KR20210049124A - 조작된 표적 특이적 염기 편집기 - Google Patents
조작된 표적 특이적 염기 편집기 Download PDFInfo
- Publication number
- KR20210049124A KR20210049124A KR1020217008090A KR20217008090A KR20210049124A KR 20210049124 A KR20210049124 A KR 20210049124A KR 1020217008090 A KR1020217008090 A KR 1020217008090A KR 20217008090 A KR20217008090 A KR 20217008090A KR 20210049124 A KR20210049124 A KR 20210049124A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- dna
- ala
- gly
- glu
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 101
- 108020004414 DNA Proteins 0.000 claims description 238
- 210000004027 cell Anatomy 0.000 claims description 224
- 108090000623 proteins and genes Proteins 0.000 claims description 222
- 230000004568 DNA-binding Effects 0.000 claims description 178
- 101710185494 Zinc finger protein Proteins 0.000 claims description 172
- 102100023597 Zinc finger protein 816 Human genes 0.000 claims description 172
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 161
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 161
- 102000004169 proteins and genes Human genes 0.000 claims description 142
- 108091033409 CRISPR Proteins 0.000 claims description 138
- 230000035772 mutation Effects 0.000 claims description 128
- 150000007523 nucleic acids Chemical class 0.000 claims description 108
- 102000039446 nucleic acids Human genes 0.000 claims description 107
- 108020004707 nucleic acids Proteins 0.000 claims description 107
- 239000000203 mixture Substances 0.000 claims description 81
- 239000002773 nucleotide Substances 0.000 claims description 74
- 125000003729 nucleotide group Chemical group 0.000 claims description 73
- 108091093037 Peptide nucleic acid Proteins 0.000 claims description 57
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 55
- 229930024421 Adenine Natural products 0.000 claims description 51
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 51
- 229960000643 adenine Drugs 0.000 claims description 51
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 44
- 108010052875 Adenine deaminase Proteins 0.000 claims description 39
- 102000040430 polynucleotide Human genes 0.000 claims description 37
- 108091033319 polynucleotide Proteins 0.000 claims description 37
- 239000002157 polynucleotide Substances 0.000 claims description 37
- 108091034117 Oligonucleotide Proteins 0.000 claims description 35
- 230000000368 destabilizing effect Effects 0.000 claims description 34
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 33
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 33
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 33
- 102000053602 DNA Human genes 0.000 claims description 28
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 28
- 108020005004 Guide RNA Proteins 0.000 claims description 25
- 201000010099 disease Diseases 0.000 claims description 25
- 229940104302 cytosine Drugs 0.000 claims description 22
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 21
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 21
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 20
- 108020004705 Codon Proteins 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 15
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 12
- 210000000349 chromosome Anatomy 0.000 claims description 11
- 230000010076 replication Effects 0.000 claims description 11
- 229940035893 uracil Drugs 0.000 claims description 10
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 claims description 8
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical group O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 claims description 8
- 229930010555 Inosine Natural products 0.000 claims description 7
- 229960003786 inosine Drugs 0.000 claims description 7
- 230000004543 DNA replication Effects 0.000 claims description 6
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 claims description 4
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 claims description 4
- 229940104230 thymidine Drugs 0.000 claims description 4
- 108700024394 Exon Proteins 0.000 claims description 2
- 238000010442 DNA editing Methods 0.000 abstract description 35
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 17
- 239000002585 base Substances 0.000 description 391
- 235000018102 proteins Nutrition 0.000 description 136
- 238000003776 cleavage reaction Methods 0.000 description 127
- 230000007017 scission Effects 0.000 description 127
- 230000004927 fusion Effects 0.000 description 92
- 101710163270 Nuclease Proteins 0.000 description 83
- 108090000765 processed proteins & peptides Proteins 0.000 description 64
- 108020001507 fusion proteins Proteins 0.000 description 56
- 102000037865 fusion proteins Human genes 0.000 description 56
- 239000013598 vector Substances 0.000 description 56
- 230000027455 binding Effects 0.000 description 55
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 50
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 45
- 102000004196 processed proteins & peptides Human genes 0.000 description 44
- 102000004190 Enzymes Human genes 0.000 description 41
- 108090000790 Enzymes Proteins 0.000 description 41
- 229920001184 polypeptide Polymers 0.000 description 41
- 230000014509 gene expression Effects 0.000 description 37
- 238000010459 TALEN Methods 0.000 description 34
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 33
- 239000011701 zinc Substances 0.000 description 33
- 229910052725 zinc Inorganic materials 0.000 description 33
- 235000001014 amino acid Nutrition 0.000 description 31
- 229940024606 amino acid Drugs 0.000 description 31
- 238000010453 CRISPR/Cas method Methods 0.000 description 30
- 108060004795 Methyltransferase Proteins 0.000 description 29
- 230000000694 effects Effects 0.000 description 29
- 230000003612 virological effect Effects 0.000 description 29
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 27
- 150000001413 amino acids Chemical class 0.000 description 27
- 230000001687 destabilization Effects 0.000 description 25
- 241000700605 Viruses Species 0.000 description 23
- 108010077544 Chromatin Proteins 0.000 description 22
- 125000000539 amino acid group Chemical group 0.000 description 22
- 210000003483 chromatin Anatomy 0.000 description 22
- 230000005782 double-strand break Effects 0.000 description 22
- 108020004999 messenger RNA Proteins 0.000 description 21
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 20
- 108010031325 Cytidine deaminase Proteins 0.000 description 19
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 18
- 101150006308 botA gene Proteins 0.000 description 17
- 230000001965 increasing effect Effects 0.000 description 17
- 239000013603 viral vector Substances 0.000 description 17
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 description 16
- 238000006471 dimerization reaction Methods 0.000 description 16
- 239000012634 fragment Substances 0.000 description 16
- 238000001415 gene therapy Methods 0.000 description 16
- 238000001727 in vivo Methods 0.000 description 16
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 15
- 102000004533 Endonucleases Human genes 0.000 description 15
- 108010042407 Endonucleases Proteins 0.000 description 15
- -1 UvsW Proteins 0.000 description 15
- 230000001580 bacterial effect Effects 0.000 description 15
- 230000001413 cellular effect Effects 0.000 description 15
- 239000012458 free base Substances 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 238000000338 in vitro Methods 0.000 description 15
- 241000702421 Dependoparvovirus Species 0.000 description 14
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 14
- 210000001519 tissue Anatomy 0.000 description 14
- 102000005381 Cytidine Deaminase Human genes 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 102200087780 rs77375493 Human genes 0.000 description 13
- 210000000130 stem cell Anatomy 0.000 description 13
- 241000701161 unidentified adenovirus Species 0.000 description 13
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 12
- 230000003993 interaction Effects 0.000 description 12
- 230000001404 mediated effect Effects 0.000 description 12
- 108010050848 glycylleucine Proteins 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 102000005962 receptors Human genes 0.000 description 11
- 108020003175 receptors Proteins 0.000 description 11
- 108091008146 restriction endonucleases Proteins 0.000 description 11
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 10
- 241000282414 Homo sapiens Species 0.000 description 10
- 108700019146 Transgenes Proteins 0.000 description 10
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 10
- 230000003197 catalytic effect Effects 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 9
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 9
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 9
- 125000003275 alpha amino acid group Chemical group 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 230000002950 deficient Effects 0.000 description 9
- 238000004806 packaging method and process Methods 0.000 description 9
- 208000011580 syndromic disease Diseases 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- 230000000981 bystander Effects 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 8
- 208000015181 infectious disease Diseases 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 7
- 102000055025 Adenosine deaminases Human genes 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- 230000007018 DNA scission Effects 0.000 description 7
- 108020004682 Single-Stranded DNA Proteins 0.000 description 7
- 102000040945 Transcription factor Human genes 0.000 description 7
- 108091023040 Transcription factor Proteins 0.000 description 7
- 230000004075 alteration Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 239000002502 liposome Substances 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- 230000001177 retroviral effect Effects 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 102100032049 E3 ubiquitin-protein ligase LRSAM1 Human genes 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 6
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 6
- 210000001744 T-lymphocyte Anatomy 0.000 description 6
- 108091028113 Trans-activating crRNA Proteins 0.000 description 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000002759 chromosomal effect Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000004069 differentiation Effects 0.000 description 6
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 238000001476 gene delivery Methods 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 150000002632 lipids Chemical class 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000009437 off-target effect Effects 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 239000013607 AAV vector Substances 0.000 description 5
- 230000033616 DNA repair Effects 0.000 description 5
- 101710096438 DNA-binding protein Proteins 0.000 description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 241000700584 Simplexvirus Species 0.000 description 5
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 5
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 5
- 241000589634 Xanthomonas Species 0.000 description 5
- 108010005233 alanylglutamic acid Proteins 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 230000007812 deficiency Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000009510 drug design Methods 0.000 description 5
- 238000003209 gene knockout Methods 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010079547 glutamylmethionine Proteins 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 238000002347 injection Methods 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 238000001638 lipofection Methods 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 210000004962 mammalian cell Anatomy 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 230000006780 non-homologous end joining Effects 0.000 description 5
- 108020001580 protein domains Proteins 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- 208000007056 sickle cell anemia Diseases 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 4
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 4
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 4
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 4
- 108700004991 Cas12a Proteins 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 208000031220 Hemophilia Diseases 0.000 description 4
- 208000009292 Hemophilia A Diseases 0.000 description 4
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 108020005067 RNA Splice Sites Proteins 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 241000713311 Simian immunodeficiency virus Species 0.000 description 4
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 4
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 4
- 238000002679 ablation Methods 0.000 description 4
- 208000031753 acute bilirubin encephalopathy Diseases 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000002716 delivery method Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 230000002538 fungal effect Effects 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 239000003607 modifier Substances 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 4
- 229920002401 polyacrylamide Polymers 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 230000005783 single-strand break Effects 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 230000005945 translocation Effects 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 3
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 3
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 3
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 3
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 3
- 102100035631 Bloom syndrome protein Human genes 0.000 description 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 208000006992 Color Vision Defects Diseases 0.000 description 3
- 201000003883 Cystic fibrosis Diseases 0.000 description 3
- 101100441545 Drosophila melanogaster Cfp1 gene Proteins 0.000 description 3
- 208000024720 Fabry Disease Diseases 0.000 description 3
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 3
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 3
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 101000687346 Homo sapiens PR domain zinc finger protein 2 Proteins 0.000 description 3
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 108010061100 Nucleoproteins Chemical class 0.000 description 3
- 102000011931 Nucleoproteins Human genes 0.000 description 3
- 102100024885 PR domain zinc finger protein 2 Human genes 0.000 description 3
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 3
- 201000011252 Phenylketonuria Diseases 0.000 description 3
- 102000001253 Protein Kinase Human genes 0.000 description 3
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 3
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 3
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 230000006907 apoptotic process Effects 0.000 description 3
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 244000309466 calf Species 0.000 description 3
- 230000007910 cell fusion Effects 0.000 description 3
- 238000002659 cell therapy Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 201000007254 color blindness Diseases 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 230000006806 disease prevention Effects 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000030279 gene silencing Effects 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 239000000833 heterodimer Substances 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 125000001921 locked nucleotide group Chemical group 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 229920002521 macromolecule Polymers 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108060006633 protein kinase Proteins 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 230000002992 thymic effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- WBSCNDJQPKSPII-UHFFFAOYSA-N 6-amino-2-[[6-amino-2-(2,6-diaminohexanoylamino)hexanoyl]amino]hexanoic acid Chemical compound NCCCCC(N)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(O)=O WBSCNDJQPKSPII-UHFFFAOYSA-N 0.000 description 2
- 101150006656 A18R gene Proteins 0.000 description 2
- 102100029325 ATP-dependent DNA helicase PIF1 Human genes 0.000 description 2
- 101710132587 ATP-dependent DNA helicase Q5 Proteins 0.000 description 2
- 102100038351 ATP-dependent DNA helicase Q5 Human genes 0.000 description 2
- 108010013043 Acetylesterase Proteins 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 2
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- 101710095342 Apolipoprotein B Proteins 0.000 description 2
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 2
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 2
- QEKBCDODJBBWHV-GUBZILKMSA-N Arg-Arg-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O QEKBCDODJBBWHV-GUBZILKMSA-N 0.000 description 2
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 2
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 2
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 2
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 2
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 2
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 2
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 101001125884 Autographa californica nuclear polyhedrosis virus Per os infectivity factor 1 Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000701412 Baculoviridae Species 0.000 description 2
- 101100039010 Caenorhabditis elegans dis-3 gene Proteins 0.000 description 2
- 241000714198 Caliciviridae Species 0.000 description 2
- 102100025621 Cytochrome b-245 heavy chain Human genes 0.000 description 2
- 101150026402 DBP gene Proteins 0.000 description 2
- 230000007035 DNA breakage Effects 0.000 description 2
- 108090000133 DNA helicases Proteins 0.000 description 2
- 102000003844 DNA helicases Human genes 0.000 description 2
- 101710150423 DNA nickase Proteins 0.000 description 2
- 102100033072 DNA replication ATP-dependent helicase DNA2 Human genes 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 101100300807 Drosophila melanogaster spn-A gene Proteins 0.000 description 2
- 241000702189 Escherichia virus Mu Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 102100034553 Fanconi anemia group J protein Human genes 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 208000024412 Friedreich ataxia Diseases 0.000 description 2
- 241000531123 GB virus C Species 0.000 description 2
- 208000015872 Gaucher disease Diseases 0.000 description 2
- 102100031885 General transcription and DNA repair factor IIH helicase subunit XPB Human genes 0.000 description 2
- 102100035184 General transcription and DNA repair factor IIH helicase subunit XPD Human genes 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 2
- IGNGBUVODQLMRJ-CIUDSAMLSA-N Gln-Ala-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IGNGBUVODQLMRJ-CIUDSAMLSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- 229920002683 Glycosaminoglycan Polymers 0.000 description 2
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 2
- 208000009329 Graft vs Host Disease Diseases 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- 241000711549 Hepacivirus C Species 0.000 description 2
- 241000724675 Hepatitis E virus Species 0.000 description 2
- 241000709721 Hepatovirus A Species 0.000 description 2
- 241000700586 Herpesviridae Species 0.000 description 2
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 2
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- 101001125842 Homo sapiens ATP-dependent DNA helicase PIF1 Proteins 0.000 description 2
- 101000927313 Homo sapiens DNA replication ATP-dependent helicase DNA2 Proteins 0.000 description 2
- 101000729474 Homo sapiens DNA-directed RNA polymerase I subunit RPA1 Proteins 0.000 description 2
- 101000650600 Homo sapiens DNA-directed RNA polymerase I subunit RPA2 Proteins 0.000 description 2
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 description 2
- 101000920748 Homo sapiens General transcription and DNA repair factor IIH helicase subunit XPB Proteins 0.000 description 2
- 101000876511 Homo sapiens General transcription and DNA repair factor IIH helicase subunit XPD Proteins 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 101000639763 Homo sapiens Regulator of telomere elongation helicase 1 Proteins 0.000 description 2
- 101000709305 Homo sapiens Replication protein A 14 kDa subunit Proteins 0.000 description 2
- 101001092206 Homo sapiens Replication protein A 32 kDa subunit Proteins 0.000 description 2
- 101001092125 Homo sapiens Replication protein A 70 kDa DNA-binding subunit Proteins 0.000 description 2
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- 241000701806 Human papillomavirus Species 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 2
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 2
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 2
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 2
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 102100034349 Integrase Human genes 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- 201000001779 Leukocyte adhesion deficiency Diseases 0.000 description 2
- 108091036060 Linker DNA Proteins 0.000 description 2
- 208000019693 Lung disease Diseases 0.000 description 2
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- PZUUMQPMHBJJKE-AVGNSLFASA-N Met-Leu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N PZUUMQPMHBJJKE-AVGNSLFASA-N 0.000 description 2
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 2
- NLDXSXDCNZIQCN-ULQDDVLXSA-N Met-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 NLDXSXDCNZIQCN-ULQDDVLXSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 2
- 241000701553 Myoviridae Species 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 2
- BKAYIFDRRZZKNF-VIFPVBQESA-N N-acetylcarnosine Chemical compound CC(=O)NCCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BKAYIFDRRZZKNF-VIFPVBQESA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 108700019961 Neoplasm Genes Proteins 0.000 description 2
- 102000048850 Neoplasm Genes Human genes 0.000 description 2
- 101710172465 Nucleoside triphosphatase I Proteins 0.000 description 2
- 108010047956 Nucleosomes Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241001631646 Papillomaviridae Species 0.000 description 2
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 2
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 2
- ILGCZYGFYQLSDZ-KKUMJFAQSA-N Phe-Ser-His Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ILGCZYGFYQLSDZ-KKUMJFAQSA-N 0.000 description 2
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 2
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 241000702072 Podoviridae Species 0.000 description 2
- 208000000474 Poliomyelitis Diseases 0.000 description 2
- 241000700625 Poxviridae Species 0.000 description 2
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 108700040121 Protein Methyltransferases Proteins 0.000 description 2
- 102000055027 Protein Methyltransferases Human genes 0.000 description 2
- 101710196562 RNA helicase NPH-II Proteins 0.000 description 2
- 102000053062 Rad52 DNA Repair and Recombination Human genes 0.000 description 2
- 108700031762 Rad52 DNA Repair and Recombination Proteins 0.000 description 2
- 241000589771 Ralstonia solanacearum Species 0.000 description 2
- 101100087805 Ralstonia solanacearum rip19 gene Proteins 0.000 description 2
- 108010012737 RecQ Helicases Proteins 0.000 description 2
- 102000019196 RecQ Helicases Human genes 0.000 description 2
- 102100034469 Regulator of telomere elongation helicase 1 Human genes 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 102100034372 Replication protein A 14 kDa subunit Human genes 0.000 description 2
- 102100035525 Replication protein A 32 kDa subunit Human genes 0.000 description 2
- 102100035729 Replication protein A 70 kDa DNA-binding subunit Human genes 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 2
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 2
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 2
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- 241000256248 Spodoptera Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 208000022292 Tay-Sachs disease Diseases 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 2
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 2
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 2
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 2
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 101710183280 Topoisomerase Proteins 0.000 description 2
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 2
- 208000037280 Trisomy Diseases 0.000 description 2
- YVXIAOOYAKBAAI-SZMVWBNQSA-N Trp-Leu-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 YVXIAOOYAKBAAI-SZMVWBNQSA-N 0.000 description 2
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 2
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 2
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 2
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 101100107496 Vaccinia virus (strain Western Reserve) VACWR138 gene Proteins 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 2
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 108070000030 Viral receptors Proteins 0.000 description 2
- 206010068348 X-linked lymphoproliferative syndrome Diseases 0.000 description 2
- 102100028612 Zinc finger protein ZFP2 Human genes 0.000 description 2
- 101710128490 Zinc finger protein zfp-2 Proteins 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 201000006288 alpha thalassemia Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 208000005980 beta thalassemia Diseases 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 210000002798 bone marrow cell Anatomy 0.000 description 2
- 101150055766 cat gene Proteins 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 208000016532 chronic granulomatous disease Diseases 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000000975 co-precipitation Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 208000024908 graft versus host disease Diseases 0.000 description 2
- 208000029570 hepatitis D virus infection Diseases 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 208000019423 liver disease Diseases 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 230000017156 mRNA modification Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 210000001178 neural stem cell Anatomy 0.000 description 2
- 210000001623 nucleosome Anatomy 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000002823 phage display Methods 0.000 description 2
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 102000021127 protein binding proteins Human genes 0.000 description 2
- 108091011138 protein binding proteins Proteins 0.000 description 2
- 108700015182 recombinant rCAS Proteins 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 108700014590 single-stranded DNA binding proteins Proteins 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 108091035705 tRNA adenine Proteins 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 230000002463 transducing effect Effects 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 241000712461 unidentified influenza virus Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 1
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- KIAPWMKFHIKQOZ-UHFFFAOYSA-N 2-[[(4-fluorophenyl)-oxomethyl]amino]benzoic acid methyl ester Chemical compound COC(=O)C1=CC=CC=C1NC(=O)C1=CC=C(F)C=C1 KIAPWMKFHIKQOZ-UHFFFAOYSA-N 0.000 description 1
- SCPRYBYMKVYVND-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-4-methylpentanoyl)pyrrolidine-2-carbonyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(O)=O SCPRYBYMKVYVND-UHFFFAOYSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 101150079657 AICDA gene Proteins 0.000 description 1
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 208000029483 Acquired immunodeficiency Diseases 0.000 description 1
- 201000010028 Acrocephalosyndactylia Diseases 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 208000002485 Adiposis dolorosa Diseases 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- AAXVGJXZKHQQHD-LSJOCFKGSA-N Ala-His-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N AAXVGJXZKHQQHD-LSJOCFKGSA-N 0.000 description 1
- LBFXVAXPDOBRKU-LKTVYLICSA-N Ala-His-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LBFXVAXPDOBRKU-LKTVYLICSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- FCXAUASCMJOFEY-NDKCEZKHSA-N Ala-Leu-Thr-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O FCXAUASCMJOFEY-NDKCEZKHSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- JWUZOJXDJDEQEM-ZLIFDBKOSA-N Ala-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 JWUZOJXDJDEQEM-ZLIFDBKOSA-N 0.000 description 1
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- FSXDWQGEWZQBPJ-HERUPUMHSA-N Ala-Trp-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FSXDWQGEWZQBPJ-HERUPUMHSA-N 0.000 description 1
- IEAUDUOCWNPZBR-LKTVYLICSA-N Ala-Trp-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IEAUDUOCWNPZBR-LKTVYLICSA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- ANNKVZSFQJGVDY-XUXIUFHCSA-N Ala-Val-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ANNKVZSFQJGVDY-XUXIUFHCSA-N 0.000 description 1
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 1
- 206010056292 Androgen-Insensitivity Syndrome Diseases 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 208000025490 Apert syndrome Diseases 0.000 description 1
- 241000893512 Aquifex aeolicus Species 0.000 description 1
- 101100339431 Arabidopsis thaliana HMGB2 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000712892 Arenaviridae Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- BJNUAWGXPSHQMJ-DCAQKATOSA-N Arg-Gln-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O BJNUAWGXPSHQMJ-DCAQKATOSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- QEHMMRSQJMOYNO-DCAQKATOSA-N Arg-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QEHMMRSQJMOYNO-DCAQKATOSA-N 0.000 description 1
- PZVMBNFTBWQWQL-DCAQKATOSA-N Arg-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PZVMBNFTBWQWQL-DCAQKATOSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- JBIRFLWXWDSDTR-CYDGBPFRSA-N Arg-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N JBIRFLWXWDSDTR-CYDGBPFRSA-N 0.000 description 1
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 1
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- 102000008682 Argonaute Proteins Human genes 0.000 description 1
- 108010088141 Argonaute Proteins Proteins 0.000 description 1
- 201000006058 Arrhythmogenic right ventricular cardiomyopathy Diseases 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- YNSCBOUZTAGIGO-ZLUOBGJFSA-N Asn-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N YNSCBOUZTAGIGO-ZLUOBGJFSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- XFJKRRCWLTZIQA-XIRDDKMYSA-N Asn-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N XFJKRRCWLTZIQA-XIRDDKMYSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 1
- FHCRKXCTKSHNOE-QEJZJMRPSA-N Asn-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FHCRKXCTKSHNOE-QEJZJMRPSA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- KGAJCJXBEWLQDZ-UBHSHLNASA-N Asp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N KGAJCJXBEWLQDZ-UBHSHLNASA-N 0.000 description 1
- PJERDVUTUDZPGX-ZKWXMUAHSA-N Asp-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O PJERDVUTUDZPGX-ZKWXMUAHSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 1
- SJLDOGLMVPHPLZ-IHRRRGAJSA-N Asp-Met-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SJLDOGLMVPHPLZ-IHRRRGAJSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 201000005943 Barth syndrome Diseases 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000702628 Birnaviridae Species 0.000 description 1
- 108091009167 Bloom syndrome protein Proteins 0.000 description 1
- 241001147386 Bos sp. Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 102100026008 Breakpoint cluster region protein Human genes 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 1
- 101710082513 C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 102000004274 CCR5 Receptors Human genes 0.000 description 1
- 108010017088 CCR5 Receptors Proteins 0.000 description 1
- 108010061299 CXCR4 Receptors Proteins 0.000 description 1
- 102000012000 CXCR4 Receptors Human genes 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 208000022526 Canavan disease Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 102000004018 Caspase 6 Human genes 0.000 description 1
- 108090000425 Caspase 6 Proteins 0.000 description 1
- 102000011727 Caspases Human genes 0.000 description 1
- 108010076667 Caspases Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 1
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 206010008723 Chondrodystrophy Diseases 0.000 description 1
- 102000008169 Co-Repressor Proteins Human genes 0.000 description 1
- 108010060434 Co-Repressor Proteins Proteins 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 1
- 102000012437 Copper-Transporting ATPases Human genes 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 206010011469 Crying Diseases 0.000 description 1
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 1
- QFMCHXSGIZPBKG-ZLUOBGJFSA-N Cys-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N QFMCHXSGIZPBKG-ZLUOBGJFSA-N 0.000 description 1
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- KIHRUISMQZVCNO-ZLUOBGJFSA-N Cys-Asp-Asp Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KIHRUISMQZVCNO-ZLUOBGJFSA-N 0.000 description 1
- UCMIKRLLIOVDRJ-XKBZYTNZSA-N Cys-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)O UCMIKRLLIOVDRJ-XKBZYTNZSA-N 0.000 description 1
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- RRJOQIBQVZDVCW-SRVKXCTJSA-N Cys-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N RRJOQIBQVZDVCW-SRVKXCTJSA-N 0.000 description 1
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 1
- 206010011732 Cyst Diseases 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 102000011724 DNA Repair Enzymes Human genes 0.000 description 1
- 108010076525 DNA Repair Enzymes Proteins 0.000 description 1
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 102000010719 DNA-(Apurinic or Apyrimidinic Site) Lyase Human genes 0.000 description 1
- 108010063362 DNA-(Apurinic or Apyrimidinic Site) Lyase Proteins 0.000 description 1
- 241000192091 Deinococcus radiodurans Species 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 1
- 102000001477 Deubiquitinating Enzymes Human genes 0.000 description 1
- 108010093668 Deubiquitinating Enzymes Proteins 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- 101710149498 Double-stranded DNA-binding protein Proteins 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 101000889905 Enterobacteria phage RB3 Intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889904 Enterobacteria phage T4 Defective intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 description 1
- 101000889899 Enterobacteria phage T4 Intron-associated endonuclease 2 Proteins 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 101800001467 Envelope glycoprotein E2 Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 201000004939 Fanconi anemia Diseases 0.000 description 1
- 241000724791 Filamentous phage Species 0.000 description 1
- 241000711950 Filoviridae Species 0.000 description 1
- 241000710781 Flaviviridae Species 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 208000027472 Galactosemias Diseases 0.000 description 1
- 208000009796 Gangliosidoses Diseases 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 1
- QFJPFPCSXOXMKI-BPUTZDHNSA-N Gln-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N QFJPFPCSXOXMKI-BPUTZDHNSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 1
- TYRMVTKPOWPZBC-SXNHZJKMSA-N Gln-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N TYRMVTKPOWPZBC-SXNHZJKMSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 1
- RGNMNWULPAYDAH-JSGCOSHPSA-N Gln-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N RGNMNWULPAYDAH-JSGCOSHPSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- CMBXOSFZCFGDLE-IHRRRGAJSA-N Gln-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O CMBXOSFZCFGDLE-IHRRRGAJSA-N 0.000 description 1
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- 208000010055 Globoid Cell Leukodystrophy Diseases 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 1
- PAZQYODKOZHXGA-SRVKXCTJSA-N Glu-Pro-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O PAZQYODKOZHXGA-SRVKXCTJSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- JLCYOCDGIUZMKQ-JBACZVJFSA-N Glu-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N JLCYOCDGIUZMKQ-JBACZVJFSA-N 0.000 description 1
- XAXJIUAWAFVADB-VJBMBRPKSA-N Glu-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XAXJIUAWAFVADB-VJBMBRPKSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 108700010013 HMGB1 Proteins 0.000 description 1
- 101150021904 HMGB1 gene Proteins 0.000 description 1
- 101100028493 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) pan2 gene Proteins 0.000 description 1
- 102220491568 Heat shock 70 kDa protein 1B_D10A_mutation Human genes 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 208000018565 Hemochromatosis Diseases 0.000 description 1
- 108010085686 Hemoglobin C Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 208000005331 Hepatitis D Diseases 0.000 description 1
- 108010049606 Hepatocyte Nuclear Factors Proteins 0.000 description 1
- 102000008088 Hepatocyte Nuclear Factors Human genes 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 108010014594 Heterogeneous Nuclear Ribonucleoprotein A1 Proteins 0.000 description 1
- 102100035621 Heterogeneous nuclear ribonucleoprotein A1 Human genes 0.000 description 1
- 102100037907 High mobility group protein B1 Human genes 0.000 description 1
- 102100022128 High mobility group protein B2 Human genes 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 1
- YPLYIXGKCRQZGW-SRVKXCTJSA-N His-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YPLYIXGKCRQZGW-SRVKXCTJSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- WJUYPBBCSSLVJE-CIUDSAMLSA-N His-Asn-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N WJUYPBBCSSLVJE-CIUDSAMLSA-N 0.000 description 1
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 1
- YXASFUBDSDAXQD-UWVGGRQHSA-N His-Met-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O YXASFUBDSDAXQD-UWVGGRQHSA-N 0.000 description 1
- YAEKRYQASVCDLK-JYJNAYRXSA-N His-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YAEKRYQASVCDLK-JYJNAYRXSA-N 0.000 description 1
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 101710135007 Histone-like protein p6 Proteins 0.000 description 1
- 208000017605 Hodgkin disease nodular sclerosis Diseases 0.000 description 1
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 1
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 1
- 101001045791 Homo sapiens High mobility group protein B2 Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101001109800 Homo sapiens Pro-neuregulin-1, membrane-bound isoform Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 206010020460 Human T-cell lymphotropic virus type I infection Diseases 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- 241000714259 Human T-lymphotropic virus 2 Species 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 1
- 241000701027 Human herpesvirus 6 Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000015178 Hurler syndrome Diseases 0.000 description 1
- 208000025500 Hutchinson-Gilford progeria syndrome Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 208000029663 Hypophosphatemia Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- UNDGQKWQNSTPPW-CYDGBPFRSA-N Ile-Arg-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N UNDGQKWQNSTPPW-CYDGBPFRSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- CTHAJJYOHOBUDY-GHCJXIJMSA-N Ile-Cys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N CTHAJJYOHOBUDY-GHCJXIJMSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 1
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101150009057 JAK2 gene Proteins 0.000 description 1
- 208000017924 Klinefelter Syndrome Diseases 0.000 description 1
- 208000028226 Krabbe disease Diseases 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 206010050638 Langer-Giedion syndrome Diseases 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 1
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- SNOUHRPNNCAOPI-SZMVWBNQSA-N Leu-Trp-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SNOUHRPNNCAOPI-SZMVWBNQSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 208000030289 Lymphoproliferative disease Diseases 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 1
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- ZZHPLPSLBVBWOA-WDSOQIARSA-N Lys-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N ZZHPLPSLBVBWOA-WDSOQIARSA-N 0.000 description 1
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 208000001826 Marfan syndrome Diseases 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 206010027145 Melanocytic naevus Diseases 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 1
- NSGXXVIHCIAISP-CIUDSAMLSA-N Met-Asn-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NSGXXVIHCIAISP-CIUDSAMLSA-N 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- OCRSGGIJBDUXHU-WDSOQIARSA-N Met-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OCRSGGIJBDUXHU-WDSOQIARSA-N 0.000 description 1
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- JOYFULUKJRJCSX-IUCAKERBSA-N Met-Met-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O JOYFULUKJRJCSX-IUCAKERBSA-N 0.000 description 1
- VWWGEKCAPBMIFE-SRVKXCTJSA-N Met-Met-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VWWGEKCAPBMIFE-SRVKXCTJSA-N 0.000 description 1
- XOFDBXYPKZUAAM-GUBZILKMSA-N Met-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N XOFDBXYPKZUAAM-GUBZILKMSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 201000002983 Mobius syndrome Diseases 0.000 description 1
- 208000034167 Moebius syndrome Diseases 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 208000000175 Nail-Patella Syndrome Diseases 0.000 description 1
- 208000009905 Neurofibromatoses Diseases 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 208000007256 Nevus Diseases 0.000 description 1
- 208000014060 Niemann-Pick disease Diseases 0.000 description 1
- 102000006570 Non-Histone Chromosomal Proteins Human genes 0.000 description 1
- 108010008964 Non-Histone Chromosomal Proteins Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108090001145 Nuclear Receptor Coactivator 3 Proteins 0.000 description 1
- 102100022883 Nuclear receptor coactivator 3 Human genes 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- XDMCWZFLLGVIID-SXPRBRBTSA-N O-(3-O-D-galactosyl-N-acetyl-beta-D-galactosaminyl)-L-serine Chemical compound CC(=O)N[C@H]1[C@H](OC[C@H]([NH3+])C([O-])=O)O[C@H](CO)[C@H](O)[C@@H]1OC1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 XDMCWZFLLGVIID-SXPRBRBTSA-N 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241000712464 Orthomyxoviridae Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000711504 Paramyxoviridae Species 0.000 description 1
- 241000150350 Peribunyaviridae Species 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 1
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 1
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- ZBYHVSHBZYHQBW-SRVKXCTJSA-N Phe-Cys-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZBYHVSHBZYHQBW-SRVKXCTJSA-N 0.000 description 1
- FSPGBMWPNMRWDB-AVGNSLFASA-N Phe-Cys-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FSPGBMWPNMRWDB-AVGNSLFASA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- NRKNYPRRWXVELC-NQCBNZPSSA-N Phe-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NRKNYPRRWXVELC-NQCBNZPSSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- OHIYMVFLQXTZAW-UFYCRDLUSA-N Phe-Met-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OHIYMVFLQXTZAW-UFYCRDLUSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- KCIKTPHTEYBXMG-BVSLBCMMSA-N Phe-Trp-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCIKTPHTEYBXMG-BVSLBCMMSA-N 0.000 description 1
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 241001631648 Polyomaviridae Species 0.000 description 1
- 241000097929 Porphyria Species 0.000 description 1
- 208000010642 Porphyrias Diseases 0.000 description 1
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- QBFONMUYNSNKIX-AVGNSLFASA-N Pro-Arg-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QBFONMUYNSNKIX-AVGNSLFASA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- RETPETNFPLNLRV-JYJNAYRXSA-N Pro-Asn-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O RETPETNFPLNLRV-JYJNAYRXSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 1
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 1
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- GNFHQWNCSSPOBT-ULQDDVLXSA-N Pro-Trp-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O GNFHQWNCSSPOBT-ULQDDVLXSA-N 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- 208000007932 Progeria Diseases 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 208000007531 Proteus syndrome Diseases 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 241000232299 Ralstonia Species 0.000 description 1
- 101100272715 Ralstonia solanacearum (strain GMI1000) brg11 gene Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000001218 Rec A Recombinases Human genes 0.000 description 1
- 108010055016 Rec A Recombinases Proteins 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 241000702247 Reoviridae Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 241000712907 Retroviridae Species 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 241000191021 Rhodobacter sp. Species 0.000 description 1
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 206010039281 Rubinstein-Taybi syndrome Diseases 0.000 description 1
- 101001025539 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Homothallic switching endonuclease Proteins 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 101100355586 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rhp51 gene Proteins 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- QSHKTZVJGDVFEW-GUBZILKMSA-N Ser-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N QSHKTZVJGDVFEW-GUBZILKMSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- 241000702202 Siphoviridae Species 0.000 description 1
- 201000001388 Smith-Magenis syndrome Diseases 0.000 description 1
- 108010085012 Steroid Receptors Proteins 0.000 description 1
- 102000007451 Steroid Receptors Human genes 0.000 description 1
- 208000027077 Stickler syndrome Diseases 0.000 description 1
- 101800001271 Surface protein Proteins 0.000 description 1
- 206010043189 Telangiectasia Diseases 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- VBPDMBAFBRDZSK-HOUAVDHOSA-N Thr-Asn-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VBPDMBAFBRDZSK-HOUAVDHOSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 1
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 1
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- VMSSYINFMOFLJM-KJEVXHAQSA-N Thr-Tyr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O VMSSYINFMOFLJM-KJEVXHAQSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- 241000710771 Tick-borne encephalitis virus Species 0.000 description 1
- 241000710924 Togaviridae Species 0.000 description 1
- 102000000887 Transcription factor STAT Human genes 0.000 description 1
- 108050007918 Transcription factor STAT Proteins 0.000 description 1
- 208000035378 Trichorhinophalangeal syndrome type 2 Diseases 0.000 description 1
- OFNPHOGOJLNVLL-KCTSRDHCSA-N Trp-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N OFNPHOGOJLNVLL-KCTSRDHCSA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 1
- KDWZQYUTMJSYRJ-BHYGNILZSA-N Trp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O KDWZQYUTMJSYRJ-BHYGNILZSA-N 0.000 description 1
- OGXQLUCMJZSJPW-LYSGOOTNSA-N Trp-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O OGXQLUCMJZSJPW-LYSGOOTNSA-N 0.000 description 1
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 1
- FHVCMIMUGUFIOJ-IHPCNDPISA-N Trp-His-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CC4=CN=CN4)C(=O)O)N FHVCMIMUGUFIOJ-IHPCNDPISA-N 0.000 description 1
- YDTKYBHPRULROG-LTHWPDAASA-N Trp-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YDTKYBHPRULROG-LTHWPDAASA-N 0.000 description 1
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- PKZIWSHDJYIPRH-JBACZVJFSA-N Trp-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKZIWSHDJYIPRH-JBACZVJFSA-N 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 208000026928 Turner syndrome Diseases 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 1
- KDGFPPHLXCEQRN-STECZYCISA-N Tyr-Arg-Ile Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDGFPPHLXCEQRN-STECZYCISA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 1
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 1
- CVXURBLRELTJKO-BWAGICSOSA-N Tyr-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O CVXURBLRELTJKO-BWAGICSOSA-N 0.000 description 1
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- XTOCLOATLKOZAU-JBACZVJFSA-N Tyr-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N XTOCLOATLKOZAU-JBACZVJFSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- NXPDPYYCIRDUHO-ULQDDVLXSA-N Tyr-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 NXPDPYYCIRDUHO-ULQDDVLXSA-N 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- CWOSXNKDOACNJN-BZSNNMDCSA-N Val-Arg-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N CWOSXNKDOACNJN-BZSNNMDCSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 1
- JPPXDMBGXJBTIB-ULQDDVLXSA-N Val-His-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N JPPXDMBGXJBTIB-ULQDDVLXSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 102100026383 Vasopressin-neurophysin 2-copeptin Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 206010049644 Williams syndrome Diseases 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 208000006110 Wiskott-Aldrich syndrome Diseases 0.000 description 1
- 241000589636 Xanthomonas campestris Species 0.000 description 1
- 241000815873 Xanthomonas euvesicatoria Species 0.000 description 1
- 101100290417 Zea mays ROA1 gene Proteins 0.000 description 1
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 208000008919 achondroplasia Diseases 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 208000019905 acrocephalosyndactyly Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 201000009628 adenosine deaminase deficiency Diseases 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical group OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010066119 arginyl-leucyl-aspartyl-serine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 206010003119 arrhythmia Diseases 0.000 description 1
- 230000006793 arrhythmia Effects 0.000 description 1
- 208000036556 autosomal recessive T cell-negative B cell-negative NK cell-negative due to adenosine deaminase deficiency severe combined immunodeficiency Diseases 0.000 description 1
- 244000000005 bacterial plant pathogen Species 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- UUVBYOGFRMMMQL-UHFFFAOYSA-N calcium;phosphoric acid Chemical compound [Ca].OP(O)(O)=O UUVBYOGFRMMMQL-UHFFFAOYSA-N 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 208000031752 chronic bilirubin encephalopathy Diseases 0.000 description 1
- 235000019877 cocoa butter equivalent Nutrition 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 208000031513 cyst Diseases 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 201000010064 diabetes insipidus Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 102000022788 double-stranded DNA binding proteins Human genes 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 210000003981 ectoderm Anatomy 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 201000006440 gangliosidosis Diseases 0.000 description 1
- 238000012246 gene addition Methods 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 102000055650 human NRG1 Human genes 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 208000004731 long QT syndrome Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 208000005340 mucopolysaccharidosis III Diseases 0.000 description 1
- 208000011045 mucopolysaccharidosis type 3 Diseases 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 206010028537 myelofibrosis Diseases 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 201000004931 neurofibromatosis Diseases 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000011164 ossification Effects 0.000 description 1
- 101150081585 panB gene Proteins 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- BULVZWIRKLYCBC-UHFFFAOYSA-N phorate Chemical compound CCOP(=S)(OCC)SCSCC BULVZWIRKLYCBC-UHFFFAOYSA-N 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 208000003476 primary myelofibrosis Diseases 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 101710199622 tRNA-specific adenosine deaminase Proteins 0.000 description 1
- 208000009056 telangiectasis Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 201000006532 trichorhinophalangeal syndrome type II Diseases 0.000 description 1
- 108010036387 trimethionine Proteins 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
- 210000004885 white matter Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04001—Cytosine deaminase (3.5.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04002—Adenine deaminase (3.5.4.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/318—Chemical structure of the backbone where the PO2 is completely replaced, e.g. MMI or formacetal
- C12N2310/3181—Peptide nucleic acid, PNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/323—Chemical structure of the sugar modified ring structure
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/323—Chemical structure of the sugar modified ring structure
- C12N2310/3231—Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/307—Single strand endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/50—Other enzymatic activities
- C12Q2521/539—Deaminase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2522/00—Reaction characterised by the use of non-enzymatic proteins
- C12Q2522/10—Nucleic acid binding proteins
- C12Q2522/101—Single or double stranded nucleic acid binding proteins
Abstract
본원에는 DNA 편집 복합체, 특히 표적 DNA 서열 내의 단일 염기쌍을 특이적으로 변경시키는 DNA 편집 복합체뿐만 아니라 이러한 DNA 편집 복합체를 만들고 사용하는 방법이 기재되어 있다.
Description
관련 출원에 대한 상호 참조
본 출원은 2018년 8월 23일에 출원된 미국 가출원 번호 62/721,903; 2018년 10월 31일에 출원된 미국 가출원 번호 62/753,696; 2019년 3월 12일에 출원된 미국 가출원 번호 62/817,153; 및 2019년 6월 27일에 출원된 미국 가출원 번호 62/867,565를 우선권 주장하며, 이들 가출원의 개시내용은 그 전체 내용이 본원에 참조로 포함된다.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출되었고 그 전체 내용이 본원에 참조로 포함되는 서열 목록을 함유한다. 2019년 8월 20일에 생성된, 상기 ASCII 카피는 8325-0180-S180-PCT_SL.txt로 명명되고 그 크기가 225,507 바이트이다.
기술분야
본 개시내용은 폴리펩티드 및 게놈 공학 분야에 있다.
인공 뉴클레아제, 예컨대 조작된 징크 핑거 뉴클레아제 (ZFN), 전사 활성화제 유사 이펙터 뉴클레아제 (TALEN), RNA 유도 뉴클레아제로서 지칭되기도 하는 조작된 crRNA/tracr RNA ('단일 가이드 RNA')를 갖는 CRISPR/Cas 시스템, 및/또는 아르고노트(Argonaute) 시스템에 기반한 뉴클레아제가 의학, 생명 공학 및 농업 분야에 혁명을 일으키고 있다. 이들 분자 도구를 사용하면 유기체 내의 게놈을 이전에는 불가능했던 수준으로 유전자 조작 (예를 들어 편집)할 수 있다. 인공 뉴클레아제는 DNA를 절단할 수 있으므로, 이러한 절단 후에 세포는 오류가 발생하기 쉬운 비상동 말단 결합 (NHEJ)에 의해, 또는 절단 부위를 플랭킹하는 영역과의 상동성을 갖는 기질 DNA의 존재하에 상동성 지향 복구 (HDR)를 통해 기질 DNA를 삽입함으로써 그 파손물을 강제로 '치유'한다. 이러한 프로세스 둘 다는 DNA에서의 이중 가닥 파손 (DSB)으로 시작된다.
일부 경우에, 조작된 뉴클레아제는 유전자 편집된 세포의 염색체에서 다수의 DSB의 유도로 인해 발생할 수 있는 원치 않는 결과 (예를 들어, 전위, 반전 및 결실)를 초래할 수 있었다. 예를 들어, 뉴클레아제 처리 후 전위, 반전 및 결실을 포함한 염색체 재배열의 일부 증거가 관찰되었고 (문헌 [Kosicki, et al. (2018) Nat Biotechnol 36:765 및 Shin, et al. (2017) Nat Comm doi:10.1038/ncomms15646]), 보다 최근에는 CRISPR/Cas 시스템을 사용하여 아폽토시스로 이어지는 일부 세포에서의 절단 후 p53 경로의 유도에 관한 우려가 있었다 (Ihry, et al. (2018) Nat Med 24:939-946 및 Haapaniemi, et al. (2018) Nat Med 24:927-930). 또한, HDR은 전형적으로, 대부분의 진핵 생물에서 매우 비효율적이므로, 유전자 교정이 어렵다 (Eid, et al. (2018) Biochem J 475:1955-1964).
또한, Cas9 염기 편집기, 예컨대 AID-dCas9, APOBEC-dCas9 (예를 들어 APOBEC3G 또는 APOBEC1), BE2, BE3 및 BE4 (예를 들어, 문헌 [Komor, et al. (2016) Nature 533:420-424; Komor, et al. (2017) Science Advances 3(8), eaao4774; Kim, et al. (2017) Nat Biotechnol 35(4):371-376] 참조)은 특이성 결여를 나타낼 수 있어 (문헌 [Kim, et al. (2019) Nat Biotechnol 10.1038/s41587-019-0050-1; Zuo, et al. (2019) Science DOI:10.1126/science.aav9973] 참조), 생체 내 및 생체 외 치료 적용을 포함한 다양한 목적에 적합하지 않게 만든다.
따라서, 이중 가닥 파손을 유도하지 않고 높은 특이성으로 게놈 (염기) 편집을 수행할 필요성이 대두된다.
본 개시내용은 표적 DNA (예를 들어, 편집된 게놈)에서 이중 가닥 절단을 하지 않고 편집하는 것 (예를 들어, 단일 염기의 편집)을 포함하여, 세포에서 DNA를 선택적으로 편집하는 방법 및 조성물 (예를 들어, 염기 편집기)을 제공한다. 이러한 염기 편집기는 C:G를 T:A로 변화시키는 시토신 염기 편집기 (CBE) 또는 A:T를 G:C로 변화시키는 아데닌 염기 편집기 (ABE)일 수 있다. 더욱이, 이중 가닥 파손이 유도되지 않기 때문에, 내인성 표적 내에 유리 DNA 말단이 없고 전위가 발생하지 않는다. 본원에 기재된 바와 같은 염기 편집기는 유전자 녹아웃을 위해 (예를 들어, 시토신 염기 편집기를 사용하여 정규 코돈을 정지 코돈으로 변화시키는 것 및/또는 시토신 또는 아데닌 염기 편집기를 사용하여 스플라이스 수용자 부위를 돌연변이시키는 것); 유전자의 제어 요소 (예를 들어, 프로모터 영역) 내로 돌연변이를 도입하기 위해 (예를 들어, 돌연변이를 활성화 또는 억제하기 위함); 질환 유발 돌연변이 (예컨대 점 돌연변이)를 교정 (역전)하기 위해; 및/또는 치료 혜택을 발생시키는 돌연변이를 유도하기 위해 사용될 수 있다. 본원에 기재된 바와 같은 염기 편집기는 폴리펩티드 및/또는 폴리뉴클레오티드 형태에서의 염기 편집을 위해 (시험관 내 또는 생체 외 사용을 위한 세포에 또는 대상체에게 생체 내) 제공될 수 있다. 다른 장점들 중에서, 본 발명의 염기 편집기는 (1) 부가의 DNA 결합 도메인/결합 부위의 길이로 인해 특이성을 증가시키고, 감소된 PAM 요구 사항으로 인해 정밀도 또는 표적화 밀도를 증가시킬 수 있고/있거나; (2) 현재 표적화할 수 없는 부위를 표적화할 수 있도록 PAM 제한을 확장 (완화)할 수 있고/있거나; (3) 성능이 저조한 PAM 부위에서 편집 효율성을 증가시킬 수 있고/있거나; (4) 비 ZFP-고정된 시약으로 표적화할 수 있는 표적 부위에서 효율성을 개선시키므로, 더 낮은 용량을 지원할 수 있으며, 이는 또한 더 낮은 오프 타겟(off-target) 활성을 발생시킨다.
따라서, 본원에는 적어도 하나의 기능적 도메인 (예를 들어, DNA 탈안정화 분자, 예컨대 닉카제, 단백질 및/또는 뉴클레오티드) 및 적어도 하나의 DNA 결합 도메인 (예를 들어, 징크 핑거 단백질)을 포함하는 염기 편집 조성물이 기재된다. 특정 실시양태에서, 염기 편집 조성물은 DNA 내의 아데닌 (A) 또는 시티딘 (C) 염기를 편집하며, 여기서 이러한 조성물은 (1) 적어도 하나의 징크 핑거 단백질 (ZFP) DNA 결합 도메인; (2) 적어도 하나의 DNA 탈안정화 분자; 및 (3) 적어도 하나의 아데닌 또는 시토신 데아미나제를 포함하고, 상기 조성물은 DNA 내에 이중 가닥 절단을 만들지 않는다.
임의의 DNA 탈안정화 분자는 Cas9 닉카제, 단일 가이드 RNA (sgRNA)에 작동가능하게 연결된 Cas9 단백질 (예를 들어, dCas), 임의의 RNA 프로그래밍가능한 시스템, 징크 핑거 뉴클레아제 닉카제 (ZFN 닉카제), TALEN 닉카제, 하나 이상의 단백질, 예컨대 표 A에 제시된 것, 및/또는 하나 이상의 뉴클레오티드 (예를 들어, 하나 이상의 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA))를 포함하나 이에 제한되지는 않는 임의의 조합으로 본원에 기재된 조성물에 사용될 수 있다. 특정 실시양태에서, 염기 편집 조성물은 1개 초과의 DNA 탈안정화 분자, 예를 들어 하나 이상의 단백질 (예를 들어, 표 A, 닉카제 등) 및/또는 하나 이상의 뉴클레오티드를 포함한다. 특정 실시양태에서, 상기 조성물은 ZFN 닉카제 및 하나 이상의 부가의 단백질 및/또는 뉴클레오티드 DNA 탈안정화 분자 (예를 들어, 표 A의 하나 이상의 단백질 및/또는 본원에 기재된 바와 같은 하나 이상의 뉴클레오티드)를 포함한다. 특정 측면에서, 염기 편집 조성물은 Cas9 단백질을 포함하지 않지만, 다른 Cas 단백질 (예를 들어, 비-Cas9 RNA 프로그램가능한 시스템)을 포함할 수 있다. 특정 실시양태에서, DNA 탈안정화 분자는 징크 핑거 뉴클레아제 (ZFN) 닉카제를 포함한다.
염기 편집 조성물의 적어도 하나의 징크 핑거 단백질 (ZFP) DNA 결합 도메인은 염기 편집 조성물의 다른 성분 중 하나 이상, 예를 들어 DNA 탈안정화 분자 중 하나 이상 (예를 들어, Cas9 닉카제, dCas9 등) 및/또는 적어도 하나의 아데닌 또는 시토신 데아미나제에 작동가능하게 연결될 수 있다. 특정 실시양태에서, 적어도 하나의 ZFP DNA 결합 도메인은 아데닌 또는 시토신 데아미나제에 작동가능하게 연결된다. 다른 실시양태에서, 염기 편집 조성물은 제1 및 제2 ZFP DNA 결합 도메인을 포함하며, 여기서 제1 ZFP DNA 결합 도메인은 Cas9 닉카제에 작동가능하게 연결된다. ZFP DNA 결합 도메인은 3, 4, 5, 6개 또는 그 초과의 핑거를 포함할 수 있고, 편집될 표적화된 염기의 어느 한 쪽 (5' 또는 3')에 있는 표적 부위와 결합할 수 있다. 특정 실시양태에서, ZFP는 표적화된 염기의 어느 한 쪽에 있는 1개 내지 100개 (또는 그 사이의 임의의 수) 뉴클레오티드인 표적 부위와 결합한다. 다른 실시양태에서, ZFP는 표적화된 염기의 어느 한 쪽에 있는 1개 내지 50개 (또는 그 사이의 임의의 수) 뉴클레오티드인 표적 부위와 결합한다.
야생형 및/또는 진화된 도메인을 포함한 임의의 아데닌 또는 시토신 데아미나제가 본원에 기재된 조성물에 사용될 수 있다. 특정 실시양태에서, 아데닌 또는 시토신 데아미나제는 이량체화하여 활성 아데닌 또는 시토신 데아미나제를 형성하는 제1 및 제2 불활성 도메인으로 구성된다. 특정 실시양태에서, 아데닌 또는 시토신 데아미나제의 제1 불활성 도메인은 Cas9 닉카제에 작동가능하게 연결되고, 아데닌 또는 시토신 데아미나제의 제2 불활성 도메인은 ZFP DNA 결합 도메인에 작동가능하게 연결된다. 또한 추가 실시양태에서, 아데닌 또는 시토신 데아미나제와 ZFP DNA 결합 도메인은 둘 다 Cas9 닉카제에 작동가능하게 연결된다. 다른 실시양태에서, 염기 편집기는 제1 및 제2 ZFP DNA 결합 도메인을 포함하며, 제1 ZFP는 Cas9 닉카제에 작동가능하게 연결되고 제2 ZFP DNA 결합 도메인은 아데닌 또는 시토신 데아미나제에 작동가능하게 연결된다.
본원에 기재된 바와 같은 하나 이상의 염기 편집 조성물을 코딩하는 하나 이상의 폴리뉴클레오티드가 또한 제공된다. 이러한 폴리뉴클레오티드는 바이러스 (예를 들어, AAV, Ad 등) 및/또는 비-바이러스 (예를 들어, 플라스미드, mRNA 등) 벡터 상에서 운반될 수 있다. 더욱이, 본원에 기재된 바와 같은 하나 이상의 조성물 및/또는 하나 이상의 폴리뉴클레오티드를 포함하는 세포 또는 세포 집단뿐만 아니라 이러한 세포의 자손이 또한 제공되며, 여기서 세포는 편집된 염기를 포함한다.
또한 본원에 기재된 바와 같은 조성물 및/또는 폴리뉴클레오티드 중 하나 이상을 사용하여 표적 DNA (예를 들어, DNA 이중 가닥 내인성 유전자 또는 염색체 외 (에피솜) 서열) 내의 염기를 편집하는 방법이 제공된다. 특정 실시양태에서, 이러한 방법은 (i) 시티딘 염기 ("C")를 우라실 염기 ("U")로 편집하는 단계이며, 임의로 여기서 U는 DNA 복제 동안 티미딘 염기 ("T")로 대체되는 것인 단계; (ii) 아데닌 염기 ("A")를 이노신 ("I")으로 편집하는 단계이며, 임의로 여기서 I는 복제 동안 구아닌 염기 ("G")로 대체되는 것인 단계; 및/또는 (iii) CA 또는 AC 디뉴클레오티드를 UI 또는 IU로 편집하는 단계를 포함한다. 다른 실시양태에서, 세포에서의 편집이 (i) C:G 염기쌍의 T:A 염기쌍으로의 변화; (ii) C:G 염기쌍의 G:C 염기쌍으로의 변화; (iii) A:T 염기쌍의 G:C 염기쌍으로의 변화; (iv) 정지 코돈의 도입; 및/또는 (v) 스플라이싱 서열의 편집 또는 생성을 발생시킨다. 상기 방법은 엑손 또는 인트론을 포함하여 임의의 질환 돌연변이 (예를 들어, 점 돌연변이)를 교정하기 위해 사용될 수 있으며, 여기서 세포 또는 대상체 내의 염색체 또는 염색체 외 에피솜에서의 DNA가 편집된다. 상기 방법은 시험관 내, 생체 외 또는 생체 내에서 수행될 수 있다.
한 측면에서, 본원에는 DNA 편집 조성물 (예를 들어, 본원에서 염기 편집 복합체로서 지칭되기도 한 염기 편집 조성물)을 포함하는 조성물 및 시스템이 기재된다. DNA 편집 복합체는 적어도 하나의 기능적 도메인 및 DNA 결합 도메인을 포함한다. 특정 실시양태에서, DNA 편집 조성물 복합체는 DNA 결합 도메인, 및 또한, 적어도 하나의 DNA 탈안정화 분자, 예컨대 이중 가닥 DNA 내에 단일 가닥 절단을 만드는 닉카제 도메인을 포함하는 융합 분자 (예를 들어, DNA 닉카제)를 포함한다. 다른 실시양태에서, DNA 편집 조성물 (복합체)은 다수의 (2개 이상의) 융합 분자, 예를 들어 제1 DNA 결합 도메인 및 닉카제 도메인을 포함한 닉카제를 포함하는 제1의 촉매적으로 활성인 융합 분자 및 제2 DNA 결합 도메인을 포함하는 제2의 촉매적으로 불활성인 융합 분자, 및 임의로 본원에 기재된 바와 같은 부가의 DNA 결합 도메인 및 하나 이상의 기능적 도메인을 각각 포함하는 하나 이상의 부가의 융합 분자를 포함한다. 특정 실시양태에서, 염기 편집기는 도 1a 내지 1d 중 임의의 것에 도시된 바와 같은 조성물을 포함한다. 특정 실시양태에서, 제1 및 제2 (및 임의로 부가의 DNA 결합 도메인)의 결합은, 예를 들어 촉매적으로 활성인 융합 분자와 촉매적으로 불활성인 융합 분자가 이량체화될 때 염기 편집을 발생시킨다. 일부 실시양태에서, 임의적 부가의 DNA 결합 도메인은 이중 가닥 DNA와 결합하는 반면, 다른 실시양태에서, DNA 결합 도메인은 단일 가닥 DNA와 결합한다. 일부 실시양태에서, DNA 닉카제는 ZFN 닉카제, TALEN 닉카제 또는 CRISPR/Cas 닉카제이며, 여기서 적어도 하나의 기능적 (닉카제) 도메인이 DNA 결합 도메인 (예를 들어, ZFP DNA 결합 도메인, TALE DNA 결합 도메인 및 CRISPR/Cas 시스템과 함께 사용하기 위한 sgRNA)에 작동가능하게 연결된다. 일부 실시양태에서, DNA 닉카제 (예를 들어, 융합 분자)는 닉카제 도메인과 DNA 결합 도메인 사이에 링커 서열을 포함한다. 닉카제 도메인(들)은 융합 분자의 N- 또는 C-말단 측을 포함하여 DNA 결합 도메인의 어느 한 쪽 (DNA 결합 도메인에 대해 N- 및/또는 C-말단)에 위치할 수 있다. 일부 실시양태에서, 링커는 대형 링커 라이브러리 (> 10e8개 구성원)로부터의 박테리아 선택 시스템으로부터 선택된다. 일부 실시양태에서, 링커는 4개 내지 22개 아미노산 잔기의 범위이다. 일부 실시양태에서, 링커는 DNA 결합 도메인에 상대적인 기능적 도메인 (예를 들어 닉카제 도메인)의 특이적 위치 설정 (예를 들어, DNA 결합 도메인의 N- 또는 C-말단 측에 대한 닉카제 도메인의 연결)을 허용한다. 일부 예에서, 링커는 문헌 [Paschon, et al. (2019) Nat Commun. 10:1133]에 개시된 방법을 사용하여 선택된다. 염기 편집기 (또는 그의 성분)를 코딩하는 하나 이상의 폴리뉴클레오티드 (예를 들어, 구축물)가 또한 제공된다.
본원에 기재된 바와 같은 DNA 편집 복합체는 하나 이상의 아데닌 데아미나제 도메인, 하나 이상의 시티딘 데아미나제, 및/또는 하나 이상의 우라실 DNA 글리코실라제 억제제를 포함하나 이에 제한되지는 않는 하나 이상의 기능적 도메인을 포함한다. 하나 이상의 기능적 도메인은 본원에 기재된 DNA 편집 복합체의 촉매적으로 활성인 융합 분자 및/또는 촉매적으로 불활성인 융합 분자에 포함될 수 있다. 일부 실시양태에서, 시티딘 데아미나제는 아포지질단백질 B mRNA 편집 복합체 1 (APOBEC1) 도메인이다. 일부 실시양태에서, 시티딘 데아미나제는 활성화 유도 데아미나제 (AID)이다. 일부 실시양태에서, 데아미나제는 아데닌 데아미나제이다. 일부 실시양태에서, 아데닌 데아미나제는 야생형 또는 돌연변이된 (진화된) TadA (tRNA 아데닌 데아미나제)이다 (문헌 [Gaudelli, et al. (2017) Nature 551:464-471] 참조). 일부 실시양태에서, 아데닌 데아미나제는 ABE 7.8, ABE 7.9 또는 ABE 7.10 (Gaudelli, 상기 문헌) 또는 ABEmax (문헌 [Koblan, et al. (2018) Nat Biotechnol. 36(9):843-846])이다. 일부 실시양태에서, 데아미나제 (아데닌 또는 시티딘) 기능적 도메인은 작동가능하게 연결된 징크 핑거 (예를 들어, 분할 효소)를 포함하는 2개의 폴리펩티드로부터 어셈블리되거나 또는 분할 효소의 한 부분에 작동가능하게 연결된 하나 이상의 ZFP 및 분할 효소의 다른 성분에 작동가능하게 연결된 Cas9 닉카제로부터 어셈블리된다 (예를 들어, 도 1b 참조). 일부 실시양태에서, 데아미나제의 어셈블리는 작동가능하게 연결된 징크 핑거를 DNA 표적과 결합시킴으로써 구동되어, 폴리펩티드가 어셈블리를 허용하도록 위치하게 한다. 일부 실시양태에서, 염기 편집기는 우라실 DNA 글리코실라제 억제제 (UGI)를 추가로 포함한다.
한 측면에서, 염기 편집기는 CRISPR 시스템으로부터 유래된 DNA 풀림 (DNA 탈안정화로서 지칭되기도 함) 시스템, 예를 들어 Cas9 (예를 들어, 자연적으로 발생하는 및/또는 조작된 Cas9) 단백질 (예를 들어, 닉카제) 또는 비-Cas9 단백질을 포함한다. 특정 실시양태에서, 염기 편집기는 징크 핑거 단백질 DNA 결합 도메인을 추가로 포함하는 Cas9 염기 편집기이며, 이러한 ZFP는 Cas9 단백질 (예를 들어, 야생형 또는 조작된 닉카제)의 임의의 성분에 임의의 방향으로 작동가능하게 연결될 수 있고, 예를 들어, 염기 편집기는 Cas9 단백질, Cas9 닉카제의 sgRNA 또는 데아미나제 (야생형 또는 조작된 (진화된) ABE 또는 CBE)에 작동가능하게 연결된 ZFP (ZFP 앵커)를 포함한다. 특정 실시양태에서, ZFP는 염기 편집기의 Cas9 도메인에 작동가능하게 연결된다. 특정 실시양태에서, 염기 편집기는 도 3의 Cas9 염기 편집기에 제시된 바와 같은 성분을 포함한다.
또 다른 측면에서, 염기 편집기는 Cas9 단백질로부터 유래된 DNA 풀림 (DNA 탈안정화) 요소를 포함하지 않는다 ("Cas9 무함유"로서 지칭되기도 함). 특정 실시양태에서, 본 발명의 Cas9 무함유 염기 편집기는 ZFP-데아미나제 융합 단백질 및 ZFN 닉카제, 및 임의로 하나 이상의 DNA 탈안정화 인자를 포함한다. 특정 실시양태에서, DNA 탈안정화 인자는 단백질 (예를 들어, 표 A에 나타낸 바와 같음) 또는 올리고뉴클레오티드 (예를 들어, 하나 이상의 PNA, LNA 및/또는 BNA)이다. 하나 이상의 비-Cas9 DNA 탈안정화 (풀림) 인자(들) (예를 들어, 표 A의 단백질, LNA, PNA, BNA 등)는 염기 편집기의 임의의 성분, 예를 들어 ZFP-데아미나제 융합 단백질의 어느 한 성분 및/또는 ZFN 닉카제의 성분 중 임의의 것에 작동가능하게 연결될 수 있다. 일부 실시양태에서, 염기 편집기는 하나 이상의 단백질 및 하나 이상의 뉴클레오티드 DNA 탈안정화 (풀림) 인자를 포함한다. 또한 추가 실시양태에서, 본원에 기재된 Cas9 무함유 염기 편집기는 CRISPR 시스템으로부터 유래된 하나 이상의 단백질을 포함하며, 이러한 단백질은 Cas9가 아니지만 DNA 탈안정화 (풀림) 특성을 갖는다.
특정 실시양태에서, 염기 편집기는 표적 부위에서 염기 편집기에 대한 단일 가닥 DNA 기질을 제공하기 위해 사용될 수 있는 하나 이상의 뉴클레오티드 서열, 예를 들어 하나 이상의 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA)을 포함한다. 이는, 예를 들어 이중 나선 침입, 삼중체 침입 또는 테일 클램프(tail-clamp)에 의해 용이하게 할 수 있다 (Quijano, et al. (2017) Yale J. Biol and Med. 90:583-598; Pellestor and Paulasova (2004) European J. Human Genetics 12:694-700; Schleifman, et al. (2011) Chem & Bio. 18:1189-1198). 염기 편집기의 하나 이상의 뉴클레오티드 서열의 구조는 DNA 및/또는 RNA 및/또는 PNA 및/또는 LNA 및/또는 BNA 염기의 길이, 수 및 위치; 포스포로티오에이트 결합; 표적 서열 조성에 따른 이들 올리고뉴클레오티드의 다른 통상적인 변형에 있어서 다양할 것이다.
특정 실시양태에서, 염기 편집기는 하나 이상의 PNA, 예를 들어, 미니PEG 치환과 증강된 결합, 증가된 용해도 및 개선된 전달을 위한 감마 위치를 함유하는 감마 PNA를 포함한다 (Bahal, et al. (2014) Current Gene Ther. 14(5):331-342). 특정 실시양태에서, PNA는 하나 이상의 O (이는 8-아미노-2,6-디옥사옥탄산 링커를 나타낸다) 및/또는 하나 이상의 시토신 (C) 또는 슈도이소시토신 잔기를 포함한다. 임의로, 하나 이상의 리신 (Lys) 잔기가 PNA 내에, 예를 들어 PNA 서열의 N- 및/또는 C-말단 상에 포함된다. 특정 실시양태에서, 1, 2, 3, 4, 5개 또는 그 초과의 Lys 잔기가 PNA의 한쪽 또는 양쪽 말단에 포함된다. 특정 실시양태에서, 둘 이상의 PNA가 염기 편집기에 사용되며, 예를 들어 서로에 대해 동일하거나 반대 방향으로 사용된다. 특정 실시양태에서, PNA는 하기 구조의 하나 이상의 PNA를 포함하나 이에 제한되지는 않는, 도 8b 내지 8e에 도시된 바와 같은 하나 이상의 PNA를 포함한다: (여기서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다). PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다.
다른 실시양태에서 염기 편집기는 하나 이상의 LNA를 포함한다. LNA는 성능 개선을 위해 스태킹 링커 및 2'-글리실아미노-LNA를 포함할 수 있다 (Geny, et al. (2016) Nucleic Acids Res. 44(5):2007-2019). 특정 실시양태에서, LNA는 임의로 하나 이상의 LNA 잔기 및/또는 DNA 잔기 사이에 하나 이상의 포스포로티오에이트 결합을 포함한다. 다른 실시양태에서, LNA는 세포로의 흡수를 증가시킬 수 있는 하나 이상의 콜레스테롤-TEG를 포함한다. 특정 실시양태에서, 염기 편집기는 하기 구조의 하나 이상의 LNA를 포함하나 이에 제한되지는 않는, 도 8f 또는 8g에 도시된 바와 같은 하나 이상의 LNA를 포함한다: (여기서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; Chol-TEG는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다).
본원에 기재된 염기 편집 조성물의 성분은 임의의 조합 (하나 이상의 닉카제 도메인, 하나 이상의 DNA 결합 도메인, 하나 이상의 기능적 도메인 등)으로 포함될 수 있으며, 이들 성분은 서로에 대해 임의의 순서로 위치할 수 있다. 일부 실시양태에서, UGI, 시티딘 및/또는 아데닌 데아미나제는 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인의 N-말단 및/또는 DNA 편집 복합체의 촉매적으로 활성인 융합 분자의 닉카제 도메인에 대해 N-말단이다. 일부 실시양태에서, 시티딘 및/또는 아데닌 데아미나제 및/또는 UGI는 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인의 C-말단 및/또는 촉매적으로 활성인 융합 분자의 닉카제 도메인에 대해 C-말단이다. 일부 실시양태에서, 하나 이상의 UGI, 시티딘 및/또는 아데닌 데아미나제(들)는 (촉매적으로 활성인 도메인 내의) DNA 결합 도메인과 닉카제 도메인(들) 사이에 위치한다. 일부 실시양태에서, 융합 분자는 시티딘 데아미나제 및 아데닌 데아미나제 도메인 또는 UGI를 포함하며, 여기서 UGI, 시티딘 및 아데닌 데아미나제는 DNA 결합 도메인, 서로 및/또는 닉카제 도메인과 관련하여 임의의 방식으로 위치한다 (예를 들어, 둘 다 임의의 순서로 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인에 대한 N-말단; 둘 다 임의의 순서로 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인에 대한 C-말단; 하나는 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인에 대한 N-말단이고, 하나는 촉매적으로 불활성인 융합 분자의 DNA 결합 도메인에 대한 C-말단, 촉매적으로 활성인 융합 분자의 닉카제 도메인 및/또는 DNA 결합 도메인에 대한 N-말단, 촉매적으로 활성인 융합 분자의 닉카제 도메인 및/또는 DNA 결합 도메인에 대한 C-말단이며; 하나는 촉매적으로 활성인 융합 분자의 닉카제 도메인 및/또는 DNA 결합 도메인에 대한 C-말단이고, 하나는 촉매적으로 활성인 융합 분자의 닉카제 도메인 및/또는 DNA 결합 도메인에 대한 N-말단, 촉매적으로 활성인 융합 분자의 닉카제 도메인과 DNA 결합 도메인 사이 등이다). 염기 편집 조성물의 하나 이상의 융합 분자의 입체 배치의 비-제한적인 예는 첨부된 도면 및 실시예에 제시되어 있다. 일부 실시양태에서, UGI, 시티딘 및/또는 아데닌 데아미나제 도메인은 관련 기술분야에 공지된 링커를 사용하여 DNA 편집 복합체의 다른 구성원에 연결된다. 염기 편집기 또는 그의 성분을 코딩하는 하나 이상의 폴리뉴클레오티드가 또한 제공된다.
또한 추가 측면에서, DNA 편집 복합체는 적어도 하나의 우라실 DNA 글리코실라제 억제제 (예를 들어 UGI) 도메인을 포함하는 하나 이상의 기능적 도메인을 포함한다. UGI 도메인(들)은 DNA 편집 복합체가 작동할 수 있도록 임의의 방식으로 DNA 편집 복합체 내로 혼입된다. 일부 실시양태에서, 염기 편집 복합체는 박테리오파지 Gam 단백질을 포함한다. 일부 실시양태에서, 염기 편집 복합체는 데아미나제, 닉카제, UGI 및/또는 GAM 단백질을 포함한다. 일부 실시양태에서, 염기 편집 복합체의 성분은 하나, 둘 또는 그 초과의 융합 단백질을 코딩하는 하나, 둘 또는 그 초과의 유전자 발현 구축물에 제공된다. 일부 실시양태에서, 하나 이상의 우라실 DNA 글리코실라제 억제제 도메인(들)은 상기 기재되고 관련 기술분야에 공지된 링커를 사용하여 복합체의 다른 구성원에 연결된다. 일부 실시양태에서, 링커는 우라실 DNA 글리코실라제 억제제를 복합체의 다른 구성원에 연결하는데 사용되며, 여기서 링커는 문헌 [Paschon, et al. (2019) Nat Commun. 10:1133]에 개시된 방법을 사용하여 확인된다.
일부 실시양태에서, DNA 편집 (염기 편집) 복합체는 이중 가닥 DNA 나선을 개방하는 데 도움을 주는 분자를 추가로 포함한다. 일부 실시양태에서, 이러한 분자는 효소를 포함한다. 일부 실시양태에서, 효소는 헬리카제 (예를 들어, RecQ 헬리카제 (WRN, BLM, RecQL4 및 RecQ5 (문헌 [Mo, et al. (2018) Cancer Lett. 413:1-10] 참조), DNA2 (문헌 [Jia, et al. (2017) DNA Repair (Amst). 59:9-19]) 및 임의의 다른 진핵 헬리카제, 예를 들어, FANCJ, XPD, XPB, RTEL1, 및 PIF1 (문헌 [Brosh (2013) Nat Rev Canc 13(8):542-558]))이다. 일부 실시양태에서, 효소는 박테리아 및/또는 바이러스 헬리카제이다. 예시적인 바이러스 헬리카제는 미오비리다에(Myoviridae) 과의 바이러스에 의해 코딩된 것 (예를 들어 gp41, Dda, UvsW, Gene α, 및 Ban); 포도비리다에(Podoviridae) 과의 바이러스에 의해 코딩된 것 (예를 들어 4B); 시포비리다에(Siphoviridae), 바쿨로비리다에(Baculoviridae), 헤르페스비리다에(Herpesviridae), 폴리오마비리다에(Polyomaviridae), 파필로마비리다에(Papillomaviridae) 및 폭스비리다에(Poxviridae) 과의 바이러스에 의해 코딩된 것 (예를 들어, G40P, p143, UL5, UL9, Tag, E1, NPH-I, NPH-II, A18R, 및 VETF), 또는 관련 기술분야에 공지된 임의의 다른 바이러스 헬리카제를 포함한다 (예를 들어 문헌 [Frick and Lam (2006) Curr Pharm Des 12(11):1315-1338] 참조). 일부 실시양태에서, 헬리카제 효소는 박테리아 효소이다. 예시적인 박테리아 헬리카제는 피. 아에루기노사(P. aeruginosa) SF4 DnaB-유사 헬리카제, 또는 박테리아, 예컨대 이. 콜라이(E. coli) 및 에이치. 파일로리(H. pylori)에서 박테리아 RecBCD 복합체의 일부인 RecB 및 RecD 헬리카제를 포함한다 (Shadrick, et al. (2013) J. Biomol Screen 18(7):761-781). 일부 실시양태에서, 다량체성 헬리카제의 조작된 또는 진화된 변이체가 사용되며, 이는 단량체성 헬리카제 활성을 발생시킨다 (예를 들어, 문헌 [Brendza, et al. (2005) PNAS 102(29):10076-70081] 참조). 일부 실시양태에서, 상기 분자는 CRISPR/Cas 복합체를 포함한다. 일부 실시양태에서, CRISPR/Cas 복합체는 가이드 RNA를 포함한다. 일부 실시양태에서, 상기 복합체는 그의 뉴클레아제 도메인에 있어서 촉매적으로 결함이 있는 Cas 효소를 포함한다. 일부 실시양태에서, 상기 복합체는 그의 뉴클레아제 도메인 중 하나에서 촉매적으로 결함이 있는 Cas 효소 (예를 들어 닉카제)를 포함한다. 일부 실시양태에서, Cas 효소는 그의 PAM 인식에 있어서 결함이 있다 (Anders, et al. (2014) Nature 513(7519):569-573). 일부 실시양태에서, Cas 효소는 천연 PAM 서열과 비교 시 완화된 (확장된) PAM 요구 사항을 갖는다 (예를 들어, 문헌 [Nishimasu, et al. (2018) Science 361:1259-1262] 참조). 특정 실시양태에서, 본원에 기재된 바와 같은 Cas 염기 편집기는 SpCas9의 NGG PAM 서열과 비교 시 완화된 (확장된) PAM 요구 사항을 나타낸다. 일부 실시양태에서, 상기 분자는 나선 탈안정화 특성을 가지고 있다. 예시적인 나선 탈안정화 분자는 단순 포진 바이러스 유형 I (문헌 [Boehmer and Lehman (1993) J Virol 67(2):711-715]), 푸랄파(Puralpha) (문헌 [Darbinian, et al. (2001) J Cell Biochem 80(4):589-95]) 및 송아지 흉선 DNA 나선 탈안정화 단백질 (문헌 [Kohwi-Shigematsu, et al. (1978) Proc Natl Acad Sci USA 75(10):4689-93])로부터의 ICP8을 포함한다. 일부 실시양태에서, 분자는 전사 및/또는 D 루프 형성/안정화에 관여한다. 이러한 클래스의 예시적인 분자는 Rad51, Rad52, RPA1, RPA2 및 RPA3, Exo1, BLM, 및 HMGB1 및 HMGB2를 포함한다. 활용될 수 있는 다른 단백질은 소 ROA1 및 이. 콜라이 RecA 또는 이. 콜라이 rad51을 포함한다. DNA 나선 탈안정화제로서 작용할 수 있는 다른 단백질 도메인은 Cas9로부터의 RecI 및 Rec II 도메인 또는 그 자체로의 RecII 도메인뿐만 아니라 Cas9로부터의 임의의 다른 나선 탈안정화 영역을 포함한다. 본원에 기재된 염기 편집기에서 사용하기 적합한 단백질 도메인의 다른 비-제한적인 예는 표 A에 제시되어 있다.
일부 실시양태에서, 분자는 올리고뉴클레오티드, PNA, LNA, BNA 등을 포함하나 이에 제한되지는 않는 핵산이다. 일부 실시양태에서, 핵산은 표적화된 편집 근처 영역과의 상동성을 갖는 DNA이다. 일부 실시양태에서, 핵산은 표적화된 편집 근처 영역과의 상동성을 갖는 RNA이다. 일부 실시양태에서, RNA는 변형된다. 일부 실시양태에서, 융합 분자는 이러한 융합 분자의 하나 이상의 도메인 사이에 아미노산 링커 서열을 포함한다. 일부 실시양태에서, 이중 가닥 DNA 나선을 개방하는 데 도움을 주기 위해 사용되는 분자(들)는 상기 기재된 링커를 사용하여 DNA 편집 복합체의 다른 구성원에 연결된다. 일부 실시양태에서, 이중 가닥 DNA 나선을 개방하는 데 도움을 주기 위해 사용되는 분자(들)는 DNA 편집 복합체의 다른 구성원에 연결되고, 이는 공지된 방법을 사용하여 확인된다.
특정 실시양태에서, 핵산은 PNA, 예를 들어 하나 이상의 O (이는 8-아미노-2,6-디옥사옥탄산 링커를 나타낸다) 및/또는 하나 이상의 시토신 (C) 또는 슈도이소시토신 잔기를 포함하는 PNA를 포함한다. 임의로, 하나 이상의 리신 (Lys) 잔기가 PNA 내에, 예를 들어 PNA 서열의 N- 및/또는 C-말단 상에 포함된다. 특정 실시양태에서, 1, 2, 3, 4, 5개 또는 그 초과의 Lys 잔기가 PNA의 한쪽 또는 양쪽 말단에 포함된다. 특정 실시양태에서, 둘 이상의 PNA가 염기 편집기에 사용되며, 예를 들어 서로에 대해 동일하거나 반대 방향으로 사용된다. 특정 실시양태에서, 하나 이상의 PNA는 하기를 포함한다: (여기서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다). PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다 (또한 도 8b 내지 8e 참조).
다른 실시양태에서 염기 편집기는 하나 이상의 LNA를 포함한다. LNA는 성능 개선을 위해 스태킹 링커 및 2'-글리실아미노-LNA를 포함할 수 있다 (Geny, et al. (2016) Nucleic Acids Res. 44(5):2007-2019). 특정 실시양태에서, LNA는 임의로 하나 이상의 LNA 잔기 및/또는 DNA 잔기 사이에 하나 이상의 포스포로티오에이트 결합을 포함한다. 다른 실시양태에서, LNA는 세포로의 흡수를 증가시킬 수 있는 하나 이상의 콜레스테롤-TEG를 포함한다. 특정 실시양태에서, 하나 이상의 LNA는 하기를 포함한다: (여기서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; "Chol-TEG"는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다) (또한, 도 8f 및 8g 참조).
이들 분자는 모두 본원에 기재된 염기 편집 시스템 내로 혼입될 수 있으며, 편집 효율성을 증가시키거나, 오프 타겟 염기 편집을 감소시키거나, 염기 편집 창을 조정하거나 또는 표적화된 유형의 핵산 염기를 변경하도록 작용할 수 있다.
일부 실시양태에서, 본원에 기재된 바와 같은 기능적 도메인은 단일 융합 분자에 포함된다. 또 다른 한편으론, 다수의 기능적 도메인을 포함하는 DNA 편집 복합체는 임의의 방식으로 별도의 융합 분자로 분리될 수 있다. 일부 실시양태에서, 하나의 융합 분자는 DNA 결합 도메인, 시티딘 및/또는 아데닌 데아미나제 및 UGI를 포함하는 반면, 제2 융합 분자는 닉카제 또는 절반-닉카제 도메인을 포함한다. 일부 실시양태에서, 하나의 융합 분자는 데아미나제 도메인에 융합된 DNA 결합 도메인에 융합된 촉매적으로 불활성인 (데드) FokI 도메인을 포함하고, 제2 융합 단백질은 절반 FokI 닉카제 단백질, DNA 결합 도메인 및 UGI 도메인을 포함한다. 일부 실시양태에서, 하나의 융합 단백질은 UGI 도메인에 융합된 데아미나제 도메인에 융합된 촉매적으로 불활성인 (데드) FokI 도메인을 포함하는 반면, 제2 융합 분자는 기능적 닉카제 단백질을 포함한다. 일부 실시양태에서, 본원에 개시된 하나 이상의 융합 단백질은 작동가능한 융합 분자 내의 도메인에 임의의 순서로 융합된다. 일부 실시양태에서, 닉카제 도메인은 Cas 닉카제 도메인이고, 일부 실시양태에서, 닉카제 도메인은 TALEN 닉카제 도메인이다. 일부 실시양태에서, 기능적 도메인 중 하나 이상은 상기 기재된 링커를 사용하여 복합체의 하나 이상의 다른 구성원에 연결된다. 일부 실시양태에서, 하나 이상의 기능적 도메인은 문헌 [Paschon, et al. (2019) Nat Commun. 10:1133]에 개시된 방법을 사용하여 확인된 링커를 사용하여 복합체의 하나 이상의 다른 구성원에 연결된다.
본원에 기재된 염기 편집기(들)는 하나 이상의 폴리뉴클레오티드에 의해 코딩될 수 있다. 하나 이상의 폴리뉴클레오티드는 바이러스 벡터 (AAV, Ad 등), 비-바이러스 벡터 (플라스미드, mRNA 등) 또는 그의 조합 상에서 운반될 수 있다. 특정 실시양태에서, 하나의 폴리뉴클레오티드는 염기 편집기의 모든 성분을 포함하는 반면, 다른 실시양태에서, 염기 편집기의 성분은 2개 이상의 폴리뉴클레오티드 (예를 들어, 분할 효소 및/또는 ZFP를 운반하는 별도의 폴리뉴클레오티드)에 의해 운반된다.
또 다른 측면에서, 본원에는 본원에 기재된 바와 같은 하나 이상의 DNA 편집 복합체를 사용하여 DNA 분자를 편집 (예를 들어, 유전자 편집)하는 방법이 기재된다. 이와 같이 기재된 방법은 DNA 분자가 편집되도록 하나 이상의 DNA 편집 복합체를 세포에 도입하는 것을 포함한다. 세포는 단리될 수 있거나 또는 (예를 들어, 대상체에게 정맥내 또는 다른 투여를 통해) 살아있는 대상체 내에 있을 수 있다. 일부 실시양태에서, DNA 분자는 세포 내의 염색체 또는 염색체 외 에피솜이다. 일부 실시양태에서, 염색체 또는 염색체 외 에피솜은 본원에 개시된 융합 단백질에 의해 우라실 염기 ("U")로 탈아미노화되는 시티딘 염기 ("C")를 포함한다. 일부 실시양태에서, U는 DNA 복제 동안 티미딘 염기 ("T")로 대체된다. 일부 실시양태에서, 염색체 또는 염색체 외 에피솜은 본원에 개시된 융합 단백질에 의해 이노신 ("I") 염기로 탈아미노화되는 아데닌 염기 ("A")를 포함한다. 일부 실시양태에서, I는 복제 동안 구아닌 염기 ("G")로 대체된다. 일부 실시양태에서, 염색체 또는 염색체 외 에피솜은 CA 또는 AC 디뉴클레오티드가 UI 또는 IU 디뉴클레오티드로 탈아미노화되도록 본원에 개시된 데아미나제에 의해 탈아미노화되는 아데닌 및 시티딘 염기를 포함한다 (예시적인 시스템에 관해서는 도 1 참조).
일부 실시양태에서, 닉카제 도메인은 FokI DNA 절단 도메인으로부터 유래된다 (미국 특허 번호 5,436,150; 8,703,489; 9,200,266; 및 9,631,186 참조). 일부 실시양태에서, FokI 닉카제는 모 FokI 닉카제와 비교 시 하나 이상의 돌연변이를 포함한다. 본원에 기재된 바와 같은 돌연변이는 절단 도메인의 전하를 변화시키는 돌연변이, 예를 들어 양으로 하전된 잔기의 비-양으로 하전된 잔기로의 돌연변이 [예를 들어, K 및 R 잔기의 돌연변이 (예를 들어, S로 돌연변이됨); N 잔기의 돌연변이 (예를 들어, D로 돌연변이됨), 및 Q 잔기의 돌연변이 (예를 들어, E로 돌연변이됨)]; 분자 모델링에 기초하여 DNA 백본에 근접한 것으로 예측되고 FokI 상동체에서의 변이를 나타내는 잔기로의 돌연변이; 및/또는 다른 잔기에서의 돌연변이를 포함하나 이에 제한되지는 않는다 (예를 들어, 미국 특허 번호 8,623,618 및 문헌 [Guo, et al. (2010) J. Mol. Biol. 400(1):96-107]). 닉카제는 ZFN 닉카제, TALEN 닉카제 및 CRISPR/Cas 시스템, 예컨대 Cas 닉카제일 수 있다.
일부 실시양태에서, 염기 편집기는 FokI 또는 FokI 동족체로부터 유래되는 절단 도메인을 포함하는 DNA 결합 도메인 (예를 들어, 조작된 닉카제 도메인)을 포함하고, 서열식별번호: 5에 제시된 바와 같은 야생형 완전한 길이의 FokI를 기준으로 하여 넘버링된 아미노산 잔기 416, 418, 422, 447, 448, 476, 479, 481 및/또는 525 중 하나 이상, 또는 FokI 동족체 내의 상응하는 잔기에서의 돌연변이를 포함한다. 일부 실시양태에서, FokI로부터 유래된 절단 절반 도메인은 387, 393, 394, 398, 400, 416, 418, 422, 427, 434, 439, 441, 442, 444, 446, 448, 472, 473, 476, 478, 479, 480, 481, 487, 495, 497, 506, 516, 523, 525, 527, 529, 534, 559, 569, 570, 및/또는 571 중 하나 이상을 포함하여, 아미노산 잔기 414-426, 443-450, 467-488, 501-502, 및/또는 521-531 중 하나 이상에서의 돌연변이를 포함한다. 돌연변이는 상응하는 위치에서 FokI에 상동인 자연 제한 효소에서 발견되는 잔기에 대한 돌연변이를 포함할 수 있다. 일부 실시양태에서, 돌연변이는 치환, 예를 들어 야생형 잔기를 임의의 상이한 아미노산, 예를 들어 알라닌 (A), 시스테인 (C), 아스파르트산 (D), 글루탐산 (E), 히스티딘 (H), 페닐알라닌 (F), 글리신 (G), 아스파라긴 (N), 세린 (S) 또는 트레오닌 (T)으로 치환하는 것이다. 일부 실시양태에서, FokI 뉴클레아제 도메인은 416, 418, 422, 476, 447, 479, 481 및/또는 525 (야생형인 서열식별번호: 5를 기준으로 하여 넘버링됨) 중 하나 이상에서의 돌연변이를 포함한다. 뉴클레아제 도메인은 또한, ELD, KKR, ELE, KKS를 포함하나 이에 제한되지는 않는, 위치 418, 432, 441, 448, 476, 481, 483, 486, 487, 490, 496, 499, 523, 527, 537, 538 및 559에서의 하나 이상의 돌연변이를 포함할 수 있다 (예를 들어, 미국 특허 번호 8,623,618 참조). 일부 실시양태에서, 절단 도메인은 잔기 419, 420, 425, 446, 447, 470, 471, 472, 475, 478, 480, 492, 500, 502, 521, 523, 526, 530, 536, 540, 545, 573 및/또는 574 중 하나 이상에서의 돌연변이를 포함한다. 특정 실시양태에서, 본원에 기재된 변이체 절단 도메인은 뉴클레아제 이량체화에 관여한 잔기에 대한 돌연변이 (이량체화 도메인 돌연변이), 및 예를 들어, 인산염 접촉에 참여할 수 있는 아미노산 잔기에서, 이량체화 도메인을 벗어난 아미노산 위치에서의 1, 2, 3, 4, 5, 6개 또는 그 초과의 돌연변이와 조합하는 하나 이상의 부가의 돌연변이; 예를 들어, 인산염 접촉 잔기에 대한 돌연변이: 예를 들어 이량체화 돌연변이체 (예컨대 ELD, KKR, ELE, KKS 등)를 포함한다. 일부 실시양태에서, 위치 416, 418, 422, 447, 448, 476, 479, 481 및/또는 525에서의 돌연변이는 양으로 하전된 아미노산을 비하전되거나 또는 음으로 하전된 아미노산으로 대체하는 것을 포함한다. 다른 실시양태에서, 위치 446, 472 및/또는 478 (및 임의로, 예를 들어 이량체화 또는 촉매 도메인 내의 부가의 잔기)에서의 돌연변이가 만들어진다. 일부 실시양태에서, 돌연변이는 I479Q 및/또는 Q481A 돌연변이를 포함한다.
일부 실시양태에서, 조작된 절단 절반 도메인은 본원에 기재된 돌연변이 이외에, 이량체화 도메인에서의 돌연변이, 예를 들어, 아미노산 잔기 490, 537, 538, 499, 496 및 486에서의 돌연변이를 포함한다. 일부 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 본원에 기재된 하나 이상의 돌연변이 이외에, 위치 486에서의 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서의 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되며, 위치 496에서의 야생형 Asn (N) 잔기가 Asp (D) 또는 Glu (E) 잔기로 대체되는 ("ELD"또는 "ELE") 폴리펩티드를 포함한다. 일부 실시양태에서, 조작된 닉카제 절반 도메인은 야생형 FokI 또는 FokI 동족체 절단 절반 도메인으로부터 유래되고, 아미노산 잔기 416, 418, 422, 447, 448, 476, 479, 481 또는 525에서의 하나 이상의 돌연변이 이외에, 야생형 FokI (서열식별번호: 5)를 기준으로 하여 넘버링된 아미노산 잔기 490, 538 및 537에서의 돌연변이를 포함한다. 일부 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 닉카제 절반-도메인은 본원에 기재된 하나 이상의 돌연변이 이외에, 위치 490에서의 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서의 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되며, 위치 537에서의 야생형 His (H) 잔기가 Lys (K) 잔기 또는 Arg (R) 잔기로 대체되는 ("KKK" 또는 "KKR") (본원에 참조로 포함된 미국 특허 번호 8,962,281 참조) 폴리펩티드를 포함한다 (미국 특허 공개 번호 2018/0087072 참조).
일부 실시양태에서, DNA 결합 도메인 및 조작된 FokI 또는 그의 동족체, 및 인공 뉴클레아제를 생산하는 본원에 기재된 바와 같은 절단 절반-도메인을 포함하는 융합 분자가 제공된다. 일부 실시양태에서, 융합 분자의 DNA 결합 도메인은 징크 핑거 결합 도메인 (예를 들어, 조작된 징크 핑거 결합 도메인, ZFP)이다. 일부 실시양태에서, 징크 핑거 중 하나 이상은 상기 문헌 ([Paschon, et al.] 참조)에 개시된 방법을 사용하여 확인된 링커를 사용하여 함께 연결된다. 일부 실시양태에서, DNA 결합 도메인은 TALE DNA 결합 도메인 (TALE)이다. 일부 실시양태에서, DNA 결합 도메인은 DNA 결합 분자 (예를 들어 가이드 RNA) 및 촉매적으로 불활성인 Cas 또는 Cpf1 (Cas12a로서 공지되기도 함) 단백질 (예를 들어 dCas9 또는 dCpf1)을 포함한다. 일부 실시양태에서, DNA 결합 도메인은 촉매적으로 불활성인 Cas (dCas) 단백질에 융합된 ZFP를 포함한다. 일부 실시양태에서, ZFP-dCas 융합 단백질은 PAM 특이성을 변경시키는 돌연변이를 포함한다. 일부 실시양태에서, ZFP-dCas 단백질은 DNA 서열과 특이적으로 결합하는 PAM 인식에 의존적이지 않다. 일부 실시양태에서, DNA 결합 도메인은 dCas 단백질에 융합된 TALE를 포함한다. 일부 실시양태에서, TALE-dCas 융합 단백질은 PAM 특이성을 변경시키는 돌연변이를 포함한다. 일부 실시양태에서, TALE-dCas 단백질은 DNA 서열과 특이적으로 결합하는 PAM 인식에 의존적이지 않다. 상기 실시양태 중 임의의 것에서, DNA 결합 도메인 (예를 들어, ZFP, TALE 또는 가이드 RNA 및 Cas 시스템)을 조작된 FokI 또는 그의 동족체에 연결시키기 위해 사용되는 링커는 관련 기술분야에 공지된 방법을 사용하여 확인된다 (예를 들어, 문헌 [Paschon, et al. (2019) Nat Commun. 10:1133] 참조).
일부 실시양태에서, DNA 편집 복합체는 이중 가닥 DNA 내의 특이적 DNA 염기를 편집한다. 일부 실시양태에서, 편집은 세포 내의 DNA 분자에서 만들어진다. 일부 실시양태에서, DNA는 세포의 염색체 내에 있다. 일부 실시양태에서, 편집은 C:G 염기쌍에서 T:A 염기쌍으로의 변화를 발생시킨다. 일부 실시양태에서, 편집은 C:G 염기쌍에서 G:C 염기쌍으로의 변화를 발생시킨다. 일부 실시양태에서, 편집은 A:T 염기쌍에서 G:C 염기쌍으로의 변화를 발생시킨다. 일부 실시양태에서, 편집은 엑손에서 이루어진다. 일부 실시양태에서, 편집은 정지 코돈 (예를 들어 TAA, TAG, TGA)의 도입을 발생시킨다. 일부 실시양태에서, 염기 편집은 표적화된 유전자의 유전자 발현의 녹아웃을 발생시킨다. 일부 실시양태에서, 편집은 스플라이싱 서열 (예를 들어, 5' 컨센서스 서열이 G T A/G A/C/T G T/G/A/C A/G/T/C (T/C/G/A)3 (서열식별번호: 73)이고, 3' 컨센서스 서열이 (T/C)10 T/C/A/G C/T A G (서열식별번호: 74)인 U2 스플라이스 서열; 및 5' 컨센서스 서열이 G/A T A T C T T/C이고, 3' 컨센서스 서열이 (T/G/A/G)2 T/A/C/G (T/C/A/G)2 C/T A G/C인 U12 스플라이스 서열)을 코딩하는 서열에서 이루어진다 (문헌 [Turunen, et al. (2013) Wiley Interdiscip Rev RNA. 4(1):61-76] 참조). 일부 실시양태에서, 새로운 스플라이싱 서열이 생성된다. 일부 실시양태에서, 스플라이싱 서열은 더 이상 스플라이싱 서열로서 기능하지 않도록 변경된다. 일부 실시양태에서, 스플라이싱 서열의 변경은 엑손 스키핑을 유발한다. 일부 실시양태에서, 희귀 코돈이 생성되도록 서열이 변경된다. 일부 실시양태에서, 염기 편집은 질환과 연관된 유전자가 교정되도록 DNA 서열에서 점 돌연변이의 교정을 유발한다. 질환의 치료 및/또는 예방을 위한 염기 편집의 비-제한적인 예는 V617F 버전이 더 이상 발현되지 않도록 하는 JAK2의 편집 (그에 의해, 비제어된 혈액 세포 생산을 발생시키는 상기 유전자의 활성화가 감소된다); 다른 암 유전자, 예컨대 BCR/ABL을 녹아웃 또는 억제하기 위한 염기 편집; A1AT의 염기 편집 등을 포함한다. 치료될 수 있는 예시적인 질환은 겸상 적혈구병, 혈우병, 낭포성 섬유증, 페닐케톤뇨증, 테이 삭스병(Tay-Sachs), 색맹, 파브리병(Fabry disease), 프리드라이히(Friedreich) 운동실조, 전립선암, 및 다른 많은 것을 포함한다.
일부 실시양태에서, 본원에 개시된 바와 같은 염기 편집 복합체는 RNA 분자 상에서 작용한다. 일부 실시양태에서, 염기 편집기는 RNA 특이적 데아미나제, 예컨대 ADAR2 (RNA 유형 2 상에서 작용하는 아데노신 데아미나제)를 활용한다 (문헌 [Cox, et al. (2017) Science 358(6366):1019-1027] 참조).
또한 본원에는 조성물 중 임의의 것 (염기 편집 조성물 및/또는 이들 조성물을 코딩하는 하나 이상의 폴리뉴클레오티드)을 포함하는 세포뿐만 아니라 본원에 개시된 방법 및 조성물에 의해 변형시킨 이들 세포의 자손인 세포가 개시된다. 일부 실시양태에서, 세포는 박테리아 세포 또는 진핵 세포이다. 일부 실시양태에서, 세포는 염기 편집기 복합체 및 염기 편집기 복합체 유도된 DNA 또는 RNA 변형을 포함한다. 변형된 세포 및 이러한 변형된 세포로부터 유래된 임의의 세포가 본 개시내용의 염기 편집기 복합체를 반드시는 아니지만 일시적 그 이상으로 포함하지만, 이러한 염기 편집기 복합체에 의해 매개되는 게놈 변형은 남아 있다.
또한 또 다른 측면에서, 관심 영역에서 세포 염색질의 표적화된 편집을 위한 방법; 감염을 치료하는 방법; 및/또는 질환을 치료하는 방법이 본원에 개시되어 있다. 이들 방법은 시험관 내, 생체 외 또는 생체 내 또는 그의 조합으로 실시될 수 있다. 상기 방법은 본원에 기재된 바와 같은 염기 편집 복합체 (예를 들어 융합 폴리펩티드 및 임의로, 하나 이상의 융합 폴리펩티드(들)가 본원에 개시된 바와 같은 조작된 닉카제를 포함하는 임의의 관련 핵산)를 발현함으로써 세포 내의 미리 결정된 관심 영역에서 세포 염색질을 편집하는 것을 수반한다. 특정 실시양태에서, 온 타겟(on-target) 부위의 표적화된 편집은 세포의 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%에서 발견된다.
본원에 개시된 바와 같은 염기 편집 복합체는 관심 영역에서 세포 염색질의 표적화된 편집을 위한 방법에 사용될 수 있다. 세포는 배양된 세포, 세포주, 유기체 내의 세포, 세포 및/또는 그 자손이 처리 후 유기체로 되돌아가는 경우 처리를 위해 유기체로부터 제거된 세포, 및 유기체로부터 제거되고, 본 발명의 융합 분자를 사용하여 변형된 다음, 치료 방법 (세포 요법)에서 유기체로 되돌아 가는 세포를 포함한다. 세포 염색질에서의 관심 영역은, 예를 들어, 게놈 서열 또는 그의 일부분일 수 있다.
융합 분자는, 예를 들어, 이러한 융합 분자를 폴리펩티드로서 세포에 전달하거나, 또는 융합 분자를 코딩하는 폴리뉴클레오티드를 세포에 전달함으로써 세포에서 발현될 수 있으며, 여기서 폴리뉴클레오티드는 DNA인 경우, 전사되고 번역되어 융합 분자를 생성한다. 추가로, 폴리뉴클레오티드가 융합 분자를 코딩하는 mRNA인 경우, 이러한 mRNA가 세포로 전달된 후, mRNA는 번역되어 융합 분자를 생성한다.
본 발명의 다른 측면에서는 염기 편집 특이성을 증가시키기 위한 방법 및 조성물이 제공된다. 일부 실시양태에서, 오프 타겟 편집 활성을 감소시킴으로써 전반적인 온 타겟 편집 특이성을 증가시키기 위한 방법이 제공된다. 일부 실시양태에서, 염기 편집과 연관된 삽입-결실 [인델(indel)] 형성을 감소시키기 위한 방법이 제공된다. 일부 실시양태에서, 조작된 염기 편집 복합체의 조작된 닉카제 성분 (ZFN 닉카제를 형성하는 닉카제 파트너, 예를 들어 촉매적으로 불활성인 ZFN 파트너 및 촉매적으로 활성인 ZFN 파트너)이 세포와 접촉하는 데 사용되며, 여기서 상기 복합체의 각각의 닉카제 파트너는 다른 파트너와 일 대 일이 아닌 비율로 제공된다. 일부 실시양태에서, 두 파트너의 비율은 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 또는 1:20 비율, 또는 그 사이의 임의의 값으로 제공된다. 다른 실시양태에서, 두 파트너의 비율은 1:30 초과이다. 일부 측면에서, 각각의 파트너는 mRNA로서 세포에 전달되거나 또는 바이러스 또는 비-바이러스 벡터로 전달되며, 여기서 각각의 파트너를 코딩하는 mRNA 또는 벡터의 상이한 수량이 전달된다. 추가 실시양태에서, 뉴클레아제 복합체의 각각의 파트너는 단일 바이러스 또는 비-바이러스 벡터 상에 포함될 수 있지만, 하나의 파트너가 다른 파트너보다 더 높거나 더 낮은 값으로 발현되도록 의도적으로 발현되어, 궁극적으로 일 대 일이 아닌 절단 절반 도메인의 비율로 세포에 전달된다. 일부 실시양태에서, 각각의 절단 절반 도메인은 상이한 발현 효율성을 갖는 상이한 프로모터를 사용하여 발현된다. 일부 실시양태에서, 2개의 절단 도메인은 바이러스 또는 비-바이러스 벡터를 사용하여 세포로 전달되며, 여기서 둘 다는 동일한 오픈 리딩 프레임으로부터 발현되지만, 두 파트너를 코딩하는 유전자는 특정 서열 (예를 들어 자기 절단 2A 서열 또는 IRES)에 의해 분리되어, 3' 파트너가 더 낮은 비율로 발현되므로, 두 파트너의 비율이 1:2, 1:3, 1:4, 1:5, 1:6, 1:8, 1:9, 1:10 또는 1:20 비율 또는 그 사이의 임의의 값이 된다. 다른 실시양태에서, 두 파트너는 1:1과 상이하도록 선택되는 비율로 전개된다.
또 다른 측면에서, 본원에는 본원에 기재된 바와 같은 하나 이상의 염기 편집기를 사용하여 생산된 세포 집단이 기재된다. 특정 실시양태에서, 세포의 5% 내지 20% 초과 (또는 그 사이의 임의의 값), 바람직하게 20% 초과, 보다 더 바람직하게 50% 초과, 보다 더 바람직하게 80% 내지 100%가, 표적화된 염기에 대한 변형을 포함한다 (예를 들어, 이는 염기 편집된 세포이다). 또한 추가 실시양태에서, 편집된 세포는 오프 타겟 편집 (게놈의 어느 곳에서나 의도하지 않은 편집) 및/또는 방관자 (매우 근접한 편집 이벤트, 예를 들어 의도된 표적 염기의 어느 한 쪽에 있는, 예를 들어 Cas9의 프로토스페이서 영역 내에 있는 1 내지 20개 (또는 그 사이의 임의의 값) 뉴클레오티드) 돌연변이를 거의 또는 전혀 나타내지 않는다. 본원에 기재된 바와 같은 염기 편집된 세포의 단리된 집단은 대상체에서 질환의 생체 외 치료에 사용될 수 있고/있거나 생체 외 치료로서 사용하기 전에 생체 외에서 (예를 들어, 본원에 기재된 바와 같은 추가 라운드의 염기 편집을 통해) 추가로 조작될 수 있다. 또한, 염기 편집은 생체 내 시행되어, 생체 내에서 질환 관련 돌연변이를 교정한 후 대상체에서 질환 또는 병태가 치료되도록 할 수 있다.
일부 실시양태에서, 닉카제 파트너는 부가의 활성 도메인에 융합된다. 일부 실시양태에서, 부가의 도메인은 하나 이상의 데아미나제 (예를 들어 A 특이적 또는 C 특이적), UGI 도메인, 헬리카제, 및 GAM 도메인으로부터 선택된 하나 이상의 예시적인 도메인을 포함한다. 또 다른 측면에서, 본원에는 본원에 기재된 바와 같은 염기 편집 복합체, 또는 본원에 기재된 바와 같은 하나 이상의 염기 편집 복합체 단백질을 코딩하는 하나 이상의 폴리뉴클레오티드(들); 보조 시약; 및 임의로 지침 및 적합한 용기를 포함하는 키트가 기재된다.
이들 측면 및 다른 측면은 전체로서의 개시내용에 비추어 통상의 기술자에게 쉽게 명백할 것이다.
도 1a 내지 1d는 예시적인 DNA 편집 시스템 및 복합체를 묘사하는 개략도이다. 도 1a는 DNA 결합 도메인 (예를 들어, ZFP, TALE, sgRNA)을 포함하는 하나의 촉매적으로 불활성인 ("X"로서 표시됨) 융합 분자 및 DNA 결합 도메인 (예를 들어, ZFP, TALE, sgRNA)을 또한 포함하는 하나의 촉매적으로 활성인 닉카제 융합 분자 (가위로서 표시됨)를 포함하는 시스템을 도시한다. 촉매적으로 활성인 융합 분자와 촉매적으로 불활성인 융합 분자는 DNA 결합 도메인이 각각의 표적 부위와 결합하면 이량체화되고, 결합 후 표적 DNA를 편집한다 (예를 들어, 염기 편집). 도 1a는 또한 2개의 UGI 도메인을 포함하는 복합체를 도시한다. 도 1b는 염기 편집을 위한 추가의 예시적인 Cas9 및 Cas9 무함유 시스템을 도시한다. 상단 패널은 임의의 아데노신 또는 시토신 데아미나제 도메인의 성분의 이량체화를 통해 기능하는 염기 편집기를 도시한다. 도 1b의 하단 패널은 본원에 기재된 바와 같은 ABE 및 CBE 염기 편집기의 다양한 실시양태를 도시한다. 도 1c는 임의로 ZFP 앵커에 연결된 Cas9 DNA 탈안정화 분자 (예를 들어, sgRNA에 작동가능하게 연결된 dCas9를 포함하는 RNA 프로그램가능한 시스템); ZFP-데아미나제 융합 단백질; 및 ZFN 닉카제를 포함하는 본원에 기재된 바와 같은 염기 편집기의 또 다른 실시양태를 도시한다. 특정 실시양태에서, ZFN 닉카제는 존재하지 않으며 DNA 탈안정화 분자는 임의의 RNA 프로그램가능한 분자를 포함한다. 본 도식은 ZFP-데아미나제 융합 단백질로부터 Cas9 닉카제의 반대 쪽에 있는 ZFN 닉카제를 도시하지만, ZFN 닉카제와 ZFP-데아미나제 둘 다는 Cas9 닉카제에 대해 3' 또는 5'일 수 있다는 것이 분명할 것이다. 도 1d는 추가의 Cas9 무함유 (비-Cas9로서 지칭되기도 함) 염기 편집 시스템을 도시한다. 삼각형은 닉킹이 발생하는 위치를 나타내고 "PNA"는 펩티드 핵산을 지칭하며; "LNA"는 잠금 핵산을 지칭하고 "BNA"는 가교 핵산을 지칭한다. 이들 염기 편집기에서의 뉴클레오티드 (예를 들어, DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA))는 표적 부위에서 염기 편집기를 위한 단일 가닥 DNA 기질을 제공할 수 있다.
도 2는 예시적인 아데닌 염기 편집기에 의해 표적화된 DNA를 도시하는 개략도이다. 본 도면은 야생형 mRNA 프로토스페이서 및 PAM이 상단에 정렬된 A1AT Z 돌연변이 근처의 DNA 서열을 도시한다 (서열식별번호: 78). 프로토스페이서의 오른쪽에는 몇 가지 상이한 ZFP의 DNA 표적이 도시된다. 도시된 바와 같이, PAM 서열을 필요로 하는 ABE의 경우, 염기 편집을 위한 표적 (염기 편집 창으로서 지칭되기도 함)은 전형적으로 PAM 서열로부터의 13 내지 16개 뉴클레오티드이며, 그 크기가 3, 4, 5, 6, 7개 또는 그 초과의 뉴클레오티드일 수 있다 (본 도면에는 4개 뉴클레오티드의 염기 편집 창이 도시된다) (서열식별번호: 77).
도 3a 및 3b는 예시적인 ZFP 염기 편집기를 묘사하는 개략도이다. 도 3a는 예시적인 ZFP 아데닌 염기 편집기를 도시한다. 상단 패널은 표시된 성분이 있는 예시적인 편집기를 도시한다. 중간 패널은 2개의 이. 콜라이 tRNA 특이적 아데노신 데아미나제 (tadA)를 사용하는 예시적인 ABE를 도시하며, 여기서 하나는 야생형 서열이고 다른 하나는 진화된 서열이다 (Gaudelli, et al. (2017) Nature 551(7681):464-471). TadA 도메인은 도시된 링커 (서열식별번호: 2)를 사용하여 서로 부착되고 SPCas9 서열에 부착된다. 사용된 SpCas9는 공지된 완화된 PAM 요구 사항을 갖는 VRVRFRR 변이체이다 (문헌 [Nishimasu, et al. (2018) Science 361:1259-1262] 참조). 이어서 Cas9 서열은 ZFP DNA 결합 도메인에 연결되며, 여기서 사용된 링커 (서열식별번호: 3)는 2개의 NLS 서열과 3개의 HA 태그를 포함할 수 있다. Cas9VR은 Cas9NG로서 지칭되기도 한다. 도 3b는 본원에 기재된 바와 같은 예시적인 Cas9 및 Cas9 무함유 염기 편집기를 도시한다. 하기 약어가 사용된다: "TadA"는 야생형 아데닌 데아미나제 도메인을 지칭하고; TadA*는 진화된 (조작된) 아데닌 데아미나제 도메인을 지칭하며; "7.8" "7.9" "7.10" 및 "MAX"는 문헌 [Gaudelli, et al. (2017) Nature 551(7681):464-471) 및 Koblan, et al. (2018) Nat Biotechnol. 36(9):843-846]에 기재된 바와 같은 진화된 (조작된) 아데닌 데아미나제 도메인을 지칭하고; "SpCas9 [PAMs: NGG]"는 문헌 [Jinek, et al. (2012) Science 337(6096):816-21]에 기재된 바와 같은 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)로부터의 Cas9를 지칭하며; "SpXCas9-3.7 [PAMs: NGN, GAA & GAT]"은 문헌 [Hu, et al. (2018) Nature 556(7699):57-63]에 기재된 바와 같은 광범위한 PAM 적합성을 갖는 SpCas9 변이체를 지칭하고; "SpCas9-NG [PAMs: NGN; 시험관 내 NAN]"는 문헌 [Nishimasu, et al. (2018) Science 361(6408):1259-1262]에 기재된 바와 같은 완화된 PAM 요구 사항을 갖는 SpCas9 변이체를 지칭하며; "ScCas9 [PAMs: TGT, …]"는 문헌 [Chatterjee, et al. (2018) Sci Adv 4(10):eaau0766. doi: 10.1126/sciadv.aau0766]에 기재된 바와 같은 최소한의 PAM 특이성을 갖는 SpCas9 오르소로그(ortholog)를 지칭하며; "NO CAS9"는 이러한 도메인이 존재하지 않는다는 것을 의미하고 (Cas9 무함유 염기 편집기); "5F ZFP"는 5개 핑거 ZFP를 지칭하며; "6F ZFP"는 6개 핑거 ZFP를 지칭하고; ">6F ZFP"는 6개 초과의 핑거를 갖는 ZFP를 지칭하며; "ZFP RQ" 및 "(…)"는 문헌 [Miller, et al. (2019) Nature Biotechnology 37(8):945-952]에 기재된 바와 같은 변형된 ZFP를 지칭한다.
도 4는 아데닌 염기 편집기에 의해 표적화를 위해 분석되는 편집 창 (서열식별번호: 4) 내에 있는 아데닌 염기를 묘사하는 개략도이다.
도 5a 내지 5f는 예시적인 시티딘 염기 편집기 구축물을 묘사하는 개략도이다. 도 5a 및 5b는 C 뉴클레오티드를 U로 탈아미노화할 수 있는 APOBEC1 (도 5a) 또는 AID (도 5b) 시티딘 효소를 코딩하는 서열에 추가로 연결된, ZFP DNA 결합 도메인에 연결된 2개의 UGI 단백질을 코딩하는 서열을 포함하는 염기 편집기 구축물을 도시한다. 도 5c 및 5d는 도 5a 및 5b의 구축물의 UGI 도메인이 결여된 2개의 시티딘 염기 편집기 구축물을 도시한다. 도 5e 및 5f는 FokI 닉카제를 코딩하는 서열을 활용하는 2개의 구축물을 도시한다. 이들 구축물은 시티딘 염기 편집기를 코딩하는 서열이 ZFP DNA 결합 도메인에 연결된 다음 FokI 촉매적으로 불활성인 뉴클레아제 도메인에 연결되는 한 쌍으로서 사용될 수 있다. 제2 구축물 (도 5f)은 촉매적으로 활성인 FokI 뉴클레아제 도메인을 코딩하는 서열에 연결되는 ZFP DNA 결합 도메인에 연결된 2개의 UGI 도메인을 코딩하는 서열을 포함한다. 이러한 쌍은 활성 염기 편집기를 만들기 위해 임의의 방식으로 구축될 수 있으며, 여기서 활성 및 불활성 FokI 도메인은 두 파트너 구축물 중 하나에 있을 수 있고, UGI 서열 및 시티딘 염기 편집기 서열은 어느 한 파트너에 있을 수 있다.
도 6a 및 6b는 2개의 예시적인 아데닌 염기 편집기를 도시한다. 도 6a는 ZFP DNA 결합 도메인에 연결된 2개의 TadA 도메인, 즉 1개의 야생형 도메인과 1개의 진화된 도메인을 코딩하는 서열을 포함하는 구축물을 도시한다. 도 6b에 도시된 바와 같이, 일부 변이에서 구축물은 촉매적으로 불활성인 FokI 도메인을 추가로 포함한다.
도 7a 내지 7c는 JAK2 V617F 표적의 염기 편집을 예시한다. 도 7a는 왼쪽에 야생형 DNA 이중 가닥 서열 (서열식별번호: 30)을 도시하며, 코딩된 발린 (V)이 상단에 표시된다. 중간 서열은 돌연변이된 DNA 이중 가닥 서열 (서열식별번호: 31)을 나타내며, 돌연변이체 페닐알라닌 (F)이 상단에 표시된다. 오른쪽에는 2가지 가능한 염기 편집된 결과 (서열식별번호: 32 및 33)가 도시되며, 여기서 편집된 뉴클레오티드는 상단에 세린 (S) 또는 프롤린 (P)에 대한 변화와 함께 볼드체로 표시된다. 도 7b는 JAK2 V617F 돌연변이를 둘러싼 DNA 서열 (서열식별번호: 34)을 도시하며, 2개의 가장 가까운 PAM 부위가 표시된다. 도 7b는 서열식별번호: 79로서의 단백질 서열을 개시한다. 도 7c는 V617F 돌연변이가 없는 K562 세포에서 표시된 염기 편집기를 사용한 예시적인 결과를 도시한다. 염기 편집 창 내의 다른 A:T 쌍은 시험된 염기 편집기의 활성을 평가하기 위해 사용되었다. ABEmax-Cas9NG는 ABEmax에 융합된 Cas9NG 닉카제를 나타낸다. ABEmax-Cas9는 7개의 상이한 ZFP (ZFP 2, ZFP 4, ZFP 6 및 ZFP 7로 제시됨)로 고정되었다. 도 7c는 왼쪽에 3개의 상이한 PAM 부위 (AAT, TAA, AAA; 도 7b 참조)에 대한 결과를 도시한다. 여기에서, ABEmax 발현 구축물 둘 다뿐만 아니라 상응하는 sgRNA가 플라스미드 DNA (각각 600 ng)로서 공급되었다. ZFP 고정된 ABEmax-Cas9NG 구축물은 3개의 PAM 부위 모두에 대해 증가된 효율성을 보여준다 (AAT 및 AAA PAM 부위의 경우 대략 2배이고, TAA PAM 부위의 경우 대략 12배이다). AAT 및 TAA PAM 부위에 대한 염기 편집기는 또한, 더 높은 용량 (800 ng 플라스미드 DNA)에서 시험되었으며 유사한 결과를 보여준다. ZFP 6은 AAT PAM 부위에 대해 대략 2.5배 더 높은 활성을 발생시키고, ZFP 2는 TAA PAM 부위에 대해 대략 17배 더 높은 활성을 발생시킨다.
도 8a 내지 8g는 뉴클레오티드 (예를 들어, 도 1d에 도시된 바와 같은 표적 부위에서 염기 편집기에 대한 단일 가닥 DNA 기질을 제공하기 위해 사용되는 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA))를 포함하는 예시적인 염기 편집기를 도시하는 개략도이다. 도 8a는 염기 편집기의 뉴클레오티드 함유 단일 가닥 기질과 접촉하기 이전 (왼쪽) 및 이후 (오른쪽) 편집될 표적화된 염기 ("X")를 묘사한다. 도 8b는 본원에 기재된 바와 같은 염기 편집기에 사용하기 위한 예시적인 PNA (PNA#1)를 도시하며, PNA는 하기 구조를 갖는다: N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C. 도 8c는 본원에 기재된 바와 같은 염기 편집기에 사용하기 위한 예시적인 PNA (PNA#2)를 도시하며, PNA는 하기 구조를 갖는다: N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C. 도 8d는 염기 편집기가 2개의 PNA (서로에 대해 반대 방향으로 구조 N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C를 갖는 PNA #3 및 구조 N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C를 갖는 PNA #4)를 포함하는 예시적인 실시양태를 도시한다. 도 8e는 PNA가 구조 N-Lys-Lys-Lys-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C (PNA #5)를 포함하는 예시적인 실시양태를 도시한다. 도 8b 내지 8e에서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다. PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다. 도 8f 및 8g는 LNA를 포함하는 염기 편집기의 예시적인 실시양태를 도시한다. 도 8f는 예시적인 LNA (LNA#1) (서열식별번호: 80)를 도시한다. 예시적인 LNA#1 서열은 를 포함한다. 도 8g는 염기 편집기가 서로에 대해 반대 방향으로 도시된 2개의 LNA (LNA#2: 5'-NnNnNnNnNntctctNnNnNnNnNn-3' (서열식별번호: 71) 및 LNA#3: 5'-NnNnNnNnNntctctNnNnNnNnNn-3' (서열식별번호: 72))를 포함하는 예시적인 실시양태를 도시한다. 도 8f 및 8g에서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; "Chol-TEG"는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다.
도 2는 예시적인 아데닌 염기 편집기에 의해 표적화된 DNA를 도시하는 개략도이다. 본 도면은 야생형 mRNA 프로토스페이서 및 PAM이 상단에 정렬된 A1AT Z 돌연변이 근처의 DNA 서열을 도시한다 (서열식별번호: 78). 프로토스페이서의 오른쪽에는 몇 가지 상이한 ZFP의 DNA 표적이 도시된다. 도시된 바와 같이, PAM 서열을 필요로 하는 ABE의 경우, 염기 편집을 위한 표적 (염기 편집 창으로서 지칭되기도 함)은 전형적으로 PAM 서열로부터의 13 내지 16개 뉴클레오티드이며, 그 크기가 3, 4, 5, 6, 7개 또는 그 초과의 뉴클레오티드일 수 있다 (본 도면에는 4개 뉴클레오티드의 염기 편집 창이 도시된다) (서열식별번호: 77).
도 3a 및 3b는 예시적인 ZFP 염기 편집기를 묘사하는 개략도이다. 도 3a는 예시적인 ZFP 아데닌 염기 편집기를 도시한다. 상단 패널은 표시된 성분이 있는 예시적인 편집기를 도시한다. 중간 패널은 2개의 이. 콜라이 tRNA 특이적 아데노신 데아미나제 (tadA)를 사용하는 예시적인 ABE를 도시하며, 여기서 하나는 야생형 서열이고 다른 하나는 진화된 서열이다 (Gaudelli, et al. (2017) Nature 551(7681):464-471). TadA 도메인은 도시된 링커 (서열식별번호: 2)를 사용하여 서로 부착되고 SPCas9 서열에 부착된다. 사용된 SpCas9는 공지된 완화된 PAM 요구 사항을 갖는 VRVRFRR 변이체이다 (문헌 [Nishimasu, et al. (2018) Science 361:1259-1262] 참조). 이어서 Cas9 서열은 ZFP DNA 결합 도메인에 연결되며, 여기서 사용된 링커 (서열식별번호: 3)는 2개의 NLS 서열과 3개의 HA 태그를 포함할 수 있다. Cas9VR은 Cas9NG로서 지칭되기도 한다. 도 3b는 본원에 기재된 바와 같은 예시적인 Cas9 및 Cas9 무함유 염기 편집기를 도시한다. 하기 약어가 사용된다: "TadA"는 야생형 아데닌 데아미나제 도메인을 지칭하고; TadA*는 진화된 (조작된) 아데닌 데아미나제 도메인을 지칭하며; "7.8" "7.9" "7.10" 및 "MAX"는 문헌 [Gaudelli, et al. (2017) Nature 551(7681):464-471) 및 Koblan, et al. (2018) Nat Biotechnol. 36(9):843-846]에 기재된 바와 같은 진화된 (조작된) 아데닌 데아미나제 도메인을 지칭하고; "SpCas9 [PAMs: NGG]"는 문헌 [Jinek, et al. (2012) Science 337(6096):816-21]에 기재된 바와 같은 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)로부터의 Cas9를 지칭하며; "SpXCas9-3.7 [PAMs: NGN, GAA & GAT]"은 문헌 [Hu, et al. (2018) Nature 556(7699):57-63]에 기재된 바와 같은 광범위한 PAM 적합성을 갖는 SpCas9 변이체를 지칭하고; "SpCas9-NG [PAMs: NGN; 시험관 내 NAN]"는 문헌 [Nishimasu, et al. (2018) Science 361(6408):1259-1262]에 기재된 바와 같은 완화된 PAM 요구 사항을 갖는 SpCas9 변이체를 지칭하며; "ScCas9 [PAMs: TGT, …]"는 문헌 [Chatterjee, et al. (2018) Sci Adv 4(10):eaau0766. doi: 10.1126/sciadv.aau0766]에 기재된 바와 같은 최소한의 PAM 특이성을 갖는 SpCas9 오르소로그(ortholog)를 지칭하며; "NO CAS9"는 이러한 도메인이 존재하지 않는다는 것을 의미하고 (Cas9 무함유 염기 편집기); "5F ZFP"는 5개 핑거 ZFP를 지칭하며; "6F ZFP"는 6개 핑거 ZFP를 지칭하고; ">6F ZFP"는 6개 초과의 핑거를 갖는 ZFP를 지칭하며; "ZFP RQ" 및 "(…)"는 문헌 [Miller, et al. (2019) Nature Biotechnology 37(8):945-952]에 기재된 바와 같은 변형된 ZFP를 지칭한다.
도 4는 아데닌 염기 편집기에 의해 표적화를 위해 분석되는 편집 창 (서열식별번호: 4) 내에 있는 아데닌 염기를 묘사하는 개략도이다.
도 5a 내지 5f는 예시적인 시티딘 염기 편집기 구축물을 묘사하는 개략도이다. 도 5a 및 5b는 C 뉴클레오티드를 U로 탈아미노화할 수 있는 APOBEC1 (도 5a) 또는 AID (도 5b) 시티딘 효소를 코딩하는 서열에 추가로 연결된, ZFP DNA 결합 도메인에 연결된 2개의 UGI 단백질을 코딩하는 서열을 포함하는 염기 편집기 구축물을 도시한다. 도 5c 및 5d는 도 5a 및 5b의 구축물의 UGI 도메인이 결여된 2개의 시티딘 염기 편집기 구축물을 도시한다. 도 5e 및 5f는 FokI 닉카제를 코딩하는 서열을 활용하는 2개의 구축물을 도시한다. 이들 구축물은 시티딘 염기 편집기를 코딩하는 서열이 ZFP DNA 결합 도메인에 연결된 다음 FokI 촉매적으로 불활성인 뉴클레아제 도메인에 연결되는 한 쌍으로서 사용될 수 있다. 제2 구축물 (도 5f)은 촉매적으로 활성인 FokI 뉴클레아제 도메인을 코딩하는 서열에 연결되는 ZFP DNA 결합 도메인에 연결된 2개의 UGI 도메인을 코딩하는 서열을 포함한다. 이러한 쌍은 활성 염기 편집기를 만들기 위해 임의의 방식으로 구축될 수 있으며, 여기서 활성 및 불활성 FokI 도메인은 두 파트너 구축물 중 하나에 있을 수 있고, UGI 서열 및 시티딘 염기 편집기 서열은 어느 한 파트너에 있을 수 있다.
도 6a 및 6b는 2개의 예시적인 아데닌 염기 편집기를 도시한다. 도 6a는 ZFP DNA 결합 도메인에 연결된 2개의 TadA 도메인, 즉 1개의 야생형 도메인과 1개의 진화된 도메인을 코딩하는 서열을 포함하는 구축물을 도시한다. 도 6b에 도시된 바와 같이, 일부 변이에서 구축물은 촉매적으로 불활성인 FokI 도메인을 추가로 포함한다.
도 7a 내지 7c는 JAK2 V617F 표적의 염기 편집을 예시한다. 도 7a는 왼쪽에 야생형 DNA 이중 가닥 서열 (서열식별번호: 30)을 도시하며, 코딩된 발린 (V)이 상단에 표시된다. 중간 서열은 돌연변이된 DNA 이중 가닥 서열 (서열식별번호: 31)을 나타내며, 돌연변이체 페닐알라닌 (F)이 상단에 표시된다. 오른쪽에는 2가지 가능한 염기 편집된 결과 (서열식별번호: 32 및 33)가 도시되며, 여기서 편집된 뉴클레오티드는 상단에 세린 (S) 또는 프롤린 (P)에 대한 변화와 함께 볼드체로 표시된다. 도 7b는 JAK2 V617F 돌연변이를 둘러싼 DNA 서열 (서열식별번호: 34)을 도시하며, 2개의 가장 가까운 PAM 부위가 표시된다. 도 7b는 서열식별번호: 79로서의 단백질 서열을 개시한다. 도 7c는 V617F 돌연변이가 없는 K562 세포에서 표시된 염기 편집기를 사용한 예시적인 결과를 도시한다. 염기 편집 창 내의 다른 A:T 쌍은 시험된 염기 편집기의 활성을 평가하기 위해 사용되었다. ABEmax-Cas9NG는 ABEmax에 융합된 Cas9NG 닉카제를 나타낸다. ABEmax-Cas9는 7개의 상이한 ZFP (ZFP 2, ZFP 4, ZFP 6 및 ZFP 7로 제시됨)로 고정되었다. 도 7c는 왼쪽에 3개의 상이한 PAM 부위 (AAT, TAA, AAA; 도 7b 참조)에 대한 결과를 도시한다. 여기에서, ABEmax 발현 구축물 둘 다뿐만 아니라 상응하는 sgRNA가 플라스미드 DNA (각각 600 ng)로서 공급되었다. ZFP 고정된 ABEmax-Cas9NG 구축물은 3개의 PAM 부위 모두에 대해 증가된 효율성을 보여준다 (AAT 및 AAA PAM 부위의 경우 대략 2배이고, TAA PAM 부위의 경우 대략 12배이다). AAT 및 TAA PAM 부위에 대한 염기 편집기는 또한, 더 높은 용량 (800 ng 플라스미드 DNA)에서 시험되었으며 유사한 결과를 보여준다. ZFP 6은 AAT PAM 부위에 대해 대략 2.5배 더 높은 활성을 발생시키고, ZFP 2는 TAA PAM 부위에 대해 대략 17배 더 높은 활성을 발생시킨다.
도 8a 내지 8g는 뉴클레오티드 (예를 들어, 도 1d에 도시된 바와 같은 표적 부위에서 염기 편집기에 대한 단일 가닥 DNA 기질을 제공하기 위해 사용되는 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA))를 포함하는 예시적인 염기 편집기를 도시하는 개략도이다. 도 8a는 염기 편집기의 뉴클레오티드 함유 단일 가닥 기질과 접촉하기 이전 (왼쪽) 및 이후 (오른쪽) 편집될 표적화된 염기 ("X")를 묘사한다. 도 8b는 본원에 기재된 바와 같은 염기 편집기에 사용하기 위한 예시적인 PNA (PNA#1)를 도시하며, PNA는 하기 구조를 갖는다: N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C. 도 8c는 본원에 기재된 바와 같은 염기 편집기에 사용하기 위한 예시적인 PNA (PNA#2)를 도시하며, PNA는 하기 구조를 갖는다: N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C. 도 8d는 염기 편집기가 2개의 PNA (서로에 대해 반대 방향으로 구조 N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C를 갖는 PNA #3 및 구조 N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C를 갖는 PNA #4)를 포함하는 예시적인 실시양태를 도시한다. 도 8e는 PNA가 구조 N-Lys-Lys-Lys-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C (PNA #5)를 포함하는 예시적인 실시양태를 도시한다. 도 8b 내지 8e에서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다. PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다. 도 8f 및 8g는 LNA를 포함하는 염기 편집기의 예시적인 실시양태를 도시한다. 도 8f는 예시적인 LNA (LNA#1) (서열식별번호: 80)를 도시한다. 예시적인 LNA#1 서열은 를 포함한다. 도 8g는 염기 편집기가 서로에 대해 반대 방향으로 도시된 2개의 LNA (LNA#2: 5'-NnNnNnNnNntctctNnNnNnNnNn-3' (서열식별번호: 71) 및 LNA#3: 5'-NnNnNnNnNntctctNnNnNnNnNn-3' (서열식별번호: 72))를 포함하는 예시적인 실시양태를 도시한다. 도 8f 및 8g에서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; "Chol-TEG"는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다.
인공 뉴클레아제, 예컨대 조작된 징크 핑거 뉴클레아제 (ZFN), 전사 활성화제 유사 이펙터 뉴클레아제 (TALEN), RNA 유도 뉴클레아제로서 지칭되기도 하는 조작된 crRNA/tracr RNA ('단일 가이드 RNA')를 갖는 CRISPR/Cas 시스템, 및/또는 아르고노트 시스템에 기반한 뉴클레아제가 의학, 생명 공학 및 농업 분야에 혁명을 일으키고 있다. 이들 분자 도구를 사용하면 유기체 내의 게놈을 이전에는 불가능했던 수준으로 유전자 조작 (예를 들어 편집)할 수 있다. 인공 뉴클레아제는 DNA를 절단할 수 있으므로, 이러한 절단 후에 세포는 오류가 발생하기 쉬운 비상동 말단 결합 (NHEJ)에 의해, 또는 절단 부위를 플랭킹하는 영역과의 상동성을 갖는 기질 DNA의 존재하에 상동성 지향 복구 (HDR)를 통해 기질 DNA를 삽입함으로써 그 파손물을 강제로 '치유'한다. 이러한 프로세스 둘 다는 DNA에서의 이중 가닥 파손 (DSB)으로 시작된다.
본원에는 유전자 변형을 위해 이중 가닥 절단을 사용하지 않는 염기 편집을위한 조성물 (시스템) 및 방법이 기재되어 있다. 염기 편집은 본질적으로, DNA 가닥에서 특이적 염기의 정체를 변경하는 것, 및 편집된 염기의 복구를 피하기 위해 DNA 복구 기구의 조작과 함께 DNA 염기의 관련 부위 특이적 변형에 의존한다. 이는 일반적으로, 단일 가닥 DNA의 영역이 존재하도록 DNA 이중 나선을 개방하는 시스템을 사용함으로써 달성된다. 다음으로, 염기 자체는 뉴클레오시드 구조를 변화시키는 염기 변형 효소, 예컨대 데아미나제에 의해 작용된다. 예를 들어, 활성화 유도 데아미나제 (AID) 및 아포지질단백질 B mRNA 편집 효소 촉매 폴리펩티드-유사 패밀리 단백질 (APOBEC)은 항체 다양화 및 레트로바이러스에 대항한 선천 면역에 중요한 시티딘 데아미나제이다. 이들 효소는 DNA에서 시티딘 (C)을 우라실 (U)로 전환시킨다. 우라실 복구 전에 DNA 복제가 발생하면, 복제 기구는 우라실을 티민 (T)으로서 처리하여, C:G에서 T:A로의 염기쌍 전환이 발생하므로 (문헌 [Yang, et al. (2016) Nat Commun doi 10.1038/ncomms13330]), 시스템은 C에서 T로의 점 돌연변이를 생성하기 위해 사용될 수 있다.
본원에 기재된 바와 같은 염기 편집기 중 임의의 것은 유전자 녹아웃 (예를 들어, 정규 코돈 대신 정지 코돈을 생산하기 위한 염기의 변경; 스플라이스 수용자 부위에서의 염기의 변경); 유전자 발현을 활성화 또는 억제하기 위해 유전자의 제어 (프로모터) 영역에 돌연변이를 도입하는 것; 및/또는 점 돌연변이를 역전시킴으로써 질환 유발 돌연변이를 교정하는 것을 포함하나 이에 제한되지는 않는 임의의 용도를 위한 표적화된 염기 편집에 사용될 수 있다. 염기 편집기 및/또는 염기 편집기에 의해 만들어진 표적화된 변화를 포함하는 (그러나 더 이상 염기 편집기 자체를 포함하지 않음) 세포 및 세포주가 또한 제공된다.
본 발명의 염기 편집기는 현재 사용되고 있는 염기 편집기와 비교 시 예기치 못하게도 우수한 편집 효율성 및/또는 특이성을 제공한다.
총론
본원에 개시된 조성물의 제조 및 사용뿐만 아니라 방법의 실행은 달리 지시되지 않는 한, 분자 생물학, 생화학, 염색질 구조 및 분석, 컴퓨터 화학, 세포 배양, 재조합 DNA 및 관련 분야의 기술 내에 있는 바와 같은 관련 분야에서의 통상적인 기술을 이용한다. 이러한 기술은 문헌에 자세히 설명되어 있다 (예를 들어, 문헌 [Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 및 Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 및 periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; 및 METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999] 참조).
정의
용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호 교환가능하게 사용되며 선형 또는 원형 입체 형태 및 단일 가닥 또는 이중 가닥 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 지칭한다. 본 개시내용의 목적을 위해, 이들 용어는 중합체의 길이에 대해 제한하는 것으로서 해석되서는 안된다. 상기 용어는 자연 뉴클레오티드의 공지된 유사체뿐만 아니라 염기, 당 및/또는 인산염 모이어티 (예를 들어, 포스포로티오에이트 백본)에서 변형되는 뉴클레오티드를 포괄할 수 있다. 일반적으로, 특별한 뉴클레오티드의 유사체는 동일한 염기쌍 형성 특이성을 갖는데, 즉 A의 유사체는 T와 염기쌍을 이룰 것이다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 지칭하기 위해 상호 교환가능하게 사용된다. 이러한 용어는 또한, 하나 이상의 아미노산이 상응하는 자연적으로 발생하는 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에 적용된다.
"결합"은 거대 분자 간의 (예를 들어, 단백질과 핵산 간의)의 서열 특이적, 비-공유 상호작용을 지칭한다. 전체로서의 상호작용이 서열 특이적인 한은, 결합 상호작용의 모든 성분이 서열 특이적 (예를 들어, DNA 백본 내의 인산염 잔기와의 접촉)일 필요는 없다. 이러한 상호작용은 일반적으로 10-6 M-1 이하의 해리 상수 (Kd)를 특징으로 한다. "친화도"는 결합 강도를 지칭한다: 증가된 결합 친화도는 더 낮은 Kd와 상관이 있다. "비-특이적 결합"은 온 타겟 서열에 의존적이지 않은 임의의 관심 분자 (예를 들어 조작된 뉴클레아제)와 거대 분자 (예를 들어 DNA) 간에 발생하는 비-공유 상호작용을 지칭한다.
"결합 단백질"은 또 다른 분자와 비공유적으로 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어, DNA 분자 (DNA 결합 단백질), RNA 분자 (RNA 결합 단백질) 및/또는 단백질 분자 (단백질 결합 단백질)와 결합할 수 있다. 단백질 결합 단백질의 경우, 자체 결합할 수 있고/있거나 (동종 이량체, 동종 삼량체 등을 형성하기 위함) 상이한 단백질(들)의 하나 이상의 분자와 결합할 수 있다. 결합 단백질은 한 가지 초과 유형의 결합 활성을 가질 수 있다. 예를 들어, 징크 핑거 단백질은 DNA 결합, RNA 결합 및 단백질 결합 활성을 가지고 있다. RNA 유도 뉴클레아제 시스템의 경우, RNA 가이드는 뉴클레아제 성분 (Cas9 또는 Cfp1)에 대해 이종이며 둘 다 조작될 수 있다.
"DNA 결합 분자"는 DNA와 결합할 수 있는 분자이다. 이러한 DNA 결합 분자는 폴리펩티드, 단백질의 도메인, 더 큰 단백질 내의 도메인 또는 폴리뉴클레오티드일 수 있다. 일부 실시양태에서, 폴리뉴클레오티드는 DNA인 반면, 다른 실시양태에서, 폴리뉴클레오티드는 RNA이다. 일부 실시양태에서, DNA 결합 분자는 뉴클레아제의 단백질 도메인 (예를 들어, FokI 도메인)인 반면, 다른 실시양태에서 DNA 결합 분자는 RNA 유도 뉴클레아제 (예를 들어 Cas9 또는 Cpf1)의 가이드 RNA 성분이다. DNA 결합 분자는, 예를 들어 하나 이상의 징크 핑거를 통해 또는 징크 핑거 단백질 (ZFP)의 하나 이상의 ZFP 인식 나선 영역 또는 TALE의 RVD와의 상호작용을 통해 서열 특이적 방식으로 DNA와 결합하는 단백질 또는 더 큰 단백질 내의 도메인을 포함할 수 있다. DNA 결합 분자는 또한, CRISPR/Cas 시스템의 단일 가이드 RNA (sgRNA) 및/또는 Ttago 시스템의 DNA 결합 도메인을 포함한다. 용어 징크 핑거 DNA 결합 단백질은 종종 징크 핑거 단백질 또는 ZFP로서 약칭된다.
"징크 핑거 DNA 결합 단백질" (또는 결합 도메인)은 징크 이온의 배위를 통해 그의 구조가 안정화되는 결합 도메인 내의 아미노산 서열의 영역인 하나 이상의 징크 핑거를 통해 서열 특이적 방식으로 DNA와 결합하는 단백질 또는 더 큰 단백질 내의 도메인이다. 용어 징크 핑거 DNA 결합 단백질은 종종 징크 핑거 단백질 또는 ZFP로서 약칭된다.
"TALE DNA 결합 도메인" 또는 "TALE"는 하나 이상의 TALE 반복 도메인/단위를 포함하는 폴리펩티드이다. 반복 도메인은 TALE와 그의 동족 표적 DNA 서열의 결합에 관여한다. 단일 "반복 단위" ("반복부"로서 지칭되기도 함)는 전형적으로 그 길이가 33개 내지 35개 아미노산이며, 자연적으로 발생하는 TALE 단백질 내에서 다른 TALE 반복 서열과의 적어도 일부 서열 상동성을 나타낸다 (예를 들어, 그 전체 내용이 본원에 참조로 포함된 미국 특허 번호 8,586,526 참조).
DNA 결합 도메인은, 예를 들어 자연적으로 발생하는 징크 핑거 단백질의 인식 나선 영역의 조작 (하나 이상의 아미노산의 변경)을 통해 또는 DNA 결합에 관여한 아미노산 ("반복 가변 2잔기" 또는 RVD 영역)의 조작에 의해, 미리 결정된 뉴클레오티드 서열과 결합하도록 "조작"될 수 있다. 따라서, 조작된 징크 핑거 단백질 또는 TALE 단백질은 비-자연적으로 발생하는 단백질이다. 징크 핑거 단백질 및 TALE를 조작하는 방법의 비-제한적인 예는 설계 및 선택이다. 설계된 단백질은 그의 설계/조성이 주로 합리적 기준으로부터 비롯되는, 자연에서 발생하지 않는 단백질이다. 설계에 대한 합리적 기준은 기존 ZFP 또는 TALE 설계의 정보와 결합 데이터를 저장하는 데이터베이스에서 정보를 처리하기 위한 대체 규칙 및 컴퓨터 알고리즘의 적용을 포함한다 (예를 들어, 미국 특허 번호 8,586,526; 6,140,081; 6,453,242; 및 6,534,261 참조; 또한 국제 특허 공개 번호 WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536; 및 WO 03/016496 참조).
"선택된" 징크 핑거 단백질, TALE 단백질 또는 CRISPR/Cas 시스템은 그의 생산이 주로 실증적 프로세스, 예컨대 파지 디스플레이, 상호작용 트랩, 합리적 설계 또는 하이브리드 선택으로부터 비롯되는, 자연에서는 발견되지 않는 것이다 (예를 들어, 미국 특허 번호 5,789,538; 5,925,523; 6,007,988; 6,013,453; 및 6,200,759; 및 국제 특허 공개 번호 WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; 및 WO 02/099084 참조).
"TtAgo"는 유전자 침묵에 관여하는 것으로 생각되는 원핵 아르고노트 단백질이다. TtAgo는 박테리아 써무스 써모필루스(Thermus thermophilus)로부터 유래된다 (예를 들어, 문헌 [Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888; G. Sheng, et al. (2013) Proc. Natl. Acad. Sci. U.S.A. 111, 652] 참조). "TtAgo 시스템"은, 예를 들어 TtAgo 효소에 의한 절단을 위한 가이드 DNA를 포함한 필요한 모든 성분이다.
"절단"은 DNA 분자의 공유 백본의 파손을 지칭한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 제한되지는 않는 다양한 방법에 의해 개시될 수 있다. 단일 가닥 절단과 이중 가닥 절단 둘 다가 가능하며, 이중 가닥 절단은 2개의 별개의 단일 가닥 절단 이벤트의 결과로서 발생할 수 있다. DNA 절단은 평활 말단 또는 엇갈린 말단의 생산을 발생시킬 수 있다. 특정 실시양태에서, 융합 폴리펩티드는 표적화된 이중 가닥 DNA 절단에 사용된다.
"절단 절반-도메인"은 제2 폴리펩티드 (동일하거나 상이함)와 연계해서, 절단 활성 (바람직하게 이중 가닥 절단 활성)을 갖는 복합체를 형성하는 폴리펩티드 서열이다. 용어 "제1 및 제2 절단 절반-도메인"; "+ 및 - 절단 절반-도메인" 및 "오른쪽 및 왼쪽 절단 절반-도메인"은 이량체화되는 절단 절반-도메인 쌍을 지칭하기 위해 상호 교환가능하게 사용된다. 용어 "절단 도메인"은 용어 "절단 절반-도메인"과 상호 교환가능하게 사용된다. 용어 "FokI 절단 도메인"은 서열식별번호: 5에 제시된 바와 같은 FokI 서열뿐만 아니라 임의의 FokI 동족체를 포함한다.
"조작된 절단 절반-도메인"은 또 다른 절단 절반-도메인 (예를 들어, 또 다른 조작된 절단 절반-도메인)과 함께 절대적인 이종 이량체를 형성하도록 변형된 절단 절반-도메인이다.
본원에 사용된 바와 같은 용어 "편집"은 동일한 위치에서 초기 (예를 들어, 야생형) 염기와 비교 시 뉴클레오티드 염기가 변형되는 프로세스를 지칭한다. 염기 편집 (예를 들어, 표적화된 점 돌연변이)은 편집된 DNA로부터 전사되는 임의의 mRNA에서의 변화를 반드시 재현할 것이다. 아데닌 및 시티딘 데아미나제는 각각의 뉴클레오티드 표적으로부터 아미노 기를 제거하여, 각각 이노신 및 우리딘으로 전환시킨다. DNA 복구 또는 복제 동안, 이노신은 폴리머라제 효소에 의해 구아닌으로서 인식되고 우리딘은 티민으로서 인식되어, 편집된 이중 가닥 DNA에서 A:T 염기쌍이 G:C 염기쌍으로 전환되거나 또는 C:G 염기쌍이 T:A 염기쌍으로 전환된다. "염기 편집 창"은 본원에 기재된 바와 같은 염기 편집기에 의해 편집되어야 하는 임의의 염기를 지칭하며, 전형적으로 표적 DNA에 대한 염기 편집 시스템의 적어도 하나의 성분의 결합 후 접근가능한 영역 내에 있는, 편집 시스템의 임의의 성분으로부터 임의의 거리일 수 있다. PAM 서열을 필요로 하는 염기 편집기 (예를 들어, Cas9 함유 편집기)는 전형적으로 PAM 서열로부터 13개 내지 16개 이상의 뉴클레오티드일 수 있는 3, 4, 5, 6, 7개 또는 그 초과의 뉴클레오티드의 염기 편집 창을 갖는다. 본원에 기재된 바와 같은 염기 편집기는 유전자 녹아웃 (예를 들어, 정규 코돈 대신 정지 코돈을 생산하기 위한 염기의 변경; 스플라이스 수용자 부위에서의 염기의 변경); 유전자 발현을 활성화 또는 억제하기 위해 유전자의 제어 (프로모터) 영역에 돌연변이를 도입하는 것; 및/또는 점 돌연변이를 역전시킴으로써 질환 유발 돌연변이를 교정하는 것을 포함하나 이에 제한되지는 않는 임의의 용도를 위한 표적화된 염기 편집에 사용될 수 있다. 염기 편집기 및/또는 염기 편집기에 의해 만들어진 표적화된 변화를 포함하는 (그러나 더 이상 염기 편집기 자체를 포함하지 않음) 세포주가 또한 제공된다.
용어 "서열"은 DNA 또는 RNA일 수 있고; 선형, 원형 또는 분지형일 수 있으며 단일 가닥 또는 이중 가닥일 수 있는 임의의 길이의 뉴클레오티드 서열을 지칭한다. 용어 "트랜스진(transgene)"은 게놈에 삽입되는 뉴클레오티드 서열을 지칭한다. 트랜스진은 임의의 길이, 예를 들어 2개 내지 100,000,000개 뉴클레오티드 길이 (또는 그 사이 또는 그 이상의 임의의 정수 값), 바람직하게 약 100개 내지 100,000개 뉴클레오티드 길이 (또는 그 사이의 임의의 정수), 보다 바람직하게 약 2000개 내지 20,000개 뉴클레오티드 길이 (또는 그 사이의 임의의 값), 보다 더 바람직하게 약 5 내지 15 kb (또는 그 사이의 임의의 값)일 수 있다.
"염색체"는 세포의 게놈의 전부 또는 일부분을 포함하는 염색질 복합체이다. 세포의 게놈은 종종, 세포의 게놈을 포함하는 모든 염색체의 모음인 그의 핵형으로서 특징지을 수 있다. 세포의 게놈은 하나 이상의 염색체를 포함할 수 있다.
"에피솜"은 복제 핵산, 핵단백질 복합체 또는 세포의 염색체 핵형의 일부가 아닌 핵산을 포함하는 다른 구조이다. 에피솜의 예는 플라스미드, 미니서클 및 특정 바이러스 게놈을 포함한다. 본원에 기재된 간 특이적 구축물은 에피솜으로 유지될 수 있거나, 또는 또 다른 한편으론, 세포에 안정적으로 통합될 수 있다.
"외인성" 분자는 정상적으로는 세포에 존재하지 않지만 하나 이상의 유전적, 생화학적 또는 다른 방법에 의해 세포 내로 도입될 수 있는 분자이다. "세포에서의 정상적인 존재"는 세포의 특별한 발달 단계 및 환경 조건과 관련하여 결정된다. 따라서, 예를 들어, 근육의 배아 발달 동안에만 존재하는 분자는 성체 근육 세포에 대한 외인성 분자이다. 유사하게, 열 충격에 의해 유도된 분자는 열 충격을 받지 않은 세포에 대한 외인성 분자이다. 외인성 분자는, 예를 들어, 기능 장애 내인성 분자의 기능 버전 또는 정상적으로 기능하는 내인성 분자의 기능 장애 버전을 포함할 수 있다.
외인성 분자는 무엇보다도, 작은 분자, 예컨대 조합 화학 프로세스에 의해 생성되는 것, 또는 거대 분자, 예컨대 단백질, 핵산, 탄수화물, 지질, 당단백질, 지단백질, 폴리사카라이드, 상기 분자의 임의의 변형된 유도체, 또는 상기 분자 중 하나 이상을 포함하는 임의의 복합체일 수 있다. 핵산은 단일 또는 이중 가닥일 수 있고; 선형, 분지형 또는 원형일 수 있으며; 임의의 길이의 것일 수 있는 DNA 및 RNA를 포함한다. 핵산은 이중 나선을 형성할 수 있는 것뿐만 아니라 삼중체 형성 핵산을 포함한다 (예를 들어, 미국 특허 번호 5,176,996 및 5,422,251 참조). 단백질은 DNA 결합 단백질, 전사 인자, 염색질 리모델링 인자, 메틸화된 DNA 결합 단백질, 폴리머라제, 메틸라제, 데메틸라제, 아세틸라제, 데아세틸라제, 키나제, 포스파타제, 라이가제, 데유비퀴티나제, 인테그라제, 리콤비나제, 라이가제, 토포이소머라제, 자이라제 및 헬리카제를 포함하나, 이에 제한되지는 않는다.
외인성 분자는 내인성 분자와 동일한 유형의 분자, 예를 들어 외인성 단백질 또는 핵산일 수 있다. 예를 들어, 외인성 핵산은 감염 바이러스 게놈, 세포 내로 도입된 플라스미드 또는 에피솜, 또는 세포에 정상적으로 존재하지 않는 염색체를 포함할 수 있다. 세포 내로 외인성 분자를 도입하는 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 지질 매개 전달 (즉, 중성 및 양이온성 지질을 포함한 리포좀), 전기천공, 직접 주사, 세포 융합, 입자 충격, 인산칼슘 공동 침전, DEAE-덱스트란 매개 전달 및 바이러스 벡터 매개 전달을 포함하나, 이에 제한되지는 않는다. 외인성 분자는 또한 내인성 분자와 동일한 유형의 분자일 수 있지만, 세포가 유래되는 것과는 상이한 종으로부터 유래된다. 예를 들어, 인간 핵산 서열은 원래 마우스 또는 햄스터로부터 유래된 세포주 내로 도입될 수 있다. 외인성 분자를 식물 세포 내로 도입하는 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 원형질체 형질전환, 탄화 규소 (예를 들어, WHISKERS™), 아그로박테리움(Agrobacterium) 매개 형질전환, 지질 매개 전달 (즉, 중성 및 양이온성 지질을 포함한 리포좀), 전기천공, 직접 주사, 세포 융합, 입자 충격 (예를 들어, "유전자 총"을 사용함), 인산칼슘 공동 침전, DEAE-덱스트란 매개 전달 및 바이러스 벡터 매개 전달을 포함하나, 이에 제한되지는 않는다.
대조적으로, "내인성" 분자는 특별한 환경 조건 하의 특별한 발달 단계에서 특별한 세포에 정상적으로 존재하는 분자이다. 예를 들어, 내인성 핵산은 염색체, 미토콘드리아의 게놈, 엽록체 또는 다른 소기관, 또는 자연적으로 발생하는 에피솜 핵산을 포함할 수 있다. 부가의 내인성 분자는 단백질, 예를 들어, 전사 인자 및 효소를 포함할 수 있다.
본원에 사용된 바와 같은, 용어 "외인성 핵산의 산물"은 폴리뉴클레오티드 및 폴리펩티드 산물, 예를 들어 전사 산물 (폴리뉴클레오티드, 예컨대 RNA) 및 번역 산물 (폴리펩티드)을 모두 포함한다.
"융합" 분자는 2개 이상의 서브유닛 분자가 바람직하게 공유적으로 연결되는 분자이다. 서브유닛 분자는 동일한 화학적 유형의 분자일 수 있거나 또는 상이한 화학적 유형의 분자일 수 있다. 융합 분자의 예는 융합 단백질 (예를 들어, 단백질 DNA 결합 도메인과 절단 도메인 간의 융합물), 절단 도메인과 작동적으로 연합된 폴리뉴클레오티드 DNA 결합 도메인 (예를 들어, sgRNA) 간의 융합물, 및 융합 핵산 (예를 들어, 융합 단백질을 코딩하는 핵산)을 포함하나, 이에 제한되지는 않는다.
세포에서의 융합 단백질의 발현은 융합 단백질을 세포로 전달하거나 또는 융합 단백질을 코딩하는 폴리뉴클레오티드를 세포에 전달함으로써 발생할 수 있으며, 여기서 폴리뉴클레오티드가 전사되고 전사체가 번역되어 융합 단백질을 생성한다. 트랜스-스플라이싱, 폴리펩티드 절단 및 폴리펩티드 라이게이션은 또한 세포에서 단백질의 발현에 관여할 수 있다. 폴리뉴클레오티드 및 폴리펩티드를 세포로 전달하는 방법은 본 개시내용의 다른 곳에서 제시된다.
"분할 효소"는 2개 이상의 불활성 폴리펩티드 쇄로 분할된 후 작동가능한 효소로 재어셈블리된 효소이다. 분할 효소를 활성 단백질로 어셈블리하는 것은 종종 근접성에 의해 구동되며, 여기서 각각의 불활성 폴리펩티드 쇄는, 불활성 쇄를 물리적으로 결합할 수 있는 다른 분자에 융합되어 이들을 어셈블리할 수 있으므로, 단편화의 엔트로피 비용을 극복할 수 있다. 융합된 분자는 서로 상호작용하는 다른 단백질일 수 있거나, 또는 서로 상호작용하거나 또는 공통 리간드와 상호작용하는 임의의 유형의 분자일 수 있으므로, 그러한 상호작용이 분할 효소를 구성하는 폴리펩티드의 어셈블리를 야기한다 (예를 들어, 문헌 [Shekhawat and Ghosh (2011) Curr Opin Chem Biol 15(6):789-797] 참조).
본 개시내용의 목적을 위한 "유전자"는 유전자 산물을 코딩하는 DNA 영역 (하기 참조) 뿐만 아니라 이러한 조절 서열이 코딩 및/또는 전사된 서열에 인접하는지의 여부에 관계없이 유전자 산물의 생산을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 프로모터 서열, 종결인자, 번역 조절 서열, 예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 침묵인자, 인슐레이터, 경계 요소, 복제 기원, 매트릭스 부착 부위 및 유전자좌 제어 영역을 포함하나, 반드시 이에 제한되지는 않는다.
"유전자 발현"은 특정 유전자에 함유된 정보를 유전자 산물로 전환하는 것을 지칭한다. 유전자 산물은 유전자의 직접 전사 산물 (예를 들어, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA 또는 임의의 다른 유형의 RNA) 또는 mRNA의 번역에 의해 생산된 단백질일 수 있다. 유전자 산물은 또한, 프로세스, 예컨대 캡핑, 폴리아데닐화, 메틸화 및 편집에 의해 변형되는 RNA, 및 예를 들어, 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화 및 글리코실화에 의해 변형된 단백질을 포함한다.
유전자 발현의 "조정"은 유전자의 활성에 있어서의 변화를 지칭한다. 발현의 조정은 유전자 활성화 및 유전자 억제를 포함할 수 있으나, 이에 제한되지는 않는다. 게놈 편집 (예를 들어, 절단, 변경, 불활성화, 무작위 돌연변이)을 사용하여 발현을 조정할 수 있다. 유전자 불활성화는 본원에 기재된 바와 같은 ZFP, TALE 또는 CRISPR/Cas 시스템을 포함하지 않는 세포와 비교 시 유전자 발현에 있어서의 임의의 감소를 지칭한다. 따라서, 유전자 불활성화는 부분적이거나 완전할 수 있다.
"관심 영역"은 세포 염색질의 임의의 영역, 예컨대 예를 들어, 외인성 분자와 결합하는 것이 바람직한 유전자 또는 유전자 내부 또는 유전자에 인접한 비-코딩 서열이다. 결합은 표적화된 DNA 절단 및/또는 표적화된 재조합의 목적을 위한 것일 수 있다. 관심 영역은, 예를 들어, 염색체, 에피솜, 소기관 게놈 (예를 들어, 미토콘드리아, 엽록체) 또는 감염 바이러스 게놈에 존재할 수 있다. 관심 영역은 유전자의 코딩 영역 내에, 전사된 비-코딩 영역 내에, 예컨대 예를 들어, 리더 서열, 트레일러 서열 또는 인트론, 또는 코딩 영역의 상류 또는 하류에 있는 비-전사된 영역 내에 있을 수 있다. 관심 영역은 단일 뉴클레오티드 쌍 또는 2,000개 이하의 뉴클레오티드 쌍 길이, 또는 임의의 정수 값의 뉴클레오티드 쌍만큼 작을 수 있다.
"진핵" 세포는 진균 세포 (예컨대 효모), 식물 세포, 동물 세포, 포유 동물 세포, 및 줄기 세포 (다능성 및 다분화능)를 포함한 인간 세포 (예를 들어, T-세포)를 포함하나, 이에 제한되지는 않는다.
용어 "작동적 연결" 및 "작동적으로 연결된" (또는 "작동가능하게 연결된")은 둘 이상의 성분 (예컨대 서열 요소)의 병치와 관련하여 상호 교환가능하게 사용되며, 여기서 상기 성분은 두 성분이 정상적으로 기능하도록 배열되고, 이들 성분 중 적어도 하나가 다른 성분 중 적어도 하나에 발휘되는 기능을 매개할 수 있는 가능성을 허용한다. 예로서, 전사 조절 서열이 하나 이상의 전사 조절 인자의 존재 또는 부재에 반응하여 코딩 서열의 전사 수준을 제어하는 경우, 이러한 전사 조절 서열, 예컨대 프로모터가 코딩 서열에 작동적으로 연결된다. 전사 조절 서열은 일반적으로, 코딩 서열과 시스로 작동적으로 연결되지만, 바로 인접할 필요는 없다. 예를 들어, 인핸서는 인접하지 않더라도 코딩 서열에 작동적으로 연결되는 전사 조절 서열이다.
단백질, 폴리펩티드 또는 핵산의 "기능적 단편"은 그의 서열이 완전한 길이의 단백질, 폴리펩티드 또는 핵산과 동일하지 않지만 완전한 길이의 단백질, 폴리펩티드 또는 핵산과 동일한 기능을 보유하는 단백질, 폴리펩티드 또는 핵산이다. 기능적 단편은 상응하는 천연 분자보다 더 많이, 더 적게 또는 동일한 수의 잔기를 보유할 수 있고/있거나 하나 이상의 아미노산 또는 뉴클레오티드 치환을 함유할 수 있다. 핵산 또는 단백질의 기능을 결정하는 방법 (예를 들어, 코딩 기능, 또 다른 핵산과 혼성화할 수 있는 능력, 효소 활성 검정)은 관련 기술분야에 널리 공지되어 있다.
폴리뉴클레오티드 "벡터" 또는 "구축물"은 유전자 서열을 표적 세포로 전달할 수 있다. 전형적으로, "벡터 구축물", "발현 벡터", "발현 구축물", "발현 카세트" 및 "유전자 전달 벡터"는 관심 유전자의 발현을 지시할 수 있고 유전자 서열을 표적 세포로 전달할 수 있는 임의의 핵산 구축물을 의미한다. 따라서, 상기 용어는 클로닝 및 발현 비히클뿐만 아니라 통합 벡터를 포함한다.
용어 "대상체" 및 "환자"는 상호 교환가능하게 사용되며 포유 동물, 예컨대 인간 환자 및 비-인간 영장류뿐만 아니라 실험 동물, 예컨대 토끼, 개, 고양이, 래트, 마우스 및 다른 동물을 지칭한다. 따라서, 본원에 사용된 바와 같은 용어 "대상체" 또는 "환자"는 본 발명의 발현 카세트가 투여될 수 있는 임의의 포유 동물 환자 또는 대상체를 의미한다. 본 발명의 대상체는 장애가 있는 대상체를 포함한다.
본원에 사용된 바와 같은 용어 "치료하는 것" 및 "치료"는 증상의 중증도 및/또는 빈도에 있어서의 감소, 증상 및/또는 근본 원인의 제거, 증상 및/또는 그의 근본 원인의 발생 예방, 및 손상의 개선 또는 교정을 지칭한다. 암, 일원성 질환 및 이식편 대 숙주 질환은 본원에 기재된 조성물 및 방법을 사용하여 치료될 수 있는 병태의 비-제한적인 예이다.
"염색질"은 세포 게놈을 포함하는 핵단백질 구조이다. 세포 염색질은 핵산, 주로 DNA, 및 히스톤 및 비-히스톤 염색체 단백질을 포함한 단백질을 포함한다. 대부분의 진핵 세포 염색질은 뉴클레오솜의 형태로 존재하며, 여기서 뉴클레오솜 코어는 히스톤 H2A, H2B, H3 및 H4 중 각각 2개를 포함하는 옥타머와 연합된 대략 150개 염기쌍의 DNA를 포함하고; 링커 DNA (유기체에 따라 가변적 길이)는 뉴클레오솜 코어 사이에서 연장된다. 히스톤 H1 분자는 일반적으로, 링커 DNA와 연합된다. 본 개시내용의 목적을 위해, 용어 "염색질"은 원핵과 진핵 둘 다의 모든 유형의 세포 핵단백질을 포괄하는 것을 의미한다. 세포 염색질은 염색체 및 에피솜 염색질 둘 다를 포함한다.
"접근가능한 영역"은 핵산에 존재하는 표적 부위가 표적 부위를 인식하는 외인성 분자에 의해 결합될 수 있는 세포 염색질 내의 부위이다. 임의의 특별한 이론에 얽매이고자 한 것은 아니지만, 접근가능한 영역은 뉴클레오솜 구조로 패키징되지 않은 영역인 것으로 여겨진다. 접근가능한 영역의 뚜렷한 구조는 화학적 및 효소적 프로브, 예를 들어, 뉴클레아제에 대한 그의 감도에 의해 종종 검출될 수 있다.
"표적 부위" 또는 "표적 서열"은 결합을 위한 충분한 조건이 존재하는 경우 결합 분자가 결합할 핵산의 일부분을 규정하는 핵산 서열이다. 예를 들어, 서열 5'-GAATTC-3'은 Eco RI 제한 엔도뉴클레아제에 대한 표적 부위이다. "의도된" 또는 "온 타겟" 서열은 결합 분자가 결합하고자 하는 서열이고, "의도하지 않은" 또는 "오프 타겟" 서열은 의도된 표적이 아닌 결합 분자에 의해 결합된 임의의 서열을 포함한다.
용어 "DNA 탈안정화 분자" 및 "DNA 풀림 분자"는 염기 편집기에 의해 표적화된 염기의 접근성 (예를 들어, 노출에 의해)을 증가시키는 것을 도와주는 임의의 분자 (예를 들어, 단백질, 뉴클레오티드, 작은 분자 등)를 지칭하기 위해 상호 교환가능하게 사용된다. 상기 용어는 닉카제, 올리고뉴클레오티드 (LNA, PNA, BNA 등), RNA 프로그램가능한 시스템 (예를 들어, sgRNA에 작동가능하게 연결된 Cas 단백질), 및 다른 단백질 (예를 들어, 표 A)을 포함하나, 이에 제한되지는 않는다.
염기 편집기
본원에 기재된 염기 편집 조성물 (시스템)은 이중 가닥 파손을 유도하지 않고 개별 DNA 염기쌍의 정체를 직접 변화시킬 수 있다. 따라서, 염기 편집기는 표적 세포에 대한 DNA 복구 경로 선호도에 의존하지 않는다. 더욱이, 표적 DNA에는 이중 가닥 파손이 없기 때문에, 유리 DNA 말단이 없으므로, 전위가 없다.
본원에 기재된 염기 편집기는 C:G 쌍을 T:A 쌍으로 변화시키는 시토신 염기 편집기 (CBE), 또는 A:T 쌍을 G:C 쌍으로 변화시키는 아데닌 염기 편집기 (ABE)일 수 있다. 이들 염기 편집기는, 예를 들어 정규 코돈을 정지 코돈으로 전환 (예를 들어, 시토신 염기 편집기를 사용함)시키고/시키거나 시토신 또는 아데닌 염기 편집기를 사용하여 스플라이스 수용자 부위를 돌연변이시킴으로써 불활성화 (유전자 녹아웃)에 사용될 수 있다. 또한, 본원에 기재된 바와 같은 염기 편집기는 유전자의 발현을 활성화 또는 억제하기 위해 유전자의 제어 (예를 들어, 프로모터 영역)를 변경하는 데 사용될 수 있다. 더욱이, 염기 편집은 돌연변이, 특히 질환 유발 돌연변이를 교정하는 데 사용될 수 있다.
제1 APOBEC-dCas9 염기 편집기의 개발에 이어, 우라실 DNA 글리코실라제 (UGI)가 부가된, BE2라고 하는 제2 염기 편집기가 개발되었다. 염기 절제 복구는 G:U 미스매치에 대한 세포의 1차 반응이며 우라실 N-글리코실라제 (UNG)에 의한 우라실의 절제에 의해 시작된다. 편집된 G:U 중간체를 UNG에 의한 절제로부터 보호하기 위한 일환으로, 83-아미노산 우라실 글리코실라제 억제제 (UGI)를, 촉매적으로 데드 Cas9 (dCas9)의 C 말단에 직접 부가하여 효율성을 증가시켰다 (Komor, et al. (2017) Science Advances 3(8):eaao4774). 염기 편집기의 초기 버전에서는, 전형적으로 데드 Cas9를 사용하여, 편집된 염기 반대편에 있는 뉴클레오티드 염기의 최종 전환을 수행하기 위해 DNA 복제 기구를 사용하도록 하였다. 또한, Cas 닉카제는 편집된 염기를 포함하는 가닥의 반대편 가닥에 닉을 생성하는 데 사용되었다. 닉의 생성은 DNA 복구 기구를 끌어들여, 닉의 하류 영역이 절제되고 편집된 가닥을 주형으로서 사용하여 대체되도록 한다. 시티딘 염기 편집기 BE3는 닉카제인 Cas, Cas9 D10A를 사용하여 효율성을 또한 증가시켰다 (Kim, et al. (2017) Nat Biotechnol 35(4):371-376). 또한 또 다른 변이체에서, BE4 시스템은 훨씬 더 높은 효율성을 위해 복합체의 N- 및 C-말단 단부 둘 다에서 2개의 UGI 도메인을 사용한다. 또 다른 시티딘 데아미나제 시스템은 닉카제 Cas9와 조합하여 활성화 유도 시티딘 데아미나제 (AID)에 의존한다 ("표적-AID").
염기 편집기가 DNA와 상호작용할 때, Cas 기반 편집기는 상호작용할 PAM 서열을 필요로 하며, 활성을 위한 창 (염기 편집 창)은 전형적으로 PAM 서열의 5'말단으로부터 13 내지 16개 염기이다 (또한 도 2 참조). 상기 기재된 상이한 편집 시스템의 활성 창은 다양하다. 표적-AID 시스템은 PAM 서열로부터 더 멀리 떨어진염기를 편집하는 반면, BE4 시스템은 PAM에 더 가까운 염기를 편집한다. 염기 편집기는 또한, Cpf1 CRISPR 시스템을 기반으로 구축되었다 (상기 문헌 [Eid, et al.]). 또한, 염기 편집기의 BE4 입체 배치는 에스. 피오게네스(S. pyogenes) 및 에스. 아우레우스(S. aureus) 유래 CRISPR 시스템 둘 다를 사용하여 개발되었다 (각각 BE4 및 SaBE4). 따라서, Cas9 염기 편집 시스템은 표적 부위로부터 적절한 간격을 두고 있는 PAM 서열의 가용성에 의해 제한 (거리가 염기 편집기의 효율성 및/또는 특이성에 상당한 영향을 미칠 수 있기 때문이다)되고/되거나 염기 편집 창으로부터의 PAM 서열의 거리 (도 2에 도시된 바와 같이, 표적 염기 (예를 들어, A)와 NGG PAM의 5' 단부 사이의 13 내지 16개 염기)에 의해 제한된다.
따라서, 본 발명 이전에, Cas9 염기 편집기는 게놈 전반에서의 오프 타겟 효과뿐만 아니라 방관자 효과 (표적화된 염기 근처에서 의도하지 않은 편집)를 유도하는 것으로 공지되어 있다 (예를 들어, 문헌 [Zuo, et al. (2019) Science 364(6437):289-292; Jin, et al. (2019) Science 364(6437):292-295; Gruenewald, et al. (2019) Nature 569(7756):433-437] 참조).
부가의 염기 편집기 입체 배치는 박테리오파지 뮤로부터의 GAM 단백질의 사용을 포함하였다. 일부 경우에, 일부 유형의 염기 편집의 결과로서 인델 (삽입 및 결실)이 관찰되었다. 일부 염기 편집기는 U 반대편 가닥을 닉킹하기 때문에, UNG에 의한 글리코시드 결합의 절단에 이어, 그 결과로 생성된 아퓨린 또는 아피리미딘 부위의 AP 리아제에 의한 프로세싱이 이중 가닥 DNA 파손 (DSB)을 발생시켜, 잠재적으로 인델 형성을 발생시킬 수 있다. 박테리오파지 뮤의 Gam 단백질은 DSB의 말단과 결합하고 분해로부터 보호하므로, DSB의 유리 말단과 결합하는 Gam을 사용하면, 염기 편집의 프로세스 동안 인델 형성을 감소시킬 수 있다 (Komor, et al. (2016) Nature 533:420-424; Komor, et al. (2017) Science Advances 3(8)). 시티딘 데아미나제 편집기 이외에, 아데닌 염기를 이노신으로 전환시키는 합성 아데노신 데아미나제를 사용하는 염기 편집기가 개발되었다 (아데닌 염기 편집기: "ABE"; 문헌 [Gaudelli, et al. (2017) Nature 551(7681):464-471] 참조). 이노신은 시티딘과 염기쌍을 형성하고, 이후 구아닌으로 교정되어 A가 G로 전환되거나, 또는 A:T가 G:C로 전환될 수 있다.
상기 기재된 바와 같이, 본원에 기재된 바와 같은 염기 편집기는 DNA의 단일 가닥 영역 내에 있는 표적화된 염기를 노출시키기 위해 DNA 나선을 "개방"하는 분자를 추가로 포함할 수 있다. 이를 달성할 수 있는 것으로 통상적으로 공지된 분자는 DNA 헬리카제, 나선 탈안정화 분자 및 박테리아 DnaA 단백질, 단일 가닥 DNA 결합 단백질, 삼중체 형성 올리고뉴클레오티드 또는 올리고뉴클레오티드를 포함하나 이에 제한되지는 않는다.
특정 실시양태에서, 염기 편집기는 편집을 위해 표적화된 염기를 노출하기 위해 DNA 나선의 풀림 (개방)을 도와주는 단백질 도메인을 포함한다. 적합한 단백질의 비-제한적인 예가 표 A에 제시된다.
<표 A>
특정 실시양태에서, 염기 편집기 (예를 들어, Cas 무함유 염기 편집기)는 하나 이상의 DNA 올리고뉴클레오티드, 하나 이상의 RNA 올리고뉴클레오티드 및/또는 하나 이상의 펩티드 핵산 (PNA), 하나 이상의 잠금 핵산 (LNA) 및/또는 하나 이상의 가교 핵산 (BNA)을 포함한 하나 이상의 합성 올리고뉴클레오티드를 포함한다 (예를 들어, 도 1d 참조). 예를 들어, PNA에 관해서는 문헌 [Nielsen, et al. (1991) Science 254:1497-1500 및 Bahal, et al. (2014) Curr Gene Ther. 14(5):331-342]을 참조하고; LNA에 관해서는 문헌 [Moreno, et al. (2013) Nucleic Acid Res. 41(5):3257-3273 및 Geny, et al. (2016) Nucleic Acid Res. 44(5):2007-2019]을 참조하며; BNA에 관해서는 문헌 [Rahman, et al. (2007) Nucleosides Nucleotides Nucleic Acids 26(10-12):1625-1628]을 참조한다.
특정 실시양태에서, 본 발명의 Cas9 무함유 염기 편집기는 ZFP-데아미나제 융합 단백질 및 ZFN 닉카제, 및 임의로 하나 이상의 DNA 탈안정화 인자를 포함한다. 특정 실시양태에서, DNA 탈안정화 인자는 단백질 (예를 들어, 표 A에 제시된 바와 같음) 또는 올리고뉴클레오티드 (예를 들어, LNA, PNA 또는 BNA)이다. 다른 실시양태에서, Cas9 무함유 염기 편집기는 임의의 Cas9 등가물, 예컨대 Cas12a (완전한 길이의 또는 말단절단된 Cas12 단백질 포함)를 포함한, DNA 탈안정화 (풀림) 특성을 가진 비-Cas9 CRISPR 단백질을 포함한다. 다른 실시양태에서, Cas9 무함유 염기 편집기는 CRISPR 시스템으로부터의 임의의 요소를 포함하지 않는다. 하나 이상의 비-Cas9 DNA 탈안정화 (풀림) 인자(들) (예를 들어, 표 A의 단백질, LNA, PNA, BNA 등)는 염기 편집기의 임의의 성분, 예를 들어 ZFP-데아미나제 융합 단백질의 한 성분 및/또는 ZFN 닉카제의 성분 중 임의의 것에 작동가능하게 연결될 수 있다.
특정 실시양태에서, 염기 편집기는 표적 부위에서 염기 편집기에 대한 단일 가닥 DNA 기질을 제공하기 위해 사용될 수 있는 하나 이상의 뉴클레오티드 서열, 예를 들어 하나 이상의 DNA 올리고뉴클레오티드, RNA 올리고뉴클레오티드, 펩티드 핵산 (PNA), 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA)을 포함한다. 이는, 예를 들어 이중 나선 침입, 삼중체 침입 또는 테일 클램프에 의해 용이하게 할 수 있다 (Quijano, et al. (2017) Yale J. Biol and Med. 90:583-598; Pellestor and Paulasova (2004) European J. Human Genetics 12:694-700; Schleifman, et al. (2011) Chem & Bio. 18:1189-1198). 염기 편집기의 하나 이상의 뉴클레오티드 서열의 구조는 DNA 및/또는 RNA 및/또는 PNA 및/또는 LNA 및/또는 BNA 염기의 길이, 수 및 위치; 포스포로티오에이트 결합; 표적 서열 조성에 따른 이들 올리고뉴클레오티드의 다른 통상적인 변형에 있어서 다양할 것이다.
특정 실시양태에서, 염기 편집기는 하나 이상의 PNA, 예를 들어, 미니PEG 치환과 증강된 결합, 증가된 용해도 및 개선된 전달을 위한 감마 위치를 함유하는 감마 PNA를 포함한다 (Bahal, et al. (2014) Current Gene Ther. 14(5):331-342). 특정 실시양태에서, PNA는 하나 이상의 O (이는 8-아미노-2,6-디옥사옥탄산 링커를 나타낸다) 및/또는 하나 이상의 시토신 (C) 또는 슈도이소시토신 잔기를 포함한다. 임의로, 하나 이상의 리신 (Lys) 잔기가 PNA 내에, 예를 들어 PNA 서열의 N- 및/또는 C-말단 상에 포함된다. 특정 실시양태에서, 1, 2, 3, 4, 5개 또는 그 초과의 Lys 잔기가 PNA의 한쪽 또는 양쪽 말단에 포함된다. 특정 실시양태에서, 둘 이상의 PNA가 염기 편집기에 사용되며, 예를 들어 서로에 대해 동일하거나 반대 방향으로 사용된다. 특정 실시양태에서, 하나 이상의 PNA는 하기 구조를 갖는다: (여기서, O는 8-아미노-2,6-디옥사옥탄산 링커를 나타내고, C는 시토신을 나타낸다). PNA 서열의 N- 및/또는 C-말단 상의 Lys 잔기는 임의적이고, 슈도이소시토신이 시토신을 대체할 수 있다. 특정 실시양태에서, 하나 이상의 PNA는 도 8b 내지 8e에 도시된 바와 같은 하나 이상의 PNA를 포함한다.
다른 실시양태에서 염기 편집기는 하나 이상의 LNA를 포함한다. LNA는 성능 개선을 위해 스태킹 링커 및 2'-글리실아미노-LNA를 포함할 수 있다 (Geny, et al. (2016) Nucleic Acids Res. 44(5):2007-2019). 특정 실시양태에서, LNA는 임의로 하나 이상의 LNA 잔기 및/또는 DNA 잔기 사이에 하나 이상의 포스포로티오에이트 결합을 포함한다. 다른 실시양태에서, LNA는 세포로의 흡수를 증가시킬 수 있는 하나 이상의 콜레스테롤-TEG를 포함한다. 특정 실시양태에서, 하나 이상의 LNA는 하기 구조를 갖는다: (여기서, LNA 뉴클레오티드는 대문자로 표시되고; DNA 뉴클레오티드는 소문자로 표시되고; "*"는 포스포로티오에이트 결합을 나타내고; "Chol-TEG"는 세포로의 증가된 흡수를 위한 3' 콜레스테롤-TEG를 나타낸다) (예를 들어, 문헌 [Bijsterbosch, et al. (2000) Nucleic Acids Res. 28:2717-2725; Bijsterbosch, et al. (2002) J. Pharmacol. Exp. Ther. 302:619-626; Manoharan (2002) Antisense Nucleic Acid Drug Dev 12:103-28; M. Manoharan (2004) Curr Opin Chem Biol. 8:570-9] 참조). 특정 실시양태에서, 염기 편집기는 도 8f 또는 도 8g에 도시된 바와 같은 하나 이상의 LNA를 포함한다.
하나 이상의 DNA 탈안정화 인자는 염기 편집기 (예를 들어, ABE 및/또는 CBE) 및/또는 닉카제와 독립적으로 및/또는 함께 제공될 수 있다. 특정 실시양태에서, DNA 탈안정화 인자(들)는 임의의 방향 (예를 들어, N- 및/또는 C-말단)으로 ZFP 및/또는 ZFN 닉카제에 융합된다. DNA 탈안정화 인자(들)는 염기 편집기 표적 부위의 1 kb 창 내에서 결합할 수 있다.
특정 실시양태에서, 본원에는 염기 편집기 (예를 들어, Cas9 아데닌 또는 시토신 염기 편집기) 및 염기 편집기 근처의 표적 부위 (RANGE)와 특이적으로 결합하는 하나 이상의 부가의 DNA 결합 도메인 (예를 들어, ZFP, TALE, 부가의 sgRNA)을 포함하는 염기 편집 시스템이 기재된다. 특정 실시양태에서, Cas9 함유 염기 편집 시스템은 Cas9 닉카제 및 다른 성분과 관련하여 Cas9 닉카제를 고정하고/하거나 염기 편집기의 하나 이상의 성분을 위치시키는 역할을 함으로써, 염기 편집의 특이성 및/또는 효율성을 증가시키는 하나 이상의 DNA 결합 분자 (예를 들어, ZFP)를 포함한다. 하나 이상의 DNA 결합 분자 (예를 들어, ZFP 앵커(들))는 전형적으로, 염기 편집기 (예를 들어, Cas9 또는 Cas9 무함유 염기 편집기) 및/또는 표적화된 염기의 1 내지 50개 (또는 그 사이의 임의의 값) 뉴클레오티드 내의 표적 부위와 결합한다. DNA 결합 분자는 염기 편집기 및/또는 표적화된 염기에 대한 5' 및/또는 3'와 결합할 수 있다. 특정 실시양태에서, 본원에 기재된 바와 같은 Cas9 염기 편집기는 2개 이상의 ZFP 도메인, 예를 들어 데아미나제 도메인 또는 그의 성분에 작동가능하게 연결된 ZFP 도메인 및 ZFP 앵커 도메인을 포함한다 (예를 들어, 도 1b 참조). 특정 실시양태에서, 적어도 하나의 DNA 결합 도메인은, 임의로 염기 편집기에 의해 결합된 것과 동일하거나 상이한 가닥 상에서, 염기 편집기의 표적 부위 5'와 결합한다. 예를 들어, 하나 이상의 부가의 ZFP 앵커가 사용되고 시스템의 염기 편집기의 표적 부위 5'와 염기 편집기에 의해 결합된 것과 동일한 가닥 상에서 특이적으로 결합하는 예시적인 실시양태에 관해서는, 도 1b, 오른쪽 하단 도식; 도 3; 및 도 7a를 참조한다. 하나 이상의 ZFP 앵커를 포함하면 염기 편집기의 효율성 및/또는 특이성이 증가할 수 있으며, 예를 들어 일부 경우에는, ZFP 앵커를 포함하지 않는 염기 편집기와 비교 시 2배 내지 5배 (또는 그 사이의 임의의 값), 10배 내지 100배 (또는 그 사이의 임의의 값) 또는 100배 초과한다.
다른 실시양태에서, 본원에는 (1) Cas9 닉카제 (예를 들어, 아데노신 데아미나제의 촉매적으로 불활성인 단량체를 포함함); (2) Cas9 닉카제에 대한 표적 부위 5' 또는 3'와 특이적으로 결합하는 앵커 DNA 결합 도메인 (예를 들어, ZFP); 및 (3) 아데노신 데아미나제의 촉매적으로 불활성인 단량체 및 Cas9 닉카제에 대한 표적 부위 5' 또는 3'와 결합하는 DNA 결합 도메인 (예를 들어, ZFP)을 포함하는 비-Cas9 닉카제 (예를 들어, ZFP-닉카제)를 포함하는 염기 편집 시스템이 기재된다. Cas9 닉카제 및 비-Cas9 닉카제 (예를 들어, ZFN 닉카제)의 A 데아미나제 단량체의 이량체화 시 이량체화되어 기능적 데아미나제가 형성된다. 앵커 DNA 결합 도메인 및 비-Cas9 닉카제는 표적의 동일하거나 상이한 가닥 및/또는 Cas9 닉카제의 동일하거나 (5' 또는 3') 상이한 (5'에 하나 및 3'에 하나) 쪽에서 결합할 수 있다. 특정 실시양태에서, 앵커 DNA 결합 도메인 및 비-Cas9 닉카제는 Cas9 닉카제의 반대 쪽에 있는 반대 가닥과 결합한다 (예를 들어, 도 1b, 상단 도식 참조).
다른 실시양태에서, 본원에는 (1) Cas9 닉카제; (2) Cas9 닉카제에 대한 표적 부위 5' 또는 3'와 특이적으로 결합하는 임의적 앵커 DNA 결합 도메인 (예를 들어, ZFP); 및 (3) A 또는 C 데아미나제를 포함하는 비-Cas9 닉카제 (예를 들어, ZFP-닉카제)를 포함하는 염기 편집 시스템이 기재된다. 앵커 DNA 결합 도메인 및 비-Cas9 닉카제는 표적의 동일하거나 상이한 가닥 및/또는 Cas9 닉카제의 동일하거나 (5' 또는 3') 상이한 (5'에 하나 및 3'에 하나) 쪽에서 결합할 수 있다. 특정 실시양태에서, 앵커 DNA 결합 도메인 및 비-Cas9 닉카제 염기 편집기는 Cas9 닉카제의 반대 쪽에 있는 반대 가닥과 결합한다 (예를 들어, 도 1b, 하단 중간 도식 참조).
다른 실시양태에서, 본원에는 (1) sgRNA에 작동가능하게 연결된 Cas9 단백질 (예를 들어, dCas9); (2) Cas9 닉카제에 대한 표적 부위 5' 또는 3'와 특이적으로 결합하는 임의적 앵커 DNA 결합 도메인 (예를 들어, ZFP 앵커); (3) A 또는 C 데아미나제에 작동가능하게 연결된 ZFP를 포함하는 융합 단백질이며, 여기서 융합 단백질은 Cas9 단백질에 대해 3' 또는 5'인 융합 단백질; 및 (4) Cas9 단백질 및/또는 ZFP의 3' 또는 5'와 결합하는 ZFN 닉카제를 포함하는 염기 편집 시스템이 기재된다. 앵커 DNA 결합 도메인 및 비-Cas9 단백질은 표적의 동일하거나 상이한 가닥 및/또는 Cas9 단백질의 동일하거나 (5' 또는 3') 상이한 (5'에 하나 및 3'에 하나) 쪽에서 결합할 수 있다. 특정 실시양태에서, ZFP-데아미나제 융합 단백질의 ZFP 및 임의적 앵커 ZFP는 반대 가닥과 결합한다 (예를 들어, 도 1c 참조). 추가 실시양태에서, 염기 편집기는 ZFN 닉카제를 포함하지 않는다.
본원에 기재된 Cas9 염기 편집기는 sgRNA를 포함하는 염기 편집기에 대해 이용가능한 PAM 서열을 확장 (완화)하는 것을 포함하여, 효율적이고 표적화된 염기 편집에 사용될 수 있는 PAM 서열의 관점에서 놀랍고도 예상치 못한 이점을 제공한다.
또한 본원에는 Cas9 염기 편집기를 포함하지 않는 (예를 들어, Cas9 닉카제 또는 Cas9 단백질이 결여되는) 염기 편집기 (ABE 또는 CBE)가 기재된다 (예를 들어, 도 1a 내지 도 1d 참조).
특정 실시양태에서, 염기 편집기는 (1) 비-Cas9 닉카제, 예를 들어 한 쌍의 ZFN (뉴클레아제 도메인에 작동가능하게 연결된 ZFP)을 포함하는 ZFN 닉카제이며, 여기서 상기 쌍의 뉴클레아제 도메인 중 하나가 촉매적으로 불활성인 것인 ZFN 닉카제 (예를 들어, 미국 특허 번호 8,703,489; 9,200,266; 9,631,186; 및 10,113,207 참조); 및 (2) A 또는 C 데아미나제에 작동가능하게 연결된 ZFP를 포함하는 ZFP 염기 편집기를 포함한다 (예를 들어, 도 1b, 하단 왼쪽 도식 참조).
다른 실시양태에서, 염기 편집기는 임의의 RNA 프로그램가능한 분자를 포함하는 DNA 탈안정화 분자를 포함한다. 특정 실시양태에서, DNA 탈안정화 분자는 Cas9 단백질 (예를 들어, dCas9) 및 sgRNA를 포함하는 RNA 프로그램가능한 분자를 포함한다. 다른 실시양태에서, RNA 프로그램가능한 분자는 Cas9 단백질 (예를 들어, Cpf1 (Cas12a로서 공지되기도 함), C2c1, C2c2 (Cas13a로서 공지되기도 함), C2c3, Cas1, Cas2, Cas4, CasX 및 CasY); 및 아데노신 또는 시토신 데아미나제가 아니다. 임의로, 염기 편집기는 적어도 하나의 ZFP DNA 결합 도메인 (예를 들어, 아데노신 또는 시토신 데아미나제에 작동가능하게 연결된 ZFP DNA 결합 도메인; DNA 탈안정화 분자의 어느 한 쪽에 있는 ZFP 앵커; 및/또는 ZFN 닉카제의 임의의 조합)을 추가로 포함한다.
다른 실시양태에서, Cas9 무함유 염기 편집기는 ZFN 닉카제, 및 ABE 또는 CBE (예를 들어, ZFP에 작동가능하게 연결됨) 및 표적 염기에 접근할 수 있게 하는 (예를 들어, DNA를 풀리게 하는) 하나 이상의 DNA 탈안정화 분자를 포함한다 (예를 들어, 도 1d 참조). DNA 탈안정화 (풀림) 분자의 비-제한적인 예는 표 A에 제시된 바와 같은 단백질 도메인과, 도 8에 도시된 바와 같은 LNA 및/또는 PNA를 포함한 핵산을 포함한다. ZFN 닉카제는 촉매적으로 활성이고/이거나 촉매적으로 불활성인 FokI 도메인에서의 하나 이상의 돌연변이 및/또는 ZFP 백본에 대한 하나 이상의 돌연변이를 포함할 수 있다 (예를 들어, 미국 특허 공개 번호 2018/0087072 참조). 특정 실시양태에서, 본원에 기재된 바와 같은 염기 편집기는 Cas9 무함유일 수 있지만 비-Cas9 CRISPR 단백질을 포함할 수 있다.
Cas9 무함유 (예를 들어, ZFP) 염기 편집기 중 임의의 것은, 예를 들어 DNA의 추가 풀림이 표적의 접근성을 증가시킴으로써 염기 편집기 기능을 증대시키는 경우에, 하나 이상의 부가의 DNA 탈안정화 인자 (예를 들어, DNA 헬리카제, 나선 탈안정화 분자 및 박테리아 DnaA 단백질, 단일 가닥 DNA 결합 단백질, 올리고뉴클레오티드 등)를 추가로 포함(또는 동원)할 수 있다. 하나 이상의 DNA 탈안정화 인자는 닉카제 및/또는 A 또는 C 데아미나제 함유 분자와 연합될 수 있다. 특정 실시양태에서, DNA 탈안정화 인자 (예를 들어, DNA 올리고)는 도 1d에 도시된 바와 같이 ZFN 닉카제와 연합된다.
다른 실시양태에서, 본원에는 (1) 적어도 하나의 DNA 탈안정화 분자 (예를 들어, 비-Cas9 단백질); (2) DNA 탈안정화 분자에 대한 표적 부위 5' 또는 3'와 특이적으로 결합하는 임의적 DNA 결합 도메인 (예를 들어, ZFN 앵커); 및 (3) A 또는 C 데아미나제에 작동가능하게 연결된 ZFP를 포함하는 융합 단백질이며, 여기서 융합 단백질은 DNA 탈안정화 분자에 대해 3' 또는 5'인 것인 융합 단백질을 포함하는 염기 편집 시스템이 기재된다.
Cas9 무함유 염기 편집기는 Cas9 염기 편집기에 비해, 하기를 포함하나 그에 제한되지는 않는 몇 가지 놀랍고 예상치 못한 이점을 제공한다: (i) 본 발명자들은 99% 이상의 절단 효율로 ZFN을 구축할 수 있기 때문에 Cas9 의존적 오프 타겟 효과가 없고 (오프 타겟 효과가 없음); (ii) ZFP가 본질적으로 인간 게놈 내의 임의의 서열을 표적으로 할 수 있으므로 PAM 제한을 제거하고; (iii) 현재의 Cas9 염기 편집기에 널리 퍼진 (예를 들어, 표적 창 내에서의) 방관자 돌연변이를 감소 및/또는 제거하고/하거나; (iv) 감소된 구축물 크기로 인해 AAV 전달 (생체 내에서 기능적인 것으로 공지됨)을 촉진시킨다.
따라서, cas9 무함유 염기 편집기는 통상적인 Cas9 염기 편집기에 비해, 하기를 포함하나 그에 제한되지는 않는 상당한 이점을 제공한다: 표적 특이성; 다양성; 방관자 돌연변이의 제어 또는 제거; 및 전달의 용이성. 표적 특이성의 관점에서, Cas9 무함유 ZFP 염기 편집기는 오프 타겟 효과가 거의 또는 전혀 없이 편집 시 99% 효율적으로 설계될 수 있는 반면, Cas9 염기 편집기는 더 높은 비율의 오프 타겟 효과를 나타낸다. 유사하게, 비-Cas9 ZFP 염기 편집기는 Cas9 염기 편집기의 경우에 관찰될 수 있는 바와 같은 방관자 돌연변이를 제어 (감소)하거나 제거한다. 더욱이, 비-Cas9 ZFP 염기 편집기의 표적 부위의 선택은 PAM 요구 사항에 의해 제한되는 반면, Cas9 무함유 ZFP 염기 편집기는 본질적으로 임의의 표적 서열을 표적으로 할 수 있다. 또한, 비-Cas9 염기 편집기의 감소된 구축물 크기로 인해, AAV 벡터를 사용하여 전달할 수 있으므로, 치료적 (생체 내) 용도를 크게 확장할 수 있다.
특정 실시양태에서, 본원에 기재된 염기 편집기 (염기 편집 시스템)는 (1) 염기 편집 창 및/또는 (2) 염기 편집 창과 PAM 서열 개재의 5' 단부 사이의 염기 내에서 변화될 단일 염기 (표적 염기)를 포함한다 (또한 도 2 참조). DNA 편집 창이 개방되면, 다른 비-표적 염기 (아데닌 및/또는 시토신)가 염기 편집기에 의한 잠재적인 변형을 위해 열려 있다. 이는 표적이 PAM 서열의 5' 단부로부터 떨어져 있는 13 내지 16개의 뉴클레오티드일 수 있지만, 이들 개재 뉴클레오티드 및/또는 염기 편집 창에 존재하는 표적화된 염기 (예를 들어, 아데닌 또는 시토신)도 또한 변경될 수 있다는 것을 의미한다. "방관자" 돌연변이로서 지칭되기도 하는 이러한 비-표적화된 돌연변이는 염기 편집 프로세스에서 바람직하지 않을 수 있다. 일부 상황에서는, 편집 창에서 표적화될 염기 (아데닌 염기 편집기의 경우 아데닌 또는 시티딘 염기 편집기의 경우 시티딘)를 포함하지 않는 PAM 서열을 선택함으로써 방관자 돌연변이를 피할 수 있다. 또 다른 한편으론, 및/또는 PAM 서열의 선택 이외에, 본 발명은 ZFN 닉카제 기능적 도메인과 쌍을 이룬 ZFP 앵커를 포함하는 본원에 기재된 바와 같은 염기 편집기를 사용하고, PAM 요구 사항을 제거하며, 사용자가 편집기를 임의의 최적의 위치에 배치할 수 있음으로써 방관자 돌연변이를 감소 또는 제거한다.
일부 실시양태에서, 본원에는 다양한 융합 단백질을 포함하는 복합체 (시스템)이 개시된다. 일부 실시양태에서, Cas 단백질은 DNA에 대한 융합 단백질의 결합 특이성을 증가시키기 위해 대체 DNA 결합 도메인에 융합될 수 있다 (문헌 [Bolukbashi, et al. (2015) Nat Methods 12(12):1150-1156] 참조). 예를 들어, ZFP, TtAgo 및 TALE DNA 결합 도메인이 dCas에 융합될 수 있다. 일부 실시양태에서, dCas는 PAM 특이성을 변경시키는 돌연변이 (문헌 [Gao, et al. (2017) Nature Biotechnology 35:789-792; Virginijus Siksnys (2016) Mol Cell 61:793] 참조) 또는 PAM 인식에 대한 요구 사항을 변경시키는 돌연변이를 포함한다. 일부 실시양태에서, 염기 편집기는 Cas 뉴클레아제가 결여된다.
이러한 접근법의 잠재적인 표적은 많다. 치료될 수 있는 예시적인 질환에 관여한 유전자의 질환 편집의 치료 및/또는 예방을 위한 염기 편집의 비-제한적인 예는 겸상 적혈구병, 혈우병, 낭포성 섬유증, 페닐케톤뇨증, 테이 삭스병, 색맹, 파브리병, 프리드라이히 운동실조, 전립선암 및 다른 많은 것을 포함한다.
따라서, 본원에 기재된 바와 같은 염기 편집 시스템은 임의의 질환 관련 유전자의 발현을 변경하는 데 사용될 수 있다. 특정 실시양태에서, 유전자는 암, 예를 들어 JAK2 V617F 돌연변이와 연관된다. 이러한 돌연변이는 골수 증식성 신생물의 확장에 있어 중요한 역할을 한다. JAK2는 전사 인자의 STAT 패밀리의 인산화를 통해 막 결합된 수용체로부터 시토카인 및 성장 인자 신호를 변환시킨다. V617F 돌연변이는 구성적 티로신 인산화 활성을 유도하고 시토카인 과민성 (문헌 [James, et al. (2005) Nature 434:1144-1148]) 및 시토카인의 부재 하에 세포가 증식하도록 구동시킬 수 있는 능력을 촉진한다 (Zhao, et al. (2005) J. Biol Chem 280 (24):22788-22792). 일부 JAK2 V617F 장애 (예를 들어, 원발성 골수 섬유증)의 경우, 유일한 치료법은 조혈 세포 이식이지만, 현재의 접근법은 종종 질환 재발 및 이식편 대 숙주 질환과 연관이 있다 (Byrne, et al. (2018) Ther Avd Hematol 9(9):251-259). 돌연변이를 제거하기 위해 대상체의 조혈 줄기 세포/전구 세포 (HSC/PC)를 편집하면, 이들 질환을 성공적으로 치료할 수 있다.
특정 실시양태에서, 염기는 알파-1 항트립신 (SERPINA 유전자좌 내)을 표적으로 한다. A1AT 단백질에서 상염색체 열성 결핍을 유발시키는 유전자좌에서의 돌연변이는 간 및 폐 질환 둘 다와 연관이 있다. 북유럽 혈통의 사람들에게 가장 흔한 결핍 대립 유전자 중 하나인 PiZ 돌연변이는 A1AT 단백질의 약 10 내지 20%만 생산되도록 한다. 이러한 돌연변이는 엑손 5에서의 단일 돌연변이에 의해 야기되어, 아미노산 위치 342에서의 리신이 글루타민으로 치환되며, 여기서 DNA 내의 위치 1096에 있는 G는 돌연변이된 유전자 서열에서의 A이다 (문헌 [Fregonese and Stolk (2008) Orphanet J Rare Dis 3:16]에서 검토됨).
DNA 결합 분자/도메인
본원에는 임의의 관심 유전자 또는 유전자좌에서의 표적 부위와 특이적으로 결합하는 하나 이상의 DNA 결합 분자/도메인을 포함하는 조성물이 기재된다. 징크 핑거 DNA 결합 도메인, TALE DNA 결합 도메인, CRISPR/Cas 뉴클레아제의 DNA 결합 부분 (가이드 또는 sgRNA), 및/또는 메가뉴클레아제로부터의 DNA 결합 도메인을 포함하나 이에 제한되지는 않는 임의의 DNA 결합 분자/도메인이 본원에 개시된 조성물 및 방법에 사용될 수 있다.
특정 실시양태에서, 본원에 기재된 염기 편집기는 징크 핑거 단백질 DNA 결합 도메인을 포함한다. 바람직하게, 징크 핑거 단백질은 선택한 표적 부위와 결합하도록 조작된다는 점에서 비-자연적으로 발생한다 (예를 들어, 문헌 [Beerli, et al. (2002) Nature Biotechnol. 20:135-141; Pabo, et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan, et al. (2001) Nature Biotechnol. 19:656-660; Segal, et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo, et al. (2000) Curr. Opin. Struct. Biol. 10:411-416]; 미국 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 및 7,253,273; 및 미국 특허 공개 번호 2005/0064474; 2007/0218528; 및 2005/0267061 참조; 모두는 그 전체 내용이 본원에 참조로 포함된다). 특정 실시양태에서, DNA 결합 도메인은 미국 특허 공개 번호 2012/0060230 (그 전체 내용이 본원에 참조로 포함됨)에 개시된 징크 핑거 단백질을 포함한다.
조작된 징크 핑거 결합 도메인은 자연적으로 발생하는 징크 핑거 단백질과 비교하여 새로운 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계와 다양한 유형의 선택을 포함하나 이에 제한되지는 않는다. 합리적 설계는, 예를 들어, 삼중항 (또는 사중항) 뉴클레오티드 서열 및 개별 징크 핑거 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하며, 여기서 각각의 삼중항 또는 사중항 뉴클레오티드 서열은 특별한 삼중항 또는 사중항 서열과 결합하는 징크 핑거의 하나 이상의 아미노산 서열과 연합된다 (예를 들어, 미국 특허 번호 6,453,242 및 6,534,261 참조; 그 전체 내용이 본원에 참조로 포함된다).
파지 디스플레이 및 2-하이브리드 시스템을 포함한 예시적인 선택 방법이 미국 특허 번호 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 국제 특허 공개 번호 WO 98/37186; WO 98/53057; WO 00/27878; 및 WO 01/88197 및 GB 2,338,237에 개시되어 있다. 또한, 징크 핑거 결합 도메인에 대한 결합 특이성의 증강이, 예를 들어, 미국 특허 번호 6,794,136에 기재되었다.
또한, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다수 핑거의 징크 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 관해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 이러한 단백질의 개별 징크 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다. 또한, 징크 핑거 결합 도메인에 대한 결합 특이성의 증강이, 예를 들어, 미국 특허 번호 6,794,136에 기재되었다.
표적 부위의 선택; ZFP 및 융합 단백질 (및 이를 코딩하는 폴리뉴클레오티드)의 설계 및 구축을 위한 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 미국 특허 번호 6,140,081; 5,789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 및 6,200,759; 및 국제 특허 공개 번호 WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536; 및 WO 03/016496에 상세하게 기재되어 있다.
또한, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다수 핑거의 징크 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 관해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 이러한 단백질의 개별 징크 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다.
통상적으로, ZFP는 적어도 3개의 핑거를 포함한다. 특정의 ZFP는 4개, 5개, 6개 또는 그 초과의 핑거를 포함한다. 3개의 핑거를 포함하는 ZFP는 전형적으로, 9개 또는 10개의 뉴클레오티드를 포함하는 표적 부위를 인식하고; 4개의 핑거를 포함하는 ZFP는 전형적으로, 12개 내지 14개의 뉴클레오티드를 포함하는 표적 부위를 인식하는 반면; 6개의 핑거를 갖는 ZFP는 18개 내지 21개의 뉴클레오티드를 포함하는 표적 부위를 인식할 수 있다. ZFP는 또한 하나 이상의 조절 도메인을 포함하는 융합 단백질일 수 있으며, 이러한 도메인은 전사 활성화 또는 억제 도메인일 수 있다.
일부 실시양태에서, DNA 결합 도메인은 뉴클레아제로부터 유래될 수 있다. 예를 들어, 귀소 엔도뉴클레아제 및 메가뉴클레아제의 인식 서열, 예컨대 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII가 공지되어 있다 (또한 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; 문헌 [Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon, et al. (1989) Gene 82:115-118; Perler, et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble, et al. (1996) J. Mol. Biol. 263:163-180; Argast, et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs catalogue] 참조). 또한, 귀소 엔도뉴클레아제 및 메가뉴클레아제의 DNA 결합 특이성은 비-자연 표적 부위와 결합하도록 조작될 수 있다 (예를 들어, 문헌 [Chevalier, et al. (2002) Molec. Cell 10:895-905; Epinat, et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth, et al. (2006) Nature 441:656-659; Paques, et al. (2007) Current Gene Therapy 7:49-66]; 미국 특허 공개 번호 2007/0117128 참조).
특정 실시양태에서, 본원에 기재된 돌연변이체 절단 도메인과 함께 사용되는 징크 핑거 단백질은, 예를 들어 위치 -14, -9 및/또는 -5 중 하나 이상에서 백본 영역 (예를 들어, -1 내지 6으로 넘버링된 7-아미노산 인식 나선 영역의 외부 영역)에 대한 하나 이상의 돌연변이 (치환, 결실 및/또는 삽입)를 포함한다. 하나 이상의 이들 위치에서 야생형 잔기는 결실될 수 있고, 임의의 아미노산 잔기로 대체될 수 있고/있거나 하나 이상의 부가의 잔기를 포함할 수 있다. 일부 실시양태에서, 위치 -5에서의 Arg (R)는 Tyr (Y), Asp (N), Glu (E), Leu (L), Gln (Q) 또는 Ala (A)로 변화된다. 다른 실시양태에서, 위치 (-9)에서의 Arg (R)는 Ser (S), Asp (N) 또는 Glu (E)로 대체된다. 추가 실시양태에서, 위치 (-14)에서의 Arg (R)는 Ser (S) 또는 Gln (Q)으로 대체된다. 다른 실시양태에서, 융합 폴리펩티드는 징크 핑거 DNA 결합 도메인 내에 돌연변이를 포함할 수 있으며, 여기서 (-5), (-9) 및/또는 (-14) 위치에서의 아미노산이 임의의 조합으로 상기 열거된 아미노산 중 임의의 것으로 변화된다.
다른 실시양태에서, DNA 결합 도메인은 식물 병원균 크산토모나스(Xanthomonas) (문헌 [Boch, et al. (2009) Science 326:1509-1512 및 Moscou and Bogdanove (2009) Science 326:1501] 참조) 및 랄스토니아(Ralstonia) (문헌 [Heuer, et al. (2007) Applied and Environmental Microbiology 73(13):4379-4384]; 미국 특허 공개 번호 2011/0301073 및 2011/0145940 참조)로부터 유래된 것과 유사한 전사 활성화제 유사 (TAL) 이펙터 (TALE)로부터의 조작된 도메인을 포함한다. 크산토모나스 속의 식물 병원성 박테리아는 중요한 작물에서 많은 질병을 일으키는 것으로 공지되어 있다. 크산토모나스의 병원성은 식물 세포에 25개 초과의 상이한 이펙터 단백질을 주입하는 보존된 유형 III 분비 (T3S) 시스템에 의존한다. 이러한 주입된 단백질 중에는 식물 전사 활성화제를 모방하고 식물 전사체를 조작하는 전사 활성화제 유사 이펙터 (TALE)가 있다 (문헌 [Kay, et al. (2007) Science 318:648-651] 참조). 이들 단백질은 DNA 결합 도메인과 전사 활성화 도메인을 함유한다. 가장 널리 특징 규명된 TALE 중 하나는 크산토모나스 캄페스트리스 pv. 베시카토리아(Xanthomonas campestris pv. Vesicatoria)로부터의 AvrBs3이다 (문헌 [Bonas, et al. (1989) Mol Gen Genet 218:127-136] 및 국제 특허 공개 번호 WO 2010/079430 참조). TALE는 탠덤 반복부의 중앙 집중식 도메인을 함유하며, 각각의 반복부는 대략 34개의 아미노산을 함유하며, 이는 이들 단백질의 DNA 결합 특이성에 중요하다. 또한, 그들은 핵 국재화 서열 및 산성 전사 활성화 도메인을 함유한다 (검토를 위해, 문헌 [Schornack S., et al. (2006) J Plant Physiol 163(3): 256-272] 참조). 또한, 식물 병원성 박테리아인 랄스토니아 솔라나세아룸(Ralstonia solanacearum)에서, 알. 솔라나세아룸(R. solanacearum) 생물변이형 1 균주 GMI1000 및 생물변이형 4 균주 RS1000에서 크산토모나스의 AvrBs3 패밀리와 상동인, brg11 및 hpx17로 지명된 2개의 유전자가 발견되었다 (문헌 [Heuer, et al. (2007) Appl and Envir Micro 73(13):4379-4384] 참조). 이들 유전자는 뉴클레오티드 서열이 서로 98.9% 동일하지만, hpx17의 반복 도메인에서 1,575개 염기쌍이 결실된다는 점에서 상이하다. 그러나, 두 유전자 산물은 크산토모나스의 AvrBs3 패밀리 단백질과 40% 미만의 서열 동일성을 갖는다.
이들 TAL 이펙터의 특이성은 탠덤 반복부에서 발견되는 서열에 의존한다. 반복된 서열은 대략 102개의 염기쌍을 포함하고 반복부는 전형적으로 서로 91 내지 100% 상동이다 (상기 문헌 [Bonas, et al.]). 반복부의 다형성은 통상적으로, 위치 12 및 13에 위치하며, 위치 12 및 13에서의 초가변 2잔기 (반복 가변 2잔기 또는 RVD 영역)의 정체와 TAL 이펙터의 표적 서열에 있는 연속되는 뉴클레오티드의 정체 간에 일 대 일 일치가 있는 것처럼 여겨진다 (문헌 [Moscou and Bogdanove (2009) Science 326:1501 및 Boch, et al. (2009) Science 326:1509-1512] 참조). 실험적으로, 이러한 TAL 이펙터의 DNA 인식을 위한 자연 코드는 위치 12 및 13에서의 HD 서열 (반복 가변 2잔기 또는 RVD)이 시토신 (C)과 결합하고, NG가 T와 결합하고, NI가 A, C, G 또는 T와 결합하고, NN이 A 또는 G와 결합하며, ING가 T와 결합하도록 결정되었다. 이러한 DNA 결합 반복부는 새로운 서열과 상호작용할 수 있고 식물 세포에서 비-내인성 리포터 유전자의 발현을 활성화할 수 있는 인공 전사 인자를 만들기 위해, 반복부의 새로운 조합과 수를 갖는 단백질로 어셈블리되었다 (상기 문헌 [Boch, et al.]). 조작된 TAL 단백질은 FokI 절단 절반 도메인에 연결되어, 비정형 RVD를 갖는 TALEN을 포함한 TAL 이펙터 도메인 뉴클레아제 융합 (TALEN)을 산출하였다 (예를 들어, 미국 특허 번호 8,586,526 참조).
일부 실시양태에서, TALEN은 엔도뉴클레아제 (예를 들어, FokI) 절단 도메인 또는 절단 절반-도메인을 포함한다. 다른 실시양태에서, TALE-뉴클레아제는 메가 TAL이다. 이들 메가 TAL 뉴클레아제는 TALE DNA 결합 도메인 및 메가뉴클레아제 절단 도메인을 포함하는 융합 단백질이다. 메가뉴클레아제 절단 도메인은 단량체로서 활성이며 활성을 위해 이량체화를 필요로 하지 않는다 (문헌 [Boissel et al. (2013) Nucl Acid Res: 1-13, doi: 10.1093/nar/gkt1224] 참조).
또한 추가 실시양태에서, 뉴클레아제는 컴팩트 TALEN을 포함한다. 이들은 TALE DNA 결합 도메인을 TevI 뉴클레아제 도메인에 연결하는 단일 쇄 융합 단백질이다. 융합 단백질은 TevI 뉴클레아제 도메인과 관련하여 TALE DNA 결합 도메인이 위치하는 곳에 따라, TALE 영역에 의해 국한된 닉카제로서 작용할 수 있거나 또는 이중 가닥 파손을 생성할 수 있다 (문헌 [Beurdeley, et al. (2013) Nat Comm: 1-8 DOI:10.1038/ncomms2782] 참조). 또한, 뉴클레아제 도메인은 또한 DNA 결합 기능성을 나타낼 수 있다. 임의의 TALEN은 부가의 TALEN (예를 들어, 하나 이상의 메가-TALE가 있는 하나 이상의 TALEN (cTALEN 또는 FokI-TALEN))과 조합하여 사용될 수 있다.
또한, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다수 핑거의 징크 핑거 단백질 또는 TALE는, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 관해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 이러한 단백질의 개별 징크 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다. 또한, 징크 핑거 결합 도메인에 대한 결합 특이성의 증강이, 예를 들어, 미국 특허 번호 6,794,136에 기재되었다.
특정 실시양태에서, 염기 편집기는 DNA와 결합하는 단일 가이드 RNA (sgRNA) DNA 결합 분자를 포함한 CRISPR/Cas 뉴클레아제 시스템의 일부인 DNA 결합 도메인을 포함한다 (예를 들어, 미국 특허 번호 8,697,359 및 미국 특허 공개 번호 2015/0056705 및 2015/0159172 참조). 상기 시스템의 RNA 성분을 코딩하는 CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부) 유전자좌와, 단백질을 코딩하는 cas (CRISPR 관련) 유전자좌 (문헌 [Jansen, et al. (2002) Mol. Microbiol. 43:1565-1575; Makarova, et al. (2002) Nucleic Acids Res. 30:482-496; Makarova, et al. (2006) Biol. Direct 1:7; Haft, et al. (2005) PLoS Comput. Biol. 1:e60])가 CRISPR/Cas 뉴클레아제 시스템의 유전자 서열을 구성한다. 미생물 숙주에서 CRISPR 유전자좌는 CRISPR 매개 핵산 절단의 특이성을 프로그래밍할 수 있는 비-코딩 RNA 요소뿐만 아니라 CRISPR 관련 (Cas) 유전자의 조합을 함유한다.
일부 실시양태에서, DNA 결합 도메인은 TtAgo 시스템의 일부이다 (문헌 [Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888; Sheng, et al., 상기 문헌] 참조). 진핵 생물에서, 유전자 침묵은 아르고노트 (Ago) 패밀리의 단백질에 의해 매개된다. 이러한 패러다임에서, Ago는 작은 (19-31 nt) RNA와 결합된다. 이러한 단백질-RNA 침묵 복합체는 작은 RNA와 표적 간의 왓슨 크릭(Watson-Crick) 염기쌍 형성을 통해 표적 RNA를 인식하고, 표적 RNA를 엔도뉴클레아제로 절단한다 (Vogel (2014) Science 344:972-973). 대조적으로, 원핵 Ago 단백질은 작은 단일 가닥 DNA 단편과 결합하며 외래 (종종 바이러스) DNA를 검출하고 이를 제거하는 기능을 하는 것으로 예상된다 (Yuan, et al. (2005) Mol. Cell 19:405; Olovnikov, et al. (2013) Mol. Cell 51, 594; Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888). 예시적인 원핵 Ago 단백질은 아퀴펙스 아에올리쿠스(Aquifex aeolicus), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 및 써무스 써모필루스로부터의 것을 포함한다.
가장 널리 특징 규명된 원핵 Ago 단백질 중 하나는 티. 써모필루스(T. thermophilus)로부터의 것이다 (TtAgo; 문헌 [Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888]). TtAgo는 5' 인산염 기가 있는 15 nt 또는 13-25 nt 단일 가닥 DNA 단편과 연합된다. TtAgo에 의해 결합된 이러한 "가이드 DNA"는 단백질-DNA 복합체가 DNA의 제3자 분자에 있는 왓슨 크릭 상보적 DNA 서열과 결합하도록 지시하는 역할을 한다. 일단 이들 가이드 DNA에서의 서열 정보가 표적 DNA를 확인시켜 줄 수 있으면, TtAgo-가이드 DNA 복합체가 표적 DNA를 절단한다. 이러한 메커니즘은 또한, 그의 표적 DNA와 결합되는 동안 TtAgo-가이드 DNA 복합체의 구조에 의해 뒷받침된다 (상기 문헌 [G. Sheng, et al.]). 로도박터 스파에로이데스로부터의 Ago (RsAgo)는 유사한 특성을 가지고 있다 (상기 문헌 [Olovnikov, et al.]).
임의의 DNA 서열의 외인성 가이드 DNA를 TtAgo 단백질 상에 부하할 수 있다 (Swarts, et al. (2014) Nature 507(7491):258-261; Swarts, et al. (2012) PLoS One 7(4):e35888). TtAgo 절단의 특이성은 가이드 DNA에 의해 지시되기 때문에, 외인성 조사자 지정 가이드 DNA와 형성된 TtAgo-DNA 복합체는 따라서, TtAgo 표적 DNA 절단이 상보적 조사자 지정 표적 DNA를 향하게 할 것이다. 이러한 방식으로, DNA에서 표적화된 이중 가닥 파손을 생성할 수 있다. TtAgo-가이드 DNA 시스템 (또는 다른 유기체로부터의 오르소로고스 Ago-가이드 DNA 시스템)을 사용하면, 세포 내에서 게놈 DNA의 표적화된 절단이 가능하다. 이러한 절단은 단일 가닥 또는 이중 가닥일 수 있다. 포유 동물 게놈 DNA의 절단을 위해, 포유 동물 세포에서의 발현을 위해 최적화된 TtAgo 코돈 버전을 사용하는 것이 바람직할 것이다. 추가로, TtAgo 단백질이 세포 침투 펩티드에 융합되는 시험관 내에서 형성된 TtAgo-DNA 복합체로 세포를 처리하는 것이 바람직할 수 있다. 추가로, 돌연변이 유발을 통해 변경된 TtAgo 단백질 버전을 사용하여 37℃에서의 개선된 활성을 갖는 것이 바람직 할 수 있다. Ago-RNA 매개 DNA 절단은 유전자 녹아웃, 표적화된 유전자 부가, 유전자 교정, DNA 파손의 이용을 위해 관련 기술분야에서의 기술 표준을 사용하는 표적화된 유전자 결실을 포함한 결과 전체에 영향을 미치는 데 사용될 수 있었다.
따라서, 임의의 DNA 결합 분자/도메인을 사용할 수 있다. 특정 실시양태에서, 본원에 기재된 염기 편집기는 sgRNA DNA 결합 도메인 (예를 들어, Cas9 닉카제의 일부로서) 및 임의로 하나 이상의 ZFP DNA 결합 도메인 ("ZFP 앵커로서 지칭됨)을 포함하는 Cas9 염기 편집기이며, ZFP(들)는 염기 편집 효율성 및/또는 특이성을 증가시킬 수 있다. ZFP 앵커를 포함한 Cas9 염기 편집기의 비-제한적인 예는 도 1b 및 도 3에 도시되어 있다.
융합 분자
본원에 기재된 DNA 편집 복합체는 본원에 기재된 바와 같은 DNA 결합 도메인 (예를 들어, ZFP 또는 TALE, CRISPR/Cas 성분, 예컨대 단일 가이드 RNA)을 포함하는 하나 이상의 융합 분자를 포함할 수 있고, 이종 (기능적) 도메인 (또는 그의 기능적 단편)이 또한 제공된다.
통상의 도메인은, 예를 들어, 전사 인자 도메인 (활성화제, 억제인자, 공동 활성화제, 공동 억제인자), 침묵인자, 종양 유전자 (예를 들어, myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos 패밀리 구성원 등); DNA 복구 효소 및 그의 관련 인자 및 변형인자; 헬리카제, 이중 가닥 DNA 결합 단백질, DNA 재배열 효소 및 그의 관련 인자 및 변형인자; 염색질 관련 단백질 및 그의 변형인자 (예를 들어 키나제, 아세틸라제 및 데아세틸라제); 및 DNA 변형 효소 (예를 들어, 메틸트랜스퍼라제, 토포이소머라제, 헬리카제, 라이가제, 키나제, 포스파타제, 데아미나제, 폴리머라제, 엔도뉴클레아제) 및 그의 관련 인자 및 변형인자를 포함한다. 미국 특허 공개 번호 2005/0064474; 2006/0188987; 및 2007/0218528은 DNA 결합 도메인과 뉴클레아제 절단 도메인의 융합에 관한 세부 사항에 대해 설명하며, 그 전체 내용이 본원에 참조로 포함된다.
융합 분자는 관련 기술분야의 통상의 기술자에게 널리 공지된 클로닝 및 생화학적 접합 방법에 의해 구축된다. 융합 분자는 DNA 결합 도메인 및 기능적 도메인 (예를 들어, 헬리카제 및/또는 데아미나제 및/또는 GUI 및/또는 GAM)을 포함한다. 융합 분자는 또한 임의로, 핵 국재화 신호 (예컨대 예를 들어, SV40 배지 T-항원으로부터의 것) 및 에피토프 태그 (예컨대 예를 들어, FLAG 및 혈구 응집소)를 포함한다. 융합 단백질 (및 이를 코딩하는 핵산)은 번역 리딩 프레임이 융합물의 성분 사이에서 보존되도록 설계된다.
한편으로는 기능적 도메인 (또는 그의 기능적 단편)의 폴리펩티드 성분과 다른 한편으로는 비-단백질 DNA 결합 도메인 (예를 들어, 항생제, 삽입제, 작은 홈 결합제, 핵산) 간의 융합물이, 관련 기술분야의 통상의 기술자에게 공지된 생화학적 접합 방법에 의해 구축된다 (예를 들어, 문헌 [Pierce Chemical Company (Rockford, IL) Catalogue] 참조). 작은 홈 결합제와 폴리펩티드 간의 융합물을 제조하는 방법 및 조성물이 문헌 [Mapp, et al. (2000) Proc. Natl. Acad. Sci. USA 97:3930-3935]에 기재되었다. 더욱이, CRISPR/Cas 시스템의 단일 가이드 RNA는 기능적 도메인과 연합하여 활성 전사 조절인자 및 뉴클레아제를 형성한다.
특정 실시양태에서, DNA 결합 도메인에 대한 표적 부위는 세포 염색질의 접근가능한 영역에 존재한다. 접근가능한 영역은, 예를 들어 미국 특허 번호 7,217,509 및 7,923,542에 기재된 바와 같이 결정될 수 있다. 표적 부위가 세포 염색질의 접근가능한 영역에 존재하지 않는 경우, 미국 특허 번호 7,785,792 및 8,071,370에 기재된 바와 같이 하나 이상의 접근가능한 영역이 생성될 수 있다. 부가의 실시양태에서, 융합 분자의 DNA 결합 도메인은 그의 표적 부위가 접근가능한 영역에 있는지의 여부에 관계없이 세포 염색질과 결합할 수 있다. 예를 들어, 이러한 DNA 결합 도메인은 링커 DNA 및/또는 뉴클레오솜 DNA와 결합할 수 있다. 이러한 유형의 "선구자" DNA 결합 도메인의 예는 특정 스테로이드 수용체와 간세포 핵 인자 3 (HNF3)에서 발견된다 (Cordingley, et al. (1987) Cell 48:261-270; Pina, et al. (1990) Cell 60:719-731; 및 Cirillo, et al. (1998) EMBO J. 17:244-254).
융합 분자는 관련 기술분야의 통상의 기술자에게 공지된 바와 같이, 제약상 허용되는 담체와 제형화될 수 있다 (예를 들어, 문헌 [Remington's Pharmaceutical Sciences, 17th ed., 1985]; 및 미국 특허 번호 6,453,242 및 6,534,261 참조).
융합 분자의 기능적 성분(들)/도메인(들)은 일단 융합 분자가 그의 DNA 결합 도메인을 통해 표적 서열과 결합하면, 유전자의 서열에 영향을 미칠 수 있는 다양한 상이한 성분 중 임의의 것으로부터 선택될 수 있다. 따라서, 기능적 성분은 다양한 데아미나제, UGI, GAM, 헬리카제 등을 포함할 수 있으나, 이에 제한되지는 않는다. 특정 실시양태에서, 기능적 도메인은 하나 이상의 시티딘 데아미나제 (예를 들어, 아포지질단백질 B mRNA 편집 복합체 1 (APOBEC1) 도메인 및/또는 활성화 유도 데아미나제 (AID))를 포함한다. 다른 실시양태에서, 기능적 도메인은 하나 이상의 아데닌 데아미나제 (예를 들어, 돌연변이된 TadA (tRNA 아데닌 데아미나제 (문헌 [Gaudelli, et al. (2017) Nature 551:464-471] 참조))를 포함한다. 또한 추가 실시양태에서, 기능적 도메인은 적어도 하나의 우라실 DNA 글리코실라제 억제제 (예를 들어 UGI) 도메인을 포함한다. 일부 실시양태에서, 염기 편집 복합체는 데아미나제, 닉카제, UGI 및/또는 GAM 단백질을 포함한다. 기능적 도메인(들)은 DNA 결합 도메인 (및/또는 촉매적으로 활성인 융합 분자에 포함될 때 닉카제)와 관련하여 N-말단 (다수의 기능적 도메인이 존재하는 경우 임의의 순서로), C-말단 (다수의 기능적 도메인이 존재하는 경우 임의의 순서로) 등을 포함하나 이에 제한되지는 않는 임의의 방식으로 위치될 수 있다.
일부 실시양태에서, DNA 편집 (염기 편집) 복합체는 이중 가닥 DNA 나선을 개방하거나 또는 탈안정화하는 데 도움을 주는 분자를 추가로 포함한다. 일부 실시양태에서, 이러한 분자는 효소를 포함한다. 일부 실시양태에서, 효소는 헬리카제 (예를 들어, RecQ 헬리카제 (WRN, BLM, RecQL4 및 RecQ5 (문헌 [Mo, et al. (2018) Cancer Lett. 413:1-10] 참조), DNA2 (문헌 [Jia, et al. (2017) DNA Repair (Amst). 59:9-19]) 및 임의의 다른 진핵 헬리카제, 예를 들어, FANCJ, XPD, XPB, RTEL1, 및 PIF1 (문헌 [Brosh (2013) Nat Rev Canc 13(8):542-558]))이다. 일부 실시양태에서, 효소는 박테리아 및/또는 바이러스 헬리카제이다. 예시적인 바이러스 헬리카제는 미오비리다에 과의 바이러스에 의해 코딩된 것 (예를 들어 gp41, Dda, UvsW, Gene α, 및 Ban); 포도비리다에 과의 바이러스에 의해 코딩된 것 (예를 들어 4B); 시포비리다에, 바쿨로비리다에, 헤르페스비리다에, 폴리오마비리다에, 파필로마비리다에 및 폭스비리다에 과의 바이러스에 의해 코딩된 것 (예를 들어, G40P, p143, UL5, UL9, Tag, E1, NPH-I, NPH-II, A18R, 및 VETF), 또는 관련 기술분야에 공지된 임의의 다른 바이러스 헬리카제를 포함한다 (예를 들어 문헌 [Frick and Lam (2006) Curr Pharm Des 12(11):1315-1338] 참조). 일부 실시양태에서, 헬리카제 효소는 박테리아 효소이다. 예시적인 박테리아 헬리카제는 피. 아에루기노사 SF4 DnaB-유사 헬리카제, 또는 박테리아, 예컨대 이. 콜라이 및 에이치. 파일로리에서 박테리아 RecBCD 복합체의 일부인 RecB 및 RecD 헬리카제를 포함한다 (Shadrick, et al. (2013) J. Biomol Screen 18(7):761-781). 일부 실시양태에서, 상기 분자는 CRISPR/Cas 복합체를 포함한다. 일부 실시양태에서, CRISPR/Cas 복합체는 가이드 RNA를 포함한다. 일부 실시양태에서, 복합체는 뉴클레아제 도메인 중 하나에서 촉매적으로 결함이 있는 Cas 효소를 포함한다. 일부 실시양태에서, Cas 효소는 그의 PAM 인식에 있어서 결함이 있다 (Anders, et al. (2014) Nature 513(7519):569-573). 일부 실시양태에서, 상기 분자는 나선 탈안정화 특성을 갖는다. 예시적인 나선 탈안정화 분자는 단순 포진 바이러스 유형 I (문헌 [Boehmer and Lehman (1993) J Virol 67(2):711-715]), 푸랄파 (문헌 [Darbinian, et al. (2001) J Cell Biochem 80(4):589-95]) 및 송아지 흉선 DNA 나선 탈안정화 단백질 (문헌 [Kohwi-Shigematsu, et al. (1978) Proc Natl Acad Sci USA 75(10):4689-93])로부터의 ICP8을 포함한다. 일부 실시양태에서, 상기 분자는 핵산이다. 일부 실시양태에서, 핵산은 표적화된 편집 근처 영역과의 상동성을 갖는 DNA이다. 일부 실시양태에서, 핵산은 표적화된 편집 근처 영역과의 상동성을 갖는 RNA이다. 일부 실시양태에서, RNA는 변형된다. 일부 실시양태에서, 융합 분자는 이러한 융합 분자의 하나 이상의 도메인 사이에 아미노산 링커 서열을 포함한다.
본원에 기재된 DNA 편집 복합체는 본원에 기재된 바와 같은 1, 2, 3, 4개 또는 그 초과의 융합 분자를 포함할 수 있다. 특정 실시양태에서, DNA 편집 복합체는 2개의 융합 분자: DNA 결합 도메인 및 닉카제 도메인을 포함하는 촉매적으로 활성인 닉카제 (촉매적으로 활성)인 제1 융합 분자 및 DNA 결합 도메인 및 하나 이상의 기능적 도메인 (시티딘 데아미나제, 아데닌 데아미나제, 및/또는 UGI 등)을 포함하는 제2의 촉매적으로 불활성인 융합 분자를 포함한다. 전형적으로, 융합 분자는 2개의 DNA 결합 도메인이 표적 부위와 결합하여 2개의 융합 분자가 이량체화되어 DNA 편집을 수행한다는 점에서 "파트너"이다. 다른 실시양태에서, DNA 편집 복합체는 3개 이상의 융합 분자: DNA 결합 도메인 및 닉카제 도메인을 포함하는 촉매적으로 활성인 닉카제인 제1 융합 분자; DNA 결합 도메인을 포함하는 제2의 촉매적으로 불활성인 융합 분자 (예를 들어, 제1 융합 분자와 파트너이고 이량체화된다); 및 본원에 기재된 바와 같은 DNA 결합 도메인 및 하나 이상의 기능적 도메인을 포함하는 제3 융합 분자를 포함한다.
닉카제 도메인
특정 실시양태에서, 융합 단백질은 DNA 결합 도메인 및 절단 (뉴클레아제) 도메인, 바람직하게 닉카제 도메인을 포함한다. 따라서, 유전자 편집은 뉴클레아제, 예를 들어 조작된 닉카제를 사용하여 달성될 수 있다. 조작된 뉴클레아제 기술은 자연적으로 발생하는 DNA 결합 단백질의 조작을 기반으로 한다. 예를 들어, 맞춤형 DNA 결합 특이성을 갖는 귀소 엔도뉴클레아제를 조작하는 것이 기재되었다 (Chames, et al. (2005) Nucleic Acids Res 33(20):e178; Arnould, et al. (2006) J. Mol. Biol. 355:443-458). 또한, ZFP를 조작하는 것이 또한 기재되었다 (예를 들어, 미국 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,979,539; 6,933,113; 7,163,824; 및 7,013,219 참조).
또한, ZFP 및/또는 TALE는 뉴클레아제 도메인에 융합되어 ZFN 및 TALEN을 생성하였으며, 이는 그의 조작된 (ZFP 또는 TALE) DNA 결합 도메인을 통해 의도된 핵산 표적을 인식할 수 있고 DNA가 뉴클레아제 활성을 통해 DNA 결합 부위 근처를 절단할 수 있게 하는 기능적 실체이다 (예를 들어, 문헌 [Kim, et al. (1996) Proc Nat'l Acad Sci USA 93(3):1156-1160] 참조). 보다 최근에는, 이러한 뉴클레아제가 다양한 유기체에서 게놈 변형을 위해 사용되었다 (예를 들어, 미국 특허 번호 9,255,250; 9,200,266; 9,045,763; 9,005,973; 8,956,828; 8,945,868; 8,703,489; 8,586,526; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,067,317; 7,262,054; 7,888,121; 7,972,854; 7,914,796; 7,951,925; 8,110,379; 8,409,861; 미국 특허 공개 번호 2003/0232410; 2005/0208489; 2005/0026157; 2005/0064474; 2006/0063231; 2008/0159996; 2010/00218264; 2012/0017290; 2011/0265198; 2013/0137104; 2013/0122591; 2013/0177983; 2013/0177960; 및 2015/0056705 참조).
따라서, 본원에 기재된 방법 및 조성물은 광범위하게 적용가능하고 임의의 관심 뉴클레아제를 수반할 수 있다. 뉴클레아제의 비-제한적인 예는 메가뉴클레아제, TALEN 및 징크 핑거 뉴클레아제를 포함한다. 뉴클레아제는 이종 DNA 결합 및 절단 도메인을 포함할 수 있거나 (예를 들어, 징크 핑거 뉴클레아제; 이종 절단 도메인을 갖는 메가뉴클레아제 DNA 결합 도메인), 또는 또 다른 한편으론, 자연적으로 발생하는 뉴클레아제의 DNA 결합 도메인은 선택된 표적 부위와 결합하도록 변경될 수 있다 (예를 들어, 동족 결합 부위와 상이한 부위와 결합하도록 조작된 메가뉴클레아제).
본원에 기재된 뉴클레아제 중 임의의 것에서, 뉴클레아제는 TALEN으로서 지칭되기도 한, 조작된 TALE DNA 결합 도메인 및 뉴클레아제 도메인 (예를 들어, 엔도뉴클레아제 및/또는 메가뉴클레아제 도메인)을 포함할 수 있다. 사용자가 선택한 표적 서열과의 강력한 부위 특이적 상호작용을 위해 이들 TALEN 단백질을 조작하는 방법 및 조성물이 공개되었다 (미국 특허 번호 8,586,526 참조). 일부 실시양태에서, TALEN은 엔도뉴클레아제 (예를 들어, FokI) 절단 도메인 또는 절단 절반-도메인을 포함한다. 다른 실시양태에서, TALE-뉴클레아제는 메가 TAL이다. 이들 메가 TAL 뉴클레아제는 TALE DNA 결합 도메인 및 메가뉴클레아제 절단 도메인을 포함하는 융합 단백질이다. 메가뉴클레아제 절단 도메인은 단량체로서 활성이며 활성을 위해 이량체화를 필요로 하지 않는다 (문헌 [Boissel, et al. (2013) Nucl Acid Res 1-13, doi:10.1093/nar/gkt1224] 참조). 또한, 뉴클레아제 도메인은 또한, DNA 결합 기능성을 나타낼 수 있다.
또한 추가 실시양태에서, 뉴클레아제는 컴팩트 TALEN (cTALEN)을 포함한다. 이들은 TALE DNA 결합 도메인을 TevI 뉴클레아제 도메인에 연결하는 단일 쇄 융합 단백질이다. 융합 단백질은 TevI 뉴클레아제 도메인과 관련하여 TALE DNA 결합 도메인이 위치하는 곳에 따라, TALE 영역에 의해 국한된 닉카제로서 작용할 수 있거나 또는 이중 가닥 파손을 생성할 수 있다 (문헌 [Beurdeley, et al. (2013) Nat Comm: 1-8 DOI:10.1038/ncomms2782] 참조). 임의의 TALEN은 부가의 TALEN (예를 들어, 하나 이상의 메가-TAL이 있는 하나 이상의 TALEN (cTALEN 또는 FokI-TALEN)) 또는 다른 DNA 절단 효소와 조합하여 사용될 수 있다.
특정 실시양태에서, 뉴클레아제는 메가뉴클레아제 (귀소 엔도뉴클레아제) 또는 절단 활성을 나타내는 그의 일부분을 포함한다. 자연적으로 발생하는 메가뉴클레아제는 15 내지 40개의 염기쌍 절단 부위를 인식하고, 통상적으로 4가지 패밀리: LAGLIDADG 패밀리 (서열식별번호: 75로서 개시된 "LAGLIDADG"), GIY-YIG 패밀리, His-Cyst 박스 패밀리 및 HNH 패밀리로 분류된다. 예시적인 귀소 엔도뉴클레아제는 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII를 포함한다. 그들의 인식 서열은 공지되어 있다 (또한 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; 문헌 [Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon, et al. (1989) Gene 82:115-118; Perler, et al. (1994) Nucleic Acids Res. 22:1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble, et al. (1996) J. Mol. Biol. 263:163-180; Argast, et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs catalogue] 참조).
자연적으로 발생하는 메가뉴클레아제, 주로 LAGLIDADG 패밀리 (서열식별번호: 75로서 개시된 "LAGLIDADG")로부터의 DNA 결합 도메인은 식물, 효모, 드로소필라(Drosophila), 포유 동물 세포 및 마우스에서 부위 특이적 게놈 변형을 촉진하는 데 사용되었지만, 이러한 접근법은 메가뉴클레아제 인식 서열을 보존하는 상동 유전자의 변형으로 제한되었거나 (문헌 [Monet, et al. (1999) Biochem. Biophysics. Res. Common 255:88-93) 또는 인식 서열이 도입된 미리 조작된 게놈으로 제한되었다 (Route, et al. (1994) Mol. Cell. Biol. 14:8096-106; Chilton, et al. (2003) Plant Physiology 133:956-65; Puchta, et al. (1996) Proc. Natl. Acad. Sci. USA 93:5055-60; Rong, et al. (2002) Genes Dev. 16:1568-81; Gouble, et al. (2006) J. Gene Med. 8(5):616-622). 따라서, 메가뉴클레아제를 조작하여 의학적으로 또는 생명공학적으로 관련된 부위에서 새로운 결합 특이성을 나타내려는 시도가 있었다 (Porteus, et al. (2005) Nat. Biotechnol. 23:967-73; Sussman, et al. (2004) J. Mol. Biol. 342:31-41; Epinat, et al. (2003) Nucleic Acids Res. 31:2952-62; Chevalier, et al. (2002) Molec. Cell 10:895-905; Epinat, et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth, et al. (2006) Nature 441:656-659; Paques, et al. (2007) Current Gene Therapy 7:49-66; 미국 특허 공개 번호 2007/0117128; 2006/0206949; 2006/0153826; 2006/0078552; 및 2004/0002092). 또한, 메가뉴클레아제로부터의 자연적으로 발생하는 또는 조작된 DNA 결합 도메인은 이종 뉴클레아제 (예를 들어, FokI)로부터의 절단 도메인과 작동가능하게 연결될 수 있고/있거나 메가뉴클레아제로부터의 절단 도메인은 이종 DNA 결합 도메인 (예를 들어, ZFP 또는 TALE)과 작동가능하게 연결될 수 있다.
다른 실시양태에서, 뉴클레아제는 징크 핑거 뉴클레아제 (ZFN) 또는 TALE DNA 결합 도메인-뉴클레아제 융합 (TALEN)이다. ZFN 및 TALEN은 선택되는 유전자 내의 표적 부위와 결합하도록 조작된 DNA 결합 도메인 (징크 핑거 단백질 또는 TALE DNA 결합 도메인) 및 절단 도메인 또는 절단 절반-도메인 (예를 들어, 본원에 기재된 바와 같은 제한 및/또는 메가뉴클레아제로부터의 것)을 포함한다.
상기 상세히 기재된 바와 같이, 징크 핑거 결합 도메인 및 TALE DNA 결합 도메인은 선택되는 서열과 결합하도록 조작될 수 있다 (예를 들어, 문헌 [Beerli, et al. (2002) Nature Biotechnol. 20:135-141; Pabo, et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan, et al. (2001) Nature Biotechnol. 19:656-660; Segal, et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo, et al. (2000) Curr. Opin. Struct. Biol. 10:411-416] 참조). 조작된 징크 핑거 결합 도메인 또는 TALE 단백질은 자연적으로 발생하는 단백질과 비교해서 새로운 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계와 다양한 유형의 선택을 포함하나 이에 제한되지는 않는다. 합리적 설계는, 예를 들어, 삼중항 (또는 사중항) 뉴클레오티드 서열 및 개별 징크 핑거 또는 TALE 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하며, 여기서 각각의 삼중항 또는 사중항 뉴클레오티드 서열은 특별한 삼중항 또는 사중항 서열과 결합하는 징크 핑거 또는 TALE 반복 단위의 하나 이상의 아미노산 서열과 연합된다 (예를 들어, 미국 특허 번호 6,453,242 및 6,534,261 참조; 그 전체 내용이 본원에 참조로 포함된다).
표적 부위의 선택; 및 융합 단백질 (및 이를 코딩하는 폴리뉴클레오티드)의 설계 및 구축을 위한 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 미국 특허 번호 7,888,121 및 8,409,861 (그의 전체 내용이 본원에 참조로 포함됨)에 상세히 기재되어 있다.
또한, 이들 및 다른 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인, TALE 및/또는 다수 핑거의 징크 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함한 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 예를 들어, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 관해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 이러한 단백질의 개별 징크 핑거 사이에 적합한 링커의 임의의 조합을 포함할 수 있다 (또한 미국 특허 번호 8,772,453 참조).
따라서, 뉴클레아제, 예컨대 ZFN, TALEN 및/또는 메가뉴클레아제는 임의의 DNA 결합 도메인 및 임의의 뉴클레아제 (절단) 도메인 (절단 도메인, 절단 절반-도메인)을 포함할 수 있다. 상기 언급된 바와 같이, 절단 도메인은 DNA 결합 도메인, 예를 들어 징크 핑거 또는 TAL-이펙터 DNA 결합 도메인 및 뉴클레아제 또는 메가뉴클레아제 DNA 결합 도메인으로부터의 절단 도메인 및 상이한 뉴클레아제로부터의 절단 도메인에 대해 이종일 수 있다. 이종 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 수득될 수 있다. 절단 도메인이 유래될 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제를 포함하나, 이에 제한되지는 않는다 (예를 들어, 문헌 [2002-2003 Catalogue, New England Biolabs, Beverly, MA; 및 Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388] 참조). DNA를 절단하는 부가의 효소가 공지되어 있다 (예를 들어, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 마이크로코쿠스 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한 문헌 [Linn, et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993] 참조). 이들 효소 (또는 그의 기능적 단편) 중 하나 이상은 절단 도메인 및 절단 절반-도메인의 공급원으로 사용될 수 있다.
유사하게, 절단 절반-도메인은 절단 활성을 위해 이량체화를 필요로 하는, 상기에 제시된 바와 같이 임의의 뉴클레아제 또는 그의 일부분으로부터 유래될 수 있다. 일반적으로, 융합 단백질이 절단 절반-도메인을 포함하는 경우에는, 절단을 위해 2개의 융합 단백질이 필요하다. 또 다른 한편으론, 2개의 절단 절반-도메인을 포함하는 단일 단백질이 사용될 수 있다. 2개의 절단 절반-도메인은 동일한 엔도뉴클레아제 (또는 그의 기능적 단편)로부터 유래될 수 있거나, 또는 각각의 절단 절반-도메인은 상이한 엔도뉴클레아제 (또는 그의 기능적 단편)로부터 유래될 수 있다. 또한, 2개의 융합 단백질에 대한 표적 부위는 바람직하게, 서로에 대해 배치되어, 2개의 융합 단백질이 그들 각각의 표적 부위와 결합하면 절단 절반-도메인이 서로 공간적 방향으로 배치되어, 절단 절반-도메인이, 예를 들어, 이량체화에 의해 기능적 절단 도메인을 형성할 수 있도록 한다. 따라서, 특정 실시양태에서, 표적 부위의 가까운 가장자리는 5 내지 10개 뉴클레오티드 또는 15 내지 18개 뉴클레오티드만큼 분리된다. 그러나, 임의의 정수의 뉴클레오티드 또는 뉴클레오티드 쌍은 두 표적 부위 사이에 개입할 수 있다 (예를 들어, 2개 내지 50개 뉴클레오티드 쌍 또는 그 초과). 일반적으로, 절단 부위는 표적 부위 사이에 있다.
제한 엔도뉴클레아제 (제한 효소)는 많은 종에 존재하며 DNA (인식 부위에서)와 서열 특이적으로 결합할 수 있으며, 결합 부위에서 또는 그 근처에서 DNA를 절단할 수 있다. 특정 제한 효소 (예를 들어, 유형 IIS)는 인식 부위로부터 제거된 부위에서 DNA를 절단하고, 분리가능한 결합 및 절단 도메인을 가지고 있다. 예를 들어, 유형 IIS 효소 FokI는 한 가닥에 있는 그의 인식 부위로부터의 9개 뉴클레오티드에서, 및 다른 가닥에 있는 그의 인식 부위로부터의 13개 뉴클레오티드에서 DNA의 이중 가닥 절단을 촉매한다 (예를 들어, 미국 특허 번호 5,356,802; 5,436,150; 및 5,487,994; 뿐만 아니라 문헌 [Li, et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li, et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim, et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim, et al. (1994b) J. Biol. Chem. 269:31,978-31,982] 참조). 따라서, 한 실시양태에서, 융합 단백질은 조작될 수 있거나 조작되지 않을 수 있는, 적어도 하나의 유형 IIS 제한 효소로부터의 절단 도메인 (또는 절단 절반-도메인) 및 하나 이상의 징크 핑거 결합 도메인을 포함한다.
그의 절단 도메인이 결합 도메인으로부터 분리될 수 있는 예시적인 유형 IIS 제한 효소는 FokI이다. 이러한 특별한 효소는 이량체로서 활성이다 (Bitinaite, et al. (1998) Proc. Natl. Acad. Sci. USA 95:10,570-10,575). 따라서, 본 개시내용의 목적을 위해, 개시된 융합 단백질에 사용되는 FokI 효소의 일부분이 절단 절반-도메인으로 간주된다. 따라서, 징크 핑거-FokI 융합물을 사용한 세포 서열의 표적화된 이중 가닥 절단 및/또는 표적화된 대체를 위해, 각각 FokI 절단 절반-도메인을 포함하는 2개의 융합 단백질을 사용하여 촉매적으로 활성인 절단 도메인을 재구성할 수 있다. 또 다른 한편으론, 징크 핑거 결합 도메인 및 2개의 FokI 절단 절반-도메인을 함유하는 단일 폴리펩티드 분자가 또한 사용될 수 있다. 징크 핑거-FokI 융합물을 사용한 표적화된 절단 및 표적화된 서열 변경을 위한 파라미터는 본 개시내용의 다른 곳에서 제공된다.
절단 도메인 또는 절단 절반-도메인은 절단 활성을 보유하거나 또는 기능적 절단 도메인을 형성하기 위해 다량체화 (예를 들어, 이량체화)할 수 있는 능력을 보유하는 단백질의 임의의 부분일 수 있다.
예시적인 유형 IIS 제한 효소는 국제 특허 공개 번호 WO 07/014275 (그 전체 내용이 본원에 참조로 포함됨)에 기재되어 있다. 부가의 제한 효소는 또한 분리가능한 결합 및 절단 도메인을 함유하고, 이들은 본 개시내용에 의해 고려된다 (예를 들어, 문헌 [Roberts, et al. (2003) Nucleic Acids Res. 31:418-420] 참조).
특정 실시양태에서, 절단 도메인은 FokI 절단 도메인이다. 완전한 길이의 FokI 서열은 하기에 제시된다. 절단 도메인은 이탤릭체와 밑줄로 표시되어 있으며 (완전한 길이의 단백질의 위치 384 내지 579), 여기서 홀로(holo) 단백질 서열이 하기에 기재되어 있다 (서열식별번호: 5):
FokI로부터 유래된 절단 절반 도메인은 서열식별번호: 5에 제시된 바와 같은 아미노산 잔기 중 하나 이상에서의 돌연변이를 포함할 수 있다. 돌연변이는 (상이한 잔기에 대한 야생형 아미노산 잔기의) 치환, (하나 이상의 아미노산 잔기의) 삽입 및/또는 (하나 이상의 아미노산 잔기의) 결실을 포함한다. 특정 실시양태에서, 잔기 414-426, 443-450, 467-488, 501-502, 및/또는 521-531 (서열식별번호: 5를 기준으로 하여 넘버링됨) 중 하나 이상이 돌연변이되는데, 이는 이들 잔기가 문헌 [Miller, et al. (2007) Nat Biotechnol 25:778-784]에 기재된 그의 표적 부위와 결합된 ZFN의 분자 모델에서 DNA 백본에 가깝게 위치하기 때문이다. 특정 실시양태에서, 위치 416, 422, 447, 448, 및/또는 525에서의 하나 이상의 잔기가 돌연변이된다. 특정 실시양태에서, 돌연변이는 야생형 잔기를 임의의 상이한 잔기, 예를 들어 알라닌 (A) 잔기, 시스테인 (C) 잔기, 아스파르트산 (D) 잔기, 글루탐산 (E) 잔기, 히스티딘 (H) 잔기, 페닐알라닌 (F) 잔기, 글리신 (G) 잔기, 아스파라긴 (N) 잔기, 세린 (S) 잔기 또는 트레오닌 (T) 잔기로 치환하는 것을 포함한다. 다른 실시양태에서, 위치 416, 418, 422, 446, 448, 476, 479, 480, 481, 및/또는 525 중의 하나 이상에서의 야생형 잔기가 임의의 다른 잔기로 대체되며, 이는 R416D, R416E, S418E, S418D, R422H, S446D, K448A, N476D, I479Q, I479T, G480D, Q481A, Q481E, K525S, K525A, N527D, R416E+R422H, R416D+R422H, R416E+K448A, R416D+R422H, K448A+I479Q, K448A+Q481A. K448A+K525A를 포함하나 이에 제한되지는 않는다.
특정 실시양태에서, 절단 도메인은, 예를 들어, 미국 특허 번호 7,914,796; 8,034,598; 및 8,623,618; 및 미국 특허 공개 번호 2011/0201055 (이들 모두의 개시내용은 그 전체 내용이 본원에 참조로 포함된다)에 기재된 바와 같이, 동종이량체화를 최소화하거나 또는 방지하는 하나 이상의 조작된 절단 절반-도메인 (이량체화 도메인 돌연변이체로서 지칭되기도 함)을 포함한다. FokI의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, 및 538 (서열식별번호: 5를 기준으로 하여 넘버링됨)에서의 아미노산 잔기는 FokI 절단 절반-도메인의 이량체화에 영향을 미치는 모든 표적이다. 돌연변이는 FokI에 상동인 자연 제한 효소에서 발견되는 잔기에 대한 돌연변이를 포함할 수 있다. 바람직한 실시양태에서, 위치 416, 422, 447, 448 및/또는 525 (서열식별번호: 5를 기준으로 하여 넘버링됨)에서의 돌연변이는 양으로 하전된 아미노산을 비하전되거나 또는 음으로 하전된 아미노산으로 대체하는 것을 포함한다. 또 다른 실시양태에서, 조작된 절단 절반 도메인은 하나 이상의 아미노산 잔기 416, 422, 447, 448, 또는 525에서의 돌연변이 이외에, 아미노산 잔기 499, 496 및 486에서의 돌연변이를 포함한다 (모두 서열식별번호: 5를 기준으로 하여 넘버링됨).
임의의 닉카제 도메인이 본원에 기재된 DNA 편집 복합체에 사용될 수 있다. 닉카제는 뉴클레아제가 완전한 이중 가닥 파손을 만들 수 없도록 하지만, 대신 이중 가닥 DNA의 "닉킹"인 부분 절단을 발생시키는 촉매 도메인에서의 돌연변이를 포함한다. 표적을 닉킹하기 위해 2개 이상의 절단 도메인이 필요한 실시양태에서, 전형적으로 절단 도메인 (예를 들어, 절단 절반-도메인) 중 적어도 하나는 그의 촉매 도메인에 대한 하나 이상의 돌연변이를 포함하며, 이는 뉴클레아제를 불활성으로 만든다 (예를 들어, 촉매적으로 불활성인 절반 도메인). 닉카제를 생산하기 위한 촉매적으로 불활성인 절단 도메인은 돌연변이된 FokI 및/또는 dCas 단백질을 포함하나 이에 제한되지는 않는다 (예를 들어, 미국 특허 번호 9,522,936; 9,631,186; 9,200,266; 및 8,703,489 및 문헌 [Guillinger, et al. (2014) Nature Biotech. 32(6):577-582; Cho, et al. (2014) Genome Res. 24(1):132-141] 참조). 이들 촉매적으로 불활성인 절단 도메인은 촉매적으로 활성인 도메인과 조합하여 닉카제로서 작용하여, 단일 가닥 절단을 만들 수 있다. 부가의 닉카제가 또한 관련 기술분야, 예를 들어, 문헌 [McCaffery, et al. (2016) Nucleic Acids Res. 44(2):e11. doi:10.1093/nar/gkv878. Epub 2015 Oct 19]에 공지되어 있다.
특정 실시양태에서, 닉카제는 촉매적으로 불활성인 FokI 절단 도메인을 포함하는 뉴클레아제 닉카제, 예를 들어 징크 핑거 뉴클레아제 (ZFN) 닉카제 또는 TAL-이펙터 도메인 (TALEN) 닉카제를 포함한다. FokI의 촉매 도메인에서 돌연변이될 수 있는 아미노산의 비-제한적인 예는 아미노산 잔기 450, 467 및/또는 469 (야생형을 기준으로 하여 결정된 바와 같음)를 포함한다. 특정 실시양태에서, 하나 이상의 점 돌연변이는 절단 절반-도메인의 촉매 활성을 불활성화하기 위해 절대적인 이종 이량체의 한 구성원의 촉매 도메인에서 만들어진다. 예를 들어, 위치 450은 D에서 N으로 돌연변이될 수 있고, 위치 467은 D에서 A로 돌연변이될 수 있으며; 위치 469는 K에서 A로 돌연변이될 수 있다. 다른 아미노산은 이들 또는 다른 위치에서 치환될 수 있다 (예를 들어, 미국 특허 번호 9,522,936; 9,631,186; 8,703,489 및 9,200,266 및 문헌 [Guillinger, et al. (2014) Nature Biotech. 32(6):577-582; Cho, et al. (2014) Genome Res. 24(1):132-141] 참조). 촉매적으로 불활성인 절단 도메인은 촉매적으로 활성인 도메인과 조합하여 닉카제로서 작용하여, 단일 가닥 절단을 만들 수 있다. 부가의 닉카제가 또한 관련 기술분야, 예를 들어, 문헌 [McCaffery, et al. (2016) Nucleic Acids Res. 44(2):e11. doi:10.1093/nar/gkv878. Epub 2015 Oct 19]에 공지되어 있다. 임의의 뉴클레아제 (예를 들어, ZFN 또는 TALEN 또는 CRISPR/Cas 뉴클레아제)는 이중 가닥 절단을 만드는 뉴클레아제 내의 절단 도메인 대신 단일 가닥 절단을 만드는 절단 도메인을 사용함으로써 닉카제가 될 수 있다.
FokI 도메인은 또한 하나 이상의 부가의 돌연변이를 포함할 수 있다. 특정 실시양태에서, 본원에 기재된 조성물은, 예를 들어, 미국 특허 번호 7,914,796; 8,034,598; 8,961,281; 및 8,623,618; 미국 특허 공개 번호 2008/0131962 및 2012/0040398에 기재된 바와 같은 절대적인 이종 이량체를 형성하는 FokI의 조작된 절단 절반-도메인을 포함한다. 따라서, 한 바람직한 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 위치 416, 422, 447, 448, 또는 525 (서열식별번호: 5를 기준으로 하여 넘버링됨)에서의 하나 이상의 돌연변이 이외에, 위치 486에서의 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서의 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되고, 위치 496에서의 야생형 Asn (N) 잔기가 Asp (D) 또는 Glu (E) 잔기로 대체되는 ("ELD"또는 "ELE") 폴리펩티드를 포함한다. 또 다른 실시양태에서, 조작된 절단 절반 도메인은 야생형 FokI 절단 절반 도메인으로부터 유래되고, 아미노산 잔기 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 야생형 FokI (서열식별번호: 5)를 기준으로 하여 넘버링된 아미노산 잔기 490, 538 및 537에서의 돌연변이를 포함한다. 바람직한 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 위치 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 위치 490에서의 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서의 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되며, 위치 537에서의 야생형 His (H) 잔기가 Lys (K) 잔기 또는 Arg (R) 잔기로 대체되는 ("KKK" 또는 "KKR") 폴리펩티드를 포함한다 (본원에 참조로 포함되는 U.S. 8,962,281 참조) (예를 들어, 미국 특허 번호 7,914,796; 8,034,598; 및 8,623,618 참조; 그의 개시내용은 모든 목적을 위해 그 전체 내용이 참조로 포함된다). 다른 실시양태에서, 조작된 절단 절반 도메인은 "샤키(Sharkey)" 및/또는 "샤키 돌연변이"를 포함한다 (문헌 [Guo, et al. (2010) J. Mol. Biol. 400(1):96-107] 참조).
다른 실시양태에서, 본원에 기재된 바와 같은 닉카제는 야생형 FokI 절단 절반 도메인으로부터 유래된 조작된 절단 절반 도메인을 포함하고, 아미노산 잔기 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 야생형 FokI 또는 FokI 동족체를 기준으로 하여 넘버링된 아미노산 잔기 490, 및 538에서의 돌연변이를 포함한다. 바람직한 실시양태에서, 본 발명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 위치 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 위치 490에서의 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고, 위치 538에서의 야생형 Ile (I) 잔기가 Lys (K) 잔기로 대체되는 ("KK") 폴리펩티드를 포함한다. 다른 바람직한 실시양태에서, 본 설명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 위치 416, 422, 447, 448, 또는 525에서의 하나 이상의 돌연변이 이외에, 위치 486에서의 야생형 Gln (Q) 잔기가 Glu (E) 잔기로 대체되고, 위치 499에서의 야생형 Ile (I) 잔기가 Leu (L) 잔기로 대체되는 ("EL") 폴리펩티드를 포함한다 (본원에 참조로 포함되는 미국 특허 번호 8,034,598 참조).
일부 측면에서, 본 설명은 융합 단백질을 제공하며, 여기서 조작된 절단 절반-도메인은 FokI 촉매 도메인 내의 위치 387, 393, 394, 398, 400, 402, 416, 422, 427, 434, 439, 441, 447, 448, 469, 487, 495, 497, 506, 516, 525, 529, 534, 559, 569, 570, 571 중 하나 이상에서의 야생형 아미노산 잔기가 돌연변이되는 폴리펩티드를 포함한다. 일부 실시양태에서, 하나 이상의 돌연변이는 야생형 아미노산을 양으로 하전된 잔기에서 중성 잔기 또는 음으로 하전된 잔기로 변경시킨다. 이들 실시양태 중 임의의 것에서, 기재된 돌연변이체는 또한, 하나 이상의 부가의 돌연변이를 포함하는 FokI 도메인에서 만들어질 수 있다. 바람직한 실시양태에서, 이들 부가의 돌연변이는 이량체화 도메인 내에, 예를 들어 위치 418, 432, 441, 481, 483, 486, 487, 490, 496, 499, 523, 527, 537, 538 및/또는 559에 있다. 돌연변이의 비-제한적인 예는 위치 393, 394, 398, 416, 421, 422, 442, 444, 472, 473, 478, 480, 525 또는 530에서의 임의의 절단 도메인 (예를 들어, FokI 또는 FokI의 동족체)의 야생형 잔기를 임의의 아미노산 잔기로 돌연변이 (예를 들어, 치환)시킨 것 (예를 들어, K393X, K394X, R398X, R416S, D421X, R422X, K444X, S472X, G473X, S472, P478X, G480X, K525X, 및 A530X, 여기서 제1 잔기는 야생형을 나타내고, X는 야생형 잔기를 대체하는 임의의 아미노산을 지칭한다)을 포함한다. 일부 실시양태에서, X는 E, D, H, A, K, S, T, D 또는 N이다. 다른 예시적인 돌연변이는 S418E, S418D, S446D, K448A, I479Q, I479T, Q481A, Q481N, Q481E, A530E 및/또는 A530K를 포함하며, 여기서 아미노산 잔기는 완전한 길이의 FokI 야생형 절단 도메인 및 그의 동족체를 기준으로 하여 넘버링된다. 특정 실시양태에서, 조합은 416과 422, 위치 416에서의 돌연변이와 K448A, K448A와 I479Q, K448A와 Q481A 및/또는 K448A와 위치 525에서의 돌연변이를 포함할 수 있다. 한 실시양태에서, 위치 416에서의 야생형 잔기는 Glu (E) 잔기로 대체될 수 있고 (R416E), 위치 422에서의 야생형 잔기는 His (H) 잔기로 대체되며 (R422H), 위치 525에서의 야생형 잔기는 Ala (A) 잔기로 대체된다. 본원에 기재된 바와 같은 절단 도메인은 위치 432, 441, 483, 486, 487, 490, 496, 499, 527, 537, 538 및/또는 559에서, 예를 들어 이량체화 도메인 돌연변이체 (예를 들어, ELD, KKR) 및/또는 닉카제 돌연변이체 (촉매 도메인에 대한 돌연변이)를 포함하나 이에 제한되지는 않는 부가의 돌연변이를 추가로 포함할 수 있다. 본원에 기재된 돌연변이를 갖는 절단 절반-도메인은 관련 기술분야에 공지된 바와 같은 이종 이량체를 형성한다.
뉴클레아제는 소위 "분할 효소" 기술을 사용하여 핵산 표적 부위에서 생체 내 어셈블리될 수 있다 (예를 들어, 미국 특허 공개 번호 2009/0068164 참조). 이러한 분할 효소의 성분은 별도의 발현 구축물 상에서 발현될 수 있거나, 또는 예를 들어, 자기 절단 2A 펩티드 또는 IRES 서열에 의해 개별 성분이 분리되는 하나의 오픈 리딩 프레임에서 연결될 수 있다. 성분은 개별 징크 핑거 결합 도메인 또는 메가뉴클레아제 핵산 결합 도메인의 도메인일 수 있다.
뉴클레아제 (예를 들어, ZFN 및/또는 TALEN)는, 예를 들어 미국 특허 번호 8,563,314에 기재된 바와 같이 효모 기반 염색체 시스템에서 사용 전에 활성에 대해 스크리닝될 수 있다.
ZFN 또는 TALEN 닉카제 이외에 또는 그 대신, DNA 편집 복합체는 CRISPR/Cas 닉카제를 포함할 수 있다. CRISPR/Cas 닉카제의 비-제한적인 예가 미국 특허 번호 9,840,713; 9,770,489; 9,567,604; 8,932,814; 8,889,356; 8,697,359; 8,771,945; 8,795,965; 8,865,406; 8,871,445; 8,889,356; 8,895,308; 8.906,616; 8,932,814; 8,945,839; 8,945,839; 8,999,641; 10,000,772 등에 기재되어 있다.
상기 시스템의 RNA 성분을 코딩하는 CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부) 유전자좌와, 단백질을 코딩하는 Cas (CRISPR 관련) 유전자좌 (문헌 [Jansen, et al. (2002) Mol. Microbiol. 43:1565-1575; Makarova, et al. (2002) Nucleic Acids Res. 30:482-496; Makarova, et al. (2006) Biol. Direct 1:7; Haft, et al. (2005) PLoS Comput. Biol. 1:e60])가 CRISPR/Cas 뉴클레아제 시스템의 유전자 서열을 구성한다. 미생물 숙주에서 CRISPR 유전자좌는 CRISPR 매개 핵산 절단의 특이성을 프로그래밍할 수 있는 비-코딩 RNA 요소뿐만 아니라 CRISPR 관련 (Cas) 유전자의 조합을 함유한다.
유형 II CRISPR은 가장 널리 특징 규명된 시스템 중 하나이며 4가지 순차적 단계로 표적화된 DNA 이중 가닥 파손을 수행한다. 첫째, 2개의 비-코딩 RNA인 프리-crRNA 어레이와 tracrRNA가 CRISPR 유전자좌로부터 전사된다. 둘째, tracrRNA는 프리-crRNA의 반복 영역과 혼성화하고, 프리-crRNA를 개별 스페이서 서열을 함유하는 성숙한 crRNA로 프로세싱하는 것을 매개한다. 셋째, 성숙한 crRNA:tracrRNA 복합체는 표적 인식에 대한 부가의 요구 사항인, crRNA 상의 스페이서와 프로토스페이서 인접 모티프 (PAM) 옆에 있는 표적 DNA 상의 프로토스페이서 간의 왓슨 크릭 염기쌍 형성을 통해 Cas9를 표적 DNA로 유도한다. 마지막으로, Cas9는 표적 DNA의 절단을 매개하여 프로토스페이서 내에서 이중 가닥 파손을 생성한다. CRISPR/Cas 시스템의 활성은 하기 3가지 단계를 포함한다: (i) '적응'이라는 프로세스에서 향후 공격을 방지하기 위해 외래 DNA 서열을 CRISPR 어레이에 삽입하는 단계, (ii) 관련 단백질의 발현뿐만 아니라 어레이의 발현 및 프로세싱 단계에 이어 (iii) 외래 핵산에 대한 RNA 매개 간섭 단계. 따라서, 박테리아 세포에서는, 소위 'Cas' 단백질 중 몇 가지가 CRISPR/Cas 시스템의 자연적 기능과 관련되어 있으며 기능, 예컨대 외래 DNA의 삽입 등에서 역할을 한다.
초기에는, Cas가 가이드 RNA의 리보스-인산염 백본과 광범위하게 접촉하여, 초기 DNA 질문에 필요한 10-nt RNA 시드 서열을 미리 배열한다. 미리 배열된 시드 서열 이외에, 5'-NGG-3' PAM 인식을 담당하고 가이드가 결여된 apo 구조에서 무질서한 Cas 단백질 R1333 및 R1335의 PAM 상호작용 부위는 표적 DNA와의 접촉 전에 사전 배치되며, 이는 sgRNA 부하를 통해 Cas가 DNA 인식 적격 구조를 형성할 수 있다는 것을 나타낸다. 일단 Cas가 그의 가이드 RNA와 결합하면, 복합체는 상보적인 표적 DNA 부위를 검색할 준비가 된다. 표적 검색 및 인식에는 표적 DNA 내의 20-nt 스페이서 서열과 프로토스페이서 간의 상보적 염기쌍 형성뿐만 아니라 표적 부위에 인접한 보존된 PAM 서열의 존재 모두가 필요하다. PAM 서열은 자기 서열과 비-자기 서열 간을 구별하는 데 중요하다. 단일 분자 실험은 잠재적인 가이드 RNA 상보성을 위해 플랭킹 DNA를 조사하기 전에 적당한 PAM 서열을 프로빙함으로써 Cas가 표적 DNA 검색 프로세스를 시작한다는 것을 입증해 주었다. 표적 인식은 적절한 PAM 서열을 함유하지 않는 DNA로부터 Cas가 신속하게 해리되는 3차원 충돌을 통해 발생하며, 체류 시간은 적당한 PAM이 존재할 때 가이드 RNA와 인접 DNA 간의 상보성에 따라 달라진다. 일단 Cas가 적절한 PAM이 있는 표적 부위를 찾으면, 이는 PAM 인접 핵 형성 부위에서 국소 DNA 용융을 촉발시킨 다음, RNA 가닥 침입을 촉발시켜 RNA-DNA 혼성체 및 PAM 근위 말단에서 PAM 원위 말단으로 변위된 DNA 가닥 (R-루프라고 함)을 형성한다. PAM 이중 나선은 보존된 HNH를 함유하는 뉴클레아제 (NUC) 로브인 알파 나선 인식 (REC) 로브와 분할 RuvC 뉴클레아제 도메인 사이의 양으로 하전된 홈에 자리 잡고 있으며, PAM 함유 비-표적 가닥은 주로 C-말단 도메인 (CTD)에 있다. N으로 표시되는 PAM 서열 내의 제1 염기는 그의 대응물과 염기쌍을 유지하지만 Cas와 상호작용하지 않는다. 보존된 PAM GG 디뉴클레오티드는 CTD의 β-헤어핀에 위치하는 2개의 아르기닌 잔기 (R1333 및 R1335)와 염기 특이적 수소 결합 상호작용에 의해 주요 홈에서 직접 판독된다. GG 디뉴클레오티드와의 염기 특이적 접촉 이외에, Cas의 CTD는 PAM 함유 비-표적 DNA 가닥의 데옥시리보스-인산염 백본과 수많은 수소 결합 상호작용을 한다. 그러나, Cas와 PAM에 상보적인 표적 가닥 뉴클레오티드 간에는 직접적인 접촉이 관찰되지 않았다 (Jiang and Doudna (2017) Annual Review of Biophysics 46:505-529). 일부 실시양태에서, 본 발명의 방법 및 조성물에 개시된 Cas는 PAM과 무관하다. 일부 실시양태에서, 상기 개시된 바와 같은 위치 R1333 및 R1335는 PAM 인식을 변경시키는 돌연변이를 포함한다 (Anders, et al. (2014) Nature 513(7519):569-573).
일부 실시양태에서, CRISPR-Cpf1 시스템이 사용된다. 프란시셀라 종( Francisella spp.)에서 확인된 CRISPR-Cpf1 시스템은 인간 세포에서 강력한 DNA 간섭을 매개하는 클래스 2 CRISPR-Cas 시스템이다. 기능적으로 보존되어 있지만, Cpf1 및 Cas9는 가이드 RNA 및 기질 특이성을 포함한 많은 측면에서 상이하다 (문헌 [Fagerlund, et al. (2015) Genom Bio 16:251] 참조). Cas9와 Cpf1 단백질 간의 주요 차이점은 Cpf1은 tracrRNA를 활용하지 않으므로 crRNA만 필요하다는 것이다. FnCpf1 crRNA는 42-44개 뉴클레오티드 길이 (19개 뉴클레오티드 반복부 및 23-25개 뉴클레오티드 스페이서)이며, 2차 구조를 유지하는 서열 변화를 허용하는 단일 스템-루프를 함유한다. 또한, Cpf1 crRNA는 Cas9에 의해 요구되는 약 100개 뉴클레오티드 조작된 sgRNA보다 상당히 더 짧으며, FnCpfl에 대한 PAM 요구 사항은 변위된 가닥에 있는 5'-TTN-3' 및 5'-CTA-3'이다. Cas9와 Cpf1 둘 다가 표적 DNA에서 이중 가닥 파손을 만들긴 하지만, Cas9는 그의 RuvC 유사 및 HNH 유사 도메인을 사용하여 가이드 RNA의 시드 서열 내에서 평활 말단 절단을 만드는 반면, Cpf1은 RuvC 유사 도메인을 사용하여 시드의 외부에 엇갈린 절단을 생산한다. Cpf1은 중요한 시드 영역으로부터 멀리 떨어져 엇갈린 절단을 하기 때문에, NHEJ는 표적 부위를 방해하지 않을 것이므로, 원하는 HDR 재결합 이벤트가 발생할 때까지 Cpf1이 동일한 부위를 계속 절단할 수 있다. 따라서, 본원에 기재된 방법 및 조성물에서, 용어 "Cas"는 Cas9 단백질과 Cfp1 단백질 둘 다를 포함하는 것으로 이해된다. 따라서, 본원에 사용된 바와 같은, "CRISPR/Cas 시스템"은 뉴클레아제, 닉카제 및/또는 전사 인자 시스템을 모두 포함한, CRISPR/Cas 및/또는 CRISPR/Cfp1 시스템 둘 다를 지칭한다.
일부 실시양태에서, 다른 Cas 단백질이 사용될 수 있다. 일부 예시적인 Cas 단백질은 Cas9, Cpf1 (Cas12a로서 공지되기도 함), C2c1, C2c2 (Cas13a로서 공지되기도 함), C2c3, Cas1, Cas2, Cas4, CasX 및 CasY를 포함하고; 그의 조작된 및 자연 변이체 (문헌 [Burstein, et al. (2017) Nature 542:237-241]), 예를 들어 HF1/spCas9 (문헌 [Kleinstiver, et al. (2016) Nature 529:490-495; Cebrian-Serrano and Davies (2017) Mamm Genome 28(7):247-261]); 분할 Cas9 시스템 (문헌 [Zetsche, et al. (2015) Nat Biotechnol 33(2):139-142]), 인테인-익스테인 시스템을 기반으로 하는 트랜스 스플라이스된 Cas9 (문헌 [Troung, et al. (2015) Nucl Acid Res 43(13):6450-8]); 미니-SaCas9 (문헌 [Ma, et al. (2018) ACS Synth Biol 7(4):978-985])를 포함한다. 따라서, 본원에 기재된 방법 및 조성물에서, 용어 "Cas"는 자연 및 조작된 모든 Cas 변이체 단백질을 포함하는 것으로 이해된다. 따라서, 본원에서 사용된 바와 같은, "CRISPR/Cas 시스템"은 뉴클레아제, 닉카제 및/또는 전사 인자 시스템 모두를 포함한 임의의 CRISPR/Cas 시스템을 지칭한다.
특정 실시양태에서, Cas 단백질은 자연적으로 발생하는 Cas 단백질의 "기능적 유도체"일 수 있다. 천연 서열 폴리펩티드의 "기능적 유도체"는 천연 서열 폴리펩티드와 공통되는 정성적 생물학적 특성을 갖는 화합물이다. "기능적 유도체"는 천연 서열의 단편 및 천연 서열 폴리펩티드 및 그의 단편의 유도체를 포함하나, 이에 제한되지는 않으며, 단 이들은 상응하는 천연 서열 폴리펩티드와 공통적인 생물학적 활성을 갖는다. 본원에서 고려되는 생물학적 활성은 DNA 기질을 단편으로 가수 분해할 수 있는 기능적 유도체의 능력이다. 용어 "유도체"는 폴리펩티드의 아미노산 서열 변이체, 공유 변형물 및 그의 융합물, 예컨대 유도체 Cas 단백질을 모두 포괄한다. Cas 폴리펩티드 또는 그의 단편의 적합한 유도체는 Cas 단백질 또는 그의 단편의 돌연변이체, 융합물, 공유 변형물을 포함하나 이에 제한되지는 않는다. Cas 단백질 또는 그의 단편을 포함하는 Cas 단백질뿐만 아니라 Cas 단백질 또는 그의 단편의 유도체는 세포로부터 수득될 수 있거나 또는 화학적으로 합성될 수 있거나 또는 이들 두 절차의 조합에 의해 합성될 수 있다. 세포는 Cas 단백질을 자연적으로 생산하는 세포이거나, 또는 Cas 단백질을 자연적으로 생산하고 더 높은 발현 수준에서 내인성 Cas 단백질을 생산하도록 유전자 조작되거나 또는 외인성으로 도입된 핵산으로부터 Cas 단백질을 생산하도록 유전자 조작되는 세포일 수 있으며, 상기 핵산은 내인성 Cas와 동일하거나 상이한 Cas를 코딩한다. 일부 경우에는, 세포가 Cas 단백질을 자연적으로 생산하지 않고 Cas 단백질을 생산하도록 유전자 조작된다. 일부 실시양태에서, Cas 단백질은 AAV 벡터를 통한 전달을 위한 작은 Cas9 오르소로그이다 (Ran, et al. (2015) Nature 510:186).
전달
본원에 기재된 DNA 편집 복합체 (또는 그의 성분 분자)는, 예를 들어 단백질 및/또는 mRNA 성분의 주입에 의한 것을 포함한 임의의 적합한 수단에 의해 표적 세포로 전달될 수 있다. 전달은 단리된 세포 (이는 결국, 생체 외 세포 요법을 위해 살아있는 대상체에게 투여될 수 있다) 또는 임의의 적합한 수단을 통해 살아있는 대상체에게 이루어질 수 있다. 유전자 편집 분자를 세포 및 대상체에게 전달하는 것은 관련 기술분야에 공지되어 있다.
적합한 세포는 진핵 및 원핵 세포 및/또는 세포주를 포함하나 이에 제한되지는 않는다. 이러한 세포 또는 이러한 세포로부터 생성된 세포주의 비-제한적인 예는 T-세포, COS, CHO (예를 들어, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예를 들어, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포뿐만 아니라 곤충 세포, 예컨대 스포도프테라 푸기페르다(Spodoptera fugiperda) (Sf), 또는 진균 세포, 예컨대 사카로마이세스(Saccharomyces), 피치아(Pichia) 및 쉬조사카로마이세스(Schizosaccharomyces)를 포함한다. 특정 실시양태에서, 세포주는 CHO-K1, MDCK 또는 HEK293 세포주이다. 적합한 세포는 또한, 줄기 세포, 예컨대 예로서, 배아 줄기 세포, 유도 다능성 줄기 세포 (iPS 세포), 조혈 줄기 세포, 신경 줄기 세포 및 중간엽 줄기 세포를 포함한다.
본원에 기재된 바와 같은 단백질 전달 방법은, 예를 들어, 미국 특허 번호 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824 (이들 모두의 개시내용은 그 전체 내용이 본원에 참조로 포함된다)에 기재되어 있다.
본원에 기재된 바와 같은 DNA 편집 복합체는 또한 하나 이상의 성분 (예를 들어, 융합 분자)을 코딩하는 서열을 함유하는 벡터를 사용하여 전달될 수 있다. 부가적으로, 부가의 핵산 (예를 들어, 공여자)이 또한 이러한 벡터를 통해 전달될 수 있다. 플라스미드 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 폭스바이러스 벡터; 헤르페스바이러스 벡터 및 아데노 관련 바이러스 벡터 등을 포함하나 이에 제한되지는 않는 임의의 벡터 시스템이 사용될 수 있다 (또한 미국 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824 참조) (그 전체 내용이 본원에 참조로 포함된다). 더욱이, 이들 벡터 중 임의의 것이 하나 이상의 DNA 결합 단백질 코딩 서열 및/또는 부가의 핵산을 적절하게 포함할 수 있다는 것이 명백할 것이다. 따라서, 본원에 기재된 바와 같은 하나 이상의 DNA 결합 단백질이 세포 및 적절하게 부가의 DNA에 도입될 때, 이들은 동일한 벡터 또는 상이한 벡터 상에서 운반될 수 있다. 다수의 벡터가 사용되는 경우, 각각의 벡터는 원하는 대로 하나 또는 다수의 DNA 결합 단백질을 코딩하는 서열 및 부가의 핵산을 포함할 수 있다. 통상적인 바이러스 및 비-바이러스 기반 유전자 전달 방법은 세포 (예를 들어, 포유 동물 세포) 및 표적 조직에서 조작된 DNA 결합 단백질을 코딩하는 핵산을 도입하고 원하는 대로 부가의 뉴클레오티드 서열을 공동 도입하기 위해 사용될 수 있다. 이러한 방법은 또한 핵산 (예를 들어, DNA 결합 단백질 및/또는 공여자를 코딩함)을 시험관 내 세포에 투여하기 위해 사용될 수 있다. 특정 실시양태에서, 핵산은 생체 내 또는 생체 외 유전자 요법 용도를 위해 투여된다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, 있는 그대로의 핵산, 및 전달 비히클, 예컨대 리포솜 또는 폴록사머와 복합체 형성된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하며, 이러한 바이러스는 세포로 전달된 후 에피솜 또는 통합된 게놈을 가지고 있다. 유전자 요법 절차의 검토를 위해, 문헌 [Anderson (1992) Science 256:808-813; Nabel & Felgner (1993) TIBTECH 11:211-217; Mitani & Caskey (1993) TIBTECH 11:162-166; Dillon (1993) TIBTECH 11:167-175; Miller (1992) Nature 357:455-460; Van Brunt (1988) Biotechnology 6(10):1149-1154; Vigne (1995) Restorative Neurology and Neuroscience 8:35-36; Kremer & Perricaudet (1995) British Medical Bulletin 51(1):31-44; Haddada, et al., in Current Topics in Microbiology and Immunology Doerfler and Boehm (eds.) (1995); 및 Yu, et al. (1994) Gene Therapy 1:13-26]을 참조한다.
핵산의 비-바이러스 전달 방법은 전기천공, 리포펙션, 미세 주입, 바이오리 스틱스, 비로좀, 리포좀, 면역 리포좀, 폴리양이온 또는 지질:핵산 접합체, 있는 그대로의 DNA, mRNA, 인공 비리온 및 DNA의 작용제 증강 흡수를 포함한다. 예를 들어, 소니트론(Sonitron) 2000 시스템 [리치-마르(Rich-Mar)]을 사용한 소노포레이션이 또한 핵산의 전달에 사용될 수 있다. 바람직한 실시양태에서, 하나 이상의 핵산이 mRNA로서 전달된다. 번역 효율성 및/또는 mRNA 안정성을 증가시키기 위해 캡핑된 mRNA를 사용하는 것이 또한 바람직하다. 특히 바람직한 것은 ARCA (항-역전 캡 유사체) 캡 또는 그의 변이체이다 (본원에 참조로 포함된 미국 특허 번호 7,074,596 및 8,153,773 참조).
부가의 예시적인 핵산 전달 시스템은 아맥사 바이오시스템즈 (Amaxa Biosystems; 독일 쾰른), 맥스사이트, 인크. (Maxcyte, Inc.; 미국 메릴랜드주 록빌), BTX 분자 전달 시스템 (BTX Molecular Delivery Systems; 미국 매사추세츠주 홀리스턴) 및 코페르니쿠스 테라퓨틱스 인크.(Copernicus Therapeutics Inc.)에 의해 제공된 것을 포함한다 (예를 들어 미국 특허 번호 6,008,336 참조). 리포펙션은, 예를 들어, 미국 특허 번호 5,049,386; 4,946,787; 및 4,897,355에 기재되어 있고, 리포펙션 시약은 상업적으로 판매된다 [예를 들어, 트랜스펙탐(Transfectam™), 리포펙틴(Lipofectin™), 및 리포펙타민(Lipofectamine™) RNAiMAX]. 폴리뉴클레오티드의 효율적인 수용체 인식 리포펙션에 적합한 양이온성 및 중성 지질은 펠그너(Felgner), 국제 특허 공개 번호 WO 91/17424 및 WO 91/16024의 것을 포함한다. 전달은 세포 (생체 외 투여) 또는 표적 조직 (생체 내 투여)에 대한 것일 수 있다.
표적화된 리포좀을 포함한 지질:핵산 복합체, 예컨대 면역 지질 복합체의 제조는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 문헌 [Crystal (1995) Science 270:404-410; Blaese, et al. (1995) Cancer Gene Ther. 2:291-297; Behr, et al. (1994) Bioconjugate Chem. 5:382-389; Remy, et al. (1994) Bioconjugate Chem. 5:647-654; Gao, et al. (1995) Gene Therapy 2:710-722; Ahmad, et al. (1992) Cancer Res. 52:4817-4820]; 미국 특허 번호 4,186,183; 4,217,344; 4,235,871; 4,261,975; 4,485,054; 4,501,728; 4,774,085; 4,837,028; 및 4,946,787 참조).
부가의 전달 방법은 엔제네익(EnGeneIC) 전달 비히클 (EDV)에 전달될 핵산을 패키징하는 것의 사용을 포함한다. 이들 EDV는 항체의 하나의 아암(arm)이 표적 조직에 대한 특이성을 가지며 다른 아암이 EDV에 대한 특이성을 갖는 이중 특이적 항체를 사용하여 표적 조직에 특이적으로 전달된다. 항체는 EDV를 표적 세포 표면으로 가져오고, 이어서 EDV는 세포내 이입에 의해 세포로 이동된다. 일단 세포에 들어가면, 그 내용물이 방출된다 (문헌 [MacDiarmid, et al. (2009) Nature Biotechnology 27(7):643] 참조).
원하는 대로 조작된 DNA 결합 단백질 및/또는 공여자 (예를 들어 CAR 또는 ACTR)를 코딩하는 핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 신체의 특이적 세포로 표적화하고 바이러스 페이로드를 핵으로 트래피킹하는 데에 고도로 진화된 프로세스를 활용한다. 바이러스 벡터는 환자에게 직접 투여될 수 있거나 (생체 내) 또는 세포를 시험관 내에서 처리하는 데 사용될 수 있으며 변형된 세포는 환자에게 투여된다 (생체 외). 핵산의 전달을 위한 통상적인 바이러스 기반 시스템은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노 관련, 백시니아 및 단순 포진 바이러스 벡터를 포함하나 이에 제한되지는 않는다. 숙주 게놈에서의 통합은 레트로바이러스, 렌티바이러스 및 아데노 관련 바이러스 유전자 전달 방법으로 가능하며, 종종 삽입된 트랜스진의 장기간 발현을 발생시킨다. 부가적으로, 많은 상이한 세포 유형 및 표적 조직에서 높은 형질도입 효율이 관찰되었다.
레트로바이러스의 지향성은 외래 외피 단백질을 혼입함으로써 변경될 수 있으며, 표적 세포의 잠재적 표적 집단을 확장할 수 있다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 감염시킬 수 있고 전형적으로 높은 바이러스 역가를 생산할 수 있는 레트로바이러스 벡터이다. 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 다르다. 레트로바이러스 벡터는 6 내지 10 kb 이하의 외래 서열에 대한 패키징 용량을 가진 시스-작용성 긴 말단 반복부로 구성된다. 최소 시스-작용성 LTR은 벡터의 복제 및 패키징에 충분하며, 이는 치료 유전자를 표적 세포에 통합하여 영구적인 트랜스진 발현을 제공하는 데 사용된다. 광범위하게 사용되는 레트로바이러스 벡터는 뮤린 백혈병 바이러스 (MuLV), 긴팔 원숭이 백혈병 바이러스 (GaLV), 유인원 면역 결핍 바이러스 (SIV), 인간 면역 결핍 바이러스 (HIV) 및 그의 조합을 기반으로 하는 벡터를 포함한다 (예를 들어, 문헌 [Buchscher, et al. (1992) J. Virol. 66:2731-2739; Johann, et al. (1992) J. Virol. 66:1635-1640; Sommerfelt, et al. (1990) Virol. 176:58-59; Wilson, et al. (1989) J. Virol. 63:2374-2378; Miller, et al. (1991) J. Virol. 65:2220-2224]; 국제 특허 공개 번호 WO 94/26877 참조).
일시적 발현이 선호되는 적용에서는, 아데노바이러스 기반 시스템을 사용할 수 있다. 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율이 가능하며 세포 분열을 필요로 하지 않는다. 이러한 벡터를 이용하여, 높은 역가 및 높은 수준의 발현이 수득되었다. 이러한 벡터는 비교적 간단한 시스템에서 대량으로 생산될 수 있다. 아데노 관련 바이러스 ("AAV") 벡터는 또한, 예를 들어, 핵산 및 펩티드의 시험관 내 생산에서, 및 생체 내 및 생체 외 유전자 요법 절차를 위해, 표적 핵산으로 세포를 형질도입하는 데 사용된다 (예를 들어, 문헌 [West, et al. (1987) Virology 160:38-47]; 미국 특허 번호 4,797,368; 국제 특허 공개 번호 WO 93/24641; 문헌 [Kotin (1994) Human Gene Therapy 5:793-801; Muzyczka (1994) J. Clin. Invest. 94:1351] 참조). 재조합 AAV 벡터의 구축은 미국 특허 번호 5,173,414; 문헌 [Tratschin, et al. (1985) Mol. Cell. Biol. 5:3251-3260; Tratschin, et al. (1984) Mol. Cell. Biol. 4:2072-2081; Hermonat & Muzyczka (1984) PNAS USA 81:6466-6470; 및 Samulski, et al. (1989) J. Virol. 63:03822-3828]을 포함한 수많은 공보에 기재되어 있다.
적어도 6개의 바이러스 벡터 접근법이 현재 임상 시험에서 유전자 전달을 위해 이용가능하며, 이는 형질도입제를 생성하기 위해 헬퍼 세포주에 삽입된 유전자에 의한 결함 벡터의 상보성을 수반하는 접근법을 활용한다.
pLASN 및 MFG-S는 임상 시험에 사용된 레트로바이러스 벡터의 예이다 (Dunbar, et al. (1995) Blood 85:3048-305; Kohn, et al. (1995) Nat. Med. 1:1017-102; Malech, et al. (1997) PNAS USA 94(22):12133-12138). PA317/pLASN이 유전자 요법 시험에 사용된 첫 번째 치료용 벡터였다 (Blaese, et al. (1995) Science 270:475-480). MFG-S 패키지 벡터에 대해 50% 이상의 형질도입 효율이 관찰되었다 (Ellem, et al. (1997) Immunol Immunother. 44(1):10-20; Dranoff, et al. (1997) Hum. Gene Ther. 1:111-2).
재조합 아데노 관련 바이러스 벡터 (rAAV)는 결함이 있고 비병원성인 파보바이러스 아데노 관련 유형 2 바이러스를 기반으로 하는 유망한 대체 유전자 전달 시스템이다. 모든 벡터는 트랜스진 발현 카세트를 플랭킹하는 AAV 145 bp 역위 말단 반복부만을 보유하는 플라스미드로부터 유래된다. 형질도입된 세포의 게놈으로의 통합으로 인한 효율적인 유전자 전달과 안정적인 트랜스진 전달이, 이러한 벡터 시스템에 대한 주요 특징이다 (Wagner, et al. (1998) Lancet 351(9117):1702-3, Kearns, et al. (1996) Gene Ther. 9:748-55). AAV1, AAV3, AAV4, AAV5, AAV6, AAV8, AAV8.2, AAV9 및 AAVrh10을 포함한 다른 AAV 혈청형 및 위형화된 AAV, 예컨대 AAV2/8, AAV2/5 및 AAV2/6이 또한 본 발명에 따라 사용될 수 있다. 복제 결핍성 재조합 아데노바이러스 벡터 (Ad)는 높은 역가로 생산될 수 있으며 많은 상이한 세포 유형을 쉽게 감염시킬 수 있다. 대부분의 아데노바이러스 벡터는 트랜스진이 Ad E1a, E1b 및/또는 E3 유전자를 대체하도록 조작되며; 이어서 복제 결함 벡터는 트랜스에서 결실된 유전자 기능을 공급하는 인간 293 세포에서 증식될 수 있다. Ad 벡터는 분열되지 않은 분화된 세포, 예컨대 간, 신장 및 근육에서 발견되는 것을 포함하여, 생체 내에서 여러 유형의 조직을 형질도입할 수 있다. 기존의 Ad 벡터는 큰 운반 능력을 가지고 있다. 임상 시험에서 Ad 벡터 사용의 예는 근육내 주사를 통한 항종양 면역화를 위한 폴리뉴클레오티드 요법을 수반하였다 (Sterman et al. (1998) Hum. Gene Ther. 7:1083-1089). 임상 시험에서 유전자 전달을 위한 아데노바이러스 벡터의 사용의 부가의 예는 하기 문헌을 포함한다 (Rosenecker, et al. (1996) Infection 24(1):5-10; Sterman, et al. (1998) Hum. Gene Ther. 9(7):1083-1089; Welsh, et al. (1995) Hum. Gene Ther. 2:205-218; Alvarez, et al. (1997) Hum. Gene Ther. 5:597-613; Topf, et al. (1998) Gene Ther. 5:507-513; Sterman, et al. (1998) Hum. Gene Ther. 7:1083-1089).
패키징 세포는 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 아데노바이러스를 패키징하는 293 세포, 및 레트로바이러스를 패키징하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 요법에 사용되는 바이러스 벡터는 통상적으로 핵산 벡터를 바이러스 입자로 패키징하는 생산자 세포주에 의해 생성된다. 벡터는 전형적으로 패키징 및 숙주로의 후속 통합에 필요한 최소 바이러스 서열을 함유하고 (적용가능한 경우), 다른 바이러스 서열은 발현될 단백질을 코딩하는 발현 카세트로 대체된다. 누락된 바이러스 기능은 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 요법에 사용되는 AAV 벡터는 전형적으로 패키징 및 숙주 게놈으로의 통합에 필요한 AAV 게놈으로부터의 역위 말단 반복부 (ITR) 서열만을 보유한다. 바이러스 DNA는 다른 AAV 유전자, 즉 rep 및 cap을 코딩하는 헬퍼 플라스미드를 함유하지만 ITR 서열이 결여된 세포주에 패키징된다. 세포주는 또한 헬퍼로서 아데노바이러스에 감염된다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진한다. 헬퍼 플라스미드는 ITR 서열의 결여로 인해 상당한 양으로 패키징되지 않는다. 예를 들어, 아데노바이러스가 AAV보다 더 감수성인 열처리를 통해 아데노바이러스에 의한 오염을 감소시킬 수 있다.
많은 유전자 요법 적용에서, 유전자 요법 벡터는 특별한 조직 유형에 대해 높은 정도의 특이성으로 전달되는 것이 바람직하다. 따라서, 바이러스의 외부 표면 상의 바이러스 코트 단백질과의 융합 단백질로서 리간드를 발현함으로써 주어진 세포 유형에 대한 특이성을 갖도록 바이러스 벡터를 변형시킬 수 있다. 리간드는 관심 세포 유형에 존재하는 것으로 공지된 수용체에 대한 친화성을 갖도록 선택된다. 예를 들어, 문헌 [Han, et al. (1995) Proc. Natl. Acad. Sci. USA 92:9747-9751]에는 몰로니(Moloney) 뮤린 백혈병 바이러스가 gp70에 융합된 인간 헤레굴린을 발현하도록 변형될 수 있으며, 재조합 바이러스가 인간 표피 성장 인자 수용체를 발현하는 특정 인간 유방암 세포를 감염시킨다고 보고되었다. 이러한 원리는 다른 바이러스-표적 세포 쌍으로 확장될 수 있는데, 여기서 표적 세포는 수용체를 발현하고 바이러스는 세포 표면 수용체에 대한 리간드를 포함하는 융합 단백질을 발현한다. 예를 들어, 사상 파지(filamentous phage)는 사실상 임의의 선택된 세포 수용체에 대한 특이적 결합 친화성을 갖는 항체 단편 (예를 들어, FAB 또는 Fv)을 표시하도록 조작될 수 있다. 상기 설명이 주로 바이러스 벡터에 적용되긴 하지만, 동일한 원리가 비-바이러스 벡터에도 적용될 수 있다. 이러한 벡터는 특이적 표적 세포에 의한 흡수를 선호하는 특이적 흡수 서열을 함유하도록 조작될 수 있다.
CRISPR/Cas 시스템에 대한 전달 방법은 상기 기재된 방법을 포함할 수 있다. 예를 들어, 동물 모델에서, 시험관 내 전사된 Cas 코딩 mRNA 또는 재조합 Cas 단백질은 유리 바늘을 사용하여 게놈 편집된 동물에게 직접 1-세포 단계 배아에 주입될 수 있다. Cas를 발현하고 시험관 내 세포에서 RNA를 가이드하기 위해, 전형적으로 이를 코딩하는 플라스미드를 리포펙션 또는 전기천공을 통해 세포로 형질감염시킨다. 또한 재조합 Cas 단백질은 시험관 내 전사된 가이드 RNA와 복합체를 형성할 수 있으며, 여기서 Cas-가이드 RNA 리보핵단백질이 관심 세포에 의해 흡수된다 (Kim, et al. (2014) Genome Res 24(6):1012). 치료 목적으로, Cas 및 가이드 RNA는 바이러스 기술과 비-바이러스 기술의 조합에 의해 전달될 수 있다. 예를 들어, Cas를 코딩하는 mRNA는 나노 입자 전달을 통해 전달될 수 있는 반면, 가이드 RNA 및 임의의 원하는 트랜스진 또는 복구 주형은 AAV를 통해 전달된다 (Yin, et al. (2016) Nat Biotechnol 34(3):328).
유전자 요법 벡터는 전형적으로 하기 기재되는 바와 같이, 전신 투여 (예를 들어, 정맥 내, 복강 내, 근육 내, 피하 또는 두개 내 주입) 또는 국소 적용에 의해 개별 환자 (대상체)에게 투여함으로써 생체 내 전달될 수 있다. 또 다른 한편으론, 벡터는 생체 외 세포, 예컨대 개별 환자로부터 체외 이식된 세포 (예를 들어, 림프구, 골수 흡인물, 조직 생검) 또는 범용 공여자 조혈 줄기 세포에 전달될 수 있으며, 이어서 통상적으로 벡터를 혼입시킨 세포에 대한 선별 후에, 환자에게 세포를 다시 체내 이식할 수 있다.
진단, 연구, 이식 또는 유전자 요법을 위한 생체 외 세포 형질감염 (예를 들어, 숙주 유기체에 형질감염된 세포의 재주입을 통함)은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 바람직한 실시양태에서, 세포는 대상 유기체로부터 단리되고, DNA 결합 단백질 핵산 (유전자 또는 cDNA)으로 형질감염되고, 대상 유기체 (예를 들어, 환자)로 다시 주입된다. 생체 외 형질감염에 적합한 다양한 세포 유형은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 문헌 [Freshney, et al., Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994)] 및 환자로부터 세포를 단리하고 배양하는 방법의 논의에 대해 상기 문헌에 인용된 참고 문헌 참조).
한 실시양태에서, 줄기 세포는 세포 형질감염 및 유전자 요법을 위한 생체 외 절차에 사용된다. 줄기 세포를 사용하는 이점은 시험관 내에서 다른 세포 유형으로 분화될 수 있거나, 또는 골수에 생착될 포유 동물 (예컨대, 세포의 공여자)에 도입될 수 있다는 것이다. 시토카인, 예컨대 GM-CSF, IFN-γ 및 TNF-α를 사용하여 시험관 내에서 CD34+ 세포를 임상적으로 중요한 면역 세포 유형으로 분화시키는 방법이 공지되어 있다 (문헌 [Inaba, et al. (1992) J. Exp. Med. 176:1693-1702] 참조).
줄기 세포는 공지된 방법을 사용하여 형질도입 및 분화를 위해 단리된다. 예를 들어, 줄기 세포는 원치 않는 세포와 결합하는 항체, 예컨대 CD4+ 및 CD8+ (T 세포), CD45+ (panB 세포), GR-1 (과립구), 및 Iad (분화된 항원 제시 세포)로 골수 세포를 패닝함으로써 골수 세포로부터 단리된다 (문헌 [Inaba, et al. (1992) J. Exp. Med. 176:1693-1702] 참조).
변형된 줄기 세포가 또한 일부 실시양태에서 사용될 수 있다. 예를 들어, 아폽토시스에 대해 내성이 있는 신경 줄기 세포가 치료 조성물로서 사용될 수 있으며, 여기서 줄기 세포는 또한 본 발명의 ZFP TF를 함유한다. 아폽토시스에 대한 내성은, 예를 들어, 줄기 세포에서 BAX 또는 BAK 특이적 ZFN (미국 특허 번호 8,597,912 참조)을 사용하여 BAX 및/또는 BAK를 녹아웃시키거나, 또는 예를 들어 카스파제-6 특이적 ZFN을 다시 사용하여, 카스파제에서 붕괴된 것들에 의해 발생할 수 있다.
치료용 DNA 결합 단백질 (또는 이들 단백질을 코딩하는 핵산)을 함유하는 벡터 (예를 들어, 레트로바이러스, 아데노바이러스, 리포좀 등)는 생체 내에서 세포의 형질도입을 위해 유기체에 직접 투여될 수도 있다. 또 다른 한편으론, 있는 그대로의 DNA를 투여할 수 있다. 투여는 주사, 주입, 국소 적용 및 전기천공을 포함 하나 이에 제한되지는 않는, 혈액 또는 조직 세포와의 궁극적인 접촉에 분자를 도입하기 위해 정상적으로 사용되는 경로 중 임의의 것에 의해 이루어진다. 이러한 핵산을 투여하는 적합한 방법이 이용가능하고 관련 기술분야의 통상의 기술자에게 널리 공지되어 있으며, 특별한 조성물을 투여하기 위해 한 가지 초과의 경로가 사용될 수 있지만, 특별한 경로는 종종 또 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.
조혈 줄기 세포에 DNA를 도입하는 방법은, 예를 들어, 미국 특허 번호 5,928,638에 개시되어 있다. 조혈 줄기 세포, 예를 들어, CD34+ 세포로의 트랜스진의 도입에 유용한 벡터는 아데노바이러스 유형 35를 포함한다.
트랜스진을 면역 세포 (예를 들어, T 세포)로 도입하는 데 적합한 벡터는 비-통합 렌티바이러스 벡터를 포함한다 (예를 들어, 문헌 [Ory, et al. (1996) Proc. Natl. Acad. Sci. USA 93:11382-11388; Dull, et al. (1998) J. Virol. 72:8463-8471; Zuffery, et al. (1998) J. Virol. 72:9873-9880; Follenzi, et al. (2000) Nature Genetics 25:217-222] 참조).
제약상 허용되는 담체는 부분적으로, 투여되는 특별한 조성물뿐만 아니라 조성물을 투여하는 데 사용되는 특별한 방법에 의해 결정된다. 따라서, 하기에 기재되는 바와 같이, 이용가능한 제약 조성물의 광범위한 적합한 제형이 있다 (예를 들어, 문헌 [Remington's Pharmaceutical Sciences, 17th ed., 1989] 참조).
상기 언급된 바와 같이, 개시된 방법 및 조성물은 원핵 세포, 진균 세포, 고세균 세포, 식물 세포, 곤충 세포, 동물 세포, 척추 동물 세포, 포유 동물 세포, 및 T-세포 및 임의의 유형의 줄기 세포를 포함한 인간 세포를 포함하나 이에 제한되지는 않는 임의의 유형의 세포에서 사용될 수 있다. 단백질 발현에 적합한 세포주는 관련 기술분야의 통상의 기술자에게 공지되어 있고, COS, CHO (예를 들어, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예를 들어, HEK293-F, HEK293-H, HEK293-T), perC6, 곤충 세포, 예컨대 스포도프테라 푸기페르다 (Sf), 및 진균 세포, 예컨대 사카로마이세스, 피치아 및 쉬조사카로마이세스를 포함하나, 이에 제한되지는 않는다. 이들 세포주의 자손, 변이체 및 유도체가 또한 사용될 수 있다.
적용
질환의 치료 및 예방에 조작된 DNA 염기 편집기 복합체를 사용하면 의학 분야에 있어서 상당한 발전이 제공된다. 본원에 기재된 방법 및 조성물은 원하는 표적 부위가 편집의 주요 장소가 되도록 보장하기 위해 이러한 신규 도구의 특이성을 증가시키는 역할을 한다.
본원에 기재된 조성물 및 방법에 의해 치료 및/또는 예방될 수 있는 예시적인 유전 질환은 연골 무형성증, 완전 색맹, 산성 말타제 결핍, 아데노신 데아미나제 결핍 (OMIM 번호 102700), 부신 백질 형성 장애증, 에카르디 증후군, 알파-1 항트립신 결핍, 알파-지중해 빈혈, 안드로겐 불감성 증후군, 아페르(apert) 증후군, 부정맥유발성 우심실 이형성증, 모세혈관 확장성 운동 실조증, 바르트(barth) 증후군, 베타-지중해 빈혈, 청색 고무 수포 모반 증후군, 캐너번(canavan)병, 만성 육아종성 질환 (CGD), 고양이 울음 증후군, 낭포성 섬유증, 더컴(dercum)병, 외배엽 형성 이상, 판코니 빈혈, 진행성 골화성 섬유이형성증, 취약 X 증후군, 갈락토스혈증, 고셔(Gaucher)병, 전신성 강글리오시드증 (예를 들어, GM1), 혈색소 침착증, 베타-글로빈의 6번째 코돈에서의 헤모글로빈 C 돌연변이 (HbC), 혈우병, 헌팅턴병, 후를러(Hurler) 증후군, 저인산증, 클라인펠터(Klinefelter) 증후군, 크라베(Krabbes)병, 랑거-기디온(Langer-Giedion) 증후군, 백혈구 유착 결핍 (LAD, OMIM 번호 116920), 백질 이영양증, 긴 QT 증후군, 마르판 증후군, 뫼비우스 증후군, 점액 다당류증 (MPS), 손발톱 슬개골 증후군, 신성 요붕증, 신경 섬유종증, 니만-피크(Niemann-Pick)병, 불완전 골형성증, 페닐케톤뇨증 (PKU), 포르피린증, 프라더-윌리(Prader-Willi) 증후군, 조로증, 프로테우스(Proteus) 증후군, 망막 모세포종, 레트(Rett) 증후군, 루빈스타인-타이비(Rubinstein-Taybi) 증후군, 산필리포(Sanfilippo) 증후군, 중증 복합 면역 결핍증 (SCID), 슈와크만(Shwachman) 증후군, 겸상 적혈구병 (겸상 적혈구 빈혈), 스미스 마제니스(Smith-Magenis) 증후군, 스티클러(Stickler) 증후군, 테이 삭스병, 저혈소판 요골 무형성 (TAR) 증후군, 트리처 콜린스(Treacher Collins) 증후군, 삼염색체증, 결절성 경화증, 터너(Turner) 증후군, 요소 회로 장애, 폰 히펠 란다우(von Hippel-Landau)병, 바르덴부르크(Waardenburg) 증후군, 윌리암스(Williams) 증후군, 윌슨(Wilson)병, 비스코트-알드리치(Wiskott-Aldrich) 증후군, X 연관 림프 증식성 증후군 (XLP, OMIM 번호 308240)을 포함하나, 이에 제한되지는 않는다.
표적화된 DNA 염기 편집에 의해 치료될 수 있는 부가의 예시적인 질환은 후천성 면역 결핍증, 리소좀 저장 질환 (예를 들어, 고셔병, GM1, 파브리병 및 테이 삭스병), 점액 다당류증 (예를 들어, 헌터병, 후를러병), 혈색소병증 (예를 들어, 겸상 적혈구병, HbC, α-지중해 빈혈, β-지중해 빈혈) 및 혈우병을 포함한다.
이러한 방법은 또한 숙주에서 감염 (바이러스성 또는 박테리아성)을 치료 (예를 들어, 바이러스 또는 박테리아 수용체의 발현을 차단함으로써, 숙주 유기체에서의 감염 및/또는 확산을 예방함으로써 이루어진다)를 허용하여 유전 질환을 치료할 수 있다.
표적화된 염기 편집은 또한 숙주에서 바이러스성 감염을 치료하기 위해 사용될 수 있다. 부가적으로, 바이러스에 대한 수용체를 코딩하는 유전자의 표적화된 절단은 이러한 수용체의 발현을 차단함으로써, 숙주 유기체에서의 바이러스성 감염 및/또는 바이러스성 확산을 방지하는 데 사용될 수 있다. 바이러스 수용체 (예를 들어, HIV에 대한 CCR5 및 CXCR4 수용체)를 코딩하는 유전자의 표적화된 돌연변이 유발은 수용체가 바이러스와 결합할 수 없도록 만들어, 그에 의해 새로운 감염을 예방하고 기존 감염의 확산을 차단하는 데 사용될 수 있다 (미국 특허 공개 번호 2008/015996 참조). 표적화될 수 있는 바이러스 또는 바이러스 수용체의 비-제한적인 예는 단순 포진 바이러스 (HSV), 예컨대 HSV-1 및 HSV-2, 수두 대상 포진 바이러스 (VZV), 엡스타인-바 바이러스 (EBV) 및 시토메갈로바이러스 (CMV), HHV6 및 HHV7을 포함한다. 바이러스의 간염 패밀리는 A형 간염 바이러스 (HAV), B형 간염 바이러스 (HBV), C형 간염 바이러스 (HCV), 델타 간염 바이러스 (HDV), E형 간염 바이러스 (HEV) 및 G형 간염 바이러스 (HGV)를 포함한다. 피코르나비리다에(Picornaviridae) (예를 들어, 폴리오바이러스 등); 칼리시비리다에(Caliciviridae); 토가비리다에(Togaviridae) (예를 들어, 풍진 바이러스, 뎅기 바이러스 등); 플라비비리다에(Flaviviridae); 코로나비리다에(Coronaviridae); 레오비리다에(Reoviridae); 비르나비리다에(Birnaviridae); 라보도비리다에(Rhabodoviridae) (예를 들어, 광견병 바이러스 등); 필로비리다에(Filoviridae); 파라믹소비리다에(Paramyxoviridae) (예를 들어, 유행성 이하선염 바이러스, 홍역 바이러스, 호흡기 세포 융합 바이러스 등); 오르토믹소비리다에(Orthomyxoviridae) (예를 들어, 인플루엔자 바이러스 유형 A, B 및 C 등); 분야비리다에(Bunyaviridae); 아레나비리다에(Arenaviridae); 레트로비리다에(Retroviridae); 렌티바이러스 (예를 들어, HTLV-I; HTLV-II; HIV-1 (HTLV-III, LAV, ARV, hTLR 등으로서 공지되기도 함) HIV-II); 유인원 면역 결핍 바이러스 (SIV), 인간 유두종 바이러스 (HPV), 인플루엔자 바이러스 및 진드기 매개 뇌염 바이러스를 포함하나 이에 제한되지는 않는 다른 바이러스 또는 그의 수용체가 표적화될 수 있다. 이들 및 다른 바이러스의 설명에 관해서는, 예를 들어 문헌 [Virology, 3rd Edition (W. K. Joklik ed. 1988); Fundamental Virology, 2nd Edition (B. N. Fields and D. M. Knipe, eds. 1991)]을 참조한다. 예를 들어, HIV에 대한 수용체는 CCR-5 및 CXCR-4를 포함한다. 상기 언급된 바와 같이, 본원에 기재된 조성물 및 방법은 유전자 변형, 유전자 교정 및 유전자 붕괴에 사용될 수 있다.
본원에 기재된 조성물 및 방법은 또한 하기를 발생시키는 편집을 포함하나 그에 제한되지는 않는 줄기 세포 기반 요법에 적용될 수 있다: 체세포 돌연변이의 교정; 우성 음성 대립 유전자의 붕괴; 병원체가 세포로 유입되거나 생산적으로 감염되는 데 필요한 유전자의 붕괴; 예를 들어, 기능적 조직의 분화 또는 형성을 촉진하기 위해 유전자 활성을 편집하고/하거나 기능적 조직의 분화 또는 형성을 촉진하기 위해 유전자 활성을 방해함으로써 증강된 조직 조작; 예를 들어, 분화를 차단하는 유전자를 편집함으로써 분화를 차단 또는 유도하여 줄기 세포가 특이적 계통 경로로 분화되는 것을 촉진시키는 것. 이러한 절차를 위한 세포 유형은 T 세포, B 세포, 조혈 줄기 세포 및 배아 줄기 세포를 포함하나 이에 제한되지는 않는다. 부가적으로, 유도 다능성 줄기 세포 (iPSC)가 사용될 수 있으며, 이는 환자 자신의 체세포로부터 생성될 수도 있다. 따라서, 이들 줄기 세포 또는 그의 유도체 (분화된 세포 유형 또는 조직)는 그의 기원이나 조직 적합성에 관계 없이 임의의 사람에게 잠재적으로 생착될 수 있었다.
상기 조성물 및 방법은 또한 체세포 요법에 사용될 수 있으며, 이에 의해 생물학적 특성을 증강시키기 위해 변형된 세포의 스톡을 생산할 수 있다. 이러한 세포는 세포의 공여자 공급원 및 수용자에 대한 조직 적합성에 관계 없이 다양한 환자에게 주입될 수 있다.
치료적 적용 이외에, 본원에 기재된 DNA 편집 복합체는 작물 조작, 세포주 조작 및 질환 모델의 구축에 사용될 수 있다. 절대적인 이종 이량체 절단 절반 도메인은 뉴클레아제 특성을 개선하기 위한 직접적인 수단을 제공한다.
본원에 기재된 조작된 DNA 편집 복합체는 한 번에 다수의 표적에서 동시 절단을 필요로 하는 유전자 변형 프로토콜에서도 사용될 수 있다. 2개의 표적에서의 편집은 2개의 DNA 편집 복합체의 세포 발현을 필요로 하며, 이는 다른 복합체에서의 절단 도메인과 상호작용 (이량체화)하지 않는 각각의 복합체 내의 절단 도메인을 포함하는 닉카제를 사용하여 달성되는 것이 바람직하다.
실시예
실시예 1: ZFP의 제조
문헌 [Urnov, et al. (2005) Nature 435(7042):646-651, Perez, et al. (2008) Nature Biotechnology 26(7): 808-816], 및 국제 특허 공개 번호 WO 2016/183298 및 WO 2017/106528에 본질적으로 기재된 바와 같이, 특이적 표적 부위를 표적으로 하는 ZFP가 설계되고 플라스미드 벡터 내로 혼입된다. 미국 특허 번호 8,586,526 및 9,873,894에 기재된 바와 같이, 특이적 부위에 대한 TALE 및 sgRNA가 또한 개발된다.
염기 편집을 위한 한 가지 예시적인 표적은 알파-1 항트립신 (A1AT)을 코딩하는 SERPINA 유전자좌이다. A1AT 단백질에서 상염색체 열성 결핍을 유발시키는 유전자좌에서의 돌연변이는 간 및 폐 질환 둘 다와 연관이 있다. 북유럽 혈통의 사람들에게 가장 흔한 결핍 대립 유전자 중 하나인 PiZ 돌연변이는 A1AT 단백질의 약 10-20%만 생산되도록 한다. 이러한 돌연변이는 엑손 5에서의 단일 돌연변이에 의해 야기되어, 아미노산 위치 342에서의 리신이 글루타민으로 치환되며, 여기서 DNA 내의 위치 1096에 있는 G가 돌연변이된 유전자 서열에서의 A이다 (문헌 [Fregonese and Stolk (2008) Orphanet J Rare Dis 3:16]에서 검토됨).
또 다른 예시적인 표적은 JAK2 V617F 돌연변이이다. V617F를 편집하여 또 다른 돌연변이를 형성하면, JAK2를 덜 활성화시킬 수 있다. 예를 들어, V617L, V617P 및 V617S 돌연변이는 V617F보다 덜 활성화되는 것으로 나타났다 (Dusa, et al. (2008) J Biol Chem 283(19):12941-12948).
따라서, A1AT에서의 돌연변이 근처 영역을 표적으로 하는 몇 가지 징크 핑거 단백질 (ZFP)이 만들어졌다 (도 2 참조). ZFP의 설계는 하기 표 1A (A1AT) 및 표 1B (JAK2)에 제시되어 있다.
<표 1A>
<표 1B>
몇 가지 상이한 조합을 포함하는 염기 편집기는 표준 프로토콜을 사용하여 구축된다. 상이한 조합은 하나 이상의 데아미나제, 헬리카제, 선택된 DNA 결합 도메인 (ZFP, TALE, sgRNA), dCas, 닉카제 (ZFN, TALEN, CRISPR/Cas) 복합체, UGI, GAM 등을 포함하는 편집기를 포함한다. 상기 조합은 순차적으로 융합된 선택된 도메인을 포함하는 복합체를 포함하거나, 또는 상기 조합이 별도의 융합 단백질로서 공급된다. 임의의 링커가 도메인 사이에 사용된다.
조합은 세포로의 형질감염을 위해 또는 시험관 내 mRNA의 생산에 사용하기 위해 발현 구축물로 어셈블리된다. 이어서, 이들 mRNA는 관련 기술분야에 공지된 방법 (예를 들어, 전기천공)에 의해 세포에 도입될 수 있다. 표적화된 돌연변이가 없는 세포가 대조군으로서 사용된다.
실시예 2: 아데닌 염기 편집기
아데닌 염기 편집기는 분자의 C-말단 측에 있는 돌연변이된 A1AT PiZ 돌연변이를 표적으로 한 ZFP DNA 결합 도메인에 연결된, PAM 요구 사항이 완화된 Cas9 변이체 (SpCas9VRVRFRR_D10A; 문헌 [Nishimasu, et al. (2018) Science 361:1259-1262] 또는 xCas9; 문헌 [Hu, et al. (2018) Nature 556:57-63] 참조)를 사용하여 구축되었다. 인접한 DNA 영역과 결합하도록 설계된 일련의 ZFP DNA 결합 도메인 (실시예 1 참조)을 염기 편집기에 혼입하였다 (도 2 및 7 참조). ZFP는 3개의 HA 펩티드와 2개의 뉴클레아제 국재화 서열 (NLS)을 포함하는 링커를 사용하여 Cas9에 부착되었다. 링커의 서열은 하기와 같다: GTGGPKKKRKVYPYDVPDYAGYPYDVPDYAGSYPYDVPDYAGSAAPAAKKKKLDFESE (서열식별번호: 3) (문헌 [Bolukbasi, et al. (2015) Nat Methods 12(12):1150-1156] 참조). 이어서, Cas9는 N 말단 측에 있는 2개의 이. 콜라이 TadA 아데닌 데아미나제 ("ecTadA"; 문헌 [Kim, et al. (2006) Biochemistry 45:6407-6416])에 연결되었다. 이러한 구축물에서, TadA 단백질 중 하나는 야생형 단백질이었고 다른 하나는 진화된 버전이었다 (Gaudelli, et al. (2017) Nature 551:464). 세린-글리신이 풍부한 링커는 Cas9와 TadA 서브유닛 사이에 2회 사용되었고, 하기 서열을 포함하였다: SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 2). 아데닌 염기 편집기 (ABE)의 개략도가 도 3a에 도시되어 있다. 일부 경우에는, 다른 유형의 아데닌 데아미나제가 사용된다. 예를 들어, 일부 구축물에서, ABE7.10 데아미나제 또는 ABEmax 아데닌 데아미나제 (문헌 [Koblan, et al. (2018) Nat Biotechnol. 36(9):843-846])가 사용된다.
JAK2 V617F 돌연변이를 표적으로 하기 위해, 돌연변이 부위 근처의 JAK2 유전자를 표적으로 하는 Cas9NG 아데닌 염기 편집기는 돌연변이 부위의 상류에 위치한 TAA 또는 AAT 또는 AAA PAM 부위를 사용하여 만들어진다 (도 7a 내지 7c 참조). ZFP DNA 결합 도메인은 상기 기재된 바와 같은 염기 편집기에 융합되고, HSC/PC를 편집하는 데 사용된다. ZFP 서열에 표 1B에 제시된다. 임의의 링커가 핑거 사이 및/또는 ZFP와 염기 편집기 사이에 사용될 수 있다.
그 결과는 표적 유전자좌에서의 성공적인 편집을 보여준다. 도 7a는 아미노산 서열에서 세린 (S) 또는 프롤린 (P)으로의 변화를 야기시키는 염기 편집을 도시한다. 이들 변이체 둘 다는 페닐알라닌 돌연변이체 (F)보다 덜 활성화되는 것으로 나타났다 (문헌 [Dusa, et al. (2008) J Biol Chem 283(19):12941-8] 참조).
세포 (예를 들어, K562 세포)는 염기 편집기를 포함하는 발현 벡터 (예를 들어, 플라스미드 또는 바이러스 벡터)로 형질감염되거나, 또는 세포는 상기 기재된 바와 같은 염기 편집기를 코딩하는 mRNA를 사용하여 전기천공된다. 형질감염된 세포를 수거하고 게놈 DNA를 단리한다. 온 타겟 관심 게놈 영역 및 오프 타겟 관심 게놈 영역은 관련 기술분야의 표준 방법에 따라 PCR 증폭에 의해 증폭된다. 서열은 염기 편집 및 인델의 존재에 대해 평가된다.
아데닌 염기 편집기 (ABE)는 K562 세포 상에서 상기 기재된 바와 같이 A1AT 유전자좌에서 시험되었으며, 여기서 200,000개 세포 당 염기 편집기를 코딩하는 800 ng의 플라스미드 DNA가 사용되었다. 실험은 또한 Z가 없는 K562 세포에서 수행되었으며 질환 유발 돌연변이에 매우 근접한 A 뉴클레오티드가 활성 측정을 위한 프록시로서 사용되었다. 아맥사(Amaxa) 장치를 사용한 형질감염 (제조업체의 프로토콜에 따름) 후 72시간에, 세포를 수거하고 Miseq 분석 [일루미나(Illumina)]을 수행하여, 발생했을 수 있는 임의의 편집을 분석하였다. 도 4는 복합체의 편집 창 내에서 표적화될 수 있는 A 염기를 예시하며, 여기서 이들 위치에 G가 존재하는 것은 A 염기 편집이 발생했다는 것을 나타낼 것이다.
변이체 ZFP 도메인을 포함하는 각각의 구축물의 3가지 상이한 클론이 시험되었다. 그 결과가 하기 표 2에 제시되어 있다 (용어 "Cas9VRVRFRR", "Cas9VR" 및 "Cas9NG"는 상호 교환가능하게 사용되는 것에 주목해야 한다):
<표 2>
A1AT 유전자좌에서의 아데닌 염기 편집
"sgRNA_단독"으로 표지된 행은 가이드 RNA만을 포함하는 행이고, "ABE_Cas9VR_D10A"는 ZFP DNA 결합 도메인이 결여된 복합체이다. 데이터로부터 알 수 있는 바와 같이, 위치 A5에서의 아데닌의 표적화된 편집은 ZFP 도메인이 결여된 편집 복합체와 비교 시 ZFP DNA 결합 도메인의 일부 존재 하에 증가되었다. ZFP가 없는 천연 ABE-Cas9 융합 구축물은 약 0.5% 염기 편집을 발생시킨 반면, ABE-Cas9-ZFP 융합 구축물은 이러한 데이터 세트에서 적어도 7배 더 높은 염기 편집 효율성을 보여주었다.
이들 실험에서는, ABEmax 또는 ABE7.10 아데닌 데아미나제에 연결된 xCas 또는 Cas9NG 단백질을 사용하여 연구를 수행하였다. 사용된 가이드 RNA는 TGT PAM 또는 AGT PAM이다. 결과는 ZFP DNA 결합 도메인 (ZFP 앵커)이 결여된 염기 편집기와 비교 시 5배 내지 10배 이상의 염기 편집 효율성을 보여주었다.
ABE 7.9 및 ABE 7.8의 사용을 포함하여 대체 버전의 아데닌 데아미나제를 사용하여 추가 실험을 수행하였으며, 거의 동등한 수준의 결과를 보여주었다.
JAK2 V617F 돌연변이체의 염기 편집을 위해, V617F 돌연변이가 없는 K562 세포에서 수행된 실험을 포함하여 실험 조건은 상기 기재된 바와 동일하였지만, 질환 유발 돌연변이에 매우 근접한 A 뉴클레오티드가 활성 측정을 위한 프록시로서 사용되었다. 표적화된 PAM 서열 도 7b에 도시되어 있다. ABEmax에 연결된 xCas 또는 Cas9NG 단백질의 다양한 조합을 사용하여 연구를 수행하였다 (예를 들어, 도 3b 참조).
결과는 ZFP 앵커의 존재가 AAT 및 TAA PAM 서열에서의 활동을 보여주는 것을 포함하여, 편집을 개선하고 PAM 요구 사항을 완화하였다는 것을 보여주었다. 특히, TAA PAM 서열을 사용하는 염기 편집기는 ZFP 도메인 없이 이러한 부위에서 불활성이다. 예를 들어, 도 7c에 도시된 바와 같은 예시적인 결과를 참조한다.
부가의 질환 관련 점 돌연변이에 대해 부가의 실험이 수행되고, ZFP 앵커 도메인의 존재하에 더 높은 염기 편집 특이성 및/또는 활성이 달성된다. 더욱이, 편집될 표적화된 염기에 따라, NAN (예를 들어, TAA), AAT, NGG (TGG), NGT (예를 들어, TGT 또는 AGT)를 포함하나 이에 제한되지는 않는 임의의 PAM 서열이 사용될 수 있다.
실시예 3: 시티딘 염기 편집기
C 뉴클레오티드를 U로 전환시키기 위한 시티딘 염기 편집기는 아포지질단백질 B mRNA 편집 효소, 촉매 폴리펩티드 유사 (APOBEC) 단백질을 사용하여 구축된다 (Yang, et al. (2017) J Genet Genomics 44(9):423-437). 특히, 시티딘 염기 편집기는 시티딘 데아미나제, 예컨대 아포지질단백질 B mRNA 편집 효소, 촉매 폴리펩티드 1 또는 APOBEC-1을 사용하여 만들어진다. AICDA 유전자에 의해 코딩된, AICDA 및 AID로서 공지되기도 한 활성화 유도 시티딘 데아미나제가 또한 본원에 기재된 바와 같은 시티딘 데아미나제 염기 편집기에 포함될 수 있다.
U:G 이종 이중 나선 DNA에 대한 세포 복구 반응은 DNA로부터의 U의 제거를 촉매하고 U:G 쌍에서 C:G 쌍으로의 역전과 함께 염기 절제 복구를 시작하는 우라실 DNA 글리코실라제 (UDG)의 활성을 유발하여, 염기 편집의 효율성을 저하시키는 것으로 생각된다. 따라서, 시티딘 염기 편집기는 내인성 UDG 활성을 차단하기 위해 편집기에 융합된 우라실 글리코실라제 억제제 (UGI)를 가질 수 있다 (Komor, et al. (2016) Nature 533(7603):420-424). 시티딘 염기 편집기는 APOBEC1 또는 B 세포 특이적 활성화 유도 시티딘 데아미나제 (AID) 효소에 연결된 ZFP DNA 결합 도메인을 사용하여 구축된다 (Kescu and Adli (2016) Nat Methods 13(12):983). 시티딘 염기 편집기는 DNA 결합 도메인, 예컨대 ZFP에 부착된다.
일부 실시양태에서, 편집기는 UGI 이량체를 추가로 포함한다 (도 5a 내지 5f 참조). UGI 이량체는 링커, 예컨대 L0 (LRGS, 서열식별번호: 76) 또는 N7a (SGTPHEVGVYTL, 서열식별번호: 28; 미국 특허 공개 번호 2017/0218349 참조)를 사용하여 ZFP DNA 결합 도메인에 부착된다. AID 또는 APOBEC1은 링커, 예컨대 L0 또는 서열, 예컨대 SGGGLGST (서열식별번호: 29; 문헌 [Yang, et al. (2016) Nat Commun DOI:10.1038/ncomms13330])를 통해 ZFP에 부착된다.
시티딘 염기 편집기는 또한 UGI 도메인 없이 구축된다. 일부 편집기는 하나의 파트너가 촉매적으로 불활성인 FokI 닉카제 도메인에 연결된 ZFP에 연결된 시티딘 편집기를 포함하는 쌍으로서 사용되도록 구축된다. 제2 파트너는 활성 FokI 도메인을 포함하여, 2개의 FokI 절반 도메인이 쌍을 형성하여 닉을 생성하는 데 작용할 수 있다. 시티딘 편집기 도메인은 UGI 이량체 어셈블리처럼 어느 한 절반에 있을 수 있다.
실시예 4: 부가의 염기 편집기
부가의 ABE 및/또는 CBE를 구축하고 시험한다.
특히, 실험은 (1) 임의로 ZFP 앵커에 작동가능하게 연결된 Cas9 닉카제; 및 (2) ABE 도메인 (예를 들어, 진화된 ABE 도메인)에 작동가능하게 연결된 ZFP를 포함하는 아데닌 염기 편집기를 사용하여 수행된다 (예를 들어, 도 1b, 하단 중간 패널 참조).
결과는 이들 염기 편집기가 질환 관련 돌연변이의 표적화된 편집에 효과적이라는 것을 보여주었다.
또한, 실험은 (1) 임의로 ZFP 앵커에 작동가능하게 연결된, 단일 가이드 RNA에 작동가능하게 연결된 dCas9 단백질; (2) ABE 도메인 (예를 들어, 진화된 ABE 도메인)에 작동가능하게 연결된 ZFP; 및 (3) ZFN 닉카제를 포함하는 ABE 염기 편집기를 사용하여 수행된다 (예를 들어, 도 1c 참조).
결과는 ZFN 닉카제를 포함한 염기 편집기가 dCas9 염기 편집기와 비교 시 염기 편집 효율성을 증가시킨 것으로 나타났다.
실시예 5: Cas9 무함유 염기 편집기
Cas9 무함유 염기 편집기를 또한 구축하고 평가한다. 구축물은 상기 기재된 바와 같이 사용되는 2개의 TadA 도메인이 있는 염기 편집기를 포함하며, 임의로 여기서 하나는 야생형이고 다른 하나는 진화된 것이며, 이들은 ZFP DNA 결합 도메인에 연결될 수 있다. 이러한 어셈블리는 단독으로 사용되거나, 또는 촉매적으로 불활성인 FokI 닉카제 도메인에 연결될 수 있다. 활성 FokI 도메인을 포함하는 또 다른 벡터와 조합하여 사용되는 경우, 아데닌 염기 편집기는 염기 편집의 교정을 방지하는 닉킹 활성을 갖는다. 만들어진 다른 비-Cas 염기 편집기가 도 1d에 도시되어 있다.
DNA 탈안정화 또는 풀림 인자를 포함하는 비-Cas 염기 편집기가 상기 구축되고 시험된다. DNA 탈안정화 인자는 ZFP 및/또는 ZFN 닉카제의 N-말단 또는 C-말단에 융합되거나 (도 1d 참조) 또는 ZFP 및/또는 닉카제와 독립적으로 도입된다.
특히, 도 1d에 도시된 바와 같은 염기 편집기가 생성된다. 이들 염기 편집기는 ZFP-데아미나제 융합 단백질 및 ZFN 닉카제를 포함한다. 또한, 이들 편집기는 그의 3' 단부 또는 5' 단부에 의해 ZFN 닉카제의 ZFP에 임의로 연결된 DNA 탈안정화 인자를 포함한다.
특히, 표 A에 제시된 바와 같이 하나 이상의 단백질 DNA 탈안정화 인자 [예를 들어, 헬리카제; DSB 복구 동안 D-루프 형성에 관여하는 인자 (예를 들어 Rad51, Rad52, RPA1, RPA2, RPA3 등); 및/또는 하나 이상의 CRISPR 단백질 (예를 들어, 비-Cas9 단백질)을 수반하거나 수반하지 않는 나선 탈안정화 단백질 (예를 들어 ICP8, 푸랄파 또는 송아지 흉선 DNA 나선 탈안정화 단백질)]를 포함하는 염기 편집기가 구축된다.
또 다른 한편으론, 또는 DNA 탈안정화 단백질 이외에, 하나 이상의 펩티드 핵산 (PNA); 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA)을 포함하는 염기 편집기가 구축된다. 특히, 하나 이상의 뉴클레오티드를 포함하는 염기 편집기가 구축되고 시험된다. PNA 및/또는 LNA를 포함하는 염기 편집기가 본원에 기재된 바와 같이 구축된다 (또한, 도 1d 및 도 8 참조).
결과에 따르면 Cas9 무함유 염기 편집기는 그의 표적 부위를 편집한다.
본원에 언급된 모든 특허, 특허 출원 및 간행물은 그 전체 내용이 본원에 참조로 포함된다.
본 개시내용은 이해의 명료함을 위해 예시 및 예로서 일부 상세하게 제공되었지만, 본 개시내용의 요지 또는 범위를 벗어나지 않고서도 다양한 변화 및 변형이 실시될 수 있다는 것이 관련 기술분야의 통상의 기술자에게 명백할 것이다. 따라서, 전술한 설명 및 예는 제한적인 것으로 해석되서는 안된다.
SEQUENCE LISTING
<110> SANGAMO THERAPEUTICS, INC.
<120> ENGINEERED TARGET SPECIFIC BASE EDITORS
<130> 8325-0180/S180-PCT
<140>
<141>
<150> 62/867,565
<151> 2019-06-27
<150> 62/817,153
<151> 2019-03-12
<150> 62/753,696
<151> 2018-10-31
<150> 62/721,903
<151> 2018-08-23
<160> 92
<170> PatentIn version 3.5
<210> 1
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(15)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (21)..(49)
<223> a, c, t, g, unknown or other
<400> 1
nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49
<210> 2
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 2
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
<210> 3
<211> 58
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 3
Gly Thr Gly Gly Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val
1 5 10 15
Pro Asp Tyr Ala Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Ser
20 25 30
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Ser Ala Ala Pro Ala Ala
35 40 45
Lys Lys Lys Lys Leu Asp Phe Glu Ser Glu
50 55
<210> 4
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 4
gtgctgacca tcgacgagaa agggactgaa gct 33
<210> 5
<211> 579
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: FokI
polypeptide
<400> 5
Met Val Ser Lys Ile Arg Thr Phe Gly Trp Val Gln Asn Pro Gly Lys
1 5 10 15
Phe Glu Asn Leu Lys Arg Val Val Gln Val Phe Asp Arg Asn Ser Lys
20 25 30
Val His Asn Glu Val Lys Asn Ile Lys Ile Pro Thr Leu Val Lys Glu
35 40 45
Ser Lys Ile Gln Lys Glu Leu Val Ala Ile Met Asn Gln His Asp Leu
50 55 60
Ile Tyr Thr Tyr Lys Glu Leu Val Gly Thr Gly Thr Ser Ile Arg Ser
65 70 75 80
Glu Ala Pro Cys Asp Ala Ile Ile Gln Ala Thr Ile Ala Asp Gln Gly
85 90 95
Asn Lys Lys Gly Tyr Ile Asp Asn Trp Ser Ser Asp Gly Phe Leu Arg
100 105 110
Trp Ala His Ala Leu Gly Phe Ile Glu Tyr Ile Asn Lys Ser Asp Ser
115 120 125
Phe Val Ile Thr Asp Val Gly Leu Ala Tyr Ser Lys Ser Ala Asp Gly
130 135 140
Ser Ala Ile Glu Lys Glu Ile Leu Ile Glu Ala Ile Ser Ser Tyr Pro
145 150 155 160
Pro Ala Ile Arg Ile Leu Thr Leu Leu Glu Asp Gly Gln His Leu Thr
165 170 175
Lys Phe Asp Leu Gly Lys Asn Leu Gly Phe Ser Gly Glu Ser Gly Phe
180 185 190
Thr Ser Leu Pro Glu Gly Ile Leu Leu Asp Thr Leu Ala Asn Ala Met
195 200 205
Pro Lys Asp Lys Gly Glu Ile Arg Asn Asn Trp Glu Gly Ser Ser Asp
210 215 220
Lys Tyr Ala Arg Met Ile Gly Gly Trp Leu Asp Lys Leu Gly Leu Val
225 230 235 240
Lys Gln Gly Lys Lys Glu Phe Ile Ile Pro Thr Leu Gly Lys Pro Asp
245 250 255
Asn Lys Glu Phe Ile Ser His Ala Phe Lys Ile Thr Gly Glu Gly Leu
260 265 270
Lys Val Leu Arg Arg Ala Lys Gly Ser Thr Lys Phe Thr Arg Val Pro
275 280 285
Lys Arg Val Tyr Trp Glu Met Leu Ala Thr Asn Leu Thr Asp Lys Glu
290 295 300
Tyr Val Arg Thr Arg Arg Ala Leu Ile Leu Glu Ile Leu Ile Lys Ala
305 310 315 320
Gly Ser Leu Lys Ile Glu Gln Ile Gln Asp Asn Leu Lys Lys Leu Gly
325 330 335
Phe Asp Glu Val Ile Glu Thr Ile Glu Asn Asp Ile Lys Gly Leu Ile
340 345 350
Asn Thr Gly Ile Phe Ile Glu Ile Lys Gly Arg Phe Tyr Gln Leu Lys
355 360 365
Asp His Ile Leu Gln Phe Val Ile Pro Asn Arg Gly Val Thr Lys Gln
370 375 380
Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys
385 390 395 400
Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg
405 410 415
Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe
420 425 430
Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys
435 440 445
Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val
450 455 460
Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly
465 470 475 480
Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn
485 490 495
Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val
500 505 510
Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr
515 520 525
Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala
530 535 540
Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala
545 550 555 560
Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu
565 570 575
Ile Asn Phe
<210> 6
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 6
atgtttttag aggccatacc catgtcta 28
<210> 7
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 7
gccatgtttt tagaggccat acccatgt 28
<210> 8
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 8
gggccatgtt tttagaggcc atacccat 28
<210> 9
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 9
ggggccatgt ttttagaggc cataccca 28
<210> 10
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 10
ctggggccat gtttttagag gccatacc 28
<210> 11
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 11
Thr Gln Ala Thr Leu Gly Val
1 5
<210> 12
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 12
Asp Arg Ser His Leu Ala Arg
1 5
<210> 13
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 13
Gln Ser Ala His Arg Lys Asn
1 5
<210> 14
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 14
Ser Thr Ala Ala Leu Ser Tyr
1 5
<210> 15
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 15
Thr Ser Gly Ser Leu Thr Arg
1 5
<210> 16
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 16
Ser Asn Gln Asn Leu Thr Thr
1 5
<210> 17
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 17
Thr Ser Gly Ser Leu Ser Arg
1 5
<210> 18
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 18
His Ser Ala Thr Leu Lys Tyr
1 5
<210> 19
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 19
Gln Asn Ala His Arg Lys Thr
1 5
<210> 20
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 20
Thr Ser Ser Asn Arg Ala Val
1 5
<210> 21
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 21
Arg Ser Asp Ala Leu Ser Thr
1 5
<210> 22
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 22
Asp Arg Ser Thr Arg Thr Lys
1 5
<210> 23
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 23
Asp Ser Ser His Arg Thr Arg
1 5
<210> 24
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 24
Asp Arg Ser Asp Leu Ser Arg
1 5
<210> 25
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 25
Arg Ser Thr His Leu Val Arg
1 5
<210> 26
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 26
Glu Arg Gly Thr Leu Ala Arg
1 5
<210> 27
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 27
Arg Ser Asp His Leu Ser Arg
1 5
<210> 28
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 28
Ser Gly Thr Pro His Glu Val Gly Val Tyr Thr Leu
1 5 10
<210> 29
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 29
Ser Gly Gly Gly Leu Gly Ser Thr
1 5
<210> 30
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 30
tgtgtctgt 9
<210> 31
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 31
tgtttctgt 9
<210> 32
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 32
tgttcctgt 9
<210> 33
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 33
tgtccctgt 9
<210> 34
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 34
tttaaattat ggagtatgtt tctgtgga 28
<210> 35
<211> 320
<212> PRT
<213> Bos sp.
<400> 35
Met Ser Lys Ser Glu Ser Pro Lys Glu Pro Glu Gln Leu Arg Lys Leu
1 5 10 15
Phe Ile Gly Gly Leu Ser Phe Glu Thr Thr Asp Glu Ser Leu Arg Ser
20 25 30
His Phe Glu Gln Trp Gly Thr Leu Thr Asp Cys Val Val Met Arg Asp
35 40 45
Pro Asn Thr Lys Arg Ser Arg Gly Phe Gly Phe Val Thr Tyr Ala Thr
50 55 60
Val Glu Glu Val Asp Ala Ala Met Asn Ala Arg Pro His Lys Val Asp
65 70 75 80
Gly Arg Val Val Glu Pro Lys Arg Ala Val Ser Arg Glu Asp Ser Gln
85 90 95
Arg Pro Gly Ala His Leu Thr Val Lys Lys Ile Phe Val Gly Gly Ile
100 105 110
Lys Glu Asp Thr Glu Glu His His Leu Arg Asp Tyr Phe Glu Gln Tyr
115 120 125
Gly Lys Ile Glu Val Ile Glu Ile Met Thr Asp Arg Gly Ser Gly Lys
130 135 140
Lys Arg Gly Phe Ala Phe Val Thr Phe Asp Asp His Asp Ser Val Asp
145 150 155 160
Lys Ile Val Ile Gln Lys Tyr His Thr Val Asn Gly His Asn Cys Glu
165 170 175
Val Arg Lys Ala Leu Ser Lys Gln Glu Met Ala Ser Ala Ser Ser Ser
180 185 190
Gln Arg Gly Arg Ser Gly Ser Gly Asn Phe Gly Gly Gly Arg Gly Gly
195 200 205
Gly Phe Gly Gly Asn Asp Asn Phe Gly Arg Gly Gly Asn Phe Ser Gly
210 215 220
Arg Gly Gly Phe Gly Gly Ser Arg Gly Gly Gly Gly Tyr Gly Gly Ser
225 230 235 240
Gly Asp Gly Tyr Asn Gly Phe Gly Asn Asp Gly Ser Asn Phe Gly Gly
245 250 255
Gly Gly Ser Tyr Asn Asp Phe Gly Asn Tyr Asn Asn Gln Ser Ser Asn
260 265 270
Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly Arg Ser Ser Gly Pro
275 280 285
Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro Arg Asn Gln Gly Gly
290 295 300
Tyr Gly Gly Ser Ser Ser Ser Ser Ser Tyr Gly Ser Gly Arg Arg Phe
305 310 315 320
<210> 36
<211> 587
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
BPT4 sequence
<400> 36
Met Asp Ile Lys Val His Phe His Asp Phe Ser His Val Arg Ile Asp
1 5 10 15
Cys Glu Glu Ser Thr Phe His Glu Leu Arg Asp Phe Phe Ser Phe Glu
20 25 30
Ala Asp Gly Tyr Arg Phe Asn Pro Arg Phe Arg Tyr Gly Asn Trp Asp
35 40 45
Gly Arg Ile Arg Leu Leu Asp Tyr Asn Arg Leu Leu Pro Phe Gly Leu
50 55 60
Val Gly Gln Ile Lys Lys Phe Cys Asp Asn Phe Gly Tyr Lys Ala Trp
65 70 75 80
Ile Asp Pro Gln Ile Asn Glu Lys Glu Glu Leu Ser Arg Lys Asp Phe
85 90 95
Asp Glu Trp Leu Ser Lys Leu Glu Ile Tyr Ser Gly Asn Lys Arg Ile
100 105 110
Glu Pro His Trp Tyr Gln Lys Asp Ala Val Phe Glu Gly Leu Val Asn
115 120 125
Arg Arg Arg Ile Leu Asn Leu Pro Thr Ser Ala Gly Lys Ser Leu Ile
130 135 140
Gln Ala Leu Leu Ala Arg Tyr Tyr Leu Glu Asn Tyr Glu Gly Lys Ile
145 150 155 160
Leu Ile Ile Val Pro Thr Thr Ala Leu Thr Thr Gln Met Ala Asp Asp
165 170 175
Phe Val Asp Tyr Arg Leu Phe Ser His Ala Met Ile Lys Lys Ile Gly
180 185 190
Gly Gly Ala Ser Lys Asp Asp Lys Tyr Lys Asn Asp Ala Pro Val Val
195 200 205
Val Gly Thr Trp Gln Thr Val Val Lys Gln Pro Lys Glu Trp Phe Ser
210 215 220
Gln Phe Gly Met Met Met Asn Asp Glu Cys His Leu Ala Thr Gly Lys
225 230 235 240
Ser Ile Ser Ser Ile Ile Ser Gly Leu Asn Asn Cys Met Phe Lys Phe
245 250 255
Gly Leu Ser Gly Ser Leu Arg Asp Gly Lys Ala Asn Ile Met Gln Tyr
260 265 270
Val Gly Met Phe Gly Glu Ile Phe Lys Pro Val Thr Thr Ser Lys Leu
275 280 285
Met Glu Asp Gly Gln Val Thr Glu Leu Lys Ile Asn Ser Ile Phe Leu
290 295 300
Arg Tyr Pro Asp Glu Phe Thr Thr Lys Leu Lys Gly Lys Thr Tyr Gln
305 310 315 320
Glu Glu Ile Lys Ile Ile Thr Gly Leu Ser Lys Arg Asn Lys Trp Ile
325 330 335
Ala Lys Leu Ala Ile Lys Leu Ala Gln Lys Asp Glu Asn Ala Phe Val
340 345 350
Met Phe Lys His Val Ser His Gly Lys Ala Ile Phe Asp Leu Ile Lys
355 360 365
Asn Glu Tyr Asp Lys Val Tyr Tyr Val Ser Gly Glu Val Asp Thr Glu
370 375 380
Thr Arg Asn Ile Met Lys Thr Leu Ala Glu Asn Gly Lys Gly Ile Ile
385 390 395 400
Ile Val Ala Ser Tyr Gly Val Phe Ser Thr Gly Ile Ser Val Lys Asn
405 410 415
Leu His His Val Val Leu Ala His Gly Val Lys Ser Lys Ile Ile Val
420 425 430
Leu Gln Thr Ile Gly Arg Val Leu Arg Lys His Gly Ser Lys Thr Ile
435 440 445
Ala Thr Val Trp Asp Leu Ile Asp Ser Ala Gly Val Lys Pro Lys Ser
450 455 460
Ala Asn Thr Lys Lys Lys Tyr Val His Leu Asn Tyr Leu Leu Lys His
465 470 475 480
Gly Ile Asp Arg Ile Gln Arg Tyr Ala Asp Glu Lys Phe Asn Tyr Val
485 490 495
Met Lys Thr Val Asn Leu Ile Ser Phe Gly Pro Leu Glu Lys Lys Met
500 505 510
Leu Leu Glu Phe Lys Gln Phe Leu Tyr Glu Ala Ser Ile Asp Glu Phe
515 520 525
Met Gly Lys Ile Ala Ser Cys Gln Thr Leu Glu Gly Leu Glu Glu Leu
530 535 540
Glu Ala Tyr Tyr Lys Lys Arg Val Lys Glu Thr Glu Leu Lys Asp Thr
545 550 555 560
Asp Asp Ile Ser Val Arg Asp Ala Leu Ala Gly Lys Arg Ala Glu Leu
565 570 575
Glu Asp Ser Asp Asp Glu Val Glu Glu Ser Phe
580 585
<210> 37
<211> 715
<212> PRT
<213> Deinococcus radiodurans
<400> 37
Met Ser Ala Ala Leu Pro Ala Glu Pro Phe Arg Val Ser Gly Gly Val
1 5 10 15
Asn Lys Val Arg Phe Arg Ser Asp Thr Gly Phe Thr Val Met Ser Ala
20 25 30
Thr Leu Arg Asn Glu Gln Gly Glu Asp Pro Asp Ala Thr Val Ile Gly
35 40 45
Val Met Pro Pro Leu Asp Val Gly Asp Thr Phe Ser Ala Glu Val Leu
50 55 60
Met Glu Glu His Arg Glu Tyr Gly Tyr Gln Tyr Arg Val Val Asn Met
65 70 75 80
Val Leu Glu Ala Met Pro Ala Asp Leu Ser Glu Glu Gly Val Ala Ala
85 90 95
Tyr Phe Glu Ala Arg Val Gly Gly Val Gly Lys Val Leu Ala Gly Arg
100 105 110
Ile Ala Lys Thr Phe Gly Ala Ala Ala Phe Asp Leu Leu Glu Asp Asp
115 120 125
Pro Gln Lys Phe Leu Gln Val Pro Gly Ile Thr Glu Ser Thr Leu His
130 135 140
Lys Met Val Ser Ser Trp Ser Gln Gln Gly Leu Glu Arg Arg Leu Leu
145 150 155 160
Ala Gly Leu Gln Gly Leu Gly Leu Thr Ile Asn Gln Ala Gln Arg Ala
165 170 175
Val Lys His Phe Gly Ala Asp Ala Leu Asp Arg Leu Glu Lys Asp Leu
180 185 190
Phe Thr Leu Thr Glu Val Glu Gly Ile Gly Phe Leu Thr Ala Asp Lys
195 200 205
Leu Trp Gln Ala Arg Gly Gly Ala Leu Asp Asp Pro Arg Arg Leu Thr
210 215 220
Ala Ala Ala Val Tyr Ala Leu Gln Leu Ala Gly Thr Gln Ala Gly His
225 230 235 240
Ser Phe Leu Pro Arg Ser Arg Ala Glu Lys Gly Val Val His Tyr Thr
245 250 255
Arg Val Thr Pro Gly Gln Ala Arg Leu Ala Val Glu Thr Ala Val Glu
260 265 270
Leu Gly Arg Leu Ser Glu Asp Asp Ser Pro Leu Phe Ala Ala Glu Ala
275 280 285
Ala Ala Thr Gly Glu Gly Arg Ile Tyr Leu Pro His Val Leu Arg Ala
290 295 300
Glu Lys Lys Leu Ala Ser Leu Ile Arg Thr Leu Leu Ala Thr Pro Pro
305 310 315 320
Ala Asp Gly Ala Gly Asn Asp Asp Trp Ala Val Pro Lys Lys Ala Arg
325 330 335
Lys Gly Leu Ser Glu Glu Gln Ala Ser Val Leu Asp Gln Leu Ala Gly
340 345 350
His Arg Leu Val Val Leu Thr Gly Gly Pro Gly Thr Gly Lys Ser Thr
355 360 365
Thr Thr Lys Ala Val Ala Asp Leu Ala Glu Ser Leu Gly Leu Glu Val
370 375 380
Gly Leu Cys Ala Pro Thr Gly Lys Ala Ala Arg Arg Leu Gly Glu Val
385 390 395 400
Thr Gly Arg Thr Ala Ser Thr Val His Arg Leu Leu Gly Tyr Gly Pro
405 410 415
Gln Gly Phe Arg His Asn His Leu Glu Pro Ala Pro Tyr Asp Leu Leu
420 425 430
Ile Val Asp Glu Val Ser Met Met Gly Asp Ala Leu Met Leu Ser Leu
435 440 445
Leu Ala Ala Val Pro Pro Gly Ala Arg Val Leu Leu Val Gly Asp Thr
450 455 460
Asp Gln Leu Pro Pro Val Asp Ala Gly Leu Pro Leu Leu Ala Leu Ala
465 470 475 480
Gln Ala Ala Pro Thr Ile Lys Leu Thr Gln Val Tyr Arg Gln Ala Ala
485 490 495
Lys Asn Pro Ile Ile Gln Ala Ala His Gly Leu Leu His Gly Glu Ala
500 505 510
Pro Ala Trp Gly Asp Lys Arg Leu Asn Leu Thr Glu Ile Glu Pro Asp
515 520 525
Gly Gly Ala Arg Arg Val Ala Leu Met Val Arg Glu Leu Gly Gly Pro
530 535 540
Gly Ala Val Gln Val Leu Thr Pro Met Arg Lys Gly Pro Leu Gly Met
545 550 555 560
Asp His Leu Asn Tyr His Leu Gln Ala Leu Phe Asn Pro Gly Glu Gly
565 570 575
Gly Val Arg Ile Ala Glu Gly Glu Ala Arg Pro Gly Asp Thr Val Val
580 585 590
Gln Thr Lys Asn Asp Tyr Asn Asn Glu Ile Phe Asn Gly Thr Leu Gly
595 600 605
Met Val Leu Lys Ala Glu Gly Ala Arg Leu Thr Val Asp Phe Asp Gly
610 615 620
Asn Val Val Glu Leu Thr Gly Ala Glu Leu Phe Asn Leu Gln Leu Gly
625 630 635 640
Tyr Ala Leu Thr Val His Arg Ala Gln Gly Ser Glu Trp Gly Thr Val
645 650 655
Leu Gly Val Leu His Glu Ala His Met Pro Met Leu Ser Arg Asn Leu
660 665 670
Val Tyr Thr Ala Leu Thr Arg Ala Arg Asp Arg Phe Phe Ser Ala Gly
675 680 685
Ser Ala Ser Ala Trp Gln Ile Ala Ala Ala Arg Gln Arg Glu Ala Arg
690 695 700
Asn Thr Ala Leu Leu Glu Arg Ile Arg Ala His
705 710 715
<210> 38
<211> 353
<212> PRT
<213> Escherichia coli
<400> 38
Met Ala Ile Asp Glu Asn Lys Gln Lys Ala Leu Ala Ala Ala Leu Gly
1 5 10 15
Gln Ile Glu Lys Gln Phe Gly Lys Gly Ser Ile Met Arg Leu Gly Glu
20 25 30
Asp Arg Ser Met Asp Val Glu Thr Ile Ser Thr Gly Ser Leu Ser Leu
35 40 45
Asp Ile Ala Leu Gly Ala Gly Gly Leu Pro Met Gly Arg Ile Val Glu
50 55 60
Ile Tyr Gly Pro Glu Ser Ser Gly Lys Thr Thr Leu Thr Leu Gln Val
65 70 75 80
Ile Ala Ala Ala Gln Arg Glu Gly Lys Thr Cys Ala Phe Ile Asp Ala
85 90 95
Glu His Ala Leu Asp Pro Ile Tyr Ala Arg Lys Leu Gly Val Asp Ile
100 105 110
Asp Asn Leu Leu Cys Ser Gln Pro Asp Thr Gly Glu Gln Ala Leu Glu
115 120 125
Ile Cys Asp Ala Leu Ala Arg Ser Gly Ala Val Asp Val Ile Val Val
130 135 140
Asp Ser Val Ala Ala Leu Thr Pro Lys Ala Glu Ile Glu Gly Glu Ile
145 150 155 160
Gly Asp Ser His Met Gly Leu Ala Ala Arg Met Met Ser Gln Ala Met
165 170 175
Arg Lys Leu Ala Gly Asn Leu Lys Gln Ser Asn Thr Leu Leu Ile Phe
180 185 190
Ile Asn Gln Ile Arg Met Lys Ile Gly Val Met Phe Gly Asn Pro Glu
195 200 205
Thr Thr Thr Gly Gly Asn Ala Leu Lys Phe Tyr Ala Ser Val Arg Leu
210 215 220
Asp Ile Arg Arg Ile Gly Ala Val Lys Glu Gly Glu Asn Val Val Gly
225 230 235 240
Ser Glu Thr Arg Val Lys Val Val Lys Asn Lys Ile Ala Ala Pro Phe
245 250 255
Lys Gln Ala Glu Phe Gln Ile Leu Tyr Gly Glu Gly Ile Asn Phe Tyr
260 265 270
Gly Glu Leu Val Asp Leu Gly Val Lys Glu Lys Leu Ile Glu Lys Ala
275 280 285
Gly Ala Trp Tyr Ser Tyr Lys Gly Glu Lys Ile Gly Gln Gly Lys Ala
290 295 300
Asn Ala Thr Ala Trp Leu Lys Asp Asn Pro Glu Thr Ala Lys Glu Ile
305 310 315 320
Glu Lys Lys Val Arg Glu Leu Leu Leu Ser Asn Pro Asn Ser Thr Pro
325 330 335
Asp Phe Ser Val Asp Asp Ser Glu Gly Val Ala Glu Thr Asn Glu Asp
340 345 350
Phe
<210> 39
<211> 1180
<212> PRT
<213> Escherichia coli
<400> 39
Met Ser Asp Val Ala Glu Thr Leu Asp Pro Leu Arg Leu Pro Leu Gln
1 5 10 15
Gly Glu Arg Leu Ile Glu Ala Ser Ala Gly Thr Gly Lys Thr Phe Thr
20 25 30
Ile Ala Ala Leu Tyr Leu Arg Leu Leu Leu Gly Leu Gly Gly Ser Ala
35 40 45
Ala Phe Pro Arg Pro Leu Thr Val Glu Glu Leu Leu Val Val Thr Phe
50 55 60
Thr Glu Ala Ala Thr Ala Glu Leu Arg Gly Arg Ile Arg Ser Asn Ile
65 70 75 80
His Glu Leu Arg Ile Ala Cys Leu Arg Glu Thr Thr Asp Asn Pro Leu
85 90 95
Tyr Glu Arg Leu Leu Glu Glu Ile Asp Asp Lys Ala Gln Ala Ala Gln
100 105 110
Trp Leu Leu Leu Ala Glu Arg Gln Met Asp Glu Ala Ala Val Phe Thr
115 120 125
Ile His Gly Phe Cys Gln Arg Met Leu Asn Leu Asn Ala Phe Glu Ser
130 135 140
Gly Met Leu Phe Glu Gln Gln Leu Ile Glu Asp Glu Ser Leu Leu Arg
145 150 155 160
Tyr Gln Ala Cys Ala Asp Phe Trp Arg Arg His Cys Tyr Pro Leu Pro
165 170 175
Arg Glu Ile Ala Gln Val Val Phe Glu Thr Trp Lys Gly Pro Gln Ala
180 185 190
Leu Leu Arg Asp Ile Asn Arg Tyr Leu Gln Gly Glu Ala Pro Val Ile
195 200 205
Lys Ala Pro Pro Pro Asp Asp Glu Thr Leu Ala Ser Arg His Ala Gln
210 215 220
Ile Val Ala Arg Ile Asp Thr Val Lys Gln Gln Trp Arg Asp Ala Val
225 230 235 240
Gly Glu Leu Asp Ala Leu Ile Glu Ser Ser Gly Ile Asp Arg Arg Lys
245 250 255
Phe Asn Arg Ser Asn Gln Ala Lys Trp Ile Asp Lys Ile Ser Ala Trp
260 265 270
Ala Glu Glu Glu Thr Asn Ser Tyr Gln Leu Pro Glu Ser Leu Glu Lys
275 280 285
Phe Ser Gln Arg Phe Leu Glu Asp Arg Thr Lys Ala Gly Gly Glu Thr
290 295 300
Pro Arg His Pro Leu Phe Glu Ala Ile Asp Gln Leu Leu Ala Glu Pro
305 310 315 320
Leu Ser Ile Arg Asp Leu Val Ile Thr Arg Ala Leu Ala Glu Ile Arg
325 330 335
Glu Thr Val Ala Arg Glu Lys Arg Arg Arg Gly Glu Leu Gly Phe Asp
340 345 350
Asp Met Leu Ser Arg Leu Asp Ser Ala Leu Arg Ser Glu Ser Gly Glu
355 360 365
Val Leu Ala Ala Ala Ile Arg Thr Arg Phe Pro Val Ala Met Ile Asp
370 375 380
Glu Phe Gln Asp Thr Asp Pro Gln Gln Tyr Arg Ile Phe Arg Arg Ile
385 390 395 400
Trp His His Gln Pro Glu Thr Ala Leu Leu Leu Ile Gly Asp Pro Lys
405 410 415
Gln Ala Ile Tyr Ala Phe Arg Gly Ala Asp Ile Phe Thr Tyr Met Lys
420 425 430
Ala Arg Ser Glu Val His Ala His Tyr Thr Leu Asp Thr Asn Trp Arg
435 440 445
Ser Ala Pro Gly Met Val Asn Ser Val Asn Lys Leu Phe Ser Gln Thr
450 455 460
Asp Asp Ala Phe Met Phe Arg Glu Ile Pro Phe Ile Pro Val Lys Ser
465 470 475 480
Ala Gly Lys Asn Gln Ala Leu Arg Phe Val Phe Lys Gly Glu Thr Gln
485 490 495
Pro Ala Met Lys Met Trp Leu Met Glu Gly Glu Ser Cys Gly Val Gly
500 505 510
Asp Tyr Gln Ser Thr Met Ala Gln Val Cys Ala Ala Gln Ile Arg Asp
515 520 525
Trp Leu Gln Ala Gly Gln Arg Gly Glu Ala Leu Leu Met Asn Gly Asp
530 535 540
Asp Ala Arg Pro Val Arg Ala Ser Asp Ile Ser Val Leu Val Arg Ser
545 550 555 560
Arg Gln Glu Ala Ala Gln Val Arg Asp Ala Leu Thr Leu Leu Glu Ile
565 570 575
Pro Ser Val Tyr Leu Ser Asn Arg Asp Ser Val Phe Glu Thr Leu Glu
580 585 590
Ala Gln Glu Met Leu Trp Leu Leu Gln Ala Val Met Thr Pro Glu Arg
595 600 605
Glu Asn Thr Leu Arg Ser Ala Leu Ala Thr Ser Met Met Gly Leu Asn
610 615 620
Ala Leu Asp Ile Glu Thr Leu Asn Asn Asp Glu His Ala Trp Asp Val
625 630 635 640
Val Val Glu Glu Phe Asp Gly Tyr Arg Gln Ile Trp Arg Lys Arg Gly
645 650 655
Val Met Pro Met Leu Arg Ala Leu Met Ser Ala Arg Asn Ile Ala Glu
660 665 670
Asn Leu Leu Ala Thr Ala Gly Gly Glu Arg Arg Leu Thr Asp Ile Leu
675 680 685
His Ile Ser Glu Leu Leu Gln Glu Ala Gly Thr Gln Leu Glu Ser Glu
690 695 700
His Ala Leu Val Arg Trp Leu Ser Gln His Ile Leu Glu Pro Asp Ser
705 710 715 720
Asn Ala Ser Ser Gln Gln Met Arg Leu Glu Ser Asp Lys His Leu Val
725 730 735
Gln Ile Val Thr Ile His Lys Ser Lys Gly Leu Glu Tyr Pro Leu Val
740 745 750
Trp Leu Pro Phe Ile Thr Asn Phe Arg Val Gln Glu Gln Ala Phe Tyr
755 760 765
His Asp Arg His Ser Phe Glu Ala Val Leu Asp Leu Asn Ala Ala Pro
770 775 780
Glu Ser Val Asp Leu Ala Glu Ala Glu Arg Leu Ala Glu Asp Leu Arg
785 790 795 800
Leu Leu Tyr Val Ala Leu Thr Arg Ser Val Trp His Cys Ser Leu Gly
805 810 815
Val Ala Pro Leu Val Arg Arg Arg Gly Asp Lys Lys Gly Asp Thr Asp
820 825 830
Val His Gln Ser Ala Leu Gly Arg Leu Leu Gln Lys Gly Glu Pro Gln
835 840 845
Asp Ala Ala Gly Leu Arg Thr Cys Ile Glu Ala Leu Cys Asp Asp Asp
850 855 860
Ile Ala Trp Gln Thr Ala Gln Thr Gly Asp Asn Gln Pro Trp Gln Val
865 870 875 880
Asn Asp Val Ser Thr Ala Glu Leu Asn Ala Lys Thr Leu Gln Arg Leu
885 890 895
Pro Gly Asp Asn Trp Arg Val Thr Ser Tyr Ser Gly Leu Gln Gln Arg
900 905 910
Gly His Gly Ile Ala Gln Asp Leu Met Pro Arg Leu Asp Val Asp Ala
915 920 925
Ala Gly Val Ala Ser Val Val Glu Glu Pro Thr Leu Thr Pro His Gln
930 935 940
Phe Pro Arg Gly Ala Ser Pro Gly Thr Phe Leu His Ser Leu Phe Glu
945 950 955 960
Asp Leu Asp Phe Thr Gln Pro Val Asp Pro Asn Trp Val Arg Glu Lys
965 970 975
Leu Glu Leu Gly Gly Phe Glu Ser Gln Trp Glu Pro Val Leu Thr Glu
980 985 990
Trp Ile Thr Ala Val Leu Gln Ala Pro Leu Asn Glu Thr Gly Val Ser
995 1000 1005
Leu Ser Gln Leu Ser Ala Arg Asn Lys Gln Val Glu Met Glu Phe
1010 1015 1020
Tyr Leu Pro Ile Ser Glu Pro Leu Ile Ala Ser Gln Leu Asp Thr
1025 1030 1035
Leu Ile Arg Gln Phe Asp Pro Leu Ser Ala Gly Cys Pro Pro Leu
1040 1045 1050
Glu Phe Met Gln Val Arg Gly Met Leu Lys Gly Phe Ile Asp Leu
1055 1060 1065
Val Phe Arg His Glu Gly Arg Tyr Tyr Leu Leu Asp Tyr Lys Ser
1070 1075 1080
Asn Trp Leu Gly Glu Asp Ser Ser Ala Tyr Thr Gln Gln Ala Met
1085 1090 1095
Ala Ala Ala Met Gln Ala His Arg Tyr Asp Leu Gln Tyr Gln Leu
1100 1105 1110
Tyr Thr Leu Ala Leu His Arg Tyr Leu Arg His Arg Ile Ala Asp
1115 1120 1125
Tyr Asp Tyr Glu His His Phe Gly Gly Val Ile Tyr Leu Phe Leu
1130 1135 1140
Arg Gly Val Asp Lys Glu His Pro Gln Gln Gly Ile Tyr Thr Thr
1145 1150 1155
Arg Pro Asn Ala Gly Leu Ile Ala Leu Met Asp Glu Met Phe Ala
1160 1165 1170
Gly Met Thr Leu Glu Glu Ala
1175 1180
<210> 40
<211> 1122
<212> PRT
<213> Escherichia coli
<400> 40
Met Leu Arg Val Tyr His Ser Asn Arg Leu Asp Val Leu Glu Ala Leu
1 5 10 15
Met Glu Phe Ile Val Glu Arg Glu Arg Leu Asp Asp Pro Phe Glu Pro
20 25 30
Glu Met Ile Leu Val Gln Ser Thr Gly Met Ala Gln Trp Leu Gln Met
35 40 45
Thr Leu Ser Gln Lys Phe Gly Ile Ala Ala Asn Ile Asp Phe Pro Leu
50 55 60
Pro Ala Ser Phe Ile Trp Asp Met Phe Val Arg Val Leu Pro Glu Ile
65 70 75 80
Pro Lys Glu Ser Ala Phe Asn Lys Gln Ser Met Ser Trp Lys Leu Met
85 90 95
Thr Leu Leu Pro Gln Leu Leu Glu Arg Glu Asp Phe Thr Leu Leu Arg
100 105 110
His Tyr Leu Thr Asp Asp Ser Asp Lys Arg Lys Leu Phe Gln Leu Ser
115 120 125
Ser Lys Ala Ala Asp Leu Phe Asp Gln Tyr Leu Val Tyr Arg Pro Asp
130 135 140
Trp Leu Ala Gln Trp Glu Thr Gly His Leu Val Glu Gly Leu Gly Glu
145 150 155 160
Ala Gln Ala Trp Gln Ala Pro Leu Trp Lys Ala Leu Val Glu Tyr Thr
165 170 175
His Gln Leu Gly Gln Pro Arg Trp His Arg Ala Asn Leu Tyr Gln Arg
180 185 190
Phe Ile Glu Thr Leu Glu Ser Ala Thr Thr Cys Pro Pro Gly Leu Pro
195 200 205
Ser Arg Val Phe Ile Cys Gly Ile Ser Ala Leu Pro Pro Val Tyr Leu
210 215 220
Gln Ala Leu Gln Ala Leu Gly Lys His Ile Glu Ile His Leu Leu Phe
225 230 235 240
Thr Asn Pro Cys Arg Tyr Tyr Trp Gly Asp Ile Lys Asp Pro Ala Tyr
245 250 255
Leu Ala Lys Leu Leu Thr Arg Gln Arg Arg His Ser Phe Glu Asp Arg
260 265 270
Glu Leu Pro Leu Phe Arg Asp Ser Glu Asn Ala Gly Gln Leu Phe Asn
275 280 285
Ser Asp Gly Glu Gln Asp Val Gly Asn Pro Leu Leu Ala Ser Trp Gly
290 295 300
Lys Leu Gly Arg Asp Tyr Ile Tyr Leu Leu Ser Asp Leu Glu Ser Ser
305 310 315 320
Gln Glu Leu Asp Ala Phe Val Asp Val Thr Pro Asp Asn Leu Leu His
325 330 335
Asn Ile Gln Ser Asp Ile Leu Glu Leu Glu Asn Arg Ala Val Ala Gly
340 345 350
Val Asn Ile Glu Glu Phe Ser Arg Ser Asp Asn Lys Arg Pro Leu Asp
355 360 365
Pro Leu Asp Ser Ser Ile Thr Phe His Val Cys His Ser Pro Gln Arg
370 375 380
Glu Val Glu Val Leu His Asp Arg Leu Leu Ala Met Leu Glu Glu Asp
385 390 395 400
Pro Thr Leu Thr Pro Arg Asp Ile Ile Val Met Val Ala Asp Ile Asp
405 410 415
Ser Tyr Ser Pro Phe Ile Gln Ala Val Phe Gly Ser Ala Pro Ala Asp
420 425 430
Arg Tyr Leu Pro Tyr Ala Ile Ser Asp Arg Arg Ala Arg Gln Ser His
435 440 445
Pro Val Leu Glu Ala Phe Ile Ser Leu Leu Ser Leu Pro Asp Ser Arg
450 455 460
Phe Val Ser Glu Asp Val Leu Ala Leu Leu Asp Val Pro Val Leu Ala
465 470 475 480
Ala Arg Phe Asp Ile Thr Glu Glu Gly Leu Arg Tyr Leu Arg Gln Trp
485 490 495
Val Asn Glu Ser Gly Ile Arg Trp Gly Ile Asp Asp Asp Asn Val Arg
500 505 510
Glu Leu Glu Leu Pro Ala Thr Gly Gln His Thr Trp Arg Phe Gly Leu
515 520 525
Thr Arg Met Leu Leu Gly Tyr Ala Met Glu Ser Ala Gln Gly Glu Trp
530 535 540
Gln Ser Val Leu Pro Tyr Asp Glu Ser Ser Gly Leu Ile Ala Glu Leu
545 550 555 560
Val Gly His Leu Ala Ser Leu Leu Met Gln Leu Asn Ile Trp Arg Arg
565 570 575
Gly Leu Ala Gln Glu Arg Pro Leu Glu Glu Trp Leu Pro Val Cys Arg
580 585 590
Asp Met Leu Asn Ala Phe Phe Leu Pro Asp Ala Glu Thr Glu Ala Ala
595 600 605
Met Thr Leu Ile Glu Gln Gln Trp Gln Ala Ile Ile Ala Glu Gly Leu
610 615 620
Gly Ala Gln Tyr Gly Asp Ala Val Pro Leu Ser Leu Leu Arg Asp Glu
625 630 635 640
Leu Ala Gln Arg Leu Asp Gln Glu Arg Ile Ser Gln Arg Phe Leu Ala
645 650 655
Gly Pro Val Asn Ile Cys Thr Leu Met Pro Met Arg Ser Ile Pro Phe
660 665 670
Lys Val Val Cys Leu Leu Gly Met Asn Asp Gly Val Tyr Pro Arg Gln
675 680 685
Leu Ala Pro Leu Gly Phe Asp Leu Met Ser Gln Lys Pro Lys Arg Gly
690 695 700
Asp Arg Ser Arg Arg Asp Asp Asp Arg Tyr Leu Phe Leu Glu Ala Leu
705 710 715 720
Ile Ser Ala Gln Gln Lys Leu Tyr Ile Ser Tyr Ile Gly Arg Ser Ile
725 730 735
Gln Asp Asn Ser Glu Arg Phe Pro Ser Val Leu Val Gln Glu Leu Ile
740 745 750
Asp Tyr Ile Gly Gln Ser His Tyr Leu Pro Gly Asp Glu Ala Leu Asn
755 760 765
Cys Asp Glu Ser Glu Ala Arg Val Lys Ala His Leu Thr Cys Leu His
770 775 780
Thr Arg Met Pro Phe Asp Pro Gln Asn Tyr Gln Pro Gly Glu Arg Gln
785 790 795 800
Ser Tyr Ala Arg Glu Trp Leu Pro Ala Ala Ser Gln Ala Gly Lys Ala
805 810 815
His Ser Glu Phe Val Gln Pro Leu Pro Phe Thr Leu Pro Glu Thr Val
820 825 830
Pro Leu Glu Thr Leu Gln Arg Phe Trp Ala His Pro Val Arg Ala Phe
835 840 845
Phe Gln Met Arg Leu Gln Val Asn Phe Arg Thr Glu Asp Ser Glu Ile
850 855 860
Pro Asp Thr Glu Pro Phe Ile Leu Glu Gly Leu Ser Arg Tyr Gln Ile
865 870 875 880
Asn Gln Gln Leu Leu Asn Ala Leu Val Glu Gln Asp Asp Ala Glu Arg
885 890 895
Leu Phe Arg Arg Phe Arg Ala Ala Gly Asp Leu Pro Tyr Gly Ala Phe
900 905 910
Gly Glu Ile Phe Trp Glu Thr Gln Cys Gln Glu Met Gln Gln Leu Ala
915 920 925
Asp Arg Val Ile Ala Cys Arg Gln Pro Gly Gln Ser Met Glu Ile Asp
930 935 940
Leu Ala Cys Asn Gly Val Gln Ile Thr Gly Trp Leu Pro Gln Val Gln
945 950 955 960
Pro Asp Gly Leu Leu Arg Trp Arg Pro Ser Leu Leu Ser Val Ala Gln
965 970 975
Gly Met Gln Leu Trp Leu Glu His Leu Val Tyr Cys Ala Ser Gly Gly
980 985 990
Asn Gly Glu Ser Arg Leu Phe Leu Arg Lys Asp Gly Glu Trp Arg Phe
995 1000 1005
Pro Pro Leu Ala Ala Glu Gln Ala Leu His Tyr Leu Ser Gln Leu
1010 1015 1020
Ile Glu Gly Tyr Arg Glu Gly Met Ser Ala Pro Leu Leu Val Leu
1025 1030 1035
Pro Glu Ser Gly Gly Ala Trp Leu Lys Thr Cys Tyr Asp Ala Gln
1040 1045 1050
Asn Asp Ala Met Leu Asp Asp Asp Ser Thr Leu Gln Lys Ala Arg
1055 1060 1065
Thr Lys Phe Leu Gln Ala Tyr Glu Gly Asn Met Met Val Arg Gly
1070 1075 1080
Glu Gly Asp Asp Ile Trp Tyr Gln Arg Leu Trp Arg Gln Leu Thr
1085 1090 1095
Pro Glu Thr Met Glu Ala Ile Val Glu Gln Ser Gln Arg Phe Leu
1100 1105 1110
Leu Pro Leu Phe Arg Phe Asn Gln Ser
1115 1120
<210> 41
<211> 608
<212> PRT
<213> Escherichia coli
<400> 41
Met Lys Leu Gln Lys Gln Leu Leu Glu Ala Val Glu His Lys Gln Leu
1 5 10 15
Arg Pro Leu Asp Val Gln Phe Ala Leu Thr Val Ala Gly Asp Glu His
20 25 30
Pro Ala Val Thr Leu Ala Ala Ala Leu Leu Ser His Asp Ala Gly Glu
35 40 45
Gly His Val Cys Leu Pro Leu Ser Arg Leu Glu Asn Asn Glu Ala Ser
50 55 60
His Pro Leu Leu Ala Thr Cys Val Ser Glu Ile Gly Glu Leu Gln Asn
65 70 75 80
Trp Glu Glu Cys Leu Leu Ala Ser Gln Ala Val Ser Arg Gly Asp Glu
85 90 95
Pro Thr Pro Met Ile Leu Cys Gly Asp Arg Leu Tyr Leu Asn Arg Met
100 105 110
Trp Cys Asn Glu Arg Thr Val Ala Arg Phe Phe Asn Glu Val Asn His
115 120 125
Ala Ile Glu Val Asp Glu Ala Leu Leu Ala Gln Thr Leu Asp Lys Leu
130 135 140
Phe Pro Val Ser Asp Glu Ile Asn Trp Gln Lys Val Ala Ala Ala Val
145 150 155 160
Ala Leu Thr Arg Arg Ile Ser Val Ile Ser Gly Gly Pro Gly Thr Gly
165 170 175
Lys Thr Thr Thr Val Ala Lys Leu Leu Ala Ala Leu Ile Gln Met Ala
180 185 190
Asp Gly Glu Arg Cys Arg Ile Arg Leu Ala Ala Pro Thr Gly Lys Ala
195 200 205
Ala Ala Arg Leu Thr Glu Ser Leu Gly Lys Ala Leu Arg Gln Leu Pro
210 215 220
Leu Thr Asp Glu Gln Lys Lys Arg Ile Pro Glu Asp Ala Ser Thr Leu
225 230 235 240
His Arg Leu Leu Gly Ala Gln Pro Gly Ser Gln Arg Leu Arg His His
245 250 255
Ala Gly Asn Pro Leu His Leu Asp Val Leu Val Val Asp Glu Ala Ser
260 265 270
Met Ile Asp Leu Pro Met Met Ser Arg Leu Ile Asp Ala Leu Pro Asp
275 280 285
His Ala Arg Val Ile Phe Leu Gly Asp Arg Asp Gln Leu Ala Ser Val
290 295 300
Glu Ala Gly Ala Val Leu Gly Asp Ile Cys Ala Tyr Ala Asn Ala Gly
305 310 315 320
Phe Thr Ala Glu Arg Ala Arg Gln Leu Ser Arg Leu Thr Gly Thr His
325 330 335
Val Pro Ala Gly Thr Gly Thr Glu Ala Ala Ser Leu Arg Asp Ser Leu
340 345 350
Cys Leu Leu Gln Lys Ser Tyr Arg Phe Gly Ser Asp Ser Gly Ile Gly
355 360 365
Gln Leu Ala Ala Ala Ile Asn Arg Gly Asp Lys Thr Ala Val Lys Thr
370 375 380
Val Phe Gln Gln Asp Phe Thr Asp Ile Glu Lys Arg Leu Leu Gln Ser
385 390 395 400
Gly Glu Asp Tyr Ile Ala Met Leu Glu Glu Ala Leu Ala Gly Tyr Gly
405 410 415
Arg Tyr Leu Asp Leu Leu Gln Ala Arg Ala Glu Pro Asp Leu Ile Ile
420 425 430
Gln Ala Phe Asn Glu Tyr Gln Leu Leu Cys Ala Leu Arg Glu Gly Pro
435 440 445
Phe Gly Val Ala Gly Leu Asn Glu Arg Ile Glu Gln Phe Met Gln Gln
450 455 460
Lys Arg Lys Ile His Arg His Pro His Ser Arg Trp Tyr Glu Gly Arg
465 470 475 480
Pro Val Met Ile Ala Arg Asn Asp Ser Ala Leu Gly Leu Phe Asn Gly
485 490 495
Asp Ile Gly Ile Ala Leu Asp Arg Gly Gln Gly Thr Arg Val Trp Phe
500 505 510
Ala Met Pro Asp Gly Asn Ile Lys Ser Val Gln Pro Ser Arg Leu Pro
515 520 525
Glu His Glu Thr Thr Trp Ala Met Thr Val His Lys Ser Gln Gly Ser
530 535 540
Glu Phe Asp His Ala Ala Leu Ile Leu Pro Ser Gln Arg Thr Pro Val
545 550 555 560
Val Thr Arg Glu Leu Val Tyr Thr Ala Val Thr Arg Ala Arg Arg Arg
565 570 575
Leu Ser Leu Tyr Ala Asp Glu Arg Ile Leu Ser Ala Ala Ile Ala Thr
580 585 590
Arg Thr Glu Arg Arg Ser Gly Leu Ala Ala Leu Phe Ser Ser Arg Glu
595 600 605
<210> 42
<211> 609
<212> PRT
<213> Escherichia coli
<400> 42
Met Ala Gln Ala Glu Val Leu Asn Leu Glu Ser Gly Ala Lys Gln Val
1 5 10 15
Leu Gln Glu Thr Phe Gly Tyr Gln Gln Phe Arg Pro Gly Gln Glu Glu
20 25 30
Ile Ile Asp Thr Val Leu Ser Gly Arg Asp Cys Leu Val Val Met Pro
35 40 45
Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Ile Pro Ala Leu Leu Leu
50 55 60
Asn Gly Leu Thr Val Val Val Ser Pro Leu Ile Ser Leu Met Lys Asp
65 70 75 80
Gln Val Asp Gln Leu Gln Ala Asn Gly Val Ala Ala Ala Cys Leu Asn
85 90 95
Ser Thr Gln Thr Arg Glu Gln Gln Leu Glu Val Met Thr Gly Cys Arg
100 105 110
Thr Gly Gln Ile Arg Leu Leu Tyr Ile Ala Pro Glu Arg Leu Met Leu
115 120 125
Asp Asn Phe Leu Glu His Leu Ala His Trp Asn Pro Val Leu Leu Ala
130 135 140
Val Asp Glu Ala His Cys Ile Ser Gln Trp Gly His Asp Phe Arg Pro
145 150 155 160
Glu Tyr Ala Ala Leu Gly Gln Leu Arg Gln Arg Phe Pro Thr Leu Pro
165 170 175
Phe Met Ala Leu Thr Ala Thr Ala Asp Asp Thr Thr Arg Gln Asp Ile
180 185 190
Val Arg Leu Leu Gly Leu Asn Asp Pro Leu Ile Gln Ile Ser Ser Phe
195 200 205
Asp Arg Pro Asn Ile Arg Tyr Met Leu Met Glu Lys Phe Lys Pro Leu
210 215 220
Asp Gln Leu Met Arg Tyr Val Gln Glu Gln Arg Gly Lys Ser Gly Ile
225 230 235 240
Ile Tyr Cys Asn Ser Arg Ala Lys Val Glu Asp Thr Ala Ala Arg Leu
245 250 255
Gln Ser Lys Gly Ile Ser Ala Ala Ala Tyr His Ala Gly Leu Glu Asn
260 265 270
Asn Val Arg Ala Asp Val Gln Glu Lys Phe Gln Arg Asp Asp Leu Gln
275 280 285
Ile Val Val Ala Thr Val Ala Phe Gly Met Gly Ile Asn Lys Pro Asn
290 295 300
Val Arg Phe Val Val His Phe Asp Ile Pro Arg Asn Ile Glu Ser Tyr
305 310 315 320
Tyr Gln Glu Thr Gly Arg Ala Gly Arg Asp Gly Leu Pro Ala Glu Ala
325 330 335
Met Leu Phe Tyr Asp Pro Ala Asp Met Ala Trp Leu Arg Arg Cys Leu
340 345 350
Glu Glu Lys Pro Gln Gly Gln Leu Gln Asp Ile Glu Arg His Lys Leu
355 360 365
Asn Ala Met Gly Ala Phe Ala Glu Ala Gln Thr Cys Arg Arg Leu Val
370 375 380
Leu Leu Asn Tyr Phe Gly Glu Gly Arg Gln Glu Pro Cys Gly Asn Cys
385 390 395 400
Asp Ile Cys Leu Asp Pro Pro Lys Gln Tyr Asp Gly Ser Thr Asp Ala
405 410 415
Gln Ile Ala Leu Ser Thr Ile Gly Arg Val Asn Gln Arg Phe Gly Met
420 425 430
Gly Tyr Val Val Glu Val Ile Arg Gly Ala Asn Asn Gln Arg Ile Arg
435 440 445
Asp Tyr Gly His Asp Lys Leu Lys Val Tyr Gly Met Gly Arg Asp Lys
450 455 460
Ser His Glu His Trp Val Ser Val Ile Arg Gln Leu Ile His Leu Gly
465 470 475 480
Leu Val Thr Gln Asn Ile Ala Gln His Ser Ala Leu Gln Leu Thr Glu
485 490 495
Ala Ala Arg Pro Val Leu Arg Gly Glu Ser Ser Leu Gln Leu Ala Val
500 505 510
Pro Arg Ile Val Ala Leu Lys Pro Lys Ala Met Gln Lys Ser Phe Gly
515 520 525
Gly Asn Tyr Asp Arg Lys Leu Phe Ala Lys Leu Arg Lys Leu Arg Lys
530 535 540
Ser Ile Ala Asp Glu Ser Asn Val Pro Pro Tyr Val Val Phe Asn Asp
545 550 555 560
Ala Thr Leu Ile Glu Met Ala Glu Gln Met Pro Ile Thr Ala Ser Glu
565 570 575
Met Leu Ser Val Asn Gly Val Gly Met Arg Lys Leu Glu Arg Phe Gly
580 585 590
Lys Pro Phe Met Ala Leu Ile Arg Ala His Val Asp Gly Asp Asp Glu
595 600 605
Glu
<210> 43
<211> 508
<212> PRT
<213> Escherichia coli
<400> 43
Met Arg Leu Asn Pro Gly Gln Gln Gln Ala Val Glu Phe Val Thr Gly
1 5 10 15
Pro Cys Leu Val Leu Ala Gly Ala Gly Ser Gly Lys Thr Arg Val Ile
20 25 30
Thr Asn Lys Ile Ala His Leu Ile Arg Gly Cys Gly Tyr Gln Ala Arg
35 40 45
His Ile Ala Ala Val Thr Phe Thr Asn Lys Ala Ala Arg Glu Met Lys
50 55 60
Glu Arg Val Gly Gln Thr Leu Gly Arg Lys Glu Ala Arg Gly Leu Met
65 70 75 80
Ile Ser Thr Phe His Thr Leu Gly Leu Asp Ile Ile Lys Arg Glu Tyr
85 90 95
Ala Ala Leu Gly Met Lys Ala Asn Phe Ser Leu Phe Asp Asp Thr Asp
100 105 110
Gln Leu Ala Leu Leu Lys Glu Leu Thr Glu Gly Leu Ile Glu Asp Asp
115 120 125
Lys Val Leu Leu Gln Gln Leu Ile Ser Thr Ile Ser Asn Trp Lys Asn
130 135 140
Asp Leu Lys Thr Pro Ala Gln Ala Ala Ala Glu Ala Lys Gly Glu Arg
145 150 155 160
Asp Arg Ile Phe Ala His Cys Tyr Gly Leu Tyr Asp Ala His Leu Lys
165 170 175
Ala Cys Asn Val Leu Asp Phe Asp Asp Leu Ile Leu Leu Pro Thr Leu
180 185 190
Leu Leu Gln Arg Asn Glu Glu Val Arg Glu Arg Trp Gln Asn Lys Ile
195 200 205
Arg Tyr Leu Leu Val Asp Glu Tyr Gln Asp Thr Asn Thr Ser Gln Tyr
210 215 220
Glu Leu Val Lys Leu Leu Val Gly Ser Arg Ala Arg Phe Thr Val Val
225 230 235 240
Gly Asp Asp Asp Gln Ser Ile Tyr Ser Trp Arg Gly Ala Arg Pro Gln
245 250 255
Asn Leu Val Leu Leu Ser Gln Asp Phe Pro Ala Leu Lys Val Ile Lys
260 265 270
Leu Glu Gln Asn Tyr Arg Ser Ser Gly Arg Ile Leu Lys Ala Ala Asn
275 280 285
Ile Leu Ile Ala Asn Asn Pro His Val Phe Glu Lys Arg Leu Phe Ser
290 295 300
Glu Leu Gly Tyr Gly Thr Glu Leu Lys Val Leu Ser Ala Asn Asn Glu
305 310 315 320
Glu His Glu Ala Glu Arg Val Thr Gly Glu Leu Ile Ala His His Phe
325 330 335
Val Asn Lys Thr Gln Tyr Lys Asp Tyr Ala Ile Leu Tyr Arg Gly Asn
340 345 350
His Gln Ser Arg Val Phe Glu Lys Phe Leu Met Gln Asn Arg Ile Pro
355 360 365
Tyr Lys Ile Ser Gly Gly Gly Gly Gly Gly Glu Ser Glu Glu Glu Leu
370 375 380
Asp Gln Val Gln Leu Met Thr Leu His Ala Ser Lys Gly Leu Glu Phe
385 390 395 400
Pro Tyr Val Tyr Met Val Gly Met Glu Glu Gly Phe Leu Pro His Gln
405 410 415
Ser Ser Ile Asp Glu Asp Asn Ile Asp Glu Glu Arg Arg Leu Ala Tyr
420 425 430
Val Gly Ile Thr Arg Ala Gln Lys Glu Leu Thr Phe Thr Leu Cys Lys
435 440 445
Glu Arg Arg Gln Tyr Gly Glu Leu Val Arg Pro Glu Pro Ser Arg Phe
450 455 460
Leu Leu Glu Leu Pro Gln Asp Asp Leu Ile Trp Glu Gln Glu Arg Lys
465 470 475 480
Val Val Ser Ala Glu Glu Arg Met Gln Lys Gly Gln Ser His Leu Ala
485 490 495
Asn Leu Lys Ala Met Met Ala Ala Lys Arg Gly Lys
500 505
<210> 44
<211> 720
<212> PRT
<213> Escherichia coli
<400> 44
Met Asp Val Ser Tyr Leu Leu Asp Ser Leu Asn Asp Lys Gln Arg Glu
1 5 10 15
Ala Val Ala Ala Pro Arg Ser Asn Leu Leu Val Leu Ala Gly Ala Gly
20 25 30
Ser Gly Lys Thr Arg Val Leu Val His Arg Ile Ala Trp Leu Met Ser
35 40 45
Val Glu Asn Cys Ser Pro Tyr Ser Ile Met Ala Val Thr Phe Thr Asn
50 55 60
Lys Ala Ala Ala Glu Met Arg His Arg Ile Gly Gln Leu Met Gly Thr
65 70 75 80
Ser Gln Gly Gly Met Trp Val Gly Thr Phe His Gly Leu Ala His Arg
85 90 95
Leu Leu Arg Ala His His Met Asp Ala Asn Leu Pro Gln Asp Phe Gln
100 105 110
Ile Leu Asp Ser Glu Asp Gln Leu Arg Leu Leu Lys Arg Leu Ile Lys
115 120 125
Ala Met Asn Leu Asp Glu Lys Gln Trp Pro Pro Arg Gln Ala Met Trp
130 135 140
Tyr Ile Asn Ser Gln Lys Asp Glu Gly Leu Arg Pro His His Ile Gln
145 150 155 160
Ser Tyr Gly Asn Pro Val Glu Gln Thr Trp Gln Lys Val Tyr Gln Ala
165 170 175
Tyr Gln Glu Ala Cys Asp Arg Ala Gly Leu Val Asp Phe Ala Glu Leu
180 185 190
Leu Leu Arg Ala His Glu Leu Trp Leu Asn Lys Pro His Ile Leu Gln
195 200 205
His Tyr Arg Glu Arg Phe Thr Asn Ile Leu Val Asp Glu Phe Gln Asp
210 215 220
Thr Asn Asn Ile Gln Tyr Ala Trp Ile Arg Leu Leu Ala Gly Asp Thr
225 230 235 240
Gly Lys Val Met Ile Val Gly Asp Asp Asp Gln Ser Ile Tyr Gly Trp
245 250 255
Arg Gly Ala Gln Val Glu Asn Ile Gln Arg Phe Leu Asn Asp Phe Pro
260 265 270
Gly Ala Glu Thr Ile Arg Leu Glu Gln Asn Tyr Arg Ser Thr Ser Asn
275 280 285
Ile Leu Ser Ala Ala Asn Ala Leu Ile Glu Asn Asn Asn Gly Arg Leu
290 295 300
Gly Lys Lys Leu Trp Thr Asp Gly Ala Asp Gly Glu Pro Ile Ser Leu
305 310 315 320
Tyr Cys Ala Phe Asn Glu Leu Asp Glu Ala Arg Phe Val Val Asn Arg
325 330 335
Ile Lys Thr Trp Gln Asp Asn Gly Gly Ala Leu Ala Glu Cys Ala Ile
340 345 350
Leu Tyr Arg Ser Asn Ala Gln Ser Arg Val Leu Glu Glu Ala Leu Leu
355 360 365
Gln Ala Ser Met Pro Tyr Arg Ile Tyr Gly Gly Met Arg Phe Phe Glu
370 375 380
Arg Gln Glu Ile Lys Asp Ala Leu Ser Tyr Leu Arg Leu Ile Ala Asn
385 390 395 400
Arg Asn Asp Asp Ala Ala Phe Glu Arg Val Val Asn Thr Pro Thr Arg
405 410 415
Gly Ile Gly Asp Arg Thr Leu Asp Val Val Arg Gln Thr Ser Arg Asp
420 425 430
Arg Gln Leu Thr Leu Trp Gln Ala Cys Arg Glu Leu Leu Gln Glu Lys
435 440 445
Ala Leu Ala Gly Arg Ala Ala Ser Ala Leu Gln Arg Phe Met Glu Leu
450 455 460
Ile Asp Ala Leu Ala Gln Glu Thr Ala Asp Met Pro Leu His Val Gln
465 470 475 480
Thr Asp Arg Val Ile Lys Asp Ser Gly Leu Arg Thr Met Tyr Glu Gln
485 490 495
Glu Lys Gly Glu Lys Gly Gln Thr Arg Ile Glu Asn Leu Glu Glu Leu
500 505 510
Val Thr Ala Thr Arg Gln Phe Ser Tyr Asn Glu Glu Asp Glu Asp Leu
515 520 525
Met Pro Leu Gln Ala Phe Leu Ser His Ala Ala Leu Glu Ala Gly Glu
530 535 540
Gly Gln Ala Asp Thr Trp Gln Asp Ala Val Gln Leu Met Thr Leu His
545 550 555 560
Ser Ala Lys Gly Leu Glu Phe Pro Gln Val Phe Ile Val Gly Met Glu
565 570 575
Glu Gly Met Phe Pro Ser Gln Met Ser Leu Asp Glu Gly Gly Arg Leu
580 585 590
Glu Glu Glu Arg Arg Leu Ala Tyr Val Gly Val Thr Arg Ala Met Gln
595 600 605
Lys Leu Thr Leu Thr Tyr Ala Glu Thr Arg Arg Leu Tyr Gly Lys Glu
610 615 620
Val Tyr His Arg Pro Ser Arg Phe Ile Gly Glu Leu Pro Glu Glu Cys
625 630 635 640
Val Glu Glu Val Arg Leu Arg Ala Thr Val Ser Arg Pro Val Ser His
645 650 655
Gln Arg Met Gly Thr Pro Met Val Glu Asn Asp Ser Gly Tyr Lys Leu
660 665 670
Gly Gln Arg Val Arg His Ala Lys Phe Gly Glu Gly Thr Ile Val Asn
675 680 685
Met Glu Gly Ser Gly Glu His Ser Arg Leu Gln Val Ala Phe Gln Gly
690 695 700
Gln Gly Ile Lys Trp Leu Val Ala Ala Tyr Ala Arg Leu Glu Ser Val
705 710 715 720
<210> 45
<211> 968
<212> PRT
<213> Escherichia coli
<400> 45
Met Pro Phe Thr Leu Gly Gln Arg Trp Ile Ser Asp Thr Glu Ser Glu
1 5 10 15
Leu Gly Leu Gly Thr Val Val Ala Val Asp Ala Arg Thr Val Thr Leu
20 25 30
Leu Phe Pro Ser Thr Gly Glu Asn Arg Leu Tyr Ala Arg Ser Asp Ser
35 40 45
Pro Val Thr Arg Val Met Phe Asn Pro Gly Asp Thr Ile Thr Ser His
50 55 60
Asp Gly Trp Gln Met Gln Val Glu Glu Val Lys Glu Glu Asn Gly Leu
65 70 75 80
Leu Thr Tyr Ile Gly Thr Arg Leu Asp Thr Glu Glu Ser Gly Val Ala
85 90 95
Leu Arg Glu Val Phe Leu Asp Ser Lys Leu Val Phe Ser Lys Pro Gln
100 105 110
Asp Arg Leu Phe Ala Gly Gln Ile Asp Arg Met Asp Arg Phe Ala Leu
115 120 125
Arg Tyr Arg Ala Arg Lys Tyr Ser Ser Glu Gln Phe Arg Met Pro Tyr
130 135 140
Ser Gly Leu Arg Gly Gln Arg Thr Ser Leu Ile Pro His Gln Leu Asn
145 150 155 160
Ile Ala His Asp Val Gly Arg Arg His Ala Pro Arg Val Leu Leu Ala
165 170 175
Asp Glu Val Gly Leu Gly Lys Thr Ile Glu Ala Gly Met Ile Leu His
180 185 190
Gln Gln Leu Leu Ser Gly Ala Ala Glu Arg Val Leu Ile Ile Val Pro
195 200 205
Glu Thr Leu Gln His Gln Trp Leu Val Glu Met Leu Arg Arg Phe Asn
210 215 220
Leu Arg Phe Ala Leu Phe Asp Asp Glu Arg Tyr Ala Glu Ala Gln His
225 230 235 240
Asp Ala Tyr Asn Pro Phe Asp Thr Glu Gln Leu Val Ile Cys Ser Leu
245 250 255
Asp Phe Ala Arg Arg Ser Lys Gln Arg Leu Glu His Leu Cys Glu Ala
260 265 270
Glu Trp Asp Leu Leu Val Val Asp Glu Ala His His Leu Val Trp Ser
275 280 285
Glu Asp Ala Pro Ser Arg Glu Tyr Gln Ala Ile Glu Gln Leu Ala Glu
290 295 300
His Val Pro Gly Val Leu Leu Leu Thr Ala Thr Pro Glu Gln Leu Gly
305 310 315 320
Met Glu Ser His Phe Ala Arg Leu Arg Leu Leu Asp Pro Asn Arg Phe
325 330 335
His Asp Phe Ala Gln Phe Val Glu Glu Gln Lys Asn Tyr Arg Pro Val
340 345 350
Ala Asp Ala Val Ala Met Leu Leu Ala Gly Asn Lys Leu Ser Asn Asp
355 360 365
Glu Leu Asn Met Leu Gly Glu Met Ile Gly Glu Gln Asp Ile Glu Pro
370 375 380
Leu Leu Gln Ala Ala Asn Ser Asp Ser Glu Asp Ala Gln Ser Ala Arg
385 390 395 400
Gln Glu Leu Val Ser Met Leu Met Asp Arg His Gly Thr Ser Arg Val
405 410 415
Leu Phe Arg Asn Thr Arg Asn Gly Val Lys Gly Phe Pro Lys Arg Glu
420 425 430
Leu His Thr Ile Lys Leu Pro Leu Pro Thr Gln Tyr Gln Thr Ala Ile
435 440 445
Lys Val Ser Gly Ile Met Gly Ala Arg Lys Ser Ala Glu Asp Arg Ala
450 455 460
Arg Asp Met Leu Tyr Pro Glu Arg Ile Tyr Gln Glu Phe Glu Gly Asp
465 470 475 480
Asn Ala Thr Trp Trp Asn Phe Asp Pro Arg Val Glu Trp Leu Met Gly
485 490 495
Tyr Leu Thr Ser His Arg Ser Gln Lys Val Leu Val Ile Cys Ala Lys
500 505 510
Ala Ala Thr Ala Leu Gln Leu Glu Gln Val Leu Arg Glu Arg Glu Gly
515 520 525
Ile Arg Ala Ala Val Phe His Glu Gly Met Ser Ile Ile Glu Arg Asp
530 535 540
Arg Ala Ala Ala Trp Phe Ala Glu Glu Asp Thr Gly Ala Gln Val Leu
545 550 555 560
Leu Cys Ser Glu Ile Gly Ser Glu Gly Arg Asn Phe Gln Phe Ala Ser
565 570 575
His Met Val Met Phe Asp Leu Pro Phe Asn Pro Asp Leu Leu Glu Gln
580 585 590
Arg Ile Gly Arg Leu Asp Arg Ile Gly Gln Ala His Asp Ile Gln Ile
595 600 605
His Val Pro Tyr Leu Glu Lys Thr Ala Gln Ser Val Leu Val Arg Trp
610 615 620
Tyr His Glu Gly Leu Asp Ala Phe Glu His Thr Cys Pro Thr Gly Arg
625 630 635 640
Thr Ile Tyr Asp Ser Val Tyr Asn Asp Leu Ile Asn Tyr Leu Ala Ser
645 650 655
Pro Asp Gln Thr Glu Gly Phe Asp Asp Leu Ile Lys Asn Cys Arg Glu
660 665 670
Gln His Glu Ala Leu Lys Ala Gln Leu Glu Gln Gly Arg Asp Arg Leu
675 680 685
Leu Glu Ile His Ser Asn Gly Gly Glu Lys Ala Gln Ala Leu Ala Glu
690 695 700
Ser Ile Glu Glu Gln Asp Asp Asp Thr Asn Leu Ile Ala Phe Ala Met
705 710 715 720
Asn Leu Phe Asp Ile Ile Gly Ile Asn Gln Asp Asp Arg Gly Asp Asn
725 730 735
Met Ile Val Leu Thr Pro Ser Asp His Met Leu Val Pro Asp Phe Pro
740 745 750
Gly Leu Ser Glu Asp Gly Ile Thr Ile Thr Phe Asp Arg Glu Val Ala
755 760 765
Leu Ala Arg Glu Asp Ala Gln Phe Ile Thr Trp Glu His Pro Leu Ile
770 775 780
Arg Asn Gly Leu Asp Leu Ile Leu Ser Gly Asp Thr Gly Ser Ser Thr
785 790 795 800
Ile Ser Leu Leu Lys Asn Lys Ala Leu Pro Val Gly Thr Leu Leu Val
805 810 815
Glu Leu Ile Tyr Val Val Glu Ala Gln Ala Pro Lys Gln Leu Gln Leu
820 825 830
Asn Arg Phe Leu Pro Pro Thr Pro Val Arg Met Leu Leu Asp Lys Asn
835 840 845
Gly Asn Asn Leu Ala Ala Gln Val Glu Phe Glu Thr Phe Asn Arg Gln
850 855 860
Leu Asn Ala Val Asn Arg His Thr Gly Ser Lys Leu Val Asn Ala Val
865 870 875 880
Gln Gln Asp Val His Ala Ile Leu Gln Leu Gly Glu Ala Gln Ile Glu
885 890 895
Lys Ser Ala Arg Ala Leu Ile Asp Ala Ala Arg Asn Glu Ala Asp Glu
900 905 910
Lys Leu Ser Ala Glu Leu Ser Arg Leu Glu Ala Leu Arg Ala Val Asn
915 920 925
Pro Asn Ile Arg Asp Asp Glu Leu Thr Ala Ile Glu Ser Asn Arg Gln
930 935 940
Gln Val Met Glu Ser Leu Asp Gln Ala Gly Trp Arg Leu Asp Ala Leu
945 950 955 960
Arg Leu Ile Val Val Thr His Gln
965
<210> 46
<211> 693
<212> PRT
<213> Escherichia coli
<400> 46
Met Lys Gly Arg Leu Leu Asp Ala Val Pro Leu Ser Ser Leu Thr Gly
1 5 10 15
Val Gly Ala Ala Leu Ser Asn Lys Leu Ala Lys Ile Asn Leu His Thr
20 25 30
Val Gln Asp Leu Leu Leu His Leu Pro Leu Arg Tyr Glu Asp Arg Thr
35 40 45
His Leu Tyr Pro Ile Gly Glu Leu Leu Pro Gly Val Tyr Ala Thr Val
50 55 60
Glu Gly Glu Val Leu Asn Cys Asn Ile Ser Phe Gly Gly Arg Arg Met
65 70 75 80
Met Thr Cys Gln Ile Ser Asp Gly Ser Gly Ile Leu Thr Met Arg Phe
85 90 95
Phe Asn Phe Ser Ala Ala Met Lys Asn Ser Leu Ala Ala Gly Arg Arg
100 105 110
Val Leu Ala Tyr Gly Glu Ala Lys Arg Gly Lys Tyr Gly Ala Glu Met
115 120 125
Ile His Pro Glu Tyr Arg Val Gln Gly Asp Leu Ser Thr Pro Glu Leu
130 135 140
Gln Glu Thr Leu Thr Pro Val Tyr Pro Thr Thr Glu Gly Val Lys Gln
145 150 155 160
Ala Thr Leu Arg Lys Leu Thr Asp Gln Ala Leu Asp Leu Leu Asp Thr
165 170 175
Cys Ala Ile Glu Glu Leu Leu Pro Pro Glu Leu Ser Gln Gly Met Met
180 185 190
Thr Leu Pro Glu Ala Leu Arg Thr Leu His Arg Pro Pro Pro Thr Leu
195 200 205
Gln Leu Ser Asp Leu Glu Thr Gly Gln His Pro Ala Gln Arg Arg Leu
210 215 220
Ile Leu Glu Glu Leu Leu Ala His Asn Leu Ser Met Leu Ala Leu Arg
225 230 235 240
Ala Gly Ala Gln Arg Phe His Ala Gln Pro Leu Ser Ala Asn Asp Thr
245 250 255
Leu Lys Asn Lys Leu Leu Ala Ala Leu Pro Phe Lys Pro Thr Gly Ala
260 265 270
Gln Ala Arg Val Val Ala Glu Ile Glu Arg Asp Met Ala Leu Asp Val
275 280 285
Pro Met Met Arg Leu Val Gln Gly Asp Val Gly Ser Gly Lys Thr Leu
290 295 300
Val Ala Ala Leu Ala Ala Leu Arg Ala Ile Ala His Gly Lys Gln Val
305 310 315 320
Ala Leu Met Ala Pro Thr Glu Leu Leu Ala Glu Gln His Ala Asn Asn
325 330 335
Phe Arg Asn Trp Phe Ala Pro Leu Gly Ile Glu Val Gly Trp Leu Ala
340 345 350
Gly Lys Gln Lys Gly Lys Ala Arg Leu Ala Gln Gln Glu Ala Ile Ala
355 360 365
Ser Gly Gln Val Gln Met Ile Val Gly Thr His Ala Ile Phe Gln Glu
370 375 380
Gln Val Gln Phe Asn Gly Leu Ala Leu Val Ile Ile Asp Glu Gln His
385 390 395 400
Arg Phe Gly Val His Gln Arg Leu Ala Leu Trp Glu Lys Gly Gln Gln
405 410 415
Gln Gly Phe His Pro His Gln Leu Ile Met Thr Ala Thr Pro Ile Pro
420 425 430
Arg Thr Leu Ala Met Thr Ala Tyr Ala Asp Leu Asp Thr Ser Val Ile
435 440 445
Asp Glu Leu Pro Pro Gly Arg Thr Pro Val Thr Thr Val Ala Ile Pro
450 455 460
Asp Thr Arg Arg Thr Asp Ile Ile Asp Arg Val His His Ala Cys Ile
465 470 475 480
Thr Glu Gly Arg Gln Ala Tyr Trp Val Cys Thr Leu Ile Glu Glu Ser
485 490 495
Glu Leu Leu Glu Ala Gln Ala Ala Glu Ala Thr Trp Glu Glu Leu Lys
500 505 510
Leu Ala Leu Pro Glu Leu Asn Val Gly Leu Val His Gly Arg Met Lys
515 520 525
Pro Ala Glu Lys Gln Ala Val Met Ala Ser Phe Lys Gln Gly Glu Leu
530 535 540
His Leu Leu Val Ala Thr Thr Val Ile Glu Val Gly Val Asp Val Pro
545 550 555 560
Asn Ala Ser Leu Met Ile Ile Glu Asn Pro Glu Arg Leu Gly Leu Ala
565 570 575
Gln Leu His Gln Leu Arg Gly Arg Val Gly Arg Gly Ala Val Ala Ser
580 585 590
His Cys Val Leu Leu Tyr Lys Thr Pro Leu Ser Lys Thr Ala Gln Ile
595 600 605
Arg Leu Gln Val Leu Arg Asp Ser Asn Asp Gly Phe Val Ile Ala Gln
610 615 620
Lys Asp Leu Glu Ile Arg Gly Pro Gly Glu Leu Leu Gly Thr Arg Gln
625 630 635 640
Thr Gly Asn Ala Glu Phe Lys Val Ala Asp Leu Leu Arg Asp Gln Ala
645 650 655
Met Ile Pro Glu Val Gln Arg Leu Ala Arg His Ile His Glu Arg Tyr
660 665 670
Pro Gln Gln Ala Lys Ala Leu Ile Glu Arg Trp Met Pro Glu Thr Glu
675 680 685
Arg Tyr Ser Asn Ala
690
<210> 47
<211> 467
<212> PRT
<213> Homo sapiens
<400> 47
Met Ser Leu Ser Leu Trp Gln Gln Cys Leu Ala Arg Leu Gln Asp Glu
1 5 10 15
Leu Pro Ala Thr Glu Phe Ser Met Trp Ile Arg Pro Leu Gln Ala Glu
20 25 30
Leu Ser Asp Asn Thr Leu Ala Leu Tyr Ala Pro Asn Arg Phe Val Leu
35 40 45
Asp Trp Val Arg Asp Lys Tyr Leu Asn Asn Ile Asn Gly Leu Leu Thr
50 55 60
Ser Phe Cys Gly Ala Asp Ala Pro Gln Leu Arg Phe Glu Val Gly Thr
65 70 75 80
Lys Pro Val Thr Gln Thr Pro Gln Ala Ala Val Thr Ser Asn Val Ala
85 90 95
Ala Pro Ala Gln Val Ala Gln Thr Gln Pro Gln Arg Ala Ala Pro Ser
100 105 110
Thr Arg Ser Gly Trp Asp Asn Val Pro Ala Pro Ala Glu Pro Thr Tyr
115 120 125
Arg Ser Asn Val Asn Val Lys His Thr Phe Asp Asn Phe Val Glu Gly
130 135 140
Lys Ser Asn Gln Leu Ala Arg Ala Ala Ala Arg Gln Val Ala Asp Asn
145 150 155 160
Pro Gly Gly Ala Tyr Asn Pro Leu Phe Leu Tyr Gly Gly Thr Gly Leu
165 170 175
Gly Lys Thr His Leu Leu His Ala Val Gly Asn Gly Ile Met Ala Arg
180 185 190
Lys Pro Asn Ala Lys Val Val Tyr Met His Ser Glu Arg Phe Val Gln
195 200 205
Asp Met Val Lys Ala Leu Gln Asn Asn Ala Ile Glu Glu Phe Lys Arg
210 215 220
Tyr Tyr Arg Ser Val Asp Ala Leu Leu Ile Asp Asp Ile Gln Phe Phe
225 230 235 240
Ala Asn Lys Glu Arg Ser Gln Glu Glu Phe Phe His Thr Phe Asn Ala
245 250 255
Leu Leu Glu Gly Asn Gln Gln Ile Ile Leu Thr Ser Asp Arg Tyr Pro
260 265 270
Lys Glu Ile Asn Gly Val Glu Asp Arg Leu Lys Ser Arg Phe Gly Trp
275 280 285
Gly Leu Thr Val Ala Ile Glu Pro Pro Glu Leu Glu Thr Arg Val Ala
290 295 300
Ile Leu Met Lys Lys Ala Asp Glu Asn Asp Ile Arg Leu Pro Gly Glu
305 310 315 320
Val Ala Phe Phe Ile Ala Lys Arg Leu Arg Ser Asn Val Arg Glu Leu
325 330 335
Glu Gly Ala Leu Asn Arg Val Ile Ala Asn Ala Asn Phe Thr Gly Arg
340 345 350
Ala Ile Thr Ile Asp Phe Val Arg Glu Ala Leu Arg Asp Leu Leu Ala
355 360 365
Leu Gln Glu Lys Leu Val Thr Ile Asp Asn Ile Gln Lys Thr Val Ala
370 375 380
Glu Tyr Tyr Lys Ile Lys Val Ala Asp Leu Leu Ser Lys Arg Arg Ser
385 390 395 400
Arg Ser Val Ala Arg Pro Arg Gln Met Ala Met Ala Leu Ala Lys Glu
405 410 415
Leu Thr Asn His Ser Leu Pro Glu Ile Gly Asp Ala Phe Gly Gly Arg
420 425 430
Asp His Thr Thr Val Leu His Ala Cys Arg Lys Ile Glu Gln Leu Arg
435 440 445
Glu Glu Ser His Asp Ile Lys Glu Asp Phe Ser Asn Leu Ile Arg Thr
450 455 460
Leu Ser Ser
465
<210> 48
<211> 215
<212> PRT
<213> Homo sapiens
<400> 48
Met Gly Lys Gly Asp Pro Lys Lys Pro Arg Gly Lys Met Ser Ser Tyr
1 5 10 15
Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro
20 25 30
Asp Ala Ser Val Asn Phe Ser Glu Phe Ser Lys Lys Cys Ser Glu Arg
35 40 45
Trp Lys Thr Met Ser Ala Lys Glu Lys Gly Lys Phe Glu Asp Met Ala
50 55 60
Lys Ala Asp Lys Ala Arg Tyr Glu Arg Glu Met Lys Thr Tyr Ile Pro
65 70 75 80
Pro Lys Gly Glu Thr Lys Lys Lys Phe Lys Asp Pro Asn Ala Pro Lys
85 90 95
Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu Tyr Arg Pro Lys
100 105 110
Ile Lys Gly Glu His Pro Gly Leu Ser Ile Gly Asp Val Ala Lys Lys
115 120 125
Leu Gly Glu Met Trp Asn Asn Thr Ala Ala Asp Asp Lys Gln Pro Tyr
130 135 140
Glu Lys Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala
145 150 155 160
Ala Tyr Arg Ala Lys Gly Lys Pro Asp Ala Ala Lys Lys Gly Val Val
165 170 175
Lys Ala Glu Lys Ser Lys Lys Lys Lys Glu Glu Glu Glu Asp Glu Glu
180 185 190
Asp Glu Glu Asp Glu Glu Glu Glu Glu Asp Glu Glu Asp Glu Asp Glu
195 200 205
Glu Glu Asp Asp Asp Asp Glu
210 215
<210> 49
<211> 209
<212> PRT
<213> Homo sapiens
<400> 49
Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr
1 5 10 15
Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro
20 25 30
Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg
35 40 45
Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala
50 55 60
Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro
65 70 75 80
Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys
85 90 95
Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys
100 105 110
Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys
115 120 125
Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr
130 135 140
Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala
145 150 155 160
Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly
165 170 175
Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu
180 185 190
Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu
195 200 205
Glu
<210> 50
<211> 616
<212> PRT
<213> Homo sapiens
<400> 50
Met Val Gly Gln Leu Ser Glu Gly Ala Ile Ala Ala Ile Met Gln Lys
1 5 10 15
Gly Asp Thr Asn Ile Lys Pro Ile Leu Gln Val Ile Asn Ile Arg Pro
20 25 30
Ile Thr Thr Gly Asn Ser Pro Pro Arg Tyr Arg Leu Leu Met Ser Asp
35 40 45
Gly Leu Asn Thr Leu Ser Ser Phe Met Leu Ala Thr Gln Leu Asn Pro
50 55 60
Leu Val Glu Glu Glu Gln Leu Ser Ser Asn Cys Val Cys Gln Ile His
65 70 75 80
Arg Phe Ile Val Asn Thr Leu Lys Asp Gly Arg Arg Val Val Ile Leu
85 90 95
Met Glu Leu Glu Val Leu Lys Ser Ala Glu Ala Val Gly Val Lys Ile
100 105 110
Gly Asn Pro Val Pro Tyr Asn Glu Gly Leu Gly Gln Pro Gln Val Ala
115 120 125
Pro Pro Ala Pro Ala Ala Ser Pro Ala Ala Ser Ser Arg Pro Gln Pro
130 135 140
Gln Asn Gly Ser Ser Gly Met Gly Ser Thr Val Ser Lys Ala Tyr Gly
145 150 155 160
Ala Ser Lys Thr Phe Gly Lys Ala Ala Gly Pro Ser Leu Ser His Thr
165 170 175
Ser Gly Gly Thr Gln Ser Lys Val Val Pro Ile Ala Ser Leu Thr Pro
180 185 190
Tyr Gln Ser Lys Trp Thr Ile Cys Ala Arg Val Thr Asn Lys Ser Gln
195 200 205
Ile Arg Thr Trp Ser Asn Ser Arg Gly Glu Gly Lys Leu Phe Ser Leu
210 215 220
Glu Leu Val Asp Glu Ser Gly Glu Ile Arg Ala Thr Ala Phe Asn Glu
225 230 235 240
Gln Val Asp Lys Phe Phe Pro Leu Ile Glu Val Asn Lys Val Tyr Tyr
245 250 255
Phe Ser Lys Gly Thr Leu Lys Ile Ala Asn Lys Gln Phe Thr Ala Val
260 265 270
Lys Asn Asp Tyr Glu Met Thr Phe Asn Asn Glu Thr Ser Val Met Pro
275 280 285
Cys Glu Asp Asp His His Leu Pro Thr Val Gln Phe Asp Phe Thr Gly
290 295 300
Ile Asp Asp Leu Glu Asn Lys Ser Lys Asp Ser Leu Val Asp Ile Ile
305 310 315 320
Gly Ile Cys Lys Ser Tyr Glu Asp Ala Thr Lys Ile Thr Val Arg Ser
325 330 335
Asn Asn Arg Glu Val Ala Lys Arg Asn Ile Tyr Leu Met Asp Thr Ser
340 345 350
Gly Lys Val Val Thr Ala Thr Leu Trp Gly Glu Asp Ala Asp Lys Phe
355 360 365
Asp Gly Ser Arg Gln Pro Val Leu Ala Ile Lys Gly Ala Arg Val Ser
370 375 380
Asp Phe Gly Gly Arg Ser Leu Ser Val Leu Ser Ser Ser Thr Ile Ile
385 390 395 400
Ala Asn Pro Asp Ile Pro Glu Ala Tyr Lys Leu Arg Gly Trp Phe Asp
405 410 415
Ala Glu Gly Gln Ala Leu Asp Gly Val Ser Ile Ser Asp Leu Lys Ser
420 425 430
Gly Gly Val Gly Gly Ser Asn Thr Asn Trp Lys Thr Leu Tyr Glu Val
435 440 445
Lys Ser Glu Asn Leu Gly Gln Gly Asp Lys Pro Asp Tyr Phe Ser Ser
450 455 460
Val Ala Thr Val Val Tyr Leu Arg Lys Glu Asn Cys Met Tyr Gln Ala
465 470 475 480
Cys Pro Thr Gln Asp Cys Asn Lys Lys Val Ile Asp Gln Gln Asn Gly
485 490 495
Leu Tyr Arg Cys Glu Lys Cys Asp Thr Glu Phe Pro Asn Phe Lys Tyr
500 505 510
Arg Met Ile Leu Ser Val Asn Ile Ala Asp Phe Gln Glu Asn Gln Trp
515 520 525
Val Thr Cys Phe Gln Glu Ser Ala Glu Ala Ile Leu Gly Gln Asn Ala
530 535 540
Ala Tyr Leu Gly Glu Leu Lys Asp Lys Asn Glu Gln Ala Phe Glu Glu
545 550 555 560
Val Phe Gln Asn Ala Asn Phe Arg Ser Phe Ile Phe Arg Val Arg Val
565 570 575
Lys Val Glu Thr Tyr Asn Asp Glu Ser Arg Ile Lys Ala Thr Val Met
580 585 590
Asp Val Lys Pro Val Asp Tyr Arg Glu Tyr Gly Arg Arg Leu Val Met
595 600 605
Ser Ile Arg Arg Ser Ala Leu Met
610 615
<210> 51
<211> 270
<212> PRT
<213> Homo sapiens
<400> 51
Met Trp Asn Ser Gly Phe Glu Ser Tyr Gly Ser Ser Ser Tyr Gly Gly
1 5 10 15
Ala Gly Gly Tyr Thr Gln Ser Pro Gly Gly Phe Gly Ser Pro Ala Pro
20 25 30
Ser Gln Ala Glu Lys Lys Ser Arg Ala Arg Ala Gln His Ile Val Pro
35 40 45
Cys Thr Ile Ser Gln Leu Leu Ser Ala Thr Leu Val Asp Glu Val Phe
50 55 60
Arg Ile Gly Asn Val Glu Ile Ser Gln Val Thr Ile Val Gly Ile Ile
65 70 75 80
Arg His Ala Glu Lys Ala Pro Thr Asn Ile Val Tyr Lys Ile Asp Asp
85 90 95
Met Thr Ala Ala Pro Met Asp Val Arg Gln Trp Val Asp Thr Asp Asp
100 105 110
Thr Ser Ser Glu Asn Thr Val Val Pro Pro Glu Thr Tyr Val Lys Val
115 120 125
Ala Gly His Leu Arg Ser Phe Gln Asn Lys Lys Ser Leu Val Ala Phe
130 135 140
Lys Ile Met Pro Leu Glu Asp Met Asn Glu Phe Thr Thr His Ile Leu
145 150 155 160
Glu Val Ile Asn Ala His Met Val Leu Ser Lys Ala Asn Ser Gln Pro
165 170 175
Ser Ala Gly Arg Ala Pro Ile Ser Asn Pro Gly Met Ser Glu Ala Gly
180 185 190
Asn Phe Gly Gly Asn Ser Phe Met Pro Ala Asn Gly Leu Thr Val Ala
195 200 205
Gln Asn Gln Val Leu Asn Leu Ile Lys Ala Cys Pro Arg Pro Glu Gly
210 215 220
Leu Asn Phe Gln Asp Leu Lys Asn Gln Leu Lys His Met Ser Val Ser
225 230 235 240
Ser Ile Lys Gln Ala Val Asp Phe Leu Ser Asn Glu Gly His Ile Tyr
245 250 255
Ser Thr Val Asp Asp Asp His Phe Lys Ser Thr Asp Ala Glu
260 265 270
<210> 52
<211> 121
<212> PRT
<213> Homo sapiens
<400> 52
Met Val Asp Met Met Asp Leu Pro Arg Ser Arg Ile Asn Ala Gly Met
1 5 10 15
Leu Ala Gln Phe Ile Asp Lys Pro Val Cys Phe Val Gly Arg Leu Glu
20 25 30
Lys Ile His Pro Thr Gly Lys Met Phe Ile Leu Ser Asp Gly Glu Gly
35 40 45
Lys Asn Gly Thr Ile Glu Leu Met Glu Pro Leu Asp Glu Glu Ile Ser
50 55 60
Gly Ile Val Glu Val Val Gly Arg Val Thr Ala Lys Ala Thr Ile Leu
65 70 75 80
Cys Thr Ser Tyr Val Gln Phe Lys Glu Asp Ser His Pro Phe Asp Leu
85 90 95
Gly Leu Tyr Asn Glu Ala Val Lys Ile Ile His Asp Phe Pro Gln Phe
100 105 110
Tyr Pro Leu Gly Ile Val Gln His Asp
115 120
<210> 53
<211> 339
<212> PRT
<213> Homo sapiens
<400> 53
Met Ala Met Gln Met Gln Leu Glu Ala Asn Ala Asp Thr Ser Val Glu
1 5 10 15
Glu Glu Ser Phe Gly Pro Gln Pro Ile Ser Arg Leu Glu Gln Cys Gly
20 25 30
Ile Asn Ala Asn Asp Val Lys Lys Leu Glu Glu Ala Gly Phe His Thr
35 40 45
Val Glu Ala Val Ala Tyr Ala Pro Lys Lys Glu Leu Ile Asn Ile Lys
50 55 60
Gly Ile Ser Glu Ala Lys Ala Asp Lys Ile Leu Ala Glu Ala Ala Lys
65 70 75 80
Leu Val Pro Met Gly Phe Thr Thr Ala Thr Glu Phe His Gln Arg Arg
85 90 95
Ser Glu Ile Ile Gln Ile Thr Thr Gly Ser Lys Glu Leu Asp Lys Leu
100 105 110
Leu Gln Gly Gly Ile Glu Thr Gly Ser Ile Thr Glu Met Phe Gly Glu
115 120 125
Phe Arg Thr Gly Lys Thr Gln Ile Cys His Thr Leu Ala Val Thr Cys
130 135 140
Gln Leu Pro Ile Asp Arg Gly Gly Gly Glu Gly Lys Ala Met Tyr Ile
145 150 155 160
Asp Thr Glu Gly Thr Phe Arg Pro Glu Arg Leu Leu Ala Val Ala Glu
165 170 175
Arg Tyr Gly Leu Ser Gly Ser Asp Val Leu Asp Asn Val Ala Tyr Ala
180 185 190
Arg Ala Phe Asn Thr Asp His Gln Thr Gln Leu Leu Tyr Gln Ala Ser
195 200 205
Ala Met Met Val Glu Ser Arg Tyr Ala Leu Leu Ile Val Asp Ser Ala
210 215 220
Thr Ala Leu Tyr Arg Thr Asp Tyr Ser Gly Arg Gly Glu Leu Ser Ala
225 230 235 240
Arg Gln Met His Leu Ala Arg Phe Leu Arg Met Leu Leu Arg Leu Ala
245 250 255
Asp Glu Phe Gly Val Ala Val Val Ile Thr Asn Gln Val Val Ala Gln
260 265 270
Val Asp Gly Ala Ala Met Phe Ala Ala Asp Pro Lys Lys Pro Ile Gly
275 280 285
Gly Asn Ile Ile Ala His Ala Ser Thr Thr Arg Leu Tyr Leu Arg Lys
290 295 300
Gly Arg Gly Glu Thr Arg Ile Cys Lys Ile Tyr Asp Ser Pro Cys Leu
305 310 315 320
Pro Glu Ala Glu Ala Met Phe Ala Ile Asn Ala Asp Gly Val Gly Asp
325 330 335
Ala Lys Asp
<210> 54
<211> 418
<212> PRT
<213> Homo sapiens
<400> 54
Met Ser Gly Thr Glu Glu Ala Ile Leu Gly Gly Arg Asp Ser His Pro
1 5 10 15
Ala Ala Gly Gly Gly Ser Val Leu Cys Phe Gly Gln Cys Gln Tyr Thr
20 25 30
Ala Glu Glu Tyr Gln Ala Ile Gln Lys Ala Leu Arg Gln Arg Leu Gly
35 40 45
Pro Glu Tyr Ile Ser Ser Arg Met Ala Gly Gly Gly Gln Lys Val Cys
50 55 60
Tyr Ile Glu Gly His Arg Val Ile Asn Leu Ala Asn Glu Met Phe Gly
65 70 75 80
Tyr Asn Gly Trp Ala His Ser Ile Thr Gln Gln Asn Val Asp Phe Val
85 90 95
Asp Leu Asn Asn Gly Lys Phe Tyr Val Gly Val Cys Ala Phe Val Arg
100 105 110
Val Gln Leu Lys Asp Gly Ser Tyr His Glu Asp Val Gly Tyr Gly Val
115 120 125
Ser Glu Gly Leu Lys Ser Lys Ala Leu Ser Leu Glu Lys Ala Arg Lys
130 135 140
Glu Ala Val Thr Asp Gly Leu Lys Arg Ala Leu Arg Ser Phe Gly Asn
145 150 155 160
Ala Leu Gly Asn Cys Ile Leu Asp Lys Asp Tyr Leu Arg Ser Leu Asn
165 170 175
Lys Leu Pro Arg Gln Leu Pro Leu Glu Val Asp Leu Thr Lys Ala Lys
180 185 190
Arg Gln Asp Leu Glu Pro Ser Val Glu Glu Ala Arg Tyr Asn Ser Cys
195 200 205
Arg Pro Asn Met Ala Leu Gly His Pro Gln Leu Gln Gln Val Thr Ser
210 215 220
Pro Ser Arg Pro Ser His Ala Val Ile Pro Ala Asp Gln Asp Cys Ser
225 230 235 240
Ser Arg Ser Leu Ser Ser Ser Ala Val Glu Ser Glu Ala Thr His Gln
245 250 255
Arg Lys Leu Arg Gln Lys Gln Leu Gln Gln Gln Phe Arg Glu Arg Met
260 265 270
Glu Lys Gln Gln Val Arg Val Ser Thr Pro Ser Ala Glu Lys Ser Glu
275 280 285
Ala Ala Pro Pro Ala Pro Pro Val Thr His Ser Thr Pro Val Thr Val
290 295 300
Ser Glu Pro Leu Leu Glu Lys Asp Phe Leu Ala Gly Val Thr Gln Glu
305 310 315 320
Leu Ile Lys Thr Leu Glu Asp Asn Ser Glu Lys Trp Ala Val Thr Pro
325 330 335
Asp Ala Gly Asp Gly Val Val Lys Pro Ser Ser Arg Ala Asp Pro Ala
340 345 350
Gln Thr Ser Asp Thr Leu Ala Leu Asn Asn Gln Met Val Thr Gln Asn
355 360 365
Arg Thr Pro His Ser Val Cys His Gln Lys Pro Gln Ala Lys Ser Gly
370 375 380
Ser Trp Asp Leu Gln Thr Tyr Ser Ala Asp Gln Arg Thr Thr Gly Asn
385 390 395 400
Trp Glu Ser His Arg Lys Ser Gln Asp Met Lys Lys Arg Lys Tyr Asp
405 410 415
Pro Ser
<210> 55
<211> 1417
<212> PRT
<213> Homo sapiens
<400> 55
Met Ala Ala Val Pro Gln Asn Asn Leu Gln Glu Gln Leu Glu Arg His
1 5 10 15
Ser Ala Arg Thr Leu Asn Asn Lys Leu Ser Leu Ser Lys Pro Lys Phe
20 25 30
Ser Gly Phe Thr Phe Lys Lys Lys Thr Ser Ser Asp Asn Asn Val Ser
35 40 45
Val Thr Asn Val Ser Val Ala Lys Thr Pro Val Leu Arg Asn Lys Asp
50 55 60
Val Asn Val Thr Glu Asp Phe Ser Phe Ser Glu Pro Leu Pro Asn Thr
65 70 75 80
Thr Asn Gln Gln Arg Val Lys Asp Phe Phe Lys Asn Ala Pro Ala Gly
85 90 95
Gln Glu Thr Gln Arg Gly Gly Ser Lys Ser Leu Leu Pro Asp Phe Leu
100 105 110
Gln Thr Pro Lys Glu Val Val Cys Thr Thr Gln Asn Thr Pro Thr Val
115 120 125
Lys Lys Ser Arg Asp Thr Ala Leu Lys Lys Leu Glu Phe Ser Ser Ser
130 135 140
Pro Asp Ser Leu Ser Thr Ile Asn Asp Trp Asp Asp Met Asp Asp Phe
145 150 155 160
Asp Thr Ser Glu Thr Ser Lys Ser Phe Val Thr Pro Pro Gln Ser His
165 170 175
Phe Val Arg Val Ser Thr Ala Gln Lys Ser Lys Lys Gly Lys Arg Asn
180 185 190
Phe Phe Lys Ala Gln Leu Tyr Thr Thr Asn Thr Val Lys Thr Asp Leu
195 200 205
Pro Pro Pro Ser Ser Glu Ser Glu Gln Ile Asp Leu Thr Glu Glu Gln
210 215 220
Lys Asp Asp Ser Glu Trp Leu Ser Ser Asp Val Ile Cys Ile Asp Asp
225 230 235 240
Gly Pro Ile Ala Glu Val His Ile Asn Glu Asp Ala Gln Glu Ser Asp
245 250 255
Ser Leu Lys Thr His Leu Glu Asp Glu Arg Asp Asn Ser Glu Lys Lys
260 265 270
Lys Asn Leu Glu Glu Ala Glu Leu His Ser Thr Glu Lys Val Pro Cys
275 280 285
Ile Glu Phe Asp Asp Asp Asp Tyr Asp Thr Asp Phe Val Pro Pro Ser
290 295 300
Pro Glu Glu Ile Ile Ser Ala Ser Ser Ser Ser Ser Lys Cys Leu Ser
305 310 315 320
Thr Leu Lys Asp Leu Asp Thr Ser Asp Arg Lys Glu Asp Val Leu Ser
325 330 335
Thr Ser Lys Asp Leu Leu Ser Lys Pro Glu Lys Met Ser Met Gln Glu
340 345 350
Leu Asn Pro Glu Thr Ser Thr Asp Cys Asp Ala Arg Gln Ile Ser Leu
355 360 365
Gln Gln Gln Leu Ile His Val Met Glu His Ile Cys Lys Leu Ile Asp
370 375 380
Thr Ile Pro Asp Asp Lys Leu Lys Leu Leu Asp Cys Gly Asn Glu Leu
385 390 395 400
Leu Gln Gln Arg Asn Ile Arg Arg Lys Leu Leu Thr Glu Val Asp Phe
405 410 415
Asn Lys Ser Asp Ala Ser Leu Leu Gly Ser Leu Trp Arg Tyr Arg Pro
420 425 430
Asp Ser Leu Asp Gly Pro Met Glu Gly Asp Ser Cys Pro Thr Gly Asn
435 440 445
Ser Met Lys Glu Leu Asn Phe Ser His Leu Pro Ser Asn Ser Val Ser
450 455 460
Pro Gly Asp Cys Leu Leu Thr Thr Thr Leu Gly Lys Thr Gly Phe Ser
465 470 475 480
Ala Thr Arg Lys Asn Leu Phe Glu Arg Pro Leu Phe Asn Thr His Leu
485 490 495
Gln Lys Ser Phe Val Ser Ser Asn Trp Ala Glu Thr Pro Arg Leu Gly
500 505 510
Lys Lys Asn Glu Ser Ser Tyr Phe Pro Gly Asn Val Leu Thr Ser Thr
515 520 525
Ala Val Lys Asp Gln Asn Lys His Thr Ala Ser Ile Asn Asp Leu Glu
530 535 540
Arg Glu Thr Gln Pro Ser Tyr Asp Ile Asp Asn Phe Asp Ile Asp Asp
545 550 555 560
Phe Asp Asp Asp Asp Asp Trp Glu Asp Ile Met His Asn Leu Ala Ala
565 570 575
Ser Lys Ser Ser Thr Ala Ala Tyr Gln Pro Ile Lys Glu Gly Arg Pro
580 585 590
Ile Lys Ser Val Ser Glu Arg Leu Ser Ser Ala Lys Thr Asp Cys Leu
595 600 605
Pro Val Ser Ser Thr Ala Gln Asn Ile Asn Phe Ser Glu Ser Ile Gln
610 615 620
Asn Tyr Thr Asp Lys Ser Ala Gln Asn Leu Ala Ser Arg Asn Leu Lys
625 630 635 640
His Glu Arg Phe Gln Ser Leu Ser Phe Pro His Thr Lys Glu Met Met
645 650 655
Lys Ile Phe His Lys Lys Phe Gly Leu His Asn Phe Arg Thr Asn Gln
660 665 670
Leu Glu Ala Ile Asn Ala Ala Leu Leu Gly Glu Asp Cys Phe Ile Leu
675 680 685
Met Pro Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Leu Pro Ala Cys
690 695 700
Val Ser Pro Gly Val Thr Val Val Ile Ser Pro Leu Arg Ser Leu Ile
705 710 715 720
Val Asp Gln Val Gln Lys Leu Thr Ser Leu Asp Ile Pro Ala Thr Tyr
725 730 735
Leu Thr Gly Asp Lys Thr Asp Ser Glu Ala Thr Asn Ile Tyr Leu Gln
740 745 750
Leu Ser Lys Lys Asp Pro Ile Ile Lys Leu Leu Tyr Val Thr Pro Glu
755 760 765
Lys Ile Cys Ala Ser Asn Arg Leu Ile Ser Thr Leu Glu Asn Leu Tyr
770 775 780
Glu Arg Lys Leu Leu Ala Arg Phe Val Ile Asp Glu Ala His Cys Val
785 790 795 800
Ser Gln Trp Gly His Asp Phe Arg Gln Asp Tyr Lys Arg Met Asn Met
805 810 815
Leu Arg Gln Lys Phe Pro Ser Val Pro Val Met Ala Leu Thr Ala Thr
820 825 830
Ala Asn Pro Arg Val Gln Lys Asp Ile Leu Thr Gln Leu Lys Ile Leu
835 840 845
Arg Pro Gln Val Phe Ser Met Ser Phe Asn Arg His Asn Leu Lys Tyr
850 855 860
Tyr Val Leu Pro Lys Lys Pro Lys Lys Val Ala Phe Asp Cys Leu Glu
865 870 875 880
Trp Ile Arg Lys His His Pro Tyr Asp Ser Gly Ile Ile Tyr Cys Leu
885 890 895
Ser Arg Arg Glu Cys Asp Thr Met Ala Asp Thr Leu Gln Arg Asp Gly
900 905 910
Leu Ala Ala Leu Ala Tyr His Ala Gly Leu Ser Asp Ser Ala Arg Asp
915 920 925
Glu Val Gln Gln Lys Trp Ile Asn Gln Asp Gly Cys Gln Val Ile Cys
930 935 940
Ala Thr Ile Ala Phe Gly Met Gly Ile Asp Lys Pro Asp Val Arg Phe
945 950 955 960
Val Ile His Ala Ser Leu Pro Lys Ser Val Glu Gly Tyr Tyr Gln Glu
965 970 975
Ser Gly Arg Ala Gly Arg Asp Gly Glu Ile Ser His Cys Leu Leu Phe
980 985 990
Tyr Thr Tyr His Asp Val Thr Arg Leu Lys Arg Leu Ile Met Met Glu
995 1000 1005
Lys Asp Gly Asn His His Thr Arg Glu Thr His Phe Asn Asn Leu
1010 1015 1020
Tyr Ser Met Val His Tyr Cys Glu Asn Ile Thr Glu Cys Arg Arg
1025 1030 1035
Ile Gln Leu Leu Ala Tyr Phe Gly Glu Asn Gly Phe Asn Pro Asp
1040 1045 1050
Phe Cys Lys Lys His Pro Asp Val Ser Cys Asp Asn Cys Cys Lys
1055 1060 1065
Thr Lys Asp Tyr Lys Thr Arg Asp Val Thr Asp Asp Val Lys Ser
1070 1075 1080
Ile Val Arg Phe Val Gln Glu His Ser Ser Ser Gln Gly Met Arg
1085 1090 1095
Asn Ile Lys His Val Gly Pro Ser Gly Arg Phe Thr Met Asn Met
1100 1105 1110
Leu Val Asp Ile Phe Leu Gly Ser Lys Ser Ala Lys Ile Gln Ser
1115 1120 1125
Gly Ile Phe Gly Lys Gly Ser Ala Tyr Ser Arg His Asn Ala Glu
1130 1135 1140
Arg Leu Phe Lys Lys Leu Ile Leu Asp Lys Ile Leu Asp Glu Asp
1145 1150 1155
Leu Tyr Ile Asn Ala Asn Asp Gln Ala Ile Ala Tyr Val Met Leu
1160 1165 1170
Gly Asn Lys Ala Gln Thr Val Leu Asn Gly Asn Leu Lys Val Asp
1175 1180 1185
Phe Met Glu Thr Glu Asn Ser Ser Ser Val Lys Lys Gln Lys Ala
1190 1195 1200
Leu Val Ala Lys Val Ser Gln Arg Glu Glu Met Val Lys Lys Cys
1205 1210 1215
Leu Gly Glu Leu Thr Glu Val Cys Lys Ser Leu Gly Lys Val Phe
1220 1225 1230
Gly Val His Tyr Phe Asn Ile Phe Asn Thr Val Thr Leu Lys Lys
1235 1240 1245
Leu Ala Glu Ser Leu Ser Ser Asp Pro Glu Val Leu Leu Gln Ile
1250 1255 1260
Asp Gly Val Thr Glu Asp Lys Leu Glu Lys Tyr Gly Ala Glu Val
1265 1270 1275
Ile Ser Val Leu Gln Lys Tyr Ser Glu Trp Thr Ser Pro Ala Glu
1280 1285 1290
Asp Ser Ser Pro Gly Ile Ser Leu Ser Ser Ser Arg Gly Pro Gly
1295 1300 1305
Arg Ser Ala Ala Glu Glu Leu Asp Glu Glu Ile Pro Val Ser Ser
1310 1315 1320
His Tyr Phe Ala Ser Lys Thr Arg Asn Glu Arg Lys Arg Lys Lys
1325 1330 1335
Met Pro Ala Ser Gln Arg Ser Lys Arg Arg Lys Thr Ala Ser Ser
1340 1345 1350
Gly Ser Lys Ala Lys Gly Gly Ser Ala Thr Cys Arg Lys Ile Ser
1355 1360 1365
Ser Lys Thr Lys Ser Ser Ser Ile Ile Gly Ser Ser Ser Ala Ser
1370 1375 1380
His Thr Ser Gln Ala Thr Ser Gly Ala Asn Ser Lys Leu Gly Ile
1385 1390 1395
Met Ala Pro Pro Lys Pro Ile Asn Arg Pro Phe Leu Lys Pro Ser
1400 1405 1410
Tyr Ala Phe Ser
1415
<210> 56
<211> 846
<212> PRT
<213> Homo sapiens
<400> 56
Met Gly Ile Gln Gly Leu Leu Gln Phe Ile Lys Glu Ala Ser Glu Pro
1 5 10 15
Ile His Val Arg Lys Tyr Lys Gly Gln Val Val Ala Val Asp Thr Tyr
20 25 30
Cys Trp Leu His Lys Gly Ala Ile Ala Cys Ala Glu Lys Leu Ala Lys
35 40 45
Gly Glu Pro Thr Asp Arg Tyr Val Gly Phe Cys Met Lys Phe Val Asn
50 55 60
Met Leu Leu Ser His Gly Ile Lys Pro Ile Leu Val Phe Asp Gly Cys
65 70 75 80
Thr Leu Pro Ser Lys Lys Glu Val Glu Arg Ser Arg Arg Glu Arg Arg
85 90 95
Gln Ala Asn Leu Leu Lys Gly Lys Gln Leu Leu Arg Glu Gly Lys Val
100 105 110
Ser Glu Ala Arg Glu Cys Phe Thr Arg Ser Ile Asn Ile Thr His Ala
115 120 125
Met Ala His Lys Val Ile Lys Ala Ala Arg Ser Gln Gly Val Asp Cys
130 135 140
Leu Val Ala Pro Tyr Glu Ala Asp Ala Gln Leu Ala Tyr Leu Asn Lys
145 150 155 160
Ala Gly Ile Val Gln Ala Ile Ile Thr Glu Asp Ser Asp Leu Leu Ala
165 170 175
Phe Gly Cys Lys Lys Val Ile Leu Lys Met Asp Gln Phe Gly Asn Gly
180 185 190
Leu Glu Ile Asp Gln Ala Arg Leu Gly Met Cys Arg Gln Leu Gly Asp
195 200 205
Val Phe Thr Glu Glu Lys Phe Arg Tyr Met Cys Ile Leu Ser Gly Cys
210 215 220
Asp Tyr Leu Ser Ser Leu Arg Gly Ile Gly Leu Ala Lys Ala Cys Lys
225 230 235 240
Val Leu Arg Leu Ala Asn Asn Pro Asp Ile Val Lys Val Ile Lys Lys
245 250 255
Ile Gly His Tyr Leu Lys Met Asn Ile Thr Val Pro Glu Asp Tyr Ile
260 265 270
Asn Gly Phe Ile Arg Ala Asn Asn Thr Phe Leu Tyr Gln Leu Val Phe
275 280 285
Asp Pro Ile Lys Arg Lys Leu Ile Pro Leu Asn Ala Tyr Glu Asp Asp
290 295 300
Val Asp Pro Glu Thr Leu Ser Tyr Ala Gly Gln Tyr Val Asp Asp Ser
305 310 315 320
Ile Ala Leu Gln Ile Ala Leu Gly Asn Lys Asp Ile Asn Thr Phe Glu
325 330 335
Gln Ile Asp Asp Tyr Asn Pro Asp Thr Ala Met Pro Ala His Ser Arg
340 345 350
Ser His Ser Trp Asp Asp Lys Thr Cys Gln Lys Ser Ala Asn Val Ser
355 360 365
Ser Ile Trp His Arg Asn Tyr Ser Pro Arg Pro Glu Ser Gly Thr Val
370 375 380
Ser Asp Ala Pro Gln Leu Lys Glu Asn Pro Ser Thr Val Gly Val Glu
385 390 395 400
Arg Val Ile Ser Thr Lys Gly Leu Asn Leu Pro Arg Lys Ser Ser Ile
405 410 415
Val Lys Arg Pro Arg Ser Ala Glu Leu Ser Glu Asp Asp Leu Leu Ser
420 425 430
Gln Tyr Ser Leu Ser Phe Thr Lys Lys Thr Lys Lys Asn Ser Ser Glu
435 440 445
Gly Asn Lys Ser Leu Ser Phe Ser Glu Val Phe Val Pro Asp Leu Val
450 455 460
Asn Gly Pro Thr Asn Lys Lys Ser Val Ser Thr Pro Pro Arg Thr Arg
465 470 475 480
Asn Lys Phe Ala Thr Phe Leu Gln Arg Lys Asn Glu Glu Ser Gly Ala
485 490 495
Val Val Val Pro Gly Thr Arg Ser Arg Phe Phe Cys Ser Ser Asp Ser
500 505 510
Thr Asp Cys Val Ser Asn Lys Val Ser Ile Gln Pro Leu Asp Glu Thr
515 520 525
Ala Val Thr Asp Lys Glu Asn Asn Leu His Glu Ser Glu Tyr Gly Asp
530 535 540
Gln Glu Gly Lys Arg Leu Val Asp Thr Asp Val Ala Arg Asn Ser Ser
545 550 555 560
Asp Asp Ile Pro Asn Asn His Ile Pro Gly Asp His Ile Pro Asp Lys
565 570 575
Ala Thr Val Phe Thr Asp Glu Glu Ser Tyr Ser Phe Glu Ser Ser Lys
580 585 590
Phe Thr Arg Thr Ile Ser Pro Pro Thr Leu Gly Thr Leu Arg Ser Cys
595 600 605
Phe Ser Trp Ser Gly Gly Leu Gly Asp Phe Ser Arg Thr Pro Ser Pro
610 615 620
Ser Pro Ser Thr Ala Leu Gln Gln Phe Arg Arg Lys Ser Asp Ser Pro
625 630 635 640
Thr Ser Leu Pro Glu Asn Asn Met Ser Asp Val Ser Gln Leu Lys Ser
645 650 655
Glu Glu Ser Ser Asp Asp Glu Ser His Pro Leu Arg Glu Glu Ala Cys
660 665 670
Ser Ser Gln Ser Gln Glu Ser Gly Glu Phe Ser Leu Gln Ser Ser Asn
675 680 685
Ala Ser Lys Leu Ser Gln Cys Ser Ser Lys Asp Ser Asp Ser Glu Glu
690 695 700
Ser Asp Cys Asn Ile Lys Leu Leu Asp Ser Gln Ser Asp Gln Thr Ser
705 710 715 720
Lys Leu Arg Leu Ser His Phe Ser Lys Lys Asp Thr Pro Leu Arg Asn
725 730 735
Lys Val Pro Gly Leu Tyr Lys Ser Ser Ser Ala Asp Ser Leu Ser Thr
740 745 750
Thr Lys Ile Lys Pro Leu Gly Pro Ala Arg Ala Ser Gly Leu Ser Lys
755 760 765
Lys Pro Ala Ser Ile Gln Lys Arg Lys His His Asn Ala Glu Asn Lys
770 775 780
Pro Gly Leu Gln Ile Lys Leu Asn Glu Leu Trp Lys Asn Phe Gly Phe
785 790 795 800
Lys Lys Asp Ser Glu Lys Leu Pro Pro Cys Lys Lys Pro Leu Ser Pro
805 810 815
Val Arg Asp Asn Ile Gln Leu Thr Pro Glu Ala Glu Glu Asp Ile Phe
820 825 830
Asn Lys Pro Glu Cys Gly Arg Val Gln Arg Ala Ile Phe Gln
835 840 845
<210> 57
<211> 649
<212> PRT
<213> Homo sapiens
<400> 57
Met Ala Ser Val Ser Ala Leu Thr Glu Glu Leu Asp Ser Ile Thr Ser
1 5 10 15
Glu Leu His Ala Val Glu Ile Gln Ile Gln Glu Leu Thr Glu Arg Gln
20 25 30
Gln Glu Leu Ile Gln Lys Lys Lys Val Leu Thr Lys Lys Ile Lys Gln
35 40 45
Cys Leu Glu Asp Ser Asp Ala Gly Ala Ser Asn Glu Tyr Asp Ser Ser
50 55 60
Pro Ala Ala Trp Asn Lys Glu Asp Phe Pro Trp Ser Gly Lys Val Lys
65 70 75 80
Asp Ile Leu Gln Asn Val Phe Lys Leu Glu Lys Phe Arg Pro Leu Gln
85 90 95
Leu Glu Thr Ile Asn Val Thr Met Ala Gly Lys Glu Val Phe Leu Val
100 105 110
Met Pro Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Leu Pro Ala Leu
115 120 125
Cys Ser Asp Gly Phe Thr Leu Val Ile Cys Pro Leu Ile Ser Leu Met
130 135 140
Glu Asp Gln Leu Met Val Leu Lys Gln Leu Gly Ile Ser Ala Thr Met
145 150 155 160
Leu Asn Ala Ser Ser Ser Lys Glu His Val Lys Trp Val His Ala Glu
165 170 175
Met Val Asn Lys Asn Ser Glu Leu Lys Leu Ile Tyr Val Thr Pro Glu
180 185 190
Lys Ile Ala Lys Ser Lys Met Phe Met Ser Arg Leu Glu Lys Ala Tyr
195 200 205
Glu Ala Arg Arg Phe Thr Arg Ile Ala Val Asp Glu Val His Cys Cys
210 215 220
Ser Gln Trp Gly His Asp Phe Arg Pro Asp Tyr Lys Ala Leu Gly Ile
225 230 235 240
Leu Lys Arg Gln Phe Pro Asn Ala Ser Leu Ile Gly Leu Thr Ala Thr
245 250 255
Ala Thr Asn His Val Leu Thr Asp Ala Gln Lys Ile Leu Cys Ile Glu
260 265 270
Lys Cys Phe Thr Phe Thr Ala Ser Phe Asn Arg Pro Asn Leu Tyr Tyr
275 280 285
Glu Val Arg Gln Lys Pro Ser Asn Thr Glu Asp Phe Ile Glu Asp Ile
290 295 300
Val Lys Leu Ile Asn Gly Arg Tyr Lys Gly Gln Ser Gly Ile Ile Tyr
305 310 315 320
Cys Phe Ser Gln Lys Asp Ser Glu Gln Val Thr Val Ser Leu Gln Asn
325 330 335
Leu Gly Ile His Ala Gly Ala Tyr His Ala Asn Leu Glu Pro Glu Asp
340 345 350
Lys Thr Thr Val His Arg Lys Trp Ser Ala Asn Glu Ile Gln Val Val
355 360 365
Val Ala Thr Val Ala Phe Gly Met Gly Ile Asp Lys Pro Asp Val Arg
370 375 380
Phe Val Ile His His Ser Met Ser Lys Ser Met Glu Asn Tyr Tyr Gln
385 390 395 400
Glu Ser Gly Arg Ala Gly Arg Asp Asp Met Lys Ala Asp Cys Ile Leu
405 410 415
Tyr Tyr Gly Phe Gly Asp Ile Phe Arg Ile Ser Ser Met Val Val Met
420 425 430
Glu Asn Val Gly Gln Gln Lys Leu Tyr Glu Met Val Ser Tyr Cys Gln
435 440 445
Asn Ile Ser Lys Cys Arg Arg Val Leu Met Ala Gln His Phe Asp Glu
450 455 460
Val Trp Asn Ser Glu Ala Cys Asn Lys Met Cys Asp Asn Cys Cys Lys
465 470 475 480
Asp Ser Ala Phe Glu Arg Lys Asn Ile Thr Glu Tyr Cys Arg Asp Leu
485 490 495
Ile Lys Ile Leu Lys Gln Ala Glu Glu Leu Asn Glu Lys Leu Thr Pro
500 505 510
Leu Lys Leu Ile Asp Ser Trp Met Gly Lys Gly Ala Ala Lys Leu Arg
515 520 525
Val Ala Gly Val Val Ala Pro Thr Leu Pro Arg Glu Asp Leu Glu Lys
530 535 540
Ile Ile Ala His Phe Leu Ile Gln Gln Tyr Leu Lys Glu Asp Tyr Ser
545 550 555 560
Phe Thr Ala Tyr Ala Thr Ile Ser Tyr Leu Lys Ile Gly Pro Lys Ala
565 570 575
Asn Leu Leu Asn Asn Glu Ala His Ala Ile Thr Met Gln Val Thr Lys
580 585 590
Ser Thr Gln Asn Ser Phe Arg Ala Glu Ser Ser Gln Thr Cys His Ser
595 600 605
Glu Gln Gly Asp Lys Lys Met Glu Glu Lys Asn Ser Gly Asn Phe Gln
610 615 620
Lys Lys Ala Ala Asn Met Leu Gln Gln Ser Gly Ser Lys Asn Thr Gly
625 630 635 640
Ala Lys Lys Arg Lys Ile Asp Asp Ala
645
<210> 58
<211> 760
<212> PRT
<213> Homo sapiens
<400> 58
Met Lys Leu Asn Val Asp Gly Leu Leu Val Tyr Phe Pro Tyr Asp Tyr
1 5 10 15
Ile Tyr Pro Glu Gln Phe Ser Tyr Met Arg Glu Leu Lys Arg Thr Leu
20 25 30
Asp Ala Lys Gly His Gly Val Leu Glu Met Pro Ser Gly Thr Gly Lys
35 40 45
Thr Val Ser Leu Leu Ala Leu Ile Met Ala Tyr Gln Arg Ala Tyr Pro
50 55 60
Leu Glu Val Thr Lys Leu Ile Tyr Cys Ser Arg Thr Val Pro Glu Ile
65 70 75 80
Glu Lys Val Ile Glu Glu Leu Arg Lys Leu Leu Asn Phe Tyr Glu Lys
85 90 95
Gln Glu Gly Glu Lys Leu Pro Phe Leu Gly Leu Ala Leu Ser Ser Arg
100 105 110
Lys Asn Leu Cys Ile His Pro Glu Val Thr Pro Leu Arg Phe Gly Lys
115 120 125
Asp Val Asp Gly Lys Cys His Ser Leu Thr Ala Ser Tyr Val Arg Ala
130 135 140
Gln Tyr Gln His Asp Thr Ser Leu Pro His Cys Arg Phe Tyr Glu Glu
145 150 155 160
Phe Asp Ala His Gly Arg Glu Val Pro Leu Pro Ala Gly Ile Tyr Asn
165 170 175
Leu Asp Asp Leu Lys Ala Leu Gly Arg Arg Gln Gly Trp Cys Pro Tyr
180 185 190
Phe Leu Ala Arg Tyr Ser Ile Leu His Ala Asn Val Val Val Tyr Ser
195 200 205
Tyr His Tyr Leu Leu Asp Pro Lys Ile Ala Asp Leu Val Ser Lys Glu
210 215 220
Leu Ala Arg Lys Ala Val Val Val Phe Asp Glu Ala His Asn Ile Asp
225 230 235 240
Asn Val Cys Ile Asp Ser Met Ser Val Asn Leu Thr Arg Arg Thr Leu
245 250 255
Asp Arg Cys Gln Gly Asn Leu Glu Thr Leu Gln Lys Thr Val Leu Arg
260 265 270
Ile Lys Glu Thr Asp Glu Gln Arg Leu Arg Asp Glu Tyr Arg Arg Leu
275 280 285
Val Glu Gly Leu Arg Glu Ala Ser Ala Ala Arg Glu Thr Asp Ala His
290 295 300
Leu Ala Asn Pro Val Leu Pro Asp Glu Val Leu Gln Glu Ala Val Pro
305 310 315 320
Gly Ser Ile Arg Thr Ala Glu His Phe Leu Gly Phe Leu Arg Arg Leu
325 330 335
Leu Glu Tyr Val Lys Trp Arg Leu Arg Val Gln His Val Val Gln Glu
340 345 350
Ser Pro Pro Ala Phe Leu Ser Gly Leu Ala Gln Arg Val Cys Ile Gln
355 360 365
Arg Lys Pro Leu Arg Phe Cys Ala Glu Arg Leu Arg Ser Leu Leu His
370 375 380
Thr Leu Glu Ile Thr Asp Leu Ala Asp Phe Ser Pro Leu Thr Leu Leu
385 390 395 400
Ala Asn Phe Ala Thr Leu Val Ser Thr Tyr Ala Lys Gly Phe Thr Ile
405 410 415
Ile Ile Glu Pro Phe Asp Asp Arg Thr Pro Thr Ile Ala Asn Pro Ile
420 425 430
Leu His Phe Ser Cys Met Asp Ala Ser Leu Ala Ile Lys Pro Val Phe
435 440 445
Glu Arg Phe Gln Ser Val Ile Ile Thr Ser Gly Thr Leu Ser Pro Leu
450 455 460
Asp Ile Tyr Pro Lys Ile Leu Asp Phe His Pro Val Thr Met Ala Thr
465 470 475 480
Phe Thr Met Thr Leu Ala Arg Val Cys Leu Cys Pro Met Ile Ile Gly
485 490 495
Arg Gly Asn Asp Gln Val Ala Ile Ser Ser Lys Phe Glu Thr Arg Glu
500 505 510
Asp Ile Ala Val Ile Arg Asn Tyr Gly Asn Leu Leu Leu Glu Met Ser
515 520 525
Ala Val Val Pro Asp Gly Ile Val Ala Phe Phe Thr Ser Tyr Gln Tyr
530 535 540
Met Glu Ser Thr Val Ala Ser Trp Tyr Glu Gln Gly Ile Leu Glu Asn
545 550 555 560
Ile Gln Arg Asn Lys Leu Leu Phe Ile Glu Thr Gln Asp Gly Ala Glu
565 570 575
Thr Ser Val Ala Leu Glu Lys Tyr Gln Glu Ala Cys Glu Asn Gly Arg
580 585 590
Gly Ala Ile Leu Leu Ser Val Ala Arg Gly Lys Val Ser Glu Gly Ile
595 600 605
Asp Phe Val His His Tyr Gly Arg Ala Val Ile Met Phe Gly Val Pro
610 615 620
Tyr Val Tyr Thr Gln Ser Arg Ile Leu Lys Ala Arg Leu Glu Tyr Leu
625 630 635 640
Arg Asp Gln Phe Gln Ile Arg Glu Asn Asp Phe Leu Thr Phe Asp Ala
645 650 655
Met Arg His Ala Ala Gln Cys Val Gly Arg Ala Ile Arg Gly Lys Thr
660 665 670
Asp Tyr Gly Leu Met Val Phe Ala Asp Lys Arg Phe Ala Arg Gly Asp
675 680 685
Lys Arg Gly Lys Leu Pro Arg Trp Ile Gln Glu His Leu Thr Asp Ala
690 695 700
Asn Leu Asn Leu Thr Val Asp Glu Gly Val Gln Val Ala Lys Tyr Phe
705 710 715 720
Leu Arg Gln Met Ala Gln Pro Phe His Arg Glu Asp Gln Leu Gly Leu
725 730 735
Ser Leu Leu Ser Leu Glu Gln Leu Glu Ser Glu Glu Thr Leu Lys Arg
740 745 750
Ile Glu Gln Ile Ala Gln Gln Leu
755 760
<210> 59
<211> 782
<212> PRT
<213> Homo sapiens
<400> 59
Met Gly Lys Arg Asp Arg Ala Asp Arg Asp Lys Lys Lys Ser Arg Lys
1 5 10 15
Arg His Tyr Glu Asp Glu Glu Asp Asp Glu Glu Asp Ala Pro Gly Asn
20 25 30
Asp Pro Gln Glu Ala Val Pro Ser Ala Ala Gly Lys Gln Val Asp Glu
35 40 45
Ser Gly Thr Lys Val Asp Glu Tyr Gly Ala Lys Asp Tyr Arg Leu Gln
50 55 60
Met Pro Leu Lys Asp Asp His Thr Ser Arg Pro Leu Trp Val Ala Pro
65 70 75 80
Asp Gly His Ile Phe Leu Glu Ala Phe Ser Pro Val Tyr Lys Tyr Ala
85 90 95
Gln Asp Phe Leu Val Ala Ile Ala Glu Pro Val Cys Arg Pro Thr His
100 105 110
Val His Glu Tyr Lys Leu Thr Ala Tyr Ser Leu Tyr Ala Ala Val Ser
115 120 125
Val Gly Leu Gln Thr Ser Asp Ile Thr Glu Tyr Leu Arg Lys Leu Ser
130 135 140
Lys Thr Gly Val Pro Asp Gly Ile Met Gln Phe Ile Lys Leu Cys Thr
145 150 155 160
Val Ser Tyr Gly Lys Val Lys Leu Val Leu Lys His Asn Arg Tyr Phe
165 170 175
Val Glu Ser Cys His Pro Asp Val Ile Gln His Leu Leu Gln Asp Pro
180 185 190
Val Ile Arg Glu Cys Arg Leu Arg Asn Ser Glu Gly Glu Ala Thr Glu
195 200 205
Leu Ile Thr Glu Thr Phe Thr Ser Lys Ser Ala Ile Ser Lys Thr Ala
210 215 220
Glu Ser Ser Gly Gly Pro Ser Thr Ser Arg Val Thr Asp Pro Gln Gly
225 230 235 240
Lys Ser Asp Ile Pro Met Asp Leu Phe Asp Phe Tyr Glu Gln Met Asp
245 250 255
Lys Asp Glu Glu Glu Glu Glu Glu Thr Gln Thr Val Ser Phe Glu Val
260 265 270
Lys Gln Glu Met Ile Glu Glu Leu Gln Lys Arg Cys Ile His Leu Glu
275 280 285
Tyr Pro Leu Leu Ala Glu Tyr Asp Phe Arg Asn Asp Ser Val Asn Pro
290 295 300
Asp Ile Asn Ile Asp Leu Lys Pro Thr Ala Val Leu Arg Pro Tyr Gln
305 310 315 320
Glu Lys Ser Leu Arg Lys Met Phe Gly Asn Gly Arg Ala Arg Ser Gly
325 330 335
Val Ile Val Leu Pro Cys Gly Ala Gly Lys Ser Leu Val Gly Val Thr
340 345 350
Ala Ala Cys Thr Val Arg Lys Arg Cys Leu Val Leu Gly Asn Ser Ala
355 360 365
Val Ser Val Glu Gln Trp Lys Ala Gln Phe Lys Met Trp Ser Thr Ile
370 375 380
Asp Asp Ser Gln Ile Cys Arg Phe Thr Ser Asp Ala Lys Asp Lys Pro
385 390 395 400
Ile Gly Cys Ser Val Ala Ile Ser Thr Tyr Ser Met Leu Gly His Thr
405 410 415
Thr Lys Arg Ser Trp Glu Ala Glu Arg Val Met Glu Trp Leu Lys Thr
420 425 430
Gln Glu Trp Gly Leu Met Ile Leu Asp Glu Val His Thr Ile Pro Ala
435 440 445
Lys Met Phe Arg Arg Val Leu Thr Ile Val Gln Ala His Cys Lys Leu
450 455 460
Gly Leu Thr Ala Thr Leu Val Arg Glu Asp Asp Lys Ile Val Asp Leu
465 470 475 480
Asn Phe Leu Ile Gly Pro Lys Leu Tyr Glu Ala Asn Trp Met Glu Leu
485 490 495
Gln Asn Asn Gly Tyr Ile Ala Lys Val Gln Cys Ala Glu Val Trp Cys
500 505 510
Pro Met Ser Pro Glu Phe Tyr Arg Glu Tyr Val Ala Ile Lys Thr Lys
515 520 525
Lys Arg Ile Leu Leu Tyr Thr Met Asn Pro Asn Lys Phe Arg Ala Cys
530 535 540
Gln Phe Leu Ile Lys Phe His Glu Arg Arg Asn Asp Lys Ile Ile Val
545 550 555 560
Phe Ala Asp Asn Val Phe Ala Leu Lys Glu Tyr Ala Ile Arg Leu Asn
565 570 575
Lys Pro Tyr Ile Tyr Gly Pro Thr Ser Gln Gly Glu Arg Met Gln Ile
580 585 590
Leu Gln Asn Phe Lys His Asn Pro Lys Ile Asn Thr Ile Phe Ile Ser
595 600 605
Lys Val Gly Asp Thr Ser Phe Asp Leu Pro Glu Ala Asn Val Leu Ile
610 615 620
Gln Ile Ser Ser His Gly Gly Ser Arg Arg Gln Glu Ala Gln Arg Leu
625 630 635 640
Gly Arg Val Leu Arg Ala Lys Lys Gly Met Val Ala Glu Glu Tyr Asn
645 650 655
Ala Phe Phe Tyr Ser Leu Val Ser Gln Asp Thr Gln Glu Met Ala Tyr
660 665 670
Ser Thr Lys Arg Gln Arg Phe Leu Val Asp Gln Gly Tyr Ser Phe Lys
675 680 685
Val Ile Thr Lys Leu Ala Gly Met Glu Glu Glu Asp Leu Ala Phe Ser
690 695 700
Thr Lys Glu Glu Gln Gln Gln Leu Leu Gln Lys Val Leu Ala Ala Thr
705 710 715 720
Asp Leu Asp Ala Glu Glu Glu Val Val Ala Gly Glu Phe Gly Ser Arg
725 730 735
Ser Ser Gln Ala Ser Arg Arg Phe Gly Thr Met Ser Ser Met Ser Gly
740 745 750
Ala Asp Asp Thr Val Tyr Met Glu Tyr His Ser Ser Arg Ser Lys Ala
755 760 765
Pro Ser Lys His Val His Pro Leu Phe Lys Arg Phe Arg Lys
770 775 780
<210> 60
<211> 1432
<212> PRT
<213> Homo sapiens
<400> 60
Met Ser Glu Lys Lys Leu Glu Thr Thr Ala Gln Gln Arg Lys Cys Pro
1 5 10 15
Glu Trp Met Asn Val Gln Asn Lys Arg Cys Ala Val Glu Glu Arg Lys
20 25 30
Ala Cys Val Arg Lys Ser Val Phe Glu Asp Asp Leu Pro Phe Leu Glu
35 40 45
Phe Thr Gly Ser Ile Val Tyr Ser Tyr Asp Ala Ser Asp Cys Ser Phe
50 55 60
Leu Ser Glu Asp Ile Ser Met Ser Leu Ser Asp Gly Asp Val Val Gly
65 70 75 80
Phe Asp Met Glu Trp Pro Pro Leu Tyr Asn Arg Gly Lys Leu Gly Lys
85 90 95
Val Ala Leu Ile Gln Leu Cys Val Ser Glu Ser Lys Cys Tyr Leu Phe
100 105 110
His Val Ser Ser Met Ser Val Phe Pro Gln Gly Leu Lys Met Leu Leu
115 120 125
Glu Asn Lys Ala Val Lys Lys Ala Gly Val Gly Ile Glu Gly Asp Gln
130 135 140
Trp Lys Leu Leu Arg Asp Phe Asp Ile Lys Leu Lys Asn Phe Val Glu
145 150 155 160
Leu Thr Asp Val Ala Asn Lys Lys Leu Lys Cys Thr Glu Thr Trp Ser
165 170 175
Leu Asn Ser Leu Val Lys His Leu Leu Gly Lys Gln Leu Leu Lys Asp
180 185 190
Lys Ser Ile Arg Cys Ser Asn Trp Ser Lys Phe Pro Leu Thr Glu Asp
195 200 205
Gln Lys Leu Tyr Ala Ala Thr Asp Ala Tyr Ala Gly Phe Ile Ile Tyr
210 215 220
Arg Asn Leu Glu Ile Leu Asp Asp Thr Val Gln Arg Phe Ala Ile Asn
225 230 235 240
Lys Glu Glu Glu Ile Leu Leu Ser Asp Met Asn Lys Gln Leu Thr Ser
245 250 255
Ile Ser Glu Glu Val Met Asp Leu Ala Lys His Leu Pro His Ala Phe
260 265 270
Ser Lys Leu Glu Asn Pro Arg Arg Val Ser Ile Leu Leu Lys Asp Ile
275 280 285
Ser Glu Asn Leu Tyr Ser Leu Arg Arg Met Ile Ile Gly Ser Thr Asn
290 295 300
Ile Glu Thr Glu Leu Arg Pro Ser Asn Asn Leu Asn Leu Leu Ser Phe
305 310 315 320
Glu Asp Ser Thr Thr Gly Gly Val Gln Gln Lys Gln Ile Arg Glu His
325 330 335
Glu Val Leu Ile His Val Glu Asp Glu Thr Trp Asp Pro Thr Leu Asp
340 345 350
His Leu Ala Lys His Asp Gly Glu Asp Val Leu Gly Asn Lys Val Glu
355 360 365
Arg Lys Glu Asp Gly Phe Glu Asp Gly Val Glu Asp Asn Lys Leu Lys
370 375 380
Glu Asn Met Glu Arg Ala Cys Leu Met Ser Leu Asp Ile Thr Glu His
385 390 395 400
Glu Leu Gln Ile Leu Glu Gln Gln Ser Gln Glu Glu Tyr Leu Ser Asp
405 410 415
Ile Ala Tyr Lys Ser Thr Glu His Leu Ser Pro Asn Asp Asn Glu Asn
420 425 430
Asp Thr Ser Tyr Val Ile Glu Ser Asp Glu Asp Leu Glu Met Glu Met
435 440 445
Leu Lys His Leu Ser Pro Asn Asp Asn Glu Asn Asp Thr Ser Tyr Val
450 455 460
Ile Glu Ser Asp Glu Asp Leu Glu Met Glu Met Leu Lys Ser Leu Glu
465 470 475 480
Asn Leu Asn Ser Gly Thr Val Glu Pro Thr His Ser Lys Cys Leu Lys
485 490 495
Met Glu Arg Asn Leu Gly Leu Pro Thr Lys Glu Glu Glu Glu Asp Asp
500 505 510
Glu Asn Glu Ala Asn Glu Gly Glu Glu Asp Asp Asp Lys Asp Phe Leu
515 520 525
Trp Pro Ala Pro Asn Glu Glu Gln Val Thr Cys Leu Lys Met Tyr Phe
530 535 540
Gly His Ser Ser Phe Lys Pro Val Gln Trp Lys Val Ile His Ser Val
545 550 555 560
Leu Glu Glu Arg Arg Asp Asn Val Ala Val Met Ala Thr Gly Tyr Gly
565 570 575
Lys Ser Leu Cys Phe Gln Tyr Pro Pro Val Tyr Val Gly Lys Ile Gly
580 585 590
Leu Val Ile Ser Pro Leu Ile Ser Leu Met Glu Asp Gln Val Leu Gln
595 600 605
Leu Lys Met Ser Asn Ile Pro Ala Cys Phe Leu Gly Ser Ala Gln Ser
610 615 620
Glu Asn Val Leu Thr Asp Ile Lys Leu Gly Lys Tyr Arg Ile Val Tyr
625 630 635 640
Val Thr Pro Glu Tyr Cys Ser Gly Asn Met Gly Leu Leu Gln Gln Leu
645 650 655
Glu Ala Asp Ile Gly Ile Thr Leu Ile Ala Val Asp Glu Ala His Cys
660 665 670
Ile Ser Glu Trp Gly His Asp Phe Arg Asp Ser Phe Arg Lys Leu Gly
675 680 685
Ser Leu Lys Thr Ala Leu Pro Met Val Pro Ile Val Ala Leu Thr Ala
690 695 700
Thr Ala Ser Ser Ser Ile Arg Glu Asp Ile Val Arg Cys Leu Asn Leu
705 710 715 720
Arg Asn Pro Gln Ile Thr Cys Thr Gly Phe Asp Arg Pro Asn Leu Tyr
725 730 735
Leu Glu Val Arg Arg Lys Thr Gly Asn Ile Leu Gln Asp Leu Gln Pro
740 745 750
Phe Leu Val Lys Thr Ser Ser His Trp Glu Phe Glu Gly Pro Thr Ile
755 760 765
Ile Tyr Cys Pro Ser Arg Lys Met Thr Gln Gln Val Thr Gly Glu Leu
770 775 780
Arg Lys Leu Asn Leu Ser Cys Gly Thr Tyr His Ala Gly Met Ser Phe
785 790 795 800
Ser Thr Arg Lys Asp Ile His His Arg Phe Val Arg Asp Glu Ile Gln
805 810 815
Cys Val Ile Ala Thr Ile Ala Phe Gly Met Gly Ile Asn Lys Ala Asp
820 825 830
Ile Arg Gln Val Ile His Tyr Gly Ala Pro Lys Asp Met Glu Ser Tyr
835 840 845
Tyr Gln Glu Ile Gly Arg Ala Gly Arg Asp Gly Leu Gln Ser Ser Cys
850 855 860
His Val Leu Trp Ala Pro Ala Asp Ile Asn Leu Asn Arg His Leu Leu
865 870 875 880
Thr Glu Ile Arg Asn Glu Lys Phe Arg Leu Tyr Lys Leu Lys Met Met
885 890 895
Ala Lys Met Glu Lys Tyr Leu His Ser Ser Arg Cys Arg Arg Gln Ile
900 905 910
Ile Leu Ser His Phe Glu Asp Lys Gln Val Gln Lys Ala Ser Leu Gly
915 920 925
Ile Met Gly Thr Glu Lys Cys Cys Asp Asn Cys Arg Ser Arg Leu Asp
930 935 940
His Cys Tyr Ser Met Asp Asp Ser Glu Asp Thr Ser Trp Asp Phe Gly
945 950 955 960
Pro Gln Ala Phe Lys Leu Leu Ser Ala Val Asp Ile Leu Gly Glu Lys
965 970 975
Phe Gly Ile Gly Leu Pro Ile Leu Phe Leu Arg Gly Ser Asn Ser Gln
980 985 990
Arg Leu Ala Asp Gln Tyr Arg Arg His Ser Leu Phe Gly Thr Gly Lys
995 1000 1005
Asp Gln Thr Glu Ser Trp Trp Lys Ala Phe Ser Arg Gln Leu Ile
1010 1015 1020
Thr Glu Gly Phe Leu Val Glu Val Ser Arg Tyr Asn Lys Phe Met
1025 1030 1035
Lys Ile Cys Ala Leu Thr Lys Lys Gly Arg Asn Trp Leu His Lys
1040 1045 1050
Ala Asn Thr Glu Ser Gln Ser Leu Ile Leu Gln Ala Asn Glu Glu
1055 1060 1065
Leu Cys Pro Lys Lys Leu Leu Leu Pro Ser Ser Lys Thr Val Ser
1070 1075 1080
Ser Gly Thr Lys Glu His Cys Tyr Asn Gln Val Pro Val Glu Leu
1085 1090 1095
Ser Thr Glu Lys Lys Ser Asn Leu Glu Lys Leu Tyr Ser Tyr Lys
1100 1105 1110
Pro Cys Asp Lys Ile Ser Ser Gly Ser Asn Ile Ser Lys Lys Ser
1115 1120 1125
Ile Met Val Gln Ser Pro Glu Lys Ala Tyr Ser Ser Ser Gln Pro
1130 1135 1140
Val Ile Ser Ala Gln Glu Gln Glu Thr Gln Ile Val Leu Tyr Gly
1145 1150 1155
Lys Leu Val Glu Ala Arg Gln Lys His Ala Asn Lys Met Asp Val
1160 1165 1170
Pro Pro Ala Ile Leu Ala Thr Asn Lys Ile Leu Val Asp Met Ala
1175 1180 1185
Lys Met Arg Pro Thr Thr Val Glu Asn Val Lys Arg Ile Asp Gly
1190 1195 1200
Val Ser Glu Gly Lys Ala Ala Met Leu Ala Pro Leu Leu Glu Val
1205 1210 1215
Ile Lys His Phe Cys Gln Thr Asn Ser Val Gln Thr Asp Leu Phe
1220 1225 1230
Ser Ser Thr Lys Pro Gln Glu Glu Gln Lys Thr Ser Leu Val Ala
1235 1240 1245
Lys Asn Lys Ile Cys Thr Leu Ser Gln Ser Met Ala Ile Thr Tyr
1250 1255 1260
Ser Leu Phe Gln Glu Lys Lys Met Pro Leu Lys Ser Ile Ala Glu
1265 1270 1275
Ser Arg Ile Leu Pro Leu Met Thr Ile Gly Met His Leu Ser Gln
1280 1285 1290
Ala Val Lys Ala Gly Cys Pro Leu Asp Leu Glu Arg Ala Gly Leu
1295 1300 1305
Thr Pro Glu Val Gln Lys Ile Ile Ala Asp Val Ile Arg Asn Pro
1310 1315 1320
Pro Val Asn Ser Asp Met Ser Lys Ile Ser Leu Ile Arg Met Leu
1325 1330 1335
Val Pro Glu Asn Ile Asp Thr Tyr Leu Ile His Met Ala Ile Glu
1340 1345 1350
Ile Leu Lys His Gly Pro Asp Ser Gly Leu Gln Pro Ser Cys Asp
1355 1360 1365
Val Asn Lys Arg Arg Cys Phe Pro Gly Ser Glu Glu Ile Cys Ser
1370 1375 1380
Ser Ser Lys Arg Ser Lys Glu Glu Val Gly Ile Asn Thr Glu Thr
1385 1390 1395
Ser Ser Ala Glu Arg Lys Arg Arg Leu Pro Val Trp Phe Ala Lys
1400 1405 1410
Gly Ser Asp Thr Ser Lys Lys Leu Met Asp Lys Thr Lys Arg Gly
1415 1420 1425
Gly Leu Phe Ser
1430
<210> 61
<211> 991
<212> PRT
<213> Homo sapiens
<400> 61
Met Ser Ser His His Thr Thr Phe Pro Phe Asp Pro Glu Arg Arg Val
1 5 10 15
Arg Ser Thr Leu Lys Lys Val Phe Gly Phe Asp Ser Phe Lys Thr Pro
20 25 30
Leu Gln Glu Ser Ala Thr Met Ala Val Val Lys Gly Asn Lys Asp Val
35 40 45
Phe Val Cys Met Pro Thr Gly Ala Gly Lys Ser Leu Cys Tyr Gln Leu
50 55 60
Pro Ala Leu Leu Ala Lys Gly Ile Thr Ile Val Val Ser Pro Leu Ile
65 70 75 80
Ala Leu Ile Gln Asp Gln Val Asp His Leu Leu Thr Leu Lys Val Arg
85 90 95
Val Ser Ser Leu Asn Ser Lys Leu Ser Ala Gln Glu Arg Lys Glu Leu
100 105 110
Leu Ala Asp Leu Glu Arg Glu Lys Pro Gln Thr Lys Ile Leu Tyr Ile
115 120 125
Thr Pro Glu Met Ala Ala Ser Ser Ser Phe Gln Pro Thr Leu Asn Ser
130 135 140
Leu Val Ser Arg His Leu Leu Ser Tyr Leu Val Val Asp Glu Ala His
145 150 155 160
Cys Val Ser Gln Trp Gly His Asp Phe Arg Pro Asp Tyr Leu Arg Leu
165 170 175
Gly Ala Leu Arg Ser Arg Leu Gly His Ala Pro Cys Val Ala Leu Thr
180 185 190
Ala Thr Ala Thr Pro Gln Val Gln Glu Asp Val Phe Ala Ala Leu His
195 200 205
Leu Lys Lys Pro Val Ala Ile Phe Lys Thr Pro Cys Phe Arg Ala Asn
210 215 220
Leu Phe Tyr Asp Val Gln Phe Lys Glu Leu Ile Ser Asp Pro Tyr Gly
225 230 235 240
Asn Leu Lys Asp Phe Cys Leu Lys Ala Leu Gly Gln Glu Ala Asp Lys
245 250 255
Gly Leu Ser Gly Cys Gly Ile Val Tyr Cys Arg Thr Arg Glu Ala Cys
260 265 270
Glu Gln Leu Ala Ile Glu Leu Ser Cys Arg Gly Val Asn Ala Lys Ala
275 280 285
Tyr His Ala Gly Leu Lys Ala Ser Glu Arg Thr Leu Val Gln Asn Asp
290 295 300
Trp Met Glu Glu Lys Val Pro Val Ile Val Ala Thr Ile Ser Phe Gly
305 310 315 320
Met Gly Val Asp Lys Ala Asn Val Arg Phe Val Ala His Trp Asn Ile
325 330 335
Ala Lys Ser Met Ala Gly Tyr Tyr Gln Glu Ser Gly Arg Ala Gly Arg
340 345 350
Asp Gly Lys Pro Ser Trp Cys Arg Leu Tyr Tyr Ser Arg Asn Asp Arg
355 360 365
Asp Gln Val Ser Phe Leu Ile Arg Lys Glu Val Ala Lys Leu Gln Glu
370 375 380
Lys Arg Gly Asn Lys Ala Ser Asp Lys Ala Thr Ile Met Ala Phe Asp
385 390 395 400
Ala Leu Val Thr Phe Cys Glu Glu Leu Gly Cys Arg His Ala Ala Ile
405 410 415
Ala Lys Tyr Phe Gly Asp Ala Leu Pro Ala Cys Ala Lys Gly Cys Asp
420 425 430
His Cys Gln Asn Pro Thr Ala Val Arg Arg Arg Leu Glu Ala Leu Glu
435 440 445
Arg Ser Ser Ser Trp Ser Lys Thr Cys Ile Gly Pro Ser Gln Gly Asn
450 455 460
Gly Phe Asp Pro Glu Leu Tyr Glu Gly Gly Arg Lys Gly Tyr Gly Asp
465 470 475 480
Phe Ser Arg Tyr Asp Glu Gly Ser Gly Gly Ser Gly Asp Glu Gly Arg
485 490 495
Asp Glu Ala His Lys Arg Glu Trp Asn Leu Phe Tyr Gln Lys Gln Met
500 505 510
Gln Leu Arg Lys Gly Lys Asp Pro Lys Ile Glu Glu Phe Val Pro Pro
515 520 525
Asp Glu Asn Cys Pro Leu Lys Glu Ala Ser Ser Arg Arg Ile Pro Arg
530 535 540
Leu Thr Val Lys Ala Arg Glu His Cys Leu Arg Leu Leu Glu Glu Ala
545 550 555 560
Leu Ser Ser Asn Arg Gln Ser Thr Arg Thr Ala Asp Glu Ala Asp Leu
565 570 575
Arg Ala Lys Ala Val Glu Leu Glu His Glu Thr Phe Arg Asn Ala Lys
580 585 590
Val Ala Asn Leu Tyr Lys Ala Ser Val Leu Lys Lys Val Ala Asp Ile
595 600 605
His Arg Ala Ser Lys Asp Gly Gln Pro Tyr Asp Met Gly Gly Ser Ala
610 615 620
Lys Ser Cys Ser Ala Gln Ala Glu Pro Pro Glu Pro Asn Glu Tyr Asp
625 630 635 640
Ile Pro Pro Ala Ser His Val Tyr Ser Leu Lys Pro Lys Arg Val Gly
645 650 655
Ala Gly Phe Pro Lys Gly Ser Cys Pro Phe Gln Thr Ala Thr Glu Leu
660 665 670
Met Glu Thr Thr Arg Ile Arg Glu Gln Ala Pro Gln Pro Glu Arg Gly
675 680 685
Gly Glu His Glu Pro Pro Ser Arg Pro Cys Gly Leu Leu Asp Glu Asp
690 695 700
Gly Ser Glu Pro Leu Pro Gly Pro Arg Gly Glu Val Pro Gly Gly Ser
705 710 715 720
Ala His Tyr Gly Gly Pro Ser Pro Glu Lys Lys Ala Lys Ser Ser Ser
725 730 735
Gly Gly Ser Ser Leu Ala Lys Gly Arg Ala Ser Lys Lys Gln Gln Leu
740 745 750
Leu Ala Thr Ala Ala His Lys Asp Ser Gln Ser Ile Ala Arg Phe Phe
755 760 765
Cys Arg Arg Val Glu Ser Pro Ala Leu Leu Ala Ser Ala Pro Glu Ala
770 775 780
Glu Gly Ala Cys Pro Ser Cys Glu Gly Val Gln Gly Pro Pro Met Ala
785 790 795 800
Pro Glu Lys Tyr Thr Gly Glu Glu Asp Gly Ala Gly Gly His Ser Pro
805 810 815
Ala Pro Pro Gln Thr Glu Glu Cys Leu Arg Glu Arg Pro Ser Thr Cys
820 825 830
Pro Pro Arg Asp Gln Gly Thr Pro Glu Val Gln Pro Thr Pro Ala Lys
835 840 845
Asp Thr Trp Lys Gly Lys Arg Pro Arg Ser Gln Gln Glu Asn Pro Glu
850 855 860
Ser Gln Pro Gln Lys Arg Pro Arg Pro Ser Ala Lys Pro Ser Val Val
865 870 875 880
Ala Glu Val Lys Gly Ser Val Ser Ala Ser Glu Gln Gly Thr Leu Asn
885 890 895
Pro Thr Ala Gln Asp Pro Phe Gln Leu Ser Ala Pro Gly Val Ser Leu
900 905 910
Lys Glu Ala Ala Asn Val Val Val Lys Cys Leu Thr Pro Phe Tyr Lys
915 920 925
Glu Gly Lys Phe Ala Ser Lys Glu Leu Phe Lys Gly Phe Ala Arg His
930 935 940
Leu Ser His Leu Leu Thr Gln Lys Thr Ser Pro Gly Arg Ser Val Lys
945 950 955 960
Glu Glu Ala Gln Asn Leu Ile Arg His Phe Phe His Gly Arg Ala Arg
965 970 975
Cys Glu Ser Glu Ala Asp Trp His Gly Leu Cys Gly Pro Gln Arg
980 985 990
<210> 62
<211> 1208
<212> PRT
<213> Homo sapiens
<400> 62
Met Glu Arg Leu Arg Asp Val Arg Glu Arg Leu Gln Ala Trp Glu Arg
1 5 10 15
Ala Phe Arg Arg Gln Arg Gly Arg Arg Pro Ser Gln Asp Asp Val Glu
20 25 30
Ala Ala Pro Glu Glu Thr Arg Ala Leu Tyr Arg Glu Tyr Arg Thr Leu
35 40 45
Lys Arg Thr Thr Gly Gln Ala Gly Gly Gly Leu Arg Ser Ser Glu Ser
50 55 60
Leu Pro Ala Ala Ala Glu Glu Ala Pro Glu Pro Arg Cys Trp Gly Pro
65 70 75 80
His Leu Asn Arg Ala Ala Thr Lys Ser Pro Gln Ser Thr Pro Gly Arg
85 90 95
Ser Arg Gln Gly Ser Val Pro Asp Tyr Gly Gln Arg Leu Lys Ala Asn
100 105 110
Leu Lys Gly Thr Leu Gln Ala Gly Pro Ala Leu Gly Arg Arg Pro Trp
115 120 125
Pro Leu Gly Arg Ala Ser Ser Lys Ala Ser Thr Pro Lys Pro Pro Gly
130 135 140
Thr Gly Pro Val Pro Ser Phe Ala Glu Lys Val Ser Asp Glu Pro Pro
145 150 155 160
Gln Leu Pro Glu Pro Gln Pro Arg Pro Gly Arg Leu Gln His Leu Gln
165 170 175
Ala Ser Leu Ser Gln Arg Leu Gly Ser Leu Asp Pro Gly Trp Leu Gln
180 185 190
Arg Cys His Ser Glu Val Pro Asp Phe Leu Gly Ala Pro Lys Ala Cys
195 200 205
Arg Pro Asp Leu Gly Ser Glu Glu Ser Gln Leu Leu Ile Pro Gly Glu
210 215 220
Ser Ala Val Leu Gly Pro Gly Ala Gly Ser Gln Gly Pro Glu Ala Ser
225 230 235 240
Ala Phe Gln Glu Val Ser Ile Arg Val Gly Ser Pro Gln Pro Ser Ser
245 250 255
Ser Gly Gly Glu Lys Arg Arg Trp Asn Glu Glu Pro Trp Glu Ser Pro
260 265 270
Ala Gln Val Gln Gln Glu Ser Ser Gln Ala Gly Pro Pro Ser Glu Gly
275 280 285
Ala Gly Ala Val Ala Val Glu Glu Asp Pro Pro Gly Glu Pro Val Gln
290 295 300
Ala Gln Pro Pro Gln Pro Cys Ser Ser Pro Ser Asn Pro Arg Tyr His
305 310 315 320
Gly Leu Ser Pro Ser Ser Gln Ala Arg Ala Gly Lys Ala Glu Gly Thr
325 330 335
Ala Pro Leu His Ile Phe Pro Arg Leu Ala Arg His Asp Arg Gly Asn
340 345 350
Tyr Val Arg Leu Asn Met Lys Gln Lys His Tyr Val Arg Gly Arg Ala
355 360 365
Leu Arg Ser Arg Leu Leu Arg Lys Gln Ala Trp Lys Gln Lys Trp Arg
370 375 380
Lys Lys Gly Glu Cys Phe Gly Gly Gly Gly Ala Thr Val Thr Thr Lys
385 390 395 400
Glu Ser Cys Phe Leu Asn Glu Gln Phe Asp His Trp Ala Ala Gln Cys
405 410 415
Pro Arg Pro Ala Ser Glu Glu Asp Thr Asp Ala Val Gly Pro Glu Pro
420 425 430
Leu Val Pro Ser Pro Gln Pro Val Pro Glu Val Pro Ser Leu Asp Pro
435 440 445
Thr Val Leu Pro Leu Tyr Ser Leu Gly Pro Ser Gly Gln Leu Ala Glu
450 455 460
Thr Pro Ala Glu Val Phe Gln Ala Leu Glu Gln Leu Gly His Gln Ala
465 470 475 480
Phe Arg Pro Gly Gln Glu Arg Ala Val Met Arg Ile Leu Ser Gly Ile
485 490 495
Ser Thr Leu Leu Val Leu Pro Thr Gly Ala Gly Lys Ser Leu Cys Tyr
500 505 510
Gln Leu Pro Ala Leu Leu Tyr Ser Arg Arg Ser Pro Cys Leu Thr Leu
515 520 525
Val Val Ser Pro Leu Leu Ser Leu Met Asp Asp Gln Val Ser Gly Leu
530 535 540
Pro Pro Cys Leu Lys Ala Ala Cys Ile His Ser Gly Met Thr Arg Lys
545 550 555 560
Gln Arg Glu Ser Val Leu Gln Lys Ile Arg Ala Ala Gln Val His Val
565 570 575
Leu Met Leu Thr Pro Glu Ala Leu Val Gly Ala Gly Gly Leu Pro Pro
580 585 590
Ala Ala Gln Leu Pro Pro Val Ala Phe Ala Cys Ile Asp Glu Ala His
595 600 605
Cys Leu Ser Gln Trp Ser His Asn Phe Arg Pro Cys Tyr Leu Arg Val
610 615 620
Cys Lys Val Leu Arg Glu Arg Met Gly Val His Cys Phe Leu Gly Leu
625 630 635 640
Thr Ala Thr Ala Thr Arg Arg Thr Ala Ser Asp Val Ala Gln His Leu
645 650 655
Ala Val Ala Glu Glu Pro Asp Leu His Gly Pro Ala Pro Val Pro Thr
660 665 670
Asn Leu His Leu Ser Val Ser Met Asp Arg Asp Thr Asp Gln Ala Leu
675 680 685
Leu Thr Leu Leu Gln Gly Lys Arg Phe Gln Asn Leu Asp Ser Ile Ile
690 695 700
Ile Tyr Cys Asn Arg Arg Glu Asp Thr Glu Arg Ile Ala Ala Leu Leu
705 710 715 720
Arg Thr Cys Leu His Ala Ala Trp Val Pro Gly Ser Gly Gly Arg Ala
725 730 735
Pro Lys Thr Thr Ala Glu Ala Tyr His Ala Gly Met Cys Ser Arg Glu
740 745 750
Arg Arg Arg Val Gln Arg Ala Phe Met Gln Gly Gln Leu Arg Val Val
755 760 765
Val Ala Thr Val Ala Phe Gly Met Gly Leu Asp Arg Pro Asp Val Arg
770 775 780
Ala Val Leu His Leu Gly Leu Pro Pro Ser Phe Glu Ser Tyr Val Gln
785 790 795 800
Ala Val Gly Arg Ala Gly Arg Asp Gly Gln Pro Ala His Cys His Leu
805 810 815
Phe Leu Gln Pro Gln Gly Glu Asp Leu Arg Glu Leu Arg Arg His Val
820 825 830
His Ala Asp Ser Thr Asp Phe Leu Ala Val Lys Arg Leu Val Gln Arg
835 840 845
Val Phe Pro Ala Cys Thr Cys Thr Cys Thr Arg Pro Pro Ser Glu Gln
850 855 860
Glu Gly Ala Val Gly Gly Glu Arg Pro Val Pro Lys Tyr Pro Pro Gln
865 870 875 880
Glu Ala Glu Gln Leu Ser His Gln Ala Ala Pro Gly Pro Arg Arg Val
885 890 895
Cys Met Gly His Glu Arg Ala Leu Pro Ile Gln Leu Thr Val Gln Ala
900 905 910
Leu Asp Met Pro Glu Glu Ala Ile Glu Thr Leu Leu Cys Tyr Leu Glu
915 920 925
Leu His Pro His His Trp Leu Glu Leu Leu Ala Thr Thr Tyr Thr His
930 935 940
Cys Arg Leu Asn Cys Pro Gly Gly Pro Ala Gln Leu Gln Ala Leu Ala
945 950 955 960
His Arg Cys Pro Pro Leu Ala Val Cys Leu Ala Gln Gln Leu Pro Glu
965 970 975
Asp Pro Gly Gln Gly Ser Ser Ser Val Glu Phe Asp Met Val Lys Leu
980 985 990
Val Asp Ser Met Gly Trp Glu Leu Ala Ser Val Arg Arg Ala Leu Cys
995 1000 1005
Gln Leu Gln Trp Asp His Glu Pro Arg Thr Gly Val Arg Arg Gly
1010 1015 1020
Thr Gly Val Leu Val Glu Phe Ser Glu Leu Ala Phe His Leu Arg
1025 1030 1035
Ser Pro Gly Asp Leu Thr Ala Glu Glu Lys Asp Gln Ile Cys Asp
1040 1045 1050
Phe Leu Tyr Gly Arg Val Gln Ala Arg Glu Arg Gln Ala Leu Ala
1055 1060 1065
Arg Leu Arg Arg Thr Phe Gln Ala Phe His Ser Val Ala Phe Pro
1070 1075 1080
Ser Cys Gly Pro Cys Leu Glu Gln Gln Asp Glu Glu Arg Ser Thr
1085 1090 1095
Arg Leu Lys Asp Leu Leu Gly Arg Tyr Phe Glu Glu Glu Glu Gly
1100 1105 1110
Gln Glu Pro Gly Gly Met Glu Asp Ala Gln Gly Pro Glu Pro Gly
1115 1120 1125
Gln Ala Arg Leu Gln Asp Trp Glu Asp Gln Val Arg Cys Asp Ile
1130 1135 1140
Arg Gln Phe Leu Ser Leu Arg Pro Glu Glu Lys Phe Ser Ser Arg
1145 1150 1155
Ala Val Ala Arg Ile Phe His Gly Ile Gly Ser Pro Cys Tyr Pro
1160 1165 1170
Ala Gln Val Tyr Gly Gln Asp Arg Arg Phe Trp Arg Lys Tyr Leu
1175 1180 1185
His Leu Ser Phe His Ala Leu Val Gly Leu Ala Thr Glu Glu Leu
1190 1195 1200
Leu Gln Val Ala Arg
1205
<210> 63
<211> 1101
<212> PRT
<213> Homo sapiens
<400> 63
Met Asp Glu Cys Gly Ser Arg Ile Arg Arg Arg Val Ser Leu Pro Lys
1 5 10 15
Arg Asn Arg Pro Ser Leu Gly Cys Ile Phe Gly Ala Pro Thr Ala Ala
20 25 30
Glu Leu Val Pro Gly Asp Glu Gly Lys Glu Glu Glu Glu Met Val Ala
35 40 45
Glu Asn Arg Arg Arg Lys Thr Ala Gly Val Leu Pro Val Glu Val Gln
50 55 60
Pro Leu Leu Leu Ser Asp Ser Pro Glu Cys Leu Val Leu Gly Gly Gly
65 70 75 80
Asp Thr Asn Pro Asp Leu Leu Arg His Met Pro Thr Asp Arg Gly Val
85 90 95
Gly Asp Gln Pro Asn Asp Ser Glu Val Asp Met Phe Gly Asp Tyr Asp
100 105 110
Ser Phe Thr Glu Asn Ser Phe Ile Ala Gln Val Asp Asp Leu Glu Gln
115 120 125
Lys Tyr Met Gln Leu Pro Glu His Lys Lys His Ala Thr Asp Phe Ala
130 135 140
Thr Glu Asn Leu Cys Ser Glu Ser Ile Lys Asn Lys Leu Ser Ile Thr
145 150 155 160
Thr Ile Gly Asn Leu Thr Glu Leu Gln Thr Asp Lys His Thr Glu Asn
165 170 175
Gln Ser Gly Tyr Glu Gly Val Thr Ile Glu Pro Gly Ala Asp Leu Leu
180 185 190
Tyr Asp Val Pro Ser Ser Gln Ala Ile Tyr Phe Glu Asn Leu Gln Asn
195 200 205
Ser Ser Asn Asp Leu Gly Asp His Ser Met Lys Glu Arg Asp Trp Lys
210 215 220
Ser Ser Ser His Asn Thr Val Asn Glu Glu Leu Pro His Asn Cys Ile
225 230 235 240
Glu Gln Pro Gln Gln Asn Asp Glu Ser Ser Ser Lys Val Arg Thr Ser
245 250 255
Ser Asp Met Asn Arg Arg Lys Ser Ile Lys Asp His Leu Lys Asn Ala
260 265 270
Met Thr Gly Asn Ala Lys Ala Gln Thr Pro Ile Phe Ser Arg Ser Lys
275 280 285
Gln Leu Lys Asp Thr Leu Leu Ser Glu Glu Ile Asn Val Ala Lys Lys
290 295 300
Thr Val Glu Ser Ser Ser Asn Asp Leu Gly Pro Phe Tyr Ser Leu Pro
305 310 315 320
Ser Lys Val Arg Asp Leu Tyr Ala Gln Phe Lys Gly Ile Glu Lys Leu
325 330 335
Tyr Glu Trp Gln His Thr Cys Leu Thr Leu Asn Ser Val Gln Glu Arg
340 345 350
Lys Asn Leu Ile Tyr Ser Leu Pro Thr Ser Gly Gly Lys Thr Leu Val
355 360 365
Ala Glu Ile Leu Met Leu Gln Glu Leu Leu Cys Cys Arg Lys Asp Val
370 375 380
Leu Met Ile Leu Pro Tyr Val Ala Ile Val Gln Glu Lys Ile Ser Gly
385 390 395 400
Leu Ser Ser Phe Gly Ile Glu Leu Gly Phe Phe Val Glu Glu Tyr Ala
405 410 415
Gly Ser Lys Gly Arg Phe Pro Pro Thr Lys Arg Arg Glu Lys Lys Ser
420 425 430
Leu Tyr Ile Ala Thr Ile Glu Lys Gly His Ser Leu Val Asn Ser Leu
435 440 445
Ile Glu Thr Gly Arg Ile Asp Ser Leu Gly Leu Val Val Val Asp Glu
450 455 460
Leu His Met Ile Gly Glu Gly Ser Arg Gly Ala Thr Leu Glu Met Thr
465 470 475 480
Leu Ala Lys Ile Leu Tyr Thr Ser Lys Thr Thr Gln Ile Ile Gly Met
485 490 495
Ser Ala Thr Leu Asn Asn Val Glu Asp Leu Gln Lys Phe Leu Gln Ala
500 505 510
Glu Tyr Tyr Thr Ser Gln Phe Arg Pro Val Glu Leu Lys Glu Tyr Leu
515 520 525
Lys Ile Asn Asp Thr Ile Tyr Glu Val Asp Ser Lys Ala Glu Asn Gly
530 535 540
Met Thr Phe Ser Arg Leu Leu Asn Tyr Lys Tyr Ser Asp Thr Leu Lys
545 550 555 560
Lys Met Asp Pro Asp His Leu Val Ala Leu Val Thr Glu Val Ile Pro
565 570 575
Asn Tyr Ser Cys Leu Val Phe Cys Pro Ser Lys Lys Asn Cys Glu Asn
580 585 590
Val Ala Glu Met Ile Cys Lys Phe Leu Ser Lys Glu Tyr Leu Lys His
595 600 605
Lys Glu Lys Glu Lys Cys Glu Val Ile Lys Asn Leu Lys Asn Ile Gly
610 615 620
Asn Gly Asn Leu Cys Pro Val Leu Lys Arg Thr Ile Pro Phe Gly Val
625 630 635 640
Ala Tyr His His Ser Gly Leu Thr Ser Asp Glu Arg Lys Leu Leu Glu
645 650 655
Glu Ala Tyr Ser Thr Gly Val Leu Cys Leu Phe Thr Cys Thr Ser Thr
660 665 670
Leu Ala Ala Gly Val Asn Leu Pro Ala Arg Arg Val Ile Leu Arg Ala
675 680 685
Pro Tyr Val Ala Lys Glu Phe Leu Lys Arg Asn Gln Tyr Lys Gln Met
690 695 700
Ile Gly Arg Ala Gly Arg Ala Gly Ile Asp Thr Ile Gly Glu Ser Ile
705 710 715 720
Leu Ile Leu Gln Glu Lys Asp Lys Gln Gln Val Leu Glu Leu Ile Thr
725 730 735
Lys Pro Leu Glu Asn Cys Tyr Ser His Leu Val Gln Glu Phe Thr Lys
740 745 750
Gly Ile Gln Thr Leu Phe Leu Ser Leu Ile Gly Leu Lys Ile Ala Thr
755 760 765
Asn Leu Asp Asp Ile Tyr His Phe Met Asn Gly Thr Phe Phe Gly Val
770 775 780
Gln Gln Lys Val Leu Leu Lys Glu Lys Ser Leu Trp Glu Ile Thr Val
785 790 795 800
Glu Ser Leu Arg Tyr Leu Thr Glu Lys Gly Leu Leu Gln Lys Asp Thr
805 810 815
Ile Tyr Lys Ser Glu Glu Glu Val Gln Tyr Asn Phe His Ile Thr Lys
820 825 830
Leu Gly Arg Ala Ser Phe Lys Gly Thr Ile Asp Leu Ala Tyr Cys Asp
835 840 845
Ile Leu Tyr Arg Asp Leu Lys Lys Gly Leu Glu Gly Leu Val Leu Glu
850 855 860
Ser Leu Leu His Leu Ile Tyr Leu Thr Thr Pro Tyr Asp Leu Val Ser
865 870 875 880
Gln Cys Asn Pro Asp Trp Met Ile Tyr Phe Arg Gln Phe Ser Gln Leu
885 890 895
Ser Pro Ala Glu Gln Asn Val Ala Ala Ile Leu Gly Val Ser Glu Ser
900 905 910
Phe Ile Gly Lys Lys Ala Ser Gly Gln Ala Ile Gly Lys Lys Val Asp
915 920 925
Lys Asn Val Val Asn Arg Leu Tyr Leu Ser Phe Val Leu Tyr Thr Leu
930 935 940
Leu Lys Glu Thr Asn Ile Trp Thr Val Ser Glu Lys Phe Asn Met Pro
945 950 955 960
Arg Gly Tyr Ile Gln Asn Leu Leu Thr Gly Thr Ala Ser Phe Ser Ser
965 970 975
Cys Val Leu His Phe Cys Glu Glu Leu Glu Glu Phe Trp Val Tyr Arg
980 985 990
Ala Leu Leu Val Glu Leu Thr Lys Lys Leu Thr Tyr Cys Val Lys Ala
995 1000 1005
Glu Leu Ile Pro Leu Met Glu Val Thr Gly Val Leu Glu Gly Arg
1010 1015 1020
Ala Lys Gln Leu Tyr Ser Ala Gly Tyr Lys Ser Leu Met His Leu
1025 1030 1035
Ala Asn Ala Asn Pro Glu Val Leu Val Arg Thr Ile Asp His Leu
1040 1045 1050
Ser Arg Arg Gln Ala Lys Gln Ile Val Ser Ser Ala Lys Met Leu
1055 1060 1065
Leu His Glu Lys Ala Glu Ala Leu Gln Glu Glu Val Glu Glu Leu
1070 1075 1080
Leu Arg Leu Pro Ser Asp Phe Pro Gly Ala Val Ala Ser Ser Thr
1085 1090 1095
Asp Lys Ala
1100
<210> 64
<211> 1196
<212> PRT
<213> Herpes simplex virus
<400> 64
Met Glu Thr Lys Pro Lys Thr Ala Thr Thr Ile Lys Val Pro Pro Gly
1 5 10 15
Pro Leu Gly Tyr Val Tyr Ala Arg Ala Cys Pro Ser Glu Gly Ile Glu
20 25 30
Leu Leu Ala Leu Leu Ser Ala Arg Ser Gly Asp Ser Asp Val Ala Val
35 40 45
Ala Pro Leu Val Val Gly Leu Thr Val Glu Ser Gly Phe Glu Ala Asn
50 55 60
Val Ala Val Val Val Gly Ser Arg Thr Thr Gly Leu Gly Gly Thr Ala
65 70 75 80
Val Ser Leu Lys Leu Thr Pro Ser His Tyr Ser Ser Ser Val Tyr Val
85 90 95
Phe His Gly Gly Arg His Leu Asp Pro Ser Thr Gln Ala Pro Asn Leu
100 105 110
Thr Arg Leu Cys Glu Arg Ala Arg Arg His Phe Gly Phe Ser Asp Tyr
115 120 125
Thr Pro Arg Pro Gly Asp Leu Lys His Glu Thr Thr Gly Glu Ala Leu
130 135 140
Cys Glu Arg Leu Gly Leu Asp Pro Asp Arg Ala Leu Leu Tyr Leu Val
145 150 155 160
Val Thr Glu Gly Phe Lys Glu Ala Val Cys Ile Asn Asn Thr Phe Leu
165 170 175
His Leu Gly Gly Ser Asp Lys Val Thr Ile Gly Gly Ala Glu Val His
180 185 190
Arg Ile Pro Val Tyr Pro Leu Gln Leu Phe Met Pro Asp Phe Ser Arg
195 200 205
Val Ile Ala Glu Pro Phe Asn Ala Asn His Arg Ser Ile Gly Glu Lys
210 215 220
Phe Thr Tyr Pro Leu Pro Phe Phe Asn Arg Pro Leu Asn Arg Leu Leu
225 230 235 240
Phe Glu Ala Val Val Gly Pro Ala Ala Val Ala Leu Arg Cys Arg Asn
245 250 255
Val Asp Ala Val Ala Arg Ala Ala Ala His Leu Ala Phe Asp Glu Asn
260 265 270
His Glu Gly Ala Ala Leu Pro Ala Asp Ile Thr Phe Thr Ala Phe Glu
275 280 285
Ala Ser Gln Gly Lys Thr Pro Arg Gly Gly Arg Asp Gly Gly Gly Lys
290 295 300
Gly Ala Ala Gly Gly Phe Glu Gln Arg Leu Ala Ser Val Met Ala Gly
305 310 315 320
Asp Ala Ala Leu Ala Leu Glu Ser Ile Val Ser Met Ala Val Phe Asp
325 330 335
Glu Pro Pro Thr Asp Ile Ser Ala Trp Pro Leu Phe Glu Gly Gln Asp
340 345 350
Thr Ala Ala Ala Arg Ala Asn Ala Val Gly Ala Tyr Leu Ala Arg Ala
355 360 365
Ala Gly Leu Val Gly Ala Met Val Phe Ser Thr Asn Ser Ala Leu His
370 375 380
Leu Thr Glu Val Asp Asp Ala Gly Pro Ala Asp Pro Lys Asp His Ser
385 390 395 400
Lys Pro Ser Phe Tyr Arg Phe Phe Leu Val Pro Gly Thr His Val Ala
405 410 415
Ala Asn Pro Gln Val Asp Arg Glu Gly His Val Val Pro Gly Phe Glu
420 425 430
Gly Arg Pro Thr Ala Pro Leu Val Gly Gly Thr Gln Glu Phe Ala Gly
435 440 445
Glu His Leu Ala Met Leu Cys Gly Phe Ser Pro Ala Leu Leu Ala Lys
450 455 460
Met Leu Phe Tyr Leu Glu Arg Cys Asp Gly Ala Val Ile Val Gly Arg
465 470 475 480
Gln Glu Met Asp Val Phe Arg Tyr Val Ala Asp Ser Asn Gln Thr Asp
485 490 495
Val Pro Cys Asn Leu Cys Thr Phe Asp Thr Arg His Ala Cys Val His
500 505 510
Thr Thr Leu Met Arg Leu Arg Ala Arg His Pro Lys Phe Ala Ser Ala
515 520 525
Ala Arg Gly Ala Ile Gly Val Phe Gly Thr Met Asn Ser Met Tyr Ser
530 535 540
Asp Cys Asp Val Leu Gly Asn Tyr Ala Ala Phe Ser Ala Leu Lys Arg
545 550 555 560
Ala Asp Gly Ser Glu Thr Ala Arg Thr Ile Met Gln Glu Thr Tyr Arg
565 570 575
Ala Ala Thr Glu Arg Val Met Ala Glu Leu Glu Thr Leu Gln Tyr Val
580 585 590
Asp Gln Ala Val Pro Thr Ala Met Gly Arg Leu Glu Thr Ile Ile Thr
595 600 605
Asn Arg Glu Ala Leu His Thr Val Val Asn Asn Val Arg Gln Val Val
610 615 620
Asp Arg Glu Val Glu Gln Leu Met Arg Asn Leu Val Glu Gly Arg Asn
625 630 635 640
Phe Lys Phe Arg Asp Gly Leu Gly Glu Ala Asn His Ala Met Ser Leu
645 650 655
Thr Leu Asp Pro Tyr Ala Cys Gly Pro Cys Pro Leu Leu Gln Leu Leu
660 665 670
Gly Arg Arg Ser Asn Leu Ala Val Tyr Gln Asp Leu Ala Leu Ser Gln
675 680 685
Cys His Gly Val Phe Ala Gly Gln Ser Val Glu Gly Arg Asn Phe Arg
690 695 700
Asn Gln Phe Gln Pro Val Leu Arg Arg Arg Val Met Asp Met Phe Asn
705 710 715 720
Asn Gly Phe Leu Ser Ala Lys Thr Leu Thr Val Ala Leu Ser Glu Gly
725 730 735
Ala Ala Ile Cys Ala Pro Ser Leu Thr Ala Gly Gln Thr Ala Pro Ala
740 745 750
Glu Ser Ser Phe Glu Gly Asp Val Ala Arg Val Thr Leu Gly Phe Pro
755 760 765
Lys Glu Leu Arg Val Lys Ser Arg Val Leu Phe Ala Gly Ala Ser Ala
770 775 780
Asn Ala Ser Glu Ala Ala Lys Ala Arg Val Ala Ser Leu Gln Ser Ala
785 790 795 800
Tyr Gln Lys Pro Asp Lys Arg Val Asp Ile Leu Leu Gly Pro Leu Gly
805 810 815
Phe Leu Leu Lys Gln Phe His Ala Ala Ile Phe Pro Asn Gly Lys Pro
820 825 830
Pro Gly Ser Asn Gln Pro Asn Pro Gln Trp Phe Trp Thr Ala Leu Gln
835 840 845
Arg Asn Gln Leu Pro Ala Arg Leu Leu Ser Arg Glu Asp Ile Glu Thr
850 855 860
Ile Ala Phe Ile Lys Lys Phe Ser Leu Asp Tyr Gly Ala Ile Asn Phe
865 870 875 880
Ile Asn Leu Ala Pro Asn Asn Val Ser Glu Leu Ala Met Tyr Tyr Met
885 890 895
Ala Asn Gln Ile Leu Arg Tyr Cys Asp His Ser Thr Tyr Phe Ile Asn
900 905 910
Thr Leu Thr Ala Ile Ile Ala Gly Ser Arg Arg Pro Pro Ser Val Gln
915 920 925
Ala Ala Ala Ala Trp Ser Ala Gln Gly Gly Ala Gly Leu Glu Ala Gly
930 935 940
Ala Arg Ala Leu Met Asp Ala Val Asp Ala His Pro Gly Ala Trp Thr
945 950 955 960
Ser Met Phe Ala Ser Cys Asn Leu Leu Arg Pro Val Met Ala Ala Arg
965 970 975
Pro Met Val Val Leu Gly Leu Ser Ile Ser Lys Tyr Tyr Gly Met Ala
980 985 990
Gly Asn Asp Arg Val Phe Gln Ala Gly Asn Trp Ala Ser Leu Met Gly
995 1000 1005
Gly Lys Asn Ala Cys Pro Leu Leu Ile Phe Asp Arg Thr Arg Lys
1010 1015 1020
Phe Val Leu Ala Cys Pro Arg Ala Gly Phe Val Cys Ala Ala Ser
1025 1030 1035
Ser Leu Gly Gly Gly Ala His Glu Ser Ser Leu Cys Glu Gln Leu
1040 1045 1050
Arg Gly Ile Ile Ser Glu Gly Gly Ala Ala Val Ala Ser Ser Val
1055 1060 1065
Phe Val Ala Thr Val Lys Ser Leu Gly Pro Arg Thr Gln Gln Leu
1070 1075 1080
Gln Ile Glu Asp Trp Leu Ala Leu Leu Glu Asp Glu Tyr Leu Ser
1085 1090 1095
Glu Glu Met Met Glu Leu Thr Ala Arg Ala Leu Glu Arg Gly Asn
1100 1105 1110
Gly Glu Trp Ser Thr Asp Ala Ala Leu Glu Val Ala His Glu Ala
1115 1120 1125
Glu Ala Leu Val Ser Gln Leu Gly Asn Ala Gly Glu Val Phe Asn
1130 1135 1140
Phe Gly Asp Phe Gly Cys Glu Asp Asp Asn Ala Thr Pro Phe Gly
1145 1150 1155
Gly Pro Gly Ala Pro Gly Pro Ala Phe Ala Gly Arg Lys Arg Ala
1160 1165 1170
Phe His Gly Asp Asp Pro Phe Gly Glu Gly Pro Pro Asp Lys Lys
1175 1180 1185
Gly Asp Leu Thr Leu Asp Met Leu
1190 1195
<210> 65
<211> 843
<212> PRT
<213> Saccharomyces cerevisiae
<400> 65
Met Thr Asp Val Glu Gly Tyr Gln Pro Lys Ser Lys Gly Lys Ile Phe
1 5 10 15
Pro Asp Met Gly Glu Ser Phe Phe Ser Ser Asp Glu Asp Ser Pro Ala
20 25 30
Thr Asp Ala Glu Ile Asp Glu Asn Tyr Asp Asp Asn Arg Glu Thr Ser
35 40 45
Glu Gly Arg Gly Glu Arg Asp Thr Gly Ala Met Val Thr Gly Leu Lys
50 55 60
Lys Pro Arg Lys Lys Thr Lys Ser Ser Arg His Thr Ala Ala Asp Ser
65 70 75 80
Ser Met Asn Gln Met Asp Ala Lys Asp Lys Ala Leu Leu Gln Asp Thr
85 90 95
Asn Ser Asp Ile Pro Ala Asp Phe Val Pro Asp Ser Val Ser Gly Met
100 105 110
Phe Arg Ser His Asp Phe Ser Tyr Leu Arg Leu Arg Pro Asp His Ala
115 120 125
Ser Arg Pro Leu Trp Ile Ser Pro Ser Asp Gly Arg Ile Ile Leu Glu
130 135 140
Ser Phe Ser Pro Leu Ala Glu Gln Ala Gln Asp Phe Leu Val Thr Ile
145 150 155 160
Ala Glu Pro Ile Ser Arg Pro Ser His Ile His Glu Tyr Lys Ile Thr
165 170 175
Ala Tyr Ser Leu Tyr Ala Ala Val Ser Val Gly Leu Glu Thr Asp Asp
180 185 190
Ile Ile Ser Val Leu Asp Arg Leu Ser Lys Val Pro Val Ala Glu Ser
195 200 205
Ile Ile Asn Phe Ile Lys Gly Ala Thr Ile Ser Tyr Gly Lys Val Lys
210 215 220
Leu Val Ile Lys His Asn Arg Tyr Phe Val Glu Thr Thr Gln Ala Asp
225 230 235 240
Ile Leu Gln Met Leu Leu Asn Asp Ser Val Ile Gly Pro Leu Arg Ile
245 250 255
Asp Ser Asp His Gln Val Gln Pro Pro Glu Asp Val Leu Gln Gln Gln
260 265 270
Leu Gln Gln Thr Ala Gly Lys Pro Ala Thr Asn Val Asn Pro Asn Asp
275 280 285
Val Glu Ala Val Phe Ser Ala Val Ile Gly Gly Asp Asn Glu Arg Glu
290 295 300
Glu Glu Asp Asp Asp Ile Asp Ala Val His Ser Phe Glu Ile Ala Asn
305 310 315 320
Glu Ser Val Glu Val Val Lys Lys Arg Cys Gln Glu Ile Asp Tyr Pro
325 330 335
Val Leu Glu Glu Tyr Asp Phe Arg Asn Asp His Arg Asn Pro Asp Leu
340 345 350
Asp Ile Asp Leu Lys Pro Ser Thr Gln Ile Arg Pro Tyr Gln Glu Lys
355 360 365
Ser Leu Ser Lys Met Phe Gly Asn Gly Arg Ala Arg Ser Gly Ile Ile
370 375 380
Val Leu Pro Cys Gly Ala Gly Lys Thr Leu Val Gly Ile Thr Ala Ala
385 390 395 400
Cys Thr Ile Lys Lys Ser Val Ile Val Leu Cys Thr Ser Ser Val Ser
405 410 415
Val Met Gln Trp Arg Gln Gln Phe Leu Gln Trp Cys Thr Leu Gln Pro
420 425 430
Glu Asn Cys Ala Val Phe Thr Ser Asp Asn Lys Glu Met Phe Gln Thr
435 440 445
Glu Ser Gly Leu Val Val Ser Thr Tyr Ser Met Val Ala Asn Thr Arg
450 455 460
Asn Arg Ser His Asp Ser Gln Lys Val Met Asp Phe Leu Thr Gly Arg
465 470 475 480
Glu Trp Gly Phe Ile Ile Leu Asp Glu Val His Val Val Pro Ala Ala
485 490 495
Met Phe Arg Arg Val Val Ser Thr Ile Ala Ala His Ala Lys Leu Gly
500 505 510
Leu Thr Ala Thr Leu Val Arg Glu Asp Asp Lys Ile Gly Asp Leu Asn
515 520 525
Phe Leu Ile Gly Pro Lys Leu Tyr Glu Ala Asn Trp Met Glu Leu Ser
530 535 540
Gln Lys Gly His Ile Ala Asn Val Gln Cys Ala Glu Val Trp Cys Pro
545 550 555 560
Met Thr Ala Glu Phe Tyr Gln Glu Tyr Leu Arg Glu Thr Ala Arg Lys
565 570 575
Arg Met Leu Leu Tyr Ile Met Asn Pro Thr Lys Phe Gln Ala Cys Gln
580 585 590
Phe Leu Ile Gln Tyr His Glu Arg Arg Gly Asp Lys Ile Ile Val Phe
595 600 605
Ser Asp Asn Val Tyr Ala Leu Gln Glu Tyr Ala Leu Lys Met Gly Lys
610 615 620
Pro Phe Ile Tyr Gly Ser Thr Pro Gln Gln Glu Arg Met Asn Ile Leu
625 630 635 640
Gln Asn Phe Gln Tyr Asn Asp Gln Ile Asn Thr Ile Phe Leu Ser Lys
645 650 655
Val Gly Asp Thr Ser Ile Asp Leu Pro Glu Ala Thr Cys Leu Ile Gln
660 665 670
Ile Ser Ser His Tyr Gly Ser Arg Arg Gln Glu Ala Gln Arg Leu Gly
675 680 685
Arg Ile Leu Arg Ala Lys Arg Arg Asn Asp Glu Gly Phe Asn Ala Phe
690 695 700
Phe Tyr Ser Leu Val Ser Lys Asp Thr Gln Glu Met Tyr Tyr Ser Thr
705 710 715 720
Lys Arg Gln Ala Phe Leu Val Asp Gln Gly Tyr Ala Phe Lys Val Ile
725 730 735
Thr His Leu His Gly Met Glu Asn Ile Pro Asn Leu Ala Tyr Ala Ser
740 745 750
Pro Arg Glu Arg Arg Glu Leu Leu Gln Glu Val Leu Leu Lys Asn Glu
755 760 765
Glu Ala Ala Gly Ile Glu Val Gly Asp Asp Ala Asp Asn Ser Val Gly
770 775 780
Arg Gly Ser Asn Gly His Lys Arg Phe Lys Ser Lys Ala Val Arg Gly
785 790 795 800
Glu Gly Ser Leu Ser Gly Leu Ala Gly Gly Glu Asp Met Ala Tyr Met
805 810 815
Glu Tyr Ser Thr Asn Lys Asn Lys Glu Leu Lys Glu His His Pro Leu
820 825 830
Ile Arg Lys Met Tyr Tyr Lys Asn Leu Lys Lys
835 840
<210> 66
<211> 778
<212> PRT
<213> Saccharomyces cerevisiae
<400> 66
Met Lys Phe Tyr Ile Asp Asp Leu Pro Val Leu Phe Pro Tyr Pro Lys
1 5 10 15
Ile Tyr Pro Glu Gln Tyr Asn Tyr Met Cys Asp Ile Lys Lys Thr Leu
20 25 30
Asp Val Gly Gly Asn Ser Ile Leu Glu Met Pro Ser Gly Thr Gly Lys
35 40 45
Thr Val Ser Leu Leu Ser Leu Thr Ile Ala Tyr Gln Met His Tyr Pro
50 55 60
Glu His Arg Lys Ile Ile Tyr Cys Ser Arg Thr Met Ser Glu Ile Glu
65 70 75 80
Lys Ala Leu Val Glu Leu Glu Asn Leu Met Asp Tyr Arg Thr Lys Glu
85 90 95
Leu Gly Tyr Gln Glu Asp Phe Arg Gly Leu Gly Leu Thr Ser Arg Lys
100 105 110
Asn Leu Cys Leu His Pro Glu Val Ser Lys Glu Arg Lys Gly Thr Val
115 120 125
Val Asp Glu Lys Cys Arg Arg Met Thr Asn Gly Gln Ala Lys Arg Lys
130 135 140
Leu Glu Glu Asp Pro Glu Ala Asn Val Glu Leu Cys Glu Tyr His Glu
145 150 155 160
Asn Leu Tyr Asn Ile Glu Val Glu Asp Tyr Leu Pro Lys Gly Val Phe
165 170 175
Ser Phe Glu Lys Leu Leu Lys Tyr Cys Glu Glu Lys Thr Leu Cys Pro
180 185 190
Tyr Phe Ile Val Arg Arg Met Ile Ser Leu Cys Asn Ile Ile Ile Tyr
195 200 205
Ser Tyr His Tyr Leu Leu Asp Pro Lys Ile Ala Glu Arg Val Ser Asn
210 215 220
Glu Val Ser Lys Asp Ser Ile Val Ile Phe Asp Glu Ala His Asn Ile
225 230 235 240
Asp Asn Val Cys Ile Glu Ser Leu Ser Leu Asp Leu Thr Thr Asp Ala
245 250 255
Leu Arg Arg Ala Thr Arg Gly Ala Asn Ala Leu Asp Glu Arg Ile Ser
260 265 270
Glu Val Arg Lys Val Asp Ser Gln Lys Leu Gln Asp Glu Tyr Glu Lys
275 280 285
Leu Val Gln Gly Leu His Ser Ala Asp Ile Leu Thr Asp Gln Glu Glu
290 295 300
Pro Phe Val Glu Thr Pro Val Leu Pro Gln Asp Leu Leu Thr Glu Ala
305 310 315 320
Ile Pro Gly Asn Ile Arg Arg Ala Glu His Phe Val Ser Phe Leu Lys
325 330 335
Arg Leu Ile Glu Tyr Leu Lys Thr Arg Met Lys Val Leu His Val Ile
340 345 350
Ser Glu Thr Pro Lys Ser Phe Leu Gln His Leu Lys Gln Leu Thr Phe
355 360 365
Ile Glu Arg Lys Pro Leu Arg Phe Cys Ser Glu Arg Leu Ser Leu Leu
370 375 380
Val Arg Thr Leu Glu Val Thr Glu Val Glu Asp Phe Thr Ala Leu Lys
385 390 395 400
Asp Ile Ala Thr Phe Ala Thr Leu Ile Ser Thr Tyr Glu Glu Gly Phe
405 410 415
Leu Leu Ile Ile Glu Pro Tyr Glu Ile Glu Asn Ala Ala Val Pro Asn
420 425 430
Pro Ile Met Arg Phe Thr Cys Leu Asp Ala Ser Ile Ala Ile Lys Pro
435 440 445
Val Phe Glu Arg Phe Ser Ser Val Ile Ile Thr Ser Gly Thr Ile Ser
450 455 460
Pro Leu Asp Met Tyr Pro Arg Met Leu Asn Phe Lys Thr Val Leu Gln
465 470 475 480
Lys Ser Tyr Ala Met Thr Leu Ala Lys Lys Ser Phe Leu Pro Met Ile
485 490 495
Ile Thr Lys Gly Ser Asp Gln Val Ala Ile Ser Ser Arg Phe Glu Ile
500 505 510
Arg Asn Asp Pro Ser Ile Val Arg Asn Tyr Gly Ser Met Leu Val Glu
515 520 525
Phe Ala Lys Ile Thr Pro Asp Gly Met Val Val Phe Phe Pro Ser Tyr
530 535 540
Leu Tyr Met Glu Ser Ile Val Ser Met Trp Gln Thr Met Gly Ile Leu
545 550 555 560
Asp Glu Val Trp Lys His Lys Leu Ile Leu Val Glu Thr Pro Asp Ala
565 570 575
Gln Glu Thr Ser Leu Ala Leu Glu Thr Tyr Arg Lys Ala Cys Ser Asn
580 585 590
Gly Arg Gly Ala Ile Leu Leu Ser Val Ala Arg Gly Lys Val Ser Glu
595 600 605
Gly Ile Asp Phe Asp His Gln Tyr Gly Arg Thr Val Leu Met Ile Gly
610 615 620
Ile Pro Phe Gln Tyr Thr Glu Ser Arg Ile Leu Lys Ala Arg Leu Glu
625 630 635 640
Phe Met Arg Glu Asn Tyr Arg Ile Arg Glu Asn Asp Phe Leu Ser Phe
645 650 655
Asp Ala Met Arg His Ala Ala Gln Cys Leu Gly Arg Val Leu Arg Gly
660 665 670
Lys Asp Asp Tyr Gly Val Met Val Leu Ala Asp Arg Arg Phe Ser Arg
675 680 685
Lys Arg Ser Gln Leu Pro Lys Trp Ile Ala Gln Gly Leu Ser Asp Ala
690 695 700
Asp Leu Asn Leu Ser Thr Asp Met Ala Ile Ser Asn Thr Lys Gln Phe
705 710 715 720
Leu Arg Thr Met Ala Gln Pro Thr Asp Pro Lys Asp Gln Glu Gly Val
725 730 735
Ser Val Trp Ser Tyr Glu Asp Leu Ile Lys His Gln Asn Ser Arg Lys
740 745 750
Asp Gln Gly Gly Phe Ile Glu Asn Glu Asn Lys Glu Gly Glu Gln Asp
755 760 765
Glu Asp Glu Asp Glu Asp Ile Glu Met Gln
770 775
<210> 67
<211> 129
<212> PRT
<213> Streptococcus pyogenes
<400> 67
Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu
1 5 10 15
Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile
20 25 30
Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala
35 40 45
Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala
50 55 60
Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
65 70 75 80
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu
85 90 95
Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu
100 105 110
Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg
115 120 125
Val
<210> 68
<211> 625
<212> PRT
<213> Streptococcus pyogenes
<400> 68
Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu
1 5 10 15
Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu
20 25 30
Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys
35 40 45
Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala
50 55 60
Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp
65 70 75 80
Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val
85 90 95
Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly
100 105 110
Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg
115 120 125
Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu
130 135 140
Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
145 150 155 160
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp
165 170 175
Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
180 185 190
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu
195 200 205
Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
210 215 220
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr
225 230 235 240
Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
245 250 255
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly
260 265 270
Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu
275 280 285
Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp
290 295 300
Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
305 310 315 320
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe
325 330 335
Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
340 345 350
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
355 360 365
Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn
370 375 380
Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
385 390 395 400
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro
405 410 415
Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr
420 425 430
Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser
435 440 445
Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
450 455 460
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu
465 470 475 480
Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
485 490 495
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp
500 505 510
Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu
515 520 525
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys
530 535 540
Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
545 550 555 560
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
565 570 575
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
580 585 590
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
595 600 605
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
610 615 620
Asp
625
<210> 69
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(15)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (21)..(49)
<223> a, c, t, g, unknown or other
<400> 69
nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49
<210> 70
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(15)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (21)..(49)
<223> a, c, t, g, unknown or other
<400> 70
nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49
<210> 71
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(10)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (16)..(25)
<223> a, c, t, g, unknown or other
<400> 71
nnnnnnnnnn tctctnnnnn nnnnn 25
<210> 72
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(10)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (16)..(25)
<223> a, c, t, g, unknown or other
<400> 72
nnnnnnnnnn tctctnnnnn nnnnn 25
<210> 73
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (6)..(10)
<223> a, c, t, g, unknown or other
<400> 73
gtrhgnnnnn 10
<210> 74
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (11)..(11)
<223> a, c, t, g, unknown or other
<400> 74
yyyyyyyyyy nyag 14
<210> 75
<211> 9
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
'LAGLIDADG' family motif peptide
<400> 75
Leu Ala Gly Leu Ile Asp Ala Asp Gly
1 5
<210> 76
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 76
Leu Arg Gly Ser
1
<210> 77
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(3)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (8)..(21)
<223> a, c, t, g, unknown or other
<400> 77
nnnaaaannn nnnnnnnnnn ngg 23
<210> 78
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 78
gtgctgacca tcgacgagaa agggactgaa gctgctgggg ccatgttttt agaggccat 59
<210> 79
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 79
Leu Asn Tyr Gly Val Cys Phe Cys Gly
1 5
<210> 80
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(15)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (21)..(49)
<223> a, c, t, g, unknown or other
<400> 80
nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49
<210> 81
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 81
caaatgcttg tgagaaagct tgctca 26
<210> 82
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 82
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 83
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 83
Leu Lys Trp Asn Leu Arg Thr
1 5
<210> 84
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 84
Arg Ser Asp Asn Leu Ala Arg
1 5
<210> 85
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 85
Trp Gln Ser Ser Leu Ile Val
1 5
<210> 86
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 86
Gln Ser Gly Asn Arg Thr Thr
1 5
<210> 87
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 87
atgcttgtga gaaagcttgc tcatca 26
<210> 88
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 88
cttgtgagaa agcttgctca tcatac 26
<210> 89
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 89
Thr Asn Gln Asn Arg Ile Thr
1 5
<210> 90
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 90
Arg Ser Ala Asn Leu Thr Arg
1 5
<210> 91
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 91
gtgagaaagc ttgctcatca tacttg 26
<210> 92
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 92
Ala His Gly Ala Arg Trp Asn
1 5
Claims (31)
- 적어도 하나의 징크 핑거 단백질 (ZFP) DNA 결합 도메인;
적어도 하나의 DNA 탈안정화 분자; 및
적어도 하나의 아데닌 또는 시토신 데아미나제
를 포함하는, DNA 내의 아데닌 (A) 또는 시티딘 (C) 염기를 편집하기 위한 조성물이며, 여기서 조성물은 DNA 내에 이중 가닥 절단을 만들지 않는 것인 조성물. - 제1항에 있어서, DNA 탈안정화 분자가 Cas9 닉카제, 또는 단일 가이드 RNA (sgRNA)에 작동가능하게 연결된 Cas9 단백질인 조성물.
- 제1항에 있어서, Cas9 단백질을 포함하지 않는 조성물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, DNA 탈안정화 분자가 징크 핑거 뉴클레아제 (ZFN) 닉카제인 조성물.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 적어도 하나의 ZFP DNA 결합 도메인이 Cas9 닉카제 또는 불활성화된 Cas9 단백질 (dCas9)에 작동가능하게 연결되는 것인 조성물.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 및 제2 ZFP DNA 결합 도메인을 포함하며, 여기서 제1 ZFP DNA 결합 도메인이 Cas9 닉카제에 작동가능하게 연결되는 것인 조성물.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 아데닌 또는 시토신 데아미나제가, 이량체화되어 활성 아데닌 또는 시토신 데아미나제를 형성하는 제1 및 제2 불활성 도메인으로 구성되는 것인 조성물.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 아데닌 또는 시토신 데아미나제의 제1 불활성 도메인이 Cas9 닉카제에 작동가능하게 연결되고 아데닌 또는 시토신 데아미나제의 제2 불활성 도메인이 제2 ZFP DNA 결합 도메인에 작동가능하게 연결되는 것인 조성물.
- 제2항에 있어서, 아데닌 또는 시토신 데아미나제 및 ZFP DNA 결합 도메인이 Cas9 닉카제에 작동가능하게 연결되는 것인 조성물.
- 제2항에 있어서, 제1 및 제2 ZFP DNA 도메인, Cas9 닉카제에 작동가능하게 연결된 제1 ZFP 및 아데닌 또는 시토신 데아미나제에 작동가능하게 연결된 제2 ZFP DNA 결합 도메인을 포함하는 조성물.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 적어도 하나의 ZFP DNA 결합 도메인이 아데닌 또는 시토신 데아미나제에 작동가능하게 연결되는 것인 조성물.
- 제1항 내지 제11항 중 어느 한 항에 있어서, ZFN 닉카제를 추가로 포함하는 조성물.
- 제1항 내지 제12항 중 어느 한 항에 있어서, DNA 탈안정화 인자가 적어도 하나의 단백질 및/또는 적어도 하나의 뉴클레오티드를 포함하는 것인 조성물.
- 제13항에 있어서, DNA 탈안정화 인자가 단백질을 포함하는 것인 조성물.
- 제14항에 있어서, DNA 탈안정화 인자가 Cas 단백질 및/또는 표 A에 제시된 바와 같은 단백질을 포함하는 것인 조성물.
- 제13항에 있어서, DNA 탈안정화 뉴클레오티드가 올리고뉴클레오티드를 포함하는 것인 조성물.
- 제16항에 있어서, 올리고뉴클레오티드가 펩티드 핵산 (PNA); 잠금 핵산 (LNA) 및/또는 가교 핵산 (BNA)을 포함하는 것인 조성물.
- 제1항 내지 제19항 중 어느 한 항에 따른 하나 이상의 조성물을 코딩하는 하나 이상의 폴리뉴클레오티드.
- 제1항 내지 제19항 중 어느 한 항에 따른 하나 이상의 조성물 또는 제20항에 따른 하나 이상의 폴리뉴클레오티드를 포함하는 세포, 또는 편집된 염기를 포함하는 세포의 자손.
- 제1항 내지 제19항 중 어느 한 항에 따른 조성물 또는 제20항의 하나 이상의 폴리뉴클레오티드를 세포에 제공하는 것을 포함하는, 세포 내의 표적 DNA에서의 염기를 편집하는 방법.
- 제22항에 있어서, 편집이
(i) 시티딘 염기 ("C")를 우라실 염기 ("U")로 편집하는 것이며, 임의로 여기서 U는 DNA 복제 동안 티미딘 염기 ("T")로 대체되는 것;
(ii) 아데닌 염기 ("A")를 이노신 ("I")으로 편집하는 것이며, 임의로 여기서 I는 복제 동안 구아닌 염기 ("G")로 대체되는 것; 및/또는
(iii) CA 또는 AC 디뉴클레오티드를 UI 또는 IU로 편집하는 것
을 포함하는 것인 방법. - 제22항에 있어서, 세포에서의 편집이
(i) C:G 염기쌍의 T:A 염기쌍으로의 변화;
(ii) C:G 염기쌍의 G:C 염기쌍으로의 변화;
(iii) A:T 염기쌍의 G:C 염기쌍으로의 변화;
(iv) 정지 코돈의 도입; 및/또는
(v) 스플라이싱 서열의 편집 또는 생성
을 발생시키는 것인 방법. - 제24항에 있어서, 편집이 질환 돌연변이를 교정하는 것인 방법.
- 제22항에 있어서, 엑손이 편집되는 것인 방법.
- 제20항의 하나 이상의 폴리뉴클레오티드를 포함하는, 표적 DNA에서의 염기를 편집하는 데 사용하기 위한 키트.
- 단리된 세포 또는 대상체에서 표적 DNA 분자를 편집하기 위한, 제1항 내지 제19항 중 어느 한 항에 따른 하나 이상의 조성물 또는 제20항의 하나 이상의 폴리뉴클레오티드의 용도이며, 임의로 여기서 세포 또는 대상체 내의 염색체 또는 염색체 외 에피솜에서의 DNA가 편집되는 것인 용도.
- 제28항에 있어서, 편집이
(iv) 시티딘 염기 ("C")를 우라실 염기 ("U")로 편집하는 것이며, 임의로 여기서 U는 DNA 복제 동안 티미딘 염기 ("T")로 대체되는 것;
(v) 아데닌 염기 ("A")를 이노신 ("I")으로 편집하는 것이며, 임의로 여기서 I는 복제 동안 구아닌 염기 ("G")로 대체되는 것; 및/또는
(vi) CA 또는 AC 디뉴클레오티드를 UI 또는 IU로 편집하는 것
을 포함하는 것인 용도. - 제28항 또는 제29항에 있어서, 세포 또는 대상체에서의 편집이
(vi) C:G 염기쌍의 T:A 염기쌍으로의 변화;
(vii) C:G 염기쌍의 G:C 염기쌍으로의 변화;
(viii) A:T 염기쌍의 G:C 염기쌍으로의 변화;
(ix) 정지 코돈의 도입; 및/또는
(x) 스플라이싱 서열의 편집 또는 생성
을 발생시키는 것인 용도. - 제28항 내지 제30항 중 어느 한 항에 있어서, 엑손이 편집되는 것인 용도.
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862721903P | 2018-08-23 | 2018-08-23 | |
US62/721,903 | 2018-08-23 | ||
US201862753696P | 2018-10-31 | 2018-10-31 | |
US62/753,696 | 2018-10-31 | ||
US201962817153P | 2019-03-12 | 2019-03-12 | |
US62/817,153 | 2019-03-12 | ||
US201962867565P | 2019-06-27 | 2019-06-27 | |
US62/867,565 | 2019-06-27 | ||
PCT/US2019/047172 WO2020041249A1 (en) | 2018-08-23 | 2019-08-20 | Engineered target specific base editors |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210049124A true KR20210049124A (ko) | 2021-05-04 |
Family
ID=69583877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217008090A KR20210049124A (ko) | 2018-08-23 | 2019-08-20 | 조작된 표적 특이적 염기 편집기 |
Country Status (10)
Country | Link |
---|---|
US (1) | US11834686B2 (ko) |
EP (1) | EP3841204A4 (ko) |
JP (1) | JP2021536229A (ko) |
KR (1) | KR20210049124A (ko) |
CN (1) | CN112867792A (ko) |
AU (1) | AU2019326408A1 (ko) |
CA (1) | CA3109592A1 (ko) |
IL (1) | IL280951B1 (ko) |
SG (1) | SG11202101801RA (ko) |
WO (1) | WO2020041249A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024063538A1 (ko) * | 2022-09-21 | 2024-03-28 | 기초과학연구원 | 식물세포 소기관 dna의 염기 교정 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210049124A (ko) | 2018-08-23 | 2021-05-04 | 상가모 테라퓨틱스, 인코포레이티드 | 조작된 표적 특이적 염기 편집기 |
JP7059965B2 (ja) * | 2019-02-21 | 2022-04-26 | 株式会社豊田中央研究所 | エピゲノム状態を制御する融合タンパク質及びその利用 |
WO2021155166A1 (en) * | 2020-01-31 | 2021-08-05 | University Of Massachusetts | A cas9-pdbd base editor platform with improved targeting range and specificity |
CN111518794B (zh) * | 2020-04-13 | 2023-05-16 | 中山大学 | 基于激活诱导性胞苷脱氨酶的诱导突变蛋白的制备和用途 |
CN111690720B (zh) * | 2020-06-16 | 2021-06-15 | 山东舜丰生物科技有限公司 | 利用修饰的单链核酸进行靶核酸检测的方法 |
CA3187135A1 (en) * | 2020-06-30 | 2022-01-06 | Pairwise Plants Services, Inc. | Compositions, systems, and methods for base diversification |
US20230340486A1 (en) * | 2020-07-27 | 2023-10-26 | The Children’S Hospital Of Philadelphia | In utero and postnatal gene editing and therapy for treatment of monogenic diseases, including mucopolysaccharidosis type 1h and other disorders |
JP2023542705A (ja) * | 2020-09-25 | 2023-10-11 | サンガモ セラピューティクス, インコーポレイテッド | 核酸塩基編集のためのジンクフィンガー融合タンパク質 |
EP4232005A1 (en) * | 2020-10-23 | 2023-08-30 | STRM.Bio Incorporated | Compositions and methods related to megakaryocyte-derived extracellular vesicles for treating myeloproliferative neoplasms |
AU2021394998A1 (en) * | 2020-12-11 | 2023-06-29 | Intellia Therapeutics, Inc. | Polynucleotides, compositions, and methods for genome editing involving deamination |
WO2022240846A1 (en) | 2021-05-10 | 2022-11-17 | Sqz Biotechnologies Company | Methods for delivering genome editing molecules to the nucleus or cytosol of a cell and uses thereof |
WO2023049926A2 (en) * | 2021-09-27 | 2023-03-30 | Vor Biopharma Inc. | Fusion polypeptides for genetic editing and methods of use thereof |
WO2023070122A1 (en) * | 2021-10-23 | 2023-04-27 | Strm.Bio Incorporated | Gene editing to treat myeloproliferative neoplasms |
WO2023122722A1 (en) * | 2021-12-22 | 2023-06-29 | Sangamo Therapeutics, Inc. | Novel zinc finger fusion proteins for nucleobase editing |
CN116497002A (zh) * | 2022-01-19 | 2023-07-28 | 中国科学院动物研究所 | 工程化的CasX核酸酶、效应蛋白及其用途 |
KR20230139064A (ko) * | 2022-03-25 | 2023-10-05 | 기초과학연구원 | 식물세포 소기관 dna의 아데닌을 구아닌으로 염기 교정 |
WO2024065721A1 (en) * | 2022-09-30 | 2024-04-04 | Peking University | Methods of determining genome-wide dna binding protein binding sites by footprinting with double stranded dna deaminase |
Family Cites Families (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5436150A (en) | 1992-04-03 | 1995-07-25 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease |
WO1995019431A1 (en) | 1994-01-18 | 1995-07-20 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US6242568B1 (en) | 1994-01-18 | 2001-06-05 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US6140466A (en) | 1994-01-18 | 2000-10-31 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
GB9824544D0 (en) | 1998-11-09 | 1999-01-06 | Medical Res Council | Screening system |
JP4118327B2 (ja) | 1994-08-20 | 2008-07-16 | ゲンダック・リミテッド | Dna認識のための結合タンパク質におけるまたはそれに関連する改良 |
US5789538A (en) | 1995-02-03 | 1998-08-04 | Massachusetts Institute Of Technology | Zinc finger proteins with high affinity new DNA binding specificities |
US5928638A (en) | 1996-06-17 | 1999-07-27 | Systemix, Inc. | Methods for gene transfer |
US5925523A (en) | 1996-08-23 | 1999-07-20 | President & Fellows Of Harvard College | Intraction trap assay, reagents and uses thereof |
GB2338237B (en) | 1997-02-18 | 2001-02-28 | Actinova Ltd | In vitro peptide or protein expression library |
GB9703369D0 (en) | 1997-02-18 | 1997-04-09 | Lindqvist Bjorn H | Process |
GB9710809D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
GB9710807D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
US6410248B1 (en) | 1998-01-30 | 2002-06-25 | Massachusetts Institute Of Technology | General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites |
DE69942334D1 (de) | 1998-03-02 | 2010-06-17 | Massachusetts Inst Technology | Poly-zinkfinger-proteine mit verbesserten linkern |
US6140081A (en) | 1998-10-16 | 2000-10-31 | The Scripps Research Institute | Zinc finger binding domains for GNN |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
US6599692B1 (en) | 1999-09-14 | 2003-07-29 | Sangamo Bioscience, Inc. | Functional genomics using zinc finger proteins |
US7070934B2 (en) | 1999-01-12 | 2006-07-04 | Sangamo Biosciences, Inc. | Ligand-controlled regulation of endogenous gene expression |
US7013219B2 (en) | 1999-01-12 | 2006-03-14 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US6794136B1 (en) | 2000-11-20 | 2004-09-21 | Sangamo Biosciences, Inc. | Iterative optimization in the design of binding proteins |
US7030215B2 (en) | 1999-03-24 | 2006-04-18 | Sangamo Biosciences, Inc. | Position dependent recognition of GNN nucleotide triplets by zinc fingers |
DE60023936T2 (de) | 1999-12-06 | 2006-05-24 | Sangamo Biosciences Inc., Richmond | Methoden zur verwendung von randomisierten zinkfingerprotein-bibliotheken zur identifizierung von genfunktionen |
AU2001250774B2 (en) | 2000-02-08 | 2005-01-27 | Sangamo Biosciences, Inc. | Cells expressing zinc finger proteins for drug discovery |
US20020061512A1 (en) | 2000-02-18 | 2002-05-23 | Kim Jin-Soo | Zinc finger domains and methods of identifying same |
US7923542B2 (en) | 2000-04-28 | 2011-04-12 | Sangamo Biosciences, Inc. | Libraries of regulatory sequences, methods of making and using same |
US7217509B2 (en) | 2000-04-28 | 2007-05-15 | Sangamo Biosciences, Inc. | Databases of regulatory sequences; methods of making and using same |
DE60126483T2 (de) | 2000-04-28 | 2007-12-06 | Sangamo BioSciences, Inc., Richmond | Gezielte Modifikation der Chromatinstruktur |
US20030044787A1 (en) | 2000-05-16 | 2003-03-06 | Joung J. Keith | Methods and compositions for interaction trap assays |
JP2002060786A (ja) | 2000-08-23 | 2002-02-26 | Kao Corp | 硬質表面用殺菌防汚剤 |
US7067317B2 (en) | 2000-12-07 | 2006-06-27 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
GB0108491D0 (en) | 2001-04-04 | 2001-05-23 | Gendaq Ltd | Engineering zinc fingers |
EP1421177A4 (en) | 2001-08-20 | 2006-06-07 | Scripps Research Inst | ZINC FINGER FASTENING DOMAINS FOR CNN |
US7262054B2 (en) | 2002-01-22 | 2007-08-28 | Sangamo Biosciences, Inc. | Zinc finger proteins for DNA binding and gene regulation in plants |
CA2474486C (en) | 2002-01-23 | 2013-05-14 | The University Of Utah Research Foundation | Targeted chromosomal mutagenesis using zinc finger nucleases |
EP2368982A3 (en) | 2002-03-21 | 2011-10-12 | Sangamo BioSciences, Inc. | Methods and compositions for using zinc finger endonucleases to enhance homologous recombination |
US7361635B2 (en) | 2002-08-29 | 2008-04-22 | Sangamo Biosciences, Inc. | Simultaneous modulation of multiple genes |
EP2806025B1 (en) | 2002-09-05 | 2019-04-03 | California Institute of Technology | Use of zinc finger nucleases to stimulate gene targeting |
US8409861B2 (en) | 2003-08-08 | 2013-04-02 | Sangamo Biosciences, Inc. | Targeted deletion of cellular DNA sequences |
US7888121B2 (en) | 2003-08-08 | 2011-02-15 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US7972854B2 (en) | 2004-02-05 | 2011-07-05 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US7253273B2 (en) | 2004-04-08 | 2007-08-07 | Sangamo Biosciences, Inc. | Treatment of neuropathic pain with zinc finger proteins |
DE602005011943D1 (de) | 2004-04-08 | 2009-02-05 | Sangamo Biosciences Inc | Zusammensetzungen zur behandlung von neuropathischen und neurodegenerativen erkrankungen |
US20080131962A1 (en) | 2006-05-25 | 2008-06-05 | Sangamo Biosciences, Inc. | Engineered cleavage half-domains |
KR20070060115A (ko) | 2004-09-16 | 2007-06-12 | 상가모 바이오사이언스 인코포레이티드 | 단백질 생산을 위한 조성물 및 방법 |
MX2007013757A (es) * | 2005-05-05 | 2008-01-24 | Univ Arizona | Reagrupacion permitida de secuencia (seer)-met odo de novedad para visualizar secuencias de adn especificas. |
GB0607063D0 (en) | 2006-04-07 | 2006-05-17 | Cellcentric Ltd | Compositions and methods for epigenetic modification of nucleic acid sequences in vivo |
JP5551432B2 (ja) | 2006-05-25 | 2014-07-16 | サンガモ バイオサイエンシーズ, インコーポレイテッド | 遺伝子不活性化のための方法と組成物 |
WO2008133938A2 (en) | 2007-04-26 | 2008-11-06 | Sangamo Biosciences, Inc. | Targeted integration into the ppp1r12c locus |
US8563314B2 (en) | 2007-09-27 | 2013-10-22 | Sangamo Biosciences, Inc. | Methods and compositions for modulating PD1 |
EP2281050B1 (en) | 2008-04-14 | 2014-04-02 | Sangamo BioSciences, Inc. | Linear donor constructs for targeted integration |
EP2297318B1 (en) | 2008-05-28 | 2018-05-23 | Sangamo Therapeutics, Inc. | Compositions for linking dna-binding domains and cleavage domains |
EP2294191B1 (en) | 2008-06-10 | 2016-09-28 | Sangamo BioSciences, Inc. | Methods and compositions for generation of bax- and bak-deficient cell lines |
CN102159722B (zh) | 2008-08-22 | 2014-09-03 | 桑格摩生物科学股份有限公司 | 用于靶向单链切割和靶向整合的方法和组合物 |
JP5681114B2 (ja) | 2008-12-04 | 2015-03-04 | サンガモ バイオサイエンシーズ, インコーポレイテッド | 亜鉛フィンガーヌクレアーゼを使用したラットのゲノム編集 |
EP2206723A1 (en) | 2009-01-12 | 2010-07-14 | Bonas, Ulla | Modular DNA-binding domains |
US8956828B2 (en) | 2009-11-10 | 2015-02-17 | Sangamo Biosciences, Inc. | Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases |
PL2510096T5 (pl) | 2009-12-10 | 2018-06-29 | Regents Of The University Of Minnesota | Modyfikacja DNA zależna od efektora TAL |
JP6137596B2 (ja) | 2010-02-08 | 2017-05-31 | サンガモ セラピューティクス, インコーポレイテッド | 遺伝子操作された切断ハーフドメイン |
WO2011100058A1 (en) | 2010-02-09 | 2011-08-18 | Sangamo Biosciences, Inc. | Targeted genomic modification with partially single-stranded donor molecules |
KR101880536B1 (ko) | 2010-04-26 | 2018-07-23 | 상가모 테라퓨틱스, 인코포레이티드 | 아연 핑거 뉴클레아제를 사용하는 로사 좌위의 게놈 편집 |
HUE048072T2 (hu) | 2010-05-03 | 2020-05-28 | Sangamo Therapeutics Inc | Készítmények cinkujj-modulok összekapcsolására |
AU2011256838B2 (en) | 2010-05-17 | 2014-10-09 | Sangamo Therapeutics, Inc. | Novel DNA-binding proteins and uses thereof |
CA2993567C (en) | 2010-07-21 | 2022-06-28 | Sangamo Biosciences, Inc. | Methods and compositions for modification of a t-cell receptor gene |
JP6185916B2 (ja) | 2011-09-21 | 2017-08-23 | サンガモ セラピューティクス, インコーポレイテッド | 導入遺伝子発現を制御するための方法および組成物 |
EP2771457B1 (en) | 2011-10-27 | 2017-11-22 | Sangamo Therapeutics, Inc. | Methods and compositions for modification of the hprt locus |
LT2800811T (lt) | 2012-05-25 | 2017-09-11 | The Regents Of The University Of California | Būdai ir kompozicijos, skirti tikslinės dnr modifikavimui, panaudojant adresuotą rnr, ir transkripcijos moduliavimui, panaudojant adresuotą rnr |
JP2016500254A (ja) | 2012-12-05 | 2016-01-12 | サンガモ バイオサイエンシーズ, インコーポレイテッド | 代謝疾患の調節のための方法および組成物 |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
EP3825401A1 (en) | 2012-12-12 | 2021-05-26 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
KR20150105634A (ko) | 2012-12-12 | 2015-09-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화 |
PT2784162E (pt) | 2012-12-12 | 2015-08-27 | Broad Inst Inc | Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências |
PL2931898T3 (pl) | 2012-12-12 | 2016-09-30 | Le Cong | Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
WO2014144592A2 (en) | 2013-03-15 | 2014-09-18 | The General Hospital Corporation | Using truncated guide rnas (tru-grnas) to increase specificity for rna-guided genome editing |
WO2014186585A2 (en) | 2013-05-15 | 2014-11-20 | Sangamo Biosciences, Inc. | Methods and compositions for treatment of a genetic condition |
US10081661B2 (en) | 2013-12-09 | 2018-09-25 | Sangamo Therapeutics, Inc. | Methods and compositions for genome engineering |
EP3099801B1 (en) | 2014-01-31 | 2020-03-18 | Factor Bioscience Inc. | Synthetic rna for use in the treatment of dystrophic epidermolysis bullosa |
CA2947941C (en) | 2014-03-05 | 2021-02-23 | National University Corporation Kobe University | Genome sequence modification method for specifically converting nucleic acid bases of targeted dna sequence, and molecular complex for use in same |
WO2015164748A1 (en) | 2014-04-24 | 2015-10-29 | Sangamo Biosciences, Inc. | Engineered transcription activator like effector (tale) proteins |
EP3167071B1 (en) | 2014-07-09 | 2020-10-07 | Gen9, Inc. | Compositions and methods for site-directed dna nicking and cleaving |
US10190106B2 (en) | 2014-12-22 | 2019-01-29 | Univesity Of Massachusetts | Cas9-DNA targeting unit chimeras |
JP6873917B2 (ja) | 2015-05-12 | 2021-05-19 | サンガモ セラピューティクス, インコーポレイテッド | ヌクレアーゼ介在性遺伝子発現調節 |
WO2017070633A2 (en) * | 2015-10-23 | 2017-04-27 | President And Fellows Of Harvard College | Evolved cas9 proteins for gene editing |
JP6928604B2 (ja) * | 2015-11-04 | 2021-09-01 | フェイト セラピューティクス,インコーポレイテッド | 万能性細胞のゲノム改変 |
KR102061438B1 (ko) * | 2015-11-27 | 2019-12-31 | 고쿠리츠다이가쿠호진 고베다이가쿠 | 표적화 dna 서열 중의 핵산 염기가 특이적으로 전환되어 있는 단자엽식물 게놈 서열을 전환시키는 방법, 및 그것에 사용되는 분자 복합체 |
CA3008413A1 (en) | 2015-12-18 | 2017-06-22 | Sangamo Therapeutics, Inc. | Targeted disruption of the t cell receptor |
JP7012650B2 (ja) | 2016-02-02 | 2022-01-28 | サンガモ セラピューティクス, インコーポレイテッド | Dna結合ドメインと切断ドメインとを連結するための組成物 |
CN109983124B (zh) * | 2016-06-02 | 2022-09-16 | 西格马-奥尔德里奇有限责任公司 | 使用可编程dna结合蛋白增强靶向基因组修饰 |
WO2018039438A1 (en) * | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
JP7272948B2 (ja) | 2016-08-24 | 2023-05-12 | サンガモ セラピューティクス, インコーポレイテッド | 操作された標的特異的ヌクレアーゼ |
JP2019531763A (ja) | 2016-09-07 | 2019-11-07 | フラッグシップ パイオニアリング, インコーポレイテッド | 遺伝子発現をモジュレートするための方法および組成物 |
CN110337446A (zh) * | 2016-12-21 | 2019-10-15 | 佛罗里达大学研究基金会 | 过继细胞疗法中ccr2+造血干细胞介导的t细胞激活 |
KR20230125856A (ko) * | 2016-12-23 | 2023-08-29 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | Pcsk9의 유전자 편집 |
WO2018119359A1 (en) * | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
US11326157B2 (en) | 2017-05-25 | 2022-05-10 | The General Hospital Corporation | Base editors with improved precision and specificity |
KR20210049124A (ko) | 2018-08-23 | 2021-05-04 | 상가모 테라퓨틱스, 인코포레이티드 | 조작된 표적 특이적 염기 편집기 |
EP4097124A1 (en) | 2020-01-28 | 2022-12-07 | The Broad Institute Inc. | Base editors, compositions, and methods for modifying the mitochondrial genome |
CA3207102A1 (en) | 2021-01-12 | 2022-07-21 | March Therapeutics, Inc. | Context-dependent, double-stranded dna-specific deaminases and uses thereof |
-
2019
- 2019-08-20 KR KR1020217008090A patent/KR20210049124A/ko not_active Application Discontinuation
- 2019-08-20 US US16/545,363 patent/US11834686B2/en active Active
- 2019-08-20 CN CN201980067879.2A patent/CN112867792A/zh active Pending
- 2019-08-20 WO PCT/US2019/047172 patent/WO2020041249A1/en unknown
- 2019-08-20 SG SG11202101801RA patent/SG11202101801RA/en unknown
- 2019-08-20 CA CA3109592A patent/CA3109592A1/en active Pending
- 2019-08-20 AU AU2019326408A patent/AU2019326408A1/en active Pending
- 2019-08-20 IL IL280951A patent/IL280951B1/en unknown
- 2019-08-20 EP EP19851741.9A patent/EP3841204A4/en active Pending
- 2019-08-20 JP JP2021510000A patent/JP2021536229A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024063538A1 (ko) * | 2022-09-21 | 2024-03-28 | 기초과학연구원 | 식물세포 소기관 dna의 염기 교정 |
Also Published As
Publication number | Publication date |
---|---|
IL280951B1 (en) | 2024-04-01 |
IL280951A (en) | 2021-04-29 |
US11834686B2 (en) | 2023-12-05 |
EP3841204A4 (en) | 2022-05-18 |
AU2019326408A1 (en) | 2021-03-11 |
SG11202101801RA (en) | 2021-03-30 |
JP2021536229A (ja) | 2021-12-27 |
EP3841204A1 (en) | 2021-06-30 |
US20200063114A1 (en) | 2020-02-27 |
CN112867792A (zh) | 2021-05-28 |
WO2020041249A1 (en) | 2020-02-27 |
CA3109592A1 (en) | 2020-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11834686B2 (en) | Engineered target specific base editors | |
JP6875362B2 (ja) | ヌクレアーゼ媒介ゲノム遺伝子操作のための送達方法および組成物 | |
AU2021286340B2 (en) | Compositions For Linking DNA-Binding Domains And Cleavage Domains | |
EP3504327B1 (en) | Engineered target specific nucleases | |
US11920169B2 (en) | Compositions for linking DNA-binding domains and cleavage domains | |
CN111954540A (zh) | 工程化靶标特异性核酸酶 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |