KR20230074519A - 핵염기 편집을 위한 아연 핑거 융합 단백질 - Google Patents
핵염기 편집을 위한 아연 핑거 융합 단백질 Download PDFInfo
- Publication number
- KR20230074519A KR20230074519A KR1020237013407A KR20237013407A KR20230074519A KR 20230074519 A KR20230074519 A KR 20230074519A KR 1020237013407 A KR1020237013407 A KR 1020237013407A KR 20237013407 A KR20237013407 A KR 20237013407A KR 20230074519 A KR20230074519 A KR 20230074519A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- thr
- ala
- arg
- lys
- Prior art date
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 164
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 164
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 title claims description 24
- 239000011701 zinc Substances 0.000 title claims description 24
- 229910052725 zinc Inorganic materials 0.000 title claims description 24
- 101710185494 Zinc finger protein Proteins 0.000 claims abstract description 169
- 102100023597 Zinc finger protein 816 Human genes 0.000 claims abstract description 169
- 102100026846 Cytidine deaminase Human genes 0.000 claims abstract description 151
- 108010031325 Cytidine deaminase Proteins 0.000 claims abstract description 151
- 238000000034 method Methods 0.000 claims abstract description 51
- 210000004027 cell Anatomy 0.000 claims description 116
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 88
- 238000006471 dimerization reaction Methods 0.000 claims description 80
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 78
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 78
- 230000000694 effects Effects 0.000 claims description 70
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 65
- 108090000623 proteins and genes Proteins 0.000 claims description 64
- 229920001184 polypeptide Polymers 0.000 claims description 63
- 108020004414 DNA Proteins 0.000 claims description 62
- 239000003795 chemical substances by application Substances 0.000 claims description 53
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 44
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 44
- 230000002401 inhibitory effect Effects 0.000 claims description 39
- 230000035772 mutation Effects 0.000 claims description 34
- 230000027455 binding Effects 0.000 claims description 33
- 230000014509 gene expression Effects 0.000 claims description 29
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 28
- 150000001413 amino acids Chemical class 0.000 claims description 23
- 229940104302 cytosine Drugs 0.000 claims description 22
- -1 G1371 Chemical compound 0.000 claims description 21
- 239000013603 viral vector Substances 0.000 claims description 21
- 241000282414 Homo sapiens Species 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 18
- 108020004705 Codon Proteins 0.000 claims description 15
- 102000039446 nucleic acids Human genes 0.000 claims description 14
- 108020004707 nucleic acids Proteins 0.000 claims description 14
- 150000007523 nucleic acids Chemical class 0.000 claims description 14
- 229940113082 thymine Drugs 0.000 claims description 14
- 108700028369 Alleles Proteins 0.000 claims description 13
- 239000003053 toxin Substances 0.000 claims description 13
- 230000001939 inductive effect Effects 0.000 claims description 12
- 231100000765 toxin Toxicity 0.000 claims description 12
- 210000005260 human cell Anatomy 0.000 claims description 11
- 231100000331 toxic Toxicity 0.000 claims description 11
- 230000002588 toxic effect Effects 0.000 claims description 11
- 239000012634 fragment Substances 0.000 claims description 10
- 230000005764 inhibitory process Effects 0.000 claims description 10
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 9
- 108091033409 CRISPR Proteins 0.000 claims description 8
- 210000004962 mammalian cell Anatomy 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 238000010354 CRISPR gene editing Methods 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000001727 in vivo Methods 0.000 claims description 5
- 210000004263 induced pluripotent stem cell Anatomy 0.000 claims description 5
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 4
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 4
- 208000009292 Hemophilia A Diseases 0.000 claims description 4
- 206010028980 Neoplasm Diseases 0.000 claims description 4
- 201000011510 cancer Diseases 0.000 claims description 4
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 4
- 208000023275 Autoimmune disease Diseases 0.000 claims description 3
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 claims description 3
- 208000006992 Color Vision Defects Diseases 0.000 claims description 3
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 3
- 241000702421 Dependoparvovirus Species 0.000 claims description 3
- 208000024412 Friedreich ataxia Diseases 0.000 claims description 3
- 208000031220 Hemophilia Diseases 0.000 claims description 3
- 208000015439 Lysosomal storage disease Diseases 0.000 claims description 3
- 201000011252 Phenylketonuria Diseases 0.000 claims description 3
- 208000024777 Prion disease Diseases 0.000 claims description 3
- 206010060862 Prostate cancer Diseases 0.000 claims description 3
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 3
- 208000022292 Tay-Sachs disease Diseases 0.000 claims description 3
- 208000025261 autosomal dominant disease Diseases 0.000 claims description 3
- 201000007254 color blindness Diseases 0.000 claims description 3
- 208000012268 mitochondrial disease Diseases 0.000 claims description 3
- 208000007056 sickle cell anemia Diseases 0.000 claims description 3
- 230000003007 single stranded DNA break Effects 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims 1
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 5
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 97
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 88
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 83
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 83
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 82
- 101000884048 Burkholderia cenocepacia (strain H111) Double-stranded DNA deaminase toxin A Proteins 0.000 description 73
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 72
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 68
- ZFVWWUILVLLVFA-AVGNSLFASA-N Phe-Gln-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N ZFVWWUILVLLVFA-AVGNSLFASA-N 0.000 description 66
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 64
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 64
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 57
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 55
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 53
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 48
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 45
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 44
- 108010065920 Insulin Lispro Proteins 0.000 description 43
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 38
- 239000002773 nucleotide Substances 0.000 description 38
- 125000003729 nucleotide group Chemical group 0.000 description 38
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 37
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 37
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 35
- 108010061238 threonyl-glycine Proteins 0.000 description 35
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 34
- 102100021277 Beta-secretase 2 Human genes 0.000 description 33
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 33
- 108010060035 arginylproline Proteins 0.000 description 33
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 32
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 32
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 32
- 101710150190 Beta-secretase 2 Proteins 0.000 description 32
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 32
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 32
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 32
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 32
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 32
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 32
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 32
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 32
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 32
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 32
- 108010062796 arginyllysine Proteins 0.000 description 32
- 108010068265 aspartyltyrosine Proteins 0.000 description 32
- 108010036413 histidylglycine Proteins 0.000 description 32
- 108010051242 phenylalanylserine Proteins 0.000 description 32
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 32
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 31
- 108010087924 alanylproline Proteins 0.000 description 30
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 29
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 28
- 108010038633 aspartylglutamate Proteins 0.000 description 28
- 108010027338 isoleucylcysteine Proteins 0.000 description 28
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 27
- 239000003112 inhibitor Substances 0.000 description 27
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 26
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 26
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 25
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 24
- SRGRINJFBHKHAC-NAKRPEOUSA-N Ile-Cys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)O)N SRGRINJFBHKHAC-NAKRPEOUSA-N 0.000 description 24
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 24
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 23
- 108010057821 leucylproline Proteins 0.000 description 23
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 22
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 22
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 22
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 21
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 21
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 21
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 20
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 20
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 20
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 20
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 20
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 20
- 235000018102 proteins Nutrition 0.000 description 20
- 102000004169 proteins and genes Human genes 0.000 description 20
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 20
- HQZGVYJBRSISDT-BQBZGAKWSA-N Cys-Gly-Arg Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQZGVYJBRSISDT-BQBZGAKWSA-N 0.000 description 19
- PCKOTDPDHIBGRW-CIUDSAMLSA-N Gln-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N PCKOTDPDHIBGRW-CIUDSAMLSA-N 0.000 description 19
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 18
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 18
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 18
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 18
- 108010025306 histidylleucine Proteins 0.000 description 18
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 17
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 17
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 17
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 17
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 17
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 17
- XFANQCRHTMOEAP-WDSOQIARSA-N Lys-Pro-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XFANQCRHTMOEAP-WDSOQIARSA-N 0.000 description 17
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 17
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 17
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 17
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 17
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 16
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 16
- 101000883965 Burkholderia cenocepacia (strain H111) Double-stranded DNA deaminase immunity protein Proteins 0.000 description 16
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 16
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 16
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 16
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 16
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 16
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 16
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 16
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 16
- 235000001014 amino acid Nutrition 0.000 description 16
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 15
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 15
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 15
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 15
- 108010017391 lysylvaline Proteins 0.000 description 15
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 14
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 14
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 14
- JUCZDDVZBMPKRT-IXOXFDKPSA-N His-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O JUCZDDVZBMPKRT-IXOXFDKPSA-N 0.000 description 14
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 14
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 14
- UXODSMTVPWXHBT-ULQDDVLXSA-N Val-Phe-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N UXODSMTVPWXHBT-ULQDDVLXSA-N 0.000 description 14
- 108010079317 prolyl-tyrosine Proteins 0.000 description 14
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 13
- 230000004568 DNA-binding Effects 0.000 description 13
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 13
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 13
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 13
- 108700002010 MHC class II transactivator Proteins 0.000 description 13
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 13
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 13
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 13
- 108010053725 prolylvaline Proteins 0.000 description 13
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 12
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 12
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 12
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 12
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 12
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 12
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 12
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 12
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 12
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 12
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 12
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 12
- 108010070783 alanyltyrosine Proteins 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 12
- 230000007017 scission Effects 0.000 description 12
- 108010051110 tyrosyl-lysine Proteins 0.000 description 12
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 11
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 11
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 11
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 11
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 11
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 11
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 11
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 11
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 11
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 11
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 11
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 11
- 101100382122 Homo sapiens CIITA gene Proteins 0.000 description 11
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 11
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 11
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 11
- 102100026371 MHC class II transactivator Human genes 0.000 description 11
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 11
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 11
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 11
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 11
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 11
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- 108010009298 lysylglutamic acid Proteins 0.000 description 11
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 10
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 10
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 10
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 10
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 10
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 10
- XSQAWJCVYDEWPT-GUBZILKMSA-N Cys-Met-Arg Chemical compound SC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XSQAWJCVYDEWPT-GUBZILKMSA-N 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 10
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 10
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 10
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 10
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 10
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 10
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 10
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 10
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 10
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 10
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 10
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 10
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 10
- 108010010147 glycylglutamine Proteins 0.000 description 10
- 108010024607 phenylalanylalanine Proteins 0.000 description 10
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 9
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 9
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 9
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 9
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 9
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 9
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 9
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 9
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 9
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 9
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 9
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 9
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 9
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 9
- 101000946926 Homo sapiens C-C chemokine receptor type 5 Proteins 0.000 description 9
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 9
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 9
- HQXSFFSLXFHWOX-IXOXFDKPSA-N Lys-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N)O HQXSFFSLXFHWOX-IXOXFDKPSA-N 0.000 description 9
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 9
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 9
- 108010079364 N-glycylalanine Proteins 0.000 description 9
- NBDHWLZEMKSVHH-UVBJJODRSA-N Pro-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 NBDHWLZEMKSVHH-UVBJJODRSA-N 0.000 description 9
- BVRBCQBUNGAWFP-KKUMJFAQSA-N Pro-Tyr-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O BVRBCQBUNGAWFP-KKUMJFAQSA-N 0.000 description 9
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 9
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 9
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 9
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 9
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 9
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 9
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 9
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 9
- 108010044940 alanylglutamine Proteins 0.000 description 9
- 108010068380 arginylarginine Proteins 0.000 description 9
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 9
- 102000048160 human CCR5 Human genes 0.000 description 9
- 108010091871 leucylmethionine Proteins 0.000 description 9
- 238000011282 treatment Methods 0.000 description 9
- 229940035893 uracil Drugs 0.000 description 9
- 108010073969 valyllysine Proteins 0.000 description 9
- 208000029108 46,XY sex reversal 8 Diseases 0.000 description 8
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 8
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 8
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 8
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 8
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 8
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 8
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 8
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 8
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 8
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 8
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 8
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 8
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 8
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 8
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 8
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 8
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 8
- 108010047495 alanylglycine Proteins 0.000 description 8
- 108010077245 asparaginyl-proline Proteins 0.000 description 8
- 210000004899 c-terminal region Anatomy 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 7
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 7
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 7
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 7
- 238000010453 CRISPR/Cas method Methods 0.000 description 7
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 7
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 7
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 7
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 7
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 7
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 7
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 7
- WXDRGWBQZIMJDE-ULQDDVLXSA-N Leu-Phe-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O WXDRGWBQZIMJDE-ULQDDVLXSA-N 0.000 description 7
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 7
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 7
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 7
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 7
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 7
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 7
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 7
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 7
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 7
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 7
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 7
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 7
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 7
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 7
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 230000001018 virulence Effects 0.000 description 7
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 6
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 6
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 6
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 6
- PWYFCPCBOYMOGB-LKTVYLICSA-N Ala-Gln-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PWYFCPCBOYMOGB-LKTVYLICSA-N 0.000 description 6
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 6
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 6
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 6
- 108091093088 Amplicon Proteins 0.000 description 6
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 6
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 6
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 6
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 6
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 6
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 6
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 6
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 6
- LDIKUWLAMDFHPU-FXQIFTODSA-N Cys-Cys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LDIKUWLAMDFHPU-FXQIFTODSA-N 0.000 description 6
- UQHYQYXOLIYNSR-CUJWVEQBSA-N Cys-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N)O UQHYQYXOLIYNSR-CUJWVEQBSA-N 0.000 description 6
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 6
- 229940123974 Cytidine deaminase inhibitor Drugs 0.000 description 6
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 6
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 6
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 6
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 6
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 6
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 6
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 6
- IXQGOKWTQPCIQM-YJRXYDGGSA-N His-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O IXQGOKWTQPCIQM-YJRXYDGGSA-N 0.000 description 6
- 101000979748 Homo sapiens Protein NDRG1 Proteins 0.000 description 6
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 6
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 6
- WVUDHMBJNBWZBU-XUXIUFHCSA-N Ile-Lys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N WVUDHMBJNBWZBU-XUXIUFHCSA-N 0.000 description 6
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 6
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 6
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 6
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 6
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 6
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 6
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 6
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 6
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 6
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 6
- OWCLJDXHHZUNEL-IHRRRGAJSA-N Phe-Cys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O OWCLJDXHHZUNEL-IHRRRGAJSA-N 0.000 description 6
- IEOHQGFKHXUALJ-JYJNAYRXSA-N Phe-Met-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IEOHQGFKHXUALJ-JYJNAYRXSA-N 0.000 description 6
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 6
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 6
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 6
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 6
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 6
- 102100024980 Protein NDRG1 Human genes 0.000 description 6
- 108010003201 RGH 0205 Proteins 0.000 description 6
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 6
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 6
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 6
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 6
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 6
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 6
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 6
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 6
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 6
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 6
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 6
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 6
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 108010016616 cysteinylglycine Proteins 0.000 description 6
- 108010085325 histidylproline Proteins 0.000 description 6
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 6
- 239000002502 liposome Substances 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 150000003384 small molecules Chemical class 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 5
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 5
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 5
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 5
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 5
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 5
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 5
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 5
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 5
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 5
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 5
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 5
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 5
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 5
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 5
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 5
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 5
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 5
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 5
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 5
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 5
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 5
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 5
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 5
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 5
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 5
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 5
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 5
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 5
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 5
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 5
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 5
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 102200087780 rs77375493 Human genes 0.000 description 5
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 4
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 4
- YGHCVNQOZZMHRZ-DJFWLOJKSA-N Asn-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N YGHCVNQOZZMHRZ-DJFWLOJKSA-N 0.000 description 4
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 4
- 230000033616 DNA repair Effects 0.000 description 4
- 230000004543 DNA replication Effects 0.000 description 4
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 4
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 4
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 4
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 4
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 4
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 4
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 4
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 4
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 4
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 4
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 4
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 4
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 4
- 102100029215 Signaling lymphocytic activation molecule Human genes 0.000 description 4
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 230000002939 deleterious effect Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- 108010052875 Adenine deaminase Proteins 0.000 description 3
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 3
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 3
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 3
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 3
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 3
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 3
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 3
- 102100024263 CD160 antigen Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 3
- 101000761938 Homo sapiens CD160 antigen Proteins 0.000 description 3
- 101000994375 Homo sapiens Integrin alpha-4 Proteins 0.000 description 3
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 3
- 101000633786 Homo sapiens SLAM family member 6 Proteins 0.000 description 3
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 3
- 102100032818 Integrin alpha-4 Human genes 0.000 description 3
- 102100032816 Integrin alpha-6 Human genes 0.000 description 3
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 description 3
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 3
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 3
- 102100038082 Natural killer cell receptor 2B4 Human genes 0.000 description 3
- 241000714474 Rous sarcoma virus Species 0.000 description 3
- 102100029197 SLAM family member 6 Human genes 0.000 description 3
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 3
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 3
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- 238000010459 TALEN Methods 0.000 description 3
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 3
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 3
- 108010022394 Threonine synthase Proteins 0.000 description 3
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 3
- 239000000556 agonist Substances 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 108091092356 cellular DNA Proteins 0.000 description 3
- 238000006481 deamination reaction Methods 0.000 description 3
- 230000034994 death Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 102000004419 dihydrofolate reductase Human genes 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 239000013607 AAV vector Substances 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 2
- 102100027211 Albumin Human genes 0.000 description 2
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 2
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 2
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 2
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 2
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 2
- 241000371430 Burkholderia cenocepacia Species 0.000 description 2
- 102100038077 CD226 antigen Human genes 0.000 description 2
- 102100022732 Diacylglycerol kinase beta Human genes 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 2
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 2
- 101000884298 Homo sapiens CD226 antigen Proteins 0.000 description 2
- 101001078158 Homo sapiens Integrin alpha-1 Proteins 0.000 description 2
- 101000994365 Homo sapiens Integrin alpha-6 Proteins 0.000 description 2
- 101001035237 Homo sapiens Integrin alpha-D Proteins 0.000 description 2
- 101001046687 Homo sapiens Integrin alpha-E Proteins 0.000 description 2
- 101000935043 Homo sapiens Integrin beta-1 Proteins 0.000 description 2
- 101000935040 Homo sapiens Integrin beta-2 Proteins 0.000 description 2
- 101000971538 Homo sapiens Killer cell lectin-like receptor subfamily F member 1 Proteins 0.000 description 2
- 101000868279 Homo sapiens Leukocyte surface antigen CD47 Proteins 0.000 description 2
- 101000873418 Homo sapiens P-selectin glycoprotein ligand 1 Proteins 0.000 description 2
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 2
- 101000633778 Homo sapiens SLAM family member 5 Proteins 0.000 description 2
- 101000633782 Homo sapiens SLAM family member 8 Proteins 0.000 description 2
- 101000633780 Homo sapiens Signaling lymphocytic activation molecule Proteins 0.000 description 2
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 2
- 101000655352 Homo sapiens Telomerase reverse transcriptase Proteins 0.000 description 2
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 2
- 102100025323 Integrin alpha-1 Human genes 0.000 description 2
- 102100039904 Integrin alpha-D Human genes 0.000 description 2
- 102100022341 Integrin alpha-E Human genes 0.000 description 2
- 102100022338 Integrin alpha-M Human genes 0.000 description 2
- 102100022297 Integrin alpha-X Human genes 0.000 description 2
- 102100025304 Integrin beta-1 Human genes 0.000 description 2
- 102100025390 Integrin beta-2 Human genes 0.000 description 2
- 102100021458 Killer cell lectin-like receptor subfamily F member 1 Human genes 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 2
- 102100032913 Leukocyte surface antigen CD47 Human genes 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- 108010061593 Member 14 Tumor Necrosis Factor Receptors Proteins 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 2
- 102100034925 P-selectin glycoprotein ligand 1 Human genes 0.000 description 2
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 2
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 2
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 2
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 102100029216 SLAM family member 5 Human genes 0.000 description 2
- 102100029214 SLAM family member 8 Human genes 0.000 description 2
- 102100027744 Semaphorin-4D Human genes 0.000 description 2
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 2
- 108010074687 Signaling Lymphocytic Activation Molecule Family Member 1 Proteins 0.000 description 2
- 102100027208 T-cell antigen CD7 Human genes 0.000 description 2
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 2
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 2
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 2
- 102100040247 Tumor necrosis factor Human genes 0.000 description 2
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 2
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000000129 anionic group Chemical group 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 230000033590 base-excision repair Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 2
- 229940127089 cytotoxic agent Drugs 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 231100000221 frame shift mutation induction Toxicity 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 102000051631 human SERPINA1 Human genes 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 210000000822 natural killer cell Anatomy 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 125000001151 peptidyl group Chemical group 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 210000001778 pluripotent stem cell Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 210000003289 regulatory T cell Anatomy 0.000 description 2
- 230000005783 single-strand break Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- JPSHPWJJSVEEAX-OWPBQMJCSA-N (2s)-2-amino-4-fluoranylpentanedioic acid Chemical compound OC(=O)[C@@H](N)CC([18F])C(O)=O JPSHPWJJSVEEAX-OWPBQMJCSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- CVOFKRWYWCSDMA-UHFFFAOYSA-N 2-chloro-n-(2,6-diethylphenyl)-n-(methoxymethyl)acetamide;2,6-dinitro-n,n-dipropyl-4-(trifluoromethyl)aniline Chemical compound CCC1=CC=CC(CC)=C1N(COC)C(=O)CCl.CCCN(CCC)C1=C([N+]([O-])=O)C=C(C(F)(F)F)C=C1[N+]([O-])=O CVOFKRWYWCSDMA-UHFFFAOYSA-N 0.000 description 1
- 102100023990 60S ribosomal protein L17 Human genes 0.000 description 1
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 1
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 102000009346 Adenosine receptors Human genes 0.000 description 1
- 108050000203 Adenosine receptors Proteins 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- NXVGBGZQQFDUTM-XVYDVKMFSA-N Asn-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N NXVGBGZQQFDUTM-XVYDVKMFSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- 208000010061 Autosomal Dominant Polycystic Kidney Diseases 0.000 description 1
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 1
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 1
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 108010051118 Bone Marrow Stromal Antigen 2 Proteins 0.000 description 1
- 102100037086 Bone marrow stromal antigen 2 Human genes 0.000 description 1
- 101000964894 Bos taurus 14-3-3 protein zeta/delta Proteins 0.000 description 1
- 241001453380 Burkholderia Species 0.000 description 1
- 108010017533 Butyrophilins Proteins 0.000 description 1
- 102000004555 Butyrophilins Human genes 0.000 description 1
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 1
- 102100024217 CAMPATH-1 antigen Human genes 0.000 description 1
- 108010056102 CD100 antigen Proteins 0.000 description 1
- 108010017009 CD11b Antigen Proteins 0.000 description 1
- 102100027207 CD27 antigen Human genes 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- 102100036008 CD48 antigen Human genes 0.000 description 1
- 108010065524 CD52 Antigen Proteins 0.000 description 1
- 108010062802 CD66 antigens Proteins 0.000 description 1
- 102100027217 CD82 antigen Human genes 0.000 description 1
- 101710139831 CD82 antigen Proteins 0.000 description 1
- 102100035793 CD83 antigen Human genes 0.000 description 1
- 101100510617 Caenorhabditis elegans sel-8 gene Proteins 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 102100024533 Carcinoembryonic antigen-related cell adhesion molecule 1 Human genes 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102100021396 Cell surface glycoprotein CD200 receptor 1 Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000004420 Creatine Kinase Human genes 0.000 description 1
- 108010042126 Creatine kinase Proteins 0.000 description 1
- 102100032218 Cytokine-inducible SH2-containing protein Human genes 0.000 description 1
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 1
- 102100027816 Cytotoxic and regulatory T-cell molecule Human genes 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 102100020986 DNA-binding protein RFX5 Human genes 0.000 description 1
- 229940122135 Deaminase inhibitor Drugs 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 102100029588 Deoxycytidine kinase Human genes 0.000 description 1
- 108010058222 Deoxyguanosine kinase Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108010062677 Diacylglycerol Kinase Proteins 0.000 description 1
- 102100022735 Diacylglycerol kinase alpha Human genes 0.000 description 1
- 102100022731 Diacylglycerol kinase delta Human genes 0.000 description 1
- 102100022733 Diacylglycerol kinase epsilon Human genes 0.000 description 1
- 102100022730 Diacylglycerol kinase gamma Human genes 0.000 description 1
- 102100030214 Diacylglycerol kinase iota Human genes 0.000 description 1
- 102100030187 Diacylglycerol kinase kappa Human genes 0.000 description 1
- 102100030221 Diacylglycerol kinase theta Human genes 0.000 description 1
- 102100030220 Diacylglycerol kinase zeta Human genes 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 101100219190 Drosophila melanogaster byn gene Proteins 0.000 description 1
- 102100025137 Early activation antigen CD69 Human genes 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 101000889905 Enterobacteria phage RB3 Intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889904 Enterobacteria phage T4 Defective intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 description 1
- 101000889899 Enterobacteria phage T4 Intron-associated endonuclease 2 Proteins 0.000 description 1
- 101000585551 Equus caballus Pregnancy-associated glycoprotein Proteins 0.000 description 1
- 101100129584 Escherichia coli (strain K12) trg gene Proteins 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102100022086 GRB2-related adapter protein 2 Human genes 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 102100035943 HERV-H LTR-associating protein 2 Human genes 0.000 description 1
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 1
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 1
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 description 1
- 102100029966 HLA class II histocompatibility antigen, DP alpha 1 chain Human genes 0.000 description 1
- 102100031618 HLA class II histocompatibility antigen, DP beta 1 chain Human genes 0.000 description 1
- 102100036242 HLA class II histocompatibility antigen, DQ alpha 2 chain Human genes 0.000 description 1
- 102100036241 HLA class II histocompatibility antigen, DQ beta 1 chain Human genes 0.000 description 1
- 102100040505 HLA class II histocompatibility antigen, DR alpha chain Human genes 0.000 description 1
- 102100040485 HLA class II histocompatibility antigen, DRB1 beta chain Human genes 0.000 description 1
- 108010075704 HLA-A Antigens Proteins 0.000 description 1
- 108010058607 HLA-B Antigens Proteins 0.000 description 1
- 108010052199 HLA-C Antigens Proteins 0.000 description 1
- 108010093061 HLA-DPA1 antigen Proteins 0.000 description 1
- 108010045483 HLA-DPB1 antigen Proteins 0.000 description 1
- 108010086786 HLA-DQA1 antigen Proteins 0.000 description 1
- 108010065026 HLA-DQB1 antigen Proteins 0.000 description 1
- 108010067802 HLA-DR alpha-Chains Proteins 0.000 description 1
- 108010039343 HLA-DRB1 Chains Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108010007712 Hepatitis A Virus Cellular Receptor 1 Proteins 0.000 description 1
- 102100034459 Hepatitis A virus cellular receptor 1 Human genes 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 101710083479 Hepatitis A virus cellular receptor 2 homolog Proteins 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000824278 Homo sapiens Acyl-[acyl-carrier-protein] hydrolase Proteins 0.000 description 1
- 101000864344 Homo sapiens B- and T-lymphocyte attenuator Proteins 0.000 description 1
- 101000903703 Homo sapiens B-cell lymphoma/leukemia 11A Proteins 0.000 description 1
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 1
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 1
- 101000716130 Homo sapiens CD48 antigen Proteins 0.000 description 1
- 101000946856 Homo sapiens CD83 antigen Proteins 0.000 description 1
- 101000969553 Homo sapiens Cell surface glycoprotein CD200 receptor 1 Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000943420 Homo sapiens Cytokine-inducible SH2-containing protein Proteins 0.000 description 1
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 1
- 101001075432 Homo sapiens DNA-binding protein RFX5 Proteins 0.000 description 1
- 101001044817 Homo sapiens Diacylglycerol kinase alpha Proteins 0.000 description 1
- 101001044814 Homo sapiens Diacylglycerol kinase beta Proteins 0.000 description 1
- 101001044810 Homo sapiens Diacylglycerol kinase delta Proteins 0.000 description 1
- 101001044812 Homo sapiens Diacylglycerol kinase epsilon Proteins 0.000 description 1
- 101001044807 Homo sapiens Diacylglycerol kinase gamma Proteins 0.000 description 1
- 101000864600 Homo sapiens Diacylglycerol kinase iota Proteins 0.000 description 1
- 101000864603 Homo sapiens Diacylglycerol kinase kappa Proteins 0.000 description 1
- 101000864574 Homo sapiens Diacylglycerol kinase theta Proteins 0.000 description 1
- 101000864576 Homo sapiens Diacylglycerol kinase zeta Proteins 0.000 description 1
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 description 1
- 101000900690 Homo sapiens GRB2-related adapter protein 2 Proteins 0.000 description 1
- 101000926140 Homo sapiens Gem-associated protein 2 Proteins 0.000 description 1
- 101001021491 Homo sapiens HERV-H LTR-associating protein 2 Proteins 0.000 description 1
- 101001046683 Homo sapiens Integrin alpha-L Proteins 0.000 description 1
- 101001046686 Homo sapiens Integrin alpha-M Proteins 0.000 description 1
- 101001046668 Homo sapiens Integrin alpha-X Proteins 0.000 description 1
- 101001015037 Homo sapiens Integrin beta-7 Proteins 0.000 description 1
- 101001043809 Homo sapiens Interleukin-7 receptor subunit alpha Proteins 0.000 description 1
- 101000971533 Homo sapiens Killer cell lectin-like receptor subfamily G member 1 Proteins 0.000 description 1
- 101000984189 Homo sapiens Leukocyte immunoglobulin-like receptor subfamily B member 2 Proteins 0.000 description 1
- 101001047640 Homo sapiens Linker for activation of T-cells family member 1 Proteins 0.000 description 1
- 101001090688 Homo sapiens Lymphocyte cytosolic protein 2 Proteins 0.000 description 1
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 description 1
- 101000763322 Homo sapiens M1-specific T cell receptor beta chain Proteins 0.000 description 1
- 101001109503 Homo sapiens NKG2-C type II integral membrane protein Proteins 0.000 description 1
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 1
- 101000589305 Homo sapiens Natural cytotoxicity triggering receptor 2 Proteins 0.000 description 1
- 101001124867 Homo sapiens Peroxiredoxin-1 Proteins 0.000 description 1
- 101000692259 Homo sapiens Phosphoprotein associated with glycosphingolipid-enriched microdomains 1 Proteins 0.000 description 1
- 101000716750 Homo sapiens Protein SCAF11 Proteins 0.000 description 1
- 101000702132 Homo sapiens Protein spinster homolog 1 Proteins 0.000 description 1
- 101000633784 Homo sapiens SLAM family member 7 Proteins 0.000 description 1
- 101000650817 Homo sapiens Semaphorin-4D Proteins 0.000 description 1
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 description 1
- 101000763321 Homo sapiens T cell receptor beta chain MC.7.G5 Proteins 0.000 description 1
- 101000914496 Homo sapiens T-cell antigen CD7 Proteins 0.000 description 1
- 101000831007 Homo sapiens T-cell immunoreceptor with Ig and ITIM domains Proteins 0.000 description 1
- 101000934346 Homo sapiens T-cell surface antigen CD2 Proteins 0.000 description 1
- 101000596234 Homo sapiens T-cell surface protein tactile Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 101000764622 Homo sapiens Transmembrane and immunoglobulin domain-containing protein 2 Proteins 0.000 description 1
- 101000680666 Homo sapiens Tripartite motif-containing protein 5 Proteins 0.000 description 1
- 101000788548 Homo sapiens Tubulin alpha-4A chain Proteins 0.000 description 1
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 1
- 101000638161 Homo sapiens Tumor necrosis factor ligand superfamily member 6 Proteins 0.000 description 1
- 101000795169 Homo sapiens Tumor necrosis factor receptor superfamily member 13C Proteins 0.000 description 1
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 description 1
- 101000679857 Homo sapiens Tumor necrosis factor receptor superfamily member 3 Proteins 0.000 description 1
- 101000611023 Homo sapiens Tumor necrosis factor receptor superfamily member 6 Proteins 0.000 description 1
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 1
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 1
- 101001135572 Homo sapiens Tyrosine-protein phosphatase non-receptor type 2 Proteins 0.000 description 1
- 101000863873 Homo sapiens Tyrosine-protein phosphatase non-receptor type substrate 1 Proteins 0.000 description 1
- 101000666896 Homo sapiens V-type immunoglobulin domain-containing suppressor of T-cell activation Proteins 0.000 description 1
- 101000723833 Homo sapiens Zinc finger E-box-binding homeobox 2 Proteins 0.000 description 1
- 102100034980 ICOS ligand Human genes 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 description 1
- 108010065825 Immunoglobulin Light Chains Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 102100021317 Inducible T-cell costimulator Human genes 0.000 description 1
- 102100022339 Integrin alpha-L Human genes 0.000 description 1
- 108010041100 Integrin alpha6 Proteins 0.000 description 1
- 108010030465 Integrin alpha6beta1 Proteins 0.000 description 1
- 102100033016 Integrin beta-7 Human genes 0.000 description 1
- 108010064593 Intercellular Adhesion Molecule-1 Proteins 0.000 description 1
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000003777 Interleukin-1 beta Human genes 0.000 description 1
- 108090000193 Interleukin-1 beta Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 102100021593 Interleukin-7 receptor subunit alpha Human genes 0.000 description 1
- 102000002698 KIR Receptors Human genes 0.000 description 1
- 108010043610 KIR Receptors Proteins 0.000 description 1
- 102100021457 Killer cell lectin-like receptor subfamily G member 1 Human genes 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- 102100025584 Leukocyte immunoglobulin-like receptor subfamily B member 1 Human genes 0.000 description 1
- 102100025583 Leukocyte immunoglobulin-like receptor subfamily B member 2 Human genes 0.000 description 1
- 101710145805 Leukocyte immunoglobulin-like receptor subfamily B member 3 Proteins 0.000 description 1
- 102100020943 Leukocyte-associated immunoglobulin-like receptor 1 Human genes 0.000 description 1
- 102100034709 Lymphocyte cytosolic protein 2 Human genes 0.000 description 1
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100029450 M1-specific T cell receptor alpha chain Human genes 0.000 description 1
- 102100026964 M1-specific T cell receptor beta chain Human genes 0.000 description 1
- 102100026299 MAP kinase-interacting serine/threonine-protein kinase 1 Human genes 0.000 description 1
- 101710139011 MAP kinase-interacting serine/threonine-protein kinase 1 Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 101100407308 Mus musculus Pdcd1lg2 gene Proteins 0.000 description 1
- 201000007224 Myeloproliferative neoplasm Diseases 0.000 description 1
- 102100022683 NKG2-C type II integral membrane protein Human genes 0.000 description 1
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 1
- 108010004217 Natural Cytotoxicity Triggering Receptor 1 Proteins 0.000 description 1
- 108010004222 Natural Cytotoxicity Triggering Receptor 3 Proteins 0.000 description 1
- 102100032870 Natural cytotoxicity triggering receptor 1 Human genes 0.000 description 1
- 102100032851 Natural cytotoxicity triggering receptor 2 Human genes 0.000 description 1
- 102100032852 Natural cytotoxicity triggering receptor 3 Human genes 0.000 description 1
- 102100029527 Natural cytotoxicity triggering receptor 3 ligand 1 Human genes 0.000 description 1
- 101710201161 Natural cytotoxicity triggering receptor 3 ligand 1 Proteins 0.000 description 1
- 101710141230 Natural killer cell receptor 2B4 Proteins 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- RVRRHFPCEOVRKQ-KKUMJFAQSA-N Phe-His-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVRRHFPCEOVRKQ-KKUMJFAQSA-N 0.000 description 1
- 102100026066 Phosphoprotein associated with glycosphingolipid-enriched microdomains 1 Human genes 0.000 description 1
- 108010071690 Prealbumin Proteins 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- 108700030875 Programmed Cell Death 1 Ligand 2 Proteins 0.000 description 1
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 1
- 102100024213 Programmed cell death 1 ligand 2 Human genes 0.000 description 1
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 1
- 102000008866 Prostaglandin E receptors Human genes 0.000 description 1
- 108010088540 Prostaglandin E receptors Proteins 0.000 description 1
- 102100020876 Protein SCAF11 Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102000014128 RANK Ligand Human genes 0.000 description 1
- 108010025832 RANK Ligand Proteins 0.000 description 1
- 239000012980 RPMI-1640 medium Substances 0.000 description 1
- 101100443768 Rattus norvegicus Dock9 gene Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 102100029198 SLAM family member 7 Human genes 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- SYCFMSYTIFXWAJ-DCAQKATOSA-N Ser-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N SYCFMSYTIFXWAJ-DCAQKATOSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101150045565 Socs1 gene Proteins 0.000 description 1
- 101150043341 Socs3 gene Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 108700027336 Suppressor of Cytokine Signaling 1 Proteins 0.000 description 1
- 108700027337 Suppressor of Cytokine Signaling 3 Proteins 0.000 description 1
- 102100024779 Suppressor of cytokine signaling 1 Human genes 0.000 description 1
- 102100024283 Suppressor of cytokine signaling 3 Human genes 0.000 description 1
- 101100215487 Sus scrofa ADRA2A gene Proteins 0.000 description 1
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 description 1
- 102100039367 T-cell immunoglobulin and mucin domain-containing protein 4 Human genes 0.000 description 1
- 101710174757 T-cell immunoglobulin and mucin domain-containing protein 4 Proteins 0.000 description 1
- 229940126547 T-cell immunoglobulin mucin-3 Drugs 0.000 description 1
- 102100024834 T-cell immunoreceptor with Ig and ITIM domains Human genes 0.000 description 1
- 102100025237 T-cell surface antigen CD2 Human genes 0.000 description 1
- 102100035268 T-cell surface protein tactile Human genes 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 1
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 101000874827 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) Dephospho-CoA kinase Proteins 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- 102000000887 Transcription factor STAT Human genes 0.000 description 1
- 108050007918 Transcription factor STAT Proteins 0.000 description 1
- 108010082684 Transforming Growth Factor-beta Type II Receptor Proteins 0.000 description 1
- 102000004060 Transforming Growth Factor-beta Type II Receptor Human genes 0.000 description 1
- 102100026224 Transmembrane and immunoglobulin domain-containing protein 2 Human genes 0.000 description 1
- 102000009190 Transthyretin Human genes 0.000 description 1
- 102100022405 Tripartite motif-containing protein 5 Human genes 0.000 description 1
- 102100025239 Tubulin alpha-4A chain Human genes 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102100031988 Tumor necrosis factor ligand superfamily member 6 Human genes 0.000 description 1
- 102100029690 Tumor necrosis factor receptor superfamily member 13C Human genes 0.000 description 1
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 description 1
- 102100033733 Tumor necrosis factor receptor superfamily member 1B Human genes 0.000 description 1
- 101710187830 Tumor necrosis factor receptor superfamily member 1B Proteins 0.000 description 1
- 102100022156 Tumor necrosis factor receptor superfamily member 3 Human genes 0.000 description 1
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 1
- 102100033141 Tyrosine-protein phosphatase non-receptor type 2 Human genes 0.000 description 1
- 102100029948 Tyrosine-protein phosphatase non-receptor type substrate 1 Human genes 0.000 description 1
- 108010079206 V-Set Domain-Containing T-Cell Activation Inhibitor 1 Proteins 0.000 description 1
- 102100038929 V-set domain-containing T-cell activation inhibitor 1 Human genes 0.000 description 1
- 102100038282 V-type immunoglobulin domain-containing suppressor of T-cell activation Human genes 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 101001038499 Yarrowia lipolytica (strain CLIB 122 / E 150) Lysine acetyltransferase Proteins 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 210000002203 alpha-beta t lymphocyte Anatomy 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 208000022185 autosomal dominant polycystic kidney disease Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 108010072917 class-I restricted T cell-associated molecule Proteins 0.000 description 1
- 208000011664 congenital factor XI deficiency Diseases 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 210000003162 effector t lymphocyte Anatomy 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 201000007219 factor XI deficiency Diseases 0.000 description 1
- IJJVMEJXYNJXOJ-UHFFFAOYSA-N fluquinconazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1N1C(=O)C2=CC(F)=CC=C2N=C1N1C=NC=N1 IJJVMEJXYNJXOJ-UHFFFAOYSA-N 0.000 description 1
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 208000009429 hemophilia B Diseases 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010025001 leukocyte-associated immunoglobulin-like receptor 1 Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- RHLMXWCISNJNDH-UHFFFAOYSA-N n-[2-[3-[[5-[3-(dimethylcarbamoyl)phenyl]-2-methoxyphenyl]sulfonylamino]anilino]ethyl]-3-methylbenzamide Chemical compound COC1=CC=C(C=2C=C(C=CC=2)C(=O)N(C)C)C=C1S(=O)(=O)NC(C=1)=CC=CC=1NCCNC(=O)C1=CC=CC(C)=C1 RHLMXWCISNJNDH-UHFFFAOYSA-N 0.000 description 1
- OHDXDNUPVVYWOV-UHFFFAOYSA-N n-methyl-1-(2-naphthalen-1-ylsulfanylphenyl)methanamine Chemical compound CNCC1=CC=CC=C1SC1=CC=CC2=CC=CC=C12 OHDXDNUPVVYWOV-UHFFFAOYSA-N 0.000 description 1
- 239000002088 nanocapsule Substances 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
아연 핑거 단백질 및 시티딘 데아미나제 도메인을 포함하는 융합 단백질을 포함하는 염기 편집제 시스템, 뿐만 아니라 염기 편집제 시스템을 사용하는 방법이 본원에 제공된다. 시스템은 표적 DNA 서열에서 단일 염기 쌍을 특이적으로 변경시키는 데 사용될 수 있다.
Description
<관련 출원에 대한 상호 참조>
본 출원은 2020년 9월 25일에 출원된 미국 특허 가출원 63/083,662; 2021년 3월 23일에 출원된 미국 특허 가출원 63/164,893; 및 2021년 8월 6일에 출원된 미국 특허 가출원 63/230,580을 우선권 주장한다. 이들 우선권 출원의 개시내용은 그 전문이 본원에 참조로 포함된다.
<서열 목록>
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 함유하며, 이는 그 전문이 본원에 참조로 포함된다. 2021년 9월 22일에 생성된 서열 목록의 전자 카피는 025297_WO034_SL.txt로 명명되고, 529,443 바이트 크기이다.
단일 염기의 정밀 DNA 편집은 장애, 예컨대 유전 질환을 치료하고 이해하는 데 다양한 적용을 갖는다. 예를 들어, 하나 이상의 유전자의 녹-아웃은 정규 코돈을 정지 코돈으로 전환시킴으로써, 또는 스플라이스 수용자 부위를 돌연변이시켜 엑손 스키핑 및/또는 프레임시프트 돌연변이를 도입함으로써 달성될 수 있다. 또한, DNA 점 돌연변이는 광범위한 장애와 연관된다. 단일 염기 편집은 유해 돌연변이를 교정하거나 또는 유익한 유전자 변형을 도입하는 데 사용될 수 있다.
시티딘 데아미나제는 핵염기 시토신을 티민으로 (또는 뉴클레오시드 데옥시시티딘을 티미딘으로) 전환시킨다. 이들 효소는 피리미딘 샐비지 경로에서 기능하며, 우세하게 단일-가닥 DNA 상에서 작용하여 시토신을 우라실로 전환시키고, 이는 후속적으로 DNA 복제 또는 복구 동안 티민 염기에 의해 대체된다. 박테리아 부르크홀데리아 세노세파시아(Burkholderia cenocepacia)에서 확인된 시티딘 데아미나제, DddA는 이중-가닥 DNA 내에서 시토신의 우라실로의 탈아미노화를 촉매할 수 있다. 따라서, DddA는 dsDNA의 ssDNA로의 언와인딩에 대한 요건을 우회한다 (문헌 [Mok et al., Nature (2020) 583:631-7]). Mok 연구는 전사 활성화제-유사 이펙터 (TALE) 단백질에 융합된 DddA-유래 시토신 염기 편집제를 사용한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집을 보고하지만, 이러한 접근법이 얼마나 광범위하게 적용가능한지는 불명확하다. 추가로, 이중-가닥 DNA 상에서 작동하는 신규한 데아미나제는 DddA와 비교하여 개선 또는 변경된 염기 편집 활성을 가질 수 있다.
따라서, 수많은 질환의 예방 및 치료를 위한 정확한 염기 편집 시스템을 개발할 필요가 계속 존재한다.
본 개시내용은 아연 핑거 단백질 (ZFP) 기반 핵염기 편집 시스템 및 그의 용도를 제공한다. 한 측면에서, 본 개시내용은, 각각 제1 융합 단백질 및 제2 융합 단백질, 또는 제1 및 제2 융합 단백질을 발현하기 위한 제1 및 제2 발현 구축물을 포함하는, 세포 (예를 들어, 진핵 세포 또는 원핵 세포, 여기서 진핵 세포는 포유동물 세포, 예컨대 인간 세포, 또는 식물 세포일 수 있음)의 게놈에서 시토신을 티민으로 변화시키기 위한 시스템을 제공하며, 여기서 a) 제1 융합 단백질은 i) 세포 내 표적 게놈 영역 내의 제1 서열에 결합하는 제1 아연 핑거 단백질 (ZFP) 도메인, 및 ii) 시티딘 데아미나제 폴리펩티드의 제1 부분 (예를 들어, 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 독소-유래 데아미나제 (TDD)임)을 포함하고; b) 제2 융합 단백질은 i) 표적 게놈 영역 내 제2 서열에 결합하는 제2 ZFP 도메인, 및 ii) 시티딘 데아미나제 폴리펩티드의 제2 부분을 포함하고; c) 제1 융합 단백질 및 제2 융합 단백질은 표적 게놈 영역에 결합하여 제1 및 제2 부분의 이량체화를 일으키며, 여기서 이량체화된 부분은 표적 게놈 영역 내 시토신을 우라실로 변화시킬 수 있는 활성 시티딘 데아미나제를 형성한다. 일부 실시양태에서, 제1 및 제2 부분은 그 자체로 시티딘 데아미나제 활성이 결여되어 있다. 일부 실시양태에서, 제1 및 제2 부분은 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 활성 시티딘 데아미나제를 형성한다. 일부 실시양태에서, 제1 및 제2 부분은 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214 또는 219의 아미노산 서열을 포함하는 활성 시티딘 데아미나제를 형성한다. 일부 실시양태에서, 표적 게놈 영역은 세포 내 유전자의 특정한 대립유전자에 대해 특이적일 수 있다. 일부 실시양태에서, 표적화된 시토신은 표적 게놈 영역 내 제1 서열과 제2 서열의 근위 말단들 사이에 있을 수 있고, 임의로 여기서 근위 말단은 100 bp 이하로 떨어져 있다.
또한, 제1 및 제2 융합 단백질의 하나 초과의 쌍을 포함하는 본 발명의 염기 편집제 시스템의 멀티플렉스 버전이 제공되며, 여기서 융합 단백질의 각각의 쌍은 상이한 표적 게놈 영역에 결합하고, 임의로 여기서 한 쌍의 융합 단백질의 제1 및 제2 시티딘 데아미나제 부분은 또 다른 쌍의 융합 단백질의 제1 및 제2 부분과 상이하다.
일부 실시양태에서, 염기 편집제 시스템은 비편집 또는 편집된 가닥 상에 단일-가닥 DNA 파괴를 생성하는 닉카제를 추가로 포함하며, 여기서 DNA 파괴는 편집될 시토신으로부터 약 500 bp 이하, 임의로 200 bp 이하, 임의로 약 10-50 bp이다. 닉카제는, 예를 들어 ZFP-기반 닉카제, TALE-기반 닉카제 또는 CRISPR-기반 닉카제일 수 있다. 일부 실시양태에서, 닉카제는 표적 게놈 영역에 결합하는 2개의 ZFP 도메인에 각각 융합된 제1 닉카제 도메인 및 제2 닉카제 도메인의 이량체화에 의해 형성된 ZFP-기반 닉카제이며, 여기서 제1 및 제2 닉카제 도메인은 그 자체로 불활성이거나, 또는 유의하거나 특이적인 닉카제 활성이 결여되어 있다. 특정 실시양태에서, 닉카제 도메인 중 하나는 제1 또는 제2 ZFP-시티딘 데아미나제 융합 단백질에 융합되고, 다른 닉카제 도메인은 표적 게놈 영역 내 제3 서열에 결합하는 제3 ZFP 도메인에 융합된다. 대안적으로, 2개의 닉카제 도메인은 각각 표적 게놈 영역 내 제3 서열에 결합하는 제3 ZFP 도메인 및 표적 게놈 영역 내 제4 서열에 결합하는 제4 ZFP 도메인에 융합될 수 있다. 특정한 실시양태에서, 제1 및 제2 닉카제 도메인은 FokI로부터 유래된다.
일부 실시양태에서, 염기 편집제 시스템은 시티딘 데아미나제의 억제 성분, 예를 들어 시티딘 데아미나제가 TDD인 독소-유래 데아미나제 억제제 (TDDI)를 추가로 포함한다. 예를 들어, 억제제는 시티딘 데아미나제가 DddA인 DddI 성분일 수 있다. 특정 실시양태에서, 이 시스템은 제3 융합 단백질 또는 세포에서 제3 융합 단백질을 발현시키기 위한 제3 발현 구축물을 포함하며, 여기서 제3 융합 단백질은 i) 표적 게놈 영역 내 제3 서열에 결합하는 ZFP 도메인, 및 ii) 시티딘 데아미나제에 대한 억제 도메인 (예를 들어, 시티딘 데아미나제가 TDD인 TDDI, 예컨대 시티딘 데아미나제가 DddA인 DddI)을 포함하고, 표적 게놈 영역에 대한 제3 융합 단백질의 결합은 억제 도메인과 이량체화된 시티딘 데아미나제 부분의 상호작용, 및 그에 의한 이량체화된 시티딘 데아미나제 부분의 시티딘 데아미나제 활성의 억제를 일으킨다.
억제 도메인-함유 염기 편집제 시스템의 일부 실시양태에서, 시스템은 제3 융합 단백질 또는 세포에서 제3 융합 단백질을 발현시키기 위한 제3 발현 구축물, 및 제4 융합 단백질 또는 세포에서 제4 융합 단백질을 발현시키기 위한 제4 발현 구축물을 포함하며, 여기서 제3 융합 단백질은 i) 표적 게놈 영역 내 제3 서열에 결합하는 ZFP 도메인, 및 ii) 제1 이량체화 도메인을 포함하고; 제4 융합 단백질은 i) 시티딘 데아미나제에 대한 억제 도메인 (예를 들어, 시티딘 데아미나제가 TDD인 TDDI, 예컨대 시티딘 데아미나제가 DddA인 DddI), 및 ii) 이량체화-유도 작용제의 존재 하에 제1 이량체화 도메인과 파트너를 이룰 수 있는 제2 이량체화 도메인을 포함하고; 표적 게놈 영역에 대한 제3 융합 단백질의 결합 및 제3 및 제4 융합 단백질의 이량체화는 이량체화된 시티딘 데아미나제 부분에 대한 억제 도메인의 결합, 및 그에 의한 이량체화된 시티딘 데아미나제 부분의 시티딘 데아미나제 활성의 억제를 일으킨다.
억제 도메인-함유 염기 편집제 시스템의 일부 실시양태에서, 시스템은 제3 융합 단백질 또는 세포에서 제3 융합 단백질을 발현시키기 위한 제3 발현 구축물, 및 제4 융합 단백질 또는 세포에서 제4 융합 단백질을 발현시키기 위한 제4 발현 구축물을 포함하며, 여기서 제3 융합 단백질은 i) 표적 게놈 영역 내 제3 서열에 결합하는 ZFP 도메인, 및 ii) 제1 이량체화 도메인을 포함하고; 제4 융합 단백질은 i) 시티딘 데아미나제에 대한 억제 도메인 (예를 들어, 시티딘 데아미나제가 TDD인 TDDI, 예컨대 시티딘 데아미나제가 DddA인 DddI), 및 ii) 이량체화-억제 작용제의 부재 하에 제1 이량체화 도메인과 파트너를 이룰 수 있는 제2 이량체화 도메인을 포함하고; 표적 게놈 영역에 대한 제3 융합 단백질의 결합, 및 제3 및 제4 융합 단백질의 이량체화는 이량체화된 시티딘 데아미나제 부분에 대한 억제 도메인의 결합, 및 그에 의한 이량체화된 시티딘 데아미나제 부분의 시티딘 데아미나제 활성의 억제를 일으킨다.
특정한 실시양태에서, 본원에 기재된 염기 편집제 시스템은 본원에 기재된 닉카제 성분 및 억제 도메인 성분 둘 다를 포함한다.
본원에 기재된 융합 단백질에 사용된 임의의 ZFP 도메인은 독립적으로 2, 3, 4, 5, 6, 7, 또는 8개의 아연 핑거를 가질 수 있다.
일부 실시양태에서, 본 발명의 염기 편집제 시스템의 단백질 성분은 발현 카세트 또는 구축물에 의해 세포에 제공된다. 이러한 카세트 또는 구축물은 동일한 또는 별개의 발현 벡터, 예컨대 바이러스 벡터 상에서 세포에 제공될 수 있다. 바이러스 벡터는, 예를 들어 아데노-관련 바이러스 (AAV) 벡터, 아데노바이러스 벡터 또는 렌티바이러스 벡터일 수 있다.
본원에 기재된 염기 편집제 시스템의 일부 실시양태에서, 시티딘 데아미나제는 TDD이다. 특정 실시양태에서, TDD는 서열식별번호: 72 (DddA)의 아미노산 서열, 또는 상기 서열을 포함하는 TDD의 독성 도메인 (예를 들어, 서열식별번호: 49 또는 81의 독성 도메인)을 포함한다. 일부 실시양태에서, 시티딘 데아미나제는 서열식별번호: 49 또는 81의 아미노산 서열에 대해 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 92%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하는 TDD이다. 특정 실시양태에서, 제1 DddA 부분은 서열식별번호: 72의 아미노산 1264-1333, 1264-1397, 1264-1404, 1264-1407, 또는 그의 단편, 아미노산 1264-1427을 포함하고; 제2 DddA 부분은 서열식별번호: 72의 상기 아미노산의 나머지 또는 그의 단편을 포함하거나; 또는 그 반대로 포함하고; 여기서 두 부분은 기능적 시티딘 데아미나제를 형성한다. 특정 실시양태에서, 제1 DddA 부분은 서열식별번호: 72의 아미노산 1290-1333, 1290-1397, 1290-1404, 1290-1407, 또는 그의 단편, 아미노산 1290-1427을 포함하고; 제2 DddA 부분은 서열식별번호: 72의 상기 아미노산의 나머지 또는 그의 단편을 포함하거나; 또는 그 반대로 포함하고; 여기서 두 부분은 기능적 시티딘 데아미나제를 형성한다. 일부 실시양태에서, 제1 및 제2 DddA 부분은 각각 서열식별번호: 82 및 83, 서열식별번호: 84 및 85, 서열식별번호: 18 및 19, 서열식별번호: 51 및 52, 또는 서열식별번호: 53 및 54를 포함하거나; 또는 그 반대로 포함한다.
본원에 기재된 염기 편집제 시스템의 일부 실시양태에서, 시티딘 데아미나제는 서열식별번호: 72의 Y1307, T1311, S1331, V1346, H1366, N1367, N1368, P1369, E1370, G1371, T1372, F1375, V1392, P1394, P1395, I1399, P1400, V1401, K1402, A1405, 및 T1406으로부터 선택된 1개 이상의 잔기에 돌연변이를 갖는 DddA이다.
본원에 기재된 염기 편집제 시스템의 일부 실시양태에서, 시티딘 데아미나제는 서열식별번호: 86-91 및 117-129 중 어느 하나의 아미노산 서열을 포함하는 TDD이다. 특정 실시양태에서, 시티딘 데아미나제는 서열식별번호: 86-91 및 117-129 중 어느 하나의 아미노산 서열을 포함하는 TDD의 독성 도메인을 포함한다. 특정 실시양태에서, TDD는 서열식별번호: 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열에 대해 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 92%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열을 포함한다. 특정한 실시양태에서, 시티딘 데아미나제는 서열식별번호: 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함하는 TDD이다. 특정한 실시양태에서, 제1 및 제2 시티딘 데아미나제 부분은 각각 서열식별번호: 93 및 94, 서열식별번호: 96 및 97, 서열식별번호: 99 및 100, 서열식별번호: 102 및 103, 서열식별번호: 105 및 106, 서열식별번호: 108 및 109, 서열식별번호: 130 및 131, 서열식별번호: 132 및 133, 서열식별번호: 135 및 136, 서열식별번호: 137 및 138, 서열식별번호: 139 및 140, 서열식별번호: 141 및 142, 서열식별번호: 144 및 145, 서열식별번호: 146 및 147, 서열식별번호: 148 및 149, 서열식별번호: 150 및 151, 서열식별번호: 153 및 154, 서열식별번호: 155 및 156, 서열식별번호: 158 및 159, 서열식별번호: 160 및 161, 서열식별번호: 163 및 164, 서열식별번호: 165 및 166, 서열식별번호: 168 및 169, 서열식별번호: 170 및 171, 서열식별번호: 173 및 174, 서열식별번호: 175 및 176, 서열식별번호: 178 및 179, 서열식별번호: 180 및 181, 서열식별번호: 182 및 183, 서열식별번호: 185 및 186, 서열식별번호: 187 및 188, 서열식별번호: 190 및 191, 서열식별번호: 192 및 193, 서열식별번호: 195 및 196, 서열식별번호: 197 및 198, 서열식별번호: 200 및 201, 서열식별번호: 202 및 203, 서열식별번호: 205 및 206, 서열식별번호: 207 및 208, 서열식별번호: 210 및 211, 서열식별번호: 212 및 213, 서열식별번호: 215 및 216, 서열식별번호: 217 및 218, 서열식별번호: 220 및 221, 또는 서열식별번호: 222 및 223을 포함하거나; 또는 그 반대로 포함한다.
관련 측면에서, 본 개시내용은 또한 i) 유전자 (진핵, 예를 들어 인간 유전자일 수 있음)에 결합하는 아연 핑거 단백질 (ZFP) 도메인 및 ii) 시티딘 데아미나제 폴리펩티드 또는 그의 단편을 포함하는 융합 단백질을 제공하며, 예를 들어 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 TDD이고, 임의로 여기서 ZFP 도메인 및 시티딘 데아미나제 또는 그의 단편은 펩티드 링커에 의해 연결된다. 일부 실시양태에서, TDD는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함한다.
관련 측면에서, 본 개시내용은 i) 유전자 (진핵, 예를 들어 인간 유전자일 수 있음)에 결합하는 아연 핑거 단백질 (ZFP) 도메인, 및 ii) 시티딘 데아미나제 억제 도메인을 포함하는 융합 단백질을 제공하며, 예를 들어 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 TDD이고, 임의로 여기서 ZFP 도메인 및 억제 도메인은 펩티드 링커에 의해 연결된다. 일부 실시양태에서, 시티딘 데아미나제 억제 도메인은 TDDI, 예컨대 DddI이며, 여기서 시티딘 데아미나제는 DddA이다. 일부 실시양태에서, TDD는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함한다.
관련 측면에서, 본 개시내용은 i) 유전자 (진핵, 예를 들어 인간 유전자일 수 있음)에 결합하는 아연 핑거 단백질 (ZFP) 도메인, 및 ii) 닉카제 또는 그의 단편을 포함하는 융합 단백질을 제공하며, 임의로 여기서 ZFP 도메인 및 닉카제 또는 그의 단편은 펩티드 링커에 의해 연결된다.
한 측면에서, 본 개시내용은 a) i) 유전자 (진핵, 예를 들어 인간 유전자일 수 있음)에 결합하는 아연 핑거 단백질 (ZFP) 도메인, 및 ii) 제1 이량체화 도메인을 포함하는 제1 융합 단백질, 및 b) i) 시티딘 데아미나제 억제 도메인 (예를 들어, 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 TDD임), 및 ii) 제2 이량체화 도메인을 포함하는 제2 융합 단백질을 포함하는 융합 단백질의 쌍을 제공하며, 여기서 제1 및 제2 이량체화 도메인은 이량체화-유도 작용제의 존재 하에 이량체화될 수 있다. 일부 실시양태에서, 시티딘 데아미나제 억제 도메인은 TDDI, 예컨대 DddI이며, 여기서 시티딘 데아미나제는 DddA이다. 일부 실시양태에서, TDD는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함한다.
또 다른 측면에서, 본 개시내용은 a) i) 유전자 (진핵, 예를 들어 인간 유전자일 수 있음)에 결합하는 아연 핑거 단백질 (ZFP) 도메인, 및 ii) 제1 이량체화 도메인을 포함하는 제1 융합 단백질, 및 b) i) 시티딘 데아미나제 억제 도메인 (예를 들어, 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 TDD임), 및 ii) 제2 이량체화 도메인을 포함하는 제2 융합 단백질을 포함하는 융합 단백질의 쌍을 제공하며, 여기서 제1 및 제2 이량체화 도메인은 이량체화-억제 작용제의 부재 하에 이량체화될 수 있다. 일부 실시양태에서, 시티딘 데아미나제 억제 도메인은 TDDI, 예컨대 DddI이며, 여기서 시티딘 데아미나제는 DddA이다. 일부 실시양태에서, TDD는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함한다.
한 측면에서, 본 개시내용은 본원에 기재된 융합 단백질(들)을 코딩하는 1개 이상의 핵산 분자, 뿐만 아니라 핵산 분자(들)를 포함하는 발현 구축물 및 발현 구축물(들)을 포함하는 바이러스 벡터를 제공하며, 임의로 여기서 바이러스 벡터는 아데노-관련 바이러스 벡터, 아데노바이러스 벡터 또는 렌티바이러스 벡터일 수 있다. 또한, 본원에 기재된 바와 같은 염기 편집제 시스템, 본원에 기재된 바와 같은 융합 단백질(들), 본원에 기재된 바와 같은 단리된 핵산 분자(들), 본원에 기재된 바와 같은 발현 구축물(들), 또는 본원에 기재된 바와 같은 바이러스 벡터(들)를 포함하는 세포 (이는 진핵 세포, 예를 들어 포유동물 세포 또는 식물 세포일 수 있음)가 제공된다. 일부 실시양태에서, 포유동물 세포는 인간 세포, 예컨대 인간 배아 줄기 또는 인간 유도된 만능 줄기 세포이다.
일부 측면에서, 본 개시내용은 본원에 기재된 바와 같은 염기 편집제 시스템을 세포 (진핵 세포, 예를 들어 포유동물 또는 식물 세포일 수 있음)에 전달하는 것을 포함하는, 상기 세포 내 표적 게놈 영역에서 시토신을 티민으로 변화시키는 방법을 제공한다. 일부 실시양태에서, 시토신의 티민으로의 변화는 표적 게놈 영역에 정지 코돈을 생성한다. 시스템의 멀티플렉스 포맷은 1개 초과의 게놈 영역 (예를 들어, 2, 3, 4, 또는 5개의 게놈 영역)을 표적화할 수 있다. 편집은 생체내, 생체외 또는 시험관내에서 수행될 수 있다.
또한, 본 발명의 편집 방법에 의해 수득된 유전자 조작된 세포 (이는 진핵 세포, 예를 들어 포유동물 세포, 예컨대 인간 iPSC 또는 식물 세포일 수 있음)가 제공된다.
세포 및 제약상 허용되는 담체를 포함하는 제약 조성물을 비롯한 본원에 기재된 조작된 세포 (예를 들어, 조작된 인간 세포)는 그를 필요로 하는 환자 (예를 들어, 그를 필요로 하는 인간 환자)를 치료하는 데 사용될 수 있거나, 또는 그를 필요로 하는 환자를 치료하기 위한 의약의 제조에 사용될 수 있다. 일부 실시양태에서, 환자는 암, 자가면역 장애, 상염색체 우성 질환 또는 미토콘드리아 장애를 갖는다. 일부 실시양태에서, 환자는 겸상 적혈구 질환, 혈우병, 낭성 섬유증, 페닐케톤뇨증, 테이-삭스병, 프리온 질환, 색맹, 리소솜 축적 질환, 프리드라이히 운동실조 또는 전립선암을 갖는다. 세포를 포함하는 키트 및 제조 물품이 또한 고려된다.
본 발명의 다른 특징, 목적 및 이점은 하기 상세한 설명에서 명백하다. 그러나, 상세한 설명은 본 발명의 실시양태 및 측면을 나타내지만, 제한이 아니라 단지 예시로서 주어지는 것으로 이해되어야 한다. 본 발명의 범주 내에서의 다양한 변화 및 변형은 상세한 설명으로부터 관련 기술분야의 통상의 기술자에게 명백해질 것이다.
도 1은 C에서 T로의 염기 편집을 위한 ZFP-TDD 융합 단백질의 쌍을 예시하는 개략도이다. 직사각형은 융합 단백질의 ZFP 도메인 내의 DNA-결합 아연 핑거를 나타낸다. 밑줄친 C 뉴클레오티드 위의 화살표 형상은 융합 단백질의 이량체화된 TDD 도메인을 나타낸다. 아연 핑거 도메인과 TDD 도메인 사이의 흑색 선은 펩티드 링커를 나타낸다.
도 2a는 CCR5-표적화 ZFP-TDD 융합 단백질 쌍에 대한 ZFP 설계를 나타내는 개략도이다. C9, C10, C18, 및 C24는 염기 편집을 위한 표적 뉴클레오티드이다. 상부 가닥 (좌측에서 우측으로): 서열식별번호: 227. 하부 가닥 (우측에서 좌측으로): 서열식별번호: 228.
도 2b는 이량체화된 ZFP-DddA 쌍에 대한 구축물 설계의 예를 나타내는 개략도이다. FLAG: FLAG 태그. NLS: 핵 국재화 서열. UGI: 우라실 DNA 글리코실라제 억제제.
도 3은 일련의 ZFP-DddA 융합 단백질 쌍에 의한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다. L0, L7A, 및 L26은 융합 단백질 내에서 DddA 도메인을 ZFP 도메인의 C-말단에 융합시키는 데 사용된 펩티드 링커를 나타낸다.
도 4는 일련의 ZFP-DddA 융합 단백질 쌍에 의한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이며, 여기서 DddA 분할은 상이한 위치에서 발생한다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다.
도 5는 CCR5-표적화 ZFP-TDD 융합 단백질에 대한 ZFP 설계를 나타내는 개략도이다. C9, C10, C18, 및 C24는 염기 편집을 위한 표적 뉴클레오티드이다. 위에서 아래로: 서열식별번호: 229 (좌측에서 우측으로), 서열식별번호: 230 (우측에서 좌측으로), 서열식별번호: 231 (좌측에서 우측으로), 서열식별번호: 232 (우측에서 좌측으로), 서열식별번호: 233 (좌측에서 우측으로), 및 서열식별번호: 234 (우측에서 좌측으로).
도 6a-6c는 나타낸 DddA 돌연변이를 갖는 일련의 ZFP-DddA 융합 단백질 쌍에 의한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 돌연변이는 서열식별번호: 72에 대해 넘버링된다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다.
도 7a는 염기 편집 효율을 증가시키기 위한 ZFP-TDD 염기 편집 시스템 및 닉카제 시스템의 조합 사용을 예시하는 개략도이다. 본원에 나타낸 닉카제 시스템은 CRISPR/Cas-기반 닉카제 시스템이다. 예시적인 유전자좌는 인간 CCR5 유전자좌이다. 상부 가닥 (좌측에서 우측으로): 서열식별번호: 235. 하부 가닥 (우측에서 좌측으로): 서열식별번호: 236.
도 7b는 도 7a의 접근법을 사용한 인간 CCR5 유전자좌에서의 DddA C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다.
도 8은 ZFP-TDD 염기 편집 시스템 및 CRISPR/Cas-기반 닉카제 시스템의 조합 사용을 예시하는 개략도이다.
도 9는 삼량체 ZFP-TDD + FokI 닉카제 염기 편집 시스템의 예를 예시하는 개략도이다.
도 10은 CCR5-표적화 ZFP-TDD 융합 단백질 쌍과 ZFP-닉카제의 조합 사용을 위한 ZFP 설계를 나타내는 개략도이다. C9, C10, C18, 및 C24는 염기 편집을 위한 표적 뉴클레오티드이다. 상부 가닥 (좌측에서 우측으로): 서열식별번호: 237. 하부 가닥 (우측에서 좌측으로): 서열식별번호: 238.
도 11은 도 10의 접근법을 사용한 인간 CCR5 유전자좌에서의 DddA C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다.
도 12는 일련의 ZFP-TDD 융합 단백질 쌍에 의한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다. O1: TDD1; O2: TDD2; O3: TDD3; O4: TDD4; O5: TDD5; O6: TDD6.
도 13은 TDD1-TDD6과의 ZFP 융합 단백질 쌍에 의한 CCR5 염기 편집 윈도우에서 임의의 C에 대한 C에서 T로의 염기 편집의 최고 빈도의 열지도 결과를 나타내는 표이다. O1: TDD1; O2: TDD2; O3: TDD3; O4: TDD4; O5: TDD5; O6: TDD6.
도 14는 TDD1-TDD6과의 ZFP 융합 단백질 쌍에 의한 CCR5 염기 편집 윈도우에서 임의의 C에 대한 C에서 T로의 염기 편집의 최고 빈도의 열지도 결과를 나타내는 표이다. O1: TDD1; O2: TDD2; O3: TDD3; O4: TDD4; O5: TDD5; O6: TDD6.
도 15는 CIITA-표적화 ZFP-TDD 융합 단백질 쌍에 대한 ZFP 설계를 나타내는 개략도이다. G2, G5, C6, C8, G10, G11, G14, C15, 및 C16은 염기 편집을 위한 표적 뉴클레오티드이다. 상부 가닥 (좌측에서 우측으로): 서열식별번호: 239. 하부 가닥 (우측에서 좌측으로): 서열식별번호: 240.
도 16은 일련의 ZFP-TDD 융합 단백질 쌍에 의한 인간 CIITA 유전자좌 ("부위 2")에서의 C에서 T로의 염기 편집의 최고 빈도의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다. O1: TDD1; O14: TDD14 등.
도 17은 CIITA 염기 편집 윈도우에서의 임의의 C (밑줄표시됨)에 대한 C에서 T로의 염기 편집의 최고 빈도 및 DddA, TDD4, TDD6, TDD9, TDD10, TDD14, TDD15 및 TDD18에 대한 그의 서열 모티프의 열지도 결과를 나타내는 표이다. 앰플리콘: 서열식별번호: 244. O4: TDD4; O6: TDD6; 등.
도 18은 TDD6 또는 TDD14와의 ZFP 융합 단백질 쌍에 의한 인간 CIITA 유전자좌 ("부위 2")에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. L26, L21, L18, L13, L11, L9, L6, 및 L4는 융합 단백질 내에서 TDD6 또는 TDD14 도메인을 ZFP 도메인의 C-말단에 융합시키는 데 사용된 펩티드 링커를 나타낸다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다. O6: TDD6; O14: TDD14.
도 19는 표적화된 ZFP-TDDI를 사용한 TDD의 억제를 위한 설계를 예시하는 개략도이다.
도 2a는 CCR5-표적화 ZFP-TDD 융합 단백질 쌍에 대한 ZFP 설계를 나타내는 개략도이다. C9, C10, C18, 및 C24는 염기 편집을 위한 표적 뉴클레오티드이다. 상부 가닥 (좌측에서 우측으로): 서열식별번호: 227. 하부 가닥 (우측에서 좌측으로): 서열식별번호: 228.
도 2b는 이량체화된 ZFP-DddA 쌍에 대한 구축물 설계의 예를 나타내는 개략도이다. FLAG: FLAG 태그. NLS: 핵 국재화 서열. UGI: 우라실 DNA 글리코실라제 억제제.
도 3은 일련의 ZFP-DddA 융합 단백질 쌍에 의한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다. L0, L7A, 및 L26은 융합 단백질 내에서 DddA 도메인을 ZFP 도메인의 C-말단에 융합시키는 데 사용된 펩티드 링커를 나타낸다.
도 4는 일련의 ZFP-DddA 융합 단백질 쌍에 의한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이며, 여기서 DddA 분할은 상이한 위치에서 발생한다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다.
도 5는 CCR5-표적화 ZFP-TDD 융합 단백질에 대한 ZFP 설계를 나타내는 개략도이다. C9, C10, C18, 및 C24는 염기 편집을 위한 표적 뉴클레오티드이다. 위에서 아래로: 서열식별번호: 229 (좌측에서 우측으로), 서열식별번호: 230 (우측에서 좌측으로), 서열식별번호: 231 (좌측에서 우측으로), 서열식별번호: 232 (우측에서 좌측으로), 서열식별번호: 233 (좌측에서 우측으로), 및 서열식별번호: 234 (우측에서 좌측으로).
도 6a-6c는 나타낸 DddA 돌연변이를 갖는 일련의 ZFP-DddA 융합 단백질 쌍에 의한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 돌연변이는 서열식별번호: 72에 대해 넘버링된다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다.
도 7a는 염기 편집 효율을 증가시키기 위한 ZFP-TDD 염기 편집 시스템 및 닉카제 시스템의 조합 사용을 예시하는 개략도이다. 본원에 나타낸 닉카제 시스템은 CRISPR/Cas-기반 닉카제 시스템이다. 예시적인 유전자좌는 인간 CCR5 유전자좌이다. 상부 가닥 (좌측에서 우측으로): 서열식별번호: 235. 하부 가닥 (우측에서 좌측으로): 서열식별번호: 236.
도 7b는 도 7a의 접근법을 사용한 인간 CCR5 유전자좌에서의 DddA C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다.
도 8은 ZFP-TDD 염기 편집 시스템 및 CRISPR/Cas-기반 닉카제 시스템의 조합 사용을 예시하는 개략도이다.
도 9는 삼량체 ZFP-TDD + FokI 닉카제 염기 편집 시스템의 예를 예시하는 개략도이다.
도 10은 CCR5-표적화 ZFP-TDD 융합 단백질 쌍과 ZFP-닉카제의 조합 사용을 위한 ZFP 설계를 나타내는 개략도이다. C9, C10, C18, 및 C24는 염기 편집을 위한 표적 뉴클레오티드이다. 상부 가닥 (좌측에서 우측으로): 서열식별번호: 237. 하부 가닥 (우측에서 좌측으로): 서열식별번호: 238.
도 11은 도 10의 접근법을 사용한 인간 CCR5 유전자좌에서의 DddA C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다.
도 12는 일련의 ZFP-TDD 융합 단백질 쌍에 의한 인간 CCR5 유전자좌에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다. O1: TDD1; O2: TDD2; O3: TDD3; O4: TDD4; O5: TDD5; O6: TDD6.
도 13은 TDD1-TDD6과의 ZFP 융합 단백질 쌍에 의한 CCR5 염기 편집 윈도우에서 임의의 C에 대한 C에서 T로의 염기 편집의 최고 빈도의 열지도 결과를 나타내는 표이다. O1: TDD1; O2: TDD2; O3: TDD3; O4: TDD4; O5: TDD5; O6: TDD6.
도 14는 TDD1-TDD6과의 ZFP 융합 단백질 쌍에 의한 CCR5 염기 편집 윈도우에서 임의의 C에 대한 C에서 T로의 염기 편집의 최고 빈도의 열지도 결과를 나타내는 표이다. O1: TDD1; O2: TDD2; O3: TDD3; O4: TDD4; O5: TDD5; O6: TDD6.
도 15는 CIITA-표적화 ZFP-TDD 융합 단백질 쌍에 대한 ZFP 설계를 나타내는 개략도이다. G2, G5, C6, C8, G10, G11, G14, C15, 및 C16은 염기 편집을 위한 표적 뉴클레오티드이다. 상부 가닥 (좌측에서 우측으로): 서열식별번호: 239. 하부 가닥 (우측에서 좌측으로): 서열식별번호: 240.
도 16은 일련의 ZFP-TDD 융합 단백질 쌍에 의한 인간 CIITA 유전자좌 ("부위 2")에서의 C에서 T로의 염기 편집의 최고 빈도의 열지도 결과를 나타내는 표이다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다. O1: TDD1; O14: TDD14 등.
도 17은 CIITA 염기 편집 윈도우에서의 임의의 C (밑줄표시됨)에 대한 C에서 T로의 염기 편집의 최고 빈도 및 DddA, TDD4, TDD6, TDD9, TDD10, TDD14, TDD15 및 TDD18에 대한 그의 서열 모티프의 열지도 결과를 나타내는 표이다. 앰플리콘: 서열식별번호: 244. O4: TDD4; O6: TDD6; 등.
도 18은 TDD6 또는 TDD14와의 ZFP 융합 단백질 쌍에 의한 인간 CIITA 유전자좌 ("부위 2")에서의 C에서 T로의 염기 편집의 열지도 결과를 나타내는 표이다. L26, L21, L18, L13, L11, L9, L6, 및 L4는 융합 단백질 내에서 TDD6 또는 TDD14 도메인을 ZFP 도메인의 C-말단에 융합시키는 데 사용된 펩티드 링커를 나타낸다. 편집 활성의 정도는 셀 내 음영의 어두움에 상응한다. O6: TDD6; O14: TDD14.
도 19는 표적화된 ZFP-TDDI를 사용한 TDD의 억제를 위한 설계를 예시하는 개략도이다.
본 개시내용은 세포 DNA, 예컨대 게놈 DNA에서, 예를 들어 시토신 (C)에서 티민 (T)으로의 염기 편집을 위한 시스템 및 방법을 제공한다. 시스템은 ZFP-독소-유래 데아미나제 (TDD) 융합 단백질 (ZFP-TDD)의 사용을 수반한다. 세포 상황에서 정확한 유전자 편집을 제공함으로써, 본 발명의 시스템 및 방법은 수많은 질환의 예방 및/또는 치료에 사용될 수 있다. 이들 시스템 및 방법은 다중 인간 유전자의 동시 녹-아웃을 필요로 하는 세포-기반 요법에 특히 유용할 것으로 고려된다.
본 발명의 시스템 및 방법은 표적화된 C:G 염기 쌍을 T:A 염기 쌍으로 전환시킬 수 있다. 일부 실시양태에서, 염기 편집 시스템은 또한 전환의 안정성을 증가시키는 단백질 (예를 들어, UGI), 및/또는 편집된 영역에서의 DNA 복구를 자극하고 대향하는 가닥 상의 G 뉴클레오티드의 A로의 교정을 촉진하여 편집된 T:A 염기 쌍을 형성하도록 표적화된 염기 근처의 DNA를 닉킹하는 엔도뉴클레아제를 포함할 수 있다.
본 발명의 시스템 및 방법은 부분적으로 융합 단백질 내의 ZFP 도메인의 소형 크기로 인해 유리하다. 비교하면, TALE의 큰 물리적 크기 및 긴 C-말단 TALE 링커는 염기 편집 윈도우가 얼마나 작을 수 있는지를 제한할 뿐만 아니라 설계 밀도도 제한할 수 있다. 조작된 TALE의 크기 및 고도로 반복적인 성질은 또한 통상의 바이러스 벡터를 사용하여 인간 세포에 TALE-기반 염기 편집제를 전달하는 것을 어렵게 만든다. 본 발명의 ZFP-유래 염기 편집 시스템은 이들 문제를 피한다. 예를 들어, 이들 ZFP-유래 시스템의 소형 크기는 TALE 염기 편집제 시스템 (예를 들어, TALE-TDD) 또는 CRISPR/Cas 염기 편집제 시스템과 대조적으로 단일 AAV 벡터 내의 패키징을 허용할 수 있다. 또한, 본원의 융합 단백질의 작은 크기로 인해, 편집된 염기 근처에서 DNA 닉의 생성을 가능하게 하고, 그에 의해 DNA 복구 기구가 편집된 C에 대향하는 염기를 G에서 상응하는 A로 변화시켜 정확한 T:A 염기 쌍을 형성하는 것을 용이하게 하도록 편집 시스템에 닉카제를 포함하는 것이 가능하다. 닉카제의 포함은 염기 편집 효율을 크게 증가시킬 수 있다.
I. 아연-핑거 융합 단백질
염기 편집제 도메인 (예를 들어, 시티딘 데아미나제 도메인, 이는 본원에 기재된 것과 같은 TDD일 수 있음), 시티딘 데아미나제 억제제 (예를 들어, TDDI, 예컨대 시티딘 데아미나제가 DddA인 DddI) 도메인, 및/또는 닉카제 도메인 (예를 들어, FokI 도메인)에 융합된 DNA-결합 아연 핑거 단백질 (ZFP) 도메인을 함유하는 융합 단백질이 제공된다. 본원에 사용된 "융합 단백질"은 이종 기능적 도메인 (즉, 자연에서 동일한 단백질에 자연적으로 존재하지 않는 기능적 도메인)이 공유 연결된 (예를 들어, 펩티딜 결합을 통해) 폴리펩티드를 지칭한다. 재조합적으로 제조될 수 있는 이들 융합 단백질은 본 발명의 염기 편집제 시스템의 성분이다. 일부 실시양태에서, 본원의 ZFP 융합 단백질은 시티딘 데아미나제 도메인 (예를 들어, 본원에 기재된 바와 같은 TDD로부터 유래됨) 및 추가로 닉카제 도메인 및/또는 UGI 도메인을 포함한다.
본 시스템의 다른 포맷이 또한 본원에서 고려된다. 예를 들어, 펩티딜 연결 대신, 2개의 기능적 도메인이 비공유 결합에 의해 합쳐질 수 있다. 일부 실시양태에서, 2개의 기능적 도메인 (예를 들어, ZFP 도메인 및 시티딘 데아미나제 억제제 도메인; 또는 ZFP 도메인 및 닉카제 도메인)은 각각 이량체화 파트너 (예를 들어, 류신 지퍼 및 본원에 추가로 기재된 것)에 융합되어, 2개의 기능적 도메인이 이량체화 파트너의 상호작용을 통해 합쳐지도록 한다. 특정 실시양태에서, 이들 도메인의 이량체화는 특정 작용제 (예를 들어, 소분자 또는 펩티드)의 존재 또는 부재에 의해 제어될 수 있다. 이러한 포맷은 본 발명의 임의의 측면에서 융합 단백질을 대체할 수 있는 것으로 고려된다.
본 발명의 염기 편집제 시스템의 각각의 성분은 하기에 상세하게 추가로 기재된다.
A. 염기 편집제
본 개시내용의 ZFP-시티딘 데아미나제 융합 단백질은 ZFP 도메인에 추가로 시티딘 데아미나제 도메인을 포함한다. 본원에 사용된 용어 "데아미나제" 또는 "데아미나제 도메인"은 탈아미노화 반응을 촉매하는 단백질을 지칭한다. 시티딘 데아미나제 도메인은, 예를 들어 시토신의 우라실로의 탈아미노화를 촉매할 수 있으며, 여기서 우라실은 DNA 복제 또는 복구 동안 티민 염기에 의해 대체된다. 데아미나제 도메인은 자연-발생일 수 있거나 또는 조작될 수 있다. 일부 실시양태에서, 본 개시내용의 시티딘 데아미나제는 이중-가닥 DNA 상에서 작동한다.
일부 실시양태에서, 시티딘 데아미나제는, 예를 들어 원핵 또는 진핵 유기체로부터의 것일 수 있는 독소로부터 유래된다. 특정 실시양태에서, 유기체는 박테리아 또는 진균일 수 있다. 이러한 시티딘 데아미나제는 본원에서 독소-유래 데아미나제 (TDD)로 지칭된다. DddA 및 DddA 오르토로그는 TDD이다. 본원에 사용된 독소"로부터 유래된" 시티딘 데아미나제는 자연 발생 독소와 동일하거나 또는 데아미나제 활성을 보유하는 독소의 변형된 버전인 시티딘 데아미나제를 지칭할 수 있다.
일부 실시양태에서, 시티딘 데아미나제는 DddA (서열식별번호: 72)이다. 특정 실시양태에서, 시티딘 데아미나제는 DddA의 독성 도메인 (예를 들어, 아미노산 1290-1427 (서열식별번호: 49) 또는 1264-1427 (서열식별번호: 81))을 포함하고, 융합 단백질은 ZFP-DddA로 명명된다. 부르크홀데리아 세노세파시아로부터 유래된 DddA 단백질의 예시적인 전체 서열을 하기에 나타낸다:
본원에 사용되고 달리 명시되지 않는 한, 용어 "DddA"는 DddA 독성 도메인을 지칭한다.
특정 실시양태에서, 시티딘 데아미나제는 DddA의 "재연결(re-wired)" 버전 (예를 들어, 서열식별번호: 50)이다.
본 개시내용은 또한 뉴클레오티드 포켓을 형성하는 잔기 (예를 들어, Y1307, T1311, S1331, V1346, H1366, N1367, N1368, P1369, E1370, G1371, T1372, F1375, V1392, P1394, P1395, I1399, P1400, V1401, K1402, A1405, T1406, 또는 그의 임의의 조합, 여기서 잔기의 넘버링은 서열식별번호: 72에 대한 것임)에서 돌연변이된 DddA의 변이체를 제공한다. DddA는, 예를 들어 상기 잔기 중 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 또는 22개에서 돌연변이될 수 있다. 일부 실시양태에서, DddA는 잔기 E1370, N1368, Y1307, T1311, S1331, K1402, 또는 그의 임의의 조합에서 돌연변이된다. 특정 실시양태에서, DddA는 잔기 E1370, N1368, Y1307, 또는 그의 임의의 조합에서 돌연변이된다. 특정 실시양태에서, 돌연변이(들)는 DddA 효율을 증가시키거나, DddA 활성을 증가시키거나, DddA 활성 윈도우를 변화시키거나, 또는 그의 임의의 조합일 수 있다. 이러한 변이체가 본 발명의 임의의 측면에서 야생형 DddA를 대체할 수 있는 것으로 고려된다.
특정한 실시양태에서, 시티딘 데아미나제 도메인 (예를 들어, 본원에 기재된 TDD로부터 유래됨)은 시티딘 데아미나제 활성이 단독으로는 결여되지만 이량체화되어 활성 시티딘 데아미나제를 형성하는 제1 및 제2 "절반 도메인" 또는 "분할"로 구성된 "분할 효소"이다. 본원에 사용된 "불활성" 또는 "시티딘 데아미나제 활성이 결여된" 절반 도메인은 i) 임의의 시티딘 데아미나제 활성 (예를 들어, 임의의 검출가능한 시티딘 데아미나제 활성)이 결여되거나, ii) 특이적 시티딘 데아미나제 활성이 결여되거나, 또는 iii) 유의한 시티딘 데아미나제 활성 (즉, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 또는 10% 또는 그 초과의 온-타겟 염기 편집 활성, 특정한 실시양태에서 10% 또는 그 초과일 수 있음)이 결여된 절반 도메인일 수 있다. 예를 들어, 활성 시티딘 데아미나제의 어셈블리는, 절반 도메인이 기능적 시티딘 데아미나제의 어셈블리가 가능하게 위치하도록 절반 도메인-연결된 아연 핑거 단백질을 서로 근접한 DNA 표적에 결합시킴으로써 구동될 수 있다.
본원에 기재된 "절반 도메인" 쌍은 시티딘 데아미나제 활성이 개별적으로는 결여되어 있지만 함께 기능적 시티딘 데아미나제 도메인 (야생형 또는 본원에 논의된 변이체)을 형성하는 시티딘 데아미나제 폴리펩티드 서열의 임의의 쌍을 지칭할 수 있는 것으로 이해된다. 시티딘 데아미나제가 DddA인 경우, DddA 서열에서의 "분할"은 임의의 다수의 위치에서, 예컨대 예를 들어 G1322, G1333, A1343, N1357, G1371, N1387, E1396, G1397, A1398, I1399, P1400, V1401, K1402, R1403, G1404, A1405, T1406, G1407 또는 E1408에서 발생할 수 있고, 단백질의 중간에 있을 필요는 없다. 일부 실시양태에서, "분할"은 G1322, G1333, A1343, N1357, G1371, N1387, G1397, G1404 또는 G1407에서 발생한다. 특정 실시양태에서, "분할"은 G1404, G1407, G1333 또는 G1397에서 발생한다. 특정한 실시양태에서, "분할"은 G1404 또는 G1407에서 발생한다. 일부 실시양태에서, DddA 절반 도메인 쌍은 하기의 아미노산 서열을 포함할 수 있다:
a) 서열식별번호: 82 및 83;
b) 서열식별번호: 84 및 85;
c) 서열식별번호: 18 및 19;
d) 서열식별번호: 51 및 52; 또는
e) 서열식별번호: 53 및 54.
특정 실시양태에서, TDD는, 예를 들어 NCBI 수탁 번호 WP_069977532.1 ("TDD1", 서열식별번호: 86), WP_021798742.1 ("TDD2" 서열식별번호: 87), QNM04114 ("TDD3" 서열식별번호: 88), WP_181981612 ("TDD4", 서열식별번호: 89), AXI73669.1 ("TDD5", 서열식별번호: 90), WP_195441564 ("TDD6", 서열식별번호: 91), AVT32940.1 ("TDD7", 서열식별번호: 117), WP_189594293.1 ("TDD8", 서열식별번호: 118), TCP42004.1 ("TDD9", 서열식별번호: 119), WP_171906854.1 ("TDD10", 서열식별번호: 120), WP_174422267.1 ("TDD11", 서열식별번호: 121), WP_059728184.1 ("TDD12", 서열식별번호: 122), WP_133186147.1 ("TDD13", 서열식별번호: 123), WP_083941146.1 ("TDD14", 서열식별번호: 124), WP_082507154.1 ("TDD15", 서열식별번호: 125), WP_044236021.1 ("TDD16", 서열식별번호: 126), WP_165374601.1 ("TDD17", 서열식별번호: 127), NLI59004.1 ("TDD18", 서열식별번호: 128) 또는 KAB8140648.1 ("TDD19", 서열식별번호: 129) 하의 아미노산 서열, 또는 시티딘 데아미나제 활성이 가능한 상기 아미노산 서열의 일부 (예를 들어, "독성 도메인")를 포함할 수 있다. 이들 아미노산 서열을 하기에 나타낸다:
NCBI 수탁 번호 WP_069977532.1 (TDD1)
NCBI 수탁 번호 WP_021798742.1 (TDD2)
NCBI 수탁 번호 QNM04114.1 (TDD3)
NCBI 수탁 번호 WP_181981612 (TDD4)
NCBI 수탁 번호 AXI73669.1 (TDD5)
NCBI 수탁 번호 WP_195441564 (TDD6)
NCBI 수탁 번호 AVT32940.1 (TDD7)
NCBI 수탁 번호 WP_189594293.1 (TDD8)
NCBI 수탁 번호 TCP42004.1 (TDD9)
NCBI 수탁 번호 WP_171906854.1 (TDD10)
NCBI 수탁 번호 WP_174422267.1 (TDD11)
NCBI 수탁 번호 WP_059728184.1 (TDD12)
NCBI 수탁 번호 WP_133186147.1 (TDD13)
NCBI 수탁 번호 WP_083941146.1 (TDD14)
NCBI 수탁 번호 WP_082507154.1 (TDD15)
NCBI 수탁 번호 WP_044236021.1 (TDD16)
NCBI 수탁 번호 WP_165374601.1 (TDD17)
NCBI 수탁 번호 NLI59004.1 (TDD18)
NCBI 수탁 번호 KAB8140648.1 (TDD19)
일부 실시양태에서, 상기 서열은 존재하는 경우에 신호 서열을 포함하지 않는다.
일부 실시양태에서, 시티딘 데아미나제는 TDD의 독성 도메인을 포함할 수 있다. TDD1-TDD19에 대한 독성 도메인의 예는 다음과 같다: 예를 들어, 표 9에 나타낸 바와 같이, TDD1 (서열식별번호: 92), TDD2 (서열식별번호: 95 또는 134), TDD3 (서열식별번호: 98), TDD4 (서열식별번호: 101 또는 143), TDD5 (서열식별번호: 104), TDD6 (서열식별번호: 107 또는 152), TDD7 (서열식별번호: 157), TDD8 (서열식별번호: 162), TDD9 (서열식별번호: 167), TDD10 (서열식별번호: 172), TDD11 (서열식별번호: 177), TDD12 (서열식별번호: 184), TDD13 (서열식별번호: 189), TDD14 (서열식별번호: 194), TDD15 (서열식별번호: 199), TDD16 (서열식별번호: 204), TDD17 (서열식별번호: 209), TDD18 (서열식별번호: 214), 및 TDD19 (서열식별번호: 219). TDD1-TDD19의 독성 도메인은, 예를 들어 표 9에 나타낸 바와 같이 절반 도메인으로 분할될 수 있다. 일부 실시양태에서, TDD1-TDD19의 독성 도메인은 표 9에 나타낸 잔기에서 절반 도메인으로 분할된다. 특정 실시양태에서, TDD 절반 도메인 쌍은 서열식별번호: 93 및 94, 서열식별번호: 96 및 97, 서열식별번호: 99 및 100, 서열식별번호: 102 및 103, 서열식별번호: 105 및 106, 서열식별번호: 108 및 109, 서열식별번호: 130 및 131, 서열식별번호: 132 및 133, 서열식별번호: 135 및 136, 서열식별번호: 137 및 138, 서열식별번호: 139 및 140, 서열식별번호: 141 및 142, 서열식별번호: 144 및 145, 서열식별번호: 146 및 147, 서열식별번호: 148 및 149, 서열식별번호: 150 및 151, 서열식별번호: 153 및 154, 서열식별번호: 155 및 156, 서열식별번호: 158 및 159, 서열식별번호: 160 및 161, 서열식별번호: 163 및 164, 서열식별번호: 165 및 166, 서열식별번호: 168 및 169, 서열식별번호: 170 및 171, 서열식별번호: 173 및 174, 서열식별번호: 175 및 176, 서열식별번호: 178 및 179, 서열식별번호: 180 및 181, 서열식별번호: 182 및 183, 서열식별번호: 185 및 186, 서열식별번호: 187 및 188, 서열식별번호: 190 및 191, 서열식별번호: 192 및 193, 서열식별번호: 195 및 196, 서열식별번호: 197 및 198, 서열식별번호: 200 및 201, 서열식별번호: 202 및 203, 서열식별번호: 205 및 206, 서열식별번호: 207 및 208, 서열식별번호: 210 및 211, 서열식별번호: 212 및 213, 서열식별번호: 215 및 216, 서열식별번호: 217 및 218, 서열식별번호: 220 및 221, 또는 서열식별번호: 222 및 223의 아미노산 서열을 포함할 수 있다.
본원에 사용되고 달리 명시되지 않는 한, 용어 "TDD"는 TDD 독성 도메인을 지칭한다.
본 개시내용이 시티딘 데아미나제 (예를 들어, 본원에 기재된 TDD)를 언급하는 경우, 다른 시티딘 데아미나제가 본원에 기재된 융합 단백질 및 세포 편집 시스템에 사용될 수 있는 것으로 고려된다. 시티딘 데아미나제는 야생형 또는 진화된 도메인을 포함할 수 있다. 특정 실시양태에서, 시티딘 데아미나제는, 예를 들어 아포지단백질 B mRNA-편집 복합체 1 (APOBEC1) 도메인 또는 활성화 유도된 데아미나제 (AID)일 수 있다.
본 개시내용은 또한 다른 잠재적 시티딘 데아미나제를 제공한다. 이러한 시티딘 데아미나제는, 예를 들어 본원에 기재된 융합 단백질 및 세포 편집 시스템에 사용될 수 있다. 일부 실시양태에서, 시티딘 데아미나제는 본원에 기재된 TDD의 기능적 유사체이다. TDD의 기능적 유사체는 상기 TDD와 동일하거나 실질적으로 동일한 생물학적 기능 (즉, 시티딘 데아미나제 기능)을 갖는 분자이다. 예를 들어, 기능적 유사체는, 예를 들어 추가의 아미노산 잔기를 갖거나 갖지 않는 TDD의 부분을 함유하고/거나 TDD에 대한 돌연변이 (예를 들어, TDD (예를 들어, 서열식별번호: 72, 86-91, 및 117-129 중 어느 하나의 아미노산 서열을 포함하는 TDD) 또는 그의 독성 도메인 (예를 들어, 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함하는 독성 도메인)에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 변이체)를 함유하는 TDD의 이소형 또는 변이체일 수 있다. 특정 실시양태에서, 기능적 유사체는 본원에 기재된 TDD의 오르토로그이다. 특정 실시양태에서, TDD 오르토로그는 상기 TDD (예를 들어, 서열식별번호: 72, 86-91 및 117-129 중 어느 하나의 아미노산 서열을 포함하는 TDD)의 아미노산 서열에 대해 적어도 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열을 포함할 수 있다. 특정 실시양태에서, TDD 오르토로그는 본원에 기재된 TDD의 독성 도메인 (예를 들어, 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함하는 독성 도메인)의 아미노산 서열에 대해 적어도 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열을 갖는 독성 도메인을 포함할 수 있다.
아미노산 또는 뉴클레오티드 서열과 관련하여 용어 "퍼센트 동일한"은 최대 상응성을 위해 정렬될 때 동일한 2개의 서열 내의 잔기의 퍼센트를 지칭한다. 2개의 서열의 퍼센트 동일성은, 예를 들어 디폴트 파라미터 (미국 국립 의학 도서관의 국립 생물 정보 센터 웹사이트에서 입수가능함)를 사용하여 BLAST®에 의해 수득될 수 있다. 일부 실시양태에서, 비교 목적을 위해 정렬된 참조 서열의 길이는 참조 서열의 적어도 30% (예를 들어, 적어도 40, 50, 60, 70, 80, 또는 90%, 또는 100%)이다.
특정 실시양태에서, 본원에 기재된 시티딘 데아미나제는 AC 서열, TC 서열, GC 서열, CC 서열, AAC 서열, TAC 서열, GAC 서열, CAC 서열, ATC 서열, TTC 서열, GTC 서열, CTC 서열, AGC 서열, TGC 서열, GGC 서열, CGC 서열, ACC 서열, TCC 서열, GCC 서열, CCC 서열, 또는 그의 임의의 조합에서 시티딘을 표적화할 수 있다. 특정 실시양태에서, 본원에 기재된 시티딘 데아미나제는 DddA와 비교하여 증가된 효율 및/또는 활성을 갖는다. 일부 실시양태에서, 증가된 효율 또는 활성은, 예를 들어 상기 표적 서열 중 어느 하나 또는 그의 조합일 수 있다.
아데닌 데아미나제 (예를 들어, TadA)가 A:T 염기 쌍의 G:C 염기 쌍으로의 전환을 위해 본원에 기재된 융합 단백질 및 세포 편집 시스템에 사용될 수 있는 것으로 또한 고려된다. 특정 실시양태에서, TDD는, 효소가 아데닌 데아미나제로서 작용하고/거나 염기 편집 윈도우 내의 TC 서열 편향을 감소시키도록 뉴클레오티드 포켓을 형성하는 잔기 (예를 들어, DddA에 대해 상기 기재된 바와 같은 잔기 또는 잔기의 조합)에서 돌연변이될 수 있다.
B. 아연 핑거 단백질 도메인
본원에 기재된 융합 단백질 (예컨대, ZFP-시티딘 데아미나제 (예를 들어, ZFP-TDD), ZFP-시티딘 데아미나제 억제제 (예를 들어, ZFP-TDDI), 또는 ZFP-닉카제 융합 단백질)은 아연 핑거 단백질 (ZFP) 도메인을 포함한다. "아연 핑거 단백질" 또는 "ZFP"는 아연에 의해 안정화된 DNA-결합 도메인을 갖는 단백질을 지칭한다. ZFP는 서열-특이적 방식으로 DNA에 결합한다. 개별 DNA-결합 도메인은 "핑거"로 지칭된다. ZFP는 적어도 1개의 핑거를 갖고, 각각의 핑거는 뉴클레오티드의 2 내지 4개의 염기 쌍, 전형적으로 DNA의 3 또는 4개의 염기 쌍 (인접 또는 비인접)에 결합한다. 각각의 아연 핑거는 전형적으로 대략 30개의 아미노산을 포함하고, 아연을 킬레이트화한다. 조작된 ZFP는 자연-발생 아연 핑거 단백질과 비교하여 신규 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계 및 다양한 유형의 선택을 포함하나 이에 제한되지는 않는다. 합리적 설계는, 예를 들어 삼중자 (또는 사중자) 뉴클레오티드 서열 및 개별 아연 핑거 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하며, 여기서 각각의 삼중자 또는 사중자 뉴클레오티드 서열은 특정한 삼중자 또는 사중자 서열에 결합하는 아연 핑거의 1개 이상의 아미노산 서열과 회합된다. 예를 들어, 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,140,081; 6,200,759; 6,453,242; 6,534,261; 6,979,539; 및 8,586,526; 및 국제 특허 공개공보 WO 95/19431; WO 96/06166; WO 98/53057; WO 98/53058; WO 98/53059; WO 98/53060; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/016536; WO 02/099084; 및 WO 03/016496에 상세히 기재된 ZFP 설계 방법을 참조한다.
본 발명의 ZFP 융합 단백질의 ZFP 도메인은 적어도 3개 (예를 들어, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13개 또는 그 초과)의 아연 핑거를 포함할 수 있다. 개별 아연 핑거는 이들이 하나 이상의 염기를 스키핑할 수 있는 조작된 링커에 의해 연결되지 않는 한 전형적으로 DNA에 결합될 때 3개의 염기 쌍 간격으로 이격된다 (예를 들어, 문헌 [Paschon et al., Nat Commun. (2019) 10:1133] 및 미국 특허 8,772,453; 9,163,245; 9,394,531; 및 9,982,245 참조). 3개의 핑거를 갖는 ZFP 도메인은 전형적으로 9 또는 12개의 뉴클레오티드를 포함하는 표적 부위를 인식한다. 4개의 핑거를 갖는 ZFP 도메인은 전형적으로 12 내지 15개의 뉴클레오티드를 포함하는 표적 부위를 인식한다. 5개의 핑거를 갖는 ZFP 도메인은 전형적으로 15 내지 18개의 뉴클레오티드를 포함하는 표적 부위를 인식한다. 6개의 핑거를 갖는 ZFP 도메인은 18 내지 21개의 뉴클레오티드를 포함하는 표적 부위를 인식할 수 있다.
ZFP 도메인의 표적 특이성은, 예를 들어 미국 특허 공개 2018/0087072에 기재된 바와 같이 ZFP 백본에 대한 돌연변이에 의해 개선될 수 있다. 돌연변이는, DNA 백본 상의 포스페이트와 비-특이적으로 상호작용할 수 있지만 뉴클레오티드 표적 특이성에 관여하지 않는 ZFP 백본 내의 잔기에 대해 이루어진 것을 포함한다. 일부 실시양태에서, 이들 돌연변이는 양이온성 아미노산 잔기를 중성 또는 음이온성 아미노산 잔기로 돌연변이시키는 것을 포함한다. 일부 실시양태에서, 이들 돌연변이는 극성 아미노산 잔기를 중성 또는 비-극성 아미노산 잔기로 돌연변이시키는 것을 포함한다. 추가 실시양태에서, 돌연변이는 DNA-결합 나선에 대해 위치 (-4), (-5), (-9) 및/또는 (-14)에서 이루어진다. 일부 실시양태에서, 아연 핑거는 위치 (-4), (-5), (-9) 및/또는 (-14)에 하나 이상의 돌연변이를 포함할 수 있다. 추가 실시양태에서, 다중-핑거 ZFP 도메인 내의 하나 이상의 아연 핑거는 위치 (-4), (-5), (-9) 및/또는 (-14)에 돌연변이를 포함할 수 있다. 일부 실시양태에서, 위치 (-4), (-5), (-9) 및/또는 (-14)에서의 아미노산 (예를 들어, 아르기닌 (R) 또는 리신 (K))은 알라닌 (A), 류신 (L), Ser (S), Asp (N), Glu (E), Tyr (Y), 및/또는 글루타민 (Q)으로 돌연변이된다. 일부 실시양태에서, 위치 (-4)에서의 R 잔기는 Q로 돌연변이된다.
대안적으로, DNA-결합 도메인은 뉴클레아제로부터 유래될 수 있다. 예를 들어, 귀소 엔도뉴클레아제 및 메가뉴클레아제, 예컨대 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII의 인식 서열이 공지되어 있다. 또한, 미국 특허 5,420,032 및 6,833,252; 문헌 [Belfort et al., Nucleic Acids Res. (1997) 25:3379-88; Dujon et al., Gene (1989) 82:115-8; Perler et al., Nucleic Acids Res. (1994) 22:1125-7; Jasin, Trends Genet. (1996) 12:224-8; Gimble et al., J Mol Biol. (1996) 263:163-80; Argast et al., J Mol Biol. (1998) 280:345-53; and the New England Biolabs catalogue]을 참조한다. 또한, 귀소 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성은 비-천연 표적 부위에 결합하도록 조작될 수 있다. 예를 들어, 문헌 [Chevalier et al., Mol Cell (2002) 10:895-905; Epinat et al., Nucleic Acids Res. (2003) 31:2952-62; Ashworth et al., Nature (2006) 441:656-59; Paques et al., Current Gene Therapy (2007) 7:49-66]; 및 미국 특허 공개 2007/0117128을 참조한다.
일부 실시양태에서, 본 발명의 ZFP 융합 단백질은 하나 이상의 아연 핑거 도메인을 포함한다. 도메인은, 예를 들어 한 도메인이 1개 이상 (예를 들어, 3, 4, 5 또는 6개)의 아연 핑거를 포함하고 또 다른 도메인이 추가의 1개 이상 (예를 들어, 3, 4, 5 또는 6개)의 아연 핑거를 포함하도록 연장가능한 가요성 링커를 통해 함께 연결될 수 있다. 일부 실시양태에서, 링커는 핑거 어레이가 8, 9, 10, 11 또는 12개 또는 그 초과의 핑거를 포함하는 1개의 DNA-결합 도메인을 포함하도록 하는 표준 핑거간 링커이다. 다른 실시양태에서, 링커는 비정형 링커, 예컨대 가요성 링커이다. 예를 들어, 2개의 ZFP 도메인이 시티딘 데아미나제, 억제제, 또는 닉카제 도메인 ("도메인"), 예컨대 본원에 기재된 것들에 (N 말단에서 C 말단으로)으로 ZFP-ZFP-도메인, 도메인-ZFP-ZFP, ZFP-도메인-ZFP, 또는 ZFP-도메인-ZFP-도메인 (2개의 ZFP-도메인 융합 단백질이 링커를 통해 함께 융합됨) 구성으로 연결될 수 있다.
일부 실시양태에서, ZFP 융합 단백질은 "양방향"이며, 즉 이들은 2개의 ZFP 도메인이 2개의 불연속 표적 부위에 결합하도록 개재 아미노산에 의해 분리된 2개의 아연 핑거 클러스터 (2개의 ZFP 도메인)를 함유한다. 양방향 유형의 아연 핑거 결합 단백질의 예는 SIP1이며, 여기서 4개의 아연 핑거의 클러스터는 단백질의 아미노 말단에 위치하고, 3개의 핑거의 클러스터는 카르복실 말단에 위치한다 (문헌 [Remacle et al., EMBO J. (1999) 18(18):5073-84] 참조). 이들 단백질 내의 아연 핑거의 각각의 클러스터는 고유한 표적 서열에 결합할 수 있고, 2개의 표적 서열 사이의 간격은 많은 뉴클레오티드를 포함할 수 있다.
본원에 기재된 ZFP 융합 단백질의 DNA-결합 ZFP 도메인은 단백질을 DNA 표적 영역으로 향하게 한다. 일부 실시양태에서, DNA 표적 영역은 적어도 8 bp 길이이다. 예를 들어, 표적 영역의 길이는 8 bp 내지 40 bp, 예컨대 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 또는 36 bp일 수 있다.
특정 실시양태에서, ZFP는 표적화된 염기의 어느 한 측면 상의 1 내지 100개 (또는 이들 사이의 임의의 수) 뉴클레오티드인 표적 부위에 결합한다. 다른 실시양태에서, ZFP는 표적화된 염기의 어느 한 측면 상의 1 내지 50개 (또는 이들 사이의 임의의 수) 뉴클레오티드인 표적 부위에 결합한다.
C. 염기 편집제 억제제
일부 실시양태에서, 본원에 기재된 염기 편집제 시스템은 시스템의 염기 편집 활성을 시간적으로 및 공간적으로 보다 잘 조절하기 위해 편집제의 억제제를 포함할 수 있다. 예를 들어, 시티딘 데아미나제가 본원에 기재된 바와 같은 TDD인 경우, 억제제는 상기 TDD를 억제하는 TDDI일 수 있다. 편집제가 시티딘 데아미나제 DddA인 경우, 억제제는 예를 들어 DddI일 수 있다. 일부 실시양태에서, DddI는 하기에 나타낸 아미노산 서열을 갖는다.
따라서, 일부 실시양태에서, 염기 편집제 시스템은 ZFP-TDD 융합 단백질에 추가로 TDDI 성분을 포함한다. TDDI 성분은 그에 공유적으로 융합된 DNA-결합 도메인을 통해 또는 그에 공유적으로 결합되지 않은 DNA-결합 도메인과의 이량체화를 통해 TDD 복합체에 매우 근접하게 될 수 있다.
일부 실시양태에서, 본 발명의 염기 편집 시스템은 ZFP 도메인 및 억제제 도메인을 포함하는 ZFP-억제제 융합 단백질을 포함하며, 여기서 ZFP 도메인은 ZFP-시티딘 데아미나제 융합 단백질의 결합 부위에 근접한 (예를 들어, 50-100개의 nt 이내) DNA 표적 영역 내의 서열에 결합한다. 이러한 ZFP-억제제 융합 단백질이 세포에 도입되는 경우, 억제제 도메인은 시티딘 데아미나제 복합체에 매우 근접하게 복합체에 결합하고, 그에 의해 그 유전자좌에서 시티딘 데아미나제의 염기 편집 활성을 억제할 것이다. ZFP-억제제의 ZFP 도메인에 의해 결합된 서열의 존재는 억제제의 억제 활성을 결정한다.
일부 실시양태에서, 시티딘 데아미나제 복합체에 대한 억제제 도메인의 결합은 작용제 (예를 들어, 소분자 또는 펩티드)에 의해 조절될 수 있다. 예를 들어, 억제제 도메인은 이량체화 도메인에 융합될 수 있고, 그의 이량체화 파트너는 ZFP-시티딘 데아미나제 융합 단백질의 결합 부위에 근접한 (예를 들어, 50-100 nt 이내) DNA 표적 영역 내의 서열에 결합하는 ZFP 도메인에 융합될 수 있다. 억제제 및 ZFP의 이량체화 도메인은 이량체화-유도 작용제 (예를 들어, 소분자 또는 펩티드)의 존재 하에 이량체화될 수 있다. 작용제의 존재 하에, 억제제 도메인은 이량체화를 통해 DNA 표적 영역에 매우 근접하게 되어, 시티딘 데아미나제 복합체의 결합 및 불활성화를 유발할 것이다. 작용제가 회수되면, 억제제 도메인은 더 이상 DNA 표적 영역 근처에서 격리되지 않을 것이고, 시티딘 데아미나제 복합체로부터 탈착되어 염기 편집 과정이 진행되도록 할 것이다. 이러한 작용제 및 이량체화 도메인의 예를 하기 표 1에 나타낸다:
표 1. 이량체화 도메인 및 이량체화-유도 작용제
반대로, ZFP에 융합된 도메인 및 억제제 도메인의 이량체화는, 작용제의 존재가 시티딘 데아미나제 복합체의 활성을 허용하도록 이량체화-억제 작용제 (예를 들어, 소분자 또는 펩티드)에 의해 촉진되기 보다는 억제될 수 있다. 작용제가 회수되는 경우, 억제제 도메인은 시티딘 데아미나제 복합체에 결합하여 염기 편집 과정을 억제할 수 있을 것이다.
D. 우라실 DNA 글리코실라제 억제제
본원에 사용된 용어 "우라실 글리코실라제 억제제" 또는 "UGI"는 우라실-DNA 글리코실라제 염기-절제 복구 효소를 억제할 수 있는 단백질을 지칭한다. G:U 미스매치가 검출되면, 세포는 염기 절제 복구를 통해 반응하고, 이는 우라실 N-글리코실라제 (UNG)에 의한 미스매치된 우라실의 절제에 의해 개시된다. 일부 실시양태에서, 본원에 기재된 염기 편집제 시스템은 편집된 G:U 중간체를 UNG에 의한 절제로부터 보호하기 위한 1개 이상의 UGI를 추가로 포함한다. 특정 실시양태에서, 본원에 기재된 ZFP-시티딘 데아미나제 (예를 들어, ZFP-TDD) 융합 단백질은, 예를 들어 본원에 기재된 링커에 의해 부착된 1개 이상의 UGI 도메인을 포함할 수 있다. 일부 실시양태에서, 링커는 SGGS 링커 (서열식별번호: 245)이다. UGI 도메인(들)은 융합 단백질의 N-말단, C-말단, 또는 그의 임의의 조합에 위치할 수 있다 (예를 들어, C-말단에서 1개의 UGI 도메인, N-말단에서 1개의 UGI 도메인, C-말단에서 2개의 UGI 도메인, N-말단에서 2개의 UGI 도메인, 또는 그의 임의의 조합). 추가적으로 또는 대안적으로, 1개 이상의 UGI 도메인이 개별 ZFP 융합 단백질 상에 있을 수 있다 ("ZFP-UGI"). 특정한 실시양태에서, UGI 도메인은 서열식별번호: 20의 아미노산 서열을 포함한다.
E. 닉카제
일부 실시양태에서, 본원에 기재된 염기 편집제 시스템은 편집된 DNA 표적 영역 근처에 (예를 들어, 편집된 염기로부터 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100개 nt 이내에) 단일-가닥 DNA 파괴를 생성하는 닉카제를 추가로 포함한다. 닉의 생성은 닉의 하류 영역이 절제되고 대체되어 완전히 편집된 이중-가닥 DNA 표적 영역을 생성하도록 DNA 복구 기구를 유인한다. 닉은, 예를 들어 동일한 가닥 또는 대향하는 가닥 상의 편집된 염기의 5' 또는 3'일 수 있다.
일부 실시양태에서, 본원에 기재된 염기 편집제 시스템은 닉카제 기능을 포함하는 삼량체 아키텍처를 갖는다. 예를 들어, 이량체 닉카제의 한 도메인은 ZFP-시티딘 데아미나제 (예를 들어, 본원에 기재된 바와 같은 ZFP-TDD)에 융합될 수 있고, 다른 도메인은 독립적 ZFP에 융합될 수 있어, ZFP 도메인 둘 다의 그의 DNA 표적 영역에 대한 결합이 단일-가닥 파괴를 생성할 수 있는 활성 닉카제를 생성한다. 예를 들어, 도 9를 참조한다.
일부 실시양태에서, 본원에 기재된 염기 편집제 시스템은 닉카제 기능을 포함하는 사량체 아키텍처를 갖는다. 2개의 ZFP-시티딘 데아미나제 (예를 들어, 본원에 기재된 바와 같은 ZFP-TDD) 융합 단백질에 추가로, 이러한 시스템은 또한 2개의 ZFP-닉카제 단백질을 포함하며, 여기서 이량체 닉카제의 한 도메인은 제1 ZFP 도메인에 융합되고, 다른 도메인은 제2 ZFP 도메인에 융합되어, ZFP 도메인 둘 다의 그의 DNA 표적 영역에 대한 결합이 단일-가닥 파괴를 생성할 수 있는 활성 닉카제를 생성한다.
일부 실시양태에서, 닉카제는 예를 들어 ZFN 닉카제, TALEN 닉카제 또는 CRISPR/Cas 닉카제일 수 있다. 특정 실시양태에서, 닉카제는 FokI DNA 절단 도메인으로부터 유래된다. 일부 실시양태에서, FokI 닉카제는 모 FokI 닉카제와 비교하여 1개 이상의 돌연변이, 예를 들어 절단 도메인의 전하를 변화시키는 돌연변이; 분자 모델링에 기초하여 DNA 백본에 근접한 것으로 예측되고 FokI 상동체에서의 변이를 나타내는 잔기에 대한 돌연변이; 및/또는 다른 잔기에서의 돌연변이를 포함한다 (예를 들어, 미국 특허 8,623,618 및 문헌 [Guo et al., J Mol Biol. (2010) 400(1):96-107] 참조).
본원에 기재된 ZFP 융합 단백질에서, 닉카제 도메인(들)은 융합 분자의 N- 또는 C-말단 측면 (ZFP 도메인에 대해 N- 및/또는 C-말단)을 비롯하여 DNA-결합 ZFP 도메인의 어느 한 측면에 위치할 수 있다. 일부 실시양태에서, 본원에 기재된 ZFP-시티딘 데아미나제 (예를 들어, 본원에 기재된 바와 같은 ZFP-TDD) 융합 단백질은 N- 또는 C- 말단에 시티딘 데아미나제 도메인 및 대향하는 말단에 닉카제 도메인을 포함한다.
F. 펩티드 링커
본원에 기재된 융합 단백질에서, ZFP, 시티딘 데아미나제 (예를 들어, 본원에 기재된 바와 같은 TDD), 억제제 (예를 들어, TDDI, 예컨대 시티딘 데아미나제가 DddA인 DddI), 닉카제 및/또는 UGI 도메인은 서로에 대해 임의의 순서로 위치할 수 있다. 일부 실시양태에서, 도메인은 직접적인 펩티딜 연결, 펩티드 링커, 또는 그의 임의의 조합에 의해 서로 회합될 수 있다. 일부 실시양태에서, 도메인 중 2개 이상은 이량체화에 의해 (예를 들어, 류신 지퍼, STAT 단백질 N-말단 도메인 또는 FK506 결합 단백질을 통해) 서로 회합될 수 있다.
일부 실시양태에서, ZFP, 시티딘 데아미나제 (예를 들어, 본원에 기재된 바와 같은 TDD), 억제제 (예를 들어, TDDI, 예컨대 시티딘 데아미나제가 DddA인 DddI), UGI, 및/또는 닉카제 도메인, 및/또는 ZFP 도메인 내의 아연 핑거는 펩티드 링커, 예를 들어 약 5 내지 200개의 아미노산 (예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 또는 26개 또는 그 초과의 아미노산)의 비절단가능한 펩티드 링커를 통해 연결될 수 있다. 바람직한 링커는 전형적으로 재조합 융합 단백질로서 합성되는 가요성 아미노산 하위서열이다. 예를 들어, 미국 특허 6,479,626; 6,903,185; 7,153,949; 8,772,453; 및 9,163,245; 및 PCT 특허 공개 WO 2011/139349를 참조한다. 본원에 기재된 단백질은 적합한 링커의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 펩티드 링커는 3 내지 30개 아미노산 잔기 길이이고, G 및/또는 S가 풍부하다. 이러한 링커의 비제한적 예는 SGGS 링커 (서열식별번호: 245) 뿐만 아니라 G4S-유형 링커, 즉 1개 이상 (예를 들어, 2, 3, 또는 4개)의 GGGGS (서열식별번호: 71) 모티프, 또는 모티프의 변이 (예컨대, 모티프로부터 1, 2, 또는 3개의 아미노산 삽입, 결실, 및 치환을 갖는 것)를 함유하는 링커이다.
특정한 실시양태에서, 본원에 기재된 융합 단백질에 사용된 펩티드 링커는 L0 (LRGSQLVKS; 서열식별번호: 15), L7A (LRGSQLVKSKSEAAAR; 서열식별번호: 16), L26 (LRGSQLVKSKSEAAARGGGGSGGGGS; 서열식별번호: 17), L21 (LRGSQLVKSKSEAAARGGGGS; 서열식별번호: 110), L18 (LRGSQLVKSKSEAAARGS; 서열식별번호: 111), L13 (LRGSQLVKSKSGS; 서열식별번호: 112), L11 (LRGSQLVKSGS; 서열식별번호: 113), L9 (LRGSQLVGS; 서열식별번호: 114), L6 (LRGSGS; 서열식별번호: 115), 또는 L4 (LRGS; 서열식별번호: 116)일 수 있다.
II. 염기 편집제 시스템
본 개시내용은 본원에 기재된 ZFP 융합 단백질을 포함하는 염기 편집제 시스템을 제공한다. 염기 편집제 시스템은 DNA 표적 영역에서 시토신 염기를 우라실 염기로 편집하는 데 사용될 수 있으며, 여기서 우라실은 DNA 복제 또는 복구 동안 티민 염기에 의해 대체된다. 특정 실시양태에서, 편집은 표적화된 C:G 염기 쌍의 T:A 염기 쌍으로의 변화를 일으킨다. 도 1은 본 개시내용의 염기 편집 시스템을 예시한다.
본원에 기재된 바와 같은 염기 편집제 시스템은 유전자를 녹아웃시키고/거나 (예를 들어, 정규 코돈을 정지 코돈으로 변화시키고/거나 스플라이스 수용자 부위를 돌연변이시켜 엑손 스키핑 및/또는 프레임시프트 돌연변이를 도입함으로써); 유전자의 제어 요소 (예를 들어, 프로모터 또는 인핸서 영역)에 돌연변이를 도입하여 발현을 증가 또는 감소시키고/거나; 질환-유발 돌연변이 (예를 들어, 점 돌연변이)를 교정하고/거나; 치료 이익을 생성하는 돌연변이를 유도하는 데 사용될 수 있다. 표적 DNA는 세포에서 염색체 내에 또는 염색체외 서열 (예를 들어, 미토콘드리아 DNA) 내에 존재할 수 있다. 염기 편집은 시험관내, 생체외 또는 생체내에서 수행될 수 있다.
일부 실시양태에서, 본원에 기재된 염기 편집제 시스템은 1개 이상의 코돈 전환, 예를 들어 CAA에서 TAA로; CAG에서 TAG로; CGA에서 TGA로; 또는 TGG에서 TAG, TGA 또는 TAA로; 또는 그의 임의의 조합을 수행함으로써 정지 코돈(들)을 도입한다.
본 개시내용의 염기 편집제 시스템은, ZFP-시티딘 데아미나제 (예를 들어, 본원에 기재된 바와 같은 ZFP-TDD) 융합 단백질에 추가로, 시스템의 편집 활성의 조절 또는 개선을 도울 수 있는 본원에 기재된 바와 같은 억제제 도메인 (예를 들어, 시티딘 데아미나제가 DddA인 DddI와 같은 TDDI), UGI, 및 닉카제, 또는 그의 임의의 조합과 같은 성분을 포함할 수 있다. 특정 실시양태에서, 시스템은 단일 바이러스 벡터 (예를 들어, AAV 벡터) 내에 패키징될 수 있다.
일부 실시양태에서, 본 개시내용의 염기 편집제 시스템은 그 자체로 시티딘 데아미나제 활성이 결여된 시티딘 데아미나제 절반 도메인을 각각 포함하는 ZFP-시티딘 데아미나제 (예를 들어, 본원에 기재된 바와 같은 ZFP-TDD) 융합 단백질의 쌍을 포함하며, 여기서 ZFP의 그의 각각의 뉴클레오티드 표적에 대한 결합은 (예를 들어, C를 U로 대체하는 것에 의해, 이는 DNA 복제 또는 복구 동안 T에 의해 대체됨) 표적화된 C 염기를 T로 편집할 수 있는 활성 시티딘 데아미나제 분자를 생성한다.
예를 들어, 일부 실시양태에서, 염기 편집제 시스템은 a) i) 편집을 위해 표적화된 염기의 한 측면 상의 이중-가닥 DNA 표적 영역의 뉴클레오티드에 결합하는 제1 ZFP 도메인; 및 ii) TDD N-절반 도메인을 포함하는 제1 융합 단백질 (ZFP-TDD 좌측); 및 b) i) 편집을 위해 표적화된 염기의 다른 측면 상의 이중-가닥 DNA 표적 영역의 뉴클레오티드에 결합하는 제2 ZFP 도메인; 및 ii) TDD C-절반 도메인을 포함하는 제2 융합 단백질 (ZFP-TDD 우측)을 포함할 수 있으며; 여기서 ZFP-TDD 좌측 및 ZFP-TDD 우측의 그의 각각의 뉴클레오티드에 대한 결합은 C 염기를 T로 변화시킴으로써 DNA 표적 영역을 편집할 수 있는 활성 TDD 분자를 생성한다. ZFP-TDD 및/또는 DNA 표적 영역은, 예를 들어 본원에 기재된 바와 같을 수 있다.
일부 실시양태에서, 염기 편집제 시스템은 다음을 포함할 수 있다: a) i) 제1 DNA 표적 영역 내의 뉴클레오티드에 결합하는 아연 핑거 단백질 (ZFP) 도메인; 및
ii) TDDI 도메인을 포함하는 제1 DNA 표적 영역 내의 뉴클레오티드에 결합하는 제1 융합 단백질 (ZFP-TDDI); b) i) 편집을 위해 표적화된 염기의 한 측면 상의 제2 DNA 표적 영역의 뉴클레오티드에 결합하는 ZFP 도메인; 및 ii) TDD N-절반 도메인을 포함하는 제2 융합 단백질 (ZFP-TDD 좌측); 및 c) i) 편집을 위해 표적화된 염기의 다른 측면 상의 제2 DNA 표적 영역의 뉴클레오티드에 결합하는 ZFP 도메인; 및 ii) TDD C-절반 도메인을 포함하는 제3 융합 단백질 (ZFP-TDD 우측)을 포함하며; 여기서 ZFP-TDD 좌측 및 ZFP-TDD 우측의 그의 각각의 뉴클레오티드에 대한 결합은 C 염기를 T로 변화시킴으로써 제2 DNA 표적 영역을 편집할 수 있는 활성 TDD 분자를 생성하고; 여기서 제1 DNA 표적 영역에 대한 ZFP-TDDI의 결합은 TDD에 의한 제2 DNA 표적 영역의 편집을 방지한다. ZFP-TDD, ZFP-TDDI 및 DNA 표적 영역은 예를 들어 본원에 기재된 바와 같을 수 있다.
일부 실시양태에서, 염기 편집제 시스템은 a) i) 제1 DNA 표적 영역 내의 뉴클레오티드에 결합하는 아연 핑거 단백질 (ZFP) 도메인, 및 ii) 이량체화 도메인을 포함하는 제1 융합 단백질; b) i) TDDI 도메인; 및 ii) a)의 이량체화 도메인과 파트너를 이루는 이량체화 도메인을 포함하는 제2 융합 단백질; c) i) 편집을 위해 표적화된 염기의 한 측면 상의 제2 DNA 표적 영역의 뉴클레오티드에 결합하는 ZFP 도메인, 및 ii) TDD N-절반 도메인을 포함하는 제3 융합 단백질 (ZFP-TDD 좌측); 및 d) i) 편집을 위해 표적화된 염기의 다른 측면 상의 제2 DNA 표적 영역의 뉴클레오티드에 결합하는 ZFP 도메인, 및 ii) TDD C-절반 도메인을 포함하는 제4 융합 단백질 (ZFP-TDD 우측)을 포함할 수 있으며; 여기서 ZFP-TDD 좌측 및 ZFP-TDD 우측의 그의 각각의 뉴클레오티드에 대한 결합은 C 염기를 T로 변화시킴으로써 제2 DNA 표적 영역을 편집할 수 있는 활성 TDD 분자를 생성하고; 여기서 ZFP-TDDI를 형성하는 a) 및 b)의 융합 단백질의 이량체화 및 제1 DNA 표적 영역에 대한 a)의 ZFP의 결합은 TDD에 의한 제2 DNA 표적 영역의 편집을 방지한다. ZFP-TDD, ZFP-TDDI 및/또는 DNA 표적 영역은 예를 들어 본원에 기재된 바와 같을 수 있다.
일부 실시양태에서, a) 및 b) 파트너의 융합 단백질의 이량체화 도메인은 이량체화-유도 작용제의 존재 하에 ZFP-TDDI를 형성하여, TDD 활성의 억제를 일으킨다.
일부 실시양태에서, a) 및 b)의 융합 단백질의 이량체화 도메인은 이량체화-억제 작용제의 존재 하에 ZFP-TDDI를 형성하기 위해 파트너를 이루는 것이 억제되어, TDD 활성을 허용한다.
일부 실시양태에서, ZFP-TDDI는 TDD 염기 편집 활성으로부터 보호될 서열에 대해 특이적이다. 예를 들어, ZFP 도메인은 그의 비편집된 형태로 보존될 대립유전자 (예를 들어, 또 다른 대립유전자, 예컨대 돌연변이된 대립유전자가 편집을 위해 표적화되는 경우) 또는 공지된 오프-타겟 편집 부위에 결합할 수 있다. 일부 실시양태에서, TDD 염기 편집은 비보호된 대립유전자에서 정규 코돈을 정지 코돈으로 전환시킬 수 있다.
일부 실시양태에서, ZFP-TDDI (또는 그의 성분)의 발현은 유도성 프로모터의 제어 하에 있을 수 있다. 특정 실시양태에서, 이러한 시스템은 "사멸 스위치"로서 사용될 수 있으며, 여기서 ZFP-TDDI는 세포 내 필수 유전자를 편집되는 것으로부터 보호하고, ZFP-TDDI의 발현의 감소 또는 제거는 세포의 사멸을 유발한다.
ZFP-TDDI의 어셈블리가 이량체화-유도 작용제 또는 이량체화-억제 작용제의 제어 하에 있는 경우, 염기 편집은 작용제의 존재 또는 부재에 따라 조건부일 수 있다. 이러한 조건부 시스템은 또한 "사멸 스위치"에 사용될 수 있으며, 예를 들어 여기서 ZFP-TDDI는 세포 내 필수 유전자를 이량체화-유도 작용제의 존재 하에 또는 이량체화-억제 작용제의 부재 하에 편집되는 것으로부터 보호하고, 각각 작용제를 제거 또는 투여하는 것은 세포의 사멸을 유발한다.
특정 실시양태에서, 본 개시내용의 염기 편집제 시스템은 1개 초과의 ZFP-TDD 좌측 및 ZFP-TDD 우측 쌍을 포함하는 멀티플렉스 시스템일 수 있고; 이러한 시스템은 한번에 1개 초과의 DNA 표적 영역을 편집할 수 있다. 특정한 실시양태에서, 편집 특이성을 증가시키기 위해, 멀티플렉스 시스템은 TDD N-절반 및 C-절반 도메인이 각각의 쌍에 대해 TDD 서열 내의 상이한 위치 (예를 들어, 본원에 기재된 위치)에서 분할되는 ZFP-TDD 쌍을 포함한다. 특정 실시양태에서, 멀티플렉스 시스템의 ZFP-TDD 쌍에 의해 편집된 DNA 표적 영역은 상이한 유전자에 내에 존재할 수 있다. 특정 실시양태에서, DNA 표적 영역은 동일한 유전자 내에 존재할 수 있다.
임의의 상기 실시양태에서, TDD 및 TDDI는 본 명세서에 기재된 임의의 것일 수 있다. 특정 실시양태에서, TDD는 DddA일 수 있고, TDDI는 DddI일 수 있다. 또한, 다른 시티딘 데아미나제 및 억제제가 TDD 및 TDDI 대신에 사용될 수 있는 것으로 고려된다. 특정한 실시양태에서, 본원에 기재된 멀티플렉스 시스템은 제1 ZFP-시티딘 데아미나제 쌍 및 제2 ZFP-시티딘 데아미나제 쌍을 포함할 수 있으며, 여기서 제1 및 제2 쌍은 상이한 시티딘 데아미나제 (예를 들어, 본원에 기재된 것들로부터 선택됨)를 이용한다.
일부 실시양태에서, 본원에 기재된 시스템 및 방법은 적어도 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 세포에서 DNA 표적 영역의 표적화된 편집을 생성한다. 일부 실시양태에서, 편집된 세포는 오프-타겟 indel을 거의 내지 전혀 나타내지 않는다 (예를 들어, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.2% 또는 0.1% 미만의 오프-타겟 indel). 일부 실시양태에서, 편집된 세포는 오프-타겟 염기 편집을 거의 내지 전혀 나타내지 않지만 (예를 들어, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.2% 또는 0.1% 미만의 오프-타겟 염기 편집); 오프-타겟 부위의 염기 편집이 전위 또는 다른 게놈 배열에 취약하지 않을 수 있기 때문에 보다 높은 백분율이 또한 고려될 수 있다.
본 개시내용은 또한 본원에 기재된 ZFP 융합 단백질을 코딩하는 핵산 분자를 제공하며, 이는 바이러스 또는 비-바이러스 벡터의 일부일 수 있다. 추가로, 본 개시내용은 본원에 기재된 바와 같은 염기 편집제 시스템을 포함하는 세포 또는 세포의 집단, 뿐만 아니라 이러한 세포의 자손을 제공하며, 여기서 세포는 1종 이상의 편집된 염기를 포함한다.
III. ZFP 융합 단백질의 전달
본 개시내용의 ZFP 융합 단백질은 다양한 방법 (예를 들어, 전기천공, 수용체 리간드, 지질 나노입자, 양이온성 또는 음이온성 리포솜에 대한 단백질의 융합, 또는 핵 국재화 신호 (예를 들어, 리포솜과 조합됨))을 통해 단백질로서 표적 세포에 도입될 수 있다. 다른 실시양태에서, 융합 단백질은 이를 코딩하는 핵산 분자, 예를 들어 DNA 플라스미드 또는 mRNA를 통해 표적 세포에 도입된다. 핵산 분자는 ZFP 융합 단백질에 대한 코딩 서열의 발현을 허용하는 발현 제어 서열, 예컨대 프로모터, 인핸서, 전사 신호 서열, 및 전사 종결 서열을 포함할 수 있는 핵산 발현 벡터 내에 있을 수 있다.
일부 실시양태에서, ZFP 융합 단백질 발현을 지시하는 벡터 상의 프로모터는 구성적으로 활성인 프로모터 또는 유도성 프로모터이다. 적합한 프로모터는 비제한적으로 라우스 육종 바이러스 (RSV) 긴 말단 반복부 (LTR) 프로모터 (임의로 RSV 인핸서를 가짐), 시토메갈로바이러스 (CMV) 프로모터 (임의로 CMV 인핸서를 가짐), CMV 극초기 프로모터, 원숭이 바이러스 40 (SV40) 프로모터, 디히드로폴레이트 리덕타제 (DHFR) 프로모터, β-액틴 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, EFlα 프로모터, 몰로니 뮤린 백혈병 바이러스 (MoMLV) LTR, 크레아틴 키나제-기반 (CK6) 프로모터, 트랜스티레틴 프로모터 (TTR), 티미딘 키나제 (TK) 프로모터, 테트라시클린 반응성 프로모터 (TRE), B형 간염 바이러스 (HBV) 프로모터, 인간 α1-항트립신 (hAAT) 프로모터, 키메라 간-특이적 프로모터 (LSP), E2 인자 (E2F) 프로모터, 인간 텔로머라제 리버스 트랜스크립타제 (hTERT) 프로모터, CMV 인핸서/닭 β-액틴/토끼 β-글로빈 프로모터 (CAG 프로모터; 문헌 [Niwa et al., Gene (1991) 108(2):193-9]), 및 RU-486-반응성 프로모터를 포함한다. 또한, 프로모터는 ZFP 융합 단백질이 그에 대해 결합하고 그 자신의 발현 수준을 미리설정된 역치로 억제시키는 하나 이상의 자기-조절 요소를 포함할 수 있다. 미국 특허 9,624,498을 참조한다.
전기천공, 인산칼슘 침전, 미세주사, 양이온성 또는 음이온성 리포솜, 핵 국재화 신호와 조합된 리포솜, 자연 발생 리포솜 (예를 들어, 엑소솜), 또는 바이러스 형질도입을 포함하나 이에 제한되지는 않는, 뉴클레오티드 서열을 세포 내로 도입하는 임의의 방법이 사용될 수 있다. 특정 실시양태에서, 뉴클레오티드 서열은 mRNA의 형태이고, 전기천공을 통해 세포에 전달된다.
발현 벡터의 생체내 전달을 위해, 바이러스 형질도입이 사용될 수 있다. 관련 기술분야에 공지된 다양한 바이러스 벡터, 예를 들어 백시니아 벡터, 아데노바이러스 벡터, 렌티바이러스 벡터, 폭시바이러스 벡터, 아데노-관련 바이러스 (AAV) 벡터, 레트로바이러스 벡터, 및 하이브리드 바이러스 벡터가 본 개시내용에서 사용하기 위해 관련 기술분야의 통상의 기술자에 의해 적합화될 수 있다. 일부 실시양태에서, 본원에 사용된 바이러스 벡터는 재조합 AAV (rAAV) 벡터이다. 임의의 적합한 AAV 혈청형이 사용될 수 있다. 예를 들어, AAV는 AAV1, AAV2, AAV3, AAV3b, AAV4, AAV5, AAV6, AAV7, AAV8, AAV8.2, AAV9, AAV.PHP.B, AAV.PHP.eB, 또는 AAVrh10, 또는 신규 혈청형 또는 유사형, 예컨대 AAV2/8, AAV2/5, AAV2/6, AAV2/9, 또는 AAV2/6/9일 수 있다. 일부 실시양태에서, 발현 벡터는 AAV 바이러스 벡터이고, 이는 생산 시스템, 예컨대 곤충 세포/바큘로바이러스 생산 시스템 또는 포유동물 세포 생산 시스템에서의 AAV 비리온의 생산을 허용하기 위해 그의 게놈이 양쪽 말단에 AAV 역전된 말단 반복부 (ITR) 서열을 갖는 구축물을 포함하는 재조합 AAV 비리온에 의해 표적 인간 세포에 도입된다. AAV는 그의 캡시드 단백질이 인간에서 감소된 면역원성 또는 증진된 형질도입 능력을 갖도록 조작될 수 있다. 본원에 기재된 바이러스 벡터는 관련 기술분야에 공지된 방법을 사용하여 생산될 수 있다. 임의의 적합한 허용 또는 패키징 세포 유형이 바이러스 입자를 생산하는 데 사용될 수 있다. 예를 들어, 포유동물 (예를 들어, 293) 또는 곤충 (예를 들어, sf9) 세포가 패키징 세포주로서 사용될 수 있다.
임의의 유형의 세포가 본원에 기재된 염기 편집 방법을 위해 표적화될 수 있다. 예를 들어, 세포는 진핵 또는 원핵일 수 있다. 일부 실시양태에서, 세포는 포유동물 (예를 들어, 인간) 세포 또는 식물 세포이다. 인간 세포는, 예를 들어 T 세포, 자연 킬러 (NK) 세포, NK T 세포, 알파-베타 T 세포, 감마-델타 T-세포, 세포독성 T 림프구 (CTL), 조절 T 세포, B 세포, 인간 배아 줄기 세포, 종양-침윤 림프구 (TIL) 또는 림프성 세포가 분화될 수 있는 만능 줄기 세포 (예를 들어, 유도된 만능 줄기 세포 (iPSC))를 포함할 수 있다. 일부 실시양태에서, 시스템은 만능 줄기 세포를 다중 세포 유형으로의 분화 전에 변형시키는 데 사용될 수 있다. 예를 들어, 림프성 세포 전구체는 림프성 세포 유형, 예컨대 조절 T 세포, 이펙터 T 세포, 자연 킬러 세포 등으로의 분화 전에 변형될 수 있다. 본 개시내용의 멀티플렉스 염기 편집제 시스템 (1개 초과의 ZFP-시티딘 데아미나제 (예를 들어, ZFP-TDD) 쌍을 포함함)은 특히 만능 세포를 비롯하여 다중 염기 편집을 갖는 세포를 한 번에 제조하는 데 사용될 수 있다. 일부 실시양태에서, 멀티플렉스 시스템은, 예를 들어 동종 T 세포를 제조하는 데 사용될 수 있다. 시스템이 본원에 기재된 바와 같은 이량체화-조절제의 존재 또는 부재 하에 어셈블리되도록 유도될 수 있는 ZFP-시티딘 데아미나제 억제제 (예를 들어, ZFP-TDDI)를 포함하는 경우, 편집된 세포는 작용제의 투여 시 활성화된 "사멸 스위치"의 제어 하에 배치될 수 있는 것으로 고려된다.
농업 응용분야를 위해, 단백질 또는 핵산 분자를 식물 세포에 도입하기 위한 임의의 방법, 예컨대 아그로박테리움 투메파시엔스-매개 T-DNA 전달이 또한 고려된다.
IV. 제약 용도
본 개시내용은 본원에 기재된 염기 편집제 시스템을 세포에 (예를 들어, 환자로부터) 전달하여 표적화된 C 염기를 T 염기로 대체하는 것을 포함하는, 세포 DNA에서 시토신을 티민 염기로 편집하는 방법을 제공한다. 세포는 환자 내에 있을 수 있거나 (생체내 치료), 또는 본원에 기재된 바와 같은 방법은 환자로부터 제거된 세포에 대해 수행하고, 이어서 편집된 세포를 환자에게 전달할 수 있다 (생체외 치료). 일부 실시양태에서, 세포는 치료로서 사용하기 전에 생체외에서 추가로 조작된다. 용어 "치료하는"은 증상의 완화, 증상의 발병의 예방, 질환 진행의 둔화, 삶의 질의 개선, 및 증가된 생존을 포괄한다. 일부 실시양태에서, 본원에 기재된 방법에 의해 치료되는 환자는 포유동물, 예를 들어 인간이다.
일부 실시양태에서, 본 개시내용의 방법은 질환과 연관된 유전자 또는 조절 서열을 편집하는 데 사용된다. 예를 들어, 특정 실시양태에서, 염기 편집은 DNA 서열에서 점 돌연변이를 교정하여 정상 유전자 발현 또는 활성을 회복시킬 수 있다. 특정 실시양태에서, 염기 편집은 정지 코돈을 유해 유전자 (예를 들어, 종양유전자) 내로 도입할 수 있다. 특정 실시양태에서, 염기 편집은 치료 이익을 생성하는 돌연변이를 도입할 수 있다.
일부 실시양태에서, 환자는 암을 갖는다. 특정 실시양태에서, 환자로부터의 세포는 화학요법제에 대한 저항성을 제공하기 위해 염기 편집 전 또는 후에 추가로 변형된다. 이어서, 환자는 화학요법제로 치료될 수 있으며, 이는 일부 실시양태에서 편집되지 않은 세포에 비해 편집된 세포의 보다 큰 생존을 유발할 수 있다.
일부 실시양태에서, 환자는 자가면역 장애를 갖는다.
일부 실시양태에서, 환자는 상염색체 우성 질환, 예컨대 상염색체 우성 다낭성 신장 질환을 갖는다.
일부 실시양태에서, 환자는 미토콘드리아 장애를 갖는다.
일부 실시양태에서, 환자는 겸상 적혈구 질환, 혈우병 (예를 들어, A형, B형 또는 C형 혈우병), 낭성 섬유증, 페닐케톤뇨증, 테이-삭스병, 프리온 질환, 색맹, 리소솜 축적 질환 (예를 들어, 파브리병), 프리드라이히 운동실조 또는 전립선암을 갖는다.
일부 실시양태에서, 본 개시내용의 방법은 유전자의 특정한 대립유전자, 예를 들어 야생형 또는 돌연변이된 대립유전자에 염기 편집을 표적화할 수 있다. 특정 실시양태에서, 대립유전자는 암과 연관될 수 있다. 예를 들어, 방법은 JAK2의 V617F 돌연변이된 대립유전자를 표적화할 수 있으며, 이는 구성적 티로신 인산화 활성을 유도하고 골수증식성 신생물의 확장에서 결정적인 역할을 한다. 예를 들어 정지 코돈을 도입함으로써 V617F 돌연변이를 갖는 대립유전자의 발현을 녹아웃시키는 것은 JAK2 V617F 장애의 성공적인 치료를 용이하게 할 수 있다.
본 개시내용은 본원에 기재된 염기 편집제 시스템의 요소, 예컨대 ZFP-시티딘 데아미나제 (예를 들어, 본원에 기재된 바와 같은 ZFP-TDD) 쌍 및 임의로 시티딘 데아미나제 억제제 (예를 들어, TDDI, 예컨대 시티딘 데아미나제가 DddA인 DddI) 성분 (예를 들어, ZFP-시티딘 데아미나제 억제제 성분), 또는 상기 요소를 코딩하는 뉴클레오티드 서열 (예를 들어, 본원에 기재된 바와 같은 바이러스 또는 비-바이러스 벡터에서)을 포함하는 제약 조성물을 추가로 제공한다. 제약 조성물은 제약상 허용되는 담체, 예컨대 물, 염수 (예를 들어, 포스페이트-완충 염수), 덱스트로스, 글리세롤, 수크로스, 락토스, 젤라틴, 덱스트란, 알부민 또는 펙틴을 추가로 포함할 수 있다. 또한, 조성물은 보조 물질, 예컨대 습윤제 또는 유화제, pH-완충제, 안정화제, 또는 제약 조성물의 유효성을 증진시키는 다른 시약을 함유할 수 있다. 제약 조성물은 전달 비히클, 예컨대 리포솜, 나노캡슐, 마이크로입자, 마이크로구체, 지질 입자 및 소포를 함유할 수 있다.
일부 실시양태에서, 본원에 기재된 염기 편집제 시스템은 2B4 (CD244), 4-1BB (CD137), A2aR, AAVS1, ACTB, AID, ALB, B2M, B7.1, B7.2, B7-H2, B7-H3, B7-H4, B7-H6, BAFFR, BCL11A, BLAME (SLAMF8), BTLA, 부티로필린, CIITA, CCR5, CD100 (SEMA4D), CD103, CD3제타, CD4, CD5, CD7, CD11a, CD11b, CD11c, CD11d, CD150, IPO-3), CD160, CD160 (BY55), CD18, CD19, CD2, CD27, CD28, CD29, CD30, CD4, CD40, CD47, CD48, CD49a, CD49D, CD49f, CD52, CD69, CD7, CD83, CD84, CD8알파, CD8베타, CD96 (Tactile), CDS, CEACAM1, CISH, CRTAM, CTLA4, CXCR4, DCK, DGK, DGKA, DGKB, DGKD, DGKE, DGKG, DGKI, DGKK, DGKQ, DGKZ, DHFR, DNAM1 (CD226), EP2/4 수용체, 아데노신 수용체, 예컨대 A2AR, FAS, FASLG, GADS, GITR, GM-CSF, gp49B, HHLA2, HLA-A, HLA-B, HLA-C, HLA-DPA1, HLA-DPB1, HIV-LTR (긴 말단 반복부), HLA-DQA1, HLA-DQB1, HLA-DRA, HLA-DRB1, HLA-I, HVEM, HVEM, IA4, ICAM-1, ICOS, ICOS, ICOS (CD278), IFN-알파/베타/감마, IL-1 베타, IL-12, IL-15, IL-18, IL-23, IL2R 베타, IL2R 감마, IL2RA, IL-6, IL7R 알파, ILT-2, ILT-4, 이뮤노글로불린 중쇄 유전자좌, 이뮤노글로불린 경쇄 유전자좌, ITGA4, ITGA4, ITGA6, ITGAD, ITGAE, ITGAL, ITGAM, ITGAX, ITGB1, ITGB2, ITGB7, KIR 패밀리 수용체, KLRG1, Lag-3, LAIR-1, LAT, LIGHT, LTBR, Ly9 (CD229), MNK1/2, NKG2C, NKG2D, NKp30, NKp44, NKp46, NKp80 (KLRF1), OX2R, OX40, PAG/Cbp, PD-1, PD-L1, PD-L2, PGE2 수용체, PIR-B, PPP1R12C, PRNP1, PSGL1, PTPN2, RANCE/RANKL, RFX5, ROSA26, SELPLG (CD162), SIRP알파 (CD47), SLAM (SLAMF1, SLAMF4 (CD244, 2B4), SLAMF5, SLAMF6 (NTB-A, Ly108), SLAMF7, SLP-76, SOCS1, SOCS3, 테테린, TGFBR2, TIGIT, TIM-1, TIM-3, TIM-4, TMIGD2, TRA, TRAC, TRB, TRD, TRG, TNF, TNF-알파, TNFR2, TRIM5, TUBA1, VISTA, VLA1, 또는 VLA-6으로부터 선택된 게놈 유전자좌를 표적화하도록 조작될 수 있다.
본원에 기재된 ZFP 융합 단백질 및 염기 편집제 시스템은 본원에 기재된 치료 방법에 사용될 수 있거나, 본원에 기재된 치료에 사용될 수 있거나, 또는 본원에 기재된 치료를 위한 의약의 제조에 사용될 수 있는 것으로 이해된다.
V. 농업 응용분야
세포 DNA에서 시토신을 티민 염기로 편집하는 기재된 시스템 및 방법은 또한 농업 응용분야에 사용될 수 있다. 예를 들어, 특정 실시양태에서, 염기 편집은 정상 유전자 발현 또는 활성을 회복시키기 위해 DNA 서열에서 1개 이상의 점 돌연변이를 교정할 수 있다. 특정 실시양태에서, 염기 편집은 정지 코돈을 하나 이상의 유해 유전자 내로 도입할 수 있다. 특정 실시양태에서, 염기 편집은 하나 이상의 유익한 돌연변이를 도입할 수 있다. 특정한 실시양태에서, 본원에 기재된 시스템 및 방법은 작물 식물을 편집하는 데 사용된다.
본원에서 달리 정의되지 않는 한, 본 개시내용과 관련하여 사용된 과학 기술 용어는 관련 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 의미를 가질 것이다. 예시적인 방법 및 물질이 하기에 기재되지만, 본원에 기재된 것들과 유사하거나 동등한 방법 및 물질이 또한 본 개시내용의 실시 또는 시험에 사용될 수 있다. 상충되는 경우, 정의를 포함한 본 명세서가 우선할 것이다. 일반적으로, 본원에 기재된 심장학, 의약, 의약 및 제약 화학, 및 세포 생물학과 관련하여 사용된 명명법 및 그의 기술은 관련 기술분야에 널리 공지되고 통상적으로 사용되는 것이다. 효소적 반응 및 정제 기술은 제조업체의 설명서에 따라, 관련 기술분야에서 통상적으로 달성되는 바와 같이 또는 본원에 기재된 바와 같이 수행된다. 추가로, 문맥상 달리 요구되지 않는 한, 단수 용어는 복수를 포함할 것이고, 복수 용어는 단수를 포함할 것이다. 본 명세서 및 실시양태 전반에 걸쳐, 단어 "갖는다" 및 "포함한다", 또는 변형어, 예컨대 "갖다", "갖는", "포함하다" 또는 "포함하는"은 언급된 정수 또는 정수의 군을 포함하지만, 임의의 다른 정수 또는 정수의 군을 배제하지 않음을 암시하는 것으로 이해될 것이다. 또한, 용어 "또는"은 일반적으로 내용이 달리 명백하게 지시하지 않는 한 "및/또는"을 포함하는 의미로 사용된다는 것에 주목해야 한다. 본원에 사용된 용어 "약"은 특정한 용법의 문맥 내에서 언급된 수치로부터 10%, 5% 또는 1% 플러스 또는 마이너스인 수치 범위를 지칭한다. 추가로, 본원에 제공된 표제는 단지 편의를 위한 것이며, 청구된 실시양태의 범주 또는 의미로 해석되지는 않는다.
본원에 언급된 모든 간행물 및 다른 참고문헌은 그 전문이 참조로 포함된다. 다수의 문헌들이 본원에 인용되지만, 이러한 인용은 이들 문헌 중 어느 것도 관련 기술분야의 통상의 일반 지식의 일부를 형성한다는 것을 인정하는 것은 아니다.
본 발명을 보다 잘 이해할 수 있도록 하기 위해, 하기 실시예를 제시한다. 이들 실시예는 단지 예시를 위한 것이며, 어떠한 방식으로도 본 발명의 범주를 제한하는 것으로 해석되어서는 안된다.
<실시예>
실시예 1: ZFP-TDD 설계
ZFP-DddA 융합 단백질 쌍을 제조하기 위해, DddA 펩티드를 상기 문헌 [Mok et al.]에 기재된 바와 같이 잔기 G1333 ("DddA-G1333"), 뿐만 아니라 잔기 G1404 ("DddA-G1404") 및 G1407 ("DddA-G1407")에서 2개의 절반들 (각각 시티딘 데아미나제 활성이 결여됨)로 분할하였다. 8개의 좌측 ZFP 및 5개의 우측 ZFP는 DddA 절반들이 인간 CCR5 유전자좌의 부위를 표적화하도록 설계하여, 이러한 절반들이 표적 부위에서 이량체화되고 DddA의 촉매 활성을 회복시킬 수 있었다. 좌측 및 우측 ZFP 쌍은 2-bp 내지 24-bp의 매우 다양한 상이한 염기 편집 윈도우를 포괄한다 (도 2a).
각각의 분할 DddA 쌍의 N-말단 절반을 좌측 ZFP의 C-말단에 융합시키고, C-말단 절반을 우측 ZFP의 C-말단에 융합시켰으며, 그 반대의 경우도 마찬가지였다. DddA-G1333의 경우에는 3개의 상이한 링커 중 하나 (L0, L7A 및 L26)를 사용한 반면에, DddA-G1404 및 DddA-G1407의 경우에는 L26 링커를 사용하였다. 모든 다른 실험의 경우, 달리 나타내지 않는 한, L26 링커를 사용하였다. UGI (우라실 DNA 글리코실라제 억제제) 도메인을 또한 각각의 N-말단 및 C-말단 절반의 C-말단에 융합시켰다. 모든 ZFP-DddA 융합 구축물은 3xFLAG 태그, 뿐만 아니라 ZFP의 N-말단에 융합된 SV40 핵 국재화 신호를 추가로 함유하였다. 좌측 및 우측 ZFP 쌍의 예를 도 2b에 도시한다.
상기 기재된 서열 및 여러 제조된 구축물의 서열을 하기 표 2에서 나타낸다. 핑거 서열은 좌측 ZFP #1-8 및 우측 ZFP #1-5에서 밑줄 및 볼드체로 표시된다. 표 2의 ZFP는 CCR5 유전자좌를 표적화한다.
표 2. ZFP-DddA 성분 및 구축물 (CCR5 유전자좌 ZFP)의 서열
SEQ: 서열식별번호.
실시예 2: K562 세포에서의 ZFP-DddA 염기 편집
상기 기재된 방법에 따라 제조된 동일한-링커 ZFP-DddA 쌍을 사용하여 세포에서의 염기 편집을 검정하기 위해, K562 (ATCC, CCL243) 세포를 ATCC로부터 입수하고, 10% FBS 및 1x 페니실린-스트렙토마이신-글루타민 (PSG) (깁코, 10378-016)을 함유하는 RPMI1640 중 37℃에서 5% CO2로 유지하였다. 쌍형성된 ZFP-DddA를 코딩하는 pDNA 400 ng을 제조업체의 지침에 따라 SF 세포주 96-웰 뉴클레오펙터 키트 (론자, V4SC-2960)를 사용하여 K562 세포 내로 전기천공하였다. 간략하게, 세포를 1x PBS (2가 양이온-무함유)로 2회 세척하고, 보충된 SF 세포주 96-웰 뉴클레오펙터 용액 15 μL당 2 x 105개 세포로 재현탁시켰다. 각각의 형질감염을 위해, 15 μL의 세포 현탁액을 5 μL의 pDNA와 혼합하고, 론자 뉴클레오큐벳 플레이트로 옮긴 다음, 아막사 뉴클레오펙터 96-웰 셔틀 시스템 (론자) 상에서 K562 세포에 대한 프로토콜 (뉴클레오펙터 프로그램 96-FF-120)을 사용하여 전기천공하였다. 전기천공된 세포를 실온에서 10분 동안 인큐베이션한 다음, 96-웰 조직 배양 플레이트에서 150 μL의 사전가온된 완전 배지로 옮겼다. 세포를 72시간 동안 인큐베이션한 다음, 염기 편집 정량화를 위해 수거하였다.
다음의 최적 조건을 갖는 프라이머3을 사용하여 CCR5 유전자좌에 대한 PCR 프라이머를 설계하였다: 앰플리콘 크기 200개 뉴클레오티드; 용융 온도 60℃; 프라이머 길이 20개 뉴클레오티드; 및 GC 함량 50%. 프라이머 및 앰플리콘에 대한 서열을 하기 표 3에 나타낸다.
표 3. CCR5 프라이머 및 앰플리콘 서열
SEQ: 서열식별번호.
일루미나 라이브러리 서열 (정방향 프라이머: ACACGACGCTCTTCCGATCT (서열식별번호: 47); 역방향 프라이머: GACGTGTGCTCTTCCGAT (서열식별번호: 48))을 부가하기 위한 제2 PCR 반응을 위해 어댑터를 첨가하였다. CCR5 유전자좌를 아큐프라임 하이파이(AccuPrime HiFi) (인비트로젠)와 함께 100 ng의 게놈 DNA를 사용하여 25 μL로 증폭시켰다. 프라이머를 다음의 열순환 조건과 함께 0.1 μM의 최종 농도로 사용하였다: 95℃에서 5분 동안의 초기 용융; 95℃에서 30초, 55℃에서 30초 및 68℃에서 40초의 35 사이클; 및 68℃에서 10분 동안의 최종 연장. PCR 생성물을 물에서 1:20으로 희석하였다. 희석된 PCR 생성물 2 μL를 20 μL PCR 반응에 사용하여 HF 완충제 (NEB)를 함유한 퓨전 하이-피델리티 PCR 마스터믹스와 함께 일루미나 라이브러리 서열을 부가하였다. 프라이머를 다음의 조건과 함께 0.5 μM의 최종 농도로 사용하였다: 98℃에서 30초 동안의 초기 용융; 98℃에서 10초, 60℃에서 30초 및 72℃에서 40초의 12 사이클; 및 72℃에서 10분 동안의 최종 연장. 이어서, 제2 PCR 반응을 수행하여 샘플 특이적 서열 바코드를 부가하였다. PCR 라이브러리를 퀴아퀵 PCR 정제 키트 (퀴아젠)를 사용하여 정제하였다. 샘플을 큐빗 dsDNA HS 검정 키트 (인비트로젠)로 정량화하고, 2 nM로 희석하였다. 이어서, 라이브러리를 제조업체의 지침에 따라 표준 300-사이클 키트를 사용하는 일루미나 MiSeq 또는 중간-출력 300-사이클 키트를 사용하는 일루미나 NextSeq 500 상에서 실행하였다.
DddA-G1333을 사용한 결과를 도 3에 나타낸다. >3%의 염기 편집이 주목할만한 indel 없이 CCR5 염기 편집 윈도우 (C9, C10, C18, 및 C24) 내의 모든 4개의 위치에서 달성되었다. 도 4는 위치 C18 및 C24에서의 DddA-1397, DddA-G1404, 및 DddA-G1407에 대한 결과를 제공한다. 특히, DddA-G1404 및 DddA-G1407이 특히 C18에서 증가된 효율 및 활성을 나타냈다. 염기 편집은 17개의 GFP 대조군 중 어느 것에서도 관찰되지 않았다 (데이터는 나타내지 않음).
실시예 3: "재연결" DddA 설계
하기에 나타낸 바와 같이, 잔기 1398을 새로운 N-말단으로 만들고, 현재의 C-말단을 잔기 1334에 연결하고, 잔기 1397을 현재의 N-말단에 연결하며, 잔기 1333을 새로운 C-말단으로 만듦으로써 표준 원형 치환을 수행하지 않으면서 DddA 폴리펩티드 쇄를 재연결하였다 ("재배열" DddA 전체):
>DddA 전체 (서열식별번호: 72의 잔기 1290-1427) (무질서 잔기 이탤릭체; 1333 및 1397 볼드체):
>재연결 DddA 전체 (1398-C_term:1334-1397:링커 (이중 밑줄):N-말단-1333, 여기서 단일 밑줄은 재연결에 의해 생성된 근접 접합부를 나타냄):
이어서, 재연결 DddA를 2개의 절반들로 분할하여 기능적 비-독성 염기 편집제, 재연결_G1309 및 재연결_N1357을 제조하기 위한 2가지 상이한 전략을 확인하였다:
>재연결_G1309-N:
>재연결_G1309-C:
>재연결_N1357-N:
>재연결_N1357-C:
이어서, CCR5 유전자좌에 대한 각각의 ZFP-DddA 염기 편집제를 이들 분할 재연결 DddA 아키텍처에 기초하여 설계하였다. 예를 들어, 표 4를 참조한다. 상기 기재된 프로토콜에 따라 K562 세포에서 시험되는 경우, 재연결 ZFP-DddA 쌍은 C에서 T로의 염기 편집을 수행할 수 있을 것으로 고려된다. 이러한 재연결 쌍은, 오직 각각의 분할 쌍의 좌측 및 우측 아암만이 기능적 DddA를 형성할 수 있기 때문에, 멀티플렉스 염기 편집제 적용의 특이성을 증가시킬 수 있다.
표 4. 재연결 ZFP-DddA 구축물 (CCR5 유전자좌)의 서열
SEQ: 서열식별번호.
실시예 4: ZFP-DddA 결합 포켓의 재성형
DddA-유래 시토신 염기 편집제는 C에서 T로의 편집으로 제한되고, 염기 편집 윈도우 내의 TC 디뉴클레오티드에 대해 강한 선호도를 갖는다. Y1307, T1311, S1331, V1346, H1366, N1367, N1368, P1369, E1370, G1371, T1372, F1375, V1392, P1394, P1395, I1399, P1400, V1401, K1402, A1405 및 T1406을 비롯한 다양한 잔기가 이들 제한을 완화시키고 효소의 효율 및/또는 활성을 증가시키기 위한 포화 돌연변이유발에 대해 확인되었다. 돌연변이는 서열식별번호: 72에 대해 넘버링된다. DddA와 아데닌 데아미나제를 비롯한 다른 염기 편집제 사이의 구조적 정렬에 기초하여, 이들 잔기가 뉴클레오티드 포켓을 형성하는 것으로 결정되었다. 위치 E1370, N1368 및 Y1307에 돌연변이를 갖는 DddA 변이체를 도 5에 도시된 좌측 및 우측 ZFP 쌍을 사용하여 상기 기재된 프로토콜에 따라 K562 세포에서 시험하였다.
도 6a-6c에 나타낸 바와 같이, 특정 잔기 변화는 효율/활성의 증가를 일으켰다. 추가로, 일부 잔기 변화는 DddA 효소의 활성 윈도우를 변경시켰고; 이러한 변경은 DddA-기반 시약의 정밀도 및 특이성을 증가시킬 수 있다. Y1307 및 N1368은 둘 다 변화에 감수성인 것으로 보였고, 일부 돌연변이는 Y1307의 활성 프로파일을 변경시켰다 (예를 들어, 특정 경우에 C18에서의 활성의 거의 20x 증가, 및 C9 및 C10에 접근하는 능력). E1370은 변화에 덜 감수성인 것으로 보였으며, 특정 돌연변이는 유익한 효과를 나타냈다 (예를 들어, "좌측_ZFP#4-G1333-N : 우측_ZFP#5-G1333-C"의 상황에서 E1370H).
실시예 5: 염기 편집에 대한 조합된 ZFP-TDD + 닉카제 접근법
염기 편집제의 효율은 비변형된 DNA 가닥을 닉카제로 닉킹함으로써 증가될 수 있다. 이어서, 비변형된 DNA 가닥은 세포에 의해 새로 합성된 것으로 인식되고, 천연 DNA 복구 기구는 주형으로서 변형된 가닥을 사용하여 닉킹된 DNA 가닥을 복구한다. 비변형된 가닥은 FokI-유래 ZFN 또는 TALEN 또는 CRISPR/Cas-유래 닉카제를 사용하여 닉킹될 수 있다. 도 7a 및 7b는 CRISPR/Cas9 닉카제를 사용한 ZFP-TDD 염기 편집 설계 및 결과를 각각 나타낸다. 그러나, 모든 3가지 접근법은 2개의 추가의 구축물 (ZFN 또는 TALEN 닉카제에 대한 2개의 펩티드; CRISPR/Cas 닉카제에 대한 1개의 펩티드 및 1개의 sgRNA; 도 8)의 전달을 필요로 한다.
삼량체 ZFP-TDD 염기 편집제 아키텍처는 이러한 한계를 극복하기 위해 개발되었고, 이는 전달을 용이하게 하고 또한 염기 편집과 DNA 닉킹이 동시에 발생할 가능성을 높여 편집 효율을 증가시켰다. 이러한 삼량체 아키텍처에서, 이량체 FokI 닉카제의 절반은 좌측 또는 우측 ZFP-TDD의 N-말단에 융합될 수 있고, FokI 닉카제의 상응하는 다른 절반은 독립적인 ZFP-FokI 펩티드를 통해 관심 부위로 표적화될 수 있다 (도 9). DddA를 사용한 닉카제 실험에 대한 서열은 하기 표 5에서 확인할 수 있으며, ZFP 설계는 도 10에 도시된다 (좌측_ZFP#4 + 우측_ZFP#1 + 닉카제 ZFP #2, 또는 좌측_ZFP#4 + 우측_ZFP#5 + 닉카제 ZFP #1).
표 5. ZFP-닉카제 구축물 (CCR5 유전자좌)의 서열
삼량체 ZFP-DddA-닉카제 시스템을 상기 기재된 프로토콜에 따라 K562 세포에서 시험하였다. 도 11에 나타낸 바와 같이, 삼량체 ZFP-DddA-닉카제 시스템은 CRISPR-기반 닉카제보다 더 높은 수준의 염기 편집 활성을 나타냈으며, 일부 경우에 약 70% 염기 편집 및 배경에 접근한 더 낮은 수준의 indel을 가졌다. CRISPR-기반 닉카제 시스템을 능가하는 것 이외에도, 삼량체 ZFP-TDD-닉카제 시스템은 다른 플랫폼, 예컨대 CRISPR/Cas 및 TALE-TDD 염기 편집제 시스템과 달리 단일 바이러스 벡터, 예컨대 AAV에 피팅될 수 있는 그의 소형 크기에서 매우 유리할 수 있다.
실시예 6: K562 세포에서의 TDD의 염기 편집 활성
19종의 다른 잠재적 시티딘 데아미나제를 확인하고 (표 6), 염기 편집 활성에 대해 시험하였다.
표 6. TDD 정보
SEQ: 서열식별번호:
상기 기재된 TDD를 상기 실시예에 기재된 염기 편집 시스템에서 DddA를 대체하였고, 염기 편집에 대해 기재된 프로토콜에 따라 CCR5 유전자좌에서 상기 기재된 CCR5-표적화 ZFP를 사용하고/거나 CIITA 유전자좌 ("부위 2")에서 하기 기재된 CIITA-표적화 ZFP를 사용하여 K562 세포에서 시험하였다 (표 7 참조). CIITA 프라이머 및 앰플리콘에 대한 서열을 하기 표 8에 나타낸다.
표 7. CIITA 부위 2 아연 핑거 단백질
SEQ: 서열식별번호.
L26 링커 (서열식별번호: 17)를 사용하여, 각각의 TDD 분할의 하나의 구성원을 좌측 ZFP의 C-말단에 융합시키고, 다른 구성원을 우측 ZFP의 C-말단에 융합시켰다. UGI (우라실 DNA 글리코실라제 억제제) 도메인 (서열식별번호: 20)을 또한 SGGS 링커 (서열식별번호: 245)로 각각의 N-말단 및 C-말단 절반의 C-말단에 융합시켰다. 모든 ZFP 융합 구축물은 ZFP의 N-말단에 융합된 SV40 핵 국재화 신호 (서열식별번호: 1) 뿐만 아니라 3xFLAG 태그를 추가로 함유하였다.
표 8. CIITA 부위 2 프라이머 및 앰플리콘 서열
SEQ: 서열식별번호.
TDD에 사용된 서열은 하기 표 9에 포함된다. 특정 TDD에 대해, 변이체 독성 도메인을 또한 시험하였다 (TDD 지표 뒤에 "b", 예를 들어 TDD2에 대해 "TDD2b"로 표시됨).
표 9. TDD 독성 도메인 및 분할의 서열
SEQ: 서열식별번호:
CCR5 유전자좌에서의 TDD 염기 편집 활성
도 12는 2개의 상이한 쌍의 ZFP DNA 결합 도메인을 갖는, 표적 서열 CCR5의 C9, C10, C14, C16, C18, C20, 및 C24에서의 TDD1-TDD6 (선택 분할)의 염기 편집 빈도를 나타낸다 (도 10 참조). 각각의 분할 효소의 2가지 배향을 시험하였다 (즉, N- 및 C-말단 절반이 각각의 배향에 대해 ZFP 쌍의 상이한 구성원에 연결됨). 염기 편집 시스템이 닉카제를 포함하는 실험에서, ZFP-FokI 닉카제 또는 CRISPR/Cas9 닉카제를 사용하였다.
도 13은 염기 편집 윈도우에서 임의의 C에 대한 각각의 데아미나제에 대한 편집의 최고 빈도의 비교를 나타낸다 (도 12에 나타낸 데이터 뿐만 아니라 추가의 반복실험에 기초함). TDD 중 적어도 3종 (TDD3, TDD4, 및 TDD6)은 검출가능한 염기 편집 활성 (>0.25% 염기 편집)을 나타냈으며, TDD4는 DddA보다 더 높은 최대 활성을 나타냈다.
도 14는 닉카제 활성을 갖거나 갖지 않는, 2개의 상이한 ZFP 쌍에 대한 각각의 TDD의 2개의 결합 배향에 대한 염기 편집 윈도우에서의 임의의 C에 대한 편집의 최고 빈도를 나타내는, TDD 염기 편집 활성의 보다 상세한 분석을 제공한다 (도 12에 나타낸 데이터 뿐만 아니라 추가의 반복실험에 기초함). 특정 TDD에 대한 염기 편집은 ZFP 쌍 (예를 들어, TDD4) 또는 결합 배향 (예를 들어, TDD3)에 감수성인 것으로 보였다. TDD6은 적어도 ZFP#4 및 ZFP#5와 관련하여 결합 배향 의존성이긴 하지만, 그것이 시험된 모든 조건에 대해 검출가능한 활성 (>0.25% 염기 편집)을 갖는 것으로 보였다. 각각의 TDD에 대해, 일부 경우에, 닉킹은 염기 편집 활성을 개선시키는 것으로 보였다 (또한 도 12 참조).
CIITA 유전자좌에서의 TDD 염기 편집 활성
선택된 TDD 분할 효소를, 나타낸 ZFP 결합 도메인 ("CIITA_부위_2_우측_1," "CIITA_부위_2_우측_5," 및 "CIITA_부위_2_좌측_6")을 갖는 표적 서열 CIITA에서 G2, G5, C6, C8, G10, G11, G14, C15 및 C16으로 표지된 뉴클레오티드에서의 염기 편집에 대해 시험하였다 (도 15). 도 16은 염기 편집 윈도우에서 임의의 C에 대한 각각의 융합 단백질 쌍에 대한 편집의 최고 빈도의 비교를 나타낸다. CCR5 유전자좌에서 활성인 TDD3, TDD4 및 TDD6은 또한 CIITA 유전자좌에서 검출가능한 염기 편집 활성 (>0.25% 염기 편집)을 나타냈다. 8종의 추가의 TDD (TDD8, TDD9, TDD10, TDD12, TDD14, TDD15, TDD18, 및 TDD19)가 또한 검출가능한 편집을 나타o다. 염기 편집 활성은 TDD 분할 위치에 대해서, 및 일부 경우에 사용된 독성 도메인의 변이체 (예를 들어, TDD4)에 대해 감수성인 것으로 보였다. TDD4는 그것이 시험된 모든 조건에서 유의한 활성을 갖는 것으로 보였다. 일부 TDD는 또한 TC 및 AC 부위에서 더 강한 활성 (DddA와 비교하여; 예를 들어, TDD6 참조) 뿐만 아니라 GC 및 CC 부위에서 활성 (예를 들어, TDD6)을 갖는 증가된 표적화 밀도를 제공한다 (도 17).
CIITA 유전자좌에서의 TDD 염기 편집 활성에 대한 다양한 링커의 효과
염기 편집 활성이 데아미나제와 ZFP 도메인 사이의 다양한 링커에 의해 영향을 받는지 여부를 평가하기 위해, CIITA 유전자좌에서의 TDD6의 편집 빈도를 링커 L26, L21, L18, L13, L11, L9, L6, 및 L4로 평가하였다. 도 18에 나타낸 바와 같이, 다양한 링커 길이가 염기 편집 윈도우 내의 염기 편집 프로파일을 변경시킬 수 있었다. 예를 들어, 좌측 ZFP를 N- 또는 C-말단 TDD 분할에 연결하는 링커를 단축시키는 것은 활성 윈도우를 좁히는 것으로 보였다. 이러한 변경은 염기 편집제 정밀도 및 특이성을 증가시킬 수 있다. 일부 경우에, 링커 길이의 효과는 TDD 분할의 ZFP 쌍에 대한 또는 TDD에 대한 결합 배향에 민감한 것으로 보였다 (예를 들어, TDD14를 이용한 L4 성능).
실시예 7: TDD에 대한 억제제 TDDI의 표적화
TDD 효소는 TDDI에 의해 불활성화될 수 있다. 예를 들어, 천연 DddA 효소는 DddI 억제제에 의해 불활성화될 수 있다. ZFP 또는 TALE 연결된 TDDI는 잠재적 TDD-유래 시토신 염기 편집제 부위에 표적화되어, 그 부위가 편집되는 것을 방지할 수 있다 (도 19). TDDI 억제제는 소분자에 의해 강화된 이량체화 도메인을 사용하여 ZFP에 연결될 수 있고, 따라서 편집 활성은 소분자의 제어 하에 놓일 수 있다.
표적화된 TDDI 구축물을 대립유전자 특이적이도록 설계함으로써, 편집은 특정 대립유전자에 선택적으로 표적화, 예를 들어 돌연변이가 존재하는 경우에만 정지 코돈에서의 편집에 의해 유해 돌연변이체를 녹아웃시킬 수 있다. 예를 들어, JAK2 V617F는 V617F 돌연변이가 존재하는 경우에만 정지 코돈에서의 편집에 의해 녹아웃될 수 있다.
이러한 TDDI 접근법은 또한, 특히 다른 수단에 의해 제거될 수 없는 경우, 오프-타겟 부위에서의 편집을 감소시키는 데 사용될 수 있다.
또한, 다른 시티딘 데아미나제 및 그의 억제제가 TDD 및 TDDI 대신에 사용될 수 있는 것으로 고려된다.
SEQUENCE LISTING
<110> SANGAMO THERAPEUTICS, INC.
<120> ZINC FINGER FUSION PROTEINS FOR NUCLEOBASE EDITING
<130> 025297.WO034
<140>
<141>
<150> 63/230,580
<151> 2021-08-06
<150> 63/164,893
<151> 2021-03-23
<150> 63/083,662
<151> 2020-09-25
<160> 245
<170> PatentIn version 3.5
<210> 1
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 1
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala
35 40
<210> 2
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 2
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
1 5 10 15
Asp Ser Leu Ser Val His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Ser Leu Thr
35 40 45
Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Thr Ser Gly His Leu Ser Arg His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His Thr
100 105 110
His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Met Val Cys Cys Arg Thr Leu His Ile Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
145 150 155 160
Arg Ser Ala Asn Leu Thr Arg His Thr Lys Ile His
165 170
<210> 3
<211> 139
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 3
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Pro
1 5 10 15
Tyr Thr Leu Arg Leu His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Tyr Tyr Leu Ala
35 40 45
Lys His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Asp Asp Trp Asn Leu Ser Gln His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala Arg Ser Ala Asn Leu Thr Arg His Thr Lys Ile His Thr
100 105 110
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Lys Phe Ala Gln
115 120 125
Ser Ala His Arg Ile Thr His Thr Lys Ile His
130 135
<210> 4
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 4
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
1 5 10 15
Gly Ala Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Leu Lys Gln His Leu Thr
35 40 45
Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His Thr
100 105 110
Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
115 120 125
Gln Ser Ala His Arg Lys Asn His Ile Arg Thr His Thr Gly Glu Lys
130 135 140
Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Ala Val
145 150 155 160
Arg Lys Asn His Thr Lys Ile His
165
<210> 5
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 5
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
1 5 10 15
Gly Ala Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Leu Lys Gln His Leu Thr
35 40 45
Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His Thr
100 105 110
His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Arg Ser Ala Asn Leu Ala Arg His Ile Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
145 150 155 160
Thr Asn Gln Asn Arg Ile Thr His Thr Lys Ile His
165 170
<210> 6
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 6
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
1 5 10 15
Asp His Leu Ser Ala His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Cys Arg Arg Asn Leu Arg
35 40 45
Asn His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Met Val Cys Cys Arg Thr Leu His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala Arg Ser Ala Asn Leu Thr Arg His Thr Lys Ile His Thr
100 105 110
Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
115 120 125
Thr Ser Ser Asn Arg Lys Thr His Ile Arg Thr His Thr Gly Glu Lys
130 135 140
Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly His
145 150 155 160
Leu Ser Arg His Thr Lys Ile His
165
<210> 7
<211> 139
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 7
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Asp
1 5 10 15
Trp Asn Leu Ser Gln His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Ala Asn Leu Thr
35 40 45
Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Lys Phe Ala Gln Ser Ala His Arg Ile Thr His Thr
65 70 75 80
Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
85 90 95
Asn Phe Ser Gln Ser Ala Asn Arg Thr Thr His Ile Arg Thr His Thr
100 105 110
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln
115 120 125
Asn Ala His Arg Lys Thr His Thr Lys Ile His
130 135
<210> 8
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 8
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
1 5 10 15
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg
35 40 45
Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Gln Ser Ala His Arg Lys Asn His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala Arg Ser Ala Val Arg Lys Asn His Thr Lys Ile His Thr
100 105 110
Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
115 120 125
Gln Ser Ala Asn Arg Thr Thr His Ile Arg Thr His Thr Gly Glu Lys
130 135 140
Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Tyr Tyr
145 150 155 160
Leu Ala Lys His Thr Lys Ile His
165
<210> 9
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 9
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
1 5 10 15
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg
35 40 45
Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile Pro Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Ala Asn Leu
65 70 75 80
Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
85 90 95
Ile Cys Gly Arg Lys Phe Ala Thr Asn Gln Asn Arg Ile Thr His Thr
100 105 110
Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
145 150 155 160
Arg Lys Asp Pro Leu Lys Glu His Thr Lys Ile His
165 170
<210> 10
<211> 139
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 10
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Lys Phe Ala Gln Ser
1 5 10 15
Gly Asn Arg Thr Thr His Thr Lys Ile His Thr Gly Glu Lys Pro Phe
20 25 30
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Ser Asn Arg Lys
35 40 45
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
50 55 60
Cys Gly Arg Lys Phe Ala Ala Gln Trp Thr Arg Ala Cys His Thr Lys
65 70 75 80
Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
85 90 95
Asn Phe Ser Leu Arg His His Leu Thr Arg His Ile Arg Thr His Thr
100 105 110
Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp
115 120 125
Arg Thr Gly Leu Arg Ser His Thr Lys Ile His
130 135
<210> 11
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 11
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
1 5 10 15
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
35 40 45
Lys His Thr Lys Ile His Thr Pro Asn Pro His Arg Arg Thr Asp Pro
50 55 60
Ser His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln
65 70 75 80
Ser Ala Asp Arg Thr Lys His Ile Arg Thr His Thr Gly Glu Lys Pro
85 90 95
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Ser Leu
100 105 110
Thr Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile Pro Lys
115 120 125
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Thr
130 135 140
Arg Ile Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
145 150 155 160
Asp Ile Cys Gly Arg Lys Phe Ala Gln Asn Ala Thr Arg Ile Asn His
165 170 175
Thr Lys Ile His
180
<210> 12
<211> 143
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 12
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
1 5 10 15
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
35 40 45
Lys His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile Pro Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Lys Phe Ala Gln Ser Gly Asn Arg
65 70 75 80
Thr Thr His Thr Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Arg
85 90 95
Ile Cys Met Arg Asn Phe Ser Thr Ser Ser Asn Arg Lys Thr His Ile
100 105 110
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
115 120 125
Lys Phe Ala Ala Gln Trp Thr Arg Ala Cys His Thr Lys Ile His
130 135 140
<210> 13
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 13
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Ile
1 5 10 15
Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Asn Leu Ala
35 40 45
Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile Pro Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly His Leu
65 70 75 80
Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
85 90 95
Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala Lys His Thr
100 105 110
Lys Ile His Thr Pro Asn Pro His Arg Arg Thr Asp Pro Ser His Lys
115 120 125
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asp
130 135 140
Arg Thr Lys His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
145 150 155 160
Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Ser Leu Thr Arg His
165 170 175
Thr Lys Ile His
180
<210> 14
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 14
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg
1 5 10 15
Ser Asn Leu Ser Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr
35 40 45
Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Asp Ile Gly Tyr Arg Ala Ala His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala Gln Ser Gly Asn Leu Ala Arg His Thr Lys Ile His Thr
100 105 110
His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Gln Ser Gly His Leu Ala Arg His Ile Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
145 150 155 160
Asn Arg His Asp Arg Ala Lys His Thr Lys Ile His
165 170
<210> 15
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 15
Leu Arg Gly Ser Gln Leu Val Lys Ser
1 5
<210> 16
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 16
Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg
1 5 10 15
<210> 17
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 17
Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg
1 5 10 15
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25
<210> 18
<211> 44
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 18
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
1 5 10 15
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
20 25 30
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly
35 40
<210> 19
<211> 94
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 19
Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln
1 5 10 15
Ser Ala Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe
20 25 30
His Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu
35 40 45
Thr Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly
50 55 60
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
65 70 75 80
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys
85 90
<210> 20
<211> 83
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 20
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1 5 10 15
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
20 25 30
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
35 40 45
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
50 55 60
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
65 70 75 80
Lys Met Leu
<210> 21
<211> 131
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 21
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
1 5 10 15
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
20 25 30
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser
35 40 45
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
50 55 60
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
65 70 75 80
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
85 90 95
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
100 105 110
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
115 120 125
Lys Met Leu
130
<210> 22
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 22
Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln
1 5 10 15
Ser Ala Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe
20 25 30
His Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu
35 40 45
Thr Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly
50 55 60
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
65 70 75 80
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly
85 90 95
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
100 105 110
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
115 120 125
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
130 135 140
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
145 150 155 160
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
165 170 175
Lys Ile Lys Met Leu
180
<210> 23
<211> 354
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 23
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
165 170 175
Ala Asn Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Asn Gln Asn Arg Ile
195 200 205
Thr His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Gly
210 215 220
Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala
225 230 235 240
Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly
245 250 255
Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr
260 265 270
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
275 280 285
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly
290 295 300
Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser
305 310 315 320
Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys
325 330 335
Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys
340 345 350
Met Leu
<210> 24
<211> 361
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 24
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Ser Leu Ser Val His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Thr Ser Gly His Leu Ser Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asp Leu Thr Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Met Val
165 170 175
Cys Cys Arg Thr Leu His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Ala Asn Leu Thr
195 200 205
Arg His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile
225 230 235 240
Ser Ala Pro Gln Leu Pro Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe
245 250 255
Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu Ser Lys Val Phe Ser Ser
260 265 270
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
275 280 285
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
290 295 300
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
305 310 315 320
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
325 330 335
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
340 345 350
Asn Gly Glu Asn Lys Ile Lys Met Leu
355 360
<210> 25
<211> 357
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 25
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Ser Ala His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Cys Arg Arg Asn Leu Arg Asn His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Met Val Cys Cys Arg Thr Leu His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Ala
130 135 140
Asn Leu Thr Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe
145 150 155 160
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Ser Asn Arg Lys
165 170 175
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
180 185 190
Cys Gly Arg Lys Phe Ala Gln Ser Gly His Leu Ser Arg His Thr Lys
195 200 205
Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala
210 215 220
Ala Arg Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln
225 230 235 240
Leu Pro Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn
245 250 255
Asp Ala Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly
260 265 270
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
275 280 285
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
290 295 300
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
305 310 315 320
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
325 330 335
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
340 345 350
Lys Ile Lys Met Leu
355
<210> 26
<211> 361
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 26
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Arg Ser Ala Asn Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Thr Asn Gln Asn Arg Ile Thr His Thr Lys Ile His Thr Gly Ser
145 150 155 160
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Asp Pro Leu Lys
195 200 205
Glu His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile
225 230 235 240
Ser Ala Pro Gln Leu Pro Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe
245 250 255
Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu Ser Lys Val Phe Ser Ser
260 265 270
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
275 280 285
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
290 295 300
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
305 310 315 320
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
325 330 335
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
340 345 350
Asn Gly Glu Asn Lys Ile Lys Met Leu
355 360
<210> 27
<211> 407
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 27
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe
145 150 155 160
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala His Arg Lys
165 170 175
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
180 185 190
Cys Gly Arg Lys Phe Ala Arg Ser Ala Val Arg Lys Asn His Thr Lys
195 200 205
Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala
210 215 220
Ala Arg Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu
225 230 235 240
Gly Gln Ser Ala Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu
245 250 255
Val Phe His Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met
260 265 270
Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro
275 280 285
Glu Gly Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val
290 295 300
Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys
305 310 315 320
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
325 330 335
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
340 345 350
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
355 360 365
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
370 375 380
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
385 390 395 400
Glu Asn Lys Ile Lys Met Leu
405
<210> 28
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 28
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Ser Leu Ser Val His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Thr Ser Gly His Leu Ser Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asp Leu Thr Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Met Val
165 170 175
Cys Cys Arg Thr Leu His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Ala Asn Leu Thr
195 200 205
Arg His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
245 250 255
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
260 265 270
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser
275 280 285
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
290 295 300
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
305 310 315 320
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
325 330 335
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
340 345 350
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
355 360 365
Lys Met Leu
370
<210> 29
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 29
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe
145 150 155 160
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala His Arg Lys
165 170 175
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
180 185 190
Cys Gly Arg Lys Phe Ala Arg Ser Ala Val Arg Lys Asn His Thr Lys
195 200 205
Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala
210 215 220
Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser Tyr Ala
225 230 235 240
Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr Asn Gly
245 250 255
Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu
260 265 270
Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
275 280 285
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
290 295 300
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
305 310 315 320
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
325 330 335
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
340 345 350
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
355 360 365
<210> 30
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 30
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
165 170 175
Ala Asn Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Asn Gln Asn Arg Ile
195 200 205
Thr His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
245 250 255
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
260 265 270
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser
275 280 285
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
290 295 300
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
305 310 315 320
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
325 330 335
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
340 345 350
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
355 360 365
Lys Met Leu
370
<210> 31
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 31
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Ser Ala His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Cys Arg Arg Asn Leu Arg Asn His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Met Val Cys Cys Arg Thr Leu His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Ala
130 135 140
Asn Leu Thr Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe
145 150 155 160
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser Ser Asn Arg Lys
165 170 175
Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
180 185 190
Cys Gly Arg Lys Phe Ala Gln Ser Gly His Leu Ser Arg His Thr Lys
195 200 205
Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala
210 215 220
Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser Tyr Ala
225 230 235 240
Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr Asn Gly
245 250 255
Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu
260 265 270
Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
275 280 285
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
290 295 300
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
305 310 315 320
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
325 330 335
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
340 345 350
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
355 360 365
<210> 32
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 32
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Arg Ser Ala Asn Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Thr Asn Gln Asn Arg Ile Thr His Thr Lys Ile His Thr Gly Ser
145 150 155 160
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Asp Pro Leu Lys
195 200 205
Glu His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
245 250 255
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
260 265 270
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser
275 280 285
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
290 295 300
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
305 310 315 320
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
325 330 335
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
340 345 350
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
355 360 365
Lys Met Leu
370
<210> 33
<211> 417
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 33
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe
145 150 155 160
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala His Arg Lys
165 170 175
Asn His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
180 185 190
Cys Gly Arg Lys Phe Ala Arg Ser Ala Val Arg Lys Asn His Thr Lys
195 200 205
Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala
210 215 220
Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Pro Thr Pro Tyr
225 230 235 240
Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala Leu Phe
245 250 255
Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro
260 265 270
Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro
275 280 285
Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala Ile Pro Val
290 295 300
Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr Gly Asn Ser Asn
305 310 315 320
Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly Gly Ser Thr Asn
325 330 335
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
340 345 350
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
355 360 365
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
370 375 380
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
385 390 395 400
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
405 410 415
Leu
<210> 34
<211> 421
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 34
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
165 170 175
Ala Asn Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Asn Gln Asn Arg Ile
195 200 205
Thr His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln
245 250 255
Ser Ala Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe
260 265 270
His Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu
275 280 285
Thr Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly
290 295 300
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
305 310 315 320
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly
325 330 335
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
340 345 350
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
355 360 365
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
370 375 380
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
385 390 395 400
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
405 410 415
Lys Ile Lys Met Leu
420
<210> 35
<211> 421
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 35
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Arg Ser Ala Asn Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Thr Asn Gln Asn Arg Ile Thr His Thr Lys Ile His Thr Gly Ser
145 150 155 160
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Asp Pro Leu Lys
195 200 205
Glu His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln
245 250 255
Ser Ala Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe
260 265 270
His Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu
275 280 285
Thr Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly
290 295 300
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
305 310 315 320
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly
325 330 335
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
340 345 350
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
355 360 365
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
370 375 380
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
385 390 395 400
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
405 410 415
Lys Ile Lys Met Leu
420
<210> 36
<211> 412
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 36
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Ile Gly Tyr Arg Ala Ala His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asn Leu Ala Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Gln Ser Gly His Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Asn Arg His Asp Arg Ala Lys His Thr Lys Ile His Thr Pro Asn
145 150 155 160
Pro His Arg Arg Thr Asp Pro Ser His Lys Pro Phe Gln Cys Arg Ile
165 170 175
Cys Met Arg Asn Phe Ser Gln Ser Ala Asp Arg Thr Lys His Ile Arg
180 185 190
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
195 200 205
Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile His Leu Arg
210 215 220
Gly Ser Gln Leu Val Lys Ser Pro Thr Pro Tyr Pro Asn Tyr Ala Asn
225 230 235 240
Ala Gly His Val Glu Gly Gln Ser Ala Leu Phe Met Arg Asp Asn Gly
245 250 255
Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys Gly
260 265 270
Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys Met
275 280 285
Thr Val Val Pro Pro Glu Gly Ala Ile Pro Val Lys Arg Gly Ala Thr
290 295 300
Gly Glu Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser Pro
305 310 315 320
Thr Lys Gly Gly Cys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
325 330 335
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met
340 345 350
Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp
355 360 365
Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
370 375 380
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile
385 390 395 400
Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
405 410
<210> 37
<211> 404
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 37
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Asp Ile Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asn Leu Ala Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
195 200 205
Lys His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Pro
210 215 220
Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser
225 230 235 240
Ala Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His
245 250 255
Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr
260 265 270
Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala
275 280 285
Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr Gly
290 295 300
Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly Gly
305 310 315 320
Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
325 330 335
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
340 345 350
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
355 360 365
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
370 375 380
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
385 390 395 400
Ile Lys Met Leu
<210> 38
<211> 378
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 38
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Lys Phe Ala Gln Ser Gly Asn Arg Thr Thr His
50 55 60
Thr Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
65 70 75 80
Arg Asn Phe Ser Thr Ser Ser Asn Arg Lys Thr His Ile Arg Thr His
85 90 95
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
100 105 110
Ala Gln Trp Thr Arg Ala Cys His Thr Lys Ile His Thr Gly Ser Gln
115 120 125
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg His
130 135 140
His Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
145 150 155 160
Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp Arg Thr Gly Leu Arg Ser
165 170 175
His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser
180 185 190
Glu Ala Ala Ala Arg Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly
195 200 205
His Val Glu Gly Gln Ser Ala Leu Phe Met Arg Asp Asn Gly Ile Ser
210 215 220
Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys
225 230 235 240
Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys Met Thr Val
245 250 255
Val Pro Pro Glu Gly Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu
260 265 270
Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys
275 280 285
Gly Gly Cys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys
290 295 300
Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
305 310 315 320
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu
325 330 335
Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu
340 345 350
Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
355 360 365
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
370 375
<210> 39
<211> 411
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 39
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Asp Ile Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asn Leu Ala Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
195 200 205
Lys His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala
225 230 235 240
Gly His Val Glu Gly Gln Ser Ala Leu Phe Met Arg Asp Asn Gly Ile
245 250 255
Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys Gly Phe
260 265 270
Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys Met Thr
275 280 285
Val Val Pro Pro Glu Gly Ala Ile Pro Val Lys Arg Gly Ala Thr Gly
290 295 300
Glu Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr
305 310 315 320
Lys Gly Gly Cys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu
325 330 335
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu
340 345 350
Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
355 360 365
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu
370 375 380
Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln
385 390 395 400
Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
405 410
<210> 40
<211> 419
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 40
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Ile Gly Tyr Arg Ala Ala His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asn Leu Ala Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Gln Ser Gly His Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Asn Arg His Asp Arg Ala Lys His Thr Lys Ile His Thr Pro Asn
145 150 155 160
Pro His Arg Arg Thr Asp Pro Ser His Lys Pro Phe Gln Cys Arg Ile
165 170 175
Cys Met Arg Asn Phe Ser Gln Ser Ala Asp Arg Thr Lys His Ile Arg
180 185 190
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
195 200 205
Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile His Leu Arg
210 215 220
Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg Pro Thr
225 230 235 240
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
245 250 255
Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn
260 265 270
Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu
275 280 285
Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala Ile
290 295 300
Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr Gly Asn
305 310 315 320
Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly Gly Ser
325 330 335
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
340 345 350
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
355 360 365
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
370 375 380
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
385 390 395 400
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
405 410 415
Lys Met Leu
<210> 41
<211> 328
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 41
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Lys Phe Ala Gln Ser Gly Asn Arg Thr Thr His
50 55 60
Thr Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
65 70 75 80
Arg Asn Phe Ser Thr Ser Ser Asn Arg Lys Thr His Ile Arg Thr His
85 90 95
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
100 105 110
Ala Gln Trp Thr Arg Ala Cys His Thr Lys Ile His Thr Gly Ser Gln
115 120 125
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg His
130 135 140
His Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
145 150 155 160
Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp Arg Thr Gly Leu Arg Ser
165 170 175
His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser
180 185 190
Glu Ala Ala Ala Arg Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser
195 200 205
Ala Pro Gln Leu Pro Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr
210 215 220
Tyr Val Asn Asp Ala Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly
225 230 235 240
Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr
245 250 255
Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu
260 265 270
Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His
275 280 285
Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser
290 295 300
Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn
305 310 315 320
Gly Glu Asn Lys Ile Lys Met Leu
325
<210> 42
<211> 388
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 42
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Lys Phe Ala Gln Ser Gly Asn Arg Thr Thr His
50 55 60
Thr Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
65 70 75 80
Arg Asn Phe Ser Thr Ser Ser Asn Arg Lys Thr His Ile Arg Thr His
85 90 95
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
100 105 110
Ala Gln Trp Thr Arg Ala Cys His Thr Lys Ile His Thr Gly Ser Gln
115 120 125
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg His
130 135 140
His Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
145 150 155 160
Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp Arg Thr Gly Leu Arg Ser
165 170 175
His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser
180 185 190
Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Pro
195 200 205
Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser
210 215 220
Ala Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His
225 230 235 240
Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr
245 250 255
Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala
260 265 270
Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr Gly
275 280 285
Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly Gly
290 295 300
Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
305 310 315 320
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
325 330 335
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
340 345 350
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
355 360 365
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
370 375 380
Ile Lys Met Leu
385
<210> 43
<211> 421
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 43
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Asp Ile Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asn Leu Ala Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
195 200 205
Lys His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln
245 250 255
Ser Ala Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe
260 265 270
His Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu
275 280 285
Thr Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly
290 295 300
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
305 310 315 320
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly
325 330 335
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
340 345 350
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
355 360 365
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
370 375 380
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
385 390 395 400
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
405 410 415
Lys Ile Lys Met Leu
420
<210> 44
<211> 429
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 44
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Ile Gly Tyr Arg Ala Ala His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asn Leu Ala Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Gln Ser Gly His Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Asn Arg His Asp Arg Ala Lys His Thr Lys Ile His Thr Pro Asn
145 150 155 160
Pro His Arg Arg Thr Asp Pro Ser His Lys Pro Phe Gln Cys Arg Ile
165 170 175
Cys Met Arg Asn Phe Ser Gln Ser Ala Asp Arg Thr Lys His Ile Arg
180 185 190
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
195 200 205
Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile His Leu Arg
210 215 220
Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg Gly Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Gly Ser Pro Thr Pro Tyr Pro Asn Tyr Ala
245 250 255
Asn Ala Gly His Val Glu Gly Gln Ser Ala Leu Phe Met Arg Asp Asn
260 265 270
Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys
275 280 285
Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys
290 295 300
Met Thr Val Val Pro Pro Glu Gly Ala Ile Pro Val Lys Arg Gly Ala
305 310 315 320
Thr Gly Glu Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser
325 330 335
Pro Thr Lys Gly Gly Cys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile
340 345 350
Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
355 360 365
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
370 375 380
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
385 390 395 400
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
405 410 415
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
420 425
<210> 45
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 45
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Lys Phe Ala Gln Ser Gly Asn Arg Thr Thr His
50 55 60
Thr Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
65 70 75 80
Arg Asn Phe Ser Thr Ser Ser Asn Arg Lys Thr His Ile Arg Thr His
85 90 95
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
100 105 110
Ala Gln Trp Thr Arg Ala Cys His Thr Lys Ile His Thr Gly Ser Gln
115 120 125
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg His
130 135 140
His Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
145 150 155 160
Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp Arg Thr Gly Leu Arg Ser
165 170 175
His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser
180 185 190
Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
195 200 205
Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala
210 215 220
Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly
225 230 235 240
Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr
245 250 255
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
260 265 270
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly
275 280 285
Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser
290 295 300
Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys
305 310 315 320
Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys
325 330 335
Met Leu
<210> 46
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 46
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Asp Ile Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asn Leu Ala Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
195 200 205
Lys His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
245 250 255
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
260 265 270
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser
275 280 285
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
290 295 300
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
305 310 315 320
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
325 330 335
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
340 345 350
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
355 360 365
Lys Met Leu
370
<210> 47
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 47
acacgacgct cttccgatct 20
<210> 48
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 48
gacgtgtgct cttccgat 18
<210> 49
<211> 138
<212> PRT
<213> Burkholderia cenocepacia
<400> 49
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
1 5 10 15
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
20 25 30
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Pro Thr Pro Tyr
35 40 45
Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala Leu Phe
50 55 60
Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro
65 70 75 80
Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro
85 90 95
Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala Ile Pro Val
100 105 110
Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr Gly Asn Ser Asn
115 120 125
Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys
130 135
<210> 50
<211> 144
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 50
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
1 5 10 15
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
20 25 30
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
35 40 45
Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn
50 55 60
Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu
65 70 75 80
Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Gly Gly
85 90 95
Ser Gly Gly Ser Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala
100 105 110
Pro Gln Leu Pro Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr
115 120 125
Val Asn Asp Ala Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly
130 135 140
<210> 51
<211> 120
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 51
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
1 5 10 15
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
20 25 30
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
35 40 45
Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn
50 55 60
Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu
65 70 75 80
Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Gly Gly
85 90 95
Ser Gly Gly Ser Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala
100 105 110
Pro Gln Leu Pro Ala Tyr Asn Gly
115 120
<210> 52
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 52
Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu
1 5 10 15
Ser Lys Val Phe Ser Ser Gly Gly
20
<210> 53
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 53
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
1 5 10 15
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
20 25 30
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
35 40 45
Leu Phe Met Arg Asp Asn
50
<210> 54
<211> 90
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 54
Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys
1 5 10 15
Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys
20 25 30
Met Thr Val Val Pro Pro Glu Gly Gly Gly Ser Gly Gly Ser Gly Ser
35 40 45
Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr
50 55 60
Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly
65 70 75 80
Leu Glu Ser Lys Val Phe Ser Ser Gly Gly
85 90
<210> 55
<211> 447
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 55
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Arg Ser Ala Asn Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Thr Asn Gln Asn Arg Ile Thr His Thr Lys Ile His Thr Gly Ser
145 150 155 160
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Asp Pro Leu Lys
195 200 205
Glu His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
245 250 255
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
260 265 270
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
275 280 285
Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn
290 295 300
Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu
305 310 315 320
Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Gly Gly
325 330 335
Ser Gly Gly Ser Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala
340 345 350
Pro Gln Leu Pro Ala Tyr Asn Gly Ser Gly Gly Ser Thr Asn Leu Ser
355 360 365
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
370 375 380
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
385 390 395 400
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
405 410 415
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
420 425 430
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
435 440 445
<210> 56
<211> 447
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 56
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
165 170 175
Ala Asn Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Asn Gln Asn Arg Ile
195 200 205
Thr His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
245 250 255
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
260 265 270
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
275 280 285
Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn
290 295 300
Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu
305 310 315 320
Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Gly Gly
325 330 335
Ser Gly Gly Ser Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala
340 345 350
Pro Gln Leu Pro Ala Tyr Asn Gly Ser Gly Gly Ser Thr Asn Leu Ser
355 360 365
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
370 375 380
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
385 390 395 400
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
405 410 415
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
420 425 430
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
435 440 445
<210> 57
<211> 351
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 57
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Asp Ile Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asn Leu Ala Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
195 200 205
Lys His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu
245 250 255
Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
260 265 270
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
275 280 285
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
290 295 300
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
305 310 315 320
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
325 330 335
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
340 345 350
<210> 58
<211> 359
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 58
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly His Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Asn Arg His Asp Arg Ala Lys His Thr Lys Ile His
85 90 95
Thr Pro Asn Pro His Arg Arg Thr Asp Pro Ser His Lys Pro Phe Gln
100 105 110
Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asp Arg Thr Lys
115 120 125
His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys
130 135 140
Gly Arg Lys Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile
145 150 155 160
His Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile
165 170 175
Cys Met Arg Asn Phe Ser Asp Arg Ser Thr Arg Ile Thr His Ile Arg
180 185 190
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
195 200 205
Phe Ala Gln Asn Ala Thr Arg Ile Asn His Thr Lys Ile His Leu Arg
210 215 220
Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg Gly Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Gly Ser Gln Thr Val Gly Thr Phe Tyr Tyr
245 250 255
Val Asn Asp Ala Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly
260 265 270
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
275 280 285
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
290 295 300
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
305 310 315 320
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
325 330 335
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
340 345 350
Glu Asn Lys Ile Lys Met Leu
355
<210> 59
<211> 351
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 59
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Arg Ser Ala Asn Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Thr Asn Gln Asn Arg Ile Thr His Thr Lys Ile His Thr Gly Ser
145 150 155 160
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Asp Pro Leu Lys
195 200 205
Glu His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu
245 250 255
Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
260 265 270
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
275 280 285
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
290 295 300
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
305 310 315 320
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
325 330 335
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
340 345 350
<210> 60
<211> 351
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 60
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
165 170 175
Ala Asn Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Asn Gln Asn Arg Ile
195 200 205
Thr His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu
245 250 255
Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
260 265 270
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
275 280 285
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
290 295 300
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
305 310 315 320
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
325 330 335
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
340 345 350
<210> 61
<211> 447
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 61
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Asp Ile Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asn Leu Ala Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
195 200 205
Lys His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
245 250 255
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
260 265 270
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
275 280 285
Leu Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn
290 295 300
Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu
305 310 315 320
Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Gly Gly
325 330 335
Ser Gly Gly Ser Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala
340 345 350
Pro Gln Leu Pro Ala Tyr Asn Gly Ser Gly Gly Ser Thr Asn Leu Ser
355 360 365
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
370 375 380
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
385 390 395 400
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
405 410 415
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
420 425 430
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
435 440 445
<210> 62
<211> 455
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 62
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly His Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Asn Arg His Asp Arg Ala Lys His Thr Lys Ile His
85 90 95
Thr Pro Asn Pro His Arg Arg Thr Asp Pro Ser His Lys Pro Phe Gln
100 105 110
Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asp Arg Thr Lys
115 120 125
His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys
130 135 140
Gly Arg Lys Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile
145 150 155 160
His Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile
165 170 175
Cys Met Arg Asn Phe Ser Asp Arg Ser Thr Arg Ile Thr His Ile Arg
180 185 190
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
195 200 205
Phe Ala Gln Asn Ala Thr Arg Ile Asn His Thr Lys Ile His Leu Arg
210 215 220
Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg Gly Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Gly Ser Ala Ile Pro Val Lys Arg Gly Ala
245 250 255
Thr Gly Glu Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser
260 265 270
Pro Thr Lys Gly Gly Cys Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala
275 280 285
Gly His Val Glu Gly Gln Ser Ala Leu Phe Met Arg Asp Asn Gly Ile
290 295 300
Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys Gly Phe
305 310 315 320
Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys Met Thr
325 330 335
Val Val Pro Pro Glu Gly Gly Gly Ser Gly Gly Ser Gly Ser Tyr Ala
340 345 350
Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr Asn Gly
355 360 365
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
370 375 380
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
385 390 395 400
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
405 410 415
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
420 425 430
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
435 440 445
Glu Asn Lys Ile Lys Met Leu
450 455
<210> 63
<211> 381
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 63
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Arg Ser Ala Asn Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Thr Asn Gln Asn Arg Ile Thr His Thr Lys Ile His Thr Gly Ser
145 150 155 160
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Asp Pro Leu Lys
195 200 205
Glu His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
245 250 255
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
260 265 270
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
275 280 285
Leu Phe Met Arg Asp Asn Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile
290 295 300
Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
305 310 315 320
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
325 330 335
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
340 345 350
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
355 360 365
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
370 375 380
<210> 64
<211> 381
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 64
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
165 170 175
Ala Asn Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Asn Gln Asn Arg Ile
195 200 205
Thr His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
245 250 255
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
260 265 270
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
275 280 285
Leu Phe Met Arg Asp Asn Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile
290 295 300
Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
305 310 315 320
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
325 330 335
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
340 345 350
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
355 360 365
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
370 375 380
<210> 65
<211> 417
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 65
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Asp Ile Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asn Leu Ala Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
195 200 205
Lys His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys
245 250 255
Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys
260 265 270
Met Thr Val Val Pro Pro Glu Gly Gly Gly Ser Gly Gly Ser Gly Ser
275 280 285
Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr
290 295 300
Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly
305 310 315 320
Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn
325 330 335
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
340 345 350
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
355 360 365
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
370 375 380
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
385 390 395 400
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
405 410 415
Leu
<210> 66
<211> 425
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 66
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly His Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Asn Arg His Asp Arg Ala Lys His Thr Lys Ile His
85 90 95
Thr Pro Asn Pro His Arg Arg Thr Asp Pro Ser His Lys Pro Phe Gln
100 105 110
Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asp Arg Thr Lys
115 120 125
His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys
130 135 140
Gly Arg Lys Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile
145 150 155 160
His Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile
165 170 175
Cys Met Arg Asn Phe Ser Asp Arg Ser Thr Arg Ile Thr His Ile Arg
180 185 190
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
195 200 205
Phe Ala Gln Asn Ala Thr Arg Ile Asn His Thr Lys Ile His Leu Arg
210 215 220
Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg Gly Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Gly Ser Gly Ile Ser Glu Gly Leu Val Phe
245 250 255
His Asn Asn Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu
260 265 270
Thr Leu Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly
275 280 285
Gly Gly Ser Gly Gly Ser Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile
290 295 300
Ser Ala Pro Gln Leu Pro Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe
305 310 315 320
Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu Ser Lys Val Phe Ser Ser
325 330 335
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
340 345 350
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
355 360 365
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
370 375 380
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
385 390 395 400
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
405 410 415
Asn Gly Glu Asn Lys Ile Lys Met Leu
420 425
<210> 67
<211> 417
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 67
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Ser Asp Leu Arg Arg His Thr Lys Ile His
85 90 95
Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile Cys
100 105 110
Met Arg Asn Phe Ser Arg Ser Ala Asn Leu Ala Arg His Ile Arg Thr
115 120 125
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
130 135 140
Ala Thr Asn Gln Asn Arg Ile Thr His Thr Lys Ile His Thr Gly Ser
145 150 155 160
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Asp Pro Leu Lys
195 200 205
Glu His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys
245 250 255
Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys
260 265 270
Met Thr Val Val Pro Pro Glu Gly Gly Gly Ser Gly Gly Ser Gly Ser
275 280 285
Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr
290 295 300
Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly
305 310 315 320
Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn
325 330 335
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
340 345 350
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
355 360 365
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
370 375 380
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
385 390 395 400
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
405 410 415
Leu
<210> 68
<211> 417
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 68
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Ala Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Leu Lys Gln His Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Ser
130 135 140
Asp Leu Arg Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
165 170 175
Ala Asn Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Asn Gln Asn Arg Ile
195 200 205
Thr His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys
245 250 255
Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys
260 265 270
Met Thr Val Val Pro Pro Glu Gly Gly Gly Ser Gly Gly Ser Gly Ser
275 280 285
Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr
290 295 300
Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly
305 310 315 320
Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn
325 330 335
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
340 345 350
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
355 360 365
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
370 375 380
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
385 390 395 400
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
405 410 415
Leu
<210> 69
<211> 381
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 69
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His
85 90 95
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
100 105 110
Ser Asp Ile Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu
115 120 125
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
130 135 140
Asn Leu Ala Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
145 150 155 160
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
165 170 175
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
180 185 190
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala
195 200 205
Lys His Thr Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys
210 215 220
Ser Glu Ala Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Ala Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
245 250 255
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Pro Thr
260 265 270
Pro Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala
275 280 285
Leu Phe Met Arg Asp Asn Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile
290 295 300
Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
305 310 315 320
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
325 330 335
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
340 345 350
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
355 360 365
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
370 375 380
<210> 70
<211> 389
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 70
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Ala Glu Arg Pro Phe Gln Cys
35 40 45
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly His Leu Ala Arg His
50 55 60
Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly
65 70 75 80
Arg Lys Phe Ala Asn Arg His Asp Arg Ala Lys His Thr Lys Ile His
85 90 95
Thr Pro Asn Pro His Arg Arg Thr Asp Pro Ser His Lys Pro Phe Gln
100 105 110
Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asp Arg Thr Lys
115 120 125
His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys
130 135 140
Gly Arg Lys Phe Ala Gln Ser Gly Ser Leu Thr Arg His Thr Lys Ile
145 150 155 160
His Thr His Pro Arg Ala Pro Ile Pro Lys Pro Phe Gln Cys Arg Ile
165 170 175
Cys Met Arg Asn Phe Ser Asp Arg Ser Thr Arg Ile Thr His Ile Arg
180 185 190
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys
195 200 205
Phe Ala Gln Asn Ala Thr Arg Ile Asn His Thr Lys Ile His Leu Arg
210 215 220
Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg Gly Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Gly Ser Ala Ile Pro Val Lys Arg Gly Ala
245 250 255
Thr Gly Glu Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser
260 265 270
Pro Thr Lys Gly Gly Cys Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala
275 280 285
Gly His Val Glu Gly Gln Ser Ala Leu Phe Met Arg Asp Asn Ser Gly
290 295 300
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
305 310 315 320
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
325 330 335
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
340 345 350
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
355 360 365
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
370 375 380
Lys Ile Lys Met Leu
385
<210> 71
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 71
Gly Gly Gly Gly Ser
1 5
<210> 72
<211> 1427
<212> PRT
<213> Burkholderia cenocepacia
<400> 72
Met Tyr Glu Ala Ala Arg Val Thr Asp Pro Ile Asp His Thr Ser Ala
1 5 10 15
Leu Ala Gly Phe Leu Val Gly Ala Val Leu Gly Ile Ala Leu Ile Ala
20 25 30
Ala Val Ala Phe Ala Thr Phe Thr Cys Gly Phe Gly Val Ala Leu Leu
35 40 45
Ala Gly Met Met Ala Gly Ile Gly Ala Gln Ala Leu Leu Ser Ile Gly
50 55 60
Glu Ser Ile Gly Lys Met Phe Ser Ser Gln Ser Gly Asn Ile Ile Thr
65 70 75 80
Gly Ser Pro Asp Val Tyr Val Asn Ser Leu Ser Ala Ala Tyr Ala Thr
85 90 95
Leu Ser Gly Val Ala Cys Ser Lys His Asn Pro Ile Pro Leu Val Ala
100 105 110
Gln Gly Ser Thr Asn Ile Phe Ile Asn Gly Arg Pro Ala Ala Arg Lys
115 120 125
Asp Asp Lys Ile Thr Cys Gly Ala Thr Ile Gly Asp Gly Ser His Asp
130 135 140
Thr Phe Phe His Gly Gly Thr Gln Thr Tyr Leu Pro Val Asp Asp Glu
145 150 155 160
Val Pro Pro Trp Leu Arg Thr Ala Thr Asp Trp Ala Phe Thr Leu Ala
165 170 175
Gly Leu Val Gly Gly Leu Gly Gly Leu Leu Lys Ala Ser Gly Gly Leu
180 185 190
Ser Arg Ala Val Leu Pro Cys Ala Ala Lys Phe Ile Gly Gly Tyr Val
195 200 205
Leu Gly Glu Ala Phe Gly Arg Tyr Val Ala Gly Pro Ala Ile Asn Lys
210 215 220
Ala Ile Gly Gly Leu Phe Gly Asn Pro Ile Asp Val Thr Thr Gly Arg
225 230 235 240
Lys Ile Leu Leu Ala Glu Ser Glu Thr Asp Tyr Val Ile Pro Ser Pro
245 250 255
Leu Pro Val Ala Ile Lys Arg Phe Tyr Ser Ser Gly Ile Asp Tyr Ala
260 265 270
Gly Thr Leu Gly Arg Gly Trp Val Leu Pro Trp Glu Ile Arg Leu His
275 280 285
Ala Arg Asp Gly Arg Leu Trp Tyr Thr Asp Ala Gln Gly Arg Glu Ser
290 295 300
Gly Phe Pro Met Leu Arg Ala Gly Gln Ala Ala Phe Ser Glu Ala Asp
305 310 315 320
Gln Arg Tyr Leu Thr Arg Thr Pro Asp Gly Arg Tyr Ile Leu His Asp
325 330 335
Leu Gly Glu Arg Tyr Tyr Asp Phe Gly Gln Tyr Asp Pro Glu Ser Gly
340 345 350
Arg Ile Ala Trp Val Arg Arg Val Glu Asp Gln Ala Gly Gln Trp Tyr
355 360 365
Gln Phe Glu Arg Asp Ser Arg Gly Arg Val Thr Glu Ile Leu Thr Cys
370 375 380
Gly Gly Leu Arg Ala Val Leu Asp Tyr Glu Thr Val Phe Gly Arg Leu
385 390 395 400
Gly Thr Val Thr Leu Val His Glu Asp Glu Arg Arg Leu Ala Val Thr
405 410 415
Tyr Gly Tyr Asp Glu Asn Gly Gln Leu Ala Ser Val Thr Asp Ala Asn
420 425 430
Gly Ala Gly Val Arg Gln Phe Ala Tyr Thr Asn Gly Leu Met Thr Asn
435 440 445
His Met Asn Ala Leu Gly Phe Thr Ser Ser Tyr Val Trp Ser Lys Ile
450 455 460
Glu Gly Glu Pro Arg Val Val Glu Thr His Thr Ser Glu Gly Glu Asn
465 470 475 480
Trp Thr Phe Glu Tyr Asp Val Ala Gly Arg Gln Thr Arg Val Arg His
485 490 495
Ala Asp Gly Arg Thr Ala His Trp Arg Phe Asp Ala Gln Ser Gln Ile
500 505 510
Val Glu Tyr Thr Asp Leu Asp Gly Ala Phe Tyr Arg Ile Lys Tyr Asp
515 520 525
Ala Val Gly Met Pro Val Met Leu Met Leu Pro Gly Asp Arg Thr Val
530 535 540
Met Phe Glu Tyr Asp Asp Ala Gly Arg Ile Ile Ala Glu Thr Asp Pro
545 550 555 560
Leu Gly Arg Thr Thr Arg Thr Arg Tyr Asp Gly Asn Ser Leu Arg Pro
565 570 575
Val Glu Val Val Gly Pro Asp Gly Gly Ala Trp Arg Val Glu Tyr Asp
580 585 590
Gln Gln Gly Arg Val Val Ser Asn Gln Asp Ser Leu Gly Arg Glu Asn
595 600 605
Arg Tyr Glu Tyr Pro Lys Ala Leu Thr Ala Leu Pro Ser Ala His Ile
610 615 620
Asp Ala Leu Gly Gly Arg Lys Thr Leu Glu Trp Asn Ser Leu Gly Lys
625 630 635 640
Leu Val Gly Tyr Thr Asp Cys Ser Gly Lys Thr Thr Arg Thr Ser Phe
645 650 655
Asp Ala Phe Gly Arg Ile Cys Ser Arg Glu Asn Ala Leu Gly Gln Arg
660 665 670
Ile Thr Tyr Asp Val Arg Pro Thr Gly Glu Pro Arg Arg Val Thr Tyr
675 680 685
Pro Asp Gly Ser Ser Glu Thr Phe Glu Tyr Asp Ala Ala Gly Thr Leu
690 695 700
Val Arg Tyr Ile Gly Leu Gly Gly Arg Val Gln Glu Leu Leu Arg Asn
705 710 715 720
Ala Arg Gly Gln Leu Ile Glu Ala Val Asp Pro Ala Gly Arg Arg Val
725 730 735
Gln Tyr Arg Tyr Asp Val Glu Gly Arg Leu Arg Glu Leu Gln Gln Asp
740 745 750
His Ala Arg Tyr Thr Phe Thr Tyr Ser Ala Gly Gly Arg Leu Leu Thr
755 760 765
Glu Thr Arg Pro Asp Gly Ile Leu Arg Arg Phe Glu Tyr Gly Glu Ala
770 775 780
Gly Glu Leu Leu Gly Leu Asp Ile Val Gly Ala Pro Asp Pro His Ala
785 790 795 800
Thr Gly Asn Arg Ser Val Arg Thr Ile Arg Phe Glu Arg Asp Arg Met
805 810 815
Gly Val Leu Lys Val Gln Arg Thr Pro Thr Glu Val Thr Arg Tyr Gln
820 825 830
His Asp Lys Gly Asp Arg Leu Val Lys Val Glu Arg Val Pro Thr Pro
835 840 845
Ser Gly Ile Ala Leu Gly Ile Val Pro Asp Ala Val Glu Phe Glu Tyr
850 855 860
Asp Lys Gly Gly Arg Leu Val Ala Glu His Gly Ser Asn Gly Ser Val
865 870 875 880
Ile Tyr Thr Leu Asp Glu Leu Asp Asn Val Val Ser Leu Gly Leu Pro
885 890 895
His Asp Gln Thr Leu Gln Met Leu Arg Tyr Gly Ser Gly His Val His
900 905 910
Gln Ile Arg Phe Gly Asp Gln Val Val Ala Asp Phe Glu Arg Asp Asp
915 920 925
Leu His Arg Glu Val Ser Arg Thr Gln Gly Arg Leu Thr Gln Arg Ser
930 935 940
Gly Tyr Asp Pro Leu Gly Arg Lys Val Trp Gln Ser Ala Gly Ile Asp
945 950 955 960
Pro Glu Met Leu Gly Arg Gly Ser Gly Gln Leu Trp Arg Asn Tyr Gly
965 970 975
Tyr Asp Ala Ala Gly Asp Leu Ile Glu Thr Ser Asp Ser Leu Arg Gly
980 985 990
Ser Thr Arg Phe Ser Tyr Asp Pro Ala Gly Arg Leu Ile Ser Arg Ala
995 1000 1005
Asn Pro Leu Asp Arg Lys Phe Glu Glu Phe Ala Trp Asp Ala Ala
1010 1015 1020
Gly Asn Leu Leu Asp Asp Ala Gln Arg Lys Ser Arg Gly Tyr Val
1025 1030 1035
Glu Gly Asn Arg Leu Leu Met Trp Gln Asp Leu Arg Phe Glu Tyr
1040 1045 1050
Asp Pro Phe Gly Asn Leu Ala Thr Lys Arg Arg Gly Ala Asn Gln
1055 1060 1065
Thr Gln Arg Phe Thr Tyr Asp Gly Gln Asp Arg Leu Ile Thr Val
1070 1075 1080
His Thr Gln Asp Val Arg Gly Val Val Glu Thr Arg Phe Ala Tyr
1085 1090 1095
Asp Pro Leu Gly Arg Arg Ile Ala Lys Thr Asp Thr Ala Phe Asp
1100 1105 1110
Leu Arg Gly Met Lys Leu Arg Ala Glu Thr Lys Arg Phe Val Trp
1115 1120 1125
Glu Gly Leu Arg Leu Val Gln Glu Val Arg Glu Thr Gly Val Ser
1130 1135 1140
Ser Tyr Val Tyr Ser Pro Asp Ala Pro Tyr Ser Pro Val Ala Arg
1145 1150 1155
Ala Asp Thr Val Met Ala Glu Ala Leu Ala Ala Thr Val Ile Asp
1160 1165 1170
Ser Ala Lys Arg Ala Ala Arg Ile Phe His Phe His Thr Asp Pro
1175 1180 1185
Val Gly Ala Leu Gln Glu Val Thr Asp Glu Ala Gly Glu Val Ala
1190 1195 1200
Trp Ala Gly Gln Tyr Ala Ala Trp Gly Lys Val Glu Ala Thr Asn
1205 1210 1215
Arg Gly Val Thr Ala Ala Arg Thr Asp Gln Pro Leu Arg Phe Ala
1220 1225 1230
Gly Gln Tyr Ala Asp Asp Ser Thr Gly Leu His Tyr Asn Thr Phe
1235 1240 1245
Arg Phe Tyr Asp Pro Asp Val Gly Arg Phe Ile Asn Gln Asp Pro
1250 1255 1260
Ile Gly Leu Asn Gly Gly Ala Asn Val Tyr His Tyr Ala Pro Asn
1265 1270 1275
Pro Val Gly Trp Val Asp Pro Trp Gly Leu Ala Gly Ser Tyr Ala
1280 1285 1290
Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr Asn
1295 1300 1305
Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly
1310 1315 1320
Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Pro Thr Pro Tyr Pro
1325 1330 1335
Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala Leu Phe
1340 1345 1350
Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn
1355 1360 1365
Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu
1370 1375 1380
Leu Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala
1385 1390 1395
Ile Pro Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr
1400 1405 1410
Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys
1415 1420 1425
<210> 73
<211> 123
<212> PRT
<213> Burkholderia cenocepacia
<400> 73
Met Tyr Ala Asp Asp Phe Asp Gly Glu Ile Glu Ile Asp Glu Val Asp
1 5 10 15
Ser Leu Val Glu Phe Leu Ser Arg Arg Pro Ala Phe Asp Ala Asn Asn
20 25 30
Phe Val Leu Thr Phe Glu Glu Ser Gly Phe Pro Gln Leu Asn Ile Phe
35 40 45
Ala Lys Asn Asp Ile Ala Val Val Tyr Tyr Met Asp Ile Gly Glu Asn
50 55 60
Phe Val Ser Lys Gly Asn Ser Ala Ser Gly Gly Thr Glu Lys Phe Tyr
65 70 75 80
Glu Asn Lys Leu Gly Gly Glu Val Asp Leu Ser Lys Asp Cys Val Val
85 90 95
Ser Lys Glu Gln Met Ile Glu Ala Ala Lys Gln Phe Phe Ala Thr Lys
100 105 110
Gln Arg Pro Glu Gln Leu Thr Trp Ser Glu Leu
115 120
<210> 74
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(37)
<223> a, c, t, g, unknown or other
<400> 74
acactctttc cctacacgac gctcttccga tctnnnncaa gtgtgatcac ttgggtgg 58
<210> 75
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 75
tggagttcag acgtgtgctc ttccgatctg gattcccgag tagcagatg 49
<210> 76
<211> 214
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(4)
<223> a, c, t, g, unknown or other
<400> 76
nnnncaagtg tgatcacttg ggtggtggct gtgtttgcgt ctctcccagg aatcatcttt 60
accagatctc aaaaagaagg tcttcattac acctgcagct ctcattttcc atacagtcag 120
tatcaattct ggaagaattt ccagacatta aagatagtca tcttggggct ggtcctgccg 180
ctgcttgtca tggtcatctg ctactcggga atcc 214
<210> 77
<211> 626
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 77
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Gly Gln Leu Val Lys Ser Glu
35 40 45
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
50 55 60
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
65 70 75 80
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
85 90 95
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
100 105 110
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
115 120 125
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
130 135 140
Glu Arg Tyr Val Glu Glu Asn Gln Thr Arg Asp Lys His Leu Asn Pro
145 150 155 160
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
165 170 175
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
180 185 190
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
195 200 205
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
210 215 220
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ser Gly
225 230 235 240
Ala Gln Gly Ser Thr Leu Asp Phe Arg Pro Phe Gln Cys Arg Ile Cys
245 250 255
Met Arg Asn Phe Ser Asp Arg Ser Asn Leu Ser Arg His Ile Arg Thr
260 265 270
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
275 280 285
Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His Thr Gly Ser
290 295 300
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Ile
305 310 315 320
Gly Tyr Arg Ala Ala His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
325 330 335
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Asn Leu Ala
340 345 350
Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile Pro Lys Pro
355 360 365
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly His Leu
370 375 380
Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
385 390 395 400
Ile Cys Gly Arg Lys Phe Ala Asn Arg His Asp Arg Ala Lys His Thr
405 410 415
Lys Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala
420 425 430
Ala Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Pro Thr Pro
435 440 445
Tyr Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala Leu
450 455 460
Phe Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn
465 470 475 480
Pro Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu
485 490 495
Pro Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala Ile Pro
500 505 510
Val Lys Arg Gly Ala Thr Gly Glu Thr Lys Val Phe Thr Gly Asn Ser
515 520 525
Asn Ser Pro Lys Ser Pro Thr Lys Gly Gly Cys Ser Gly Gly Ser Thr
530 535 540
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
545 550 555 560
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly
565 570 575
Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser
580 585 590
Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys
595 600 605
Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys
610 615 620
Met Leu
625
<210> 78
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 78
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Gly Gln Leu Val Lys Ser Glu
35 40 45
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
50 55 60
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
65 70 75 80
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
85 90 95
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asn Gly Ala Ile
100 105 110
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
115 120 125
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
130 135 140
Gln Arg Tyr Val Lys Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
145 150 155 160
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
165 170 175
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
180 185 190
Arg Leu Asn Arg Lys Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
195 200 205
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
210 215 220
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ser Gly
225 230 235 240
Ala Gln Gly Ser Thr Leu Asp Phe Arg Pro Phe Gln Cys Arg Ile Cys
245 250 255
Met Arg Asn Phe Ser Cys Ser Asn Asn Leu Pro Thr His Ile Arg Thr
260 265 270
His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe
275 280 285
Ala Asp Arg Ser Asn Leu Thr Arg His Thr Lys Ile His Thr Gly Ser
290 295 300
Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr Ser
305 310 315 320
Gly Asn Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
325 330 335
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ala Glu Asn Leu Lys
340 345 350
Ser His Thr Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile
355 360 365
Cys Met Arg Lys Phe Ala Asp Arg Ser Thr Leu Arg Gln His Thr Lys
370 375 380
Ile His Leu Arg Gln Lys Asp
385 390
<210> 79
<211> 543
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 79
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Gly Gln Leu Val Lys Ser Glu
35 40 45
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
50 55 60
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
65 70 75 80
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
85 90 95
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
100 105 110
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
115 120 125
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
130 135 140
Glu Arg Tyr Val Glu Glu Asn Gln Thr Arg Asp Lys His Leu Asn Pro
145 150 155 160
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
165 170 175
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
180 185 190
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
195 200 205
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
210 215 220
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ser Gly
225 230 235 240
Ala Gln Gly Ser Thr Leu Asp Phe Arg Pro Phe Gln Cys Arg Ile Cys
245 250 255
Met Arg Lys Phe Ala Gln Ser Gly Asn Arg Thr Thr His Thr Lys Ile
260 265 270
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
275 280 285
Ser Thr Ser Ser Asn Arg Lys Thr His Ile Arg Thr His Thr Gly Glu
290 295 300
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Ala Gln Trp
305 310 315 320
Thr Arg Ala Cys His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe
325 330 335
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Leu Arg His His Leu Thr
340 345 350
Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile
355 360 365
Cys Gly Arg Lys Phe Ala Asp Arg Thr Gly Leu Arg Ser His Thr Lys
370 375 380
Ile His Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala
385 390 395 400
Ala Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser Tyr Ala
405 410 415
Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr Asn Gly
420 425 430
Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu
435 440 445
Ser Lys Val Phe Ser Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
450 455 460
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser
465 470 475 480
Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
485 490 495
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
500 505 510
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
515 520 525
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
530 535 540
<210> 80
<211> 395
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 80
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Met Gly Gln Leu Val Lys Ser Glu
35 40 45
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
50 55 60
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
65 70 75 80
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
85 90 95
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asn Gly Ala Ile
100 105 110
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
115 120 125
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
130 135 140
Gln Arg Tyr Val Lys Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
145 150 155 160
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
165 170 175
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
180 185 190
Arg Leu Asn Arg Lys Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
195 200 205
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
210 215 220
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Ser Gly
225 230 235 240
Ala Gln Gly Ser Thr Leu Asp Phe Arg Pro Phe Gln Cys Arg Ile Cys
245 250 255
Met Arg Lys Phe Ala Arg Asn Ala Asp Arg Lys Lys His Thr Lys Ile
260 265 270
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
275 280 285
Ser Thr Ser Ser Asn Arg Lys Thr His Ile Arg Thr His Thr Gly Glu
290 295 300
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
305 310 315 320
His Leu Ser Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
325 330 335
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg
340 345 350
Ser Ala Leu Ser Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
355 360 365
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Ser Ser Asn Arg Lys
370 375 380
Thr His Thr Lys Ile His Leu Arg Gln Lys Asp
385 390 395
<210> 81
<211> 164
<212> PRT
<213> Burkholderia cenocepacia
<400> 81
Ile Gly Leu Asn Gly Gly Ala Asn Val Tyr His Tyr Ala Pro Asn Pro
1 5 10 15
Val Gly Trp Val Asp Pro Trp Gly Leu Ala Gly Ser Tyr Ala Leu Gly
20 25 30
Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro Ala Tyr Asn Gly Gln Thr
35 40 45
Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala Gly Gly Leu Glu Ser Lys
50 55 60
Val Phe Ser Ser Gly Gly Pro Thr Pro Tyr Pro Asn Tyr Ala Asn Ala
65 70 75 80
Gly His Val Glu Gly Gln Ser Ala Leu Phe Met Arg Asp Asn Gly Ile
85 90 95
Ser Glu Gly Leu Val Phe His Asn Asn Pro Glu Gly Thr Cys Gly Phe
100 105 110
Cys Val Asn Met Thr Glu Thr Leu Leu Pro Glu Asn Ala Lys Met Thr
115 120 125
Val Val Pro Pro Glu Gly Ala Ile Pro Val Lys Arg Gly Ala Thr Gly
130 135 140
Glu Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr
145 150 155 160
Lys Gly Gly Cys
<210> 82
<211> 115
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 82
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
1 5 10 15
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
20 25 30
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Pro Thr Pro Tyr
35 40 45
Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala Leu Phe
50 55 60
Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro
65 70 75 80
Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro
85 90 95
Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala Ile Pro Val
100 105 110
Lys Arg Gly
115
<210> 83
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 83
Ala Thr Gly Glu Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys
1 5 10 15
Ser Pro Thr Lys Gly Gly Cys
20
<210> 84
<211> 118
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 84
Gly Ser Tyr Ala Leu Gly Pro Tyr Gln Ile Ser Ala Pro Gln Leu Pro
1 5 10 15
Ala Tyr Asn Gly Gln Thr Val Gly Thr Phe Tyr Tyr Val Asn Asp Ala
20 25 30
Gly Gly Leu Glu Ser Lys Val Phe Ser Ser Gly Gly Pro Thr Pro Tyr
35 40 45
Pro Asn Tyr Ala Asn Ala Gly His Val Glu Gly Gln Ser Ala Leu Phe
50 55 60
Met Arg Asp Asn Gly Ile Ser Glu Gly Leu Val Phe His Asn Asn Pro
65 70 75 80
Glu Gly Thr Cys Gly Phe Cys Val Asn Met Thr Glu Thr Leu Leu Pro
85 90 95
Glu Asn Ala Lys Met Thr Val Val Pro Pro Glu Gly Ala Ile Pro Val
100 105 110
Lys Arg Gly Ala Thr Gly
115
<210> 85
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 85
Glu Thr Lys Val Phe Thr Gly Asn Ser Asn Ser Pro Lys Ser Pro Thr
1 5 10 15
Lys Gly Gly Cys
20
<210> 86
<211> 2358
<212> PRT
<213> Streptomyces rubrolavendulae
<400> 86
Met Ser Ser Ser Asp Ala Gly Arg Ala Phe Gly Val Pro Glu Asn Val
1 5 10 15
Leu Ala Arg Phe Thr Arg Tyr Pro Gly Gly Ala Arg Arg Arg Ala Gly
20 25 30
Arg Thr Ala Arg Ala Arg Arg Leu Gly Ile Val Leu Ser Ala Val Leu
35 40 45
Ser Ala Thr Leu Leu Pro Ala Glu Ala Trp Ala Ile Ala Pro Pro Ala
50 55 60
Pro Arg Thr Gly Pro Thr Leu Asp Ala Leu Gln Gln Glu Glu Glu Val
65 70 75 80
Asp Pro Asp Pro Ala Ala Met Glu Glu Leu Asp Asp Trp Asp Gly Gly
85 90 95
Pro Val Glu Pro Pro Ala Asp Tyr Thr Pro Thr Glu Val Thr Pro Pro
100 105 110
Thr Gly Gly Thr Ala Pro Val Pro Leu Asp Ser Ala Gly Glu Glu Leu
115 120 125
Val Pro Ala Gly Thr Leu Pro Val Arg Ile Gly Gln Ala Ser Pro Thr
130 135 140
Glu Glu Asp Pro Ala Pro Pro Ala Pro Ser Gly Thr Trp Asp Val Thr
145 150 155 160
Val Glu Pro Arg Ala Thr Thr Glu Ala Ala Ala Val Asp Gly Ala Ile
165 170 175
Ile Lys Leu Thr Pro Pro Ala Ser Gly Ser Thr Pro Val Asp Val Glu
180 185 190
Leu Asp Tyr Gly Arg Phe Glu Asp Leu Phe Gly Thr Glu Trp Ser Ser
195 200 205
Arg Leu Lys Leu Thr Gln Leu Pro Glu Cys Phe Leu Thr Thr Pro Glu
210 215 220
Leu Glu Glu Cys Gly Thr Pro Ile Thr Ile Pro Thr Ser Asn Asp Pro
225 230 235 240
Ala Thr Gly Thr Val Arg Ala Thr Val Asp Pro Ala Asp Gly Gln Pro
245 250 255
Gln Gly Leu Ala Ala Gln Ser Gly Gly Gly Pro Ala Val Leu Ala Ala
260 265 270
Thr Asp Ser Ala Ser Gly Ala Gly Gly Thr Tyr Lys Ala Thr Ser Leu
275 280 285
Ser Ala Thr Gly Ser Trp Thr Ala Gly Gly Ser Gly Gly Gly Phe Ser
290 295 300
Trp Ser Tyr Pro Leu Thr Ile Pro Asp Thr Pro Ala Gly Pro Ala Pro
305 310 315 320
Lys Ile Ser Leu Ser Tyr Ser Ser Gln Ser Val Asp Gly Arg Thr Ser
325 330 335
Val Ala Asn Gly Gln Ala Ser Trp Ile Gly Asp Gly Trp Asp Tyr His
340 345 350
Pro Gly Phe Val Glu Arg Arg Tyr Arg Ser Cys Asn Asp Asp Arg Ser
355 360 365
Gly Thr Pro Asn Asn Asp Asn Ser Ala Asp Lys Glu Lys Ser Asp Leu
370 375 380
Cys Trp Ala Ser Asp Asn Val Val Met Ser Leu Gly Gly Ser Thr Thr
385 390 395 400
Glu Leu Val Arg Asp Asp Thr Thr Gly Thr Trp Val Ala Gln Asn Asp
405 410 415
Thr Gly Ala Arg Ile Glu Tyr Lys Asp Lys Asp Gly Gly Ala Leu Ala
420 425 430
Ala Gln Thr Ala Gly Tyr Asp Gly Glu His Trp Val Val Thr Thr Arg
435 440 445
Asp Gly Thr Arg Tyr Trp Phe Gly Arg Asn Thr Leu Pro Gly Arg Gly
450 455 460
Ala Pro Thr Asn Ser Ala Leu Thr Val Pro Val Phe Gly Asn His Thr
465 470 475 480
Gly Glu Pro Cys His Ala Ala Thr Tyr Ala Ala Ser Ser Cys Thr Gln
485 490 495
Ala Trp Arg Trp Asn Leu Asp Tyr Val Glu Asp Val His Gly Asn Ala
500 505 510
Met Val Val Asp Trp Lys Lys Glu Gln Asn Arg Tyr Ala Lys Asn Glu
515 520 525
Lys Phe Lys Ala Ala Val Ser Tyr Asp Arg Asp Ala Tyr Pro Thr Gln
530 535 540
Ile Leu Tyr Gly Leu Arg Ala Asp Asp Leu Ala Gly Pro Pro Ala Gly
545 550 555 560
Lys Val Val Phe His Ala Ala Pro Arg Cys Leu Glu Ser Ala Ala Thr
565 570 575
Cys Ser Glu Ala Lys Phe Glu Ser Lys Asn Tyr Ala Asp Lys Gln Pro
580 585 590
Trp Trp Asp Thr Pro Ala Thr Leu His Cys Lys Ala Gly Asp Glu Asn
595 600 605
Cys Tyr Val Thr Ser Pro Thr Phe Trp Ser Arg Val Arg Leu Ser Ala
610 615 620
Ile Glu Thr Gln Gly Gln Arg Thr Pro Gly Ser Thr Ala Leu Ser Thr
625 630 635 640
Val Asp Arg Trp Thr Leu His Gln Ser Phe Pro Lys Gln Arg Thr Asp
645 650 655
Thr His Pro Pro Leu Trp Leu Glu Ser Ile Thr Arg Val Gly Phe Gly
660 665 670
Arg Pro Asp Ala Ser Gly Asn Gln Ser Ser Lys Ala Leu Pro Ala Val
675 680 685
Thr Phe Leu Pro Asn Lys Val Asp Met Pro Asn Arg Val Leu Lys Ser
690 695 700
Thr Thr Asp Gln Thr Pro Asp Phe Asp Arg Leu Arg Val Glu Val Ile
705 710 715 720
Arg Thr Glu Thr Gly Gly Glu Thr His Val Thr Tyr Ser Ala Pro Cys
725 730 735
Pro Val Gly Gly Thr Arg Pro Thr Pro Ala Ser Asn Gly Thr Arg Cys
740 745 750
Phe Pro Val His Trp Ser Pro Asp Pro Ala Ala Phe Ser Asp Glu Asn
755 760 765
Leu Asp Lys Ser Gly Tyr Glu Pro Pro Leu Glu Trp Phe Asn Lys Tyr
770 775 780
Val Val Thr Lys Val Thr Glu Met Asp Leu Val Ala Glu Gln Pro Ser
785 790 795 800
Val Glu Thr Val Tyr Thr Tyr Glu Gly Asp Ala Ala Trp Ala Lys Asn
805 810 815
Thr Asp Glu Tyr Gly Lys Pro Ala Leu Arg Thr Tyr Asp Gln Trp Arg
820 825 830
Gly Tyr Ala Ser Val Val Thr Arg Thr Gly Thr Thr Ala Asn Thr Gly
835 840 845
Ala Ala Asp Ala Thr Glu Gln Ser Gln Thr Arg Thr Arg Tyr Phe Arg
850 855 860
Gly Met Ser Gly Asp Ala Gly Arg Ala Lys Val His Val Thr Leu Thr
865 870 875 880
Asp Val Thr Gly Thr Ala Thr Thr Val Glu Asp Leu Leu Pro Tyr Gln
885 890 895
Gly Met Ala Ala Glu Thr Leu Thr Tyr Thr Lys Ala Gly Gly Asp Val
900 905 910
Ala Ala Arg Glu Leu Ala Phe Pro Tyr Ser Arg Lys Thr Ala Ser Arg
915 920 925
Ala Arg Pro Gly Leu Pro Ala Leu Glu Ala Tyr Arg Thr Gly Thr Thr
930 935 940
Arg Thr Asp Ser Ile Gln His Ile Ser Gly Asp Arg Thr Arg Ala Ala
945 950 955 960
Gln Asn His Thr Thr Tyr Asp Asp Ala Tyr Gly Leu Pro Thr Gln Thr
965 970 975
Tyr Ser Leu Thr Leu Ser Pro Asn Asp Ser Gly Thr Leu Val Ala Gly
980 985 990
Asp Glu Arg Cys Thr Val Thr Thr Tyr Val His Asn Thr Ala Ala His
995 1000 1005
Ile Ile Gly Leu Pro Asp Arg Val Arg Ala Thr Thr Gly Asp Cys
1010 1015 1020
Ala Ala Ala Pro Asn Ala Thr Thr Gly Gln Ile Val Ser Asp Ser
1025 1030 1035
Arg Thr Ala Tyr Asp Ala Leu Gly Ala Phe Gly Thr Ala Pro Val
1040 1045 1050
Lys Gly Leu Pro Val Gln Val Asp Thr Ile Ser Gly Gly Gly Thr
1055 1060 1065
Ser Trp Ile Thr Ser Ala Arg Thr Glu Tyr Asp Ala Leu Gly Arg
1070 1075 1080
Ala Thr Lys Val Thr Asp Ala Ala Gly Asn Ser Thr Thr Thr Thr
1085 1090 1095
Tyr Ser Pro Ala Thr Gly Pro Ala Phe Glu Val Thr Val Thr Asn
1100 1105 1110
Ala Ala Gly His Ala Thr Thr Thr Thr Leu Asp Pro Gly Arg Gly
1115 1120 1125
Ser Ala Leu Thr Val Thr Asp Gln Asn Gly Arg Lys Thr Thr Ser
1130 1135 1140
Thr Tyr Asp Glu Leu Gly Arg Ala Thr Gly Val Trp Thr Pro Ser
1145 1150 1155
Arg Pro Val Asn Gln Asp Ala Ser Val Arg Phe Val Tyr Gln Ile
1160 1165 1170
Glu Asp Ser Lys Val Pro Ala Val His Thr Arg Val Leu Arg Asp
1175 1180 1185
Ala Gly Thr Tyr Glu Glu Ser Ile Glu Leu Tyr Asp Gly Phe Leu
1190 1195 1200
Arg Pro Arg Gln Thr Gln Arg Glu Ala Leu Gly Gly Gly Arg Ile
1205 1210 1215
Val Thr Glu Thr Leu Tyr Asn Ala Asn Gly Ser Ala Lys Glu Val
1220 1225 1230
Arg Asp Gly Tyr Leu Ala Glu Gly Glu Pro Ala Arg Glu Leu Phe
1235 1240 1245
Val Pro Leu Ser Leu Asp Gln Val Pro Ser Ala Thr Arg Thr Ala
1250 1255 1260
Tyr Asp Gly Leu Gly Arg Pro Val Arg Thr Thr Thr Leu His Arg
1265 1270 1275
Gly Val Pro Arg His Ser Ala Thr Thr Ala Tyr Gly Gly Asp Trp
1280 1285 1290
Glu Leu Ser Arg Thr Gly Met Ser Pro Asp Gly Thr Thr Pro Leu
1295 1300 1305
Ser Gly Ser Arg Ala Val Lys Ala Thr Thr Asp Ala Leu Gly Arg
1310 1315 1320
Pro Ala Arg Ile Gln His Phe Thr Thr Gln Asn Val Ser Ala Glu
1325 1330 1335
Ser Val Asp Thr Thr Tyr Thr Tyr Asp Pro Arg Gly Pro Leu Ala
1340 1345 1350
Gln Val Thr Asp Ala Gln Gln Asn Thr Trp Thr Tyr Thr Tyr Asp
1355 1360 1365
Ala Arg Gly Arg Lys Thr Ser Ser Thr Asp Pro Asp Ala Gly Ala
1370 1375 1380
Ala Tyr Phe Gly Tyr Asn Ala Leu Asp Gln Gln Val Trp Ser Lys
1385 1390 1395
Asp Asn Gln Gly Arg Leu Gln Tyr Thr Thr Tyr Asp Val Leu Gly
1400 1405 1410
Arg Gln Thr Glu Leu Arg Asp Asp Ser Ala Ser Gly Pro Leu Val
1415 1420 1425
Ala Lys Trp Thr Phe Asp Thr Leu Pro Gly Ala Lys Gly His Pro
1430 1435 1440
Val Ala Ser Thr Arg Tyr Asn Asp Gly Ala Ala Phe Thr Ser Glu
1445 1450 1455
Val Thr Gly Tyr Asp Thr Glu Tyr Arg Pro Thr Gly Asn Lys Val
1460 1465 1470
Thr Ile Pro Ser Thr Pro Met Thr Thr Gly Leu Ala Gly Thr Tyr
1475 1480 1485
Thr Tyr Ala Ser Thr Tyr Thr Pro Thr Gly Lys Val Gln Ser Val
1490 1495 1500
Asp Leu Pro Ala Thr Pro Gly Gly Leu Ala Ala Glu Lys Val Ile
1505 1510 1515
Thr Arg Tyr Asp Gly Glu Asp Ser Pro Thr Thr Met Ser Gly Leu
1520 1525 1530
Ala Trp Tyr Thr Ala Asp Thr Phe Leu Gly Pro Tyr Gly Glu Val
1535 1540 1545
Leu Arg Thr Ala Ser Gly Glu Ala Pro Arg Arg Val Trp Thr Thr
1550 1555 1560
Asn Val Tyr Asp Glu Asp Thr Arg Arg Leu Thr Arg Thr Thr Ala
1565 1570 1575
His Arg Glu Thr Ala Pro His Pro Val Ser Thr Thr Thr Tyr Gly
1580 1585 1590
Tyr Asp Thr Val Gly Asn Ile Thr Ser Ile Ala Asp Gln Gln Pro
1595 1600 1605
Ala Gly Thr Glu Glu Gln Cys Phe Ser Tyr Asp Pro Met Gly Arg
1610 1615 1620
Leu Val His Ala Trp Thr Asp Gly Asn Ser Ala Val Cys Pro Arg
1625 1630 1635
Thr Ser Thr Ala Pro Gly Ala Gly Pro Ala Arg Ala Asp Val Ser
1640 1645 1650
Ala Gly Val Asp Gly Gly Gly Tyr Trp His Ser Tyr Ala Phe Asp
1655 1660 1665
Ala Ile Gly Asn Arg Thr Lys Leu Thr Val His Asp Arg Thr Asp
1670 1675 1680
Ala Ala Leu Asp Asp Thr Tyr Thr Tyr Thr Tyr Gly Lys Thr Leu
1685 1690 1695
Pro Gly Asn Pro Gln Pro Val Gln Pro His Thr Leu Thr Gln Val
1700 1705 1710
Asp Ala Val Leu Asn Glu Pro Gly Ser Arg Val Glu Pro Arg Ser
1715 1720 1725
Thr Tyr Ala Tyr Asp Thr Ser Gly Asn Thr Thr Gln Arg Val Ile
1730 1735 1740
Gly Gly Asp Thr Gln Thr Leu Ala Trp Asp Arg Arg Asn Lys Leu
1745 1750 1755
Thr Ser Val Asp Thr Asn Asn Asp Gly Thr Pro Asp Val Lys Tyr
1760 1765 1770
Leu Tyr Asp Ala Ser Gly Asn Arg Leu Val Glu Asp Asp Gly Thr
1775 1780 1785
Thr Arg Thr Leu Phe Leu Gly Glu Ala Glu Ile Val Val Asn Thr
1790 1795 1800
Ala Gly Gln Ala Val Asp Ala Arg Arg Tyr Tyr Ser Ser Pro Gly
1805 1810 1815
Ala Pro Thr Thr Ile Arg Thr Thr Gly Gly Lys Thr Thr Gly His
1820 1825 1830
Lys Leu Thr Val Met Leu Ser Asp His His Ser Thr Ala Thr Thr
1835 1840 1845
Ala Val Glu Leu Thr Asp Thr Gln Pro Val Thr Arg Arg Arg Phe
1850 1855 1860
Asp Pro Tyr Gly Asn Pro Arg Gly Thr Glu Pro Thr Thr Trp Pro
1865 1870 1875
Asp Arg Arg Thr Tyr Leu Gly Val Gly Ile Asp Asp Pro Ala Thr
1880 1885 1890
Gly Leu Thr His Ile Gly Ala Arg Glu Tyr Asp Ala Ser Thr Gly
1895 1900 1905
Arg Phe Ile Ser Val Asp Pro Val Met Asp Leu Thr Asp Pro Leu
1910 1915 1920
Gln Met Asn Gly Tyr Thr Tyr Ala Asn Ala Asp Pro Ile Asn Asn
1925 1930 1935
Ser Asp Pro Thr Gly Leu Leu Leu Asp Ala Arg Gly Gly Gly Thr
1940 1945 1950
Gln Lys Cys Val Gly Thr Cys Val Lys Asp Val Thr Asn Arg Lys
1955 1960 1965
Gly Ile Pro Leu Pro Pro Gly Glu Glu Trp Lys His Glu Gly Glu
1970 1975 1980
Ala Gln Thr Asp Phe Asn Gly Asp Gly Phe Ile Thr Val Phe Pro
1985 1990 1995
Thr Val Asn Val Pro Ala Lys Trp Lys Lys Ala Lys Lys Tyr Thr
2000 2005 2010
Glu Ala Phe Tyr Lys Ala Val Asp Thr Ala Cys Phe Tyr Gly Arg
2015 2020 2025
Glu Ser Cys Ala Asp Pro Glu Tyr Pro Ser Arg Ala His Ser Ile
2030 2035 2040
Asn Asn Trp Lys Gly Lys Ala Cys Lys Ala Val Gly Gly Lys Cys
2045 2050 2055
Pro Glu Arg Leu Ser Trp Gly Glu Gly Pro Ala Phe Ala Gly Gly
2060 2065 2070
Phe Ala Ile Ala Ala Glu Glu Tyr Ala Gly Arg Gly Gly Tyr Arg
2075 2080 2085
Gly Gly Gly Ala Arg Arg Gly Ser Pro Cys Lys Cys Phe Leu Ala
2090 2095 2100
Gly Thr Glu Val Leu Met Ala Asp Gly Ser Thr Lys Ser Ile Glu
2105 2110 2115
Asp Ile Lys Leu Gly Asp Glu Val Val Ala Thr Asp Pro Val Thr
2120 2125 2130
Gly Glu Ala Gly Ala His Pro Val Ser Ala Leu Ile Ala Thr Glu
2135 2140 2145
Asn Asp Lys Arg Phe Asn Glu Leu Val Ile Ile Thr Ser Glu Gly
2150 2155 2160
Val Glu Arg Leu Thr Ala Thr His Glu His Pro Phe Trp Ser Pro
2165 2170 2175
Ser Glu Gly Glu Trp Leu Glu Ala Gly Glu Leu Arg Thr Gly Met
2180 2185 2190
Thr Leu Arg Ser Asp Ser Gly Glu Thr Leu Val Val Ala Gly Asn
2195 2200 2205
Arg Ala Phe Thr Gln Arg Ala Arg Thr Tyr Asn Leu Thr Val Ala
2210 2215 2220
Asp Leu His Thr Tyr Tyr Val Leu Ala Gly Gln Thr Pro Val Leu
2225 2230 2235
Val His Asn Ala Asn Cys Gly Pro His Leu Lys Asp Leu Gln Lys
2240 2245 2250
Asp Tyr Pro Arg Arg Thr Val Gly Ile Leu Asp Val Gly Thr Asp
2255 2260 2265
Gln Leu Pro Met Ile Ser Gly Pro Gly Gly Gln Ser Gly Leu Leu
2270 2275 2280
Lys Asn Leu Pro Gly Arg Thr Lys Ala Asn Gly Glu His Val Glu
2285 2290 2295
Thr His Ala Ala Ala Phe Leu Arg Met Asn Pro Gly Val Arg Lys
2300 2305 2310
Ala Val Leu Tyr Ile Asp Tyr Pro Thr Gly Thr Cys Gly Thr Cys
2315 2320 2325
Arg Ser Thr Leu Pro Asp Met Leu Pro Glu Gly Val Gln Leu Trp
2330 2335 2340
Val Ile Ser Pro Arg Arg Thr Glu Lys Phe Thr Gly Leu Pro Asp
2345 2350 2355
<210> 87
<211> 1885
<212> PRT
<213> Propionibacterium acidifaciens
<400> 87
Met Val Asp Leu Gly Ala Tyr Glu Glu Pro Val Ala Phe Asp Asp Gly
1 5 10 15
Val Ala Asp Ala Leu Arg Ser Ala Ala Ser Ala Leu Ser Gly Thr Leu
20 25 30
Ser Gly Gln Ala Ala Ser Arg Ser Ser Trp Ala Ala Thr Ala Ser Thr
35 40 45
Asp Phe Glu Gly His Tyr Ala Asp Val Phe Asp Ala Asn Ala Arg Ala
50 55 60
Ala Cys Asp Asp Cys Ser Asn Ile Ala Ser Ala Leu Asp Ala Leu Ala
65 70 75 80
Ala Asp Val Gln Thr Met Lys Asp Ala Ala Ala Ser Glu Arg Asp Arg
85 90 95
Arg Arg Gln Ala Lys Glu Trp Ala Asp Arg Gln Lys Asp Glu Trp Ala
100 105 110
Pro Lys Ser Trp Ile Asp Asp His Leu Gly Leu Asp Lys Pro Pro Ala
115 120 125
Gly Pro Pro Glu Thr Pro Val Val Asp Ala Gln Ala Pro Thr Val Ala
130 135 140
Thr Trp Ser Glu Pro Ala Gln Gly Gln Ala Gly Gly Val Ser Ser Ala
145 150 155 160
Arg Pro Asp Asp Leu Arg Thr Tyr Ser Ser Asn Val Thr Gly Ala Asn
165 170 175
Asp Thr Val Thr Thr Gln Lys Gly Thr Leu Asp Gly Ala Leu Ser Asp
180 185 190
Phe Ala Asp Arg Cys Ser Trp Cys Ser Ile Asp Thr Ser Gly Ile Thr
195 200 205
Thr Ala Leu Ala Ala Phe Gly Ala Asn Asn Thr Asn Glu Thr Arg Trp
210 215 220
Val Asp Thr Val Ala Ala Ala Phe Glu Ala Ala Gly Gly Ser Gly Ala
225 230 235 240
Ile Ser Ala Val Ser Asp Ala Ala Leu Asp Ala Ser Leu Gln Ala Ala
245 250 255
Gly Val Thr Gln Ser Arg Gln Pro Val Asp Val Thr Ala Pro Thr Ile
260 265 270
Gln Gly Asp Pro Gln Thr Ser Gly Tyr Ala Asp Asp Pro Val Asn Thr
275 280 285
Thr Thr Gly Asn Phe Ile Glu Pro Glu Thr Asp Leu Ala Phe Ser Gly
290 295 300
Gly Cys Ala Ser Leu Gly Phe Asp Arg Val Tyr Asn Ser Leu Ser Ala
305 310 315 320
Gly Val Gly Ala Phe Gly Pro Gly Trp Ala Ser Thr Ala Asp Gln Arg
325 330 335
Leu Leu Val Thr Glu Asp Gly Ala Val Trp Val Gln Pro Ser Gly Arg
340 345 350
His Val Val Phe Pro Arg Leu Gly Asn Gly Trp Asp Arg Ala His Asn
355 360 365
Asp Thr Tyr Trp Leu His Thr Thr Thr Asp Thr Thr Gly Pro Thr Pro
370 375 380
Gly Asp Ala Pro Thr Thr Gly Ala Ala Gly Gly Ala Gly Val Phe Val
385 390 395 400
Val Ser Asp Asn Ala Gly Gly Arg Trp Val Phe Asp Arg Ala Gly Arg
405 410 415
Pro Val Ser Val Ser Arg Gly Pro Gly Thr Arg Val Asp His Arg Trp
420 425 430
Asp Gly Asp Arg Leu Val Gly Leu Thr His Glu Arg Gly Arg Ala Val
435 440 445
Thr Ile Glu Trp Asn Asp His His Thr Arg Ile Thr Ala Leu Thr Ala
450 455 460
Asn Asp Gly Arg Arg Val Asp Tyr Gly Tyr Asp Pro Ala Gly Arg Leu
465 470 475 480
Thr Glu Ala Ala Ser Ala Gly Gly Thr Arg Thr Tyr Gly Trp Asn Glu
485 490 495
Ala Gly Leu Ile Ala Thr Val Thr Asp Pro Asp Gly Val Val Glu Ala
500 505 510
Ala Asn Thr Tyr Asn Glu His Gly Gln Val Thr Ser Gln Arg Ser Arg
515 520 525
Phe Gly Arg Leu Ser His Tyr Thr Tyr Leu Pro Gly Gly Val Thr Gln
530 535 540
Val Ala Asp Glu Asp Gly Gly Arg Ala Asn Thr Trp Ile His Asp Gln
545 550 555 560
Thr Gly Arg Leu Val Gly Met Val Asp Ala Asp Gly Asn Arg Gln Ser
565 570 575
Ile Gly Trp Asp Gln Trp Gly Asn Arg Val Gln Ile Thr Gly Arg Asp
580 585 590
Gly Arg Thr Thr Val Cys Arg Tyr Asp Ala Arg Gly Arg Leu Ile Thr
595 600 605
Arg Gln Glu Ala Ser Gly Ala Arg Thr Asp Tyr Glu Trp Asp Glu Ala
610 615 620
Asp Arg Val Val Gln Val Thr Val Thr Asp Thr Thr Ser Ser Ser His
625 630 635 640
Gly Asn Thr Ser Ser Ala Gly Gly Ser Gly Pro Ser Val Thr Ser Tyr
645 650 655
Glu Tyr Glu Gly Ala Gly Arg Asn Pro Ser Thr Val Thr Asp Pro Glu
660 665 670
Gly Gly Val Thr Arg Leu Thr Trp Asp Gln Asn Leu Leu Thr Glu Ala
675 680 685
Thr Asp Pro Ala Gly Val Arg Val Arg Leu Gly Tyr Asp Gly His Gly
690 695 700
Asp Leu Val Ser Thr Thr Asn Ala Ala Gly Asp Thr Ala Arg Leu Val
705 710 715 720
Arg Asp Gly Ala Gly Arg Val Val Ala Ala Ile Thr Pro Leu Gly His
725 730 735
Arg Thr Glu Tyr Arg Tyr Asp Glu Ala Gly Arg Leu Ala Ser Arg Gln
740 745 750
Asp Pro Asp Gly Ala Leu Trp Arg Tyr Glu His Thr Thr Gly Gly Arg
755 760 765
Leu Ser Ala Val Val Asp Pro Asp Gly Gly Arg Thr Val Thr Glu Tyr
770 775 780
Gly Pro Gly Gly Val Glu Glu Ala Thr Thr Asp Pro Leu Gly Arg Arg
785 790 795 800
Leu Glu Gln Glu Trp Asp Asp Leu Gly Asn Leu Ala Gly Val Arg Leu
805 810 815
Pro Asp Gly Arg Glu Trp Ser Tyr Val His Asp Gly Leu Ser Arg Leu
820 825 830
Thr Glu Thr Val Asp Pro Ala Gly Gly Leu Trp Arg Arg Glu Tyr Asp
835 840 845
Val Asn Gly Met Val Ala Ala Thr Val Asp Pro Thr Gly Val Arg Arg
850 855 860
Gly Leu Ala Trp Ala Ala Asp Gly Ser Val Thr Val Ser Asp Ala Ser
865 870 875 880
Gly Thr Ala Arg Val Gly Val Asp Gly Leu Gly Arg Pro Val Ser Val
885 890 895
Ser Val Ser Ser Ala Pro Ala Pro Gly Glu Ala Val Pro Met Gly Met
900 905 910
Ser Leu Glu Glu Thr Val Gly Thr Gly Ala Pro Ala Pro Gly Gly Ala
915 920 925
Gly Pro Asp Gly Pro Asp Ala Arg Val Val Val Arg Asp Leu Cys Gly
930 935 940
Arg Pro Val Glu Ala Leu Asp Ala Asp Gly Gly Leu Thr Arg Leu Met
945 950 955 960
Arg Asp Ala Ala Gly Arg Leu Val Glu Glu Ile Ser Pro Ala Gly Arg
965 970 975
Ser Thr Arg Tyr Glu Trp Asp Arg Cys Gly Arg Leu Ser Ala Val Ile
980 985 990
Gly Pro Asp Gly Ala Arg Thr Thr Met Ala Tyr Asp Ala Ala Ser Arg
995 1000 1005
Leu Ile Ala Gln Asp Gly Pro Gly Gly Arg Val Arg Val Ala Tyr
1010 1015 1020
Asp Arg Cys Gly Arg Leu Ser Thr Val Thr Ala Pro Gly Arg Gly
1025 1030 1035
Lys Thr Thr Trp Gly Tyr Asp Arg Ala Gly Arg Val Arg Ser Val
1040 1045 1050
Arg Ser Pro Ala Trp Gly Leu Val Arg Phe Gly Tyr Asp Pro Ala
1055 1060 1065
Gly Gln Leu Thr Ala Val Thr Asn Ala Leu Gly Gly Val Thr Arg
1070 1075 1080
Tyr Asp Tyr Asp Glu Cys Gly Arg Leu Val Gln Val Thr Asp Pro
1085 1090 1095
Leu Gly His Val Thr Arg Arg Thr Tyr Thr Ala Ala Asp Arg Val
1100 1105 1110
Glu Thr Leu Val Asp Pro Leu Gly Arg Thr Thr Gln Ala Gly Tyr
1115 1120 1125
Asp Ala Ala Gly Arg Gln Leu Trp Gln Thr Asp Asp Thr Gly Glu
1130 1135 1140
Arg Leu Ala Phe Gly Trp Asp Glu Ala Gly Arg Leu Glu Arg Val
1145 1150 1155
Ala Thr Gly Gly Glu Gly Leu Pro Gly Gln Thr Cys Cys Ala Leu
1160 1165 1170
Thr Arg Pro Gly Arg Arg Val Leu Arg Val Thr Gly Pro Gly Gly
1175 1180 1185
Ala Arg Asp Glu Leu Val Phe Asp Arg Leu Gly Arg Leu Ala Arg
1190 1195 1200
His Ala Arg Gly Gly Arg Thr Val Gly Glu Trp Ser Trp Asp Pro
1205 1210 1215
Asp Gly Ala Cys Thr Ala Phe Thr Gly Pro Asp Gly Gln Arg Val
1220 1225 1230
Arg Tyr Ala Tyr Asp Asp Ala Gly Ala Leu Val Arg Val Glu Gly
1235 1240 1245
Thr Ala Phe Gly Pro Val Thr Val Arg Arg Asp Thr Ala Gly Arg
1250 1255 1260
Leu Thr Gly Met Asp Gly Pro Gly Leu Thr Gln Arg Trp Asp Arg
1265 1270 1275
Asp Glu Thr Gly His Val Ile Ala Tyr Arg Arg Thr Lys Asn Gly
1280 1285 1290
Val Thr Thr Ser Ser Arg Val Ser Arg Asp Glu Ser Gly Arg Val
1295 1300 1305
Thr Ala Val Asp Gly Pro Asp Gly Thr Val Arg Tyr Gly Tyr Asp
1310 1315 1320
Pro Ala Gly Gln Leu Ala Arg Ile Glu Gly Pro Asp Gly Arg Arg
1325 1330 1335
Glu Ser Phe Thr Trp Asp Lys Ala Gly His Leu Thr Arg Arg Ser
1340 1345 1350
Val Glu Arg Pro Gly Ala Arg Pro Glu Thr Thr Leu Tyr Ser Tyr
1355 1360 1365
Asp Pro Ala Gly Gln Leu Ala Ser Thr Asp Gly Pro Asp Gly Arg
1370 1375 1380
Thr Leu Tyr Thr Trp Asp Ala Ala Gly Arg Arg Thr Gly Gln Asp
1385 1390 1395
Gly Pro Asp Gly His Trp Ser Tyr Ser Trp Ala Pro Ser Gly His
1400 1405 1410
Leu Thr Ala Val Thr Arg Arg Thr Pro His Asp Ala Arg Thr Trp
1415 1420 1425
Arg Ile Ser Arg Asp Gly Leu Gly Leu Pro Arg Arg Ile Asp Asp
1430 1435 1440
Thr Asp Leu Ala Trp Asp Leu Ser Gly Pro Val Pro Ala Leu Thr
1445 1450 1455
Arg Phe Gly Thr His Thr Val Thr Gly Leu Pro Arg Ala Leu Ala
1460 1465 1470
Ile Asp Gly Thr Leu Thr Ser Thr Gly Trp Arg Pro Ala Arg Pro
1475 1480 1485
Thr Ser Ala Asp Asp Pro Trp Ala Pro Pro Pro Pro Val Val Glu
1490 1495 1500
Thr Asp Gly Ala Arg Leu Gly Val Gly Gly Ala Val Gly Leu Gly
1505 1510 1515
Gly Leu Glu Ile Leu Gly Ala Arg Val His Asp Pro Thr Thr Phe
1520 1525 1530
Ser Phe Leu Ser Pro Asp Pro Leu Asp Gln Pro Pro Leu Ala Pro
1535 1540 1545
Trp Ala Thr Asn Pro Tyr Ser Tyr Ala Ala Asn Asn Pro Leu Ala
1550 1555 1560
Phe Thr Asp Pro Thr Gly Leu Arg Pro Leu Thr Asp Thr Asp Phe
1565 1570 1575
Glu Ala Tyr Lys His Asp His Gly Gly Leu Gly Gly Trp Ile Ala
1580 1585 1590
Asp His Lys Asp Tyr Leu Ile Gly Gly Ala Met Val Ile Ala Gly
1595 1600 1605
Gly Val Leu Met Ala Thr Gly Val Gly Gly Pro Leu Gly Gly Met
1610 1615 1620
Leu Ile Gly Ala Gly Ala Asp Thr Ile Ile Gln Arg Ala Thr Thr
1625 1630 1635
Gly Gln Val Asp Tyr Gly Gln Val Ala Val Ser Gly Leu Leu Gly
1640 1645 1650
Ala Ala Gly Gly Gly Ala Ala Ser Ala Leu Leu Lys Gly Gly Gly
1655 1660 1665
Arg Leu Ala Thr Glu Leu Gly Ala Thr Gly Leu Arg Thr Ala Ile
1670 1675 1680
Thr Thr Gly Ala Ala Ser Gly Thr Ala Ser Gly Ala Gly Gly Ser
1685 1690 1695
Gly Tyr Gly Tyr Leu Thr Gly Pro Gly Pro His Thr Val Ser Gly
1700 1705 1710
Phe Leu Thr Ser Thr Ala Thr Gly Ala Val Glu Gly Gly Leu Leu
1715 1720 1725
Gly Gly Ala Ser Gly Ala Ala Gly His Gly Leu Ser Thr Thr Gly
1730 1735 1740
Lys Asn Val Leu Gly His Phe Glu Pro Thr Pro Thr Thr Pro Gln
1745 1750 1755
Gly Thr Ser Ser Asp Thr Ile Ala Glu Met Leu Asn Ser Ala Ser
1760 1765 1770
Gln Pro Gly Arg Thr Ala Gly Val Leu Asp Ile Asp Gly Glu Leu
1775 1780 1785
Thr Pro Leu Thr Ser Gly Arg Pro Ser Leu Pro Asn Tyr Ile Ala
1790 1795 1800
Ser Gly His Val Glu Gly Gln Ala Ala Met Ile Met Arg Gln Gln
1805 1810 1815
Gln Val Gln Ser Ala Thr Val Tyr His Asp Asn Pro Asn Gly Thr
1820 1825 1830
Cys Gly Tyr Cys Tyr Ser Gln Leu Pro Thr Leu Leu Pro Glu Gly
1835 1840 1845
Ala Ala Leu Asp Val Val Pro Pro Ala Gly Thr Val Pro Pro Ser
1850 1855 1860
Asn Arg Trp His Asn Gly Gly Pro Ser Phe Ile Gly Asn Ser Ser
1865 1870 1875
Glu Pro Lys Pro Trp Pro Arg
1880 1885
<210> 88
<211> 125
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 88
Met Ser Leu Pro Glu Tyr Asp Gly Thr Thr Thr His Gly Val Leu Val
1 5 10 15
Leu Asp Asp Gly Thr Gln Ile Gly Phe Thr Ser Gly Asn Gly Asp Pro
20 25 30
Arg Tyr Thr Asn Tyr Arg Asn Asn Gly His Val Glu Gln Lys Ser Ala
35 40 45
Leu Tyr Met Arg Glu Asn Asn Ile Ser Asn Ala Thr Val Tyr His Asn
50 55 60
Asn Thr Asn Gly Thr Cys Gly Tyr Cys Asn Thr Met Thr Ala Thr Phe
65 70 75 80
Leu Pro Glu Gly Ala Thr Leu Thr Val Val Pro Pro Glu Asn Ala Val
85 90 95
Ala Asn Asn Ser Arg Ala Ile Asp Tyr Val Lys Thr Tyr Thr Gly Thr
100 105 110
Ser Asn Asp Pro Lys Ile Ser Pro Arg Tyr Lys Gly Asn
115 120 125
<210> 89
<211> 251
<212> PRT
<213> Ruminococcus bicirculans
<400> 89
Met Leu Ala Ile Glu Lys Ile Lys Ser Gly Asp Lys Val Ile Ser Thr
1 5 10 15
Asp Pro Glu Thr Met Glu Thr Ser Pro Lys Thr Val Leu Glu Thr Tyr
20 25 30
Ile Arg Glu Val Thr Thr Leu Val His Leu Thr Val Asn Gly Glu Glu
35 40 45
Ile Val Thr Thr Val Asp His Pro Phe Tyr Val Lys Asn Gln Gly Phe
50 55 60
Ile Lys Ala Gly Glu Leu Ile Val Gly Asp Glu Leu Leu Asp Ser Asn
65 70 75 80
Cys Asn Val Leu Leu Val Glu Asn His Ser Val Glu Leu Thr Asp Glu
85 90 95
Pro Val Thr Val Tyr Asn Phe Gln Val Glu Asp Phe His Thr Tyr His
100 105 110
Val Gly Lys Cys Arg Leu Leu Val His Asn Ala Asn Cys Asn Gln Glu
115 120 125
Lys Pro Val Leu Pro Lys Tyr Asp Gly Lys Thr Thr Glu Gly Val Met
130 135 140
Val Thr Pro Asp Gly Lys Gln Ile Ser Phe Lys Ser Gly Asn Ser Ser
145 150 155 160
Thr Pro Ser Tyr Pro Gln Tyr Lys Ala Gln Ser Ala Ser His Val Glu
165 170 175
Gly Lys Ala Ala Leu Tyr Met Arg Glu Asn Gly Ile Asn Glu Ala Thr
180 185 190
Val Phe His Asn Asn Pro Asn Gly Thr Cys Gly Phe Cys Asp Arg Gln
195 200 205
Val Pro Ala Leu Leu Pro Lys Gly Ala Lys Leu Thr Val Val Pro Pro
210 215 220
Ser Asn Ser Val Ala Asn Asn Val Arg Ala Ile Pro Val Pro Lys Thr
225 230 235 240
Tyr Ile Gly Asn Ser Thr Val Pro Lys Ile Lys
245 250
<210> 90
<211> 2379
<212> PRT
<213> Streptomyces cavourensis
<400> 90
Met Ser Ser Ser Val Ser Gly Arg Ala Phe Arg Val Ser Gly Val Leu
1 5 10 15
Thr Arg Ile Thr Lys Ser Trp Thr Pro Gly Ser Ala Arg Arg Ser Ser
20 25 30
Ala Ser Val Arg His Arg Gly Arg Ala Val Arg Ala Arg Ser Leu Gly
35 40 45
Val Thr Leu Ser Ala Val Leu Ala Ala Thr Leu Leu Pro Ala Glu Ala
50 55 60
Trp Ala Ile Ala Pro Pro Ala Pro Arg Ile Gly Pro Ser Leu Val Asp
65 70 75 80
Leu Gln Gln Glu Glu Pro Ala Asp Pro Asp Gln Ala Lys Ile Asp Glu
85 90 95
Leu Ser Thr Trp Ser Gly Ala Pro Val Glu Pro Pro Ala Asp Tyr Thr
100 105 110
Pro Thr Ala Thr Thr Pro Pro Ala Gly Gly Thr Ala Pro Val Ala Leu
115 120 125
Asp Gly Ala Gly Asp Asp Leu Val Pro Val Gly Asn Leu Pro Val Arg
130 135 140
Leu Gly Lys Ala Ser Pro Thr Asp Glu Glu Pro Asp Pro Pro Ala Pro
145 150 155 160
Gly Gly Thr Trp Asp Val Ala Val Glu Pro Arg Thr Ser Thr Glu Ala
165 170 175
Ser Asp Val Asp Gly Ala Leu Ile Thr Val Thr Pro Pro Ser Gly Gly
180 185 190
Ala Thr Pro Val Asp Ile Glu Leu Asp Tyr Gly Lys Phe Glu Asp Leu
195 200 205
Phe Gly Thr Ala Trp Ser Ser Arg Leu Arg Leu Thr Gln Leu Pro Glu
210 215 220
Cys Phe Leu Thr Thr Pro Glu Leu Asp Glu Cys Thr Thr Val Val Asp
225 230 235 240
Val Pro Ser Val Asn Asp Pro Ser Asn Asp Thr Val Arg Ala Thr Ile
245 250 255
Asp Pro Ala Ala Ser Pro Gln Gln Gly Leu Ser Thr Gln Ser Gly Gly
260 265 270
Gly Pro Val Val Leu Ala Ala Thr Asp Ser Ala Ser Gly Ala Gly Gly
275 280 285
Thr Tyr Lys Ala Thr Pro Phe Thr Ala Thr Gly Thr Trp Thr Ala Gly
290 295 300
Gly Ser Gly Gly Gly Phe Ser Trp Ser Tyr Pro Leu Thr Ala Pro Ala
305 310 315 320
Pro Pro Ala Gly Pro Ala Pro Thr Ile Ser Leu Ser Tyr Ser Ser Gln
325 330 335
Ser Val Asp Gly Arg Thr Ser Val Ala Asn Gly Gln Ala Ser Trp Ile
340 345 350
Gly Asp Gly Trp Asp Tyr Asn Pro Gly Phe Ile Glu Arg Arg Tyr Arg
355 360 365
Ser Cys Asn Asp Asp Arg Ser Gly Thr Pro Asn Asn Ala Gly Gly Lys
370 375 380
Asp Lys Lys Lys Ser Asp Leu Cys Trp Ala Ser Asp Asn Leu Val Met
385 390 395 400
Ser Leu Gly Gly Ser Ala Thr Ala Leu Val His Asp Gly Thr Thr Gly
405 410 415
Ala Trp Val Ala Gln Ser Asp Thr Gly Ala Arg Ile Glu Tyr Arg Thr
420 425 430
Arg Thr Gly Ser Pro Lys Thr Ala Gln Thr Gly Ala Tyr Asp Gly Glu
435 440 445
Tyr Trp Val Val Thr Thr Arg Asp Gly Thr Arg Tyr Trp Phe Gly Arg
450 455 460
Asn Thr Ile Pro Gly Arg Thr Ala Ala Thr Glu Ser Ala Leu Thr Val
465 470 475 480
Pro Val Phe Gly Asn His Ser Gly Glu Pro Cys His Ala Thr Ala Tyr
485 490 495
Ala Asp Ser Ser Cys Ala Gln Ala Trp Arg Trp Asn Leu Asp Tyr Val
500 505 510
Glu Asp Val His Gly Asn Ala Met Ile Val Asp Trp Lys Lys Glu Thr
515 520 525
Asn Arg Tyr Ala Arg Asn Glu Lys Phe Lys Glu Ala Val Ala Tyr His
530 535 540
Arg Gly Gly Tyr Pro Ala Gln Ile Leu Tyr Gly Leu Arg Ala Asp Asp
545 550 555 560
Leu Asn Gly Ala Pro Ala Gly Lys Val Val Phe Lys Thr Ala Pro Arg
565 570 575
Cys Val Glu Asp Ala Gly Thr Thr Cys Ser Pro Thr Gly Tyr Glu Ser
580 585 590
Asp Asn Tyr Ala Asp Lys Gln Pro Trp Trp Asp Thr Pro Ala Thr Leu
595 600 605
His Cys Lys Ser Gly Ala Lys Asn Cys Phe Val Thr Ser Pro Thr Phe
610 615 620
Trp Ser Ser Val Arg Leu Thr Glu Ile Glu Thr His Gly Arg Arg Thr
625 630 635 640
Pro Gly Ser Thr Ala Leu Ser Leu Val Asp Ser Trp Thr Leu Lys Gln
645 650 655
Ser Phe Pro Lys Gln Arg Thr Asp Thr His Pro Pro Leu Trp Leu Glu
660 665 670
Ser Ile Thr Arg Thr Gly His Gly Ala Pro Asn Ala Ser Gly Glu Gln
675 680 685
Thr Ser Arg Ala Leu Pro Pro Val Ser Phe Leu Pro Asn Val Val Asp
690 695 700
Met Pro Asn Arg Val Ser Lys Gly Ala Thr Asp Glu Thr Pro Asp Phe
705 710 715 720
Asp Arg Leu Arg Val Glu Thr Val Arg Thr Glu Thr Gly Gly Glu Ile
725 730 735
His Val Asp Tyr Ser Ala Pro Cys Ala Val Gly Thr Ala His Pro Ser
740 745 750
Pro Glu Thr Asn Thr Thr Arg Cys Phe Pro Val His Tyr Ser Pro Asp
755 760 765
Pro Glu Ala Leu Ser Asp Glu Val Leu Ala Lys Lys Pro Ala Pro Val
770 775 780
Glu Trp Phe Asn Lys Tyr Val Val Gln Lys Val Thr Glu Lys Asp Arg
785 790 795 800
Val Ala Arg Gln Pro Asp Val Val Thr Thr Tyr Ala Tyr Glu Gly Gly
805 810 815
Gly Ala Trp Gly Arg Ser Thr Asp Glu Phe Thr Lys Pro Lys Leu Arg
820 825 830
Thr Tyr Asp Gln Trp Arg Gly Tyr Ala Ser Val Leu Val Arg Lys Gly
835 840 845
Val Thr Gly Ala Asp Pro Ala Ala Ala Asp Ala Thr Glu Gln Ser Gln
850 855 860
Thr Arg Met Arg Tyr Phe Arg Gly Met Ser Gly Asp Ala Gly Arg Pro
865 870 875 880
Thr Val Thr Val Lys Asp Ser Thr Gly Ala Glu Thr Leu Gly Glu Asp
885 890 895
Leu Ala Pro Tyr Gln Gly Met Pro Ala Glu Thr Val Ala Tyr Thr Arg
900 905 910
Ala Gly Gly Asp Val Ala Ser Arg Ile Leu Ala Trp Pro Thr Ser Arg
915 920 925
Glu Thr Ala Ser Gln Ala Arg Pro Gly Leu Pro Ala Leu Lys Ala His
930 935 940
Arg Val Ala Thr Ala Arg Thr Glu Thr Val Glu Thr Ile Ser Gly Gly
945 950 955 960
Arg Thr Arg Thr Ala Arg Thr Val Thr Thr Tyr Asp Asp Thr Tyr Gly
965 970 975
Leu Pro Leu Thr Ala Glu Thr Leu Thr Leu Thr Pro Asp Gly Ser Gly
980 985 990
Gly Thr Thr Thr Gly Asp Arg Ser Cys Ser Thr Asn Thr Tyr Val His
995 1000 1005
Asn Thr Ala Lys His Leu Ile Gly Leu Val Gln Arg Ala Arg Thr
1010 1015 1020
Thr Val Gly Thr Cys Ala Gln Ala Ala Thr Ala Ser Gly Ser Asp
1025 1030 1035
Val Val Ser Asp Thr Arg Val Ser Tyr Asp Ala Leu Asp Ala Phe
1040 1045 1050
Gly Ala Ala Pro Val Arg Gly Leu Pro Phe Arg Thr Asp Thr Val
1055 1060 1065
Gly Ala Asp Gly Thr Gly Trp Val Thr Ser Ala Arg Thr Glu Tyr
1070 1075 1080
Asp Pro Leu Gly Arg Ala Thr Glu Val Arg Asp Ala Lys Gly His
1085 1090 1095
Val Ser Lys Val Gly Phe Val Pro Pro Thr Gly Pro Ala Phe Thr
1100 1105 1110
Thr Thr Ser Thr Asp Ala Lys Gly His Thr Thr Thr Thr Ala Leu
1115 1120 1125
Asp Pro Ala Arg Gly Thr Ala Leu Ser Val Thr Asp Ala Asn Gly
1130 1135 1140
Arg Arg Thr Thr Ser Ala Tyr Asp Glu Leu Gly Arg Thr Thr Ala
1145 1150 1155
Val Trp Ser Pro Ser Arg Thr Gln Gly Thr Asp Lys Ala Ser Val
1160 1165 1170
Leu Phe Asp Tyr Gln Ile Glu Asp Asn Lys Val Pro Ala Thr Arg
1175 1180 1185
Thr Arg Val Leu Arg Asp Asn Gly Thr Tyr Glu Asp Ser Val Thr
1190 1195 1200
Val Tyr Asp Gly Leu Leu Arg Pro Arg Gln Ala Gln Thr Glu Ala
1205 1210 1215
Leu Gly Gly Gly Arg Ile Val Thr Glu Thr Leu Tyr Asn Ala Asn
1220 1225 1230
Gly Ala Pro Ala Glu Thr Arg Asn Gly Tyr Leu Ala Glu Gly Glu
1235 1240 1245
Pro Gln Thr Glu Leu Phe Val Pro Leu Ser Leu Thr Gln Val Pro
1250 1255 1260
Ser Ala Ser Lys Thr Ala Tyr Asp Gly Leu Gly Arg Ala Val Arg
1265 1270 1275
Thr Thr Val Leu His Ala Gly Asp Pro Gln His Ser Ala Thr Val
1280 1285 1290
Arg His Glu Gly Asp Arg Thr Leu Thr Arg Thr Gly Met Ser Ala
1295 1300 1305
Asp Gly Thr Thr Pro Met Pro Gly Ser Arg Ser Thr Ala Thr Trp
1310 1315 1320
Thr Asp Ala Leu Gly Arg Thr Ser Lys Ile Glu His Phe Thr Ala
1325 1330 1335
Thr Asp Leu Ser Ala Ala Ile Asp Thr Arg Tyr Thr Tyr Asp Ala
1340 1345 1350
Arg Gly Asn Leu Ala Lys Val Thr Asp Ala Arg Asp Asn Ile Trp
1355 1360 1365
Thr Tyr Thr Tyr Asp Ala Arg Gly Arg Leu Thr Phe Ser Thr Asp
1370 1375 1380
Pro Asp Ala Gly Ser Ser Ser Phe Gly Tyr Asp Val Leu Asp Arg
1385 1390 1395
Gln Ile Trp Ser Lys Asp Ser Arg Gln Arg Ser Gln His Thr Val
1400 1405 1410
Tyr Asp Glu Leu Gly Arg Arg Thr Glu Leu Arg Asp Asp Ser Ala
1415 1420 1425
Glu Gly Pro Leu Val Ala Lys Trp Thr Tyr Asp Thr Leu Pro Gly
1430 1435 1440
Ala Lys Gly Leu Pro Val Ala Ser Thr Arg Tyr His Glu Gly Ala
1445 1450 1455
Glu Phe Thr Ser Glu Val Thr Gly Tyr Asp Gln Glu Tyr Arg Pro
1460 1465 1470
Thr Gly Ser Arg Thr Thr Ile Pro Ser Thr Pro Leu Thr Thr Gly
1475 1480 1485
Leu Ala Gly Thr Tyr Thr Tyr Lys Asn Thr Tyr Thr Pro Thr Gly
1490 1495 1500
Leu Pro Gln Ser Val Glu Leu Pro Ala Thr Pro Gly Gly Leu Ala
1505 1510 1515
Ala Glu Lys Val Ile Thr Arg Tyr Asp Gly Glu Gly Ser Pro Arg
1520 1525 1530
Thr Thr Ser Gly Leu Ala Trp Tyr Thr Val Asp Thr Val Leu Ser
1535 1540 1545
Pro Leu Gly Gln Val Leu Arg Thr Ala Ser Gly Glu Ala Pro Asn
1550 1555 1560
Arg Val Trp Ala Thr His Phe Tyr Asp Glu Ser Thr Gly Arg Leu
1565 1570 1575
Asp Arg Arg Ile Thr Asp Arg Glu Thr Leu Asp Pro Ser Arg Ile
1580 1585 1590
Ser Glu Thr Ser Tyr Ala His Asp Thr Val Gly Asn Ile Thr Ser
1595 1600 1605
Ile Thr Asp Thr Gln Ser Pro Ala Arg Val Asp Arg Gln Cys Phe
1610 1615 1620
Ala Tyr Asp Pro Met Gly Arg Leu Ala His Ala Trp Thr Ala Lys
1625 1630 1635
Ser Pro Gly Cys Pro Arg Ser Ser Thr Ala Gln Gly Ala Gly Pro
1640 1645 1650
Asn Arg Thr Asp Val Ser Pro Ser Ile Asp Gly Ala Gly Tyr Trp
1655 1660 1665
His Ser Tyr Glu Phe Asp Thr Ile Gly Asn Arg Thr Gly Met Val
1670 1675 1680
Val His Asp Pro Ala Asp Pro Ala Leu Asp Asp Thr Tyr Val Tyr
1685 1690 1695
Thr His Gly Val Pro Ser Glu Gly Pro Leu Gln Pro Ala Thr Leu
1700 1705 1710
Gln Pro His Thr Leu Thr Lys Val Asp Ala Thr Val Arg Gly Pro
1715 1720 1725
Gly Ser Thr Val Thr Ser Ser Ser Thr Tyr Ala Tyr Asp Pro Ser
1730 1735 1740
Gly Asn Thr Thr Gln Arg Val Ile Gly Gly Asp Thr Gln Ala Leu
1745 1750 1755
Thr Trp Asp Arg Arg Asn Lys Leu Met Ser Ala Asp Thr Asp Asp
1760 1765 1770
Asp Gly Thr Ala Asp Val Thr Tyr Leu Tyr Asp Ala Ser Gly Asn
1775 1780 1785
Arg Leu Leu Glu Ala Asp Ala Thr Thr Arg Thr Leu Tyr Leu Gly
1790 1795 1800
Glu Ser Glu Ile Val Val Asp Thr Ala Gly Arg Pro Val Glu Ala
1805 1810 1815
Arg Arg Tyr Tyr Ser His Pro Gly Ala Pro Thr Thr Leu Arg Thr
1820 1825 1830
Thr Gly Gly Arg Thr Ser Gly His Thr Leu Thr Val Gln Leu Thr
1835 1840 1845
Asp His His Asn Thr Pro Thr Ala Ser Val Ala Leu Thr Gly Gly
1850 1855 1860
Gln Pro Val Thr Arg Arg Met Phe Asp Pro Tyr Gly Asn Pro Arg
1865 1870 1875
Gly Thr Glu Pro Thr Thr Trp Pro Asp Arg Arg Thr Tyr Leu Gly
1880 1885 1890
Val Gly Ile Asp Asp Glu Thr Thr Gly Leu Thr His Ile Gly Ala
1895 1900 1905
Arg Glu Tyr Asp Ser Val Thr Gly Arg Phe Ile Ser Ala Asp Pro
1910 1915 1920
Ile Ile Asp Ile Ala Asp Pro Leu Gln Met Asn Gly Tyr Ala Tyr
1925 1930 1935
Ala Asn Asn Asn Pro Val Thr Asn Trp Asp Pro Thr Gly Leu Lys
1940 1945 1950
Ser Asp Glu Cys Gly Ser Leu Tyr Arg Cys Gly Gly Asn Gln Val
1955 1960 1965
Ile Thr Thr Lys Thr Thr Lys Tyr Gln Asp Val Asn Thr Val Ala
1970 1975 1980
Arg His Phe Glu Lys Thr Ala Ser Trp Ala Thr Leu Ala Gln Trp
1985 1990 1995
Lys Ala Glu Gly Leu Gly Lys Ser Pro Ala Phe Gly Lys Ala Lys
2000 2005 2010
Lys Leu Thr Lys Trp Lys Asn Glu His Tyr Glu Lys Asn Trp Thr
2015 2020 2025
Ile Asn Leu Val Pro Gly Met Ala Arg Ser Trp Val Ser Gly Val
2030 2035 2040
Asp Ala Ala Ala Ser Ala Ile Met Pro Phe Pro Thr Val Gln Ala
2045 2050 2055
Ala Pro Leu Tyr Asp Ser Leu Val Ser Ser Leu Gly Val Asn Thr
2060 2065 2070
Lys Gly Arg Ala Tyr Ala Asn Gly Glu Gly Leu Met Asp Gly Leu
2075 2080 2085
Ser Met Val Gly Gly Val Gly Ala Ile Ala Pro Gly Ile Lys Ser
2090 2095 2100
Gly Leu Lys Ala Ala Ala Lys Gly Cys Gly Pro Gly Asn Ser Phe
2105 2110 2115
Thr Pro Gly Thr Glu Val Ala Leu Ala Asp Gly Thr Thr Lys Pro
2120 2125 2130
Ile Glu Asp Ile Lys Ile Gly Asp Glu Val Leu Ala Thr Asp Pro
2135 2140 2145
Glu Thr Gly Glu Thr Arg Ala Glu Lys Val Thr Ala Glu Ile Arg
2150 2155 2160
Gly Asp Gly Thr Lys Asn Leu Val Lys Val Thr Ile Asp Thr Asp
2165 2170 2175
Gly Asp Arg Gly Thr Asp Thr Ala Glu Ile Thr Ala Thr Asp Gly
2180 2185 2190
His Pro Phe Trp Val Pro Glu Leu Gly Arg Trp Ile Asp Ala Thr
2195 2200 2205
Asp Leu Ala Pro Gly Gln Trp Leu Arg Thr Ser Ala Gly Thr His
2210 2215 2220
Val Gln Ile Thr Ala Ile Lys Arg Trp Thr Glu Thr Ala Thr Val
2225 2230 2235
His Asn Leu Thr Val Ala Asp Leu His Thr Tyr Tyr Val Leu Ala
2240 2245 2250
Gly Lys Thr Pro Val Leu Val His Asn Glu Asn Cys Gly Pro Asn
2255 2260 2265
Leu Lys Asp Leu Pro Lys Asp Tyr Asp Arg Arg Thr Val Gly Ile
2270 2275 2280
Leu Asp Val Gly Thr Asp Gln Leu Pro Met Ile Ser Gly Pro Gly
2285 2290 2295
Gly Gln Ser Gly Leu Leu Lys Asn Leu Pro Gly Arg Thr Lys Ala
2300 2305 2310
Asn Thr Asp His Val Glu Ala His Thr Ala Ala Phe Leu Arg Met
2315 2320 2325
Asn Pro Gly Ile Arg Lys Ala Val Leu Tyr Ile Asp Tyr Pro Thr
2330 2335 2340
Gly Thr Cys Gly Thr Cys Gly Ser Thr Leu Pro Asp Met Leu Pro
2345 2350 2355
Glu Gly Val Gln Leu Trp Val Ile Ser Pro Arg Lys Thr Glu Lys
2360 2365 2370
Phe Ala Gly Leu Pro Asp
2375
<210> 91
<211> 2409
<212> PRT
<213> Roseburia intestinalis
<400> 91
Met Lys Leu Thr Tyr Lys Glu Leu Glu Ile Glu Leu Glu Leu Ala Gly
1 5 10 15
Leu Leu Ala Val Glu Glu Leu Val Leu Thr Gln Gly Leu Asn Cys His
20 25 30
Ala Gly Leu Thr Leu Lys Ile Leu Ile Glu Glu Glu Gln Arg Asp Glu
35 40 45
Leu Val Thr Met Ser Ser Asp Ala Gly Val Thr Val Arg Glu Leu Glu
50 55 60
Lys Thr Asn Gly Gln Val Val Phe Arg Gly Lys Leu Glu Thr Val Ser
65 70 75 80
Ala Arg Arg Glu Asn Gly Leu Phe Tyr Leu Tyr Leu Glu Ala Trp Ser
85 90 95
Tyr Thr Met Asp Trp Asp Arg Val Lys Lys Ser Arg Ser Phe Gln Asn
100 105 110
Gly Ala Leu Thr Tyr Met Glu Val Val Gln Arg Val Leu Ser Gly Tyr
115 120 125
Gly Gln Ser Gly Val Thr Asp His Ala Thr Gly Gly Ala Cys Ile Pro
130 135 140
Glu Phe Leu Leu Gln Tyr Glu Glu Ser Asp Trp Val Phe Leu Arg Arg
145 150 155 160
Leu Ala Ser His Phe Gly Thr Tyr Leu Leu Ala Asp Ala Thr Asp Ala
165 170 175
Cys Gly Lys Val Tyr Phe Gly Val Pro Glu Ile Ser Tyr Gly Thr Val
180 185 190
Leu Asp Arg Gln Gly Tyr Thr Met Glu Lys Asp Met Leu His Tyr Ala
195 200 205
Arg Val Leu Glu Lys Glu Gly Val Leu Ser Gln Glu Ala Ser Cys Trp
210 215 220
Asn Val Thr Val Arg Phe Phe Leu Arg Met Trp Glu Thr Leu Thr Phe
225 230 235 240
Asn Gly Ile Glu Ala Val Val Thr Ala Met Arg Leu His Thr Glu Lys
245 250 255
Gly Glu Leu Val Tyr Ser Tyr Val Leu Ala Arg Arg Ala Gly Ile Arg
260 265 270
Arg Glu Lys Glu Lys Asn Pro Gly Ile Phe Gly Met Ser Ile Pro Ala
275 280 285
Thr Val Met Glu Arg Ser Gly Asn Arg Ile Arg Val His Phe Glu Ile
290 295 300
Asp Pro Glu Tyr Glu Ala Ser Glu Lys Thr Lys Tyr Phe Thr Tyr Ala
305 310 315 320
Ile Glu Ser Ser Ser Phe Tyr Cys Met Pro Glu Glu Gly Ser Gln Val
325 330 335
His Ile Tyr Phe Pro Asp His Asp Glu Gln Gly Ala Val Ala Val His
340 345 350
Ala Ile Arg Ser Gly Glu Gly Ala Ser Gly Ser Cys Ser Thr Pro Glu
355 360 365
Asn Lys Arg Phe Ser Asp Pro Ser Gly Ser Ala Met Asp Met Thr Pro
370 375 380
Ala Ser Leu Gln Phe Ala Pro Asp Ala Gly Gly Ala Thr Val Leu His
385 390 395 400
Leu Glu Gly Gly Gly Phe Leu Ser Leu Thr Gly Met Asp Ile Lys Leu
405 410 415
Lys Thr Gln Met Gly Met Ala Ser Asp Lys Glu Lys Pro Met Gln Asp
420 425 430
Leu Met Ile Cys Gly Glu Gln Lys Leu Thr Met Gln Ile Gly Glu Ser
435 440 445
Ser Asp Asp Cys Ile Val Met Glu Ala Gly Thr Glu Val Arg Ser Ala
450 455 460
Leu Val Val Gln Glu Ala Asp Ser Ser Pro Ala Ala Val Pro Ser Gly
465 470 475 480
Asp Glu Leu Leu Ser Glu Gln Glu Ala Ala Asp Ala Gln Ala Arg Glu
485 490 495
Ala Glu Asn Asn Ala Val Lys Glu Asp Met Ile Thr Lys Lys Gln Glu
500 505 510
Ser Lys Arg Lys Ile Val Asp Gly Val Ile Ser Leu Val Thr Val Val
515 520 525
Gly Leu Thr Ala Leu Thr Val Ala Thr Gly Gly Leu Ala Ala Pro Phe
530 535 540
Ala Ile Ala Ala Gly Val Lys Ala Thr Phe Ala Val Ala Asp Ile Ala
545 550 555 560
Glu Gly Leu Asp Gly Tyr Ser Lys Met Asn Ala Met Asp Ala Ser Arg
565 570 575
Pro Ala Asn Phe Leu Arg Asp Thr Val Phe Gly Gly Asn Gln Thr Ala
580 585 590
Tyr Asp Ile Thr Ser Met Ile Thr Asp Val Ala Phe Asp Val Val Ser
595 600 605
Gly Lys Ala Leu Val Gly Ala Phe Ser Gly Ala Asp Lys Val Ser Lys
610 615 620
Val Gln Lys Phe Ala Gly Lys Ala Met Ser Phe Trp Asn Gly Ile Cys
625 630 635 640
Pro Lys Thr Lys Val Ala Asn Phe Leu Phe Gln Met Gly Gly Thr Met
645 650 655
Leu Phe Gly Ala Val Asn Asp Tyr Leu Thr Thr Gly Lys Val Asp Leu
660 665 670
Lys Asn Leu Gly Leu Asp Ala Phe Ala Gly Leu Ala Lys Gly Thr Leu
675 680 685
Gly Thr Ala Gly Thr Glu Lys Ile Lys Arg Leu Leu Asn Thr Asp Asn
690 695 700
Lys Trp Val Glu Lys Ala Val Gly Ile Leu Ala Gly Thr Thr Phe Gly
705 710 715 720
Thr Thr Val Asp Leu Gly Ile Asn Lys Leu Ala Gly Arg Asp Val Asp
725 730 735
Leu Leu Gln Val Ile Lys Gln Asn Leu Ile Glu Ser Gly Leu Gly Gln
740 745 750
Phe Phe Gly Glu Pro Ile Asp Val Val Thr Gly Ala Phe Leu Ile Thr
755 760 765
Ala Thr Asp Phe Thr Leu Pro Asp Ile Arg Glu Asp Leu Arg Val Gln
770 775 780
Arg Lys Tyr Asn Ser Thr Ser Arg Glu Ala Gly Leu Leu Gly Pro Gly
785 790 795 800
Trp Ser Phe Ser Tyr Glu Cys Arg Leu Tyr Cys Ser Gly Asn Arg Leu
805 810 815
His Ala Lys Leu Asp Ser Gly Ile Thr Ala Val Phe Ala Trp Asp Gly
820 825 830
Ser His Ala Val Asn Val Thr Arg Gly Cys Glu Trp Leu Glu Leu Thr
835 840 845
Gly Glu Asp Asp Gly Trp Arg Ile Tyr Asp Gly Arg Asn Tyr Lys Cys
850 855 860
Tyr His Tyr Asp Gly Gln Gly Leu Leu Thr Ala Ala Glu Asp Arg Asn
865 870 875 880
Gly Gln Cys Val Arg Leu Tyr Tyr Glu Gly Glu Arg Leu Thr Arg Ile
885 890 895
Thr Thr Pro Leu Gly Tyr Ser Leu Asp Val Glu Ile Arg Asp Gly Arg
900 905 910
Leu Val Gln Ile Arg Asp His Met Gly Arg Thr Met Gln Tyr Arg Tyr
915 920 925
Glu Asn Gly Phe Leu Ser Asp Val Ile His Met Asp Glu Gly Val Thr
930 935 940
His Tyr Glu Tyr Asp Ser Asn Gly Tyr Leu Glu Arg Ala Val Asp Gln
945 950 955 960
Ala Lys Val Thr Tyr Leu Glu Asn Arg Tyr Asp Asp Ala Gly Arg Val
965 970 975
Val Leu Gln Thr Leu Ala Asn Gly Asp Thr Tyr Arg Ala Asp Tyr His
980 985 990
Pro Glu Lys Asn Arg Val Thr Ile Val Ser Ser Val His Asp Lys Ala
995 1000 1005
Val Glu His Trp Tyr Asn Glu Phe Gly Glu Ile Leu Glu Thr Ser
1010 1015 1020
Tyr Gln Asp Gly Thr Lys Glu Arg Tyr Glu Tyr Gly Glu Asn Gly
1025 1030 1035
His Arg Thr Ser Arg Thr Asp Arg Leu Gly Arg Lys Thr Thr Trp
1040 1045 1050
Thr Tyr Asp Glu Ala Gly Arg Leu Thr Glu Glu Val Gln Pro Asp
1055 1060 1065
Gly Leu Arg Thr Val His Arg Tyr Asp Ala Ala Gly Asn Glu Ile
1070 1075 1080
Leu Arg Thr Asp Ser Ala Gly Arg Glu Thr Ala Phe Glu Tyr Asp
1085 1090 1095
Gly His His Asn Arg Thr Ala Glu Arg Arg Thr Asp Gly Leu Gln
1100 1105 1110
Val Arg Glu Asn Arg Ser Val Tyr Asp Trp Met Gly Arg Leu Thr
1115 1120 1125
Glu Thr Ala Asp Ala Glu Gly Asn Arg Thr Gln Tyr Gln Tyr Gly
1130 1135 1140
Glu Ala Gly Gly Lys Pro Ser Val Ile Arg Phe Ala Asp Gly Glu
1145 1150 1155
Thr Cys Ser Phe Glu Tyr Asp Lys Ala Gly Arg Met Met Ala Gln
1160 1165 1170
Glu Asp Ala Cys Gly Arg Thr Glu Tyr Gly Tyr Asn Ala Arg Asn
1175 1180 1185
Lys Arg Ala Leu Val Arg Asp Gly Glu Gly Asn Glu Thr Arg Trp
1190 1195 1200
Met Tyr Asp Gly Met Gly Arg Leu Leu Ala Leu Tyr Leu Pro Lys
1205 1210 1215
Ala Trp Lys Glu Gln His Gly Glu Tyr Ser Tyr Ser Tyr Asp Phe
1220 1225 1230
Leu Asp Arg Leu Ile His Thr Lys Asn Pro Asp Gly Gly His Glu
1235 1240 1245
Arg Leu Met Arg Asp Gly Glu Gly Asn Val Leu Lys Arg Val His
1250 1255 1260
Pro Asn Ala Tyr Asp Ser Cys Arg Asp Asp Gly Glu Gly Thr Thr
1265 1270 1275
Tyr Asp Tyr Asp Ser Asp Gly Asn Asn Ile Arg Ile His Tyr Pro
1280 1285 1290
Asp Gly Gly Cys Glu Arg Ile Phe Tyr Asp Ser Glu Gly Asn Arg
1295 1300 1305
Ile Arg His Val Met Pro Glu Ser Tyr Asp Pro Gln Thr Asp Asp
1310 1315 1320
Gly Glu Gly Phe Thr Tyr Thr Tyr Asp Ala Cys Ser Arg Leu Thr
1325 1330 1335
Gly Val Thr Gly Pro Asp Gly Val Arg Gln Ala Ser Tyr Thr Tyr
1340 1345 1350
Asp Pro Ala Gly Asn Leu Thr Glu Glu Thr Asp Ala Glu Gly Arg
1355 1360 1365
Cys Thr Tyr Arg Ser Tyr Thr Ala Phe Gly Glu Leu Lys Glu Gln
1370 1375 1380
Leu Lys Pro Ala Leu Glu Lys Asp Gly Val Met Leu Tyr Glu Arg
1385 1390 1395
Ile Thr Trp Gln Tyr Asp Arg Cys Gly Asn Val Leu Leu Glu Gln
1400 1405 1410
Arg His Gly Gly Tyr Trp Asp Ser Asn Gly Val Leu Val Lys Glu
1415 1420 1425
Asp Gly Ala Gly Leu Ala Leu Arg Phe Thr Tyr Asp Ser Arg Asn
1430 1435 1440
Arg Arg Ile Arg Val Glu Asp Gly Leu Gly Ala Val Ile Ser Cys
1445 1450 1455
His Tyr Asp Val Gln Gly Lys Leu Val Tyr Glu Glu Lys Ala Val
1460 1465 1470
Ser Gly Glu Val Arg Gln Val Ile His Tyr Gly Tyr Asp Arg Ala
1475 1480 1485
Gly Arg Leu Thr Glu Arg Lys Glu Glu Leu Asp Ser Gly Leu Ala
1490 1495 1500
Pro Leu Glu Gly Glu Pro Arg Tyr Ala Val Thr Arg Tyr Arg Tyr
1505 1510 1515
Asp Gly Asn Gly Asn Arg Thr Gly Ile Val Thr Pro Glu Gly Tyr
1520 1525 1530
Arg Ile Leu Arg Ser Tyr Asp Ala Cys Asp Arg Leu Val Ser Glu
1535 1540 1545
Arg Val Val Asp Asp Lys Asn Gly Ile Asp Arg Thr Thr Ser Val
1550 1555 1560
Thr Tyr Asp Tyr Ala Gly Asn Ile Thr Arg Ile Val Arg Ser Gly
1565 1570 1575
Lys Gly Leu Gly Glu Trp Glu Gln Gly Tyr Gly Tyr Asp Leu Lys
1580 1585 1590
Asp Arg Ile Val His Val Lys Asp Cys Leu Gly Pro Val Phe Ser
1595 1600 1605
Tyr Glu Tyr Asp Lys Asn Asp Arg Arg Ile Ala Glu Thr Leu Pro
1610 1615 1620
Gln Thr Gly Met Thr Glu Asn Gly Lys Ser Gly Tyr Pro Lys Asn
1625 1630 1635
Gln Asn Arg Tyr Arg Tyr Asp Val Tyr Gly Arg Leu Leu Thr Arg
1640 1645 1650
Thr Asp Gly Ser Gly Thr Val Gln Glu Glu Asn Arg Tyr Leu Pro
1655 1660 1665
Asp Gly Arg Leu Ala Leu Ser Arg Glu Ala Asp Gly Gln Glu Ile
1670 1675 1680
Arg Tyr Ala Tyr Gly Ala His Gly Arg Glu Glu Glu Thr Gly Thr
1685 1690 1695
Ala Arg Ser Arg Lys Ala Gly Arg Ala Ala Gln Lys Tyr Arg Tyr
1700 1705 1710
Asp Ser Arg Gly Arg Ile Thr Gly Val Val Asn Gly Asn Gly Asn
1715 1720 1725
Glu Thr Gly Tyr Asp Leu Asp Ala Trp Gly Arg Ile Gln Asn Ile
1730 1735 1740
Arg Gln Ala Asp Gly Gly Glu Glu Gly Tyr Thr Tyr Asp Phe Ala
1745 1750 1755
Gly Asn Val Thr Gly Thr Arg Asp Ala Asn Gly Gly Val Ile Thr
1760 1765 1770
Tyr Arg Tyr Asn Ser Gln Gly Lys Val Cys Glu Ile Thr Asp Gln
1775 1780 1785
Glu Gly Asn Ser Glu Thr Phe Arg Tyr Asp Arg Glu Gly Arg Met
1790 1795 1800
Val Leu His Val Asp Arg Asn Gly Ser Glu Val Arg Thr Thr Tyr
1805 1810 1815
Asn Val Asp Gly Asn Pro Val Leu Glu Thr Gly Thr Asp Arg Asn
1820 1825 1830
Gly Glu Asn Arg Val Thr Arg Ser Phe Glu Tyr Asp Ala Ser Gly
1835 1840 1845
Asn Val Arg Lys Ala Val Ala Gly Gly Phe Cys Tyr Thr Tyr Glu
1850 1855 1860
Tyr Arg Pro Asp Gly Lys Leu Leu Lys Lys Ser Ala Ser Gly Arg
1865 1870 1875
Thr Ile Leu Ser Cys Ser Tyr His Ala Asp Gly Ser Leu Glu Ser
1880 1885 1890
Leu Thr Asp Ala Ser Gly Lys Pro Val Phe Tyr Glu Tyr Asp Trp
1895 1900 1905
Arg Gly Asn Leu Ser Gly Val Arg Asp Glu Asn Gly Asp Met Leu
1910 1915 1920
Ala Ala Tyr Ala His Thr Pro Gly Gly Lys Leu Lys Glu Ile Cys
1925 1930 1935
His Gly Asn Gly Leu Cys Thr Arg Tyr Glu Tyr Asp Thr Asp Gly
1940 1945 1950
Asn Met Ile His Leu His Phe Gln Arg Glu Asn Gly Glu Thr Ile
1955 1960 1965
Ser Asp Leu Trp Tyr Glu Tyr Asp Leu Asn Gly Asn Arg Thr Leu
1970 1975 1980
Lys Thr Gly Lys Cys Ile Leu Ser Gly Asp Ser Leu Thr Asp Leu
1985 1990 1995
Ala Val Ser Tyr Arg Tyr Asp Ser Met Asp Arg Leu Thr Ser Glu
2000 2005 2010
Ser Arg Asp Gly Glu Glu Thr Ala Tyr Ser Tyr Asp Phe Cys Gly
2015 2020 2025
Asn Arg Leu Lys Lys Leu Asp Lys Ser Gly Thr Glu Glu Tyr His
2030 2035 2040
Tyr Asn Arg Lys Asn Gln Leu Ile Cys Arg Phe Ser Glu Lys Glu
2045 2050 2055
Lys Thr Ala Tyr Arg Tyr Asp Leu Gln Gly Asn Leu Leu Glu Ala
2060 2065 2070
Ala Gly Ala Glu Gly Thr Glu Val Phe Ser Tyr Asn Ala Phe Gln
2075 2080 2085
Gln Gln Thr Ala Val Thr Met Pro Asp Gly Lys His Leu Glu Asn
2090 2095 2100
Arg Tyr Asp Ala Glu Tyr Leu Arg Ala Gly Thr Val Glu Asn Gly
2105 2110 2115
Thr Val Thr Ser Phe Ser Tyr His Asn Gly Glu Leu Leu Ala Glu
2120 2125 2130
Ser Ser Pro Glu Gly Asp Thr Ile Ser Arg Tyr Ile Pro Gly Tyr
2135 2140 2145
Gly Val Ala Ala Gly Trp Asn Arg Glu Lys Ser Gly Tyr His Tyr
2150 2155 2160
Tyr His Leu Asp Glu Gln Asn Ser Thr Ala Tyr Ile Thr Gly Gly
2165 2170 2175
Ser Cys Glu Ile Glu Asn Arg Tyr Glu Tyr Asp Ala Phe Gly Val
2180 2185 2190
Leu Lys Asn Ser Met Glu Glu Phe His Asn Arg Ile Leu Tyr Thr
2195 2200 2205
Gly Gln Gln Tyr Asp Gln Thr Ser Gly Gln Tyr Tyr Leu Arg Ala
2210 2215 2220
Arg Phe Tyr Asn Pro Val Ile Gly Arg Phe Val Gln Glu Asp Glu
2225 2230 2235
Tyr Arg Gly Asp Gly Leu Asn Leu Tyr Ala Tyr Cys Lys Asn Asn
2240 2245 2250
Pro Val Val Tyr Tyr Asp Pro Ser Gly Tyr Asp Ser Gln Tyr Pro
2255 2260 2265
Cys Lys Glu Glu Met Ser Ala Gly Ala Gly Glu Ser Gly Arg Lys
2270 2275 2280
Thr Ile Ser Leu Pro Glu Tyr Asp Gly Thr Thr Thr His Gly Val
2285 2290 2295
Leu Val Leu Asp Asp Gly Thr Gln Ile Gly Phe Thr Ser Gly Asn
2300 2305 2310
Gly Asp Pro Arg Tyr Thr Asn Tyr Arg Asn Asn Gly His Val Glu
2315 2320 2325
Gln Lys Ser Ala Leu Tyr Met Arg Glu Asn Asn Ile Ser Asn Ala
2330 2335 2340
Thr Val Tyr His Asn Asn Thr Asn Gly Thr Cys Gly Tyr Cys Asn
2345 2350 2355
Thr Met Thr Ala Thr Phe Leu Pro Glu Gly Ala Thr Leu Thr Val
2360 2365 2370
Val Pro Pro Glu Asn Ala Val Ala Asn Asn Ser Arg Ala Ile Asp
2375 2380 2385
Tyr Val Lys Thr Tyr Thr Gly Thr Ser Asn Asp Pro Lys Ile Ser
2390 2395 2400
Pro Arg Tyr Lys Gly Asn
2405
<210> 92
<211> 154
<212> PRT
<213> Streptomyces rubrolavendulae
<400> 92
Val Ala Gly Asn Arg Ala Phe Thr Gln Arg Ala Arg Thr Tyr Asn Leu
1 5 10 15
Thr Val Ala Asp Leu His Thr Tyr Tyr Val Leu Ala Gly Gln Thr Pro
20 25 30
Val Leu Val His Asn Ala Asn Cys Gly Pro His Leu Lys Asp Leu Gln
35 40 45
Lys Asp Tyr Pro Arg Arg Thr Val Gly Ile Leu Asp Val Gly Thr Asp
50 55 60
Gln Leu Pro Met Ile Ser Gly Pro Gly Gly Gln Ser Gly Leu Leu Lys
65 70 75 80
Asn Leu Pro Gly Arg Thr Lys Ala Asn Gly Glu His Val Glu Thr His
85 90 95
Ala Ala Ala Phe Leu Arg Met Asn Pro Gly Val Arg Lys Ala Val Leu
100 105 110
Tyr Ile Asp Tyr Pro Thr Gly Thr Cys Gly Thr Cys Arg Ser Thr Leu
115 120 125
Pro Asp Met Leu Pro Glu Gly Val Gln Leu Trp Val Ile Ser Pro Arg
130 135 140
Arg Thr Glu Lys Phe Thr Gly Leu Pro Asp
145 150
<210> 93
<211> 74
<212> PRT
<213> Streptomyces rubrolavendulae
<400> 93
Val Ala Gly Asn Arg Ala Phe Thr Gln Arg Ala Arg Thr Tyr Asn Leu
1 5 10 15
Thr Val Ala Asp Leu His Thr Tyr Tyr Val Leu Ala Gly Gln Thr Pro
20 25 30
Val Leu Val His Asn Ala Asn Cys Gly Pro His Leu Lys Asp Leu Gln
35 40 45
Lys Asp Tyr Pro Arg Arg Thr Val Gly Ile Leu Asp Val Gly Thr Asp
50 55 60
Gln Leu Pro Met Ile Ser Gly Pro Gly Gly
65 70
<210> 94
<211> 80
<212> PRT
<213> Streptomyces rubrolavendulae
<400> 94
Gln Ser Gly Leu Leu Lys Asn Leu Pro Gly Arg Thr Lys Ala Asn Gly
1 5 10 15
Glu His Val Glu Thr His Ala Ala Ala Phe Leu Arg Met Asn Pro Gly
20 25 30
Val Arg Lys Ala Val Leu Tyr Ile Asp Tyr Pro Thr Gly Thr Cys Gly
35 40 45
Thr Cys Arg Ser Thr Leu Pro Asp Met Leu Pro Glu Gly Val Gln Leu
50 55 60
Trp Val Ile Ser Pro Arg Arg Thr Glu Lys Phe Thr Gly Leu Pro Asp
65 70 75 80
<210> 95
<211> 147
<212> PRT
<213> Propionibacterium acidifaciens
<400> 95
Leu Ser Thr Thr Gly Lys Asn Val Leu Gly His Phe Glu Pro Thr Pro
1 5 10 15
Thr Thr Pro Gln Gly Thr Ser Ser Asp Thr Ile Ala Glu Met Leu Asn
20 25 30
Ser Ala Ser Gln Pro Gly Arg Thr Ala Gly Val Leu Asp Ile Asp Gly
35 40 45
Glu Leu Thr Pro Leu Thr Ser Gly Arg Pro Ser Leu Pro Asn Tyr Ile
50 55 60
Ala Ser Gly His Val Glu Gly Gln Ala Ala Met Ile Met Arg Gln Gln
65 70 75 80
Gln Val Gln Ser Ala Thr Val Tyr His Asp Asn Pro Asn Gly Thr Cys
85 90 95
Gly Tyr Cys Tyr Ser Gln Leu Pro Thr Leu Leu Pro Glu Gly Ala Ala
100 105 110
Leu Asp Val Val Pro Pro Ala Gly Thr Val Pro Pro Ser Asn Arg Trp
115 120 125
His Asn Gly Gly Pro Ser Phe Ile Gly Asn Ser Ser Glu Pro Lys Pro
130 135 140
Trp Pro Arg
145
<210> 96
<211> 56
<212> PRT
<213> Propionibacterium acidifaciens
<400> 96
Leu Ser Thr Thr Gly Lys Asn Val Leu Gly His Phe Glu Pro Thr Pro
1 5 10 15
Thr Thr Pro Gln Gly Thr Ser Ser Asp Thr Ile Ala Glu Met Leu Asn
20 25 30
Ser Ala Ser Gln Pro Gly Arg Thr Ala Gly Val Leu Asp Ile Asp Gly
35 40 45
Glu Leu Thr Pro Leu Thr Ser Gly
50 55
<210> 97
<211> 91
<212> PRT
<213> Propionibacterium acidifaciens
<400> 97
Arg Pro Ser Leu Pro Asn Tyr Ile Ala Ser Gly His Val Glu Gly Gln
1 5 10 15
Ala Ala Met Ile Met Arg Gln Gln Gln Val Gln Ser Ala Thr Val Tyr
20 25 30
His Asp Asn Pro Asn Gly Thr Cys Gly Tyr Cys Tyr Ser Gln Leu Pro
35 40 45
Thr Leu Leu Pro Glu Gly Ala Ala Leu Asp Val Val Pro Pro Ala Gly
50 55 60
Thr Val Pro Pro Ser Asn Arg Trp His Asn Gly Gly Pro Ser Phe Ile
65 70 75 80
Gly Asn Ser Ser Glu Pro Lys Pro Trp Pro Arg
85 90
<210> 98
<211> 125
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 98
Met Ser Leu Pro Glu Tyr Asp Gly Thr Thr Thr His Gly Val Leu Val
1 5 10 15
Leu Asp Asp Gly Thr Gln Ile Gly Phe Thr Ser Gly Asn Gly Asp Pro
20 25 30
Arg Tyr Thr Asn Tyr Arg Asn Asn Gly His Val Glu Gln Lys Ser Ala
35 40 45
Leu Tyr Met Arg Glu Asn Asn Ile Ser Asn Ala Thr Val Tyr His Asn
50 55 60
Asn Thr Asn Gly Thr Cys Gly Tyr Cys Asn Thr Met Thr Ala Thr Phe
65 70 75 80
Leu Pro Glu Gly Ala Thr Leu Thr Val Val Pro Pro Glu Asn Ala Val
85 90 95
Ala Asn Asn Ser Arg Ala Ile Asp Tyr Val Lys Thr Tyr Thr Gly Thr
100 105 110
Ser Asn Asp Pro Lys Ile Ser Pro Arg Tyr Lys Gly Asn
115 120 125
<210> 99
<211> 30
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 99
Met Ser Leu Pro Glu Tyr Asp Gly Thr Thr Thr His Gly Val Leu Val
1 5 10 15
Leu Asp Asp Gly Thr Gln Ile Gly Phe Thr Ser Gly Asn Gly
20 25 30
<210> 100
<211> 95
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 100
Asp Pro Arg Tyr Thr Asn Tyr Arg Asn Asn Gly His Val Glu Gln Lys
1 5 10 15
Ser Ala Leu Tyr Met Arg Glu Asn Asn Ile Ser Asn Ala Thr Val Tyr
20 25 30
His Asn Asn Thr Asn Gly Thr Cys Gly Tyr Cys Asn Thr Met Thr Ala
35 40 45
Thr Phe Leu Pro Glu Gly Ala Thr Leu Thr Val Val Pro Pro Glu Asn
50 55 60
Ala Val Ala Asn Asn Ser Arg Ala Ile Asp Tyr Val Lys Thr Tyr Thr
65 70 75 80
Gly Thr Ser Asn Asp Pro Lys Ile Ser Pro Arg Tyr Lys Gly Asn
85 90 95
<210> 101
<211> 143
<212> PRT
<213> Ruminococcus bicirculans
<400> 101
His Thr Tyr His Val Gly Lys Cys Arg Leu Leu Val His Asn Ala Asn
1 5 10 15
Cys Asn Gln Glu Lys Pro Val Leu Pro Lys Tyr Asp Gly Lys Thr Thr
20 25 30
Glu Gly Val Met Val Thr Pro Asp Gly Lys Gln Ile Ser Phe Lys Ser
35 40 45
Gly Asn Ser Ser Thr Pro Ser Tyr Pro Gln Tyr Lys Ala Gln Ser Ala
50 55 60
Ser His Val Glu Gly Lys Ala Ala Leu Tyr Met Arg Glu Asn Gly Ile
65 70 75 80
Asn Glu Ala Thr Val Phe His Asn Asn Pro Asn Gly Thr Cys Gly Phe
85 90 95
Cys Asp Arg Gln Val Pro Ala Leu Leu Pro Lys Gly Ala Lys Leu Thr
100 105 110
Val Val Pro Pro Ser Asn Ser Val Ala Asn Asn Val Arg Ala Ile Pro
115 120 125
Val Pro Lys Thr Tyr Ile Gly Asn Ser Thr Val Pro Lys Ile Lys
130 135 140
<210> 102
<211> 53
<212> PRT
<213> Ruminococcus bicirculans
<400> 102
His Thr Tyr His Val Gly Lys Cys Arg Leu Leu Val His Asn Ala Asn
1 5 10 15
Cys Asn Gln Glu Lys Pro Val Leu Pro Lys Tyr Asp Gly Lys Thr Thr
20 25 30
Glu Gly Val Met Val Thr Pro Asp Gly Lys Gln Ile Ser Phe Lys Ser
35 40 45
Gly Asn Ser Ser Thr
50
<210> 103
<211> 90
<212> PRT
<213> Ruminococcus bicirculans
<400> 103
Pro Ser Tyr Pro Gln Tyr Lys Ala Gln Ser Ala Ser His Val Glu Gly
1 5 10 15
Lys Ala Ala Leu Tyr Met Arg Glu Asn Gly Ile Asn Glu Ala Thr Val
20 25 30
Phe His Asn Asn Pro Asn Gly Thr Cys Gly Phe Cys Asp Arg Gln Val
35 40 45
Pro Ala Leu Leu Pro Lys Gly Ala Lys Leu Thr Val Val Pro Pro Ser
50 55 60
Asn Ser Val Ala Asn Asn Val Arg Ala Ile Pro Val Pro Lys Thr Tyr
65 70 75 80
Ile Gly Asn Ser Thr Val Pro Lys Ile Lys
85 90
<210> 104
<211> 156
<212> PRT
<213> Streptomyces cavourensis
<400> 104
Val Gln Ile Thr Ala Ile Lys Arg Trp Thr Glu Thr Ala Thr Val His
1 5 10 15
Asn Leu Thr Val Ala Asp Leu His Thr Tyr Tyr Val Leu Ala Gly Lys
20 25 30
Thr Pro Val Leu Val His Asn Glu Asn Cys Gly Pro Asn Leu Lys Asp
35 40 45
Leu Pro Lys Asp Tyr Asp Arg Arg Thr Val Gly Ile Leu Asp Val Gly
50 55 60
Thr Asp Gln Leu Pro Met Ile Ser Gly Pro Gly Gly Gln Ser Gly Leu
65 70 75 80
Leu Lys Asn Leu Pro Gly Arg Thr Lys Ala Asn Thr Asp His Val Glu
85 90 95
Ala His Thr Ala Ala Phe Leu Arg Met Asn Pro Gly Ile Arg Lys Ala
100 105 110
Val Leu Tyr Ile Asp Tyr Pro Thr Gly Thr Cys Gly Thr Cys Gly Ser
115 120 125
Thr Leu Pro Asp Met Leu Pro Glu Gly Val Gln Leu Trp Val Ile Ser
130 135 140
Pro Arg Lys Thr Glu Lys Phe Ala Gly Leu Pro Asp
145 150 155
<210> 105
<211> 76
<212> PRT
<213> Streptomyces cavourensis
<400> 105
Val Gln Ile Thr Ala Ile Lys Arg Trp Thr Glu Thr Ala Thr Val His
1 5 10 15
Asn Leu Thr Val Ala Asp Leu His Thr Tyr Tyr Val Leu Ala Gly Lys
20 25 30
Thr Pro Val Leu Val His Asn Glu Asn Cys Gly Pro Asn Leu Lys Asp
35 40 45
Leu Pro Lys Asp Tyr Asp Arg Arg Thr Val Gly Ile Leu Asp Val Gly
50 55 60
Thr Asp Gln Leu Pro Met Ile Ser Gly Pro Gly Gly
65 70 75
<210> 106
<211> 80
<212> PRT
<213> Streptomyces cavourensis
<400> 106
Gln Ser Gly Leu Leu Lys Asn Leu Pro Gly Arg Thr Lys Ala Asn Thr
1 5 10 15
Asp His Val Glu Ala His Thr Ala Ala Phe Leu Arg Met Asn Pro Gly
20 25 30
Ile Arg Lys Ala Val Leu Tyr Ile Asp Tyr Pro Thr Gly Thr Cys Gly
35 40 45
Thr Cys Gly Ser Thr Leu Pro Asp Met Leu Pro Glu Gly Val Gln Leu
50 55 60
Trp Val Ile Ser Pro Arg Lys Thr Glu Lys Phe Ala Gly Leu Pro Asp
65 70 75 80
<210> 107
<211> 136
<212> PRT
<213> Roseburia intestinalis
<400> 107
Ser Ala Gly Ala Gly Glu Ser Gly Arg Lys Thr Ile Ser Leu Pro Glu
1 5 10 15
Tyr Asp Gly Thr Thr Thr His Gly Val Leu Val Leu Asp Asp Gly Thr
20 25 30
Gln Ile Gly Phe Thr Ser Gly Asn Gly Asp Pro Arg Tyr Thr Asn Tyr
35 40 45
Arg Asn Asn Gly His Val Glu Gln Lys Ser Ala Leu Tyr Met Arg Glu
50 55 60
Asn Asn Ile Ser Asn Ala Thr Val Tyr His Asn Asn Thr Asn Gly Thr
65 70 75 80
Cys Gly Tyr Cys Asn Thr Met Thr Ala Thr Phe Leu Pro Glu Gly Ala
85 90 95
Thr Leu Thr Val Val Pro Pro Glu Asn Ala Val Ala Asn Asn Ser Arg
100 105 110
Ala Ile Asp Tyr Val Lys Thr Tyr Thr Gly Thr Ser Asn Asp Pro Lys
115 120 125
Ile Ser Pro Arg Tyr Lys Gly Asn
130 135
<210> 108
<211> 40
<212> PRT
<213> Roseburia intestinalis
<400> 108
Ser Ala Gly Ala Gly Glu Ser Gly Arg Lys Thr Ile Ser Leu Pro Glu
1 5 10 15
Tyr Asp Gly Thr Thr Thr His Gly Val Leu Val Leu Asp Asp Gly Thr
20 25 30
Gln Ile Gly Phe Thr Ser Gly Asn
35 40
<210> 109
<211> 96
<212> PRT
<213> Roseburia intestinalis
<400> 109
Gly Asp Pro Arg Tyr Thr Asn Tyr Arg Asn Asn Gly His Val Glu Gln
1 5 10 15
Lys Ser Ala Leu Tyr Met Arg Glu Asn Asn Ile Ser Asn Ala Thr Val
20 25 30
Tyr His Asn Asn Thr Asn Gly Thr Cys Gly Tyr Cys Asn Thr Met Thr
35 40 45
Ala Thr Phe Leu Pro Glu Gly Ala Thr Leu Thr Val Val Pro Pro Glu
50 55 60
Asn Ala Val Ala Asn Asn Ser Arg Ala Ile Asp Tyr Val Lys Thr Tyr
65 70 75 80
Thr Gly Thr Ser Asn Asp Pro Lys Ile Ser Pro Arg Tyr Lys Gly Asn
85 90 95
<210> 110
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 110
Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg
1 5 10 15
Gly Gly Gly Gly Ser
20
<210> 111
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 111
Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Glu Ala Ala Ala Arg
1 5 10 15
Gly Ser
<210> 112
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 112
Leu Arg Gly Ser Gln Leu Val Lys Ser Lys Ser Gly Ser
1 5 10
<210> 113
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 113
Leu Arg Gly Ser Gln Leu Val Lys Ser Gly Ser
1 5 10
<210> 114
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 114
Leu Arg Gly Ser Gln Leu Val Gly Ser
1 5
<210> 115
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 115
Leu Arg Gly Ser Gly Ser
1 5
<210> 116
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 116
Leu Arg Gly Ser
1
<210> 117
<211> 115
<212> PRT
<213> Plantactinospora sp.
<400> 117
Met Gly Asp Arg Leu Pro Ala Phe Val Asp Gly Gly Asp Thr Leu Gly
1 5 10 15
Ile Phe Ser Arg Gly Gly Ile Glu Arg Asp Leu Ala Ser Gly Val Ala
20 25 30
Gly Pro Ala Ser Ser Leu Pro Lys Gly Thr Pro Gly Phe Asn Gly Leu
35 40 45
Val Lys Ser His Val Glu Gly His Ala Ala Ala Leu Met Arg Gln Asn
50 55 60
Gly Ile Pro Asn Ala Glu Leu Tyr Ile Asn Arg Val Pro Cys Gly Ser
65 70 75 80
Gly Asn Gly Cys Ala Ala Met Leu Pro His Met Leu Pro Glu Gly Ala
85 90 95
Thr Leu Arg Val Tyr Gly Pro Asn Gly Tyr Asp Arg Thr Phe Thr Gly
100 105 110
Leu Pro Asp
115
<210> 118
<211> 2198
<212> PRT
<213> Streptomyces massasporeus
<400> 118
Met Ser Ser Arg Pro Phe Arg Lys Arg Leu Pro Gly Ala Val Val Arg
1 5 10 15
Arg Trp Leu Gly Arg Gly Ala Val Val Ala Ser Leu Ser Leu Leu Pro
20 25 30
Gln Val Val Val Pro Ser Gly Tyr Asp Phe Ala Ala Gln Ala Gln Ser
35 40 45
Val Ala Ala Arg Lys Lys Leu Glu Asp Arg Pro Glu Ala Lys Ile Asn
50 55 60
Lys Val Gly Val Leu Arg Pro Gly Thr Ser Lys Ala Pro Lys Asp Lys
65 70 75 80
Ser Ala Pro Ala Ser Arg Lys Thr Arg Glu Arg Leu Gln Glu Ala Ser
85 90 95
Trp Pro Lys Ser Gly Lys Ala Thr Ala Ala Val Thr Ala Thr Ser Glu
100 105 110
Ala Thr Val Asn Val Gly Gly Leu Gly Met Glu Leu Thr Gln Glu Pro
115 120 125
Ala Ala Pro Ala Ala Lys Ser Ala Lys Ser Thr Thr Lys Arg Lys Ala
130 135 140
Thr Gly Pro Ala Glu Lys Val Thr Leu Arg Val His Ser Arg Ala Thr
145 150 155 160
Ala Lys Lys Ala Gly Val Asn Gly Val Leu Leu Thr Val Asp Pro Ala
165 170 175
Arg Gly Glu Ser Asn Glu Lys Ala Glu Asp Thr Asp Lys Leu Arg Ile
180 185 190
Ser Leu Asp Tyr Ser Ser Phe Ser Asp Val Tyr Gly Gly Asn Phe Gly
195 200 205
Pro Arg Leu Ser Leu Val Lys Leu Pro Ala Cys Ala Leu Thr Thr Pro
210 215 220
Glu Lys Lys Ser Cys Arg Thr Gln Thr Pro Val Ala Gly Ala Asp Asn
225 230 235 240
Glu Ala Glu Ser Gln Thr Leu Thr Gly Thr Val Pro Ala Arg Asn Leu
245 250 255
Lys Ala Gly Thr Pro Met Leu Leu Ala Ala Ala Ala Asp Ser Ser Gly
260 265 270
Gly Gly Gly Asp Phe Ser Ala Thr Pro Leu Ser Pro Thr Ala Thr Trp
275 280 285
Glu Ala Gly Gly Ser Thr Gly Asp Phe Thr Trp Asp Tyr Pro Leu Arg
290 295 300
Val Pro Pro Ala Thr Ala Gly Pro Ser Pro Asn Leu Ser Ile Ser Tyr
305 310 315 320
Asn Ser Ala Ser Val Asp Gly Arg Thr Ala Gly Glu Asn Asn Gln Thr
325 330 335
Ser Leu Ile Gly Glu Gly Phe Ser Ile Thr Glu Ser Tyr Ile Glu Arg
340 345 350
Lys Tyr Ala Ser Cys Lys Asp Asp Gly Gln Ser Gly Lys Gly Asp Leu
355 360 365
Cys Trp Lys Tyr Ala Asn Ala Thr Leu Val Leu Asn Gly Lys Ala Val
370 375 380
Glu Leu Val Asn Ala Cys Ala Asp Lys Ser Ala Cys Asp Thr Ala Ala
385 390 395 400
Leu Ser Glu Ala Ser Gly Gly Thr Trp Lys Val Lys Asn Glu Asp Gly
405 410 415
Thr Arg Val Glu His Leu Thr Gly Ala Ser Gly Asn Gly Asp Asn Asn
420 425 430
Gly Glu Tyr Trp Lys Val Thr Asp Ala Ser Gly Ile Gln Tyr Tyr Phe
435 440 445
Gly Lys His Arg Met Pro Gly Trp Ser Asp Lys Gly Thr Thr Asp Thr
450 455 460
Ala Asp Asp Asp Pro Ser Thr Tyr Ser Thr Trp Ala Val Pro Val Phe
465 470 475 480
Gly Asp Asp Ser Gly Glu Pro Cys Tyr Lys Ser Ser Gly Phe Ala Asp
485 490 495
Ser Ser Cys Asn Gln Ala Trp Arg Trp Asn Leu Asp Tyr Val Val Asp
500 505 510
Thr His Asp Asn Ala Ser Thr Tyr Trp Tyr Ser Lys Glu Thr Asn Tyr
515 520 525
Tyr Ser Lys Asn Ala Asp Thr Thr Val Asn Gly Thr Ala Tyr Thr Arg
530 535 540
Gly Gly Tyr Leu Asn Arg Ile Asp Tyr Gly Leu Arg Ser Asp Leu Ile
545 550 555 560
Tyr Ser Lys Pro Ala Ala Gln Gln Val Arg Phe Thr Tyr Gly Gln Arg
565 570 575
Cys Ile Val Thr Asn Gly Cys Ser Ser Leu Thr Lys Asp Thr Lys Ala
580 585 590
Asn Trp Pro Asp Val Pro Tyr Asp Met Ile Cys Ala Ala Asn Thr Lys
595 600 605
Cys Thr Thr Gln Ile Gly Pro Ser Phe Phe Thr Arg Gln Arg Leu Ile
610 615 620
Asp Ile Thr Thr Ser Val Trp Thr Gly Thr Gly Thr Thr Arg Arg Asp
625 630 635 640
Val Asp Thr Trp His Leu Ser His Asp Phe Pro Asp Thr Gly Asp Ala
645 650 655
Ser Ser Pro Ser Leu Trp Leu Lys Ser Ile Gln Asn Thr Gly Lys Ala
660 665 670
Asn Thr Thr Thr Ala Ala Met Pro Pro Ile Val Phe Gly Gly Ile Gln
675 680 685
Met Pro Asn His Val Glu Gly Ser Gly Gln Asp Asn Leu Arg Tyr Ile
690 695 700
Lys Trp Arg Val Arg Thr Ile Lys Ser Glu Thr Gly Ser Thr Leu Thr
705 710 715 720
Val Asn Tyr Ser Asp Pro Asp Cys Ile Trp Gly Ser Ser Met Pro Ser
725 730 735
Ala Val Asp Lys Asn Thr Arg Arg Cys Phe Pro Val Lys Trp Ser Gln
740 745 750
Ser Gly Thr Thr Pro Val Thr Asp Trp Phe His Lys Tyr Val Val Thr
755 760 765
Ser Val Leu Gln Asp Asp Pro Tyr Gly His Ser Asp Thr Gly Glu Thr
770 775 780
Tyr Tyr Asp Tyr Gln Gly Gly Ala Gly Trp Ala Tyr Ser Asp Asp Glu
785 790 795 800
Gly Leu Thr Lys Pro Ser Asn Arg Thr Trp Ser Gln Trp Arg Gly Tyr
805 810 815
Gly Lys Val Val Thr Thr Ser Gly Asn Ser Glu Gly Pro Arg Ser Lys
820 825 830
Lys Ser Thr Leu Tyr Met Arg Gly Leu Asn Gly Glu Lys Glu Leu Asp
835 840 845
Gly Thr Ala Arg Val Ala Lys Val Thr Asp Ser Thr Gly Thr Ala Ile
850 855 860
Asp Asp Ser Arg Gln Tyr Ala Gly Phe Val Arg Glu Thr Ile Ala Tyr
865 870 875 880
Asn Gly Ser Asp Glu Leu Ser Gly Thr Ile Asn Thr Pro Trp Ser His
885 890 895
Lys Thr Gly Ser His Thr Tyr Ser Trp Gly Thr Thr Glu Ala Trp Ile
900 905 910
Val Gln Ala Gly Glu Thr Glu Ser Arg Thr Lys Ile Ser Thr Gly Thr
915 920 925
Arg Thr Val Lys Gln Lys Thr Thr Tyr Asp Thr Thr Tyr Gly Met Pro
930 935 940
Ile Thr Val Glu Asp Ser Gly Asp Ala Thr Lys Phe Gly Asp Glu Ser
945 950 955 960
Cys Val Arg Thr Ser Tyr Ala Arg Asn Thr Ser Ala Trp Leu Val Asn
965 970 975
Arg Val Ser Arg Thr Glu Thr Tyr Ser Val Pro Cys Ala Thr Ile Pro
980 985 990
Ala Ile Pro Ala Asp Val Val Ser Asp Ile Thr Thr Ala Tyr Asp Ala
995 1000 1005
Lys Ala Val Gly Ala Ala Pro Thr Gln Gly Asp Ile Thr Ala Thr
1010 1015 1020
Tyr Arg Val Ala Ser Tyr Asn Ala Ala Asp Lys Thr Pro Val Tyr
1025 1030 1035
Gln Gln Val Ser Ser Ser Thr Phe Asp Lys Leu Gly Arg Pro Leu
1040 1045 1050
Thr Glu Thr Asn Ala Leu Asp Arg Thr Val Lys Thr Ser Tyr Val
1055 1060 1065
Pro Asp Asp Thr Gly Tyr Gly Pro Leu Thr Ser Lys Thr Thr Thr
1070 1075 1080
Asp Pro Lys Leu Tyr Thr Ser Thr Thr Glu Val Asp Pro Ala Trp
1085 1090 1095
Gly Ala Ala Ser Lys Thr Thr Asp Ala Asn Gly Asn Val Thr Glu
1100 1105 1110
Trp Ser Phe Asp Ala Leu Gly Arg Leu Arg Ser Val Trp Lys Pro
1115 1120 1125
Asp Arg Ser Arg Thr Leu Asp Asp Ala Ala Ser Ile Val Tyr Ala
1130 1135 1140
Tyr Ser Val Asn Asn Asp Lys Glu Thr Trp Val Arg Thr Asp Ala
1145 1150 1155
Leu Lys Ala Asp Gly Lys Thr Tyr Asn Ser Ser Tyr Glu Ile Phe
1160 1165 1170
Asp Ser Leu Leu Arg Pro Arg Gln Lys Gln Val Pro Ala Pro Asn
1175 1180 1185
Gly Gly Arg Val Ile Ser Glu Met Leu Tyr Asp Asp Arg Gly Leu
1190 1195 1200
Ala Tyr Ile Ala Asn Ser Gln Val His Asp Asn Ser Ala Pro Ser
1205 1210 1215
Gly Thr Leu Ala Asn Thr Tyr Thr Gly Ser Val Pro Ala Ser Thr
1220 1225 1230
Glu Thr Val Phe Asp Ala Ala Gly Arg Ala Thr Asp Ser Ile Phe
1235 1240 1245
Arg Val Tyr Gly Gln Glu Lys Trp Arg Thr Lys Thr Asp Gln Gln
1250 1255 1260
Gly Asp Arg Thr Ala Val Thr Ala Ala Ala Gly Gly Thr Gly Thr
1265 1270 1275
Leu Thr Ile Val Asp Ala Arg Gly Arg Val Thr Glu Arg Arg Glu
1280 1285 1290
Phe Gly Gly Pro Ala Pro Thr Gly Thr Asp Tyr Thr Arg Thr Leu
1295 1300 1305
Tyr Glu Tyr Thr Pro Gly Gly Gln Ile Lys Lys Met Thr Gly Pro
1310 1315 1320
Asp Gly Ala Val Trp Thr Tyr Glu Tyr Asp Leu Arg Gly Arg Lys
1325 1330 1335
Thr Thr Ser Thr Asp Pro Asp Lys Gly Ser Ile Thr Thr Thr Tyr
1340 1345 1350
Asn Asp Ala Asp Gln Pro Leu Thr Ala Thr Thr Thr Leu Asp Asn
1355 1360 1365
Val Ser Arg Thr Leu Ile Asn Asp Tyr Asp Glu Leu Gly Arg Pro
1370 1375 1380
Thr Gly Thr Trp Asp Gly Thr Lys Asp Asn Ala His Gln Leu Thr
1385 1390 1395
Lys Phe Thr Tyr Asp Ser Leu Ala Lys Gly Gln Pro Thr Ala Ser
1400 1405 1410
Ile Arg Tyr Val Gly Gly Thr Thr Gly Lys Ile Tyr Ser Gln Ser
1415 1420 1425
Val Thr Gly Tyr Asp Ala Leu Asn Arg Pro Lys Gly Thr Lys Thr
1430 1435 1440
Val Ile Ala Ala Thr Asp Pro Leu Val Thr Ala Gly Ala Pro Gln
1445 1450 1455
Thr Phe Thr Thr Ser Thr Ala Tyr Asn Ile Asp Gly Thr Val Gln
1460 1465 1470
Ser Thr Ser Leu Pro Ala Ala Ala Gly Leu Pro Ala Glu Thr Val
1475 1480 1485
Lys Asn Thr Tyr Asn Ser Leu Gly Met Leu Thr Gly Thr Asp Gly
1490 1495 1500
Met Thr Asp Tyr Val Gln His Ile Gly Tyr Ser Pro Tyr Gly Glu
1505 1510 1515
Ile Glu Glu Thr Arg Leu Gly Thr Ser Thr Glu Ala Lys Gln Leu
1520 1525 1530
Gln Val Leu Asn Arg Tyr Glu Asp Gly Thr Arg Arg Leu Ala Asn
1535 1540 1545
Thr His Thr Leu Asp Gln Thr Asn Ala Gly Tyr Thr Ser Asp Val
1550 1555 1560
Asp Tyr Val Tyr Asp Ala Thr Gly Asn Val Lys Ser Val Thr Asp
1565 1570 1575
Lys Ala Asn Gly Lys Asp Thr Gln Cys Phe Ala Tyr Asp Gly Tyr
1580 1585 1590
Arg Arg Leu Thr Glu Ala Trp Thr Pro Ser Ser Asn Asp Cys Ala
1595 1600 1605
Thr Ala Arg Ser Ala Ser Ala Leu Gly Gly Pro Ala Pro Tyr Trp
1610 1615 1620
Thr Ser Trp Thr Tyr Lys Pro Gly Gly Leu Arg Asp Ser Gln Thr
1625 1630 1635
Glu His Lys Thr Ser Gly Asp Thr Lys Thr Val Tyr Gly Tyr Pro
1640 1645 1650
Ala Val Asn Thr Ser Gly Thr Gly Gln Pro His Thr Leu Thr Ser
1655 1660 1665
Val Thr Val Gly Ser Gly Ser Ala Lys Thr Tyr Thr Tyr Asp Glu
1670 1675 1680
His Gly Asn Thr Thr Lys Arg Tyr Ser Pro Thr Gly Thr Ala Gln
1685 1690 1695
Ser Leu Thr Trp Asn Ile Glu Gly Glu Leu Thr Arg Leu Thr Glu
1700 1705 1710
Gly Thr Lys Thr Thr Asp Tyr Leu Tyr Asp Ala Asn Gly Glu Leu
1715 1720 1725
Leu Ile Arg Arg Ser Pro Asp Lys Thr Val Leu Tyr Leu Gly Gly
1730 1735 1740
Gln Glu Leu His Tyr Asp Thr Ala Thr Glu Lys Phe Thr Ala Gln
1745 1750 1755
Arg Tyr Tyr Pro Ala Gly Asp Ala Thr Ala Val Arg Thr Glu Thr
1760 1765 1770
Gly Leu Ser Trp Met Val Asp Asp His His Gly Thr Ala Ser Met
1775 1780 1785
Thr Val Asp Ala Thr Thr Gln Ala Val Thr Arg Arg Tyr Thr Lys
1790 1795 1800
Pro Phe Gly Glu Ala Arg Gly Thr Ala Pro Ser Val Trp Pro Asp
1805 1810 1815
Asp Lys Gly Phe Leu Gly Lys Pro Ala Asp Thr Gly Thr Gly Leu
1820 1825 1830
Thr His Ile Gly Ala Arg Glu Tyr Asp Pro Thr Leu Gly Arg Phe
1835 1840 1845
Leu Ser Val Asp Pro Val Leu Ala Pro Asp Asp His Glu Ser Leu
1850 1855 1860
Asn Gly Tyr Ala Tyr Ala Asn Asn Thr Pro Val Thr Leu Ser Asp
1865 1870 1875
Pro Thr Gly Leu Arg Pro Asp Gly Met Cys Gly Gly Ser Ser Ser
1880 1885 1890
Ser Cys Gly Gly Gly Thr Glu Thr Trp Thr Leu Asn Ser Lys Gly
1895 1900 1905
Gly Trp Asp Trp Ser Tyr Thr Lys Thr Tyr Thr Lys Lys Phe Thr
1910 1915 1920
Tyr Arg Thr Gly Asn Gly Gly Thr Arg Thr Gly Thr Met Thr Thr
1925 1930 1935
Thr Val Arg Thr Glu Val Gly His Lys Ala Val Arg Ile Val Phe
1940 1945 1950
Lys Lys Gly Pro Glu Pro Lys Pro Ala Lys Lys Asp Gly Gln Cys
1955 1960 1965
Ser Ser Cys Trp Ala Met Gly Thr Asn Pro Gly Tyr Ser Pro Gly
1970 1975 1980
Ala Thr Asp Asp Trp Ile Asp Arg Pro Lys Leu Glu Thr Trp Gln
1985 1990 1995
Lys Val Val Leu Gly Ala Ile Ser Val Val Ala Ala Gly Val Ile
2000 2005 2010
Leu Ala Pro Ala Ala Ile Val Val Gly Glu Gly Cys Leu Ala Ala
2015 2020 2025
Ala Pro Val Cys Ala Ala Glu Ile Ala Glu Ala Ala Thr Gly Gly
2030 2035 2040
Ala Ser Gly Gly Ser Ala Val Val Gly Ala Gly Val Val Ala Thr
2045 2050 2055
Gly Ala Lys Ala Val Thr Thr Gly Lys Ser Leu Ser Glu Ser Gln
2060 2065 2070
Ala Thr Leu Ser Val Ala Gln Arg Leu Leu Ala Thr Ile Gly Glu
2075 2080 2085
Glu Gly Lys Thr Ala Gly Val Leu Glu Leu Asp Gly Glu Leu Ile
2090 2095 2100
Pro Leu Val Ser Gly Lys Ser Ser Leu Pro Asn Tyr Ala Ala Ser
2105 2110 2115
Gly His Val Glu Gly Gln Ala Ala Leu Ile Met Arg Asp Arg Gly
2120 2125 2130
Ala Thr Ser Gly Arg Leu Leu Ile Asp Asn Pro Ser Gly Ile Cys
2135 2140 2145
Gly Tyr Cys Lys Ser Gln Val Ala Thr Leu Leu Pro Glu Asn Ala
2150 2155 2160
Thr Leu Gln Val Gly Thr Pro Leu Gly Thr Val Thr Pro Ser Ser
2165 2170 2175
Arg Trp Ser Ala Ser Arg Thr Phe Thr Gly Asn Asp Arg Asp Pro
2180 2185 2190
Lys Pro Trp Pro Arg
2195
<210> 119
<211> 2202
<212> PRT
<213> Streptomyces sp.
<400> 119
Met Ala Phe Gly Ile Gly Thr Ser Arg Arg Gly Ser Gly Gly Gly Arg
1 5 10 15
Gly Trp Gly Arg Arg Leu Val Thr Pro Val Ala Ala Leu Ala Leu Leu
20 25 30
Ala Pro Leu Gly Glu Ala Gln Asp Ala Val Ala Gln Asp Ala Gly Ala
35 40 45
Val Arg Ser Gly Pro Val Gln Pro Asp Val Pro Lys Pro Arg Val Ser
50 55 60
Lys Val Lys Glu Val Lys Gly Leu Gly Ala Lys Lys Ala Arg Asp Arg
65 70 75 80
Val Ala Ala Gly Lys Lys Ala Gly Ala Ala Gln Ala Ala Arg Ala Arg
85 90 95
Arg Glu Gln Thr Ala Val Trp Pro Gly Pro Asp Thr Ala Ser Ile Glu
100 105 110
Leu Ala Asp Asp Arg Arg Ala Lys Ala Glu Leu Gly Gly Ala Ser Val
115 120 125
Ser Val Val Pro Glu Asn Gly Arg Lys Thr Ala Ala Ser Gly Thr Ala
130 135 140
Gln Val Thr Ile Leu Asp Gln Lys Ala Ala Asp Lys Ala Gly Val Thr
145 150 155 160
Gly Val Leu Leu Ser Ala Thr Ala Asp Thr Ala Gly Thr Ala Glu Val
165 170 175
Ser Val Asp Tyr Ser Gly Phe Ala Ser Ala Phe Gly Gly Asp Trp Ala
180 185 190
Gln Arg Leu His Leu Val Gln Leu Pro Ala Cys Val Leu Thr Thr Pro
195 200 205
Glu Lys Ala Val Cys Arg Arg Gln Thr Pro Leu Lys Thr Asp Asn Asn
210 215 220
Ala Ser Glu Gln Ser Val Ala Ala Gln Val Ala Leu Ala Lys Ala Glu
225 230 235 240
Pro Gly Ala Pro Ser Ala Gln Ser Val Ala Ser Ala Glu Gly Pro Ser
245 250 255
Ala Thr Val Leu Ala Val Thr Ala Ala Ala Ala Gly Ser Gly Ala Ser
260 265 270
Pro Lys Gly Thr Gly Asp Tyr Ala Ala Thr Glu Leu Ser Pro Ser Ser
275 280 285
Ala Trp Glu Ala Gly Gly Ser Ser Gly Ala Phe Thr Trp Asn Tyr Gly
290 295 300
Phe Thr Val Pro Pro Ala Ala Ala Gly Pro Thr Pro Pro Leu Ala Leu
305 310 315 320
Ser Tyr Asp Ser Gly Ser Ile Asp Gly Arg Thr Ala Thr Thr Asn Asn
325 330 335
Gln Gly Ser Ala Val Gly Glu Gly Phe Ser Leu Thr Glu Ser Tyr Ile
340 345 350
Glu Arg Ser Tyr Gly Ser Cys Asp Lys Asp Gly His Ala Asp Val Trp
355 360 365
Asp His Cys Trp Lys Tyr Asp Asn Ala Ser Ile Val Leu Asn Gly Lys
370 375 380
Ser Asn Arg Leu Ile Lys Asp Asp Thr Ser Gly Lys Trp Arg Leu Glu
385 390 395 400
Asp Asp Asp Ala Ser Thr Val Thr Arg Ser Thr Gly Ala Asp Asn Gly
405 410 415
Asp Asp Asn Gly Glu Tyr Trp Thr Val Thr Thr Gly Asp Gly Thr Lys
420 425 430
Tyr Val Phe Gly Glu Asn Lys Leu Asp Gly Ala Ala Asp Gln Arg Thr
435 440 445
Asn Ser Thr Trp Thr Val Pro Val Phe Gly Asp Asp Ser Gly Glu Pro
450 455 460
Gly Tyr Asp Lys Gly Asp Thr Phe Ala Glu Arg Ala Val Thr Gln Ala
465 470 475 480
Trp Arg Trp Asn Leu Asp Tyr Val Glu Asp Thr Ser Gly Asn Ala Ser
485 490 495
Thr Tyr Trp Tyr Ala Lys Asp Ser Asn Tyr Tyr Pro Lys Asn Lys Ala
500 505 510
Thr Thr Ala Asn Ala Ser Tyr Thr Arg Gly Gly Tyr Leu Lys Glu Ile
515 520 525
Arg Tyr Gly Leu Arg Lys Asp Ala Leu Phe Thr Asp Asp Ala Asp Ala
530 535 540
Lys Val Val Phe Ala His Ala Glu Arg Cys Thr Val Gly Ser Cys Thr
545 550 555 560
Thr Leu Thr Lys Asp Thr Ala Lys Asn Trp Pro Asp Val Pro Phe Asp
565 570 575
Ala Ile Cys Ser Ser Gly Asp Ser Glu Cys Asn Ala Ala Gly Pro Ser
580 585 590
Phe Phe Ser Arg Lys Arg Leu Thr Gly Ile Ser Thr Phe Ser Trp Asn
595 600 605
Ala Ala Ser Lys Ala Phe Asp Pro Val Asp Thr Trp Glu Leu Thr Gln
610 615 620
Asp Tyr Tyr Asp Ala Gly Asp Ile Gly Asp Thr Thr Asp His Val Leu
625 630 635 640
Val Leu Glu Ser Ile Lys Arg Thr Ala Lys Ala Gly Ala Thr Ala Ile
645 650 655
Asp Val Asn Pro Val Thr Phe Thr Tyr Gln Leu Arg Pro Asn Arg Val
660 665 670
Asp Gly Thr Asp Asp Ile Leu Pro Leu Lys Arg His Arg Ile Glu Thr
675 680 685
Ile Thr Ser Glu Thr Gly Ser Ile Thr Thr Val Thr Leu Ser Gln Pro
690 695 700
Glu Cys Lys Arg Ser Thr Val Leu Asp Ala Pro Gln Asp Ser Asn Thr
705 710 715 720
Arg Pro Cys Tyr Pro Gln Phe Trp Asn Ile Asn Gly Ala Thr Lys Ala
725 730 735
Ser Val Asp Trp Phe His Lys Tyr Arg Val Leu Ala Val Ala Val Asp
740 745 750
Asp Pro Thr Gly His Asn Glu Ser Ile Glu His Ala Tyr Asp Tyr Ala
755 760 765
Gly Ala Ala Trp His Tyr Ser Asp Asp Pro Phe Thr Thr Lys Asn Glu
770 775 780
Arg Thr Trp Ser Glu Trp Arg Gly Tyr Arg Asp Val Thr Thr Tyr Thr
785 790 795 800
Gly Ala Leu Asp Thr Thr Arg Ser Lys Ser Val Ser Arg Tyr Met Leu
805 810 815
Gly Met Asp Gly Asp Lys Asn Thr Asp Gly Thr Thr Lys Ser Val Ser
820 825 830
Thr Ala Pro Leu Met Asp Thr Asp Val Asp Phe Ala Ala Leu Thr Asp
835 840 845
Ser Asp Pro Tyr Ser Gly Gln Leu Leu Gln Gln Val Thr Tyr Ser Gly
850 855 860
Ser Gln Pro Ile Ser Thr Ser Tyr Thr Asn Phe Thr His Lys Asn Thr
865 870 875 880
Ala Ser Gln Thr Val Pro Asp Ala Thr Asp His Thr Ala Arg Trp Val
885 890 895
Arg Pro Asn Ser Ser Tyr Ala Ser Thr Tyr Leu Thr Ala Ser Lys Thr
900 905 910
Trp Arg Thr Gln Val Thr Thr Ser Arg Tyr Asp Asp Leu Gly Met Val
915 920 925
Thr Ser His Asp Asp Tyr Gly Gln Lys Gly Leu Ser Gly Asp Glu Ile
930 935 940
Cys Thr Arg Thr Trp Tyr Ala Arg Asn Thr Glu Ala Gly Ile Asn Ser
945 950 955 960
Leu Val Ser Arg Thr Arg Thr Val Gly Lys Glu Cys Ser Val Asp Asp
965 970 975
Thr Ala Leu Asp Leu Pro Ala Asp Asn Lys Arg Ser Gly Asp Val Leu
980 985 990
Ser Asp Thr Ala Thr Ala Tyr Asp Gly Ala Thr Trp Ser Asp Ser Met
995 1000 1005
Lys Pro Thr Lys Gly Leu Val Thr Trp Thr Gly Arg Ala Lys Gly
1010 1015 1020
Tyr Ala Ser Gly Thr Pro Ser Trp Gln Thr Leu Thr Ser Ala Ala
1025 1030 1035
Pro Ala Asp Phe Asp Val Leu Gly Arg Pro Leu Lys Val Thr Asn
1040 1045 1050
Ala Glu Gly Gln Pro Thr Thr Thr Ala Tyr Thr Pro Val Thr Ala
1055 1060 1065
Gly Pro Val Thr Lys Ile Ile Ser Gly Asn Pro Lys Gly Phe Lys
1070 1075 1080
Thr Thr Ser Phe Leu Asp Pro Arg Thr Gly Gln Glu Leu Arg Thr
1085 1090 1095
Tyr Asp Ala Asn Leu Lys Lys Thr Glu Arg Val Tyr Asp Ala Leu
1100 1105 1110
Gly Arg Leu Thr Gln Val Trp Leu Pro Asn Arg Asp Arg Gly Ser
1115 1120 1125
Glu Ser Ala Thr Phe Gly Pro Ser Val Lys Phe Glu Tyr Thr Ile
1130 1135 1140
Asp Asn Asn Asp Pro Ser Trp Val Ser Thr Ala Ala Leu Lys Lys
1145 1150 1155
Asp Gly Lys Thr Tyr Ala Thr Ser Tyr Ala Ile Tyr Asp Ala Met
1160 1165 1170
Leu Arg Pro Leu Gln Ser Gln Thr Glu Thr Ser Asn Gly Gly Arg
1175 1180 1185
Leu Leu Thr Asp Thr Arg Tyr Asp Thr Arg Gly Leu Pro Tyr Glu
1190 1195 1200
Thr Tyr Ala Asn Ile Phe Asp Thr Thr Ser Thr Pro Asn Gly Thr
1205 1210 1215
Tyr Thr Arg Ala Glu Tyr Gly Glu Ala Pro Asn Gln Asn Ala Thr
1220 1225 1230
Val Phe Asp Gly Ala Gly Arg Pro Thr Lys Ser Thr Leu Leu Val
1235 1240 1245
Phe Gly Val Glu Lys Trp Ser Thr Thr Thr Ser Tyr Thr Gly Asp
1250 1255 1260
Ser Thr Ala Thr Thr Ala Leu Asp Gly Gly Thr Ala Ser Arg Ala
1265 1270 1275
Ile Thr Asn Ile Arg Gly His Thr Val Glu Ser Arg Glu Tyr Ala
1280 1285 1290
Gly Lys Ser Pro Ala Asp Ala Gln Tyr Gly Asp Gly Leu Gly Val
1295 1300 1305
Gly Phe Ala Ser Thr Arg Thr Leu Tyr Thr Arg Gly Gly Leu Gln
1310 1315 1320
Lys Gln Ile Thr Gly Pro Asp Asp Ala Thr Trp Ser Tyr Thr Tyr
1325 1330 1335
Asp Leu Phe Gly Arg Gln Val Glu Ala Glu Asp Pro Asp Lys Gly
1340 1345 1350
Thr Ser Ser Thr Glu Tyr Asp Val Leu Asp Arg Ala Thr Lys Ser
1355 1360 1365
Thr Asp Ser Arg Ser Lys Ser Ile Leu Thr Ala Tyr Asp Glu Leu
1370 1375 1380
Gly Arg Met Val Gly Thr Trp Ala Gly Ser Lys Thr Asp Thr Asn
1385 1390 1395
Gln Arg Thr Glu Tyr Thr Tyr Asp Lys Leu Leu Lys Gly Gln Pro
1400 1405 1410
Asp Lys Ser Ile Arg Tyr Val Gly Gly Lys Ala Gly Gln Ala Tyr
1415 1420 1425
Thr Asp Thr Ile Thr Glu Tyr Asp Ser Leu Ser Arg Pro Val Ala
1430 1435 1440
Ala Ser Leu Glu Leu Pro Ala Asp Asp Pro Phe Ala Lys Val Gly
1445 1450 1455
Ala Leu Gly Ser Ala Ser Arg Thr Leu Ser Phe Arg His Ala Tyr
1460 1465 1470
Asn Leu Asp Asp Thr Val Lys Thr Ala Glu Glu Pro Ala Leu Gly
1475 1480 1485
Gly Leu Pro Ser Glu Ile Ile Asp Tyr Gly Tyr Asn Asn Val Gly
1490 1495 1500
Gln Val Thr Ser Val Gly Gly Ser Thr Gly Tyr Leu Leu Gly Ala
1505 1510 1515
Thr Tyr Ser Pro Leu Gly Gln Pro Trp Glu Gln Leu Leu Gly Thr
1520 1525 1530
Ala Asn Thr Ala Asp His Lys Lys Val Ser Ile Arg Asn Thr Phe
1535 1540 1545
Glu Asp Gly Thr Gly Arg Leu Thr Arg Ser Asn Val Lys Ala Asp
1550 1555 1560
Ser Gln Pro Tyr Met Leu Gln Asp Leu Asn Tyr Ser Phe Asp Gln
1565 1570 1575
Val Gly Asn Val Thr Ser Ile Thr Asp Pro Thr Thr Leu Gly Gly
1580 1585 1590
Thr Ser Ser Ala Glu Thr Gln Cys Phe Thr Tyr Asp Ser His Arg
1595 1600 1605
Arg Leu Thr Glu Ala Trp Thr Pro Ser Gln Gln Lys Cys Ser Asp
1610 1615 1620
Pro Arg Ser Thr Ser Ser Leu Ser Gly Pro Ala Pro Tyr Trp Thr
1625 1630 1635
Ser Tyr Thr Tyr Asn Thr Ala Gly Gln Arg Thr Thr Glu Thr Thr
1640 1645 1650
Arg Lys Ala Ala Gly Asp Thr Thr Thr Thr Tyr Cys Tyr Thr Lys
1655 1660 1665
Thr Asp Gln Pro His Phe Leu Thr Gly Thr Thr Thr Lys Gly Asp
1670 1675 1680
Cys Ala Thr Arg Glu Arg Thr Tyr Thr Pro Asp Thr Thr Gly Asn
1685 1690 1695
Thr Thr Lys Arg Pro Gly Ala Ser Thr Thr Gln Asp Leu Ala Trp
1700 1705 1710
Ser Glu Glu Gly Lys Leu Thr Lys Leu Thr Glu Asn Gly Lys Ala
1715 1720 1725
Thr Asp Tyr Leu Tyr Asp Ala Thr Gly Glu Leu Leu Ile Arg Asn
1730 1735 1740
Thr Thr Ser Gly Glu Arg Val Leu Tyr Thr Gly Thr Thr Glu Leu
1745 1750 1755
His Leu Arg Thr Asp Gly Thr Thr Trp Ala Gln Arg Tyr Tyr Ala
1760 1765 1770
Ala Gly Asp Gln Thr Val Ala Met Arg Ser Asn Glu Ser Gly Thr
1775 1780 1785
Asn Lys Leu Thr Tyr Leu Ala Gly Asp His His Gly Thr Ser Ser
1790 1795 1800
Leu Ala Ile Ser Ala Asp Ser Thr Gln Thr Val Ser Lys Arg Tyr
1805 1810 1815
Met Thr Pro Phe Gly Ala Glu Arg Gly Lys Pro Thr Gly Thr Ala
1820 1825 1830
Trp Pro Asp Asp Lys Gly Phe Leu Ser Lys Thr Thr Asp Lys Thr
1835 1840 1845
Thr Gly Leu Thr His Ile Gly Ala Arg Glu Tyr Asp Pro Ala Ile
1850 1855 1860
Gly Gln Phe Ile Ser Thr Asp Pro Ile Leu Asp Pro Ala Gln Pro
1865 1870 1875
Gln Ser Leu Asn Gly Tyr Ser Tyr Ala Asn Asn Thr Pro Val Thr
1880 1885 1890
Ala Ala Asp Pro Ser Gly Leu Trp Cys Asp Ser Cys Asn Asp Gly
1895 1900 1905
Lys Gly Trp Thr Arg Pro Asp Gly Gly Thr Arg Gly Asp Glu Asn
1910 1915 1920
Gly Gly Lys Asn Pro Asp Gly Ser Val Arg Gly Thr Pro Gly Phe
1925 1930 1935
Pro Ser Thr Arg Pro Thr Thr Val Gly Tyr Gly Asn Ser Pro Gly
1940 1945 1950
Ala Gly Lys Val Ile Thr Asp Leu Gly Ser Gly Thr Pro Ala Leu
1955 1960 1965
Pro Pro Pro Asp Val Tyr Gln Asp Tyr Gln Pro Lys Leu Pro Gly
1970 1975 1980
Val Gly Gln Met Gly Arg Asn Gly Thr Tyr Met Pro Glu Leu Ser
1985 1990 1995
Tyr Glu Leu Asn Val Glu Leu Tyr Phe Arg Glu Arg Cys Ser Phe
2000 2005 2010
Ser Trp Thr Glu Glu Cys Glu Ser Ile Arg Ala Phe Tyr Thr His
2015 2020 2025
Gly Glu Asp Ser His Gly Leu Pro Arg Tyr Trp Thr Asp Val Gln
2030 2035 2040
Asp Ile Pro Thr Val Asn Thr Cys Pro Ile Cys Glu Asn Ile Gly
2045 2050 2055
Phe Asp Ile Ile Leu Ala Thr Leu Pro Ile Gly Lys Val Gly Lys
2060 2065 2070
Leu Arg Phe Ala Pro Lys Val Glu Ser Ala Glu Ser Met Leu Arg
2075 2080 2085
Ser Leu Ser Gln Glu Gly Lys Thr Ala Gly Val Leu Asp Ile Asn
2090 2095 2100
Gly Glu Leu Ile Pro Leu Val Ser Gly Thr Ser Ser Leu Lys Asn
2105 2110 2115
Tyr Ala Ala Ser Gly His Val Glu Gly Gln Ala Ala Leu Ile Met
2120 2125 2130
Arg Glu Arg Gly Val Ala Ser Ala Arg Leu Ile Ile Asp Asn Pro
2135 2140 2145
Ser Gly Ile Cys Gly Tyr Cys Arg Ser Gln Val Pro Thr Leu Leu
2150 2155 2160
Pro Ala Gly Ala Thr Leu Glu Val Thr Thr Pro Arg Gly Thr Val
2165 2170 2175
Pro Pro Thr Ala Arg Trp Ser Asn Gly Lys Thr Phe Val Gly Asn
2180 2185 2190
Glu Asn Asp Pro Lys Pro Trp Pro Arg
2195 2200
<210> 120
<211> 1758
<212> PRT
<213> Jiangella alba
<400> 120
Met Arg Gly Trp Val Arg Ala Val Ser Ile Pro Val Ile Val Gly Val
1 5 10 15
Leu Ser Thr Ala Leu Ser Met Pro Pro Ser Phe Ala Asp Gln Glu Pro
20 25 30
Val Ala Arg Thr Glu Ala Thr Thr Asp Gly Leu Pro Thr Asn Ala Asp
35 40 45
Glu Gly Gln Arg Ala Glu Pro Pro Ala Leu Ile Pro Ser Glu Asn Arg
50 55 60
Ile Pro Gly Val Gly Leu Lys Ser Glu Ile Glu Ser Gln Pro Thr Ala
65 70 75 80
Ala Ser Val Ala Asp Gly Pro Leu Pro Ser Glu Arg Ser Asp Ser Phe
85 90 95
Phe Pro Ala Leu Ala Pro Thr Pro Pro Thr Ile Val Gly Tyr Val Pro
100 105 110
Thr Ser Leu Ala Pro Gly Cys Ala Glu Trp Gly Ala Leu Arg Trp Thr
115 120 125
His Pro Asp Ser Arg Pro Asn Gly Leu Val His Leu Tyr Thr Phe Glu
130 135 140
Leu Tyr Arg Asp Ser Asp Asp Ala Met Val Trp Asp Gln Leu Phe Asp
145 150 155 160
Tyr Thr Leu Thr Gly Ala Gly Val Val Ser Asp Val Ala Gly Asp Cys
165 170 175
Glu Ser Ile Leu Pro Asp Pro Gln Ala Thr Pro Ile Val Glu Leu Gly
180 185 190
Glu Ser Tyr Tyr Ala Lys Val Tyr Ala Trp Asp Gly Thr Gly Trp Ser
195 200 205
Ala Pro Ala Thr Ser Ser Ala Tyr Pro Ala Val Ala Leu Pro Gly Leu
210 215 220
Thr Asp Glu Ala Ala Arg Gly Val Cys Val Cys Asp Thr Ser Thr Gly
225 230 235 240
Arg Leu Tyr Pro Leu Asn Ile Leu Arg Ala Asp Pro Val Asn Thr Ala
245 250 255
Thr Gly Thr Leu Thr Glu Ser Ala Thr Asp Leu Thr Ile Pro Gly Val
260 265 270
Gly Pro Ala Ile Ser Ala Ser Arg Thr Tyr Asn Ser Thr Asp Pro Thr
275 280 285
Val Gly Pro Leu Gly Lys Gly Trp Ser Phe Pro Tyr Phe Ser Glu Leu
290 295 300
Glu Ser Ala Ala Ser Ser Val Thr Tyr Lys Ala Glu Asp Gly Gln Glu
305 310 315 320
Val Glu Tyr Ala Leu Gln Gly Gly Ala Tyr Arg Leu Pro Pro Gly Ala
325 330 335
Ser Thr Arg Leu Arg Ser Val Ser Gly Gly Tyr Gln Leu Glu Thr Lys
340 345 350
Ser His Gln Val Ile Gly Phe Asp Gln Asn Gly Arg Leu Glu Tyr Ala
355 360 365
Arg Asp Ser Ser Gly Gln Gly Val Ser Leu Ala Tyr Ala Thr Asn Gly
370 375 380
Thr Leu Asp Lys Ile Thr Asp Ala Ser Gly Arg Glu Val Asp Val Thr
385 390 395 400
Met Asp Ala Ser Gly Lys Val Thr Ala Ile Ala Leu Ser Asp Gly Arg
405 410 415
Ser Val Ser Tyr Gly Tyr Thr Gly Asp Leu Leu Thr Ser Val Thr Asp
420 425 430
Val Arg Gly Gly Val Thr Glu Tyr Glu Tyr Asp Ala Ala Gly Arg Leu
435 440 445
Ala Ala Ile Thr Asp Pro Leu Gly Asn Glu Val Met Arg Ser Thr Tyr
450 455 460
Asp Ala Gln Gly Arg Val Ile Ser Gln Val Asp Ala Gly Gly Gly Thr
465 470 475 480
Trp Gly Phe Glu Tyr Val Asp Asp Gly Ala Tyr Gln Thr Thr Arg Thr
485 490 495
Thr Asp Pro Arg Gly Gly Val Ser Arg Asp Val Tyr Tyr Asn Asn Val
500 505 510
Leu Val Glu Ser Glu Thr Ala Gly Gly Ala Ile Thr Thr Tyr Gln Tyr
515 520 525
Asp Glu Arg Leu Arg Leu Ala Ala Thr Val Asp Pro His Gly Arg Thr
530 535 540
Thr Arg His Thr Tyr Asp Ala Asn Asp Asn Leu Leu Ser Thr Thr His
545 550 555 560
Pro Asn Gly Asp Arg Glu Ala Phe Thr Tyr Ser Ser Gly Gly Asp Leu
565 570 575
Leu Thr Glu Thr Ser Pro Glu Gly Arg Lys Thr Thr Tyr Thr Tyr Asp
580 585 590
Ala Asn His Arg Val Ala Thr Thr Thr Asp Pro Asn Gly Gly Val Thr
595 600 605
Ser Tyr Thr Tyr Asn Thr Asp Gly Gln Val Leu Thr Glu Thr Ser Pro
610 615 620
Glu Gly Asn Val Thr Glu Phe Glu Tyr Asp Ala Gln Gly Asn Arg Val
625 630 635 640
Ala Thr Ile Ser Pro Glu Gly Arg Arg Thr Thr Ala Thr Phe Asp Ala
645 650 655
Tyr Gly Arg Leu Glu Ser Gln Thr Thr Ala Arg Gly His Val Ala Gly
660 665 670
Ala Asp Pro Ala Asp Phe Thr Thr Thr Phe Ala Tyr Asp Val Ala Ser
675 680 685
Asn Leu Thr Ser Ser Thr Asp Pro Leu Gly His Val Thr Glu Tyr Glu
690 695 700
Tyr Asp Leu Asn Asn Arg Arg Thr Thr Val Ile Asp Pro Leu Asp Arg
705 710 715 720
Arg Thr Glu Thr Glu Phe Asp Ala Ala Gly Arg Val Val Lys Ile Ile
725 730 735
Glu Pro Gly Gly Ala Glu Thr Val His Glu Tyr Asp Leu Ala Gly Asn
740 745 750
Gln Val Ala Thr Thr Asp Ala Glu Gly Gly Arg Thr Thr Arg Thr Phe
755 760 765
Asp Leu Asp Ala His Met Ile Thr Met Thr Ala Ala Arg Gly Asn Glu
770 775 780
Pro Gly Ala Glu Pro Ala Asp Phe Thr Trp Gly Tyr Glu Tyr Asp Gly
785 790 795 800
Leu Gly Asn Val Val Glu Glu Thr Asp Ser Ala Gly Gly Ile Val Ser
805 810 815
Tyr Gly Tyr Asp Glu Arg Tyr Arg Gln Thr Ser Val Thr Asn Gln Ala
820 825 830
Asn Glu Thr Thr Thr Thr Ala Tyr Asp Gly Asp Gly Asn Thr Val Ser
835 840 845
Val Thr Asp Pro Leu Asp Arg Thr Val Ser Thr Thr Tyr Asn Gly Leu
850 855 860
Asn Leu Pro Ala Thr Val Thr Asp Pro Ala Gly Lys Val Ser Thr Val
865 870 875 880
Ile Tyr Asp Arg Asp Gly Asn Arg Thr Ser Thr Thr Thr Pro Leu Gly
885 890 895
His Lys Ala Thr Phe Thr Tyr Asp Gly Asp Gly Met Leu Val Gln Asp
900 905 910
Gln Thr Pro Asn Gly Asn Gly Arg Ile Ser Thr Tyr Thr Tyr Asp Ala
915 920 925
Asp Gly Asn Gln Ile Arg Thr Val Asp Pro Gln Gly Arg Phe Thr Thr
930 935 940
Ala Thr Phe Asp Asn Ala Gly Arg Val Ser Ser Arg Ser Leu Trp Asn
945 950 955 960
Val Thr Thr Thr Tyr Gly Tyr Asp Asp Ala Gly Arg Leu Thr Thr Val
965 970 975
Thr Gly Gly Asp Gly Ala Val Thr Glu Tyr Gly Tyr Asn Thr Ala Gly
980 985 990
Asp Leu Val Thr Val Thr Asp Pro Asn Asp His Val Thr Thr His Thr
995 1000 1005
Tyr Asp Asp Ala His Arg Arg Thr Ala Thr Thr Asp Ala Leu Asn
1010 1015 1020
Arg Thr Arg Thr Phe Gly Tyr Asp Ala Asp Gly Asn Gln Thr Ser
1025 1030 1035
Thr Val Leu Ala Arg Gly Pro Ala Ser Gly Asp Leu Ala Arg Trp
1040 1045 1050
Thr Val Thr Gln Ser Tyr Asp Glu Leu Gly Arg Arg Thr Gly Val
1055 1060 1065
Thr Thr Gly Ser Thr Ala Ser Thr Ala Ser Tyr Ala Tyr Asp Pro
1070 1075 1080
Val Gly Arg Leu Thr Gly Val Thr Asp Ala Gly Gly Thr Thr Thr
1085 1090 1095
Thr Val Tyr Asp Asp Ala Gly Gln Ile Ala Ser Val Thr Arg Gly
1100 1105 1110
Ser Gln Ala Tyr Gly Tyr Thr Tyr Asp Pro Arg Gly Met Val Lys
1115 1120 1125
Thr Ile Thr Gln Pro Gly Gly Val Thr Val Thr Asn Thr Phe Asp
1130 1135 1140
Asp Asp Gly Arg Leu Ala Thr Thr Ala Ser Thr Asn Ala Gly Thr
1145 1150 1155
Thr Ala Phe Ser Tyr Asp Lys Asn Asn Asn Leu Thr Arg Ile Asp
1160 1165 1170
Asn Leu Ala Ala Thr Gly Leu Val Asn Arg Trp Gln Gln Arg Asn
1175 1180 1185
Tyr Asp Arg Ala Asp Ala Leu Val Ser Thr Thr Thr Gly Thr Gly
1190 1195 1200
Thr Thr Thr Asp Pro Thr Gln Thr Val Thr Tyr Ser Arg Asp Gly
1205 1210 1215
Ala Gly Arg Pro Phe Val Ile Arg Arg Gly Ala Gly Gly Thr Gln
1220 1225 1230
Ala Pro Gly Glu Ala His Phe Phe Asp Ala Ala Gly Arg Leu Ala
1235 1240 1245
Gln Val Cys Tyr Asp Ala Ser Ser Met Phe Gly Gln Asn Cys Ala
1250 1255 1260
Thr Ala Asp Glu Thr Leu Ala Tyr Thr Tyr Asp Gly Ala Gly Asn
1265 1270 1275
Arg Leu Thr Glu Thr Arg Thr Gly Gly Thr Thr Pro Gly Thr Thr
1280 1285 1290
Thr Tyr Thr Tyr Asp Ala Ala Asn Gln Leu Thr Gln Arg Gly Asn
1295 1300 1305
Thr Thr Tyr Ser Tyr Asp Ala Asp Gly Asn Gln Ile Ser Asp Gly
1310 1315 1320
Ala Thr Ser Trp Thr Tyr Asp Glu Leu Asn Arg Leu Val Gly Ile
1325 1330 1335
Asp Thr Pro Thr Ala Asp Ser Gln Leu Thr Tyr Asp Gly Leu Gly
1340 1345 1350
Asn Arg Thr Ser Val Thr Thr Gly Ala Thr Thr Arg Thr Phe Ser
1355 1360 1365
Trp Asp Ile Asn Asn Pro Leu Pro Leu Leu Thr Ser Val Thr Gln
1370 1375 1380
Gly Thr Ser Thr Thr Arg Tyr Arg Tyr Gly Pro Asp Ala Ile Pro
1385 1390 1395
Val Asn Ala Asn Ile Asn Gly Thr Asn His Ala Leu Leu Thr Glu
1400 1405 1410
Asp Leu Asn Ser Leu Thr Thr Thr Tyr Asn Arg Thr Thr Gly Ala
1415 1420 1425
Lys Ser Trp Thr Thr Thr Tyr Glu Pro Phe Gly Thr Pro Arg Asn
1430 1435 1440
Thr Thr Ser Thr Gly Leu Thr Thr Ala Gln Val Gly Leu Gly Tyr
1445 1450 1455
Thr Gly Glu Tyr Leu Asp Pro Thr Thr Gly Leu Leu Asn Leu Arg
1460 1465 1470
Ala Arg Asn Tyr Asn Pro Thr Leu Gly Gln Phe Thr Ser Thr Asp
1475 1480 1485
Pro Val Glu Thr Pro Gln Gly Thr Pro Ser Ile Ser Pro Tyr Ala
1490 1495 1500
Tyr Val Asp Asn Arg Pro Thr Val Leu Thr Asp Pro Ser Gly Ala
1505 1510 1515
Cys Phe Phe Ile Asp Met Pro Trp Ile Pro Gly Cys Ser Glu Pro
1520 1525 1530
Ser Trp Ala Asp Glu Val Thr Pro Ala Thr Asn Gly Val Leu Ala
1535 1540 1545
Gly Leu Ile Ser Ala Ala Glu Asp Thr Phe Tyr Leu Thr Gly Met
1550 1555 1560
Ala Leu Gly Val Asp Trp Val Gly Tyr Asp Gly Asp Leu Ala Gln
1565 1570 1575
Gln Leu Phe Asp Glu Ala Ala Val Glu Gly Asn Tyr His Gly Glu
1580 1585 1590
Thr Tyr Gln Gln Ala Gln Leu Val Gly Gly Leu Val Ala Leu Val
1595 1600 1605
Gly Gly Ala Ala Ser Thr Ala Ala Ser Leu Ala Arg Ile Cys Thr
1610 1615 1620
Ser Leu Val Arg Lys Ile Arg Pro Pro Val Ala Ser Gly Gly Leu
1625 1630 1635
Ala Thr Glu Val Pro Ala Tyr Ala Gly Ser Arg Thr Ala Gly Thr
1640 1645 1650
Leu Val Thr Pro Asp Gly Ala Glu Phe Pro Leu Ile Ser Gly Trp
1655 1660 1665
His Pro Pro Ala Ala Ser Met Pro Gln Gly Thr Pro Gly Met Asn
1670 1675 1680
Ile Val Thr Lys Ser His Val Glu Ala His Ala Ala Ala Ile Met
1685 1690 1695
Arg Asn Gln Gly Leu Ser Glu Ala Thr Leu Trp Ile Asn Arg Ala
1700 1705 1710
Pro Cys Gly Gly Lys Pro Gly Cys Ala Ala Met Leu Pro Arg Met
1715 1720 1725
Val Pro Ser Gly Ser Thr Leu Thr Ile Asn Val Val Pro Asn Gly
1730 1735 1740
Ser Ala Gly Ser Ile Ala Asp Thr Leu Ile Ile Arg Gly Ile Gly
1745 1750 1755
<210> 121
<211> 1526
<212> PRT
<213> Burkholderia diffusa
<400> 121
Met Ser Asp Ser Glu Asn Arg Leu Thr Arg Ala Ser Asp Ser Pro Ala
1 5 10 15
Ser Gly Lys Thr Gln Ser Glu Ser Lys Val Asn Thr Ala Cys Asp Ser
20 25 30
Leu Leu Asp Thr Ala Gly Ser Thr Tyr Asp Ser Leu Lys Gln Pro Phe
35 40 45
Ser Ser Lys Gly Gly Ala Leu His His Val Ser Glu Ala Val Asn Ala
50 55 60
Leu Ala Ser Leu Gln Gly Ala Pro Ser Gln Leu Leu Asn Thr Gly Ile
65 70 75 80
Ala Gln Ile Pro Leu Leu Asp Lys Met Pro Gly Met Pro Ala Ser Val
85 90 95
Ile Ser Ala Ala His Leu Gly Thr Pro His Ala His Ser His Pro Pro
100 105 110
Ser Asp Gly Phe Pro Leu Pro Ser Met Gly Ala Thr Ile Gly Ser Gly
115 120 125
Cys Leu Ser Val Leu Ile Gly Gly Leu Pro Ala Ala Arg Val Gln Asp
130 135 140
Ile Gly Ile Ala Pro Thr Cys Gly Gly Leu Thr Pro Tyr Phe Asn Ile
145 150 155 160
Glu Thr Gly Ser Ser Asn Thr Phe Ile Gly Gly Met Arg Ala Ala Arg
165 170 175
Met Gly Ile Asp Met Thr Arg His Cys Asn Pro Met Gly His Ala Gly
180 185 190
Lys Ser Gly Glu Glu Ala Glu Gly Ala Ala Glu Lys Gly Glu Gln Ala
195 200 205
Ala Ser Glu Ala Ala Glu Val Ser Ser Arg Ala Arg Trp Met Gly Arg
210 215 220
Ala Gly Lys Ala Trp Lys Val Gly Asn Ala Ala Val Gly Pro Ala Ser
225 230 235 240
Gly Val Ala Gly Ala Ala Ser Asp Ala Lys His His Glu Ala Leu Ala
245 250 255
Ala Ala Met Met Ala Ala Gln Thr Ala Ala Asp Ala Ala Met Met Leu
260 265 270
Leu Ser Asn Leu Met Gly Lys Asp Pro Gly Ile Glu Pro Ser Met Gly
275 280 285
Met Leu Met Asp Gly Asn Pro Thr Val Leu Ile Gly Gly Phe Pro Met
290 295 300
Pro Asp Ser Gln Met Met Trp His Gly Ala Lys His Gly Leu Gly Lys
305 310 315 320
Lys Val Lys Ala Arg Arg Ala Asp Arg Gln Lys Glu Ala Ala Pro Cys
325 330 335
Arg Asp Gly His Pro Val Asp Val Val Arg Gly Thr Ala Glu Asn Glu
340 345 350
Phe Val Asp Tyr Glu Thr Arg Ile Ala Pro Gly Phe Lys Trp Glu Arg
355 360 365
Tyr Tyr Cys Ser Gly Trp Ser Glu Gln Asp Gly Glu Leu Gly Phe Gly
370 375 380
Phe Arg His Cys Phe Gln His Glu Leu Arg Leu Leu Arg Thr Arg Ala
385 390 395 400
Ile Tyr Val Asp Ala Leu Asn Arg Glu Tyr Pro Ile Leu Arg Asn Ala
405 410 415
Ala Gly Arg Tyr Glu Gly Val Phe Ala Gly Tyr Glu Leu Glu Gln Arg
420 425 430
Asp Gly Arg Arg Phe Val Leu Arg His Gly Arg Leu Gly Asp Met Thr
435 440 445
Phe Glu Arg Ala Ser Glu Ala Asp Arg Thr Ala Arg Leu Val Asn His
450 455 460
Val Arg Asp Gly Val Glu Ser Thr Leu Glu Tyr Ala Arg Asn Gly Ala
465 470 475 480
Leu Met Arg Ile Asp Gln Glu Lys Gly Pro Gly Arg Arg Arg Gln Leu
485 490 495
Ile Asp Phe Arg Tyr Asp Asp Cys Gly His Ile Val Glu Leu Tyr Leu
500 505 510
Thr Asp Pro Gln Gly Glu Thr Lys Arg Ile Val His Tyr Arg Tyr Asp
515 520 525
Thr Ala Gly Cys Leu Ala Ala Ser Thr Asn Pro Leu Gly Ala Val Met
530 535 540
Ser His Gly Tyr Asp Gly Arg Arg Arg Met Val Arg Glu Thr Asp Ala
545 550 555 560
Asn Gly Tyr Ser Phe Ser Tyr Arg Tyr Asp Ser Gln Asp Arg Cys Ile
565 570 575
Glu Ser Met Gly Gln Asp Gly Leu Trp His Val Ser Leu Asp Tyr Gln
580 585 590
Pro Gly Arg Thr Val Val Thr Arg Ala Asp Gly Gly Lys Trp Thr Phe
595 600 605
Leu Tyr Asp Glu Ala Arg Thr Val Thr Arg Ile Val Asp Pro Tyr Gly
610 615 620
Gly Thr Thr Glu Arg Val Ser Gly Asp Asn Gly Arg Ile Leu Arg Glu
625 630 635 640
Ile Asp Ser Gly Gly Arg Val Met Arg Trp Leu Tyr Asp Glu Arg Gly
645 650 655
Gly Asn Thr Gly Arg Met Asp Arg Trp Gly Asn Arg Trp Pro Thr Lys
660 665 670
Asp Glu Ala Pro Val Leu Pro Asn Pro Leu Ala His Thr Val Pro Asn
675 680 685
Thr Pro Leu Ala Leu Gln Trp Gly Asp Ala Arg His Glu Asp Leu Ala
690 695 700
Asp Thr Leu Leu Leu Pro Pro Glu Ile Ala Lys Ile Ala Ala Ser Phe
705 710 715 720
Phe Pro Pro Gln Pro Phe Ser Ala Ser Thr Glu Gln Cys Asp Glu Thr
725 730 735
Gly Arg Val Ile Ala Arg Thr Asp Gly Tyr Gly Gln Ala Glu Arg Leu
740 745 750
Arg Leu Asp Ala Thr Gly Asn Leu Leu Gln Leu Cys Asp Arg Asp Gly
755 760 765
Arg Asp Tyr Cys Tyr Ser Ile Ala Ser Trp Asn Leu Arg Glu Ser Glu
770 775 780
Thr Asp Pro Leu Gly Asn Thr Val Arg Tyr Arg Tyr Ser Pro Lys Gln
785 790 795 800
Glu Ile Thr Ala Ile Val Asp Ala Asn Gly Asn Glu Ser Thr Tyr Thr
805 810 815
Tyr Asp Tyr Lys Ser Arg Leu Thr Ser Val Thr Arg His Gly Thr Val
820 825 830
Arg Glu Thr Tyr Ala Tyr Asp Val Gly Asp Arg Leu Ile Glu Lys Arg
835 840 845
Asp Gly Thr Gly Asn Ala Leu Leu Arg Phe Glu Val Gly Glu Asp Gly
850 855 860
Leu Gln Lys Thr Arg Ile Leu Ala Ser Gly Glu Thr His Thr Tyr Lys
865 870 875 880
Tyr Asp His Arg Gly Asn Phe Thr Arg Ala Ser Thr Asp Lys Leu Asp
885 890 895
Val Thr Leu Thr Tyr Asp Ala Tyr Gly Arg Arg Thr Gly Asp Lys Arg
900 905 910
Asp Gly Arg Gly Ile Asp His Ser Phe Val Gly Gly Arg Leu Glu Ser
915 920 925
Thr Thr Tyr Phe Gly Arg Phe Val Val Arg Tyr Glu Ala Gly Gln Ala
930 935 940
Gly Asp Val Met Ile His Thr Pro Gly Gly Gly Ile His Arg Leu Arg
945 950 955 960
Arg Ala Ala Asp Gly Thr Val Leu Leu Arg Leu Gly Asn Arg Thr Asn
965 970 975
Val Leu Tyr Gly Phe Asp Ala Asp Gly Arg Cys Thr Gly Arg Leu Ser
980 985 990
Trp Pro Glu Gly Arg Thr Ala Glu Ile His Cys Val Gln Tyr Arg Tyr
995 1000 1005
Ser Ala Val Gly Glu Leu Arg Cys Val Ile Asp Ser Thr Gly Gly
1010 1015 1020
Thr Ile Glu Tyr Gln Tyr Asp Ala Ala His Arg Leu Val Gly Glu
1025 1030 1035
Ser Arg Asp Gly Trp Ala Val Arg Arg Phe Glu Tyr Asp Gln Gly
1040 1045 1050
Gly Asn Leu Leu Ser Thr Pro Thr Cys Gln Trp Met Arg Tyr Thr
1055 1060 1065
Glu Gly Asn Arg Leu Ser Ser Ala Ser Cys Gly Ala Phe Arg Tyr
1070 1075 1080
Asn Ser Arg Asn His Leu Ala Glu Gln Ile Glu Glu Asn Asn Arg
1085 1090 1095
Arg Thr Thr Tyr His Tyr Asn Ser Met Asp Leu Leu Val Gln Val
1100 1105 1110
Lys Trp Ser Asp Arg Gln Glu Ser Trp Arg Ser Glu Tyr Asp Gly
1115 1120 1125
Leu Cys Arg Arg Ile Ala Lys Ala Met Gly Gln Ala Arg Thr Gln
1130 1135 1140
Tyr Phe Trp Asp Gly Asp Arg Leu Ala Ala Glu Ala Ala Pro Asp
1145 1150 1155
Gly Arg Leu Arg Ile Tyr Val Tyr Val Asn Glu Ala Ser Tyr Leu
1160 1165 1170
Pro Phe Met Phe Ile Asp Tyr Pro Ser Cys Asp Ala Glu Pro Glu
1175 1180 1185
Ser Gly Ser Ala Tyr Tyr Val Phe Cys Asn Gln Val Gly Leu Pro
1190 1195 1200
Glu Arg Ile Glu Ser Ala Met Gly Leu Asp Ala Trp Arg Ala Glu
1205 1210 1215
Glu Ile Glu Pro Tyr Gly Ser Ile Arg Val Ala Thr Gly Asn Ala
1220 1225 1230
Ile Asp Tyr Asp Leu Arg Trp Pro Gly His Trp Phe Asp Val Glu
1235 1240 1245
Thr Gly Leu His Tyr Asn Arg Phe Arg Tyr Phe Gln Pro Thr Leu
1250 1255 1260
Gly Arg Tyr Leu Gln Ser Asp Pro Ala Gly Gln Ser Gly Gly Val
1265 1270 1275
Asn Leu Tyr Ala Tyr Ser Ala Asn Pro Leu Val Phe Val Asp Val
1280 1285 1290
Leu Gly Leu Glu Cys Pro His Asn Asp Lys Ser Thr Thr Glu Cys
1295 1300 1305
Ala Arg Cys Glu Ala Lys Glu Glu Val Asp Gln Arg Glu Lys Arg
1310 1315 1320
Asp Lys Glu Leu Ala Arg Glu Ile Tyr His Ile Glu Asp Lys Tyr
1325 1330 1335
Ser Asp Ser His Ala Gly Ile Gly Leu Asp Pro Asp Glu Lys Lys
1340 1345 1350
Arg Ala Leu Glu Asp Lys Ile Asp Tyr Asp Asp Leu Val Arg Lys
1355 1360 1365
Arg Glu Lys Ala Arg Glu Asp Leu Leu Glu Ala Glu Lys Arg Leu
1370 1375 1380
Arg Glu Glu Glu Ile Arg Ala Lys Tyr Pro Thr Pro Glu Glu Ala
1385 1390 1395
Gln Leu Pro Pro Tyr Asp Gly Asp Thr Thr Tyr Ala Leu Met Tyr
1400 1405 1410
Tyr Thr Asp Glu His Gly Lys Ser His Val Val Glu Leu Ser Ser
1415 1420 1425
Gly Gly Ala Asp Asp Glu His Ser Asn Tyr Ala Ala Ala Gly His
1430 1435 1440
Thr Glu Gly Gln Ala Ala Val Ile Met Arg Gln Arg Lys Ile Thr
1445 1450 1455
Ser Ala Val Val Val His Asn Asn Thr Asp Gly Thr Cys Pro Phe
1460 1465 1470
Cys Val Ala His Leu Pro Thr Leu Leu Pro Ser Gly Ala Glu Leu
1475 1480 1485
Arg Val Val Pro Pro Arg Ser Ala Lys Ala Lys Lys Pro Gly Trp
1490 1495 1500
Ile Asp Val Ser Lys Thr Phe Glu Gly Asn Ala Arg Lys Pro Leu
1505 1510 1515
Asp Asn Lys Asn Lys Lys Ser Thr
1520 1525
<210> 122
<211> 1513
<212> PRT
<213> Burkholderia ubonensis
<400> 122
Met Ser Glu Pro Ala Asn Arg Leu Thr Arg Ala Ser Glu Pro Ser Glu
1 5 10 15
Arg His Ala Ala Gln Ser Glu Ser Lys Ala Asp Thr Ala Cys Glu Ser
20 25 30
Leu Leu Gly Thr Val Lys Ser Thr Phe Asp Pro Phe Lys Gln Thr Phe
35 40 45
Ser Ser Asp Gly Ser Ala Leu His His Val Ser Glu Ala Val Asn Ala
50 55 60
Leu Ala Ser Leu Gln Ser Ala Pro Ser Gln Leu Leu Asn Thr Gly Ile
65 70 75 80
Ala Gln Ile Pro Leu Leu Asp Lys Met Pro Gly Met Pro Ala Ala Thr
85 90 95
Ile Gly Val Pro His Leu Gly Thr Pro His Ala His Ser His Pro Pro
100 105 110
Ser Ser Gly Phe Pro Leu Pro Ser Ile Gly Ala Thr Ile Gly Ser Gly
115 120 125
Cys Leu Ser Val Leu Ile Gly Gly Ile Pro Ala Ala Arg Val Leu Asp
130 135 140
Ile Gly Ile Ala Pro Thr Cys Gly Gly Leu Thr Pro Tyr Phe Asp Ile
145 150 155 160
Gln Thr Gly Ser Ser Asn Thr Phe Phe Gly Gly Met Arg Ala Ala Arg
165 170 175
Met Gly Ile Asp Met Thr Arg His Cys Asn Pro Met Gly His Val Gly
180 185 190
Lys Ser Gly Gly Lys Ala Ala Gly Ala Ala Glu Lys Thr Glu Glu Ala
195 200 205
Ala Ser Glu Ala Ala Gln Val Thr Ser Arg Ala Lys Trp Met Gly Arg
210 215 220
Ala Gly Lys Ala Trp Lys Val Gly Asn Ala Ala Val Gly Pro Ala Ser
225 230 235 240
Gly Ala Ala Gly Ala Ala Ala Asp Ala Ala His Gly Glu Glu Leu Ala
245 250 255
Ala Ala Met Met Ala Ala Gln Thr Ala Ala Asp Ala Ala Met Met Leu
260 265 270
Leu Gly Asn Leu Met Gly Lys Asp Pro Gly Ile Glu Pro Ser Met Gly
275 280 285
Thr Leu Leu Ala Gly Asn Pro Thr Val Leu Val Gly Gly Phe Pro Leu
290 295 300
Pro Asp Ser Gln Met Met Trp His Gly Val Lys His Gly Ile Gly Lys
305 310 315 320
Lys Val Arg Ala Arg Ile Ala Asn Arg Arg Lys Glu Val Ser Pro Cys
325 330 335
Thr Asp Gly His Pro Val Asp Val Val Arg Gly Thr Ala Glu Asn Glu
340 345 350
Phe Val Asp Tyr Glu Thr Lys Ile Ala Pro Ala Phe Lys Trp Glu Arg
355 360 365
Tyr Tyr Cys Ser Gly Trp Ser Glu Gln Asp Gly Ala Leu Gly Phe Gly
370 375 380
Phe Arg His Cys Phe Gln His Glu Leu Arg Leu Leu Arg Thr Arg Ala
385 390 395 400
Ile Tyr Val Asp Ala Leu Asn Arg Glu Tyr Pro Ile Leu Arg Asn Ala
405 410 415
Ala Gly Arg Tyr Glu Gly Val Phe Ala Gly Tyr Glu Leu Glu Gln Arg
420 425 430
Asp Gly Arg Arg Phe Leu Leu Arg His Gly Arg His Gly Asp Met Thr
435 440 445
Phe Glu Arg Glu Asn Glu Ala Asp Arg Thr Ala Arg Phe Val Ser His
450 455 460
Val Arg Asp Asp Val Glu Cys Thr Leu Glu Tyr Ala Arg Asn Gly Ala
465 470 475 480
Leu Ala Arg Ile Ala Gln Glu Asp Ala Arg Gly Leu Arg Arg Gln Leu
485 490 495
Ile Asp Phe Arg Tyr Asp Asp Arg Gly His Ile Val Glu Leu Cys Leu
500 505 510
Thr Asp Pro Arg Gly Gln Thr Arg Arg Leu Ala His Tyr Arg Tyr Asp
515 520 525
Ala Ala Gly Cys Leu Thr Val Val Thr Asp Pro Leu Gly Ala Val Thr
530 535 540
Ser His Gly Tyr Asp Asp Arg Arg Arg Met Val Arg Glu Thr Asp Ala
545 550 555 560
Asn Gly Tyr Ser Phe Ser Tyr Arg Tyr Asp Ser Gln Gly Arg Cys Ile
565 570 575
Glu Thr Val Gly Gln Asp Gly Leu Leu His Val Val Leu Asp Tyr Gln
580 585 590
Pro Gly Arg Thr Val Val Thr Arg Ala Asp Gly Gly Lys Trp Thr Phe
595 600 605
Leu Tyr Asp Asn Ala Arg Thr Val Thr Arg Ile Val Asp Pro Tyr Gly
610 615 620
Gly Met Thr Glu Arg Val Ile Gly Gly Asp Gly Arg Ile Leu Arg Glu
625 630 635 640
Ile Asp Ser Gly Gly Arg Val Met Arg Trp Leu Tyr Asp Glu Arg Gly
645 650 655
Arg Asn Thr Gly Arg Met Asp Arg Trp Gly Asn Cys Trp Pro Thr Arg
660 665 670
Asp Glu Ala Pro Val Leu Pro Asn Pro Leu Ala His Thr Val Pro Val
675 680 685
Thr Pro Leu Asp Leu Gln Trp Gly Glu Val Ser Pro Ala Glu Leu Thr
690 695 700
Asp Ser Val Leu Leu Ser Pro Glu Ile Gln Lys Val Ala Glu Ser Leu
705 710 715 720
Phe Gln Gln Pro Ala Phe Ser Pro Ser Glu Gln His Asp Ala Arg Gly
725 730 735
Gln Val Val Ala Arg Thr Asp Glu His Gly Gly Val Glu Arg Phe Arg
740 745 750
Arg Asp Ala Ala Gly Asn Ile Ile Gln Val Cys Asp Lys Asp Gly Arg
755 760 765
Ala His His Tyr Gly Ile Ala Ser Trp Ser Leu Arg Glu Ser Glu Thr
770 775 780
Asp Ser Leu Gly Asn Thr Val Arg Tyr Arg Tyr Ser Asn Lys Gln Glu
785 790 795 800
Ile Thr Ser Ile Val Asp Ala Asn Gly Asn Glu Ser Ala Tyr Thr Tyr
805 810 815
Asp Tyr Lys Gly Arg Ile Thr Ser Val Met Arg His Gly Val Val Arg
820 825 830
Glu Thr Tyr Thr Tyr Asp Ala Gly Asp Arg Leu Ile Glu Lys Arg Asp
835 840 845
Gly Ala Gly Asn Leu Leu Leu Arg Phe Glu Val Gly Glu Asn Gly Leu
850 855 860
His Ser Lys Arg Ile Leu Ala Ser Gly Glu Thr His Thr Tyr Glu Tyr
865 870 875 880
Asp Arg Arg Gly Asn Phe Thr Lys Ala Ser Thr Asp Lys Phe Asp Val
885 890 895
Thr Arg Thr Tyr Asp Ala His Gly Arg Arg Thr Gly Asp Lys Arg Asp
900 905 910
Gly Arg Gly Ile Glu His Val Tyr Gly Asp Gly Arg Leu Cys Ser Thr
915 920 925
Thr Tyr Phe Glu Arg Phe Thr Val Arg Tyr Glu Ala Glu Ala Asp Gly
930 935 940
Glu Val Leu Ile His Ala Pro Val Gly Gly Thr His Arg Leu Gln Arg
945 950 955 960
Ser Ser Asp Gly Gln Ile Leu Leu Arg Leu Gly Asn Gly Ala Asn Val
965 970 975
Leu Cys Arg Phe Asp Ala His Gly Arg Cys Val Gly Arg Leu Val Trp
980 985 990
Pro Glu Gly Arg Pro Lys Glu Cys His Arg Val Ala Tyr Gln Tyr Ser
995 1000 1005
Ala Met Gly Glu Leu Arg Arg Val Ile Ala Asn Thr Thr Gly Thr
1010 1015 1020
Thr Glu Tyr Leu Tyr Asp Asp Ala His Arg Leu Ile Gly Glu Ser
1025 1030 1035
His Asp Gly Trp Pro Val Arg Arg Phe Glu Tyr Asp Cys Gly Gly
1040 1045 1050
Asn Leu Leu Ser Ala Pro Thr Cys Gln Trp Met Arg Tyr Thr Glu
1055 1060 1065
Gly Asn Arg Leu Ala Thr Ala Ser Arg Gly Ala Phe Tyr Tyr Asn
1070 1075 1080
Asp Arg Asn His Leu Ala Glu Gln Ile Gly Glu Asn Asn His Arg
1085 1090 1095
Thr Ser Tyr His Tyr Asn Ser Met Asp Leu Leu Val Lys Val Thr
1100 1105 1110
Trp Ser Asp Trp Pro Glu Val Trp Thr Ala Glu Tyr Asp Gly Leu
1115 1120 1125
Cys Arg Arg Ile Ala Lys Ala Met Gly Pro Ala Arg Thr Glu Tyr
1130 1135 1140
Tyr Trp Asp Gly Asp Arg Leu Ala Ala Glu Ile Ala Pro Asn Gly
1145 1150 1155
Gln Leu Arg Ile Tyr Val Tyr Val Asn Glu Thr Ser Tyr Leu Pro
1160 1165 1170
Phe Met Phe Ile Asp Tyr Asp Gly Cys Asp Ala Ala Pro Glu Ser
1175 1180 1185
Gly Arg Gly Tyr Tyr Val Phe Ser Asn Gln Val Gly Leu Pro Glu
1190 1195 1200
Trp Ile Glu Asp Ile Ala Gly Ala Cys Val Trp Arg Ala Met Glu
1205 1210 1215
Ile Asp Pro Tyr Gly Ala Ile Arg Val Ala Pro Gly Asn Glu Leu
1220 1225 1230
Gly Tyr Asn Leu Arg Trp Pro Gly His Trp Leu Asp Pro Glu Thr
1235 1240 1245
Gly Leu His Tyr Asn Arg Phe Arg Ser Tyr His Ser Ala Leu Gly
1250 1255 1260
Arg Tyr Leu Gln Ser Asp Pro Ala Gly Gln Ser Gly Gly Ile Asn
1265 1270 1275
Leu Tyr Ala Tyr Thr Ala Asn Pro Leu Val Phe Val Asp Val Leu
1280 1285 1290
Gly Arg Glu Cys Pro His Leu Asn Glu Ser Ser Ser Glu Cys Ser
1295 1300 1305
Gln Cys Glu Asn Arg Glu Glu Ala Glu Arg Ile Arg Lys Glu Met
1310 1315 1320
Leu Gln Ser Ile Ser Arg Arg Met Asp Ile Glu Gly Asp Val Thr
1325 1330 1335
Gly His Pro Gly Ile Leu Leu Thr Gln Ala Glu Leu Thr Gly Lys
1340 1345 1350
Tyr Ser His Tyr Ala Glu Glu Tyr Lys Gln Leu Leu Lys Asp Ile
1355 1360 1365
Asp Thr Lys Arg Glu Ala Glu Glu Ala Ala Leu Leu Arg Glu Ala
1370 1375 1380
Tyr Pro Ser Met Glu Gly Ala Thr Leu Pro Pro Phe Asp Gly Lys
1385 1390 1395
Thr Thr Ile Gly Leu Met Phe Tyr Thr Asp Ala Ser Gly Gln Tyr
1400 1405 1410
Gln Val Lys Lys Leu Phe Ser Gly Glu Lys Val Leu Ser Asn Tyr
1415 1420 1425
Asp Ala Thr Gly His Val Glu Gly Lys Ala Ala Leu Ile Met Arg
1430 1435 1440
Asn Glu Lys Ile Thr Glu Ala Val Val Met His Asn His Pro Ser
1445 1450 1455
Gly Thr Cys Asn Tyr Cys Asp Lys Gln Val Glu Thr Leu Leu Pro
1460 1465 1470
Lys Asn Ala Thr Leu Arg Val Ile Pro Pro Glu Asn Ala Lys Ala
1475 1480 1485
Pro Thr Ser Tyr Trp Asn Asp Gln Pro Thr Thr Tyr Arg Gly Asp
1490 1495 1500
Gly Lys Asp Pro Lys Ala Pro Ser Lys Lys
1505 1510
<210> 123
<211> 1500
<212> PRT
<213> Paraburkholderia guartelaensis
<400> 123
Met Ser Thr Pro Pro Gly Asn Pro Ala Ser Pro Ala Asn Glu Pro Pro
1 5 10 15
Pro Pro Pro Ala Pro Leu Ile Ser Pro Thr Gly Asn Thr Ser Val Asp
20 25 30
Ala Leu Ala Ser Ala Val Asn Ala Gly Ala Gln Pro Phe Gln Gln Leu
35 40 45
Gly Asn Pro Lys Ala Asn Thr Leu Asp Arg Val Thr Asn Val Val Ser
50 55 60
Gly Ala Val Gly Ser Leu Gly Ala Leu Asp Gln Leu Leu Asn Thr Gly
65 70 75 80
Met Ala Met Ile Pro Gly Ala Asn Leu Val Pro Gly Met Pro Ala Ala
85 90 95
Phe Ile Gly Val Pro His Leu Gly Val Pro His Ala His Ala His Pro
100 105 110
Pro Ser Asp Gly Val Pro Met Pro Ser Cys Gly Val Thr Ile Gly Ser
115 120 125
Gly Cys Leu Ser Val Leu Tyr Gly Gly Met Pro Ala Ala Arg Val Leu
130 135 140
Asp Ile Gly Leu Ala Pro Thr Cys Gly Gly Leu Ala Pro Ile Phe Glu
145 150 155 160
Ile Cys Thr Gly Ser Ser Asn Thr Phe Ile Gly Gly Ala Arg Ala Ala
165 170 175
Arg Met Ala Leu Asp Leu Thr Arg His Cys Asn Pro Leu Gly Met Ser
180 185 190
Gly Ala Gly His Ala Glu Gln Asp Ala Glu Lys Ala Ser Ala Leu Lys
195 200 205
Arg Ala Met His Ile Ala Gly Met Ala Ala Pro Val Ala Ser Gly Gly
210 215 220
Leu Thr Ala Ala Asp Gln Ala Val Asp Gly Ala Gly Ala Ala Ala Val
225 230 235 240
Glu Met Thr Ala Ala Gln Thr Ala Ala Asp Ala Ile Ala Met Ala Met
245 250 255
Ser Asn Leu Met Gly Lys Asp Pro Gly Val Glu Pro Gly Val Gly Thr
260 265 270
Leu Ile Asp Gly Asp Ala Ser Val Leu Ile Gly Gly Phe Pro Met Pro
275 280 285
Asp Ala Leu Ala Met Leu Met Leu Gly Trp Gly Leu Arg Lys Lys Ala
290 295 300
His Ala Pro Glu Gly Ala Gly Glu Pro Lys Arg Thr Glu Gln Gly Glu
305 310 315 320
Cys Lys Gly Gly His Pro Val Asp Val Val Arg Gly Thr Ala Glu Asn
325 330 335
Gln Phe Thr Asp Tyr Ala Thr Leu Asp Ala Pro Glu Phe Lys Trp Glu
340 345 350
Arg Tyr Tyr Arg Ser Asp Trp Ser Glu Arg Asp Gly Ala Leu Gly Phe
355 360 365
Gly Phe Arg His Ser Phe Gln His Glu Leu Arg Leu Leu Arg Thr Arg
370 375 380
Ala Ile Tyr Val Asp Gly His Gly Arg Ala Tyr Ala Phe Gly Arg Ser
385 390 395 400
Ala Ser Gly Arg Tyr Glu Asp Val Phe Ala Gly Tyr Glu Leu Glu Gln
405 410 415
Gln Gly Glu Asn Arg Phe Val Leu Leu Gln Ala Thr Arg Gly Glu Phe
420 425 430
Thr Phe Glu Arg Ala Ser Ala Ala Gln Ala Ser Ala Arg Leu Val Arg
435 440 445
His Val His Glu Gly Val Glu Ser Ala Leu Arg Tyr Ala Gly Asp Gly
450 455 460
Thr Leu Arg His Ile Glu Gln Thr Ala Gln Arg Glu Gln Arg His Arg
465 470 475 480
Met Ile Asp Leu Leu Tyr Asp Ala Arg Gly His Val Val Glu Met Arg
485 490 495
Val Thr Asp Pro Arg Gly Ala Val Leu Cys Ala Ala Arg Tyr Arg Tyr
500 505 510
Asp Ala Thr Gly Cys Leu Val Ala Ser Thr Asp Ala Leu Gly Ala Ser
515 520 525
Met Thr Tyr Gly Tyr Asp Ala Trp Arg Arg Met Ile Arg Glu Thr Asp
530 535 540
Ala Asn Gly Tyr Ala Phe Ser Tyr Arg Tyr Asp Ser Asp Gly Arg Cys
545 550 555 560
Val Glu Ser Ala Gly Gln Asp Gly Leu Trp Arg Val Leu Leu Asp Tyr
565 570 575
Gln Pro Gly Arg Thr Val Val Thr Gln Ala Asp Gly Gly Arg Trp Thr
580 585 590
Tyr Leu Tyr Asp Ala Ala Arg Thr Val Thr Arg Ile Val Asp Pro Tyr
595 600 605
Gly Gly Ala Thr Glu Arg Val Ile Gly Asp Asp Gly Arg Ile Val Glu
610 615 620
Glu Val Asp Ser Gly Gly Arg Val Met Arg Trp Leu Tyr Asp Glu Arg
625 630 635 640
Gly Glu Asn Thr Gly Arg Gln Asp Arg Trp Gly Asn Arg Trp Pro Thr
645 650 655
Arg Asp Glu Ala Pro Val Leu Pro Asn Pro Leu Ala His Val Val Pro
660 665 670
Ala Arg Pro Leu Glu Leu Leu Trp Gly Asp Ala Arg Pro Glu Asp Phe
675 680 685
Thr Asp Arg Leu Leu Leu Pro Pro Glu Ile Glu Ala Val Ala Ala Ala
690 695 700
Ala Phe Ala Pro Ser Ala Ala Val Pro Lys Pro Ala Glu Gln Arg Asp
705 710 715 720
Gly Ala Gly Arg Val Ile Arg Arg Thr Asp Glu Ser Gly His Ala Glu
725 730 735
Cys Leu His Arg Asp Ala Ala Gly Asn Val Val Gln Leu Arg Asp Lys
740 745 750
Asp Gly Arg Tyr Tyr Gly Tyr Ala Ile Ala Ser Trp Asn Leu Arg Glu
755 760 765
Ser Glu Thr Asp Pro Leu Gly Asn Thr Val Arg Tyr Arg Tyr Ser Ser
770 775 780
Lys Gln Asn Ile Thr Ala Val Val Asp Ala Asn Gly Asn Glu Ser Arg
785 790 795 800
Tyr Thr Tyr Asp Tyr Lys Ser Arg Leu Thr Arg Val Ala Arg His Asp
805 810 815
Thr Ile Arg Glu Ser Tyr Val Tyr Asp Thr Gly Asp Arg Leu Ile Glu
820 825 830
Lys Arg Asp Gly Ala Gly Asn Thr Leu Leu Arg Phe Glu Val Gly Glu
835 840 845
Asn Gly Leu His Ser Lys Arg Ile Leu Ala Ser Gly Glu Thr His Thr
850 855 860
Tyr Glu Tyr Asp Arg Arg Gly Asn Phe Thr Arg Ala Ser Thr Asp Lys
865 870 875 880
Phe Glu Val Thr Leu Thr Tyr Asp Ala Phe Gly Arg Arg Thr Gly Asp
885 890 895
Lys Arg Asp Gly Arg Gly Val Glu His Ser Phe Val Gly Gln Arg Leu
900 905 910
Glu Ser Thr Thr Trp Phe Gly Arg Phe Val Val Arg Tyr Glu Thr Gly
915 920 925
Pro Ser Gly Asp Val Met Ile His Thr Pro Gly Gly Asp Val His Arg
930 935 940
Leu Gln Arg Ala Ala Asp Gly Thr Val Leu Leu Arg Leu Ser Asn Ser
945 950 955 960
Thr Asn Val Leu Tyr Lys Phe Asp Glu Asn Gly Arg Cys Ala Gly Arg
965 970 975
Leu Thr Trp Pro Asp Gly His Thr Ser Ala Asn Arg Cys Val Gln Tyr
980 985 990
Arg Tyr Ser Ala Val Gly Glu Leu Arg Gln Val Ile Asp Ser Lys Gly
995 1000 1005
Gly Thr Thr Glu Tyr Gln Tyr Asp Asp Ala His Arg Leu Val Gly
1010 1015 1020
Glu Ser Arg Glu Gly Trp Ala Phe Arg Arg Phe Glu Tyr Asp Arg
1025 1030 1035
Gly Gly Asn Leu Leu Ser Thr Pro Thr Cys Gln Trp Met Arg Tyr
1040 1045 1050
Thr Glu Gly Asn Arg Leu Ser Gly Ala Ala Cys Gly Ala Phe Cys
1055 1060 1065
Tyr Asn Ser Arg Asn His Leu Ala Glu Gln Ile Gly Glu Asn Asn
1070 1075 1080
Arg Arg Thr Thr Trp His Tyr Asn Ser Met Asp Leu Leu Val Arg
1085 1090 1095
Val Gln Trp Ser Asp Arg Gln Glu Asn Trp Ser Ala Glu Tyr Asp
1100 1105 1110
Gly Leu Cys Arg Arg Ile Ala Lys Ala Met Gly Gln Ala Arg Thr
1115 1120 1125
Gln Tyr Phe Trp Asp Gly Asp Arg Leu Ala Ala Glu Val Ala Pro
1130 1135 1140
Asn Gly Gln Leu Arg Ile Tyr Ala Tyr Val Asn Glu Thr Ser Tyr
1145 1150 1155
Leu Pro Phe Met Phe Ile Asp Tyr Asp Gly Cys Asp Ala Ala Pro
1160 1165 1170
Glu Ser Gly Arg Thr Tyr Tyr Val Phe Cys Asn Gln Val Gly Leu
1175 1180 1185
Pro Glu Trp Ile Glu Asp Ile Ser Arg Gly Cys Val Trp Gly Val
1190 1195 1200
Asn Glu Ile Asp Pro Tyr Gly Ala Ile Cys Val Ala Pro Asp Asn
1205 1210 1215
Glu Leu Glu Tyr Asn Leu Arg Trp Pro Gly His Trp Phe Asp Pro
1220 1225 1230
Glu Thr Asp Leu His Tyr Asn Arg Phe Arg Ser Tyr Ser Pro Val
1235 1240 1245
Leu Gly Arg Tyr Leu Gln Ser Asp Pro Ala Gly Gln Ala Gly Gly
1250 1255 1260
Ile Asn Leu Tyr Ala His Thr Ala Asn Pro Leu Val Phe Ile Asp
1265 1270 1275
Val Leu Gly Arg Glu Cys Pro His Gly Asn Glu Ser Ser Ser Glu
1280 1285 1290
Cys Ser Gln Cys Ala Asp Arg Glu Glu Ala Glu Arg Ile Asn Ala
1295 1300 1305
Lys Ile Leu Gln Leu Ile Ser Lys Lys Met Ser Ile Glu Asp Ala
1310 1315 1320
Val Thr Gly His Pro Gly Glu Leu Ile Pro Leu Pro His Phe Glu
1325 1330 1335
Ile Asp Lys Glu Tyr Ser His Tyr Ala Lys Glu Tyr Lys Gln Leu
1340 1345 1350
Leu Ala Asp Ile Asp Ala Leu Ala Glu Ala Arg Glu Asp Ala Leu
1355 1360 1365
Leu Arg Glu Gln Phe Pro Ser Met Asp Ala Val Thr Leu Pro Pro
1370 1375 1380
Phe Asp Gly Lys Thr Thr Ile Gly Tyr Met Phe Tyr Thr Asp Ala
1385 1390 1395
Asn Gly Gln Tyr His Val Arg Lys Leu Tyr Ser Gly Gly Lys Val
1400 1405 1410
Leu Ser Asn Tyr Asp Ser Ser Gly His Val Glu Gly Met Ala Ala
1415 1420 1425
Leu Ile Met Arg Lys Gly Arg Ile Thr Glu Ala Val Val Met His
1430 1435 1440
Asn His Pro Ser Gly Thr Cys His Tyr Cys Asn Gly Gln Val Glu
1445 1450 1455
Thr Leu Leu Pro Lys Asn Ala Lys Leu Lys Val Ile Pro Pro Ala
1460 1465 1470
Asn Ala Lys Ala Pro Thr Lys Tyr Trp Tyr Asp Gln Pro Val Asp
1475 1480 1485
Tyr Leu Gly Asn Ser Asn Asp Pro Lys Pro Pro Ser
1490 1495 1500
<210> 124
<211> 137
<212> PRT
<213> Pseudoduganella violaceinigra
<400> 124
Gly Ser Ser Gly Lys Asn Val Arg Met Pro Arg Asp Tyr Ala Ser Glu
1 5 10 15
Leu Pro Glu Tyr Asp Gly Lys Thr Thr His Gly Val Leu Val Thr Asn
20 25 30
Glu Gly Lys Val Ile Gln Leu Arg Ser Gly Gly Lys Glu Glu Pro Tyr
35 40 45
Thr Gly Tyr Lys Ala Val Ser Ala Ser His Val Glu Gly Lys Ala Ala
50 55 60
Ile Trp Ile Arg Glu Asn Gly Ser Ser Gly Gly Thr Val Tyr His Asn
65 70 75 80
Asn Thr Thr Gly Thr Cys Gly Tyr Cys Asn Ser Gln Val Lys Ala Leu
85 90 95
Leu Pro Glu Gly Val Glu Leu Lys Ile Val Pro Pro Thr Asn Ala Val
100 105 110
Ala Lys Asn Ala Gln Ala Arg Ala Val Pro Thr Ile Asn Val Gly Asn
115 120 125
Gly Thr Gln Pro Gly Arg Lys Gln Lys
130 135
<210> 125
<211> 408
<212> PRT
<213> Duganella sp.
<400> 125
Met Asp Ala Glu Thr Gly Leu Val Tyr Phe Gln Ala Arg Tyr Tyr Asp
1 5 10 15
Pro Gln Leu Gly Arg Phe Ile Thr Gln Asp Pro Tyr Glu Gly Asp Trp
20 25 30
Lys Thr Pro Leu Ser Leu His His Tyr Leu Tyr Ala Tyr Ala Asn Pro
35 40 45
Thr Thr Tyr Val Asp Leu Asn Gly Tyr Tyr Ala Arg Asp Ala Asn Glu
50 55 60
Val Gln Arg Tyr Ile Ile Ala Glu Ser Asn Cys Ala Lys Thr Gly Ser
65 70 75 80
Cys Asp Ala Val Thr Ala Leu Arg Glu Pro Ser Glu Ala Arg Gln Arg
85 90 95
Ser Ala Ala Asn Cys Lys Ser Leu Asp Arg Cys Arg Glu Ile Ala Asp
100 105 110
Asp Ala Ala Arg Ser Glu Gly Asp Ile Ser Ala Arg Ile Lys Ala Leu
115 120 125
Gln Lys Asp Leu Arg Asn Gly Ile Glu Ala Asn Pro Thr Thr Gly Ile
130 135 140
Lys Thr Ile Trp Glu Leu Asp Lys Gln Leu Glu Ala Arg Asn Ile Ser
145 150 155 160
Ala Gly Ala Val Arg Glu Ala Gly Arg His Val Arg Trp Arg Ala Phe
165 170 175
Val Glu Asn Arg Glu Leu Thr Asp His Glu Lys Val Ala Pro Ala Ala
180 185 190
Glu Met Tyr Gly Val Leu Ser Gly Gly Arg Ile Val Ile Ala Arg Ala
195 200 205
Val Ala Arg Ser Ser Val Thr Arg Ala Ser Ile Thr Gln Glu Ser Lys
210 215 220
Thr Ile Gly Val Thr Ala Glu Val Ala Pro Asn Glu Ser Leu Arg Asn
225 230 235 240
Thr Ser Gly Asp Leu Arg Ala Ser Ala Asn Ser Ala Arg Asn Gln Pro
245 250 255
Tyr Gly Asn Gly Gln Ser Ala Ser Ala Ser Pro Ser Thr Asn Ser Ala
260 265 270
Gly Ser Ser Gly Lys Asn Val Arg Leu Pro Arg Asp Tyr Ala Ser Glu
275 280 285
Leu Pro Glu Tyr Asp Gly Lys Thr Thr Tyr Gly Val Leu Val Thr Asn
290 295 300
Glu Gly Lys Val Ile Gln Leu Arg Ser Gly Gly Lys Glu Val Pro Tyr
305 310 315 320
Ser Gly Tyr Lys Ala Val Ser Ala Ser His Val Glu Gly Lys Ala Ala
325 330 335
Ile Trp Ile Arg Glu Asn Ala Ser Ser Gly Gly Thr Val Tyr His Asn
340 345 350
Asn Thr Thr Gly Thr Cys Gly Tyr Cys Asn Ser Gln Val Lys Ala Leu
355 360 365
Leu Pro Glu Gly Val Glu Leu Lys Ile Val Pro Pro Ala Asn Ala Val
370 375 380
Ala Arg Asn Ser Gln Ala Lys Ala Ile Pro Thr Ile Asn Val Gly Asn
385 390 395 400
Ala Thr Gln Pro Gly Arg Lys Pro
405
<210> 126
<211> 1354
<212> PRT
<213> Chondromyces apiculatus
<400> 126
Met Leu Ala Ser Thr Trp Leu Asp Leu Val Ile Gly Val Asp Leu His
1 5 10 15
Phe Glu Leu Val Pro Pro Val Met Ala Pro Val Pro Phe Pro His Pro
20 25 30
Phe Val Gly Leu Val Phe Asp Pro Trp Gly Leu Leu Gly Gly Leu Val
35 40 45
Ile Ser Asn Val Met Ser Val Ala Thr Gly Gly Ser Leu Gln Gly Pro
50 55 60
Val Leu Ile Asn Leu Met Pro Ala Thr Thr Thr Gly Thr Asp Ala Lys
65 70 75 80
Asn Trp Met Leu Leu Pro His Phe Ile Ile Pro Pro Gly Val Met Trp
85 90 95
Ala Pro Met Val Arg Val Pro Lys Pro Ser Ile Ile Pro Gly Lys Pro
100 105 110
Ile Gly Leu Glu Leu Pro Ile Pro Pro Pro Gly Asp Ala Val Val Ile
115 120 125
Thr Gly Ser Lys Thr Val His Ala Met Gly Ala Asn Leu Cys Arg Leu
130 135 140
Gly Asp Ile Ala Leu Ser Cys Ser Asp Pro Ile Arg Leu Pro Thr Ala
145 150 155 160
Ala Ile Leu Thr Ile Pro Lys Gly Met Pro Val Leu Val Gly Gly Pro
165 170 175
Pro Ala Leu Asp Leu Met Ala Ala Ala Phe Ala Leu Ile Lys Cys Lys
180 185 190
Trp Val Ala Asn Arg Leu His Lys Leu Val Asn Arg Ile Lys Asn Ala
195 200 205
Arg Leu Arg Asn Leu Leu Asn Arg Val Val Cys Phe Phe Thr Gly His
210 215 220
Pro Val Asp Val Ala Thr Gly Arg Val Met Thr Gln Ala Thr Asp Phe
225 230 235 240
Glu Leu Pro Gly Pro Leu Pro Leu Gln Phe Glu Arg Val Tyr Ala Ser
245 250 255
Ser Trp Ala Asp Arg Ala Ser Pro Val Gly Arg Gly Trp Ser His Ser
260 265 270
Leu Asp Gln Ala Val Trp Leu Glu Pro Gly Lys Val Val Tyr Arg Ala
275 280 285
Glu Asp Gly Arg Glu Ile Glu Leu Asp Thr Phe Glu Leu Pro Gly Arg
290 295 300
Met Leu Gln Pro Gly Gln Glu Ser Phe Glu Pro Leu Asn Arg Leu Leu
305 310 315 320
Phe Arg Cys Leu Asp Gly His Arg Trp Glu Val Glu Ser Ala Glu Gly
325 330 335
Leu Val His Glu Phe Ala Pro Val Ala Gly Asp Ala Asp Pro Ala Met
340 345 350
Ala Arg Leu Thr Arg Lys Arg Ser Arg Gln Gly His Ala Ile Thr Leu
355 360 365
His Tyr Asp Gly Lys Gly Cys Leu Thr Trp Val Gln Asp Ser Gly Gly
370 375 380
Arg Ile Val Arg Phe Glu His Asp Glu Ala Gly His Leu Thr Gln Val
385 390 395 400
Ser Leu Pro His Pro Thr Gln Pro Gly Trp Leu Pro His Thr Arg Tyr
405 410 415
Ile Tyr Ser Pro Glu Gly Asp Leu Val Glu Val Val Asp Pro Leu Gly
420 425 430
His Arg Thr Arg Tyr Glu Tyr Val Gly His Leu Leu Val Arg Glu Thr
435 440 445
Asp Arg Thr Gly Leu Ser Phe Tyr Phe Gly Tyr Asp Gly Thr Gly Pro
450 455 460
Gly Ala Tyr Cys Ile Arg Thr Trp Gly Asp Gly Gly Ile Tyr Asp His
465 470 475 480
Glu Ile Asp Tyr Asp Lys Val Asn Arg Val Thr Phe Val Thr Asp Ser
485 490 495
Leu Gly Ala Thr Thr Thr Tyr Glu Met Asn Val Ala Asn Ala Val Val
500 505 510
Lys Val Ile Asp Pro Arg Gly Gly Glu Thr Arg Tyr Glu Tyr Asn Asp
515 520 525
Val Leu Trp Lys Thr Glu Glu Val Glu Pro Ala Gly Gly Ala Thr Arg
530 535 540
Tyr Glu Tyr Asp Ala Arg Gly Asn Cys Thr Lys Ser Thr Gly Pro Asp
545 550 555 560
Gly Ala Thr Val Gln Val Glu Tyr Asp Ala Arg Asn Val Pro Ile Arg
565 570 575
Ala Val Asn Pro Cys Gly Glu Glu Trp Gln Trp Val Tyr Asp Ala Gln
580 585 590
Gly Gln Leu Val Glu Arg Ile Asp Pro Leu Gly Glu Thr Thr Arg Tyr
595 600 605
Glu Tyr Asp Lys Gly Met Val Val Thr Ile Thr Glu Ala Ser Gly Val
610 615 620
Thr Thr Ala Glu Tyr Asp Asp Ser Arg Asn Leu Arg Arg Val Gln Gly
625 630 635 640
Pro Ser Glu Ala Glu Thr Ser Tyr Val Tyr Asp Ala Leu Gly Arg Met
645 650 655
Val Val Lys Arg Ser Pro Ala Arg Val Ala Glu Arg Leu His Tyr Asp
660 665 670
Ala Cys Gly Arg Leu Val Thr Val Glu Gln Pro Asp Gly Asn Val Trp
675 680 685
Arg Leu Ala Tyr Asp Gly Glu Gly Asn Leu Thr Glu Ile Gln Asp His
690 695 700
His Gln Arg Val Arg Met Arg Tyr Gly Gly Tyr His Gln Met Val Ser
705 710 715 720
Arg Gln Glu Ala Glu Asp Thr Thr Leu Phe Arg Tyr Asp Ser Glu Gly
725 730 735
Arg Leu Val Ala Ile Glu Asn Glu Ala Gly Glu Ile Tyr Gln Tyr Glu
740 745 750
Leu Asp Ser Cys Gly Arg Ala Gly Leu Glu Arg Gly Phe Asp Gly Gly
755 760 765
Cys Trp Lys Tyr Glu Arg Asp Ala Ala Gly Arg Val Ile Lys Leu Arg
770 775 780
Lys Pro Ser Gly Ala Glu Ala Arg Leu Ile Tyr Asp Ala Met Gly Arg
785 790 795 800
Leu Val Glu Val Arg Arg Ser Asp Ser Ala Val Glu Arg Phe Arg Tyr
805 810 815
Arg Lys Asp Gly Ala Leu Ile Glu Ala Glu Asn Ser Thr Ile Gln Val
820 825 830
Lys Phe Glu Arg Asp Ala Leu Gly Arg Val Val Arg Glu Met Gln Gly
835 840 845
Gly His Trp Val Glu Ser Ser Tyr Glu Arg Gly Ala Arg Thr Trp Val
850 855 860
Ala Ser Ser Leu Gly Val His Ser Ala Ile Met Arg Asp Glu Arg Arg
865 870 875 880
Ser Val Val Ala Met Thr Ala Gly Arg Gly Val Asp Glu Trp Arg Val
885 890 895
Glu Leu Ser Arg Asp Ala Phe Gly Leu Glu Thr Glu Arg Lys Leu Ser
900 905 910
Ser Gly Ile Val Ser Thr Trp Ala Arg Asp Ala Leu Gly Arg Pro Arg
915 920 925
His Arg Gly Val Ala His Ser Asn Asn Val Leu Phe Gly Val Glu Tyr
930 935 940
Gln Trp Ala Pro Gly Ser Arg Leu Val Ala Leu Ile Asp Thr Glu Arg
945 950 955 960
Gly Thr Thr Ala Phe His Phe Asp Glu Arg Ser Arg Leu Val Gly Ala
965 970 975
Lys Leu Pro Gly Gly Arg Ile Asp Arg Arg Glu Pro Asp Arg Ile Gly
980 985 990
Asn Ile Tyr Arg Ala Gln Asp Gln Arg Asp Arg Thr Tyr Ser Asp Gly
995 1000 1005
Gly Ile Leu Arg Gly Ala Gly Glu Thr Arg Tyr Thr His Asp Leu
1010 1015 1020
Asp Gly Asn Leu Thr Gln Lys Val Leu Pro Asp Gly Ala Thr Trp
1025 1030 1035
Ser Tyr Ser Tyr Asn Ala Ala Gly Cys Leu Lys Glu Val Glu Arg
1040 1045 1050
Pro Asp Gly Thr Arg Val Thr Phe Ala Tyr Asp Ala Leu Gly Arg
1055 1060 1065
Arg Val Ser Lys Arg Trp Gly Glu Asn Glu Val Trp Trp Leu Trp
1070 1075 1080
Asp Arg His Val Pro Leu His Glu Ile Ser Thr Arg Ala Glu Pro
1085 1090 1095
Ile Thr Trp Leu Phe Glu Pro Glu Ser Phe Ala Pro Ile Ala Lys
1100 1105 1110
Ile Glu Gly Asp Arg His Tyr Asp Ile Leu Cys Asp His Leu Gly
1115 1120 1125
Ala Pro Thr Val Val Leu Asp Glu Ala Gly Val Val Thr Trp Arg
1130 1135 1140
Ala Arg Leu Asp Ile His Ala Ala Val Gln Pro Glu Ile Ala Glu
1145 1150 1155
Thr Glu Cys Pro Trp Arg Trp Pro Gly Gln Tyr Glu Asp Gln Glu
1160 1165 1170
Thr Gly Leu Tyr Tyr Asn Arg Phe Arg Tyr Tyr Asp Pro Glu Ala
1175 1180 1185
Asp Arg Tyr Ile Ser Gln Asp Pro Leu Gly Pro Val Gly Gly Leu
1190 1195 1200
Asn Leu Tyr Ser Tyr Ala Ala Asp Pro Leu Thr Trp Ser Asp Pro
1205 1210 1215
Leu Gly Leu Gln Pro Asp Pro Pro Pro Pro Pro Thr Pro Met Gly
1220 1225 1230
Asn Thr Leu Pro Gly Trp Asp Gly Gly Lys Thr Gln Gly Trp Phe
1235 1240 1245
Val Tyr Pro Asp Gly Thr Glu Arg His Leu Ile Ser Gly Tyr Asp
1250 1255 1260
Gly Pro Ser Lys Phe Thr Gln Gly Ile Pro Gly Met Asn Gly Asn
1265 1270 1275
Ile Lys Ser His Val Glu Ala His Ala Ala Ala Leu Met Arg Gln
1280 1285 1290
Tyr Glu Leu Ser Lys Ala Thr Leu Tyr Ile Asn Arg Val Pro Cys
1295 1300 1305
Pro Gly Val Arg Gly Cys Asp Ala Leu Leu Ala Arg Met Leu Pro
1310 1315 1320
Glu Gly Val Gln Leu Glu Ile Ile Gly Pro Asn Gly Phe Lys Lys
1325 1330 1335
Thr Tyr Thr Gly Leu Pro Asp Pro Lys Leu Lys Pro Lys Gly Cys
1340 1345 1350
Ser
<210> 127
<211> 2169
<212> PRT
<213> Sorangium cellulosum
<400> 127
Met Thr Ala Cys Ser Asp Ser Pro Arg Leu Pro Pro Ser Leu Leu Glu
1 5 10 15
Leu Pro Asp Thr Pro Cys Pro Glu Pro Asp Glu Ala Ala Ser Pro Phe
20 25 30
Pro Ala Glu Leu Pro His Ser Ala Thr Val Glu Ala Gly Ala Ile Ala
35 40 45
Gly Ser Phe Gly Val Thr Ser Thr Gly Glu Ala Thr Tyr Thr Ile Pro
50 55 60
Leu Val Val Pro Pro Gly Arg Ala Gly Met Gln Pro Glu Leu Ala Val
65 70 75 80
Gln Tyr Asp Ser Ala Ser Gly Glu Gly Val Leu Gly Met Gly Phe Ser
85 90 95
Val Thr Gly Leu Ser Ala Val Thr Arg Cys Pro Arg Asn Leu Ala Gln
100 105 110
Asp Gly Glu Ile Arg Ala Val Arg Tyr Asp Glu Gly Asp Ala Leu Cys
115 120 125
Leu Asp Gly Lys Arg Leu Val Glu Val Gly Gly Gly Gly Glu Val Val
130 135 140
Glu Tyr Arg Thr Val Pro Asp Thr Phe Ala Arg Val Val Ala Ser Tyr
145 150 155 160
Glu Gly Gly Trp Asp Arg Ala Arg Gly Pro Lys Arg Leu Arg Val Phe
165 170 175
Thr Arg Ala Gly Arg Val Leu Glu Tyr Gly Gly Glu Pro Ser Gly Gln
180 185 190
Val Leu Ala Lys Gly Gly Val Ile Arg Ala Trp Trp Ala Thr Arg Val
195 200 205
Ser Asp Arg Ser Gly Asn Thr Ile Asp Phe His Tyr Gln Asn Glu Thr
210 215 220
Ser Ala Ser Glu Gly Tyr Thr Val Glu His Ala Pro Arg Arg Ile Glu
225 230 235 240
Tyr Thr Gly His Pro Arg Ala Ala Ala Thr Arg Ala Ile Glu Phe Val
245 250 255
Tyr Ala Pro Arg Arg Pro Gly Thr Gly Arg Val Leu Tyr Ser Arg Gly
260 265 270
Met Ala Leu Arg Ser Ser Gln Gln Leu Asp Arg Ile Arg Met Leu Gly
275 280 285
Pro Gly Gly Ala Leu Val Arg Glu Tyr Arg Phe Ser Tyr Thr Ser Gly
290 295 300
Pro Ala Thr Gly Arg Arg Leu Leu Asn Ala Val Arg Glu Cys Ala Ala
305 310 315 320
Asp Gly Arg Cys Lys Pro Ala Thr Arg Phe Arg Trp His His Gly Thr
325 330 335
Gly Pro Gly Phe Ala Glu Val Gly Thr Arg Leu Arg Val Pro Glu Ser
340 345 350
Glu Arg Gly Ser Leu Met Thr Met Asp Ala Thr Gly Asp Gly Arg Asp
355 360 365
Asp Leu Val Thr Thr Asp Leu Asp Leu Pro Val Asp Asp Asp Asn Pro
370 375 380
Ile Thr Asn Phe Phe Val Ala Pro Asn Arg Met Ala Glu Gly Gly Ser
385 390 395 400
Ser Ser Phe Gly Ala Leu Ala Leu Ala His Gln Glu Met His His Ala
405 410 415
Pro Pro Ser Pro Val Gln Pro Glu Leu Gly Thr Pro Ile Asp Tyr Asn
420 425 430
Asp Asp Gly Arg Met Asp Ile Phe Leu His Asp Val His Gly Arg Tyr
435 440 445
Pro Asp Trp His Val Leu Leu Ala Thr Pro Glu Gly Thr Phe Arg Arg
450 455 460
Lys Ser Thr Gly Ile Arg Arg Lys Phe Gly Ile Asp Ala Pro Pro Pro
465 470 475 480
Leu Asp Leu Asn Ser Arg Asn Ala Ser Ala His Leu Ala Asp Val Asp
485 490 495
Gly Asp Gly Ile Ala Asp Leu Leu Gln Cys Glu Asp Thr Gly Ser Val
500 505 510
Phe Thr Asp Trp Thr Leu His Leu Trp Arg Pro Ala Ala Ser Gly Phe
515 520 525
Glu Pro Glu Pro Ser Arg Ile Pro Ala Leu Arg Gly His Pro Cys Asn
530 535 540
Ala Glu Thr His Leu Ala Asp Val Asp Ser Asp Gly Lys Val Asp Leu
545 550 555 560
Leu Val Tyr Glu Ala Thr Ile Thr Gly Asn Gly Thr Leu Phe Gly Thr
565 570 575
Thr Phe Glu Ala Leu Ser Phe Val Arg Pro Gly Glu Trp Thr Lys Arg
580 585 590
Ala Thr Gly Leu Pro Val Leu Lys Ala Gly Ser Gly Gly Arg Val Ile
595 600 605
Val Leu Asp Val Asn Gly Asp Gly Leu Pro Asp Ala Val Glu Thr Gly
610 615 620
Phe Asp Asp Gly Gln Leu Arg Thr Phe Ile Asn Thr Gly Asp Gly Phe
625 630 635 640
Ala Ala Gly Val Ser Ser Leu Pro Ser Phe Val Phe Asp Ala Asp Ala
645 650 655
Phe Ala Lys Leu Ala Ala Pro Ile Asp His Asn Ser Asp Gly Arg Gln
660 665 670
Asp Leu Leu Met Pro Ile Arg Glu Pro Gly Gly Pro Val Leu Trp Lys
675 680 685
Ile Leu Gln Ala Thr Gly Ser Thr Gly Asp Gly Thr Phe Ala Val Ile
690 695 700
Asp Ala Arg Leu Pro Val Ser Glu Val Leu Val Asp Arg Glu Ile Thr
705 710 715 720
Leu Ala His Pro Trp Ala Pro Arg Val Thr Asp Val Asp Gly Asp Gly
725 730 735
Asn Gln Asp Val Val Leu Ala Val Gly Lys Glu Leu Arg Val Phe Arg
740 745 750
Ser Arg Leu Arg Glu Glu Asp Leu Leu Trp Thr Val Ser Asp Gly Met
755 760 765
Ser Ala Tyr Asp Pro Glu Glu Ala Gly His Val Pro Lys Val Gln Ile
770 775 780
Glu Tyr Ser His Leu Ser Ala Ala Glu Pro Gly Val Arg Gly Glu Gln
785 790 795 800
Arg Thr Tyr Leu Pro Arg Tyr Asp Thr Gly Glu Pro Gly Asp Gly Ala
805 810 815
Cys Asp Tyr Pro Val Arg Cys Ala Leu Gly Pro Arg Arg Val Val Ser
820 825 830
Arg Tyr Ala Val Asn Asn Gly Ala Asp Arg Leu Arg Thr Phe Gln Val
835 840 845
Ala Tyr Arg Asn Gly Lys Tyr His Arg Leu Gly Arg Gly Phe Leu Gly
850 855 860
Phe Gly Val Arg Ile Val Arg Asp Ala Ala Ser Gly Ala Gly Ser Ala
865 870 875 880
Glu Phe Phe Asp Asn Val Thr Phe Asp Pro Ser Asp Arg Ser Phe Pro
885 890 895
Leu Ala Gly His Val Val Arg Glu Trp Arg Trp Thr Pro Glu Pro Gln
900 905 910
Gln Lys Gly Val Ser Arg Val Glu Leu Ser Tyr Thr Glu Arg Leu Ile
915 920 925
His Ala Ile Leu Thr Asn Arg Gly Lys Ser Tyr Phe Thr Leu Pro Val
930 935 940
Tyr Gln Lys Gln Arg Arg Glu Gln Gly Glu His Arg Arg Asp Ser Gly
945 950 955 960
Lys Thr Leu Glu Glu Tyr Val Arg Asp Thr Trp Tyr Ala Pro Thr Gln
965 970 975
Val Val Ser Arg Thr Glu Arg Leu Val Ser Ala Trp Asp Ala Phe Gly
980 985 990
Asn Ile Arg Glu Glu Ser Thr Ser Thr Ala Gly Val Asp Leu Thr Leu
995 1000 1005
Lys Val Lys Arg Thr Phe Arg Asn Asp Glu Asp Ala Trp Leu Ile
1010 1015 1020
Gly Leu Leu Glu Thr Gln Gln Glu Cys Ser Arg Ala Leu Ser Ile
1025 1030 1035
Glu Gln Cys Arg Thr Ser Ser Arg Ala Tyr Asp Arg His Gly Arg
1040 1045 1050
Val Arg Thr Glu Ser Ala Gly Ser Asp Asp Asp Asp Pro Glu Thr
1055 1060 1065
Val Val Arg Val Arg Tyr Thr Arg Asp Ala Phe Gly Asn Val Ile
1070 1075 1080
His Thr Arg Ala Glu Asp Ala Phe Gly Gly Arg Arg Lys Ala Cys
1085 1090 1095
Val Ser Tyr Asp Ala Glu Gly Val Phe Pro Tyr Ala Gln Arg Asn
1100 1105 1110
Pro Glu Gly His Val Thr Tyr Thr Arg Tyr Asp Ala Gly His Gly
1115 1120 1125
Ala Leu Glu Ala Val Val Asp Pro Asn Gly Leu Ala Thr Gln Trp
1130 1135 1140
Ala His Asp Gly Leu Gly Arg Ile Thr Glu Glu Arg Arg Pro Asp
1145 1150 1155
Gly Thr Thr Thr Arg Ala Thr Leu Ser Arg Thr Arg Asp Gly Gly
1160 1165 1170
Pro Arg Gly Asp Ala Trp Arg Val Leu Arg Arg Thr Ala Thr Asp
1175 1180 1185
Gly Gly Ala Asp Glu Thr Val Glu Leu Asp Gly Phe Gly Arg Pro
1190 1195 1200
Ile Arg Gly Trp Ala Tyr Lys Ala Arg Thr Asp Asp Gly Pro Ala
1205 1210 1215
Glu Arg Val Val Gln Glu Ile Ala Phe Asp Gln Ser Gly Glu Arg
1220 1225 1230
Val Ala Arg Arg Ser Leu Pro Ala Ala Glu Gly Thr Pro Arg Glu
1235 1240 1245
Arg Met Gln Val Glu Thr Tyr Gly His Asp Ala Thr Gly Arg Ile
1250 1255 1260
Ala Trp His Arg Ala Ala Trp Gly Ala Glu Thr Arg Tyr Arg Tyr
1265 1270 1275
Leu Gly Arg Thr Val Glu Val Glu Gly Pro Gly Gly Arg Val Thr
1280 1285 1290
Thr Ile Glu Asn Asp Ala Leu Gly Arg Pro Val Arg Ile Val Asp
1295 1300 1305
Pro Glu Gly Gly Val Thr Ser Tyr Ala Tyr Gly Pro Phe Gly Gly
1310 1315 1320
Leu Trp Thr Val Thr Asp Pro Gly Asp Ala Lys Thr Thr Thr Glu
1325 1330 1335
Arg Asp Ala Tyr Gly Arg Val Arg Arg His Ile Asp Pro Asp Arg
1340 1345 1350
Gly Thr Ala Val Ala His Tyr Asp Gly Phe Gly Gln Gln Thr Ser
1355 1360 1365
Thr Val Asp Ala Leu Gly Arg Glu Val Ser Trp Lys His Asp Arg
1370 1375 1380
Leu Gly Arg Ala Val Glu Arg Ser Asp Glu Asp Gly Thr Thr Thr
1385 1390 1395
Trp Thr Trp Asp Glu Ala Glu His Gly Val Gly Lys Leu Ala Glu
1400 1405 1410
Val Ala Ser Pro Glu Gly His Arg Thr Thr Tyr Arg Tyr Asp Ala
1415 1420 1425
Leu Gly Arg Leu Arg Glu Glu Glu Leu Ala Ile Glu Gly Glu Arg
1430 1435 1440
Phe Ala Thr Thr Val Asp Tyr Asp Gly His Ser Arg Pro Phe Arg
1445 1450 1455
Leu Trp Tyr Pro Gln Ala Glu Gly Glu Arg Arg Phe Gly Val Arg
1460 1465 1470
Arg Ile Phe Asp Ala His Gly His Leu Val Gly Leu Arg Asn Glu
1475 1480 1485
Arg Ser Arg Glu Met Phe Trp Arg Leu Glu Asp Thr Asp Glu Ala
1490 1495 1500
Gly Arg Ile Arg Ile Glu Glu Phe Gly Asn Gly Val Thr Thr Glu
1505 1510 1515
Arg Ser Tyr His Glu Thr Lys Gly Arg Leu Arg Arg Val Ala Thr
1520 1525 1530
Met Lys Asp His Val Val Leu Gln Asp Leu Trp Tyr Gly Tyr Asp
1535 1540 1545
Asp Arg Leu Asn Leu Ser Ser Arg Arg Asp Asp Arg Leu Glu Arg
1550 1555 1560
Thr Glu His Phe Arg Tyr Asp Lys Leu Asp Arg Leu Thr Cys Ala
1565 1570 1575
Ala Arg His Glu Arg Phe Cys Leu Phe Glu Thr Thr Tyr Ala Pro
1580 1585 1590
Asn Gly Asn Ile Arg Glu Lys Pro Asp Val Gly Glu Tyr Thr Tyr
1595 1600 1605
Asp Pro Glu His Pro His Ala Val Arg Thr Ala Gly Ala Asp Val
1610 1615 1620
Phe Ala Tyr Asp Ala Val Gly Asn Gln Val Arg Arg Pro Gly Val
1625 1630 1635
Glu Glu Ile Arg Tyr Thr Ala Phe Asp Leu Pro Ala Ser Ile Thr
1640 1645 1650
Leu Ala Gly Gly Thr Gly Thr Val Asp Leu Asp Tyr Asp Gly Asp
1655 1660 1665
Gln Arg Arg Ile Arg Lys Thr Thr Pro Met Glu Gln Thr Val Tyr
1670 1675 1680
Ala Gly Asp Leu Tyr Glu Arg Val Thr Asp Leu Ala Thr Gly Val
1685 1690 1695
Val Glu His Arg Tyr Thr Val Arg Ser Ser Glu Arg Ala Val Ala
1700 1705 1710
Val Val Thr Lys Arg Ala Gly Gly Glu Ala Arg Thr Leu Tyr Ile
1715 1720 1725
His Val Asp His Leu Gly Ser Val Asp Leu Leu Thr Glu Gly Arg
1730 1735 1740
Gly Glu Asp Ala Gly Arg Glu Val Glu Arg Arg Ser Tyr Asp Ala
1745 1750 1755
Phe Gly Ala Arg Arg Asp Pro Val Thr Trp Arg Arg Ala Pro Lys
1760 1765 1770
Ala Glu Ala Pro Pro Ala Leu Leu Ala Arg Gly Phe Thr Gly His
1775 1780 1785
Gly Ser Asp Asp Glu Leu Gly Leu Val His Met Lys Gly Arg Leu
1790 1795 1800
Tyr Asp Pro Lys Ile Gly Arg Phe Thr Thr Pro Asp Pro Val Val
1805 1810 1815
Ser Arg Pro Leu Phe Gly Gln Ser Trp Asn Ala Tyr Ser Tyr Val
1820 1825 1830
Leu Asn Asn Pro Leu Ala Tyr Val Asp Pro Ser Gly Phe Gln Glu
1835 1840 1845
Ala Val Pro Glu Asp Arg Gly Gly Ser Ser Arg Ala Ala Gly Ala
1850 1855 1860
Glu Phe Thr Ser Asp Glu Leu Gly Leu Pro Pro Ile Glu Glu Leu
1865 1870 1875
Val Val Ala Arg Phe Pro Glu His Glu Ala Arg Ser Asp Ala Asp
1880 1885 1890
Ala Asn Ala Met Gly Ala Glu Val Gly Gly Ala Val Pro Pro Val
1895 1900 1905
Asp Val Gly Val Tyr Gly Thr Ser Ala Gly Phe Val Pro Gln Pro
1910 1915 1920
Gly Pro Ser Ser Pro Glu His Ala Ser Ala Ala Ser Val Val Gly
1925 1930 1935
Glu Gly Leu Leu Gly Ala Gly Glu Gly Thr Gly Glu Leu Ala Leu
1940 1945 1950
Arg Val Ala Arg Ser Leu Val Leu Ser Ala Leu Thr Phe Gly Gly
1955 1960 1965
Tyr Gly Thr Tyr Glu Leu Gly Arg Ala Met Trp Asp Gly Tyr Lys
1970 1975 1980
Glu Asn Gly Val Val Gly Ala Leu Asn Ala Val Asn Pro Leu Tyr
1985 1990 1995
Gln Ile Gly Arg Gly Ala Ala Asp Thr Ala Leu Ala Ile Asp Arg
2000 2005 2010
Asp Asp Tyr Arg Ala Ala Gly Ala Ala Gly Val Lys Thr Val Ile
2015 2020 2025
Ile Gly Ala Ala Thr Val Phe Gly Ala Gly Arg Gly Leu Gly Ala
2030 2035 2040
Leu Glu Glu Ala Thr Thr Ala Ala Gly Ile Ala Arg Gly Ala Pro
2045 2050 2055
Ser Leu Pro Val Tyr Thr Gly Gly Lys Thr Thr Gly Val Leu Arg
2060 2065 2070
Thr Ala Thr Gly Asp Met Pro Leu Val Ser Gly Tyr Lys Gly Pro
2075 2080 2085
Ser Ala Ser Met Pro Arg Gly Thr Pro Gly Met Asn Gly Arg Ile
2090 2095 2100
Lys Ser His Val Glu Ala His Ala Ala Ala Val Met Arg Glu Arg
2105 2110 2115
Gly Ile Lys Asp Ala Thr Leu His Ile Asn Gln Val Pro Cys Ser
2120 2125 2130
Ser Ala Thr Gly Cys Gly Ala Met Leu Pro Arg Met Leu Pro Glu
2135 2140 2145
Gly Ala Gln Leu Arg Val Leu Gly Pro Asp Gly Tyr Asp Gln Val
2150 2155 2160
Phe Ile Gly Leu Pro Asp
2165
<210> 128
<211> 273
<212> PRT
<213> Clostridium sp.
<400> 128
Met Val Ile Ile Gly Arg Ile Asp Thr Asn Glu Ser Thr Val Ser Leu
1 5 10 15
Tyr Gln Trp Ser Leu Leu Pro Ala Thr Asp Thr Asn Cys Tyr Lys Glu
20 25 30
Ile Thr Val Glu Gln Tyr Lys Asn Asn Gln Leu Val Arg Lys Val Ser
35 40 45
Phe Ser Lys Ala Phe Val Val Asn Tyr Thr Glu Ser Tyr Ser Asn His
50 55 60
Val Gly Val Gly Thr Phe Thr Leu Tyr Val Arg Gln Phe Cys Gly Lys
65 70 75 80
Asp Ile Glu Val Thr Ser Gln Glu Leu Asn Ser Val Ser Asn Leu Thr
85 90 95
Pro Asn Leu Pro Asn Ser Val Glu Lys Asp Val Glu Val Val Glu Ile
100 105 110
Ala Glu Lys Gln Ala Val Val Lys Ser Asp Thr Ser Asn Leu Lys Gln
115 120 125
Ser Asn Met Ser Ile Thr Asp Arg Leu Ala Lys Gln Lys Glu Lys Gln
130 135 140
Asp Asn Thr Asn Ile Ile Asp Asn Arg Pro Lys Leu Pro Asp Tyr Asp
145 150 155 160
Gly Lys Thr Thr His Gly Ile Leu Val Thr Pro Asn Ser Glu His Ile
165 170 175
Pro Phe Ser Ser Gly Asn Pro Asn Pro Asn Tyr Lys Asn Tyr Ile Pro
180 185 190
Ala Ser His Val Glu Gly Lys Ser Ala Ile Tyr Met Arg Glu Asn Gly
195 200 205
Ile Thr Ser Gly Thr Ile Tyr Tyr Asn Asn Thr Asp Gly Thr Cys Pro
210 215 220
Tyr Cys Asp Lys Met Leu Ser Thr Leu Leu Glu Glu Gly Ser Val Leu
225 230 235 240
Glu Val Ile Pro Pro Ile Asn Ala Lys Ala Pro Lys Pro Ser Trp Val
245 250 255
Asp Lys Pro Lys Thr Tyr Ile Gly Asn Asn Lys Val Pro Lys Pro Asn
260 265 270
Lys
<210> 129
<211> 339
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Chloroflexia bacterium sequence"
<400> 129
Met Leu Tyr Ala Tyr Gly Pro Glu Ser Val Val Ala Glu Arg Thr Ile
1 5 10 15
Val Gly Thr Thr Val Ala Asp Ala Gly Lys Ala Ala Phe Arg Val Leu
20 25 30
Asp Asp Thr Leu Ala Glu Gly Val Glu His Ser Ala Asn Lys Ala Asp
35 40 45
Glu Ala Gly Glu Leu Ile Glu Ala Val Val Glu Gln Cys Leu Arg Asn
50 55 60
Ser Phe Ser Ala Asp Thr Leu Val Thr Thr Ala Ser Gly Leu Arg Pro
65 70 75 80
Ile Ser Thr Ile Ala Val Gly Glu Leu Val Leu Ala Trp Asp Ala Thr
85 90 95
Thr Arg Ser Thr Gly Tyr Tyr Pro Val Thr Ala Val Met Leu His Thr
100 105 110
Asp Ala Ala Gln Val His Leu Ser Val Gly Gly Glu His Val Glu Thr
115 120 125
Thr Pro Glu His Pro Phe Tyr Thr Leu Glu Arg Gly Trp Val Ala Ala
130 135 140
Gly Asp Leu Trp Asp Gly Ala His Val Arg Arg Ala Asp Gly Ser Tyr
145 150 155 160
Ala Leu Thr Leu Val Leu Trp Leu Asp Ala Glu Pro Gln Val Met Tyr
165 170 175
Asn Leu Thr Val Ala Thr Ala His Thr Phe Phe Val Gly Val Glu Arg
180 185 190
Ala Leu Val His Asn Ala Gly Cys Pro Gly Asp Ala Leu Pro Pro Tyr
195 200 205
Gly Thr Lys Gly Ser Lys Thr Thr Gly Ile Leu Asp Thr Gly Asn Glu
210 215 220
Ser Ile Leu Leu Glu Ser Gly Glu Asn Gly Pro Gly Met Met Val Pro
225 230 235 240
Arg Asp Thr Pro Gly Met Ser Gly Ala Met Pro Asn Arg Ala His Val
245 250 255
Glu Gly His Thr Ala Ala Ile Met Arg Asn Glu Asn Ile Arg Leu Ala
260 265 270
Asp Leu Tyr Ile Asn Arg Met Pro Cys Ser Gly Ala Tyr Gly Cys Met
275 280 285
Val Asn Leu Pro His Met Leu Pro Glu Gly Ser Ile Leu Arg Ile His
290 295 300
Val Arg Ala Lys Leu Ser Asp Pro Trp Thr Thr Leu Pro Pro Phe Val
305 310 315 320
Gly Ile Ser Asp Thr Leu Trp Pro Pro Ser Gly Leu Asn Pro Lys Ile
325 330 335
Val Leu Pro
<210> 130
<211> 142
<212> PRT
<213> Streptomyces rubrolavendulae
<400> 130
Val Ala Gly Asn Arg Ala Phe Thr Gln Arg Ala Arg Thr Tyr Asn Leu
1 5 10 15
Thr Val Ala Asp Leu His Thr Tyr Tyr Val Leu Ala Gly Gln Thr Pro
20 25 30
Val Leu Val His Asn Ala Asn Cys Gly Pro His Leu Lys Asp Leu Gln
35 40 45
Lys Asp Tyr Pro Arg Arg Thr Val Gly Ile Leu Asp Val Gly Thr Asp
50 55 60
Gln Leu Pro Met Ile Ser Gly Pro Gly Gly Gln Ser Gly Leu Leu Lys
65 70 75 80
Asn Leu Pro Gly Arg Thr Lys Ala Asn Gly Glu His Val Glu Thr His
85 90 95
Ala Ala Ala Phe Leu Arg Met Asn Pro Gly Val Arg Lys Ala Val Leu
100 105 110
Tyr Ile Asp Tyr Pro Thr Gly Thr Cys Gly Thr Cys Arg Ser Thr Leu
115 120 125
Pro Asp Met Leu Pro Glu Gly Val Gln Leu Trp Val Ile Ser
130 135 140
<210> 131
<211> 12
<212> PRT
<213> Streptomyces rubrolavendulae
<400> 131
Pro Arg Arg Thr Glu Lys Phe Thr Gly Leu Pro Asp
1 5 10
<210> 132
<211> 123
<212> PRT
<213> Propionibacterium acidifaciens
<400> 132
Leu Ser Thr Thr Gly Lys Asn Val Leu Gly His Phe Glu Pro Thr Pro
1 5 10 15
Thr Thr Pro Gln Gly Thr Ser Ser Asp Thr Ile Ala Glu Met Leu Asn
20 25 30
Ser Ala Ser Gln Pro Gly Arg Thr Ala Gly Val Leu Asp Ile Asp Gly
35 40 45
Glu Leu Thr Pro Leu Thr Ser Gly Arg Pro Ser Leu Pro Asn Tyr Ile
50 55 60
Ala Ser Gly His Val Glu Gly Gln Ala Ala Met Ile Met Arg Gln Gln
65 70 75 80
Gln Val Gln Ser Ala Thr Val Tyr His Asp Asn Pro Asn Gly Thr Cys
85 90 95
Gly Tyr Cys Tyr Ser Gln Leu Pro Thr Leu Leu Pro Glu Gly Ala Ala
100 105 110
Leu Asp Val Val Pro Pro Ala Gly Thr Val Pro
115 120
<210> 133
<211> 24
<212> PRT
<213> Propionibacterium acidifaciens
<400> 133
Pro Ser Asn Arg Trp His Asn Gly Gly Pro Ser Phe Ile Gly Asn Ser
1 5 10 15
Ser Glu Pro Lys Pro Trp Pro Arg
20
<210> 134
<211> 134
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 134
Pro Thr Pro Thr Thr Pro Gln Gly Thr Ser Ser Asp Thr Ile Ala Glu
1 5 10 15
Met Leu Asn Ser Ala Ser Gln Pro Gly Arg Thr Ala Gly Val Leu Asp
20 25 30
Ile Asp Gly Glu Leu Thr Pro Leu Thr Ser Gly Arg Pro Ser Leu Pro
35 40 45
Asn Tyr Ile Ala Ser Gly His Val Glu Gly Gln Ala Ala Met Ile Met
50 55 60
Arg Gln Gln Gln Val Gln Ser Ala Thr Val Tyr His Asp Asn Pro Asn
65 70 75 80
Gly Thr Cys Gly Tyr Cys Tyr Ser Gln Leu Pro Thr Leu Leu Pro Glu
85 90 95
Gly Ala Ala Leu Asp Val Val Pro Pro Ala Gly Thr Val Pro Pro Ser
100 105 110
Asn Arg Trp His Asn Gly Gly Pro Ser Phe Ile Gly Asn Ser Ser Glu
115 120 125
Pro Lys Pro Trp Pro Arg
130
<210> 135
<211> 43
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 135
Pro Thr Pro Thr Thr Pro Gln Gly Thr Ser Ser Asp Thr Ile Ala Glu
1 5 10 15
Met Leu Asn Ser Ala Ser Gln Pro Gly Arg Thr Ala Gly Val Leu Asp
20 25 30
Ile Asp Gly Glu Leu Thr Pro Leu Thr Ser Gly
35 40
<210> 136
<211> 91
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 136
Arg Pro Ser Leu Pro Asn Tyr Ile Ala Ser Gly His Val Glu Gly Gln
1 5 10 15
Ala Ala Met Ile Met Arg Gln Gln Gln Val Gln Ser Ala Thr Val Tyr
20 25 30
His Asp Asn Pro Asn Gly Thr Cys Gly Tyr Cys Tyr Ser Gln Leu Pro
35 40 45
Thr Leu Leu Pro Glu Gly Ala Ala Leu Asp Val Val Pro Pro Ala Gly
50 55 60
Thr Val Pro Pro Ser Asn Arg Trp His Asn Gly Gly Pro Ser Phe Ile
65 70 75 80
Gly Asn Ser Ser Glu Pro Lys Pro Trp Pro Arg
85 90
<210> 137
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 137
Pro Thr Pro Thr Thr Pro Gln Gly Thr Ser Ser Asp Thr Ile Ala Glu
1 5 10 15
Met Leu Asn Ser Ala Ser Gln Pro Gly Arg Thr Ala Gly Val Leu Asp
20 25 30
Ile Asp Gly Glu Leu Thr Pro Leu Thr Ser Gly Arg Pro Ser Leu Pro
35 40 45
Asn Tyr Ile Ala Ser Gly His Val Glu Gly Gln Ala Ala Met Ile Met
50 55 60
Arg Gln Gln Gln Val Gln Ser Ala Thr Val Tyr His Asp Asn Pro Asn
65 70 75 80
Gly Thr Cys Gly Tyr Cys Tyr Ser Gln Leu Pro Thr Leu Leu Pro Glu
85 90 95
Gly Ala Ala Leu Asp Val Val Pro Pro Ala Gly Thr Val Pro
100 105 110
<210> 138
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 138
Pro Ser Asn Arg Trp His Asn Gly Gly Pro Ser Phe Ile Gly Asn Ser
1 5 10 15
Ser Glu Pro Lys Pro Trp Pro Arg
20
<210> 139
<211> 64
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 139
Asp Pro Arg Tyr Thr Asn Tyr Arg Asn Asn Gly His Val Glu Gln Lys
1 5 10 15
Ser Ala Leu Tyr Met Arg Glu Asn Asn Ile Ser Asn Ala Thr Val Tyr
20 25 30
His Asn Asn Thr Asn Gly Thr Cys Gly Tyr Cys Asn Thr Met Thr Ala
35 40 45
Thr Phe Leu Pro Glu Gly Ala Thr Leu Thr Val Val Pro Pro Glu Asn
50 55 60
<210> 140
<211> 31
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 140
Ala Val Ala Asn Asn Ser Arg Ala Ile Asp Tyr Val Lys Thr Tyr Thr
1 5 10 15
Gly Thr Ser Asn Asp Pro Lys Ile Ser Pro Arg Tyr Lys Gly Asn
20 25 30
<210> 141
<211> 121
<212> PRT
<213> Ruminococcus bicirculans
<400> 141
His Thr Tyr His Val Gly Lys Cys Arg Leu Leu Val His Asn Ala Asn
1 5 10 15
Cys Asn Gln Glu Lys Pro Val Leu Pro Lys Tyr Asp Gly Lys Thr Thr
20 25 30
Glu Gly Val Met Val Thr Pro Asp Gly Lys Gln Ile Ser Phe Lys Ser
35 40 45
Gly Asn Ser Ser Thr Pro Ser Tyr Pro Gln Tyr Lys Ala Gln Ser Ala
50 55 60
Ser His Val Glu Gly Lys Ala Ala Leu Tyr Met Arg Glu Asn Gly Ile
65 70 75 80
Asn Glu Ala Thr Val Phe His Asn Asn Pro Asn Gly Thr Cys Gly Phe
85 90 95
Cys Asp Arg Gln Val Pro Ala Leu Leu Pro Lys Gly Ala Lys Leu Thr
100 105 110
Val Val Pro Pro Ser Asn Ser Val Ala
115 120
<210> 142
<211> 22
<212> PRT
<213> Ruminococcus bicirculans
<400> 142
Asn Asn Val Arg Ala Ile Pro Val Pro Lys Thr Tyr Ile Gly Asn Ser
1 5 10 15
Thr Val Pro Lys Ile Lys
20
<210> 143
<211> 129
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 143
Ala Asn Cys Asn Gln Glu Lys Pro Val Leu Pro Lys Tyr Asp Gly Lys
1 5 10 15
Thr Thr Glu Gly Val Met Val Thr Pro Asp Gly Lys Gln Ile Ser Phe
20 25 30
Lys Ser Gly Asn Ser Ser Thr Pro Ser Tyr Pro Gln Tyr Lys Ala Gln
35 40 45
Ser Ala Ser His Val Glu Gly Lys Ala Ala Leu Tyr Met Arg Glu Asn
50 55 60
Gly Ile Asn Glu Ala Thr Val Phe His Asn Asn Pro Asn Gly Thr Cys
65 70 75 80
Gly Phe Cys Asp Arg Gln Val Pro Ala Leu Leu Pro Lys Gly Ala Lys
85 90 95
Leu Thr Val Val Pro Pro Ser Asn Ser Val Ala Asn Asn Val Arg Ala
100 105 110
Ile Pro Val Pro Lys Thr Tyr Ile Gly Asn Ser Thr Val Pro Lys Ile
115 120 125
Lys
<210> 144
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 144
Ala Asn Cys Asn Gln Glu Lys Pro Val Leu Pro Lys Tyr Asp Gly Lys
1 5 10 15
Thr Thr Glu Gly Val Met Val Thr Pro Asp Gly Lys Gln Ile Ser Phe
20 25 30
Lys Ser Gly Asn Ser Ser Thr
35
<210> 145
<211> 90
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 145
Pro Ser Tyr Pro Gln Tyr Lys Ala Gln Ser Ala Ser His Val Glu Gly
1 5 10 15
Lys Ala Ala Leu Tyr Met Arg Glu Asn Gly Ile Asn Glu Ala Thr Val
20 25 30
Phe His Asn Asn Pro Asn Gly Thr Cys Gly Phe Cys Asp Arg Gln Val
35 40 45
Pro Ala Leu Leu Pro Lys Gly Ala Lys Leu Thr Val Val Pro Pro Ser
50 55 60
Asn Ser Val Ala Asn Asn Val Arg Ala Ile Pro Val Pro Lys Thr Tyr
65 70 75 80
Ile Gly Asn Ser Thr Val Pro Lys Ile Lys
85 90
<210> 146
<211> 107
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 146
Ala Asn Cys Asn Gln Glu Lys Pro Val Leu Pro Lys Tyr Asp Gly Lys
1 5 10 15
Thr Thr Glu Gly Val Met Val Thr Pro Asp Gly Lys Gln Ile Ser Phe
20 25 30
Lys Ser Gly Asn Ser Ser Thr Pro Ser Tyr Pro Gln Tyr Lys Ala Gln
35 40 45
Ser Ala Ser His Val Glu Gly Lys Ala Ala Leu Tyr Met Arg Glu Asn
50 55 60
Gly Ile Asn Glu Ala Thr Val Phe His Asn Asn Pro Asn Gly Thr Cys
65 70 75 80
Gly Phe Cys Asp Arg Gln Val Pro Ala Leu Leu Pro Lys Gly Ala Lys
85 90 95
Leu Thr Val Val Pro Pro Ser Asn Ser Val Ala
100 105
<210> 147
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 147
Asn Asn Val Arg Ala Ile Pro Val Pro Lys Thr Tyr Ile Gly Asn Ser
1 5 10 15
Thr Val Pro Lys Ile Lys
20
<210> 148
<211> 144
<212> PRT
<213> Streptomyces cavourensis
<400> 148
Val Gln Ile Thr Ala Ile Lys Arg Trp Thr Glu Thr Ala Thr Val His
1 5 10 15
Asn Leu Thr Val Ala Asp Leu His Thr Tyr Tyr Val Leu Ala Gly Lys
20 25 30
Thr Pro Val Leu Val His Asn Glu Asn Cys Gly Pro Asn Leu Lys Asp
35 40 45
Leu Pro Lys Asp Tyr Asp Arg Arg Thr Val Gly Ile Leu Asp Val Gly
50 55 60
Thr Asp Gln Leu Pro Met Ile Ser Gly Pro Gly Gly Gln Ser Gly Leu
65 70 75 80
Leu Lys Asn Leu Pro Gly Arg Thr Lys Ala Asn Thr Asp His Val Glu
85 90 95
Ala His Thr Ala Ala Phe Leu Arg Met Asn Pro Gly Ile Arg Lys Ala
100 105 110
Val Leu Tyr Ile Asp Tyr Pro Thr Gly Thr Cys Gly Thr Cys Gly Ser
115 120 125
Thr Leu Pro Asp Met Leu Pro Glu Gly Val Gln Leu Trp Val Ile Ser
130 135 140
<210> 149
<211> 12
<212> PRT
<213> Streptomyces cavourensis
<400> 149
Pro Arg Lys Thr Glu Lys Phe Ala Gly Leu Pro Asp
1 5 10
<210> 150
<211> 112
<212> PRT
<213> Roseburia intestinalis
<400> 150
Ser Ala Gly Ala Gly Glu Ser Gly Arg Lys Thr Ile Ser Leu Pro Glu
1 5 10 15
Tyr Asp Gly Thr Thr Thr His Gly Val Leu Val Leu Asp Asp Gly Thr
20 25 30
Gln Ile Gly Phe Thr Ser Gly Asn Gly Asp Pro Arg Tyr Thr Asn Tyr
35 40 45
Arg Asn Asn Gly His Val Glu Gln Lys Ser Ala Leu Tyr Met Arg Glu
50 55 60
Asn Asn Ile Ser Asn Ala Thr Val Tyr His Asn Asn Thr Asn Gly Thr
65 70 75 80
Cys Gly Tyr Cys Asn Thr Met Thr Ala Thr Phe Leu Pro Glu Gly Ala
85 90 95
Thr Leu Thr Val Val Pro Pro Glu Asn Ala Val Ala Asn Asn Ser Arg
100 105 110
<210> 151
<211> 24
<212> PRT
<213> Roseburia intestinalis
<400> 151
Ala Ile Asp Tyr Val Lys Thr Tyr Thr Gly Thr Ser Asn Asp Pro Lys
1 5 10 15
Ile Ser Pro Arg Tyr Lys Gly Asn
20
<210> 152
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 152
Asp Pro Ser Gly Tyr Asp Ser Gln Tyr Pro Cys Lys Glu Glu Met Ser
1 5 10 15
Ala Gly Ala Gly Glu Ser Gly Arg Lys Thr Ile Ser Leu Pro Glu Tyr
20 25 30
Asp Gly Thr Thr Thr His Gly Val Leu Val Leu Asp Asp Gly Thr Gln
35 40 45
Ile Gly Phe Thr Ser Gly Asn Gly Asp Pro Arg Tyr Thr Asn Tyr Arg
50 55 60
Asn Asn Gly His Val Glu Gln Lys Ser Ala Leu Tyr Met Arg Glu Asn
65 70 75 80
Asn Ile Ser Asn Ala Thr Val Tyr His Asn Asn Thr Asn Gly Thr Cys
85 90 95
Gly Tyr Cys Asn Thr Met Thr Ala Thr Phe Leu Pro Glu Gly Ala Thr
100 105 110
Leu Thr Val Val Pro Pro Glu Asn Ala Val Ala Asn Asn Ser Arg Ala
115 120 125
Ile Asp Tyr Val Lys Thr Tyr Thr Gly Thr Ser Asn Asp Pro Lys Ile
130 135 140
Ser Pro Arg Tyr Lys Gly Asn
145 150
<210> 153
<211> 55
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 153
Asp Pro Ser Gly Tyr Asp Ser Gln Tyr Pro Cys Lys Glu Glu Met Ser
1 5 10 15
Ala Gly Ala Gly Glu Ser Gly Arg Lys Thr Ile Ser Leu Pro Glu Tyr
20 25 30
Asp Gly Thr Thr Thr His Gly Val Leu Val Leu Asp Asp Gly Thr Gln
35 40 45
Ile Gly Phe Thr Ser Gly Asn
50 55
<210> 154
<211> 96
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 154
Gly Asp Pro Arg Tyr Thr Asn Tyr Arg Asn Asn Gly His Val Glu Gln
1 5 10 15
Lys Ser Ala Leu Tyr Met Arg Glu Asn Asn Ile Ser Asn Ala Thr Val
20 25 30
Tyr His Asn Asn Thr Asn Gly Thr Cys Gly Tyr Cys Asn Thr Met Thr
35 40 45
Ala Thr Phe Leu Pro Glu Gly Ala Thr Leu Thr Val Val Pro Pro Glu
50 55 60
Asn Ala Val Ala Asn Asn Ser Arg Ala Ile Asp Tyr Val Lys Thr Tyr
65 70 75 80
Thr Gly Thr Ser Asn Asp Pro Lys Ile Ser Pro Arg Tyr Lys Gly Asn
85 90 95
<210> 155
<211> 127
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 155
Asp Pro Ser Gly Tyr Asp Ser Gln Tyr Pro Cys Lys Glu Glu Met Ser
1 5 10 15
Ala Gly Ala Gly Glu Ser Gly Arg Lys Thr Ile Ser Leu Pro Glu Tyr
20 25 30
Asp Gly Thr Thr Thr His Gly Val Leu Val Leu Asp Asp Gly Thr Gln
35 40 45
Ile Gly Phe Thr Ser Gly Asn Gly Asp Pro Arg Tyr Thr Asn Tyr Arg
50 55 60
Asn Asn Gly His Val Glu Gln Lys Ser Ala Leu Tyr Met Arg Glu Asn
65 70 75 80
Asn Ile Ser Asn Ala Thr Val Tyr His Asn Asn Thr Asn Gly Thr Cys
85 90 95
Gly Tyr Cys Asn Thr Met Thr Ala Thr Phe Leu Pro Glu Gly Ala Thr
100 105 110
Leu Thr Val Val Pro Pro Glu Asn Ala Val Ala Asn Asn Ser Arg
115 120 125
<210> 156
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 156
Ala Ile Asp Tyr Val Lys Thr Tyr Thr Gly Thr Ser Asn Asp Pro Lys
1 5 10 15
Ile Ser Pro Arg Tyr Lys Gly Asn
20
<210> 157
<211> 115
<212> PRT
<213> Plantactinospora sp.
<400> 157
Met Gly Asp Arg Leu Pro Ala Phe Val Asp Gly Gly Asp Thr Leu Gly
1 5 10 15
Ile Phe Ser Arg Gly Gly Ile Glu Arg Asp Leu Ala Ser Gly Val Ala
20 25 30
Gly Pro Ala Ser Ser Leu Pro Lys Gly Thr Pro Gly Phe Asn Gly Leu
35 40 45
Val Lys Ser His Val Glu Gly His Ala Ala Ala Leu Met Arg Gln Asn
50 55 60
Gly Ile Pro Asn Ala Glu Leu Tyr Ile Asn Arg Val Pro Cys Gly Ser
65 70 75 80
Gly Asn Gly Cys Ala Ala Met Leu Pro His Met Leu Pro Glu Gly Ala
85 90 95
Thr Leu Arg Val Tyr Gly Pro Asn Gly Tyr Asp Arg Thr Phe Thr Gly
100 105 110
Leu Pro Asp
115
<210> 158
<211> 33
<212> PRT
<213> Plantactinospora sp.
<400> 158
Met Gly Asp Arg Leu Pro Ala Phe Val Asp Gly Gly Asp Thr Leu Gly
1 5 10 15
Ile Phe Ser Arg Gly Gly Ile Glu Arg Asp Leu Ala Ser Gly Val Ala
20 25 30
Gly
<210> 159
<211> 82
<212> PRT
<213> Plantactinospora sp.
<400> 159
Pro Ala Ser Ser Leu Pro Lys Gly Thr Pro Gly Phe Asn Gly Leu Val
1 5 10 15
Lys Ser His Val Glu Gly His Ala Ala Ala Leu Met Arg Gln Asn Gly
20 25 30
Ile Pro Asn Ala Glu Leu Tyr Ile Asn Arg Val Pro Cys Gly Ser Gly
35 40 45
Asn Gly Cys Ala Ala Met Leu Pro His Met Leu Pro Glu Gly Ala Thr
50 55 60
Leu Arg Val Tyr Gly Pro Asn Gly Tyr Asp Arg Thr Phe Thr Gly Leu
65 70 75 80
Pro Asp
<210> 160
<211> 102
<212> PRT
<213> Plantactinospora sp.
<400> 160
Met Gly Asp Arg Leu Pro Ala Phe Val Asp Gly Gly Asp Thr Leu Gly
1 5 10 15
Ile Phe Ser Arg Gly Gly Ile Glu Arg Asp Leu Ala Ser Gly Val Ala
20 25 30
Gly Pro Ala Ser Ser Leu Pro Lys Gly Thr Pro Gly Phe Asn Gly Leu
35 40 45
Val Lys Ser His Val Glu Gly His Ala Ala Ala Leu Met Arg Gln Asn
50 55 60
Gly Ile Pro Asn Ala Glu Leu Tyr Ile Asn Arg Val Pro Cys Gly Ser
65 70 75 80
Gly Asn Gly Cys Ala Ala Met Leu Pro His Met Leu Pro Glu Gly Ala
85 90 95
Thr Leu Arg Val Tyr Gly
100
<210> 161
<211> 13
<212> PRT
<213> Plantactinospora sp.
<400> 161
Pro Asn Gly Tyr Asp Arg Thr Phe Thr Gly Leu Pro Asp
1 5 10
<210> 162
<211> 153
<212> PRT
<213> Streptomyces massasporeus
<400> 162
Gly Gly Ser Ala Val Val Gly Ala Gly Val Val Ala Thr Gly Ala Lys
1 5 10 15
Ala Val Thr Thr Gly Lys Ser Leu Ser Glu Ser Gln Ala Thr Leu Ser
20 25 30
Val Ala Gln Arg Leu Leu Ala Thr Ile Gly Glu Glu Gly Lys Thr Ala
35 40 45
Gly Val Leu Glu Leu Asp Gly Glu Leu Ile Pro Leu Val Ser Gly Lys
50 55 60
Ser Ser Leu Pro Asn Tyr Ala Ala Ser Gly His Val Glu Gly Gln Ala
65 70 75 80
Ala Leu Ile Met Arg Asp Arg Gly Ala Thr Ser Gly Arg Leu Leu Ile
85 90 95
Asp Asn Pro Ser Gly Ile Cys Gly Tyr Cys Lys Ser Gln Val Ala Thr
100 105 110
Leu Leu Pro Glu Asn Ala Thr Leu Gln Val Gly Thr Pro Leu Gly Thr
115 120 125
Val Thr Pro Ser Ser Arg Trp Ser Ala Ser Arg Thr Phe Thr Gly Asn
130 135 140
Asp Arg Asp Pro Lys Pro Trp Pro Arg
145 150
<210> 163
<211> 63
<212> PRT
<213> Streptomyces massasporeus
<400> 163
Gly Gly Ser Ala Val Val Gly Ala Gly Val Val Ala Thr Gly Ala Lys
1 5 10 15
Ala Val Thr Thr Gly Lys Ser Leu Ser Glu Ser Gln Ala Thr Leu Ser
20 25 30
Val Ala Gln Arg Leu Leu Ala Thr Ile Gly Glu Glu Gly Lys Thr Ala
35 40 45
Gly Val Leu Glu Leu Asp Gly Glu Leu Ile Pro Leu Val Ser Gly
50 55 60
<210> 164
<211> 90
<212> PRT
<213> Streptomyces massasporeus
<400> 164
Lys Ser Ser Leu Pro Asn Tyr Ala Ala Ser Gly His Val Glu Gly Gln
1 5 10 15
Ala Ala Leu Ile Met Arg Asp Arg Gly Ala Thr Ser Gly Arg Leu Leu
20 25 30
Ile Asp Asn Pro Ser Gly Ile Cys Gly Tyr Cys Lys Ser Gln Val Ala
35 40 45
Thr Leu Leu Pro Glu Asn Ala Thr Leu Gln Val Gly Thr Pro Leu Gly
50 55 60
Thr Val Thr Pro Ser Ser Arg Trp Ser Ala Ser Arg Thr Phe Thr Gly
65 70 75 80
Asn Asp Arg Asp Pro Lys Pro Trp Pro Arg
85 90
<210> 165
<211> 130
<212> PRT
<213> Streptomyces massasporeus
<400> 165
Gly Gly Ser Ala Val Val Gly Ala Gly Val Val Ala Thr Gly Ala Lys
1 5 10 15
Ala Val Thr Thr Gly Lys Ser Leu Ser Glu Ser Gln Ala Thr Leu Ser
20 25 30
Val Ala Gln Arg Leu Leu Ala Thr Ile Gly Glu Glu Gly Lys Thr Ala
35 40 45
Gly Val Leu Glu Leu Asp Gly Glu Leu Ile Pro Leu Val Ser Gly Lys
50 55 60
Ser Ser Leu Pro Asn Tyr Ala Ala Ser Gly His Val Glu Gly Gln Ala
65 70 75 80
Ala Leu Ile Met Arg Asp Arg Gly Ala Thr Ser Gly Arg Leu Leu Ile
85 90 95
Asp Asn Pro Ser Gly Ile Cys Gly Tyr Cys Lys Ser Gln Val Ala Thr
100 105 110
Leu Leu Pro Glu Asn Ala Thr Leu Gln Val Gly Thr Pro Leu Gly Thr
115 120 125
Val Thr
130
<210> 166
<211> 23
<212> PRT
<213> Streptomyces massasporeus
<400> 166
Pro Ser Ser Arg Trp Ser Ala Ser Arg Thr Phe Thr Gly Asn Asp Arg
1 5 10 15
Asp Pro Lys Pro Trp Pro Arg
20
<210> 167
<211> 143
<212> PRT
<213> Streptomyces sp.
<400> 167
Asp Ile Ile Leu Ala Thr Leu Pro Ile Gly Lys Val Gly Lys Leu Arg
1 5 10 15
Phe Ala Pro Lys Val Glu Ser Ala Glu Ser Met Leu Arg Ser Leu Ser
20 25 30
Gln Glu Gly Lys Thr Ala Gly Val Leu Asp Ile Asn Gly Glu Leu Ile
35 40 45
Pro Leu Val Ser Gly Thr Ser Ser Leu Lys Asn Tyr Ala Ala Ser Gly
50 55 60
His Val Glu Gly Gln Ala Ala Leu Ile Met Arg Glu Arg Gly Val Ala
65 70 75 80
Ser Ala Arg Leu Ile Ile Asp Asn Pro Ser Gly Ile Cys Gly Tyr Cys
85 90 95
Arg Ser Gln Val Pro Thr Leu Leu Pro Ala Gly Ala Thr Leu Glu Val
100 105 110
Thr Thr Pro Arg Gly Thr Val Pro Pro Thr Ala Arg Trp Ser Asn Gly
115 120 125
Lys Thr Phe Val Gly Asn Glu Asn Asp Pro Lys Pro Trp Pro Arg
130 135 140
<210> 168
<211> 53
<212> PRT
<213> Streptomyces sp.
<400> 168
Asp Ile Ile Leu Ala Thr Leu Pro Ile Gly Lys Val Gly Lys Leu Arg
1 5 10 15
Phe Ala Pro Lys Val Glu Ser Ala Glu Ser Met Leu Arg Ser Leu Ser
20 25 30
Gln Glu Gly Lys Thr Ala Gly Val Leu Asp Ile Asn Gly Glu Leu Ile
35 40 45
Pro Leu Val Ser Gly
50
<210> 169
<211> 90
<212> PRT
<213> Streptomyces sp.
<400> 169
Thr Ser Ser Leu Lys Asn Tyr Ala Ala Ser Gly His Val Glu Gly Gln
1 5 10 15
Ala Ala Leu Ile Met Arg Glu Arg Gly Val Ala Ser Ala Arg Leu Ile
20 25 30
Ile Asp Asn Pro Ser Gly Ile Cys Gly Tyr Cys Arg Ser Gln Val Pro
35 40 45
Thr Leu Leu Pro Ala Gly Ala Thr Leu Glu Val Thr Thr Pro Arg Gly
50 55 60
Thr Val Pro Pro Thr Ala Arg Trp Ser Asn Gly Lys Thr Phe Val Gly
65 70 75 80
Asn Glu Asn Asp Pro Lys Pro Trp Pro Arg
85 90
<210> 170
<211> 120
<212> PRT
<213> Streptomyces sp.
<400> 170
Asp Ile Ile Leu Ala Thr Leu Pro Ile Gly Lys Val Gly Lys Leu Arg
1 5 10 15
Phe Ala Pro Lys Val Glu Ser Ala Glu Ser Met Leu Arg Ser Leu Ser
20 25 30
Gln Glu Gly Lys Thr Ala Gly Val Leu Asp Ile Asn Gly Glu Leu Ile
35 40 45
Pro Leu Val Ser Gly Thr Ser Ser Leu Lys Asn Tyr Ala Ala Ser Gly
50 55 60
His Val Glu Gly Gln Ala Ala Leu Ile Met Arg Glu Arg Gly Val Ala
65 70 75 80
Ser Ala Arg Leu Ile Ile Asp Asn Pro Ser Gly Ile Cys Gly Tyr Cys
85 90 95
Arg Ser Gln Val Pro Thr Leu Leu Pro Ala Gly Ala Thr Leu Glu Val
100 105 110
Thr Thr Pro Arg Gly Thr Val Pro
115 120
<210> 171
<211> 23
<212> PRT
<213> Streptomyces sp.
<400> 171
Pro Thr Ala Arg Trp Ser Asn Gly Lys Thr Phe Val Gly Asn Glu Asn
1 5 10 15
Asp Pro Lys Pro Trp Pro Arg
20
<210> 172
<211> 128
<212> PRT
<213> Jiangella alba
<400> 172
Pro Pro Val Ala Ser Gly Gly Leu Ala Thr Glu Val Pro Ala Tyr Ala
1 5 10 15
Gly Ser Arg Thr Ala Gly Thr Leu Val Thr Pro Asp Gly Ala Glu Phe
20 25 30
Pro Leu Ile Ser Gly Trp His Pro Pro Ala Ala Ser Met Pro Gln Gly
35 40 45
Thr Pro Gly Met Asn Ile Val Thr Lys Ser His Val Glu Ala His Ala
50 55 60
Ala Ala Ile Met Arg Asn Gln Gly Leu Ser Glu Ala Thr Leu Trp Ile
65 70 75 80
Asn Arg Ala Pro Cys Gly Gly Lys Pro Gly Cys Ala Ala Met Leu Pro
85 90 95
Arg Met Val Pro Ser Gly Ser Thr Leu Thr Ile Asn Val Val Pro Asn
100 105 110
Gly Ser Ala Gly Ser Ile Ala Asp Thr Leu Ile Ile Arg Gly Ile Gly
115 120 125
<210> 173
<211> 37
<212> PRT
<213> Jiangella alba
<400> 173
Pro Pro Val Ala Ser Gly Gly Leu Ala Thr Glu Val Pro Ala Tyr Ala
1 5 10 15
Gly Ser Arg Thr Ala Gly Thr Leu Val Thr Pro Asp Gly Ala Glu Phe
20 25 30
Pro Leu Ile Ser Gly
35
<210> 174
<211> 91
<212> PRT
<213> Jiangella alba
<400> 174
Trp His Pro Pro Ala Ala Ser Met Pro Gln Gly Thr Pro Gly Met Asn
1 5 10 15
Ile Val Thr Lys Ser His Val Glu Ala His Ala Ala Ala Ile Met Arg
20 25 30
Asn Gln Gly Leu Ser Glu Ala Thr Leu Trp Ile Asn Arg Ala Pro Cys
35 40 45
Gly Gly Lys Pro Gly Cys Ala Ala Met Leu Pro Arg Met Val Pro Ser
50 55 60
Gly Ser Thr Leu Thr Ile Asn Val Val Pro Asn Gly Ser Ala Gly Ser
65 70 75 80
Ile Ala Asp Thr Leu Ile Ile Arg Gly Ile Gly
85 90
<210> 175
<211> 116
<212> PRT
<213> Jiangella alba
<400> 175
Pro Pro Val Ala Ser Gly Gly Leu Ala Thr Glu Val Pro Ala Tyr Ala
1 5 10 15
Gly Ser Arg Thr Ala Gly Thr Leu Val Thr Pro Asp Gly Ala Glu Phe
20 25 30
Pro Leu Ile Ser Gly Trp His Pro Pro Ala Ala Ser Met Pro Gln Gly
35 40 45
Thr Pro Gly Met Asn Ile Val Thr Lys Ser His Val Glu Ala His Ala
50 55 60
Ala Ala Ile Met Arg Asn Gln Gly Leu Ser Glu Ala Thr Leu Trp Ile
65 70 75 80
Asn Arg Ala Pro Cys Gly Gly Lys Pro Gly Cys Ala Ala Met Leu Pro
85 90 95
Arg Met Val Pro Ser Gly Ser Thr Leu Thr Ile Asn Val Val Pro Asn
100 105 110
Gly Ser Ala Gly
115
<210> 176
<211> 12
<212> PRT
<213> Jiangella alba
<400> 176
Ser Ile Ala Asp Thr Leu Ile Ile Arg Gly Ile Gly
1 5 10
<210> 177
<211> 140
<212> PRT
<213> Burkholderia diffusa
<400> 177
Glu Ile Arg Ala Lys Tyr Pro Thr Pro Glu Glu Ala Gln Leu Pro Pro
1 5 10 15
Tyr Asp Gly Asp Thr Thr Tyr Ala Leu Met Tyr Tyr Thr Asp Glu His
20 25 30
Gly Lys Ser His Val Val Glu Leu Ser Ser Gly Gly Ala Asp Asp Glu
35 40 45
His Ser Asn Tyr Ala Ala Ala Gly His Thr Glu Gly Gln Ala Ala Val
50 55 60
Ile Met Arg Gln Arg Lys Ile Thr Ser Ala Val Val Val His Asn Asn
65 70 75 80
Thr Asp Gly Thr Cys Pro Phe Cys Val Ala His Leu Pro Thr Leu Leu
85 90 95
Pro Ser Gly Ala Glu Leu Arg Val Val Pro Pro Arg Ser Ala Lys Ala
100 105 110
Lys Lys Pro Gly Trp Ile Asp Val Ser Lys Thr Phe Glu Gly Asn Ala
115 120 125
Arg Lys Pro Leu Asp Asn Lys Asn Lys Lys Ser Thr
130 135 140
<210> 178
<211> 44
<212> PRT
<213> Burkholderia diffusa
<400> 178
Glu Ile Arg Ala Lys Tyr Pro Thr Pro Glu Glu Ala Gln Leu Pro Pro
1 5 10 15
Tyr Asp Gly Asp Thr Thr Tyr Ala Leu Met Tyr Tyr Thr Asp Glu His
20 25 30
Gly Lys Ser His Val Val Glu Leu Ser Ser Gly Gly
35 40
<210> 179
<211> 96
<212> PRT
<213> Burkholderia diffusa
<400> 179
Ala Asp Asp Glu His Ser Asn Tyr Ala Ala Ala Gly His Thr Glu Gly
1 5 10 15
Gln Ala Ala Val Ile Met Arg Gln Arg Lys Ile Thr Ser Ala Val Val
20 25 30
Val His Asn Asn Thr Asp Gly Thr Cys Pro Phe Cys Val Ala His Leu
35 40 45
Pro Thr Leu Leu Pro Ser Gly Ala Glu Leu Arg Val Val Pro Pro Arg
50 55 60
Ser Ala Lys Ala Lys Lys Pro Gly Trp Ile Asp Val Ser Lys Thr Phe
65 70 75 80
Glu Gly Asn Ala Arg Lys Pro Leu Asp Asn Lys Asn Lys Lys Ser Thr
85 90 95
<210> 180
<211> 112
<212> PRT
<213> Burkholderia diffusa
<400> 180
Glu Ile Arg Ala Lys Tyr Pro Thr Pro Glu Glu Ala Gln Leu Pro Pro
1 5 10 15
Tyr Asp Gly Asp Thr Thr Tyr Ala Leu Met Tyr Tyr Thr Asp Glu His
20 25 30
Gly Lys Ser His Val Val Glu Leu Ser Ser Gly Gly Ala Asp Asp Glu
35 40 45
His Ser Asn Tyr Ala Ala Ala Gly His Thr Glu Gly Gln Ala Ala Val
50 55 60
Ile Met Arg Gln Arg Lys Ile Thr Ser Ala Val Val Val His Asn Asn
65 70 75 80
Thr Asp Gly Thr Cys Pro Phe Cys Val Ala His Leu Pro Thr Leu Leu
85 90 95
Pro Ser Gly Ala Glu Leu Arg Val Val Pro Pro Arg Ser Ala Lys Ala
100 105 110
<210> 181
<211> 28
<212> PRT
<213> Burkholderia diffusa
<400> 181
Lys Lys Pro Gly Trp Ile Asp Val Ser Lys Thr Phe Glu Gly Asn Ala
1 5 10 15
Arg Lys Pro Leu Asp Asn Lys Asn Lys Lys Ser Thr
20 25
<210> 182
<211> 116
<212> PRT
<213> Burkholderia diffusa
<400> 182
Glu Ile Arg Ala Lys Tyr Pro Thr Pro Glu Glu Ala Gln Leu Pro Pro
1 5 10 15
Tyr Asp Gly Asp Thr Thr Tyr Ala Leu Met Tyr Tyr Thr Asp Glu His
20 25 30
Gly Lys Ser His Val Val Glu Leu Ser Ser Gly Gly Ala Asp Asp Glu
35 40 45
His Ser Asn Tyr Ala Ala Ala Gly His Thr Glu Gly Gln Ala Ala Val
50 55 60
Ile Met Arg Gln Arg Lys Ile Thr Ser Ala Val Val Val His Asn Asn
65 70 75 80
Thr Asp Gly Thr Cys Pro Phe Cys Val Ala His Leu Pro Thr Leu Leu
85 90 95
Pro Ser Gly Ala Glu Leu Arg Val Val Pro Pro Arg Ser Ala Lys Ala
100 105 110
Lys Lys Pro Gly
115
<210> 183
<211> 24
<212> PRT
<213> Burkholderia diffusa
<400> 183
Trp Ile Asp Val Ser Lys Thr Phe Glu Gly Asn Ala Arg Lys Pro Leu
1 5 10 15
Asp Asn Lys Asn Lys Lys Ser Thr
20
<210> 184
<211> 137
<212> PRT
<213> Burkholderia ubonensis
<400> 184
Ala Ala Leu Leu Arg Glu Ala Tyr Pro Ser Met Glu Gly Ala Thr Leu
1 5 10 15
Pro Pro Phe Asp Gly Lys Thr Thr Ile Gly Leu Met Phe Tyr Thr Asp
20 25 30
Ala Ser Gly Gln Tyr Gln Val Lys Lys Leu Phe Ser Gly Glu Lys Val
35 40 45
Leu Ser Asn Tyr Asp Ala Thr Gly His Val Glu Gly Lys Ala Ala Leu
50 55 60
Ile Met Arg Asn Glu Lys Ile Thr Glu Ala Val Val Met His Asn His
65 70 75 80
Pro Ser Gly Thr Cys Asn Tyr Cys Asp Lys Gln Val Glu Thr Leu Leu
85 90 95
Pro Lys Asn Ala Thr Leu Arg Val Ile Pro Pro Glu Asn Ala Lys Ala
100 105 110
Pro Thr Ser Tyr Trp Asn Asp Gln Pro Thr Thr Tyr Arg Gly Asp Gly
115 120 125
Lys Asp Pro Lys Ala Pro Ser Lys Lys
130 135
<210> 185
<211> 45
<212> PRT
<213> Burkholderia ubonensis
<400> 185
Ala Ala Leu Leu Arg Glu Ala Tyr Pro Ser Met Glu Gly Ala Thr Leu
1 5 10 15
Pro Pro Phe Asp Gly Lys Thr Thr Ile Gly Leu Met Phe Tyr Thr Asp
20 25 30
Ala Ser Gly Gln Tyr Gln Val Lys Lys Leu Phe Ser Gly
35 40 45
<210> 186
<211> 92
<212> PRT
<213> Burkholderia ubonensis
<400> 186
Glu Lys Val Leu Ser Asn Tyr Asp Ala Thr Gly His Val Glu Gly Lys
1 5 10 15
Ala Ala Leu Ile Met Arg Asn Glu Lys Ile Thr Glu Ala Val Val Met
20 25 30
His Asn His Pro Ser Gly Thr Cys Asn Tyr Cys Asp Lys Gln Val Glu
35 40 45
Thr Leu Leu Pro Lys Asn Ala Thr Leu Arg Val Ile Pro Pro Glu Asn
50 55 60
Ala Lys Ala Pro Thr Ser Tyr Trp Asn Asp Gln Pro Thr Thr Tyr Arg
65 70 75 80
Gly Asp Gly Lys Asp Pro Lys Ala Pro Ser Lys Lys
85 90
<210> 187
<211> 112
<212> PRT
<213> Burkholderia ubonensis
<400> 187
Ala Ala Leu Leu Arg Glu Ala Tyr Pro Ser Met Glu Gly Ala Thr Leu
1 5 10 15
Pro Pro Phe Asp Gly Lys Thr Thr Ile Gly Leu Met Phe Tyr Thr Asp
20 25 30
Ala Ser Gly Gln Tyr Gln Val Lys Lys Leu Phe Ser Gly Glu Lys Val
35 40 45
Leu Ser Asn Tyr Asp Ala Thr Gly His Val Glu Gly Lys Ala Ala Leu
50 55 60
Ile Met Arg Asn Glu Lys Ile Thr Glu Ala Val Val Met His Asn His
65 70 75 80
Pro Ser Gly Thr Cys Asn Tyr Cys Asp Lys Gln Val Glu Thr Leu Leu
85 90 95
Pro Lys Asn Ala Thr Leu Arg Val Ile Pro Pro Glu Asn Ala Lys Ala
100 105 110
<210> 188
<211> 25
<212> PRT
<213> Burkholderia ubonensis
<400> 188
Pro Thr Ser Tyr Trp Asn Asp Gln Pro Thr Thr Tyr Arg Gly Asp Gly
1 5 10 15
Lys Asp Pro Lys Ala Pro Ser Lys Lys
20 25
<210> 189
<211> 134
<212> PRT
<213> Paraburkholderia guartelaensis
<400> 189
Ala Leu Leu Arg Glu Gln Phe Pro Ser Met Asp Ala Val Thr Leu Pro
1 5 10 15
Pro Phe Asp Gly Lys Thr Thr Ile Gly Tyr Met Phe Tyr Thr Asp Ala
20 25 30
Asn Gly Gln Tyr His Val Arg Lys Leu Tyr Ser Gly Gly Lys Val Leu
35 40 45
Ser Asn Tyr Asp Ser Ser Gly His Val Glu Gly Met Ala Ala Leu Ile
50 55 60
Met Arg Lys Gly Arg Ile Thr Glu Ala Val Val Met His Asn His Pro
65 70 75 80
Ser Gly Thr Cys His Tyr Cys Asn Gly Gln Val Glu Thr Leu Leu Pro
85 90 95
Lys Asn Ala Lys Leu Lys Val Ile Pro Pro Ala Asn Ala Lys Ala Pro
100 105 110
Thr Lys Tyr Trp Tyr Asp Gln Pro Val Asp Tyr Leu Gly Asn Ser Asn
115 120 125
Asp Pro Lys Pro Pro Ser
130
<210> 190
<211> 45
<212> PRT
<213> Paraburkholderia guartelaensis
<400> 190
Ala Leu Leu Arg Glu Gln Phe Pro Ser Met Asp Ala Val Thr Leu Pro
1 5 10 15
Pro Phe Asp Gly Lys Thr Thr Ile Gly Tyr Met Phe Tyr Thr Asp Ala
20 25 30
Asn Gly Gln Tyr His Val Arg Lys Leu Tyr Ser Gly Gly
35 40 45
<210> 191
<211> 89
<212> PRT
<213> Paraburkholderia guartelaensis
<400> 191
Lys Val Leu Ser Asn Tyr Asp Ser Ser Gly His Val Glu Gly Met Ala
1 5 10 15
Ala Leu Ile Met Arg Lys Gly Arg Ile Thr Glu Ala Val Val Met His
20 25 30
Asn His Pro Ser Gly Thr Cys His Tyr Cys Asn Gly Gln Val Glu Thr
35 40 45
Leu Leu Pro Lys Asn Ala Lys Leu Lys Val Ile Pro Pro Ala Asn Ala
50 55 60
Lys Ala Pro Thr Lys Tyr Trp Tyr Asp Gln Pro Val Asp Tyr Leu Gly
65 70 75 80
Asn Ser Asn Asp Pro Lys Pro Pro Ser
85
<210> 192
<211> 111
<212> PRT
<213> Paraburkholderia guartelaensis
<400> 192
Ala Leu Leu Arg Glu Gln Phe Pro Ser Met Asp Ala Val Thr Leu Pro
1 5 10 15
Pro Phe Asp Gly Lys Thr Thr Ile Gly Tyr Met Phe Tyr Thr Asp Ala
20 25 30
Asn Gly Gln Tyr His Val Arg Lys Leu Tyr Ser Gly Gly Lys Val Leu
35 40 45
Ser Asn Tyr Asp Ser Ser Gly His Val Glu Gly Met Ala Ala Leu Ile
50 55 60
Met Arg Lys Gly Arg Ile Thr Glu Ala Val Val Met His Asn His Pro
65 70 75 80
Ser Gly Thr Cys His Tyr Cys Asn Gly Gln Val Glu Thr Leu Leu Pro
85 90 95
Lys Asn Ala Lys Leu Lys Val Ile Pro Pro Ala Asn Ala Lys Ala
100 105 110
<210> 193
<211> 23
<212> PRT
<213> Paraburkholderia guartelaensis
<400> 193
Pro Thr Lys Tyr Trp Tyr Asp Gln Pro Val Asp Tyr Leu Gly Asn Ser
1 5 10 15
Asn Asp Pro Lys Pro Pro Ser
20
<210> 194
<211> 137
<212> PRT
<213> Pseudoduganella violaceinigra
<400> 194
Gly Ser Ser Gly Lys Asn Val Arg Met Pro Arg Asp Tyr Ala Ser Glu
1 5 10 15
Leu Pro Glu Tyr Asp Gly Lys Thr Thr His Gly Val Leu Val Thr Asn
20 25 30
Glu Gly Lys Val Ile Gln Leu Arg Ser Gly Gly Lys Glu Glu Pro Tyr
35 40 45
Thr Gly Tyr Lys Ala Val Ser Ala Ser His Val Glu Gly Lys Ala Ala
50 55 60
Ile Trp Ile Arg Glu Asn Gly Ser Ser Gly Gly Thr Val Tyr His Asn
65 70 75 80
Asn Thr Thr Gly Thr Cys Gly Tyr Cys Asn Ser Gln Val Lys Ala Leu
85 90 95
Leu Pro Glu Gly Val Glu Leu Lys Ile Val Pro Pro Thr Asn Ala Val
100 105 110
Ala Lys Asn Ala Gln Ala Arg Ala Val Pro Thr Ile Asn Val Gly Asn
115 120 125
Gly Thr Gln Pro Gly Arg Lys Gln Lys
130 135
<210> 195
<211> 43
<212> PRT
<213> Pseudoduganella violaceinigra
<400> 195
Gly Ser Ser Gly Lys Asn Val Arg Met Pro Arg Asp Tyr Ala Ser Glu
1 5 10 15
Leu Pro Glu Tyr Asp Gly Lys Thr Thr His Gly Val Leu Val Thr Asn
20 25 30
Glu Gly Lys Val Ile Gln Leu Arg Ser Gly Gly
35 40
<210> 196
<211> 94
<212> PRT
<213> Pseudoduganella violaceinigra
<400> 196
Lys Glu Glu Pro Tyr Thr Gly Tyr Lys Ala Val Ser Ala Ser His Val
1 5 10 15
Glu Gly Lys Ala Ala Ile Trp Ile Arg Glu Asn Gly Ser Ser Gly Gly
20 25 30
Thr Val Tyr His Asn Asn Thr Thr Gly Thr Cys Gly Tyr Cys Asn Ser
35 40 45
Gln Val Lys Ala Leu Leu Pro Glu Gly Val Glu Leu Lys Ile Val Pro
50 55 60
Pro Thr Asn Ala Val Ala Lys Asn Ala Gln Ala Arg Ala Val Pro Thr
65 70 75 80
Ile Asn Val Gly Asn Gly Thr Gln Pro Gly Arg Lys Gln Lys
85 90
<210> 197
<211> 118
<212> PRT
<213> Pseudoduganella violaceinigra
<400> 197
Gly Ser Ser Gly Lys Asn Val Arg Met Pro Arg Asp Tyr Ala Ser Glu
1 5 10 15
Leu Pro Glu Tyr Asp Gly Lys Thr Thr His Gly Val Leu Val Thr Asn
20 25 30
Glu Gly Lys Val Ile Gln Leu Arg Ser Gly Gly Lys Glu Glu Pro Tyr
35 40 45
Thr Gly Tyr Lys Ala Val Ser Ala Ser His Val Glu Gly Lys Ala Ala
50 55 60
Ile Trp Ile Arg Glu Asn Gly Ser Ser Gly Gly Thr Val Tyr His Asn
65 70 75 80
Asn Thr Thr Gly Thr Cys Gly Tyr Cys Asn Ser Gln Val Lys Ala Leu
85 90 95
Leu Pro Glu Gly Val Glu Leu Lys Ile Val Pro Pro Thr Asn Ala Val
100 105 110
Ala Lys Asn Ala Gln Ala
115
<210> 198
<211> 19
<212> PRT
<213> Pseudoduganella violaceinigra
<400> 198
Arg Ala Val Pro Thr Ile Asn Val Gly Asn Gly Thr Gln Pro Gly Arg
1 5 10 15
Lys Gln Lys
<210> 199
<211> 136
<212> PRT
<213> Duganella sp.
<400> 199
Gly Ser Ser Gly Lys Asn Val Arg Leu Pro Arg Asp Tyr Ala Ser Glu
1 5 10 15
Leu Pro Glu Tyr Asp Gly Lys Thr Thr Tyr Gly Val Leu Val Thr Asn
20 25 30
Glu Gly Lys Val Ile Gln Leu Arg Ser Gly Gly Lys Glu Val Pro Tyr
35 40 45
Ser Gly Tyr Lys Ala Val Ser Ala Ser His Val Glu Gly Lys Ala Ala
50 55 60
Ile Trp Ile Arg Glu Asn Ala Ser Ser Gly Gly Thr Val Tyr His Asn
65 70 75 80
Asn Thr Thr Gly Thr Cys Gly Tyr Cys Asn Ser Gln Val Lys Ala Leu
85 90 95
Leu Pro Glu Gly Val Glu Leu Lys Ile Val Pro Pro Ala Asn Ala Val
100 105 110
Ala Arg Asn Ser Gln Ala Lys Ala Ile Pro Thr Ile Asn Val Gly Asn
115 120 125
Ala Thr Gln Pro Gly Arg Lys Pro
130 135
<210> 200
<211> 43
<212> PRT
<213> Duganella sp.
<400> 200
Gly Ser Ser Gly Lys Asn Val Arg Leu Pro Arg Asp Tyr Ala Ser Glu
1 5 10 15
Leu Pro Glu Tyr Asp Gly Lys Thr Thr Tyr Gly Val Leu Val Thr Asn
20 25 30
Glu Gly Lys Val Ile Gln Leu Arg Ser Gly Gly
35 40
<210> 201
<211> 93
<212> PRT
<213> Duganella sp.
<400> 201
Lys Glu Val Pro Tyr Ser Gly Tyr Lys Ala Val Ser Ala Ser His Val
1 5 10 15
Glu Gly Lys Ala Ala Ile Trp Ile Arg Glu Asn Ala Ser Ser Gly Gly
20 25 30
Thr Val Tyr His Asn Asn Thr Thr Gly Thr Cys Gly Tyr Cys Asn Ser
35 40 45
Gln Val Lys Ala Leu Leu Pro Glu Gly Val Glu Leu Lys Ile Val Pro
50 55 60
Pro Ala Asn Ala Val Ala Arg Asn Ser Gln Ala Lys Ala Ile Pro Thr
65 70 75 80
Ile Asn Val Gly Asn Ala Thr Gln Pro Gly Arg Lys Pro
85 90
<210> 202
<211> 118
<212> PRT
<213> Duganella sp.
<400> 202
Gly Ser Ser Gly Lys Asn Val Arg Leu Pro Arg Asp Tyr Ala Ser Glu
1 5 10 15
Leu Pro Glu Tyr Asp Gly Lys Thr Thr Tyr Gly Val Leu Val Thr Asn
20 25 30
Glu Gly Lys Val Ile Gln Leu Arg Ser Gly Gly Lys Glu Val Pro Tyr
35 40 45
Ser Gly Tyr Lys Ala Val Ser Ala Ser His Val Glu Gly Lys Ala Ala
50 55 60
Ile Trp Ile Arg Glu Asn Ala Ser Ser Gly Gly Thr Val Tyr His Asn
65 70 75 80
Asn Thr Thr Gly Thr Cys Gly Tyr Cys Asn Ser Gln Val Lys Ala Leu
85 90 95
Leu Pro Glu Gly Val Glu Leu Lys Ile Val Pro Pro Ala Asn Ala Val
100 105 110
Ala Arg Asn Ser Gln Ala
115
<210> 203
<211> 18
<212> PRT
<213> Duganella sp.
<400> 203
Lys Ala Ile Pro Thr Ile Asn Val Gly Asn Ala Thr Gln Pro Gly Arg
1 5 10 15
Lys Pro
<210> 204
<211> 132
<212> PRT
<213> Chondromyces apiculatus
<400> 204
Pro Asp Pro Pro Pro Pro Pro Thr Pro Met Gly Asn Thr Leu Pro Gly
1 5 10 15
Trp Asp Gly Gly Lys Thr Gln Gly Trp Phe Val Tyr Pro Asp Gly Thr
20 25 30
Glu Arg His Leu Ile Ser Gly Tyr Asp Gly Pro Ser Lys Phe Thr Gln
35 40 45
Gly Ile Pro Gly Met Asn Gly Asn Ile Lys Ser His Val Glu Ala His
50 55 60
Ala Ala Ala Leu Met Arg Gln Tyr Glu Leu Ser Lys Ala Thr Leu Tyr
65 70 75 80
Ile Asn Arg Val Pro Cys Pro Gly Val Arg Gly Cys Asp Ala Leu Leu
85 90 95
Ala Arg Met Leu Pro Glu Gly Val Gln Leu Glu Ile Ile Gly Pro Asn
100 105 110
Gly Phe Lys Lys Thr Tyr Thr Gly Leu Pro Asp Pro Lys Leu Lys Pro
115 120 125
Lys Gly Cys Ser
130
<210> 205
<211> 42
<212> PRT
<213> Chondromyces apiculatus
<400> 205
Pro Asp Pro Pro Pro Pro Pro Thr Pro Met Gly Asn Thr Leu Pro Gly
1 5 10 15
Trp Asp Gly Gly Lys Thr Gln Gly Trp Phe Val Tyr Pro Asp Gly Thr
20 25 30
Glu Arg His Leu Ile Ser Gly Tyr Asp Gly
35 40
<210> 206
<211> 90
<212> PRT
<213> Chondromyces apiculatus
<400> 206
Pro Ser Lys Phe Thr Gln Gly Ile Pro Gly Met Asn Gly Asn Ile Lys
1 5 10 15
Ser His Val Glu Ala His Ala Ala Ala Leu Met Arg Gln Tyr Glu Leu
20 25 30
Ser Lys Ala Thr Leu Tyr Ile Asn Arg Val Pro Cys Pro Gly Val Arg
35 40 45
Gly Cys Asp Ala Leu Leu Ala Arg Met Leu Pro Glu Gly Val Gln Leu
50 55 60
Glu Ile Ile Gly Pro Asn Gly Phe Lys Lys Thr Tyr Thr Gly Leu Pro
65 70 75 80
Asp Pro Lys Leu Lys Pro Lys Gly Cys Ser
85 90
<210> 207
<211> 120
<212> PRT
<213> Chondromyces apiculatus
<400> 207
Pro Asp Pro Pro Pro Pro Pro Thr Pro Met Gly Asn Thr Leu Pro Gly
1 5 10 15
Trp Asp Gly Gly Lys Thr Gln Gly Trp Phe Val Tyr Pro Asp Gly Thr
20 25 30
Glu Arg His Leu Ile Ser Gly Tyr Asp Gly Pro Ser Lys Phe Thr Gln
35 40 45
Gly Ile Pro Gly Met Asn Gly Asn Ile Lys Ser His Val Glu Ala His
50 55 60
Ala Ala Ala Leu Met Arg Gln Tyr Glu Leu Ser Lys Ala Thr Leu Tyr
65 70 75 80
Ile Asn Arg Val Pro Cys Pro Gly Val Arg Gly Cys Asp Ala Leu Leu
85 90 95
Ala Arg Met Leu Pro Glu Gly Val Gln Leu Glu Ile Ile Gly Pro Asn
100 105 110
Gly Phe Lys Lys Thr Tyr Thr Gly
115 120
<210> 208
<211> 12
<212> PRT
<213> Chondromyces apiculatus
<400> 208
Leu Pro Asp Pro Lys Leu Lys Pro Lys Gly Cys Ser
1 5 10
<210> 209
<211> 140
<212> PRT
<213> Sorangium cellulosum
<400> 209
Gly Ala Ala Thr Val Phe Gly Ala Gly Arg Gly Leu Gly Ala Leu Glu
1 5 10 15
Glu Ala Thr Thr Ala Ala Gly Ile Ala Arg Gly Ala Pro Ser Leu Pro
20 25 30
Val Tyr Thr Gly Gly Lys Thr Thr Gly Val Leu Arg Thr Ala Thr Gly
35 40 45
Asp Met Pro Leu Val Ser Gly Tyr Lys Gly Pro Ser Ala Ser Met Pro
50 55 60
Arg Gly Thr Pro Gly Met Asn Gly Arg Ile Lys Ser His Val Glu Ala
65 70 75 80
His Ala Ala Ala Val Met Arg Glu Arg Gly Ile Lys Asp Ala Thr Leu
85 90 95
His Ile Asn Gln Val Pro Cys Ser Ser Ala Thr Gly Cys Gly Ala Met
100 105 110
Leu Pro Arg Met Leu Pro Glu Gly Ala Gln Leu Arg Val Leu Gly Pro
115 120 125
Asp Gly Tyr Asp Gln Val Phe Ile Gly Leu Pro Asp
130 135 140
<210> 210
<211> 58
<212> PRT
<213> Sorangium cellulosum
<400> 210
Gly Ala Ala Thr Val Phe Gly Ala Gly Arg Gly Leu Gly Ala Leu Glu
1 5 10 15
Glu Ala Thr Thr Ala Ala Gly Ile Ala Arg Gly Ala Pro Ser Leu Pro
20 25 30
Val Tyr Thr Gly Gly Lys Thr Thr Gly Val Leu Arg Thr Ala Thr Gly
35 40 45
Asp Met Pro Leu Val Ser Gly Tyr Lys Gly
50 55
<210> 211
<211> 82
<212> PRT
<213> Sorangium cellulosum
<400> 211
Pro Ser Ala Ser Met Pro Arg Gly Thr Pro Gly Met Asn Gly Arg Ile
1 5 10 15
Lys Ser His Val Glu Ala His Ala Ala Ala Val Met Arg Glu Arg Gly
20 25 30
Ile Lys Asp Ala Thr Leu His Ile Asn Gln Val Pro Cys Ser Ser Ala
35 40 45
Thr Gly Cys Gly Ala Met Leu Pro Arg Met Leu Pro Glu Gly Ala Gln
50 55 60
Leu Arg Val Leu Gly Pro Asp Gly Tyr Asp Gln Val Phe Ile Gly Leu
65 70 75 80
Pro Asp
<210> 212
<211> 127
<212> PRT
<213> Sorangium cellulosum
<400> 212
Gly Ala Ala Thr Val Phe Gly Ala Gly Arg Gly Leu Gly Ala Leu Glu
1 5 10 15
Glu Ala Thr Thr Ala Ala Gly Ile Ala Arg Gly Ala Pro Ser Leu Pro
20 25 30
Val Tyr Thr Gly Gly Lys Thr Thr Gly Val Leu Arg Thr Ala Thr Gly
35 40 45
Asp Met Pro Leu Val Ser Gly Tyr Lys Gly Pro Ser Ala Ser Met Pro
50 55 60
Arg Gly Thr Pro Gly Met Asn Gly Arg Ile Lys Ser His Val Glu Ala
65 70 75 80
His Ala Ala Ala Val Met Arg Glu Arg Gly Ile Lys Asp Ala Thr Leu
85 90 95
His Ile Asn Gln Val Pro Cys Ser Ser Ala Thr Gly Cys Gly Ala Met
100 105 110
Leu Pro Arg Met Leu Pro Glu Gly Ala Gln Leu Arg Val Leu Gly
115 120 125
<210> 213
<211> 13
<212> PRT
<213> Sorangium cellulosum
<400> 213
Pro Asp Gly Tyr Asp Gln Val Phe Ile Gly Leu Pro Asp
1 5 10
<210> 214
<211> 127
<212> PRT
<213> Clostridium sp.
<400> 214
Thr Asn Ile Ile Asp Asn Arg Pro Lys Leu Pro Asp Tyr Asp Gly Lys
1 5 10 15
Thr Thr His Gly Ile Leu Val Thr Pro Asn Ser Glu His Ile Pro Phe
20 25 30
Ser Ser Gly Asn Pro Asn Pro Asn Tyr Lys Asn Tyr Ile Pro Ala Ser
35 40 45
His Val Glu Gly Lys Ser Ala Ile Tyr Met Arg Glu Asn Gly Ile Thr
50 55 60
Ser Gly Thr Ile Tyr Tyr Asn Asn Thr Asp Gly Thr Cys Pro Tyr Cys
65 70 75 80
Asp Lys Met Leu Ser Thr Leu Leu Glu Glu Gly Ser Val Leu Glu Val
85 90 95
Ile Pro Pro Ile Asn Ala Lys Ala Pro Lys Pro Ser Trp Val Asp Lys
100 105 110
Pro Lys Thr Tyr Ile Gly Asn Asn Lys Val Pro Lys Pro Asn Lys
115 120 125
<210> 215
<211> 35
<212> PRT
<213> Clostridium sp.
<400> 215
Thr Asn Ile Ile Asp Asn Arg Pro Lys Leu Pro Asp Tyr Asp Gly Lys
1 5 10 15
Thr Thr His Gly Ile Leu Val Thr Pro Asn Ser Glu His Ile Pro Phe
20 25 30
Ser Ser Gly
35
<210> 216
<211> 92
<212> PRT
<213> Clostridium sp.
<400> 216
Asn Pro Asn Pro Asn Tyr Lys Asn Tyr Ile Pro Ala Ser His Val Glu
1 5 10 15
Gly Lys Ser Ala Ile Tyr Met Arg Glu Asn Gly Ile Thr Ser Gly Thr
20 25 30
Ile Tyr Tyr Asn Asn Thr Asp Gly Thr Cys Pro Tyr Cys Asp Lys Met
35 40 45
Leu Ser Thr Leu Leu Glu Glu Gly Ser Val Leu Glu Val Ile Pro Pro
50 55 60
Ile Asn Ala Lys Ala Pro Lys Pro Ser Trp Val Asp Lys Pro Lys Thr
65 70 75 80
Tyr Ile Gly Asn Asn Lys Val Pro Lys Pro Asn Lys
85 90
<210> 217
<211> 104
<212> PRT
<213> Clostridium sp.
<400> 217
Thr Asn Ile Ile Asp Asn Arg Pro Lys Leu Pro Asp Tyr Asp Gly Lys
1 5 10 15
Thr Thr His Gly Ile Leu Val Thr Pro Asn Ser Glu His Ile Pro Phe
20 25 30
Ser Ser Gly Asn Pro Asn Pro Asn Tyr Lys Asn Tyr Ile Pro Ala Ser
35 40 45
His Val Glu Gly Lys Ser Ala Ile Tyr Met Arg Glu Asn Gly Ile Thr
50 55 60
Ser Gly Thr Ile Tyr Tyr Asn Asn Thr Asp Gly Thr Cys Pro Tyr Cys
65 70 75 80
Asp Lys Met Leu Ser Thr Leu Leu Glu Glu Gly Ser Val Leu Glu Val
85 90 95
Ile Pro Pro Ile Asn Ala Lys Ala
100
<210> 218
<211> 23
<212> PRT
<213> Clostridium sp.
<400> 218
Pro Lys Pro Ser Trp Val Asp Lys Pro Lys Thr Tyr Ile Gly Asn Asn
1 5 10 15
Lys Val Pro Lys Pro Asn Lys
20
<210> 219
<211> 142
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Chloroflexia bacterium sequence"
<400> 219
Ala Gly Cys Pro Gly Asp Ala Leu Pro Pro Tyr Gly Thr Lys Gly Ser
1 5 10 15
Lys Thr Thr Gly Ile Leu Asp Thr Gly Asn Glu Ser Ile Leu Leu Glu
20 25 30
Ser Gly Glu Asn Gly Pro Gly Met Met Val Pro Arg Asp Thr Pro Gly
35 40 45
Met Ser Gly Ala Met Pro Asn Arg Ala His Val Glu Gly His Thr Ala
50 55 60
Ala Ile Met Arg Asn Glu Asn Ile Arg Leu Ala Asp Leu Tyr Ile Asn
65 70 75 80
Arg Met Pro Cys Ser Gly Ala Tyr Gly Cys Met Val Asn Leu Pro His
85 90 95
Met Leu Pro Glu Gly Ser Ile Leu Arg Ile His Val Arg Ala Lys Leu
100 105 110
Ser Asp Pro Trp Thr Thr Leu Pro Pro Phe Val Gly Ile Ser Asp Thr
115 120 125
Leu Trp Pro Pro Ser Gly Leu Asn Pro Lys Ile Val Leu Pro
130 135 140
<210> 220
<211> 37
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Chloroflexia bacterium sequence"
<400> 220
Ala Gly Cys Pro Gly Asp Ala Leu Pro Pro Tyr Gly Thr Lys Gly Ser
1 5 10 15
Lys Thr Thr Gly Ile Leu Asp Thr Gly Asn Glu Ser Ile Leu Leu Glu
20 25 30
Ser Gly Glu Asn Gly
35
<210> 221
<211> 105
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Chloroflexia bacterium sequence"
<400> 221
Pro Gly Met Met Val Pro Arg Asp Thr Pro Gly Met Ser Gly Ala Met
1 5 10 15
Pro Asn Arg Ala His Val Glu Gly His Thr Ala Ala Ile Met Arg Asn
20 25 30
Glu Asn Ile Arg Leu Ala Asp Leu Tyr Ile Asn Arg Met Pro Cys Ser
35 40 45
Gly Ala Tyr Gly Cys Met Val Asn Leu Pro His Met Leu Pro Glu Gly
50 55 60
Ser Ile Leu Arg Ile His Val Arg Ala Lys Leu Ser Asp Pro Trp Thr
65 70 75 80
Thr Leu Pro Pro Phe Val Gly Ile Ser Asp Thr Leu Trp Pro Pro Ser
85 90 95
Gly Leu Asn Pro Lys Ile Val Leu Pro
100 105
<210> 222
<211> 18
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Chloroflexia bacterium sequence"
<400> 222
Ile Ser Asp Thr Leu Trp Pro Pro Ser Gly Leu Asn Pro Lys Ile Val
1 5 10 15
Leu Pro
<210> 223
<211> 124
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Chloroflexia bacterium sequence"
<400> 223
Ala Gly Cys Pro Gly Asp Ala Leu Pro Pro Tyr Gly Thr Lys Gly Ser
1 5 10 15
Lys Thr Thr Gly Ile Leu Asp Thr Gly Asn Glu Ser Ile Leu Leu Glu
20 25 30
Ser Gly Glu Asn Gly Pro Gly Met Met Val Pro Arg Asp Thr Pro Gly
35 40 45
Met Ser Gly Ala Met Pro Asn Arg Ala His Val Glu Gly His Thr Ala
50 55 60
Ala Ile Met Arg Asn Glu Asn Ile Arg Leu Ala Asp Leu Tyr Ile Asn
65 70 75 80
Arg Met Pro Cys Ser Gly Ala Tyr Gly Cys Met Val Asn Leu Pro His
85 90 95
Met Leu Pro Glu Gly Ser Ile Leu Arg Ile His Val Arg Ala Lys Leu
100 105 110
Ser Asp Pro Trp Thr Thr Leu Pro Pro Phe Val Gly
115 120
<210> 224
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (21)..(24)
<223> a, c, t, g, unknown or other
<400> 224
acacgacgct cttccgatct nnnnctgggg cagctgatca catgt 45
<210> 225
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 225
gacgtgtgct cttccgatct cttccatccc ctccccaag 39
<210> 226
<211> 141
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(4)
<223> a, c, t, g, unknown or other
<400> 226
nnnnctgggg cagctgatca catgttttct ctgcagcctt cccagaggag cttccggcag 60
acctgaagca ctggaagcca ggtgtgcagg gcaggtgggc tggggttggg aagggtggat 120
gccttgggga ggggatggaa g 141
<210> 227
<211> 68
<212> DNA
<213> Homo sapiens
<400> 227
tcttcattac acctgcagct ctcattttcc atacagtcag tatcaattct ggaagaattt 60
ccagacat 68
<210> 228
<211> 68
<212> DNA
<213> Homo sapiens
<400> 228
atgtctggaa attcttccag aattgatact gactgtatgg aaaatgagag ctgcaggtgt 60
aatgaaga 68
<210> 229
<211> 59
<212> DNA
<213> Homo sapiens
<400> 229
tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagac 59
<210> 230
<211> 59
<212> DNA
<213> Homo sapiens
<400> 230
gtctggaaat tcttccagaa ttgatactga ctgtatggaa aatgagagct gcaggtgta 59
<210> 231
<211> 53
<212> DNA
<213> Homo sapiens
<400> 231
tgcagctctc attttccata cagtcagtat caattctgga agaatttcca gac 53
<210> 232
<211> 53
<212> DNA
<213> Homo sapiens
<400> 232
gtctggaaat tcttccagaa ttgatactga ctgtatggaa aatgagagct gca 53
<210> 233
<211> 39
<212> DNA
<213> Homo sapiens
<400> 233
tacacctgca gctctcattt tccatacagt cagtatcaa 39
<210> 234
<211> 39
<212> DNA
<213> Homo sapiens
<400> 234
ttgatactga ctgtatggaa aatgagagct gcaggtgta 39
<210> 235
<211> 111
<212> DNA
<213> Homo sapiens
<400> 235
ctttaccaga tctcaaaaag aaggtcttca ttacacctgc agctctcatt ttccatacag 60
tcagtatcaa ttctggaaga atttccagac attaaagata gtcatcttgg g 111
<210> 236
<211> 111
<212> DNA
<213> Homo sapiens
<400> 236
cccaagatga ctatctttaa tgtctggaaa ttcttccaga attgatactg actgtatgga 60
aaatgagagc tgcaggtgta atgaagacct tctttttgag atctggtaaa g 111
<210> 237
<211> 81
<212> DNA
<213> Homo sapiens
<400> 237
tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagaca 60
ttaaagatag tcatcttggg g 81
<210> 238
<211> 81
<212> DNA
<213> Homo sapiens
<400> 238
ccccaagatg actatcttta atgtctggaa attcttccag aattgatact gactgtatgg 60
aaaatgagag ctgcaggtgt a 81
<210> 239
<211> 60
<212> DNA
<213> Homo sapiens
<400> 239
tcccagagga gcttccggca gacctgaagc actggaagcc aggtgtgcag ggcaggtggg 60
<210> 240
<211> 60
<212> DNA
<213> Homo sapiens
<400> 240
cccacctgcc ctgcacacct ggcttccagt gcttcaggtc tgccggaagc tcctctggga 60
<210> 241
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 241
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser
1 5 10 15
Ala His Leu Ser Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Ser Gly His Leu Ser
35 40 45
Arg His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile Pro Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Ser Ser His Arg
65 70 75 80
Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp
85 90 95
Ile Cys Gly Arg Lys Phe Ala Ala Lys Trp Asn Leu Asp Ala His Thr
100 105 110
Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Arg Pro Tyr Thr Leu Arg Leu His Ile Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala
145 150 155 160
Leu Arg His His Leu Thr Arg His Thr Lys Ile His
165 170
<210> 242
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 242
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
1 5 10 15
Gly His Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Lys Trp Thr Leu Gln
35 40 45
Gly His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Ile Arg Ser Thr Leu Arg Asp His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala His Arg Ser Ser Leu Arg Arg His Thr Lys Ile His Thr
100 105 110
Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
115 120 125
Gln Ser Gly Asn Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys
130 135 140
Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Asn Val Asp
145 150 155 160
Leu Ile His His Thr Lys Ile His
165
<210> 243
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 243
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Ile Arg
1 5 10 15
Ser Thr Leu Arg Asp His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
20 25 30
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala His Arg Ser Ser Leu Arg
35 40 45
Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asn Leu Ala Arg His Ile
65 70 75 80
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
85 90 95
Lys Phe Ala Arg Asn Val Asp Leu Ile His His Thr Lys Ile His Thr
100 105 110
Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
115 120 125
Arg Ser Asp Val Leu Ser Glu His Ile Arg Thr His Thr Gly Glu Lys
130 135 140
Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Thr Ser Gly His
145 150 155 160
Leu Ser Arg His Thr Lys Ile His
165
<210> 244
<211> 137
<212> DNA
<213> Homo sapiens
<400> 244
ctggggcagc tgatcacatg ttttctctgc agccttccca gaggagcttc cggcagacct 60
gaagcactgg aagccaggtg tgcagggcag gtgggctggg gttgggaagg gtggatgcct 120
tggggagggg atggaag 137
<210> 245
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 245
Ser Gly Gly Ser
1
Claims (54)
- 제1 융합 단백질 및 제2 융합 단백질, 또는 각각 제1 및 제2 융합 단백질을 발현시키기 위한 제1 및 제2 발현 구축물을 포함하는, 세포의 게놈에서 시토신을 티민으로 변화시키기 위한 시스템으로서, 여기서
a) 제1 융합 단백질은
i) 세포 내 표적 게놈 영역 내의 제1 서열에 결합하는 제1 아연 핑거 단백질 (ZFP) 도메인, 및
ii) 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 독소-유래 데아미나제 (TDD)인 시티딘 데아미나제 폴리펩티드의 제1 부분
을 포함하고;
b) 제2 융합 단백질은
i) 표적 게놈 영역 내의 제2 서열에 결합하는 제2 ZFP 도메인, 및
ii) 시티딘 데아미나제 폴리펩티드의 제2 부분
을 포함하고;
c) 제1 및 제2 부분은 그 자체로 시티딘 데아미나제 활성이 결여되어 있고;
d) 표적 게놈 영역에 대한 제1 융합 단백질 및 제2 융합 단백질의 결합은 제1 및 제2 부분의 이량체화를 일으키며, 여기서 이량체화된 부분은 표적 게놈 영역에서 시토신을 티민으로 변화시킬 수 있는 활성 시티딘 데아미나제를 형성하고,
임의로 여기서 세포는 진핵 세포이고,
임의로 여기서 진핵 세포는 포유동물 세포 또는 식물 세포이고,
추가로 임의로 여기서 포유동물 세포는 인간 세포인
시스템. - 제1항에 있어서, 표적 게놈 영역이 세포 내 유전자의 특정한 대립유전자에 대해 특이적인 것인 시스템.
- 제1항 또는 제2항에 있어서, 시토신이 표적 게놈 영역 내 제1 서열과 제2 서열의 근위 말단들 사이에 있고, 임의로 여기서 근위 말단은 100 bp 이하로 떨어져 있는 것인 시스템.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 제1 및 제2 융합 단백질의 하나 초과의 쌍을 포함하며, 여기서 융합 단백질의 각각의 쌍은 상이한 표적 게놈 영역에 결합하는 것인 시스템.
- 제4항에 있어서, 한 쌍의 융합 단백질의 제1 및 제2 시티딘 데아미나제 부분이 또 다른 쌍의 융합 단백질의 제1 및 제2 부분과 상이한 것인 시스템.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 비편집 또는 편집된 가닥 상에 단일-가닥 DNA 파괴를 생성하는 닉카제를 추가로 포함하며, 여기서 DNA 파괴는 편집될 시토신으로부터 약 500 bp 이하, 임의로 200 bp 이하, 임의로 약 10-50 bp인 시스템.
- 제6항에 있어서, 닉카제가 ZFP-기반 닉카제, TALE-기반 닉카제 또는 CRISPR-기반 닉카제인 시스템.
- 제7항에 있어서, 닉카제가 표적 게놈 영역에 결합하는 2개의 ZFP 도메인에 각각 융합된 제1 닉카제 도메인 및 제2 닉카제 도메인의 이량체화에 의해 형성된 ZFP-기반 닉카제이며, 여기서 제1 및 제2 닉카제 도메인은 그 자체로 불활성인 시스템.
- 제8항에 있어서,
닉카제 도메인 중 하나는 제1 또는 제2 융합 단백질에 융합되고,
다른 닉카제 도메인은 표적 게놈 영역 내의 제3 서열에 결합하는 제3 ZFP 도메인에 융합되는 것인
시스템. - 제8항에 있어서, 2개의 닉카제 도메인이 각각
i) 표적 게놈 영역 내의 제3 서열에 결합하는 제3 ZFP 도메인, 및
ii) 표적 게놈 영역 내의 제4 서열에 결합하는 제4 ZFP 도메인
에 융합된 것인 시스템. - 제8항 내지 제10항 중 어느 한 항에 있어서, 제1 및 제2 닉카제 도메인이 FokI로부터 유래된 것인 시스템.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 제3 융합 단백질 또는 세포에서 제3 융합 단백질을 발현시키기 위한 제3 발현 구축물을 추가로 포함하며, 여기서
e) 제3 융합 단백질은
i) 표적 게놈 영역 내의 제3 서열에 결합하는 ZFP 도메인, 및
ii) 시티딘 데아미나제에 대한 억제 도메인
을 포함하고;
f) 표적 게놈 영역에 대한 제3 융합 단백질의 결합은 이량체화된 시티딘 데아미나제 부분에 대한 억제 도메인 결합, 및 그에 의한 이량체화된 시티딘 데아미나제 부분의 시티딘 데아미나제 활성의 억제를 일으키는 것인
시스템. - 제1항 내지 제7항 중 어느 한 항에 있어서, 제3 융합 단백질 또는 세포에서 제3 융합 단백질을 발현시키기 위한 제3 발현 구축물, 및 제4 융합 단백질 또는 세포에서 제4 융합 단백질을 발현시키기 위한 제4 발현 구축물을 추가로 포함하며, 여기서
e) 제3 융합 단백질은
i) 표적 게놈 영역 내의 제3 서열에 결합하는 ZFP 도메인, 및
ii) 제1 이량체화 도메인
을 포함하고;
f) 제4 융합 단백질은
i) 시티딘 데아미나제에 대한 억제 도메인, 및
ii) 이량체화-유도 작용제의 존재 하에 제1 이량체화 도메인과 파트너를 이룰 수 있는 제2 이량체화 도메인
을 포함하고;
g) 표적 게놈 영역에 대한 제3 융합 단백질의 결합, 및 제1 및 제2 이량체화 도메인의 이량체화는 이량체화된 시티딘 데아미나제 부분에 대한 억제 도메인 결합, 및 그에 의한 이량체화된 시티딘 데아미나제 부분의 시티딘 데아미나제 활성의 억제를 일으키는 것인
시스템. - 제1항 내지 제7항 중 어느 한 항에 있어서, 제3 융합 단백질 또는 세포에서 제3 융합 단백질을 발현시키기 위한 제3 발현 구축물, 및 제4 융합 단백질 또는 세포에서 제4 융합 단백질을 발현시키기 위한 제4 발현 구축물을 추가로 포함하며, 여기서
e) 제3 융합 단백질은
i) 표적 게놈 영역 내의 제3 서열에 결합하는 ZFP 도메인, 및
ii) 제1 이량체화 도메인
을 포함하고;
f) 제4 융합 단백질은
i) 시티딘 데아미나제에 대한 억제 도메인, 및
ii) 이량체화-억제 작용제의 부재 하에 제1 이량체화 도메인과 파트너를 이룰 수 있는 제2 이량체화 도메인
을 포함하고;
g) 표적 게놈 영역에 대한 제3 융합 단백질의 결합, 및 제1 및 제2 이량체화 도메인의 이량체화는 이량체화된 시티딘 데아미나제 부분에 대한 억제 도메인 결합, 및 그에 의한 이량체화된 시티딘 데아미나제 부분의 시티딘 데아미나제 활성의 억제를 일으키는 것인
시스템. - 제1항 내지 제14항 중 어느 한 항에 있어서, ZFP 도메인이 독립적으로 2, 3, 4, 5, 6, 7, 또는 8개의 아연 핑거를 갖는 것인 시스템.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 발현 구축물이 동일한 또는 별개의 바이러스 벡터 상에 있는 것인 시스템.
- 제16항에 있어서, 바이러스 벡터가 아데노-관련 바이러스 (AAV) 벡터, 아데노바이러스 벡터 또는 렌티바이러스 벡터인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, TDD가 서열식별번호: 72의 아미노산 서열을 포함하는 것인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, TDD가 서열식별번호: 72의 아미노산 서열을 포함하는 TDD의 독성 도메인을 포함하는 것인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 시티딘 데아미나제가 서열식별번호: 49 또는 81의 아미노산 서열에 대해 적어도 95% 동일한 아미노산 서열을 포함하는 TDD인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, TDD가 서열식별번호: 49 또는 81의 아미노산 서열을 포함하는 것인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서,
제1 및 제2 시티딘 데아미나제 부분이
서열식별번호: 72의
각각 아미노산 1264-1333 및 1334-1427;
각각 아미노산 1264-1397 및 1398-1427;
각각 아미노산 1264-1404 및 1405-1427;
각각 아미노산 1264-1407 및 1408-1427;
각각 아미노산 1290-1333 및 1334-1427;
각각 아미노산 1290-1397 및 1398-1427;
각각 아미노산 1290-1404 및 1405-1427; 또는
각각 아미노산 1290-1407 및 1408-1427
을 포함하거나; 또는
그 반대로 포함하는 것인
시스템. - 제1항 내지 제17항 중 어느 한 항에 있어서,
제1 및 제2 시티딘 데아미나제 부분이 각각
서열식별번호: 82 및 83,
서열식별번호: 84 및 85,
서열식별번호: 18 및 19,
서열식별번호: 51 및 52, 또는
서열식별번호: 53 및 54
를 포함하거나; 또는
그 반대로 포함하는 것인
시스템. - 제18항 내지 제23항 중 어느 한 항에 있어서, TDD가 Y1307, T1311, S1331, V1346, H1366, N1367, N1368, P1369, E1370, G1371, T1372, F1375, V1392, P1394, P1395, I1399, P1400, V1401, K1402, A1405 및 T1406으로부터 선택된 1개 이상의 잔기에 돌연변이를 가지며, 여기서 잔기는 서열식별번호: 72에 대해 넘버링된 것인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 시티딘 데아미나제가 서열식별번호: 86-91 및 117-129 중 어느 하나의 아미노산 서열을 포함하는 TDD인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 시티딘 데아미나제가 서열식별번호: 86-91 및 117-129 중 어느 하나의 아미노산 서열을 포함하는 TDD의 독성 도메인을 포함하는 것인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, TDD가 서열식별번호: 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열에 대해 적어도 95% 동일한 아미노산 서열을 포함하는 것인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 시티딘 데아미나제가 서열식별번호: 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함하는 TDD인 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서,
제1 및 제2 시티딘 데아미나제 부분이 각각 서열식별번호: 93 및 94, 서열식별번호: 96 및 97, 서열식별번호: 99 및 100, 서열식별번호: 102 및 103, 서열식별번호: 105 및 106, 서열식별번호: 108 및 109, 서열식별번호: 130 및 131, 서열식별번호: 132 및 133, 서열식별번호: 135 및 136, 서열식별번호: 137 및 138, 서열식별번호: 139 및 140, 서열식별번호: 141 및 142, 서열식별번호: 144 및 145, 서열식별번호: 146 및 147, 서열식별번호: 148 및 149, 서열식별번호: 150 및 151, 서열식별번호: 153 및 154, 서열식별번호: 155 및 156, 서열식별번호: 158 및 159, 서열식별번호: 160 및 161, 서열식별번호: 163 및 164, 서열식별번호: 165 및 166, 서열식별번호: 168 및 169, 서열식별번호: 170 및 171, 서열식별번호: 173 및 174, 서열식별번호: 175 및 176, 서열식별번호: 178 및 179, 서열식별번호: 180 및 181, 서열식별번호: 182 및 183, 서열식별번호: 185 및 186, 서열식별번호: 187 및 188, 서열식별번호: 190 및 191, 서열식별번호: 192 및 193, 서열식별번호: 195 및 196, 서열식별번호: 197 및 198, 서열식별번호: 200 및 201, 서열식별번호: 202 및 203, 서열식별번호: 205 및 206, 서열식별번호: 207 및 208, 서열식별번호: 210 및 211, 서열식별번호: 212 및 213, 서열식별번호: 215 및 216, 서열식별번호: 217 및 218, 서열식별번호: 220 및 221, 또는 서열식별번호: 222 및 223을 포함하거나; 또는
그 반대로 포함하는 것인
시스템. - i) 유전자에 결합하는 아연 핑거 단백질 (ZFP) 도메인 및 ii) 시티딘 데아미나제 폴리펩티드의 단편을 포함하는 융합 단백질로서, 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 독소-유래 데아미나제 (TDD)이고, 임의로 여기서 ZFP 도메인 및 시티딘 데아미나제 단편은 펩티드 링커에 의해 연결되고, 임의로 여기서 유전자는 진핵 유전자이고, 임의로 여기서 진핵 유전자는 인간 유전자인 융합 단백질.
- i) 유전자에 결합하는 아연 핑거 단백질 (ZFP) 도메인, 및 ii) 시티딘 데아미나제 억제 도메인을 포함하는 융합 단백질로서, 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 독소-유래 데아미나제 (TDD)이고, 임의로 여기서 ZFP 도메인 및 억제 도메인은 펩티드 링커에 의해 연결되고, 임의로 여기서 유전자는 진핵 유전자이고, 임의로 여기서 진핵 유전자는 인간 유전자인 융합 단백질.
- 제30항 또는 제31항에 있어서, TDD가 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제30항 내지 제32항 중 어느 한 항에 있어서, 링커가 서열식별번호: 15-17 및 110-116 중 어느 하나를 포함하는 것인 융합 단백질.
- 융합 단백질의 쌍으로서,
a) i) 유전자에 결합하는 아연 핑거 단백질 (ZFP) 도메인 및 ii) 제1 이량체화 도메인을 포함하는 제1 융합 단백질, 및
b) i) 시티딘 데아미나제 억제 도메인으로서, 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 독소-유래 데아미나제 (TDD)인 시티딘 데아미나제 억제 도메인, 및 ii) 제2 이량체화 도메인을 포함하는 제2 융합 단백질
을 포함하고,
여기서 제1 및 제2 이량체화 도메인은 이량체화-유도 작용제의 존재 하에 이량체화될 수 있고,
임의로 여기서 유전자는 진핵 유전자이고, 임의로 여기서 진핵 유전자는 인간 유전자인
융합 단백질의 쌍. - 융합 단백질의 쌍으로서,
a) i) 유전자에 결합하는 아연 핑거 단백질 (ZFP) 도메인 및 ii) 제1 이량체화 도메인을 포함하는 제1 융합 단백질, 및
b) i) 시티딘 데아미나제 억제 도메인으로서, 여기서 시티딘 데아미나제는 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214 또는 219에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 독소-유래 데아미나제 (TDD)인 시티딘 데아미나제 억제 도메인, 및 ii) 제2 이량체화 도메인을 포함하는 제2 융합 단백질
을 포함하고,
여기서 제1 및 제2 이량체화 도메인은 이량체화-억제 작용제의 부재 하에 이량체화될 수 있고,
임의로 여기서 유전자는 진핵 유전자이고, 임의로 여기서 진핵 유전자는 인간 유전자인
융합 단백질의 쌍. - 제34항 또는 제35항에 있어서, TDD가 서열식별번호: 49, 81, 92, 95, 98, 101, 104, 107, 134, 143, 152, 157, 162, 167, 172, 177, 184, 189, 194, 199, 204, 209, 214, 또는 219의 아미노산 서열을 포함하는 것인 융합 단백질의 쌍.
- 제30항 내지 제36항 중 어느 한 항의 융합 단백질(들)을 코딩하는 하나 이상의 단리된 핵산 분자.
- 제37항의 핵산 분자(들)를 포함하는 발현 구축물.
- 제38항의 발현 구축물을 포함하며, 임의로 아데노-관련 바이러스 벡터, 아데노바이러스 벡터 또는 렌티바이러스 벡터인 바이러스 벡터.
- 제1항 내지 제29항 중 어느 한 항의 시스템, 제30항 내지 제36항 중 어느 한 항의 융합 단백질(들), 제37항의 단리된 핵산 분자(들), 제38항의 발현 구축물 또는 제39항의 바이러스 벡터를 포함하며, 임의로 진핵 세포인 세포.
- 제40항에 있어서, 포유동물 세포, 임의로 인간 세포, 추가로 임의로 인간 배아 줄기 또는 인간 유도된 만능 줄기 세포인 세포.
- 제1항 내지 제29항 중 어느 한 항의 시스템을 세포에 전달하는 것을 포함하는, 세포 내 표적 게놈 영역에서 시토신을 티민으로 변화시키는 방법으로서, 임의로 여기서 세포는 진핵 세포인 방법.
- 제42항에 있어서, 시토신의 티민으로의 변화가 표적 게놈 영역에 정지 코돈을 생성하는 것인 방법.
- 제42항 또는 제43항에 있어서, 시스템이 1개 초과의 게놈 영역을 표적화하는 것인 방법.
- 제42항 내지 제44항 중 어느 한 항에 있어서, 제13항 및 제15항 내지 제29항 중 어느 한 항의 시스템 및 이량체화-유도 작용제를 전달하는 것을 포함하며, 여기서 작용제는 제1 및 제2 이량체화 도메인의 이량체화를 유도하고, 그에 의해 억제 도메인의 이량체화된 시티딘 데아미나제 부분에 대한 결합을 활성화시키는 것인 방법.
- 제42항 내지 제44항 중 어느 한 항에 있어서, 제14항 내지 제29항 중 어느 한 항의 시스템 및 이량체화-억제 작용제를 전달하는 것을 포함하며, 여기서 작용제는 제1 및 제2 이량체화 도메인의 이량체화를 억제하고, 그에 의해 억제 도메인의 이량체화된 시티딘 데아미나제 부분에 대한 결합을 방지하는 것인 방법.
- 제42항 내지 제46항 중 어느 한 항에 있어서, 세포가 생체내 인간 세포인 방법.
- 제42항 내지 제46항 중 어느 한 항에 있어서, 세포가 생체외 인간 세포인 방법.
- 제48항의 방법에 의해 수득된, 유전자 조작된 세포, 임의로 진핵 세포, 임의로 인간 세포.
- 제49항의 유전자 조작된 세포를 치료를 필요로 하는 환자에게 전달하는 것을 포함하는, 상기 환자를 치료하는 방법으로서, 임의로 여기서 세포 및 환자는 인간인 방법.
- 제49항에 있어서, 치료를 필요로 하는 환자를 치료하는 데 사용하기 위한 유전자 조작된 세포.
- 치료를 필요로 하는 환자를 치료하기 위한 의약의 제조를 위한 제49항의 유전자 조작된 세포의 용도.
- 제50항 내지 제52항 중 어느 한 항에 있어서, 환자가 암, 자가면역 장애, 상염색체 우성 질환, 또는 미토콘드리아 장애를 갖는 것인 방법, 세포, 또는 용도.
- 제50항 내지 제52항 중 어느 한 항에 있어서, 환자가 겸상 적혈구 질환, 혈우병, 낭성 섬유증, 페닐케톤뇨증, 테이-삭스병, 프리온 질환, 색맹, 리소솜 축적 질환, 프리드라이히 운동실조 또는 전립선암을 갖는 것인 방법, 세포 또는 용도.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063083662P | 2020-09-25 | 2020-09-25 | |
US63/083,662 | 2020-09-25 | ||
US202163164893P | 2021-03-23 | 2021-03-23 | |
US63/164,893 | 2021-03-23 | ||
US202163230580P | 2021-08-06 | 2021-08-06 | |
US63/230,580 | 2021-08-06 | ||
PCT/US2021/052088 WO2022067122A1 (en) | 2020-09-25 | 2021-09-24 | Zinc finger fusion proteins for nucleobase editing |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230074519A true KR20230074519A (ko) | 2023-05-30 |
Family
ID=78500694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237013407A KR20230074519A (ko) | 2020-09-25 | 2021-09-24 | 핵염기 편집을 위한 아연 핑거 융합 단백질 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240043829A1 (ko) |
EP (1) | EP4217479A1 (ko) |
JP (1) | JP2023542705A (ko) |
KR (1) | KR20230074519A (ko) |
CN (1) | CN116261594A (ko) |
AU (1) | AU2021350099A1 (ko) |
CA (1) | CA3196599A1 (ko) |
IL (1) | IL301393A (ko) |
WO (1) | WO2022067122A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024140538A1 (en) * | 2022-12-30 | 2024-07-04 | Peking University | Nucleobase editor systems and methods of use thereof |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5420032A (en) | 1991-12-23 | 1995-05-30 | Universitge Laval | Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence |
US5792632A (en) | 1992-05-05 | 1998-08-11 | Institut Pasteur | Nucleotide sequence encoding the enzyme I-SceI and the uses thereof |
CA2181548C (en) | 1994-01-18 | 2009-11-03 | Carlos F. Barbas, Iii | Zinc finger protein derivatives and methods therefor |
US6140466A (en) | 1994-01-18 | 2000-10-31 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
USRE45721E1 (en) | 1994-08-20 | 2015-10-06 | Gendaq, Ltd. | Relating to binding proteins for recognition of DNA |
GB9824544D0 (en) | 1998-11-09 | 1999-01-06 | Medical Res Council | Screening system |
US5789538A (en) | 1995-02-03 | 1998-08-04 | Massachusetts Institute Of Technology | Zinc finger proteins with high affinity new DNA binding specificities |
US5925523A (en) | 1996-08-23 | 1999-07-20 | President & Fellows Of Harvard College | Intraction trap assay, reagents and uses thereof |
GB9710809D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
GB9710807D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
US6140081A (en) | 1998-10-16 | 2000-10-31 | The Scripps Research Institute | Zinc finger binding domains for GNN |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
US20020061512A1 (en) | 2000-02-18 | 2002-05-23 | Kim Jin-Soo | Zinc finger domains and methods of identifying same |
US20030044787A1 (en) | 2000-05-16 | 2003-03-06 | Joung J. Keith | Methods and compositions for interaction trap assays |
JP2002060786A (ja) | 2000-08-23 | 2002-02-26 | Kao Corp | 硬質表面用殺菌防汚剤 |
GB0108491D0 (en) | 2001-04-04 | 2001-05-23 | Gendaq Ltd | Engineering zinc fingers |
US20040224385A1 (en) | 2001-08-20 | 2004-11-11 | Barbas Carlos F | Zinc finger binding domains for cnn |
MX2007013757A (es) * | 2005-05-05 | 2008-01-24 | Univ Arizona | Reagrupacion permitida de secuencia (seer)-met odo de novedad para visualizar secuencias de adn especificas. |
DK2628794T3 (en) | 2005-10-18 | 2016-08-15 | Prec Biosciences | RATIONALE CONSTRUCTED MECHANUCLEAS WITH CHANGED SEQUENCE SPECIFICITY AND DNA BINDING EFFICIENCY |
CA2725773C (en) | 2008-05-28 | 2017-12-05 | Sangamo Biosciences, Inc. | Compositions for linking dna-binding domains and cleavage domains |
JP6137596B2 (ja) | 2010-02-08 | 2017-05-31 | サンガモ セラピューティクス, インコーポレイテッド | 遺伝子操作された切断ハーフドメイン |
US8772453B2 (en) | 2010-05-03 | 2014-07-08 | Sangamo Biosciences, Inc. | Compositions for linking zinc finger modules |
JP6208580B2 (ja) | 2010-05-17 | 2017-10-04 | サンガモ セラピューティクス, インコーポレイテッド | 新規のdna結合タンパク質及びその使用 |
EP3929279A1 (en) | 2014-03-18 | 2021-12-29 | Sangamo Therapeutics, Inc. | Methods and compositions for regulation of zinc finger protein expression |
EP3504327B1 (en) | 2016-08-24 | 2021-10-06 | Sangamo Therapeutics, Inc. | Engineered target specific nucleases |
US20200172895A1 (en) * | 2017-05-25 | 2020-06-04 | The General Hospital Corporation | Using split deaminases to limit unwanted off-target base editor deamination |
CN112867792A (zh) * | 2018-08-23 | 2021-05-28 | 桑格摩生物治疗股份有限公司 | 工程化靶特异性碱基编辑器 |
EP4097124A1 (en) * | 2020-01-28 | 2022-12-07 | The Broad Institute Inc. | Base editors, compositions, and methods for modifying the mitochondrial genome |
-
2021
- 2021-09-24 IL IL301393A patent/IL301393A/en unknown
- 2021-09-24 JP JP2023519028A patent/JP2023542705A/ja active Pending
- 2021-09-24 US US18/246,574 patent/US20240043829A1/en active Pending
- 2021-09-24 CA CA3196599A patent/CA3196599A1/en active Pending
- 2021-09-24 CN CN202180066106.XA patent/CN116261594A/zh active Pending
- 2021-09-24 WO PCT/US2021/052088 patent/WO2022067122A1/en active Application Filing
- 2021-09-24 EP EP21802040.2A patent/EP4217479A1/en active Pending
- 2021-09-24 KR KR1020237013407A patent/KR20230074519A/ko unknown
- 2021-09-24 AU AU2021350099A patent/AU2021350099A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4217479A1 (en) | 2023-08-02 |
IL301393A (en) | 2023-05-01 |
AU2021350099A9 (en) | 2023-07-13 |
US20240043829A1 (en) | 2024-02-08 |
CA3196599A1 (en) | 2022-03-31 |
CN116261594A (zh) | 2023-06-13 |
JP2023542705A (ja) | 2023-10-11 |
AU2021350099A1 (en) | 2023-04-27 |
WO2022067122A1 (en) | 2022-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12084692B2 (en) | Guide scaffolds | |
JP6840796B2 (ja) | Dna結合ドメインと切断ドメインとを連結するための組成物 | |
US20230076357A1 (en) | Methods and Compositions for Directed Genome Editing | |
JP2021045166A (ja) | ヌクレアーゼ媒介ゲノム遺伝子操作のための送達方法及び組成物 | |
JP2021536229A (ja) | 操作された標的特異的な塩基エディター | |
KR20210023831A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 병원성 아미노산을 치환하는 방법 | |
CA3009727A1 (en) | Compositions and methods for the treatment of hemoglobinopathies | |
CA3163714A1 (en) | Compositions and methods for the targeting of pcsk9 | |
WO2016106338A2 (en) | Cas9-dna targeting unit chimeras | |
EP3769775A2 (en) | Compositions for linking dna-binding domains and cleavage domains | |
US20240026386A1 (en) | Compositions and methods for the targeting of bcl11a | |
CN111954540A (zh) | 工程化靶标特异性核酸酶 | |
KR20240087856A (ko) | 지속성 동종 변형된 면역 세포 및 이의 사용 방법 | |
WO2019070974A1 (en) | PCSK9 ENDONUCLEASE VARIANTS, COMPOSITIONS AND METHODS OF USE | |
WO2020069029A1 (en) | Novel crispr nucleases | |
CN117729931A (zh) | 用于治疗转甲状腺素蛋白淀粉样变性的组合物和方法 | |
US20240043829A1 (en) | Zinc finger fusion proteins for nucleobase editing | |
AU2022421236A1 (en) | Novel zinc finger fusion proteins for nucleobase editing | |
CA3225808A1 (en) | Context-specific adenine base editors and uses thereof | |
KR20240012377A (ko) | 염기 편집기의 자기-불활성화용 조성물 및 방법 | |
US20180238877A1 (en) | Isolation of antigen specific b-cells | |
CA3163369A1 (en) | Variant cas9 | |
CN118234865A (zh) | 持久性同种异体修饰免疫细胞及其使用方法 |