KR20230005941A - 향상된 유전자 요법을 위한 아데노-관련 바이러스(aav)의 제어된 변형 - Google Patents
향상된 유전자 요법을 위한 아데노-관련 바이러스(aav)의 제어된 변형 Download PDFInfo
- Publication number
- KR20230005941A KR20230005941A KR1020227042010A KR20227042010A KR20230005941A KR 20230005941 A KR20230005941 A KR 20230005941A KR 1020227042010 A KR1020227042010 A KR 1020227042010A KR 20227042010 A KR20227042010 A KR 20227042010A KR 20230005941 A KR20230005941 A KR 20230005941A
- Authority
- KR
- South Korea
- Prior art keywords
- aav
- amino acid
- genetically
- modified
- adeno
- Prior art date
Links
- 241000702421 Dependoparvovirus Species 0.000 title claims description 53
- 238000001415 gene therapy Methods 0.000 title description 15
- 230000009466 transformation Effects 0.000 title description 5
- 230000001976 improved effect Effects 0.000 title description 2
- 210000000234 capsid Anatomy 0.000 claims abstract description 82
- 108090000565 Capsid Proteins Proteins 0.000 claims abstract description 81
- 102100023321 Ceruloplasmin Human genes 0.000 claims abstract description 81
- 150000001413 amino acids Chemical class 0.000 claims abstract description 61
- 238000004806 packaging method and process Methods 0.000 claims abstract description 15
- 101710081079 Minor spike protein H Proteins 0.000 claims description 106
- 235000001014 amino acid Nutrition 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 54
- 108090000623 proteins and genes Proteins 0.000 claims description 49
- 210000004027 cell Anatomy 0.000 claims description 41
- 235000018102 proteins Nutrition 0.000 claims description 41
- 102000004169 proteins and genes Human genes 0.000 claims description 41
- 125000000539 amino acid group Chemical group 0.000 claims description 35
- 208000015181 infectious disease Diseases 0.000 claims description 33
- 230000002458 infectious effect Effects 0.000 claims description 33
- 241000700605 Viruses Species 0.000 claims description 32
- 101710136297 Protein VP2 Proteins 0.000 claims description 30
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 claims description 29
- 101710157639 Minor capsid protein Proteins 0.000 claims description 27
- 239000013612 plasmid Substances 0.000 claims description 26
- 239000000203 mixture Substances 0.000 claims description 20
- 230000014509 gene expression Effects 0.000 claims description 19
- 239000003446 ligand Substances 0.000 claims description 16
- 108020004705 Codon Proteins 0.000 claims description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 15
- 230000001225 therapeutic effect Effects 0.000 claims description 15
- 230000003612 virological effect Effects 0.000 claims description 14
- 230000000890 antigenic effect Effects 0.000 claims description 13
- 201000010099 disease Diseases 0.000 claims description 13
- 108700026244 Open Reading Frames Proteins 0.000 claims description 12
- 150000007523 nucleic acids Chemical class 0.000 claims description 12
- -1 cyclopropene amino acid Chemical class 0.000 claims description 11
- 230000002068 genetic effect Effects 0.000 claims description 11
- 230000028993 immune response Effects 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 11
- 108010069514 Cyclic Peptides Proteins 0.000 claims description 10
- 239000002202 Polyethylene glycol Substances 0.000 claims description 9
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 9
- 235000018417 cysteine Nutrition 0.000 claims description 9
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims description 9
- 229920001223 polyethylene glycol Polymers 0.000 claims description 9
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 9
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 claims description 8
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 claims description 8
- 239000000227 bioadhesive Substances 0.000 claims description 8
- 229920000642 polymer Polymers 0.000 claims description 8
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 claims description 7
- 102000001189 Cyclic Peptides Human genes 0.000 claims description 7
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 claims description 7
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 7
- 239000000523 sample Substances 0.000 claims description 7
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 claims description 7
- 235000016491 selenocysteine Nutrition 0.000 claims description 7
- 229940055619 selenocysteine Drugs 0.000 claims description 7
- 150000003384 small molecules Chemical class 0.000 claims description 7
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 7
- VKBLQCDGTHFOLS-NSHDSACASA-N (2s)-2-(4-benzoylanilino)propanoic acid Chemical compound C1=CC(N[C@@H](C)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 VKBLQCDGTHFOLS-NSHDSACASA-N 0.000 claims description 6
- IERVIGIDGQRAJZ-JAMMHHFISA-N CC1(C=C1)C(=O)NC(CCC[C@H](N)C(=O)O)N Chemical compound CC1(C=C1)C(=O)NC(CCC[C@H](N)C(=O)O)N IERVIGIDGQRAJZ-JAMMHHFISA-N 0.000 claims description 6
- GEYBMYRBIABFTA-VIFPVBQESA-N O-methyl-L-tyrosine Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1 GEYBMYRBIABFTA-VIFPVBQESA-N 0.000 claims description 6
- 230000001939 inductive effect Effects 0.000 claims description 6
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 6
- DTERQYGMUDWYAZ-ZETCQYMHSA-N N(6)-acetyl-L-lysine Chemical compound CC(=O)NCCCC[C@H]([NH3+])C([O-])=O DTERQYGMUDWYAZ-ZETCQYMHSA-N 0.000 claims description 5
- 150000001720 carbohydrates Chemical class 0.000 claims description 5
- 239000002773 nucleotide Substances 0.000 claims description 5
- 125000003729 nucleotide group Chemical group 0.000 claims description 5
- 150000002993 phenylalanine derivatives Chemical class 0.000 claims description 5
- 238000013519 translation Methods 0.000 claims description 5
- 125000005454 tryptophanyl group Chemical group 0.000 claims description 5
- HTFFMYRVHHNNBE-YFKPBYRVSA-N (2s)-2-amino-6-azidohexanoic acid Chemical compound OC(=O)[C@@H](N)CCCCN=[N+]=[N-] HTFFMYRVHHNNBE-YFKPBYRVSA-N 0.000 claims description 4
- LDCYZAJDBXYCGN-UHFFFAOYSA-N 5-hydroxytryptophan Chemical compound C1=C(O)C=C2C(CC(N)C(O)=O)=CNC2=C1 LDCYZAJDBXYCGN-UHFFFAOYSA-N 0.000 claims description 4
- 108020005038 Terminator Codon Proteins 0.000 claims description 4
- VEVCTKUSISWYDS-VIFPVBQESA-N (2S)-2-amino-3-(5-azido-1H-indol-3-yl)propanoic acid Chemical compound C1=C(N=[N+]=[N-])C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 VEVCTKUSISWYDS-VIFPVBQESA-N 0.000 claims description 3
- KZDNJQUJBMDHJW-VIFPVBQESA-N (2s)-2-amino-3-(5-bromo-1h-indol-3-yl)propanoic acid Chemical compound C1=C(Br)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 KZDNJQUJBMDHJW-VIFPVBQESA-N 0.000 claims description 3
- HMZJSKDXXVDHAC-LBPRGKRZSA-N (2s)-2-amino-3-(5-prop-2-ynoxy-1h-indol-3-yl)propanoic acid Chemical compound C1=C(OCC#C)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 HMZJSKDXXVDHAC-LBPRGKRZSA-N 0.000 claims description 3
- YNJSNEKCXVFDKW-VIFPVBQESA-N (2s)-3-(5-amino-1h-indol-3-yl)-2-azaniumylpropanoate Chemical compound C1=C(N)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 YNJSNEKCXVFDKW-VIFPVBQESA-N 0.000 claims description 3
- KVNPSKDDJARYKK-JTQLQIEISA-N 5-methoxytryptophan Chemical compound COC1=CC=C2NC=C(C[C@H](N)C(O)=O)C2=C1 KVNPSKDDJARYKK-JTQLQIEISA-N 0.000 claims description 3
- 108091026890 Coding region Proteins 0.000 claims description 3
- 239000002671 adjuvant Substances 0.000 claims description 3
- 239000000427 antigen Substances 0.000 claims description 3
- 108091007433 antigens Proteins 0.000 claims description 3
- 102000036639 antigens Human genes 0.000 claims description 3
- 210000004748 cultured cell Anatomy 0.000 claims description 3
- 150000002632 lipids Chemical class 0.000 claims description 3
- 102000039446 nucleic acids Human genes 0.000 claims description 3
- 108020004707 nucleic acids Proteins 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 101710124709 Minor capsid protein VP1 Proteins 0.000 claims description 2
- 101710124706 Minor capsid protein VP2 Proteins 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 101710132601 Capsid protein Proteins 0.000 claims 26
- 101710197658 Capsid protein VP1 Proteins 0.000 claims 26
- 101710108545 Viral protein 1 Proteins 0.000 claims 26
- 101000805768 Banna virus (strain Indonesia/JKT-6423/1980) mRNA (guanine-N(7))-methyltransferase Proteins 0.000 claims 2
- 101000686790 Chaetoceros protobacilladnavirus 2 Replication-associated protein Proteins 0.000 claims 2
- 101000864475 Chlamydia phage 1 Internal scaffolding protein VP3 Proteins 0.000 claims 2
- 241000701022 Cytomegalovirus Species 0.000 claims 2
- 101000803553 Eumenes pomiformis Venom peptide 3 Proteins 0.000 claims 2
- 101000583961 Halorubrum pleomorphic virus 1 Matrix protein Proteins 0.000 claims 2
- 238000001890 transfection Methods 0.000 claims 1
- 230000035772 mutation Effects 0.000 abstract description 29
- 238000012986 modification Methods 0.000 abstract description 23
- 230000004048 modification Effects 0.000 abstract description 22
- 230000010415 tropism Effects 0.000 abstract description 5
- 230000005847 immunogenicity Effects 0.000 abstract description 2
- 238000010348 incorporation Methods 0.000 description 22
- 239000013607 AAV vector Substances 0.000 description 20
- 108020004566 Transfer RNA Proteins 0.000 description 16
- 108020004414 DNA Proteins 0.000 description 11
- 238000002372 labelling Methods 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 108010077245 asparaginyl-proline Proteins 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 108020003175 receptors Proteins 0.000 description 7
- 102000005962 receptors Human genes 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 4
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 4
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 4
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- 108010071170 Leucine-tRNA ligase Proteins 0.000 description 4
- 102100023339 Leucine-tRNA ligase, cytoplasmic Human genes 0.000 description 4
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 235000014633 carbohydrates Nutrition 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 238000007385 chemical modification Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 230000036515 potency Effects 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 3
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 3
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 3
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 3
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 3
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 3
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 3
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 3
- 108010029485 Protein Isoforms Proteins 0.000 description 3
- 102000001708 Protein Isoforms Human genes 0.000 description 3
- 101710123256 Pyrrolysine-tRNA ligase Proteins 0.000 description 3
- 108010079005 RDV peptide Proteins 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 3
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 3
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 3
- 238000012761 co-transfection Methods 0.000 description 3
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 3
- 238000001215 fluorescent labelling Methods 0.000 description 3
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 229960005486 vaccine Drugs 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 2
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 2
- ALOVURZCXKYKJC-NAKRPEOUSA-N Arg-Asp-Gln-Ser Chemical compound N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O ALOVURZCXKYKJC-NAKRPEOUSA-N 0.000 description 2
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 2
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 2
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 2
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 2
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 2
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 2
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 2
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 2
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 2
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 2
- 101150044789 Cap gene Proteins 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 2
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 2
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 2
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 2
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 2
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 2
- 102000008055 Heparan Sulfate Proteoglycans Human genes 0.000 description 2
- 229920002971 Heparan sulfate Polymers 0.000 description 2
- 101710121996 Hexon protein p72 Proteins 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 2
- 101710125418 Major capsid protein Proteins 0.000 description 2
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 2
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 2
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 2
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 102000007073 Sialic Acid Binding Immunoglobulin-like Lectins Human genes 0.000 description 2
- 108010047827 Sialic Acid Binding Immunoglobulin-like Lectins Proteins 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- 108090000054 Syndecan-2 Proteins 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 2
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 2
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 2
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 2
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 2
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 2
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 2
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 2
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 2
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 2
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002073 fluorescence micrograph Methods 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 108091008042 inhibitory receptors Proteins 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 230000012743 protein tagging Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 150000003923 2,5-pyrrolediones Chemical class 0.000 description 1
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 1
- GZAJOEGTZDUSKS-UHFFFAOYSA-N 5-aminofluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(N)=CC=C21 GZAJOEGTZDUSKS-UHFFFAOYSA-N 0.000 description 1
- LDCYZAJDBXYCGN-VIFPVBQESA-N 5-hydroxy-L-tryptophan Chemical compound C1=C(O)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 LDCYZAJDBXYCGN-VIFPVBQESA-N 0.000 description 1
- 229940000681 5-hydroxytryptophan Drugs 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- 108020005098 Anticodon Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- WTFIFQWLQXZLIZ-UMPQAUOISA-N Arg-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O WTFIFQWLQXZLIZ-UMPQAUOISA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- JPSODRNUDXONAS-XIRDDKMYSA-N Asn-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC(=O)N)N JPSODRNUDXONAS-XIRDDKMYSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- 241000726103 Atta Species 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 108091016585 CD44 antigen Proteins 0.000 description 1
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000005698 Diels-Alder reaction Methods 0.000 description 1
- 108010046649 GDNP peptide Proteins 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 1
- AASLOGQZZKZWKH-SRVKXCTJSA-N His-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AASLOGQZZKZWKH-SRVKXCTJSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 1
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010047852 Integrin alphaVbeta3 Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 1
- 241000205275 Methanosarcina barkeri Species 0.000 description 1
- 241000205274 Methanosarcina mazei Species 0.000 description 1
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 1
- OBWQLWYNNZPWGX-QEJZJMRPSA-N Trp-Gln-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OBWQLWYNNZPWGX-QEJZJMRPSA-N 0.000 description 1
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- 125000002344 aminooxy group Chemical group [H]N([H])O[*] 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 1
- 238000010461 azide-alkyne cycloaddition reaction Methods 0.000 description 1
- 238000006149 azo coupling reaction Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000012650 click reaction Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000003431 cross linking reagent Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 108010045325 cyclic arginine-glycine-aspartic acid peptide Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 239000012039 electrophile Substances 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 230000017188 evasion or tolerance of host immune response Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 125000002485 formyl group Chemical class [H]C(*)=O 0.000 description 1
- 150000002240 furans Chemical class 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- OAKJQQAXSVQMHS-UHFFFAOYSA-N hydrazine group Chemical group NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000008073 immune recognition Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001524 infective effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000005935 nucleophilic addition reaction Methods 0.000 description 1
- 238000010534 nucleophilic substitution reaction Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 230000001699 photocatalysis Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 125000001554 selenocysteine group Chemical group [H][Se]C([H])([H])C(N([H])[H])C(=O)O* 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 150000004905 tetrazines Chemical class 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 230000007502 viral entry Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14121—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14145—Special targeting system for viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
- C12N2750/14152—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Virology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 발명은 부위 및 화학량론에 대해 제어하면서 AAV 캡시드를 화학적으로 변형하기 위한 플랫폼을 개시한다. 3가지 캡시드 단백질 중 임의의 하위 집단으로 부위-지정 천연 및 비천연 아미노산 돌연변이를 도입하는 것을 허용하는 AAV 패키징 시스템이 기술된다. 이들 조작된 잔기는 이후에 부위 및 화학량론에 대해 정확하게 제어하면서 생성된 캡시드를 화학적으로 기능화시키는 데 사용될 수 있다. 이러한 제어된 변형 전략은 AAV 캡시드의 향성, 면역원성 등을 조작하기 위해 AAV 캡시드에 매우 다양한 독립체를 부착하는 데 사용될 수 있다.
Description
정부 지원
본 발명은 미국국립과학재단에서 수여한 보조금 번호 제1817893호에 따른 정부 지원으로 이루어졌다. 미국 정부는 본 발명에 대한 특정 권리를 갖는다.
관련 출원
본 출원은 2020년 5월 1일자로 출원된 미국 특허 가출원 제63/018,573호에 대해 35 U.S.C. § 119(e)에 따른 우선권을 주장하며, 이의 전체가 참조에 의해 본 명세서에 원용된다.
ASCII 텍스트 파일의 자료 참조에 의한 원용
본 출원은 다음의 ASCII 텍스트 파일에 포함된 서열 목록을 참조에 의해 원용한다: 0342_0010WO1_SL.txt; 2021년 5월 3일 생성되었고, 76,879바이트의 크기를 가짐.
발명의 분야
본 발명은 생명공학 분야에 관한 것으로, 바이러스 캡시드의 제어된 화학적 변형을 통해 조작된 AAV-기반 유전자-치료 벡터의 개발에 중점을 두고 있다.
아데노-관련 바이러스(AAV)는 유전자 치료를 위한 가장 유망한 전달 수단 중 하나로 떠올랐다. 이는 자연적으로 복제가 결핍되어 있으며, 단지 낮은 선천성 면역 반응을 나타내고, 분열 세포뿐만 아니라 비-분열 세포를 효율적으로 감염시키며, 생체 내에서 전달된 치료 유전자의 안정적이고 장기적인 발현을 제공한다. 실제로, 최근에 몇몇 AAV-기반 유전자 치료법이 승인되었으며, 다른 많은 치료법이 현재 임상 시험 중이다. 현재 치료할 수 없는 많은 질환의 치유법을 제공하기 위한 AAV-기반 유전자 치료법의 가능성에도 불구하고, 몇 가지 핵심 과제가 있다. 예를 들어, 거의 모든 현재의 접근 방식은 제한적인 선천성 조직-향성(tropism)을 나타내는 AAV의 천연 혈청형에 의지한다. 당연히, 이들 벡터에 의해 효율적으로 감염되는 세포-유형과 관련된 질환들은 이러한 접근 방식에 의해 표적이 될 수 있다. 그러나, 기존의 AAV 벡터에 의해 쉽게 감염되지 않는 조직에서 발생하는 다른 많은 질환들은 현재 치료가 어려운 상태로 남아있다. 기존 AAV 벡터의 조직-향성을 재조작하는 능력은 원하는 위치에 유전적 적재물을 전달할 수 있는 맞춤형 벡터를 만드는 데 매우 유용할 것이며, AAV-기반 유전자 치료의 범위를 크게 확장할 것이다. 또한, 많은 환자들은 기존 AAV 벡터에 대해 면역력을 갖는다. 게다가, 치료적 AAV 벡터의 투여는 강한 적응성 면역 반응을 유도하며, 같은 벡터의 두 번째 투여를 못하게 한다. 이러한 면역 인식을 회피하도록 기존 AAV 벡터를 조작하는 능력은 지속가능한 유전자 치료법의 개발을 위한 핵심이 될 것이다. 보다 치료적으로 바람직한 특성을 갖는 AAV 캡시드를 개발하기 위해 유도 진화가 사용되었다. 그러나, 이러한 접근 방식은 허용가능한 용액을 생산함에 있어서 종종 신뢰할 수 없으며, 결과적으로 생성된 돌연변이 AAV 캡시드는 패키징 결함을 자주 나타낸다.
제어된 방식으로 기존 AAV 캡시드에 활성-조절 독립체를 표시하는 능력은 이들의 특성을 조작하기 위한 매력적인 모듈식 접근 방식을 제공한다. 부 캡시드(minor capsid) 단백질의 N-말단 확장, 캡시드 단백질의 허용 부위에 펩타이드 루프의 삽입 및 캡시드 표면의 라이신과 같은 기존 아미노산의 변경을 포함하여 수많은 방법들이 이러한 목적을 위해 시도되었다. 그러나, N-말단 확장 및 루프 삽입은 종종 복잡한 AAV 캡시드의 조립을 방해한다. AAV 캡시드의 섬세함 때문에, 펩타이드 루프의 삽입은 매우 적은 위치로 제한되며 생성되는 캡시드는 종종 최적이 아닌 패키징을 나타낸다. 이러한 방법들은 활성-조절 모이어티의 배치, 표시될 수 있는 독립체의 구조적 다양성뿐만 아니라 캡시드 표면에 표시되는 표적화 모이어티의 수를 최적화하는 능력을 최적화하는데 있어서 제한된 유연성을 제공한다.
이후 스트레인-촉진 아자이드-알킨 고리 첨가 반응(strain-promoted azide-alkyne cycloaddition: SPAAC)을 통해 사이클로옥틴(cyclooctyne)-변형 cRGDFC에 접합되는, 아지도 기능성을 갖는 UAA를 포함하는 AAV를 생산하여, 바이러스를 특정 유형의 암세포에서 과발현되는 αVβ3 인테그린 수용체에 재표적화하는 것이 가능하였다. 그러나, 앞서 기술한 바와 같이 UAA의 혼입은 AAV의 모든 60개의 캡시드 단백질에 대한 UAA의 혼입으로 제한되었다. 본 명세서에 기술된 바와 같이, AAV 바이러스 입자의 모든 60개의 캡시드 단백질(부 캡시드 단백질 VP1 및 VP2뿐만 아니라 주 캡시드 단백질 VP3 포함)의 과도한 변형은 이의 감염성에 매우 나쁜 영향을 미치는 것으로 나타났다. 캡시드당(야생형 AAV에 비해) 특정한 수의 자연-발생 및/또는 UAA 변형/돌연변이를 혼입/도입하기 위해 변이 캡시드를 생산하기 위한 아미노산 돌연변이의 수를 제어하는 능력은 돌연변이된 아미노산 잔기를 갖는 변이 캡시드 단백질을 포함하는 감염성 유전자-변형 아데노-관련 바이러스의 합성을 가능하게 하는 본 발명의 주요 특징이다. 변이 캡시드 단백질의 이들 돌연변이된 잔기는 부위-특이적 방식으로 AAV에 생물접합 "핸들"을 도입하기 위한 생물학적 및/또는 화학적 독립체(본 명세서에서 "기"(group)로도 표시함)의 부착(예를 들어, 공유 결합)을 허용하여 AAV 기능을 최적으로 조작할 수 있는 정의된 수의 활성-조절기의 혼입/도입을 가능하게 한다.
본 발명은 야생형 AAV의 상응하는 부위에 비해 하나 이상의 캡시드 단백질의 부위 특이적 위치에 변형/돌연변이가 있는 유전자 조작/유전자 변형 아데노-관련 바이러스(AAV) 및 이러한 유전자-변형 바이러스를 제조하는 방법을 포함한다. 중요하게는, 본 명세서에 기술된 바와 같이, 변형은 AAV 입자의 감염성에 영향을 미치지 않으면서, VP1, VP2 또는 VP3와 같은, 단일 캡시드 단백질 또는, VP1 및 VP2 둘 다와 같은, 이들 캡시드 단백질의 배수에서 하나 이상의 특정한 화학-선택적 위치(들)로 제한될 수 있다(즉, 여기서 유전자-변형 AAV의 감염성은 유사한 생물학적 조건 하에서 야생형 AAV의 감염성에 본질적으로 필적하거나 약간 변경됨).
AAV는 비-구조적 Rep 및 AAP 단백질 및, 공통 C 말단을 공유하고 N-말단 확장에 따라 다른, 구조적 Cap 단백질 VP1, VP2 및 VP3를 암호화하는 4.5kb의 단일 가닥 DNA 게놈을 갖는 작은 비-외피성 파보바이러스이다. 표면 단백질로 장식된 지질막을 갖는 외피성 바이러스와는 달리, AAV는 약 1:1:10의 화학량론으로 단백질 VP1, VP2 및 VP3의 60카피 만으로 이루어지는 빽빽하게 패키징된 이십면체 캡시드를 갖는다. AAV는 복제-결핍이며, 완전한 바이러스 생산 및 탈출에는 아데노바이러스와 같은 헬퍼 바이러스의 존재가 필요하다. AAV에는 서로 다른 천연 향성(tropism)을 갖는 여러 다른 혈청형이 있다. 예를 들어, 본 명세서에 기술된 하나의 혈청형은 2형 AAV(AAV2)이며, 이는 황산 헤파란 프로테오글리칸 수용체를 발현하는 세포를 표적으로 한다.
아데노-관련 바이러스는 인간 유전자 치료를 위한 가장 유망한 후보로 떠올랐다. 이 바이러스는 유전자 치료 벡터에 이상적인 낮은 면역원성 및 장기간 유전자 발현과 같은 바람직한 특성을 자랑한다. 그러나, 이 바이러스의 많은 다른 특성은 종종 치료적인 요구와 일치하지 않는다. 예를 들어, 바이러스의 천연 혈청형은 뚜렷한 세포 특이성을 갖는데, 이는 인간 유전자 치료의 표적이 될 수 있는 세포/조직을 제한한다. 부위 및 화학량론에 대한 정확한 제어로 기존 AAV 벡터를 기능화시키는 능력은 세포-특이성 및 면역-회피와 같은 치료적으로 바람직한 특성을 도입하기 위한 매력적인 수단을 제공한다.
AAV의 부 캡시드 단백질에 생물접합 독립체 또는 "핸들"(예를 들어, 천연 아미노산 시스테인 또는 광범위한 생물접합 화학적 성질을 갖는 비천연 아미노산)과 같은 독립체 또는 기(group)와 함께 UAA와 같은 아미노산을 도입하여 AAV를 정확하게, 부위-특이적으로, 유전적으로 조작하는 기술이 본 명세서에 기술되어 있다. 부 캡시드 단백질 VP1 및 VP2는 AAV 캡시드당 각각 5카피로 존재한다. 본 명세서에 기술된 바와 같이, 본 발명의 작제물 및 방법은 3가지 캡시드 단백질 중 임의의 것의 부위-선택적 변형을 가능하게 하지만, 특히 VP1 또는 VP2 또는 VP1 및 VP2 둘 다를 변형시켜 완전히-조립된 AAV 캡시드당 5 또는 10개의 기가 부착되는 것을 가능하게 한다(본 명세서에서 사용된 용어 "완전히-조립된"은 모든 3가지 캡시드 단백질, 즉 부 VP1 및 VP2 캡시드 단백질뿐만 아니라 주 캡시드 단백질 VP3가 통합되어 감염성 바이러스 입자를 형성하는 바이러스 조립을 의미함). 또한 본 방법은 캡시드당 15 또는 20개의 생물접합기의 정확한 부착을 가능하게 하는 생물접합 핸들(bioconjugation handle)(캡시드 단백질 당 최대 2개의 생물접합 핸들)의 혼입을 허용한다.
보다 구체적으로, 본 발명은 부 캡시드 단백질 VP1 및 VP2 중 어느 하나 또는 조합이 부위-특이적으로 화학적으로 변형될 수 있는 AAV 벡터를 생산하는 방법을 포함한다. 3가지 캡시드 단백질이 서로 다른 화학량론으로 존재하기 때문에(캡시드당 VP1, VP2 및 VP3가 각각 5, 5 및 50카피임), 이 방법은 변형 부위 및 수 모두에 대한 정확한 제어를 통해 변형이 캡시드에 도입될 수 있는 동종의 AAV 접합체를 생성하고 바이러스의 생물학적 활성, 특히 표적화된 세포 감염성을 유지하는 능력을 제공한다.
본 명세서에 기술된 바와 같이, 넌센스 코돈을 억제하는 조작된 아미노아실-tRNA 합성효소(aaRS)/tRNA 쌍을 사용하면, 천연 및 비천연 아미노산(UAA)을 캡시드 단백질에 부위-특이적으로 혼입하는 것이 가능하다. 이들의 작은 크기로 인해, UAA는 AAV 캡시드의 많은 위치에 잘-허용된다.
유전자-변형 아데노-관련 바이러스(AAV)로서, AAV 캡시드가 적어도 하나의 변이 부 캡시드 단백질(variant minor capsid protein) VP1, VP2 또는 VP1 및 VP2 둘 다를 포함하고, 변이 부 캡시드 단백질이 야생형 AVV VP1 또는 VP2 캡시드 단백질에 비해 야생형 AAV에 존재하지 않는 천연 아미노산 또는 비천연 아미노산(UAA)이 혼입되도록 하나 이상의 아미노산 잔기 부위에서 돌연변이된, 유전자-변형 아데노-관련 바이러스가 본 발명에 포함된다. 중요하게는, 본 명세서에 기술된 바와 같은 유전자-변형 AAV는 유사한 조건 하에서 야생형 AAV에 비교하여 그들의 감염성을 유지한다.
특히, 본 발명은 변이 부 캡시드 단백질을 포함하는 유전자-변형 아데노-관련 바이러스(AAV)로서, 캡시드 암호화 서열(서열번호 1)이 VP1, VP2 또는 VP1 및 VP2 둘 다의 번역이 방해되도록 AAV VP1 또는 VP2 또는 VP3 캡시드 단백질 열린 해독 틀(ORF)의 번역 기원에서 돌연변이되어, VP1, VP2, VP3 또는 VP1 및 VP2 둘 다가 결실된 AAV 캡시드 단백질을 초래하는, 유전자-변형 아데노-관련 바이러스를 포함한다. 이후 결실/누락된 캡시드 단백질은 결실된 부 캡시드 단백질(들)을 암호화하는 제2의 캡시드 암호화 서열로부터 인트랜스(in trans)로 제공(즉, 발현)되어 하나 이상의 변이 캡시드 단백질을 갖는 유전자-변형 AAV를 초래한다. 또한 본 명세서에서 VP2는 서열번호 2로 표시되며 VP3은 서열번호 3으로 표시된다.
유전자-변형 AAV 캡시드 단백질은 서열번호 1 또는 서열번호 1의 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 90% 내지 99%의 서열 동일성을 포함하는 서열을 포함한다. 변이 캡시드 단백질은 VP1, VP2 또는 VP1 및 VP2 둘 다를 결실시키기 위해 특정 부위에서 돌연변이된다(예를 들어, 도 2에 나타난 바와 같음). 예를 들어, 서열번호 1의 T454 위치에서 본 명세서에 설명된 기술을 통해 종결 코돈이 삽입될 수 있다. 이러한 기술은 예를 들어 PCT/US2020/055834, PCT/US2020/038766 또는 PCT/US2020/029567에 기술되어 있으며, 이들의 교시는 그 전체가 참조에 의해 본 명세서에 원용된다. 보다 구체적으로, 변이 캡시드 단백질에 혼입되는 종결 코돈은 TAG, TAA 또는 TGA 억제인자 종결 코돈일 수 있다.
구체적으로 부 캡시드 단백질 CMV-VP1-delVP23(도 20, 서열번호 7); CMV-VP2-delVP3(도 21, 서열번호 9) 및 CMV-VP1-VP2-delVP3(도 22, 서열번호 10)가 본 발명에 포함된다. 본 명세서에 기술된 바와 같이, CMV 프로모터 서열이 예시되지만 임의의 적합한 프로모터 서열이 포함될 수 있다. 또한, 부 캡시드 단백질은 본 명세서에 기술된 바와 같은 자연-발생 또는 비천연 아미노산을 포함할 수 있다.
본 발명의 유전자-변형 AAV의 주요 이점이 부 캡시드 단백질에 혼입되는 UAA가 낮은 수준이어서, 이들의 생산 효율이 UAA의 혼입에 의해 손상되지(유의적으로 영향을 받지) 않는다는 것임을 주목하는 것이 중요하다. 따라서, AVV는 야생형 바이러스와 실질적으로 유사하게 감염성 역가로 패키징/조립된다.
본 발명의 유전자-변형 AAV의 변이 캡시드 단백질은 VP1, VP2 또는 VP1 및 VP2 둘 다의 하나 이상의 돌연변이된 아미노산 잔기를 포함할 수 있고, 여기서 돌연변이된 아미노산 잔기 부위는 비천연 아미노산(UAA)을 포함할 수 있다. 본 발명에서 사용하기에 적합한 UAA의 예시를 도 1에 나타내었으며, 이는 탄소 사슬 연장의 길이 및 치환을 포함하는 화학식 1 내지 12를 보여준다(상단 첫 번째 줄 좌에서 우로 화학식 1 내지 6, 두 번째 줄 좌에서 우로 화학식 7 내지 12). 보다 구체적으로, 본 발명에서 사용하기에 적합한 비천연 아미노산은 페닐알라닌 유사체, 티로실 유사체, 트립토파닐 유사체 또는 라이실 유사체로 이루어진 군에서 선택될 수 있다. 특히 유사체는 p-벤조일페닐알라닌(pBpA); O-메틸티로신(OMeY); 5-아지도트립토판; 5-프로파길옥시트립토판; 5-아미노트립토판; 5-메톡시트립토판; 5-O-알릴트립토판; 5-브로모트립토판; 아지도-라이신(AzK) 또는 Nε-아세틸라이신(AcK); C5Az; LCA; Nε-아세틸라이신(AcK); 사이클로프로펜 아미노산, N ε -(1-메틸사이클로프로프-2-에네카복사미도)-라이신(CpK); 5-하이드록시-트립토판(5-HTP); LCAlk; DiaazK 및 LCKet로 이루어진 군에서 선택된다.
대안적으로, 유전자-변형 AAV의 변이 부 캡시드 단백질의 돌연변이는 시스테인 또는 셀레노시스테인과 같은 천연 아미노산 잔기일 수 있다. 구체적으로, 천연 아미노산 잔기는 야생형 AAV의 같은 위치에 배치된 아미노산 잔기와 다르다.
본 발명의 유전자-변형 AAV는 생물접합 핸들을 더 포함할 수 있다. 이러한 생물접합 핸들은 부위-특이적 방식으로 변이 부 캡시드 단백질의 돌연변이된 천연 또는 비천연 아미노산 잔기에 공유 결합으로 부착될 수 있다. 본 명세서에 기술된 바와 같이, 5 내지 10개의 생물접합 핸들이 부 캡시드 단백질에 특이적으로 혼입되어, 완전히-조립된 AAV 캡시드당 5 내지 10개의 생물접합 핸들을 갖는 유전자-변형 AAV가 생성될 수 있다. 다시, 적어도 하나의 변이 부 캡시드 단백질 VP1, VP2 또는 VP1 및 VP2 둘 다를 포함하는 유전자-변형 AAV는 세포 배양 조건과 같은 유사한 조건 하에서 야생형 AAV에 필적하는 표적 세포의 감염성을 유지한다. 예를 들어, 돌연변이된 아미노산은 화학적 또는 생물학적 독립체(예를 들어, 생물학적 독립체는 단백질, 펩타이드, 핵산, 지질 또는 탄수화물을 포함할 수 있음)와 접합될 수 있다.
구체적으로 변이 캡시드 단백질을 포함하는 캡시드를 포함하는 유전자-변형 감염성 AAV가 본 발명에 포함된다. 예를 들어, 변이 캡시드 단백질은 서열번호 1 또는 서열번호 1과 적어도 약 80%의 서열 동일성을 갖는 서열을 포함할 수 있고, 여기서 서열은 VP1, VP2 또는 VP1 및 VP2 둘 다가 결실되도록 돌연변이된다. 유전자-변형 AAV 캡시드의 돌연변이는 예를 들어 263, 454, 456, 587 및/또는 588번 위치(들)에서 이루어질 수 있고, 여기서 돌연변이 위치는 야생형 VP1 서열에 상대적이다. VP1 서열 또한 263, 454, 456 및 588번 위치에서 돌연변이될 수 있지만 587번 위치에서는 그렇지 않다. 대안적으로, VP1 서열은 263, 454, 456번 위치에서 돌연변이될 수 있지만 585 또는 588번 위치에서는 그렇지 않다. 본 발명의 감염성 유전자-변형 AAV의 특성은 유사한 조건 하에서 야생형 AAV의 감염성에 실질적으로 필적하는 감염성, 유사한 조건 하에서 야생형 AAV에 실질적으로 필적하는 역가를 갖는 AAV의 패키징 또는 야생형 AAV에 필적하는 감염성 및 패키징 모두이다.
본 발명의 일 실시형태에서 변형 AAV의 돌연변이된 아미노산 잔기(들)는 화학적 또는 단백질 독립체(본 명세서에서 생물접합 핸들 또는 기로도 지칭됨)로 기능화되거나 이와 접합된다. 본 명세서에 기술된 바와 같이, 화학적 또는 단백질 독립체는 탐침, 소분자 리간드, 펩타이드, 고리형 펩타이드, 뉴클레오타이드, 중합체, 단백질 또는 바이러스 접합체로 이루어진 군에서 선택된다. 특정 실시형태에서, 유전자-변형 감염성 AAV는 화학적 또는 단백질 독립체를 포함하고, 여기서 독립체는 고리형 펩타이드 cRGD 폴리에틸렌 글리콜(PEG)이다.
본 발명의 다른 실시형태에서, 변이 VP1 또는 VP2의 돌연변이된 아미노산 잔기 부위는 자연-발생 아미노산을 포함한다. 특히, 자연-발생 아미노산은 시스테인 또는 셀레노시스테인이다.
변이 캡시드 단백질(들)을 포함하는 본 발명의 유전자-변형 감염성 AAV(예를 들어, cRGD 펩타이드로 기능화된 돌연변이 캡시드 단백질을 포함하는 유전자-변형 AAV)는 비-동족 표적화 세포에 결합하거나, 이를 인식하거나, 이와 상호작용하도록 그의 본래의 동족 세포 수용체에 결합하거나, 이를 인식하거나, 이와 상호작용하는 것으로부터 "재-표적화"될 수 있다. 본 명세서에 기술된 바와 같이 캡시드당 부착된 임의의 수의 재표적화기는 생성되는 AAV 접합체의 특성에 극적으로 영향을 미친다. 이는 화학적 변형으로 AAV 벡터의 특성을 변화시키는데 있어서 부위 및 화학량론을 제어하는 것의 중요성을 강조한다. 본 명세서에 기술된 바와 같이, 이제 부위 및 화학량론(캡시드당 얼마나 많은 변형이 도입되는지) 모두에 대한 전례없는 제어를 통해 AAV 캡시드를 정확하고 선택적으로 화학적 변형하는 것이 가능하다. 이러한 제어는 보다 치료적으로 바람직한 특성을 갖는 조작된 AAV 벡터를 개발하는데 있어서 매우 중요할 것이다.
또한 감염성 유전자-변형 AAV를 생산/제조하는 방법으로서, 여기서 AAV는 변이 AAV 캡시드 단백질을 포함하고, 여기서 VP1, VP2 또는 VP1 및 VP2 둘 다는 야생형 VP1, VP2 또는 VP1 및 VP2 둘 다에 비해 하나 이상의 돌연변이된 아미노산 잔기 부위를 포함하는, 감염성 유전자-변형 AAV를 생산/제조하는 방법이 본 발명에 포함된다. 일반적으로, 방법은 배양에 수용성 숙주 세포(competent host cell)를 제공하는 단계, 배양된 세포를 하나 이상의 플라스미드로 형질주입하는 단계로서, 상기 플라스미드는 1) VP1 또는 VP2 또는 VP1 및 VP2 둘 다를 발현하지 않는 AAV 변이 VP3; 2) VP3를 발현하지 않는 적합한 프로모터를 갖는 변이 VP1, VP2 또는 VP1 및 VP2 둘 다; 3) AAV 발현에 필요한 추가 인자; 4) 필요한 비천연 아미노산을 제공하는 단계 및 5) 종결 코돈에 대해 비천연 아미노산을 선택적으로 충전하는 조작된 아미노아실-tRNA 합성효소/tRNA 쌍을 암호화하는 플라스미드를 제공하는 단계를 포함한다. 세포 및 플라스미드가 플라스미드 유전자의 발현 및 AAV의 조립에 충분한 조건 하에서 배양되어, 변이 캡시드 단백질을 포함하는 감염성 유전자-변형 AAV가 생산되며, 여기서 VP1, VP2 또는 VP1 및 VP2 둘 다는 야생형 AAV에 비해 하나 이상의 아미노산 잔기에서 돌연변이된다.
보다 구체적으로, 방법은 배양에 수용성 숙주 세포를 제공하는 단계; 및 배양된 세포를 유전자-변형 감염성 AAV의 조립 및 발현을 위해 필요한 서열을 포함하는 플라스미드/작제물로 공동-형질주입하는 단계를 포함한다. 하나의 mRNA는 다른 시작 코돈 부위를 갖는 VP1, VP2 또는 VP3를 암호화한다(도 2 참조). 시작 부위가 돌연변이되면 VP1, VP2 또는 VP3의 발현이 각 캡시드 단백질에 대한 개별 mRNA 발현에 의해 제어될 수 있고, 캡시드 단백질은 선택적으로 돌연변이될 수 있지만 돌연변이된 부 캡시드 단백질 VP1 및/또는 VP2 및 야생형은 조립되어 결과적으로 감염성 유전자-변형 AAV가 생성될 수 있다.
예를 들어, 본 명세서에 기술된 바와 같이, 비천연 아미노산은 수용성 숙주 세포를 비천연 아미노산을 충전하는 조작된 tRNA 합성효소 및 tRNA 쌍을 암호화하는 플라스미드로 공동-형질주입하는 것을 통해 VP1 및/또는 VP2에 부위-특이적으로 혼입될 수 있다. 보다 구체적으로, 변이 VP1, VP2, VP3 또는 VP1 및 VP2 둘 다의 돌연변이 부위에 반응하여 비천연 아미노산(UAA)을 상호-번역적으로 혼입시키기 위한 조작된 아미노-아실 RNA 합성효소(aaRS) 및 이에 상응하는 tRNA를 포함하는 직교(orthogonal) tRNA/aaRS 쌍이 제공되며, 돌연변이 부위에 혼입될 필요한 비천연 아미노산이 제공된다.
또한 돌연변이된 VP1 및/또는 VP2 및 야생형 VP3 전사체를 암호화하는 플라스미드와 함께 세포 배양에서 AAV 캡시드 발현 및 완전한 캡시드(즉, VP1, VP2 및 VP3를 포함)의 조립에 필요한 부가 요소를 암호화하는 플라스미드(들)이 제공된다(공동-배양된다). 세포, 플라스미드 및 UAA를 플라스미드 유전자의 발현 및 AAV의 조립에 충분한 조건 하에서 배양/유지하면, 변이 AAV 캡시드 단백질을 포함하는 감염성 유전자-변형 AAV가 생산되며, 여기서 VP1, VP2 또는 VP1 및 VP2 둘 다가 야생형 AAV에 비해 하나 이상의 아미노산 잔기 부위에서 돌연변이된다.
조작된 아미노아실-tRNA-합성효소-tRNA 쌍은 대장균(E. coli)의 류실 쌍, 대장균의 트립토파닐 쌍, 대장균의 티로실 쌍 또는 고세균-유래 피롤리실 쌍에서 유래될 수 있다.
감염성 유전자-변형 AAV를 세포 배양물에서 회수/수확할 수 있으며 본 명세서에 기술된 바와 같은 그리고 이 분야의 기술자에게 알려진 기술을 사용하여 생물학적 활성에 대해 평가할 수 있다.
감염성 유전자-변형 AAV의 돌연변이된 아미노산 잔기 부위는 도 1의 화학식 1 내지 12에 나타난 바와 같은 비천연 아미노산(UAA) 유사체를 포함할 수 있다. 보다 구체적으로, 비천연 아미노산은 페닐알라닌 유사체; 티로실 유사체; 트립토파닐 유사체; 또는 라이실 유사체로 이루어진 군에서 선택된다. 유사체는 p-벤조일페닐알라닌(pBpA); O-메틸티로신(OMeY); 5-아지도트립토판; 5-프로파길옥시트립토판; 5-아미노트립토판; 5-메톡시트립토판; 5-O-알릴트립토판; 5-브로모트립토판; 아지도-라이신(AzK) 또는 Nε-아세틸라이신(AcK); C5Az; LCA; Nε-아세틸라이신(AcK); 사이클로프로펜 아미노산, N ε -(1-메틸사이클로프로프-2-에네카복사미도)-라이신(CpK); 5-하이드록시-트립토판(5-HTP); LCAlk; DiaazK 및 LCKet로 이루어진 군에서 선택된다.
대안적으로, 변이 캡시드 단백질의 돌연변이된 아미노산 잔기 부위는 자연-발생 아미노산을 포함하고, 이 자연-발생 아미노산은 시스테인 또는 셀레노시스테인이다.
변이 캡시드 단백질의 돌연변이된 아미노산은 화학적 또는 단백질 독립체로 기능화될 수 있으며, 여기서 독립체는 탐침, 소분자 리간드, 펩타이드, 고리형 펩타이드, 뉴클레오타이드, 중합체, 단백질 또는 바이러스 접합체로 이루어진 군에서 선택된다. 일 실시형태에서 감염성 유전자-변형 AAV의 변이 캡시드 단백질의 돌연변이된 아미노산을 기능화시키는 독립체는 고리형 펩타이드 cRGD이다.
감염성 유전자-변형 AAV는 서열번호 1 또는 서열번호 1과 적어도 약 80%의 서열 동일성을 갖는 서열을 포함하는 돌연변이된 VP1 아미노산 서열을 포함할 수 있으며, 여기서 변이 VP1 캡시드 단백질은 야생형 VP1 서열에 비해 VP1 서열의 263, 454, 456, 587 및/또는 588번에 위치한 하나 이상의 위치(들)에서 돌연변이된다. VP1 서열은 또한 263, 454, 456 및 588번 위치에서 돌연변이되지만 587번 위치에서는 그렇지 않을 수 있다. 대안적으로, VP1 서열은 263, 454, 456번 위치에서 돌연변이되지만 585 또는 588번 위치에서는 그렇지 않을 수 있다.
감염성 유전자-변형 AAV는 서열번호 2 또는 서열번호 2와 적어도 약 80%, 85%, 90%, 95% 또는 99%의 서열 동일성을 갖는 서열을 포함하는 돌연변이된 VP2 아미노산 서열을 포함할 수 있다.
감염성 유전자-변형 AAV는 서열번호 3 또는 서열번호 3과 적어도 약 80%, 84%, 90%, 95% 또는 99%의 서열 동일성을 갖는 서열을 포함하는 VP3 아미노산 서열을 포함할 수 있다.
또한 본 발명은 본 명세서에 기술된 바와 같은 유전자-변형 AAV를 포함하고 유전자 치료 또는 예방접종(예를 들어, 대상체의 면역 반응을 유도하는 것)에 적합한 하나 이상의 치료적 또는 항원성 유전자 작제물을 더 포함하는 치료적 또는 항원성 조성물을 포함한다. 조성물이 항원을 포함하는 백신 조성물인 경우, 조성물은 아쥬반트를 더 포함할 수 있다.
대상체에서 질환 또는 상태를 치료하는 방법 또한 본 명세서에 포함된다. 예를 들어, 치료 방법은 대상체에게 치료적 조성물을 투여하는 단계를 포함할 수 있고, 여기서 조성물은 본 명세서에 기술된 바와 같은 AAV 벡터 및 대상체에서 질환 또는 상태를 감소시키거나 완화시킬 수 있는 치료량으로 단백질 또는 펩타이드를 암호화하는 유전자 작제물을 포함한다. 치료적 조성물에 본 발명의 유전자-변형 AAV 벡터를 사용하는 것은 특히 암 또는 겸상 적혈구 빈혈증(sickle-cell anemia)의 낭포성 섬유증(cystic fibrosis)과 같은 질환을 치료하는 데 유용할 수 있으며, 여기서 목표한 방식으로 기능 단백질을 암호화하는 대체 유전자를 제공하는 것은 암 또는 질환 증상을 감소시키거나 완전하게 완화시킬 것이다.
다른 예시는 대상체에서 면역 반응을 유도하는 방법으로서, 대상체에게 항원성/백신 조성물을 투여하는 단계를 포함하며, 여기서 항원성 조성물은 본 발명의 유전자-변형 AAV 벡터 및 대상체에서 면역 반응을 유도할 수 있는 항원성 단백질 또는 펩타이드를 암호화하는 유전자 작제물을 포함한다. 이러한 본 발명의 AAV 벡터를 사용하는 방법은 면역 반응을 개시할 수 있는 면역 세포를 특이적으로 표적화할 것이다.
또한 본 발명의 유전자-변형 AAV를 포함하는 키트가 본 명세서에 포함된다. 이러한 키트는 본 명세서에 기술된 바와 같은 유전자-변형 AAV를 함유하는 적합한 바이알, 예를 들어 멸균 희석제 중의 AAV 바이알뿐만 아니라 보충 성분, 예를 들어 세포 배양에서 AAV를 증식시키기 위한 보충 성분의 바이알/용기를 포함할 수 있다. 또한 설명용 팜플렛이 키트에 포함될 수 있다.
이제 구성 및 부분 조합의 다양한 신규 세부사항을 포함하는 본 발명의 상기 및 다른 특징과 다른 이점이 첨부된 도면을 참조로 보다 구체적으로 기술되고 청구범위에 언급될 것이다. 본 발명을 구현하는 특정 방법 및 장치를 본 발명을 제한하는 것이 아닌 예시의 방식으로 나타낸다. 본 발명의 원리 및 특징은 본 발명의 범위를 벗어나지 않고 다양하고 수많은 실시형태에서 적용될 수 있다.
첨부된 도면에서, 참조 부호는 서로 다른 도면 전체에 걸쳐 같은 부분을 의미한다. 도면은 축적에 맞춰진 것은 아니다; 대신 본 발명의 원리를 설명하는데 중점을 두었다. 특허 또는 출원 파일은 컬러로 제작된 적어도 하나의 도면을 포함한다. 컬러 도면(들)이 포함된 본 특허 또는 특허 출원 공개의 사본이 요청 및 필요한 수수료의 지불 시 관청에 의해 제공될 것이다. 도면들 중:
도 1은 제어된 화학량론으로 AAV의 캡시드에 혼입될 수 있는 천연 및 비천연 아미노산의 구조의 예시를 보여준다. 구체적으로 화학식 1 내지 12(상단 첫 번째 줄 좌에서 우로 화학식 1 내지 6, 두 번째 줄 좌에서 우로 화학식 7 내지 12, 탄소 사슬 연장의 길이 및 치환을 포함함)를 포함하는 UAA 유사체를 보여준다.
도 2는 VP1 또는 VP2 또는 VP1 및 VP2에 선택적으로 돌연변이(천연 또는 비천연 아미노산)를 도입하기 위한 계획을 보여준다. 3가지 캡시드 단백질이 대체 스플라이싱(alternative splicing) 및 시작 코돈 사용을 통해 같은 열린 해독 틀 Cap에서 발현된다. 돌연변이는 이 ORF에서 VP1, VP2 또는 VP3의 발현을 막도록 번역 기원(적색 십자 표시로 표시함)에서 조작되었다. 누락된 부 캡시드 단백질(들)은 이후 CMV와 같은 강력한 프로모터로 인트랜스로 공급될 수 있다. 나머지 캡시드 단백질로부터 VP1, VP2 또는 VP1+VP2의 발현을 분리하면 다른 캡시드 단백질에 대한 영향없이 이들을 선택적으로 돌연변이시키는 것이 가능하다.
도 3은 도 2에 기술된 작제물을 사용한 HEK293T 세포에서의 AAV2 패키징을 보여준다. 변이 캡시드 단백질을 갖는 AAV는 본래의 시스템에 필적하는 수율을 갖는다.
도 4는 HEK293T 세포에서 EGFP 리포터 유전자를 전달하고 발현하는 능력으로 측정된 일정한 역가에서 도 3에서 생산된 패키징된 역가 바이러스의 감염성을 보여준다.
도 5는 AAV 캡시드에서 개별 부 캡시드 단백질의 선택적 비천연 아미노산 돌연변이 유발 및 이를 형광단을 화학적으로 부착하는 데 사용하는 것을 보여준다.
도 6은 AAV 캡시드에 부착된 재표적화 리간드의 수가 이의 재표적화 효율에 극적으로 영향을 미친다는 것을 보여준다.
도 7a 내지 도 7c는 조작된 시스테인 잔기에서 AAV의 정확한 표지를 보여준다.
도 8a 내지 도 8c는 AAV 동형(isoform) VP1에 대한 아미노산 서열(서열번호 1)을 보여준다. 도 8b 및 도 8c는 각각 서열번호 2 및 서열번호 3을 나타낸다.
도 9는 AAV 캡시드 단백질 동형 VP2의 아미노산 서열(서열번호 2)을 보여준다.
도 10은 AAV 캡시드 단백질 동형 VP3의 아미노산 서열(서열번호 3)을 보여준다.
도 11a 내지 도 11c는 VP1 또는 VP2 또는 VP1+VP2으로의 UAA C5Az의 선택적 혼입을 보여준다.
도 12a 내지 도 12c는 VP1에 혼입된 LCA의 결과를 보여준다.
도 13a 내지 도 13c는 VP1으로의 CpK의 혼입 결과를 보여준다.
도 14a 내지 도 14c는 VP1으로의 5HTP의 혼입 결과를 보여준다.
도 15a 내지 도 15b는 VP1으로의 몇몇 다른 비천연 아미노산 LCAlk, DiazK 및 LCKet의 혼입을 보여준다.
도 16a 및 도 16b는 AAV VP1 454번 위치의 선택적 페길화(PEGylation)의 결과를 보여준다.
도 17은 RC2-VP1-del을 암호화하는 핵산 서열(서열번호 4)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 18은 RC2-VP2-del을 암호화하는 핵산 서열(서열번호 5)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 19는 RC2-VP12-del을 암호화하는 핵산 서열(서열번호 6)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 20은 CMV-VP1-delVP23을 암호화하는 핵산 서열(서열번호 7)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 21은 CMV-VP2-delVP3을 암호화하는 핵산 서열(서열번호 8)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 22는 CMV-VP1-VP2-delVP3을 암호화하는 핵산 서열(서열번호 9)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 23a는 pIDTsmart-ITR-GFP-4xEcLtR-LeuRS의 플라스미드 지도이다. 도 23b는 플라스미드의 핵산 서열(서열번호 10)을 보여준다.
도 24a는 pIDTsmart-TrpRS-8xWtR-ITR-GFP의 플라스미드 지도를 보여준다. 도 24b는 플라스미드의 핵산 서열(서열번호 11)을 보여준다.
도 1은 제어된 화학량론으로 AAV의 캡시드에 혼입될 수 있는 천연 및 비천연 아미노산의 구조의 예시를 보여준다. 구체적으로 화학식 1 내지 12(상단 첫 번째 줄 좌에서 우로 화학식 1 내지 6, 두 번째 줄 좌에서 우로 화학식 7 내지 12, 탄소 사슬 연장의 길이 및 치환을 포함함)를 포함하는 UAA 유사체를 보여준다.
도 2는 VP1 또는 VP2 또는 VP1 및 VP2에 선택적으로 돌연변이(천연 또는 비천연 아미노산)를 도입하기 위한 계획을 보여준다. 3가지 캡시드 단백질이 대체 스플라이싱(alternative splicing) 및 시작 코돈 사용을 통해 같은 열린 해독 틀 Cap에서 발현된다. 돌연변이는 이 ORF에서 VP1, VP2 또는 VP3의 발현을 막도록 번역 기원(적색 십자 표시로 표시함)에서 조작되었다. 누락된 부 캡시드 단백질(들)은 이후 CMV와 같은 강력한 프로모터로 인트랜스로 공급될 수 있다. 나머지 캡시드 단백질로부터 VP1, VP2 또는 VP1+VP2의 발현을 분리하면 다른 캡시드 단백질에 대한 영향없이 이들을 선택적으로 돌연변이시키는 것이 가능하다.
도 3은 도 2에 기술된 작제물을 사용한 HEK293T 세포에서의 AAV2 패키징을 보여준다. 변이 캡시드 단백질을 갖는 AAV는 본래의 시스템에 필적하는 수율을 갖는다.
도 4는 HEK293T 세포에서 EGFP 리포터 유전자를 전달하고 발현하는 능력으로 측정된 일정한 역가에서 도 3에서 생산된 패키징된 역가 바이러스의 감염성을 보여준다.
도 5는 AAV 캡시드에서 개별 부 캡시드 단백질의 선택적 비천연 아미노산 돌연변이 유발 및 이를 형광단을 화학적으로 부착하는 데 사용하는 것을 보여준다.
도 6은 AAV 캡시드에 부착된 재표적화 리간드의 수가 이의 재표적화 효율에 극적으로 영향을 미친다는 것을 보여준다.
도 7a 내지 도 7c는 조작된 시스테인 잔기에서 AAV의 정확한 표지를 보여준다.
도 8a 내지 도 8c는 AAV 동형(isoform) VP1에 대한 아미노산 서열(서열번호 1)을 보여준다. 도 8b 및 도 8c는 각각 서열번호 2 및 서열번호 3을 나타낸다.
도 9는 AAV 캡시드 단백질 동형 VP2의 아미노산 서열(서열번호 2)을 보여준다.
도 10은 AAV 캡시드 단백질 동형 VP3의 아미노산 서열(서열번호 3)을 보여준다.
도 11a 내지 도 11c는 VP1 또는 VP2 또는 VP1+VP2으로의 UAA C5Az의 선택적 혼입을 보여준다.
도 12a 내지 도 12c는 VP1에 혼입된 LCA의 결과를 보여준다.
도 13a 내지 도 13c는 VP1으로의 CpK의 혼입 결과를 보여준다.
도 14a 내지 도 14c는 VP1으로의 5HTP의 혼입 결과를 보여준다.
도 15a 내지 도 15b는 VP1으로의 몇몇 다른 비천연 아미노산 LCAlk, DiazK 및 LCKet의 혼입을 보여준다.
도 16a 및 도 16b는 AAV VP1 454번 위치의 선택적 페길화(PEGylation)의 결과를 보여준다.
도 17은 RC2-VP1-del을 암호화하는 핵산 서열(서열번호 4)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 18은 RC2-VP2-del을 암호화하는 핵산 서열(서열번호 5)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 19는 RC2-VP12-del을 암호화하는 핵산 서열(서열번호 6)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 20은 CMV-VP1-delVP23을 암호화하는 핵산 서열(서열번호 7)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 21은 CMV-VP2-delVP3을 암호화하는 핵산 서열(서열번호 8)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 22는 CMV-VP1-VP2-delVP3을 암호화하는 핵산 서열(서열번호 9)을 보여준다. 돌연변이 위치는 적색으로 나타낸다.
도 23a는 pIDTsmart-ITR-GFP-4xEcLtR-LeuRS의 플라스미드 지도이다. 도 23b는 플라스미드의 핵산 서열(서열번호 10)을 보여준다.
도 24a는 pIDTsmart-TrpRS-8xWtR-ITR-GFP의 플라스미드 지도를 보여준다. 도 24b는 플라스미드의 핵산 서열(서열번호 11)을 보여준다.
이제 본 발명은 본 발명의 예시적인 실시형태를 보여주는 첨부된 도면을 참조하여 다음에서 보다 완전하게 기술될 것이다. 그러나 본 발명은 많은 다른 형태로 구현될 수 있으며 여기서 제시하는 실시형태로 제한하는 것으로 이해되어서는 안 된다; 오히려, 이들 실시형태는 본 개시내용을 충실하고 완전하게 하기 위해, 그리고 이 분야의 기술자에게 본 발명의 범위를 완전하게 전달하기 위해 제공된다.
본 명세서에서 사용된 용어 "및/또는"은 관련되어 나열된 하나 이상의 항목의 임의의 및 모든 조합을 포함한다. 또한, 단수 형태는, 달리 명시적으로 언급되지 않은 한, 복수의 형태도 포함하도록 의도된다. 본 명세서에서 사용된 경우, 용어 포함은 언급된 특징, 정수, 단계, 실행, 요소 및/또는 구성요소의 존재를 명시하지만, 하나 이상의 다른 특징, 정수, 단계, 실행, 요소, 구성요소 및/또는 이들의 군의 존재 또는 추가를 배제하지 않음이 이해될 것이다. 또한, 구성요소 또는 하위시스템을 포함하는, 요소가 다른 요소에 연결되거나 결합되는 것으로 언급되고/언급되거나 보여질 경우, 이는 다른 요소에 직접적으로 연결되거나 결합될 수 있거나 사이의 요소가 존재할 수 있음이 이해될 것이다.
"제1" 및 "제2"와 같은 용어가 다양한 요소를 설명하기 위해 본 명세서에 사용되지만, 이러한 요소가 이들 용어에 의해 제한되어서는 안된다는 것이 이해될 것이다. 이들 용어는 단지 하나의 요소를 다른 요소로부터 구별하기 위해 사용된다. 따라서, 아래에서 논의되는 요소는 제2의 요소로 명명될 수 있고, 유사하게, 제2의 요소는 본 발명의 교시에서 벗어남 없이 제1의 요소로 명명될 수 있다.
달리 정의되지 않은 한, 본 명세서에서 사용된 모든 용어(기술적 및 과학적 용어 포함)는 본 발명이 속하는 분야의 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 같은 의미를 갖는다. 또한 일반적으로 사용되는 사전에 정의된 것과 같은 용어는 관련 기술의 맥락에서 이들이 의미하는 것과 동일한 의미를 갖는 것으로 이해되어야 하며 본 명세서에 명시적으로 정의되지 않은 한 이상화되거나 지나치게 형식적인 의미로 이해되지 않을 것이다.
본 발명의 설명은 이들 특정 방법론, 조성물, 세포주/생물학적 시스템 또는 임의의 다른 표준 프로토콜에 제한되지 않는다는 점을 유의해야 한다. 본 발명은 변형의 부위 및 화학량론에 대한 제어와 함께 화학-선택적 반응을 사용하여 화학적으로 기능화될 수 있는 AAV 벡터를 생산하기 위한 일반적인 플랫폼을 개시하며, 바이러스 패키징을 위해 사용되는 세포 유형, 조작된 아미노아실-tRNA 합성효소(aaRS) 또는 tRNA의 정체 또는 UAA 또는 천연 아미노산, 변형을 도입하기 위해 사용되는 화학 반응 등은 이 분야 및 이 작업 발전의 기술에 따라 달라질 수 있다.
이전에, AAV 캡시드에 UAA를 혼입한 것은 60개의 캡시드 단백질 모두에 대한 것이었다. 3가지의 겹치는 캡시드 단백질이 대체 스플라이싱 및 시작 코돈 사용을 통해 같은 열린 해독 틀(ORF) Cap에서 발현되기 때문에, 이들 단백질의 하위세트를 선택적으로 변형하는 것은 불가능하였다. 그러나, 60개의 캡시드 단백질 모두의 후속 화학적 변형은 바이러스의 감염성을 교란한다(예를 들어, 도 6의 청색 그래프). 이러한 교란의 메커니즘에 대한 이해가 부족하지만, 바이러스의 복잡한 진입 경로와 관련된 분자적 절차가 캡시드의 과도한 변형에 의해 영향을 받을 수 있다고 믿는 것이 합리적이다. 또한, 정의된 수의 화학적 변형이 부위-특이적 방식으로 도입될 수 있는 AAV 벡터를 생성할 수 있는 것이 바람직하다. 실제로, 재표적화 실험은 효율적인 재표적화에 필요한 캡시드당 최적의 리간드 수가 있음을 보여준다(도 6). 변형 시약의 농도 또는 반응 시간을 제어하여 60개의 UAA-핸들로 AAV 캡시드의 변형 정도를 제어하는 것이 가능하다(도 6). 그러나, 이것은 다른 변형 상태에서 캡시드의 불균질한 혼합물을 유발한다. 캡시드당 정의된 수의 변형이 도입된 균질한 AAV 접합체를 생성하는 능력은 유전자 치료에 중요하다.
3가지 캡시드 단백질 VP1, VP2 및 VP3는 AAV 캡시드에 약 1:1:10의 화학량론으로 혼입된다. 결과적으로, 바이러스 입자 당 총 60카피의 캡시드 단백질에 대해 두 가지 부 캡시드 단백질 VP1 및 VP2 각각의 약 5카피가 10카피의 VP3와 함께 캡시드에 존재한다. 조작된 변형가능한 천연 또는 비천연 아미노산 잔기를 이러한 부 캡시드 단백질에 선택적으로 도입하는 능력은 캡시드당 제어된 수의 핸들을 도입하는 방안을 제공한다. 그러나, AAV 캡시드 유전자는 모두 같은 ORF에 암호화되고 대체 스플라이싱 및 시작 코돈 사용에 의해 발현되기 때문에, 다른 것에 영향을 주지 않으면서 하나의 캡시드 단백질을 돌연변이시키는 것은 어렵다. 본 발명은 VP1 및/또는 VP2가 천연 Cap ORF에서 발현되지 않도록 이들의 번역 기원에 돌연변이를 도입하여 부 캡시드 단백질(VP1 또는 VP2 또는 VP1+VP2)을 개별적으로 발현시키는 방법을 기술한다. 다음으로, 누락된 캡시드 단백질은 강한 프로모터, 예를 들어 본 명세서에 기술된 바와 같은 CMV 프로모터로부터 인트랜스로 발현될 수 있다. 이러한 제2의 ORF에서 원치않는 캡시드 단백질(예를 들어, VP3)의 발현 또한 번역 기원을 돌연변이시켜 유사하게 제거한다(도 2). 이러한 플랫폼은 하나의 ORF로부터 3가지 캡시드 단백질 중 임의의 조합을 발현하고 제2의 ORF로부터 선택된 제3의 발현을 분리하는 능력을 제공하여, 3가지 캡시드 단백질의 임의의 하위세트를 선택적으로 조작하는 것을 가능하게 한다.
이제, 본 명세서에 기술된 플랫폼을 사용하여, 부위-지정 돌연변이 유발에 의해 독특한 비-암호화 코돈(예를 들어, 넌센스, 4-염기 또는 비천연 염기-쌍-함유 코돈)을 3가지 캡시드 단백질의 임의의 조합에 선택적으로 도입하는 것이 가능하다. 이러한 돌연변이 Cap가 독특한 코돈을 해독할 수 있는 적합한 조작된 아미노아실-tRNA 합성효소(aaRS)/tRNA 쌍과 함께 공동-발현되면, UAA 잔기가 이러한 부위에 혼입될 수 있다.
본 발명의 일 실시형태에서, 피롤리실-tRNA 합성효소/tRNA 쌍의 사용을 통해, UAA AzK가 VP1 또는 VP2 또는 VP1+VP2의 T454(VP1 번호 설정) 잔기에 혼입된다(도 3). 이의 결과로 생성되는 바이러스는 야생형 바이러스에 필적하는 효율로 패키징되고 필적하는 감염성을 가져 이러한 변형이 잘-용인됨을 보여주었다(도 3 및 도 4). 캡시드당 변형의 수를 제어하는 것의 중요성은 UAA가 캡시드당 5카피(VP1 또는 VP2 단독의 돌연변이) 또는 캡시드당 10카피(VP1+VP2 모두의 돌연변이) 또는 캡시드당 60카피(3가지 캡시드 단백질 모두 돌연변이)로 혼입되고, 이후 재표적화 리간드가 이들 UAA 핸들에 부착되는 AAV의 차별적 습성에 의해 입증되었다(도 6). 60개의 부착 핸들을 갖는 AVV는 중간 변형 상태에서 효율적인 재표적화가 가능하였지만, 완전 변형 시, 모든 감염성을 잃었다. 캡시드당 5 또는 10개의 변형은 잘 용인되었지만, 효율적인 재표적화를 위해서는 캡시드당 10개의 재표적화 리간드가 필요하였다(도 6).
이러한 전략을 사용하여 캡시드 단백질의 임의의 다른 조합 및 이들 단백질 내의 임의의 부위를 조작할 수 있음에 주목해야 한다. 돌연변이에 특히 적합한 것은 캡시드 단백질의 N-말단이며, 이는 캡시드 단백질의 이 부분은 기능성 캡시드로 접힐 때 본질적으로 내부에 존재하지만, 캡시드의 C-말단은 노출되기 때문이다.
또한, 다른 aaRS/tRNA 쌍(세균성 티로실, 트립토파닐 및 류실-tRNA 합성효소/tRNA 쌍을 포함하지만 이로 제한되지 않음)이 사용될 수 있으며 임의의 다른 비천연 아미노산(예를 들어 도 1에 도시된 것 및 본 명세서에 기술된 것)이 혼입될 수 있다. 또한 이러한 기술은 AAV의 임의의 다른 천연 혈청형뿐만 아니라 조작되고 진화된 AAV의 변이체로 확장될 수 있다.
시스테인 및 셀레노시스테인은 단백질에서 발견되는 천연 아미노산 잔기이다. 이들의 낮은 존재도 및 독특한 반응성 때문에, 이들은 부위-선택적 생물접합 반응에 사용할 수 있다. 본 발명의 또 다른 실시형태에서, 조작된 표면-노출 시스테인 잔기가 부 캡시드 단백질에 도입될 수 있다(도 7a 및 도 7b). 같은 돌연변이가 모든 60개의 캡시드 단백질에 도입 시 잘 용인되지 않아 낮은 역가 및 부족한 감염성을 유발하지만, 표면 노출 시스테인 잔기가 VP1 또는 VP2에만 T454 부위에 도입되었을 때 강한 바이러스 패키징 및 감염성이 관찰되었다. 부 캡시드 단백질에서 조작된 시스테인 잔기를 선택적으로 변형하는 능력도 입증되었다(도 7c).
AAV 캡시드가 진화를 통해 최적화된, 조립 및 세포-진입 과정과 관련된 복잡함 때문에, 천연/비천연 아미노산 돌연변이 유발, 루프 삽입, 단백질 융합 등을 통해 캡시드 단백질을 조작하는 시도는 자주 저항에 부딪힌다. 그러나, 단지 부 캡시드 단백질을 조작하는 것은 이것이 캡시드 전체에 훨씬 작은 전체적 교란을 도입하기 때문에 훨씬 더 잘 용인된다. 이것은 조작된 시스테인 잔기가 부 캡시드 단백질에서 용인되는 것으로 설명되지만, 모든 곳에서 그런 것은 아니다(도 7). 따라서 본 발명은 부 캡시드 단백질의 조작을 통해 AAV 캡시드의 특성을 변화시키기 위한 보다 공격적인 조작을 도입할 수 있는 기회를 제공한다. 천연 및 비천연 아미노산 돌연변이 유발에 더해, 본 발명은 유익한 특성(예를 들어, 특정 표적에 결합하는 특성)을 직접 제공하거나 화학적 또는 효소적 반응(예를 들어, 비오틴화 태그, SNAP 또는 HALO 태그 등)을 통해 선택적으로 변형될 수 있는 부 캡시드 단백질에 펩타이드 및 단백질 융합 및 삽입을 도입하는 데 사용될 수도 있다.
본 발명은 VP1 또는 VP2 또는 VP1+VP2를 선택적으로 돌연변이시켜 캡시드당 정의된 수의 조작된 잔기(천연 또는 비천연) 도입을 허용한다. 조작된 부위의 수에 대한 추가 제어는 VP1 또는 VP2 또는 VP1+VP2에 하나 초과의 조작된 잔기를 도입하여 이루어질 수 있다. 본 명세서에 기술된 바와 같이, VP1 캡시드 단백질의 다양한 부위, 예를 들어 263, 454, 456, 587 및 588번 부위(야생형 VP1의 아미노산 잔기에 해당하는 번호)가 선택적으로 돌연변이되었다. 플랫폼은 포유동물 세포, 곤충 세포 및 무세포성 번역/패키징 시스템을 포함하지만 이로 제한되지 않는 임의의 패키징 플랫폼으로 확장될 수 있다.
본 발명은 다양한 독립체를 화학-선택적으로 부착하는 데 사용될 수 있는 매우 다양한 서로 다른 화학으로 부위와 카피수를 제어하면서 AAV에 수많은 천연 및 비천연 아미노산 잔기를 도입하는 것을 가능하게 한다. 본 발명의 일 실시형태에서, 아지도-함유 UAA를 AAV의 부 캡시드 단백질에 선택적으로 도입한 후, 스트레인-촉진 아지드-알킨 클릭 반응을 사용하여 형광단 또는 재표적화 리간드에 접합하였다(도 5 및 도 6). 다른 실시형태에서, 부 캡시드 단백질에 조작된 시스테인 잔기를 도입하고 이어서 시스테인-말레이미드 결합 반응을 사용하여 형광단에 접합하였다. 캡시드 변형을 위해 변형된 알켄과 테트라진 또는 푸란과 말레이미드 사이의 역-전자 요구 Diels-Alder 반응, 알데하이드/케톤 및 아미노-옥시/하이드라진 기 사이의 축합 반응, 화학-선택적 급속 아조-결합 반응(CRACR), 산화 및 광촉매 결합 반응, 시스테인 또는 셀레노시스테인 잔기에 의한 다양한 친전자체로의 친핵성 치환/부가 등을 포함하지만 이로 제한되지 않는 임의의 다른 화학-선택적 접합 반응이 사용될 수 있다.
본 명세서에 기술된 방법은 탐침(형광, 방사성, MRI, 발광 등), 소분자 리간드, 펩타이드, 고리형 펩타이드, 뉴클레오타이드(DNA, RNA, LNA, PNA 등), 중합체(예를 들어, PEG), 탄수화물(예를 들어, 시알산 등), 단백질(예를 들어, 효소, 나노바디, 항체 등), 같거나 다른 혈청형의 다른 AAV 등을 포함하지만 이로 제한되지 않는 매우 다양한 독립체를 부착하는 데 사용될 수 있다. 이러한 부착은 사용자-지정 수용체에 효율적으로 재표적화하여 이의 조직 향성을 변화시키는 AAV 접합체를 제공할 수 있다. 또한 면역계로부터 캡시드를 수동적으로 보호하는 기(예를 들어, PEG, 펩타이드, 탄수화물 또는 다른 중합체) 또는 면역 세포 상의 억제 수용체에 활성적으로 결합하여 면역 반응을 끄는 리간드(예를 들어, SIGLEC 리간드)를 부위 특이적으로 부착하여 면역-회피 AAV를 생성할 수 있다. 또한 AAV에 효소를 부착하여 우수한 감염성 프로파일을 갖는 캡시드를 생산하거나, 같거나 다른 혈청형의 두 가지 AAV를 접합하여 확장된 적재량뿐만 아니라 새로운 향성을 갖는 새로운 류의 벡터를 생성하는 데 사용될 수 있다.
본 명세서에 기술된 제어된 AAV 변형 기술은 많은 응용분야, 예를 들어 소분자, 펩타이드, 고리형 펩타이드, 나노바디, 항체 및 항체 단편; DNA/RNA/PNA 압타머 등을 포함하지만 이로 제한되지 않는 재표적화 리간드를 부착하여 원하는 유형의 세포에 AAV 벡터를 표적화하는 분야; 부착 부위, 캡시드당 재표적화 기의 수 및 링커의 화학적 특성을 체계적으로 제어하여 이러한 접합체의 특성을 최적화하는 분야; 폴리에틸렌 글리콜 및 다른 중합체, 탄수화물(시알산 등), 면역 세포의 억제 수용체에 결합하는 리간드(예를 들어, SIGLEC 수용체) 등을 포함하지만 이로 제한되지 않는 면역-조절 독립체의 제어된 부착으로 AAV 벡터에 의해 생성되는 면역 반응을 약화시키는 분야에 사용될 수 있다.
특히 본 발명의 유전자-변형 AAV는 유전자 요법을 위한 인핸스 벡터로 사용될 수 있다. 본 명세서에 기술된 기술을 사용하면, 변형하지 않은 AAV 벡터를 능가하는 향상된/증가된 효능으로 표적 세포에 치료적 또는 항원성 유전자 작제물을 특이적으로 표적화/직접적으로 전달하도록 AAV를 유전자-변형시킬 수 있다. 세포는 시험관 내에서 또는 생체 내에서 배양되거나 생체 외에서 배양하여 이를 필요로 하는 대상체에게 전달할 수 있다. 본 명세서에 사용된 용어 "대상체"는 임의의 동물 대상체를 포함할 수 있고, 특히 인간과 같은 포유동물 대상체를 포함할 수 있다. 인간 대상체가 본 명세서에 기술된 AAV 유전자 벡터를 사용하여 의료 목적으로, 예를 들어 기존 질환, 장애, 상태의 치료 또는 질환, 장애 또는 상태의 발생을 예방하기 위한 예방적 처치의 목적으로, 치료받을 수 있거나 동물 대상체가 의료, 수의학 목적 또는 발달 목적으로 치료받을 수 있다. 본 발명의 방법 및 조성물은 임의의 유형의 암성 종양 또는 암세포를 치료하는 데 사용될 수 있다. 또한, 본 발명의 유전자-변형 AAV는 백신 조성물에 사용될 수 있으며, 여기서 단백질 또는 펩타이드와 같은 항원성 물질을 암호화하는 핵산 서열이 아쥬반트와 같은 추가 성분과 함께 표적 세포로 전달되며 면역 반응이 대상체에서 유도된다.
유전자-변형 AAV에 의해 전달되는 유전자 작제물은 치료적으로 효과적이다. 본 명세서에 사용된 "치료적 유효"한 양은 임의의 의학적 처리에 적용가능한 합당한 이익/위험 비율로 대상체의 세포의 적어도 하위 집단에서 근본적인 질환 상태에 대해 원하는 효과를 생성하기 위한 원하는 생물학적 효과를 갖기에 충분한 양(예를 들어, 대상에서 종양의 성장을 억제하거나, 항원에 대한 면역 반응을 생성하거나, 자가면역 질환을 억제하기에 충분한 양)을 의미한다. 본 발명에 사용되는 작제물/작용제의 치료적 유효량의 결정은 공지 기술을 사용하고 유사한 상황에서 얻어지는 결과를 관찰함으로써 이 분야의 기술자에 의해 쉽게 이루어질 수 있다.
또한 기술은 세포 당 전달되는 유전적 화물의 전체 크기를 늘리기 위해 이중기능성 링커를 사용하여 같거나 다른 혈청형의 2개의 별개 AAV 벡터를 접합하는 데 사용될 수 있다. 또한 2개의 다른 AAV 벡터의 이러한 새로운 접합체는 독특한 향성을 가질 것이며, 독립적으로 또는 AAV 캡시드 내부의 유전적 화물과 함께 작동하는 연구 또는 치료 목적을 위한 시험관 내 및 생체 내에서 세포에 전달되도록 외부 적재물(예를 들어, 단백질, 소분자, 핵산, 탐침 등)을 바이러스 캡시드에 접합하기 위한 것이다.
마지막으로, 이 기술은 형광 탐침, 광-가교제 및 친화성 핸들(예를 들어, 비오틴)과 같은 기를 혼입하여 포유동물 세포에 대한 AAV 캡시드의 진입 경로를 조사하는 데 사용될 수 있다.
추가 설명없이, 이 분야의 기술자는 상기 설명에 기초하여 본 발명을 최대로 활용할 수 있다고 여겨진다. 따라서 다음의 구체적인 실시형태 및 실시예는 단지 예시적인 것으로서 이해되어야 하며, 어떤 방식으로든 본 개시내용의 나머지를 제한하지 않는다.
UAA를 AAV의 캡시드에 혼입하려면 바이러스 증폭을 위한 숙주 역할을 하는 수용 세포(예를 들어, 포유동물 세포)에서 원하는 UAA의 변형을 포함하는 이 캡시드 단백질(들)의 효율적인 발현이 필요하다. 앞서 기술한 바와 같이, UAA 혼입 부위는 정지 코돈(예를 들어, TAG)에 의해 지정될 수 있으며, 관심있는 UAA는 동족 안티코돈을 갖는 조작된 tRNA/아미노아실-tRNA 합성효소 쌍에 의해 전달될 수 있다. 결과적으로, UAA-변형 바이러스의 생산은 바이러스 증폭에 필요한 유전적 구성 요소뿐만 아니라 바이러스의 증폭을 위해 필요한 구성 요소의 동시 발현이 수반되어야 한다.
AVV의 캡시드 단백질에 UAA를 혼입하기 위해, 몇몇 표면 노출 내인성 아미노산 잔기의 교체가 AAV 캡시드 상의 표적이 되었다(바이러스 입자의 결정 구조에 의해 유도됨, 예를 들어 문헌[Xie, et al., "The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy" PNAS August 6, 2002: vol. 99: no. 16, p. 10407] 참조). 이러한 캡시드 돌연변이는 잠재적으로 바이러스 감염성을 교란할 수 있으므로, 변경이 허용되는 것으로 알려진 영역, 예를 들어 삼중 근위 스파이크 상의 영역이 표적이 되었다. 필수 아르기닌 잔기의 교체 또한 헤파란 황산염 수용체 결합 영역에서 표적이 되었으며, 이는 본래의 향성을 방해하고 재-표적화를 촉진할 것이다. 이는 AAV의 본래 숙주 세포 선호도를 "삭제"하고 정확한 표지화 방법론을 사용하여 표적 제제로 다시 작성하는 것을 허용한다. 예를 들어, 표적 위치는 3가지의 모든 AAV 캡시드 단백질 사이에 보존된 도메인에 존재할 수 있으며, 이는 이들 모두에서 UAA로 교체되는 것을 유발할 수 있다. AAV는 예를 들어 HEK293T 세포를 UAA 아지도-라이신("AzK")이 존재 하에 필요한 요소를 함유하는 플라스미드로 형질주입하여 생산할 수 있다. 특정 실시예에서 메타노사르키나 바르케리(Methanosarcina barkeri)-유래 피롤리실-tRNA 합성효소 및 메타노사르키나 마제이(M. mazeii) 유래 피롤리실 tRNA(TAG 억제인자)가 T454에서 정지 코돈 TAG에 반응하여 AzK 아미노산을 혼입하기 위해 사용된다.
아래에 기술된 실시예에서 사용되는 플라스미드 지도 및 서열은 도 17 내지 24에서 찾을 수 있다.
실시예 1: AAV2의 패키징
도 3은 본래 시스템에 필적하는 수율로 도 2에 기술된 작제물을 사용하여 HEK293T 세포에서 AAV2를 패키징하는 것을 보여준다. 본래의(WT) AAV2의 qPCR 역가를 보여주며 나머지에 대한 역가를 WT에 비교하여 보여준다. ΔVP1 및 ΔVP2는 각각 VP1 및 VP2의 발현이 배제된 Cap 유전자를 사용하여 패키징된 AAV2를 나타낸다. 바이러스는 부 캡시드 단백질의 부재 하에서 여전히 효율적으로 조립된다. ΔVP1-CMV-VP1 및 ΔVP2-CMV-VP2는 각각 VP1 및 VP2의 발현이 배제되고 각각의 단백질이 CMV 프로모터로부터 인트랜스로 발현되는 Cap 유전자를 사용하여 패키징된 AAV2를 나타낸다. 이러한 시스템에서, VP1 또는 VP2의 T454 잔기가 TAG로 돌연변이되고 피롤리실-tRNA 합성효소/tRNA 쌍의 사용을 통해 UAA(AzK)가 혼입됨으로써 억제되었으며, 이를 각각 ΔVP1-CMV-VP1-454AzK 및 ΔVP2-CMV-VP2-454AzK로 표시하였다. 배지에 첨가된 UAA의 존재 또는 부재 하에서 바이러스의 패키징 수율을 나타내었다.
실시예 2: 패키징된 바이러스의 감염성
도 4는 도 3에서 생산된 패키징되고 적정된 바이러스의 일정한 역가에서의 감염성으로서 HEK293T 세포에 EGFP 리포터를 전달하고 발현하는 능력으로 측정된 감염성을 보여준다. ΔVP1 및 ΔVP2 바이러스는 패키징은 잘 되지만, 감염성은 크게 약화되는 것으로 나타났다. 인트랜스로 VP1 및 VP2를 공급하면(ΔVP1-CMV-VP1 및 ΔVP2-CMV-VP2) 감염성은 회복된다. UAA의 존재 하에서 생산된 ΔVP1-CMV-VP1-454AzK 및 ΔVP2-CMV-VP2-454AzK 바이러스는 강한 감염성을 나타내었지만, 부재 하에서 생산된 것은 그렇지 않았다. UAA의 부재 하에서, 부 캡시드 단백질의 TAG 돌연변이는 발현되지 못한다는 점에 주목해야 한다.
실시예 3: 돌연변이 AAV의 선택적 형광단 표지
도 5는 AAV 캡시드에서 개별 부 캡시드 단백질의 선택적인 비천연 아미노산 돌연변이 유발 및 형광단을 화학적으로 부착하기 위한 이들의 용도를 보여준다. 정제 후, 서로 다른 재조합 AAV2 조제물을 UAA AzK에 존재하는 아지드 기를 선택적으로 표지하는 사이클로옥틴-형광단으로 표지하였다. 윗부분은 AAV2 조제물의 SDS-PAGE 분석결과를 보여주며, 아랫부분은 같은 겔의 형광 이미지를 보여준다. 기대했던 바와 같이, 야생형 AAV2는 표지를 나타내지 않았고, T454AzK(모든 60개의 캡시드 단백질에 AzK가 혼입됨)는 모든 캡시드 단백질의 표지를 나타낸 반면, ΔVP1-CMV-VP1-454AzK 및 ΔVP2-CMV-VP2-454AzK는 VP1 및 VP2 각각의 선택적인 표지를 보여주며, 이는 별개의 부 캡시드 단백질을 선택적으로 표지하는 능력을 보여준다.
실시예 4: 돌연변이 AAV의 재표적화 효율
도 6은 AAV 캡시드에 부착된 재표적화 리간드의 수가 이의 재표적화 효율에 극적인 영향을 미침을 보여준다. 탈표적화 AAV2 캡시드에 cRGD 리간드를 부착하면(여기서 천연 1차 수용체인 헤파란 황산염 프로테오글리칸 수용체 HSPG의 결합은 핵심 잔기 R588 및 R587(VP1의 아미노산 잔기 위치로 지정됨)이 Ala로 돌연변이됨으로써 제거됨) 이것을 αVβ3 인테그린 수용체를 과발현하는 SK-OV-3와 같은 암세포주에 선택적으로 결합 및 감염시키는 것이 가능하다. 이들 그래프는 시간에 걸쳐 사이클로옥틴-cRGD와 함께 배양함에 따라 AzK 측쇄가 cRGD로 점진적으로 기능화됨에 따른 표시한 탈표적화 AAV2 돌연변이의 감염성을 보여준다. 454AA(캡시드당 60개의 AzK)의 경우, SK-OV-3 세포에 대한 감염성이 처음에 상승했다가 이후 하락하는데, 이는 효율적인 재표적화에 필요한 캡시드당 cRGD의 최적 수를 제시한다. 이후에 캡시드의 과도한 변형은 바이러스 진입 과정을 교란하여 감염성의 손실을 유발할 수 있다. VP1-454AA 및 VP2-454AA(각 캡시드당 5개의 AzK)의 경우, 감염성이 상승하다가 배양 연장 시 안정기에 도달하는데, 이는 캡시드당 5개의 cRGD 부착이 AAV2의 감염성에 유해하지 않음을 제시한다. 그러나, 이들 돌연변이의 최대 감염성은 낮은데, 이는 캡시드당 5개의 cRGD가 효율적인 재표적화를 위해 충분하지 않을 수 있음을 제시한다. VP1+2-454AA(캡시드당 10개의 AzK)는 VP1-454AA 및 VP2-454AA와 유사한 경향을 나타내지만, 배양 연장 시 감염성이 T454-AA의 최적 변형 정도에서 관찰된 최적 감염성과 유사한 수준에 도달한다.
실시예 5: AAV의 조작된 시스테인 잔기의 정확한 표지
도 7a 내지 도 7c는 AAV의 조작된 시스테인 잔기의 정확한 표지를 보여준다. (A) 야생형 Cap(WT), Cap의 T454C 돌연변이(모든 3가지 캡시드 단백질에서 T454C), VP1-T454C(트랜스-치환된 VP1의 T454C 돌연변이), VP2-T454C(트랜스-치환된 VP2의 T454C 돌연변이)를 사용하여 생산된 AAV의 패키징 효율(qPCR). (B) HEK293T 세포에 EGFP 유전자를 전달하고 발현하는 능력으로 측정한 이들 바이러스의 감염성(FACS 역가). (C) VP1-454C 바이러스 상에서 플루오레세인-말레이미드에 의한 VP1의 조작된 454-시스테인 잔기의 선택적 표지. FAM-형광 이미지는 WT 및 VP1-454C 바이러스에 대한 표지 반응의 결과를 보여주며, SYPRO는 모든 단백질을 염색한다.
실시예 6: VP1 또는 VP2 또는 VP1+VP2로의 UAA의 선택적 혼입
도 11a 내지 도 11c에 나타난 바와 같이, HEK293T 세포를 C5Az를 충전하는 조작된 대장균 류실-tRNA 합성효소(EcLeuRS) 및 tRNA 쌍을 암호화하는 플라스미드(pIDTsmart-ITR-GFP-4xEcLtR-LeuRS) 및 각각 [RC2-VP1-del + CMV-VP1-delVP23] 또는 [RC2-VP2-del + CMV-VP2-delVP3] 또는 [RC2-VP12-del + CMV-VP1-VP2-delVP3]을 암호화하는 플라스미드로 공동-형질주입하여 C5Az를 VP1 또는 VP2 또는 VP1+VP2에 혼입하였다. 원하는 단백질에서 454번 위치(VP1 번호 설정)가 TAG 정지 코돈으로 교체되었다. A) C5Az의 구조, B) C5Az의 존재 또는 부재 하에서, 야생형 AAV2 생산에 비교하여 나타낸 다양한 조제물의 qPCR 역가. C) AAV2-VP1-454-C5Az 상에서 DBCO-로다민(rhodamine)을 사용한 VP1의 선택적 형광 표지.
실시예 7: VP1으로의 CpK의 선택적 혼입
도 13a 내지 도 13c에 나타난 바와 같이, HEK293T 세포를 CpK를 충전하는 조작된 대장균 류실-tRNA 합성효소(EcLeuRS) 및 tRNA 쌍을 암호화하는 플라스미드(pIDTsmart-ITR-GFP-4xEcLtR-LeuRS) 및 [RC2-VP1-del + CMV-VP1-delVP23]을 암호화하는 플라스미드로 공동-형질주입하여 CpK를 VP1에 혼입하였다. VP1에서 다양한 부위(VP1 번호 설정으로 나타냄)가 TAG 정지 코돈으로 교체되었다. A) CpK의 구조, B) LCA의 존재 또는 부재 하에서, 야생형 AAV2 생산에 비교하여 나타낸 다양한 조제물의 상대 역가. C) VP1의 456번 부위에 LCA를 포함하는 AAV 조제물 상에서 테트라진-FITC를 사용한 VP1의 선택적 형광 표지.
실시예 8: VP1으로의 5-HTP의 선택적 혼입
도 14a 내지 도 14c에 나타난 바와 같이, HEK293T 세포를 5HTP를 충전하는 조작된 대장균 트립토파닐-tRNA 합성효소(EcTrpRS) 및 tRNA 쌍을 암호화하는 플라스미드(pIDTsmart-TrpRS-8xWtR-ITR-GFP) 및 [RC2-VP1-del + CMV-VP1-delVP23]을 암호화하는 플라스미드로 공동-형질주입하여 5HTP를 VP1에 혼입하였다. VP1에서 다양한 부위(VP1 번호 설정으로 나타냄)가 TGA 정지 코돈으로 교체되었다. A) 5HTP의 구조, B) 5HTP의 존재 또는 부재 하에서, 야생형 AAV2 생산에 비교하여 나타낸 다양한 조제물의 상대 역가. C) VP1의 454번 부위에 5HTP를 포함하는 AAV 조제물 상에서 플루오레세인 아민 및 페리시안 화합물을 사용한 VP1의 선택적 형광 표지.
실시예 9: VP1으로의 UAA의 혼입
도 15a 및 도 15b에 나타난 바와 같이, HEK293T 세포를 몇몇 다른 비천연 아미노산을 충전하는 조작된 대장균 류실-tRNA 합성효소(EcLeuRS) 및 tRNA 쌍을 암호화하는 플라스미드(pIDTsmart-ITR-GFP-4xEcLtR-LeuRS) 및 [RC2-VP1-del + CMV-VP1-delVP23]을 암호화하는 플라스미드로 공동-형질주입하여 이들 비천연 아미노산을 VP1에 혼입하였다. VP1에서 454번 부위(VP1 번호 설정)가 TAG 정지 코돈으로 교체되었다. A) 비천연 아미노산의 구조, B) 표시된 비천연 아미노산의 존재 또는 부재 하에서, 야생형 AAV2 생산에 비교하여 나타낸 다양한 돌연변이 AAV2 조제물의 상대 역가.
실시예 10: AAV2-VP1-454-LCA의 LCA 부위의 변형
도 16a 및 도 16b에 나타난 바와 같이, 해당 PEG-DBCO 접합체를 사용하여 AAV2-VP1-454-LCA의 LCA 부위를 20kDa 폴리에틸렌 글리콜(PEG) 중합체로 선택적으로 변형시켰다. SDS-PAGE 분석결과는 VP1의 선택적 표지를 보여준다. 야생형 AAV2, AAV2-VP1-454-LCA 및 PEG-변형 AAV2-VP1-454-LCA는 유사한 감염성을 보여준다. 각 바이러스의 동등한 게놈 카피를 HEK293 세포에 첨가하고 표준 루시페라제 분석법을 사용하여 암호화된 루시페라제 리포터의 발현을 모니터하였다.
본 발명이 바람직한 실시형태를 참조하여 특별히 도시되고 기술되었지만, 첨부된 청구범위에 의해 포함되는 발명의 범위를 벗어나지 않고 형태 및 세부사항에서 다양한 변화가 만들어질 수 있음을 이 분야의 기술자들은 이해할 것이다.
SEQUENCE LISTING
<110> TRUSTEES OF BOSTON COLLEGE
<120> CONTROLLED MODIFICATION OF ADENO-ASSOCIATED VIRUS (AAV) FOR
ENHANCED GENE THERAPY
<130> 0342.0010WO1
<140> PCT/US2021/030489
<141> 2021-05-03
<150> US 63/018,573
<151> 2020-05-01
<160> 11
<170> PatentIn version 3.5
<210> 1
<211> 735
<212> PRT
<213> Adeno-associated virus 2
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 598
<212> PRT
<213> Adeno-associated virus 2
<400> 2
Met Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro
1 5 10 15
Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro
35 40 45
Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn
50 55 60
Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly
115 120 125
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
130 135 140
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
145 150 155 160
Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe
165 170 175
Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr
180 185 190
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
195 200 205
Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys
210 215 220
Leu Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
225 230 235 240
Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr
245 250 255
Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe
260 265 270
Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala
275 280 285
His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr
290 295 300
Leu Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln
305 310 315 320
Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln
325 330 335
Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser
340 345 350
Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala
355 360 365
Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro
370 375 380
Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser
385 390 395 400
Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp
405 410 415
Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn
420 425 430
Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg
435 440 445
Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu
450 455 460
Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile
465 470 475 480
Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu
485 490 495
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys
500 505 510
Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys
515 520 525
Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu
530 535 540
Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu
545 550 555 560
Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr
565 570 575
Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg
580 585 590
Tyr Leu Thr Arg Asn Leu
595
<210> 3
<211> 533
<212> PRT
<213> Adeno-associated virus 2
<400> 3
Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala
50 55 60
Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe
65 70 75 80
Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg
85 90 95
Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys
100 105 110
Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr
115 120 125
Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser
130 135 140
Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu
145 150 155 160
Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu
165 170 175
Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys
180 185 190
Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr
195 200 205
Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His
210 215 220
Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu
225 230 235 240
Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser
245 250 255
Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser
260 265 270
Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys
275 280 285
Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr
290 295 300
Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala
305 310 315 320
Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly
325 330 335
Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile
340 345 350
Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro
355 360 365
Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly
370 375 380
Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro
385 390 395 400
Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
405 410 415
Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met
420 425 430
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn
435 440 445
Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe
450 455 460
Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile
465 470 475 480
Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
485 490 495
Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val
500 505 510
Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr
515 520 525
Leu Thr Arg Asn Leu
530
<210> 4
<211> 4642
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 4
gctctagaac tagtggatcc cccggaagat cagaagttcc tattccgaag ttcctattct 60
ctagaaagta taggaacttc tgatctgcgc agccgccatg ccggggtttt acgagattgt 120
gattaaggtc cccagcgacc ttgacgagca tctgcccggc atttctgaca gctttgtgaa 180
ctgggtggcc gagaaggaat gggagttgcc gccagattct gacatggatc tgaatctgat 240
tgagcaggca cccctgaccg tggccgagaa gctgcagcgc gactttctga cggaatggcg 300
ccgtgtgagt aaggccccgg aggccctttt ctttgtgcaa tttgagaagg gagagagcta 360
cttccacatg cacgtgctcg tggaaaccac cggggtgaaa tccatggttt tgggacgttt 420
cctgagtcag attcgcgaaa aactgattca gagaatttac cgcgggatcg agccgacttt 480
gccaaactgg ttcgcggtca caaagaccag aaatggcgcc ggaggcggga acaaggtggt 540
ggatgagtgc tacatcccca attacttgct ccccaaaacc cagcctgagc tccagtgggc 600
gtggactaat atggaacagt atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt 660
ggtggcgcag catctgacgc acgtgtcgca gacgcaggag cagaacaaag agaatcagaa 720
tcccaattct gatgcgccgg tgatcagatc aaaaacttca gccaggtaca tggagctggt 780
cgggtggctc gtggacaagg ggattacctc ggagaagcag tggatccagg aggaccaggc 840
ctcatacatc tccttcaatg cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga 900
caatgcggga aagattatga gcctgactaa aaccgccccc gactacctgg tgggccagca 960
gcccgtggag gacatttcca gcaatcggat ttataaaatt ttggaactaa acgggtacga 1020
tccccaatat gcggcttccg tctttctggg atgggccacg aaaaagttcg gcaagaggaa 1080
caccatctgg ctgtttgggc ctgcaactac cgggaagacc aacatcgcgg aggccatagc 1140
ccacactgtg cccttctacg ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga 1200
ctgtgtcgac aagatggtga tctggtggga ggaggggaag atgaccgcca aggtcgtgga 1260
gtcggccaaa gccattctcg gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc 1320
ggcccagata gacccgactc ccgtgatcgt cacctccaac accaacatgt gcgccgtgat 1380
tgacgggaac tcaacgacct tcgaacacca gcagccgttg caagaccgga tgttcaaatt 1440
tgaactcacc cgccgtctgg atcatgactt tgggaaggtc accaagcagg aagtcaaaga 1500
ctttttccgg tgggcaaagg atcacgtggt tgaggtggag catgaattct acgtcaaaaa 1560
gggtggagcc aagaaaagac ccgcccccag tgacgcagat ataagtgagc ccaaacgggt 1620
gcgcgagtca gttgcgcagc catcgacgtc agacgcggaa gcttcgatca actacgcaga 1680
caggtaccaa aacaaatgtt ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag 1740
acaatgcgag agaatgaatc agaattcaaa tatctgcttc actcacggac agaaagactg 1800
tttagagtgc tttcccgtgt cagaatctca acccgtttct gtcgtcaaaa aggcgtatca 1860
gaaactgtgc tacattcatc atatcatggg aaaggtgcca gacgcttgca ctgcctgcga 1920
tctggtcaat gtggatttgg atgactgcat ctttgaacaa taaatgattt aaatcaggtc 1980
tcgctgccga tggttatctt ccagattggc tcgaggacac tctctctgaa ggaataagac 2040
agtggtggaa gctcaaacct ggcccaccac caccaaagcc cgcagagcgg cataaggacg 2100
acagcagggg tcttgtgctt cctgggtaca agtacctcgg acccttcaac ggactcgaca 2160
agggagagcc ggtcaacgag gcagacgccg cggccctcga gcacgacaaa gcctacgacc 2220
ggcagctcga cagcggagac aacccgtacc tcaagtacaa ccacgccgac gcggagtttc 2280
aggagcgcct taaagaagat acgtcttttg ggggcaacct cggacgagca gtcttccagg 2340
cgaaaaagag ggttcttgaa cctctgggcc tggttgagga acctgttaag acggctccgg 2400
gaaaaaagag gccggtagag cactctcctg tggagccaga ctcctcctcg ggaaccggaa 2460
aggcgggcca gcagcctgca agaaaaagat tgaattttgg tcagactgga gacgcagact 2520
cagtacctga cccccagcct ctcggacagc caccagcagc cccctctggt ctgggaacta 2580
atacgatggc tacaggcagt ggcgcaccaa tggcagacaa taacgagggc gccgacggag 2640
tgggtaattc ctcgggaaat tggcattgcg attccacatg gatgggcgac agagtcatca 2700
ccaccagcac ccgaacctgg gccctgccca cctacaacaa ccacctctac aaacaaattt 2760
ccagccaatc aggagcctcg aacgacaatc actactttgg ctacagcacc ccttgggggt 2820
attttgactt caacagattc cactgccact tttcaccacg tgactggcaa agactcatca 2880
acaacaactg gggattccga cccaagagac tcaacttcaa gctctttaac attcaagtca 2940
aagaggtcac gcagaatgac ggtacgacga cgattgccaa taaccttacc agcacggttc 3000
aggtgtttac tgactcggag taccagctcc cgtacgtcct cggctcggcg catcaaggat 3060
gcctcccgcc gttcccagca gacgtcttca tggtgccaca gtatggatac ctcaccctga 3120
acaacgggag tcaggcagta ggacgctctt cattttactg cctggagtac tttccttctc 3180
agatgctgcg taccggaaac aactttacct tcagctacac ttttgaggac gttcctttcc 3240
acagcagcta cgctcacagc cagagtctgg accgtctcat gaatcctctc atcgaccagt 3300
acctgtatta cttgagcaga acaaacactc caagtggaac caccacgcag tcaaggcttc 3360
agttttctca ggccggagcg agtgacattc gggaccagtc taggaactgg cttcctggac 3420
cctgttaccg ccagcagcga gtatcaaaga catctgcgga taacaacaac agtgaatact 3480
cgtggactgg agctaccaag taccacctca atggcagaga ctctctggtg aatccgggcc 3540
cggccatggc aagccacaag gacgatgaag aaaagttttt tcctcagagc ggggttctca 3600
tctttgggaa gcaaggctca gagaaaacaa atgtggacat tgaaaaggtc atgattacag 3660
acgaagagga aatcaggaca accaatcccg tggctacgga gcagtatggt tctgtatcta 3720
ccaacctcca gagaggcaac agacaagcag ctaccgcaga tgtcaacaca caaggcgttc 3780
ttccaggcat ggtctggcag gacagagatg tgtaccttca ggggcccatc tgggcaaaga 3840
ttccacacac ggacggacat tttcacccct ctcccctcat gggtggattc ggacttaaac 3900
accctcctcc acagattctc atcaagaaca ccccggtacc tgcgaatcct tcgaccacct 3960
tcagtgcggc aaagtttgct tccttcatca cacagtactc cacgggacag gtcagcgtgg 4020
agatcgagtg ggagctgcag aaggaaaaca gcaaacgctg gaatcccgaa attcagtaca 4080
cttccaacta caacaagtct gttaatgtgg actttactgt ggacactaat ggcgtgtatt 4140
cagagcctcg ccccattggc accagatacc tgactcgtaa tctgtaattg cttgttaatc 4200
aataaaccgt ttaattcgtt tcagttgaac tttggtctct gcgtatttct ttcttatcta 4260
gtttccatgg ctacgtagat aagtagcatg gcgggttaat cattaactac agcccgggcg 4320
tttaaacagc gggcggaggg gtggagtcgt gacgtgaatt acgtcatagg gttagggagg 4380
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtctcgct 4440
gggggggggg gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacga 4500
gcgctggcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 4560
acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag 4620
gcccgcaccg atcgcccttc cc 4642
<210> 5
<211> 4642
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 5
gctctagaac tagtggatcc cccggaagat cagaagttcc tattccgaag ttcctattct 60
ctagaaagta taggaacttc tgatctgcgc agccgccatg ccggggtttt acgagattgt 120
gattaaggtc cccagcgacc ttgacgagca tctgcccggc atttctgaca gctttgtgaa 180
ctgggtggcc gagaaggaat gggagttgcc gccagattct gacatggatc tgaatctgat 240
tgagcaggca cccctgaccg tggccgagaa gctgcagcgc gactttctga cggaatggcg 300
ccgtgtgagt aaggccccgg aggccctttt ctttgtgcaa tttgagaagg gagagagcta 360
cttccacatg cacgtgctcg tggaaaccac cggggtgaaa tccatggttt tgggacgttt 420
cctgagtcag attcgcgaaa aactgattca gagaatttac cgcgggatcg agccgacttt 480
gccaaactgg ttcgcggtca caaagaccag aaatggcgcc ggaggcggga acaaggtggt 540
ggatgagtgc tacatcccca attacttgct ccccaaaacc cagcctgagc tccagtgggc 600
gtggactaat atggaacagt atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt 660
ggtggcgcag catctgacgc acgtgtcgca gacgcaggag cagaacaaag agaatcagaa 720
tcccaattct gatgcgccgg tgatcagatc aaaaacttca gccaggtaca tggagctggt 780
cgggtggctc gtggacaagg ggattacctc ggagaagcag tggatccagg aggaccaggc 840
ctcatacatc tccttcaatg cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga 900
caatgcggga aagattatga gcctgactaa aaccgccccc gactacctgg tgggccagca 960
gcccgtggag gacatttcca gcaatcggat ttataaaatt ttggaactaa acgggtacga 1020
tccccaatat gcggcttccg tctttctggg atgggccacg aaaaagttcg gcaagaggaa 1080
caccatctgg ctgtttgggc ctgcaactac cgggaagacc aacatcgcgg aggccatagc 1140
ccacactgtg cccttctacg ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga 1200
ctgtgtcgac aagatggtga tctggtggga ggaggggaag atgaccgcca aggtcgtgga 1260
gtcggccaaa gccattctcg gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc 1320
ggcccagata gacccgactc ccgtgatcgt cacctccaac accaacatgt gcgccgtgat 1380
tgacgggaac tcaacgacct tcgaacacca gcagccgttg caagaccgga tgttcaaatt 1440
tgaactcacc cgccgtctgg atcatgactt tgggaaggtc accaagcagg aagtcaaaga 1500
ctttttccgg tgggcaaagg atcacgtggt tgaggtggag catgaattct acgtcaaaaa 1560
gggtggagcc aagaaaagac ccgcccccag tgacgcagat ataagtgagc ccaaacgggt 1620
gcgcgagtca gttgcgcagc catcgacgtc agacgcggaa gcttcgatca actacgcaga 1680
caggtaccaa aacaaatgtt ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag 1740
acaatgcgag agaatgaatc agaattcaaa tatctgcttc actcacggac agaaagactg 1800
tttagagtgc tttcccgtgt cagaatctca acccgtttct gtcgtcaaaa aggcgtatca 1860
gaaactgtgc tacattcatc atatcatggg aaaggtgcca gacgcttgca ctgcctgcga 1920
tctggtcaat gtggatttgg atgactgcat ctttgaacaa taaatgattt aaatcaggta 1980
tggctgccga tggttatctt ccagattggc tcgaggacac tctctctgaa ggaataagac 2040
agtggtggaa gctcaaacct ggcccaccac caccaaagcc cgcagagcgg cataaggacg 2100
acagcagggg tcttgtgctt cctgggtaca agtacctcgg acccttcaac ggactcgaca 2160
agggagagcc ggtcaacgag gcagacgccg cggccctcga gcacgacaaa gcctacgacc 2220
ggcagctcga cagcggagac aacccgtacc tcaagtacaa ccacgccgac gcggagtttc 2280
aggagcgcct taaagaagat acgtcttttg ggggcaacct cggacgagca gtcttccagg 2340
cgaaaaagag ggttcttgaa cctctgggcc tggttgagga acctgttaag accgctccgg 2400
gaaaaaagag gccggtagag cactctcctg tggagccaga ctcctcctcg ggaaccggaa 2460
aggcgggcca gcagcctgca agaaaaagat tgaattttgg tcagactgga gacgcagact 2520
cagtacctga cccccagcct ctcggacagc caccagcagc cccctctggt ctgggaacta 2580
atacgatggc tacaggcagt ggcgcaccaa tggcagacaa taacgagggc gccgacggag 2640
tgggtaattc ctcgggaaat tggcattgcg attccacatg gatgggcgac agagtcatca 2700
ccaccagcac ccgaacctgg gccctgccca cctacaacaa ccacctctac aaacaaattt 2760
ccagccaatc aggagcctcg aacgacaatc actactttgg ctacagcacc ccttgggggt 2820
attttgactt caacagattc cactgccact tttcaccacg tgactggcaa agactcatca 2880
acaacaactg gggattccga cccaagagac tcaacttcaa gctctttaac attcaagtca 2940
aagaggtcac gcagaatgac ggtacgacga cgattgccaa taaccttacc agcacggttc 3000
aggtgtttac tgactcggag taccagctcc cgtacgtcct cggctcggcg catcaaggat 3060
gcctcccgcc gttcccagca gacgtcttca tggtgccaca gtatggatac ctcaccctga 3120
acaacgggag tcaggcagta ggacgctctt cattttactg cctggagtac tttccttctc 3180
agatgctgcg taccggaaac aactttacct tcagctacac ttttgaggac gttcctttcc 3240
acagcagcta cgctcacagc cagagtctgg accgtctcat gaatcctctc atcgaccagt 3300
acctgtatta cttgagcaga acaaacactc caagtggaac caccacgcag tcaaggcttc 3360
agttttctca ggccggagcg agtgacattc gggaccagtc taggaactgg cttcctggac 3420
cctgttaccg ccagcagcga gtatcaaaga catctgcgga taacaacaac agtgaatact 3480
cgtggactgg agctaccaag taccacctca atggcagaga ctctctggtg aatccgggcc 3540
cggccatggc aagccacaag gacgatgaag aaaagttttt tcctcagagc ggggttctca 3600
tctttgggaa gcaaggctca gagaaaacaa atgtggacat tgaaaaggtc atgattacag 3660
acgaagagga aatcaggaca accaatcccg tggctacgga gcagtatggt tctgtatcta 3720
ccaacctcca gagaggcaac agacaagcag ctaccgcaga tgtcaacaca caaggcgttc 3780
ttccaggcat ggtctggcag gacagagatg tgtaccttca ggggcccatc tgggcaaaga 3840
ttccacacac ggacggacat tttcacccct ctcccctcat gggtggattc ggacttaaac 3900
accctcctcc acagattctc atcaagaaca ccccggtacc tgcgaatcct tcgaccacct 3960
tcagtgcggc aaagtttgct tccttcatca cacagtactc cacgggacag gtcagcgtgg 4020
agatcgagtg ggagctgcag aaggaaaaca gcaaacgctg gaatcccgaa attcagtaca 4080
cttccaacta caacaagtct gttaatgtgg actttactgt ggacactaat ggcgtgtatt 4140
cagagcctcg ccccattggc accagatacc tgactcgtaa tctgtaattg cttgttaatc 4200
aataaaccgt ttaattcgtt tcagttgaac tttggtctct gcgtatttct ttcttatcta 4260
gtttccatgg ctacgtagat aagtagcatg gcgggttaat cattaactac agcccgggcg 4320
tttaaacagc gggcggaggg gtggagtcgt gacgtgaatt acgtcatagg gttagggagg 4380
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtctcgct 4440
gggggggggg gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacga 4500
gcgctggcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 4560
acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag 4620
gcccgcaccg atcgcccttc cc 4642
<210> 6
<211> 4642
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 6
gctctagaac tagtggatcc cccggaagat cagaagttcc tattccgaag ttcctattct 60
ctagaaagta taggaacttc tgatctgcgc agccgccatg ccggggtttt acgagattgt 120
gattaaggtc cccagcgacc ttgacgagca tctgcccggc atttctgaca gctttgtgaa 180
ctgggtggcc gagaaggaat gggagttgcc gccagattct gacatggatc tgaatctgat 240
tgagcaggca cccctgaccg tggccgagaa gctgcagcgc gactttctga cggaatggcg 300
ccgtgtgagt aaggccccgg aggccctttt ctttgtgcaa tttgagaagg gagagagcta 360
cttccacatg cacgtgctcg tggaaaccac cggggtgaaa tccatggttt tgggacgttt 420
cctgagtcag attcgcgaaa aactgattca gagaatttac cgcgggatcg agccgacttt 480
gccaaactgg ttcgcggtca caaagaccag aaatggcgcc ggaggcggga acaaggtggt 540
ggatgagtgc tacatcccca attacttgct ccccaaaacc cagcctgagc tccagtgggc 600
gtggactaat atggaacagt atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt 660
ggtggcgcag catctgacgc acgtgtcgca gacgcaggag cagaacaaag agaatcagaa 720
tcccaattct gatgcgccgg tgatcagatc aaaaacttca gccaggtaca tggagctggt 780
cgggtggctc gtggacaagg ggattacctc ggagaagcag tggatccagg aggaccaggc 840
ctcatacatc tccttcaatg cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga 900
caatgcggga aagattatga gcctgactaa aaccgccccc gactacctgg tgggccagca 960
gcccgtggag gacatttcca gcaatcggat ttataaaatt ttggaactaa acgggtacga 1020
tccccaatat gcggcttccg tctttctggg atgggccacg aaaaagttcg gcaagaggaa 1080
caccatctgg ctgtttgggc ctgcaactac cgggaagacc aacatcgcgg aggccatagc 1140
ccacactgtg cccttctacg ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga 1200
ctgtgtcgac aagatggtga tctggtggga ggaggggaag atgaccgcca aggtcgtgga 1260
gtcggccaaa gccattctcg gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc 1320
ggcccagata gacccgactc ccgtgatcgt cacctccaac accaacatgt gcgccgtgat 1380
tgacgggaac tcaacgacct tcgaacacca gcagccgttg caagaccgga tgttcaaatt 1440
tgaactcacc cgccgtctgg atcatgactt tgggaaggtc accaagcagg aagtcaaaga 1500
ctttttccgg tgggcaaagg atcacgtggt tgaggtggag catgaattct acgtcaaaaa 1560
gggtggagcc aagaaaagac ccgcccccag tgacgcagat ataagtgagc ccaaacgggt 1620
gcgcgagtca gttgcgcagc catcgacgtc agacgcggaa gcttcgatca actacgcaga 1680
caggtaccaa aacaaatgtt ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag 1740
acaatgcgag agaatgaatc agaattcaaa tatctgcttc actcacggac agaaagactg 1800
tttagagtgc tttcccgtgt cagaatctca acccgtttct gtcgtcaaaa aggcgtatca 1860
gaaactgtgc tacattcatc atatcatggg aaaggtgcca gacgcttgca ctgcctgcga 1920
tctggtcaat gtggatttgg atgactgcat ctttgaacaa taaatgattt aaatcaggtc 1980
tcgctgccga tggttatctt ccagattggc tcgaggacac tctctctgaa ggaataagac 2040
agtggtggaa gctcaaacct ggcccaccac caccaaagcc cgcagagcgg cataaggacg 2100
acagcagggg tcttgtgctt cctgggtaca agtacctcgg acccttcaac ggactcgaca 2160
agggagagcc ggtcaacgag gcagacgccg cggccctcga gcacgacaaa gcctacgacc 2220
ggcagctcga cagcggagac aacccgtacc tcaagtacaa ccacgccgac gcggagtttc 2280
aggagcgcct taaagaagat acgtcttttg ggggcaacct cggacgagca gtcttccagg 2340
cgaaaaagag ggttcttgaa cctctgggcc tggttgagga acctgttaag accgctccgg 2400
gaaaaaagag gccggtagag cactctcctg tggagccaga ctcctcctcg ggaaccggaa 2460
aggcgggcca gcagcctgca agaaaaagat tgaattttgg tcagactgga gacgcagact 2520
cagtacctga cccccagcct ctcggacagc caccagcagc cccctctggt ctgggaacta 2580
atacgatggc tacaggcagt ggcgcaccaa tggcagacaa taacgagggc gccgacggag 2640
tgggtaattc ctcgggaaat tggcattgcg attccacatg gatgggcgac agagtcatca 2700
ccaccagcac ccgaacctgg gccctgccca cctacaacaa ccacctctac aaacaaattt 2760
ccagccaatc aggagcctcg aacgacaatc actactttgg ctacagcacc ccttgggggt 2820
attttgactt caacagattc cactgccact tttcaccacg tgactggcaa agactcatca 2880
acaacaactg gggattccga cccaagagac tcaacttcaa gctctttaac attcaagtca 2940
aagaggtcac gcagaatgac ggtacgacga cgattgccaa taaccttacc agcacggttc 3000
aggtgtttac tgactcggag taccagctcc cgtacgtcct cggctcggcg catcaaggat 3060
gcctcccgcc gttcccagca gacgtcttca tggtgccaca gtatggatac ctcaccctga 3120
acaacgggag tcaggcagta ggacgctctt cattttactg cctggagtac tttccttctc 3180
agatgctgcg taccggaaac aactttacct tcagctacac ttttgaggac gttcctttcc 3240
acagcagcta cgctcacagc cagagtctgg accgtctcat gaatcctctc atcgaccagt 3300
acctgtatta cttgagcaga acaaacactc caagtggaac caccacgcag tcaaggcttc 3360
agttttctca ggccggagcg agtgacattc gggaccagtc taggaactgg cttcctggac 3420
cctgttaccg ccagcagcga gtatcaaaga catctgcgga taacaacaac agtgaatact 3480
cgtggactgg agctaccaag taccacctca atggcagaga ctctctggtg aatccgggcc 3540
cggccatggc aagccacaag gacgatgaag aaaagttttt tcctcagagc ggggttctca 3600
tctttgggaa gcaaggctca gagaaaacaa atgtggacat tgaaaaggtc atgattacag 3660
acgaagagga aatcaggaca accaatcccg tggctacgga gcagtatggt tctgtatcta 3720
ccaacctcca gagaggcaac agacaagcag ctaccgcaga tgtcaacaca caaggcgttc 3780
ttccaggcat ggtctggcag gacagagatg tgtaccttca ggggcccatc tgggcaaaga 3840
ttccacacac ggacggacat tttcacccct ctcccctcat gggtggattc ggacttaaac 3900
accctcctcc acagattctc atcaagaaca ccccggtacc tgcgaatcct tcgaccacct 3960
tcagtgcggc aaagtttgct tccttcatca cacagtactc cacgggacag gtcagcgtgg 4020
agatcgagtg ggagctgcag aaggaaaaca gcaaacgctg gaatcccgaa attcagtaca 4080
cttccaacta caacaagtct gttaatgtgg actttactgt ggacactaat ggcgtgtatt 4140
cagagcctcg ccccattggc accagatacc tgactcgtaa tctgtaattg cttgttaatc 4200
aataaaccgt ttaattcgtt tcagttgaac tttggtctct gcgtatttct ttcttatcta 4260
gtttccatgg ctacgtagat aagtagcatg gcgggttaat cattaactac agcccgggcg 4320
tttaaacagc gggcggaggg gtggagtcgt gacgtgaatt acgtcatagg gttagggagg 4380
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtctcgct 4440
gggggggggg gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacga 4500
gcgctggcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 4560
acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag 4620
gcccgcaccg atcgcccttc cc 4642
<210> 7
<211> 2877
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 7
gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctctc tggctaacta 600
gagaacccac tgcttactgg cttatcgaaa ttaatacgac tcactatagg gagacccaag 660
ctggctagca tggctgccga tggttatctt ccagattggc tcgaggacac tctctctgaa 720
ggaataagac agtggtggaa gctcaaacct ggcccaccac caccaaagcc cgcagagcgg 780
cataaggacg acagcagggg tcttgtgctt cctgggtaca agtacctcgg acccttcaac 840
ggactcgaca agggagagcc ggtcaacgag gcagacgccg cggccctcga gcacgacaaa 900
gcctacgacc ggcagctcga cagcggagac aacccgtacc tcaagtacaa ccacgccgac 960
gcggagtttc aggagcgcct taaagaagat acgtcttttg ggggcaacct cggacgagca 1020
gtcttccagg cgaaaaagag ggttcttgaa cctctgggcc tggttgagga acctgttaag 1080
accgctccgg gaaaaaagag gccggtagag cactctcctg tggagccaga ctcctcctcg 1140
ggaaccggaa aggcgggcca gcagcctgca agaaaaagat tgaattttgg tcagactgga 1200
gacgcagact cagtacctga cccccagcct ctcggacagc caccagcagc cccctctggt 1260
ctcggaacta ataccctcgc tacaggcagt ggcgcaccac tcgcagacaa taacgagggc 1320
gccgacggag tgggtaattc ctcgggaaat tggcattgcg attccacatg gctcggcgac 1380
agagtcatca ccaccagcac ccgaacctgg gccctgccca cctacaacaa ccacctctac 1440
aaacaaattt ccagccaatc aggagcctcg aacgacaatc actactttgg ctacagcacc 1500
ccttgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcaa 1560
agactcatca acaacaactg gggattccga cccaagagac tcaacttcaa gctctttaac 1620
attcaagtca aagaggtcac gcagaatgac ggtacgacga cgattgccaa taaccttacc 1680
agcacggttc aggtgtttac tgactcggag taccagctcc cgtacgtcct cggctcggcg 1740
catcaaggat gcctcccgcc gttcccagca gacgtcttca tggtgccaca gtatggatac 1800
ctcaccctga acaacgggag tcaggcagta ggacgctctt cattttactg cctggagtac 1860
tttccttctc agatgctgcg taccggaaac aactttacct tcagctacac ttttgaggac 1920
gttcctttcc acagcagcta cgctcacagc cagagtctgg accgtctcat gaatcctctc 1980
atcgaccagt acctgtatta cttgagcaga acaaacactc caagtggaac caccacgcag 2040
tcaaggcttc agttttctca ggccggagcg agtgacattc gggaccagtc taggaactgg 2100
cttcctggac cctgttaccg ccagcagcga gtatcaaaga catctgcgga taacaacaac 2160
agtgaatact cgtggactgg agctaccaag taccacctca atggcagaga ctctctggtg 2220
aatccgggcc cggccatggc aagccacaag gacgatgaag aaaagttttt tcctcagagc 2280
ggggttctca tctttgggaa gcaaggctca gagaaaacaa atgtggacat tgaaaaggtc 2340
atgattacag acgaagagga aatcaggaca accaatcccg tggctacgga gcagtatggt 2400
tctgtatcta ccaacctcca gagaggcaac agacaagcag ctaccgcaga tgtcaacaca 2460
caaggcgttc ttccaggcat ggtctggcag gacagagatg tgtaccttca ggggcccatc 2520
tgggcaaaga ttccacacac ggacggacat tttcacccct ctcccctcat gggtggattc 2580
ggacttaaac accctcctcc acagattctc atcaagaaca ccccggtacc tgcgaatcct 2640
tcgaccacct tcagtgcggc aaagtttgct tccttcatca cacagtactc cacgggacag 2700
gtcagcgtgg agatcgagtg ggagctgcag aaggaaaaca gcaaacgctg gaatcccgaa 2760
attcagtaca cttccaacta caacaagtct gttaatgtgg actttactgt ggacactaat 2820
ggcgtgtatt cagagcctcg ccccattggc accagatacc tgactcgtaa tctgtaa 2877
<210> 8
<211> 2592
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 8
gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctctc tggctaacta 600
gagaacccac tgcttactgg cttatcgaaa ttaatacgac tcactatagg gagacccaag 660
ctggctagca tggctccggg aaaaaagagg ccggtagagc actctcctgt ggagccagac 720
tcctcctcgg gaaccggaaa ggcgggccag cagcctgcaa gaaaaagatt gaattttggt 780
cagactggag acgcagactc agtacctgac ccccagcctc tcggacagcc accagcagcc 840
ccctctggtc tcggaactaa taccctcgct acaggcagtg gcgcaccact cgcagacaat 900
aacgagggcg ccgacggagt gggtaattcc tcgggaaatt ggcattgcga ttccacatgg 960
ctcggcgaca gagtcatcac caccagcacc cgaacctggg ccctgcccac ctacaacaac 1020
cacctctaca aacaaatttc cagccaatca ggagcctcga acgacaatca ctactttggc 1080
tacagcaccc cttgggggta ttttgacttc aacagattcc actgccactt ttcaccacgt 1140
gactggcaaa gactcatcaa caacaactgg ggattccgac ccaagagact caacttcaag 1200
ctctttaaca ttcaagtcaa agaggtcacg cagaatgacg gtacgacgac gattgccaat 1260
aaccttacca gcacggttca ggtgtttact gactcggagt accagctccc gtacgtcctc 1320
ggctcggcgc atcaaggatg cctcccgccg ttcccagcag acgtcttcat ggtgccacag 1380
tatggatacc tcaccctgaa caacgggagt caggcagtag gacgctcttc attttactgc 1440
ctggagtact ttccttctca gatgctgcgt accggaaaca actttacctt cagctacact 1500
tttgaggacg ttcctttcca cagcagctac gctcacagcc agagtctgga ccgtctcatg 1560
aatcctctca tcgaccagta cctgtattac ttgagcagaa caaacactcc aagtggaacc 1620
accacgcagt caaggcttca gttttctcag gccggagcga gtgacattcg ggaccagtct 1680
aggaactggc ttcctggacc ctgttaccgc cagcagcgag tatcaaagac atctgcggat 1740
aacaacaaca gtgaatactc gtggactgga gctaccaagt accacctcaa tggcagagac 1800
tctctggtga atccgggccc ggccatggca agccacaagg acgatgaaga aaagtttttt 1860
cctcagagcg gggttctcat ctttgggaag caaggctcag agaaaacaaa tgtggacatt 1920
gaaaaggtca tgattacaga cgaagaggaa atcaggacaa ccaatcccgt ggctacggag 1980
cagtatggtt ctgtatctac caacctccag agaggcaaca gacaagcagc taccgcagat 2040
gtcaacacac aaggcgttct tccaggcatg gtctggcagg acagagatgt gtaccttcag 2100
gggcccatct gggcaaagat tccacacacg gacggacatt ttcacccctc tcccctcatg 2160
ggtggattcg gacttaaaca ccctcctcca cagattctca tcaagaacac cccggtacct 2220
gcgaatcctt cgaccacctt cagtgcggca aagtttgctt ccttcatcac acagtactcc 2280
acgggacagg tcagcgtgga gatcgagtgg gagctgcaga aggaaaacag caaacgctgg 2340
aatcccgaaa ttcagtacac ttccaactac aacaagtctg ttaatgtgga ctttactgtg 2400
gacactaatg gcgtgtattc agagcctcgc cccattggca ccagatacct gactcgtaat 2460
ctgtaattgc ttgttaatca ataaaccgtt taattcgttt cagttgaact ttggtctctg 2520
cgtatttctt tcttatctag tttccatggc tacgtagata agtagcatgg cgggttaatc 2580
attaactaca gc 2592
<210> 9
<211> 5595
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 9
gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctctc tggctaacta 600
gagaacccac tgcttactgg cttatcgaaa ttaatacgac tcactatagg gagacccaag 660
ctggctagca tggctgccga tggttatctt ccagattggc tcgaggacac tctctctgaa 720
ggaataagac agtggtggaa gctcaaacct ggcccaccac caccaaagcc cgcagagcgg 780
cataaggacg acagcagggg tcttgtgctt cctgggtaca agtacctcgg acccttcaac 840
ggactcgaca agggagagcc ggtcaacgag gcagacgccg cggccctcga gcacgacaaa 900
gcctacgacc ggcagctcga cagcggagac aacccgtacc tcaagtacaa ccacgccgac 960
gcggagtttc aggagcgcct taaagaagat acgtcttttg ggggcaacct cggacgagca 1020
gtcttccagg cgaaaaagag ggttcttgaa cctctgggcc tggttgagga acctgttaag 1080
accgctccgg gaaaaaagag gccggtagag cactctcctg tggagccaga ctcctcctcg 1140
ggaaccggaa aggcgggcca gcagcctgca agaaaaagat tgaattttgg tcagactgga 1200
gacgcagact cagtacctga cccccagcct ctcggacagc caccagcagc cccctctggt 1260
ctcggaacta ataccctcgc tacaggcagt ggcgcaccac tcgcagacaa taacgagggc 1320
gccgacggag tgggtaattc ctcgggaaat tggcattgcg attccacatg gctcggcgac 1380
agagtcatca ccaccagcac ccgaacctgg gccctgccca cctacaacaa ccacctctac 1440
aaacaaattt ccagccaatc aggagcctcg aacgacaatc actactttgg ctacagcacc 1500
ccttgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcaa 1560
agactcatca acaacaactg gggattccga cccaagagac tcaacttcaa gctctttaac 1620
attcaagtca aagaggtcac gcagaatgac ggtacgacga cgattgccaa taaccttacc 1680
agcacggttc aggtgtttac tgactcggag taccagctcc cgtacgtcct cggctcggcg 1740
catcaaggat gcctcccgcc gttcccagca gacgtcttca tggtgccaca gtatggatac 1800
ctcaccctga acaacgggag tcaggcagta ggacgctctt cattttactg cctggagtac 1860
tttccttctc agatgctgcg taccggaaac aactttacct tcagctacac ttttgaggac 1920
gttcctttcc acagcagcta cgctcacagc cagagtctgg accgtctcat gaatcctctc 1980
atcgaccagt acctgtatta cttgagcaga acaaacactc caagtggaac caccacgcag 2040
tcaaggcttc agttttctca ggccggagcg agtgacattc gggaccagtc taggaactgg 2100
cttcctggac cctgttaccg ccagcagcga gtatcaaaga catctgcgga taacaacaac 2160
agtgaatact cgtggactgg agctaccaag taccacctca atggcagaga ctctctggtg 2220
aatccgggcc cggccatggc aagccacaag gacgatgaag aaaagttttt tcctcagagc 2280
ggggttctca tctttgggaa gcaaggctca gagaaaacaa atgtggacat tgaaaaggtc 2340
atgattacag acgaagagga aatcaggaca accaatcccg tggctacgga gcagtatggt 2400
tctgtatcta ccaacctcca gagaggcaac agacaagcag ctaccgcaga tgtcaacaca 2460
caaggcgttc ttccaggcat ggtctggcag gacagagatg tgtaccttca ggggcccatc 2520
tgggcaaaga ttccacacac ggacggacat tttcacccct ctcccctcat gggtggattc 2580
ggacttaaac accctcctcc acagattctc atcaagaaca ccccggtacc tgcgaatcct 2640
tcgaccacct tcagtgcggc aaagtttgct tccttcatca cacagtactc cacgggacag 2700
gtcagcgtgg agatcgagtg ggagctgcag aaggaaaaca gcaaacgctg gaatcccgaa 2760
attcagtaca cttccaacta caacaagtct gttaatgtgg actttactgt ggacactaat 2820
ggcgtgtatt cagagcctcg ccccattggc accagatacc tgactcgtaa tctgtaattg 2880
cttgttaatc aataaaccgt ttaattcgtt tcagttgaac tttggtctct gcgtatttct 2940
ttcttatcta gtttccatgg ctacgtagat aagtagcatg gcgggttaat cattaactac 3000
aacgcgttga cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt 3060
tcatagccca tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg 3120
accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc 3180
aatagggact ttccattgac gtcaatgggt ggactattta cggtaaactg cccacttggc 3240
agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 3300
gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat 3360
ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg 3420
tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag 3480
tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt 3540
gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctctggct 3600
aactagagaa cccactgctt actggcttat cgaaattaat acgactcact atagggagac 3660
ccaagctggc tagcatggct ccgggaaaaa agaggccggt agagcactct cctgtggagc 3720
cagactcctc ctcgggaacc ggaaaggcgg gccagcagcc tgcaagaaaa agattgaatt 3780
ttggtcagac tggagacgca gactcagtac ctgaccccca gcctctcgga cagccaccag 3840
cagccccctc tggtctcgga actaataccc tcgctacagg cagtggcgca ccactcgcag 3900
acaataacga gggcgccgac ggagtgggta attcctcggg aaattggcat tgcgattcca 3960
catggctcgg cgacagagtc atcaccacca gcacccgaac ctgggccctg cccacctaca 4020
acaaccacct ctacaaacaa atttccagcc aatcaggagc ctcgaacgac aatcactact 4080
ttggctacag caccccttgg gggtattttg acttcaacag attccactgc cacttttcac 4140
cacgtgactg gcaaagactc atcaacaaca actggggatt ccgacccaag agactcaact 4200
tcaagctctt taacattcaa gtcaaagagg tcacgcagaa tgacggtacg acgacgattg 4260
ccaataacct taccagcacg gttcaggtgt ttactgactc ggagtaccag ctcccgtacg 4320
tcctcggctc ggcgcatcaa ggatgcctcc cgccgttccc agcagacgtc ttcatggtgc 4380
cacagtatgg atacctcacc ctgaacaacg ggagtcaggc agtaggacgc tcttcatttt 4440
actgcctgga gtactttcct tctcagatgc tgcgtaccgg aaacaacttt accttcagct 4500
acacttttga ggacgttcct ttccacagca gctacgctca cagccagagt ctggaccgtc 4560
tcatgaatcc tctcatcgac cagtacctgt attacttgag cagaacaaac actccaagtg 4620
gaaccaccac gcagtcaagg cttcagtttt ctcaggccgg agcgagtgac attcgggacc 4680
agtctaggaa ctggcttcct ggaccctgtt accgccagca gcgagtatca aagacatctg 4740
cggataacaa caacagtgaa tactcgtgga ctggagctac caagtaccac ctcaatggca 4800
gagactctct ggtgaatccg ggcccggcca tggcaagcca caaggacgat gaagaaaagt 4860
tttttcctca gagcggggtt ctcatctttg ggaagcaagg ctcagagaaa acaaatgtgg 4920
acattgaaaa ggtcatgatt acagacgaag aggaaatcag gacaaccaat cccgtggcta 4980
cggagcagta tggttctgta tctaccaacc tccagagagg caacagacaa gcagctaccg 5040
cagatgtcaa cacacaaggc gttcttccag gcatggtctg gcaggacaga gatgtgtacc 5100
ttcaggggcc catctgggca aagattccac acacggacgg acattttcac ccctctcccc 5160
tcatgggtgg attcggactt aaacaccctc ctccacagat tctcatcaag aacaccccgg 5220
tacctgcgaa tccttcgacc accttcagtg cggcaaagtt tgcttccttc atcacacagt 5280
actccacggg acaggtcagc gtggagatcg agtgggagct gcagaaggaa aacagcaaac 5340
gctggaatcc cgaaattcag tacacttcca actacaacaa gtctgttaat gtggacttta 5400
ctgtggacac taatggcgtg tattcagagc ctcgccccat tggcaccaga tacctgactc 5460
gtaatctgta attgcttgtt aatcaataaa ccgtttaatt cgtttcagtt gaactttggt 5520
ctctgcgtat ttctttctta tctagtttcc atggctacgt agataagtag catggcgggt 5580
taatcattaa ctaca 5595
<210> 10
<211> 10010
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 10
cccgtgtaaa acgacggcca gtttatctag tcagcttgat tctagctgat cgtggaccgg 60
aaggtgagcc agtgagttga ttgcagtcca gttacgctgg agtctgaggc tcgtcctgaa 120
tgatatgcga ccgccggagg gttgcgtttg agacgggcga cagatccagt cgcgctgctc 180
tcgtcgatcc gctaggacta tggttgcttt gacgtatgcg gtgtgaaata ccgcacagat 240
gcgtaaggag aaaataccgc atcaggcgcc cctgcaggca gctgcgcgct cgctcgctca 300
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 360
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc tgcggccgct 420
cggtccgcac gtggttacct acaaaatcag aaggacaggg aagggagcag tggttcacgc 480
ctgtaatccc agcaatttgg gaggccaagg tgggtagatc acctgagatt aggagttgga 540
gaccagcctg gccaatatgg tgaaaccccg tctctaccaa aaaaacaaaa attagctgag 600
cctggtcatg catgcctgga atcccaacaa ctcgggaggc tgaggcagga gaatcgcttg 660
aacccaggag gcggagattg cagtgagcca agattgtgcc actgcactcc agcttggttc 720
ccaatagacc ccgcaggccc tacaggttgt cttcccaact tgccccttgc tccataccac 780
ccccctccac cccataatat tatagaagga cacctagtca gacaaaatga tgcaacttaa 840
ttttattagg acaaggctgg tgggcactgg agtggcaact tccagggcca ggagaggcac 900
tggggagggg tcacagggat gccacccgta gatctctcga gcagcgctgc tcgaggcaag 960
cttctgcagg tcgactctag aggatcccta cttgagctcg agatctgagt acttgtacag 1020
ctcgtccatg ccgagagtga tcccggcggc ggtcacgaac tccagcagga ccatgtgatc 1080
gcgcttctcg ttggggtctt tgctcagggc ggactgggtg ctcaggtagt ggttgtcggg 1140
cagcagcacg gggccgtcgc cgatgggggt gttctgctgg tagtggtcgg cgagctgcac 1200
gctgccgtcc tcgatgttgt ggcggatctt gaagttcacc ttgatgccgt tcttctgctt 1260
gtcggccatg atatagacgt tgtggctgtt gtagttgtac tccagcttgt gccccaggat 1320
gttgccgtcc tccttgaagt cgatgccctt cagctcgatg cggttcacca gggtgtcgcc 1380
ctcgaacttc acctcggcgc gggtcttgta gttgccgtcg tccttgaaga agatggtgcg 1440
ctcctggacg tagccttcgg gcatggcgga cttgaagaag tcgtgctgct tcatgtggtc 1500
ggggtagcgg ctgaagcact gcacgccgta ggtcagggtg gtcacgaggg tgggccaggg 1560
cacgggcagc ttgccggtgg tgcagatgaa cttcagggtc agcttgccgt aggtggcatc 1620
gccctcgccc tcgccggaca cgctgaactt gtggccgttt acgtcgccgt ccagctcgac 1680
caggatgggc accaccccgg tgaacagctc ctcgcccttg ctcaccattc agaattcaat 1740
cgatgttcga atcccaattc tttgccaaag tgatgggcca gcacacagac cagcacgttg 1800
cccaggagct gtgggaggaa gataagaggt atgaacatga ttagcaaaag ggcctagctt 1860
ggactcagaa taatccagcc ttatcccaac cataaaataa aagcagaatg gtagctggat 1920
tgtagctgct attagcaata tgaaacctct tacatcagtt acaatttata tgcagaaata 1980
tttatatgca gaaatattgc tattgcctta acccagaaat tatcactgtt attctttaga 2040
atggtgcaaa gaggcatgat acattgtatc attattgccc tgaaagaaag agattaggga 2100
aagtattaga aataagataa acaaaaaagt atattaaaag aagaaagcat tttttgtggg 2160
cctatagact ctataggcgg tacttacgtc actcttggca cggggaatcc gcgttccaat 2220
gcaccgttcc cggccgggat tcgaatccgc ggaggctgga tcggtcccgg tgtcttctat 2280
ggaggtcaaa acagcgtgga tggcgtctcc aggcgatctg acggttcact aaacgagctc 2340
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 2400
tgttacgaca ttttggaaag tcccgttgat tttggtgcaa aacaaactcc cattgacgtc 2460
aatggggtgg agacttggaa atccccgtga gtcaaaccgc tatccacgcc cattgatgta 2520
ctgccaaaac cgcatcacca tggtaatagc gatgactaat acgtagatgt actgccaagt 2580
aggaaagtcc cataaggtca tgtactgggc ataatgccag gcgggccatt taccgtcatt 2640
gacgtcaata gggggcgtac ttggcatatg atacacttga tgtactgcca agtgggcagt 2700
ttaccgtaaa tactccaccc attgacgtca atggaaagtc cctattgacg ttactatggg 2760
aacatacgtc attattgacg tcaatgggcg ggggtcgttg ggcggtcagc caggcgggcc 2820
atttaccgta agttatgtaa cgcggaactc catatatggg ctatgaacta atgaccccgt 2880
aattgattac tattaataac tagctccacg cgtgcggccg caggaacccc tagtgatgga 2940
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 3000
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 3060
ggacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 3120
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 3180
gtggcgaaac ccgagctagc aaaaaatgcc cggagcggga cttgaacccg cacagcgcga 3240
acgccgaggg atttagagtc ccttgtgtct accgattcca ccatccgggc ggtgtttcgt 3300
cctttccaca agatatataa agccaagaaa tcgaaatact ttcaagttac ggtaagcata 3360
tgatagtcca ttttaaaaca taattttaaa actgcaaact acccaagaaa ttattacttt 3420
ctacgtcacg tattttgtac taatatcttt gtgtttacag tcaaattaat tctaattatc 3480
tctctaacag ccttgtatcg tatatgcaaa tatgaaggaa tcatgggaaa taggccctct 3540
tcctgcccga ggtaccccta gcaaaaaatg cccggagcgg gacttgaacc cgcacagcgc 3600
gaacgccgag ggatttagag tcccttgtgt ctaccgattc caccatccgg gcggtgtttc 3660
gtcctttcca caagatatat aaagccaaga aatcgaaata ctttcaagtt acggtaagca 3720
tatgatagtc cattttaaaa cataatttta aaactgcaaa ctacccaaga aattattact 3780
ttctacgtca cgtattttgt actaatatct ttgtgtttac agtcaaatta attctaatta 3840
tctctctaac agccttgtat cgtatatgca aatatgaagg aatcatggga aataggccct 3900
cttcctgccc gaggtacccc tagcaaaaaa tgcccggagc gggacttgaa cccgcacagc 3960
gcgaacgccg agggatttag agtcccttgt gtctaccgat tccaccatcc gggcggtgtt 4020
tcgtcctttc cacaagatat ataaagccaa gaaatcgaaa tactttcaag ttacggtaag 4080
catatgatag tccattttaa aacataattt taaaactgca aactacccaa gaaattatta 4140
ctttctacgt cacgtatttt gtactaatat ctttgtgttt acagtcaaat taattctaat 4200
tatctctcta acagccttgt atcgtatatg caaatatgaa ggaatcatgg gaaataggcc 4260
ctcttcctgc ccgaggtacc cctagcaaaa aatgcccgga gcgggacttg aacccgcaca 4320
gcgcgaacgc cgagggattt agagtccctt gtgtctaccg attccaccat ccgggcggtg 4380
tttcgtcctt tccacaagat atataaagcc aagaaatcga aatactttca agttacggta 4440
agcatatgat agtccatttt aaaacataat tttaaaactg caaactaccc aagaaattat 4500
tactttctac gtcacgtatt ttgtactaat atctttgtgt ttacagtcaa attaattcta 4560
attatctctc taacagcctt gtatcgtata tgcaaatatg aaggaatcat gggaaatagg 4620
ccctcttcct gcccgaggta cccctaggtg cgctgcttcg cgatgtacgg gccagatata 4680
cgcgttgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 4740
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 4800
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 4860
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 4920
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 4980
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 5040
acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 5100
gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgca aatgggcggt 5160
aggcgtgtac ggtgggaggt ctatataagc agagctctct ggctaactag agaacccact 5220
gcttactggc ttatcgaaat taatacgact cactataggg agacccaagc tggctagcgt 5280
ttaaacttaa gcttgccgcc accatggaag agcaataccg cccggaagag atagaatcca 5340
aagtacagct tcattgggat gagaagcgca catttgaagt aaccgaagac gagagcaaag 5400
agaagtatta ctgcctgtct atcctcccct atccttctgg tcgactacac atgggccacg 5460
tacgtaacta caccatcggt gacgtgatcg cccgctacca gcgtatgctg ggcaaaaacg 5520
tcctgcagcc gatcggctgg gacgcgtttg gtctgcctgc ggaaggcgcg gcggtgaaaa 5580
acaacaccgc tccggcaccg tggacgtacg acaacatcgc gtatatgaaa aaccagctca 5640
aaatgctggg ctttggttat gactggagcc gcgagctggc aacctgtacg ccggaatact 5700
accgttggga acagaaattc ttcaccgagc tgtataaaaa aggcctggta tataagaaga 5760
cttctgcggt caactggtgt ccgaacgacc agaccgtact ggcgaacgaa caagttatcg 5820
acggctgctg ctggcgctgc gataccaaag ttgaacgtaa agagatcccg cagtggttta 5880
tcaaaatcac tgcttacgct gacgagctgc tcaacgatct ggataaactg gatcactggc 5940
cagacaccgt taaaaccatg cagcgtaact ggatcggtcg ttccgaaggc gtggagatca 6000
ccttcaacgt taacgactat gacaacacgc tgaccgttta cactacccgc ccggacgcgt 6060
ttatgggttg tacctacctg gcggtagctg cgggtcatcc gctggcgcag aaagcggcgg 6120
aaaataatcc tgaactggcg gcctttattg acgaatgccg taacaccaaa gttgccgaag 6180
ctgaaatggc gacgatggag aaaaaaggcg tcgatactgg ctttaaagcg gttcacccat 6240
taacgggcga agaaattccc gtttgggcag caaacttcgt attgatggag tacggcacgg 6300
gcgcagttat ggcggtaccg gggcacgacc agcgcgacta cgagtttgcc tctaaatacg 6360
gcctgaacat caaaccggtt atcctggcag ctgacggctc tgagccagat ctttctcagc 6420
aagccctgac tgaaaaaggc gtgctgttca actctggcga gttcaacggt cttgaccatg 6480
aagcggcctt caacgccatc gccgataaac tgactgcgat gggcgttggc gagcgtaaag 6540
tgaactaccg cctgcgcgac tggggtgttt cccgtcagcg ttactggggc gcgccgattc 6600
cgatggtgac tctagaagac ggtaccgtaa tgccgacccc ggacgaccag ctgccggtga 6660
tcctgccgga agatgtggta atggacggca ttaccagccc gattaaagca gatccggagt 6720
gggcgaaaac taccgttaac ggtatgccag cactgcgtga aaccgacact ttcgacacct 6780
ttatggagtc ctcctggatc tatgcgcgct acacttgccc gcagtacaaa gaaggtatgc 6840
tggattccga agcggctaac tactggctgc cggtggatat cgctattggt ggtattgaac 6900
acgccattat gggtctgctc tacttccgct tcttccacaa actgatgcgt gatgcaggca 6960
tggtgaactc tgacgaacca gcgaaacagt tgctgtgtca gggtatggtg ctggcagatg 7020
ccttctacta tgttggcgaa aacggcgaac gtaactgggt ttccccggtt gatgctatcg 7080
ttgaacgtga cgagaaaggc cgtatcgtga aagcgaaaga tgcggcaggc catgaactgg 7140
tttataccgg catgagcaaa atgtccaagt cgaagaacaa cggtatcgac ccgcaggtga 7200
tggttgaacg ttacggcgcg gacaccgttc gtctgtttat gatgtttgct tctccggctg 7260
atatgactct cgaatggcag gaatccggtg tggaaggggc taaccgcttc ctgaaacgtg 7320
tctggaaact ggtttacgag cacacagcaa aaggtgatgt tgcggcactg aacgttgatg 7380
cgctgactga aaatcagaaa gcgctgcgtc gcgatgtgca taaaacgatc gctaaagtga 7440
ccgatgatat cggccgtcgt cagaccttca acaccgcaat tgcggcgatt atggagctga 7500
tgaacaaact ggcgaaagca ccaaccgatg gcgagcagga tcgcgctctg atgcaggaag 7560
cactgctggc cgttgtccgt atgcttaacc cgttcacccc gcacatctgc ttcacgctgt 7620
ggcaggaact gaaaggcgaa ggcgatatcg acaacgcgcc gtggccggtt gctgacgaaa 7680
aagcgatggt ggaagactcc acgctggtcg tggtgcaggt taacggtaaa gtccgtgcca 7740
aaatcaccgt tccggtggac gcaacggaag aacaggttcg cgaacgtgct ggccaggaac 7800
atctggtagc aaaatatctt gatggcgtta ctgtacgtaa agtgatttac gtaccaggta 7860
aactcctcaa tctggtcgtt ggcgggcccg tttaactcga gtctagaggg cccgtttaaa 7920
cccgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt tgcccctccc 7980
ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg 8040
aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg 8100
acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta 8160
tggcttctga ggcggaaaga accctagggg tgcgagcgga tcgagcagtg tcgatcacta 8220
ctggaccgcg agctgtgctg cgacccgtga tcttacggca ttatacgtat gatcggtcca 8280
cgatcagcta gattatctag tcagcttgat gtcatagctg tttcctgagg ctcaatactg 8340
accatttaaa tcatacctga cctccatagc agaaagtcaa aagcctccga ccggaggctt 8400
ttgacttgat cggcacgtaa gaggttccaa ctttcaccat aatgaaataa gatcactacc 8460
gggcgtattt tttgagttat cgagattttc aggagctaag gaagctaaaa tgagccatat 8520
tcaacgggaa acgtcttgct tgaagccgcg attaaattcc aacatggatg ctgatttata 8580
tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt gcgacaatct atcgattgta 8640
tgggaagccc gatgcgccag agttgtttct gaaacatggc aaaggtagcg ttgccaatga 8700
tgttacagat gagatggtca ggctaaactg gctgacggaa tttatgcctc ttccgaccat 8760
caagcatttt atccgtactc ctgatgatgc atggttactc accactgcga tcccagggaa 8820
aacagcattc caggtattag aagaatatcc tgattcaggt gaaaatattg ttgatgcgct 8880
ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt aattgtcctt ttaacggcga 8940
tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat aacggtttgg ttggtgcgag 9000
tgattttgat gacgagcgta atggctggcc tgttgaacaa gtctggaaag aaatgcataa 9060
actcttgcca ttctcaccgg attcagtcgt cactcatggt gatttctcac ttgataacct 9120
tatttttgac gaggggaaat taataggttg tattgatgtt ggacgagtcg gaatcgcaga 9180
ccgataccag gatcttgcca tcctatggaa ctgcctcggt gagttttctc cttcattaca 9240
gaaacggctt tttcaaaaat atggtattga taatcctgat atgaataaat tgcagtttca 9300
cttgatgctc gatgagtttt tctaatgagg acctaaatgt aatcacctgg ctcaccttcg 9360
ggtgggcctt tctgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 9420
caaaaatcga tgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 9480
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 9540
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 9600
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 9660
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 9720
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 9780
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 9840
tatctgcgct ctgctgaagc cagttacctc ggaaaaagag ttggtagctc ttgatccggc 9900
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 9960
aaaaaaggat ctcaagaaga tcctttgatt ttctaccgaa gaaaggccca 10010
<210> 11
<211> 10183
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 11
cccgtgtaaa acgacggcca gtttatctag tcagcttgat tctagctgat cgtggaccgg 60
aaggtgagcc agtgagttga ttgcagtcca gttacgctgg agtctgaggc tcgtcctgaa 120
tgatatgcga ccgccggagg gttgcgtttg agacgggcga cagatccagt cgcgctgctc 180
tcgtcgatcc gctagggcgg ccgcaaatac ctgcaggcag ctgcgcgctc gctcgctcac 240
tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag 300
cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct gcggccgctc 360
ggtccgcacg tggttaccta caaaatcaga aggacaggga agggagcagt ggttcacgcc 420
tgtaatccca gcaatttggg aggccaaggt gggtagatca cctgagatta ggagttggag 480
accagcctgg ccaatatggt gaaaccccgt ctctaccaaa aaaacaaaaa ttagctgagc 540
ctggtcatgc atgcctggaa tcccaacaac tcgggaggct gaggcaggag aatcgcttga 600
acccaggagg cggagattgc agtgagccaa gattgtgcca ctgcactcca gcttggttcc 660
caatagaccc cgcaggccct acaggttgtc ttcccaactt gccccttgct ccataccacc 720
cccctccacc ccataatatt atagaaggac acctagtcag acaaaatgat gcaacttaat 780
tttattagga caaggctggt gggcactgga gtggcaactt ccagggccag gagaggcact 840
ggggaggggt cacagggatg ccacccgtag atctctcgag cagcgctgct cgaggcaagc 900
ttctgcaggt cgactctaga ggatccctac ttgagctcga gatctgagta cttgtacagc 960
tcgtccatgc cgagagtgat cccggcggcg gtcacgaact ccagcaggac catgtgatcg 1020
cgcttctcgt tggggtcttt gctcagggcg gactgggtgc tcaggtagtg gttgtcgggc 1080
agcagcacgg ggccgtcgcc gatgggggtg ttctgctggt agtggtcggc gagctgcacg 1140
ctgccgtcct cgatgttgtg gcggatcttg aagttcacct tgatgccgtt cttctgcttg 1200
tcggccatga tatagacgtt gtggctgttg tagttgtact ccagcttgtg ccccaggatg 1260
ttgccgtcct ccttgaagtc gatgcccttc agctcgatgc ggttcaccag ggtgtcgccc 1320
tcgaacttca cctcggcgcg ggtcttgtag ttgccgtcgt ccttgaagaa gatggtgcgc 1380
tcctggacgt agccttcggg catggcggac ttgaagaagt cgtgctgctt catgtggtcg 1440
gggtagcggc tgaagcactg cacgccgtag gtcagggtgg tcacgagggt gggccagggc 1500
acgggcagct tgccggtggt gcagatgaac ttcagggtca gcttgccgta ggtggcatcg 1560
ccctcgccct cgccggacac gctgaacttg tggccgttta cgtcgccgtc cagctcgacc 1620
aggatgggca ccaccccggt gaacagctcc tcgcccttgc tcaccattca gaattcaatc 1680
gatgttcgaa tcccaattct ttgccaaagt gatgggccag cacacagacc agcacgttgc 1740
ccaggagctg tgggaggaag ataagaggta tgaacatgat tagcaaaagg gcctagcttg 1800
gactcagaat aatccagcct tatcccaacc ataaaataaa agcagaatgg tagctggatt 1860
gtagctgcta ttagcaatat gaaacctctt acatcagtta caatttatat gcagaaatat 1920
ttatatgcag aaatattgct attgccttaa cccagaaatt atcactgtta ttctttagaa 1980
tggtgcaaag aggcatgata cattgtatca ttattgccct gaaagaaaga gattagggaa 2040
agtattagaa ataagataaa caaaaaagta tattaaaaga agaaagcatt ttttgtgggc 2100
ctatagactc tataggcggt acttacgtca ctcttggcac ggggaatccg cgttccaatg 2160
caccgttccc ggccgggatt cgaatccgcg gaggctggat cggtcccggt gtcttctatg 2220
gaggtcaaaa cagcgtggat ggcgtctcca ggcgatctga cggttcacta aacgagctct 2280
gcttatatag acctcccacc gtacacgcct accgcccatt tgcgtcaatg gggcggagtt 2340
gttacgacat tttggaaagt cccgttgatt ttggtgcaaa acaaactccc attgacgtca 2400
atggggtgga gacttggaaa tccccgtgag tcaaaccgct atccacgccc attgatgtac 2460
tgccaaaacc gcatcaccat ggtaatagcg atgactaata cgtagatgta ctgccaagta 2520
ggaaagtccc ataaggtcat gtactgggca taatgccagg cgggccattt accgtcattg 2580
acgtcaatag ggggcgtact tggcatatga tacacttgat gtactgccaa gtgggcagtt 2640
taccgtaaat actccaccca ttgacgtcaa tggaaagtcc ctattgacgt tactatggga 2700
acatacgtca ttattgacgt caatgggcgg gggtcgttgg gcggtcagcc aggcgggcca 2760
tttaccgtaa gttatgtaac gcggaactcc atatatgggc tatgaactaa tgaccccgta 2820
attgattact attaataact agctccacgc gtgcggccgc aggaacccct agtgatggag 2880
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 2940
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag 3000
gctcgatccg ctcgcaccct aggtcgggca ggaagagggc ctatttccca tgattccttc 3060
atatttgcat atacgataca aggctgttag agagataatt agaattaatt tgactgtaaa 3120
cacaaagata ttagtacaaa atacgtgacg tagaaagtaa taatttcttg ggtagtttgc 3180
agttttaaaa ttatgtttta aaatggacta tcatatgctt accgtaactt gaaagtattt 3240
cgatttcttg gctttatata tcttgtggaa aggacgaaac accaggggcg tagttcaatt 3300
ggtagagcac cggtcttcaa aaccgggtgt tgggagttcg agtctctccg cccctgccat 3360
tttttgctag gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat 3420
acgatacaag gctgttagag agataattag aattaatttg actgtaaaca caaagatatt 3480
agtacaaaat acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt 3540
atgttttaaa atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc 3600
tttatatatc ttgtggaaag gacgaaacac caggggcgta gttcaattgg tagagcaccg 3660
gtcttcaaaa ccgggtgttg ggagttcgag tctctccgcc cctgccattt tttgctaggt 3720
cgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 3780
tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 3840
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 3900
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 3960
gtggaaagga cgaaacacca ggggcgtagt tcaattggta gagcaccggt cttcaaaacc 4020
gggtgttggg agttcgagtc tctccgcccc tgccattttt tgctaggtcg ggcaggaaga 4080
gggcctattt cccatgattc cttcatattt gcatatacga tacaaggctg ttagagagat 4140
aattagaatt aatttgactg taaacacaaa gatattagta caaaatacgt gacgtagaaa 4200
gtaataattt cttgggtagt ttgcagtttt aaaattatgt tttaaaatgg actatcatat 4260
gcttaccgta acttgaaagt atttcgattt cttggcttta tatatcttgt ggaaaggacg 4320
aaacaccagg ggcgtagttc aattggtaga gcaccggtct tcaaaaccgg gtgttgggag 4380
ttcgagtctc tccgcccctg ccattttttg ctaggtcggg caggaagagg gcctatttcc 4440
catgattcct tcatatttgc atatacgata caaggctgtt agagagataa ttagaattaa 4500
tttgactgta aacacaaaga tattagtaca aaatacgtga cgtagaaagt aataatttct 4560
tgggtagttt gcagttttaa aattatgttt taaaatggac tatcatatgc ttaccgtaac 4620
ttgaaagtat ttcgatttct tggctttata tatcttgtgg aaaggacgaa acaccagggg 4680
cgtagttcaa ttggtagagc accggtcttc aaaaccgggt gttgggagtt cgagtctctc 4740
cgcccctgcc attttttgct aggtcgggca ggaagagggc ctatttccca tgattccttc 4800
atatttgcat atacgataca aggctgttag agagataatt agaattaatt tgactgtaaa 4860
cacaaagata ttagtacaaa atacgtgacg tagaaagtaa taatttcttg ggtagtttgc 4920
agttttaaaa ttatgtttta aaatggacta tcatatgctt accgtaactt gaaagtattt 4980
cgatttcttg gctttatata tcttgtggaa aggacgaaac accaggggcg tagttcaatt 5040
ggtagagcac cggtcttcaa aaccgggtgt tgggagttcg agtctctccg cccctgccat 5100
tttttgctag gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat 5160
acgatacaag gctgttagag agataattag aattaatttg actgtaaaca caaagatatt 5220
agtacaaaat acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt 5280
atgttttaaa atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc 5340
tttatatatc ttgtggaaag gacgaaacac caggggcgta gttcaattgg tagagcaccg 5400
gtcttcaaaa ccgggtgttg ggagttcgag tctctccgcc cctgccattt tttgctaggt 5460
cgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 5520
tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 5580
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 5640
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 5700
gtggaaagga cgaaacacca ggggcgtagt tcaattggta gagcaccggt cttcaaaacc 5760
gggtgttggg agttcgagtc tctccgcccc tgccattttt tgctaggtta ttaatagtaa 5820
tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 5880
gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 5940
tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggactattta 6000
cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 6060
gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 6120
tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt 6180
tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac 6240
cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt 6300
cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat 6360
ataagcagag ctctctggct aactagagaa cccactgctt actggcttat cgaaattaat 6420
acgactcact atagggagac ccaagctggc tagcgccacc atgactaagc ccatcgtttt 6480
tgctggcgca cagccctcag gtgaattgac cattggtaac tacatgggtg cgctgcgtca 6540
gtgggtaaac atgcaggatg actaccattg catttactgt atcgttgacc aacacgcgat 6600
caccgtgcgc caggatgcac agaagctgcg taaagcgacg ctggatacgc tggccttgta 6660
tctggcttgt ggtatcgatc ctgagaaaag caccattttt gttcagtccc acgtgccgga 6720
acatgcacag ttaggctggg cactgaactg ctatacctac ttcggcgaac tgagtcgcat 6780
gacgcagttt aaagataaat ctgcgcgtta tgccgagaac atcaacgctg gtctgtttga 6840
ctatccggtg ctgatggcag cggacatcct gctgtatcaa actaatctgg gtccttgtgg 6900
tgaagaccag aaacagcacc tcgaactgag ccgcgatatt gcccagcgtt tcaacgcgct 6960
gtatggcgag atctttaagg tgccggagcc gtttattccg aaatctggcg cgcgcgtaat 7020
gtcgctgctg gagccgacca agaagatgtc caagtctgac gataatcgca ataacgttat 7080
cggcctgctg gaagatccga aatcggtagt gaagaaaatc aaacgtgcgg tcactgactc 7140
cgacgagccg ccggtagttc gctacgatgt gcagaacaaa gcgggcgttt ccaacctgtt 7200
ggatatcctt tcagcggtaa cgggccagag catcccagaa ctggaaaaac agttcgaagg 7260
caagatgtat ggtcatctga aaggtgaagt ggctgatgcc gtttccggta tgctgactga 7320
attgcaggaa cgctatcacc gtttccgcaa cgatgaagcc ttcctgcaac aggtgatgaa 7380
agatggcgcg gaaaaagcca gcgcgcacgc ttcccgtacg ctaaaagcgg tgtacgaagc 7440
gattggtttt gtggcgaagc cgtaagaatt caacgcgtta agtcgacaat caacctctgg 7500
attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat 7560
gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt 7620
tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca 7680
ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg 7740
ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg 7800
aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca 7860
attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca 7920
cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc 7980
ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc 8040
agacgagtcg gatctccctt tgggccgcct ccccgcgtcg actttaactc gagtctagag 8100
ggcccgttta aacccgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg 8160
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 8220
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 8280
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 8340
cggtgggctc tatggactag gggtgcgagc ggatcgagca gtgtcgatca ctactggacc 8400
gcgagctgtg ctgcgacccg tgatcttacg gcattatacg tatgatcggt ccacgatcag 8460
ctagattatc tagtcagctt gatgtcatag ctgtttcctg aggctcaata ctgaccattt 8520
aaatcatacc tgacctccat agcagaaagt caaaagcctc cgaccggagg cttttgactt 8580
gatcggcacg taagaggttc caactttcac cataatgaaa taagatcact accgggcgta 8640
ttttttgagt tatcgagatt ttcaggagct aaggaagcta aaatgagcca tattcaacgg 8700
gaaacgtctt gcttgaagcc gcgattaaat tccaacatgg atgctgattt atatgggtat 8760
aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgatt gtatgggaag 8820
cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca 8880
gatgagatgg tcaggctaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat 8940
tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatcccagg gaaaacagca 9000
ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg 9060
ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacgg cgatcgcgta 9120
tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttggtgc gagtgatttt 9180
gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca taaactcttg 9240
ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt 9300
gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac 9360
caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg 9420
ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt tcacttgatg 9480
ctcgatgagt ttttctaatg aggacctaaa tgtaatcacc tggctcacct tcgggtgggc 9540
ctttctgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 9600
cgatgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 9660
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 9720
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 9780
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 9840
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 9900
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 9960
gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc 10020
gctctgctga agccagttac ctcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 10080
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 10140
gatctcaaga agatcctttg attttctacc gaagaaaggc cca 10183
Claims (39)
- 유전자-변형된 아데노-관련 바이러스(AAV)로서,
AAV 캡시드는 적어도 하나의 변이 부 캡시드 단백질(variant minor capsid protein) VP1, VP2 또는 VP1 및 VP2 둘 다를 포함하고, 상기 변이 부 캡시드 단백질은 야생형 AVV VP1 또는 VP2 캡시드 단백질에 비해 천연 아미노산 또는 비천연 아미노산(UAA)이 혼입되도록 하나 이상의 아미노산 잔기 부위에서 돌연변이된, 유전자-변형된 아데노-관련 바이러스. - 제1항에 있어서, 변이 부 캡시드 단백질을 포함하고, 상기 변이 캡시드 암호화 서열은 VP1, VP2 또는 VP1 및 VP2 둘 다의 번역이 방해되도록 상기 AAV VP1 또는 VP2 또는 VP3 캡시드 단백질 열린 해독 틀(ORF)의 번역 기원에서 돌연변이된, 유전자-변형된 아데노-관련 바이러스.
- 제2항에 있어서, 상기 AAV 캡시드 단백질은 서열번호 1 또는 서열번호 1의 적어도 약 80%의 서열 동일성을 포함하는 서열을 포함하는, 유전자-변형된 아데노-관련 바이러스.
- 제3항에 있어서, 종결 코돈이 상기 캡시드 단백질(들)에 포함되고 상기 종결 코돈은 TAG, TAA 또는 TGA 코돈인, 유전자-변형된 아데노-관련 바이러스.
- 제1항에 있어서, 변이 부 캡시드 단백질을 포함하고, 상기 천연 아미노산 잔기는 시스테인 또는 셀레노시스테인인, 유전자-변형된 아데노-관련 바이러스.
- 제1항에 있어서, 변이 부 캡시드 단백질을 포함하고, 상기 비천연-발생 아미노산은 페닐알라닌 유사체, 티로실 유사체, 트립토파닐 유사체 또는 라이실 유사체로 이루어진 군에서 선택된 것인, 유전자-변형된 아데노-관련 바이러스.
- 제7항에 있어서, 변이 부 캡시드 단백질을 포함하고, 상기 유사체는 p-벤조일페닐알라닌(pBpA); O-메틸티로신(OMeY); 5-아지도트립토판; 5-프로파길옥시트립토판; 5-아미노트립토판; 5-메톡시트립토판; 5-O-알릴트립토판; 5-브로모트립토판; 아지도-라이신(AzK); C5Az; LCA; Nε-아세틸라이신(AcK); 사이클로프로펜 아미노산, N ε -(1-메틸사이클로프로프-2-에네카복사미도)-라이신(CpK); 5-하이드록시-트립토판(5-HTP); LCAlk; DiaazK 및 LCKet로 이루어진 군에서 선택된 것인, 유전자-변형된 아데노-관련 바이러스.
- 제1항에 있어서, 상기 변이 부 캡시드 단백질의 천연 또는 비천연 아미노산 잔기는 생물접합 핸들(bioconjugation handle)을 포함하는, 유전자-변형된 아데노-관련 바이러스.
- 제9항에 있어서, 상기 AAV 캡시드는 캡시드당 5 내기 10개의 생물접합 핸들을 포함하는, 유전자-변형된 아데노-관련 바이러스.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 적어도 하나의 변이 부 캡시드 단백질 VP1, VP2 또는 VP1 및 VP2 둘 다를 포함하고, 상기 AAV는,
a) 야생형 AAV와 유사한 표적 세포의 감염성;
b) 야생형 AAV와 유사한 역가로 패키징되는 특성; 또는
c) a) 및 b)의 특성 둘 다
를 특징으로 하는, 유전자-변형된 아데노-관련 바이러스. - 유전자-변형된 감염성 아데노-관련 바이러스(AAV)로서,
상기 유전자-변형된 AAV는 변이 부 캡시드 단백질 VP1, VP2 또는 VP1 및 VP2 둘 다를 포함하고, 상기 VP1, VP2 또는 VP1 및 VP2 둘 다는 하나 이상의 돌연변이된 아미노산 잔기를 포함하는, 유전자-변형된 감염성 아데노-관련 바이러스. - 제12항에 있어서, 상기 변이 캡시드 단백질은 VP1, VP2 또는 VP1 및 VP2 둘 다의 하나 이상의 돌연변이된 아미노산 잔기를 포함하고 상기 돌연변이된 아미노산 잔기 부위는 비천연 아미노산(UAA)을 포함하는, 유전자-변형된 감염성 아데노-관련 바이러스.
- 제13항에 있어서, 변이 캡시드 단백질을 포함하고, 상기 비천연-발생 아미노산은 페닐알라닌 유사체, 티로실 유사체, 트립토파닐 유사체 또는 라이실 유사체로 이루어진 군에서 선택된 것인, 유전자-변형된 감염성 아데노-관련 바이러스.
- 제12항 내지 제15항 중 어느 한 항에 있어서, 상기 변이 캡시드 단백질은 서열번호 1 또는 서열번호 1의 적어도 약 80%의 서열 동일성을 포함하는 서열을 포함하는 VP1인, 유전자-변형된 감염성 아데노-관련 바이러스.
- 제16항에 있어서, 상기 변이 VP1 캡시드 단백질은 263, 454, 456, 587 및 588번 위치(들)에서 단백질의 하나 이상의 위치에서 돌연변이된, 유전자-변형된 감염성 아데노-관련 바이러스.
- 제12항 내지 제17항 중 어느 한 항에 있어서, 상기 변이 캡시드 단백질은 VP1, VP2 또는 VP1 및 VP2 둘 다의 하나 이상의 돌연변이된 아미노산 잔기를 포함하고 상기 돌연변이된 아미노산 잔기 부위는 자연-발생 아미노산을 포함하는, 유전자-변형된 감염성 아데노-관련 바이러스.
- 제18항에 있어서, 상기 자연-발생 아미노산은 시스테인 또는 셀레노시스테인인, 유전자-변형된 감염성 아데노-관련 바이러스.
- 제18항 또는 제19항에 있어서, 상기 돌연변이된 VP1 아미노산 서열은 서열번호 1 또는 서열번호 1과 적어도 약 80%의 서열 동일성을 갖는 서열을 포함하고, 상기 변이 VP1 캡시드 단백질은 263, 454, 456, 587 또는 588번 위치(들)에서 하나 이상의 위치에서 돌연변이된, 유전자-변형된 감염성 아데노-관련 바이러스.
- 제12항 내지 제20항 중 어느 한 항에 있어서, 돌연변이된 아미노산 잔기를 포함하는 변이 캡시드 단백질을 포함하되, 상기 돌연변이된 아미노산은 화학적 또는 생물학적(단백질, 핵산, 지질 또는 탄수화물) 독립체와 접합되는, 유전자-변형된 감염성 아데노-관련 바이러스.
- 제21항의 화학적 또는 단백질 독립체를 포함하는 유전자-변형된 감염성 아데노-관련 바이러스로서,
상기 독립체는 탐침, 소분자 리간드, 펩타이드, 고리형 펩타이드, 뉴클레오타이드, 중합체 또는 단백질 접합체로 이루어진 군에서 선택되는 것인, 유전자-변형된 감염성 아데노-관련 바이러스. - 제22항의 화학적 또는 단백질 독립체를 포함하는 유전자-변형된 감염성 아데노-관련 바이러스로서,
상기 독립체는 고리형 펩타이드 cRGD 또는 폴리에틸렌 글리콜인, 유전자-변형된 감염성 아데노-관련 바이러스. - 감염성 유전자-변형된 AAV를 생산하는 방법으로서,
상기 AAV는 변이 AAV 캡시드 단백질을 포함하고, VP1, VP2 또는 VP1 및 VP2 둘 다는 야생형 VP1, VP2 또는 VP1 및 VP2 둘 다에 비해 하나 이상의 돌연변이된 아미노산 잔기 부위를 포함하고, 상기 방법은,
a) 배양에 수용성 숙주 세포(competent host cell)를 제공하는 단계;
b) 배양된 세포를 하나 이상의 플라스미드로 형질주입하는 단계로서, 상기 플라스미드는,
1) VP1 또는 VP2 또는 VP1 및 VP2 둘 다를 발현하지 않는 AAV 변이 VP3;
2) VP3를 발현하지 않는 적합한 프로모터를 갖는 변이 VP1, VP2 또는 VP1 및 VP2 둘 다;
3) AAV 발현에 필요한 추가 인자;
를 포함하는, 상기 형질주입하는 단계;
c) 필요한 비천연 아미노산; 및 정지 코돈에 대한 응답으로 비천연 아미노산을 선택적으로 충전하는 변형된 아미노아실-tRNA 합성효소/tRNA 쌍을 암호화하는 플라스미드를 제공하는 단계;
d) 상기 세포를 상기 플라스미드 유전자들의 발현 및 상기 AAV의 조립에 충분한 조건 하에서 배양하는 단계;
를 포함하되;
이에 따라 변이 AAV 캡시드 단백질을 포함하는 감염성 유전자-변형된 AAV를 생산하되, 여기서 VP1, VP2, VP3 또는 VP1 및 VP2 둘 다가 야생형 AVV에 비해 하나 이상의 아미노산 잔기 부위에서 돌연변이된, 감염성 유전자-변형된 AAV를 생산하는 방법. - 제24항에 있어서, 상기 적합한 프로모터는 거대세포바이러스(CMV) 프로모터인, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제24항 또는 제25항에 있어서, 상기 변이 캡시드 단백질은 상기 아미노산 잔기 부위에서 자연-발생 또는 비천연 아미노산으로 돌연변이되는, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제25항 또는 제26항에 있어서, 상기 돌연변이된 아미노산 잔기 부위는 비천연 아미노산(UAA)을 포함하는, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제27항에 있어서, 상기 비천연-발생 아미노산은 페닐알라닌 유사체, 티로실 유사체, 트립토파닐 유사체 또는 라이실 유사체로 이루어진 군에서 선택된 것인, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제24항 또는 제25항에 있어서, 상기 돌연변이된 아미노산 잔기 부위는 자연-발생 아미노산을 포함하는, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제30항에 있어서, 상기 자연-발생 아미노산은 시스테인 또는 셀레노시스테인인, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제24항 내지 제31항 중 어느 한 항에 있어서, 상기 돌연변이된 아미노산은 화학적 또는 생물학적 독립체와 접합되는, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제32항에 있어서, 상기 독립체는 탐침, 소분자 리간드, 펩타이드, 고리형 펩타이드, 뉴클레오타이드, 중합체, 단백질 또는 바이러스 접합체로 이루어진 군에서 선택되는 것인, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제33항에 있어서, 상기 독립체는 고리형 펩타이드 cRGD 또는 폴리에틸렌 글리콜인, 감염성 유전자-변형된 AAV를 생산하는 방법.
- 제1항 내지 제23항 중 어느 한 항의 유전자-변형된 AAV를 포함하고 하나 이상의 치료적 또는 항원성 유전자 작제물을 더 포함하는 치료적 또는 항원성 조성물.
- 제35항에 있어서, 상기 조성물은 항원성 조성물이고 아쥬반트를 더 포함하는, 치료적 또는 항원성 조성물.
- 대상체에서 질환 또는 상태를 치료하는 방법으로서,
상기 방법은 상기 대상체에게 제35항의 치료적 조성물을 투여하는 단계를 포함하고, 상기 조성물은 상기 대상체에서 상기 질환 또는 상태를 감소시키거나 완화시킬 수 있는 치료량으로 단백질 또는 펩타이드를 암호화하는 유전자 작제물을 포함하는, 대상체에서 질환 또는 상태를 치료하는 방법. - 대상체에서 면역 반응을 유도하는 방법으로서,
상기 방법은 상기 대상체에게 제35항 또는 제36항의 항원성 조성물을 투여하는 단계를 포함하고, 상기 항원성 조성물은 상기 대상체에서 면역 반응을 유도할 수 있는 항원을 암호화하는 유전자 작제물을 포함하는, 대상체에서 면역 반응을 유도하는 방법. - 제1항 내지 제23항 중 어느 한 항의 유전자-변형 AAV를 포함하는 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063018573P | 2020-05-01 | 2020-05-01 | |
US63/018,573 | 2020-05-01 | ||
PCT/US2021/030489 WO2021222899A1 (en) | 2020-05-01 | 2021-05-03 | Controlled modification of adeno-associated virus (aav) for enhanced gene therapy |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230005941A true KR20230005941A (ko) | 2023-01-10 |
Family
ID=76392408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227042010A KR20230005941A (ko) | 2020-05-01 | 2021-05-03 | 향상된 유전자 요법을 위한 아데노-관련 바이러스(aav)의 제어된 변형 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230175013A1 (ko) |
EP (1) | EP4143206A1 (ko) |
JP (1) | JP2023524401A (ko) |
KR (1) | KR20230005941A (ko) |
CN (1) | CN115551878A (ko) |
AU (1) | AU2021264081A1 (ko) |
CA (1) | CA3177573A1 (ko) |
IL (1) | IL297780A (ko) |
WO (1) | WO2021222899A1 (ko) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT2657247T (pt) * | 2003-06-19 | 2017-06-29 | Genzyme Corp | Viriões aav com imunorreatividade diminuída e seus usos |
CN104592364B (zh) * | 2013-10-30 | 2018-05-01 | 北京大学 | 定点突变和定点修饰的腺相关病毒、其制备方法及应用 |
AU2019270900A1 (en) * | 2018-05-15 | 2020-10-15 | President And Fellows Of Harvard College | Viral vectors exhibiting improved gene delivery properties |
-
2021
- 2021-05-03 CN CN202180032267.7A patent/CN115551878A/zh active Pending
- 2021-05-03 US US17/922,425 patent/US20230175013A1/en active Pending
- 2021-05-03 JP JP2022563990A patent/JP2023524401A/ja active Pending
- 2021-05-03 KR KR1020227042010A patent/KR20230005941A/ko active Search and Examination
- 2021-05-03 CA CA3177573A patent/CA3177573A1/en active Pending
- 2021-05-03 WO PCT/US2021/030489 patent/WO2021222899A1/en active Application Filing
- 2021-05-03 AU AU2021264081A patent/AU2021264081A1/en active Pending
- 2021-05-03 EP EP21731860.9A patent/EP4143206A1/en active Pending
-
2022
- 2022-10-30 IL IL297780A patent/IL297780A/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP4143206A1 (en) | 2023-03-08 |
JP2023524401A (ja) | 2023-06-12 |
CN115551878A (zh) | 2022-12-30 |
AU2021264081A1 (en) | 2022-11-03 |
US20230175013A1 (en) | 2023-06-08 |
CA3177573A1 (en) | 2021-11-04 |
IL297780A (en) | 2022-12-01 |
WO2021222899A1 (en) | 2021-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102499953B1 (ko) | Aav 입자의 생산을 위한 벡터 | |
AU2020260485B2 (en) | Gene therapies for lysosomal disorders | |
CN110770346B (zh) | 多倍体腺相关病毒载体及其制备和使用方法 | |
KR102111244B1 (ko) | 이종 유전자의 발현을 위한 강력한 짧은 프로모터 | |
ES2602352T3 (es) | Secuencias de serotipo 8 de virus adenoasociado (VAA), vectores que las contienen y usos de las mismas | |
ES2607029T3 (es) | Adenovirus que comprende una proteína hexónica de la cápside del adenovirus E de simio SAdV-39 y usos de la misma | |
CN113302201A (zh) | 重组病毒载体和用于产生所述重组病毒载体的核酸 | |
CN112566923A (zh) | 合成嗜肝性腺相关病毒衣壳及其用途 | |
CN115103710A (zh) | 用于治疗遗传性听力损失的腺相关病毒(aav)系统 | |
KR20220155981A (ko) | 미성숙 종결 코돈-매개 장애를 치료하기 위한 방법 및 조성물 | |
KR20210005889A (ko) | Cns 퇴행에 대한 유전자 요법 | |
KR20200066349A (ko) | 복제 가능 아데노바이러스 벡터 | |
KR20220078650A (ko) | 이중 바이러스 및 이중 종양용해 바이러스 및 치료 방법 | |
CN115916986A (zh) | 修饰的腺相关病毒5衣壳及其用途 | |
CN113508130A (zh) | 用于治疗达农病的基因治疗载体 | |
CN115029360B (zh) | 用于治疗粘多糖贮积症iiia型的转基因表达盒 | |
KR20220140537A (ko) | Cdkl5 결핍 장애를 치료하기 위한 유전자 요법 | |
KR20240025507A (ko) | 미성숙 종결 코돈-매개 장애를 치료하기 위한 방법 및 조성물 | |
CN116685329A (zh) | 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途 | |
WO2022020246A1 (en) | Insulin receptor-mediated enhancement of gene transfer | |
KR20210086638A (ko) | 진행성 가족성 간내 담즙정체 3형 (pfic3)의 치료를 위한 코돈-최적화 전이유전자 | |
KR20230005941A (ko) | 향상된 유전자 요법을 위한 아데노-관련 바이러스(aav)의 제어된 변형 | |
Keir et al. | Efficient gene transfer into primary and immortalized human fetal glial cells using adeno-associated virus vectors: establishment of a glial cell line with a functional CD4 receptor | |
CN115244181A (zh) | 阿司匹林化合物在增加核酸表达中的新型用途 | |
WO2023205610A2 (en) | Hybrid aav capsids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |