KR20220161297A - 신규 세포주 - Google Patents
신규 세포주 Download PDFInfo
- Publication number
- KR20220161297A KR20220161297A KR1020227032424A KR20227032424A KR20220161297A KR 20220161297 A KR20220161297 A KR 20220161297A KR 1020227032424 A KR1020227032424 A KR 1020227032424A KR 20227032424 A KR20227032424 A KR 20227032424A KR 20220161297 A KR20220161297 A KR 20220161297A
- Authority
- KR
- South Korea
- Prior art keywords
- promoter
- rep
- parvovirus
- expression
- aav
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 249
- 230000014509 gene expression Effects 0.000 claims abstract description 230
- 241000125945 Protoparvovirus Species 0.000 claims abstract description 185
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 184
- 241000238631 Hexapoda Species 0.000 claims abstract description 140
- 239000013598 vector Substances 0.000 claims abstract description 95
- 238000004519 manufacturing process Methods 0.000 claims abstract description 75
- 239000002773 nucleotide Substances 0.000 claims description 187
- 125000003729 nucleotide group Chemical group 0.000 claims description 184
- 241000701447 unidentified baculovirus Species 0.000 claims description 147
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 claims description 67
- 108091081024 Start codon Proteins 0.000 claims description 54
- 108090000565 Capsid Proteins Proteins 0.000 claims description 53
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 53
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 51
- 238000000034 method Methods 0.000 claims description 51
- 239000003623 enhancer Substances 0.000 claims description 49
- 230000001939 inductive effect Effects 0.000 claims description 45
- 210000002845 virion Anatomy 0.000 claims description 42
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 41
- 108020004999 messenger RNA Proteins 0.000 claims description 40
- 108700019146 Transgenes Proteins 0.000 claims description 36
- 210000000234 capsid Anatomy 0.000 claims description 33
- 230000002103 transcriptional effect Effects 0.000 claims description 30
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 27
- 238000013519 translation Methods 0.000 claims description 27
- 108091026890 Coding region Proteins 0.000 claims description 26
- 108700010070 Codon Usage Proteins 0.000 claims description 22
- 108700026244 Open Reading Frames Proteins 0.000 claims description 22
- 238000013518 transcription Methods 0.000 claims description 18
- 230000035897 transcription Effects 0.000 claims description 18
- 101000999689 Saimiriine herpesvirus 2 (strain 11) Transcriptional regulator ICP22 homolog Proteins 0.000 claims description 17
- 230000014621 translational initiation Effects 0.000 claims description 17
- 230000004048 modification Effects 0.000 claims description 13
- 238000012986 modification Methods 0.000 claims description 13
- 230000001419 dependent effect Effects 0.000 claims description 12
- 241000702421 Dependoparvovirus Species 0.000 claims description 11
- 108700008625 Reporter Genes Proteins 0.000 claims description 11
- 239000012634 fragment Substances 0.000 claims description 10
- 230000003111 delayed effect Effects 0.000 claims description 7
- 238000001261 affinity purification Methods 0.000 claims description 6
- 238000012258 culturing Methods 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims description 5
- 230000002829 reductive effect Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 239000011148 porous material Substances 0.000 claims description 4
- 241001203868 Autographa californica Species 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 5
- 238000001415 gene therapy Methods 0.000 abstract description 7
- 108700002693 Viral Replicase Complex Proteins Proteins 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 290
- 108020004414 DNA Proteins 0.000 description 92
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 64
- 150000007523 nucleic acids Chemical class 0.000 description 61
- 150000001413 amino acids Chemical group 0.000 description 58
- 102000039446 nucleic acids Human genes 0.000 description 52
- 108020004707 nucleic acids Proteins 0.000 description 52
- 239000002245 particle Substances 0.000 description 51
- 108091028043 Nucleic acid sequence Proteins 0.000 description 50
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 45
- 101710132601 Capsid protein Proteins 0.000 description 41
- 101710197658 Capsid protein VP1 Proteins 0.000 description 41
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 description 41
- 101710108545 Viral protein 1 Proteins 0.000 description 41
- 102100022641 Coagulation factor IX Human genes 0.000 description 32
- 108020004705 Codon Proteins 0.000 description 30
- 108010076282 Factor IX Proteins 0.000 description 30
- 229960004222 factor ix Drugs 0.000 description 30
- 210000004962 mammalian cell Anatomy 0.000 description 30
- 239000005089 Luciferase Substances 0.000 description 29
- 230000001105 regulatory effect Effects 0.000 description 29
- 239000000047 product Substances 0.000 description 28
- 238000013461 design Methods 0.000 description 26
- 230000014616 translation Effects 0.000 description 26
- 238000001890 transfection Methods 0.000 description 22
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 21
- 101710081079 Minor spike protein H Proteins 0.000 description 21
- 230000000694 effects Effects 0.000 description 21
- 101000805768 Banna virus (strain Indonesia/JKT-6423/1980) mRNA (guanine-N(7))-methyltransferase Proteins 0.000 description 20
- 101000686790 Chaetoceros protobacilladnavirus 2 Replication-associated protein Proteins 0.000 description 20
- 101000864475 Chlamydia phage 1 Internal scaffolding protein VP3 Proteins 0.000 description 20
- 101000803553 Eumenes pomiformis Venom peptide 3 Proteins 0.000 description 20
- 101000583961 Halorubrum pleomorphic virus 1 Matrix protein Proteins 0.000 description 20
- 239000000463 material Substances 0.000 description 20
- 238000004806 packaging method and process Methods 0.000 description 19
- 239000013600 plasmid vector Substances 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 19
- 239000013613 expression plasmid Substances 0.000 description 15
- 201000010099 disease Diseases 0.000 description 14
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 208000015181 infectious disease Diseases 0.000 description 14
- 102000004196 processed proteins & peptides Human genes 0.000 description 14
- 230000010076 replication Effects 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 13
- 101150066583 rep gene Proteins 0.000 description 13
- 238000001262 western blot Methods 0.000 description 12
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 11
- 241000700605 Viruses Species 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 230000001052 transient effect Effects 0.000 description 11
- 230000003612 virological effect Effects 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 241000709691 Enterovirus E Species 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 230000008685 targeting Effects 0.000 description 10
- 108010061238 threonyl-glycine Proteins 0.000 description 10
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 9
- 101150014715 CAP2 gene Proteins 0.000 description 9
- 108060001084 Luciferase Proteins 0.000 description 9
- 101100260872 Mus musculus Tmprss4 gene Proteins 0.000 description 9
- 230000027455 binding Effects 0.000 description 9
- 239000013608 rAAV vector Substances 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- 239000013607 AAV vector Substances 0.000 description 8
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 8
- 108020005350 Initiator Codon Proteins 0.000 description 8
- 108091092195 Intron Proteins 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 230000006698 induction Effects 0.000 description 8
- 238000011081 inoculation Methods 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 238000003146 transient transfection Methods 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 230000004568 DNA-binding Effects 0.000 description 7
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 7
- 108091005461 Nucleic proteins Chemical group 0.000 description 7
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 230000030279 gene silencing Effects 0.000 description 7
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 108010053725 prolylvaline Proteins 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 238000010348 incorporation Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000003753 real-time PCR Methods 0.000 description 6
- 239000004055 small Interfering RNA Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 5
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 5
- 101150044789 Cap gene Proteins 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- 238000013324 OneBac system Methods 0.000 description 5
- WDVSHHCDHLJJJR-UHFFFAOYSA-N Proflavine Chemical compound C1=CC(N)=CC2=NC3=CC(N)=CC=C3C=C21 WDVSHHCDHLJJJR-UHFFFAOYSA-N 0.000 description 5
- 241000256251 Spodoptera frugiperda Species 0.000 description 5
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 5
- 108010070944 alanylhistidine Proteins 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 210000005260 human cell Anatomy 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 5
- 239000001301 oxygen Substances 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- 230000003389 potentiating effect Effects 0.000 description 5
- 108010031719 prolyl-serine Proteins 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 231100000331 toxic Toxicity 0.000 description 5
- 230000002588 toxic effect Effects 0.000 description 5
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 4
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 4
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 4
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 4
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 4
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 4
- 239000007993 MOPS buffer Substances 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 241000701945 Parvoviridae Species 0.000 description 4
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 4
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 4
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 4
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 4
- 239000011543 agarose gel Substances 0.000 description 4
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 4
- 238000010923 batch production Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 239000013592 cell lysate Substances 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 108010069495 cysteinyltyrosine Proteins 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 230000003278 mimic effect Effects 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 3
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 description 3
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 3
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 3
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 3
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 3
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 3
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 3
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 3
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 3
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 3
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 3
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 3
- 241000201370 Autographa californica nucleopolyhedrovirus Species 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 102000016911 Deoxyribonucleases Human genes 0.000 description 3
- 108010053770 Deoxyribonucleases Proteins 0.000 description 3
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 3
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 3
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 3
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 3
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 3
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 3
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 3
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 3
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 3
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 3
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 3
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 3
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 3
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 3
- 108010047562 NGR peptide Proteins 0.000 description 3
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 3
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 3
- 241000288906 Primates Species 0.000 description 3
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 3
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 3
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 3
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 3
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 3
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 3
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 3
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 3
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 3
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 3
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 3
- 108020005202 Viral DNA Proteins 0.000 description 3
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 3
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000012091 fetal bovine serum Substances 0.000 description 3
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 3
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 3
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 230000002458 infectious effect Effects 0.000 description 3
- 238000011031 large-scale manufacturing process Methods 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000003468 luciferase reporter gene assay Methods 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 3
- 238000013341 scale-up Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 108010038745 tryptophylglycine Proteins 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 2
- 208000005452 Acute intermittent porphyria Diseases 0.000 description 2
- 241000649045 Adeno-associated virus 10 Species 0.000 description 2
- 241000649046 Adeno-associated virus 11 Species 0.000 description 2
- 241000649047 Adeno-associated virus 12 Species 0.000 description 2
- 241000300529 Adeno-associated virus 13 Species 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 2
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 2
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 2
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 2
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 2
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 2
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 2
- 102100034561 Alpha-N-acetylglucosaminidase Human genes 0.000 description 2
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 2
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 2
- BGDILZXXDJCKPF-CIUDSAMLSA-N Arg-Gln-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(O)=O BGDILZXXDJCKPF-CIUDSAMLSA-N 0.000 description 2
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 2
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 2
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 2
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 2
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 2
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 2
- 208000002150 Arrhythmogenic Right Ventricular Dysplasia Diseases 0.000 description 2
- 201000006058 Arrhythmogenic right ventricular cardiomyopathy Diseases 0.000 description 2
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 2
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 2
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 2
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 2
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 2
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 2
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 2
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 2
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 2
- HGGIYWURFPGLIU-FXQIFTODSA-N Asn-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(N)=O HGGIYWURFPGLIU-FXQIFTODSA-N 0.000 description 2
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 2
- JPSODRNUDXONAS-XIRDDKMYSA-N Asn-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC(=O)N)N JPSODRNUDXONAS-XIRDDKMYSA-N 0.000 description 2
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 2
- GBAWQWASNGUNQF-ZLUOBGJFSA-N Asp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N GBAWQWASNGUNQF-ZLUOBGJFSA-N 0.000 description 2
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 2
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 2
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 2
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 2
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 2
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 2
- 102100026735 Coagulation factor VIII Human genes 0.000 description 2
- 208000003322 Coinfection Diseases 0.000 description 2
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 2
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 2
- DGQJGBDBFVGLGL-ZKWXMUAHSA-N Cys-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DGQJGBDBFVGLGL-ZKWXMUAHSA-N 0.000 description 2
- 201000003883 Cystic fibrosis Diseases 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 108090000133 DNA helicases Proteins 0.000 description 2
- 102000003844 DNA helicases Human genes 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 208000032928 Dyslipidaemia Diseases 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- 208000024720 Fabry Disease Diseases 0.000 description 2
- 206010016207 Familial Mediterranean fever Diseases 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 2
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 2
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 2
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 2
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 2
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 2
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 2
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 2
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 2
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- XOIATPHFYVWFEU-DCAQKATOSA-N Glu-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOIATPHFYVWFEU-DCAQKATOSA-N 0.000 description 2
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 2
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 2
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 2
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 2
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 2
- 208000032003 Glycogen storage disease due to glucose-6-phosphatase deficiency Diseases 0.000 description 2
- 206010018464 Glycogen storage disease type I Diseases 0.000 description 2
- 238000010268 HPLC based assay Methods 0.000 description 2
- 208000009292 Hemophilia A Diseases 0.000 description 2
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 2
- AASLOGQZZKZWKH-SRVKXCTJSA-N His-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AASLOGQZZKZWKH-SRVKXCTJSA-N 0.000 description 2
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 2
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000924350 Homo sapiens Alpha-N-acetylglucosaminidase Proteins 0.000 description 2
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 2
- 101000986595 Homo sapiens Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 2
- 208000030673 Homozygous familial hypercholesterolemia Diseases 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 208000001021 Hyperlipoproteinemia Type I Diseases 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 2
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 2
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 2
- AMSYMDIIIRJRKZ-HJPIBITLSA-N Ile-His-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AMSYMDIIIRJRKZ-HJPIBITLSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 2
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 2
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 2
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 2
- RTSQPLLOYSGMKM-DSYPUSFNSA-N Ile-Trp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N RTSQPLLOYSGMKM-DSYPUSFNSA-N 0.000 description 2
- XDVKZSJODLMNLJ-GGQYPGDFSA-N Ile-Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 XDVKZSJODLMNLJ-GGQYPGDFSA-N 0.000 description 2
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 2
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 2
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 2
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 2
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 2
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 2
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 2
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 2
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 2
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 2
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 2
- NLDXSXDCNZIQCN-ULQDDVLXSA-N Met-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 NLDXSXDCNZIQCN-ULQDDVLXSA-N 0.000 description 2
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 208000000599 Ornithine Carbamoyltransferase Deficiency Disease Diseases 0.000 description 2
- 206010052450 Ornithine transcarbamoylase deficiency Diseases 0.000 description 2
- 208000035903 Ornithine transcarbamylase deficiency Diseases 0.000 description 2
- 102100028200 Ornithine transcarbamylase, mitochondrial Human genes 0.000 description 2
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 2
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 2
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 2
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 2
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 2
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 2
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- YVXPUUOTMVBKDO-IHRRRGAJSA-N Phe-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CS)C(=O)O YVXPUUOTMVBKDO-IHRRRGAJSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 2
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 2
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 2
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 2
- 206010036182 Porphyria acute Diseases 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 2
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 2
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 2
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 2
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 2
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 2
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 101710150114 Protein rep Proteins 0.000 description 2
- 108091034057 RNA (poly(A)) Proteins 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 101710195674 Replication initiator protein Proteins 0.000 description 2
- 108010034634 Repressor Proteins Proteins 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 2
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 2
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 2
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 2
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 2
- 241000977068 Simian Adeno-associated virus Species 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 241000256248 Spodoptera Species 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 2
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 2
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 2
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 2
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 2
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 2
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 2
- HHPSUFUXXBOFQY-AQZXSJQPSA-N Trp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O HHPSUFUXXBOFQY-AQZXSJQPSA-N 0.000 description 2
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 2
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 2
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 2
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 2
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 2
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 2
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 2
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 2
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 2
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 2
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 2
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 2
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 2
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 2
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 2
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 2
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 2
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 2
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 2
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 2
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 108091006088 activator proteins Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 206010003246 arthritis Diseases 0.000 description 2
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 2
- 229930189065 blasticidin Natural products 0.000 description 2
- -1 but not limited to Proteins 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 201000011110 familial lipoprotein lipase deficiency Diseases 0.000 description 2
- 239000012737 fresh medium Substances 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 235000003869 genetically modified organism Nutrition 0.000 description 2
- 102000018146 globin Human genes 0.000 description 2
- 108060003196 globin Proteins 0.000 description 2
- 201000004541 glycogen storage disease I Diseases 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 208000009429 hemophilia B Diseases 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 229960000027 human factor ix Drugs 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000007479 molecular analysis Methods 0.000 description 2
- 201000011278 ornithine carbamoyltransferase deficiency Diseases 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229940002612 prodrug Drugs 0.000 description 2
- 239000000651 prodrug Substances 0.000 description 2
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 239000013014 purified material Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- GRRNUXAQVGOGFE-KPBUCVLVSA-N (3'r,3as,4s,4'r,5'r,6r,6'r,7s,7as)-4-[(1r,2s,3r,5s,6r)-3-amino-2,6-dihydroxy-5-(methylamino)cyclohexyl]oxy-6'-[(1s)-1-amino-2-hydroxyethyl]-6-(hydroxymethyl)spiro[4,6,7,7a-tetrahydro-3ah-[1,3]dioxolo[4,5-c]pyran-2,2'-oxane]-3',4',5',7-tetrol Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2OC3([C@@H]([C@H](O)[C@@H](O)[C@@H]([C@@H](N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-KPBUCVLVSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- MPVDXIMFBOLMNW-ISLYRVAYSA-N 7-hydroxy-8-[(E)-phenyldiazenyl]naphthalene-1,3-disulfonic acid Chemical compound OC1=CC=C2C=C(S(O)(=O)=O)C=C(S(O)(=O)=O)C2=C1\N=N\C1=CC=CC=C1 MPVDXIMFBOLMNW-ISLYRVAYSA-N 0.000 description 1
- 208000013824 Acidemia Diseases 0.000 description 1
- 208000010444 Acidosis Diseases 0.000 description 1
- 241000425548 Adeno-associated virus 3A Species 0.000 description 1
- 241000958487 Adeno-associated virus 3B Species 0.000 description 1
- 241000256173 Aedes albopictus Species 0.000 description 1
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 208000031277 Amaurotic familial idiocy Diseases 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 102100029470 Apolipoprotein E Human genes 0.000 description 1
- 101710095339 Apolipoprotein E Proteins 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- WTFIFQWLQXZLIZ-UMPQAUOISA-N Arg-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O WTFIFQWLQXZLIZ-UMPQAUOISA-N 0.000 description 1
- FSPQNLYOFCXUCE-BPUTZDHNSA-N Arg-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FSPQNLYOFCXUCE-BPUTZDHNSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- XQFLFQWOBXPMHW-NHCYSSNCSA-N Asp-Val-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XQFLFQWOBXPMHW-NHCYSSNCSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 108700040077 Baculovirus p10 Proteins 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 208000022526 Canavan disease Diseases 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 108090000397 Caspase 3 Proteins 0.000 description 1
- 102100029855 Caspase-3 Human genes 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 201000011297 Citrullinemia Diseases 0.000 description 1
- 102000012437 Copper-Transporting ATPases Human genes 0.000 description 1
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 1
- MJOYUXLETJMQGG-IHRRRGAJSA-N Cys-Tyr-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJOYUXLETJMQGG-IHRRRGAJSA-N 0.000 description 1
- ZFHXNNXMNLWKJH-HJPIBITLSA-N Cys-Tyr-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZFHXNNXMNLWKJH-HJPIBITLSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000121256 Densovirinae Species 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000008157 ELISA kit Methods 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 108010092408 Eosinophil Peroxidase Proteins 0.000 description 1
- 102100028471 Eosinophil peroxidase Human genes 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- 102100027581 Forkhead box protein P3 Human genes 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 1
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 1
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- 208000010055 Globoid Cell Leukodystrophy Diseases 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 1
- CMMBEMZGNGYJRJ-IHRRRGAJSA-N His-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N CMMBEMZGNGYJRJ-IHRRRGAJSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- XHQYFGPIRUHQIB-PBCZWWQYSA-N His-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CN=CN1 XHQYFGPIRUHQIB-PBCZWWQYSA-N 0.000 description 1
- MRVZCDSYLJXKKX-ACRUOGEOSA-N His-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N MRVZCDSYLJXKKX-ACRUOGEOSA-N 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000861452 Homo sapiens Forkhead box protein P3 Proteins 0.000 description 1
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 1
- 101000959820 Homo sapiens Interferon alpha-1/13 Proteins 0.000 description 1
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 1
- 208000008852 Hyperoxaluria Diseases 0.000 description 1
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 1
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 1
- 102100040019 Interferon alpha-1/13 Human genes 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 208000028226 Krabbe disease Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 201000003533 Leber congenital amaurosis Diseases 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 208000017170 Lipid metabolism disease Diseases 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- GHOIOYHDDKXIDX-SZMVWBNQSA-N Lys-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 GHOIOYHDDKXIDX-SZMVWBNQSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- ORRNBLTZBBESPN-HJWJTTGWSA-N Met-Ile-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ORRNBLTZBBESPN-HJWJTTGWSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101001055320 Myxine glutinosa Insulin-like growth factor Proteins 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 102000007072 Nerve Growth Factors Human genes 0.000 description 1
- 208000002537 Neuronal Ceroid-Lipofuscinoses Diseases 0.000 description 1
- 208000014060 Niemann-Pick disease Diseases 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 241000121250 Parvovirinae Species 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 1
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 1
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 108010089430 Phosphoproteins Proteins 0.000 description 1
- 102000007982 Phosphoproteins Human genes 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- RETPETNFPLNLRV-JYJNAYRXSA-N Pro-Asn-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O RETPETNFPLNLRV-JYJNAYRXSA-N 0.000 description 1
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 1
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 239000012083 RIPA buffer Substances 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101150100379 Rep52 gene Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 101710088839 Replication initiation protein Proteins 0.000 description 1
- 101710152114 Replication protein Proteins 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 1
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 102000009488 Thyroxine-Binding Proteins Human genes 0.000 description 1
- 108010048889 Thyroxine-Binding Proteins Proteins 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- HJWVPKJHHLZCNH-DVXDUOKCSA-N Trp-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=3C4=CC=CC=C4NC=3)C)C(O)=O)=CNC2=C1 HJWVPKJHHLZCNH-DVXDUOKCSA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- SSNGFWKILJLTQM-QEJZJMRPSA-N Trp-Gln-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SSNGFWKILJLTQM-QEJZJMRPSA-N 0.000 description 1
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 1
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- AAOPYWQQBXHINJ-DZKIICNBSA-N Val-Gln-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AAOPYWQQBXHINJ-DZKIICNBSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 239000012131 assay buffer Substances 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000005101 cell tropism Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 208000016617 citrullinemia type I Diseases 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- IRSCQMHQWWYFCW-UHFFFAOYSA-N ganciclovir Chemical compound O=C1NC(N)=NC2=C1N=CN2COC(CO)CO IRSCQMHQWWYFCW-UHFFFAOYSA-N 0.000 description 1
- 229960002963 ganciclovir Drugs 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 208000017476 juvenile neuronal ceroid lipofuscinosis Diseases 0.000 description 1
- NLYAJNPCOHFWQQ-UHFFFAOYSA-N kaolin Chemical compound O.O.O=[Al]O[Si](=O)O[Si](=O)O[Al]=O NLYAJNPCOHFWQQ-UHFFFAOYSA-N 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 201000007607 neuronal ceroid lipofuscinosis 3 Diseases 0.000 description 1
- 208000014500 neuronal tumor Diseases 0.000 description 1
- 239000003900 neurotrophic factor Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000006213 oxygenation reaction Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 108010040003 polyglutamine Proteins 0.000 description 1
- 229920000155 polyglutamine Polymers 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 238000010377 protein imaging Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000002804 saturated mutagenesis Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 208000002320 spinal muscular atrophy Diseases 0.000 description 1
- 201000003624 spinocerebellar ataxia type 1 Diseases 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 239000002351 wastewater Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/08—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
- C07K16/081—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from DNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0601—Invertebrate cells or tissues, e.g. insect cells; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/22—Immunoglobulins specific features characterized by taxonomic origin from camelids, e.g. camel, llama or dromedary
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14111—Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
- C12N2710/14141—Use of virus, viral particle or viral elements as a vector
- C12N2710/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14111—Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
- C12N2710/14141—Use of virus, viral particle or viral elements as a vector
- C12N2710/14144—Chimeric viral vector comprising heterologous viral elements for production of another viral vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
- C12N2750/14152—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14311—Parvovirus, e.g. minute virus of mice
- C12N2750/14322—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14311—Parvovirus, e.g. minute virus of mice
- C12N2750/14351—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/50—Vectors for producing vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/002—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Virology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Control Of Motors That Do Not Use Commutators (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 파르보바이러스 유전자 치료요법 벡터의 생산을 위한 곤충 세포주에 관한 것이다. 특히, 본 발명은 이의 게놈 내로 통합된 바이러스 레플리카제 단백질에 대한 발현 작제물을 지닌 안정한 곤충 세포주에 관한 것이며, 이러한 세포주는 이종 파르보바이러스-관련 단백질 및 벡터를 고 수율의, 풍부하고, 확장가능한 생산을 허용한다.
Description
발명의 분야
본 발명은 의약, 분자 생물학, 및 유전자 치료요법의 분야에 관한 것이다. 본 발명은 세포 내에서의 단백질의 생산에 관한 것이고, 이에 의해 반복된 불완전한 팔린드롬성/상동성 반복 서열(repeated imperfect palindromic/homologous repeat sequence)이 바큘로바이러스 벡터(baculoviral vector) 내에서 사용된다. 특히, 본 발명은 유전자 치료요법에서 사용될 수 있는 파르보바이러스(parvoviral) 벡터(parvoviral vector)의 생산, 및, 파르보바이러스 벡터의 생산성을 증가시키는 바이러스 레플리카제(viral replicase; Rep) 단백질의 발현에 있어서의 개선에 관한 것이다.
바큘로바이러스 발현 시스템은 진핵성 클로닝(eukaryotic cloning) 및 발현 벡터로서의 이의 용도에 대해 잘 알려져 있다(King, L. A., and R. D. Possee, 1992, "The baculovirus expression system", Chapman and Hall, United Kingdom; O'Reilly, D. R., et al., 1992. Baculovirus Expression Vectors: A Laboratory Manual. New York: W. H. Freeman). 바큘로바이러스 발현 시스템의 장점은 다른 것들 중에서도, 발현된 단백질이 거의 항상 가용성이고, 정확하게 폴딩(folding)되며 생물학적으로 활성이라는 것이다. 추가의 장점은 높은 단백질 발현 수준, 보다 신속한 생산, 거대 단백질의 발현에 대한 적합성 및 대규모 생산에 대한 적합성을 포함한다. 그러나, 곤충 세포 생물반응기 속에서 바큘로바이러스 시스템을 사용한 이종 단백질의 대규모 또는 연속 생산 동안, 계대배양 효과로서 또한 알려진, 생산 수준의 불안정성이 주요 장애물이다. 이러한 효과는 적어도 부분적으로는 바큘로바이러스 DNA내 반복된 상동성 서열 사이에서의 재조합에 기인한다.
바큘로바이러스 발현 시스템은 또한 재조합 아데노-관련 바이러스(adeno-associated virus; AAV) 벡터의 생산에 성공적으로 사용되어 왔다(Urabe et al., 2002, Hum. Gene Ther. 13: 1935-1943; US 6,723,551 및 US 20040197895). AAV는 사람 유전자 치료요법을 위해 가장 촉망되는 바이러스 벡터 중 하나로 고려될 수 있다. AAV는 분열하는 사람 세포 뿐만 아니라 분열하지 않는 사람 세포를 효율적으로 감염시키는 능력을 가지며, 심지어 AAV가 많은 사람에 존재한다해도 이는 어떠한 질환과 관련되어 있지 않다. 이러한 장점의 측면에서, 재조합 아데노-관련 바이러스(recombinant adeno-associated virus; rAAV)는 혈우병 B(hemophilia B), 악성 흑색종(malignant melanoma), 낭성 섬유증(cystic fibrosis), 과지방단백혈증 제I형(hyperlipoproteinemia type I) 및 다른 질환을 포함하는 다양한 유전자 치료요법 임상 시험에서 평가중에 있다.
AAV의 대규모 생산을 위해, 포유동물 생산 시스템은, 특히 규모 확장이 많은 생물반응기 공간을 요구할 것이므로, 아주 적합하지 않은 것으로 밝혀졌다. AAV에 대한 포유동물 생산 시스템의 규모 확장에서 이러한 문제를 해결하기 위하여, 문헌(참고: Urabe et al. (2002, 상기 참고))는 곤충 세포 내에서 AAV 생산 시스템을 개발하였다. 곤중 체포 내에서 AAV의 생산을 가능하도록 하기 위하여, 3개의 AAV 캡시드 단백질(VP1, VP2 및 VP3)의 정확한 화학량론을 달성하기 위하여 일부 변형이 요구되었으며, 이는 2개의 스플라이스 수용체 부위(splice acceptor site)의 교호적인 사용의 조합 및 곤충 세포에 의해 정밀하게 재생되지 않는 VP2에 대한 ACG 개시 코돈의 준최적 활용(suboptimal utilization)에 의존한다. 곤충 세포내에서 캡시드 단백질의 정확한 화학량론을 모사하기 위하여, 문헌(참고: Urabe et al. (2002, 상기 참고)은 스플라이싱을 요구하지 않고 모든 3개의 VP 단백질을 발현할 수 있는 단일의 폴리시스트론성 전령(polycistronic messenger)으로 전사되는 작제물을 사용하여 여기서 대부분의 상부 개시인자 코돈(upstream initiator codon)은 준최적(suboptimal) 개시인자 코돈 ACG로 대체된다. 제WO2007/046703호는 곤충 세포 내에서 생산된 바와 같은 AAV 캡시드 단백질의 화학량론의 추가의 최적화에 의해 달성된 바큘로바이러스-생산된 rAAV 캡시드 단백질의 감염성의 추가의 개선을 개시하고 있다.
문헌(참고: Urabe et al. (2002, 상기 참고))에서 초기 개발된 바와 같은, AAV 바큘로바이러스 발현 시스템에서 AAV Rep 단백질의 발현을 위해, 각각 별개의 바큘로바이러스 프로모터(baculobviaral promoter), 각각 △IE1 및 polH 프로모터 각각의 제어 하에서, 2개의 별개의 Rep 발현 단위(Rep78에 대해 1개 및 Rep52에 대해 1개)를 지닌 재조합 바큘로바이러스 작제물이 사용된다. 그러나, 코흘브렌너(Kohlbrenner) 등의 문헌(2005, Mol. Ther. 12: 1217-25; WO 2005/072364)은 우라베(Urabe) 등에 의해 사용된 바와 같은 2개의 Rep 단백질의 발현을 위해 바큘로바이러스 작제물이 고유의 불안정성을 겪음을 보고하였다. 우라베의 원래의 벡터 내 2개의 Rep 유전자의 팔린드롬성 배향을 분할하고 Rep52 및 Rep78을 발현하기 위한 2개의 별개의 바큘로바이러스 벡터를 설계함으로써, 문헌(참고: Kohlbrenner et al. (2005, 상기 참고)은 벡터의 계대배양 안정성을 증가시켰다. 그러나, 적어도 5개의 계배배양에 걸쳐 곤충 세포 내에서 2개의 별개의 바큘로바이러스-Rep 작제물로부터의 Rep78 및 Rep52의 일관된 발현에도 불구하고, rAAV 벡터 수율은 문헌(참고: Urabe et al. (2002, 상기 참고))에서 설계된 원래의 바큘로바이러스-Rep 작제물과 비교하여 5 내지 10배 더 낮다.
출원 제WO2007/148971호에서 본 발명자는 Rep78 및 Rep52 단백질에 대한 단일 코딩 서열(coding sequence)을 사용함으로써 곤충 세포 내에서 rAAV 벡터 생산의 안정성을 유의적으로 개선시켰고 여기서 준최적 개시인자 코돈은 스캐닝 리보솜(scanning ribosome)에 의해 부분적으로 스킵(skip)된 Rep78 단백질에 대해 사용되어 해독(translation) 개시가 Rep52 단백질의 개시 코돈에서 추가로 하부에서 발생하도록 한다. 제WO 2009/014445호에서는 곤충 세포 내에서 rAAV 벡터의 안정성을 Rep52 및 Rep78에 대한 별개의 발현 카세트를 사용함으로써 다시 추가로 개선시켰으며, 여기서 반복된 코딩 서열은 코돈 편향(codon bias)에서 상이하여 상동 재조합(homologous recombination)을 감소시킨다.
국제 특허원 제WO 2007/084773호는 곤충 세포 내에서 rAAV 생산 방법을 개시하고 있으며, 여기서 감염성 바이러스 입자의 생산은 VP2 및 VP3에 대해 VP1을 보충함으로써 증가된다. 보충은 곤충 세포 내로 VP1, VP2 및 VP3를 발현하는 뉴클레오타이드 서열을 포함하는 캡시드 벡터를 도입하고 추가로 동일한 캡시드 벡터 상에 또는 상이한 벡터 상에 존재할 수 있는, VP1을 발현하는 곤충 세포 뉴클레오타이드 서열을 곤충 세포 내로 도입함으로써 시행될 수 있다.
2009년에, 아슬라니디(Aslanidi) 등의 문헌(Proc Natl Acad Sci U S A. 2009;106(13):5059-64)에서는 AAV ITR 및 목적한 전이유전자(transgene)(Trans)를 지닌 바큘로바이러스(Bac)의 단일 접종시 세포 당 105개의 게놈 카피(GC)에서 AAV를 생산할 수 있는 Sf9-기반 Rep-Cap 패키징 세포주(packaging cell line)를 생성하였다. OneBac 플랫폼(platform)으로서 지칭된 이러한 시스템은 AAV 생산의 규모 확장을 위해 적합한 것으로 고려되었다(Mietzsch, et al., 2014; Mietzsch, et al., 2017). 그러나, 문헌(참고: Mietzsch et al. (2015))에서는 이러한 플랫폼을 추가로 최적화하여 낮은 숙주-DNA 거짓 패키징(false packaging)을 지닌 다수의 AAV 혈청형을 생산하였다. 최근의 연구에서 문헌(참고: Wu et al. (2019))은 OneBac 플랫폼이 보다 더 다용도일 수 있고 패키징 Rep Sf9 세포 내에서 통합된 유도성 Rep 유전자를 유지하면서 바큘로바이러스 벡터 게놈 내부에 Cap 유전자를 ITR-전이유전자-ITR(Cap-Trans)와 함께 융합시킴으로써 유연성(flexible)이 될 수 있음을 입증하였다. 모든 이러한 실험은 OneBac 플랫폼의 가치 및 동시에 개선의 필수성 및 가능성을 입증하였다.
따라서, 특히 공정 견고성(robustness)과 관련된 제한을 극복하기 위하여, 세포 내에서 파르보바이러스 벡터의 대규모(상업적) 생산에서 추가의 개선이 여전이 요구되고 있다. 따라서 본 발명의 목적은 이종의 파르보바이러스-관련 단백질 및 벡터의 고-수율의, 강력한, 및 확장가능한 생산을 허용하는 수단 및 방법을 제공하는 것이다.
발명의 요약
제1 양태에서, 본 발명은 i) 세포 내에서의 해독(translation)이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나를 생산하는, mRNA를 암호화(encoding)하는 뉴클레오타이드 서열에 작동 가능하게 연결된(operably linked) 제1의 프로모터; ii) 세포 내에서의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제2의 프로모터; 및 iii) 제1 및 제2의 프로모터에 작동 가능하게 연결된 적어도 하나의 인핸서(enhancer)를 포함하는, 세포의 게놈 내로 통합된 곤충 세포에 관한 것이고, 여기서 적어도 하나의 인핸서 성분은 전사 트랜스레귤레이터(transcriptional transregulator)에 의존적이고, 여기서 전사 트랜스레귤레이터의 세포 내로의 도입은 제1 및 제2의 프로모터로부터의 전사를 유도한다. 바람직하게는 본 발명의 곤충 세포 내에서, 제1 및 제2의 프로모터는 바큘로바이러스 프로모터이고, 전사 트랜스레귤레이터는 바큘로바이러스 이미이어트-얼리 단백질(immediate-early protein; IE1) 또는 이의 스플라이스 변이체(splice variant; IE0)이고 전사 트랜스레귤레이터-의존적인 인핸서 성분은 바큘로바이러스 상동성 영역(homologous region; hr) 인핸서 성분이고, 여기서 바람직하게는 바큘로바이러스는 오토그라파 칼리포르니카(Autographa californica) 다중캡시드(multicapsid) 뉴클레오폴리헤드로바이러스이다. 바람직하게는, 본 발명의 곤충 세포에서, hr 인핸서 성분은 hr2-0.9 이외의 hr 인핸서 성분이고, 여기서 바람직하게는 hr 인핸서 성분은 바람직하게는 hr 28-mer 서열 CTTTACGAGTAGAATTCTACGCGTAAAA (서열 번호: 32)의 적어도 하나의 카피 및/또는 적어도 20, 21, 22, 23, 24, 25, 26, 또는 27 뉴클레오타이드의 서열이 서열 CTTTACGAGTAGAATTCTACGCGTAAAA(서열 번호: 32)와 동일하고 바큘로바이러스 IE1 단백질에 결합하는 서열의 적어도 하나의 카피(one copy of a of a sequence)를 포함하고, 여기서 hr 인핸서 성분은, polH 프로모터에 작동 가능하게 연결된 리포터 유전자(reporter gene)를 포함하는 발현 카세트(expression cassette)에 작동 가능하게 연결된 경우, a) 비-유도 조건(non-inducing condition) 하에서, hr 인핸서 성분을 지닌 발현 카세트는 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트 보다는 리포터 전사체를 거의 생산하지 않거나, hr 인핸서 성분을 지닌 카세트는 hr4b 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체 양의 1.1, 1.2, 1.5, 2, 5 또는 10배(factor) 미만을 생산하고; b) 유도 조건 하에서, hr 인핸서 성분을 지닌 발현 카세트는 hr4b 또는 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체의 양의 적어도 50, 60, 70, 80, 90 또는 100%를 생산하고, 보다 바람직하게는, hr 인핸서 성분은 hr1, hr3, hr4b 및 hr5로 이루어진 그룹으로부터 선택되고, 이 중 hr4b 및 hr5가 바람직하고, 이중 hr4b가 가장 바람직하다.
본 발명에 따른 곤충 세포에서, 제1 및 제2의 프로모터는 바람직하게는 별개이고, 여기서 보다 바람직하게는 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터(delayed early baculoviral promoter)이고 제2의 프로모터는 레이트 또는 베리 레이트 바큘로바이러스 프로모터(late or very late baculoviral promoter)이고, 가장 바람직하게는 제1의 프로모터는 39k 프로모터이고 제2의 프로모터는 polH, p10, p6.9 및 pSel120 프로모터로 이루어진 그룹으로부터 선택된다.
본 발명의 곤충 세포의 바람직한 구현예에서, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 및 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나는 적어도 90% 동일한 일반적인 아미노산 서열을 가지지만, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에 대해 mRNA일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대해 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 95, 90, 85, 80, 75, 70, 65 또는 60% 미만의 서열 동일성(sequence identity)을 갖고, 여기서 바람직하게는 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에 대한 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 내 코돈 사용(codon usage)은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 내 코돈 사용보다 곤충 세포의 코돈 사용 편향(codon usage bias)에 대해 보다 더 적응된다.
본 발명의 곤충 세포의 다른 바람직한 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA를 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 감소된 정상 상태 수준(steady state level)에 영향을 미치는 변형을 포함하고, 바람직하게는 파르보바이러스 Rep78 및 68 단백질 중 적어도 하나는 준최적 해독 개시 코돈으로 출발하는 개방 판독 프레임(open reading frame)을 포함하고, 여기서 보다 바람직하게는, 준최적 해독 개시 코돈은 ACG, CTG, TTG, GTG 및 ATT로부터 선택되고, 이중 ACG가 가장 바람직하다.
바람직하게는 본 발명에 따른 곤충 세포 내에서, 제1 및 제2의 프로모터는 전사의 반대 방향으로 세포의 게놈 내에 통합되고 여기서 적어도 하나의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재하고, 여기서 보다 바람직하게는 2개의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재한다.
본 발명에 따른 곤충 세포는 또한 바람직하게는: a) 곤충 세포 내에서 발현을 위한 제3의 프로모터에 작동 가능하게 연결된 파르보바이러스 캡시드 단백질 암호화 서열을 포함하는 뉴클레오타이드 서열; b) 적어도 하나의 파르보바이러스 역위된 말단 반복 서열(parvovirus inverted terminal repeat sequence)에 의해 플랭킹(flanking)되는 전이유전자를 포함하는 뉴클레오타이드 서열; 및 c) 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 뉴클레오타이드 서열을 포함하고, 여기서 바람직하게는, a) 및 b) 중 적어도 하나의 뉴클레오타이드 서열은 바큘로바이러스 벡터 내에 포함되고, 여기서, 보다 바람직하게는 a), b) 및 c) 중 적어도 하나의 뉴클레오타이드 서열은 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 바큘로바이러스 벡터 내에 포함된다. 바람직한 구현예에서, 제1의 프로모터는 제3의 프로모터 앞에서 활성이다.
본 발명에 따른 곤충 세포의 바람직한 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나, 파르보바이러스 VP1, VP2, 및 VP3 캡시드 단백질 및 적어도 하나의 파르보바이러스 역위된 말단 반복체 서열은 아데노 관련 바이러스(adeno associated virus; AAV)로부터 유래된다.
본 발명에 따른 곤충 세포의 바람직한 구현예에서, 바람직한 cap-암호화 서열은 적어도 CAP AAV2/5(서열 번호: 29) 또는 AAV5(서열 번호: 30)를 포함한다.
제2의 양태에서, 본 발명은 a) 상기 정의된 바와 같은 곤충 세포를 배양하는 단계; b) a)에서 배양된 세포에 본원의 상기에 정의된 바와 같은 뉴클레오타이드 서열을 제공하는 단계; 및, c) 재조합 파르보바이러스 비리온(virion)을 회수하는 단계를 포함하는, 재조합 파르보바이러스 비리온을 생산하는 방법에 관한 것이다. 바람직하게는 본 발명의 방법에서, 단계 c)에서 재조합 파르보바이러스 비리온의 회수는 고정된 항-파르보바이러스 항체, 바람직하게는 단일 쇄 카멜리드 항체(camelid antibody) 또는 이의 단편을 사용한 비리온의 친화성-정제(affinity-purification), 및 30 내지 70 nm의 공칭 공극 크기(nominal pore size)를 지닌 필터(filter) 위에서의 여과 중 적어도 하나를 포함한다.
제3의 양태에서, 본 발명은 적어도 본원의 상기에 정의된 바와 같은 곤충 세포 및 본원의 상기에 정의된 바와 같은 바큘로바이러스 벡터 및/또는 뉴클레오타이드 서열을 포함하는 부분의 키트(kit of parts)에 관한 것이다.
발명의 설명
정의
달리 정의하지 않는 한, 본원에 사용된 기술적 및 과학적 용어는 본 개시내용이 속한 분야의 통상의 기술자에 의해 일반적으로 이해된 바와 동일한 의미를 갖는다. 당해 분야의 숙련가는 본원에 기술된 것과 유사하거나 동일한 많은 방법 및 물질을 인식할 것이며, 이는 본 발명의 실시에 사용될 수 있다. 더욱이, 본 발명은 어떠한 방식으로도 이러한 방법에 한정되지 않는다.
이러한 문서 및 이의 청구범위에서, 동사 "포함하는" 및 이의 활용은 이러한 단어를 수반하는 항목이 포함됨을 의미하는 이의 비-제한적인 의미로 사용되지만, 구체적으로 언급되지 않은 항목이 배제되지는 않는다. 또한, 단수 형태("a" 또는 "an")에 의한 성분에 대한 참고는, 문맥이 성분 중 하나 또는 하나 만이 존재함을 명확하게 요구하지 않는 한, 성분 중 하나 이상이 존재할 가능성을 배제하지 않는다. 따라서, 단수 형태("a" 또는 "an")는 일반적으로 "적어도 하나"를 의미한다.
본원에 사용된 바와 같은 용어 "및/또는"은 기술된 경우 중 하나 이상이 단독으로 또는 기술된 경우 중 적어도 하나와 함께 기술된 경우의 모두를 사용할 때까지 발생할 수 있음을 아타낸다.
본원에 사용된 바와 같은, "적어도" 특수한 값은 특수한 값 또는 그 이상을 의미한다. 예를 들면, "적어도 2"는 "2 이상"과 동일한, 즉, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, ... , 등인 것으로 이해된다.
단어 "약" 또는 "대략"은 수치 값과 함께 사용되는 경우(예컨대, 약 10), 바람직하게는 값이 주어진 값(10) 이상 또는 값의 0.1% 미만일 수 있음을 의미한다.
본원에 사용된 바와 같은, "유효량"은 제제의 양이 치료되지 않은 환자와 관련하여 질환의 증상을 개선시키는데 요구되는 제제의 양을 의미한다. 예를 들면, 암의 치료학적 치료를 위해 본 발명을 실시하는데 사용된 활성제(들)의 유효량은 투여 방식, 체중, 및 대상체의 일반적인 건강에 따라 변한다. 궁극적으로, 주치의 또는 수의사는 적절한 양 및 투여량 요법을 결정할 것이다. 이러한 양은 킬로그램 당 게놈 카피(GC/kg)로서 측정될 수 있는 "유효한" 양으로 지칭된다. 따라서, 현재의 개시내용의 문맥에서, 질환 또는 상태"에 대해 효과적인" 약물의 투여와 관련하여, 임상적으로 적절한 방식의 투여는 환자의 적어도 통계적으로 유의적인 분획에 대해 유리한 효과, 예를 들면, 증상의 개선, 적어도 하나의 질환 신호 또는 증상에서 치유, 감소, 삶의 연장, 삶의 질의 개선, 또는 특수한 유형의 질환 또는 상태를 치료하는 것에 친숙한 의사 박사에 의해 긍정적인 것으로 일반적으로 인식된 다른 효과를 생성함을 나타낸다.
본 문서에 기술된 바와 같은 의약으로부터의 물질의 사용은 의약의 제조시 상기 물질의 사용으로서 또한 해석될 수 있다. 유사하게, 물질이 치료를 위해 또는 의약으로서 사용될 때는 언제는지, 이는 또한 치료용 의약의 제조를 위해 사용될 수 있다. 본원에 기술된 의약으로서 사용하기 위한 생성물은 치료 방법에서 사용될 수 있고, 여기서 이러한 치료 방법은 사용을 위한 생성물의 투여를 포함한다.
용어 "상동성(homology)", "서열 동일성(sequence identity)" 등은 본원에서 상호교환적으로 사용된다. 서열 동일성은 서열을 비교함으로서 측정한 것으로서, 본원에서 2개 이상의 아미노산(폴리펩타이드 또는 단백질) 서열 또는 2개 이상의 핵산(폴리뉴클레오타이드) 서열 사이의 관계로서 정의된다. 당해 분야에서, "동일성"은 또한 이러한 서열의 스트링(string) 사이의 매치에 의해 측정된 것으로서, 경우가 존재할 경우, 아미노산 또는 핵산 서열 사이의 서열 관련성 정도를 의미한다. 2개의 아미노산 서열 사이의 "유사성"은 하나의 펩타이드의 아미노산 서열 및 이의 보존된 아미노산 치환체를 제2의 폴리펩타이드의 서열과 비교함으로써 측정된다. "동일성" 및 "유사성"은 공지된 방법에 의해 용이하게 계산될 수 있다.
"서열 동일성" 및 "서열 유사성"은 2개의 서열의 길이에 따라, 전반적이거나 국부적인 정렬 알고리즘을 사용하여 2개의 펩타이드 또는 2개의 뉴클레오타이드 서열의 정렬에 의해 측정할 수 있다. 유사한 길이의 서열은 바람직하게는 임의로 전체 길이에 걸쳐 서열을 정렬하는 전반적인 정렬 알고리즘(예컨대, Needleman Wunsch)을 사용하여 정렬되지만, 실질적으로 상이한 길이의 서열은 바람직하게는 국부 정렬 알고리즘(예컨대, Smith Waterman)을 사용하여 정렬된다. 서열이(예를 들면 디폴트 매개변수(default parameter)를 사용하여 프로그램 GAP 또는 BESTFIT에 의해 임의로 정렬된 경우) 서열 동일성의 적어도 특정의 최소 퍼센트를 공유하는 경우(하기 정의된 바와 같이), 이후에 "실질적으로 동일한" 또는 "필수적으로 유사한" 것으로 지칭될 수 있다. GAP은 Needleman 및 Wunsch 전반적인 정렬 알고리즘을 사용하여 이의 전체 길이(전체 길이)에 걸쳐 2개의 서열을 정렬하여, 매치의 수를 극대화하고 갭의 수를 최소화한다. 전반적인 정렬을 적합하게 사용하여 2개의 서열이 유사한 길이를 갖는 경우 서열 동일성을 측정한다. 일반적으로, GAP 디폴트 매개변수를 사용하여, 갭 창조 패널티(gap creation penalty)는 50(뉴클레오타이드)/8(단백질)이고 갭 연장 패널티(gap extension penalty)는 3(뉴클레오타이드)/2(단백질)이다. 뉴클레오타이드의 경우 사용된 디폴트 점수매김 매트릭스(default scoring matrix)는 nwsgapdna이고 단백질의 경우 디폴트 점수매김 매트릭스는 Blosum62이다(Henikoff & Henikoff, 1992, PNAS 89, 915-919). 서열 정렬 및 서열 동일성 퍼센트에 대한 점수는 컴퓨터 프로그램, 예를 들면, 미국 캘리포니아주 92121-3752, 샌 디에고, 스크란톤 로드 9685에 소재하는 Accelrys Inc.로부터 이용가능한 GCG Wisconsisn Package, 버젼 10.3을 사용하거나, 개방 소프 소프트웨어(open source software), 예를 들면, 프로그램 "니들(needle)"(전반적인 Needleman Wunsch 알고리즘 사용) 또는 상기 GAP에 대해서와 동일한 매개변수, 또는 디폴트 셋팅('티들' 및 '워터'의 경우 둘 다 및 단백질 및 DNA 정렬'에 대해 둘 다, 디폴트 Gap 개방 패널티(Gap opening penalty)는 10.0이고 디폴티 갭 연장 패널티는0.5이고; 디폴트 점수매김 매트릭스(default scoring matrices)는 단백질의 경우 Blossum62이고 DNA의 경우 DNAFull이다)을 사용하는 "워터(water)"(국부 Smith Waterman 알고리즘 사용)를 EmbossWIN 버젼 2.10.0을 사용하여 측정할 수 있다. 서열이 실질적으로 상이한 전체 길이를 갖는 경우, 국부 알고리즘, 예를 들면, Smith Waterman 알고리즘을 사용하는 것이 바람직하다.
대안적으로, 유사성 또는 동일성 퍼센트는 FASTA, BLAST와 같은 알고리즘을 사용하여, 공공의 데이타베이스에 대해 조사함으로써 측정할 수 있다. 따라서, 본 발명의 핵산 및 단백질 서열은 또한 "질의 서열(query sequence)"로서 사용하여 공공의 데이타베이스에 대한 조사를 수행함으로써, 예를 들면, 다른 계열 구성원 또는 관련된 서열을 확인할 수 있다. 이러한 조사는 문헌: Altschul, et al. (1990) J. Mol. Biol. 215:403―10의 BLASTn 및 BLASTx 프로그램(버젼 2.0)을 사용하여 수행할 수 있다. BLAST 뉴클레오타이드 조사는 NBLAST 프로그램, 점수 = 100, 단어길이(wordlength) = 12를 사용하여 수행함으로써 본 발명의 옥시도리덕타제 핵산에 대해 상동성인 뉴클레오타이드 서열을 수득할 수 있다. BLAST 단백질 조사는 BLASTx 프로그램, 점수 = 50, 단어길이 = 3을 사용하여 수행함으로써 본 발명의 단백질 분자에 대해 상동성인 아미노산을 수득할 수 있다. 비교 목적을 위한 갭화된 정렬(gapped alignment)을 수득하기 위해, 갭화된(Gapped) BLAST를 문헌: Altschul et al., (1997) Nucleic Acids Res. 25(17): 3389-3402에 기술된 바와 같이 활용할 수 있다. BLAST 및 갭화된 BLAST 프로그램을 활용하는 경우, 각각의 프로그램(예컨대, BLASTx 및 BLASTn)의 디폴트 매개변수를 사용할 수 있다. http://www.ncbi.nlm.nih.gov/에서의 생명과학 정보를 위한 국립 센터(National Center for Biotechnology Information)를 참고한다.
본원에 사용된 바와 같은, 용어 "선택적으로 하이브리드화하는", "선택적으로 하이브리드화하다" 및 유사한 용어는 서로에 대해 적어도 66%, 적어도 70%, 적어도 75%, 적어도 80%, 보다 바람직하게는 적어도 85%, 심지어 보다 바람직하게는 적어도 90%, 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 98% 또는 보다 바람직하게는 적어도 99% 상동성인 뉴클레오타이드 서열이 전형적으로 서로에 대해 하이브리드화되어 남아있는 하에서, 하이브리드화 및 세척 조건을 기술하기 위해 의도된다. 즉, 다시 말해서, 이러한 하이브리드화 서열은 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65, 적어도 70%, 적어도 75%, 적어도 80%, 보다 바람직하게는 적어도 85%, 심지어 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 98% 또는 보다 바람직하게는 적어도 99%의 서열 동일성을 공유한다.
이러한 하이브리드화 조건의 바람직한, 비-제한적 예는 약 45℃에서 6X 염화나트륨/시트르산나트륨(SSC) 속에서 하이브리드화에 이어 1X SSC, 0.1% SDS 속에서 50℃, 바람직하게는 약 55℃ 까지, 바람직하게는 약 60℃ 및 심지어 보다 바람직하게는 약 65℃에서 1회 이상의 세척이다.
고도로 엄격한 조건(highly stringent condition)은 예를 들면, 5x SSC/5x 덴하르트 용액(Denhardt's solution)/1.0% SDS 속에서 약 68℃에서 하이브리드화 및 실온에서 0.2x SSC/0.1% SDS 속에서 세척을 포함한다. 대안적으로, 세척은 42℃에서 수행될 수 있다.
숙련가는 어느 조건을 엄격한 및 고도로 엄격한 하이브리드화 조건에 적용하는지를 알 것이다. 이러한 조건에 대한 추가의 안내는 당해 분야에서, 예를 들면, 문헌: Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y.; 및 Ausubel et al. (eds.), Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.)에서 용이하게 이용가능하다.
물론, 폴리 A 서열(예를 들면, mRNA의 3' 말단 폴리(A) 트랙(tract)), 또는 T(또는 U) 잔기의 상보성 스트레치(complementary stretch)에만 하이브리드화하는 폴리뉴클레오타이드는 폴리(A) 스트레치 또는 이의 보체(즉, 실질적으로 임의의 이중-가닥 cDNA 클론)을 함유하는 임의의 핵산에 하이브리드화할 수 있으므로, 이는 본 발명의 핵산의 부위에 대해 특이적으로 하이브리드화하는데 사용된 본 발명의 폴리뉴클레오타이드 내에 포함되지 않을 수 있다.
"핵산 작제물" 또는 "핵산 벡터"는 본원에서 재조합 DNA 기술의 사용으로부터 야기되는 사람이 제조한 핵산 분자를 의미하는 것으로 본원에서 이해된다. 따라서, 용어 "핵산 작제물"은, 핵산 작제물이 천연적으로 존재하는 핵산 분자(중 일부)를 포함하지 않을 수 있다고 해도, 천연적으로 존재하는 핵산 분자를 포함하지 않는다. "벡터"는 외인성 핵산 서열(즉, DNA 또는 RNA)을 숙주 세포 내로 전달하기 위해 공급되는 핵산 작제물(전형적으로 DNA 또는 RNA)이다. 벡터는 바람직하게는 자가 복제 및 숙주 세포의 게놈 내로의 통합 중 적어도 하나에 의해 숙주 내에서 유지된다. 용어 "발현 벡터" 또는 "발현 작제물"은 이러한 서열과 상용성인 숙주 세포 또는 숙주 유기체 내에서 유전자의 발현에 영향을 미칠 수 있는 뉴클레오타이드 서열을 지칭한다. 이러한 발현 벡터는 전형적으로 발현될 생성물을 암호화하는 서열의 발현에 영향을 미칠 수 있는 기능성 단위인 적어도 하나의 "발현 카세트"를 포함하고, 여기서 코딩 서열은 적합한 발현 제어 서열과 작동가능하게 연결되어 있다. 이는 적어도 적합한 전사 조절 서열 및 임의로, 3' 전사 종결 신호를 포함한다. 발현에 영향을 미치는데 필수적이거나 도움이 되는 추가의 인자, 예를 들면, 발현 인핸서 성분이 또한 존재할 수 있다. 발현 벡터는 적합한 숙주 세포 내로 도입될 것이고 숙주 세포의 시험관 내 세포 배양물 속에서 암호화 서열의 발현에 영향을 미칠 수 있다. 바람직한 발현 벡터는 바이러서 단백질 및/또는 핵산, 특히 재조합 AAV 단백질 및/또는 핵산의 발현에 적합할 것이다.
본원에 사용된 바와 같은, 용어 "프로모터" 또는 "전사 조절 서열"은 하나 이상의 암호화 서열의 전사를 제어하는 기능을 하는 핵산을 지칭하고, 코딩 서열의 전사 개시 부위의 전사 방향과 관련하여 상부에 위치하고, 및 DNA-의존성 RNA 폴리머라제, 전사 개시 부위 및 임의의 다른 DNA 서열, 예를 들면, 그러나 이에 한정되지 않는 전사 인자 억제 부위, 리프레서(repressor) 및 활성인자 단백질 결합 부위, 및 당해 분야의 숙련가에게 프로모터로부터 전사의 양을 직접 또는 간접적으로 조절하기 위해 작용하는 것으로 알려진 뉴클레오타이드의 임의의 다른 서열의 존재에 의해 구조적으로 확인된다. "구성적" 프로모터는 가장 생리학적 및 발달 조건 하에서 대부분의 조직 속에서 활성인 프로모터이다. "유도성" 프로모터는 예컨대, 화학 유도인자 또는 생물학적 실체의 적용에 의해 생리학적으로 또는 발달적으로 조절되는 프로모터이다.
용어 "리포터(reporter)"는 주로 가시성 마커(visible marker), 예를 들면, 녹색 형광 단백질(GFP) 또는 루시퍼라제를 지칭하기 위해 주로 사용되지만, 마커와 상호교환적으로 사용될 수 있다.
용어 "단백질" 또는 "폴리펩타이드"는 상호교환적으로 사용되며 구체적인 작용 방식, 크기, 3-차원 구조 또는 기원을 참고하지 않고, 아미노산 쇄로 이루어진 분자를 지칭한다.
용어 "유전자"는 적합한 조절 영역(예컨대, 프로모터)에 작동 가능하게 연결된, 세포 내 RNA 분자(예컨대, mRNA) 내로 전사되는, 영역(전사된 영역)을 포함하는 DNA 단편을 의미한다. 유전자는 일반적으로 수개의 작동 가능하게 연결된 단편, 예를 들면, 프로모터, 5' 리더 서열, 암호화 서열 및 폴리아데닐화 부위를 포함하는 3'-해독되지 않은 서열(3'-말단)을 포함할 것이다. "유전자의 발현"은 적절한 조절 영역, 특히 프로모터에 작동 가능하게 연결된 DNA 영역이 RNA 내로 전사되고, 이는 생물학적으로 활성인, 즉, 생물학적으로 활성인 단백질 또는 펩타이드로 해독될 수 있는 공정을 지칭한다.
용어 "상동성"은 주어진(재조합) 핵산 또는 폴리펩타이드 분자와 주어진 숙주 유기체 또는 숙주 세포 사이에서의 관계를 나타내는데 사용되는 경우, 천연에서 핵산 또는 폴리펩타이드 분자가 동일한 종, 바람직하게는 동일한 다양성 또는 균주의 숙주 세포 또는 유기체에 의해 생산되는 것을 의미하는 것으로 이해된다. 숙주 세포에 대해 상동성인 경우, 폴리펩타이드를 암호화하는 핵산 서열은 전형적으로(그러나 필수적이지 않게) 다른 (이종) 프로모터 서열 및, 적용가능한 경우, 이의 천연 환경에서보다 다른 (이종) 분비 신호 서열 및/또는 터미네이터 서열(terminator sequence)에 작동 가능하게 연결될 것이다. 이러한 문맥에서, "상동성" 서열 성분 만의 사용은 "자가-클로닝된(self-cloned)" 유전적으로 변형된 유기체(GMO's)(자가-클로닝은 본원에서 유럽 지침 98/81/EC 부록 II(European Directive 98/81/EC Annex II)에서와 같이 정의된다)의 작제를 허용한다. 2개의 핵산 서열의 관계를 나타내기 위해 사용된 경우 용어 "상동성"은 하나의 단일 가닥 핵산 서열이 상보성 단일 가닥 핵산 서열에 하이브리드화될 수 있음을 의미한다. 하이브리드화 정도는 서열과 하이브리드화 조건, 예를 들면, 이후 논의되는 바와 같은 온도 및 염 농도 사이의 동일성의 양을 포함하는 다수의 인자의 의존할 수 있다.
용어 "이종" 및 "외인성"은 핵산(DNA 또는 RNA) 또는 단백질과 관련하여 사용되는 경우 이것이 존재하는 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 부분으로서 천연적으로 발생하지 않거나, 이것이 천연에서 발견된 것과는 상이한 세포 또는 게놈 또는 DNA 또는 RNA 서열 내 위치 또는 위치들에서 발견된 핵산 또는 단백질을 지칭한다. 이종 및 외인성 핵산 또는 단백질은 이들이 도입되지만 다른 세포로부터 수득되거나 합성적으로 또는 재조합적으로 생산된 세포에 대해 내인성이 아니다. 일반적으로, 필수적이지는 않지만, 이러한 핵산은 DNA가 전사 또는 발현되는 세포에 의해 일반적으로 생산되지 않는 단백질, 즉, 외인성 단백질을 암호화한다. 이종/외인성 핵산 및 단백질은 또한 외부(foreign) 핵산 또는 단백질로서 지칭될 수 있다. 당해 분야의 숙련가가 이것이 발현된 세포에 대해 외부인 것으로 인식할 수 있는 임의의 핵산 또는 단백질은 본원에서 용어 이종 또는 외인성 핵산 또는 단백질에 의해 포함된다. 용어 이종 및 외인성은 또한 핵산 또는 아미노산 서열의 비-천연 조합, 즉, 조합된 서열 중 적어도 2개가 서로에 대해 외부인 조합에 적용된다.
본원에 사용된 바와 같은, 용어 "비-천연적으로 발생하는"은 유기체에 대해 참고하여 사용된 경우 유기체가 참고된 종의 천연적으로 발생하는 균주, 예를 들면, 지칭된 종의 야생형 균주에서 일반적으로 발견되지 않는 적어도 하나의 유전적 대체를 가지는 것을 의미한다. 유전적 변경은 예를 들면, 단백질 또는 효소를 암호화하는 발현가능한 핵산, 다른 핵산 첨가, 핵산 결실, 핵산 치환, 또는 유기체의 유전 물질의 다른 기능적 파괴를 도입하는 변형을 포함한다. 이러한 변형은, 예를 들면, 참고된 종에 대한 이종 또는 동종 폴리펩타이드에 대한 코딩 영역 및 이의 기능적 단편을 포함한다. 추가의 변형은 예를 들면, 변형이 유전자 또는 오페론의 발현을 변경시키는 비-코딩 조절 영역을 포함한다. 효소 또는 이의 기능성 단편을 암호화하는 핵산 분자에 대한 유전적 변형은 이의 천연적으로 발생하는 상태로부터 변경된 비-천연적으로 발생하는 유기체에게 생화학적 반응 능력 또는 물질대사 경로 능력을 부여할 수 있다.
본원에 사용된 바와 같은, 용어 "작동 가능하게 연결된"은 기능적 관계인 폴리뉴클레오타이드(또는 폴리펩타이드) 성분의 연결을 지칭한다. 핵산은 이것이 다른 핵산 서열과 기능적 관계로 위치하는 경우 "작동 가능하게 연결"된다. 예를 들면, 전사 조절 서열은 이것이 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동 가능하게 연결된다. 작동 가능하게 연결된은, 연결되는 DNA 서열이 전형적으로 연속적이며, 필수적으로 2개의 단백질 암호화 영역을 결합시키는 경우 연속적이고 개방 프레임(reading frame) 내에 존재한다.
발현 제어 서열은 발현 제어 서열이 뉴클레오타이드 서열의 전사 및또는 해독을 제어하고 조절하는 경우 뉴클레오타이드 서열에 "작동 가능하게 연결"된다. 따라서, 발현 제어 서열은 프로모터, 인핸서, 내부 리보솜 도입 부위(internal ribosome entry site; IRES), 전사 터미네이터(transcription terminator), 단백질-암호화 유전자 앞의 출발 코돈, 인트론에 대한 스플라이싱 신호, 및 정지 코돈을 포함할 수 있다.
용어 "발현 제어 서열"은 최소로, 이의 존재가 발현에 영향을 미치는 것으로 지정된 서열을 포함하는 것으로 의도되며, 또한 추가의 유리한 구성성분을 포함할 수 있다. 예를 들면, 리더 서열 및 융합 파트너 서열은 발현 제어 서열이다. 이러한 용어는 또한 핵산 서열의 설계를 포함함으로써, 프레임 내부 및 외부의 바람직하지 않은, 잠재적인 개시 코돈이 서열로부터 제거되도록 한다. 이는 또한 핵산 서열의 설계를 포함함으로써 바람직하지 않은 잠재적인 스플라이스 부위가 제거되도록 한다. 이는 폴리A 테일의 추가를 지시하는 서열 또는 폴리아데닐화 서열(pA), 즉, 폴리A 서열로서 지칭된 서열인, mRNA의 3'-말단에서 아데닌 잔기의 스트링을 포함한다. 이는 또한 mRNA 안정성을 향상시키기 위해 설계될 수 있다. 전사 및 해독 안정성에 영향을 미치는 발현 제어 서열, 예컨대, 프로모터 뿐만 아니라 해독에 영향을 미치는 서열, 예컨대, 코작 서열(Kozak sequence)도 곤충 세포 내에서 알려져 있다. 발현 제어 서열은 이것이 작동 가능하게 연결됨으로써 보다 적은 발현 수준 또는 보다 높은 발현 수준이 달성되도록 하는 뉴클레오타이드 서열을 조절하는 특성을 가질 수 있다.
발명의 상세한 설명
본 발명자는 재조합 파르보바이러스 벡터의 생산을 위한 개선된 패키징 곤충 세포주 및 벡터 시스템을 개발하기 위해 설정되었다. 특히, 본 발명자는 유도된 조건 하에서 강력한 발현을 유지하면서 유도되지 않은 조건 하에서 리키 발현(leaky expression)을 감소시키기 위한 수단을 제공함으로써 곤충 세포주 내에서 안정하게 통합된 Rep 유전자의 유도성 발현의 개선된 제어를 갖는다. 이러한 곤충 세포는 또한 iRep 세포, 또는 단순히 iRep로 지칭된다. 또한 본 발명자는 다양한 바르보바이러스, 예컨대, AAV, 구조적 또는 비-구조적 단백질 중에서 발현 역학 및 비(ratio)를 최적화시킴으로써, 특히 바큘로바이러스 및 곤충 세포 플랫폼을 사용한 생산 플랫폼으로부터 벡터 산출량의 풍부성, 수율 및 품질을 추가로 개선시켰다.
벡터 품질은 전체 비리온(full virion)대 빈 비리온(empty virion) 사이의 비와 강력하게 관련되어 있으며, 이는 벡터 자체의 효능에 기여한다. 용어 "전체 비리온"은 역위된 말단 반복체(ITR) 서열에 의해 플랭킹되는 전이유전자 DNA를 캡슐화하는 파르보바이러스 구조적 캡시드 단백질(VP1, VP2 및 VP3)를 포함하는 비리온 입자를 지칭한다. 용어 "빈 비리온"은 파르보바이러스 게놈 물질을 포함하지 않는 비리온 입자를 지칭한다. 본 발명의 바람직한 구현예에서, 전체 비리온 대 빈 비리온의 비는 적어도 1:50, 보다 바람직하게는 적어도 1:10, 또는 적어도 1:5, 또는 적어도 1:2 및 심지어 보다 바람직하게는 적어도 1:1이다. 심지어 보다 바람직하게는, 빈 비리온은 검출될 수 없고, 가장 바람직하게는 빈 비리온은 존재하지 않는다. 비리온 당 하나 만의 게놈 카피가 존재할 것이므로, 당해 분야의 숙련가는 예를 들면, 유전자 카피 수를 조립된 AAV 캡시드 수를 지닌 전체 입자로 나눔으로써, 전체 비리온 대 빈 비리온 비(또는 전체의 조립된 캡시드:게놈 카피 수)를 측정하는 방법을 알 것이다. 당해 분야의 숙련가는 이러한 비를 측정하는 방법을 알 것이다. 예를 들면, 빈 비리온 대 전체 캡시드의 비는 게놈 종의 양(즉, 게놈 카피 수)를 전체 파르보바이러스 입자의 양(즉, 파르보바이러스 입자의 수)로 나눔으로써 측정할 수 있고, 여기서 ml 당 게놈 카피의 양은 정량적 PCR에 의해 측정되며 ml 당 전체 파르보바이러스 입자의 양은 예컨대, Progen으로부터의 효소 면역검정(enzyme immunoassay)으로 측정된다.
곤충 세포
일 양태에서, 세포의 게놈 내로: i) 이의 해독이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 만을 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제1의 프로모터; ii) 세포 내에서 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 만을 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제2의 프로모터; 및 iii) 제1 및 제2의 프로모터에 작동 가능하게 연결된 적어도 하나의 인핸서 성분을 통합시킨 곤충 세포가 제공되며, 여기서 적어도 하나의 인핸서 성분은 전사 트랜스레귤레이터에 의존적이고, 여기서 바람직하게는 전사 트랜스레귤레이터의 세포 내로의 도입은 제1 및 제2의 프로모터로부터의 전사를 유도한다.
곤충 세포는 이종 단백질의 생산에 적합한 임의의 세포일 수 있다. 바람직하게는 곤충 세포는 바큘로바이러스 벡터의 복제를 허용하며 배양물 속에서 유지될 수 있다. 보다 바람직하게는 곤충 세포는 또한 재조합 파르보바이러스 벡터, 예를 들면, rAAV 벡터의 복제를 허용한다. 예를 들면, 사용된 세포주는 스포도프테라 프루기페르다(Spodoptera frugiperda), 드로소필라(Drosophila) 세포주, 또는 모기 세포 주, 예컨대, 아에데스 알보픽투스(Aedes albopictus) 유래된 세포주로부터 유래될 수 있다. 바람직한 곤충 세포 또는 세포주는 바큘로바이러스 감염에 민감한 곤충 종으로부터의 세포, 예를 들면, 예컨대, S2(CRL-1963, ATCC), Se301, SeIZD2109, SeUCR1, Sf9, Sf900+, Sf21, BTI-TN-5B1-4, MG-1, Tn368, HzAm1, Ha2302, Hz2E5, 하이 파이브(High Five)(Invitrogen, 미국 캘리포니아주 소재) 및 expresSF+®(US 6,103,526; Protein Sciences Corp., 미국 코넷티컷주 소재)로부터 유래된 세포이다.
당해 분야의 통상의 숙련가는 뉴클레오타이드 서열을 곤충 게놈 내로 안정하게 도입시키는 방법 및 이러한 뉴클레오타이드 서열을 게놈 내에서 갖는 세포를 확인하는 방법을 알고 있다. 게놈 내로의 도입은 예를 들면, 곤충 게놈의 영역에 대해 고도로 상동성인 뉴클레오타이드 서열을 포함하는 벡터의 사용에 의해 보조될 수 있다. 특정 서열, 예를 들면, 트랜스포손(transposon)의 사용은 뉴클레오타이드 서열을 게놈 내로 도입시키는 다른 방법이다. 게놈 내로의 혼입은 하나 또는 하나 이상의 단계를 통할 수 있다. 용어 "통합된"에 대한 참고는 당해 분야의 숙련가에게 또한 "안정하게 통합된"을 의미하는 것으로 알려질 것이다.
배양물 속에서 곤충 세포에 대한 성장 조건, 및 배양물 속의 곤충 세포 내에서 이종 생성물의 생산은 당해 분야에 잘 공지되어 있고, 예컨대, 곤충 세포의 분자 가공에 있어서 상기 인용된 참고 문헌(또한 제WO2007/046703호)에 기술되어 있다.
"곤충 세포-상용성 벡터" 또는 "벡터"는 곤충 또는 곤충 세포를 생산적 형질전환 또는 형질감염시킬 수 있는 분자인 것으로 이해된다. 예시적인 생물학적 벡터는 플라스미드, 선형 핵산 분자, 및 재조합 바이러스를 포함한다. 곤충 세포-양립성인 한, 어떠한 벡터도 사용할 수 있다. 벡터는 곤충 세포 게놈 내로 통합될 수 있지만, 곤충 세포 내에서 벡터의 존재는 영구적일 필요가 없으며 일시적인 에피솜 벡터가 또한 포함된다. 벡터는 예를 들면, 세포의 화학적 처리, 전기천공, 또는 감염에 의해 알려진 임의의 수단으로 도입될 수 있다. 바람직한 구현예에서, 벡터는 바큘로바이러스, 바이러스 벡터, 또는 플라스미드이다. 보다 바람직한 구현예에서, 벡터는 바큘로바이러스인데, 즉, 핵산 작제물은 바큘로바이러스-발현 벡터이다. 바큘로바이러스-발현 벡터 및 이의 사용 방법은 예를 들면, 문헌: Summers and Smith, 1986, "A Manual of Methods for Vaculovirus Vectors and Insect Culture Procedures", Texas Agricultural Experimental Station Bull. No. 7555, College Station, Tex.; Luckow, 1991, In Prokop et al., "Cloning and Expression of Heterologous Genes in Insect Cells with Vaculovirus Vectors' Recombinant DNA Technology 및 Applications", 97-152; King and Possee, 1992, "The Vaculovirus expression system", Chapman and Hall, United Kingdom; O'Reilly, Miller, and Luckow, 1992, "Vaculovirus Expression Vectors: A Laboratory Manual", New York; Freeman and Richardson, 1995, "Vaculovirus Expression Protocols", Methods in Molecular Biology, volume 39; US 4,745,051; US2003148506; 및 WO 03/074714에 기술되어 있다.
재조합 파르보바이러스(rAAV) 벡터의 생산을 위해 곤충 세포 내에서 사용된 핵산 작제물의 수는 본 발명에서 제한되지 않는다. 예를 들면, 1, 2, 3개 이상의 별개의 작제물을 사용하여 본 발명의 방법에 따라 곤충 세포 내에서 rAAV를 생산할 수 있다. 2개의 작제물을 사용한 경우, 하나의 작제물은 적어도 하나의 파르보바이러스 ITR 서열에 의해 플랭킹되는 전이유전자를 포함하는 뉴클레오타이드 서열을 포함할 수 있고 이후 다른 작제물은 Rep 및 Cap 단백질 각각에 대한 발현 카세트를 포함할 수 있다. 3개의 작제물을 사용하는 경우, 하나의 작제물은 적어도 하나의 파르보바이러스 ITR 서열에 의해 플랭킹되는 전이유전자를 포함하는 뉴클레오타이드 서열을 포함할 수 있고, 다른 작제물은 Cap 단백질에 대한 발현 카세트를 포함할 수 있고 여전히 다른 작제물은 Rep 단백질에 대한 하나 이상의 발현 카세트, 에컨대, 하나는 임의로 코돈 최적화, AT-최적화 또는 GC-최적화된, Rep 78 및 52 단백질 각각에 대한 것인 하나 이상의 발현 카세트를 포함함으로써, 본원에서 이후 기술된 바와 같은 재조합을 최소화하거나 방지할 수 있다. 본원에 의해, 핵산 작제물 중 적어도 일부, 바람직하게는 Rep 단백질에 대한 하나 이상의 발현 카세트를 포함하는 것은 곤충 세포의 게놈 내로 안정하게 통합될 수 있음이 이해된다.
본 발명의 발명자는 유도성 곤충 세포 발현 벡터의 설계(예컨대, Rep 단백질의 발현을 위한, 예를 들면, iRep)를 2개 방식으로 추가로 최적화하였다. 우선, AAV 유전자 발현을 조절하는데 있어서 대안의 바큘로바이러스 프로모터의 사용을 시험하였다. 지금까지, 폴리헤드론 프로모터(polH)가 AAV 생산에서, BEV 설정에서 가장 집중적으로 연구되었다(van Oers, M. M., et al., 2015). 대안적인 레이트 프로모터(late promoter), 예를 들면 p10이 polH를 지닌 숙주 인자를 공유하는 것으로 보고되었지만(Ghosh, S., et al., 1998), 다른 바큘로바이러스 프로모터가 상이한 유도 강도 및 일시적인 프로파일을 나타내는 것으로 보고되었다(Dong, Z. Q. et al., 2018; Lin, C. H & Jarvis, D. L., 2013; Martinez-Solis, M., et al., 2016). 그럼에도 불구하고, 곤충 세포 내에서 AAV 생산을 위한 잠재적인 사용은 지금까지 보고되지 않았다. 둘째로, 유도성 발현에서 보다 엄격한 조절이 본 연구에서 탐구되고 있다. 이는, Rep 단백질이 숙주 세포에 대해 독성일 수 있어서 발현의 제어가 요구되므로, 예컨대, AAV Rep의 유도성 발현을 위해 바람직할 수 있다. polH와 함께 바큘로바이러스 상동성 영역(hr) 2 또는 hr2.09 인핸서 서열의 사용은 유도성 OneBac 플랫폼을 위한 디폴트 분자 설계가 되었다(Aslanidi, G., et al. 상기 참고). 여기서, 본 발명자는 다른 바큘로바이러스 hr 인핸서 서열과 함께 대안의 바큘로바이러스 프로모터의 잠재적인 용도를 시험하였다. 또한 상이한 분자 구조에서, 상이한 바큘로바이러스 프로모터 및 인핸서를 연구함으로써, 본 발명자는 AAV 유전자(Cap, Rep)의 발현을 최적화시켜 고 역가를 지닌 고 품질의 AAV 배치를 수득하는 안정하고 풍부한 AAV 생산 플랫폼을 수득하였다.
이러한 접근법은, 유사하거나 명백한 발현 강도 및 야생형(wt)의 단일- 또는 분할-카세트 AAV Rep, 또는 다른 AAV 유전자 발현을 조절하는 유도성 발현 작제물을 유리하게 생성하는 일시적인 프로파일을 사용하여, 대안적이고 비-보존적인 바큘로바이러스 프로모터(p10, 39k, p6.9, pSel120)의 채택을 포함한다. 이는 이후에 재조합 바큘로바이러스 트랜스활성화시 시스:트랜스 프로모터 경쟁하는 경향이 없는 유도성 플라스미드 벡터 작제물의 생산을 가능하도록 할 것이다. 또한, 이는 거의 리키(leaky)하지 않는/리키하지 않는 바큘로바이러스 hr 인핸서를 사용하여 유도성 플라스미드 벡터 작제물의 보다 엄격한 조절을 가능하도록 할 것이다.
본 발명의 추가의 이점은 OneBac 및 곤충 세포 플랫폼보다 개선된 AAV 생산 수율 및 품질; 유도되지 않는 경우 실제로 사일런트(silent)함으로써, 스위치 "오프"된 경우, 보다 생존성이고 안정한 AAV 패키징 세포를 허용하는, 독성 AAV 유전자의 발현을 피하도록 하는 유도성 프로모터의 제공; 및 유도성 플라스미드 벡터 내로 분할-카세트 Rep AAV 설계의 채택을 포함한다.
프로모터
본원에 사용된 바와 같은, 용어 "프로모터" 또는 "전사 조절 서열"은 하나 이상의 암호화 서열의 전사를 제어하도록 작용하고, 암호화 서열의 전사 개시 부위의 방향과 관련하여 상부에 위치하며, DNA-의존성 RNA 폴리머라제에 대한 결합 부위, 전사 개시 부위 및 다른 DNA 서열, 예를 들면, 그러나 이에 한정되지 않는 전사 인자 결합 부위, 리프레서 및 활성인자 단백질 결합 부위, 및 당해 분야의 기술자에게 프로모터로부터 전사의 양을 조절하기 위해 직접 또는 간접적으로 작용하는 것으로 알려진 뉴클레오타이드의 임의의 다른 서열에 의해 구조적으로 확인된 핵산 단편을 지칭한다. "구성적" 프로모터는 가장 생리학적 및 발달 조건 하에서 대부분의 조직 속에서 활성인 프로모터이다. "유도성" 프로모터는 예컨대, 화학적 인핸서의 적용에 의해 생리적으로 또는 발달적으로 조절되는 프로모터이다. "조직 특이적인" 프로모터는 특정 유형의 조직 또는 세포에서만 활성이다. "크립틱 프로모터(cryptic promoter)"는 활성화될 수 있는 후성적으로 사일런스된 프로모터(epigenetically silenced promoter)이다.
바람직한 구현예에서, Rep78 대 Rep52 단백질의 발현 비는: (a) 예컨대, 리포터 유전자 발현(예컨대, 루시퍼라제 또는 SEAP), 또는 노던 블롯(northern blot) 또는 웨스턴 블롯(western blot)에 의해 측정된 것으로서, 제1의 프로모터보다 더 강력한 제2의 프로모터; (b) 제1의 발현 카세트와 비교하여 제2의 발현 카세트의 상부에서 뉴클레오타이드 스페이서 이상 및/또는 보다 강력한 인핸서 성분의 존재; (c) Rep 78 단백질을 암호화하는 뉴클레오타이드 서열과 비교하여 보다 더 높은 코돈 채택 지수(codon adaptation index)를 갖는 파르보바이러스 Rep52 단백질을 코딩하는 뉴클레오타이드 서열; (d) 파르보바이러스 Rep 단백질의 온도 최적화; 및 (e) 상응하는 야생형 Rep 단백질과 비교하여 아미노산 서열내 하나 이상의 변경을 지닌 변이체 Rep 단백질 여기서 하나 이상의 아미노산 변경은 곤충 세포 내에서 증가된 AAV 생산을 검출함으로써 평가된 것으로서 Rep 기능의 활성에서의 증가를 야기한다. 곤충 세포 내에서 증가된 AAV 생산을 검출함으로써 평가된 것으로서 Rep 기능의 증가된 활성을 지닌 변이체 Rep 단백질의 생성, 선택 및/또는 스크리닝 방법은 포유동물 세포 내에서 AAV 생산과 관련하여 증가된 기능을 지닌 변이체 Rep 단백질을 수득하기 위해 제US20030134351호에 기술된 방법의 곤충 세포에 대해 적응시켜 수득될 수 있다. 상응하는 야생형 Rep 단백질과 비교하여 아미노산 서열 내 하나 이상의 변경을 지닌 변이체 Rep 단백질은 본원에서 상응하는 야생형 Rep 단백질의 아미노산 서열과 비교하여 변이체 아미노산 서열 내 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 지닌 Rep 단백질을 포함하는 것으로 이해된다.
제1의 프로모터보다 더 강력한 제2의 프로모터는 Rep52 단백질을 코딩하는 추가의 Mrna 분자가 Rep78 단백질을 코딩하는 mRNA 분자보다 더 발현됨을 의미한다. Rep52 단백질의 발현은 이후 Rep78 단백질의 발현과 비교하여 증가될 것이므로, 동일하게 강력한 프로모터를 사용할 수 있다. 프로모터의 강도는 본 발명의 방법에서 사용된 조건 하에서 수득된 발현에 의해 측정될 수 있다.
일 구현예에서, 제1 및 제2의 프로모터는 바큘로바이러스 프로모터이다. 일 구현예에서, 제1 및 제2의 프로모터는 별개이다. 일 구현예에서, 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터, 예를 들면, 39k 프로모터이다. 일 구현예에서, 제2의 프로모터는 레이트 또는 베리 레이트 바큘로바이러스 프로모터, 예를 들면, polH, p10, p6.9 및 pSel120 프로모터이다. 결과적으로, 일 구현예에서, 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터이고 제2의 프로모터는 레이트 또는 베리 레이트 바큘로바이러스 프로모터이다. 따라서, 일 구현예에서, 제1의 프로모터는 39k 프로모터이고 제2의 프로모터는 p10, p6.9 및 pSel120 프로모터로 이루어진 그룹으로부터 선택된다.
일 구현예에서, 제1 및 제2의 프로모터는 반대의 전사 방향으로 세포 게놈 내에 통합된다.
후술된 바와 같이, 완전한 파르보바이러스 유전자 치료요법 벡터 비리온의 생산을 위해, 세포는 바람직하게는 곤충 세포 내에서 발현을 위한 제3의 프로모터에 작동 가능하게 연결된 서열을 코딩하는 파르보바이러스 캡시드 단백질을 포함하는 뉴클레오타이드 서열을 포함하는 발현 카세트를 추가로 포함한다. 일 구현예에서, 제1, 제2 및 제3의 프로모터는 바큘로바이러스 프로모터이다. 일 구현예에서, 제1 및 제2 및 제3의 프로모터는 별개이다. 일 구현예에서, 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터, 예를 들면, 39k 프로모터이다. 일 구현예에서, 제2의 프로모터는 레이트 또는 베리 얼리 바큘로바이러스 프로모터, 예를 들면, polH, p10, p6.9 및 pSel120 프로모터이다. 결과적으로, 일 구현예에서, 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터이고 제2의 프로모터는 레이트 또는 베리 레이트 바큘로바이러스 프로모터이다. 따라서, 일 구현예에서, 제1의 프로모터는 39k 프로모터이고 제2의 프로모터는 polH, p10, p6.9 및 pSel120 프로모터로 이루어진 그룹으로부터 선택된다. 일 구현예에서, 제1의 프로모터는 제3의 프로모터 앞에서 활성이다.
인핸서
"인핸서 성분" 또는 "인핸서"는 프로모터와는 반대로, 프로모터 활성을 지니지 않고, 일반적으로 프로모터와 관련하여 이의 위치와 관계없이(즉, 프로모터의 상부 또는 하부에서) 일반적으로 작용할 수 있는 프로모터의 활성을 향상시키는(즉, 프로모터의 하부의 서열의 전사율을 증가시키는) 서열을 정의함을 의미한다. 인핸서 성분은 당해 분야에 잘 알려져 이다. 본 발명에 사용될 수 있는 인핸서 성분(또는 이의 부분)의 비-제한적 예는 곤충 세포 내에서 발견된 바큘로바이러스 인핸서 및 인핸서 성분을 포함한다. 인핸서 성분이 이것이 작동 가능하게 연결된 프로모터에 대해 유전자의 mRNA 발현을 인핸서 성분의 부재하에서 유전자의 mRNA 발현과 비교하여 적어도 25%, 보다 바람직하게는 적어도 50%, 심지어 보다 바람직하게는 적어도 100%, 및 가장 바람직하게는 적어도 200%까지 증가시키는 것이 바람직하다. mRNA 발현은 예를 들면, 정량적 RT-PCR에 의해 측정될 수 있다.
여기서 파르보바이러스 Rep 단백질의 발현을 향상시키는 인핸서 성분을 사용하는 것이 바람직하다. 바람직한 구현예에서, 세포 내에서 이의 해독이 파르보바이러스 Rep 단백질을 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 본원에 정의된 바와 같은 (제1 및/또는 제2의) 프로모터에 작동 가능하게 연결된 적어도 하나의 인핸서 성분은 전사 트랜스레귤레이터에 의존적인 인핸서 성분이다. 전사 트랜스레귤레이터-의존성 인핸서 성분은 본원에서 트랜스로 제공된 전사 트랜스레귤레이터 단백질에 의해 결합된 경우 이에 작동 가능하게 연결된 프로모터의 전사를 활성화시키는 인핸서 성분으로서 이해된다.
따라서, 추가의 바람직한 구현예에서, 전사 트랜스레귤레이터-의존성 인핸서 성분은 적어도 하나의 바큘로바이러스 인핸서 성분 및/또는 적어도 하나의 엑다이손 반응성 성분(ecdysone responsive element)을 포함한다. 바람직하게는 전사 트랜스레귤레이터는 바큘로바이러스 이미디어트-얼리 단백질(IE1) 또는 이의 스플라이스 변이체(IE0)이고 전사 트랜스레귤레이터-의존성 인핸서 성분은 바큘로바이러스 상동성 영역(hr) 인핸서 성분이고, 여기서 바람직하게는 바큘로바이러스는 오토그라파 캘리포니카(Autographa californica) 다중캡시드 뉴클레오폴리헤드론바이러스이다. IE1은 바큘로바이러스 얼리 유전자 프로모터를 트랜스활성화시키고 플라스미드 형질감염 검정에서 레이트 유전자 발현을 뒷받침하는 고도로 보존된, 67-kDa DNA 결합 단백질이다(참고: 예컨대, Olson et al., 2002, J Virol., 76:9505-9515). AcMNPV IE1은 프로모터 트랜스활성화 및 DNA 결합에 기여하는 분리가능한 도메인을 지닌다. 이러한 582개-잔기의 인단백질의 N-말단 1/2은 잔기 8 내지 118번 및 168 내지 222번으로부터의 전사 조절 도메인을 함유한다. IE1은 AcMNPV 게놈 전체에 분산된 것으로 밝혀진 다중 상동성 영역(hrs) 내 반복된 서열을 구성하는 28-bp 불완전한 팔린드롬(palindrome)(28-mer)에 결합한다. hr 28-mer는 IE1-매개된 인핸서 및 오리진(origin)-특이적인 복제 기능에 요구되는 최소의 서열 모티프이다.
일 구현예에서, hr 인핸서 성분은 hr2-0.9 이외의 hr 인핸서 성분이다(US 2012/100606 A1). 추가의 구현예에서, hr 인핸서 성분은 hr1, hr3, hr4b 및 hr5로 이루어진 그룹으로부터 선택되고, 이중에서 hr4b 및 hr5가 바람직하고, 이중에서hr4b가 가장 바람직하다. 대안의 구현예에서, hr 인핸서 성분은 변이체 hr 인핸서 성분, 예를 들면, 비-천연적으로 발생하는 설계된 성분이다. 변이체 hr 인핸서 성분은 바람직하게는 hr 28-mer 서열 CTTTACGAGTAGAATTCTACGCGTAAAA(서열 번호: 32)의 적어도 하나의 카피 및/또는 적어도 18, 20, 21, 22, 23, 24, 25, 26, 또는 27개의 뉴클레오타이드의 서열이 서열 CTTTACGAGTAGAATTCTACGCGTAAAA(서열 번호: 32)와 동일하고 바람직하게는 바큘로바이러스 IE1 단백질, 보다 바람직하게는 AcMNPV IE1 단백질에 결합한 이의 서열의 적어도 하나의 카피를 포함한다. 변이체 hr 인핸서 성분은 또한 바람직하게는 변이체 성분이 polH 프로모터에 작동 가능하게 연결된 리포터 유전자를 포함하는 발현 카세트에 작동 가능하게 연결된 경우, a) 비-유도 조건 하에서, 변이체 성분을 지닌 카세트가 변이체 성분 대신에 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트보다 적은 리포터 전사체를 생산하거나, 변이체 성분을 지닌 카세트가 변이체 성분 대신에 hr4b 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체의 양의 1.1, 1.2, 1.5, 2, 5 또는 10배 미만으로 생산하고; b) 유도 조건 하에서, 변이체 성분을 지닌 카세트가 변이체 성분 대신에 hr4b 또는 the hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체의 양의 적어도 50, 60, 70, 80, 90 또는 100%를 생산한다는 점에서 기능적으로 정의된다. 비-유도 조건은 IE1 단백질이, 카세트가 시험되는 세포 내에 존재하지 않는 조건으로서 이해되며, 유도 조건은 충분한 IE1 단백질이 존재하여 hr4b 또는 the hr2-0.9 성분을 포함하는 참고 카세트를 지닌 최대의 리포터 발현을 수득하는 조건인 것으로 이해된다. 바큘로바이러스 IE1 단백질에 대한 변이체 hr 인핸서 성분의 결합은 예컨대, 문헌: Rodems and Friesen (J Virol. 1995; 69(9):5368-75)에 기술된 바와 같은 이동성 쉬프트 검정(mobility shift assay)을 사용하여 검정할 수 있다.
일 구현예에서, 적어도 하나의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재한다. 결과적으로, 일 구현예에서, 제1 및 제2의 프로모터는 전사의 반대 방향으로 세포 게놈내에 통합되며 적어도 하나의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재한다. 추가의 구현예에서, 2개의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재한다. 유도를 위해 Bac polH Cap Trans를 사용하는 경우, 비교적 보다 약한 트랜스활성화 프로파일이 i) 사용된 2개의 polH 프로모터 사이의 시스:트랜스 프로모터 경쟁(Bac polH Cap Trans 내에서 Cap에 대해 및 발현 플라스미드 내에서 Rep에 대해) 및 ii) 리키하지 않지만 hr4b과 같은 비교적 더 약한 hr의 채택으로 인하여 관찰된다. 일 구현예에서, 이러한 비-리키 발현 플랫폼의 사용, 예를 들면, hr4b와 같은 비교적 보다 약한 hr의 사용이 존재한다. 추가의 구현예에서, Bac polH Cap Trans의 사용과의 양립성이 존재한다. 여전히 추가의 구현예에서, hr4b 인핸서는 p10 프로모터와 조합된다. 이러한 조합은 강력한 야생형 ATG 출발 코돈을 지닌 단일-카세트 AAV2 Rep를 조절하도록 제조될 수 있다.
레플리카제(Rep) 단백질
파르바이러스, 특히 AAV, 레플리카제는 rep 유전자에 의해 암호화된 비-구조 단백질이다. 야생형 파르바이러스에서 rep 유전자는 내부 P19 프로모터로 인하여, 상이한 길이의 2개의 오버랩핑된 전령 리보핵산(mRNA)를 생산한다. 이러한 mRNA 각각은 스플라이싱되거나 되지 않음으로써 궁극적으로 4개의 Rep 단백질, Rep78, Rep68, Rep52 및 Rep40을 생성하거나 생성하지 않을 수 있다. Rep78/68 및 Rep52/40은 ITR-의존성 AAV 게놈 또는 전이유전자 복제 및 바이러스 입자 조립에 중요하다. Rep78/68은 바이러스 복제 개시인자 단백질로서 공급되며 바이러스 게놈에 대한 레플리카제로서 작용한다(Chejanovsky and Carter, J Virol., 1990, 64:1764-1770; Hong et al., Proc Natl Acad Sci USA, 1992, 89:4673-4677; Ni., et al., J Virol., 1994, 68:1128-1138). Rep52/40 단백질은 3' 내지 5' 극성을 지닌 DNA 헬리카제이고 빈 캡시드 내로 바이러스 DNA의 패키징 동안 중요한 역할을 하고, 여기서 이는 패키징 모터 복합체의 부분인 것으로 고려된다(Smith and Kotin, J. Virol., 1998, 4874 - 4881; King, et al., EMBO J., 2001, 20:3282-3291). 곤충 세포 플랫폼에서 바큘로바이러스 벡터로부터 AAV를 생산하기 위하여, Rep68 및 Rep40 둘 다의 존재는 전제조건이 아니다(Urabe, et al., 2002).
파르보바이러스 Rep 단백질을 암호화하는 뉴클레오타이드 서열은 함께 요구되거나 곤충 세포 내에서 파르보바이러스 벡터에 대해 충분한 2개의 비-구조적 Rep 단백질, Rep 78 및 Rep52 중 적어도 하나를 암호화하는 뉴클레오타이드 서열로서 이해된다. 파르보바이러스 뉴클레오타이드 서열은 바람직하게는 아데노바이러스, 보다 바람직하게는 사람 또는 시미안 아데노-관련 바이러스(AAV)로부터 유래되고 가장 바람직하게는 일반적으로 사람을 감염시키는 AAV(예컨대, 혈청형 1, 2, 3A, 3B, 4, 5, 6, 8 및 9) 또는 영장류를 감염시키는 AAV(예컨대, 혈청형 1 및 4)로부터 유래된다. 파르보바이러스 Rep 단백질을 암호화하는 뉴클레오타이드 서열의 예는 서열 번호: 37로 제공되며(참고: 본원에 참고로 포함된, 제WO 2009/104964호의 서열 번호: 5), 이는 Rep 단백질을 암호화하는 AAV 혈청형-2 서열 게놈을 나타낸다. Rep78 코딩 서열은 뉴클레오타이드 11 내지 1876번을 포함하고 Rep52 암호화 서열은 뉴클레오타이드 683 내지 1876번을 포함하며, 이는 또한 서열 번호: 37 및 39(참고: 본원에 참고로 포함된 제WO 2009/104964호의 서열 번호: 5 및 7)로 별도로 나타낸다. Rep78 및 Rep52 단백질의 정확한 분자량 뿐만 아니라, 해독 개시 코돈의 정확한 위치는 상이한 아데노바이러스 사이에서 상이할 수 있음이 이해된다. 그러나, 당해 분야의 숙련가는 AAV-2보다는 다른 파르보바이러스로부터의 뉴클레오타이드 서열내 상응하는 위치를 확인하는 방법을 알 것이다.
본 발명에 따라서, 세포는 바람직하게는 이의 게놈 내로 통합된 파르보바이러스 Rep 단백질의 발현을 위한 적어도 제1 및 제2의 발현 카세트를 포함하는 제1의 핵산 작제물을 포함한다.
제1의 발현 카세트는 mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제1의 프로모터를 포함하고, 이의 해독은 세포 내에서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나를 생산한다. 곤충 세포 내에서 이의 해독이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나를 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열은: a) 서열 번호: 40(본원에 참고로 포함된 제WO 2009/104964호의 서열 번호: 8)의 아미노산 서열과 적어도 50, 60, 70, 80, 88, 89, 90, 95, 97, 98, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드를 암호화하고; b) 서열 번호: 39의 11 내지 1876번 위치의 뉴클레오타이드 서열과 적어도 50, 60, 70, 80, 81, 82, 85, 90, 95, 97, 98, 또는 99%의 서열 동일성을 가지고; c) 이의 상보성 가닥이 (a) 또는 (b)의 핵산 분자 서열에 하이브리드화하는 뉴클레오타이드 서열; 및 d) 이의 서열이 유전 코드의 축퇴성(degeneracy)으로 인하여 (c)의 핵산 분자의 서열과는 상이한 뉴클레오타이드 서열로서 정의될 수 있다. 바람직하게는, 뉴클레오타이드 서열은 mRNA를 암호화하고, 이의 해독은 곤충 세포 내에서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 만을 생산한다. 곤충 세포 내에서 mRNA의 해독은 일반적으로 적어도 파르보바이러스 Rep 78 단백질 만을 생산할 것이고 파르보바이러스 Rep 68 단백질을 생산할 필요가 없음이 이해된다. 뉴클레오타이드 서열이 mRNA를 암호화하지만, 이의 해독은 곤충 세포 내에서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 만을 생산하고(및 파르보바이러스 Rep 52 및 40 단백질은 생산하지 않음), 이는 뉴클레오타이드 서열이 곤충 세포 내에서 활성이고 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는, 추가의 mRNA를 생산하는 내부 내인성 파르보바이러스 P19 프로모터를 포함함이 추가로 이해된다. 바람직한 구현예에서, 이의 해독이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 만을 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열은 더욱이 파르보바이러스 P19 프로모터를 포함하고, 이는 바람직하게는 곤충 세포 내에서 완전하거나 적어도 활성이다.
제2의 발현 카세트는 세포 내에서 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는 mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제2의 프로모터를 포함한다. 곤충 세포 내에서 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는 mRNA를 암호화하는 뉴클레오타이드 서열은: a) 서열 번호: 38(참고: 본원에 참고로 포함된 제WO 2009/104964호의 서열 번호: 6)의 아미노산 서열과 적어도 50, 60, 70, 80, 88, 89, 90, 95, 97, 98, 또는 99% 서열 동일성을 갖고; b) 서열 번호: 33 내지 37(참고: 본원에 참고로 포함된 제WO 2009/104964호의 서열 번호: 1 내지 5) 및 서열 번호: 15의 뉴클레오타이드 서열(이중 서열 번호: 15가 바람직하다)과 적어도 50, 60, 70, 80, 81, 82, 85, 90, 95, 97, 98, 또는 99% 서열 동일성을 갖는 뉴클레오타이드 서열; c) (a) 또는 (b)의 핵산 분자 서열에 하이브리드화하는 이의 보체 가닥; 및, d) 이의 서열이 유전 코드의 축퇴로 인하여 (c)의 핵산 분자의 서열과는 상이한 뉴클레오타이드 서열로서 정의될 수 있다. 바람직하게는, 뉴클레오타이드 서열은 mRNA를 암호화하고, 곤충 세포 내에서 이의 해독은 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 만을 생산한다. 이에 의해 파르보바이러스 Rep 52 및/또는 40 단백질을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및/또는 68 단백질을 또한 암호화하는 보다 큰 코딩 서열의 부분이 아님이 이해된다. 바람직하게는 세포 내에서 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 만을 생산하는 뉴클레오타이드 서열은 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 해독 개시 코돈으로부터 가장 C-말단 아미노산까지의 아미노산 서열로 이루어진 개방 판독 프레임을 포함하고, 보다 바람직하게는, 개방 판독 프레임은 mRNA를 암호화하는 뉴클레오타이드 서열 내에 포함된 유일한 개방 판독 프레임이다. 곤충 세포 내에서 mRNA의 해독은 일반적으로 적어도 파르보바이러스 Rep 52 단백질 만을 생산할 것이고 파르보바이러스 Rep 40 단백질을 생산할 필요가 없을 것임이 추가로 이해된다.
바람직하게는, 뉴클레오타이드 서열은 이것이 바이러스 복제 개시인자 단백질, 바이러스 게놈의 레플리카제, DNA 헬리카제의 요구된 활성 및 곤충 세포 내에서 파르보바이러스 벡터 생산에 충분한, 상술한 바와 같은 바이러스 DNA의 빈 캡시드내로의 패키징을 갖는다는 의미에서 기능적으로 활성인 파르보바이러스 Rep 단백질을 암호화한다.
일 구현예에서, Rep78 및 Rep52 해독 개시 부위 이외에, Rep 단백질 코딩 서열 내 가능한 거짓 해독 개시 부위가 제거된다. 일 구현예에서, 곤충 세포 내에서 인식될 수 있는 추정의 스플라이스 부위는 Rep 단백질 암호화 서열로부터 제거된다. 이러한 부위의 제거는 당해 분야의 숙련가에 의해 잘 이해될 것이다.
바람직한 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나는 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 제2의 아미노산으로부터 가장 C-말단 아미노산까지의 아미노산 서열을 포함하는 일반적인 아미노산 서열을 포함하고, 여기서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질의 적어도 하나의 일반적인 아미노산 서열은 적어도 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일하고, 여기서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 90, 89, 88, 87, 86, 85, 84, 83, 82, 81, 80, 79, 78, 77, 76, 75, 74, 73, 72, 71, 70, 69, 68, 67, 66, 60% 미만으로 동일하다.
추가의 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 52 및 40 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 비교하여 세포에 대해 개선된 코돈 사용 편향(codon usage bias)을 갖는다. 그러나, 바람직하게는, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 비교하여 세포에 대해 개선된 코돈 사용 편향을 갖는다.
숙주 세포의 코돈 사용에 대한 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열의 적응성(adaptiveness)은 코돈 적응 지수(codon adaptation index; CAI)로 나타낼 수 있다. 바람직하게는 코돈 사용은 곤충 세포에 대해 적응되며 여기서 일반적인 아미노산 서열을 지닌 Rep 단백질이 발현된다. 일반적으로 이는 스포도프테라(Spodoptera) 속의 세포, 보다 바람직하게는 스포토프테라 프루기페르다(Spodoptera frugiperda) 세포일 것이다. 따라서, 코돈 사용은 바람직하게는 스포토프테라 프루기페르다(Spodoptera frugiperda) 또는 오토그파파 캘리포르니카 뉴클레오폴리헤드로바이러스(Autographa californica nucleopolyhedrovirus; AcMNPV) 감염된 세포에 대해 적응된다. 코돈 적응 지수는 본원에서 고도로 발현된 유전자의 코돈 사용을 향한 유전자의 코돈 사용의 상대적인 적응성의 척도로서 정의된다. 각각의 코돈의 상대적인 적응성(relative adaptiveness; w)은 동일한 아미노산에 대한 가장 풍부한 코돈의 사용에 대한 각각의 코돈의 사용의 비이다. CAI 지수는 이러한 상대적인 적응성 값의 기하 평균으로 정의된다. 동일하지 않은 코돈 및 종결 코돈(유전 코드에 의존함)은 배제된다. CAI 값은 0 내지 1의 범위이고, 보다 높은 값은 가장 풍부한 코돈의 보다 높은 비율을 나타낸다(Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295; 또한 문헌: Kim et al., Gene. 1997, 25 199:293-301; zur Megede et al., Journal of Virology, 2000, 74: 2628-2635을 참조한다).
바람직하게는, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에서 일반적인 아미노산 서열을 코딩하는 뉴클레오타이드 서열 사이의 코돈 적응 지수에서의 차이는 적어도 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7 또는 0.8이고, 이에 의해 보다 바람직하게는, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에서 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열의 CAI는 적어도 0.5, 0.6, 0.7, 0.8, 0.9 또는 1.0이다.
따라서, 대안적인 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나는, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 제2의 아미노산으로부터 가장 C-말단 아미노산까지의 아미노산 서열을 포함하는 일반적인 아미노산 서열을 포함하고, 여기서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열은 적어도 90% 동일하고, 여기서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 90% 미만으로 동일하고, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 52 및 40 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 비교하여 세포에 대해 개선된 코돈 사용 편향을 갖거나, 여기서 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 비교하여 세포에 대해 개선된 코돈 사용 편향을 갖고, 여기서 바람직하게는, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 암호화하는 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 사이의 코돈 적응 지수에서의 차이는 적어도 0.2이다. 바람직한 구현예에서, 곤충 세포에 대해 개선된 코돈 사용 편향을 지닌 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 코돈의 적어도 80, 85, 90, 95, 96, 97, 98, 99 또는 100%가 서열 번호: 15에서의 코돈과 동일한 이의 뉴클레오타이드 서열을 갖는다.
파르보바이러스 Rep 단백질의 온도 최적화는 곤충 세포가 성장하고 Rep가 기능화되는 온도 둘 다와 관련하여 최적 조건을 사용하는 것을 지칭한다. Rep 단백질은 예를 들면, 37℃에서 최적으로 활성일 수 있지만, 곤충 세포는 28℃에서 최적으로 성장할 수 있다. Rep 단백질이 활성이고 곤충 세포가 성장하는 온도는 30℃일 수 있다. 바람직한 구현예에서, 최적화된 온도는 27, 28, 29, 30, 31, 32, 33, 34 또는 35℃ 이상 및/또는 37, 36, 35, 34, 33, 32, 31, 30 또는 29℃ 미만이다.
일 구현예에서, 세포 내에서 제1 및 제2의 발현 카세트를 최적화하여 (곤충) 세포 내에서 Rep78 대 Rep52의 바람직한 몰 비를 수득한다. 바람직하게는, 세포 내에서 제1 및 제2의 발현 카세트의 조합은 (곤충) 세포 내에서 1:10 내지 10:1, 1:5 내지 5:1, 또는 1:3 내지 3:1의 범위의 Rep78 대 Rep52의 몰 비를 생산한다. 보다 바람직하게는, 제1의 핵산 작제물은 적어도 1:2, 1:3, 1:5 또는 1:10인 Rep78 대 Rep52의 몰 비를 생산한다. Rep78 및 Rep52의 몰 비는 웨스턴 블롯팅의 수단으로, 바람직하게는 Rep78 및 Rep52 둘 다의 일반적인 에피토프를 인식하는 모노클로날 항체를 사용하거나, 예컨대, 마우스 항-Rep 항체(303.9, Progen, 독일; 1:50의 희석)를 사용함으로써 측정할 수 있다.
Rep78 대 Rep52의 바람직한 몰 비는 본원에서 상기 추가로 기술된 각각 제1 및 제2의 발현 카세트에서 프로모터를 선택함으로써 수득될 수 있다. 대안적으로 또는 함께, Rep78 대 Rep52의 바람직한 몰 비는 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 정체 상 수준을 감소시키기 위한 수단을 사용하여 수득할 수 있다.
따라서, 일 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA를 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 감소된 정체 상 수준에 영향을 미치는 변형을 포함한다. 감소된 정체 상 조건은 예를 들면, 조절 성분 또는 상부 프로모터를 절두(truncation)하고(Urabe et al., supra, Dong et al., supra), 단백질 분해 신호 펩타이드, 예를 들면, PEST 또는 우비퀴틴화 펩타이드 서열을 가하고, 출발 코돈을 보다 준최적인 것으로 대체하거나, 제WO 2008/024998호에 기술된 바와 같은 인공 인트론을 도입함으로써 달성할 수 있다.
바람직한 구현예에서, 파르보바이러스 Rep78 및 68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열은 준최적 해독 개시 코돈으로 출발하는 개방 판독 프레임을 포함한다. 준최적 개시 코돈은 바람직하게는 부분적인 엑손 스키핑(partial exon skipping)에 영향을 미치는 개시 코돈이다. 부분적인 엑손 스키핑은 본원에서 적어도 리보솜의 부분이 Rep78 단백질의 준최적 개시 코돈에서 해독을 개시하지 않지만 개시 코돈 추가의 하부에서 개시할 수 있음으로써, 바람직하게는 (제1)의 개시 코돈 추가의 하부가 Rep52 단백질의 개시 코돈인 것으로 이해된다. 대안적으로, 파르보바이러스 Rep78 및 68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열은 준최적 해독 개시 코돈으로 출발하는 개방 판독 프레임을 포함하고 개시 코돈 추가의 하부를 가지지 않는다. 준최적 개시 코돈은 바람직하게는 곤충 세포 내에서 뉴클레오타이드 서열의 발현시 부분적인 엑손 스키핑에 영향을 미친다. 바람직하게는, 중최적 개시 코돈은 곤충 세포 내에서 부분적인 엑손 스키핑에 영향을 미침으로써 곤충 세포 내에서 1:10 내지 10:1, 1:5 내지 5:1, 또는 1:3 내지 3:1의 범위의 Rep78 대 Rep52의 몰 비를 생산하도록 한다. Rep78 및 Rep52의 몰 비는 웨스턴 블롯팅의 수단으로, 바람직하게는 Rep78 및 Rep52 둘 다의 일반적인 에피토프를 인식하는 모노클로날 항체를 사용하거나, 또는 예컨대, 마우스 항-Rep 항체(303.9, Progen, 독일; 1:50의 희석)를 사용하여 측정할 수 있다.
본원에서 용어 "준최적 개시 코돈"은 트리-뉴클레오타이드 개시 코돈 자체를 지칭할 뿐 아니라, 이의 내용도 지칭한다. 따라서, 준최적 개시 코돈은 준최적 내용, 예컨대, 비-코작 내용에서 "최적의" ATG 코돈으로 이루어질 수 있다. 그러나, 트리-뉴클레오타이드 개시 코돈 자체가 준최적인, 즉, ATG가 아닌 준최적 개시 코돈이 보다 바람직하다. 본원에서 준최적은 코돈이 정상의 ATG 코돈과 비교하여 달리 동일한 내용에서 해독 개시에 거의 효과적이지 않음을 의미하는 것으로 이해된다. 바람직하게는, 준최적 코돈의 효능은 달리 동일한 내용에서 정상의 ATG 코돈의 효능의 90, 80, 60, 40 또는 20% 미만이다. 해독 개시의 상대적인 효능을 비교하기 위한 방법은 숙련가에게 공지되어 있다. 바람직한 준최적 개시 코돈은 ACG, TTG, CTG, 및 GTG로부터 선택될 수 있다. ACG가 보다 바람직하다. 파르보바이러스 Rep 단백질을 암호화하는 뉴클레오타이드 서열은 본원에서 Rep78 및 Rep52 단백질과 같이 곤충 세포 내에서 파르보바이러스 벡터 생산에 요구되고 충분한 비-구조적 Rep 단백질을 암호화하는 뉴클레오타이드 서열로서 이해된다.
캡시드 단백질
완전한 파르보바이러스 유전자 치료요법 벡터 비리온의 생산을 위해, 세포는 바람직하게는 곤충 세포 내에서 발현을 위해 제3의 프로모터에 작동 가능하게 연결된 파르보바이러스 캡시드 단백질 코딩 서열을 포함하는 뉴클레오타이드 서열을 포함하는 추가의 (제3의) 발현 카세트를 추가로 포함한다.
파르보바이러스 캡시드(Cap) 단백질을 암호화하는 뉴클레오타이드 서열은 본원에서 3개의 파르보바이러스 캡시드 단백질, VP1, -2 및 -3 중 하나 이상을 암호화하는 뉴클레오타이드 서열을 포함하는 것으로 이해된다. 파르보바이러스 뉴클레오타이드 서열은 바람직하게는 데펜도바이러스(dependovirus)로부터, 보다 바람직하게는 사람 또는 시미안 아데노-관련 바이러스(simian adeno-associated virus; AAV) 및 가장 바람직하게는 일반적으로 사람을 감염시키는 AAV(예컨대, 혈청형 1, 2, 3A, 3B, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13) 또는 영장류를 감염시키는 AAV(예컨대, 혈청형 1 및 4)로부터 유래되고, 이의 뉴클레오타이드 및 아미노산 서열은 이의 전문이 본원에 참고로 포함된 문헌: Lubelski et al. US2017356008에 나타나 있다. 따라서, 본 발명에 따른 핵산 작제물은 문헌: Lubelski et al. US2017356008에 개시된 바와 같은 AAV 캡시드 단백질에 대한 전체 개방 판독 프레임을 포함할 수 있다. 대안적으로, 서열은 인공일 수 있는데, 예를 들면, 서열을 하이브리드 형태일 수 있거나 예를 들면, AcmNPv 또는 스포도프테라 프루기페르다(Spodoptera frugiperda)의 코돈 사용에 의해서와 같이 코돈 최적화될 수 있다. 예를 들면, 캡시드 서열은 AAV1의 VP2 및 VP3 서열로 구성될 수 있는 반면, VP1 서열의 나머지는 AAV5이다. 바람직한 캡시드 단백질은 AAV5 또는 AAV2/5 하이브리드, 바람직하게는 (본 출원에서 서열 번호: 30 및 29 각각) 또는 AAV8, 바람직하게는 서열 번호: 41(참고: Lubelski et al. US2017356008에서 서열 번호: 28)이다. 따라서, 바람직한 구현예에서, AAV 캡시드 단백질은 본 발명에 따라서 변형된 AAV 혈청형 5, 하이드리드 혈청형 2/5 또는 AAV 혈청형 8 캡시드 단백질이다. 보다 바람직하게는, AAV 캡시드 단백질은 본 발명에 따라 변형된 AAV 혈청형 5 캡시드 단백질이다. 보다 바람직하게는, 캡-코딩 서열은 적어도 CAP AAV2/5(서열 번호: 29) 및 AAV5(서열 번호: 30)이다. 캡시드 단백질의 정확한 분자량 뿐만 아니라 해독 개시 코돈의 정확한 위치는 상이한 파르보바이러스 사이에서 상이할 수 있다. 그러나, 숙련가는 AAV5이외의 다른 파르보바이러스로부터의 뉴클레오타이드 서열 내 상응하는 위치를 확인하는 방법을 알 것이다. 대안적으로, AAV 캡시드 단백질 암호화 서열은 예를 들면, 지시된 진화 실험의 결과로서 인공 서열이다. 이는 DNA 셔플링(shuffling), 오류 유발(error prone) PCR, 생물정보학 합리적 설계(bioinformatics rational design), 부위 포화된 돌연변이유발을 통해 캡시드 라이브러리의 생성을 포함할 수 있다. 수득되는 캡시드는 기존의 혈청형을 기반으로 하지만 이러한 캡시드의 특징을 개선시키는 다양한 아미노산 또는 뉴클레오타이드 변화를 함유한다. 수득되는 캡시드는 기존의 혈청형, "셔플드 캡시드(shuffled capsid)"의 다양한 부분의 조합일 수 있거나, 그룹내에서 조직화되거나 유전자 또는 단백질의 전체 길이에 걸쳐 확산된, 하나 이상의 아미노산 또는 뉴클레오타이드의 완전히 신규한 변화, 즉, 첨가, 결실 또는 치환을 함유한다. 참고: 예를 들면, 본원에 참고로 포함된 문헌: Schaffer and Maheshri; Proceedings of the 26th Annual International Conference of the IEEE EMBS San Francisco, CA, USA; September 1-5, 2004, pages 3520-3523; Asuri et al., 2012, Molecular Therapy 20(2):329-3389; Lisowski et al., 2014, Nature 506(7488):382-386.
본 발명의 바람직한 구현예에서, VP1 캡시드 단백질을 암호화하는 개방 판독 프레임은 ACG, ATT, ATA, AGA, AGG, AAA, CTG, CTT, CTC, CTA, CGA, CGC, TTG, TAG 및 GTG로 이루어진 그룹으로부터 선택된 비-표준의 해독 개시 코돈으로 출발한다. 바람직하게는, 비-표준의 해독 개시 코돈은 GTG, CTG, ACG, 및 TTG으로 이루어진 그룹으로부터 선택되고, 보다 바람직하게는 비-표준의 해독 개시 코돈은 CTG이다.
AAV 캡시드 단백질의 발현을 위한 본 발명의 뉴클레오타이드 서열은 또한 바람직하게는 VP1의 개방 판독 프레임의 12번 뉴클레오타이드 위치에서 G, 21번 뉴클레오타이드 위치에서 A, 및 24번 뉴클레오타이드 위치에서 C 중에서 선택된 AAV VP1 캡시드 단백질을 암호화하는 뉴클레오타이드 서열의 적어도 하나의 변형을 포함하고, 여기서 뉴클레오타이드 위치는 야생형 뉴클레오타이드 서열의 뉴클레오타이드 위치에 상응한다. 본원에서 "잠재적인/가능한 거짓 출발 부위(potential/possible false start site)" 또는 "잠재적인/가능한 거짓 해독 개시 코돈(potential/possible false translation initiation codon)"은 본원에서 캡시드 단백질(들)의 코딩 서열 내에 위치한 프레임 내 ATG 코돈을 의미하는 것으로 이해된다. 다른 혈청형의 VP1 코딩 서열 내 해독을 위한 가능한 거짓 출발 부위의 제거는 곤충 세포내에서 인식될 수 있는 추정의 스플라이스 부위의 제거일 수 있으므로, 당해 분야의 숙련가에 의해 잘 이해될 것이다. 예를 들면, 뉴클레오타이드 T는 거짓 ATG 코돈이 생기게 하지 않으므로, 12번 위치에서 뉴클레오타이드의 변형은 재조합 AAV5에 요구되지 않는다. 파르보바이러스 캡시드 단백질을 암호화하는 뉴클레오타이드 서열의 구체적인 예는 서열 번호: 44, 45 및 46에서 제공된다. 본 발명의 파르보바이러스 Cap 및/또는 Rep 단백질을 암호화하는 뉴클레오타이드 서열은 또한 중간의(moderate), 또는 바람직하게는 엄격한 하이브리드화 조건(stringent hybridisation condition) 하에서 서열 번호: 44, 45, 46 및 33 내지 37의 뉴클레오타이드 서열과 하이브리드화하는 이의 능력에 의해 정의될 수 있다.
캡시드 단백질 코딩 서열은 다양한 형태로 존재할 수 있다. 예컨대, 캡시드 단백질 VP1, -2 및 -3 각각에 대한 별개의 암호화 서열을 사용할 수 있고, 이에 의해 각각의 암호화 서열은 곤충 세포 내에서 발현을 위해 발현 제어 서열에 작동 가능하게 연결된다. 그러나, 보다 바람직하게는, 제3의 발현 카세트는 파르보바이러스(AAV) VP1, VP2, 및 VP3 캡시드 단백질 중 모두 3개를 암호화하는 단일의 개방 판독 프레임을 포함하는 뉴클레오타이드 서열을 포함하고, 여기서 VP1 캡시드 단백질의 해독을 위한 개시 코돈은 예컨대, 문헌: Urabe et al., (2002, 상기 참고) 및 제 WO2007/046703호에 기술된 ATG가 아닌 준최적 개시 코돈이다. VP1 캡시드 단백질에 대한 준최적 개시 코돈은 Rep78 단백질에 대해 상기 정의된 바와 같을 수 있다. VP1 캡시드 단백질에 대한 보다 바람직한 준최적 개시 코돈은 ACG, TTG, CTG 및 GTG로부터 선택될 수 있고, 이중에서 CTG 및 GTG가 가장 바람직하다.
대안적인 구현예에서, 제2의 발현 카세트는 파르보바이러스(AAV) VP1, VP2, 및 VP3 캡시드 단백질 중 모드 3개를 암호화하는 단일 개방 판독 프레임을 포함하는 뉴클레오타이드 서열을 포함하고, 여기서 VP1 캡시드 단백질의 해독을 위한 개시 코돈은 ATG이고 여기서 뉴클레오타이드 서열 내에 암호화된 것으로서 VP1 캡시드 단백질을 코딩하는 mRNA는 VP1 캡시드 단백질(제WO2019/016349호에 기술된 바와 같은)의 개방 판독 프레임과는 프레임 외부에 있는 대안의 출발 코돈을 포함한다. 바람직하게는, 대안의 출발 코돈은 CTG, ATG, ACG, TTG, GTG, CTC 및 CTT로 이루어진 그룹으로부터 선택되고, 이 중 ATG가 바람직하다. 바람직하게는, AAV 캡시드 단백질은 AAV5 혈청형 캡시드 단백질이다. 바람직하게는 당해 구현예에서, 뉴클레오타이드 서열은 VP1에 대한 상기 ATG 해독 개시 코돈을 포함하는 대안의 출발 코돈으로부터 출발하는 대안의 개방 판독 프레임을 포함하고, 이에 의해 바람직하게는, 대안의 출발 코돈을 수반하는 대안의 개방 판독 프레임은 20개 이하의 아미노산의 펩타이드를 암호화한다.
캡시드 단백질의 발현을 위한 제2의 발현 카세트 속에 포함된 뉴클레오타이드 서열은 제WO2007/046703호에 기술된 바와 같은 하나 이상의 변형을 추가로 포함할 수 있다. VP 및 비리온의 수율을 증가시킬 수 있거나 다른 목적한 효과, 예를 들면, 변경된 향성(tropism)을 가지거나 비리온의 항원성을 감소시킬 수 있는 VP 코딩 영역의 다양한 추가의 변형은 숙련가에게 공지되어 있다.
일 구현예에서, VP1의 발현은 VP2 및 VP3의 발현과 비교하여 증가된다. VP1 발현은 VP1을 보충하거나, 제WO 2007/084773호에 기술된 바와 같이 VP1에 대한 뉴클레오타이드 서열을 포함하는 단일 벡터의 곤충 세포 내로 도입시킴에 의해 증가될 수 있다.
전형적으로, 본 발명의 방법에서, 적어도 하나의 개방 판독 프레임은 VP1, VP2 및 VP3 캡시드 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나 적어도 하나의 개방 판독 프레임은 Rep78 및 Rep68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열을 포함한다. 일 구현예에서, VP1, VP2 및 VP3 캡시드 단백질 또는 Rep78 및 Rep68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열을 포함하는 개방 판독 프레임을 포함하는 적어도 하나의 개방 판독 프레임은 인공 인트론(또는 인공 인트론으로부터 유래된 서열)을 포함하지 않는다. 즉 다시 말해서, Rep 또는 VP 단백질을 암호화하는데 사용된 적어도 개방 판독 프레임은 인공 인트론을 포함하지 않을 것이다. 인공 인트론은 아데노-관련 바이러스 Rep 또는 Cap 서열내에서 천연적으로 발생하지 않는 인트론, 예를 들면, 가공되어 곤충 세포 내에서 기능적 스플라이싱을 허용하는 인트론을 의미한다. 따라서, 이러한 문맥에서 인공 인트론은 야생형 곤충 세포 인트론을 포함한다. 본 발명의 발현 카세트는 천연의 절두된(truncated) 인트론 서열(천연적으로는 아데노-관련 바이러스내에서 천연적으로 발생하는 서열을 의미한다)을 포함하고 - 이러한 서열은 본원에 정의된 바와 같은 인공 인트론의 의미 내에 속하는 것으로 의도되지 않는다.
본 발명에서, 하나의 가능성은 VP1, VP2 및 VP3 캡시드 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는 개방 판독 프레임 및/또는 Rep78 및 Rep68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열을 포함하는 개방 판독 프레임이 인공 인트론을 포함하지 않는다는 것이다.
바람직하게는 AAV 캡시드 단백질을 암호화하는 본 발명의 뉴클레오타이드 서열은 곤충 세포 내에서 발현을 위한 발현 제어 서열에 작동 가능하게 연결된다. 이러한 발현 제어 서열은 적어도 곤충 세포 내에서 활성인 프로모터를 포함할 것이다. AAV 캡시드 단백질을 암호화하는 본 발명의 뉴클레오타이드 서열의 전사에 적합한 프로모터는 예컨대, 폴리헤드론 프로모터(polH), 예를 들면, 서열 번호: 42의 polH 프로모터 및 서열 번호: 43의 이의 단축된 버젼(참고: 문헌: Lubelski et al. US2017356008에서 서열 번호: 53 및 서열 번호: 54의 이의 단축된 버젼)이다. 그러나, 곤충 세포에서 활성이고 본 발명에 따라 선택될 수 있는 다른 프로모터, 예컨대, 폴리헤드린(polH) 프로모터, p10 프로모터, p35 프로모터, 4xHsp27 EcRE+최소 Hsp70 프로모터, 델타E1 프로모터, E1 프로모터 또는 IE-1 프로모터 및 상기 참고문헌에 기술된 추가의 프로모터는 당해 분야에 공지되어 있다.
바이러스 벡터
본 발명은 포유동물 세포, 바람직하게는 사람 세포 내에서 도입 및/또는 발현을 위한 벡터로서 사용하기 위한 파르보바이러스, 특히 데펜도바이러스, 예를 들면, 감염성 사람 또는 시미안 AAV, 및 이의 구성성분(예컨대, 파르보바이러스 게놈)의 용도에 관한 것이다. 특히, 본 발명은 곤충 세포 내에서 생산시 이러한 파르보바이러스 벡터의 생산성에서의 개선에 관한 것이다.
"파르보바이러스 벡터"는 생체 내(in vivo), 생체 외(ex vivo) 또는 시험관 내(in vitro)에서, 숙주 세포 내로 전달될 폴리뉴클레오타이드를 포함하는 재조합적으로 생산된 파르보바이러스 또는 파르보바이러스 입자로서 정의된다. 파르보바이러스 벡터의 예는 예컨대, 아데노-관련 바이러스 벡터를 포함한다. 여기서, 파르보바이러스 벡터 작제물은 바이러스 게놈 또는 이의 부분, 및 전이유전자를 포함하는 폴리뉴클레오타이드에 관한 것이다. 파르보비리다에 계열의 바이러스는 작은 DNA 바이러스이다. 파르보비리다에 계열은 2개의 서브계열: 척추동물을 감염시키는 파르보비리나에, 및 곤충을 포함하는, 척추동물을 감염시키는 덴소비리나에 사이에서 나뉠 수 있다. 서브계열 피리보비리다에의 구성원은 본원에서 파르보바이러스로서 지칭되며 데펜도바이러스 속을 포함한다. 이의 게놈 명칭으로부터 유추될 수 있는 바와 같이, 데펜도바이러스의 구성원은, 이들이 일반적으로 헬퍼 바이러스, 예를 들면, 세포 배양물 속에서 생산성 감염을 위해 아데노바이러스 또는 헤르페스 바이러스를 사용한 공감염(coinfection)을 필요로 한다는 점에서 유일하다. 데펜도바이러스의 속은 AAV를 포함하고, 이는 일반적으로 사람(예컨대, 혈청형 1, 2, 3A, 3B, 4, 5, 6, 7, 8, 9, 10, 11, 12 및 13) 또는 영장류(예컨대, 혈청형 1 및 4)를 감염시키는 AAV, 및 다른 온혈 동물(예컨대, 소과, 개과, 말과, 및 양과 아데노-관련 바이러스)를 감염시키는 관련된 바이러스를 포함한다. 파르보바이러스 및 파르보비리다에의 다른 구성원에 대한 추가의 정보는 문헌: Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication," Chapter 69 in Fields Virology (3d Ed. 1996)에 기술되어 있다. 편의상, 본 발명은 AAV를 참고로 추가로 예시되고 본원에 기술된다. 그러나, 본 발명은 AAV에 한정되지 않지만 다른 파르보바이러스에 동등하게 적용될 수 있음이 이해된다.
모든 공지된 AAV 혈청형의 게놈 조직화(genomic organization)는 매우 유사하다. AAV의 게놈은 길이가 약 5,000개 뉴클레오타이드(nt) 미만인 선형의, 단일 가닥 DNA 분자이다. 역위된 말단 반복체(inverted terminal repeat; ITR)는 비-구조적 복제(Rep) 단백질 및 구조 바이러스 입자(VP) 단백질에 대한 유일한 코딩 뉴클레오타이드 서열을 플랭킹한다. VP 단백질(VP1, -2 및 -3)은 캡시드를 형성한다. 말단 145 nt ITR은 자가-상보성이고 구조화되어 T-형 헤어핀(T-shaped hairpin)을 형성하는 효과적으로 안정한 분자간 듀플렉스(duplex)가 형성될 수 있다. 이러한 헤어핀 구조는 바이러스 DNA 복제를 위한 오리진(origin)으로서 기능하여, 세포 DNA 폴리머라제 복합체에 대한 프라이머로서 제공된다. 포유동물 세포 내에서 야생형(wt) AAV 감염 후 Rep 유전자(즉, Rep78 및 Rep52)는 P5 프로모터 및 P19 프로모터 각각으로부터 발현되고, Rep 단백질 둘 다는 바이러스 게놈의 복제 및 패키징에서 기능을 갖는다. Rep ORF 내 스플라이싱 현상(splicing event)은 실제로 4개의 Rep 단백질(즉, Rep78, Rep68, Rep52 및 Rep40)의 발현을 야기한다. 그러나, 포유동물 세포 내에서, Rep78 및 Rep52 단백질을 암호화하는, 스플라이싱되지 않은 mRNA는 AAV 벡터 생산에 충분한 것으로 밝혀졌다. 또한, 곤충 세포 내에서 Rep78 및 Rep52 단백질은 AAV 벡터 생산에 충분한다. 3개의 캡시드 단백질, VP1, VP2 및 VP3은 p40 프로모터로부터 단일의 VP 판독 프레임으로부터 발현된다. 포유동물 세포 내에서 wtAAV 감염은 2개의 스플라이스 수용체 부위의 대안의 사용의 조합시 캡시드 단백질 생산 및 VP2에 대한 ACG 개시 코돈의 준최적 활용에 의존한다.
본원에서 "재조합 파르보바이러스 또는 AAV 벡터"(또는 "rAAV 벡터")는 적어도 하나의 파르보바이러스 또는 AAV 역위된 말단 반복체 서열(ITR)에 의해 플랭킹되는 하나 이상의 목적한 폴리뉴클레오타이드, 목적한 유전자 또는 "전이유전자"를 포함하는 벡터를 지칭한다. 바람직하게는, 전이유전자(들)은 전이유전자(들)의 각각의 측면 상의 하나인, ITR에 의해 플랭킹된다. 이러한 rAAV 벡터는 복제될 수 있고 AAV rep 및 cap 유전자 생성물(즉, AAV Rep 및 Cap 단백질)을 발현하는 곤충 숙주 세포 내에 존재하는 경우 감염성 바이러스 임자로 복제되고 패키징될 수 있다. rAAV 벡터가 보다 큰 핵산 작제물(즉, 염색체 또는 클로닝 또는 형질감염을 위해 사용된 플라스미드 또는 바큘로바이러스와 같은 다른 벡터 내) 내로 혼입된 다음, rAAV 벡터는 AAV 패키징 기능 및 필수적인 헬퍼 기능의 존재하에서 복제 및 캡시드화에 의해 "구조(rescue)"될 수 있는 "프로-벡터"로서 전형적으로 지칭된다.
본 발명은 곤충 세포 내에서 재조합 파르보바이러스(rAAV) 벡터를 포함하는 재조합 파르보바이러스(rAAV) 비리온을 생산하는 방법에 관한 것이다. 일 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나, 파르보바이러스 VP1, VP2, 및 VP3 캡시드 단백질 및 적어도 하나의 파르보바이러스 역위 말단 반복체 서열은 아데노 관련 바이러스(AAV)로부터 유래된다. 바람직하게는, 뉴클레오타이드 서열은 동일한 혈청형의 것이다. 보다 바람직하게는, 뉴클레오타이드 서열은 이들이 코돈 최적화되거나, AT-최적화되거나 GC-최적화되어 재조합을 최소화하거나 방지할 수 있다는 점에서 서로 상이하다. 바람직하게는, 파르보바이러스 Rep 단백질의 일반적인 아미노산 서열을 코딩하는 제1 및 제2의 뉴클레오타이드 서열 내 차이는: a) 파르보바이러스 Rep 일반적인 아미노산 서열을 암호화하는 제1의 뉴클레오타이드 서열의 코돈 편향을 변화시키는 방법; b) 파르보바이러스 Rep 일반적인 아미노산 서열을 암호화하는 제2의 뉴클레오타이드 서열의 코돈 편향을 변화시키는 방법; c) 일반적인 아미노산 서열을 암호화하는 제1의 뉴클레오타이드 서열의 GC-함량을 변화시키는 방법; 및 d) 일반적인 아미노산 서열을 암호화하는 제2의 뉴클레오타이드 서열의 GC-함량을 변화시키는 방법 중 하나 이상에 의해 극대화된다(즉, 뉴클레오타이드 동일성은 최소화된다). 코돈 최적화는 코돈 사용 데이타베이스(참고: 예컨대, http://www.kazusa.or.jp/codon/)에서 발견될 수 있는, 본 발명의 방법에서 사용된 곤충 세포, 바람직하게는 스포도프테라 프루기페르다(Spodoptera frugiperda)의 코돈 사용을 기반으로 수행될 수 있다. 코돈 최적화에 적합한 컴퓨터 프로그램은 숙련가에게 이용가능하다(참고: 예컨대, Jayaraj et al., 2005, Nucl. Acids Res. 33(9):3011-3016; 및 인터넷). 대안적으로, 최적화는 동일한 코돈 사용 데이타베이스를 사용하여 수동으로 수행할 수 있다.
전이유전자
일 구현예에서, 세포는 a) 곤충 세포내에서 발현시키기 위한 제3의 프로모터에 작동 가능하게 연결된 파르보바이러스 캡시드 단백질 코딩 서열을 포함하는 뉴클레오타이드 서열; b) 적어도 하나의 파르보바이러스 역위된 말단 반복체 서열에 의해 플랭킹되는 전이유전자를 포함하는 뉴클레오타이드; 및, c) 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 뉴클레오타이드 서열을 추가로 포함한다.
추가의 구현예에서, a) 및 b) 중 적어도 하나의 뉴클레오타이드 서열은 바큘로바이러스 벡터 내에 포함되고, 여기서, 바람직하게는 a), b) 및 c) 중 적어도 하나의 뉴클레오타이드 서열은 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 바큘로바이러스 벡터 내에 포함된다.
본 발명의 문맥에서 "적어도 하나의 파르보바이러스 역위된 말단 반복체 뉴클레오타이드 서열"은 "A", "B", 및 "C" 영역으로서 또한 지칭된 가장 상보성인, 대칭적으로 정렬된 서열을 포함하는 팔린드롬 서열(palindromic sequence)을 의미하는 것으로 이해된다. ITR은 복제 오리진으로서, 복제시 "시스" 역활을 갖는, 즉, 예컨대, Rep 78(또는 Rep68)과 같은 트랜스 작용 복제 단백질에 대한 인식 부위인, 부위로서 기능하며, 이는 팔린드롬 및 팔린드롬에 대해 내부의 구체적인 서열을 인식한다. ITR 서열의 대칭에 대한 하나의 예외는 ITR의 "D" 영역이다. 이는 유일하다(하나의 ITR 내에 보체를 가지지 않는다). 단일 가닥 DNA의 니킹(nicking)은 A와 D 영역 사이의 접합부에서 발생한다. 이는 새로운 DNA 합성이 개시되는 영역이다. D 영역은 일반적으로 팔린드롬의 한쪽 측면에 있으며 핵산 복제 단계에 대한 방향성을 제공한다. 포유동물 세포 내에서 복제하는 파르보바이러스는 전형적으로 2개의 ITR 서열을 갖는다. 그러나, ITR을 가공하여 A 영역과 D 영역의 가닥 둘 다에서의 결합 부위가 팔린드롬의 각각의 측면 하나에, 대칭적으로 위치한다. 이중-가닥 환형 DNA 주형(예컨대, 플라스미드)에서, Rep78- 또는 Rep68-관련 핵산 복제는 이후 양 방향에서 진행하고 단일의 ITR은 환형 벡터의 파르보바이러스 복제에 충분하다. 따라서, 하나의 ITR 뉴클레오타이드 서열을 본 발명의 문맥에서 사용할 수 있다. 그러나, 바람직하게는, 2개 또는 다른 짝수의 정규 ITR을 사용한다. 가장 바람직하게는, 2개의 ITR 서열이 사용된다. 바람직한 파르보바이러스 ITR은 AAV ITR이다. 보다 바람직하게는 AAV2 ITR이 사용된다. 안전성 이유를 위해, 제2의 AAV의 존재 하에서 세포 내로 초기 도입 후 추가로 계대배양할 수 없는 재조합 파르보바이러스(rAAV) 벡터를 작제하는 것이 바람직할 수 있다. 수용체에서 바람직하지 않은 벡터 증식을 제한하기 위한 이러한 안전성 메카니즘은 제US2003148506호에 기술된 바와 같은 키메라 ITR을 지닌 rAAV를 사용하여 제공할 수 있다.
본원에서 다른 성분(들)에 의해 플랭킹되는 서열과 관련하여 용어 "플랭킹되는"은 플랭킹 성분 상부 및/또는 하부, 즉, 서열과 관련하여 5' 및/또는 3' 중 하나 이상의 존재를 나타낸다.용어 "플랭킹되는"은 서열이 필수적으로 연속적임을 나타내는 것으로 의도되지 않는다. 예를 들면, 전이유전자 및 플랭킹 성분을 암호화하는 핵산 사이에 개재 서열(intervening sequence)이 존재할 수 있다. 2개의 다른 성분(예컨대, ITR)에 의해 "플랭킹"된 서열은 하나의 성분이 서열에 대해 5'에 위치하고 다른 것이 서열에 대해 3'에 위치하지만; 이들 사이에 개재 서열이 존재할 수 있음을 나타내지만; 이들 사이에 개재 서열이 존재할 수 있다. 바람직한 구현예에서, (i)의 뉴클레오타이드 서열은 파르보바이러스 역위된 말단 반복체 뉴클레오타이드 서열에 의해 어느 하나의 측면에서 플랭킹된다.
본 발명의 구현예에서, 적어도 하나의 파르보바이러스 IRT 서열에 의해 플랭킹된 전이유전자를 포함하는(목적한 유전자 생성물을 암호화하거나 목적한 유전자를 표적화하는 뉴클레오타이드 서열을 포함하는) 뉴클레오타이드 서열은 바람직하게는 곤충 세포 내에서 생산된 재조합 파르보바이러스(rAAV) 벡터내로 혼입된다. 바람직하게는, 전이유전자는 포유동물 세포 내에서 발현시키기 위한 목적한 유전자 생성물을 암호화한다. 바람직하게는, 전이유전자는 포유동물 세포 내에서 상기 목적한 유전자를 사일런싱하기 위한 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열을 포함한다. 바람직하게는, 전이유전자를 포함하는 뉴클레오타이드 서열은 2개의 파르보바이러스(AAV) ITR 뉴클레오타이드 서열에 의해 플랭킹되고 여기서 전이유전자는 2개의 파르보바이러스(AAV) ITR 뉴클레오타이드 서열 사이에 위치한다. 바람직하게는, 목적한 유전자 생성물을 암호화하거나(포유동물 세포 내에서 발현시키기 위한) 목적한 유전자를 표적화하는 뉴클레오타이드 서열을 포함하는(포유동물 세포 내에서 목적한 유전자를 사일런싱하기 위한) 뉴클레오타이드 서열은 2개의 정규 ITR 사이에 위치하거나, 2개의 D 영역을 지닌 가공된 ITR의 한쪽 측면에 위치한 경우 곤충 세포 내에서 생산된 재조합 파르보바이러스(rAAV) 벡터 내로 혼입될 것이다.
곤충 세포 내에서 재조합 AAV 비리온의 생산을 위해 본 발명에서 사용될 수 있는 AAV 서열은 임의의 AAV 혈청형의 게놈으로부터 유래될 수 있다. 일반적으로, AAV 혈청형은 아미노산 및 핵산 수준에서 유의적인 상동성의 게놈 서열을 가지며, 유전 기능의 동일한 세트를 제공하고, 필수적으로 생리학적으로 및 기능적으로 등가인 비리온을 생산하며, 실제로 동일한 메카니즘에 의해 복제 및 조립된다. 다양한 AAV 혈청형의 게놈 서열 및 게놈 유사성의 고찰을 위해 예컨대, GenBank 수탁 번호 U89790; GenBank 수탁 번호 J01901; GenBank 수탁 번호 AF043303; GenBank 수탁 번호 AF085716; Chlorini et al. (1997, J. Vir. 71: 6823-33); Srivastava et al. (1983, J. Vir. 45:555-64); Chlorini et al. (1999, J. Vir. 73:1309-1319); Rutledge et al. (1998, J. Vir. 72:309-319); 및 Wu et al. (2000, J. Vir. 74: 8635-47)를 참고한다. 임의의 AAV 혈청형은 본 발명의 문맥에서 사용하기 위한 AAV 뉴클레오타이드 서열의 공급원으로서 제공될 수 있다. 바람직하게는 본 발명의 문맥에서 사용하기 위한 AAV ITR 서열은 AAV1, AAV2, AAV4 및/또는 AAV7로부터 유래된다. 유사하게, Rep(Rep78/68 및 Rep52/40) 암호화서열은 바람직하게는 AAV1, AAV2, AAV4 및/또는 AAV7로부터 유래된다. 그러나, 본 발명의 문맥에서 사용하기 위한 VP1, VP2, 및 VP3 캡시드 단백질을 암호화하는 서열은 임의의 공지된 42개의 혈청형으로부터, 보다 바람직하게는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8. AAV9, AAV10, AAV11, AAV12 또는 AAV13으로부터 또는 예컨대, 캡시드 셔플링 기술 및 AAV 캡시드 라이브러리에 의해 수득된 새로이 개발된 AAV-유사 입자로부터, 또는 새로이 및 합성적으로 설계되거나, 개발되거나 포괄된 캡시드, 예를 들면, Anc-80 캡시드로부터 취할 수 있다.
AAV Rep 및 ITR 서열은 대부분의 혈청형 중에서 특히 보존된다. 다양한 AAV 혈청형의 Rep78 단백질은 예컨대, 89% 이상 동일하고 AAV2, AAV3A, AAV3B, 및 AAV6 사이에서 게놈 수준에서 전체 뉴클레오타이드 서열 동일성은 대략 82%이다(Bantel-Schaal et al., 1999, J. Virol., 73(2):939-947). 더욱이, 많은 AAV 혈청형의 Rep 서열 및 ITR은 포유동물 세포 내에서 AAV 입자의 생산시 다른 혈청형으로부터의 상응하는 서열을 효율적으로 교차-보충(즉, 기능적으로 치환)하는 것으로 알려져 있다. 제US2003148506호는 AAV Rep 및 ITR 서열이 곤충 세포 내에서 다른 AAV Rep 및 ITR 서열과 효율적으로 교차-보충(cross-complementing)함을 보고한다.
또한 VP 단백질로서 알려진, AAV 캡시드 단백질은 AAV 비리온의 세포 편향을 결정하는 것으로 알려져 있다. VP 단백질-암호화 서열은 상이한 AAV 혈청형 중에서 Rep 단백질 및 유전자보다 유의적으로 거의 보존되지 않는다. 다른 혈청형의 상응하는 서열을 교차-보충하는 Rep 및 ITR 서열의 능력은 혈청형(예컨대, AAV3)의 캡시드 단백질 및 다른 AAV 혈청형(예컨대, AAV2)의 Rep 및/또는 ITR 서열을 포함하는 슈도형 rAAV 입자의 생산을 허용한다. 이런 슈도형 rAAV 입자는 본 발명의 일부이다.
변형된 "AAV" 서열은 또한 예컨대, 곤충 세포 내에서 rAAV 벡터의 생산을 위해, 본 발명의 문맥에서 사용될 수 있다. 이러한 변형된 서열은 예컨대, 야생형 AAV ITR, Rep, 또는 VP 서열 대신에 사용될 수 있는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12 또는 AAV13 ITR, Rep, 또는 VP에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95% 이상의 뉴클레오타이드 및/또는 아미노산 서열 동일성(예컨대, 75 내지 99% 뉴클레오타이드 서열 동일성을 갖는 서열)을 갖는 서열을 포함한다.
많은 측면에서 다른 AAV 혈청형과 유사하지만, AAV5는 다른 사람 및 시미안(simian) 혈청형보다 더 다른 사람 및 시미안 AAV 혈청형과는 상이하다. 이러한 측면에서, rAAV5의 생산은 곤충 세포 내에서 다른 혈청형의 생산과는 상이할 수 있다. 본 발명의 방법을 사용하여 rAAV5를 생산하는 경우, 종합적으로, 하나 이상의 작제물, AAV5 ITR을 포함하는 뉴클레오타이드 서열의 경우에, 뉴클레오타이드 서열이 AAV5 Rep 암호화 서열을 포함하는 것이 바람직하다(즉, 뉴클레오타이드 서열은 AAV5 Rep78을 포함한다). 이러한 ITR 및 Rep 서열은 경우에 따라 변형되어 곤충 세포 내에서 rAAV5 또는 슈도형 rAAV5 벡터의 효율적인 생산을 수득할 수 있다. 예컨대, Rep 서열의 출발 코돈은 변형될 수 있고/있거나, VP 스플라이스 부위는 변형되거나 제거될 수 있고/있거나 VP1 출발 코돈 및 근처 뉴클레오타이드는 변형되어 곤충 세포 내에서 rAAV5 벡터의 생산을 개선시킬 수 있다.
바람직한 구현예에서, 본 발명의 곤충 세포는 적어도 하나의 파르보바이러스 ITR 서열에 의해 플랭킹되는 전이유전자를 포함하는 뉴클레오타이드 서열을 추가로 포함한다. 따라서, 바람직하게는 뉴클레오타이드 서열은 적어도 하나의 AAV ITR 및 목적한 유전자 생성물을 암호화하는 적어도 하나의 뉴클레오타이드 서열(바람직하게는 포유동물 세포 내에서 발현시키기 위한) 또는 목적한 유전자를 표적화하는 뉴클레오타이드 서열(바람직하게는 포유동물 세포 내에서 상기 목적한 유전자를 사일런싱하기 위한)을 포함함으로써, 바람직하게는 목적한 유전자 생성물을 암호화하거나 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열은 곤충 세포 내에서 생산된 AAV의 게놈 내로 혼입된다. 바람직하게는, 목적한 유전자 생성물을 암호화하는 적어도 하나의 뉴클레오타이드 서열은 포유동물 세포 내에서 발현을 위한 서열이다. 바람직하게는, 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열은 포유동물 세포내에서 상기 목적한 유전자를 사일런싱하기 위한 서열이고, 바람직하게는, 뉴클레오타이드 서열은 2개의 AAV ITR 뉴클레오타이드 서열을 포함하고 여기서 목적한 유전자를 암호화하거나 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열은 2개의 AAV ITR 뉴클레오타이드 서열 사이에 위치한다. 바람직하게는, 복적한 유전자 생성물을 암호화하는 뉴클레오타이드 서열(포유동물 세포 내에서 발현시키기 위한) 또는 목적한 유전자를 표적화하는 뉴클레오타이드 서열(포유동물 세포 내에서 상기 목적한 유전자를 사일런싱하기 위한)은 이것이 2개의 정규 ITR 사이에 위치하거나 2개의 D 영역을 지닌 가공된 ITR의 어느 한쪽 측면에 위치하는 경우 곤충 세포 내에서 생산된 AAV 게놈 내로 혼입될 것이다. 따라서, 바람직한 구현예에서, 본 발명은 본 발명에 따른 곤충 세포를 제공하고, 여기서 뉴클레오타이드 서열은 2개의 AAV ITR 뉴클레오타이드 서열을 포함하고, 여기서 목적한 유전자 생성물을 암호화하는 적어도 하나의 뉴클레오타이드 서열 또는 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열은 2개의 AAV ITR 뉴클레오타이드 서열 사이에 위치한다.
전형적으로, ITR 및 프로모터 & 폴리아데닐화 서열을 포함하는 전이유전자는 길이가 5,000개 미만의 뉴클레오타이드(nt)이다. 다른 구현예에서, 너무 큰 DNA 분자, 즉, 길이가 5,000개 nt 이상인 분자는 본 발명에 의해 기술된 AAV 벡터를 사용함으로써 시험관 내에서 또는 생체 내에서 발현될 수 있다. 너무 큰 DNA는 여기서 5.5 kbp의 최대 AAV 패키딩 한계를 초과하는 DNA로 이해된다. 따라서, AAV 벡터의 생성은 또한 실현가능한 5.0 kb 보다 큰 게놈에 의해 일반적으로 암호화된 재조합 단백질을 생산할 수 있다.
따라서 본원에서 상기 정의된 바와 같은 전이유전자를 포함하는 뉴클레오타이드 서열은 목적한 유전자 생성물을 암호화하는 뉴클레오타이드 서열(포유동물 세포 내에서 발현시키기 위해) 또는 목적한 유전자를 표적화하는 뉴클레오타이드 서열(포유동물 세포 내에서 상기 목적한 유전자를 사일런싱하기 위해)을 포함하고, 이것이 곤충 세포내에서 복제된 재조합 파르보바이러스(rAAV) 벡터 내로 혼입되도록 위치할 수 있다. 본 발명의 문맥에서, "목적한 유전자 생성물"이 발현되거나 사일런싱되는 특히 바람직한 포유동물 세포는 사람 세포인 것으로 이해된다. 임의의 뉴클레오타이드 서열은 본 발명에 따라서 생산된 재조합 파르보바이러스(rAAV) 벡터로 형질감염된 포유동물 세포 내에서 이후 발현을 위해 혼입될 수 있다. 뉴클레오타이드 서열은 예컨대, 단백질을 암호화할 수 있거나 이는 RNAi 제제, 즉, 예컨대, shRNA(짧은 헤어핀RNA) 또는 siRNA(짧은 방해 RNA)와 같은 RNA 방해할 수 있는 RNA 분자를 발현할 수 있다. "siRNA"는 포유동물 세포 내에서 독성이 아닌 짧은 길이의 이중-가닥 RNA인 짧은 방해 RNA를 의미한다(Elbashir et al., 2001, Nature 411: 494-98; Caplen et al., 2001, Proc. Natl. Acad. Sci. USA 98: 9742-47). 바람직한 구현예에서, 전이유전자를 포함하는 뉴클레오타이드 서열은 2개의 코딩 뉴클레오타이드 서열을 포함할 수 있고, 각각은 포유동물 세포 내에서 발현시키기 위한 하나의 목적한 유전자 생성물을 암호화한다. 목적한 생성물을 암호화하는 2개의 뉴클레오타이드 서열 각각은 이것이 곤충 세포 내에서 복제된 재조합 파르보바이러스(rAAV) 내로 혼입되도록 위치한다.
포유동물 세포 내에서 발현시키기 위한 목적한 생성물은 치료학적 유전자 생성물일 수 있다. 치료학적 유전자 생성물은 표적 세포 내에서 발현된 경우, 목적한 치료학적 효과를 제공하는 폴리펩타이드, 또는 RNA 분자(si/sh/miRNA), 또는 다른 유전자일 수 있다. 목적한 치료학적 효과는 예를 들면, 목적하지 않은 활성(예컨대, VEGF)의 절제(ablation), 유전자 결함의 보충, 질환을 유발하는 유전자의 사일런싱, 효소 활성 또는 임의의 다른 질환-개실 효과에서 결함의 회복일 수 있다. 치료학적 폴리펩타이드 유전자 생성물의 예는 성장 인자, 응고 캐스케이드의 부분을 형성하는 인자, 효소, 지단백질, 사이토킨, 신경영양 인자, 호르몬 및 치료학적 면역글로불린 및 이의 변이체를 포함하나, 이에 한정되지 않는다. 치료학적 RNA 분자 생성물의 예는 스플라이싱 질환(silencing disease), 예를 들면, 그러나 이에 한정되지 않는 폴리글루타민 질환(polyglutamine disease), 이상지질혈증(dyslipidaemia) 또는 근위축성 측색 경화증(amyotrophic lateral sclerosis; ALS)에서 효과적인 miRNA를 포함한다.
본 발명에 따라 생산된 재조합 파르보바이러스(rAAV) 벡터를 사용하여 치료할 수 있는 질환은 일반적으로 유전적 원인 또는 기반을 갖는 것 이외에는, 특별히 제한되지 않는다. 예를 들면, 개시된 벡터로 치료될 수 있는 질환은 급성 간헐 포르피린증(acute intermittent porphyria; AIP), 노화 관련 황반 변성(age-related macular degeneration), 알츠하이머 질환(Alzheimer's disease), 관절염(arthritis), 배턴 질환(Batten disease), 캐너번 질환(Canavan disease), 시투룰린혈증 제1형(Citrullinemia type 1), 크리글러 나자르 질환(Crigler Najjar), 울혈성 심부전(congestive heart failure), 낭성 섬유증(cystic fibrosis), 뒤센느 근위축증(Duchene muscular dystrophy), 이상지질혈증(dyslipidemia), 글리코겐 저장 질환 제I형(glycogen storage disease type I; GSD-I), 혈우병(hemophilia) A, 혈우병 B, 유전성 폐기종(hereditary emphysema), 동질접합체적 가족성 고콜레스테롤혈증(homozygous familial hypercholesterolemia; HoFH), 헌팅톤 질환(Huntington's disease; HD), 레베르 선천성 흑암시(Leber's congenital amaurosis), 메틸말론 아카데미아(methylmalonic academia), 오르니틴 트랜스카바밀라제 결핍증(ornithine transcarbamylase deficiency; OTC), 파킨슨 질환(Parkinson's disease), 페닐케톤뇨증(phenylketonuria; PKU), 척수성 근위축(spinal muscular atrophy), 마비(paralysis), 윌슨 질환(Wilson disease), 간질(epilepsy), 폼페 질환(Pompe disease), 근위축성 측색 경화증(amyotrophic lateral sclerosis; ALS), 테이-새크스 질환(Tay-Sachs disease), 고옥살산뇨(hyperoxaluria) 9PH-1), 척수소뇌실조증 제1형(spinocerebellar ataxia type 1; SCA-1), SCA-3, u-디스트로핀(dystrophin), 가우처 제II형 또는 제III형(Gaucher's types II or III), 부정맥유발성 우심실 형성이상(arrhythmogenic right ventricular cardiomyopathy; ARVC), 파브리 질환(Fabry disease), 가족성 지중해열(familial Mediterranean fever; FMF), 프로피온산 혈증(proprionic acidemia), 취약 X 증후군(fragile X syndrome), 레트 증후군(Rett syndrome), 니만-피크 질환(Niemann-Pick disease) 및 크라베 질환(Krabbe disease)을 포함하나, 이에 한정되지 않는다. 발현될 치료학적 유전자 생성물의 예는 N-아세틸글루코스아미니다제, 알파(NaGLU), Treg167, Treg289, EPO, IGF, IFN, GDNF, FOXP3, 인자 VIII, 인자 IX 및 인슐린을 포함한다.
대안적으로 또는, 또한 다른 유전자 생성물로서, 본원의 상기 정의한 바와 같은 전이유전자를 포함하는 뉴클레오타이드 서열은 세포 형질전환 및 발현을 평가하기 위한 선택 마커 단백질로서 제공되는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 추가로 포함할 수 있다. 이러한 목적에 적합한 마커 단백질은 예컨대, 형광성 단백질 GFP, 및 선택가능한 마커 유전자 HSV 티미딘 키나제(HAT 배지에서 선택을 위해), 세균 하이그로마이신 B 포스포트랜스퍼라제(하이드로마이신 B에서 선택을 위해), Tn5 아미노글리코시드 포스포트랜스퍼라제(G418에서 선택을 위해), 및 디하이드로폴레이트 리덕타제(DHFR)(메토트렉세이트 상에서 선택을 위해), CD20, 저 친화성 신경 성장 유전자이다. 이러한 마커 유전자를 수득하기 위한 공급원 및 이의 사용 방법은 문헌(Sambrook and Russel, 상기 참고)에서 제공된다. 본원의 상기에 정의된 바와 같은 전이유전자를 포함하는 뉴클레오타이드 서열은 필요한 경우, 본 발명의 재조합 파르보바이러스(rAAV) 벡터로 형질도입된 세포로부터 대상체를 치유하도록 하는 안전 보장 메카니즘(fail-safe mechanism)으로서 제공될 수 있는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 추가로 포함할 수 있다. 자살 유전자(suicide gene)로서 흔히 지칭되는 이러한 뉴클레오타이드 서열은 전구약물(prodrug)을 단백질이 발현되는 유전자전이 세포를 사멸시킬 수 있는 독성 물질로 전환시킬 수 있는 단백질을 암호화한다. 이러한 자살 유전자의 적합한 예는, 예컨대, 이. 콜라이 사이토신 데아미나제 유전자 또는 헤르페스 단성 바이러스(Herpes Simplex Virus), 사이토메갈로바이러스(Cytomegalovirus) 및 바르셀라-조스타 바이러스(Varicella-Zoster virus)로부터의 티미딘 키나제 유전자 중 하나를 포함하고, 여기서 간시클로비르(ganciclovir)는 대상체 내에서 유전자이식 세포를 사멸시키는 전구약물로서 사용될 수 있다(참고: 예컨대, Clair et al., 1987, Antimicrob. Agents Chemother. 31: 844-849).
포유동물 세포 내에서 발현시키기 위한, 본원의 상기에 정의된 바와 같은 전이유전자를 포함하는 뉴클레오타이드 서열은 또한 바람직하게는 적어도 하나의 포유동물 세포-얄립성 발현 제어 서열, 예컨대, 목적한 유전자 생성물을 코딩하는 서열에 작동 가능하게 연결된 프로모터를 포함한다. 많은 이러한 프로모터는 당해 분야에 공지되어 있다(참고: Sambrook and Russel, 2001, 상기 참고). 많은 세포형에서 광범위하게 발현된 구성적 프로모터, 예를 들어, CMV 프로모터를 사용할 수 있다. 그러나, 유도성의 조직-특이적이거나, 세포-특이적이거나, 세포 주기-특이적인 프로모터가 보다 바람직할 것이다. 예를 들면, 간-특이적인 발현(제PCT/EP2019/081743호에 기술된 바와 같이)의 경우 프로모터는 α1-항-트립신 프로모터, 갑상선 호르몬-결합 글로빈 프로모터, 알부민 프로모터, LPS(티록신-결합 글로빈) 프로모터, HCR-ApoCII 하이브리드 프로모터, HCR-hAAT 하이브리드 프로모터 및 아포지단백질 E 프로모터, LP1, HLP, 최소 TTR 프로모터, FVIII 프로모터, 하이페론 인핸서, ealb-hAAT로부터 선택될 수 있다. 다른 예는 종양-선택적인, 및, 특히 신경 세포 종양-선택적인 발현을 위한 E2F 프로모터(Parr et al., 1997, Nat. Med. 3:1145-9) 또는 단핵 혈액 세포에서 사용하기 위한 IL-2 프로모터(Hagenbaugh et al., 1997, J Exp Med; 185: 2101-10)를 포함한다.
곤충 세포 내에서 적절한 발현을 위한, 상기 정의된 바와 같은 뉴클레오타이드 서열, 예컨대, 야생형 파르보바이러스 서열의 다양한 변형은 예컨대, 문헌: Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York에 기술된 바와 같은 잘-공지된 유전 가공 기술을 적용함으로써 달성된다. 암호화 영역의 다양한 추가의 변형은 암호화 단백질의 수율을 증가시킬 수 있는 당해 분야의 숙련가에게 알려져 있다. 이러한 변형은 본 발명의 영역 내에 있다.
AAV
본 발명의 재조합 파르보바이러스(rAAV) 벡터에서 포유동물 세포 내에서 발현을 위한 전이유전자 또는 목적한 유전자 생성물을 암호화하는 적어도 하나의 뉴클레오타이드 서열(들)은 바람직하게는 적어도 하나의 포유동물 세포-양립성 발현 제어 서열, 예컨대, 프로모터에 작동 가능하게 연결되어 있다. 상기 논의된 바와 같이, 많은 이러한 프로모터는 당해 분야에 공지되어 있다.
AAV는 다수의 포유동물 세포를 감염시킬 수 있다. 예컨대, 문헌: Tratschin et al. (1985, Mol. Cell Biol. 5:3251-3260) 및 Grimm et al. (1999, Hum. Gene Ther. 10:2445-2450)를 참고한다. 그러나, 사람 AAV 활액 섬유아세포의 형질도입은 유사한 쥐 세포(murine cell)에서보다 유의적으로 보다 효율적이고(Jennings et al., Arthritis Res, 3:1 (2001), AAV의 세포 향성은 혈청형 중에서 상이하다. 예컨대, 문헌: Davidson et al. (2000, Proc. Natl. Acad. Sci. USA, 97:3428-3432)를 참고하며, 이는 포유동물 CNS 세포 향성 및 형질도입 효능과 관련하여 AAV2, AAV4, 및 AAV5 중에서의 차이를 논의하고 있다. 바람직한 구현예에서, 본 발명의 숙주 세포는 파르보바이러스 비리온에 의해 감염될 수 있는 임의의 포유동물 세포, 예를 들면, 그러나 이에 한정되지 않는 근육 세포, 간 세포, 신경 세포, 교질 세포 및 상피 세포이다. 바람직한 구현예에서, 본 발명의 숙주 세포는 사람 세포이다.
방법
추가의 양태에서, 본 발명은 재조합 파르보바이러스 비리온을 생산하는 방법을 제공한다. 방법은 바람직하게는 a) 본원에 정의된 바와 같은 곤충 세포를 배양하는 단계; b) a)에서 배양된 세포에 본원에 정의된 바와 같은 뉴클레오타이드 서열을 제공하는 단계; 및 c) 재조합 파르보바이러스 비리온을 회수하는 단계를 포함한다. 일 구현예에서, a)에서 세포 배양은 본원에 정의된 바와 같은 뉴클레오타이드 서열로 또한 감염된 것으로 알려진, 형질감염된다.
회수는 바람직하게는 항-AAV 항체, 바람직하게는 고정된 항체를 사용하여 재조함 파르보바이러스(rAAV) 벡터(를 포함하는 비리온)의 친화성-정제의 단계를 포함한다. 항-AAV 항체는 바람직하게는 모노클로날 항체이다. 특히 적합한 항체는 예컨대, 카멜(camel) 또는 라마(llama)로부터 수득가능한 것으로서 단일 쇄 카멜리드 항체 또는 이의 단편이다(참고: 예컨대, Muyldermans, 2001, Biotechnol. 74: 277-302). rAAV의 친화성-정제를 위한 항체는 AAV 캡시드 단백질 상의 에피토프에 특이적으로 결합하는 항체이고, 이에 의해, 바람직하게는 에피토프는 하나 이상의 AAV 혈청형의 캡시드 단백질 상에 존재하는 에피토프이다. 예컨대, 항체는 AAV2 캡시드에 대한 특이적인 결합을 기반으로 상승되거나 선택될 수 있지만 동시에 또한 이는 AAV1, AAV3 및 AAV5 캡시드에 특이적으로 결합할 수 있다.
추가의 구현예에서, 여기서 단계 c)에서 재조합 파르보바이러스 비리온의 회수는 고정된 항-파르보바이러스 항체, 바람직하게는 단일 쇄 카멜리드 항체 또는 이의 단편을 사용한 비리온의 친화성-정제, 및 공칭 공극 크기가 30 내지 70 m인 필터 위에서 여과 중 적어도 하나를 포함한다.
따라서, 일 구현예에서 본 발명은 세포 내에서 재조합 파르보바이러스 비리온을 생산하는 방법을 제공한다. 방법은 바람직하게는: a) 본원에 정의된 바와 같은 곤충 세포를 배양하는 단계; b) a)에서 배양된 세포를 본원에 정의된 바와 같은 뉴클레오타이드 서열로 감염시키는 단계; 및, c) 재조합 파르보바이러스 비리온을 회수하는 단계를 포함하고 여기서 단계 b)에서 재조합 파르보바이러스 비리온의 회수는 고정된 항-파르보바이러스 항체, 바람직하게는 단일 쇄 카멜리드 항체 또는 이의 단편을 사용한 비리온의 친화성-정제, 또는 공칭 공극 크기가 30 내지 70 nm인 필터 위에서의 여과 중 적어도 하나를 포함한다.
추가의 양태에서, 본 발명은 본 발명의 상술한 방법에서 생산된 파르보바이러스 비리온의 배치에 관한 것이다. "파르보바이러스 비리온의 배치"는 임의로 곤충 세포의 용기 당 본원에서 동일한 생산 라운드에서 생산된 모든 파르보바이러스 비리온으로서 정의된다. 바람직한 구현예에서, 본 발명의 파르보바이러스 비리온의 배치는 상술한 바와 같은 전체 비리온(full virion):총 비리온(total virion) 비 및/또는 상술한 바와 같은 전체 비리온:빈(empty) 비를 포함한다.
키트
추가의 양태에서, 본 발명은 적어도 본원에 정의된 바와 같은 곤충 세포 및 본원에 정의된 바와 같은 바큘로바이러스 벡터 및/또는 뉴클레오타이드 서열을 포함하는 부분의 키트를 제공한다.
도 1. (A) 리포터 또는 pCLD 발현 작제물을 포함하는 일시적인 형질감염 및 바큘로바이러스 트랜스활성화 연구의 개략적 표시. 루시퍼라제 활성은 나노-루시퍼라제 리포토 연구를 위해 측정되었고 웨스턴 블롯을 수행하여 pCLD 작제물로부터 Rep 발현을 측정하였다. GSG-P2A는 자가-절단 펩타이드(Wang et al., 2015)이다. (B) 감염 후 48시간 째에 상이한 바큘로바이러스 트랜스활성화의 영향 하에서 나타낸 조절 성분을 지닌 나타낸 pCLD로부터의 AAV Rep 단백질의 발현 프로파일. T: Bac Trans. CT: Bac polH Cap Trans. C: Bac polH Cap. (C) 나타낸 바큘로바이러스 트랜스활성화시 나타낸 프로모터에 의해 조절된 리포터 유전자 발현(나노-루시퍼라제)의 역학 및 강도. 발광성의 척도인, 상대적인 루시퍼라제 단위(relative luciferase unit: RLU)를 30 μl의 샘플 용적에서 측정하였다. 모의(Mock)(원): 동일한 용적의 신선한 배지로 접종됨. Bac Trans(사각형): AAV ITR-전이유전자-ITR 만을 지닌 재조합 바큘로바이러스. Bac polH Cap Trans (triangles): polH 조절된 AAV Cap 유전자 및 ITR-전이유전자-ITR을 지닌 재조합 바큘로바이러스. Bac polH Cap: polH 조절된 AAV2 Cap 유전자 만을 지닌 재조합 바큘로바이러스. 각각의 데이타 점은 독립된 실험 복제물을 나타낸다.
도 2. (A) 곤충 세포 내에서 상이한 상동성 반복체(hr) 성분의 인핵서 활성을 비교하기 위해 사용된 리포터 작제물의 분자 설계. polH 프로모터를 대표적인 프로모터로서 선택하였다. (B) 바큘로바이러스 게놈 내 모든 hr 서열의 뉴클레오타이드 유사성의 퍼센트. (C 및 D) 나타낸 바큘로바이러스 트랜스활성화시 나타낸 hr 인핸서에 의해 조절된 리포터 유전자의 역학 및 강도. 상대적인 루시퍼라제 단위(relative luciferase unit; RLU)를 30 μl의 샘플 용적에서 측정하였다. 각각의 ㅈㅁ은 독립된 실험의 복제물을 나타낸다. (E) AAV Rep 발현에서 상이한 hrs의 인핸서 활성을 비교하기 위한 pCLD의 분자 설계. (F) 감염 후 48시간 째에 상이한 hr 인핸서의 영향 하에서 AAV Rep 단백질의 발현 프로파일. T: Bac Trans.
도 3. (A) Bac polH Cap Trans 트랜스활성화시 관찰된 시스:트랜스 프로모터를 최소화하는 유도성의 단일-Rep 카세트 플라스미드 벡터의 대안적인 분자 설계. (B) 나타낸 바큘로바이러스 트랜스활성화 후 48시간 째에 거의 리키하지 않은(less leaky) hr4b 인핸서 및 보다 강력한 ATG와 함께 나타낸 프로모터의 제어 하에서 AAV Rep 단백질의 발현 프로파일. T: Bac Trans. CT: Bac polH Cap Trans.
도 4. (A) 나타낸 바큘로바이러스 트랜스활성화시 대안의 바큘로바이러스 프로모터에 의해 조절된 리포터 유전자 발현의 역학 및 강도. (B) 39k 프로모터에 대한 대안의 또는 준최적 출발 코돈을 특성화하는데 사용된 리포터 작제물의 분자 설계. hr2.09 인핸서를 대표적인 인핸서로서 선택하였다. (C) 나타낸 바큘로바이러스 트랜스활성화에 의해 나타낸 대안의 출발 코돈을 지닌 리포터 유전자 발현의 역학 및 강도. (D) 39k 프로모터 및 ACG 출발 코돈의 조절 하에서 AAV Rep 발현 프로파일을 관찰하기 위한 pCLD 작제물의 분자 설계 또는 (E) 인공 인트론 내에서 추가의 프로모터 성분 하에서. 나타낸 바큘로바이러스 트랜스활성화시 나타낸 단일-Rep 카세트 pCLD로부터 AAV Rep 단백질의 웨스턴 블롯. 상대적인 루시퍼라제 단위(RLU)를 30 μl의 샘플 용적으로 측정하였다. 각각의 데이타 점은 별개의 실험 복제물(replicate)을 나타낸다.
도 5. (A) 코돈 최적화된 AAV2 Rep의 뉴클레오타이드 유사성의 퍼센트. (B) 나타낸 조절 성분을 지닌 유도성 분할-Rep 카세트 플라스미드 벡터의 분자 설계. (C) 나타낸 바큘로바이러스 트랜스활성화시 분할-Rep 카세트 플라스미드 벡터의 발현 프로파일. ((+) 및 우측 화살표): 전방 배향. ((-) 및 좌측 화살표): 역-보충된 배향. T: Bac Trans. CT: Bac polH Cap Trans.
도 6. (A) 일시적인 AAV 생산 실험 설정의 개략도. (B 및 C) 나타낸 pCLD 형질감염 및 바큘로바이러스 트랜스활성화를 사용한 일시적인 AAV 생산 후 3일 때에 수거한 조 분해물 완충제(crude lysate buffer: CLB) 중 뉴클레아제 내성 AAV 입자의 게놈 카피 역가(GC/ml). Bac Cap5 FIX(원): polH 조절된 AAV Cap5 유전자 및 ITR-FIX-ITR을 지닌 재조합 바큘로바이러스. Bac Cap2/5 나노-루시퍼라제(삼각형): nano-luciferase (triangles): polH 조절된 AAV Cap2/5(AAV2/5) 유전자 및 ITR-분비된-Nano-Luc-ITR을 지닌 재조합 바큘로바이러스. (D 및 E) 일시적인 AAV 생산 실험으로부터의 AAV Rep 역학 및 발현 프로파일. 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다.
도 7. (A) AVB 정제된 AAV2/5 나노-루시퍼라제의 VP1:2:3 프로파일 (B) Huh7 세포내에서 설정된 AAV 효능 검정의 개략도. 일시적인 AAV 생산으로부터 생산된 AVB 정제된 AAV2/5 입자를 표준화하고 세포 당 105 또는 104개의 GC 용량에서 Huh7 세포를 접종하는데 사용하였다. 감염 후 3일째에(days post infection)(d.p.i), AAV2/5 입자 형질도입의 효능을 상층액 내로 분비된 나노-루시퍼라제 활성(상대적인 루시퍼라제 단위/RLU)로 측정하였다. (C) 나타낸 Rep 플라스미드 벡터(pCLD)를 사용하여 일시적인 AAV 생산으로부터 생산된 정제된 AAV의 효능 비교. Bac Rep183: BEV 유래된 AAV 물질. 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다.
도 8. (A) 변성된 포름알데하이드 아가로스 겔 상에서 나타낸 pCLD 일시적인 형질감염 실험으로부터 생산된 AAV 배치로부터 추출된, AAV DNA 벡터 게놈의 분자 분석. FIX 및 나노-루시퍼라제 벡터 게놈에 대한 전체 ITR - 전이유전자 - ITR 크기는 각각 2.5 kb 및 2 kb이었다. 검정색 화살표: FIX 또는 나노-루시퍼라제 벡터 게놈의 이량체 복제 형태. 백색 화살표: 단량체 복제형. m: 스마트 DNA 레더(smart DNA ladder). High/low exp: 총 조립된 AAV5 캡시드/GC 역가 방법을 기반으로 (B) 이론적인 AAV 총:전체 비(TF) 동안 겔 노출. 총 조립된 캡시드의 수는 AVB 정제된 AAV 입자에서 ELISA 분석을 수행함으로써 측정하였다. GC 역가는 또한 동일한 AVB 정제된 입자로부터 수득하였다.
도 9. (A) 신규의 안정한 iRep expresSf+ 세포주의 생성의 개략도. (B) 조 분해 완충제(CLB) 속에서 및 나타낸 iRep 세포주 및 바큘로바이러스 트랜스활성화를 사용한 일시적인 AAV 생산 후 3일째에 수거된 뉴클레아제 내성 AAV 입자의 게놈 카피 역가(GC/ml) 및 생산성(GC/도입 세포(input cell)). 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다. (C) 일시적인 AAV 생산 실험으로부터의 AAV Rep 역학 및 발현 프로파일.
도 10. (A) 나타낸 바와 같은 iRep 세포주로부터 생산된 ABV 정제된 AAV2/5 sNano-Luc의 Vp1:2:3 프로파일. (B) Huh7 세포 내에서 정제된 AAV 입자의 효능 비교. 3-ple Bac: 3개의 Bac 생산 플랫폼으로부터 생산된 AAV 물질 및 Bac Rep: 야생형 ExpresSf+ 세포 내에서 Bac Cap Trans 및 Bac Rep 조합으로부터 생산된 AAV 물질.
도 11. (A) 입자 품질 연구 및 공급 방법을 위한 AAV5 FIX 정제된 물질의 목록. iRep 세포주를 야생형 ExpresSf+ 세포 및 Bac Rep의 사용으로 대체하여 AAV 물질을 생산하였다 (B) 변성하는 포름알데하이드 아가로스 겔 상에서, AAV 물질로부터 추출된 AAV DNA 벡터 게놈의 분자 분석. FIX 벡터 게놈에 대한 전체 ITR - 전이유전자 - ITR 크기는 2.5 kb이다. 검정색 및 백색 화살표: FIX의 이량체 단량체 복제형. (C) 총 조립된 AAV5 캡시드/GC 역가 방법을 기반으로 한 이론적인 AAV 총:전체 비(TF). 총 조립된 캡시드는 정제된 AAV 입자에서의 분석을 기반으로 HPLC를 수행함으로써 측정하였다. GC 역가는 또한 동일한 입자로부터 수득하였다. (D) 정제된 AAV 물질에서 잔류 Bac DNA 오염의 정량화. 결과는 1 x 1013개의 AAV GC 당 Bac DNA의 비로 나타낸다.
도 12. 본 연구에 사용된 플라스미드의 물리적 맵(map): A) pCLD 046; B) pCLD 050; C) pCLD 051; D) pCLD 052; E) pCLD 053; 및 F) pCLD 054).
도 13. 합성 hr 서열을 포함하는, 모든 바큘로바이러스 hr 서열의 뉴클레오타이드 정렬 및 크기. 선은 나타낸 hr 서열을 나타낸다.
도 14. A) 내지 R): 야생형 Rep52, Rep183 Rep52(제WO2009/014445호에 기술된 바와 같음) 및 극도의-코돈-최적화된 Rep52 코딩 서열(서열 번호: 15)의 암호화 서열의 뉴클레오타이드 정렬.
도 15. (A) iRep 안정한 세포 혼주물(cell pool)의 확인을 위한 실험 설정 개략도. 황색은 1L의 진탕 플라스크 속에서 예비-배양 계대배양물을 나타낸다(계대배양 0-3). 녹색은 2L STR에서 씨드 무리 생산(seed train production)을 나타낸다(계대배양 4 내지 9). 적색은 2L STR로부터 계대배양 5, 7, 및 9에서 iRep 안정한 세포 혼주물을 사용하여 바큘로바이러스 Bac Cap5 FIX 계대배양 5로 형질감염시킴에 의한 1L들이 진탕 플라스크 속에서 AAV 생산 현상을 나타낸다. (B) iRep 안정한 혼주물의 확인을 위한 시각표. 괄호 안의 숫자는 형질감염에 사용된 iRep 안정한 혼주물 세포의 생성을 나타내었다. (C) Bac Cap5 FIX (P5)로 형질감염한 후 48 및 72시간 째에 계대배양 5, 7, 및 9에서 iRep 안정한 혼주물 세포 속에서 Rep 78 및 Rep 52의 발현. (D) Bac Cap5 FIX (P5)로 형질감염 후 72시간째의 결과로서 FCLB 내 전이유전자 FIX의 게놈 카피. MOI는 iRep 안정한 혼주물 세포의 형질감염에 사용된 Bac Cap5 FIX P5의 용적 비를 나타낸다. 괄호 안의 숫자는 형질감염을 위해 사용된 iRep 안정한 혼주물 세포의 계대배양 수를 나타낸다.
도 2. (A) 곤충 세포 내에서 상이한 상동성 반복체(hr) 성분의 인핵서 활성을 비교하기 위해 사용된 리포터 작제물의 분자 설계. polH 프로모터를 대표적인 프로모터로서 선택하였다. (B) 바큘로바이러스 게놈 내 모든 hr 서열의 뉴클레오타이드 유사성의 퍼센트. (C 및 D) 나타낸 바큘로바이러스 트랜스활성화시 나타낸 hr 인핸서에 의해 조절된 리포터 유전자의 역학 및 강도. 상대적인 루시퍼라제 단위(relative luciferase unit; RLU)를 30 μl의 샘플 용적에서 측정하였다. 각각의 ㅈㅁ은 독립된 실험의 복제물을 나타낸다. (E) AAV Rep 발현에서 상이한 hrs의 인핸서 활성을 비교하기 위한 pCLD의 분자 설계. (F) 감염 후 48시간 째에 상이한 hr 인핸서의 영향 하에서 AAV Rep 단백질의 발현 프로파일. T: Bac Trans.
도 3. (A) Bac polH Cap Trans 트랜스활성화시 관찰된 시스:트랜스 프로모터를 최소화하는 유도성의 단일-Rep 카세트 플라스미드 벡터의 대안적인 분자 설계. (B) 나타낸 바큘로바이러스 트랜스활성화 후 48시간 째에 거의 리키하지 않은(less leaky) hr4b 인핸서 및 보다 강력한 ATG와 함께 나타낸 프로모터의 제어 하에서 AAV Rep 단백질의 발현 프로파일. T: Bac Trans. CT: Bac polH Cap Trans.
도 4. (A) 나타낸 바큘로바이러스 트랜스활성화시 대안의 바큘로바이러스 프로모터에 의해 조절된 리포터 유전자 발현의 역학 및 강도. (B) 39k 프로모터에 대한 대안의 또는 준최적 출발 코돈을 특성화하는데 사용된 리포터 작제물의 분자 설계. hr2.09 인핸서를 대표적인 인핸서로서 선택하였다. (C) 나타낸 바큘로바이러스 트랜스활성화에 의해 나타낸 대안의 출발 코돈을 지닌 리포터 유전자 발현의 역학 및 강도. (D) 39k 프로모터 및 ACG 출발 코돈의 조절 하에서 AAV Rep 발현 프로파일을 관찰하기 위한 pCLD 작제물의 분자 설계 또는 (E) 인공 인트론 내에서 추가의 프로모터 성분 하에서. 나타낸 바큘로바이러스 트랜스활성화시 나타낸 단일-Rep 카세트 pCLD로부터 AAV Rep 단백질의 웨스턴 블롯. 상대적인 루시퍼라제 단위(RLU)를 30 μl의 샘플 용적으로 측정하였다. 각각의 데이타 점은 별개의 실험 복제물(replicate)을 나타낸다.
도 5. (A) 코돈 최적화된 AAV2 Rep의 뉴클레오타이드 유사성의 퍼센트. (B) 나타낸 조절 성분을 지닌 유도성 분할-Rep 카세트 플라스미드 벡터의 분자 설계. (C) 나타낸 바큘로바이러스 트랜스활성화시 분할-Rep 카세트 플라스미드 벡터의 발현 프로파일. ((+) 및 우측 화살표): 전방 배향. ((-) 및 좌측 화살표): 역-보충된 배향. T: Bac Trans. CT: Bac polH Cap Trans.
도 6. (A) 일시적인 AAV 생산 실험 설정의 개략도. (B 및 C) 나타낸 pCLD 형질감염 및 바큘로바이러스 트랜스활성화를 사용한 일시적인 AAV 생산 후 3일 때에 수거한 조 분해물 완충제(crude lysate buffer: CLB) 중 뉴클레아제 내성 AAV 입자의 게놈 카피 역가(GC/ml). Bac Cap5 FIX(원): polH 조절된 AAV Cap5 유전자 및 ITR-FIX-ITR을 지닌 재조합 바큘로바이러스. Bac Cap2/5 나노-루시퍼라제(삼각형): nano-luciferase (triangles): polH 조절된 AAV Cap2/5(AAV2/5) 유전자 및 ITR-분비된-Nano-Luc-ITR을 지닌 재조합 바큘로바이러스. (D 및 E) 일시적인 AAV 생산 실험으로부터의 AAV Rep 역학 및 발현 프로파일. 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다.
도 7. (A) AVB 정제된 AAV2/5 나노-루시퍼라제의 VP1:2:3 프로파일 (B) Huh7 세포내에서 설정된 AAV 효능 검정의 개략도. 일시적인 AAV 생산으로부터 생산된 AVB 정제된 AAV2/5 입자를 표준화하고 세포 당 105 또는 104개의 GC 용량에서 Huh7 세포를 접종하는데 사용하였다. 감염 후 3일째에(days post infection)(d.p.i), AAV2/5 입자 형질도입의 효능을 상층액 내로 분비된 나노-루시퍼라제 활성(상대적인 루시퍼라제 단위/RLU)로 측정하였다. (C) 나타낸 Rep 플라스미드 벡터(pCLD)를 사용하여 일시적인 AAV 생산으로부터 생산된 정제된 AAV의 효능 비교. Bac Rep183: BEV 유래된 AAV 물질. 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다.
도 8. (A) 변성된 포름알데하이드 아가로스 겔 상에서 나타낸 pCLD 일시적인 형질감염 실험으로부터 생산된 AAV 배치로부터 추출된, AAV DNA 벡터 게놈의 분자 분석. FIX 및 나노-루시퍼라제 벡터 게놈에 대한 전체 ITR - 전이유전자 - ITR 크기는 각각 2.5 kb 및 2 kb이었다. 검정색 화살표: FIX 또는 나노-루시퍼라제 벡터 게놈의 이량체 복제 형태. 백색 화살표: 단량체 복제형. m: 스마트 DNA 레더(smart DNA ladder). High/low exp: 총 조립된 AAV5 캡시드/GC 역가 방법을 기반으로 (B) 이론적인 AAV 총:전체 비(TF) 동안 겔 노출. 총 조립된 캡시드의 수는 AVB 정제된 AAV 입자에서 ELISA 분석을 수행함으로써 측정하였다. GC 역가는 또한 동일한 AVB 정제된 입자로부터 수득하였다.
도 9. (A) 신규의 안정한 iRep expresSf+ 세포주의 생성의 개략도. (B) 조 분해 완충제(CLB) 속에서 및 나타낸 iRep 세포주 및 바큘로바이러스 트랜스활성화를 사용한 일시적인 AAV 생산 후 3일째에 수거된 뉴클레아제 내성 AAV 입자의 게놈 카피 역가(GC/ml) 및 생산성(GC/도입 세포(input cell)). 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다. (C) 일시적인 AAV 생산 실험으로부터의 AAV Rep 역학 및 발현 프로파일.
도 10. (A) 나타낸 바와 같은 iRep 세포주로부터 생산된 ABV 정제된 AAV2/5 sNano-Luc의 Vp1:2:3 프로파일. (B) Huh7 세포 내에서 정제된 AAV 입자의 효능 비교. 3-ple Bac: 3개의 Bac 생산 플랫폼으로부터 생산된 AAV 물질 및 Bac Rep: 야생형 ExpresSf+ 세포 내에서 Bac Cap Trans 및 Bac Rep 조합으로부터 생산된 AAV 물질.
도 11. (A) 입자 품질 연구 및 공급 방법을 위한 AAV5 FIX 정제된 물질의 목록. iRep 세포주를 야생형 ExpresSf+ 세포 및 Bac Rep의 사용으로 대체하여 AAV 물질을 생산하였다 (B) 변성하는 포름알데하이드 아가로스 겔 상에서, AAV 물질로부터 추출된 AAV DNA 벡터 게놈의 분자 분석. FIX 벡터 게놈에 대한 전체 ITR - 전이유전자 - ITR 크기는 2.5 kb이다. 검정색 및 백색 화살표: FIX의 이량체 단량체 복제형. (C) 총 조립된 AAV5 캡시드/GC 역가 방법을 기반으로 한 이론적인 AAV 총:전체 비(TF). 총 조립된 캡시드는 정제된 AAV 입자에서의 분석을 기반으로 HPLC를 수행함으로써 측정하였다. GC 역가는 또한 동일한 입자로부터 수득하였다. (D) 정제된 AAV 물질에서 잔류 Bac DNA 오염의 정량화. 결과는 1 x 1013개의 AAV GC 당 Bac DNA의 비로 나타낸다.
도 12. 본 연구에 사용된 플라스미드의 물리적 맵(map): A) pCLD 046; B) pCLD 050; C) pCLD 051; D) pCLD 052; E) pCLD 053; 및 F) pCLD 054).
도 13. 합성 hr 서열을 포함하는, 모든 바큘로바이러스 hr 서열의 뉴클레오타이드 정렬 및 크기. 선은 나타낸 hr 서열을 나타낸다.
도 14. A) 내지 R): 야생형 Rep52, Rep183 Rep52(제WO2009/014445호에 기술된 바와 같음) 및 극도의-코돈-최적화된 Rep52 코딩 서열(서열 번호: 15)의 암호화 서열의 뉴클레오타이드 정렬.
도 15. (A) iRep 안정한 세포 혼주물(cell pool)의 확인을 위한 실험 설정 개략도. 황색은 1L의 진탕 플라스크 속에서 예비-배양 계대배양물을 나타낸다(계대배양 0-3). 녹색은 2L STR에서 씨드 무리 생산(seed train production)을 나타낸다(계대배양 4 내지 9). 적색은 2L STR로부터 계대배양 5, 7, 및 9에서 iRep 안정한 세포 혼주물을 사용하여 바큘로바이러스 Bac Cap5 FIX 계대배양 5로 형질감염시킴에 의한 1L들이 진탕 플라스크 속에서 AAV 생산 현상을 나타낸다. (B) iRep 안정한 혼주물의 확인을 위한 시각표. 괄호 안의 숫자는 형질감염에 사용된 iRep 안정한 혼주물 세포의 생성을 나타내었다. (C) Bac Cap5 FIX (P5)로 형질감염한 후 48 및 72시간 째에 계대배양 5, 7, 및 9에서 iRep 안정한 혼주물 세포 속에서 Rep 78 및 Rep 52의 발현. (D) Bac Cap5 FIX (P5)로 형질감염 후 72시간째의 결과로서 FCLB 내 전이유전자 FIX의 게놈 카피. MOI는 iRep 안정한 혼주물 세포의 형질감염에 사용된 Bac Cap5 FIX P5의 용적 비를 나타낸다. 괄호 안의 숫자는 형질감염을 위해 사용된 iRep 안정한 혼주물 세포의 계대배양 수를 나타낸다.
실시예
물질 및 방법
세포 배양
Huh7 세포를 37℃, 5% CO2에서 10%(v/v) 태아 소 혈청(fetal bovine serum; FBS)이 보충된 둘베코 변형된 이글 배지(Dulbecco's modified Eagle's medium)(DMEM, Invitrogen) 속에 유지시켰다. Sf9 및 ExpresSf+ 세포를 진탕 플라스크 속에서 Sf-900 II SFM(Gibco) 속에서 28℃, 135 rpm에서 유지시켰다. Sf9 세포의 경우에, 배양된 세포에 10% FBS(Gibco)를 보충하였다.
유도성 발현 플라스미드 및 재조합 바큘로바이러스 작제(construction)
모든 유도성 발현 플라스미드 시리즈(pCLDs) 및 나노-루시퍼라제 리포터 작제물을 GeneArt 유전자 합성 서비스(ThermoFisher)를 사용하여 생성시켰다. ITR-전이유전자-ITR 단독(Bac Trans) 또는 AAV Cap 발현 카세트 단독(Bac polH Cap2/5; Urabe, M. et al., 2006) 또는 AAV Cap 발현 카세트 및 ITR-전이유전자-ITR(Bac polH Cap5 - 사람 인자 IX 또는 Bac polH Cap2/5 - 분비된 나노-루시퍼라제 [나노-루시퍼라제])를 포함하는 재조합 바큘로바이러스를 생성시키기 위하여, Sf9 세포를 pVD-ITR-전이유전자-ITR(SEAP 전이유전자)(서열 번호: 01) 또는 pVD-polH-Cap(polH Cap2)(서열 번호: 02) 또는 pVD-polH-Cap-ITR-전이유전자-ITR(polH Cap Trans)(Cap5 FIX: 서열 번호: 03, Cap2/5 나노-루시퍼라제: 서열 번호: 29)로 형질감염시키고 셀펙틴(Cellfectine) II 시약을 사용하여 바큘로바이러스 게놈을 선형화하였다. 이후에, 양성 세포 플라크를 점착하여 배양시킨 Sf9 세포로 이전시켰다. 형질감염 후 72시간 째에, Sf9 세포로부터 감염된 상층액을 추가로 계대배양하고 계대배양 4(P4)에 도달할 때까지 ExpresSf+ 세포 속에서 증폭시켰다. 재조합 현상 및 게놈 안정성을 분석한 후, 선택된 재조합 바큘로바이러스로부터의 P4 물질을 분취량으로서 액체 질소 속에 저장하고 특성화 실험 전에 P5 작업 종자 바이러스에 단독으로 새로이 증폭시켰다. AAV2 Rep(Bac Rep183)(서열 번호: 04)를 발현하는 바큘로바이러스를 앞서 설명한 바와 같이 생성시켰다(Urabe, M. et al., 2006). 이러한 Bac Rep183은 또한 분할-카세트 AAV Rep, 또는 분할 Rep로 지칭된다.
AAV 벡터 생산
AAV 변이체는 일시적으로 형질감염된 ExpresSF+ 곤충 세포를 나타낸 AAV Cap 및 전이유전자를 포함하는 새로이 증폭시킨 재조합 바큘로바이러스 스톡(P4→P5)으로 형질감염시켜 생성하였다(Urabe, M. et al., 2002). 28℃에서 72시간 항온처리한 후, 세포를 1% 트리톤(Triton) X-100으로 1시간 동안 분해하였다. 게놈 DNA를 1시간 동안 37℃에서 벤조노나제((Merck) 처리를 통해 분해하고, 세포 부스러기를 15분 동안 1900 Xg에서 원심분리함으로써 제거하였다. 투명하게된 분해물을 정제 시작까지 4℃에서 저장하고, DNase-내성 AAV 입자 역가를 나타낸 전이유전자의 프로모터 영역에 대해 지시된 프라이머 및 프로브를 사용한 정량적 폴리머라제 쇄 반응(qPCR)을 사용하여 측정하였다(참고: 표 1). AAV 벡터를 정제하기 위하여, 투명해진 분해물을 AVB 세파로즈(GE Healthcare)를 사용하여 정제하였다. 정제된 바이러스 역가를 이후에 qPCR로 측정하였다.
[표 1]
일시적인 형질감염 및 발현 분석
단백질 발현을 분석하기 위하여, ExpresSf+ 세포를 부착하여 씨딩하고 1 pg의 유도성 나노-루시퍼라제 리포터 또는 Rep 유전자를 암호화하는 플라스미드 DNA로 형질감염시켰다. Cellfectin II 시약(Invitrogen)을 형질감염을 위해 사용하였다. 형질감염 후 1일째에, 1% (v/v) 말기 농도에서 나타낸 P5 바큘로바이러스를 접종하였다.
SDS-페이지(page) 및 웨스턴 블롯
웨스턴 블롯 분석을 RIPA 완충제(Sigma Aldrich) + 프로테아제 억제제 칵테일(protease inhibitor cocktail)(Roche)로 형질감염 후 48시간째에 분해한 형질감염된 세포로부터의 세포 분해물로 수행하였다. 세포 분해물을 동일한 용적의 미니-프로테안 프레캐스트(mini-protean precast) 4 내지 12% 비스-트리스 폴리아크릴아미드 겔(BioRad)에 로딩하였다. 이후에, 겔을 트랜스-블롯 터보 전달 시스템(trans-blot turbo transfer system)(BioRad)을 사용하여 즉석용 PVDF 막 내로 블롯팅하였다. 이후에, 막을 α-AAV2-Rep(Progen, 독일)와 함께 항온처리한 후, 서양 고추냉이 퍼옥시다제(horseradish peroxidase)(HRP)(Sigma-Aldrich)에 커플링된 2차 항체와 함께 항온처리하였다. 결합된 항체를 ECL 검출 시스템(Thermo Pierce)으로 검출하고 케미독 영상화기(Chemidoc imager)(BioRad)를 통해 영상화하였다. VP 단백질 영상화를 위해, 정제된 AAV 입자의 단백질 조성물을 mini-protean stain-free® 프로캐스트(precast) 4 내지 12% 비스-트리스 폴리아크릴아미드 겔(BioRad) 상에서 전기영동으로 측정하였다. 이후에, 겔을 케이독 영상화기로 넣고 영상을 영상 랩 소프트웨어(image lab software)(BioRad)로 분석하였다.
시험관 내 효능
Huh7 세포를 상이한 MOI(GC/세포)에서 전이유전자로서 분비된 나노-루시퍼라제를 발현하는 AAV 변이체로 형질감염시켰다. 야생형 아데노바이러스(MOI 30)를 사용한 공-감염을 수행하여 제2의 가닥 합성을 자극시켰다. 감염 출발 후 48시간 째에, 분비된 나노-루시퍼라제 발현을 상층액 속에서 검정 키트 및 1초의 통합 시간으로 글로막스 발광기(Glomax luminometer)(Promega)를 사용하여 상층액 속에서 측정하였다.
게놈성 AAV DNA를 사용한 포름알데하이드 겔 전기영동
게놈성 AAV DNA를 정제된 AAV 배치로부터 PCR 정제 뉴클레오스핀 키트(Nucleospin kit)(Machery Nagel)를 사용하여 분리하였다. 전기영동 전에, 500 ng의 AAV 게놈 DNA를 10분 동안 95℃에서 포름알데하이드 로딩 완충제(1ml 20x MOPS, 3.6ml 37% 포름알데하이드, 2ml의 67% 슈크로스 중 5mg/ml 오렌지(Orange) G, MQ를 사용하여 10ml 까지) 속에서 변성시키고 즉시 빙상에 두었다. 다음에, 샘플을 6.6% 포름알데하이드가 보충된 1x MOPS 완충제(40mM MOPS, 10 mM NaAc, 1mM EDTA, pH=8.0) 속에 제조된 1% 아가로스 겔 위에서 이동시켰다. 이후에, 샘플을 2시간 동안 100 볼트에서 6.6% 포름알데하이드 이동 완충제가 보충된 1x MOPS 완충제 속에서 이동시켰다. 이동 후, DNA를 SYBR Gold(Thermofisher)로 염색시키고 밴드를 Chemidoc 터치 영상화기(touch imager)(Biorad)로 가시화하였다.
가상적인 총:전체 비 측정
생산에 대한 가상적인 총 대 전체 비(total to full ratio)(T/F)를 조립된 캡시드의 총 양을 각각의 AVB 정제된 AAV 물질의 GC 양(qPCR로 측정)으로 나누어 계산하였다. 총 캡시드 또는 총 입자를 측정하기 위하여, ELISA 또는 HPLC 기반 분석을 수행하였다. AAV 역가 ELISA 키트(Progen, 독일)를 사용하여 총 비리온을 정량하고 AAV5의 빈 캡시드를 조립하였다. 포획-항체는 조립되지 않거나 개개 캡시드 VP 단백질 상에 존재하지 않는 구조적 에피토프를 검출한다. AVB 정제된 AAV 물질을 키트 검정 완충제 속에서 1000 내지 2000배로 희석하였다. 실험은 키트 프로토콜에 따라 수행하였다.
크기 배제 크로마토그래피를 또한 사용하여 총 AAV5 입자 함량을 측정하였다. 당해 방법은 BioBasic SEC-1000 컬럼을 사용하는 HPLC 시스템을 사용하며, 이는 AAV와 같은 보다 큰 입자를 분리하기 위한 이의 능력에 대해 선택된다. AAV 입자를 214 nm의 흡광도에서 측정한다. 공지된 총 입자 함량(초기 참고 표준에 대해 입증됨)을 지닌 AAV5-기반 생성물인, 작업 표준(working standard; WS)을 사용하여 교정곡선(총 입자 농도 대 피크 면??)을 생성하였다. 피크를 통합하고 케미스테이션-소프트웨어(Chemstation-software)를 사용하여 정량화하였다. AAV5 샘플을 당해 교정 곡선에 대해 정량화한다.
잔류 바큘로바이러스 DNA 정량화
잔류 바큘로바이러스 DNA는 AAV 약물 기질- 및 약물 생성물 제제 속에 공던-관련 불순물소서 존재한다. 잔류 바큘로바이러스 DNA 수준은 qPCR로 바큘로바이러스 게놈 내 대표적인 영역(HR3 인핸서 영역에 근접함)에 대해 특이적인 프라이머 세트를 사용하여 qPCR로 평가한다.
AAV2 Rep의 유도성 발현을 지닌 ExpresSf+ 안정한 세포(iRep Sf+ 세포)의 생성
모든 세포를 지닌 모 ExpresSf+ 세포를 플라스미드 DNA 형질감염 1일 전에 1회 계대배양하였다. 형질감염 일에, 모 세포를 새로이 예비-가온된 Sf-900 II 배지를 사용하여 1.5Х106개의 세포/ml의 밀도로 희석시킨 다음 세포를 씨딩할 때까지 진탕기 항온처리기 속에 다시 두었다. 1 ml의 염수 용액 중 DNA(1 pg dna/세포):리포솜(Cellfectine II) 복합체를 제조하였다. 복합체 형성을 위해 기다리는 동안, 희석된 세포를 취하고 전체 1 ml의 복합체 용적을 세포의 상단에 125 ml의 진탕 플라스크 속에서 서서히 점적함으로써 가한 후 온화하게 스월링(swirling)시켜 균질화하고 28℃, 135 rpm에서, CO2의 부재 하에 진탕 항온처리기 속에서 5시간 항온처리하였다. 5시간 후, 다른 9 ml의 신선한 Sf-900 II 배지를 가하고 형질감염된 세포를 추가로 항온처리하였다. 3일 후, 세포를 원심분리로 회전 침강(spin down)시키고, 오래된 배지는 경사제거로 버리고 신선한 Sf-900 II 배지로 대체하여 전체 세포 펠렛을 5Х105개의 세포/ml의 최종 세포 밀도로 희석하였다. 블라스티시딘 항생제 선택 압력을 세포 현탁액에 25 μg/ml의 말기 농도에서 가하였다. 세포 생존능이 90% 초과에 도달한 후(± 3주 이내), 안정하게 형질감염된 세포를 정상적으로 그러나 블라스티시딘 선택 압력의 연속적인 존재하에 계대배양하였다. 세포 생존능이 >95%이고 2배 시간이 ± 24 내지 26시간 이하가 되자 마자, 세포 혼주물 뱅킹(cell pool banking)을 안정한 세포 혼주물 당 적어도 30개의 동결튜브(cryotube)로 수행한다.
순차적인 배치 반응기(SBR) 연구를 위해 설정된 iRep 안정한 혼주물 예비-배양
iRep 052(iRep) 안정한 혼주물 세포의 예비-배양물(P0-P3)을 진탕 플라스크 속에서 일반적으로 생산하였다. 1.5 L의 신선한 SF900 II 배지(Thermo Fisher Scientific)를 2L 들이의 STR 내로 가하고 28.0℃까지의 온도로 평형화시켰다. 생물반응기의 DO 센서 및 세포 밀도 프로브(Incyte Arc, Hamilton)를 예비-가온 배지로 재-교정하였다. 진탕 플라스크로부터의 P4 예비-배양물을 혼주하고 생존하는 세포 밀도(viable cell density: VCD)에 대해 NucleoCounter NC-100을 사용하여 GEN-SOP-0031 - Operation of BucleoCounter NC-100에 따라 측정하였다. 혼주된 P3 배양물의 계산된 농도 및 추가의 신선한 배지 SF900II 배지(Thermo Fisher Scientific)의 계산된 용적을 2L의 생물반응기(UniVessel® SU, Sartorius)에 0.5e6 VC/mL의 최종의 생존하는 세포 밀도에서 2L의 최종 작업 용적을 사용하여 이전시켰다. 배양을 반응기 용기 주변의 열-매트(thermo-mat)에 의해 유지된 28℃의 온도에서 수행하였다. 압축된 공기를 반응기 속에 분당 5 큐빅 센티미터(cubic centimeters per minute; ccm)의 유동 속도에서 및 분 당 0.30 리터(1pm)의 공기 오버레이(air overlay)로 연속적으로 가스처리하였다. 용존 산소 농도 및 pH를 온라인으로 빌트-인 전기화학 센서 인터페이스(built-in electrochemical sensor interface)로 측정하였다. 반응기의 산소 공급을 교반기의 캐스케이드 제어와 함께 반응기에 가스처리 산소의 캐스케이드 제어에 의해 30% 포화도의 용존 산소에서 유지시켰다(표 2). 온도 및 산소 제어기에 대해 2L 생물반응기의 비례적, 통합적 및 유도적(PID) 설정의 획득을 (표 3)에 나타내었다. 배양물의 세포 밀도는 온-라인으로 배양 동안 세포 밀도 프로브로 측정하였다.
48 내지 72 시간 배양 후 및 P4 예비배양의 VCD에 따라, 예비-배양물 P4의 계산된 용적을 생물반응기의 바닥으로부터 빼내고, 신선한 SF900± 배지(Thermo Fisher Scientific)의 계산된 용적을 2L의 최종 작업 용적에서 0.5e6 VC/mL의 최종 생존 세포 밀도까지 폐수 펌프에 의해 생물반응기에 후속적으로 가하였다. SBR의 이러한 충전 및 배수 주기를 9까지의 계대배양 수의 세포 배양까지 반복하였다.
[표 2]
[표 3]
결과
실시예 1: 유도성 플라스미드 벡터 내 대안의 레이트(late) 바큘로바리러스 p10 프로모터의 사용은 재조합 바큘로바이러스 내에서 polH 프로모터의 혼입에 의해 유발된 시스:트랜스 경쟁을 개선(ameliorating)시킨다.
재조합 프로모터로서 레이트 프로모터, 특히 polH(서열 번호: 25)의 사용은 BEV 시스템 내에서 재조합 유전자의 발현을 조절하기 위한 보존적 전략이 되었다. 따라서, 동일한 전략이 또한 일반적으로 사용되며 AAV 생산을 위해 BEV 시스템(Urabe, M. et al., 2002)을 사용하여 최적화하였다. 유사한 전략을 또한 첫번째의 안정하고 유도성인 AAV 패키징 세포의 생성시 시행하였다(Aslanidi, G., et al., 2009, 상기 참고). 이러한 안정한 세포를 생성하기 위해, hr2.09 및 레이트 polH 프로모터에 의해 조절된 AAV 단일-카세트 Rep 및 Cap 발현 플라스미드를 사용하여 숙주 곤충 세포 게놈 내로 안정하게 통합시켰다. 흥미롭게도, 문헌(Wu et al. (상기 참고)은 AAV Cap 발현을 패키징 숙주 세포 대신에 재조합 바큘로바이러스에 의해 구동되도록 함으로써 유연성이 증가된 AAV 패키징 세포의 차세대 생성을 최근 입증하였다(Wu, Y. et al. 2019). 그럼에도 불구하고, 재조합 바큘로바이러스 게놈 내 보존적인 레이트 프로모터, 특히 polH의 사용이 전사활성화 동안 통합된 발현 플라스미드 내 동일한 프로모터와 상호작용하거나 심지어 방해하는지의 여부는 명확하지 않다. 이를 설명하기 위해, 유도성 발현 플라스미드 벡터(pCLD 002)(서열 번호: 05)를 약독화된(attenuated) ACG 출발 코돈을 지닌 전체-길이의 AAV2 Rep와 조합된 상부 hr2.09 인핸서를 사용하여 설계하였다(서열 번호: 18)(Hermens, W. T. J. M. C., et al., 2009). 이러한 pCLD 002를 ExpresSf+ 세포 내로 일시적으로 형질감염시킨 다음(도 1a) 상이한 재조합 바큘로바이러스의 접종을 통해 트랜스활성화시켰다. 흥미롭게도, AAV2 Rep78의 발현은 트랜스활성화를 Bac Trans를 사용하여 수행한 경우에만 관찰될 수 있었다(도 1b). 다른 바큘로바이러스, Bac polH Cap 및 Bac polH Cap Trans 둘 다는, AAV2 Rep52의 발현 만을 유도하였고, 이는 Rep78 및 Rep52의 발현이 단일의 AAV Rep 카세트 설계 내에서 상이하게 조절됨을 제시한다. 이러한 발견을 확인하기 위하여, 나노-루시퍼라제 리포터 작제물을 보존적 레이트 프로모터(polH 또는 p10(서열 번호: 22))와 조합된 상부 hr2.09 인핸서를 사용하여 설계하고, 이미 기술한 바와 유사한 실험을 수행하였다(도 1a). 이러한 접근법을 사용하여, 본 발명자는 재조합 보존적 레이트 프로모터의 존재(Bac polH Cap Trans) 또는 부재(Bac Trans) 하에서, 상이한 재조합 바큘로바이러스의 접종에 의한 트랜스활성화시 리포터 유도 프로파일을 우추하였다(도 1a). 재조합 바큘로바이러스 사이에 감염성에서 차이가 없었음을 입증하기 위하여, 천연의 AAV2 프로모터(p5, p19, 및 p40)를 또한 시험하였다. 샘플을 Bac Trans 또는 Bac polH Cap Trans(도 1c, 사각형 대 삼각형)로 접종한 경우 3개의 AAV 프로모터의 유도 프로파일에서 유의적인 차이가 관찰되지 않았으며, 이는 이러한 재조합 바큘로바이러스 사이에서 유사한 감염성이 있었음을 나타낸다. 흥미롭게도, 본 발명자는 나노-루시퍼라제를 감염 후 24시간으로서 조기에, polH 및 p10으로 조절한 경우 Bac Trans 트랜스활성화시 리포터의 보다 강력한 유도를 주목하였다. 동일한 시점에서, Bac polH Cap Trans에 의한 트랜스활성화는 Bac Trans와 비교하여 ±10(polH) 및 ±5-배(p10) 더 낮은 리포터 유전자 발현을 입증하였다. 보다 늦은 시점에, Bac polH Cap Trans 또는 Bac Trans 사이의 유도에서의 차이는 거의 없게 되었다. 더욱이, p10 프로모터 리포터는 Bac polH Cap Trans 트랜스활성화시 polH와 비교하여 약간 보다 더 강력한 상향조절(±2배)을 나타내었다(도 1c). pCLD 002 및 리포터 작제물 연구로부터의 결과는 발현 플라스미드 벡터 내 polH 프로모터와 트랜스활성화 동안 재조합 바큘로바이러스 사이에, 상호작용 또는 경쟁이 존재함을 나타낸다. 놀랍게도, 발현 플라스미드 벡터 내 대안의 레이트 p10 프로모터의 삽입은 트랜스활성화 경쟁을 개선시킬 수 있다.
실시예 2: 대안적인 바큘로바이러스 hr 인핸서의 사용은 기본 유전자 발현을 감소시키고 바큘로바이러스 트랜스활성화가능한 플라스미드 벡터 내 강력한 조절을 전달한다.
다양한 바큘로바이러스 hr 서열은 전사 인핸서 활성을 지닌 것으로 입증되었다(Bleckmann, M. et al. 2016; Rodems, S. M. & Friesen, P. D., 1993; Venkaiah, B., et al., 2004). 다양한 바큘로바이러스 프로모터와 함께, 이러한 hr 기능을 탐구하여 곤충 세포 내에서 재조합 발현 플라스미드를 생성하였다. 유사한 전략을 또한 사용하여 바큘로바이러스 트랜스활성화가능한 AAV 유전자 발현 플라스미드 벡터를 생성하였다. 보다 정밀하도록 하기 위한 hr2, 또는 hr2.09의 사용은 재조합 바큘로바이러스를 사용한 트랜스활성화 시 플라스미드 벡터로부터 AAV Rep 및 Cap 발현 둘 다를 강력하게 향상시키는 것으로 밝혀졌다(Aslanidi, G., et al., 2009, supra). 유전자 발현의 총 상실을 트랜스활성화에 대한 이의 존재의 필요성을 나타내는 hr 서열의 부재하에서 관찰하였다. hr 내에서 IE-1 DNA 결합 부위 서열(CNNGTAGAATTCTACNNG)의 존재는 이의 인핸서 기능에 관여하는 것이 알려져 있다(Olson, V. A., et al., 2003). 본 실시예에서, hr2/hr2.09(7x IE-1 DNA 결합 부위를 가짐) 및 참고 프로모터로서 polH와 조합된 다른 것(즉, hr1 [서열 번호: 26], hr3 [서열 번호: 27], hr4b [4x IE-1 DNA 결합 부위, 서열 번호: 19] 및 hr5 [6x IE-1 DNA 결합 부위, 서열 번호: 20])의 인핸서 능력을 상이한 재조합 바큘로바이러스를 사용한 트랜스활성화시 나노-루시퍼라제 리포터 작제물을 사용하여 프로파일링하였다(도 1a & 2a). 이러한 hr 인핸서는 IE-1 DNA 결합 부위의 간헐적인 존재에도 불구하고, 서로 각각의 것들 중에서 유의적인 뉴클레오타이드 차이를 갖는다(도 2b). 본 발명자는 모든 hr 서열이, 활성도의 차이에도 불구하고, 이의 방향성(directionality)에 상관없이, 바큘로바이러스를 사용한 트랜스활성화시 프로모터 활성를 향상시켰다는 것을 알 수 있었다(도 2c). 흥미롭게도, 8 IE-1 DNA 결합 부위를 갖도록 가공된 합성 hr은 hr3과 함께 7개 부위 만을 갖는 hr2.09 이상으로 프로모터 발현을 향상시키는데 실패하였다. 이는 앞서 추정한 바와 같이 결합 부위의 양이 인핸서 강도와 관련되지 않음을 입증한다(Aslanidi et al., 2009, supra). 이러한 실험을 통해, hr2.09는 최고의 향상 기능을 나타내고, 이후에 극소수의 i3-1 결합 성분을 지닌 하나의 가장짧은 hr 서열인, hr4b임이 여전히 관찰되었다.(도 2b 및 13). 그러나, 리키 발현의 일부 정도가 또한 다른 hr 서열과 비교하여 모의(mock) 처리된 hr2.09 샘플로부터 관찰될 수 있었다(도 2c 및 d). hr2.09에 대해 관찰된 이러한 리키 발현은, 이를 매우 독성인, 단백질, 예를 들면 AAV Rep를 조절하는데 사용하는 경우 특히 쟁점을 가질 수 있다. AAV Rep 발현에서 이러한 명백한 hr 인핸서를 비교하기 위하여, 몇가지 플라스미드 벡터(pCLDs)를 제조하고 바큘로바이러스 트랜스활성화시 발현 조절에 대해 시험하였다(도 1a 및 2e). 실제로, 웨스턴 블롯 결과로부터(도 2f), 모든 hr 인핸서를 사용하여 AAV2 Rep 상향조절에서 polH 기능을 향상시킬 수 있었다. 흥미롭게도, hr2.09 > hr4b > hr5의 명백한 발현 강도는 AAV2 Rep78에서만 유의적으로 관찰될 수 있었지만 보다 작은 Rep52 발현에서는 관찰될 수 없었다. 이는 단일의 AAV Rep 카세트 내 명백한 조절 시스템의 존재를 나타내며, 여기서 천연의 내인성 AAV p19 프로모터는 임의의 hr의 존재하에서 기능적이고 바큘로바이러스 첨가에 상관없이 유도성이다. 루시퍼라제 활성을 측정하는 경우 관찰되었던, hr2.09의 리키 발현은 루시퍼라제 활성을 측정하는 경우 관찰괴었지만, 웨스턴 블롯에 의해서는 관찰되지 않았고, 나노-루시퍼라제 리포터 검정과 비교하여 이러한 방법을 사용한 민감성으로서 이미 유의적으로 약독화된 ACG-Rep78 버젼의 사용은 올바른 관철 결과를 생성하기 위한 주요 쟁점일 수 있었다. 따라서, 대안의 hr 인핸서, 특히 비교적 보다 더 약한 hr, 예를 들면, hr4b 및 hr5의 사용은 hr2.09를 사용한 유도성 AAV 유전자 발현 플라스미드 벡터의 리키 발현 쟁점을 극복하는데 사용될 수 있다.
실시예 3: 비-리키 hr 인핸서, 레이트 프로모터 p10, 및 강력한 ATG 출발 코돈의 사용은 재조합 polH 프로모터를 지닌 바큘로바이러스에 의해 유도성인 최적의 단일-카세트 Rep 설계를 전달한다.
앞서의 실시예에 나타낸 바와 같이, 약독화된 ACG 출발 코돈과 함께 polH 프로모터의 사용은 Bac Trans를 사용한 트랜스활성화시 외견상으로 정상의 Rep 발현 비(낮은 Rep78 및 높은 Rep52)를 가져올 수 있다(Urabe et al., 2006; Hermens et al., 2007). 그러나, 유도를 위해 Bac polH Cap Trans를 사용하는 경우 비교적 보다 약한 트랜스활성화 프로파일이 i) 사용된 2개의 polH 프로모터 사이의 시스:트랜스 프로모터 경쟁(Bac polH Cap Trans에서 Cap에 대해 및 발현 플라스미드에서 Rep에 대해) 및 ii) 비-리키이지만 비교적 보다 약한 hr, 예를 들면, hr4b의 채택으로 인해 관찰된다. Bac polH Cap Trans의 사용과 여전히 상용성인 비-리키 발현 플랫폼을 생성하기 위하여, hr4b 인핸서를 p10 프로모터와 조합하여 강력한 야생형 ATG 출발 코돈을 지닌 단일-카세트 AAV2 Rep를 조절하였다(도 3a 및 9)(서열 번호: 06, 서열 번호: 17). 재조합 바큘로바이러스 접종에 의한 트랜스활성화 동안 시스:트랜스 프로모터 경쟁의 감소를 비교하고 확인하기 위하여, 보존적 polH 프로모터를 지닌 플라스미드 벡터를 생성시켜다(도 3a, pCLD 047)(서열 번호: 07). 이러한 발현 플라스미드를 형질감염시키고 앞서의 실험 설계에 따라 트랜스활성화시켰다(도 1a). pCLD 015(서열 번호: 08) 웨스턴 블롯 결과로 부터 알 수 있는 바와 같이, p10 및 내인성 AAV p19 프로모터 둘 다는 이의 트랜스활성화 동안 hr 인핸서의 존재를 필요로 함이 밝혀졌다. Bac Trans 트랜스활성화와 함께 이러한 작제물(pCLD 046 및 047 둘 다)의 사용은 아마도 강한 ATG 출발 코돈의 채택으로 인하여, 준최적 AAV Rep 발현 비(너무 높은 Rep78)를 생성하였다. 그러나, Bac polH Cap Trans 트랜스활성화 시, Rep78의 적절한 발현 및 전체 Rep 비는 p10 프로모터를 사용하여 도달할 수 있지만, polH를 사용하여서는 도달되지 않는다. 흥미롭게도, 트랜스활성화에 사용된 바큘로바이러스에 상관없이 Rep52의 발현에서 차이가 없었고, 이는 앞서 보고된 결과와 일치하게 단일-카세트 AAV Rep 내 상부 프로모터 대 내인성 AAV p19 프로모터 사이의 명백한 조절을 입증한다(도 1b).
실시예 4: 분할-카세트 AAV Rep 설계를 유도적으로 조절하기 위한 대안의 바큘로바이러스 프로모터와 함께 비-리키 hr 인핸서의 사용
앞서의 실시예에 나타낸 바와 같이, 바큘로바이러스 게놈(즉, Bac polH Cap Trans) 내 재조합 프로모터의 사용은 시스:트랜스 프로모터 경쟁으로 인하여 리포터 유전자의 상이한 발현 프로파일을 유발한다. 이는 특히 2개의 polH 프로모터의 사용을 내포하므로, 유도성 발현 플라스미드에 대한 AAV2 분할 Rep-카세트를 채택하는 경우에, 문제가 될 수 있다. BEV 분할-카세트 Rep(Bac Rep183) 내에서, Rep78 및 Rep52의 발현은 절두된 이미디어트 얼리 IE-1 프로모터(△IE-1) 및 레이트 polH 프로모터 각각의 조절 하에 속한다(Urabe, M. et al., 2002; Hermens et al., 2007; Hermens et al., 2009). 바큘로바이러스 트랜스활성화가능한 플라스미드 벡터에 대해 이러한 설계를 채택하려는 노력은 아마도 △IE-1 프로모터의 구성적 특성 및 시험한 설계에서 polH 프로모터의 시스:트랜스 경쟁으로 인하여, 성공적이지 않은 결과로 이미 시도되었다(Aslanidi, G., et al., 2009). 분할-카세트 Rep는 이것이 수득될 수 있는 보다 우수한 AAV 품질로 인하여 BEV 플랫폼에서 기본적인 AAV Rep 카세트 설계가 되었다(Urabe, M. et al., 2002; Hermens, W. T. J. M. C., 2009). 분할-카세트 Rep의 우수성은 아마도 가능한 발현 강도 및 이러한 설계가 제공하는 일시적인 제어에 기인한다. 대조적으로, 단일-카세트 Rep 설계는 보다 강직하고 트랜스활성화시 작은 Rep52의 발현은 감염 동안 이른 시점으로 이의 일시적인 발현을 제한하는 내인성 AAV p19 프로모터(도 2e & 3b)에 의해 편향적으로 조절되는 것으로 알려져 있다(도 1c). 더욱이, 프로모터 리포터 연구를 검토할 때(도 1c), AAV p19 프로모터는 장기간 이동시, 숙주 세포에 대해 독성이 되는 Rep52의 구성적인 낮은 발현을 야기하는 비교적 리키한 것으로 밝혀졌다. 이는 거의 리키하지 않은 hr 인핸서의 채택에도 불구하고 거의 이상적이지 않은 단일-카세트 Rep 플라스미드 벡터를 제조할 수 있다.
본 연구에서, △IE-1 프로모터의 구성적 발현 프로파일의 챌린지를 극복하기 위하여, 지연된 얼리 39k 프로모터(서열 번호: 21)(Dong, Z. Q. et al., 2018; Lin, C. H. & Jarvis, D. L., 2013)를 Rep78 발현을 조절하기 위한 대안으로서 사용하였다. 39k 프로모터의 발현 프로파일은 바튤로바이러스 트랜스활성화 후 3 내지 6시간 째로 조기에 활성인 것으로 관찰되어, 이는 △IE-1 일시적인 모사체로서 사용될 매력적인 대안이 되도록 하였다(도 4a). 그럼에도 불구하고, 39k 프로모터 조절로부터 발현 강도는 특히 보다 늦은 시점에서 △IE-1와 비교하여 비교적 더 높았고(도 4a), 본 발명자는 다른 루시퍼라제 리포터 검정을 수행하여(도 4b) △IE-1-조절된 발현 수준을 모사하기 위한 39k-조절된 유전자 발현에 대한 준최적 출발 코돈을 사용하는 것과 같은 대안에 대해 스크리닝하였다. 도 4c로부터 알 수 있는 바와 같이, ATG 출발 코돈을 준최적 ACG 코돈으로 대체하는 것은 △IE-1와 비교적 유사한 수준까지의 39k 프로모터 강도를 조율 강하할 수 있다. 이러한 준최적 ACG 코돈을 사용하여, 나타낸 pCLD를 설계하여(도 4d) 전체 길이의 AAV2 Rep에서 39k 프로모터 - ACG 조합의 강도 및 발현 프로파일을 시험하였다. 나타낸 바큘로바이러스 트랜스활성화시(도 4d), AAV2 Rep78의 발현은 hr2.09가 여전히 존재하는 pCLD 020(서열 번호: 09)에 대해서만 검출될 수 있었고, 이는 39k 프로모터가 여전히 hr 인핸서 의존성 프로모터임을 나타낸다. 그러나, Rep78의 발현 수준은 여전히 너무 높고 Rep78:Rep52 사이의 비는 이상(ideal)과는 떨어져 있다. 비교적 강한 hr2.09의 혼입은 관찰된 결과를 유발하는 것으로 예측되었다.
이를 피하기 위하여, Rep78의 발현 카세트는 인핸서를 비교적 보다 약한, hr4b로 변화시켜 개선시킨 반면, Rep52는 이를 앞서 나타낸 바와 같이(Chen, 2008) 인공 인트론 내부의 추가의 강력한 레이트 프로모터로 조절함으로써 향상시켰다. polH 프로모터와 최소 시스-트랜스 경쟁을 지닌 수개의 레이트 프로모터를 시험한다(도 4e). 흥미롭게도, 강력한 hr2.09 인핸서의 존재에도 불구하고, 인트론성 프로모터로서 polH를 놓는 것은 Bac polH Cap Trans로 트랜스활성화하는 경우 Rep52 발현을 개시하는데 실패하였다. Rep52 발현은 인트론성 프로모터를 p10 또는 p6.9로 대체함으로써만 복구될 수 있었다(도 4e). 이러한 결과는 특정의 바큘로바이러스 프로모터 사이의 시스-트랜스 프로모터 경쟁의 존재 및 프로모터 스위칭이 이러한 쟁점을 약화시킬 수 있었음을 확인한다. 그러나, Rep52의 수준은 보다 약한 hr4b 인핸서의 공유된 사용으로 인해 아마도 유발된 바와 같이 비교적 약하게 남아있다.
이를 다루기 위하여, 수개의 분할-카세트(split-cassette) AAV2 Rep 작제물(pCLD 050 - 054, 도 12)(서열 번호: 10 내지 14)을 설계하고 대안의 보다 약하고 여전히 비-리키한 hr 인핸서를 혼입함으로써 클로닝하여 Rep78 발현을 추가로 감소시켰다. 인핸서 활성은 양방향인 것으로 알려져 있으므로(도 2c), 본 발명자는 단일 hr4b의 능력을 시험하고 이를 hr4b-hr5 조합과 비교하였다(도 5b). 최종적으로, 바큘로바이러스 레이트 프로모터의 조절 하에서 코돈 최적화된 Rep52 유전자의 다른 카피(서열 번호: 15)(도 5a 및 11)를 시스로(in cis)로 가하여 Rep52 발현을 강화하였다(도 5b). 수개의 비-보존적 바큘로바이러스 레이트 프로모터, 예를 들면, p6.9(서열 번호: 23), 및 pSel120(서열 번호: 24)(Lin, C. H. & Jarvis, D. L., 2013; Martinez-Solis, M., et al., 2016)의 발현 역학 및 강도를, 바큘로바이러스 트랜스활성화시 루시퍼라제 리포터 검정을 사용하여 프로파일링하여 Rep52의 예외적인 카피를 조절하는 레이트 프로모터로서 이의 불능을 관찰하였다. 흥미롭게도, 모든 이러한 비-보존적 바큘로바이러스 프로모터는 거의 유사한 효능으로 Bac Trans 및 Bac polH Cap Trans에 의해 트랜스활성화될 수 있다(도 4a). 최대 차이는 48 h.p.i.에서 대략 ±4배 더 낮은 효능에서 p6.9 프로모터의 Bac polH Cap Trans 트랜스활성화를 사용하여서만 관찰될 수 있었고, 이는 보다 이른 p10 프로모터보다 여전히 보다 더 강력하였다(도 4a 및 1c). Bac polH Cap Trans를 사용한 pSel120의 트랜스활성화는 매우 늦은 시점(71 h.p.i)에서 최고의 발현을 갖는 것으로 밝혀졌다. 시스-트랜스-경쟁이 없는/-거의 없는 프로모터(p10, p6.9, 또는 pSel120)의 혼입은 유도성 분할-Rep 카세트의 대안을 수개 설계하는 것이 가능할 수 있다(도 5b). 이러한 작제물을 시험하기 위하여, 이러한 신규 플라스미드(pCLD 050 내지 054) 각각을 형질감염시키고, 나타낸 바큘로바이러스 트랜스활성화시 AAV2 Rep 발현을 웨스턴 블롯으로 측정하였다(도 5c). 예측한 바와 같이, 39k 프로모터의 사용은 hr 인핸서 및/또는 재조합 바큘로바이러스의 선택과는 상관없이 유동성 Rep78 발현을 야기하였다(도 5c). 모든 이러한 작제물로부터의 Rep52가 레이트 프로모터와는 상관없이 임의의 바큘로바이러스에 의해 트랜스활성화될 수 있지만, 명백한 일반적인 발현 강도가 Bac Trans와 polH Cap Trans 사이에서(도 5c), 특히 도 1b 및 3b에 나타낸 앞서의 결과와 일치하는 p10 조절된 작제물(pCLD 052)의 경우 관찰될 수 있었다. 대안의 레이트 p6.9 및 pSel120 프로모터의 사용은 Bac polH Cap Trans에 의한 Rep52 트랜스활성화시 시스:트랜스 프로모터 경쟁 쟁점을 추가로 개선시킬 수 있었다. 전반적으로, 이러한 결과는 정확한 시점 및 강도 둘 다에서 AAV 유전자의 발현을 위한 유도성 AAV 분할 Rep 설계 내에서 대안의 바큘로바이러스 프로모터의 잠재적인 사용을 나타내었다. 추가로, 나타낸 실시예는 발현 플라스미드와 동일한 프로모터를 지닌 재조합 바큘로바이러스에 의한 트랜스활성화 동안 관찰된 시스:트랜스 프로모터 경쟁에 대한 가능한 해결책을 제공한다.
실시예 5: 재조합 polH 프로모터를 지닌 바큘로바이러스의 단일 접종과 함께 신규의 유도성 분할-Rep 카세트는 고 품질 AAV 입자를 생산하기 위해 사용될 수 있다
신규한 유도성 플라스미드 벡터, pCLD 046 및 pCLD 050 내지 054가 완전한 AAV 입자를 생산하는데 사용될 수 있는지의 여부를 관찰하기 위해, 작은 일시적인 AAV 생산 실험을 ExpresSf+ 세포 내에서 수행하였다(도 6a). 상이한 AAV Cap 혈청형 및 전이유전자를 암호화하는 상이한 Bac polH Cap Trans 바이러스를 트랜스활성화제로서 사용하였다(도 6a에 나타냄). 벤치마크로서, pCLD 011을 문헌(Aslanidi et al. (상기 참고)) 설계에 따라 제조하였다(도 4a, pCLD 011 (서열 번호: 16)). 이러한 작제물은 Bac Cap Trans 설계와 양립성인 것으로 보고되었지만, 리키하지만 강력한 hr2.09 인핸서가 여전히 존재한다(Wu, Y., et al., 2019). 전반적으로, 유도성 단일(pCLD 046) 및 분할-카세트 Rep(pCLD 050 내지 054) 플라스미드 벡터 둘 다를 사용한 일시적인 AAV 생산은 조 분해물 완충제(crude lysate buffer; CLB) 속에서 ±5 x 1010 GC/ml의 평균 게놈 카피(GC) 역가를 지닌 수개의 생산 배치로부터 DNase-내성 AAV 임자의 유의적인 배출량을 일관되게 수득하였다. 이러한 역가는 벤치마크 작제물, pCLD 011의 역가와 동등하였다(도 6b 및 c). 흥미롭게도, AAV Rep의 발현 프로파일, 특히 Rep78의 일시적인 발현은 벤치마크 pCLD 011 사이에서 상이하였다(도 6d 및 e).
AAV 입자의 품질 매개변수를 관찰하기 위하여, 작은 생산으로부터의 물질을 사용하여 ABV 정제를 수행하고(도 4d) 분석하였다. 흥미롭게도, 정제된 AAV 물질로부터 캡시드 비(VP1:2:3 비)는 또한 서로 비교가능하였다(도 7a). 최종적으로, 표적 세포(Huh7)를 형질도입시키기 위한 AAV 입자의 효능을 분할-카세트 AAV Rep(Bac Rep183)을 지닌 BEV를 사용하여 나타낸 프로토콜(도 7b)에 따라 생산된 AAV 입자에 대해 비교하였다. 이러한 결과로부터, 다른 소스 AAV 입자 중에서 효능 차이가 존재하였음이 관찰될 수 있다(도 7c). 흥미롭게도, 유도성 분할-카세트 Rep 플라스미드 벡터로부터, 특히 pCLD 052 및 053 작제물로부터 생산된 AAV 입자는 단일-Rep 카세트 Rep(pCLD 011 및 046) 유래된 물질보다 더 높은 효능을 나타내었다. 효능은 심지어 거의 풍부하지 않은 BEV 생산된 물질을 사용하여 유사한 수준에 도달할 수 있었다.
AAV 입자 품질에서 이러한 신규한 유도성 플라스미드 벡터의 영향을 추가로 연구하기 위하여, 가장 우수한 효능 검정 결과를 지닌 AAV 입자에서의 AAV 벡터 DNA 분석을 포름아데하이드 아가로스 겔 분석을 사용하여 수행하였다. 특히 분할-Rep 카세트를 사용하여 생산된, BEV 유래된 AAV는 아마도 벡터 DNA의 다량체 형태의 높은 패키징 속도로 인하여, 보다 신속한 시작(onset) 및 보다 높은 효능을 나타낸다(Urabe, M., et al., 2006). 이러한 다량체 형태는 유전자 발현 이전에 속도-제한 단일 가닥(rate-limiting single-stranded)(ssDNA)을 dsDNA 형성으로 우회하는 이중 가닥 DNA(dsDNA)를 모사할 수 있다(McCarty, D. M., 2008). 본 연구에서, AAV5 FIX- 및 AAV2/5 나노-루시퍼라제 벡터 게놈의 예측된 크기는 각각 2.5 kb 및 2 kb이다. pCLD 046 또는 단일-카세트-Rep 생산된 AAV 벡터 게놈의 대부분은 도 8a로부터 알 수 있는 바와 같이 단일-가닥 단량체이다. 그러나, 2 또는 2.5-kb 단일-가닥 벡터 게놈 외에, pCLD 052 및 053을 사용하여 생산된 AAV 입자로부터 추출된 DNA는 4.7 kb의 최대 AAV 패키징 능력에서 정확하게 컷-오프 크기(cut-off size)를 지닌 추가의 단량체성 게놈을 함유하였다(도 8a). 이러한 결과는 pCLD 052 및 053이 다량체성 벡턱 게놈의 패키징시 분할-카세트 Rep를 지닌 BEV의 성능을 정확하게 모사할 수 있고, 이는 시험관 내 효능 검정 결과와 관련되어 있음을 추가로 입증하였다. 최종적으로, 단일-Rep 카세트에 걸쳐 분할 Rep-카세트의 우수성을 입증하기 위하여, 본 발명자는 나타낸 pCLD를 사용하여 생산된 정제된 AAV 물질에서 헤드 대 헤드 가상(head to head hypothetical) T/F 비교를 수행하였다(도 8b). 여기서, 본 발명자는 분할-Rep 카세트 설계가 또한 보다 낮은 T/F 값을 지닌 AAV를 생산하는 경향을 가짐을 알 수 있었고, 이는 전체 입자의 보다 높은 함량 및 설계(pCLD 052 및 053)의 우수성을 나타낸다.
일반적으로, 시스:트랜스 경쟁이 거의 없는 대안의 바큘로바이러스 프로모터(39k, p10, p6.9, 및 pSel120)와 함께 대안의 및 비-리키 hr 인핸서의 조합을 실행하여 Bac polH Cap Trans로 트랜스활성화시킬 수 있는 신규한 유도성 분할-Rep 카세트 플라스미드 벡터를 생성시킬 수 있다. 이러한 벡터, 특히, pCLD 052 및 053은 차세대의 안정한 패키징 곤충 세포주를 생성하는데 매우 유용하다.
실시예 6: 신규한 안정한 rAAV 패키징 세포의 생성
본 발명자가 AAV를 생산하기 위해 단일 바큘로바이러스 접종 만을 요구할 수 있는 안정한 세포주/혼주물을 생성할 수 있는지를 알기 위하여, 본 발명자는 물질 및 방법 단락에서 상세한 단계 또는 도 9a의 너트쉘(nutshell)에서 알 수 있는 바와 같이 일시적인 형질감염 연구(pCLD 046, 052, 및 053)에서 사용된 선택된 유도성 AAV-Rep 플라스미들을 사용한 안정한 세포주 생성을 수행하였다. 생성된 신규 세포주는 다음에 곤충 유도성 Rep 세포주 또는 iRep 세포주(iRep 046, iRep 052, 및 iRep 053)로 불릴 수 있다. AAV가 안정한 iRep 세포주로부터 생산될 수 있는지를 시험하기 위하여, 세포를 야생형 ExpresSf+ 세포와 유사하게 일반적으로 확장시키고, Bac polH Cap Trans(Bac Cap5 FIX 또는 Bac Cap2/5 sNano-Luc)로 감염시키고 CLB를 수거하여 DNase-내성 AAV 입자 GC 농도를 측정하였다. 관측될 수 있는 바와 같이, iRep 세포주는, 유도성 Rep 설계와 상관없이, AAV의 유형에 의존하여 세포당 ±1 x 1011개의 GC/ml 역가에 이르거나 1 x 105개의 GC 생산성 보다 더 높은 비교적 풍부한 AAV 입자를 생산할 수 있었다(도 9b). 흥미롭게도 안정한 iRep 세포주로부터 AAV Rep 발현 프로파일은 또한 일시적인 형질감염 결과로부터 알 수 있는 프로파일과 일치하였다(도 6e 및 9c). AAV 입자 기능성 및 품빌을 추가로 점검하기 위하여, AVB 정제를 수행하고 분석하였다. 흥미롭게도, 일시적인 형질감염 결과와 유사하게, 정제된 대표적인 AAV2/5 물질로부터의 캡시드 비(VP1:2:3 비)는 각각의 다른 것과 비교가능하였다(도 10a). 최종적으로, 표적 세포(Huh7)를 형질도입하는 AAV 입자의 효능을 분할-카세트 AAV Rep(Bac Rep183)을 지닌 BEV를 사용하여 나타낸 프로토콜(도 7b)에 따라 생산한 AAV 입자에 대해 비교하였다. 결과로부터, 유사한 편향을 지닌 상이한 소스의 AAV 입자(도 10b) 중에서 효능 차이가 존재하였음의 관찰될 수 있고 이는 일시적인 형질감염 결과를 입증한다(도 7c).
입자 품질을 추가로 분석하기 위하여, 신규한 iRep 세포주로부터 생산된 AVB 정제된 물질(BBNE)을 다른 방법, 예를 들면, 이중 또는 이중 bac 접종 방법과 비교하였다(도 11a). 일시적인 형질감염 결과(도 8a)와 유사하게, 패키지된 AAV DNA의 단량체-이량체 패턴은 iRep 052 및 053 세포주로부터 생산된 물질에서만 관찰될 수 있었지만 bac 접종 접근법과는 상관없이 iRep 046에서는 관찰되지 않았다(도 11b). 그러나, 이론적 T/F 및 바큘로바이러스 게놈 DNA 오염 분석으로부터의 추가의 결과는 캡시드 및 전이유전자를 지닌 bac가 단일 접종된 iRep 052 세포주 만이 AAV 입자를 비교적 탁월한 품질로 가장 일관된 방식으로 생산할 수 있었음을 나타내었다(도 11c 및 d).
실시예 7: 선택된 iRep 052 세포주를 사용한 순차적인 배치 반응기(Sequential batches reactor; SBR) 연구
통합된 Rep 유전자를 지닌 신규한 세포주의 생성을 향한 중간 단계로서, 모 세포주를 AAV Rep 카세트를 수반한, DNA 플라스미드 pCLD-052로 모 세포주의 형질감염에 의해 iRep Express SF+의 폴리클로날 배양물을 생성시킬 필요가 있었다. 이러한 안정한 세포 혼주물 속에서 통합된 Rep 유전자의 안정성 및 발현을 평가하기 위하여, 본 발명자는 순차적인 배치 반응기(sequential batches reactor; SBR) 속에서 세포 배양물을 확장시키고 1L 진탕 플라스크 속에서 상이한 세포 계대배양시 Rep 유전자 발현을 점검하였다. SBR은 충전 및 제거가 생물반응기 속에서 순차적으로 발생하는 반복적인 배치 공정이다. 본 발명자는 진탕 플라스크 속에서 수동의 매일 전달에 걸쳐 SBR 시스템을 사용하여 보다 우수한 재생산성 및 보다 일관된 결과를 제공하는 배양 조건 표준화(예컨대, 산소 공급)을 허용하고, 세포가 생산 조건을 경험할 조건을 모사하였다.
본 발명자는 먼저 1L 진탕 플라스크 속에 세포 해동물(P0)로부터의 안정한 세포 혼주물을 세포 계대배양 3(P3)까지 성장시킨 다음 세포 계대배양 4(P4)로부터 계대배양 9(P9)까지 세포 혼주물을 2L 생물반응기 속에서 SBR 시스템을 통해 계대배양하였다(도 15a). 씨드 트레인 생산(seed train production)은 총 5주가 걸렸다(도 15b). 본 발명자는 AAV Cap 유전자 및 AAV-ITR에 의한 인자 IX(FIX) 전이유전자 플랭크에 대한 발현 카세트를 지닌, 바큘로바이러스 Bac Cap5 FIX를 사용한 형질감염으로 AAV 생산을 위한 계대배양 5, 7, 및 9에서 안정한 혼주물을 사용하였다(도 15a). 계대배양 5, 7, 및 9에서 안정한 혼주물은 500L, 2000L, 및 10000L 이상의 공정에서 씨드 트레인 생산과 동등하다. 이러한 문서의 목적은 2L 공정을 기술하여 iRep Express Sf+ 안정한 세포 혼주물 속에서 통합된 Rep 유전자의 발현 및 안정성을 입증하는 것이며, 여기서, 본 발명자는 또한 Bac Cap5 FIX를 사용한 형질감염 후 72시간째에 여과된 조 분해된 벌크(filtered crude lysed bulk; FCLB)로부터 전이유전자의 게놈 카피를 측정하였다.
폴리클로날(polyclonal) 배양물인 iRep 안정한 혼주물의 안정성을 입증하기 위하여, 본 발명자는 웨스턴 블롯으로 계대배양 5, 7, 및 9에서 배양물의 통합된 Rep 유전자의 발현을 점검하였다(도 15c). iRep 안정한 혼주물 속에서 통합된 Rep 유전자(Rep78 및 Rep52)의 발현은 hr2.09 및 바큘로바이러스 Bac Cap5 FIX의 프로모터에 의해 조절되므로, 본 발명자는 1L 플라스크 속에서 별개로 계대배양 5, 7 및 9에서의 iRep 안정한 혼주물 배양물을 바큘로바이러스 Bac Cap5 FIX(계대배양 5)로 형질감염시켜 iRep 안정한 혼주물 속의 통합된 Rep 유전자의 발현을 활성화시켰다. 세포 분해물 샘플을 진탕 플라스크로부터 바큘로바이러스 Bac Cap5 FIX(P5)의 형질감염 후 48 및 72시간 째에 취하였다. 도 15에 나타낸 바와 같이, 본 발명자는 세포 계대배양 5, 7 및 9에서 iRep 안정한 혼주물 세포 계대배양 속의 Rep78 및 Rep52의 발현을 확인하였고, 여기서 명백한 단백질 생성물 Rep78 및 Rep 52가 세포 분해물의 각각의 단백질 추출물 샘플로부터 관찰되었다(사선 박스, 도 15c). 20세대(계대배양 9) 후, 통합된 Rep 유전자의 발현은 안정하에 남았다. 모든 단백질 추출물로부터, 단백질 Eep52로부터의 면역신호의 강도는 단백질 Rep 72보다 더 높았다. Rep78 및 Rep52의 이러한 발현 비는 정상의 AAV2 Rep 발현 비(낮은 Rep78 및 높은 Rep52)와 상응하였다.
단일 바큘로바이러스 형질감염((UnoBac 플랫폼)을 사용한 iRep 안정한 혼주물의 AAV 생산을 추가로 확인하기 위하여, 본 발명자는 또한 계대배양 5, 7 및 9에서 iRep 안정한 혼주물 세포를 사용한 바큘로바이러스 Bac Cap5 FIX(P5)의 형질감염으로부터 FCLB내 인자 IX(FIX)의 게놈 카피(GC)를 측정하였다(도 15d). FIX는 혈우병의 대체 치료요법에서 사용되었고 바큘로바이러스 Bac Cap5 FIX의 재조합 Cap-Trans-카세트 속에 포함된다. iRep 안정한 혼주물 속에서 통합된 Rep78 및 Rep52의 발현은 Bac Cap5 FIX내에서 Cap-Trans 카세트의 얼리 및 레이트 polH 프로모터 각각에 의해 트랜스활성화된다. Cap 및 전이유전자의 캐스케이드(cascade) 발현으로, 당해 경우 FIX에서, 형질감염 동안, iRep 안정한 혼주물은 AAV2 캡슐화된 FIX를 생서하였다. 도 15d에 나타낸 바와 같이, 모든 FCLB 샘플 속에서 평균 GC 역가는 모두 1e11 GC /mL를 초과하였다. 상이한 계대배양에서 GC 역가(FIX)는 정상 상태로 남았고, 이는 iRep 안정한 혼주물 속의 통합된 Rep 유전자 카세트의 안정성을 입증한다. 이는 또한 UnoBac 시스템에 의한 AAV의 규모확장된(up-scaling) 생산을 위한 iRep 세포주의 사용 가능성을 제공한다.
참고문헌
SEQUENCE LISTING
<110> uniQure biopharma B.V.
<120> Novel Cell Line
<130> P6090147PCT
<150> EP 20167817.4
<151> 2020-04-02
<160> 55
<170> PatentIn version 3.5
<210> 1
<211> 12538
<212> DNA
<213> Artificial Sequence
<220>
<223> Bac Trans
<400> 1
cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg 60
cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggctgcgca actgttggga 120
agggcgatcg gtgcgggcct cttcgctatt acgccaggct gcaggggggg ggggggggtt 180
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 240
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc 300
caactccatc actaggggtt cctcagatct gaattcggta cccgttacat aacttacggt 360
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa tagtaacgcc 420
aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc 480
agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 540
gcccgcctgg cattgtgccc agtacatgac cttatgggac tttcctactt ggcagtacat 600
ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg 660
tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag 720
tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt 780
gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctcgtttagt 840
gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata gaagacaccg 900
ggaccgatcc agcctccgga ctctagagga tccggtactc gataatacga ctcactatag 960
ggagacccaa gcttgatccc ccctcttcct cctcctcaag ggaaagctgc ccacttctag 1020
ctgccctgcc atccccttta aagggcgact tgctcagcgc caaaccgcgg ctccagccct 1080
ctccagcctc cggctcagcc ggctcatcag tcggtcaatt cgcccaccat gctgctgctg 1140
ctgctgctgc tgggcctgag gctacagctc tccctgggca tcatcccagt tgaggaggag 1200
aacccggact tctggaaccg cgaggcagcc gaggccctgg gtgccgccaa gaagctgcag 1260
cctgcacaga cagccgccaa gaacctcatc atcttcctgg gcgatgggat gggggtgtct 1320
acggtgacag ctgccaggat cctaaaaggg cagaagaagg acaaactggg gcctgagata 1380
cccctggcca tggaccgctt cccatatgtg gctctgtcca agacatacaa tgtagacaaa 1440
catgtgccag acagtggagc cacagccacg gcctacctgt gcggggtcaa gggcaacttc 1500
cagaccattg gcttgagtgc agccgcccgc tttaaccagt gcaacacgac acgcggcaac 1560
gaggtcatct ccgtgatgaa tcgggccaag aaagcaggga agtcagtggg agtggtaacc 1620
accacacgag tgcagcacgc ctcgccagcc ggcacctacg cccacacggt gaaccgcaac 1680
tggtactcgg acgccgacgt gcctgcctcg gcccgccagg aggggtgcca ggacatcgct 1740
acgcagctca tctccaacat ggacattgac gtgatcctag gtggaggccg aaagtacatg 1800
tttcgcatgg gaaccccaga ccctgagtac ccagatgact acagccaagg tgggaccagg 1860
ctggacggga agaatctggt gcaggaatgg ctggcgaagc gccagggtgc ccggtatgtg 1920
tggaaccgca ctgagctcat gcaggcttcc ctggacccgt ctgtgaccca tctcatgggt 1980
ctctttgagc ctggagacat gaaatacgag atccaccgag actccacact ggacccctcc 2040
ctgatggaga tgacagaggc tgccctgcgc ctgctgagca ggaacccccg cggcttcttc 2100
ctcttcgtgg agggtggtcg catcgaccat ggtcatcatg aaagcagggc ttaccgggca 2160
ctgactgaga cgatcatgtt cgacgacgcc attgagaggg cgggccagct caccagcgag 2220
gaggacacgc tgagcctcgt cactgccgac cactcccacg tcttctcctt cggaggctac 2280
cccctgcgag ggagctccat cttcgggctg gcccctggca aggcccggga caggaaggcc 2340
tacacggtcc tcctatacgg aaacggtcca ggctatgtgc tcaaggacgg cgcccggccg 2400
gatgttaccg agagcgagag cgggagcccc gagtatcggc agcagtcagc agtgcccctg 2460
gacgaagaga cccacgcagg cgaggacgtg gcggtgttcg cgcgcggccc gcaggcgcac 2520
ctggttcacg gcgtgcagga gcagaccttc atagcgcacg tcatggcctt cgccgcctgc 2580
ctggagccct acaccgcctg cgacctggcg ccccccgccg gcaccaccga cgccgcgcac 2640
ccgggttact ctagagtcgg ggcggccggc cgcttcgagc agacatgata agatacattg 2700
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2760
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt gtccgtgttg 2820
cttggtcttc acctgtgcag aattgcgaac catggattca tcgacggtac cgcgggccct 2880
cgactagagc tcgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt 2940
gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 3000
aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 3060
tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggagagat 3120
ctgaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 3180
aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc tcagtgagcg 3240
agcgagcgcg cagagaggga gtggccaact ccatcactag gggttccccc tgcagcctgc 3300
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 3360
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagggggg taccagatcc 3420
catgggagct ctgcagaatt ctctagaggc ctcgcgagat cttaattaat taagtaccga 3480
ctctgctgaa gaggaggaaa ttctccttga agtttccctg gtgttcaaag taaaggagtt 3540
tgcaccagac gcacctctgt tcactggtcc ggcgtattaa aacacgatac attgttatta 3600
gtacatttat taagcgctag attctgtgcg ttgttgattt acagacaatt gttgtacgta 3660
ttttaataat tcattaaatt tataatcttt agggtggtat gttagagcga aaatcaaatg 3720
attttcagcg tctttatatc tgaatttaaa tattaaatcc tcaatagatt tgtaaaatag 3780
gtttcgatta gtttcaaaca agggttgttt ttccgaaccg atggctggac tatctaatgg 3840
attttcgctc aacgccacaa aacttgccaa atcttgtagc agcaatctag ctttgtcgat 3900
attcgtttgt gttttgtttt gtaataaagg ttcgacgtcg ttcaaaatat tatgcgcttt 3960
tgtatttctt tcatcactgt cgttagtgta caattgactc gacgtaaaca cgttaaataa 4020
agcttggaca tatttaacat cgggcgtgtt agctttatta ggccgattat cgtcgtcgtc 4080
ccaaccctcg tcgttagaag ttgcttccga agacgatttt gccatagcca cacgacgcct 4140
attaattgtg tcggctaaca cgtccgcgat caaatttgta gttgagcttt ttggaattat 4200
ttctgattgc gggcgttttt gggcgggttt caatctaact gtgcccgatt ttaattcaga 4260
caacacgtta gaaagcgatg gtgcaggcgg tggtaacatt tcagacggca aatctactaa 4320
tggcggcggt ggtggagctg atgataaatc taccatcggt ggaggcgcag gcggggctgg 4380
cggcggaggc ggaggcggag gtggtggcgg tgatgcagac ggcggtttag gctcaaatgt 4440
ctctttaggc aacacagtcg gcacctcaac tattgtactg gtttcgggcg ccgtttttgg 4500
tttgaccggt ctgagacgag tgcgattttt ttcgtttcta atagcttcca acaattgttg 4560
tctgtcgtct aaaggtgcag cgggttgagg ttccgtcggc attggtggag cgggcggcaa 4620
ttcagacatc gatggtggtg gtggtggtgg aggcgctgga atgttaggca cgggagaagg 4680
tggtggcggc ggtgccgccg gtataatttg ttctggttta gtttgttcgc gcacgattgt 4740
gggcaccggc gcaggcgccg ctggctgcac aacggaaggt cgtctgcttc gaggcagcgc 4800
ttggggtggt ggcaattcaa tattataatt ggaatacaaa tcgtaaaaat ctgctataag 4860
cattgtaatt tcgctatcgt ttaccgtgcc gatatttaac aaccgctcaa tgtaagcaat 4920
tgtattgtaa agagattgtc tcaagctcgg atcccgcacg ccgataacaa gccttttcat 4980
ttttactaca gcattgtagt ggcgagacac ttcgctgtcg tcgacgtaca tgtatgcttt 5040
gttgtcaaaa acgtcgttgg caagctttaa aatatttaaa agaacatctc tgttcagcac 5100
cactgtgttg tcgtaaatgt tgtttttgat aatttgcgct tccgcagtat cgacacgttc 5160
aaaaaattga tgcgcatcaa ttttgttgtt cctattattg aataaataag attgtacaga 5220
ttcatatcta cgattcgtca tggccaccac aaatgctacg ctgcaaacgc tggtacaatt 5280
ttacgaaaac tgcaaaaacg tcaaaactcg gtataaaata atcaacgggc gctttggcaa 5340
aatatctatt ttatcgcaca agcccactag caaattgtat ttgcagaaaa caatttcggc 5400
gcacaatttt aacgctgacg aaataaaagt tcaccagtta atgagcgacc acccaaattt 5460
tataaaaatc tattttaatc acggttccat caacaaccaa gtgatcgtga tggactacat 5520
tgactgtccc gatttatttg aaacactaca aattaaaggc gagctttcgt accaacttgt 5580
tagcaatatt attagacagc tgtgtgaagc gctcaacgat ttgcacaagc acaatttcat 5640
acacaacgac ataaaactcg aaaatgtctt atatttcgaa gcacttgatc gcgtgtatgt 5700
ttgcgattac ggattgtgca aacacgaaaa ctcacttagc gtgcacgacg gcacgttgga 5760
gtattttagt ccggaaaaaa ttcgacacac aactatgcac gtttcgtttg actggtacgc 5820
ggcgtgttaa catacaagtt gctaaccggc ggccgacacc catttgaaaa aagcgaagac 5880
gaaatgttgg acttgaatag catgaagcgt cgtcagcaat acaatgacat tggcgtttta 5940
aaacacgttc gtaacgttaa cgctcgtgac tttgtgtact gcctaacaag atacaacata 6000
gattgtagac tcacaaatta caaacaaatt ataaaacatg agtttttgtc gtaaaaatgc 6060
cacttgtttt acgagtagaa ttcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 6120
tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 6180
gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 6240
ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg 6300
cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 6360
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 6420
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 6480
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 6540
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 6600
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 6660
ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 6720
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 6780
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 6840
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 6900
ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 6960
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 7020
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 7080
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 7140
taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 7200
aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa 7260
tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 7320
tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct 7380
gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca 7440
gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt 7500
aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 7560
gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 7620
ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 7680
tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 7740
atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 7800
ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 7860
ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 7920
ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 7980
atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 8040
gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 8100
tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt 8160
ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc 8220
acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc 8280
tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa 8340
aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg 8400
agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac 8460
tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac 8520
agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct gcgcaactgt 8580
tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 8640
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 8700
accgagttgt ttgcgtacgt gactagcgaa gaagatgtgt ggaccgcaga acagatagta 8760
aaacaaaacc ctagtattgg agcaataatc gatttaacca acacgtctaa atattatgat 8820
ggtgtgcatt ttttgcgggc gggcctgtta tacaaaaaaa ttcaagtacc tggccagact 8880
ttgccgcctg aaagcatagt tcaagaattt attgacacgg taaaagaatt tacagaaaag 8940
tgtcccggca tgttggtggg cgtgcactgc acacacggta ttaatcgcac cggttacatg 9000
gtgtgcagat atttaatgca caccctgggt attgcgccgc aggaagccat agatagattc 9060
gaaaaagcca gaggtcacaa aattgaaaga caaaattacg ttcaagattt attaatttaa 9120
ttaatattat ttgcattctt taacaaatac tttatcctat tttcaaattg ttgcgcttct 9180
tccagcgaac caaaactatg cttcgcttgc tccgtttagc ttgtagccga tcagtggcgt 9240
tgttccaatc gacggtagga ttaggccgga tattctccac cacaatgttg gcaacgttga 9300
tgttacgttt atgcttttgg ttttccacgt acgtcttttg gccggtaata gccgtaaacg 9360
tagtgccgtc gcgcgtcacg cacaacaccg gatgtttgcg cttgtccgcg gggtattgaa 9420
ccgcgcgatc cgacaaatcc accactttgg caactaaatc ggtgacctgc gcgtcttttt 9480
tctgcattat ttcgtctttc ttttgcatgg tttcctggaa gccggtgtac atgcggttta 9540
gatcagtcat gacgcgcgtg acctgcaaat ctttggcctc gatctgcttg tccttgatgg 9600
caacgatgcg ttcaataaac tcttgttttt taacaagttc ctcggttttt tgcgccacca 9660
ccgcttgcag cgcgtttgtg tgctcggtga atgtcgcaat cagcttagtc accaactgtt 9720
tgctctcctc ctcccgttgt ttgatcgcgg gatcgtactt gccggtgcag agcacttgag 9780
gaattacttc ttctaaaagc cattcttgta attctatggc gtaaggcaat ttggacttca 9840
taatcagctg aatcacgccg gatttagtaa tgagcactgt atgcggctgc aaatacagcg 9900
ggtcgcccct tttcacgacg ctgttagagg tagggccccc attttggatg gtctgctcaa 9960
ataacgattt gtatttattg tctacatgaa cacgtatagc tttatcacaa actgtatatt 10020
ttaaactgtt agcgacgtcc ttggccacga accggacctg ttggtcgcgc tctagcacgt 10080
accgcaggtt gaacgtatct tctccaaatt taaattctcc aattttaacg cgagccattt 10140
tgatacacgt gtgtcgattt tgcaacaact attgtttttt aacgcaaact aaacttattg 10200
tggtaagcaa taattaaata tgggggaaca tgcgccgcta caacactcgt cgttatgaac 10260
gcagacggcg ccggtctcgg cgcaagcggc taaaacgtgt tgcgcgttca acgcggcaaa 10320
catcgcaaaa gccaatagta cagttttgat ttgcatatta acggcgattt tttaaattat 10380
cttatttaat aaatagttat gacgcctaca actccccgcc cgcgttgact cgctgcacct 10440
cgagcagttc gttgacgcct tcctccgtgt ggccgaacac gtcgagcggg tggtcgatga 10500
ccagcggcgt gccgcacgcg acgcacaagt atctgtacac cgaatgatcg tcgggcgaag 10560
gcacgtcggc ctccaagtgg caatattggc aaattcgaaa atatatacag ttgggttgtt 10620
tgcgcatatc tatcgtggcg ttgggcatgt acgtccgaac gttgatttgc atgcaagccg 10680
aaattaaatc attgcgatta gtgcgattaa aacgttgtac atcctcgctt ttaatcatgc 10740
cgtcgattaa atcgcgcaat cgagtcaagt gatcaaagtg tggaataatg ttttctttgt 10800
attcccgagt caagcgcagc gcgtatttta acaaactagc catcttgtaa gttagtttca 10860
tttaatgcaa ctttatccaa taatatatta tgtatcgcac gtcaagaatt aacaatgcgc 10920
ccgttgtcgc atctcaacac gactatgata gagatcaaat aaagcgcgaa ttaaatagct 10980
tgcgacgcaa cgtgcacgat ctgtgcacgc gttccggcac gagctttgat tgtaataagt 11040
ttttacgaag cgatgacatg acccccgtag tgacaacgat cacgcccaaa agaactgccg 11100
actacaaaat taccgagtat gtcggtgacg ttaaaactat taagccatcc aatcgaccgt 11160
tagtcgaatc aggaccgctg gtgcgagaag ccgcgaagta tggcgaatgc atcgtataac 11220
gtgtggagtc cgctcattag agcgtcatgt ttagacaaga aagctacata tttaattgat 11280
cccgatgatt ttattgataa attgacccta actccataca cggtattcta caatggcggg 11340
gttttggtca aaatttccgg actgcgattg tacatgctgt taacggctcc gcccactatt 11400
aatgaaatta aaaattccaa ttttaaaaaa cgcagcaaga gaaacatttg tatgaaagaa 11460
tgcgtagaag gaaagaaaaa tgtcgtcgac atgctgaaca acaagattaa tatgcctccg 11520
tgtataaaaa aaatattgaa cgatttgaaa gaaaacaatg taccgcgcgg cggtatgtac 11580
aggaagaggt ttatactaaa ctgttacatt gcaaacgtgg tttcgtgtgc caagtgtgaa 11640
aaccgatgtt taatcaaggc tctgacgcat ttctacaacc acgactccaa gtgtgtgggt 11700
gaagtcatgc atcttttaat caaatcccaa gatgtgtata aaccaccaaa ctgccaaaaa 11760
atgaaaactg tcgacaagct ctgtccgttt gctggcaact gcaagggtct caatcctatt 11820
tgtaattatt gaataataaa acaattataa atgctaaatt tgttttttat taacgataca 11880
aaccaaacgc aacaagaaca tttgtagtat tatctataat tgaaaacgcg tagttataat 11940
cgctgaggta atatttaaaa tcattttcaa atgattcaca gttaatttgc gacaatataa 12000
ttttattttc acataaacta gacgccttgt cgtcttcttc ttcgtattcc ttctcttttt 12060
catttttctc ctcataaaaa ttaacatagt tattatcgta tccatatatg tatctatcgt 12120
atagagtaaa ttttttgttg tcataaatat atatgtcttt tttaatgggg tgtatagtac 12180
cgctgcgcat agtttttctg taatttacaa cagtgctatt ttctggtagt tcttcggagt 12240
gtgttgcttt aattattaaa tttatataat caatgaattt gggatcgtcg gttttgtaca 12300
atatgttgcc ggcatagtac gcagcttctt ctagttcaat tacaccattt tttagcagca 12360
ccggattaac ataactttcc aaaatgttgt acgaaccgtt aaacaaaaac agttcacctc 12420
ccttttctat actattgtct gcgagcagtt gtttgttgtt aaaaataaca gccattgtaa 12480
tgagacgcac aaactaatat cacaaactgg aaatgtctat caatatatag ttgctgat 12538
<210> 2
<211> 11544
<212> DNA
<213> Artificial Sequence
<220>
<223> Bac polH Cap2/5
<400> 2
ttaacgatac aaaccaaacg caacaagaac atttgtagta ttatctataa ttgaaaacgc 60
gtagttataa tcgctgaggt aatatttaaa atcattttca aatgattcac agttaatttg 120
cgacaatata attttatttt cacataaact agacgccttg tcgtcttctt cttcgtattc 180
cttctctttt tcatttttct cctcataaaa attaacatag ttattatcgt atccatatat 240
gtatctatcg tatagagtaa attttttgtt gtcataaata tatatgtctt ttttaatggg 300
gtgtatagta ccgctgcgca tagtttttct gtaatttaca acagtgctat tttctggtag 360
ttcttcggag tgtgttgctt taattattaa atttatataa tcaatgaatt tgggatcgtc 420
ggttttgtac aatatgttgc cggcatagta cgcagcttct tctagttcaa ttacaccatt 480
ttttagcagc accggattaa cataactttc caaaatgttg tacgaaccgt taaacaaaaa 540
cagttcacct cccttttcta tactattgtc tgcgagcagt tgtttgttgt taaaaataac 600
agccatcatg gagatctgag ctcggcgcgt gtaatgagac gcacaaacta atatcacaaa 660
ctggaaatgt ctatcaatat atagttgctg atgtaccgca tgctatgcat cagctgctag 720
tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct cgcaaataaa 780
taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa tagaccggag 840
tagtcatacc gtcccaccat cgggcgcgga tcgtaccggg cccaagcttg ccgccaccct 900
ggctgccgat ggttatctac ccgattggct cgaggacact ctctctgaag gaataagaca 960
gtggtggaag ctcaaacctg gcccaccacc accaaagccc gcagagcggc ataaggacga 1020
cagcaggggt cttgtgcttc ctgggtacaa gtacctcgga cccttcaacg gactcgacaa 1080
gggagagccg gtcaacgagg cagacgccgc ggccctcgag cacgacaaag cctacgaccg 1140
gcagctcgac agcggagaca acccgtacct caagtacaac cacgccgacg cggagtttca 1200
ggagcgcctt aaagaagata cgtcttttgg gggcaacctc ggacgagcag tcttccaggc 1260
gaaaaagagg gttcttgaac ctctgggcct ggttgaggaa cctgttaaga cggctccggg 1320
aaaaaagagg ccggtagagc actctcctgt ggagccagac tcctcctcgg gaaccggaaa 1380
ggcgggccag cagcctgcaa gaaaaagatt gaattttggt cagactggag acgcagactc 1440
agtacctgac ccccagcctc tcggacagcc accagcagcc ccctctggtc tgggaactaa 1500
tacgatggct acaggcagtg gcgcaccaat ggcagacaat aacgagggcg ccgacggagt 1560
gggtaattcc tcgggaaatt ggcattgcga ttccacatgg atgggcgaca gagtcatcac 1620
caccagcacc cgaacctggg ccctgcccac ctacaacaac cacctctaca aacaaatttc 1680
cagccaatca ggagcctcga acgacaatca ctactttggc tacagcaccc cttgggggta 1740
ttttgacttc aacagattcc actgccactt ttcaccacgt gactggcaaa gactcatcaa 1800
caacaactgg ggattccgac ccaagagact caacttcaag ctctttaaca ttcaagtcaa 1860
agaggtcacg cagaatgacg gtacgacgac gattgccaat aaccttacca gcacggttca 1920
ggtgtttact gactcggagt accagctccc gtacgtcctc ggctcggcgc atcaaggatg 1980
cctcccgccg ttcccagcag acgtcttcat ggtgccacag tatggatacc tcaccctgaa 2040
caacgggagt caggcagtag gacgctcttc attttactgc ctggagtact ttccttctca 2100
gatgctgcgt accggaaaca actttacctt cagctacact tttgaggacg ttcctttcca 2160
cagcagctac gctcacagcc agagtctgga ccgtctcatg aatcctctca tcgaccagta 2220
cctgtattac ttgagcagaa caaacactcc aagtggaacc accacgcagt caaggcttca 2280
gttttctcag gccggagcga gtgacattcg ggaccagtct aggaactggc ttcctggacc 2340
ctgttaccgc cagcagcgag tatcaaagac atctgcggat aacaacaaca gtgaatactc 2400
gtggactgga gctaccaagt accacctcaa tggcagagac tctctggtga atccgggccc 2460
ggccatggca agccacaagg acgatgaaga aaagtttttt cctcagagcg gggttctcat 2520
ctttgggaag caaggctcag agaaaacaaa tgtggacatt gaaaaggtca tgattacaga 2580
cgaagaggaa atcaggacaa ccaatcccgt ggctacggag cagtatggtt ctgtatctac 2640
caacctccag agaggcaaca gacaagcagc taccgcagat gtcaacacac aaggcgttct 2700
tccaggcatg gtctggcagg acagagatgt gtaccttcag gggcccatct gggcaaagat 2760
tccacacacg gacggacatt ttcacccctc tcccctcatg ggtggattcg gacttaaaca 2820
ccctcctcca cagattctca tcaagaacac cccggtacct gcgaatcctt cgaccacctt 2880
cagtgcggca aagtttgctt ccttcatcac acagtactcc acgggacagg tcagcgtgga 2940
gatcgagtgg gagctgcaga aggaaaacag caaacgctgg aatcccgaaa ttcagtacac 3000
ttccaactac aacaagtctg ttaatgtgga ctttactgtg gacactaatg gcgtgtattc 3060
agagcctcgc cccattggca ccagatacct gactcgtaat ctgtaagatc ataatcagcc 3120
ataccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc 3180
tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt 3240
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 3300
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctggatcggc cgccccgggg 3360
gtaccgactc tgctgaagag gaggaaattc tccttgaagt ttccctggtg ttcaaagtaa 3420
aggagtttgc accagacgca cctctgttca ctggtccggc gtattaaaac acgatacatt 3480
gttattagta catttattaa gcgctagatt ctgtgcgttg ttgatttaca gacaattgtt 3540
gtacgtattt taataattca ttaaatttat aatctttagg gtggtatgtt agagcgaaaa 3600
tcaaatgatt ttcagcgtct ttatatctga atttaaatat taaatcctca atagatttgt 3660
aaaataggtt tcgattagtt tcaaacaagg gttgtttttc cgaaccgatg gctggactat 3720
ctaatggatt ttcgctcaac gccacaaaac ttgccaaatc ttgtagcagc aatctagctt 3780
tgtcgatatt cgtttgtgtt ttgttttgta ataaaggttc gacgtcgttc aaaatattat 3840
gcgcttttgt atttctttca tcactgtcgt tagtgtacaa ttgactcgac gtaaacacgt 3900
taaataaagc ttggacatat ttaacatcgg gcgtgttagc tttattaggc cgattatcgt 3960
cgtcgtccca accctcgtcg ttagaagttg cttccgaaga cgattttgcc atagccacac 4020
gacgcctatt aattgtgtcg gctaacacgt ccgcgatcaa atttgtagtt gagctttttg 4080
gaattatttc tgattgcggg cgtttttggg cgggtttcaa tctaactgtg cccgatttta 4140
attcagacaa cacgttagaa agcgatggtg caggcggtgg taacatttca gacggcaaat 4200
ctactaatgg cggcggtggt ggagctgatg ataaatctac catcggtgga ggcgcaggcg 4260
gggctggcgg cggaggcgga ggcggaggtg gtggcggtga tgcagacggc ggtttaggct 4320
caaatgtctc tttaggcaac acagtcggca cctcaactat tgtactggtt tcgggcgccg 4380
tttttggttt gaccggtctg agacgagtgc gatttttttc gtttctaata gcttccaaca 4440
attgttgtct gtcgtctaaa ggtgcagcgg gttgaggttc cgtcggcatt ggtggagcgg 4500
gcggcaattc agacatcgat ggtggtggtg gtggtggagg cgctggaatg ttaggcacgg 4560
gagaaggtgg tggcggcggt gccgccggta taatttgttc tggtttagtt tgttcgcgca 4620
cgattgtggg caccggcgca ggcgccgctg gctgcacaac ggaaggtcgt ctgcttcgag 4680
gcagcgcttg gggtggtggc aattcaatat tataattgga atacaaatcg taaaaatctg 4740
ctataagcat tgtaatttcg ctatcgttta ccgtgccgat atttaacaac cgctcaatgt 4800
aagcaattgt attgtaaaga gattgtctca agctcggatc ccgcacgccg ataacaagcc 4860
ttttcatttt tactacagca ttgtagtggc gagacacttc gctgtcgtcg acgtacatgt 4920
atgctttgtt gtcaaaaacg tcgttggcaa gctttaaaat atttaaaaga acatctctgt 4980
tcagcaccac tgtgttgtcg taaatgttgt ttttgataat ttgcgcttcc gcagtatcga 5040
cacgttcaaa aaattgatgc gcatcaattt tgttgttcct attattgaat aaataagatt 5100
gtacagattc atatctacga ttcgtcatgg ccaccacaaa tgctacgctg caaacgctgg 5160
tacaatttta cgaaaactgc aaaaacgtca aaactcggta taaaataatc aacgggcgct 5220
ttggcaaaat atctatttta tcgcacaagc ccactagcaa attgtatttg cagaaaacaa 5280
tttcggcgca caattttaac gctgacgaaa taaaagttca ccagttaatg agcgaccacc 5340
caaattttat aaaaatctat tttaatcacg gttccatcaa caaccaagtg atcgtgatgg 5400
actacattga ctgtcccgat ttatttgaaa cactacaaat taaaggcgag ctttcgtacc 5460
aacttgttag caatattatt agacagctgt gtgaagcgct caacgatttg cacaagcaca 5520
atttcataca caacgacata aaactcgaaa atgtcttata tttcgaagca cttgatcgcg 5580
tgtatgtttg cgattacgga ttgtgcaaac acgaaaactc acttagcgtg cacgacggca 5640
cgttggagta ttttagtccg gaaaaaattc gacacacaac tatgcacgtt tcgtttgact 5700
ggtacgccgt cgaattcact ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc 5760
gttacccaac ttaatcgcct tgcagcacat ccccctttcg ccagctggcg taatagcgaa 5820
gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga atggcgcctg 5880
atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc 5940
agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct 6000
gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc 6060
tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag 6120
ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg 6180
tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata 6240
cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga 6300
aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca 6360
ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat 6420
cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag 6480
agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc 6540
gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct 6600
cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca 6660
gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 6720
ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat 6780
gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 6840
gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 6900
cttactctag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 6960
ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 7020
gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 7080
gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 7140
gagataggtg cctcactgat taagcattgg taactgtcag accaagttta ctcatatata 7200
ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt 7260
gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 7320
gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 7380
caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 7440
ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt tcttctagtg 7500
tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 7560
ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 7620
tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 7680
cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 7740
gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 7800
ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 7860
gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 7920
agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 7980
tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 8040
tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 8100
gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat 8160
taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt 8220
aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt 8280
atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat 8340
tacgccaagc ttgcatgcct gcaggtcgac tctagaccga gttgtttgcg tacgtgacta 8400
gcgaagaaga tgtgtggacc gcagaacaga tagtaaaaca aaaccctagt attggagcaa 8460
taatcgattt aaccaacacg tctaaatatt atgatggtgt gcattttttg cgggcgggcc 8520
tgttatacaa aaaaattcaa gtacctggcc agactttgcc gcctgaaagc atagttcaag 8580
aatttattga cacggtaaaa gaatttacag aaaagtgtcc cggcatgttg gtgggcgtgc 8640
actgcacaca cggtattaat cgcaccggtt acatggtgtg cagatattta atgcacaccc 8700
tgggtattgc gccgcaggaa gccatagata gattcgaaaa agccagaggt cacaaaattg 8760
aaagacaaaa ttacgttcaa gatttattaa tttaattaat attatttgca ttctttaaca 8820
aatactttat cctattttca aattgttgcg cttcttccag cgaaccaaaa ctatgcttcg 8880
cttgctccgt ttagcttgta gccgatcagt ggcgttgttc caatcgacgg taggattagg 8940
ccggatattc tccaccacaa tgttggcaac gttgatgtta cgtttatgct tttggttttc 9000
cacgtacgtc ttttggccgg taatagccgt aaacgtagtg ccgtcgcgcg tcacgcacaa 9060
caccggatgt ttgcgcttgt ccgcggggta ttgaaccgcg cgatccgaca aatccaccac 9120
tttggcaact aaatcggtga cctgcgcgtc ttttttctgc attatttcgt ctttcttttg 9180
catggtttcc tggaagccgg tgtacatgcg gtttagatca gtcatgacgc gcgtgacctg 9240
caaatctttg gcctcgatct gcttgtcctt gatggcaacg atgcgttcaa taaactcttg 9300
ttttttaaca agttcctcgg ttttttgcgc caccaccgct tgcagcgcgt ttgtgtgctc 9360
ggtgaatgtc gcaatcagct tagtcaccaa ctgtttgctc tcctcctccc gttgtttgat 9420
cgcgggatcg tacttgccgg tgcagagcac ttgaggaatt acttcttcta aaagccattc 9480
ttgtaattct atggcgtaag gcaatttgga cttcataatc agctgaatca cgccggattt 9540
agtaatgagc actgtatgcg gctgcaaata cagcgggtcg ccccttttca cgacgctgtt 9600
agaggtaggg cccccatttt ggatggtctg ctcaaataac gatttgtatt tattgtctac 9660
atgaacacgt atagctttat cacaaactgt atattttaaa ctgttagcga cgtccttggc 9720
cacgaaccgg acctgttggt cgcgctctag cacgtaccgc aggttgaacg tatcttctcc 9780
aaatttaaat tctccaattt taacgcgagc cattttgata cacgtgtgtc gattttgcaa 9840
caactattgt tttttaacgc aaactaaact tattgtggta agcaataatt aaatatgggg 9900
gaacatgcgc cgctacaaca ctcgtcgtta tgaacgcaga cggcgccggt ctcggcgcaa 9960
gcggctaaaa cgtgttgcgc gttcaacgcg gcaaacatcg caaaagccaa tagtacagtt 10020
ttgatttgca tattaacggc gattttttaa attatcttat ttaataaata gttatgacgc 10080
ctacaactcc ccgcccgcgt tgactcgctg cacctcgagc agttcgttga cgccttcctc 10140
cgtgtggccg aacacgtcga gcgggtggtc gatgaccagc ggcgtgccgc acgcgacgca 10200
caagtatctg tacaccgaat gatcgtcggg cgaaggcacg tcggcctcca agtggcaata 10260
ttggcaaatt cgaaaatata tacagttggg ttgtttgcgc atatctatcg tggcgttggg 10320
catgtacgtc cgaacgttga tttgcatgca agccgaaatt aaatcattgc gattagtgcg 10380
attaaaacgt tgtacatcct cgcttttaat catgccgtcg attaaatcgc gcaatcgagt 10440
caagtgatca aagtgtggaa taatgttttc tttgtattcc cgagtcaagc gcagcgcgta 10500
ttttaacaaa ctagccatct tgtaagttag tttcatttaa tgcaacttta tccaataata 10560
tattatgtat cgcacgtcaa gaattaacaa tgcgcccgtt gtcgcatctc aacacgacta 10620
tgatagagat caaataaagc gcgaattaaa tagcttgcga cgcaacgtgc acgatctgtg 10680
cacgcgttcc ggcacgagct ttgattgtaa taagttttta cgaagcgatg acatgacccc 10740
cgtagtgaca acgatcacgc ccaaaagaac tgccgactac aaaattaccg agtatgtcgg 10800
tgacgttaaa actattaagc catccaatcg accgttagtc gaatcaggac cgctggtgcg 10860
agaagccgcg aagtatggcg aatgcatcgt ataacgtgtg gagtccgctc attagagcgt 10920
catgtttaga caagaaagct acatatttaa ttgatcccga tgattttatt gataaattga 10980
ccctaactcc atacacggta ttctacaatg gcggggtttt ggtcaaaatt tccggactgc 11040
gattgtacat gctgttaacg gctccgccca ctattaatga aattaaaaat tccaatttta 11100
aaaaacgcag caagagaaac atttgtatga aagaatgcgt agaaggaaag aaaaatgtcg 11160
tcgacatgct gaacaacaag attaatatgc ctccgtgtat aaaaaaaata ttgaacgatt 11220
tgaaagaaaa caatgtaccg cgcggcggta tgtacaggaa gaggtttata ctaaactgtt 11280
acattgcaaa cgtggtttcg tgtgccaagt gtgaaaaccg atgtttaatc aaggctctga 11340
cgcatttcta caaccacgac tccaagtgtg tgggtgaagt catgcatctt ttaatcaaat 11400
cccaagatgt gtataaacca ccaaactgcc aaaaaatgaa aactgtcgac aagctctgtc 11460
cgtttgctgg caactgcaag ggtctcaatc ctatttgtaa ttattgaata ataaaacaat 11520
tataaatgct aaatttgttt ttta 11544
<210> 3
<211> 14299
<212> DNA
<213> Artificial Sequence
<220>
<223> Bac polH Cap5 - human Factor IX
<400> 3
tgtaatgaga cgcacaaact aatatcacaa actggaaatg tctatcaata tatagttgct 60
gatgtaccgc agcatgctat gcatcagctg ctagtactcc ggaatattaa tagatcatgg 120
agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt ttcgtaacag 180
ttttgtaata aaaaaaccta taaatagacc ggagtagtca taccgtccca ccatcgggcg 240
cggatcgtac cgggcccaag cttcctgtta agacggcttc ttttgttgat cacccacccg 300
attggttgga agaagttggt gaaggtcttc gcgagttttt gggccttgaa gcgggcccac 360
cgaaaccaaa acccaatcag cagcatcaag atcaagcccg tggtcttgtg ctgcctggtt 420
ataactatct cggacccgga aacggtctcg atcgaggaga gcctgtcaac agggcagacg 480
aggtcgcgcg agagcacgac atctcgtaca acgagcagct tgaggcggga gacaacccct 540
acctcaagta caaccacgcg gacgccgagt ttcaggagaa gctcgccgac gacacatcct 600
tcgggggaaa cctcggaaag gcagtctttc aggccaagaa aagggttctc gaaccttttg 660
gcctggttga agagggtgct aagacggccc ctaccggaaa gcggatagac gaccactttc 720
caaaaagaaa gaaggctcgg accgaagagg actccaagcc ttccacctcg tcagacgccg 780
aagctggacc cagcggatcc cagcagctgc aaatcccagc ccaaccagcc tcaagtttgg 840
gagctgatac aatgtctgcg ggaggtggcg gcccattggg cgacaataac caaggtgccg 900
atggagtggg caatgcctcg ggagattggc attgcgattc cacgtggatg ggggacagag 960
tcgtcaccaa gtccacccga acctgggtgc tgcccagcta caacaaccac cagtaccgag 1020
agatcaaaag cggctccgtc gacggaagca acgccaacgc ctactttgga tacagcaccc 1080
cctgggggta ctttgacttt aaccgcttcc acagccactg gagcccccga gactggcaaa 1140
gactcatcaa caactactgg ggcttcagac cccggtccct cagagtcaaa atcttcaaca 1200
ttcaagtcaa agaggtcacg gtgcaggact ccaccaccac catcgccaac aacctcacct 1260
ccaccgtcca agtgtttacg gacgacgact accagctgcc ctacgtcgtc ggcaacggga 1320
ccgagggatg cctgccggcc ttccctccgc aggtctttac gctgccgcag tacggttacg 1380
cgacgctgaa ccgcgacaac acagaaaatc ccaccgagag gagcagcttc ttctgcctag 1440
agtactttcc cagcaagatg ctgagaacgg gcaacaactt tgagtttacc tacaactttg 1500
aggaggtgcc cttccactcc agcttcgctc ccagtcagaa cctcttcaag ctggccaacc 1560
cgctggtgga ccagtacttg taccgcttcg tgagcacaaa taacactggc ggagtccagt 1620
tcaacaagaa cctggccggg agatacgcca acacctacaa aaactggttc ccggggccca 1680
tgggccgaac ccagggctgg aacctgggct ccggggtcaa ccgcgccagt gtcagcgcct 1740
tcgccacgac caataggatg gagctcgagg gcgcgagtta ccaggtgccc ccgcagccga 1800
acggcatgac caacaacctc cagggcagca acacctatgc cctggagaac actatgatct 1860
tcaacagcca gccggcgaac ccgggcacca ccgccacgta cctcgagggc aacatgctca 1920
tcaccagcga gagcgagacg cagccggtga accgcgtggc gtacaacgtc ggcgggcaga 1980
tggccaccaa caaccagagc tccaccactg cccccgcgac cggcacgtac aacctccagg 2040
aaatcgtgcc cggcagcgtg tggatggaga gggacgtgta cctccaagga cccatctggg 2100
ccaagatccc agagacgggg gcgcactttc acccctctcc ggccatgggc ggattcggac 2160
tcaaacaccc accgcccatg atgctcatca agaacacgcc tgtgcccgga aatatcacca 2220
gcttctcgga cgtgcccgtc agcagcttca tcacccagta cagcaccggg caggtcaccg 2280
tggagatgga gtgggagctc aagaaggaaa actccaagag gtggaaccca gagatccagt 2340
acacaaacaa ctacaacgac ccccagtttg tggactttgc cccggacagc accggggaat 2400
acagaaccac cagacctatc ggaacccgat accttacccg acccctttaa tctagagcct 2460
gcagtctcga caagctagct tgtcgagaag tactagagga tcataatcag ccataccaca 2520
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 2580
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 2640
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 2700
ttgtccaaac tcatcaatgt atcttatcat gtctggatct gatcactgct tgagcctagg 2760
ggggtaccag atcccatggg agctctgcag aattctctag aggcctcgcg agatcgatct 2820
agaaagcttc ccggggggat ctgggccact ccctctctgc gcgctcgctc gctcactgag 2880
gccgcccggg caaagcccgg gcgtcgggcg acctttggtc gcccggcctc agtgagcgag 2940
cgagcgcgca gagagggagt ggccaactcc atcactaggg gttcctggag gggtggagtc 3000
gtgaccccta aaatgggcaa acattgcaag cagcaaacag caaacacaca gccctccctg 3060
cctgctgacc ttggagctgg ggcagaggtc agagacctct ctgggcccat gccacctcca 3120
acatccactc gaccccttgg aatttcggtg gagaggagca gaggttgtcc tggcgtggtt 3180
taggtagtgt gagaggggaa tgactccttt cggtaagtgc agtggaagct gtacactgcc 3240
caggcaaagc gtccgggcag cgtaggcggg cgactcagat cccagccagt ggacttagcc 3300
cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc 3360
gttgcccctc tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct 3420
tcaggcacca ccactgacct gggacagtga atccggactc taaggtaaat ataaaatttt 3480
taagtgtata atgtgttaaa ctactgattc taattgtttc tctcttttag attccaacct 3540
ttggaactga attctagacc accatgcaga gggtgaacat gatcatggct gagagccctg 3600
gcctgatcac catctgcctg ctgggctacc tgctgtctgc tgagtgcact gtgttcctgg 3660
accatgagaa tgccaacaag atcctgaaca ggcccaagag atacaactct ggcaagctgg 3720
aggagtttgt gcagggcaac ctggagaggg agtgcatgga ggagaagtgc agctttgagg 3780
aggccaggga ggtgtttgag aacactgaga ggaccactga gttctggaag cagtatgtgg 3840
atggggacca gtgtgagagc aacccctgcc tgaatggggg cagctgcaag gatgacatca 3900
acagctatga gtgctggtgc ccctttggct ttgagggcaa gaactgtgag ctggatgtga 3960
cctgcaacat caagaatggc agatgtgagc agttctgcaa gaactctgct gacaacaagg 4020
tggtgtgcag ctgcactgag ggctacaggc tggctgagaa ccagaagagc tgtgagcctg 4080
ctgtgccatt cccatgtggc agagtgtctg tgagccagac cagcaagctg accagggctg 4140
aggctgtgtt ccctgatgtg gactatgtga acagcactga ggctgaaacc atcctggaca 4200
acatcaccca gagcacccag agcttcaatg acttcaccag ggtggtgggg ggggaggatg 4260
ccaagcctgg ccagttcccc tggcaagtgg tgctgaatgg caaggtggat gccttctgtg 4320
ggggcagcat tgtgaatgag aagtggattg tgactgctgc ccactgtgtg gagactgggg 4380
tgaagatcac tgtggtggct ggggagcaca acattgagga gactgagcac actgagcaga 4440
agaggaatgt gatcaggatc atcccccacc acaactacaa tgctgccatc aacaagtaca 4500
accatgacat tgccctgctg gagctggatg agcccctggt gctgaacagc tatgtgaccc 4560
ccatctgcat tgctgacaag gagtacacca acatcttcct gaagtttggc tctggctatg 4620
tgtctggctg gggcagggtg ttccacaagg gcaggtctgc cctggtgctg cagtacctga 4680
gggtgcccct ggtggacagg gccacctgcc tgctgagcac caagttcacc atctacaaca 4740
acatgttctg tgctggcttc catgaggggg gcagggacag ctgccagggg gactctgggg 4800
gcccccatgt gactgaggtg gagggcacca gcttcctgac tggcatcatc agctgggggg 4860
aggagtgtgc catgaagggc aagtatggca tctacaccaa agtctccaga tatgtgaact 4920
ggatcaagga gaagaccaag ctgacctgac tcgatgcttt atttgtgaaa tttgtgatgc 4980
tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat 5040
tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaacta ggtcacgact 5100
ccacccctcc aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 5160
ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 5220
gtgagcgagc gagcgcgcag agagggagtg gcccagatcc ccccgggaag ctttctagat 5280
cgatcttaat taattaagta ccgactctgc tgaagaggag gaaattctcc ttgaagtttc 5340
cctggtgttc aaagtaaagg agtttgcacc agacgcacct ctgttcactg gtccggcgta 5400
ttaaaacacg atacattgtt attagtacat ttattaagcg ctagattctg tgcgttgttg 5460
atttacagac aattgttgta cgtattttaa taattcatta aatttataat ctttagggtg 5520
gtatgttaga gcgaaaatca aatgattttc agcgtcttta tatctgaatt taaatattaa 5580
atcctcaata gatttgtaaa ataggtttcg attagtttca aacaagggtt gtttttccga 5640
accgatggct ggactatcta atggattttc gctcaacgcc acaaaacttg ccaaatcttg 5700
tagcagcaat ctagctttgt cgatattcgt ttgtgttttg ttttgtaata aaggttcgac 5760
gtcgttcaaa atattatgcg cttttgtatt tctttcatca ctgtcgttag tgtacaattg 5820
actcgacgta aacacgttaa ataaagcttg gacatattta acatcgggcg tgttagcttt 5880
attaggccga ttatcgtcgt cgtcccaacc ctcgtcgtta gaagttgctt ccgaagacga 5940
ttttgccata gccacacgac gcctattaat tgtgtcggct aacacgtccg cgatcaaatt 6000
tgtagttgag ctttttggaa ttatttctga ttgcgggcgt ttttgggcgg gtttcaatct 6060
aactgtgccc gattttaatt cagacaacac gttagaaagc gatggtgcag gcggtggtaa 6120
catttcagac ggcaaatcta ctaatggcgg cggtggtgga gctgatgata aatctaccat 6180
cggtggaggc gcaggcgggg ctggcggcgg aggcggaggc ggaggtggtg gcggtgatgc 6240
agacggcggt ttaggctcaa atgtctcttt aggcaacaca gtcggcacct caactattgt 6300
actggtttcg ggcgccgttt ttggtttgac cggtctgaga cgagtgcgat ttttttcgtt 6360
tctaatagct tccaacaatt gttgtctgtc gtctaaaggt gcagcgggtt gaggttccgt 6420
cggcattggt ggagcgggcg gcaattcaga catcgatggt ggtggtggtg gtggaggcgc 6480
tggaatgtta ggcacgggag aaggtggtgg cggcggtgcc gccggtataa tttgttctgg 6540
tttagtttgt tcgcgcacga ttgtgggcac cggcgcaggc gccgctggct gcacaacgga 6600
aggtcgtctg cttcgaggca gcgcttgggg tggtggcaat tcaatattat aattggaata 6660
caaatcgtaa aaatctgcta taagcattgt aatttcgcta tcgtttaccg tgccgatatt 6720
taacaaccgc tcaatgtaag caattgtatt gtaaagagat tgtctcaagc tcggatcccg 6780
cacgccgata acaagccttt tcatttttac tacagcattg tagtggcgag acacttcgct 6840
gtcgtcgacg tacatgtatg ctttgttgtc aaaaacgtcg ttggcaagct ttaaaatatt 6900
taaaagaaca tctctgttca gcaccactgt gttgtcgtaa atgttgtttt tgataatttg 6960
cgcttccgca gtatcgacac gttcaaaaaa ttgatgcgca tcaattttgt tgttcctatt 7020
attgaataaa taagattgta cagattcata tctacgattc gtcatggcca ccacaaatgc 7080
tacgctgcaa acgctggtac aattttacga aaactgcaaa aacgtcaaaa ctcggtataa 7140
aataatcaac gggcgctttg gcaaaatatc tattttatcg cacaagccca ctagcaaatt 7200
gtatttgcag aaaacaattt cggcgcacaa ttttaacgct gacgaaataa aagttcacca 7260
gttaatgagc gaccacccaa attttataaa aatctatttt aatcacggtt ccatcaacaa 7320
ccaagtgatc gtgatggact acattgactg tcccgattta tttgaaacac tacaaattaa 7380
aggcgagctt tcgtaccaac ttgttagcaa tattattaga cagctgtgtg aagcgctcaa 7440
cgatttgcac aagcacaatt tcatacacaa cgacataaaa ctcgaaaatg tcttatattt 7500
cgaagcactt gatcgcgtgt atgtttgcga ttacggattg tgcaaacacg aaaactcact 7560
tagcgtgcac gacggcacgt tggagtattt tagtccggaa aaaattcgac acacaactat 7620
gcacgtttcg tttgactggt acgcggcgtg ttaacataca agttgctaac cggcggccga 7680
cacccatttg aaaaaagcga agacgaaatg ttggacttga atagcatgaa gcgtcgtcag 7740
caatacaatg acattggcgt tttaaaacac gttcgtaacg ttaacgctcg tgactttgtg 7800
tactgcctaa caagatacaa catagattgt agactcacaa attacaaaca aattataaaa 7860
catgagtttt tgtcgtaaaa atgccacttg ttttacgagt agaattcgta atcatggtca 7920
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 7980
agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 8040
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 8100
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 8160
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 8220
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 8280
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 8340
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 8400
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 8460
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 8520
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 8580
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 8640
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 8700
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 8760
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 8820
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 8880
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 8940
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 9000
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 9060
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 9120
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 9180
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 9240
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 9300
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 9360
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 9420
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 9480
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 9540
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 9600
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 9660
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 9720
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 9780
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 9840
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 9900
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 9960
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 10020
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 10080
accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 10140
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 10200
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 10260
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 10320
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 10380
tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 10440
cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 10500
tcccagtcac gacgttgtaa aacgaccgag ttgtttgcgt acgtgactag cgaagaagat 10560
gtgtggaccg cagaacagat agtaaaacaa aaccctagta ttggagcaat aatcgattta 10620
accaacacgt ctaaatatta tgatggtgtg cattttttgc gggcgggcct gttatacaaa 10680
aaaattcaag tacctggcca gactttgccg cctgaaagca tagttcaaga atttattgac 10740
acggtaaaag aatttacaga aaagtgtccc ggcatgttgg tgggcgtgca ctgcacacac 10800
ggtattaatc gcaccggtta catggtgtgc agatatttaa tgcacaccct gggtattgcg 10860
ccgcaggaag ccatagatag attcgaaaaa gccagaggtc acaaaattga aagacaaaat 10920
tacgttcaag atttattaat ttaattaata ttatttgcat tctttaacaa atactttatc 10980
ctattttcaa attgttgcgc ttcttccagc gaaccaaaac tatgcttcgc ttgctccgtt 11040
tagcttgtag ccgatcagtg gcgttgttcc aatcgacggt aggattaggc cggatattct 11100
ccaccacaat gttggcaacg ttgatgttac gtttatgctt ttggttttcc acgtacgtct 11160
tttggccggt aatagccgta aacgtagtgc cgtcgcgcgt cacgcacaac accggatgtt 11220
tgcgcttgtc cgcggggtat tgaaccgcgc gatccgacaa atccaccact ttggcaacta 11280
aatcggtgac ctgcgcgtct tttttctgca ttatttcgtc tttcttttgc atggtttcct 11340
ggaagccggt gtacatgcgg tttagatcag tcatgacgcg cgtgacctgc aaatctttgg 11400
cctcgatctg cttgtccttg atggcaacga tgcgttcaat aaactcttgt tttttaacaa 11460
gttcctcggt tttttgcgcc accaccgctt gcagcgcgtt tgtgtgctcg gtgaatgtcg 11520
caatcagctt agtcaccaac tgtttgctct cctcctcccg ttgtttgatc gcgggatcgt 11580
acttgccggt gcagagcact tgaggaatta cttcttctaa aagccattct tgtaattcta 11640
tggcgtaagg caatttggac ttcataatca gctgaatcac gccggattta gtaatgagca 11700
ctgtatgcgg ctgcaaatac agcgggtcgc cccttttcac gacgctgtta gaggtagggc 11760
ccccattttg gatggtctgc tcaaataacg atttgtattt attgtctaca tgaacacgta 11820
tagctttatc acaaactgta tattttaaac tgttagcgac gtccttggcc acgaaccgga 11880
cctgttggtc gcgctctagc acgtaccgca ggttgaacgt atcttctcca aatttaaatt 11940
ctccaatttt aacgcgagcc attttgatac acgtgtgtcg attttgcaac aactattgtt 12000
ttttaacgca aactaaactt attgtggtaa gcaataatta aatatggggg aacatgcgcc 12060
gctacaacac tcgtcgttat gaacgcagac ggcgccggtc tcggcgcaag cggctaaaac 12120
gtgttgcgcg ttcaacgcgg caaacatcgc aaaagccaat agtacagttt tgatttgcat 12180
attaacggcg attttttaaa ttatcttatt taataaatag ttatgacgcc tacaactccc 12240
cgcccgcgtt gactcgctgc acctcgagca gttcgttgac gccttcctcc gtgtggccga 12300
acacgtcgag cgggtggtcg atgaccagcg gcgtgccgca cgcgacgcac aagtatctgt 12360
acaccgaatg atcgtcgggc gaaggcacgt cggcctccaa gtggcaatat tggcaaattc 12420
gaaaatatat acagttgggt tgtttgcgca tatctatcgt ggcgttgggc atgtacgtcc 12480
gaacgttgat ttgcatgcaa gccgaaatta aatcattgcg attagtgcga ttaaaacgtt 12540
gtacatcctc gcttttaatc atgccgtcga ttaaatcgcg caatcgagtc aagtgatcaa 12600
agtgtggaat aatgttttct ttgtattccc gagtcaagcg cagcgcgtat tttaacaaac 12660
tagccatctt gtaagttagt ttcatttaat gcaactttat ccaataatat attatgtatc 12720
gcacgtcaag aattaacaat gcgcccgttg tcgcatctca acacgactat gatagagatc 12780
aaataaagcg cgaattaaat agcttgcgac gcaacgtgca cgatctgtgc acgcgttccg 12840
gcacgagctt tgattgtaat aagtttttac gaagcgatga catgaccccc gtagtgacaa 12900
cgatcacgcc caaaagaact gccgactaca aaattaccga gtatgtcggt gacgttaaaa 12960
ctattaagcc atccaatcga ccgttagtcg aatcaggacc gctggtgcga gaagccgcga 13020
agtatggcga atgcatcgta taacgtgtgg agtccgctca ttagagcgtc atgtttagac 13080
aagaaagcta catatttaat tgatcccgat gattttattg ataaattgac cctaactcca 13140
tacacggtat tctacaatgg cggggttttg gtcaaaattt ccggactgcg attgtacatg 13200
ctgttaacgg ctccgcccac tattaatgaa attaaaaatt ccaattttaa aaaacgcagc 13260
aagagaaaca tttgtatgaa agaatgcgta gaaggaaaga aaaatgtcgt cgacatgctg 13320
aacaacaaga ttaatatgcc tccgtgtata aaaaaaatat tgaacgattt gaaagaaaac 13380
aatgtaccgc gcggcggtat gtacaggaag aggtttatac taaactgtta cattgcaaac 13440
gtggtttcgt gtgccaagtg tgaaaaccga tgtttaatca aggctctgac gcatttctac 13500
aaccacgact ccaagtgtgt gggtgaagtc atgcatcttt taatcaaatc ccaagatgtg 13560
tataaaccac caaactgcca aaaaatgaaa actgtcgaca agctctgtcc gtttgctggc 13620
aactgcaagg gtctcaatcc tatttgtaat tattgaataa taaaacaatt ataaatgcta 13680
aatttgtttt ttattaacga tacaaaccaa acgcaacaag aacatttgta gtattatcta 13740
taattgaaaa cgcgtagtta taatcgctga ggtaatattt aaaatcattt tcaaatgatt 13800
cacagttaat ttgcgacaat ataattttat tttcacataa actagacgcc ttgtcgtctt 13860
cttcttcgta ttccttctct ttttcatttt tctcctcata aaaattaaca tagttattat 13920
cgtatccata tatgtatcta tcgtatagag taaatttttt gttgtcataa atatatatgt 13980
cttttttaat ggggtgtata gtaccgctgc gcatagtttt tctgtaattt acaacagtgc 14040
tattttctgg tagttcttcg gagtgtgttg ctttaattat taaatttata taatcaatga 14100
atttgggatc gtcggttttg tacaatatgt tgccggcata gtacgcagct tcttctagtt 14160
caattacacc attttttagc agcaccggat taacataact ttccaaaatg ttgtacgaac 14220
cgttaaacaa aaacagttca cctccctttt ctatactatt gtctgcgagc agttgtttgt 14280
tgttaaaaat aacagccat 14299
<210> 4
<211> 13365
<212> DNA
<213> Artificial Sequence
<220>
<223> Bac Rep183
<400> 4
accgctgcgc atagtttttc tgtaatttac aacagtgcta ttttctggta gttcttcgga 60
gtgtgttgct ttaattatta aatttatata atcaatgaat ttgggatcgt cggttttgta 120
caatatgttg ccggcatagt acgcagcttc ttctagttca attacaccat tttttagcag 180
caccggatta acataacttt ccaaaatgtt gtacgaaccg ttaaacaaaa acagttcacc 240
tcccttttct atactattgt ctgcgagcag ttgtttgttg ttaaaaataa cagccattgt 300
aatgagacgc acaaactaat atcacaaact ggaaatgtct atcaatatat agttgctgat 360
gtacccgtag tggctatggc agggcttgcc gccccgacgt tggctgcgag ccctgggcct 420
tcacccgaac ttgggggttg gggtggggaa aaggaagaaa cgcgggcgta ttggtcccaa 480
tggggtctcg gtggggtatc gacagagtgc cagccctggg accgaacccc gcgtttatga 540
acaaacgacc caacacccgt gcgttttatt ctgtcttttt attgccgtca tagcgcgggt 600
tccttccggt attgtctcct tccgtgtttc agttagcctc ccccatctcc cggtaccgca 660
tgctatgcat cagtcgagat taccctgtta tccctaccag tgtgttggat ttattgttca 720
aagatacagt catccaaatc cacattaacc agatcgcagg cagtacaagc gtctggcact 780
tttcccatga tatgatgaat atagcataat ttttgatacg ccttttttac gacagaaacg 840
ggttgagatt ctgacaccgg aaagcattct aaacagtctt tctggccgtg agtgaaacag 900
atattactat tctgattcat tctctcacat tgtctgcagg gaaacaacat taagttcatg 960
cctacgtgac gagaacattt gttttggtag cggtctgcgt agtttatcga agcttccgca 1020
tctgacgtgc ttggctgcgc aaccgattct ctcactcgtt tgggctcact tatatctgca 1080
tcactcgggg cgggtctttt cttagcacca ccttttttga cgtaaaattc atgttccact 1140
tcaacaacgt gatcctttgc ccaacgaaag aagtctttga cttcttgttt tgttaccttg 1200
ccaaaatcat gatccagtcg gcgcgtcaat tcaaatttga acattcggtc ttgcaacggt 1260
tgttggtgtt cgaatgtcgt actgttaccg tcaatcacgg cgcacatgtt cgtgttgctt 1320
gtaacgatca ccggtgtcgg gtctatctgc gcagagcttt tgcatttctg gtctacgcgc 1380
actttgctgc ctcctaaaat tgctttggcc gactccacga ctttagcggt cattttgcct 1440
tcctcccacc aaataaccat cttgtcgaca cagtcgttga atggaaagtt ctcattggtc 1500
cagttaacgc agccataaaa aggtacagtg tgggctatgg cctccgctat gtttgttttt 1560
cccgtagttg caggtccaaa caaccaaatg gtgtttcttt tgccaaactt tttcgtcgcc 1620
cagcccaaaa atacggaagc cgcatattga ggatcgtagc cgtttaactc caaaatctta 1680
tagatgcgat tgctggaaat gtcttccacg ggttgctggc ccaccaggta gtcgggggcg 1740
gttttagtca ggctcataat cttgcccgca ttgtccaagg cagctttgat ttggctacgc 1800
gagttggatg ccgcattaaa cgagatgtat gaggcttgat cttcttgtat ccattgcttc 1860
tccgaggtaa tacccttgtc caccaaccaa ccgaccaatt ccatggcgac cgagatccgc 1920
gcccgatggt gggacggtat gaataatccg gaatatttat aggttttttt attacaaaac 1980
tgttacgaaa acagtaaaat acttatttat ttgcgagatg gttatcattt taattatctc 2040
catgatctat taatattccg gagtactgct agcaccatgg atcccggtcc gaagcgcgcg 2100
gaattcaaag gcctacgtcg acgagctcac tagtcgcggc cgatctaata aacgataacg 2160
ccgggtggcg tgaggcatgt aaaaggttac atcattatct tgttcgccat ccggttggta 2220
taaatagacg ttcatgttgg tttttgtttc agttgcaagt tggctgcggc gcgcgcagca 2280
cctttgcggc catctgcaga attcgccctt gttactcttc agccatggcg gggttttacg 2340
agattgtgat taaggtcccc agcgaccttg acgagcatct gcccggcatt tctgacagct 2400
ttgtgaactg ggtggccgag aaggaatggg agttgccgcc agattctgac atggatctga 2460
atctgattga gcaggcaccc ctgaccgtgg ccgagaagct gcagcgcgac tttctgacgg 2520
aatggcgccg tgtgagtaag gccccggagg cccttttctt tgtgcaattt gagaagggag 2580
agagctactt ccacatgcac gtgctcgtgg aaaccaccgg ggtgaaatcc atggttttgg 2640
gacgtttcct gagtcagatt cgcgaaaaac tgattcagag aatttaccgc gggatcgagc 2700
cgactttgcc aaactggttc gcggtcacaa agaccagaaa tggcgccgga ggcgggaaca 2760
aggtggtgga tgagtgctac atccccaatt acttgctccc caaaacccag cctgagctcc 2820
agtgggcgtg gactaatatg gaacagtatt taagcgcctg tttgaatctc acggagcgta 2880
aacggttggt ggcgcagcat ctgacgcacg tgtcgcagac gcaggagcag aacaaagaga 2940
atcagaatcc caattctgat gcgccggtga tcagatcaaa aacttcagcc aggtacatgg 3000
agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg atccaggagg 3060
accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa atcaaggctg 3120
ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac tacctggtgg 3180
gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg gaactaaacg 3240
ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa aagttcggca 3300
agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac atcgcggagg 3360
ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag aactttccct 3420
tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg accgccaagg 3480
tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac cagaaatgca 3540
agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc aacatgtgcg 3600
ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa gaccggatgt 3660
tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc aagcaggaag 3720
tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat gaattctacg 3780
tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata agtgagccca 3840
aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct tcgatcaact 3900
acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg atgctgtttc 3960
cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact cacggacaga 4020
aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc gtcaaaaagg 4080
cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac gcttgcactg 4140
cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa atgatttaaa 4200
tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct ctctgatgaa 4260
gagtaactaa gggcgaattc cagcacactg gcggccgtta ctaggtagct gagcgggccg 4320
ctttcgaatc tagagcctgc agtctcgaca agcttgtcga gaagtactag aggatcataa 4380
tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc 4440
tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 4500
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 4560
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg atctgatcac 4620
tgcttgagcc tagaggcctc gcgagatctt aattaattaa gtaccgactc tgctgaagag 4680
gaggaaattc tccttgaagt ttccctggtg ttcaaagtaa aggagtttgc accagacgca 4740
cctctgttca ctggtccggc gtattaaaac acgatacatt gttattagta catttattaa 4800
gcgctagatt ctgtgcgttg ttgatttaca gacaattgtt gtacgtattt taataattca 4860
ttaaatttat aatctttagg gtggtatgtt agagcgaaaa tcaaatgatt ttcagcgtct 4920
ttatatctga atttaaatat taaatcctca atagatttgt aaaataggtt tcgattagtt 4980
tcaaacaagg gttgtttttc cgaaccgatg gctggactat ctaatggatt ttcgctcaac 5040
gccacaaaac ttgccaaatc ttgtagcagc aatctagctt tgtcgatatt cgtttgtgtt 5100
ttgttttgta ataaaggttc gacgtcgttc aaaatattat gcgcttttgt atttctttca 5160
tcactgtcgt tagtgtacaa ttgactcgac gtaaacacgt taaataaagc ttggacatat 5220
ttaacatcgg gcgtgttagc tttattaggc cgattatcgt cgtcgtccca accctcgtcg 5280
ttagaagttg cttccgaaga cgattttgcc atagccacac gacgcctatt aattgtgtcg 5340
gctaacacgt ccgcgatcaa atttgtagtt gagctttttg gaattatttc tgattgcggg 5400
cgtttttggg cgggtttcaa tctaactgtg cccgatttta attcagacaa cacgttagaa 5460
agcgatggtg caggcggtgg taacatttca gacggcaaat ctactaatgg cggcggtggt 5520
ggagctgatg ataaatctac catcggtgga ggcgcaggcg gggctggcgg cggaggcgga 5580
ggcggaggtg gtggcggtga tgcagacggc ggtttaggct caaatgtctc tttaggcaac 5640
acagtcggca cctcaactat tgtactggtt tcgggcgccg tttttggttt gaccggtctg 5700
agacgagtgc gatttttttc gtttctaata gcttccaaca attgttgtct gtcgtctaaa 5760
ggtgcagcgg gttgaggttc cgtcggcatt ggtggagcgg gcggcaattc agacatcgat 5820
ggtggtggtg gtggtggagg cgctggaatg ttaggcacgg gagaaggtgg tggcggcggt 5880
gccgccggta taatttgttc tggtttagtt tgttcgcgca cgattgtggg caccggcgca 5940
ggcgccgctg gctgcacaac ggaaggtcgt ctgcttcgag gcagcgcttg gggtggtggc 6000
aattcaatat tataattgga atacaaatcg taaaaatctg ctataagcat tgtaatttcg 6060
ctatcgttta ccgtgccgat atttaacaac cgctcaatgt aagcaattgt attgtaaaga 6120
gattgtctca agctcggatc ccgcacgccg ataacaagcc ttttcatttt tactacagca 6180
ttgtagtggc gagacacttc gctgtcgtcg acgtacatgt atgctttgtt gtcaaaaacg 6240
tcgttggcaa gctttaaaat atttaaaaga acatctctgt tcagcaccac tgtgttgtcg 6300
taaatgttgt ttttgataat ttgcgcttcc gcagtatcga cacgttcaaa aaattgatgc 6360
gcatcaattt tgttgttcct attattgaat aaataagatt gtacagattc atatctacga 6420
ttcgtcatgg ccaccacaaa tgctacgctg caaacgctgg tacaatttta cgaaaactgc 6480
aaaaacgtca aaactcggta taaaataatc aacgggcgct ttggcaaaat atctatttta 6540
tcgcacaagc ccactagcaa attgtatttg cagaaaacaa tttcggcgca caattttaac 6600
gctgacgaaa taaaagttca ccagttaatg agcgaccacc caaattttat aaaaatctat 6660
tttaatcacg gttccatcaa caaccaagtg atcgtgatgg actacattga ctgtcccgat 6720
ttatttgaaa cactacaaat taaaggcgag ctttcgtacc aacttgttag caatattatt 6780
agacagctgt gtgaagcgct caacgatttg cacaagcaca atttcataca caacgacata 6840
aaactcgaaa atgtcttata tttcgaagca cttgatcgcg tgtatgtttg cgattacgga 6900
ttgtgcaaac acgaaaactc acttagcgtg cacgacggca cgttggagta ttttagtccg 6960
gaaaaaattc gacacacaac tatgcacgtt tcgtttgact ggtacgcggc gtgttaacat 7020
acaagttgct aaccggcggc cgacacccat ttgaaaaaag cgaagacgaa atgttggact 7080
tgaatagcat gaagcgtcgt cagcaataca atgacattgg cgttttaaaa cacgttcgta 7140
acgttaacgc tcgtgacttt gtgtactgcc taacaagata caacatagat tgtagactca 7200
caaattacaa acaaattata aaacatgagt ttttgtcgta aaaatgccac ttgttttacg 7260
agtagaattc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa 7320
ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga 7380
gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt 7440
gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct 7500
cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 7560
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 7620
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 7680
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 7740
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 7800
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 7860
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 7920
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 7980
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 8040
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 8100
ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta 8160
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 8220
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 8280
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 8340
tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 8400
aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 8460
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg 8520
tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 8580
gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 8640
agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 8700
aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 8760
gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 8820
caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 8880
cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 8940
ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 9000
ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 9060
gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 9120
cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 9180
gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 9240
caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 9300
tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat 9360
acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa 9420
aagtgccacc tgacgtctaa gaaaccatta ttatcatgac attaacctat aaaaataggc 9480
gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 9540
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 9600
gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg gcttaactat gcggcatcag 9660
agcagattgt actgagagtg caccatatgc ggtgtgaaat accgcacaga tgcgtaagga 9720
gaaaataccg catcaggcgc cattcgccat tcaggctgcg caactgttgg gaagggcgat 9780
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 9840
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacc gagttgtttg 9900
cgtacgtgac tagcgaagaa gatgtgtgga ccgcagaaca gatagtaaaa caaaacccta 9960
gtattggagc aataatcgat ttaaccaaca cgtctaaata ttatgatggt gtgcattttt 10020
tgcgggcggg cctgttatac aaaaaaattc aagtacctgg ccagactttg ccgcctgaaa 10080
gcatagttca agaatttatt gacacggtaa aagaatttac agaaaagtgt cccggcatgt 10140
tggtgggcgt gcactgcaca cacggtatta atcgcaccgg ttacatggtg tgcagatatt 10200
taatgcacac cctgggtatt gcgccgcagg aagccataga tagattcgaa aaagccagag 10260
gtcacaaaat tgaaagacaa aattacgttc aagatttatt aatttaatta atattatttg 10320
cattctttaa caaatacttt atcctatttt caaattgttg cgcttcttcc agcgaaccaa 10380
aactatgctt cgcttgctcc gtttagcttg tagccgatca gtggcgttgt tccaatcgac 10440
ggtaggatta ggccggatat tctccaccac aatgttggca acgttgatgt tacgtttatg 10500
cttttggttt tccacgtacg tcttttggcc ggtaatagcc gtaaacgtag tgccgtcgcg 10560
cgtcacgcac aacaccggat gtttgcgctt gtccgcgggg tattgaaccg cgcgatccga 10620
caaatccacc actttggcaa ctaaatcggt gacctgcgcg tcttttttct gcattatttc 10680
gtctttcttt tgcatggttt cctggaagcc ggtgtacatg cggtttagat cagtcatgac 10740
gcgcgtgacc tgcaaatctt tggcctcgat ctgcttgtcc ttgatggcaa cgatgcgttc 10800
aataaactct tgttttttaa caagttcctc ggttttttgc gccaccaccg cttgcagcgc 10860
gtttgtgtgc tcggtgaatg tcgcaatcag cttagtcacc aactgtttgc tctcctcctc 10920
ccgttgtttg atcgcgggat cgtacttgcc ggtgcagagc acttgaggaa ttacttcttc 10980
taaaagccat tcttgtaatt ctatggcgta aggcaatttg gacttcataa tcagctgaat 11040
cacgccggat ttagtaatga gcactgtatg cggctgcaaa tacagcgggt cgcccctttt 11100
cacgacgctg ttagaggtag ggcccccatt ttggatggtc tgctcaaata acgatttgta 11160
tttattgtct acatgaacac gtatagcttt atcacaaact gtatatttta aactgttagc 11220
gacgtccttg gccacgaacc ggacctgttg gtcgcgctct agcacgtacc gcaggttgaa 11280
cgtatcttct ccaaatttaa attctccaat tttaacgcga gccattttga tacacgtgtg 11340
tcgattttgc aacaactatt gttttttaac gcaaactaaa cttattgtgg taagcaataa 11400
ttaaatatgg gggaacatgc gccgctacaa cactcgtcgt tatgaacgca gacggcgccg 11460
gtctcggcgc aagcggctaa aacgtgttgc gcgttcaacg cggcaaacat cgcaaaagcc 11520
aatagtacag ttttgatttg catattaacg gcgatttttt aaattatctt atttaataaa 11580
tagttatgac gcctacaact ccccgcccgc gttgactcgc tgcacctcga gcagttcgtt 11640
gacgccttcc tccgtgtggc cgaacacgtc gagcgggtgg tcgatgacca gcggcgtgcc 11700
gcacgcgacg cacaagtatc tgtacaccga atgatcgtcg ggcgaaggca cgtcggcctc 11760
caagtggcaa tattggcaaa ttcgaaaata tatacagttg ggttgtttgc gcatatctat 11820
cgtggcgttg ggcatgtacg tccgaacgtt gatttgcatg caagccgaaa ttaaatcatt 11880
gcgattagtg cgattaaaac gttgtacatc ctcgctttta atcatgccgt cgattaaatc 11940
gcgcaatcga gtcaagtgat caaagtgtgg aataatgttt tctttgtatt cccgagtcaa 12000
gcgcagcgcg tattttaaca aactagccat cttgtaagtt agtttcattt aatgcaactt 12060
tatccaataa tatattatgt atcgcacgtc aagaattaac aatgcgcccg ttgtcgcatc 12120
tcaacacgac tatgatagag atcaaataaa gcgcgaatta aatagcttgc gacgcaacgt 12180
gcacgatctg tgcacgcgtt ccggcacgag ctttgattgt aataagtttt tacgaagcga 12240
tgacatgacc cccgtagtga caacgatcac gcccaaaaga actgccgact acaaaattac 12300
cgagtatgtc ggtgacgtta aaactattaa gccatccaat cgaccgttag tcgaatcagg 12360
accgctggtg cgagaagccg cgaagtatgg cgaatgcatc gtataacgtg tggagtccgc 12420
tcattagagc gtcatgttta gacaagaaag ctacatattt aattgatccc gatgatttta 12480
ttgataaatt gaccctaact ccatacacgg tattctacaa tggcggggtt ttggtcaaaa 12540
tttccggact gcgattgtac atgctgttaa cggctccgcc cactattaat gaaattaaaa 12600
attccaattt taaaaaacgc agcaagagaa acatttgtat gaaagaatgc gtagaaggaa 12660
agaaaaatgt cgtcgacatg ctgaacaaca agattaatat gcctccgtgt ataaaaaaaa 12720
tattgaacga tttgaaagaa aacaatgtac cgcgcggcgg tatgtacagg aagaggttta 12780
tactaaactg ttacattgca aacgtggttt cgtgtgccaa gtgtgaaaac cgatgtttaa 12840
tcaaggctct gacgcatttc tacaaccacg actccaagtg tgtgggtgaa gtcatgcatc 12900
ttttaatcaa atcccaagat gtgtataaac caccaaactg ccaaaaaatg aaaactgtcg 12960
acaagctctg tccgtttgct ggcaactgca agggtctcaa tcctatttgt aattattgaa 13020
taataaaaca attataaatg ctaaatttgt tttttattaa cgatacaaac caaacgcaac 13080
aagaacattt gtagtattat ctataattga aaacgcgtag ttataatcgc tgaggtaata 13140
tttaaaatca ttttcaaatg attcacagtt aatttgcgac aatataattt tattttcaca 13200
taaactagac gccttgtcgt cttcttcttc gtattccttc tctttttcat ttttctcctc 13260
ataaaaatta acatagttat tatcgtatcc atatatgtat ctatcgtata gagtaaattt 13320
tttgttgtca taaatatata tgtctttttt aatggggtgt atagt 13365
<210> 5
<211> 7311
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 002
<400> 5
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatttggc 1740
cgcgaattca ctagtgattg cggaataatt gccatatgta aatgatgtca tcgttctaac 1800
tcgctttacg agtagaattc tacgtgtaaa acataatcaa gagatgatgt catttgtttt 1860
tcaaaactga actcaagaaa tgatgtcatt tgtttttcaa aactgaactg gctttacgag 1920
cagaattcta cttgtaacgc atgatcaagg gatgatgtca tttgtttttt aaaattgaac 1980
tggctttacg agtagaattc tacttgtaaa acacaatcga gagatgatgt catattttgc 2040
acacggctct aattaaactc gctttacgag taaaattcta cttgtaacgc atgatcaagg 2100
gatgatgtca ttggatgagt catttgtttt tcaaaactaa actcgcttta cgagtagaat 2160
tctacttgta aaacacaatc aagggatgat gtcattatac aaatgatgtc atttgttttt 2220
caaaactaaa ctcgctttac gggtagaatt ctacttgtaa aacacaatcg agggatgatg 2280
tcatccttta cacatgatta taaacgtgtt tatgtatgac tcatttgttt ttcaaaacta 2340
aactcgcttt acgagtagaa ttctacttgt aacgcacgat caagggatga tgtcatttat 2400
ttgtgcaaag ctgatgtcat cttttgcaca cgattataaa cacaatcaaa taatgactca 2460
tttgttttca aaactgaact cgctttacga gtagaattct acttgtaaaa cacaatcaag 2520
ggatgatgtc attttaaaaa tgatgtcatt tgtttttcaa aactaaactc gctttacgag 2580
tagaattcta cgtgtaaaac acaatcaagg gatgatgtca tttactaaaa taaaataatt 2640
atttaaataa aaatgttttt attgtaaaat acacattgat tacacgtgac aatcgaattc 2700
ccgcttgcta gcttcttaag ttagatcttt atgcatttcg gagcgagacc atcatggaga 2760
taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc gtaacagttt 2820
tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca tcgggcgcgg 2880
atcccggtcc gaagcgcgcg gaattcaaag gcctacgtcg acgagctcac tagtaacggc 2940
cgccagtgtg ctggaattcg cccttcgcgg atcctgttaa gacggcgggg ttctacgaga 3000
ttgtgattaa ggtccccagc gaccttgacg agcatctgcc cggcatttct gacagctttg 3060
tgaactgggt ggccgagaag gaatgggagt tgccgccaga ttctgacatg gatctgaatc 3120
tgattgagca ggcacccctg accgtggccg agaagctgca gcgcgacttt ctgacggaat 3180
ggcgccgtgt gagtaaggcc ccggaggccc ttttctttgt gcaatttgag aagggagaga 3240
gctacttcca catgcacgtg ctcgtggaaa ccaccggggt gaaatccatg gttttgggac 3300
gtttcctgag tcagattcgc gaaaaactga ttcagagaat ttaccgcggg atcgagccga 3360
ctttgccaaa ctggttcgcg gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg 3420
tggtggatga gtgctacatc cccaattact tgctccccaa aacccagcct gagctccagt 3480
gggcgtggac taatatggaa cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac 3540
ggttggtggc gcagcatctg acgcacgtgt cgcagacgca ggagcagaac aaagagaatc 3600
agaatcccaa ttctgatgcg ccggtgatca gatcaaaaac ttcagccagg tacatggagc 3660
tggtcgggtg gctcgtggac aaggggatta cctcggagaa gcagtggatc caggaggacc 3720
aggcctcata catctccttc aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct 3780
tggacaatgc gggaaagatt atgagcctga ctaaaaccgc ccccgactac ctggtgggcc 3840
agcagcccgt ggaggacatt tccagcaatc ggatttataa aattttggaa ctaaacgggt 3900
acgatcccca atatgcggct tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga 3960
ggaacaccat ctggctgttt gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca 4020
tagcccacac tgtgcccttc tacgggtgcg taaactggac caatgagaac tttcccttca 4080
acgactgtgt cgacaagatg gtgatctggt gggaggaggg gaagatgacc gccaaggtcg 4140
tggagtcggc caaagccatt ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt 4200
cctcggccca gatagacccg actcccgtga tcgtcacctc caacaccaac atgtgcgccg 4260
tgattgacgg gaactcaacg accttcgaac accagcagcc gttgcaagac cggatgttca 4320
aatttgaact cacccgccgt ctggatcatg actttgggaa ggtcaccaag caggaagtca 4380
aagacttttt ccggtgggca aaggatcacg tggttgaggt ggagcatgaa ttctacgtca 4440
aaaagggtgg agccaagaaa agacccgccc ccagtgacgc agatataagt gagcccaaac 4500
gggtgcgcga gtcagttgcg cagccatcga cgtcagacgc ggaagcttcg atcaactacg 4560
cagacaggta ccaaaacaaa tgttctcgtc acgtgggcat gaatctgatg ctgtttccct 4620
gcagacaatg cgagagaatg aatcagaatt caaatatctg cttcactcac ggacagaaag 4680
actgtttaga gtgctttccc gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt 4740
atcagaaact gtgctacatt catcatatca tgggaaaggt gccagacgct tgcactgcct 4800
gcgatctggt caatgtggat ttggatgact gcatctttga acaataaatg atttaaatca 4860
ggtatggctg ccgatggtta tcttccagat tggctcgagg acactctctc tgatgaagag 4920
taactaaggg cgaattccag cacactggcg gccgttacta ggtagctgag cgggccgctt 4980
tcgaatctag agcctgcagt ctcgacaagc ttgtcgagaa gtactagagg atcataatca 5040
gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac ctccccctga 5100
acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg 5160
gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 5220
ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc ggtctcacca 5280
tgcgtacagc ttgacgcgtg cgtaataact tcgtataatg tatgctatac gaagttatac 5340
tgggcctcat gggccttccg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 5400
ctgcattaac atggtcatag ctgtttcctt gcgtattggg cgctctccgc ttcctcgctc 5460
actgactcgc tgcgctcggt cgttcgggta aagcctgggg tgcctaatga gcaaaaggcc 5520
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5580
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5640
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5700
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5760
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5820
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5880
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5940
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 6000
gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 6060
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6120
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 6180
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 6240
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 6300
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 6360
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 6420
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaacca cgctcaccgg 6480
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6540
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6600
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6660
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6720
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6780
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6840
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6900
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 6960
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 7020
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 7080
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 7140
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 7200
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 7260
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca c 7311
<210> 6
<211> 7640
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 046
<400> 6
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg tctcaggctt aattaatgat 600
gcgatcgccg ttacacgttt atgcgggccg aggcacatgc ggcaggatga cggtccatac 660
cagattcctg ggcacaactc atcggcaacg ttccatcgtc ctgctcctcc acctcgggcg 720
ggaagccatg gctcagtttt ttatagagct catccattcc gagtgttata cctgccgctg 780
tcacaaattc aagcagcacc atgtggtcgc gtttctcgtt cggatccttt gacagttttg 840
attggtatga caaatagtga ttatctggga gcaggactgg tccatctcct ataggggtgt 900
tttgttgata atgatcggca agttgcacgc taccgtcctc tatgttgtgg cgaatcttga 960
aatttacctt tataccgttt ttctgcttgt ctgccataat atagacgttg tgcgagttat 1020
aattgtattc caacttgtgt cccaatatgt ttccatcttc tttgaagtct atgcctttaa 1080
gctcaatacg attcaccaat gtatcgccct cgaacttcac ttcagcccta gtcttataat 1140
taccatcatc cttaaaaaaa atggttcttt cttggacgta accttctggc atcgccgatt 1200
tgaaaaagtc atgttgtttc atgtgatccg ggtagcgagc aaagcactgg agaccgtatc 1260
caaacgtcgt tacgagggta ggccagggca ctggcaattt gcccgtggta cagataaact 1320
tgagggtcag ctttccataa gtagcatcac cttctccctc gcctgacacg ctgaacttgt 1380
gaccattaac gtcgccgtcc agctccacca agataggcac tacaccagtg aaaagctcct 1440
cgcccttcga cactggaccc gggttttctt cgacatcgcc tgcttgtttg agaagtgaaa 1500
agtttgtagc acccgatccg ccttcccaaa cgtaacccga tggcaagagt tcccttattc 1560
ccactgcagt gggctggccg tcgctatcct tgacgatggc tttaatacca gggtgaagat 1620
ccaagagcac ttggcggcac ctaccgcacg gagaaagtat tcctctattc tcgttaccaa 1680
tagccactat gcaagtcaag ttgcctgccg cagccgccgc tgctgttccc aggacgacga 1740
gttcggcgca tggtcctccc gtaaagtggt acacgttgac tccggtgaag atacgtccat 1800
ccgaagacaa tgcggcgctt gcaacactat aatcctctga aataggaatt gagtttatgg 1860
ttgcagtagc acgctcaatc agtgtgctct cttcttgaga cagcggtttc gccatggtgg 1920
cgaccggtag cctcgagtac cggatcctct agcggccgaa cagatgctgt tcaactgtgt 1980
ttaccagatc gttgcgggct gtatttatag gcgcgataag cgggacgggc gcctcgtgtc 2040
cggtcacgcg catgagataa cgcgcggctg atatggaggc gcgtcctgtt ccgataagga 2100
gttgcgtccg gctgcggtta gcaacacagg aagctggcgt cctgtcacga taagacaaca 2160
ctcgtccggt ccgataatgt gattcgtacg tgacaggacg cgacccgata aggccggcct 2220
acgtgactgc cgacacgtac ttttttgcac tgcaaaaagg ttcaatgtgt ggtagtgtat 2280
ttggagcgta tacaacggtg tagactattt atgtaaaata gtctacgaaa cgtagagttt 2340
gtactatgta tgggcccgcg tgcaaaagcg tgtttttttg cagtgcaaaa aagttggtgg 2400
tggggaggcc accgagtata aaggtgcttg ttggcaaaca tgaaaacaca gttcaacaga 2460
attgttgttg aagcaacatt agcaccatac attgtttatc atcatgaata acttcgtata 2520
atgtatgcta tacgaagtta tttgcggccg cttgatatct tcctgcaggt tatcgatttg 2580
ctttacgagt agaattttac ttgtaaaaca caatcaagaa atgatgtcat ttttgtacgt 2640
gattataaac atgtttaaac atggtacatt gaacttaatt tttgcaagtt gataaacatg 2700
attaatgtac gactcatttg tttgtgcaag ttgataaacg tgattaatat atgactcata 2760
tgtttgtgca aaaatgatgt catcgtacaa actcgcttta cgagtagaat tctacttgta 2820
acgcatgatc aagggatgat gtcatttgtt tttttaaaat tcaactcgct ttacgagtag 2880
aattctactt gtaaaacaca atcgagggat gatgtcattt gtagaatgat gtcatttgtt 2940
tttcaaaacc gaactcgctt tacgagtaga attctacttg taacgcaaga tcggtggatg 3000
atgtcatttt aaaaatgatg tcatcgtaca aactcgcttt acgagtagaa ttctacgtgt 3060
aaaacttgct agcttcttaa gttagatctt tatgcattac ggacctttaa ttcaacccaa 3120
cacaatatat tatagttaaa taagaattat tatcaaatca tttgtatatt aattaaaata 3180
ctatactgta aattacattt tatttacaat cactcgacga agacttgatc acccctagat 3240
tcgaaagcgg cccgctcact agtaacggcc gccagtgtgc tggaattcgc ccttcgcgga 3300
tcctgttaag atggcggggt tctacgagat tgtgattaag gtccccagcg accttgacga 3360
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 3420
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 3480
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 3540
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 3600
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 3660
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 3720
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 3780
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 3840
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 3900
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 3960
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 4020
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 4080
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 4140
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 4200
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 4260
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 4320
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 4380
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 4440
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 4500
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 4560
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 4620
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 4680
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 4740
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 4800
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 4860
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 4920
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 4980
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 5040
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 5100
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 5160
catctttgaa caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt 5220
ggctcgagga cactctctct gatgaagagt aactaagggc gaattccagc acactggcgg 5280
ccgttactag gtagctgagc gggccgcttt cgaatctaga gcctgcagtc tcgacaagct 5340
tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc 5400
tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt 5460
tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt 5520
cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt 5580
atcttatcat gtctggatcg gtctcaccat gcgtacagct tgacgcgtgc gtaataactt 5640
cgtataatgt atgctatacg aagttatact gggcctcatg ggccttccgc tcactgcccg 5700
ctttccagtc gggaaacctg tcgtgccagc tgcattaaca tggtcatagc tgtttccttg 5760
cgtattgggc gctctccgct tcctcgctca ctgactcgct gcgctcggtc gttcgggtaa 5820
agcctggggt gcctaatgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 5880
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 5940
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 6000
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 6060
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 6120
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 6180
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 6240
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 6300
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 6360
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 6420
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 6480
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 6540
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 6600
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 6660
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 6720
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 6780
aatgataccg cgagaaccac gctcaccggc tccagattta tcagcaataa accagccagc 6840
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 6900
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 6960
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 7020
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 7080
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 7140
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 7200
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 7260
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 7320
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 7380
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 7440
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 7500
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 7560
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 7620
atttccccga aaagtgccac 7640
<210> 7
<211> 7569
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 047
<400> 7
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg tctcaggctt aattaatgat 600
gcgatcgccg ttacacgttt atgcgggccg aggcacatgc ggcaggatga cggtccatac 660
cagattcctg ggcacaactc atcggcaacg ttccatcgtc ctgctcctcc acctcgggcg 720
ggaagccatg gctcagtttt ttatagagct catccattcc gagtgttata cctgccgctg 780
tcacaaattc aagcagcacc atgtggtcgc gtttctcgtt cggatccttt gacagttttg 840
attggtatga caaatagtga ttatctggga gcaggactgg tccatctcct ataggggtgt 900
tttgttgata atgatcggca agttgcacgc taccgtcctc tatgttgtgg cgaatcttga 960
aatttacctt tataccgttt ttctgcttgt ctgccataat atagacgttg tgcgagttat 1020
aattgtattc caacttgtgt cccaatatgt ttccatcttc tttgaagtct atgcctttaa 1080
gctcaatacg attcaccaat gtatcgccct cgaacttcac ttcagcccta gtcttataat 1140
taccatcatc cttaaaaaaa atggttcttt cttggacgta accttctggc atcgccgatt 1200
tgaaaaagtc atgttgtttc atgtgatccg ggtagcgagc aaagcactgg agaccgtatc 1260
caaacgtcgt tacgagggta ggccagggca ctggcaattt gcccgtggta cagataaact 1320
tgagggtcag ctttccataa gtagcatcac cttctccctc gcctgacacg ctgaacttgt 1380
gaccattaac gtcgccgtcc agctccacca agataggcac tacaccagtg aaaagctcct 1440
cgcccttcga cactggaccc gggttttctt cgacatcgcc tgcttgtttg agaagtgaaa 1500
agtttgtagc acccgatccg ccttcccaaa cgtaacccga tggcaagagt tcccttattc 1560
ccactgcagt gggctggccg tcgctatcct tgacgatggc tttaatacca gggtgaagat 1620
ccaagagcac ttggcggcac ctaccgcacg gagaaagtat tcctctattc tcgttaccaa 1680
tagccactat gcaagtcaag ttgcctgccg cagccgccgc tgctgttccc aggacgacga 1740
gttcggcgca tggtcctccc gtaaagtggt acacgttgac tccggtgaag atacgtccat 1800
ccgaagacaa tgcggcgctt gcaacactat aatcctctga aataggaatt gagtttatgg 1860
ttgcagtagc acgctcaatc agtgtgctct cttcttgaga cagcggtttc gccatggtgg 1920
cgaccggtag cctcgagtac cggatcctct agcggccgaa cagatgctgt tcaactgtgt 1980
ttaccagatc gttgcgggct gtatttatag gcgcgataag cgggacgggc gcctcgtgtc 2040
cggtcacgcg catgagataa cgcgcggctg atatggaggc gcgtcctgtt ccgataagga 2100
gttgcgtccg gctgcggtta gcaacacagg aagctggcgt cctgtcacga taagacaaca 2160
ctcgtccggt ccgataatgt gattcgtacg tgacaggacg cgacccgata aggccggcct 2220
acgtgactgc cgacacgtac ttttttgcac tgcaaaaagg ttcaatgtgt ggtagtgtat 2280
ttggagcgta tacaacggtg tagactattt atgtaaaata gtctacgaaa cgtagagttt 2340
gtactatgta tgggcccgcg tgcaaaagcg tgtttttttg cagtgcaaaa aagttggtgg 2400
tggggaggcc accgagtata aaggtgcttg ttggcaaaca tgaaaacaca gttcaacaga 2460
attgttgttg aagcaacatt agcaccatac attgtttatc atcatgaata acttcgtata 2520
atgtatgcta tacgaagtta tttgcggccg cttgatatct tcctgcaggt tatcgatttg 2580
ctttacgagt agaattttac ttgtaaaaca caatcaagaa atgatgtcat ttttgtacgt 2640
gattataaac atgtttaaac atggtacatt gaacttaatt tttgcaagtt gataaacatg 2700
attaatgtac gactcatttg tttgtgcaag ttgataaacg tgattaatat atgactcata 2760
tgtttgtgca aaaatgatgt catcgtacaa actcgcttta cgagtagaat tctacttgta 2820
acgcatgatc aagggatgat gtcatttgtt tttttaaaat tcaactcgct ttacgagtag 2880
aattctactt gtaaaacaca atcgagggat gatgtcattt gtagaatgat gtcatttgtt 2940
tttcaaaacc gaactcgctt tacgagtaga attctacttg taacgcaaga tcggtggatg 3000
atgtcatttt aaaaatgatg tcatcgtaca aactcgcttt acgagtagaa ttctacgtgt 3060
aaaacttgct agcttcttaa gttagatctt tatgcatatc atggagataa ttaaaatgat 3120
aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt aataaaaaaa 3180
cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc tcggtcgcca 3240
tggcggggtt ctacgagatt gtgattaagg tccccagcga ccttgacgag catctgcccg 3300
gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg ccgccagatt 3360
ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag aagctgcagc 3420
gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt ttctttgtgc 3480
aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc accggggtga 3540
aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt cagagaattt 3600
accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc agaaatggcg 3660
ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg ctccccaaaa 3720
cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc gcctgtttga 3780
atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg cagacgcagg 3840
agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga tcaaaaactt 3900
cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc tcggagaagc 3960
agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc aactcgcggt 4020
cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact aaaaccgccc 4080
ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg atttataaaa 4140
ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg ggatgggcca 4200
cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact accgggaaga 4260
ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta aactggacca 4320
atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg gaggagggga 4380
agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc aaggtgcgcg 4440
tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc gtcacctcca 4500
acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac cagcagccgt 4560
tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac tttgggaagg 4620
tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg gttgaggtgg 4680
agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc agtgacgcag 4740
atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg tcagacgcgg 4800
aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac gtgggcatga 4860
atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca aatatctgct 4920
tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct caacccgttt 4980
ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg ggaaaggtgc 5040
cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc atctttgaac 5100
aataaatgat ttaaatcagg tatggctgcc gatggttatc ttccagattg gctcgaggac 5160
actctctctg atgaagagta actaagggcg aattccagca cactggcggc cgttactagg 5220
tagctgagcg ggccgctttc gaatctagag cctgcagtct cgacaagctt gtcgagaagt 5280
actagaggat cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc 5340
tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt 5400
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 5460
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 5520
tctggatcgg tctcaccatg cgtacagctt gacgcgtgcg taataacttc gtataatgta 5580
tgctatacga agttatactg ggcctcatgg gccttccgct cactgcccgc tttccagtcg 5640
ggaaacctgt cgtgccagct gcattaacat ggtcatagct gtttccttgc gtattgggcg 5700
ctctccgctt cctcgctcac tgactcgctg cgctcggtcg ttcgggtaaa gcctggggtg 5760
cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 5820
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 5880
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 5940
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 6000
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 6060
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 6120
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 6180
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 6240
ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 6300
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 6360
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 6420
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 6480
tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 6540
aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 6600
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg 6660
tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 6720
gagaaccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 6780
agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 6840
aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 6900
gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 6960
caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 7020
cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 7080
ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 7140
ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 7200
gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 7260
cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 7320
gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 7380
caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 7440
tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat 7500
acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa 7560
aagtgccac 7569
<210> 8
<211> 6326
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 015
<400> 8
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatttttg 1740
ctagcttctt aagttagatc tttatgcatt tcggagcgag acctacggac ctttaattca 1800
acccaacaca atatattata gttaaataag aattattatc aaatcatttg tatattaatt 1860
aaaatactat actgtaaatt acattttatt tacaatcact cgacgaagac ttgatcaccc 1920
ctagattcga aagcggcccg ctcactagta acggccgcca gtgtgctgga attcgccctt 1980
cgcggatcct gttaagacgg cggggttcta cgagattgtg attaaggtcc ccagcgacct 2040
tgacgagcat ctgcccggca tttctgacag ctttgtgaac tgggtggccg agaaggaatg 2100
ggagttgccg ccagattctg acatggatct gaatctgatt gagcaggcac ccctgaccgt 2160
ggccgagaag ctgcagcgcg actttctgac ggaatggcgc cgtgtgagta aggccccgga 2220
ggcccttttc tttgtgcaat ttgagaaggg agagagctac ttccacatgc acgtgctcgt 2280
ggaaaccacc ggggtgaaat ccatggtttt gggacgtttc ctgagtcaga ttcgcgaaaa 2340
actgattcag agaatttacc gcgggatcga gccgactttg ccaaactggt tcgcggtcac 2400
aaagaccaga aatggcgccg gaggcgggaa caaggtggtg gatgagtgct acatccccaa 2460
ttacttgctc cccaaaaccc agcctgagct ccagtgggcg tggactaata tggaacagta 2520
tttaagcgcc tgtttgaatc tcacggagcg taaacggttg gtggcgcagc atctgacgca 2580
cgtgtcgcag acgcaggagc agaacaaaga gaatcagaat cccaattctg atgcgccggt 2640
gatcagatca aaaacttcag ccaggtacat ggagctggtc gggtggctcg tggacaaggg 2700
gattacctcg gagaagcagt ggatccagga ggaccaggcc tcatacatct ccttcaatgc 2760
ggcctccaac tcgcggtccc aaatcaaggc tgccttggac aatgcgggaa agattatgag 2820
cctgactaaa accgcccccg actacctggt gggccagcag cccgtggagg acatttccag 2880
caatcggatt tataaaattt tggaactaaa cgggtacgat ccccaatatg cggcttccgt 2940
ctttctggga tgggccacga aaaagttcgg caagaggaac accatctggc tgtttgggcc 3000
tgcaactacc gggaagacca acatcgcgga ggccatagcc cacactgtgc ccttctacgg 3060
gtgcgtaaac tggaccaatg agaactttcc cttcaacgac tgtgtcgaca agatggtgat 3120
ctggtgggag gaggggaaga tgaccgccaa ggtcgtggag tcggccaaag ccattctcgg 3180
aggaagcaag gtgcgcgtgg accagaaatg caagtcctcg gcccagatag acccgactcc 3240
cgtgatcgtc acctccaaca ccaacatgtg cgccgtgatt gacgggaact caacgacctt 3300
cgaacaccag cagccgttgc aagaccggat gttcaaattt gaactcaccc gccgtctgga 3360
tcatgacttt gggaaggtca ccaagcagga agtcaaagac tttttccggt gggcaaagga 3420
tcacgtggtt gaggtggagc atgaattcta cgtcaaaaag ggtggagcca agaaaagacc 3480
cgcccccagt gacgcagata taagtgagcc caaacgggtg cgcgagtcag ttgcgcagcc 3540
atcgacgtca gacgcggaag cttcgatcaa ctacgcagac aggtaccaaa acaaatgttc 3600
tcgtcacgtg ggcatgaatc tgatgctgtt tccctgcaga caatgcgaga gaatgaatca 3660
gaattcaaat atctgcttca ctcacggaca gaaagactgt ttagagtgct ttcccgtgtc 3720
agaatctcaa cccgtttctg tcgtcaaaaa ggcgtatcag aaactgtgct acattcatca 3780
tatcatggga aaggtgccag acgcttgcac tgcctgcgat ctggtcaatg tggatttgga 3840
tgactgcatc tttgaacaat aaatgattta aatcaggtat ggctgccgat ggttatcttc 3900
cagattggct cgaggacact ctctctgatg aagagtaact aagggcgaat tccagcacac 3960
tggcggccgt tactaggtag ctgagcgggc cgctttcgaa tctagagcct gcagtctcga 4020
caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt 4080
acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 4140
tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 4200
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 4260
caatgtatct tatcatgtct ggatcggtct caccatgcgt acagcttgac gcgtgcgtaa 4320
taacttcgta taatgtatgc tatacgaagt tatactgggc ctcatgggcc ttccgctcac 4380
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 4440
tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 4500
gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 4560
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 4620
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 4680
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 4740
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 4800
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 4860
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 4920
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 4980
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 5040
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 5100
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 5160
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 5220
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 5280
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 5340
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 5400
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 5460
tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 5520
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 5580
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 5640
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 5700
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 5760
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 5820
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 5880
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 5940
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 6000
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 6060
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 6120
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 6180
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 6240
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 6300
gcgcacattt ccccgaaaag tgccac 6326
<210> 9
<211> 7986
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 020
<400> 9
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatttggc 1740
cgcgaattca ctagtgattg cggaataatt gccatatgta aatgatgtca tcgttctaac 1800
tcgctttacg agtagaattc tacgtgtaaa acataatcaa gagatgatgt catttgtttt 1860
tcaaaactga actcaagaaa tgatgtcatt tgtttttcaa aactgaactg gctttacgag 1920
cagaattcta cttgtaacgc atgatcaagg gatgatgtca tttgtttttt aaaattgaac 1980
tggctttacg agtagaattc tacttgtaaa acacaatcga gagatgatgt catattttgc 2040
acacggctct aattaaactc gctttacgag taaaattcta cttgtaacgc atgatcaagg 2100
gatgatgtca ttggatgagt catttgtttt tcaaaactaa actcgcttta cgagtagaat 2160
tctacttgta aaacacaatc aagggatgat gtcattatac aaatgatgtc atttgttttt 2220
caaaactaaa ctcgctttac gggtagaatt ctacttgtaa aacacaatcg agggatgatg 2280
tcatccttta cacatgatta taaacgtgtt tatgtatgac tcatttgttt ttcaaaacta 2340
aactcgcttt acgagtagaa ttctacttgt aacgcacgat caagggatga tgtcatttat 2400
ttgtgcaaag ctgatgtcat cttttgcaca cgattataaa cacaatcaaa taatgactca 2460
tttgttttca aaactgaact cgctttacga gtagaattct acttgtaaaa cacaatcaag 2520
ggatgatgtc attttaaaaa tgatgtcatt tgtttttcaa aactaaactc gctttacgag 2580
tagaattcta cgtgtaaaac acaatcaagg gatgatgtca tttactaaaa taaaataatt 2640
atttaaataa aaatgttttt attgtaaaat acacattgat tacacgtgac aatcgaattc 2700
ccgcttgcta gcttcttaag ttagatcttt atgcatttcg gagcgagacc aaggctgtct 2760
tgctgtgtgc ccgtcgcgcg taccggagcg cgaacgcgcc cgccgccgac ataaacgaca 2820
cttttctaga aaaaatttcc ataccacgag gtcatcgcga ttgttgcgac gcaaaagttt 2880
acgaaactgc cgtgcgcgag tttgtggaag aaactggccg gttttttgac agcgcgttca 2940
tctacaagtt tccatttacg ttacaatgga aagacgacgg tgtcacttac aagtatttga 3000
tatacgtagg cgtcgtgcgc ggcaacttga ttgacgtgaa cgccaaaccc aacacgtaca 3060
ccgtgaagtt gttgccgggc acgtttggca acgactatcg tataatgtta aaaccgcgac 3120
gcttcaattg cgaaataacg cgcagcctgg ccatcgtgcc gctcaacaaa tattttaatt 3180
atatgaacga caaacaattg atcacgtacg attacagcaa ttacattgaa ttttttagtt 3240
ttgtgcgcag catcaagaag cgtttcgata ataggcaatt gcaagacttt ttctacgcca 3300
ctctaaaaaa gatagacaac aacgatgccc cccaaaaatt gcacgcactt aggcgggtgt 3360
aattcggact gcttgacccg aagcgaaata caagcgctgt tcagggaagc catcaacacg 3420
ctcaagcaca caatgaatac agaagacgtc tgcgcgcaca tgttggacat cgtgtcgttt 3480
gagcgtataa aagaatatat aagagctaat ttaggccatt tcacagtaat taccgacaaa 3540
tgttctaagc gtaaggtgtg tcttcatcac aaacgaattg ccaggctgtt gggcattaaa 3600
aaaatatatc atcaagaata caagcgggtc gtttcaaagg tttacaaaaa tcaaacacgg 3660
cggggttcta cgagattgtg attaaggtcc ccagcgacct tgacgagcat ctgcccggca 3720
tttctgacag ctttgtgaac tgggtggccg agaaggaatg ggagttgccg ccagattctg 3780
acatggatct gaatctgatt gagcaggcac ccctgaccgt ggccgagaag ctgcagcgcg 3840
actttctgac ggaatggcgc cgtgtgagta aggccccgga ggcccttttc tttgtgcaat 3900
ttgagaaggg agagagctac ttccacatgc acgtgctcgt ggaaaccacc ggggtgaaat 3960
ccatggtttt gggacgtttc ctgagtcaga ttcgcgaaaa actgattcag agaatttacc 4020
gcgggatcga gccgactttg ccaaactggt tcgcggtcac aaagaccaga aatggcgccg 4080
gaggcgggaa caaggtggtg gatgagtgct acatccccaa ttacttgctc cccaaaaccc 4140
agcctgagct ccagtgggcg tggactaata tggaacagta tttaagcgcc tgtttgaatc 4200
tcacggagcg taaacggttg gtggcgcagc atctgacgca cgtgtcgcag acgcaggagc 4260
agaacaaaga gaatcagaat cccaattctg atgcgccggt gatcagatca aaaacttcag 4320
ccaggtacat ggagctggtc gggtggctcg tggacaaggg gattacctcg gagaagcagt 4380
ggatccagga ggaccaggcc tcatacatct ccttcaatgc ggcctccaac tcgcggtccc 4440
aaatcaaggc tgccttggac aatgcgggaa agattatgag cctgactaaa accgcccccg 4500
actacctggt gggccagcag cccgtggagg acatttccag caatcggatt tataaaattt 4560
tggaactaaa cgggtacgat ccccaatatg cggcttccgt ctttctggga tgggccacga 4620
aaaagttcgg caagaggaac accatctggc tgtttgggcc tgcaactacc gggaagacca 4680
acatcgcgga ggccatagcc cacactgtgc ccttctacgg gtgcgtaaac tggaccaatg 4740
agaactttcc cttcaacgac tgtgtcgaca agatggtgat ctggtgggag gaggggaaga 4800
tgaccgccaa ggtcgtggag tcggccaaag ccattctcgg aggaagcaag gtgcgcgtgg 4860
accagaaatg caagtcctcg gcccagatag acccgactcc cgtgatcgtc acctccaaca 4920
ccaacatgtg cgccgtgatt gacgggaact caacgacctt cgaacaccag cagccgttgc 4980
aagaccggat gttcaaattt gaactcaccc gccgtctgga tcatgacttt gggaaggtca 5040
ccaagcagga agtcaaagac tttttccggt gggcaaagga tcacgtggtt gaggtggagc 5100
atgaattcta cgtcaaaaag ggtggagcca agaaaagacc cgcccccagt gacgcagata 5160
taagtgagcc caaacgggtg cgcgagtcag ttgcgcagcc atcgacgtca gacgcggaag 5220
cttcgatcaa ctacgcagac aggtaccaaa acaaatgttc tcgtcacgtg ggcatgaatc 5280
tgatgctgtt tccctgcaga caatgcgaga gaatgaatca gaattcaaat atctgcttca 5340
ctcacggaca gaaagactgt ttagagtgct ttcccgtgtc agaatctcaa cccgtttctg 5400
tcgtcaaaaa ggcgtatcag aaactgtgct acattcatca tatcatggga aaggtgccag 5460
acgcttgcac tgcctgcgat ctggtcaatg tggatttgga tgactgcatc tttgaacaat 5520
aaatgattta aatcaggtat ggctgccgat ggttatcttc cagattggct cgaggacact 5580
ctctctgatg aagagtaact aagggcgaat tccagcacac tggcggccgt tactaggtag 5640
ctgagcgggc cgctttcgaa tctagagcct gcagtctcga caagcttgtc gagaagtact 5700
agaggatcat aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 5760
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 5820
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 5880
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 5940
ggatcggtct caccatgcgt acagcttgac gcgtgcgtaa taacttcgta taatgtatgc 6000
tatacgaagt tatactgggc ctcatgggcc ttccgctcac tgcccgcttt ccagtcggga 6060
aacctgtcgt gccagctgca ttaacatggt catagctgtt tccttgcgta ttgggcgctc 6120
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc gggtaaagcc tggggtgcct 6180
aatgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6240
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6300
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6360
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6420
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6480
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6540
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6600
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6660
actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 6720
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6780
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6840
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 6900
tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 6960
caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7020
cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7080
agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7140
aaccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7200
gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7260
ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7320
tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7380
ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7440
tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7500
attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7560
agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7620
ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7680
ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7740
cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7800
gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7860
tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 7920
tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 7980
tgccac 7986
<210> 10
<211> 10046
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 050
<400> 10
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740
gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800
cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860
ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920
ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980
ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040
ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100
ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160
tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220
gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280
gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340
ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400
cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460
acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520
gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580
ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640
tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700
cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760
gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820
cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880
aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940
acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000
cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060
ctttatcgac aagccaaccc accaattcca tgtttaaatt gtgtaattta tgtagctgta 3120
atttttacct tattaatatt ttttacgctt tgcattcgac gactgaactc ccaaatatat 3180
gtttaactcg tcttggtcgt ttgaattttt gttgctgtgt ttcctaatat tttccatcac 3240
cttaaatatg ttattgtaat cctcaatgtt gaactgccca tgaccactaa aatagagctg 3300
agcctagtcg cgtgatttga cttaagattt cggtctgtac gactatagtt tcgtgagata 3360
aactggatcg gcaatttgct agacgatctg gcacagaaag acacagacga aggactcact 3420
atggaatggc ggcttcggcc gccaatgatg gatcccagcg gaagtaggaa gcgatgtggc 3480
ctgaggaata cgtctgtcat tgcgtttaga taaggcatcc cgctggaaag ggaaccagta 3540
ctttgtaaag gagctagagg ttctctttat gctctgtggt tcgtgcggtt cttaaaagca 3600
aacgacgagc gaacaggtgc gtgggcgaga gggcaccctc atttctaagt acgatcaggt 3660
ggactacgat tgcattttat gggttccctg cggctgtcac gctaaatcac tcggagaatg 3720
gcaatgcaat cgactactag caatgaccca ctgaccgaaa tggagcataa cgggtcgttt 3780
tacacgtaga attctactcg taaagcgagt ttgtacgatg acatcatttt taaaatgaca 3840
tcatccaccg atcttgcgtt acaagtagaa ttctactcgt aaagcgagtt cggttttgaa 3900
aaacaaatga catcattcta caaatgacat catccctcga ttgtgtttta caagtagaat 3960
tctactcgta aagcgagttg aattttaaaa aaacaaatga catcatccct tgatcatgcg 4020
ttacaagtag aattctactc gtaaagcgag tttgtacgat gacatcattt ttgcacaaac 4080
atatgagtca tatattaatc acgtttatca acttgcacaa acaaatgagt cgtacattaa 4140
tcatgtttat caacttgcaa aaattaagtt caatgtacca tgtttaaaca tgtttataat 4200
cacgtacaaa aatgacatca tttcttgatt gtgttttaca agtaaaattc tactcgtaaa 4260
gcttttggtc cgcccgagcg gtgcaaccga ttaggaccat gtacagcatt tgttacaagt 4320
cttctagtaa acacaatctt cctgctcagt ggcgcatgat tatcgttgtt gcaagccagc 4380
gtggtaagta acagcaccac tgcgagccta atgtgccctt tccacgaaca cagggctgtc 4440
cgatcctata ttaggactcc gcaatggggt tagcaagtcg caccctaaac gatgttgaag 4500
actcgcgatg tacatgctct ggtacaatac atacgtgttc cggctgttat cctgcatcgg 4560
aacctcaatc atgcatcgca ccagcgtatt cgtgtcatct aggagtgtcg cgtaggataa 4620
ataattcaat taagatgtcg ttatgctagt atacgcctac ccgtcaccgg ccatctgtgt 4680
gcagatgagt cgacgagtta ctggccctga tttctccgct tctaatacca cacactgggc 4740
aatacgagct caagccagtc tcttttgcta gcttcttaag ttagatcttt atgcatttcg 4800
gagcgagacc aaggctgtct tgctgtgtgc ccgtcgcgcg taccggagcg cgaacgcgcc 4860
cgccgccgac ataaacgaca cttttctaga aaaaatttcc ataccacgag gtcatcgcga 4920
ttgttgcgac gcaaaagttt acgaaactgc cgtgcgcgag tttgtggaag aaactggccg 4980
gttttttgac agcgcgttca tctacaagtt tccatttacg ttacaatgga aagacgacgg 5040
tgtcacttac aagtatttga tatacgtagg cgtcgtgcgc ggcaacttga ttgacgtgaa 5100
cgccaaaccc aacacgtaca ccgtgaagtt gttgccgggc acgtttggca acgactatcg 5160
tataatgtta aaaccgcgac gcttcaattg cgaaataacg cgcagcctgg ccatcgtgcc 5220
gctcaacaaa tattttaatt atatgaacga caaacaattg atcacgtacg attacagcaa 5280
ttacattgaa ttttttagtt ttgtgcgcag catcaagaag cgtttcgata ataggcaatt 5340
gcaagacttt ttctacgcca ctctaaaaaa gatagacaac aacgatgccc cccaaaaatt 5400
gcacgcactt aggcgggtgt aattcggact gcttgacccg aagcgaaata caagcgctgt 5460
tcagggaagc catcaacacg ctcaagcaca caatgaatac agaagacgtc tgcgcgcaca 5520
tgttggacat cgtgtcgttt gagcgtataa aagaatatat aagagctaat ttaggccatt 5580
tcacagtaat taccgacaaa tgttctaagc gtaaggtgtg tcttcatcac aaacgaattg 5640
ccaggctgtt gggcattaaa aaaatatatc atcaagaata caagcgggtc gtttcaaagg 5700
tttacaaaaa tcaaacacgg cggggttcta cgagattgtg attaaggtcc ccagcgacct 5760
tgacgagcat ctgcccggca tttctgacag ctttgtgaac tgggtggccg agaaggaatg 5820
ggagttgccg ccagattctg acatggatct gaatctgatt gagcaggcac ccctgaccgt 5880
ggccgagaag ctgcagcgcg actttctgac ggaatggcgc cgtgtgagta aggccccgga 5940
ggcccttttc tttgtgcaat ttgagaaggg agagagctac ttccacatgc acgtgctcgt 6000
ggaaaccacc ggggtgaaat ccatggtttt gggacgtttc ctgagtcaga ttcgcgaaaa 6060
actgattcag agaatttacc gcgggatcga gccgactttg ccaaactggt tcgcggtcac 6120
aaagaccaga aatggcgccg gaggcgggaa caaggtggtg gatgagtgct acatccccaa 6180
ttacttgctc cccaaaaccc agcctgagct ccagtgggcg tggactaata tggaacagta 6240
tttaagcgcc tgtttgaatc tcacggagcg taaacggttg gtggcgcagc atctgacgca 6300
cgtgtcgcag acgcaggagc agaacaaaga gaatcagaat cccaattctg atgcgccggt 6360
gatcagatca aaaacttcag ccaggtacat ggagctggtc gggtggctcg tggacaaggg 6420
gattacctcg gagaagcagt ggatccagga ggaccaggcc tcatacatct ccttcaatgc 6480
ggcctccaac tcgcggtccc aaatcaaggc tgccttggac aatgcgggaa agattatgag 6540
cctgactaaa accgcccccg actacctggt gggccagcag cccgtggagg acatttccag 6600
caatcggatt tataaaattt tggaactaaa cgggtacgat ccccaatatg cggcttccgt 6660
ctttctggga tgggccacga aaaagttcgg caagaggaac accatctggc tgtttgggcc 6720
tgcaactacc gggaagacca acatcgcgga ggccatagcc cacactgtgc ccttctacgg 6780
gtgcgtaaac tggaccaatg agaactttcc cttcaacgac tgtgtcgaca agatggtgat 6840
ctggtgggag gaggggaaga tgaccgccaa ggtcgtggag tcggccaaag ccattctcgg 6900
aggaagcaag gtgcgcgtgg accagaaatg caagtcctcg gcccagatag acccgactcc 6960
cgtgatcgtc acctccaaca ccaacatgtg cgccgtgatt gacgggaact caacgacctt 7020
cgaacaccag cagccgttgc aagaccggat gttcaaattt gaactcaccc gccgtctgga 7080
tcatgacttt gggaaggtca ccaagcagga agtcaaagac tttttccggt gggcaaagga 7140
tcacgtggtt gaggtggagc atgaattcta cgtcaaaaag ggtggagcca agaaaagacc 7200
cgcccccagt gacgcagata taagtgagcc caaacgggtg cgcgagtcag ttgcgcagcc 7260
atcgacgtca gacgcggaag cttcgatcaa ctacgcagac aggtaccaaa acaaatgttc 7320
tcgtcacgtg ggcatgaatc tgatgctgtt tccctgcaga caatgcgaga gaatgaatca 7380
gaattcaaat atctgcttca ctcacggaca gaaagactgt ttagagtgct ttcccgtgtc 7440
agaatctcaa cccgtttctg tcgtcaaaaa ggcgtatcag aaactgtgct acattcatca 7500
tatcatggga aaggtgccag acgcttgcac tgcctgcgat ctggtcaatg tggatttgga 7560
tgactgcatc tttgaacaat aaatgattta aatcaggtat ggctgccgat ggttatcttc 7620
cagattggct cgaggacact ctctctgatg aagagtaact aagggcgaat tccagcacac 7680
tggcggccgt tactaggtag ctgagcgggc cgctttcgaa tctagagcct gcagtctcga 7740
caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt 7800
acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 7860
tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 7920
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 7980
caatgtatct tatcatgtct ggatcggtct caccatgcgt acagcttgac gcgtgcgtaa 8040
taacttcgta taatgtatgc tatacgaagt tatactgggc ctcatgggcc ttccgctcac 8100
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 8160
tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 8220
gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 8280
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 8340
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 8400
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 8460
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 8520
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8580
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8640
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8700
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8760
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8820
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8880
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8940
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 9000
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 9060
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 9120
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 9180
tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 9240
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 9300
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 9360
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 9420
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 9480
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9540
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9600
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9660
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9720
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9780
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9840
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9900
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9960
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 10020
gcgcacattt ccccgaaaag tgccac 10046
<210> 11
<211> 9979
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 051
<400> 11
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740
gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800
cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860
ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920
ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980
ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040
ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100
ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160
tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220
gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280
gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340
ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400
cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460
acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520
gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580
ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640
tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700
cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760
gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820
cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880
aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940
acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000
cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060
ctttatcgac aagccaaccc accaattcca ttatattgta gcaaaaattt aatttttgcc 3120
aaaagactta ataaatcatc agcaatggac aacaaagtaa ataaaaaatt tacaaagcat 3180
aatagagagg tttattgatt attgaacagc ccatgaccac taaaatagag ctgagcctag 3240
tcgcgtgatt tgacttaaga tttcggtctg tacgactata gtttcgtgag ataaactgga 3300
tcggcaattt gctagacgat ctggcacaga aagacacaga cgaaggactc actatggaat 3360
ggcggcttcg gccgccaatg atggatccca gcggaagtag gaagcgatgt ggcctgagga 3420
atacgtctgt cattgcgttt agataaggca tcccgctgga aagggaacca gtactttgta 3480
aaggagctag aggttctctt tatgctctgt ggttcgtgcg gttcttaaaa gcaaacgacg 3540
agcgaacagg tgcgtgggcg agagggcacc ctcatttcta agtacgatca ggtggactac 3600
gattgcattt tatgggttcc ctgcggctgt cacgctaaat cactcggaga atggcaatgc 3660
aatcgactac tagcaatgac ccactgaccg aaatggagca taacgggtcg ttttacacgt 3720
agaattctac tcgtaaagcg agtttgtacg atgacatcat ttttaaaatg acatcatcca 3780
ccgatcttgc gttacaagta gaattctact cgtaaagcga gttcggtttt gaaaaacaaa 3840
tgacatcatt ctacaaatga catcatccct cgattgtgtt ttacaagtag aattctactc 3900
gtaaagcgag ttgaatttta aaaaaacaaa tgacatcatc ccttgatcat gcgttacaag 3960
tagaattcta ctcgtaaagc gagtttgtac gatgacatca tttttgcaca aacatatgag 4020
tcatatatta atcacgttta tcaacttgca caaacaaatg agtcgtacat taatcatgtt 4080
tatcaacttg caaaaattaa gttcaatgta ccatgtttaa acatgtttat aatcacgtac 4140
aaaaatgaca tcatttcttg attgtgtttt acaagtaaaa ttctactcgt aaagcttttg 4200
gtccgcccga gcggtgcaac cgattaggac catgtacagc atttgttaca agtcttctag 4260
taaacacaat cttcctgctc agtggcgcat gattatcgtt gttgcaagcc agcgtggtaa 4320
gtaacagcac cactgcgagc ctaatgtgcc ctttccacga acacagggct gtccgatcct 4380
atattaggac tccgcaatgg ggttagcaag tcgcacccta aacgatgttg aagactcgcg 4440
atgtacatgc tctggtacaa tacatacgtg ttccggctgt tatcctgcat cggaacctca 4500
atcatgcatc gcaccagcgt attcgtgtca tctaggagtg tcgcgtagga taaataattc 4560
aattaagatg tcgttatgct agtatacgcc tacccgtcac cggccatctg tgtgcagatg 4620
agtcgacgag ttactggccc tgatttctcc gcttctaata ccacacactg ggcaatacga 4680
gctcaagcca gtctcttttg ctagcttctt aagttagatc tttatgcatt tcggagcgag 4740
accaaggctg tcttgctgtg tgcccgtcgc gcgtaccgga gcgcgaacgc gcccgccgcc 4800
gacataaacg acacttttct agaaaaaatt tccataccac gaggtcatcg cgattgttgc 4860
gacgcaaaag tttacgaaac tgccgtgcgc gagtttgtgg aagaaactgg ccggtttttt 4920
gacagcgcgt tcatctacaa gtttccattt acgttacaat ggaaagacga cggtgtcact 4980
tacaagtatt tgatatacgt aggcgtcgtg cgcggcaact tgattgacgt gaacgccaaa 5040
cccaacacgt acaccgtgaa gttgttgccg ggcacgtttg gcaacgacta tcgtataatg 5100
ttaaaaccgc gacgcttcaa ttgcgaaata acgcgcagcc tggccatcgt gccgctcaac 5160
aaatatttta attatatgaa cgacaaacaa ttgatcacgt acgattacag caattacatt 5220
gaatttttta gttttgtgcg cagcatcaag aagcgtttcg ataataggca attgcaagac 5280
tttttctacg ccactctaaa aaagatagac aacaacgatg ccccccaaaa attgcacgca 5340
cttaggcggg tgtaattcgg actgcttgac ccgaagcgaa atacaagcgc tgttcaggga 5400
agccatcaac acgctcaagc acacaatgaa tacagaagac gtctgcgcgc acatgttgga 5460
catcgtgtcg tttgagcgta taaaagaata tataagagct aatttaggcc atttcacagt 5520
aattaccgac aaatgttcta agcgtaaggt gtgtcttcat cacaaacgaa ttgccaggct 5580
gttgggcatt aaaaaaatat atcatcaaga atacaagcgg gtcgtttcaa aggtttacaa 5640
aaatcaaaca cggcggggtt ctacgagatt gtgattaagg tccccagcga ccttgacgag 5700
catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 5760
ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 5820
aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 5880
ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 5940
accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 6000
cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 6060
agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 6120
ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 6180
gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 6240
cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 6300
tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 6360
tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 6420
aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 6480
aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 6540
atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 6600
ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 6660
accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 6720
aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 6780
gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 6840
aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 6900
gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 6960
cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 7020
tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 7080
gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 7140
agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 7200
tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 7260
gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 7320
aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 7380
caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 7440
ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 7500
atctttgaac aataaatgat ttaaatcagg tatggctgcc gatggttatc ttccagattg 7560
gctcgaggac actctctctg atgaagagta actaagggcg aattccagca cactggcggc 7620
cgttactagg tagctgagcg ggccgctttc gaatctagag cctgcagtct cgacaagctt 7680
gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt tttacttgct 7740
ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt 7800
gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 7860
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 7920
tcttatcatg tctggatcgg tctcaccatg cgtacagctt gacgcgtgcg taataacttc 7980
gtataatgta tgctatacga agttatactg ggcctcatgg gccttccgct cactgcccgc 8040
tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct gtttccttgc 8100
gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg ttcgggtaaa 8160
gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 8220
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 8280
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 8340
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 8400
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 8460
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 8520
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 8580
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 8640
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 8700
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 8760
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 8820
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 8880
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 8940
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 9000
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 9060
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 9120
atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 9180
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 9240
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 9300
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 9360
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 9420
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 9480
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 9540
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 9600
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 9660
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 9720
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 9780
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 9840
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 9900
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 9960
tttccccgaa aagtgccac 9979
<210> 12
<211> 10101
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 052
<400> 12
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740
gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800
cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860
ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920
ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980
ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040
ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100
ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160
tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220
gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280
gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340
ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400
cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460
acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520
gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580
ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640
tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700
cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760
gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820
cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880
aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940
acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000
cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060
ctttatcgac aagccaaccc accaattcca tcttaacagg atccgcgaag ggcgaattcc 3120
agcacactgg cggccgttac tagtgagcgg gccgctttcg aatctagggg tgatcaagtc 3180
ttcgtcgagt gattgtaaat aaaatgtaat ttacagtata gtattttaat taatatacaa 3240
atgatttgat aataattctt atttaactat aatatattgt gttgggttga attaaaggtc 3300
cgtagcccat gaccactaaa atagagctga gcctagtcgc gtgatttgac ttaagatttc 3360
ggtctgtacg actatagttt cgtgagataa actggatcgg caatttgcta gacgatctgg 3420
cacagaaaga cacagacgaa ggactcacta tggaatggcg gcttcggccg ccaatgatgg 3480
atcccagcgg aagtaggaag cgatgtggcc tgaggaatac gtctgtcatt gcgtttagat 3540
aaggcatccc gctggaaagg gaaccagtac tttgtaaagg agctagaggt tctctttatg 3600
ctctgtggtt cgtgcggttc ttaaaagcaa acgacgagcg aacaggtgcg tgggcgagag 3660
ggcaccctca tttctaagta cgatcaggtg gactacgatt gcattttatg ggttccctgc 3720
ggctgtcacg ctaaatcact cggagaatgg caatgcaatc gactactagc aatgacccac 3780
tgaccgaaat ggagcataac gggtcgtttt acacgtagaa ttctactcgt aaagcgagtt 3840
tgtacgatga catcattttt aaaatgacat catccaccga tcttgcgtta caagtagaat 3900
tctactcgta aagcgagttc ggttttgaaa aacaaatgac atcattctac aaatgacatc 3960
atccctcgat tgtgttttac aagtagaatt ctactcgtaa agcgagttga attttaaaaa 4020
aacaaatgac atcatccctt gatcatgcgt tacaagtaga attctactcg taaagcgagt 4080
ttgtacgatg acatcatttt tgcacaaaca tatgagtcat atattaatca cgtttatcaa 4140
cttgcacaaa caaatgagtc gtacattaat catgtttatc aacttgcaaa aattaagttc 4200
aatgtaccat gtttaaacat gtttataatc acgtacaaaa atgacatcat ttcttgattg 4260
tgttttacaa gtaaaattct actcgtaaag cggaccagga ccaggaccgc tttacgagta 4320
gaattctacg cgtaaaacac aatcaagtat gagtcataat ctgatgtcat gttttgtaca 4380
cggctcataa ccgaactggc tttacgagta gaattctact tgtaatgcac gatcagtgga 4440
tgatgtcatt tgtttttcaa atcgagatga tgtcatgttt tgcacacggc tcataaactc 4500
gctttacgag tagaattcta cgtgtaacgc acgatcgatt gatgagtcat ttgttttgca 4560
atatgatatc atacaatatg actcatttgt ttttcaaaac cgaacttgat ttacgggtag 4620
aattctactt gtaaagcaca atcaaaaaga tgatgtcatt tgtttttcaa aactgaactc 4680
gctttacgag tagaattcta cgtgtaaaac acaatcaaga aatgatgtca tttgttataa 4740
aaataaaagc tgatgtcatg ttttgcacat ggctcataac taaactcgct ttacgggtag 4800
aattctacgc gtaaaacttt tgctagcttc ttaagttaga tctttatgca tttcggagcg 4860
agaccaaggc tgtcttgctg tgtgcccgtc gcgcgtaccg gagcgcgaac gcgcccgccg 4920
ccgacataaa cgacactttt ctagaaaaaa tttccatacc acgaggtcat cgcgattgtt 4980
gcgacgcaaa agtttacgaa actgccgtgc gcgagtttgt ggaagaaact ggccggtttt 5040
ttgacagcgc gttcatctac aagtttccat ttacgttaca atggaaagac gacggtgtca 5100
cttacaagta tttgatatac gtaggcgtcg tgcgcggcaa cttgattgac gtgaacgcca 5160
aacccaacac gtacaccgtg aagttgttgc cgggcacgtt tggcaacgac tatcgtataa 5220
tgttaaaacc gcgacgcttc aattgcgaaa taacgcgcag cctggccatc gtgccgctca 5280
acaaatattt taattatatg aacgacaaac aattgatcac gtacgattac agcaattaca 5340
ttgaattttt tagttttgtg cgcagcatca agaagcgttt cgataatagg caattgcaag 5400
actttttcta cgccactcta aaaaagatag acaacaacga tgccccccaa aaattgcacg 5460
cacttaggcg ggtgtaattc ggactgcttg acccgaagcg aaatacaagc gctgttcagg 5520
gaagccatca acacgctcaa gcacacaatg aatacagaag acgtctgcgc gcacatgttg 5580
gacatcgtgt cgtttgagcg tataaaagaa tatataagag ctaatttagg ccatttcaca 5640
gtaattaccg acaaatgttc taagcgtaag gtgtgtcttc atcacaaacg aattgccagg 5700
ctgttgggca ttaaaaaaat atatcatcaa gaatacaagc gggtcgtttc aaaggtttac 5760
aaaaatcaaa cacggcgggg ttctacgaga ttgtgattaa ggtccccagc gaccttgacg 5820
agcatctgcc cggcatttct gacagctttg tgaactgggt ggccgagaag gaatgggagt 5880
tgccgccaga ttctgacatg gatctgaatc tgattgagca ggcacccctg accgtggccg 5940
agaagctgca gcgcgacttt ctgacggaat ggcgccgtgt gagtaaggcc ccggaggccc 6000
ttttctttgt gcaatttgag aagggagaga gctacttcca catgcacgtg ctcgtggaaa 6060
ccaccggggt gaaatccatg gttttgggac gtttcctgag tcagattcgc gaaaaactga 6120
ttcagagaat ttaccgcggg atcgagccga ctttgccaaa ctggttcgcg gtcacaaaga 6180
ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc cccaattact 6240
tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa cagtatttaa 6300
gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg acgcacgtgt 6360
cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg ccggtgatca 6420
gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac aaggggatta 6480
cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc aatgcggcct 6540
ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt atgagcctga 6600
ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt tccagcaatc 6660
ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct tccgtctttc 6720
tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt gggcctgcaa 6780
ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc tacgggtgcg 6840
taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg gtgatctggt 6900
gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt ctcggaggaa 6960
gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg actcccgtga 7020
tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg accttcgaac 7080
accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt ctggatcatg 7140
actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg 7200
tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccgccc 7260
ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg cagccatcga 7320
cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa tgttctcgtc 7380
acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg aatcagaatt 7440
caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc gtgtcagaat 7500
ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt catcatatca 7560
tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat ttggatgact 7620
gcatctttga acaataaatg atttaaatca ggtatggctg ccgatggtta tcttccagat 7680
tggctcgagg acactctctc tgatgaagag taactaaggg cgaattccag cacactggcg 7740
gccgttacta ggtagctgag cgggccgctt tcgaatctag agcctgcagt ctcgacaagc 7800
ttgtcgagaa gtactagagg atcataatca gccataccac atttgtagag gttttacttg 7860
ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg 7920
ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 7980
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 8040
tatcttatca tgtctggatc ggtctcacca tgcgtacagc ttgacgcgtg cgtaataact 8100
tcgtataatg tatgctatac gaagttatac tgggcctcat gggccttccg ctcactgccc 8160
gctttccagt cgggaaacct gtcgtgccag ctgcattaac atggtcatag ctgtttcctt 8220
gcgtattggg cgctctccgc ttcctcgctc actgactcgc tgcgctcggt cgttcgggta 8280
aagcctgggg tgcctaatga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 8340
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 8400
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 8460
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 8520
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 8580
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 8640
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 8700
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 8760
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 8820
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 8880
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 8940
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 9000
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 9060
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 9120
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 9180
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 9240
caatgatacc gcgagaacca cgctcaccgg ctccagattt atcagcaata aaccagccag 9300
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 9360
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 9420
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 9480
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 9540
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 9600
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 9660
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 9720
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 9780
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 9840
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 9900
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 9960
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 10020
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 10080
catttccccg aaaagtgcca c 10101
<210> 13
<211> 10072
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 053
<400> 13
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740
gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800
cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860
ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920
ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980
ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040
ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100
ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160
tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220
gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280
gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340
ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400
cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460
acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520
gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580
ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640
tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700
cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760
gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820
cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880
aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940
acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000
cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060
ctttatcgac aagccaaccc accaattcca tgtttaaatt gtgtaattta tgtagctgta 3120
atttttacct tattaatatt ttttacgctt tgcattcgac gactgaactc ccaaatatat 3180
gtttaactcg tcttggtcgt ttgaattttt gttgctgtgt ttcctaatat tttccatcac 3240
cttaaatatg ttattgtaat cctcaatgtt gaactgccca tgaccactaa aatagagctg 3300
agcctagtcg cgtgatttga cttaagattt cggtctgtac gactatagtt tcgtgagata 3360
aactggatcg gcaatttgct agacgatctg gcacagaaag acacagacga aggactcact 3420
atggaatggc ggcttcggcc gccaatgatg gatcccagcg gaagtaggaa gcgatgtggc 3480
ctgaggaata cgtctgtcat tgcgtttaga taaggcatcc cgctggaaag ggaaccagta 3540
ctttgtaaag gagctagagg ttctctttat gctctgtggt tcgtgcggtt cttaaaagca 3600
aacgacgagc gaacaggtgc gtgggcgaga gggcaccctc atttctaagt acgatcaggt 3660
ggactacgat tgcattttat gggttccctg cggctgtcac gctaaatcac tcggagaatg 3720
gcaatgcaat cgactactag caatgaccca ctgaccgaaa tggagcataa cgggtcgttt 3780
tacacgtaga attctactcg taaagcgagt ttgtacgatg acatcatttt taaaatgaca 3840
tcatccaccg atcttgcgtt acaagtagaa ttctactcgt aaagcgagtt cggttttgaa 3900
aaacaaatga catcattcta caaatgacat catccctcga ttgtgtttta caagtagaat 3960
tctactcgta aagcgagttg aattttaaaa aaacaaatga catcatccct tgatcatgcg 4020
ttacaagtag aattctactc gtaaagcgag tttgtacgat gacatcattt ttgcacaaac 4080
atatgagtca tatattaatc acgtttatca acttgcacaa acaaatgagt cgtacattaa 4140
tcatgtttat caacttgcaa aaattaagtt caatgtacca tgtttaaaca tgtttataat 4200
cacgtacaaa aatgacatca tttcttgatt gtgttttaca agtaaaattc tactcgtaaa 4260
gcggaccagg accaggaccg ctttacgagt agaattctac gcgtaaaaca caatcaagta 4320
tgagtcataa tctgatgtca tgttttgtac acggctcata accgaactgg ctttacgagt 4380
agaattctac ttgtaatgca cgatcagtgg atgatgtcat ttgtttttca aatcgagatg 4440
atgtcatgtt ttgcacacgg ctcataaact cgctttacga gtagaattct acgtgtaacg 4500
cacgatcgat tgatgagtca tttgttttgc aatatgatat catacaatat gactcatttg 4560
tttttcaaaa ccgaacttga tttacgggta gaattctact tgtaaagcac aatcaaaaag 4620
atgatgtcat ttgtttttca aaactgaact cgctttacga gtagaattct acgtgtaaaa 4680
cacaatcaag aaatgatgtc atttgttata aaaataaaag ctgatgtcat gttttgcaca 4740
tggctcataa ctaaactcgc tttacgggta gaattctacg cgtaaaactt ttgctagctt 4800
cttaagttag atctttatgc atttcggagc gagaccaagg ctgtcttgct gtgtgcccgt 4860
cgcgcgtacc ggagcgcgaa cgcgcccgcc gccgacataa acgacacttt tctagaaaaa 4920
atttccatac cacgaggtca tcgcgattgt tgcgacgcaa aagtttacga aactgccgtg 4980
cgcgagtttg tggaagaaac tggccggttt tttgacagcg cgttcatcta caagtttcca 5040
tttacgttac aatggaaaga cgacggtgtc acttacaagt atttgatata cgtaggcgtc 5100
gtgcgcggca acttgattga cgtgaacgcc aaacccaaca cgtacaccgt gaagttgttg 5160
ccgggcacgt ttggcaacga ctatcgtata atgttaaaac cgcgacgctt caattgcgaa 5220
ataacgcgca gcctggccat cgtgccgctc aacaaatatt ttaattatat gaacgacaaa 5280
caattgatca cgtacgatta cagcaattac attgaatttt ttagttttgt gcgcagcatc 5340
aagaagcgtt tcgataatag gcaattgcaa gactttttct acgccactct aaaaaagata 5400
gacaacaacg atgcccccca aaaattgcac gcacttaggc gggtgtaatt cggactgctt 5460
gacccgaagc gaaatacaag cgctgttcag ggaagccatc aacacgctca agcacacaat 5520
gaatacagaa gacgtctgcg cgcacatgtt ggacatcgtg tcgtttgagc gtataaaaga 5580
atatataaga gctaatttag gccatttcac agtaattacc gacaaatgtt ctaagcgtaa 5640
ggtgtgtctt catcacaaac gaattgccag gctgttgggc attaaaaaaa tatatcatca 5700
agaatacaag cgggtcgttt caaaggttta caaaaatcaa acacggcggg gttctacgag 5760
attgtgatta aggtccccag cgaccttgac gagcatctgc ccggcatttc tgacagcttt 5820
gtgaactggg tggccgagaa ggaatgggag ttgccgccag attctgacat ggatctgaat 5880
ctgattgagc aggcacccct gaccgtggcc gagaagctgc agcgcgactt tctgacggaa 5940
tggcgccgtg tgagtaaggc cccggaggcc cttttctttg tgcaatttga gaagggagag 6000
agctacttcc acatgcacgt gctcgtggaa accaccgggg tgaaatccat ggttttggga 6060
cgtttcctga gtcagattcg cgaaaaactg attcagagaa tttaccgcgg gatcgagccg 6120
actttgccaa actggttcgc ggtcacaaag accagaaatg gcgccggagg cgggaacaag 6180
gtggtggatg agtgctacat ccccaattac ttgctcccca aaacccagcc tgagctccag 6240
tgggcgtgga ctaatatgga acagtattta agcgcctgtt tgaatctcac ggagcgtaaa 6300
cggttggtgg cgcagcatct gacgcacgtg tcgcagacgc aggagcagaa caaagagaat 6360
cagaatccca attctgatgc gccggtgatc agatcaaaaa cttcagccag gtacatggag 6420
ctggtcgggt ggctcgtgga caaggggatt acctcggaga agcagtggat ccaggaggac 6480
caggcctcat acatctcctt caatgcggcc tccaactcgc ggtcccaaat caaggctgcc 6540
ttggacaatg cgggaaagat tatgagcctg actaaaaccg cccccgacta cctggtgggc 6600
cagcagcccg tggaggacat ttccagcaat cggatttata aaattttgga actaaacggg 6660
tacgatcccc aatatgcggc ttccgtcttt ctgggatggg ccacgaaaaa gttcggcaag 6720
aggaacacca tctggctgtt tgggcctgca actaccggga agaccaacat cgcggaggcc 6780
atagcccaca ctgtgccctt ctacgggtgc gtaaactgga ccaatgagaa ctttcccttc 6840
aacgactgtg tcgacaagat ggtgatctgg tgggaggagg ggaagatgac cgccaaggtc 6900
gtggagtcgg ccaaagccat tctcggagga agcaaggtgc gcgtggacca gaaatgcaag 6960
tcctcggccc agatagaccc gactcccgtg atcgtcacct ccaacaccaa catgtgcgcc 7020
gtgattgacg ggaactcaac gaccttcgaa caccagcagc cgttgcaaga ccggatgttc 7080
aaatttgaac tcacccgccg tctggatcat gactttggga aggtcaccaa gcaggaagtc 7140
aaagactttt tccggtgggc aaaggatcac gtggttgagg tggagcatga attctacgtc 7200
aaaaagggtg gagccaagaa aagacccgcc cccagtgacg cagatataag tgagcccaaa 7260
cgggtgcgcg agtcagttgc gcagccatcg acgtcagacg cggaagcttc gatcaactac 7320
gcagacaggt accaaaacaa atgttctcgt cacgtgggca tgaatctgat gctgtttccc 7380
tgcagacaat gcgagagaat gaatcagaat tcaaatatct gcttcactca cggacagaaa 7440
gactgtttag agtgctttcc cgtgtcagaa tctcaacccg tttctgtcgt caaaaaggcg 7500
tatcagaaac tgtgctacat tcatcatatc atgggaaagg tgccagacgc ttgcactgcc 7560
tgcgatctgg tcaatgtgga tttggatgac tgcatctttg aacaataaat gatttaaatc 7620
aggtatggct gccgatggtt atcttccaga ttggctcgag gacactctct ctgatgaaga 7680
gtaactaagg gcgaattcca gcacactggc ggccgttact aggtagctga gcgggccgct 7740
ttcgaatcta gagcctgcag tctcgacaag cttgtcgaga agtactagag gatcataatc 7800
agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca cctccccctg 7860
aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat 7920
ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 7980
tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat cggtctcacc 8040
atgcgtacag cttgacgcgt gcgtaataac ttcgtataat gtatgctata cgaagttata 8100
ctgggcctca tgggccttcc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 8160
gctgcattaa catggtcata gctgtttcct tgcgtattgg gcgctctccg cttcctcgct 8220
cactgactcg ctgcgctcgg tcgttcgggt aaagcctggg gtgcctaatg agcaaaaggc 8280
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 8340
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 8400
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 8460
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 8520
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 8580
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 8640
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 8700
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 8760
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 8820
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 8880
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 8940
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 9000
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 9060
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 9120
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 9180
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaacc acgctcaccg 9240
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 9300
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 9360
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 9420
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 9480
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 9540
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 9600
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 9660
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 9720
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 9780
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 9840
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 9900
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 9960
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 10020
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc ac 10072
<210> 14
<211> 10005
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 054
<400> 14
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740
gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800
cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860
ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920
ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980
ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040
ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100
ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160
tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220
gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280
gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340
ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400
cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460
acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520
gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580
ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640
tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700
cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760
gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820
cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880
aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940
acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000
cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060
ctttatcgac aagccaaccc accaattcca ttatattgta gcaaaaattt aatttttgcc 3120
aaaagactta ataaatcatc agcaatggac aacaaagtaa ataaaaaatt tacaaagcat 3180
aatagagagg tttattgatt attgaacagc ccatgaccac taaaatagag ctgagcctag 3240
tcgcgtgatt tgacttaaga tttcggtctg tacgactata gtttcgtgag ataaactgga 3300
tcggcaattt gctagacgat ctggcacaga aagacacaga cgaaggactc actatggaat 3360
ggcggcttcg gccgccaatg atggatccca gcggaagtag gaagcgatgt ggcctgagga 3420
atacgtctgt cattgcgttt agataaggca tcccgctgga aagggaacca gtactttgta 3480
aaggagctag aggttctctt tatgctctgt ggttcgtgcg gttcttaaaa gcaaacgacg 3540
agcgaacagg tgcgtgggcg agagggcacc ctcatttcta agtacgatca ggtggactac 3600
gattgcattt tatgggttcc ctgcggctgt cacgctaaat cactcggaga atggcaatgc 3660
aatcgactac tagcaatgac ccactgaccg aaatggagca taacgggtcg ttttacacgt 3720
agaattctac tcgtaaagcg agtttgtacg atgacatcat ttttaaaatg acatcatcca 3780
ccgatcttgc gttacaagta gaattctact cgtaaagcga gttcggtttt gaaaaacaaa 3840
tgacatcatt ctacaaatga catcatccct cgattgtgtt ttacaagtag aattctactc 3900
gtaaagcgag ttgaatttta aaaaaacaaa tgacatcatc ccttgatcat gcgttacaag 3960
tagaattcta ctcgtaaagc gagtttgtac gatgacatca tttttgcaca aacatatgag 4020
tcatatatta atcacgttta tcaacttgca caaacaaatg agtcgtacat taatcatgtt 4080
tatcaacttg caaaaattaa gttcaatgta ccatgtttaa acatgtttat aatcacgtac 4140
aaaaatgaca tcatttcttg attgtgtttt acaagtaaaa ttctactcgt aaagcggacc 4200
aggaccagga ccgctttacg agtagaattc tacgcgtaaa acacaatcaa gtatgagtca 4260
taatctgatg tcatgttttg tacacggctc ataaccgaac tggctttacg agtagaattc 4320
tacttgtaat gcacgatcag tggatgatgt catttgtttt tcaaatcgag atgatgtcat 4380
gttttgcaca cggctcataa actcgcttta cgagtagaat tctacgtgta acgcacgatc 4440
gattgatgag tcatttgttt tgcaatatga tatcatacaa tatgactcat ttgtttttca 4500
aaaccgaact tgatttacgg gtagaattct acttgtaaag cacaatcaaa aagatgatgt 4560
catttgtttt tcaaaactga actcgcttta cgagtagaat tctacgtgta aaacacaatc 4620
aagaaatgat gtcatttgtt ataaaaataa aagctgatgt catgttttgc acatggctca 4680
taactaaact cgctttacgg gtagaattct acgcgtaaaa cttttgctag cttcttaagt 4740
tagatcttta tgcatttcgg agcgagacca aggctgtctt gctgtgtgcc cgtcgcgcgt 4800
accggagcgc gaacgcgccc gccgccgaca taaacgacac ttttctagaa aaaatttcca 4860
taccacgagg tcatcgcgat tgttgcgacg caaaagttta cgaaactgcc gtgcgcgagt 4920
ttgtggaaga aactggccgg ttttttgaca gcgcgttcat ctacaagttt ccatttacgt 4980
tacaatggaa agacgacggt gtcacttaca agtatttgat atacgtaggc gtcgtgcgcg 5040
gcaacttgat tgacgtgaac gccaaaccca acacgtacac cgtgaagttg ttgccgggca 5100
cgtttggcaa cgactatcgt ataatgttaa aaccgcgacg cttcaattgc gaaataacgc 5160
gcagcctggc catcgtgccg ctcaacaaat attttaatta tatgaacgac aaacaattga 5220
tcacgtacga ttacagcaat tacattgaat tttttagttt tgtgcgcagc atcaagaagc 5280
gtttcgataa taggcaattg caagactttt tctacgccac tctaaaaaag atagacaaca 5340
acgatgcccc ccaaaaattg cacgcactta ggcgggtgta attcggactg cttgacccga 5400
agcgaaatac aagcgctgtt cagggaagcc atcaacacgc tcaagcacac aatgaataca 5460
gaagacgtct gcgcgcacat gttggacatc gtgtcgtttg agcgtataaa agaatatata 5520
agagctaatt taggccattt cacagtaatt accgacaaat gttctaagcg taaggtgtgt 5580
cttcatcaca aacgaattgc caggctgttg ggcattaaaa aaatatatca tcaagaatac 5640
aagcgggtcg tttcaaaggt ttacaaaaat caaacacggc ggggttctac gagattgtga 5700
ttaaggtccc cagcgacctt gacgagcatc tgcccggcat ttctgacagc tttgtgaact 5760
gggtggccga gaaggaatgg gagttgccgc cagattctga catggatctg aatctgattg 5820
agcaggcacc cctgaccgtg gccgagaagc tgcagcgcga ctttctgacg gaatggcgcc 5880
gtgtgagtaa ggccccggag gcccttttct ttgtgcaatt tgagaaggga gagagctact 5940
tccacatgca cgtgctcgtg gaaaccaccg gggtgaaatc catggttttg ggacgtttcc 6000
tgagtcagat tcgcgaaaaa ctgattcaga gaatttaccg cgggatcgag ccgactttgc 6060
caaactggtt cgcggtcaca aagaccagaa atggcgccgg aggcgggaac aaggtggtgg 6120
atgagtgcta catccccaat tacttgctcc ccaaaaccca gcctgagctc cagtgggcgt 6180
ggactaatat ggaacagtat ttaagcgcct gtttgaatct cacggagcgt aaacggttgg 6240
tggcgcagca tctgacgcac gtgtcgcaga cgcaggagca gaacaaagag aatcagaatc 6300
ccaattctga tgcgccggtg atcagatcaa aaacttcagc caggtacatg gagctggtcg 6360
ggtggctcgt ggacaagggg attacctcgg agaagcagtg gatccaggag gaccaggcct 6420
catacatctc cttcaatgcg gcctccaact cgcggtccca aatcaaggct gccttggaca 6480
atgcgggaaa gattatgagc ctgactaaaa ccgcccccga ctacctggtg ggccagcagc 6540
ccgtggagga catttccagc aatcggattt ataaaatttt ggaactaaac gggtacgatc 6600
cccaatatgc ggcttccgtc tttctgggat gggccacgaa aaagttcggc aagaggaaca 6660
ccatctggct gtttgggcct gcaactaccg ggaagaccaa catcgcggag gccatagccc 6720
acactgtgcc cttctacggg tgcgtaaact ggaccaatga gaactttccc ttcaacgact 6780
gtgtcgacaa gatggtgatc tggtgggagg aggggaagat gaccgccaag gtcgtggagt 6840
cggccaaagc cattctcgga ggaagcaagg tgcgcgtgga ccagaaatgc aagtcctcgg 6900
cccagataga cccgactccc gtgatcgtca cctccaacac caacatgtgc gccgtgattg 6960
acgggaactc aacgaccttc gaacaccagc agccgttgca agaccggatg ttcaaatttg 7020
aactcacccg ccgtctggat catgactttg ggaaggtcac caagcaggaa gtcaaagact 7080
ttttccggtg ggcaaaggat cacgtggttg aggtggagca tgaattctac gtcaaaaagg 7140
gtggagccaa gaaaagaccc gcccccagtg acgcagatat aagtgagccc aaacgggtgc 7200
gcgagtcagt tgcgcagcca tcgacgtcag acgcggaagc ttcgatcaac tacgcagaca 7260
ggtaccaaaa caaatgttct cgtcacgtgg gcatgaatct gatgctgttt ccctgcagac 7320
aatgcgagag aatgaatcag aattcaaata tctgcttcac tcacggacag aaagactgtt 7380
tagagtgctt tcccgtgtca gaatctcaac ccgtttctgt cgtcaaaaag gcgtatcaga 7440
aactgtgcta cattcatcat atcatgggaa aggtgccaga cgcttgcact gcctgcgatc 7500
tggtcaatgt ggatttggat gactgcatct ttgaacaata aatgatttaa atcaggtatg 7560
gctgccgatg gttatcttcc agattggctc gaggacactc tctctgatga agagtaacta 7620
agggcgaatt ccagcacact ggcggccgtt actaggtagc tgagcgggcc gctttcgaat 7680
ctagagcctg cagtctcgac aagcttgtcg agaagtacta gaggatcata atcagccata 7740
ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga 7800
aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca 7860
aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 7920
gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatcggtctc accatgcgta 7980
cagcttgacg cgtgcgtaat aacttcgtat aatgtatgct atacgaagtt atactgggcc 8040
tcatgggcct tccgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 8100
taacatggtc atagctgttt ccttgcgtat tgggcgctct ccgcttcctc gctcactgac 8160
tcgctgcgct cggtcgttcg ggtaaagcct ggggtgccta atgagcaaaa ggccagcaaa 8220
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 8280
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 8340
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 8400
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 8460
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 8520
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 8580
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 8640
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 8700
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 8760
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 8820
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 8880
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 8940
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 9000
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 9060
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 9120
gcttaccatc tggccccagt gctgcaatga taccgcgaga accacgctca ccggctccag 9180
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 9240
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 9300
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 9360
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 9420
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 9480
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 9540
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 9600
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 9660
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 9720
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 9780
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 9840
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 9900
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 9960
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccac 10005
<210> 15
<211> 1194
<212> DNA
<213> Artificial Sequence
<220>
<223> Extreme codon optimized Rep52
<400> 15
atggaattgg tgggttggct tgtcgataaa ggcataacga gcgaaaaaca atggattcaa 60
gaagatcaag catcctatat tagctttaac gctgcgagta atagcagaag ccagataaaa 120
gcagcgttgg acaacgctgg taagatcatg tcgcttacaa agacggcgcc ggactatctc 180
gtcggtcaac aaccagttga ggacataagt tcaaacagaa tttacaagat cttggagctc 240
aatggttatg accctcagta cgctgcgtct gtattcctcg gatgggctac aaagaaattt 300
ggtaaacgca atactatttg gctcttcggt ccagccacaa ccggcaaaac taatattgcc 360
gaagctattg ctcataccgt cccattttat ggttgtgtga attggactaa cgaaaatttc 420
ccttttaatg attgcgtgga taaaatggtc atatggtggg aagaaggtaa aatgacagct 480
aaagtggttg aatccgcgaa ggcaatcctg ggtggttcca aagtccgtgt cgatcaaaag 540
tgtaaaagct ccgctcaaat cgatcctacc ccggtaattg ttacgagtaa tactaatatg 600
tgcgcagtta ttgacggtaa ctcgacgacg tttgaacatc aacaacccct ccaggataga 660
atgtttaagt ttgagctgac tagacgcctc gaccacgatt tcggtaaagt tactaaacag 720
gaggtgaagg atttctttcg ctgggctaaa gaccatgtcg tagaagtcga gcacgagttt 780
tatgttaaga aaggaggtgc taaaaagcgt cctgctccta gcgatgctga catctccgaa 840
cctaagcgtg tccgtgaaag cgtcgcacaa cctagcacca gcgatgctga ggcctccatt 900
aattatgctg atcgttatca gaataagtgc agccgccatg tcggtatgaa cctcatgctc 960
ttcccttgtc gtcagtgtga acgtatgaac caaaactcaa acatatgttt tacccatggt 1020
caaaaggact gcctggagtg cttccctgta agtgaatcgc aacctgtaag tgtggtaaag 1080
aaagcgtacc aaaagctctg ttatatccac cacattatgg gcaaagtacc ggatgcctgt 1140
accgcgtgtg accttgtgaa cgttgacctg gacgattgta tattcgagca gtaa 1194
<210> 16
<211> 8316
<212> DNA
<213> Artificial Sequence
<220>
<223> pCLD 011
<400> 16
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420
cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480
ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540
gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600
gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660
caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720
acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780
agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840
gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900
tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960
gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020
gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080
accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140
accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200
gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260
tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320
cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380
gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440
ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500
actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560
gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620
tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680
gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatttggc 1740
cgcgaattca ctagtgattg cggaataatt gccatatgta aatgatgtca tcgttctaac 1800
tcgctttacg agtagaattc tacgtgtaaa acataatcaa gagatgatgt catttgtttt 1860
tcaaaactga actcaagaaa tgatgtcatt tgtttttcaa aactgaactg gctttacgag 1920
cagaattcta cttgtaacgc atgatcaagg gatgatgtca tttgtttttt aaaattgaac 1980
tggctttacg agtagaattc tacttgtaaa acacaatcga gagatgatgt catattttgc 2040
acacggctct aattaaactc gctttacgag taaaattcta cttgtaacgc atgatcaagg 2100
gatgatgtca ttggatgagt catttgtttt tcaaaactaa actcgcttta cgagtagaat 2160
tctacttgta aaacacaatc aagggatgat gtcattatac aaatgatgtc atttgttttt 2220
caaaactaaa ctcgctttac gggtagaatt ctacttgtaa aacacaatcg agggatgatg 2280
tcatccttta cacatgatta taaacgtgtt tatgtatgac tcatttgttt ttcaaaacta 2340
aactcgcttt acgagtagaa ttctacttgt aacgcacgat caagggatga tgtcatttat 2400
ttgtgcaaag ctgatgtcat cttttgcaca cgattataaa cacaatcaaa taatgactca 2460
tttgttttca aaactgaact cgctttacga gtagaattct acttgtaaaa cacaatcaag 2520
ggatgatgtc attttaaaaa tgatgtcatt tgtttttcaa aactaaactc gctttacgag 2580
tagaattcta cgtgtaaaac acaatcaagg gatgatgtca tttactaaaa taaaataatt 2640
atttaaataa aaatgttttt attgtaaaat acacattgat tacacgtgac aatcgaattc 2700
ccgcttgcta gcttcttaag ttagatctga cccgttatgc tccatttcgg tcagtgggtc 2760
attgctagta gtcgattgca ttgccattct ccgagtgatt tagcgtgaca gccgcaggga 2820
acccataaaa tgcaatcgta gtccacctga tcgtacttag aaatgagggt gccctctcgc 2880
ccacgcacct gttcgctcgt cgtttgcttt taagaaccgc acgaaccaca gagcataaag 2940
agaacctcta gctcctttac aaagtactgg ttccctttcc agcgggatgc cttatctaaa 3000
cgcaatgaca gacgtattcc tcaggccaca tcgcttccta cttccgctgg gatccatcat 3060
tggcggccga agccgccatt ccatagtgag tccttcgtct gtgtctttct gtgccagatc 3120
gtctagcaaa ttgccgatcc agtttatctc acgaaactat agtcgtacag accgaaatct 3180
taagtcaaat cacgcgacta ggctcagctc tattttagtg gtcatgggtt ttggtccgcc 3240
cgagcggtgc aaccgattag gaccatgtac agcatttgtt acaagtcttc tagtaaacac 3300
aatcttcctg ctcagtggcg catgattatc gttgttgcta gccagcgtgg taagtaacag 3360
caccactgcg agcctaatgt gccctttcca cgaacacagg gctgtccgat cctatattag 3420
gactccgcaa tggggttagc aagtcgcacc ctaaacgatg ttgaagactc gcgatgtaca 3480
tgctctggta caatacatac gtgttccggc tgttatcctg catcggaacc tcaatcatgc 3540
atcgcaccag cgtattcgtg tcatctagga gtgtcgcgta ggataaataa ttcaattaag 3600
atgtcgttat gctagtatac gcctacccgt caccggccat ctgtgtgcag atgagtcgac 3660
gagttactgg ccctgatttc tccgcttcta ataccacaca ctgggcaata cgagctcaag 3720
ccagtctcga tctttatgca tttcggagcg agaccatcat ggagataatt aaaatgataa 3780
ccatctcgca aataaataag tattttactg ttttcgtaac agttttgtaa taaaaaaacc 3840
tataaatatt ccggattatt cataccgtcc caccatcggg cgcggatccc ggtccgaagc 3900
gcgcggaatt caaaggccta cgtcgacgag ctcactagta acggccgcca gtgtgctgga 3960
attcgccctt cgcggatcct gttaagatgg cggggttcta cgagattgtg attaaggtcc 4020
ccagcgacct tgacgagcat ctgcccggca tttctgacag ctttgtgaac tgggtggccg 4080
agaaggaatg ggagttgccg ccagattctg acatggatct gaatctgatt gagcaggcac 4140
ccctgaccgt ggccgagaag ctgcagcgcg actttctgac ggaatggcgc cgtgtgagta 4200
aggccccgga ggcccttttc tttgtgcaat ttgagaaggg agagagctac ttccacatgc 4260
acgtgctcgt ggaaaccacc ggggtgaaat ccatggtttt gggacgtttc ctgagtcaga 4320
ttcgcgaaaa actgattcag agaatttacc gcgggatcga gccgactttg ccaaactggt 4380
tcgcggtcac aaagaccaga aatggcgccg gaggcgggaa caaggtggtg gatgagtgct 4440
acatccccaa ttacttgctc cccaaaaccc agcctgagct ccagtgggcg tggactaata 4500
tggaacagta tttaagcgcc tgtttgaatc tcacggagcg taaacggttg gtggcgcagc 4560
atctgacgca cgtgtcgcag acgcaggagc agaacaaaga gaatcagaat cccaattctg 4620
atgcgccggt gatcagatca aaaacttcag ccaggtacat ggagctggtc gggtggctcg 4680
tggacaaggg gattacctcg gagaagcagt ggatccagga ggaccaggcc tcatacatct 4740
ccttcaatgc ggcctccaac tcgcggtccc aaatcaaggc tgccttggac aatgcgggaa 4800
agattatgag cctgactaaa accgcccccg actacctggt gggccagcag cccgtggagg 4860
acatttccag caatcggatt tataaaattt tggaactaaa cgggtacgat ccccaatatg 4920
cggcttccgt ctttctggga tgggccacga aaaagttcgg caagaggaac accatctggc 4980
tgtttgggcc tgcaactacc gggaagacca acatcgcgga ggccatagcc cacactgtgc 5040
ccttctacgg gtgcgtaaac tggaccaatg agaactttcc cttcaacgac tgtgtcgaca 5100
agatggtgat ctggtgggag gaggggaaga tgaccgccaa ggtcgtggag tcggccaaag 5160
ccattctcgg aggaagcaag gtgcgcgtgg accagaaatg caagtcctcg gcccagatag 5220
acccgactcc cgtgatcgtc acctccaaca ccaacatgtg cgccgtgatt gacgggaact 5280
caacgacctt cgaacaccag cagccgttgc aagaccggat gttcaaattt gaactcaccc 5340
gccgtctgga tcatgacttt gggaaggtca ccaagcagga agtcaaagac tttttccggt 5400
gggcaaagga tcacgtggtt gaggtggagc atgaattcta cgtcaaaaag ggtggagcca 5460
agaaaagacc cgcccccagt gacgcagata taagtgagcc caaacgggtg cgcgagtcag 5520
ttgcgcagcc atcgacgtca gacgcggaag cttcgatcaa ctacgcagac aggtaccaaa 5580
acaaatgttc tcgtcacgtg ggcatgaatc tgatgctgtt tccctgcaga caatgcgaga 5640
gaatgaatca gaattcaaat atctgcttca ctcacggaca gaaagactgt ttagagtgct 5700
ttcccgtgtc agaatctcaa cccgtttctg tcgtcaaaaa ggcgtatcag aaactgtgct 5760
acattcatca tatcatggga aaggtgccag acgcttgcac tgcctgcgat ctggtcaatg 5820
tggatttgga tgactgcatc tttgaacaat aaatgattta aatcaggtat ggctgccgat 5880
ggttatcttc cagattggct cgaggacact ctctctgatg aagagtaact aagggcgaat 5940
tccagcacac tggcggccgt tactaggtag ctgagcgggc cgctttcgaa tctagagcct 6000
gcagtctcga caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg 6060
tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa 6120
tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca 6180
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 6240
ccaaactcat caatgtatct tatcatgtct ggatcggtct caccatgcgt acagcttgac 6300
gcgtgcgtaa taacttcgta taatgtatgc tatacgaagt tatactgggc ctcatgggcc 6360
ttccgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt 6420
catagctgtt tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc 6480
tcggtcgttc gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga 6540
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 6600
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 6660
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 6720
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 6780
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 6840
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 6900
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 6960
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 7020
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 7080
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 7140
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 7200
acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga 7260
tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt 7320
ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt 7380
catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat 7440
ctggccccag tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag 7500
caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct 7560
ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt 7620
tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg 7680
cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca 7740
aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt 7800
tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat 7860
gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac 7920
cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa 7980
aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt 8040
tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt 8100
tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa 8160
gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt 8220
atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 8280
taggggttcc gcgcacattt ccccgaaaag tgccac 8316
<210> 17
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> ATG - AAV2 Rep78/52
<400> 17
atggcggggt tctacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataa 1866
<210> 18
<211> 1866
<212> DNA
<213> Artificial Sequence
<220>
<223> ACG - AAV2 Rep78/52
<400> 18
acggcggggt tctacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataa 1866
<210> 19
<211> 486
<212> DNA
<213> Artificial Sequence
<220>
<223> Baculovirus hr4b
<400> 19
gctttacgag tagaatttta cttgtaaaac acaatcaaga aatgatgtca tttttgtacg 60
tgattataaa catgtttaaa catggtacat tgaacttaat ttttgcaagt tgataaacat 120
gattaatgta cgactcattt gtttgtgcaa gttgataaac gtgattaata tatgactcat 180
atgtttgtgc aaaaatgatg tcatcgtaca aactcgcttt acgagtagaa ttctacttgt 240
aacgcatgat caagggatga tgtcatttgt ttttttaaaa ttcaactcgc tttacgagta 300
gaattctact tgtaaaacac aatcgaggga tgatgtcatt tgtagaatga tgtcatttgt 360
ttttcaaaac cgaactcgct ttacgagtag aattctactt gtaacgcaag atcggtggat 420
gatgtcattt taaaaatgat gtcatcgtac aaactcgctt tacgagtaga attctacgtg 480
taaaac 486
<210> 20
<211> 509
<212> DNA
<213> Artificial Sequence
<220>
<223> Baculovirus hr5
<400> 20
gctttacgag tagaattcta cgcgtaaaac acaatcaagt atgagtcata atctgatgtc 60
atgttttgta cacggctcat aaccgaactg gctttacgag tagaattcta cttgtaatgc 120
acgatcagtg gatgatgtca tttgtttttc aaatcgagat gatgtcatgt tttgcacacg 180
gctcataaac tcgctttacg agtagaattc tacgtgtaac gcacgatcga ttgatgagtc 240
atttgttttg caatatgata tcatacaata tgactcattt gtttttcaaa accgaacttg 300
atttacgggt agaattctac ttgtaaagca caatcaaaaa gatgatgtca tttgtttttc 360
aaaactgaac tcgctttacg agtagaattc tacgtgtaaa acacaatcaa gaaatgatgt 420
catttgttat aaaaataaaa gctgatgtca tgttttgcac atggctcata actaaactcg 480
ctttacgggt agaattctac gcgtaaaac 509
<210> 21
<211> 906
<212> DNA
<213> Artificial Sequence
<220>
<223> 39k promoter full-length
<400> 21
aaggctgtct tgctgtgtgc ccgtcgcgcg taccggagcg cgaacgcgcc cgccgccgac 60
ataaacgaca cttttctaga aaaaatttcc ataccacgag gtcatcgcga ttgttgcgac 120
gcaaaagttt acgaaactgc cgtgcgcgag tttgtggaag aaactggccg gttttttgac 180
agcgcgttca tctacaagtt tccatttacg ttacaatgga aagacgacgg tgtcacttac 240
aagtatttga tatacgtagg cgtcgtgcgc ggcaacttga ttgacgtgaa cgccaaaccc 300
aacacgtaca ccgtgaagtt gttgccgggc acgtttggca acgactatcg tataatgtta 360
aaaccgcgac gcttcaattg cgaaataacg cgcagcctgg ccatcgtgcc gctcaacaaa 420
tattttaatt atatgaacga caaacaattg atcacgtacg attacagcaa ttacattgaa 480
ttttttagtt ttgtgcgcag catcaagaag cgtttcgata ataggcaatt gcaagacttt 540
ttctacgcca ctctaaaaaa gatagacaac aacgatgccc cccaaaaatt gcacgcactt 600
aggcgggtgt aattcggact gcttgacccg aagcgaaata caagcgctgt tcagggaagc 660
catcaacacg ctcaagcaca caatgaatac agaagacgtc tgcgcgcaca tgttggacat 720
cgtgtcgttt gagcgtataa aagaatatat aagagctaat ttaggccatt tcacagtaat 780
taccgacaaa tgttctaagc gtaaggtgtg tcttcatcac aaacgaattg ccaggctgtt 840
gggcattaaa aaaatatatc atcaagaata caagcgggtc gtttcaaagg tttacaaaaa 900
tcaaac 906
<210> 22
<211> 213
<212> DNA
<213> Artificial Sequence
<220>
<223> p10 promoter
<400> 22
tacggacctt taattcaacc caacacaata tattatagtt aaataagaat tattatcaaa 60
tcatttgtat attaattaaa atactatact gtaaattaca ttttatttac aatcactcga 120
cgaagacttg atcaccccta gattcgaaag cggcccgctc actagtaacg gccgccagtg 180
tgctggaatt cgcccttcgc ggatcctgtt aag 213
<210> 23
<211> 184
<212> DNA
<213> Artificial Sequence
<220>
<223> p6.9 promoter
<400> 23
agttcaacat tgaggattac aataacatat ttaaggtgat ggaaaatatt aggaaacaca 60
gcaacaaaaa ttcaaacgac caagacgagt taaacatata tttgggagtt cagtcgtcga 120
atgcaaagcg taaaaaatat taataaggta aaaattacag ctacataaat tacacaattt 180
aaac 184
<210> 24
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> pSel120 promoter
<400> 24
tgttcaataa tcaataaacc tctctattat gctttgtaaa ttttttattt actttgttgt 60
ccattgctga tgatttatta agtcttttgg caaaaattaa atttttgcta caatata 117
<210> 25
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> polH promoter
<400> 25
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca 120
tcgggcgcg 129
<210> 26
<211> 457
<212> DNA
<213> Artificial Sequence
<220>
<223> Baculovirus hr1
<400> 26
gttttacaag tagaattcta cccgtaaagc gagtttagtt ttgaaaaaca aatgacatca 60
tttgtataat gacatcatcc cctgattgtg ttttacaagt agaattctat ccgtaaagcg 120
agttcagttt tgaaaacaaa tgagtcatac ctaaacacgt taataatctt ctgatatcag 180
cttatgactc aagttatgag ccgtgtgcaa aacatgagat aagtttatga catcatccac 240
tgatcgtgcg ttacaagtag aattctactc gtaaagccag ttcggttatg agccgtgtgc 300
aaaacatgac atcagcttat gactcatact tgattgtgtt ttacgcgtag aattctactc 360
gtaaagcgag ttcggttatg agccgtgtgc aaaacatgac atcagcttat gagtcataat 420
taatcgtgcg ttacaagtag aattctactc gtaaagc 457
<210> 27
<211> 666
<212> DNA
<213> Artificial Sequence
<220>
<223> Baculovirus hr3
<400> 27
gatttacgcg tagaattcta cttgtaaagc aagttaaaat aagccgtgtg caaaaatgac 60
atcagacaaa tgacatcatc tacctatcat gatcatgtta ataatcatgt tttaaaatga 120
catcagctta tgactaataa ttgatcgtgc gttacaagta gaattctact cgtaaagcga 180
gtttagtttt gaaaaacaaa tgagtcatca ttaaacatgt taataatcgt gtataaagga 240
tgacatcatc cactaatcgt gcgttacaag tagaattcta ctcgtaaagc gagttcggtt 300
ttgaaaaaca aatgacatca tttcttgatt gtgttttaca cgtagaattc tactcgtaaa 360
gtatgttcag tttaaaaaac aaatgacatc attttacaga tgacatcatt tcttgattat 420
gttttacaag tagaattcta ctcgtaaagc aagtttagtt ttaaaaaaca aatgacatca 480
tctcttgatt atgttttaca agtagaattc tactcgtaaa gcgagtttag ttttgaaaaa 540
caaatgacat catctcttga ttatgtttta caagtagaat tctactcgta aagcgagttt 600
agttttcaaa aacaaatgac atcatccctt gatcatgcgt tacaagtaga attctactcg 660
taaagc 666
<210> 28
<211> 806
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic hr134b5
<400> 28
gatttacgcg tagaattcta cttgtaaagc aagttaaaat aagccgtgtg caaaaatgac 60
atcagacaaa tgacatcatc tacctatcat gatcatgtta ataatcatgt tttaaaatga 120
catcagctta tgactaataa ttgatcgtgc gttacaagta gaattctacg cgtaaaacac 180
aatcaagtat gagtcataat ctgatgtcat gttttgtaca cggctcataa ccgaactggc 240
tttacgagta gaattctact tgtaatgcac gatcagtgga tgatgtcatt tgtttttcaa 300
atcgagatga tgtcatgttt atgacatcat ccactaatcg tgcgttacaa gtagaattct 360
actcgtaaag cgagttcggt tttgaaaaac aaatgacatc atacctaaac acgttaataa 420
tcttctgata tcagcttatg actcaagtta tgagccgtgt gcaaaacatg agataagttt 480
atgacatcat ccactgatcg tgcgttacaa gtagaattct actcgtaaag ccagttcggt 540
tatgagccgt gtgcaaaaca tgacatcagc ttatgactca tacttgattg tgttttacgc 600
gtagaattct actcgtaaag cgagttcggt tatgatgtca tttgttataa aaataaaagc 660
tgatgtcatg ttttgcacat ggctcataac taaactcgct ttacgggtag aattctactt 720
gtaacgcaag atcggtggat gatgtcattt taaaaatgat gtcatcgtac aaactcgctt 780
tacgagtaga attctacgtg taaaac 806
<210> 29
<211> 14265
<212> DNA
<213> Artificial Sequence
<220>
<223> polH Cap2/5 nano-luciferase
<400> 29
tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg 60
agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc 120
ccgcgcgttg gccgattcat taatgcaggc tgcagggggg gggggggggg gggggggggg 180
ccactccctc tctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 240
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 300
actccatcac taggggttcc tcagatcttc ggtcgacgga tccttatcga ttttaccaca 360
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 420
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 480
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 540
ttgtccaaac tcatcaatgt atcttatcat gtctgctcga agcggccggc cgccccgact 600
ctagaattac gccagaatgc gttcgcacag ccgccagccg gtcactccgt tgatggttac 660
tcggaacagc agggagccgt cggggttgat caggcgctcg tcgataattt tgttgccgtt 720
ccacagggtc cctgttacag tgatcttttt gccgtcgaac acggcgatgc cttcatacgg 780
ccgtccgaaa tagtcgatca tgttcggcgt aaccccgtcg attaccagtg tgccatagtg 840
caggatcacc ttaaagtgat gatcatccac agggtacacc accttaaaaa ttttttcgat 900
ctggcccatt tggtcgccgc tcagaccttc atacgggatg atgacatgga tgtcgatctt 960
cagcccattt tcaccgctca ggacaatcct ttggatcgga gttacggaca ccccgagatt 1020
ctgaaacaaa ctggacacac ctccctgttc aaggacttgg tccaggttgt agccggctgt 1080
ctgtcgccag tccccaacga aatcttcgag tgtgaagact ggggcaggga aggcagcagg 1140
caacaccagg agcaggccca gggagaaggc aactggaccg aaggcgcttg tggagaagga 1200
gttcatggtg gctttaccaa cagtaccgga ttgccaagct tggccgccga ggcccactga 1260
ctgcgttagc aatttaactg tgataaacta ccgcaataaa gcttctagtg atctgacggt 1320
tcactaaacg agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1380
tcaacggggc ggggttatta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1440
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1500
cacgcccatt ggtgtactgc caaaaccgca tcaccatggt aatagcgatg actaatacgt 1560
agatgtactg ccaagtagga aagtcccgta aggtcatgta ctgggcataa tgccaggcgg 1620
gccatttacc gtcattgacg tcaatagggg gcggacttgg catatgatac acttgatgta 1680
ctgccaagtg ggcagtttac cgtaaatact ccacccattg acgtcaatgg aaagtcccta 1740
ttggcgttac tatgggaaca tacgtcatta ttgacgtcaa tgggcggggg tcgttgggcg 1800
gtcagccagg cgggccattt accgtaagtt atgtaacgcg gaactccata tatgggctat 1860
gaactaatga ccccgtaatt gattactatt aataactagt caataatcaa tgccaacatg 1920
gcggtcatat tggacatgag ccaatataaa tgtacatatt atgatataga tacaacgtat 1980
gcaatggcca atagccaata ttgatttatg ctatataacc aatgaataat atggctaatg 2040
gccaatattg aggccagtta gatctgagga acccctagtg atggagttgg ccactccctc 2100
tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt 2160
tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag ggagtggccc cccccccccc 2220
cccccctgca gcctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt 2280
gcgcagcctg aatggcgaat ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 2340
gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 2400
ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 2460
ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 2520
ggtgatggtt cacgtagtgt gtaatgagac gcacaaacta atatcacaaa ctggaaatgt 2580
ctatcaatat atagttgctg atctatgcat cagctgctag tactccggaa tattaataga 2640
tcatggagat aattaaaatg ataaccatct cgcaaataaa taagtatttt actgttttcg 2700
taacagtttt gtaataaaaa aacctataaa tattccggat tattcatacc gtcccaccat 2760
cgggcgcgga tcgtaccggg cccaagcttc ctgttaagac ggctgccgac ggttatctac 2820
ccgattggtt ggaggacact ctctctgaag gaataagaca gtggtggaag ctcaaacctg 2880
gcccaccacc accaaagccc gcagagcggc ataaggacga cagcaggggt cttgtgcttc 2940
ctgggtacaa gtacctcgga cccttcaacg gactcgacaa gggagagccg gtcaacgagg 3000
cagacgccgc ggccctcgag cacgacaaag cctacgaccg gcagctcgac agcggagaca 3060
acccgtacct caagtacaac cacgccgacg cggagtttca ggagcgcctt aaagaagata 3120
cgtcttttgg gggcaacctc ggacgagcag tcttccaggc gaaaaagagg gttcttgaac 3180
ctctgggcct ggttgaggaa cctgttaaga cggcccctac cggaaagcgg atagacgacc 3240
actttccaaa aagaaagaag gctcggaccg aagaggactc caagccttcc acctcgtcag 3300
acgccgaagc tggacccagc ggatcccagc agctgcaaat cccagcccaa ccagcctcaa 3360
gtttgggagc tgatacaatg tctgcgggag gtggcggccc attgggcgac aataaccaag 3420
gtgccgatgg agtgggcaat gcctcgggag attggcattg cgattccacg tggatggggg 3480
acagagtcgt caccaagtcc acccgaacct gggtgctgcc cagctacaac aaccaccagt 3540
accgagagat caaaagcggc tccgtcgacg gaagcaacgc caacgcctac tttggataca 3600
gcaccccctg ggggtacttt gactttaacc gcttccacag ccactggagc ccccgagact 3660
ggcaaagact catcaacaac tactggggct tcagaccccg gtccctcaga gtcaaaatct 3720
tcaacattca agtcaaagag gtcacggtgc aggactccac caccaccatc gccaacaacc 3780
tcacctccac cgtccaagtg tttacggacg acgactacca gctgccctac gtcgtcggca 3840
acgggaccga gggatgcctg ccggccttcc ctccgcaggt ctttacgctg ccgcagtacg 3900
gttacgcgac gctgaaccgc gacaacacag aaaatcccac cgagaggagc agcttcttct 3960
gcctagagta ctttcccagc aagatgctga gaacgggcaa caactttgag tttacctaca 4020
actttgagga ggtgcccttc cactccagct tcgctcccag tcagaacctg ttcaagctgg 4080
ccaacccgct ggtggaccag tacttgtacc gcttcgtgag cacaaataac actggcggag 4140
tccagttcaa caagaacctg gccgggagat acgccaacac ctacaaaaac tggttcccgg 4200
ggcccatggg ccgaacccag ggctggaacc tgggctccgg ggtcaaccgc gccagtgtca 4260
gcgccttcgc cacgaccaat aggatggagc tcgagggcgc gagttaccag gtgcccccgc 4320
agccgaacgg catgaccaac aacctccagg gcagcaacac ctatgccctg gagaacacta 4380
tgatcttcaa cagccagccg gcgaacccgg gcaccaccgc cacgtacctc gagggcaaca 4440
tgctcatcac cagcgagagc gagacgcagc cggtgaaccg cgtggcgtac aacgtcggcg 4500
ggcagatggc caccaacaac cagagctcca ccactgcccc cgcgaccggc acgtacaacc 4560
tccaggaaat cgtgcccggc agcgtgtgga tggagaggga cgtgtacctc caaggaccca 4620
tctgggccaa gatcccagag acgggggcgc actttcaccc ctctccggcc atgggcggat 4680
tcggactcaa acacccaccg cccatgatgc tcatcaagaa cacgcctgtg cccggaaata 4740
tcaccagctt ctcggacgtg cccgtcagca gcttcatcac ccagtacagc accgggcagg 4800
tcaccgtgga gatggagtgg gagctcaaga aggaaaactc caagaggtgg aacccagaga 4860
tccagtacac aaacaactac aacgaccccc agtttgtgga ctttgccccg gacagcaccg 4920
gggaatacag aaccaccaga cctatcggaa cccgatacct tacccgaccc ctttaaagga 4980
tcataatcag ccataccaca tttgtagagg ttttacttgc tttaaaaaac ctcccacacc 5040
tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag 5100
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 5160
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctggatcc 5220
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttaa ttaattaagt 5280
accgactctg ctgaagagga ggaaattctc cttgaagttt ccctggtgtt caaagtaaag 5340
gagtttgcac cagacgcacc tctgttcact ggtccggcgt attaaaacac gatacattgt 5400
tattagtaca tttattaagc gctagattct gtgcgttgtt gatttacaga caattgttgt 5460
acgtatttta ataattcatt aaatttataa tctttagggt ggtatgttag agcgaaaatc 5520
aaatgatttt cagcgtcttt atatctgaat ttaaatatta aatcctcaat agatttgtaa 5580
aataggtttc gattagtttc aaacaagggt tgtttttccg aaccgatggc tggactatct 5640
aatggatttt cgctcaacgc cacaaaactt gccaaatctt gtagcagcaa tctagctttg 5700
tcgatattcg tttgtgtttt gttttgtaat aaaggttcga cgtcgttcaa aatattatgc 5760
gcttttgtat ttctttcatc actgtcgtta gtgtacaatt gactcgacgt aaacacgtta 5820
aataaagctt ggacatattt aacatcgggc gtgttagctt tattaggccg attatcgtcg 5880
tcgtcccaac cctcgtcgtt agaagttgct tccgaagacg attttgccat agccacacga 5940
cgcctattaa ttgtgtcggc taacacgtcc gcgatcaaat ttgtagttga gctttttgga 6000
attatttctg attgcgggcg tttttgggcg ggtttcaatc taactgtgcc cgattttaat 6060
tcagacaaca cgttagaaag cgatggtgca ggcggtggta acatttcaga cggcaaatct 6120
actaatggcg gcggtggtgg agctgatgat aaatctacca tcggtggagg cgcaggcggg 6180
gctggcggcg gaggcggagg cggaggtggt ggcggtgatg cagacggcgg tttaggctca 6240
aatgtctctt taggcaacac agtcggcacc tcaactattg tactggtttc gggcgccgtt 6300
tttggtttga ccggtctgag acgagtgcga tttttttcgt ttctaatagc ttccaacaat 6360
tgttgtctgt cgtctaaagg tgcagcgggt tgaggttccg tcggcattgg tggagcgggc 6420
ggcaattcag acatcgatgg tggtggtggt ggtggaggcg ctggaatgtt aggcacggga 6480
gaaggtggtg gcggcggtgc cgccggtata atttgttctg gtttagtttg ttcgcgcacg 6540
attgtgggca ccggcgcagg cgccgctggc tgcacaacgg aaggtcgtct gcttcgaggc 6600
agcgcttggg gtggtggcaa ttcaatatta taattggaat acaaatcgta aaaatctgct 6660
ataagcattg taatttcgct atcgtttacc gtgccgatat ttaacaaccg ctcaatgtaa 6720
gcaattgtat tgtaaagaga ttgtctcaag ctcggatccc gcacgccgat aacaagcctt 6780
ttcattttta ctacagcatt gtagtggcga gacacttcgc tgtcgtcgac gtacatgtat 6840
gctttgttgt caaaaacgtc gttggcaagc tttaaaatat ttaaaagaac atctctgttc 6900
agcaccactg tgttgtcgta aatgttgttt ttgataattt gcgcttccgc agtatcgaca 6960
cgttcaaaaa attgatgcgc atcaattttg ttgttcctat tattgaataa ataagattgt 7020
acagattcat atctacgatt cgtcatggcc accacaaatg ctacgctgca aacgctggta 7080
caattttacg aaaactgcaa aaacgtcaaa actcggtata aaataatcaa cgggcgcttt 7140
ggcaaaatat ctattttatc gcacaagccc actagcaaat tgtatttgca gaaaacaatt 7200
tcggcgcaca attttaacgc tgacgaaata aaagttcacc agttaatgag cgaccaccca 7260
aattttataa aaatctattt taatcacggt tccatcaaca accaagtgat cgtgatggac 7320
tacattgact gtcccgattt atttgaaaca ctacaaatta aaggcgagct ttcgtaccaa 7380
cttgttagca atattattag acagctgtgt gaagcgctca acgatttgca caagcacaat 7440
ttcatacaca acgacataaa actcgaaaat gtcttatatt tcgaagcact tgatcgcgtg 7500
tatgtttgcg attacggatt gtgcaaacac gaaaactcac ttagcgtgca cgacggcacg 7560
ttggagtatt ttagtccgga aaaaattcga cacacaacta tgcacgtttc gtttgactgg 7620
tacgccgtcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 7680
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 7740
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat 7800
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 7860
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 7920
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 7980
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 8040
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 8100
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 8160
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 8220
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 8280
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 8340
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 8400
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 8460
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 8520
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 8580
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 8640
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 8700
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 8760
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 8820
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 8880
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 8940
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 9000
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 9060
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 9120
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 9180
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 9240
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 9300
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 9360
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 9420
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 9480
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 9540
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 9600
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 9660
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 9720
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 9780
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 9840
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 9900
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 9960
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 10020
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 10080
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 10140
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 10200
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 10260
cgccaagctt gcatgcctgc aggtcgactc tagaccgagt tgtttgcgta cgtgactagc 10320
gaagaagatg tgtggaccgc agaacagata gtaaaacaaa accctagtat tggagcaata 10380
atcgatttaa ccaacacgtc taaatattat gatggtgtgc attttttgcg ggcgggcctg 10440
ttatacaaaa aaattcaagt acctggccag actttgccgc ctgaaagcat agttcaagaa 10500
tttattgaca cggtaaaaga atttacagaa aagtgtcccg gcatgttggt gggcgtgcac 10560
tgcacacacg gtattaatcg caccggttac atggtgtgca gatatttaat gcacaccctg 10620
ggtattgcgc cgcaggaagc catagataga ttcgaaaaag ccagaggtca caaaattgaa 10680
agacaaaatt acgttcaaga tttattaatt taattaatat tatttgcatt ctttaacaaa 10740
tactttatcc tattttcaaa ttgttgcgct tcttccagcg aaccaaaact atgcttcgct 10800
tgctccgttt agcttgtagc cgatcagtgg cgttgttcca atcgacggta ggattaggcc 10860
ggatattctc caccacaatg ttggcaacgt tgatgttacg tttatgcttt tggttttcca 10920
cgtacgtctt ttggccggta atagccgtaa acgtagtgcc gtcgcgcgtc acgcacaaca 10980
ccggatgttt gcgcttgtcc gcggggtatt gaaccgcgcg atccgacaaa tccaccactt 11040
tggcaactaa atcggtgacc tgcgcgtctt ttttctgcat tatttcgtct ttcttttgca 11100
tggtttcctg gaagccggtg tacatgcggt ttagatcagt catgacgcgc gtgacctgca 11160
aatctttggc ctcgatctgc ttgtccttga tggcaacgat gcgttcaata aactcttgtt 11220
ttttaacaag ttcctcggtt ttttgcgcca ccaccgcttg cagcgcgttt gtgtgctcgg 11280
tgaatgtcgc aatcagctta gtcaccaact gtttgctctc ctcctcccgt tgtttgatcg 11340
cgggatcgta cttgccggtg cagagcactt gaggaattac ttcttctaaa agccattctt 11400
gtaattctat ggcgtaaggc aatttggact tcataatcag ctgaatcacg ccggatttag 11460
taatgagcac tgtatgcggc tgcaaataca gcgggtcgcc ccttttcacg acgctgttag 11520
aggtagggcc cccattttgg atggtctgct caaataacga tttgtattta ttgtctacat 11580
gaacacgtat agctttatca caaactgtat attttaaact gttagcgacg tccttggcca 11640
cgaaccggac ctgttggtcg cgctctagca cgtaccgcag gttgaacgta tcttctccaa 11700
atttaaattc tccaatttta acgcgagcca ttttgataca cgtgtgtcga ttttgcaaca 11760
actattgttt tttaacgcaa actaaactta ttgtggtaag caataattaa atatggggga 11820
acatgcgccg ctacaacact cgtcgttatg aacgcagacg gcgccggtct cggcgcaagc 11880
ggctaaaacg tgttgcgcgt tcaacgcggc aaacatcgca aaagccaata gtacagtttt 11940
gatttgcata ttaacggcga ttttttaaat tatcttattt aataaatagt tatgacgcct 12000
acaactcccc gcccgcgttg actcgctgca cctcgagcag ttcgttgacg ccttcctccg 12060
tgtggccgaa cacgtcgagc gggtggtcga tgaccagcgg cgtgccgcac gcgacgcaca 12120
agtatctgta caccgaatga tcgtcgggcg aaggcacgtc ggcctccaag tggcaatatt 12180
ggcaaattcg aaaatatata cagttgggtt gtttgcgcat atctatcgtg gcgttgggca 12240
tgtacgtccg aacgttgatt tgcatgcaag ccgaaattaa atcattgcga ttagtgcgat 12300
taaaacgttg tacatcctcg cttttaatca tgccgtcgat taaatcgcgc aatcgagtca 12360
agtgatcaaa gtgtggaata atgttttctt tgtattcccg agtcaagcgc agcgcgtatt 12420
ttaacaaact agccatcttg taagttagtt tcatttaatg caactttatc caataatata 12480
ttatgtatcg cacgtcaaga attaacaatg cgcccgttgt cgcatctcaa cacgactatg 12540
atagagatca aataaagcgc gaattaaata gcttgcgacg caacgtgcac gatctgtgca 12600
cgcgttccgg cacgagcttt gattgtaata agtttttacg aagcgatgac atgacccccg 12660
tagtgacaac gatcacgccc aaaagaactg ccgactacaa aattaccgag tatgtcggtg 12720
acgttaaaac tattaagcca tccaatcgac cgttagtcga atcaggaccg ctggtgcgag 12780
aagccgcgaa gtatggcgaa tgcatcgtat aacgtgtgga gtccgctcat tagagcgtca 12840
tgtttagaca agaaagctac atatttaatt gatcccgatg attttattga taaattgacc 12900
ctaactccat acacggtatt ctacaatggc ggggttttgg tcaaaatttc cggactgcga 12960
ttgtacatgc tgttaacggc tccgcccact attaatgaaa ttaaaaattc caattttaaa 13020
aaacgcagca agagaaacat ttgtatgaaa gaatgcgtag aaggaaagaa aaatgtcgtc 13080
gacatgctga acaacaagat taatatgcct ccgtgtataa aaaaaatatt gaacgatttg 13140
aaagaaaaca atgtaccgcg cggcggtatg tacaggaaga ggtttatact aaactgttac 13200
attgcaaacg tggtttcgtg tgccaagtgt gaaaaccgat gtttaatcaa ggctctgacg 13260
catttctaca accacgactc caagtgtgtg ggtgaagtca tgcatctttt aatcaaatcc 13320
caagatgtgt ataaaccacc aaactgccaa aaaatgaaaa ctgtcgacaa gctctgtccg 13380
tttgctggca actgcaaggg tctcaatcct atttgtaatt attgaataat aaaacaatta 13440
taaatgctaa atttgttttt tattaacgat acaaaccaaa cgcaacaaga acatttgtag 13500
tattatctat aattgaaaac gcgtagttat aatcgctgag gtaatattta aaatcatttt 13560
caaatgattc acagttaatt tgcgacaata taattttatt ttcacataaa ctagacgcct 13620
tgtcgtcttc ttcttcgtat tccttctctt tttcattttt ctcctcataa aaattaacat 13680
agttattatc gtatccatat atgtatctat cgtatagagt aaattttttg ttgtcataaa 13740
tatatatgtc ttttttaatg gggtgtatag taccgctgcg catagttttt ctgtaattta 13800
caacagtgct attttctggt agttcttcgg agtgtgttgc tttaattatt aaatttatat 13860
aatcaatgaa tttgggatcg tcggttttgt acaatatgtt gccggcatag tacgcagctt 13920
cttctagttc aattacacca ttttttagca gcaccggatt aacataactt tccaaaatgt 13980
tgtacgaacc gttaaacaaa aacagttcac ctcccttttc tatactattg tctgcgagca 14040
gttgtttgtt gttaaaaata acagccattg taatgagacg cacaaactaa tatcacaaac 14100
tggaaatgtc tatcaatata tagttgctga tgcgtcgatt tttgtgatgc tcgtcagggg 14160
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 14220
ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctg 14265
<210> 30
<211> 2178
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap AAV2/5
<400> 30
acggctgccg acggttatct acccgattgg ttggaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggcccct 420
accggaaagc ggatagacga ccactttcca aaaagaaaga aggctcggac cgaagaggac 480
tccaagcctt ccacctcgtc agacgccgaa gctggaccca gcggatccca gcagctgcaa 540
atcccagccc aaccagcctc aagtttggga gctgatacaa tgtctgcggg aggtggcggc 600
ccattgggcg acaataacca aggtgccgat ggagtgggca atgcctcggg agattggcat 660
tgcgattcca cgtggatggg ggacagagtc gtcaccaagt ccacccgaac ctgggtgctg 720
cccagctaca acaaccacca gtaccgagag atcaaaagcg gctccgtcga cggaagcaac 780
gccaacgcct actttggata cagcaccccc tgggggtact ttgactttaa ccgcttccac 840
agccactgga gcccccgaga ctggcaaaga ctcatcaaca actactgggg cttcagaccc 900
cggtccctca gagtcaaaat cttcaacatt caagtcaaag aggtcacggt gcaggactcc 960
accaccacca tcgccaacaa cctcacctcc accgtccaag tgtttacgga cgacgactac 1020
cagctgccct acgtcgtcgg caacgggacc gagggatgcc tgccggcctt ccctccgcag 1080
gtctttacgc tgccgcagta cggttacgcg acgctgaacc gcgacaacac agaaaatccc 1140
accgagagga gcagcttctt ctgcctagag tactttccca gcaagatgct gagaacgggc 1200
aacaactttg agtttaccta caactttgag gaggtgccct tccactccag cttcgctccc 1260
agtcagaacc tgttcaagct ggccaacccg ctggtggacc agtacttgta ccgcttcgtg 1320
agcacaaata acactggcgg agtccagttc aacaagaacc tggccgggag atacgccaac 1380
acctacaaaa actggttccc ggggcccatg ggccgaaccc agggctggaa cctgggctcc 1440
ggggtcaacc gcgccagtgt cagcgccttc gccacgacca ataggatgga gctcgagggc 1500
gcgagttacc aggtgccccc gcagccgaac ggcatgacca acaacctcca gggcagcaac 1560
acctatgccc tggagaacac tatgatcttc aacagccagc cggcgaaccc gggcaccacc 1620
gccacgtacc tcgagggcaa catgctcatc accagcgaga gcgagacgca gccggtgaac 1680
cgcgtggcgt acaacgtcgg cgggcagatg gccaccaaca accagagctc caccactgcc 1740
cccgcgaccg gcacgtacaa cctccaggaa atcgtgcccg gcagcgtgtg gatggagagg 1800
gacgtgtacc tccaaggacc catctgggcc aagatcccag agacgggggc gcactttcac 1860
ccctctccgg ccatgggcgg attcggactc aaacacccac cgcccatgat gctcatcaag 1920
aacacgcctg tgcccggaaa tatcaccagc ttctcggacg tgcccgtcag cagcttcatc 1980
acccagtaca gcaccgggca ggtcaccgtg gagatggagt gggagctcaa gaaggaaaac 2040
tccaagaggt ggaacccaga gatccagtac acaaacaact acaacgaccc ccagtttgtg 2100
gactttgccc cggacagcac cggggaatac agaaccacca gacctatcgg aacccgatac 2160
cttacccgac ccctttaa 2178
<210> 31
<211> 2178
<212> DNA
<213> Artificial Sequence
<220>
<223> Cap AAV5
<400> 31
acggcttctt ttgttgatca cccacccgat tggttggaag aagttggtga aggtcttcgc 60
gagtttttgg gccttgaagc gggcccaccg aaaccaaaac ccaatcagca gcatcaagat 120
caagcccgtg gtcttgtgct gcctggttat aactatctcg gacccggaaa cggtctcgat 180
cgaggagagc ctgtcaacag ggcagacgag gtcgcgcgag agcacgacat ctcgtacaac 240
gagcagcttg aggcgggaga caacccctac ctcaagtaca accacgcgga cgccgagttt 300
caggagaagc tcgccgacga cacatccttc gggggaaacc tcggaaaggc agtctttcag 360
gccaagaaaa gggttctcga accttttggc ctggttgaag agggtgctaa gacggcccct 420
accggaaagc ggatagacga ccactttcca aaaagaaaga aggctcggac cgaagaggac 480
tccaagcctt ccacctcgtc agacgccgaa gctggaccca gcggatccca gcagctgcaa 540
atcccagccc aaccagcctc aagtttggga gctgatacaa tgtctgcggg aggtggcggc 600
ccattgggcg acaataacca aggtgccgat ggagtgggca atgcctcggg agattggcat 660
tgcgattcca cgtggatggg ggacagagtc gtcaccaagt ccacccgaac ctgggtgctg 720
cccagctaca acaaccacca gtaccgagag atcaaaagcg gctccgtcga cggaagcaac 780
gccaacgcct actttggata cagcaccccc tgggggtact ttgactttaa ccgcttccac 840
agccactgga gcccccgaga ctggcaaaga ctcatcaaca actactgggg cttcagaccc 900
cggtccctca gagtcaaaat cttcaacatt caagtcaaag aggtcacggt gcaggactcc 960
accaccacca tcgccaacaa cctcacctcc accgtccaag tgtttacgga cgacgactac 1020
cagctgccct acgtcgtcgg caacgggacc gagggatgcc tgccggcctt ccctccgcag 1080
gtctttacgc tgccgcagta cggttacgcg acgctgaacc gcgacaacac agaaaatccc 1140
accgagagga gcagcttctt ctgcctagag tactttccca gcaagatgct gagaacgggc 1200
aacaactttg agtttaccta caactttgag gaggtgccct tccactccag cttcgctccc 1260
agtcagaacc tcttcaagct ggccaacccg ctggtggacc agtacttgta ccgcttcgtg 1320
agcacaaata acactggcgg agtccagttc aacaagaacc tggccgggag atacgccaac 1380
acctacaaaa actggttccc ggggcccatg ggccgaaccc agggctggaa cctgggctcc 1440
ggggtcaacc gcgccagtgt cagcgccttc gccacgacca ataggatgga gctcgagggc 1500
gcgagttacc aggtgccccc gcagccgaac ggcatgacca acaacctcca gggcagcaac 1560
acctatgccc tggagaacac tatgatcttc aacagccagc cggcgaaccc gggcaccacc 1620
gccacgtacc tcgagggcaa catgctcatc accagcgaga gcgagacgca gccggtgaac 1680
cgcgtggcgt acaacgtcgg cgggcagatg gccaccaaca accagagctc caccactgcc 1740
cccgcgaccg gcacgtacaa cctccaggaa atcgtgcccg gcagcgtgtg gatggagagg 1800
gacgtgtacc tccaaggacc catctgggcc aagatcccag agacgggggc gcactttcac 1860
ccctctccgg ccatgggcgg attcggactc aaacacccac cgcccatgat gctcatcaag 1920
aacacgcctg tgcccggaaa tatcaccagc ttctcggacg tgcccgtcag cagcttcatc 1980
acccagtaca gcaccgggca ggtcaccgtg gagatggagt gggagctcaa gaaggaaaac 2040
tccaagaggt ggaacccaga gatccagtac acaaacaact acaacgaccc ccagtttgtg 2100
gactttgccc cggacagcac cggggaatac agaaccacca gacctatcgg aacccgatac 2160
cttacccgac ccctttaa 2178
<210> 32
<211> 28
<212> DNA
<213> artificial
<220>
<223> hr 28-mer
<400> 32
ctttacgagt agaattctac gcgtaaaa 28
<210> 33
<211> 1194
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep52 wt
<400> 33
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194
<210> 34
<211> 1194
<212> DNA
<213> Artificial Sequence
<220>
<223> rep52 sf9 (insect cell) optimised
<400> 34
atggagctgg tgggttggct ggtggacaag ggtatcacct ccgagaagca gtggatccag 60
gaggaccagg cttcctacat ctccttcaac gctgcttcca actcccgttc ccagatcaag 120
gctgctctgg acaacgctgg taagatcatg tccctgacca agaccgctcc tgactacctg 180
gtgggtcagc agcctgtgga ggacatctcc tccaaccgta tctacaagat cctggagctg 240
aacggttacg accctcagta cgctgcttcc gtgttcctgg gttgggctac caagaagttc 300
ggtaagcgta acaccatctg gctgttcggt cctgctacca ccggtaagac caacatcgct 360
gaggctatcg ctcacaccgt gcctttctac ggttgcgtga actggaccaa cgagaacttc 420
cctttcaacg actgcgtgga caagatggtg atctggtggg aggagggtaa gatgaccgct 480
aaggtggtgg agtccgctaa ggctatcctg ggtggttcca aggtgcgtgt ggaccagaag 540
tgcaagtcct ccgctcagat cgaccctacc cctgtgatcg tgacctccaa caccaacatg 600
tgcgctgtga tcgacggtaa ctccaccacc ttcgagcacc agcagcctct gcaggaccgt 660
atgttcaagt tcgagctgac ccgtcgtctg gaccacgact tcggtaaggt gaccaagcag 720
gaggtgaagg acttcttccg ttgggctaag gaccacgtgg tggaggtgga gcacgagttc 780
tacgtgaaga agggtggtgc taagaagcgt cctgctcctt ccgacgctga catctccgag 840
cctaagcgtg tgcgtgagtc cgtggctcag ccttccacct ccgacgctga ggcttccatc 900
aactacgctg accgttacca gaacaagtgc tcccgtcacg tgggtatgaa cctgatgctg 960
ttcccttgcc gtcagtgcga gcgtatgaac cagaactcca acatctgctt cacccacggt 1020
cagaaggact gcctggagtg cttccctgtg tccgagtccc agcctgtgtc cgtggtgaag 1080
aaggcttacc agaagctgtg ctacatccac cacatcatgg gtaaggtgcc tgacgcttgc 1140
accgcttgcg acctggtgaa cgtggacctg gacgactgca tcttcgagca gtaa 1194
<210> 35
<211> 1194
<212> DNA
<213> Artificial Sequence
<220>
<223> rep52 AT optimised
<400> 35
atggaattag taggatggtt agtagataaa ggaataacat cagaaaaaca atggatacaa 60
gaagatcaag catcatatat atcatttaat gcagcatcaa attcaagatc acaaataaaa 120
gcagcattag ataatgcagg aaaaataatg tcattaacaa aaacagcacc agattattta 180
gtaggacaac aaccagtaga agatatatca tcaaatagaa tatataaaat attagaatta 240
aatggatatg atccacaata tgcagcatca gtatttttag gatgggcaac aaaaaaattt 300
ggaaaaagaa atacaatatg gttatttgga ccagcaacaa caggaaaaac aaatatagca 360
gaagcaatag cacatacagt accattttat ggatgtgtaa attggacaaa tgaaaatttt 420
ccatttaatg attgtgtaga taaaatggta atatggtggg aagaaggaaa aatgacagca 480
aaagtagtag aatcagcaaa agcaatatta ggaggatcaa aagtaagagt agatcaaaaa 540
tgtaaatcat cagcacaaat agatccaaca ccagtaatag taacatcaaa tacaaatatg 600
tgtgcagtaa tagatggaaa ttcaacaaca tttgaacatc aacaaccatt acaagataga 660
atgtttaaat ttgaattaac aagaagatta gatcatgatt ttggaaaagt aacaaaacaa 720
gaagtaaaag atttttttag atgggcaaaa gatcatgtag tagaagtaga acatgaattt 780
tatgtaaaaa aaggaggagc aaaaaaaaga ccagcaccat cagatgcaga tatatcagaa 840
ccaaaaagag taagagaatc agtagcacaa ccatcaacat cagatgcaga agcatcaata 900
aattatgcag atagatatca aaataaatgt tcaagacatg taggaatgaa tttaatgtta 960
tttccatgta gacaatgtga aagaatgaat caaaattcaa atatatgttt tacacatgga 1020
caaaaagatt gtttagaatg ttttccagta tcagaatcac aaccagtatc agtagtaaaa 1080
aaagcatatc aaaaattatg ttatatacat catataatgg gaaaagtacc agatgcatgt 1140
acagcatgtg atttagtaaa tgtagattta gatgattgta tatttgaaca ataa 1194
<210> 36
<211> 1194
<212> DNA
<213> Artificial Sequence
<220>
<223> rep52 GC optimised
<400> 36
atggagctgg tggggtggct ggtggacaag gggatcacga gcgagaagca gtggatccag 60
gaggaccagg cgagctacat cagcttcaac gcggcgagca acagccggag ccagatcaag 120
gcggcgctgg acaacgcggg gaagatcatg agcctgacga agacggcgcc ggactacctg 180
gtggggcagc agccggtgga ggacatcagc agcaaccgga tctacaagat cctggagctg 240
aacgggtacg acccgcagta cgcggcgagc gtgttcctgg ggtgggcgac gaagaagttc 300
gggaagcgga acacgatctg gctgttcggg ccggcgacga cggggaagac gaacatcgcg 360
gaggcgatcg cgcacacggt gccgttctac gggtgcgtga actggacgaa cgagaacttc 420
ccgttcaacg actgcgtgga caagatggtg atctggtggg aggaggggaa gatgacggcg 480
aaggtggtgg agagcgcgaa ggcgatcctg ggggggagca aggtgcgggt ggaccagaag 540
tgcaagagca gcgcgcagat cgacccgacg ccggtgatcg tgacgagcaa cacgaacatg 600
tgcgcggtga tcgacgggaa cagcacgacg ttcgagcacc agcagccgct gcaggaccgg 660
atgttcaagt tcgagctgac gcggcggctg gaccacgact tcgggaaggt gacgaagcag 720
gaggtgaagg acttcttccg gtgggcgaag gaccacgtgg tggaggtgga gcacgagttc 780
tacgtgaaga aggggggggc gaagaagcgg ccggcgccga gcgacgcgga catcagcgag 840
ccgaagcggg tgcgggagag cgtggcgcag ccgagcacga gcgacgcgga ggcgagcatc 900
aactacgcgg accggtacca gaacaagtgc agccggcacg tggggatgaa cctgatgctg 960
ttcccgtgcc ggcagtgcga gcggatgaac cagaacagca acatctgctt cacgcacggg 1020
cagaaggact gcctggagtg cttcccggtg agcgagagcc agccggtgag cgtggtgaag 1080
aaggcgtacc agaagctgtg ctacatccac cacatcatgg ggaaggtgcc ggacgcgtgc 1140
acggcgtgcg acctggtgaa cgtggacctg gacgactgca tcttcgagca gtaa 1194
<210> 37
<211> 1194
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep52
<400> 37
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194
<210> 38
<211> 397
<212> PRT
<213> Artificial Sequence
<220>
<223> Rep52
<400> 38
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
325 330 335
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
340 345 350
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
355 360 365
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
370 375 380
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 39
<211> 1873
<212> DNA
<213> Artificial Sequence
<220>
<223> Rep78
<400> 39
cgcagccgcc atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga 60
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 120
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 180
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 240
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 300
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 360
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 420
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 480
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 540
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 600
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 660
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 720
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 780
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 840
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 900
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 960
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1020
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1080
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1140
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1200
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1260
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1320
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1380
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1440
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1500
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1560
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1620
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1680
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1740
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1800
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1860
catctttgaa caa 1873
<210> 40
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<223> Rep78
<400> 40
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 41
<211> 738
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV8
<400> 41
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 42
<211> 250
<212> DNA
<213> Artificial Sequence
<220>
<223> PolH long
<400> 42
tgtaatgaga cgcacaaact aatatcacaa actggaaatg tctatcaata tatagttgct 60
gatctatgca tcagctgcta gtactccgga atattaatag atcatggaga taattaaaat 120
gataaccatc tcgcaaataa ataagtattt tactgttttc gtaacagttt tgtaataaaa 180
aaacctataa atattccgga ttattcatac cgtcccacca tcgggcgcgg atcgtaccgg 240
gcccaagctt 250
<210> 43
<211> 155
<212> DNA
<213> Artificial Sequence
<220>
<223> PolH short
<400> 43
tgtaatgaga cgcacaaact aatatcacaa actggaaatg tctatcaata tatagttgct 60
gatatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt 120
ttcgtaacag ttttgtaata aaaaaaccta taaat 155
<210> 44
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV 1; VP1, VP2, VP3; startcodon VP1 altered (GTG)
<400> 44
gtggctgccg acggttatct acccgattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctg 2208
<210> 45
<211> 1800
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV1; VP2; VP3
<400> 45
acggctcctg gaaagaaacg tccggtagag cagtcgccac aagagccaga ctcctcctcg 60
ggcatcggca agacaggcca gcagcccgct aaaaagagac tcaattttgg tcagactggc 120
gactcagagt cagtccccga tccacaacct ctcggagaac ctccagcaac ccccgctgct 180
gtgggaccta ctacaatggc ttcaggcggt ggcgcaccaa tggcagacaa taacgaaggc 240
gccgacggag tgggtaatgc ctcaggaaat tggcattgcg attccacatg gctgggcgac 300
agagtcatca ccaccagcac ccgcacctgg gccttgccca cctacaataa ccacctctac 360
aagcaaatct ccagtgcttc aacgggggcc agcaacgaca accactactt cggctacagc 420
accccctggg ggtattttga tttcaacaga ttccactgcc acttttcacc acgtgactgg 480
cagcgactca tcaacaacaa ttggggattc cggcccaaga gactcaactt caaactcttc 540
aacatccaag tcaaggaggt cacgacgaat gatggcgtca caaccatcgc taataacctt 600
accagcacgg ttcaagtctt ctcggactcg gagtaccagc ttccgtacgt cctcggctct 660
gcgcaccagg gctgcctccc tccgttcccg gcggacgtgt tcatgattcc gcaatacggc 720
tacctgacgc tcaacaatgg cagccaagcc gtgggacgtt catcctttta ctgcctggaa 780
tatttccctt ctcagatgct gagaacgggc aacaacttta ccttcagcta cacctttgag 840
gaagtgcctt tccacagcag ctacgcgcac agccagagcc tggaccggct gatgaatcct 900
ctcatcgacc aatacctgta ttacctgaac agaactcaaa atcagtccgg aagtgcccaa 960
aacaaggact tgctgtttag ccgtgggtct ccagctggca tgtctgttca gcccaaaaac 1020
tggctacctg gaccctgtta tcggcagcag cgcgtttcta aaacaaaaac agacaacaac 1080
aacagcaatt ttacctggac tggtgcttca aaatataacc tcaatgggcg tgaatccatc 1140
atcaaccctg gcactgctat ggcctcacac aaagacgacg aagacaagtt ctttcccatg 1200
agcggtgtca tgatttttgg aaaagagagc gccggagctt caaacactgc attggacaat 1260
gtcatgatta cagacgaaga ggaaattaaa gccactaacc ctgtggccac cgaaagattt 1320
gggaccgtgg cagtcaattt ccagagcagc agcacagacc ctgcgaccgg agatgtgcat 1380
gctatgggag cattacctgg catggtgtgg caagatagag acgtgtacct gcagggtccc 1440
atttgggcca aaattcctca cacagatgga cactttcacc cgtctcctct tatgggcggc 1500
tttggactca agaacccgcc tcctcagatc ctcatcaaaa acacgcctgt tcctgcgaat 1560
cctccggcgg agttttcagc tacaaagttt gcttcattca tcacccaata ctccacagga 1620
caagtgagtg tggaaattga atgggagctg cagaaagaaa acagcaagcg ctggaatccc 1680
gaagtgcagt acacatccaa ttatgcaaaa tctgccaacg ttgattttac tgtggacaac 1740
aatggacttt atactgagcc tcgccccatt ggcacccgtt accttacccg tcccctgtaa 1800
<210> 46
<211> 1605
<212> DNA
<213> Artificial Sequence
<220>
<223> AAV1; VP3
<400> 46
atggcttcag gcggtggcgc accaatggca gacaataacg aaggcgccga cggagtgggt 60
aatgcctcag gaaattggca ttgcgattcc acatggctgg gcgacagagt catcaccacc 120
agcacccgca cctgggcctt gcccacctac aataaccacc tctacaagca aatctccagt 180
gcttcaacgg gggccagcaa cgacaaccac tacttcggct acagcacccc ctgggggtat 240
tttgatttca acagattcca ctgccacttt tcaccacgtg actggcagcg actcatcaac 300
aacaattggg gattccggcc caagagactc aacttcaaac tcttcaacat ccaagtcaag 360
gaggtcacga cgaatgatgg cgtcacaacc atcgctaata accttaccag cacggttcaa 420
gtcttctcgg actcggagta ccagcttccg tacgtcctcg gctctgcgca ccagggctgc 480
ctccctccgt tcccggcgga cgtgttcatg attccgcaat acggctacct gacgctcaac 540
aatggcagcc aagccgtggg acgttcatcc ttttactgcc tggaatattt cccttctcag 600
atgctgagaa cgggcaacaa ctttaccttc agctacacct ttgaggaagt gcctttccac 660
agcagctacg cgcacagcca gagcctggac cggctgatga atcctctcat cgaccaatac 720
ctgtattacc tgaacagaac tcaaaatcag tccggaagtg cccaaaacaa ggacttgctg 780
tttagccgtg ggtctccagc tggcatgtct gttcagccca aaaactggct acctggaccc 840
tgttatcggc agcagcgcgt ttctaaaaca aaaacagaca acaacaacag caattttacc 900
tggactggtg cttcaaaata taacctcaat gggcgtgaat ccatcatcaa ccctggcact 960
gctatggcct cacacaaaga cgacgaagac aagttctttc ccatgagcgg tgtcatgatt 1020
tttggaaaag agagcgccgg agcttcaaac actgcattgg acaatgtcat gattacagac 1080
gaagaggaaa ttaaagccac taaccctgtg gccaccgaaa gatttgggac cgtggcagtc 1140
aatttccaga gcagcagcac agaccctgcg accggagatg tgcatgctat gggagcatta 1200
cctggcatgg tgtggcaaga tagagacgtg tacctgcagg gtcccatttg ggccaaaatt 1260
cctcacacag atggacactt tcacccgtct cctcttatgg gcggctttgg actcaagaac 1320
ccgcctcctc agatcctcat caaaaacacg cctgttcctg cgaatcctcc ggcggagttt 1380
tcagctacaa agtttgcttc attcatcacc caatactcca caggacaagt gagtgtggaa 1440
attgaatggg agctgcagaa agaaaacagc aagcgctgga atcccgaagt gcagtacaca 1500
tccaattatg caaaatctgc caacgttgat tttactgtgg acaacaatgg actttatact 1560
gagcctcgcc ccattggcac ccgttacctt acccgtcccc tgtaa 1605
<210> 47
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV1; VP1, VP2, VP3; startcodon VP1 altered (GTG)
<400> 47
Val Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 48
<211> 599
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV1; VP2, VP3
<400> 48
Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln Ser Pro Gln Glu Pro
1 5 10 15
Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln Pro Ala Lys Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
35 40 45
Gln Pro Leu Gly Glu Pro Pro Ala Thr Pro Ala Ala Val Gly Pro Thr
50 55 60
Thr Met Ala Ser Gly Gly Gly Ala Pro Met Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ala Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Ala Ser Thr
115 120 125
Gly Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
130 135 140
Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp
145 150 155 160
Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn
165 170 175
Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Asn Asp Gly
180 185 190
Val Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ser
195 200 205
Asp Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly
210 215 220
Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly
225 230 235 240
Tyr Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe
245 250 255
Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn
260 265 270
Phe Thr Phe Ser Tyr Thr Phe Glu Glu Val Pro Phe His Ser Ser Tyr
275 280 285
Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln
290 295 300
Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln
305 310 315 320
Asn Lys Asp Leu Leu Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val
325 330 335
Gln Pro Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val
340 345 350
Ser Lys Thr Lys Thr Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly
355 360 365
Ala Ser Lys Tyr Asn Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly
370 375 380
Thr Ala Met Ala Ser His Lys Asp Asp Glu Asp Lys Phe Phe Pro Met
385 390 395 400
Ser Gly Val Met Ile Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr
405 410 415
Ala Leu Asp Asn Val Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr
420 425 430
Asn Pro Val Ala Thr Glu Arg Phe Gly Thr Val Ala Val Asn Phe Gln
435 440 445
Ser Ser Ser Thr Asp Pro Ala Thr Gly Asp Val His Ala Met Gly Ala
450 455 460
Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro
465 470 475 480
Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro
485 490 495
Leu Met Gly Gly Phe Gly Leu Lys Asn Pro Pro Pro Gln Ile Leu Ile
500 505 510
Lys Asn Thr Pro Val Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr
515 520 525
Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val
530 535 540
Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro
545 550 555 560
Glu Val Gln Tyr Thr Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe
565 570 575
Thr Val Asp Asn Asn Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr
580 585 590
Arg Tyr Leu Thr Arg Pro Leu
595
<210> 49
<211> 534
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV1; VP3
<400> 49
Met Ala Ser Gly Gly Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly
50 55 60
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
65 70 75 80
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
85 90 95
Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe
100 105 110
Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val
115 120 125
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ser Asp
130 135 140
Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys
145 150 155 160
Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr
165 170 175
Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr
180 185 190
Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe
195 200 205
Thr Phe Ser Tyr Thr Phe Glu Glu Val Pro Phe His Ser Ser Tyr Ala
210 215 220
His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr
225 230 235 240
Leu Tyr Tyr Leu Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn
245 250 255
Lys Asp Leu Leu Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln
260 265 270
Pro Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser
275 280 285
Lys Thr Lys Thr Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala
290 295 300
Ser Lys Tyr Asn Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr
305 310 315 320
Ala Met Ala Ser His Lys Asp Asp Glu Asp Lys Phe Phe Pro Met Ser
325 330 335
Gly Val Met Ile Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala
340 345 350
Leu Asp Asn Val Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn
355 360 365
Pro Val Ala Thr Glu Arg Phe Gly Thr Val Ala Val Asn Phe Gln Ser
370 375 380
Ser Ser Thr Asp Pro Ala Thr Gly Asp Val His Ala Met Gly Ala Leu
385 390 395 400
Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile
405 410 415
Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu
420 425 430
Met Gly Gly Phe Gly Leu Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys
435 440 445
Asn Thr Pro Val Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys
450 455 460
Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu
465 470 475 480
Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu
485 490 495
Val Gln Tyr Thr Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr
500 505 510
Val Asp Asn Asn Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg
515 520 525
Tyr Leu Thr Arg Pro Leu
530
<210> 50
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 50
ttgacgcaaa tgggcggta 19
<210> 51
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 51
gatctgacgg ttcactaaac gag 23
<210> 52
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 52
caagtatggc atctacacca aagtct 26
<210> 53
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 53
gcaatagcat cacaaatttc acaaa 25
<210> 54
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> probe
<400> 54
tgtgaactgg atcaaggaga agaccaagc 29
<210> 55
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> CMV probe with ZEN quencher at position 10
<220>
<221> ZEN-quencher
<222> (10)..(10)
<223> ZEN-quencher
<220>
<221> misc_feature
<222> (10)..(10)
<223> n is a, c, g, or t
<400> 55
tatagacctn cccaccgtac acgcc 25
Claims (15)
- i) 세포 내에서의 해독(translation)이 파르보바이러스(parvoviral) Rep 78 및 68 단백질 중 적어도 하나를 생산하는, mRNA를 암호화(encoding)하는 뉴클레오타이드 서열에 작동 가능하게 연결된(operably linked) 제1의 프로모터;
ii) 세포 내에서의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제2의 프로모터;
및
iii) 제1 및 제2의 프로모터에 작동 가능하게 연결된 적어도 하나의 인핸서(enhancer)를 포함하는, 세포의 게놈 내로 통합된 곤충 세포로서,
여기서 적어도 하나의 인핸서 성분은 전사 트랜스레귤레이터(transcriptional transregulator)에 의존적이고,
여기서 전사 트랜스레귤레이터의 세포 내로의 도입은 제1 및 제2의 프로모터로부터의 전사를 유도하는, 곤충 세포. - 제1항에 있어서, 제1 및 제2의 프로모터가 바큘로바이러스 프로모터(baculobviaral promoter)이고, 전사 트랜스레귤레이터가 바큘로바이러스 이미디어트-얼리 단백질(immediate-early protein; IE1) 또는 이의 스플라이스 변이체(splice variant; IE0)이고 전사 트랜스레귤레이터-의존적인 인핸서 성분이 바큘로바이러스 상동성 영역(homologous region; hr) 인핸서 성분이고, 여기서 바람직하게는 바큘로바이러스가 오토그라파 칼리포르니카(Autographa californica) 다중캡시드 뉴클레오폴리헤드로바이러스인, 곤충 세포.
- 제2항에 있어서, hr 인핸서 성분이 hr2-0.9 이외의 hr 인핸서 성분이고, 여기서 바람직하게는 hr 인핸서 성분이 바람직하게는 hr 28-mer 서열 CTTTACGAGTAGAATTCTACGCGTAAAA의 적어도 하나의 카피를 포함하고/하거나 이의 적어도 20, 21, 22, 23, 24, 25, 26, 또는 27개의 뉴클레오타이드가 서열 CTTTACGAGTAGAATTCTACGCGTAAAA와 동일하고 바큘로바이러스 IE1 단백질에 결합하는 서열의 적어도 하나의 카피를 포함하고, 여기서 hr 인핸서 성분은, polH 프로모터에 작동 가능하게 연결된 리포터 유전자(reporter gene)를 포함하는 발현 카세트(expression cassette)에 작동 가능하게 연결된 경우,
a) 비-유도 조건(non-inducing condition) 하에서, hr 인핸서 성분을 지닌 발현 카세트가 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트 보다는 리포터 전사체를 거의 생산하지 않거나, hr 인핸서 성분을 지닌 카세트가 hr4b 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체 양의 1.1, 1.2, 1.5, 2, 5 또는 10배(factor) 미만을 생산하고;
b) 유도 조건 하에서, hr 인핸서 성분을 지닌 발현 카세트가 hr4b 또는 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체의 양의 적어도 50, 60, 70, 80, 90 또는 100%를 생산하고,
여기서 보다 바람직하게는, hr 인핸서 성분이 hr1, hr3, hr4b 및 hr5로 이루어진 그룹으로부터 선택되고, 이 중에서 hr4b 및 hr5가 바람직하고, 이 중에서 hr4b가 가장 바람직한, 곤충 세포. - 제2항 또는 제3항에 있어서, 제1 및 제2의 프로모터가가 별개이고, 여기서 바람직하게는 제1의 프로모터가 지연된 얼리 바큘로바이러스 프로모터(delayed early baculoviral promoter)이고 제2의 프로모터가 레이트 또는 베리 레이트 바큘로바이러스 프로모터(late or very late baculoviral promoter)이고, 가장 바람직하게는 제1의 프로모터가 39k 프로모터이고 제2의 프로모터가 polH, p10, p6.9 및 pSel120 프로모터로 이루어진 그룹으로부터 선택되는, 곤충 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 및 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나가 적어도 90% 동일한 일반적인 아미노산 서열을 가지지만, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에 대해 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대해 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 95, 90, 85, 80, 75, 70, 65 또는 60% 미만의 서열 동일성(sequence identity)을 갖고, 여기서 바람직하게는 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에 대한 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 내 코돈 사용(codon usage)은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 내 코돈 사용보다 곤충 세포의 코돈 사용 편향(codon usage bias)에 대해 보다 더 적응되는, 곤충 세포.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA를 암호화하는 뉴클레오타이드 서열이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 감소된 정상 상태 수준(steady state level)에 영향을 미치는 변형을 포함하고, 바람직하게는 파르보바이러스 Rep78 및 68 단백질 중 적어도 하나가 준최적(suboptimal) 해독 개시 코돈으로 출발하는 개방 판독 프레임(open reading frame)을 포함하고, 여기서 보다 바람직하게는, 준최적 해독 개시 코돈은 ACG, CTG, TTG, GTG 및 ATT로부터 선택되고, 이중 ACG가 가장 바람직한, 곤충 세포.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 제1 및 제2의 프로모터가 전사의 반대 방향으로 세포의 게놈 내에 통합되고, 여기서 적어도 하나의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재하고, 여기서 보다 바람직하게는 2개의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재하는, 곤충 세포.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 세포가:
a) 곤충 세포 내에서 발현을 위한 제3의 프로모터에 작동 가능하게 연결된 파르보바이러스 캡시드 단백질 코딩 서열(coding sequence)을 포함하는 뉴클레오타이드 서열;
b) 적어도 하나의 파르보바이러스 역위된 말단 반복 서열(parvovirus inverted terminal repeat sequence)에 의해 플랭킹(flanking)되는 전이유전자를 포함하는 뉴클레오타이드 서열; 및
c) 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 뉴클레오타이드 서열을 추가로 포함하는, 곤충 세포. - 제8항에 있어서, a) 및 b) 중 적어도 하나의 뉴클레오타이드 서열이 바큘로바이러스 벡터 내에 포함되고, 여기서, 바람직하게는 a), b) 및 c) 중 적어도 하나의 뉴클레오타이드 서열이 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 바큘로바이러스 벡터 내에 포함되는, 곤충 세포.
- 제8항 또는 제9항에 있어서, 제1의 프로모터가 제3의 프로모터 앞에서 활성인, 곤충 세포.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나, 파르보바이러스 VP1, VP2, 및 VP3 캡시드 단백질 및 적어도 하나의 파르보바이러스 역위된 말단 반복체 서열이 아데노 관련 바이러스(adeno associated virus; AAV)로부터 유래되는, 곤충 세포.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 바람직한 cap-코딩 서열이 적어도 CAP AAV2/5(서열 번호: 29) 또는 AAV5(서열 번호: 30)를 포함하는, 곤충 세포.
- a) 제1항 내지 제7항 중 어느 한 항에서 정의된 바와 같은 곤충 세포를 배양하는 단계;
b) a)에서 배양된 세포에 제8항 내지 제12항 중 어느 한 항에서 정의된 바와 같은 뉴클레오타이드 서열을 제공하는 단계; 및
c) 재조합 파르보바이러스 비리온(recombinant parvovirus virion)을 회수하는 단계를 포함하는, 재조합 파르보바이러스 비리온을 생산하기 위한 방법. - 제13항에 있어서, 단계 c)에서 재조합 파르보바이러스 비리온의 회수가 고정된 항-파르보바이러스 항체, 바람직하게는 단일 쇄 카멜리드 항체(camelid antibody) 또는 이의 단편을 사용한 비리온의 친화성-정제(affinity-purification), 및 30 내지 70 nm의 공칭 공극 크기(nominal pore size)를 지닌 필터 위에서의 여과 중 적어도 하나를 포함하는, 방법.
- 적어도 제1항 내지 제7항 중 어느 한 항에서 정의된 바와 같은 곤충 세포 및 제8항 내지 제12항 중 어느 한 항에서 정의된 바와 같은 바큘로바이러스 벡터 및/또는 뉴클레오타이드 서열을 포함하는 부분의 키트(kit of parts).
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20167817.4 | 2020-04-02 | ||
EP20167817 | 2020-04-02 | ||
PCT/EP2021/058798 WO2021198510A1 (en) | 2020-04-02 | 2021-04-02 | Novel cell line |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220161297A true KR20220161297A (ko) | 2022-12-06 |
Family
ID=70165885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227032424A KR20220161297A (ko) | 2020-04-02 | 2021-04-02 | 신규 세포주 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230265381A1 (ko) |
EP (1) | EP4127146A1 (ko) |
JP (1) | JP2023519138A (ko) |
KR (1) | KR20220161297A (ko) |
CN (1) | CN115867647A (ko) |
AU (1) | AU2021249483A1 (ko) |
CA (1) | CA3169017A1 (ko) |
WO (1) | WO2021198510A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022207899A1 (en) | 2021-04-02 | 2022-10-06 | Uniqure Biopharma B.V. | Methods for producing single insect cell clones |
WO2024078584A1 (zh) * | 2022-10-13 | 2024-04-18 | 康霖生物科技(杭州)有限公司 | 腺相关病毒的衣壳蛋白编码基因改造方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4745051A (en) | 1983-05-27 | 1988-05-17 | The Texas A&M University System | Method for producing a recombinant baculovirus expression vector |
US6103526A (en) | 1998-10-08 | 2000-08-15 | Protein Sciences Corporation | Spodoptera frugiperda single cell suspension cell line in serum-free media, methods of producing and using |
US7647184B2 (en) | 2001-08-27 | 2010-01-12 | Hanall Pharmaceuticals, Co. Ltd | High throughput directed evolution by rational mutagenesis |
US6723551B2 (en) | 2001-11-09 | 2004-04-20 | The United States Of America As Represented By The Department Of Health And Human Services | Production of adeno-associated virus in insect cells |
CA2467959C (en) | 2001-11-09 | 2009-03-10 | Robert M. Kotin | Production of adeno-associated virus in insect cells |
AU2003212708A1 (en) | 2002-03-05 | 2003-09-16 | Stichting Voor De Technische Wetenschappen | Baculovirus expression system |
US20060166363A1 (en) | 2004-01-27 | 2006-07-27 | Sergei Zolotukhin | Modified baculovirus expression system for production of pseudotyped rAAV vector |
EP3272872B1 (en) | 2005-10-20 | 2020-06-17 | uniQure IP B.V. | Improved aav vectors produced in insect cells |
EP1981548A4 (en) | 2006-01-20 | 2010-03-24 | Univ North Carolina | ENHANCED PRODUCTION OF INFECTIOUS VECTORS OF PARVOVIRUS IN INSECT CELLS |
CN101506369B (zh) | 2006-06-21 | 2014-02-12 | 尤尼克尔生物制药股份有限公司 | 具有经修饰的用于在昆虫细胞中产生aav的aav-rep78翻译起始密码子的载体 |
ES2385679T3 (es) | 2006-08-24 | 2012-07-30 | Virovek, Inc. | Expresión de células de insecto de genes con marcos de lectura abiertos superpuestos, métodos y composiciones de éstos |
EP3093345B8 (en) | 2007-07-26 | 2019-07-24 | UniQure IP B.V. | Baculoviral vectors comprising repeated coding sequences with differential codon biases |
EA020969B1 (ru) | 2008-02-19 | 2015-03-31 | ЮНИКЬЮРЕ АйПи Б.В. | ОПТИМИЗАЦИЯ ЭКСПРЕССИИ ПАРВОВИРУСНЫХ БЕЛКОВ Rep И Cap В КЛЕТКАХ НАСЕКОМЫХ |
US8679837B2 (en) | 2009-04-02 | 2014-03-25 | University Of Florida Research Foundation, Inc. | Inducible system for highly efficient production of recombinant Adeno-associated virus (rAAV) vectors |
MX2016011585A (es) | 2014-03-10 | 2016-11-29 | Uniqure Ip Bv | Vectores aav mejorados adicionales producidos en celulas de insecto. |
EP3445381A4 (en) * | 2016-04-21 | 2019-10-02 | Virovek, Inc. | AAV PREPARATION IN INSECT CELLS, METHOD AND COMPOSITIONS THEREFOR |
EA202090332A1 (ru) | 2017-07-20 | 2020-04-29 | ЮНИКЬЮРЕ АйПи Б.В. | Улучшенная продукция капсида aav в клетках насекомых |
-
2021
- 2021-04-02 JP JP2022552316A patent/JP2023519138A/ja active Pending
- 2021-04-02 CN CN202180026816.XA patent/CN115867647A/zh active Pending
- 2021-04-02 CA CA3169017A patent/CA3169017A1/en active Pending
- 2021-04-02 KR KR1020227032424A patent/KR20220161297A/ko active Search and Examination
- 2021-04-02 AU AU2021249483A patent/AU2021249483A1/en active Pending
- 2021-04-02 EP EP21716420.1A patent/EP4127146A1/en active Pending
- 2021-04-02 WO PCT/EP2021/058798 patent/WO2021198510A1/en unknown
-
2022
- 2022-09-20 US US17/948,862 patent/US20230265381A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3169017A1 (en) | 2021-10-07 |
JP2023519138A (ja) | 2023-05-10 |
EP4127146A1 (en) | 2023-02-08 |
CN115867647A (zh) | 2023-03-28 |
AU2021249483A1 (en) | 2022-09-15 |
US20230265381A1 (en) | 2023-08-24 |
WO2021198510A1 (en) | 2021-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018229561B2 (en) | Recombinant adenoviruses and use thereof | |
CN111372943B (zh) | 腺病毒及其用途 | |
KR102147005B1 (ko) | Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 | |
AU2021203052A1 (en) | Compositions and methods for TCR reprogramming using fusion proteins | |
US20030119104A1 (en) | Chromosome-based platforms | |
CN109689856A (zh) | 用于海藻宿主细胞的CRISPR-Cas系统 | |
US20040003420A1 (en) | Modified recombinase | |
CN108495685B (zh) | 针对艰难梭菌感染的基于酵母的免疫疗法 | |
CN101827938A (zh) | 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物 | |
KR20140128453A (ko) | 이상혈색소증 치료를 위한 조성물 및 방법 | |
CN101815432A (zh) | 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法 | |
CN114181957B (zh) | 一种基于病毒加帽酶的稳定t7表达系统及其在真核生物中表达蛋白质的方法 | |
KR20220161297A (ko) | 신규 세포주 | |
KR20230019063A (ko) | C9orf72 연관 질환의 치료를 위한 삼중 기능 아데노-연관 바이러스 (aav) 벡터 | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
KR20220163950A (ko) | Aav 생산을 위한 이중 이기능성 벡터 | |
CN114729387A (zh) | 遗传修饰真菌和与其相关方法和用途 | |
CN101868545B (zh) | 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法 | |
KR20230031929A (ko) | 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도 | |
KR20220112283A (ko) | Hunter 질환 치료용 아데노-연합된 바이러스 벡터 | |
BRPI0616533A2 (pt) | polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas | |
KR102287880B1 (ko) | 세포에서 이중 가닥 dna의 표적 부위를 변형시키기 위한 방법 | |
AU2017252409A1 (en) | Compositions and methods for nucleic acid expression and protein secretion in bacteroides | |
CN101848931B (zh) | 具有改变的根构造的植物、涉及编码exostosin家族多肽及其同源物的基因的相关的构建体和方法 | |
US20210130818A1 (en) | Compositions and Methods for Enhancement of Homology-Directed Repair Mediated Precise Gene Editing by Programming DNA Repair with a Single RNA-Guided Endonuclease |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |