KR102693318B1 - 리소좀 장애를 위한 유전자 요법 - Google Patents
리소좀 장애를 위한 유전자 요법 Download PDFInfo
- Publication number
- KR102693318B1 KR102693318B1 KR1020207012188A KR20207012188A KR102693318B1 KR 102693318 B1 KR102693318 B1 KR 102693318B1 KR 1020207012188 A KR1020207012188 A KR 1020207012188A KR 20207012188 A KR20207012188 A KR 20207012188A KR 102693318 B1 KR102693318 B1 KR 102693318B1
- Authority
- KR
- South Korea
- Prior art keywords
- itr
- raav
- vector
- nucleic acid
- sequence
- Prior art date
Links
- 238000001415 gene therapy Methods 0.000 title description 9
- 208000015439 Lysosomal storage disease Diseases 0.000 title 1
- 208000018737 Parkinson disease Diseases 0.000 claims abstract description 43
- 108700019146 Transgenes Proteins 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 25
- 208000015872 Gaucher disease Diseases 0.000 claims abstract description 22
- 108010017544 Glucosylceramidase Proteins 0.000 claims abstract description 7
- 108090000623 proteins and genes Proteins 0.000 claims description 131
- 150000007523 nucleic acids Chemical class 0.000 claims description 101
- 102000039446 nucleic acids Human genes 0.000 claims description 83
- 108020004707 nucleic acids Proteins 0.000 claims description 83
- 239000013598 vector Substances 0.000 claims description 71
- 239000013608 rAAV vector Substances 0.000 claims description 62
- 238000002347 injection Methods 0.000 claims description 56
- 239000007924 injection Substances 0.000 claims description 56
- 210000004027 cell Anatomy 0.000 claims description 46
- 102000004169 proteins and genes Human genes 0.000 claims description 40
- 210000003169 central nervous system Anatomy 0.000 claims description 30
- 108090000565 Capsid Proteins Proteins 0.000 claims description 26
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 26
- 108091026890 Coding region Proteins 0.000 claims description 23
- 241000702421 Dependoparvovirus Species 0.000 claims description 21
- 230000002401 inhibitory effect Effects 0.000 claims description 19
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 claims description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 239000002773 nucleotide Substances 0.000 claims description 16
- 230000002093 peripheral effect Effects 0.000 claims description 16
- 102000003802 alpha-Synuclein Human genes 0.000 claims description 15
- 108090000185 alpha-Synuclein Proteins 0.000 claims description 15
- 239000013612 plasmid Substances 0.000 claims description 15
- 125000003729 nucleotide group Chemical group 0.000 claims description 14
- 239000008194 pharmaceutical composition Substances 0.000 claims description 11
- 210000004962 mammalian cell Anatomy 0.000 claims description 10
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 9
- 230000001105 regulatory effect Effects 0.000 claims description 9
- 230000008685 targeting Effects 0.000 claims description 9
- 241000701447 unidentified baculovirus Species 0.000 claims description 9
- 239000003623 enhancer Substances 0.000 claims description 7
- 102000004547 Glucosylceramidase Human genes 0.000 claims description 6
- 108010006025 bovine growth hormone Proteins 0.000 claims description 6
- 238000007913 intrathecal administration Methods 0.000 claims description 6
- 230000001124 posttranscriptional effect Effects 0.000 claims description 5
- 241000700605 Viruses Species 0.000 claims description 4
- 241001492404 Woodchuck hepatitis virus Species 0.000 claims description 4
- 238000010253 intravenous injection Methods 0.000 claims description 4
- 238000004806 packaging method and process Methods 0.000 claims description 4
- 241000238631 Hexapoda Species 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims 1
- 239000001963 growth medium Substances 0.000 claims 1
- 238000003306 harvesting Methods 0.000 claims 1
- 102100033342 Lysosomal acid glucosylceramidase Human genes 0.000 abstract description 33
- 102100020983 Lysosome membrane protein 2 Human genes 0.000 abstract description 32
- 102100036197 Prosaposin Human genes 0.000 abstract description 24
- 239000000203 mixture Substances 0.000 abstract description 21
- 101100095198 Homo sapiens SCARB2 gene Proteins 0.000 abstract description 18
- 101710152403 Prosaposin Proteins 0.000 abstract description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 16
- 230000002132 lysosomal effect Effects 0.000 abstract description 15
- 201000010099 disease Diseases 0.000 abstract description 5
- 108010064171 Lysosome-Associated Membrane Glycoproteins Proteins 0.000 abstract description 3
- 102000014944 Lysosome-Associated Membrane Glycoproteins Human genes 0.000 abstract description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 2
- ZHMWOVGZCINIHW-FTYOSCRSSA-N 1-D-1,2-anhydro-myo-inositol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@H]2O[C@H]21 ZHMWOVGZCINIHW-FTYOSCRSSA-N 0.000 description 101
- 241000699670 Mus sp. Species 0.000 description 50
- 238000011282 treatment Methods 0.000 description 43
- 108020004414 DNA Proteins 0.000 description 38
- 101000997662 Homo sapiens Lysosomal acid glucosylceramidase Proteins 0.000 description 33
- 238000000185 intracerebroventricular administration Methods 0.000 description 33
- 239000003981 vehicle Substances 0.000 description 30
- 230000000694 effects Effects 0.000 description 26
- 102000040430 polynucleotide Human genes 0.000 description 24
- 108091033319 polynucleotide Proteins 0.000 description 24
- 239000002157 polynucleotide Substances 0.000 description 24
- 210000004556 brain Anatomy 0.000 description 21
- 238000009825 accumulation Methods 0.000 description 19
- 108091005488 SCARB2 Proteins 0.000 description 18
- 238000007912 intraperitoneal administration Methods 0.000 description 17
- 238000010172 mouse model Methods 0.000 description 15
- 108020004705 Codon Proteins 0.000 description 13
- 108090000765 processed proteins & peptides Proteins 0.000 description 13
- 208000024891 symptom Diseases 0.000 description 13
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 12
- 230000035772 mutation Effects 0.000 description 12
- 239000000758 substrate Substances 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 11
- 238000003556 assay Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 208000035475 disorder Diseases 0.000 description 11
- 239000013607 AAV vector Substances 0.000 description 10
- 108700011259 MicroRNAs Proteins 0.000 description 9
- 230000002950 deficient Effects 0.000 description 9
- 239000002679 microRNA Substances 0.000 description 9
- 239000000546 pharmaceutical excipient Substances 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 8
- 238000012417 linear regression Methods 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 7
- POQRWMRXUOPCLD-GZXCKHLVSA-N beta-D-glucosyl-N-(tetracosanoyl)sphingosine Chemical compound CCCCCCCCCCCCCCCCCCCCCCCC(=O)N[C@H]([C@H](O)\C=C\CCCCCCCCCCCCC)CO[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O POQRWMRXUOPCLD-GZXCKHLVSA-N 0.000 description 7
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 7
- 150000002632 lipids Chemical class 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 208000009829 Lewy Body Disease Diseases 0.000 description 6
- 201000002832 Lewy body dementia Diseases 0.000 description 6
- 108010007100 Pulmonary Surfactant-Associated Protein A Proteins 0.000 description 6
- 101150003696 gba-1 gene Proteins 0.000 description 6
- 210000005260 human cell Anatomy 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- 108091027967 Small hairpin RNA Proteins 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 150000001413 amino acids Chemical group 0.000 description 5
- 230000003542 behavioural effect Effects 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 238000005462 in vivo assay Methods 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 239000004055 small Interfering RNA Substances 0.000 description 5
- 239000013603 viral vector Substances 0.000 description 5
- 238000002965 ELISA Methods 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 101150002602 Psap gene Proteins 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000037396 body weight Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000001361 intraarterial administration Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 208000033808 peripheral neuropathy Diseases 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 238000010361 transduction Methods 0.000 description 4
- 230000026683 transduction Effects 0.000 description 4
- 102100026882 Alpha-synuclein Human genes 0.000 description 3
- 208000020322 Gaucher disease type I Diseases 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000834898 Homo sapiens Alpha-synuclein Proteins 0.000 description 3
- 102000017852 Saposin Human genes 0.000 description 3
- 108050007079 Saposin Proteins 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000008499 blood brain barrier function Effects 0.000 description 3
- 210000001218 blood-brain barrier Anatomy 0.000 description 3
- 210000003710 cerebral cortex Anatomy 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 210000003712 lysosome Anatomy 0.000 description 3
- 230000001868 lysosomic effect Effects 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 210000000278 spinal cord Anatomy 0.000 description 3
- 210000000952 spleen Anatomy 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241001203868 Autographa californica Species 0.000 description 2
- QADHATDBZXHRCA-ACZMJKKPSA-N Cys-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N QADHATDBZXHRCA-ACZMJKKPSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 2
- 229930186217 Glycolipid Natural products 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 description 2
- WNQKUUQIVDDAFA-ZPFDUUQYSA-N Ile-Gln-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N WNQKUUQIVDDAFA-ZPFDUUQYSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 2
- 102100025136 Macrosialin Human genes 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 208000002740 Muscle Rigidity Diseases 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 206010028851 Necrosis Diseases 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 2
- 102000019204 Progranulins Human genes 0.000 description 2
- 108010012809 Progranulins Proteins 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 2
- LNWSJGJCLFUNTN-ZOBUZTSGSA-N Val-Trp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LNWSJGJCLFUNTN-ZOBUZTSGSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000013320 baculovirus expression vector system Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000012742 biochemical analysis Methods 0.000 description 2
- 210000001715 carotid artery Anatomy 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000007278 cognition impairment Effects 0.000 description 2
- 208000010877 cognitive disease Diseases 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 238000002716 delivery method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 230000004064 dysfunction Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000002518 glial effect Effects 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 150000002339 glycosphingolipids Chemical class 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 210000002149 gonad Anatomy 0.000 description 2
- 102000045630 human GBA Human genes 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 239000007928 intraperitoneal injection Substances 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 231100000225 lethality Toxicity 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000007659 motor function Effects 0.000 description 2
- 230000017074 necrotic cell death Effects 0.000 description 2
- 238000000424 optical density measurement Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000037390 scarring Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000041 toxicology testing Toxicity 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 241000649045 Adeno-associated virus 10 Species 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- FRSGNOZCTWDVFZ-ACZMJKKPSA-N Asp-Asp-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRSGNOZCTWDVFZ-ACZMJKKPSA-N 0.000 description 1
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- OQMGSMNZVHYDTQ-ZKWXMUAHSA-N Asp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N OQMGSMNZVHYDTQ-ZKWXMUAHSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 208000018240 Bone Marrow Failure disease Diseases 0.000 description 1
- 206010065553 Bone marrow failure Diseases 0.000 description 1
- 206010006100 Bradykinesia Diseases 0.000 description 1
- 102100025222 CD63 antigen Human genes 0.000 description 1
- 101100282787 Caenorhabditis elegans gba-1 gene Proteins 0.000 description 1
- YBSQGNFRWZKFMJ-UHFFFAOYSA-N Cerebroside B Natural products CCCCCCCCCCCCCCC(O)C(=O)NC(C(O)C=CCCC=C(C)CCCCCCCCC)COC1OC(CO)C(O)C(O)C1O YBSQGNFRWZKFMJ-UHFFFAOYSA-N 0.000 description 1
- 208000029767 Congenital, Hereditary, and Neonatal Diseases and Abnormalities Diseases 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- WKELHWMCIXSVDT-UBHSHLNASA-N Cys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WKELHWMCIXSVDT-UBHSHLNASA-N 0.000 description 1
- QJUDRFBUWAGUSG-SRVKXCTJSA-N Cys-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N QJUDRFBUWAGUSG-SRVKXCTJSA-N 0.000 description 1
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 1
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 1
- LHMSYHSAAJOEBL-CIUDSAMLSA-N Cys-Lys-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O LHMSYHSAAJOEBL-CIUDSAMLSA-N 0.000 description 1
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 1
- CIVXDCMSSFGWAL-YUMQZZPRSA-N Cys-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N CIVXDCMSSFGWAL-YUMQZZPRSA-N 0.000 description 1
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 1
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 1
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 1
- MQQLYEHXSBJTRK-FXQIFTODSA-N Cys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N MQQLYEHXSBJTRK-FXQIFTODSA-N 0.000 description 1
- AZDQAZRURQMSQD-XPUUQOCRSA-N Cys-Val-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AZDQAZRURQMSQD-XPUUQOCRSA-N 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 206010012559 Developmental delay Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 206010015548 Euthanasia Diseases 0.000 description 1
- 206010070246 Executive dysfunction Diseases 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 206010017577 Gait disturbance Diseases 0.000 description 1
- 208000020916 Gaucher disease type II Diseases 0.000 description 1
- 208000028735 Gaucher disease type III Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- KYFSMWLWHYZRNW-ACZMJKKPSA-N Gln-Asp-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KYFSMWLWHYZRNW-ACZMJKKPSA-N 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- QZQYITIKPAUDGN-GVXVVHGQSA-N Gln-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QZQYITIKPAUDGN-GVXVVHGQSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- LSTFYPOGBGFIPP-FXQIFTODSA-N Glu-Cys-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O LSTFYPOGBGFIPP-FXQIFTODSA-N 0.000 description 1
- OWVURWCRZZMAOZ-XHNCKOQMSA-N Glu-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OWVURWCRZZMAOZ-XHNCKOQMSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- COSBSYQVPSODFX-GUBZILKMSA-N Glu-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N COSBSYQVPSODFX-GUBZILKMSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- YVYVMJNUENBOOL-KBIXCLLPSA-N Glu-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YVYVMJNUENBOOL-KBIXCLLPSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- UMHRCVCZUPBBQW-GARJFASQSA-N Glu-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UMHRCVCZUPBBQW-GARJFASQSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 1
- DXMOIVCNJIJQSC-QEJZJMRPSA-N Glu-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DXMOIVCNJIJQSC-QEJZJMRPSA-N 0.000 description 1
- KCCNSVHJSMMGFS-NRPADANISA-N Glu-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KCCNSVHJSMMGFS-NRPADANISA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- DEMIXZCKUXVEBO-BWAGICSOSA-N His-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O DEMIXZCKUXVEBO-BWAGICSOSA-N 0.000 description 1
- UIRUVUUGUYCMBY-KCTSRDHCSA-N His-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N UIRUVUUGUYCMBY-KCTSRDHCSA-N 0.000 description 1
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 1
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 1
- 101000934368 Homo sapiens CD63 antigen Proteins 0.000 description 1
- 208000006083 Hypokinesia Diseases 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 1
- BALLIXFZYSECCF-QEWYBTABSA-N Ile-Gln-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N BALLIXFZYSECCF-QEWYBTABSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- POMXSEDNUXYPGK-IHRRRGAJSA-N Leu-Met-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N POMXSEDNUXYPGK-IHRRRGAJSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 1
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 1
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 1
- GUYHHBZCBQZLFW-GUBZILKMSA-N Lys-Gln-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N GUYHHBZCBQZLFW-GUBZILKMSA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- CRNNMTHBMRFQNG-GUBZILKMSA-N Lys-Glu-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N CRNNMTHBMRFQNG-GUBZILKMSA-N 0.000 description 1
- DKTNGXVSCZULPO-YUMQZZPRSA-N Lys-Gly-Cys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O DKTNGXVSCZULPO-YUMQZZPRSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- PIXVFCBYEGPZPA-JYJNAYRXSA-N Lys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N PIXVFCBYEGPZPA-JYJNAYRXSA-N 0.000 description 1
- NQSFIPWBPXNJII-PMVMPFDFSA-N Lys-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 NQSFIPWBPXNJII-PMVMPFDFSA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 1
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 1
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 108010009254 Lysosomal-Associated Membrane Protein 1 Proteins 0.000 description 1
- 108010009491 Lysosomal-Associated Membrane Protein 2 Proteins 0.000 description 1
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 1
- 102100038225 Lysosome-associated membrane glycoprotein 2 Human genes 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- HHCOOFPGNXKFGR-HJGDQZAQSA-N Met-Gln-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HHCOOFPGNXKFGR-HJGDQZAQSA-N 0.000 description 1
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- WRLYTJVPSUBYST-AVGNSLFASA-N Met-His-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N WRLYTJVPSUBYST-AVGNSLFASA-N 0.000 description 1
- ULLIQRYQNMAAHC-RWMBFGLXSA-N Met-His-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N ULLIQRYQNMAAHC-RWMBFGLXSA-N 0.000 description 1
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 1
- GRKPXCKLOOUDFG-UFYCRDLUSA-N Met-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 GRKPXCKLOOUDFG-UFYCRDLUSA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 1
- 208000034819 Mobility Limitation Diseases 0.000 description 1
- 208000019430 Motor disease Diseases 0.000 description 1
- 206010061296 Motor dysfunction Diseases 0.000 description 1
- 208000016285 Movement disease Diseases 0.000 description 1
- 208000001089 Multiple system atrophy Diseases 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 206010060860 Neurological symptom Diseases 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 206010033661 Pancytopenia Diseases 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- PDUVELWDJZOUEI-IHRRRGAJSA-N Phe-Cys-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PDUVELWDJZOUEI-IHRRRGAJSA-N 0.000 description 1
- ZBYHVSHBZYHQBW-SRVKXCTJSA-N Phe-Cys-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZBYHVSHBZYHQBW-SRVKXCTJSA-N 0.000 description 1
- CPTJPDZTFNKFOU-MXAVVETBSA-N Phe-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N CPTJPDZTFNKFOU-MXAVVETBSA-N 0.000 description 1
- ZFVWWUILVLLVFA-AVGNSLFASA-N Phe-Gln-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N ZFVWWUILVLLVFA-AVGNSLFASA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- SZYBZVANEAOIPE-UBHSHLNASA-N Phe-Met-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SZYBZVANEAOIPE-UBHSHLNASA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- BPIFSOUEUYDJRM-DCPHZVHLSA-N Phe-Trp-Ala Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(O)=O)C1=CC=CC=C1 BPIFSOUEUYDJRM-DCPHZVHLSA-N 0.000 description 1
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 1
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- GQLOZEMWEBDEAY-NAKRPEOUSA-N Pro-Cys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GQLOZEMWEBDEAY-NAKRPEOUSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 1
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 1
- 208000028017 Psychotic disease Diseases 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 108010025216 RVF peptide Proteins 0.000 description 1
- 206010071390 Resting tremor Diseases 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- UQGAAZXSCGWMFU-UBHSHLNASA-N Ser-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N UQGAAZXSCGWMFU-UBHSHLNASA-N 0.000 description 1
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- BIWBTRRBHIEVAH-IHPCNDPISA-N Ser-Tyr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BIWBTRRBHIEVAH-IHPCNDPISA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 102000006467 TATA-Box Binding Protein Human genes 0.000 description 1
- 108010044281 TATA-Box Binding Protein Proteins 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- CJXURNZYNHCYFD-WDCWCFNPSA-N Thr-Lys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CJXURNZYNHCYFD-WDCWCFNPSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- DDHFMBDACJYSKW-AQZXSJQPSA-N Trp-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DDHFMBDACJYSKW-AQZXSJQPSA-N 0.000 description 1
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 1
- XKDOQXAXKFQWQJ-SRVKXCTJSA-N Tyr-Cys-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O XKDOQXAXKFQWQJ-SRVKXCTJSA-N 0.000 description 1
- MOCXXGZHHSPNEJ-AVGNSLFASA-N Tyr-Cys-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O MOCXXGZHHSPNEJ-AVGNSLFASA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- YYZPVPJCOGGQPC-JYJNAYRXSA-N Tyr-His-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYZPVPJCOGGQPC-JYJNAYRXSA-N 0.000 description 1
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 1
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- NXPDPYYCIRDUHO-ULQDDVLXSA-N Tyr-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 NXPDPYYCIRDUHO-ULQDDVLXSA-N 0.000 description 1
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 1
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- MJXNDRCLGDSBBE-FHWLQOOXSA-N Val-His-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N MJXNDRCLGDSBBE-FHWLQOOXSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 108091006088 activator proteins Proteins 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 230000006736 behavioral deficit Effects 0.000 description 1
- 230000006741 behavioral dysfunction Effects 0.000 description 1
- 238000009227 behaviour therapy Methods 0.000 description 1
- HHJTWTPUPVQKNA-JIAPQYILSA-N beta-D-glucosylsphingosine Chemical compound CCCCCCCCCCCCC\C=C\[C@@H](O)[C@@H](N)CO[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HHJTWTPUPVQKNA-JIAPQYILSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000000423 cell based assay Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001876 chaperonelike Effects 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000003703 cisterna magna Anatomy 0.000 description 1
- 230000006999 cognitive decline Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000002121 endocytic effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 238000002641 enzyme replacement therapy Methods 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000007421 fluorometric assay Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 150000002305 glucosylceramides Chemical class 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 206010019847 hepatosplenomegaly Diseases 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000003137 locomotive effect Effects 0.000 description 1
- 230000005980 lung dysfunction Effects 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 108010045758 lysosomal proteins Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 210000001259 mesencephalon Anatomy 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 230000004973 motor coordination Effects 0.000 description 1
- 210000000337 motor cortex Anatomy 0.000 description 1
- 239000007922 nasal spray Substances 0.000 description 1
- 229940097496 nasal spray Drugs 0.000 description 1
- 210000001577 neostriatum Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 150000002482 oligosaccharides Polymers 0.000 description 1
- 239000000668 oral spray Substances 0.000 description 1
- 229940041678 oral spray Drugs 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 208000024335 physical disease Diseases 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 231100000279 safety data Toxicity 0.000 description 1
- 239000013609 scAAV vector Substances 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 208000022925 sleep disturbance Diseases 0.000 description 1
- 229940126586 small molecule drug Drugs 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 150000003408 sphingolipids Chemical class 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 210000000115 thoracic cavity Anatomy 0.000 description 1
- 238000011200 topical administration Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/861—Adenoviral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/14—Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
- A61P25/16—Anti-Parkinson drugs
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70596—Molecules with a "CD"-designation not provided for elsewhere
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/40—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01045—Glucosylceramidase (3.2.1.45), i.e. beta-glucocerebrosidase
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0019—Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/14—Type of nucleic acid interfering N.A.
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/14—Type of nucleic acid interfering N.A.
- C12N2310/141—MicroRNAs, miRNAs
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/50—Biochemical production, i.e. in a transformed host cell
- C12N2330/51—Specially adapted vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14041—Use of virus, viral particle or viral elements as a vector
- C12N2710/14043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Virology (AREA)
- Immunology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Cell Biology (AREA)
- Neurosurgery (AREA)
- Neurology (AREA)
- Psychology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Dermatology (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
일부 측면에서, 본 개시내용은 비정상적인 리소좀 기능과 연관된 질환, 예를 들어, 파킨슨병 및 고셰병 치료를 위한 조성물 및 방법에 관한 것이다. 일부 실시양태에서, 본 개시내용은 베타-글루코세레브로시다제 (GBA) 또는 그의 일부, 리소좀 막 단백질 2 (LIMP2), 프로사포신, 또는 상기의 임의의 조합을 코딩하는 트랜스진을 포함하는 발현 구축물을 제공한다. 일부 실시양태에서, 본 개시내용은 파킨슨병 방법을 필요로 하는 대상체에게 상기 발현 구축물을 투여함으로써 파킨슨병 방법을 제공한다.
Description
관련 출원
본 출원은 35 U.S.C. 119(e)하에 2017년 10월 3일 출원된 미국 가출원 일련 번호 62/567,296 (발명의 명칭: "GENE THERAPIES FOR LYSOSOMAL DISORDERS")의 출원일의 이익을 주장하고, 상기 출원의 전체 내용이 본원에서 참조로 포함된다.
고셰병(Gaucher disease)은 리소좀 산 β-글루코세레브로시다제 (Gcase, "GBA")의 결핍에 기인한, 선천성 글리코스핑고리피드 대사 이상 희귀 질환이다. 환자는 간비장비대, 범혈구감소증으로 이어지는 골수 기능 부전, 폐 장애 및 섬유증, 골 결손을 비롯한, 비-CNS 증상 및 소견을 앓는다. 추가로, 상당수의 환자들은 결함성 도약 안구 운동 및 시선, 발작, 인지 결손, 발달 지연, 및 파킨슨병을 비롯한 운동 장애를 포함하는, 신경학적 증상을 앓는다.
말초 질환 및 조혈 골수 및 내장에서의 주요 임상 증상을 처리하는 여러 치료제들이 존재하며, 이는 효소 대체 요법, 결함성 Gcase에 결합하고, 안정성을 개선시키는 샤페론 유사 소분자 약물, 및 증상 및 병상으로 이어지는, 고셰병에서 축적되는 기질의 생산을 차단하는 기질 감소 요법을 포함한다. 그러나, 고셰병의 다른 측면 및 치료에 대하여 난치성인 것으로 보인다.
(GBA1 유전자의 두 염색체 대립유전자 모두에 돌연변이를 갖는) 고셰병 환자 이외에도, GBA1의 단 하나의 대립유전자에만 돌연변이를 갖는 환자는 파킨슨병 (PD)에 걸릴 위험이 매우 높다. 보행 장애, 휴식시 떨림, 경직, 및 흔히 우울증, 수면 장애, 및 인지 저하를 포함하는, PD 증상의 중증도는 효소 활성 감소 정도와 상관관계를 갖는다. 따라서, 고셰병 환자는 가장 중증의 과정을 갖는 반면, GBA1 중 단일의 가벼운 돌연변이를 갖는 환자는 전형적으로 더욱 양성의 과정을 갖는다. 돌연변이 보유자는 또한, 실행 기능 장애, 정신병, 및 PD 유사 운동 장애를 특징으로 하는 루이소체 치매, 및 특유의 운동 및 인지 장애를 갖는 다계통 위축을 비롯한, 다른 PD 관련 장애의 위험이 높다. 이러한 장애의 거침없이 계속되는 과정을 변경하는 요법은 현재 없다.
예컨대, Gcase (예컨대, GBA1 유전자의 유전자 생성물)와 같은 효소 결핍 뿐만 아니라, 리소좀 기능 또는 리소좀으로의 거대분자 수송에 관여하는 다수의 유전자 (예컨대, 리소좀 막 단백질 1 (LIMP), 이는 또한 SCARB2로도 지칭)에서의 일반적인 변이체가 PD 위험 증가와 연관이 있다. 본 개시내용은 부분적으로 Gcase (또는 그의 일부), 프로사포신 (또는 그의 일부), LIMP2 (또는 그의 일부), 또는 Gcase (또는 그의 일부) 및 PD 연관 유전자 (예컨대, LIMP2, 프로사포신, 및/또는 α-시누클레인 (α-Syn))로부터의 하나 이상의 추가 유전자 생성물의 조합을 코딩하는 발현 구축물 (예컨대, 벡터)에 기초한다. 일부 실시양태에서, 본원에 기술된 유전자 생성물의 조합은 대상체에서 발현되었을 때, 함께 (예컨대, 시너지적으로) 작용하여 PD의 하나 이상의 징후 및 증상을 감소시킨다.
따라서, 일부 측면에서, 본 개시내용은 Gcase (예컨대, GBA1 유전자의 유전자 생성물)을 코딩하는 발현 구축물을 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, 단리된 핵산은 코돈 최적화된 (예컨대, 포유동물 세포, 예를 들어, 인간 세포에서의 발현을 위해 코돈 최적화된) Gcase 코딩 서열을 포함한다. 일부 실시양태에서, Gcase를 코딩하는 핵산 서열은 서열식별번호(SEQ ID NO:) 14에 기재된 바와 같은 (예컨대, NCBI 참조 서열 NP_000148.2에 기재된 바와 같은) 아미노산 서열을 포함하는 단백질을 코딩한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호 15에 기재된 바와 같은 서열을 포함한다. 일부 실시양태에서, 발현 구축물은 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR), 예를 들어, Gcase를 코딩하는 핵산 서열에 플랭킹된 AAV ITR을 포함한다.
일부 측면에서, 본 개시내용은 프로사포신 (예컨대, PSAP 유전자의 유전자 생성물)을 코딩하는 발현 구축물을 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, 단리된 핵산은 코돈 최적화된 (예컨대, 포유동물 세포, 예를 들어, 인간 세포에서의 발현을 위해 코돈 최적화된) 프로사포신 코딩 서열을 포함한다. 일부 실시양태에서, 프로사포신을 코딩하는 핵산 서열은 서열식별번호 16에 기재된 바와 같은 (예컨대, NCBI 참조 서열 NP_002769.1에 기재된 바와 같은) 아미노산 서열을 포함하는 단백질을 코딩한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호 17에 기재된 바와 같은 서열을 포함한다. 일부 실시양태에서, 발현 구축물은 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR), 예를 들어, 프로사포신을 코딩하는 핵산 서열에 플랭킹된 AAV ITR을 포함한다.
일부 측면에서, 본 개시내용은 LIMP2/SCARB2 (예컨대, SCARB2 유전자의 유전자 생성물)를 코딩하는 발현 구축물을 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, 단리된 핵산은 코돈 최적화된 (예컨대, 포유동물 세포, 예를 들어, 인간 세포에서의 발현을 위해 코돈 최적화된) SCARB2 코딩 서열을 포함한다. 일부 실시양태에서, LIMP2/SCARB2를 코딩하는 핵산 서열은 서열식별번호 18에 기재된 바와 같은 (예컨대, NCBI 참조 서열 NP_005497.1에 기재된 바와 같은) 아미노산 서열을 포함하는 단백질을 코딩한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호 29에 기재된 바와 같은 서열을 포함한다. 일부 실시양태에서, 발현 구축물은 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR), 예를 들어, SCARB2를 코딩하는 핵산 서열에 플랭킹된 AAV ITR을 포함한다.
일부 측면에서, 본 개시내용은 제1 유전자 생성물 및 제2 유전자 생성물을 코딩하는 발현 구축물을 포함하는 단리된 핵산이며, 여기서 각 유전자 생성물은 독립적으로 표 1에 기재된 유전자 생성물 또는 그의 일부로부터 선택되는 것인, 단리된 핵산을 제공한다.
일부 실시양태에서, 제1 유전자 생성물 또는 제2 유전자 생성물은 Gcase 단백질 또는 그의 일부이다. 일부 실시양태에서, 제1 유전자 생성물 또는 제2 유전자 생성물은 LIMP2 또는 그의 일부, 또는 프로사포신 또는 그의 일부이다. 일부 실시양태에서, 제1 유전자 생성물은 Gcase 단백질이고, 제2 유전자 생성물은 LIMP2 또는 그의 일부, 또는 프로사포신 또는 그의 일부이다.
일부 실시양태에서, 발현 구축물은 간섭 핵산 (예컨대, shRNA, miRNA, dsRNA 등)을 추가로 코딩한다. 일부 실시양태에서, 간섭 핵산은 α-시누클레인 (α-시누클레인)의 발현을 억제시킨다. 일부 실시양태에서, α-시누클레인을 표적화하는 간섭 핵산은 서열식별번호 20-25 중 어느 하나에 기재된 서열을 포함한다. 일부 실시양태에서, α-시누클레인을 표적화하는 간섭 핵산은 서열식별번호 20-25 중 어느 하나에 기재된 서열에 결합한다 (예컨대, 그와 하이브리드화한다).
일부 실시양태에서, 발현 구축물은 하나 이상의 프로모터를 추가로 포함한다. 일부 실시양태에서, 프로모터는 닭 베타 액틴 (CBA) 프로모터, CAG 프로모터, CD68 프로모터, 또는 JeT 프로모터이다. 일부 실시양태에서, 프로모터는 RNA pol II 프로모터 (예컨대, 또는 RNA pol III 프로모터 (예컨대, U6 등)이다.
일부 실시양태에서, 발현 구축물은 내부 리보솜 진입 부위 (IRES)를 추가로 포함한다. 일부 실시양태에서, IRES는 제1 유전자 생성물과 제2 유전자 생성물 사이에 위치한다.
일부 실시양태에서, 발현 구축물은 자기 절단 펩티드 코딩 서열을 추가로 포함한다. 일부 실시양태에서, 자기 절단 펩티드는 T2A 펩티드이다.
일부 실시양태에서, 발현 구축물은 2개의 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR) 서열을 포함한다. 일부 실시양태에서, ITR 서열은 제1 유전자 생성물 및 제2 유전자 생성물에 플랭킹된다 (예컨대, 5' 단부에서 3' 단부 방향으로 하기와 같이 배열되어 있다: ITR-제1 유전자 생성물-제2 유전자 생성물-ITR). 일부 실시양태에서, 단리된 핵산의 ITR 서열 중 하나에는 기능성 말단 분해 부위 (trs)가 결손되어 있다. 예를 들어, 일부 실시양태에서, ITR 중 하나는 ΔITR이다.
일부 측면에서, 본 개시내용은 변형된 "D" 영역 (예컨대, 야생형 AAV2 ITR 기준으로 변형된 D 서열, 서열식별번호 29)을 갖는 ITR을 포함하는 rAAV 벡터에 관한 것이다. 일부 실시양태에서, 변형된 D 영역을 갖는 ITR은 rAAV 벡터의 5' ITR이다. 일부 실시양태에서, 변형된 "D" 영역은 예를 들어, 서열식별번호 26에 기재되어 있는 바와 같은 "S" 서열을 포함한다. 일부 실시양태에서, 변형된 "D" 영역을 갖는 ITR은 rAAV 벡터의 3' ITR이다. 일부 실시양태에서, 일부 실시양태에서, 변형된 "D" 영역은 "D" 영역이 ITR의 3' 단부에 (예컨대, 벡터의 트랜스진 인서트 기준으로 ITR의 외부 또는 말단 단부 상에) 위치하는 3' ITR을 포함한다. 일부 실시양태에서, 변형된 "D" 영역은 서열식별번호 26 또는 27에 기재되어 있는 바와 같은 서열을 포함한다.
일부 실시양태에서, 단리된 핵산 (예컨대, rAAV 벡터)는 TRY 영역을 포함한다. 일부 실시양태에서, TRY 영역은 서열식별번호 28에 기재되어 있는 바와 같은 서열을 포함한다.
일부 실시양태에서, 본 개시내용에 의해 기술된 단리된 핵산은 서열식별번호 1 내지 13, 15, 17, 및 19 중 어느 하나에 기재된 서열을 포함하거나 또는 그로 이루어진다. 일부 실시양태에서, 본 개시내용에 의해 기술된 단리된 핵산은 서열식별번호 14, 16, 및 18중 어느 하나에 기재된 서열을 포함하거나 또는 그로 이루어진 펩티드를 코딩한다.
일부 측면에서, 본 개시내용은 본 개시내용에 의해 기술된 바와 같은 단리된 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 플라스미드, 또는 바이러스 벡터이다. 일부 실시양태에서, 바이러스 벡터는 재조합 AAV (rAAV) 벡터이다. 일부 실시양태에서, rAAV 벡터는 단일-가닥 (예컨대, 단일-가닥 DNA)이다.
일부 측면에서, 본 개시내용은 본 개시내용에 의해 기술된 바와 같은 단리된 핵산, 또는 본 개시내용에 의해 기술된 바와 같은 벡터를 포함하는 숙주 세포를 제공한다.
일부 측면에서, 본 개시내용은 본 개시내용에 의해 기술된 바와 같은 캡시드 단백질 및 단리된 핵산 또는 벡터를 포함하는 재조합 아데노-연관 바이러스 (rAAV)를 제공한다.
일부 실시양태에서, 캡시드 단백질, 예를 들어, AAV9 캡시드 단백질 또는 AAVrh.10 캡시드 단백질은 혈액-뇌 장벽을 건널 수 있다. 일부 실시양태에서, rAAV는 중추 신경계 (CNS)의 뉴런 세포 및 비-뉴런 세포를 형질도입한다.
일부 측면에서, 본 개시내용은 파킨슨병을 앓거나 또는 앓을 것으로 의심되는 대상체에게 본 개시내용에 의해 기술된 바와 같은 조성물 (예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)을 투여하는 단계를 포함하는, 파킨슨병을 앓거나 또는 앓을 것으로 의심되는 대상체를 치료하는 방법을 제공한다.
일부 실시양태에서, 투여는 대상체의 CNS에의 직접 주사를 포함한다. 일부 실시양태에서, 직접 주사는 대뇌내 주사, 실질내 주사, 경막내 주사, 대수조내 주사, 또는 그의 임의의 조합이다. 일부 실시양태에서, 대상체의 CNS에의 직접 주사는 컨벡션 강화 전달법 (CED)을 포함한다.
일부 실시양태에서, 투여는 말초 주사를 포함한다. 일부 실시양태에서, 말초 주사는 정맥내 주사이다.
도 1은 Gcase (예컨대, GBA1 또는 그의 일부)를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다.
도 2는 Gcase (예컨대, GBA1 또는 그의 일부) 및 LIMP2 (SCARB2) 또는 그의 일부를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다. Gcase 및 LIMP2의 코딩 서열은 내부 리보솜 진입 부위 (IRES)에 의해 이격되어 있다.
도 3은 Gcase (예컨대, GBA1 또는 그의 일부) 및 LIMP2 (SCARB2) 또는 그의 일부를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다. Gcase 및 LIMP2의 코딩 서열의 발현은 각각 별개의 프로모터에 의해 구동된다.
도 4는 Gcase (예컨대, GBA1 또는 그의 일부), LIMP2 (SCARB2) 또는 그의 일부, 및 α-Syn에 대한 간섭 RNA를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다.
도 5는 Gcase (예컨대, GBA1 또는 그의 일부), 프로사포신 (예컨대, PSAP 또는 그의 일부), 및 α-Syn에 대한 간섭 RNA를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다.
도 6은 Gcase (예컨대, GBA1 또는 그의 일부) 및 프로사포신 (예컨대, PSAP 또는 그의 일부)을 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다. Gcase 및 프로사포신의 코딩 서열은 내부 리보솜 진입 부위 (IRES)에 의해 이격되어 있다.
도 7은 Gcase (예컨대, GBA1 또는 그의 일부)를 코딩하는 발현 구축물을 포함하는 rAAV 벡터의 한 실시양태를 도시한 개략도이다. 본 실시양태에서, 벡터는 인간 GBA1의 코돈 최적화된 코딩 서열을 구성적으로 발현하기 위해, 4개 파트: CMV 인핸서 (CMVe), CBA 프로모터 (CBAp), 엑손 1, 및 인트론 (int)으로 이루어진, CBA 프로모터 요소 (CBA)를 포함한다. 3' 영역은 또한 WPRE 조절 요소, 이어서, bGH 폴리A 테일을 함유한다. 3개의 전사 조절 활성화 부위가 프로모터 영역의 5' 단부에 포함되어 있다: TATA, RBS, 및 YY1. 플랭킹 ITR을 통해 개재 서열은 정확하게 패키징될 수 있다. 5' ITR 서열의 두 변이체 (삽입 박스)를 평가하였다: 상기 변이체들은 야생형 AAV2 ITR의 20-뉴클레오티드 "D" 영역 내에서 수개의 뉴클레오티드 차이를 보인다. 일부 실시양태에서, rAAV 벡터는 상단 라인에 제시된 "D" 도메인 뉴클레오티드 서열을 함유한다. 일부 실시양태에서, rAAV 벡터 돌연변이체 "D" 도메인 (예컨대, "S" 도메인, 여기서 뉴클레오티드 변이는 하단 라인에 제시)을 보유한다.
도 8은 도 7에 기술된 rAAV 벡터를 코딩하는 플라스미드의 한 실시양태를 도시한 개략도이다.
도 9는 파킨슨병을 앓는 CBE 마우스 모델에서의 Gcase (예컨대, GBA1 또는 그의 일부)를 코딩하는 트랜스진을 포함하는 rAAV의 전달에 대한 대표적인 데이터를 보여주는 것이다. P8에 PBS 비히클, 25 mg/kg CBE, 37.5 mg/kg CBE, 또는 50 mg/kg CBE (좌측부터 우측으로)의 매일 IP 전달을 개시하였다. 매일 2회에 걸쳐 생존 (좌측 상단)을 체크하였고, 체중 (우측 상단)은 매일 체크하였다. 모든 군은 n = 8으로 시작하였다. P23에 오픈 필드에서의 총 이동 거리 (좌측 하단) 및 P24에 로타로드에서 떨어질 때까지의 시간 (하단의 중간)에 의해 행동을 사정하였다. CBE를 중단한 조건 (3일째) 및 CBE를 중단하지 않은 조건 (1일째), 둘 모두의 PBS 및 25 mg/kg CBE 처리군 중의 마우스의 피질에서 GCase 기질의 수준을 분석하였다. 응집체 GluSph 및 GalSph 수준 (우측 하단)은 조직 습식 중량 1 mg당 pmol로 제시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; **p<0.01; ***p<0.001, 선형 회귀에 의한 처리군에 대한 명목 p 값.
도 10은 CBE 마우스 모델에서의 최대 rAAV 용량에 대한 연구 디자인의 한 실시양태를 도시한 개략도이다. 간략하면, rAAV를 P3에 ICV 주사에 의해 전달하고, P8에 매일 CBE 처리를 개시하였다. P24-25에 오픈 필드 및 로타로드 검정법으로 행동을 사정하고, P36 및 P38에 기질 수준을 측정하였다.
도 11은 CBE 마우스 모델에서의 최대 rAAV 용량의 생전 사정에 대한 대표적인 데이터를 보여주는 것이다. P3에, 마우스를 ICV 전달을 통해 부형제 또는 8.8e9 vg rAAV로 처리하였다. P8에 PBS 또는 25 mg/kg CBE의 매일 IP 전달을 개시하였다. 연구 종료시, 마우스 중 절반을 P36 (1일째)에 그의 최종 CBE 투약 후 다음날 희생시켰고, 나머지 절단은 P38 (3일째)에 희생시키기 전에 3일 동안 CBE를 중단하였다. 모든 처리군 (부형제 + PBS의 경우, n = 8, rAAV + PBS의 경우, n = 7, 부형제 + CBE의 경우, n = 8, 및 rAAV + CBE의 경우, n = 9)의 체중을 매일 측정하였고 (좌측 상단), P36에서의 체중을 분석하였다 (우측 상단). P23에 오픈 필드에서의 총 이동 거리 (좌측 하단) 및 P24에 로타로드에서 떨어질 때까지의 시간 (우측 하단)에 의해 행동을 사정하고, 각 동물에 대하여 3회 시도에 대한 중간값으로서 평가하였다. 치사에 기인하여, 행동 검정법에서 부형제 + CBE 군의 경우, n = 7인 반면, 다른 군은 모두 n=8이었다. 동물들 간의 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; ***p<0.001, CBE 처리된 동물에서 선형 회귀에 의한 처리군에 대한 명목 p 값.
도 12는 CBE 마우스 모델에서의 최대 rAAV 용량의 생화학적 사정에 대한 대표적인 데이터를 보여주는 것이다. CBE 중단 전 (1일째) 또는 CBE 중단 후 (3일째), 모든 처리군 (부형제 + PBS의 경우, n = 8, rAAV + PBS의 경우, n = 7, 부형제 + CBE의 경우, n = 7, 및 rAAV + CBE의 경우, n = 9)의 피질을 사용하여 군에서의 GCase 활성 (좌측 상단), GluSph 수준 (우측 상단), GluCer 수준 (좌측 하단), 및 벡터 게놈 (우측 하단)을 측정하였다. 생체분포는 게놈 DNA 1 ㎍당 벡터 게놈으로 제시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다. (*)p<0.1; **p<0.01; ***p<0.001, CBE 처리된 동물에서 선형 회귀에 의한 처리군에 대한 명목 p 값, 여기서 수집일 및 성별은 공변량으로서 보정.
도 13은 부형제 + PBS, 부형제 + CBE, 및 rAAV + CBE 처리군의 투여 이후의 CBE 마우스 모델에서의 행동 및 생화학적 상관관계에 대한 대표적인 데이터를 보여주는 것이다. 처리군 간에, 로타로드에서의 수행능은 GluCer 축적과 음의 상관관계를 가졌고 (A, 선형 회귀에 의해 p=0.0012), GluSph 축적은 증가된 GCase 활성과 음의 상관관계를 가졌다 (B, 선형 회귀에 의해 p=0.0086).
도 14는 CBE 마우스 모델에서의 GBA1 rAAV의 생체분포에 대한 대표적인 데이터를 보여주는 것이다. 모든 처리군 (부형제 + PBS의 경우, n = 8, rAAV + PBS의 경우, n = 7, 부형제 + CBE의 경우, n = 7, 및 rAAV + CBE의 경우, n = 9)에 대해 간, 비장, 신장, 및 생식선에서 벡터 게놈의 존재를 사정하였다. 생체분포는 게놈 DNA 1 ㎍당 벡터 게놈으로 제시되어 있다. 벡터 참조 표준 곡선을 이용하여 정량적 PCR에 의해 벡터 게놈 존재를 정량화하였고; A260 광학 밀도 측정에 의해 게놈 DNA 농도를 평가하였다. 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; **p<0.01; ***p<0.001, CBE 처리된 동물에서 선형 회귀에 의한 처리군에 대한 명목 p 값, 여기서 수집일 및 성별은 공변량으로서 보정.
도 15는 CBE 마우스 모델에서의 rAAV 용량 범위의 생전 사정에 대한 대표적인 데이터를 보여주는 것이다. 마우스는 P3에 ICV 전달에 의해 부형제 또는 3개의 상이한 용량의 GBA1 rAAV: 3.2e9 vg, 1.0e10 vg, 또는 3.2e10 vg 중 하나를 받았다. P8에, 25 mg/kg CBE의 매일 IP 처리를 개시하였다. 부형제 및 CBE 또는 부형제 및 PBS를 받은 마우스는 대조군으로서의 역할을 하였다. 모든 처리군은 군당 n = 10 (5M/5F)으로 시작하였다. 모든 마우스를 그의 최종 CBE 투약 후 다음날 (P38-P40) 희생시켰다. 모든 처리군을 매일 체중을 측정하고, P36에 그의 체중을 분석하였다. P24에 로타로드에서 떨어질 때까지의 시간, 및 P30에 테이퍼 빔(Tapered Beam)을 건너는 데 소요되는 시간에 의해 운동 수행능을 사정하였다. 조기 치사에 기인하여, 행동 검정법에 참여한 마우스의 마리수는 부형제 + PBS의 경우, n = 10, 부형제 + CBE의 경우, n = 9, 및 3.2e9 vg rAAV + CBE의 경우, n = 6, 1.0e10 vg rAAV + CBE의 경우, n = 10, 3.2e10 vg rAAV + CBE의 경우, n = 7이었다. 평균이 제시되어 있다. 오차 막대는 SEM이고; * p<0.05; **p<0.01, CBE 처리군에서 선형 회귀에 의한 명목 p 값, 여기서 성별은 공변량으로서 보정.
도 16은 CBE 마우스 모델에서의 rAAV 용량 범위의 생화학적 사정에 대한 대표적인 데이터를 보여주는 것이다. 모든 처리군 (부형제 + PBS의 경우, n = 10, 부형제 + CBE의 경우, n = 9, 및 3.2e9 vg rAAV + CBE의 경우, n = 6, 1.0e10 vg rAAV + CBE의 경우, n = 10, 3.2e10 vg rAAV + CBE의 경우, n = 7)의 피질을 이용하여 GCase 활성, GluSph 수준, GluCer 수준, 및 벡터 게놈을 측정하였다. GCase 활성은 총 단백질 1 mg당 GCase ng로 제시되어 있다. GluSph 및 GluCer 수준은 조직 습식 중량 1 mg당 pmol로 제시되어 있다. 생체분포는 게놈 DNA 1 ㎍당 벡터 게놈으로 제시되어 있다. 벡터 참조 표준 곡선을 이용하여 정량적 PCR에 의해 벡터 게놈 존재를 정량화하였고; A260 광학 밀도 측정에 의해 게놈 DNA 농도를 평가하였다. 벡터 게놈 존재를 또한 간에서도 측정하였다 (E). 평균이 제시되어 있다. 오차 막대는 SEM이다. **p<0.01; ***p<0.001, CBE 처리군에서 선형 회귀에 의한 명목 p 값, 여기서 성별은 공변량으로서 보정.
도 17은 유전적 마우스 모델에서 최대 용량 GBA1 rAAV에서의 테이퍼 빔 분석에 대한 대표적인 데이터를 보여주는 것이다. rAAV 투여 후 4주째에 빔 워크(Beam Walk)에 의해 처리군 (WT + 부형제, n = 5), 4L/PS-NA + 부형제 (n = 6), 및 4L/PS-NA + rAAV (n = 5))의 운동 수행능을 검정하였다. 총 슬립수 및 활동 시간은 상이한 빔에서의 5회 시도에 대한 총합으로 제시되어 있다. 속도 및 속도당 슬립수는 상이한 빔에서의 5회 시도에 대한 평균으로 제시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다.
도 18은 프로사포신 (PSAP), SCARB2, 및/또는 하나 이상의 억제성 핵산과 함께 조합된, GBA1을 코딩하는 rAAV 구축물의 시험관내 발현에 대한 대표적인 데이터를 보여주는 것이다. 데이터는, HEK293 세포를 각 구축물로 형질감염시켰을 때, GFP 형질감염된 세포와 비교하여 관심 트랜스진이 과다발현되었다는 것을 나타낸다.
도 19는 ITR의 "외부"에 (예컨대, 트랜스진 인서트 또는 발현 구축물 기준으로 ITR의 말단에 인접하게) 위치하는 "D" 영역을 포함하는 rAAV 벡터 (상단), 및 벡터의 "내부"에 (예컨대, 벡터의 트랜스진 인서트에 인접한 위치에) ITR을 갖는 야생형 rAAV 벡터를 도시한 개략도이다.
도 20은 "D" 서열이 야생형으로 (동그라미 표시) 또는 대안적으로 (예컨대, "외부에"; 사각형 표시) 배치되어 있는 ITR을 갖는 rAAV를 이용한 HEK293 세포의 형질도입에 대한 데이터를 보여주는 것이다. "외부에" 배치된 ITR을 갖는 rAAV는 야생형 ITR을 갖는 rAAV만큼 효율적으로 세포를 형질도입시킬 수 있었다.
도 2는 Gcase (예컨대, GBA1 또는 그의 일부) 및 LIMP2 (SCARB2) 또는 그의 일부를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다. Gcase 및 LIMP2의 코딩 서열은 내부 리보솜 진입 부위 (IRES)에 의해 이격되어 있다.
도 3은 Gcase (예컨대, GBA1 또는 그의 일부) 및 LIMP2 (SCARB2) 또는 그의 일부를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다. Gcase 및 LIMP2의 코딩 서열의 발현은 각각 별개의 프로모터에 의해 구동된다.
도 4는 Gcase (예컨대, GBA1 또는 그의 일부), LIMP2 (SCARB2) 또는 그의 일부, 및 α-Syn에 대한 간섭 RNA를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다.
도 5는 Gcase (예컨대, GBA1 또는 그의 일부), 프로사포신 (예컨대, PSAP 또는 그의 일부), 및 α-Syn에 대한 간섭 RNA를 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다.
도 6은 Gcase (예컨대, GBA1 또는 그의 일부) 및 프로사포신 (예컨대, PSAP 또는 그의 일부)을 코딩하는 발현 구축물을 포함하는 rAAV 벡터를 포함하는 플라스미드의 한 실시양태를 도시한 개략도이다. Gcase 및 프로사포신의 코딩 서열은 내부 리보솜 진입 부위 (IRES)에 의해 이격되어 있다.
도 7은 Gcase (예컨대, GBA1 또는 그의 일부)를 코딩하는 발현 구축물을 포함하는 rAAV 벡터의 한 실시양태를 도시한 개략도이다. 본 실시양태에서, 벡터는 인간 GBA1의 코돈 최적화된 코딩 서열을 구성적으로 발현하기 위해, 4개 파트: CMV 인핸서 (CMVe), CBA 프로모터 (CBAp), 엑손 1, 및 인트론 (int)으로 이루어진, CBA 프로모터 요소 (CBA)를 포함한다. 3' 영역은 또한 WPRE 조절 요소, 이어서, bGH 폴리A 테일을 함유한다. 3개의 전사 조절 활성화 부위가 프로모터 영역의 5' 단부에 포함되어 있다: TATA, RBS, 및 YY1. 플랭킹 ITR을 통해 개재 서열은 정확하게 패키징될 수 있다. 5' ITR 서열의 두 변이체 (삽입 박스)를 평가하였다: 상기 변이체들은 야생형 AAV2 ITR의 20-뉴클레오티드 "D" 영역 내에서 수개의 뉴클레오티드 차이를 보인다. 일부 실시양태에서, rAAV 벡터는 상단 라인에 제시된 "D" 도메인 뉴클레오티드 서열을 함유한다. 일부 실시양태에서, rAAV 벡터 돌연변이체 "D" 도메인 (예컨대, "S" 도메인, 여기서 뉴클레오티드 변이는 하단 라인에 제시)을 보유한다.
도 8은 도 7에 기술된 rAAV 벡터를 코딩하는 플라스미드의 한 실시양태를 도시한 개략도이다.
도 9는 파킨슨병을 앓는 CBE 마우스 모델에서의 Gcase (예컨대, GBA1 또는 그의 일부)를 코딩하는 트랜스진을 포함하는 rAAV의 전달에 대한 대표적인 데이터를 보여주는 것이다. P8에 PBS 비히클, 25 mg/kg CBE, 37.5 mg/kg CBE, 또는 50 mg/kg CBE (좌측부터 우측으로)의 매일 IP 전달을 개시하였다. 매일 2회에 걸쳐 생존 (좌측 상단)을 체크하였고, 체중 (우측 상단)은 매일 체크하였다. 모든 군은 n = 8으로 시작하였다. P23에 오픈 필드에서의 총 이동 거리 (좌측 하단) 및 P24에 로타로드에서 떨어질 때까지의 시간 (하단의 중간)에 의해 행동을 사정하였다. CBE를 중단한 조건 (3일째) 및 CBE를 중단하지 않은 조건 (1일째), 둘 모두의 PBS 및 25 mg/kg CBE 처리군 중의 마우스의 피질에서 GCase 기질의 수준을 분석하였다. 응집체 GluSph 및 GalSph 수준 (우측 하단)은 조직 습식 중량 1 mg당 pmol로 제시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; **p<0.01; ***p<0.001, 선형 회귀에 의한 처리군에 대한 명목 p 값.
도 10은 CBE 마우스 모델에서의 최대 rAAV 용량에 대한 연구 디자인의 한 실시양태를 도시한 개략도이다. 간략하면, rAAV를 P3에 ICV 주사에 의해 전달하고, P8에 매일 CBE 처리를 개시하였다. P24-25에 오픈 필드 및 로타로드 검정법으로 행동을 사정하고, P36 및 P38에 기질 수준을 측정하였다.
도 11은 CBE 마우스 모델에서의 최대 rAAV 용량의 생전 사정에 대한 대표적인 데이터를 보여주는 것이다. P3에, 마우스를 ICV 전달을 통해 부형제 또는 8.8e9 vg rAAV로 처리하였다. P8에 PBS 또는 25 mg/kg CBE의 매일 IP 전달을 개시하였다. 연구 종료시, 마우스 중 절반을 P36 (1일째)에 그의 최종 CBE 투약 후 다음날 희생시켰고, 나머지 절단은 P38 (3일째)에 희생시키기 전에 3일 동안 CBE를 중단하였다. 모든 처리군 (부형제 + PBS의 경우, n = 8, rAAV + PBS의 경우, n = 7, 부형제 + CBE의 경우, n = 8, 및 rAAV + CBE의 경우, n = 9)의 체중을 매일 측정하였고 (좌측 상단), P36에서의 체중을 분석하였다 (우측 상단). P23에 오픈 필드에서의 총 이동 거리 (좌측 하단) 및 P24에 로타로드에서 떨어질 때까지의 시간 (우측 하단)에 의해 행동을 사정하고, 각 동물에 대하여 3회 시도에 대한 중간값으로서 평가하였다. 치사에 기인하여, 행동 검정법에서 부형제 + CBE 군의 경우, n = 7인 반면, 다른 군은 모두 n=8이었다. 동물들 간의 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; ***p<0.001, CBE 처리된 동물에서 선형 회귀에 의한 처리군에 대한 명목 p 값.
도 12는 CBE 마우스 모델에서의 최대 rAAV 용량의 생화학적 사정에 대한 대표적인 데이터를 보여주는 것이다. CBE 중단 전 (1일째) 또는 CBE 중단 후 (3일째), 모든 처리군 (부형제 + PBS의 경우, n = 8, rAAV + PBS의 경우, n = 7, 부형제 + CBE의 경우, n = 7, 및 rAAV + CBE의 경우, n = 9)의 피질을 사용하여 군에서의 GCase 활성 (좌측 상단), GluSph 수준 (우측 상단), GluCer 수준 (좌측 하단), 및 벡터 게놈 (우측 하단)을 측정하였다. 생체분포는 게놈 DNA 1 ㎍당 벡터 게놈으로 제시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다. (*)p<0.1; **p<0.01; ***p<0.001, CBE 처리된 동물에서 선형 회귀에 의한 처리군에 대한 명목 p 값, 여기서 수집일 및 성별은 공변량으로서 보정.
도 13은 부형제 + PBS, 부형제 + CBE, 및 rAAV + CBE 처리군의 투여 이후의 CBE 마우스 모델에서의 행동 및 생화학적 상관관계에 대한 대표적인 데이터를 보여주는 것이다. 처리군 간에, 로타로드에서의 수행능은 GluCer 축적과 음의 상관관계를 가졌고 (A, 선형 회귀에 의해 p=0.0012), GluSph 축적은 증가된 GCase 활성과 음의 상관관계를 가졌다 (B, 선형 회귀에 의해 p=0.0086).
도 14는 CBE 마우스 모델에서의 GBA1 rAAV의 생체분포에 대한 대표적인 데이터를 보여주는 것이다. 모든 처리군 (부형제 + PBS의 경우, n = 8, rAAV + PBS의 경우, n = 7, 부형제 + CBE의 경우, n = 7, 및 rAAV + CBE의 경우, n = 9)에 대해 간, 비장, 신장, 및 생식선에서 벡터 게놈의 존재를 사정하였다. 생체분포는 게놈 DNA 1 ㎍당 벡터 게놈으로 제시되어 있다. 벡터 참조 표준 곡선을 이용하여 정량적 PCR에 의해 벡터 게놈 존재를 정량화하였고; A260 광학 밀도 측정에 의해 게놈 DNA 농도를 평가하였다. 평균이 제시되어 있다. 오차 막대는 SEM이다. *p<0.05; **p<0.01; ***p<0.001, CBE 처리된 동물에서 선형 회귀에 의한 처리군에 대한 명목 p 값, 여기서 수집일 및 성별은 공변량으로서 보정.
도 15는 CBE 마우스 모델에서의 rAAV 용량 범위의 생전 사정에 대한 대표적인 데이터를 보여주는 것이다. 마우스는 P3에 ICV 전달에 의해 부형제 또는 3개의 상이한 용량의 GBA1 rAAV: 3.2e9 vg, 1.0e10 vg, 또는 3.2e10 vg 중 하나를 받았다. P8에, 25 mg/kg CBE의 매일 IP 처리를 개시하였다. 부형제 및 CBE 또는 부형제 및 PBS를 받은 마우스는 대조군으로서의 역할을 하였다. 모든 처리군은 군당 n = 10 (5M/5F)으로 시작하였다. 모든 마우스를 그의 최종 CBE 투약 후 다음날 (P38-P40) 희생시켰다. 모든 처리군을 매일 체중을 측정하고, P36에 그의 체중을 분석하였다. P24에 로타로드에서 떨어질 때까지의 시간, 및 P30에 테이퍼 빔(Tapered Beam)을 건너는 데 소요되는 시간에 의해 운동 수행능을 사정하였다. 조기 치사에 기인하여, 행동 검정법에 참여한 마우스의 마리수는 부형제 + PBS의 경우, n = 10, 부형제 + CBE의 경우, n = 9, 및 3.2e9 vg rAAV + CBE의 경우, n = 6, 1.0e10 vg rAAV + CBE의 경우, n = 10, 3.2e10 vg rAAV + CBE의 경우, n = 7이었다. 평균이 제시되어 있다. 오차 막대는 SEM이고; * p<0.05; **p<0.01, CBE 처리군에서 선형 회귀에 의한 명목 p 값, 여기서 성별은 공변량으로서 보정.
도 16은 CBE 마우스 모델에서의 rAAV 용량 범위의 생화학적 사정에 대한 대표적인 데이터를 보여주는 것이다. 모든 처리군 (부형제 + PBS의 경우, n = 10, 부형제 + CBE의 경우, n = 9, 및 3.2e9 vg rAAV + CBE의 경우, n = 6, 1.0e10 vg rAAV + CBE의 경우, n = 10, 3.2e10 vg rAAV + CBE의 경우, n = 7)의 피질을 이용하여 GCase 활성, GluSph 수준, GluCer 수준, 및 벡터 게놈을 측정하였다. GCase 활성은 총 단백질 1 mg당 GCase ng로 제시되어 있다. GluSph 및 GluCer 수준은 조직 습식 중량 1 mg당 pmol로 제시되어 있다. 생체분포는 게놈 DNA 1 ㎍당 벡터 게놈으로 제시되어 있다. 벡터 참조 표준 곡선을 이용하여 정량적 PCR에 의해 벡터 게놈 존재를 정량화하였고; A260 광학 밀도 측정에 의해 게놈 DNA 농도를 평가하였다. 벡터 게놈 존재를 또한 간에서도 측정하였다 (E). 평균이 제시되어 있다. 오차 막대는 SEM이다. **p<0.01; ***p<0.001, CBE 처리군에서 선형 회귀에 의한 명목 p 값, 여기서 성별은 공변량으로서 보정.
도 17은 유전적 마우스 모델에서 최대 용량 GBA1 rAAV에서의 테이퍼 빔 분석에 대한 대표적인 데이터를 보여주는 것이다. rAAV 투여 후 4주째에 빔 워크(Beam Walk)에 의해 처리군 (WT + 부형제, n = 5), 4L/PS-NA + 부형제 (n = 6), 및 4L/PS-NA + rAAV (n = 5))의 운동 수행능을 검정하였다. 총 슬립수 및 활동 시간은 상이한 빔에서의 5회 시도에 대한 총합으로 제시되어 있다. 속도 및 속도당 슬립수는 상이한 빔에서의 5회 시도에 대한 평균으로 제시되어 있다. 평균이 제시되어 있다. 오차 막대는 SEM이다.
도 18은 프로사포신 (PSAP), SCARB2, 및/또는 하나 이상의 억제성 핵산과 함께 조합된, GBA1을 코딩하는 rAAV 구축물의 시험관내 발현에 대한 대표적인 데이터를 보여주는 것이다. 데이터는, HEK293 세포를 각 구축물로 형질감염시켰을 때, GFP 형질감염된 세포와 비교하여 관심 트랜스진이 과다발현되었다는 것을 나타낸다.
도 19는 ITR의 "외부"에 (예컨대, 트랜스진 인서트 또는 발현 구축물 기준으로 ITR의 말단에 인접하게) 위치하는 "D" 영역을 포함하는 rAAV 벡터 (상단), 및 벡터의 "내부"에 (예컨대, 벡터의 트랜스진 인서트에 인접한 위치에) ITR을 갖는 야생형 rAAV 벡터를 도시한 개략도이다.
도 20은 "D" 서열이 야생형으로 (동그라미 표시) 또는 대안적으로 (예컨대, "외부에"; 사각형 표시) 배치되어 있는 ITR을 갖는 rAAV를 이용한 HEK293 세포의 형질도입에 대한 데이터를 보여주는 것이다. "외부에" 배치된 ITR을 갖는 rAAV는 야생형 ITR을 갖는 rAAV만큼 효율적으로 세포를 형질도입시킬 수 있었다.
본 개시내용은 부분적으로 대상체에서 PD 연관 유전자 생성물의 조합의 발현을 위한 조성물 및 방법에 기초한다. 유전자 생성물은 단백질, 단백질의 단편 (예컨대, 일부), PD 연관 유전자를 억제시키는 간섭 핵산 등일 수 있다. 일부 실시양태에서, 유전자 생성물은 PD 연관 유전자에 의해 코딩되는 단백질 또는 단백질 단편이다. 일부 실시양태에서, 유전자 생성물은 PD 연관 유전자를 억제시키는 간섭 핵산 (예컨대, shRNA, siRNA, miRNA, amiRNA 등)이다.
PD 연관 유전자란, PD와 유전적으로, 생화학적으로 또는 기능적으로 연관이 있는 유전자 생성물을 코딩하는 유전자를 지칭한다. 예를 들어, (단백질 Gcase를 코딩하는) GBA1 유전자 중 돌연변이를 갖는 개체는 GBA1 중에 돌연변이를 가지지 않는 것과 비교하였을 때, PD가 발생할 위험이 증가되어 있는 것으로 관찰되었다. 또 다른 예에서, PD는 α-시누클레인 (α-Syn)을 포함하는 단백질 응집체의 축적과 연관이 있고; 따라서, (α-Syn을 코딩하는) SCNA가 PD 연관 유전자이다. 일부 실시양태에서, 본원에 기술된 발현 카세트는 야생형 또는 비-돌연변이체 형태의 PD 연관 유전자 (또는 그의 코딩 서열)이다. PD 연관 유전자의 예는 표 1에 열거되어 있다.
<표 1>
PD 연관 유전자의 예
단리된
핵산 및 벡터
단리된 핵산은 DNA 또는 RNA일 수 있다. 일부 측면에서, 본 개시내용은 Gcase (예컨대, GBA1 유전자의 유전자 생성물) 또는 그의 일부를 코딩하는 발현 구축물을 포함하는 단리된 핵산을 제공한다. β-글루코세레브로시다제 또는 GBA로도 지칭되는 Gcase란, 당지질 대사에서 중간체인 화학물질 글루코세레브로시드의 베타-글리코시드 결합을 절단하는 리소좀 단백질을 지칭한다. 인간에서, Gcase는 염색체 1에 위치하는, GBA1 유전자에 의해 코딩된다. 일부 실시양태에서, GBA1은 NCBI 참조 서열 NCBI 참조 서열 NP_000148.2 (서열식별번호 14)에 의해 제시되는 펩티드를 코딩한다. 일부 실시양태에서, 단리된 핵산은 코돈 최적화된 (예컨대, 포유동물 세포, 예를 들어, 인간 세포에서의 발현을 위해 코돈 최적화된) Gcase 코딩 서열, 예컨대, 서열식별번호 15에 기재된 서열을 포함한다.
일부 측면에서, 본 개시내용은 프로사포신 (예컨대, PSAP 유전자의 유전자 생성물)을 코딩하는 발현 구축물을 포함하는 단리된 핵산을 제공한다. 프로사포신은 짧은 올리고당 기를 갖는 글리코스핑고리피드의 이화작용을 촉진시키는 스핑고리피드 활성인자 단백질 (사포신) A, B, C, 및 D에 대한 전구체 당단백질이다. 인간에서, PSAP 유전자는 염색체 10에 위치한다. 일부 실시양태에서, PSAP는 NCBI 참조 서열 NP_002769.1 (예컨대, 서열식별번호 16)에 의해 제시되는 펩티드를 코딩한다. 일부 실시양태에서, 단리된 핵산은 코돈 최적화된 (예컨대, 포유동물 세포, 예를 들어, 인간 세포에서의 발현을 위해 코돈 최적화된) 프로사포신 코딩 서열, 예컨대, 서열식별번호 17에 기재된 서열을 포함한다.
본 개시내용의 측면은 LIMP2/SCARB2 (예컨대, SCARB2 유전자의 유전자 생성물)를 코딩하는 발현 구축물을 포함하는 단리된 핵산에 관한 것이다. SCARB2는 세포 내에서의 리소좀 및 엔도솜 수송을 조절하는 막 단백질을 지칭한다. 인간에서, SCARB2 유전자는 염색체 4에 위치한다. 일부 실시양태에서, SCARB2 유전자는 NCBI 참조 서열 NP_005497.1 (서열식별번호 18)에 의해 제시되는 펩티드를 코딩한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호 19에 기재된 서열을 포함한다. 일부 실시양태에서, 단리된 핵산은 코돈 최적화된 SCARB2 코딩 서열을 포함한다.
일부 측면에서, 본 개시내용은 제1 유전자 생성물 및 제2 유전자 생성물을 코딩하는 발현 구축물을 포함하는 단리된 핵산이며, 여기서 각 유전자 생성물은 독립적으로 표 1에 기재된 유전자 생성물 또는 그의 일부로부터 선택되는 것인, 단리된 핵산을 제공한다.
일부 실시양태에서, 유전자 생성물은 자연적으로 발생된 유전자의 코딩 부분 (예컨대, cDNA)에 의해 코딩된다. 일부 실시양태에서, 제1 유전자 생성물은 GBA1 유전자에 의해 코딩된 단백질 (또는 그의 단편)이다. 일부 실시양태에서, 유전자 생성물은 SCARB2/LIMP2 유전자 및/또는 PSAP 유전자에 의해 코딩된 단백질 (또는 그의 단편)이다. 그러나, 통상의 기술자는 제1 유전자 생성물 (예컨대, Gcase) 및 제2 유전자 생성물 (예컨대, LIMP2)의 발현 순서가 일반적으로 역전될 수 있다는 것 (예컨대, LIMP2가 제1 유전자 생성물이고, Gcase가 제2 유전자 생성물이다)을 이해한다. 일부 실시양태에서, 유전자 생성물은 표 1에 열거된 유전자의 단편 (또는 일부)이다. 단백질 단편은 표 1에 열거된 유전자에 의해 코딩된 단백질의 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 99%를 포함할 수 있다. 일부 실시양태에서, 단백질 단편은 표 1에 열거된 유전자에 의해 코딩된 단백질의 50% 내지 99.9% (예컨대, 50% 내지 99.9% 사이의 임의의 값)를 포함한다.
일부 실시양태에서, 발현 구축물은 모노시스트론성이다 (예컨대, 발현 구축물은 제1 유전자 생성물 및 제2 유전자 생성물을 포함하는 단일 융합 단백질을 코딩한다). 일부 실시양태에서, 발현 구축물은 폴리시스트론성이다 (예컨대, 발현 구축물은 2개의 전혀 다른 유전자 생성물, 예를 들어, 2개의 상이한 단백질 또는 단백질 단편을 코딩한다).
폴리시스트론성 발현 벡터는 하나 이상의 (예컨대, 1, 2, 3, 4, 5개 또는 그 초과의) 프로모터를 포함할 수 있다. 임의의 적합한 프로모터, 예를 들어, 구성적 프로모터, 유도성 프로모터, 내인성 프로모터, 조직 특이적 프로모터 (예컨대, CNS 특이적 프로모터) 등이 사용될 수 있다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 프로모터 (CBA 프로모터), CAG 프로모터 (예를 들어, 문헌 [Alexopoulou et al. (2008) BMC Cell Biol . 9:2; doi: 10.1186/1471-2121-9-2]에 의해 기술된 것과 같은 것), CD68 프로모터, 또는 JeT 프로모터 (예를 들어, 문헌 [Tornøe et al. (2002) Gene 297(1-2):21-32]에 의해 기술된 것과 같은 것)이다. 일부 실시양태에서, 프로모터는 제1 유전자 생성물, 제2 유전자 생성물, 또는 제1 유전자 생성물 및 제2 유전자 생성물을 코딩하는 핵산 서열에 작동가능하게 연결된다. 일부 실시양태에서, 발현 카세트는 전사 인자 결합 서열, 인트론 스플라이스 부위, 폴리(A) 부가 부위, 인핸서 서열, 리프레서 결합 부위, 또는 상기의 임의의 조합을 포함하나, 이에 제한되지 않는, 하나 이상의 추가의 조절 서열을 포함한다.
일부 실시양태에서, 제1 유전자 생성물을 코딩하는 핵산 서열 및 제2 유전자 생성물을 코딩하는 핵산 서열은 내부 리보솜 진입 부위 (IRES)를 코딩하는 핵산 서열에 의해 이격된다. IRES 부위의 예는 예를 들어, 문헌 [Mokrejs et al. (2006) Nucleic Acids Res. 34(Database issue):D125-30]에 기술되어 있다. 일부 실시양태에서, 제1 유전자 생성물을 코딩하는 핵산 서열 및 제2 유전자 생성물을 코딩하는 핵산 서열은 자기 절단 펩티드를 코딩하는 핵산 서열에 의해 이격된다. 자기 절단 펩티드의 예는 T2A, P2A, E2A, F2A, BmCPV 2A, 및 BmIFV 2A, 및 문헌 [Liu et al. (2017) Sci Rep. 7: 2193]에 의해 기술된 것을 포함하나, 이에 제한되지 않는다. 일부 실시양태에서, 자기 절단 펩티드는 T2A 펩티드이다.
병리학상, 장애, 예컨대, PD 및 고셰병은 대개는 α-시누클레인 (α-Syn) 단백질로 구성된 단백질 응집체의 축적과 연관이 있다. 따라서, 일부 실시양태에서, 본원에 기술된 단리된 핵산은 α-Syn 단백질의 발현을 감소시키거나, 또는 방해하는 억제성 핵산을 포함한다. 억제성 핵산을 코딩하는 서열은 발현 벡터의 비번역 영역 (예컨대, 인트론, 5'UTR, 3'UTR 등)에 배치될 수 있다.
일부 실시양태에서, 억제성 핵산은 발현 구축물의 인트론에, 예를 들어, 제1 유전자 생성물을 코딩하는 서열의 상류쪽 인트론에 위치한다. 억제성 핵산은 이중 가닥 RNA (dsRNA), siRNA, 마이크로RNA (miRNA), 인공 miRNA (amiRNA), 또는 RNA 압타머일 수 있다. 일반적으로, 억제성 핵산은 표적 RNA (예컨대, mRNA)의 약 6개 내지 약 30개의 (예컨대, 6 내지 30 사이의 임의의 정수 (6 및 30 포함)) 연속적인 뉴클레오티드에 결합한다 (예컨대, 그와 하이브리드화한다). 일부 실시양태에서, 억제성 핵산 분자는 miRNA 또는 amiRNA, 예를 들어, SNCA (α-Syn 단백질을 코딩하는 유전자)를 표적화하는 miRNA이다. 일부 실시양태에서, miRNA는 하이브리드화 대상인 SNCA mRNA의 영역과의 미스매치는 포함하지 않는다 (예컨대, miRNA는 "완벽한 것이다"). 일부 실시양태에서, 억제성 핵산은 shRNA (예컨대, SNCA를 표적화하는 shRNA)이다.
본원에 기술된 단리된 핵산은 그 자체 단독으로, 또는 벡터의 일부로서 존재할 수 있다. 일반적으로, 벡터는 플라스미드, 코스미드, 파지미드, 박테리아 인공 염색체 (BAC), 또는 바이러스 벡터 (예컨대, 아데노바이러스 벡터, 아데노-연관 바이러스 (AAV) 벡터, 레트로바이러스 벡터, 배큘로바이러스 벡터 등)일 수 있다. 일부 실시양태에서, 벡터는 플라스미드 (예컨대, 본원에 기술된 바와 같은 단리된 핵산을 포함하는 플라스미드)이다. 일부 실시양태에서, 벡터는 재조합 AAV (rAAV) 벡터이다. 일부 실시양태에서, rAAV 벡터는 단일-가닥 (예컨대, 단일-가닥 DNA)이다. 일부 실시양태에서, 벡터는 배큘로바이러스 벡터 (예컨대, 오토그라파 칼리포르니카 핵 다각체병 (AcNPV) 벡터)이다.
전형적으로, rAAV 벡터 (예컨대, rAAV 게놈)는 두 AAV 역전된 말단 반복부 (ITR) 서열에 의해 플랭킹된 트랜스진 (예컨대, 하기 각각의 것: 프로모터, 인트론, 인핸서 서열, 단백질 코딩 서열, 억제성 RNA 코딩 서열, 폴리A 테일 서열 등 중 하나 이상의 것을 포함하는 발현 구축물)을 포함한다. 일부 실시양태에서, rAAV 벡터의 트랜스진은 본 개시내용에 의해 기술된 바와 같은 단리된 핵산을 포함한다. 일부 실시양태에서, rAAV 벡터의 두 ITR 서열은 각각 전장의 ITR (예컨대, 길이 대략 145 bp, 및 기능성 Rep 결합 부위 (RBS) 및 말단 분해 부위 (trs)를 함유하는 것)이다. 일부 실시양태에서, rAAV 벡터의 ITR들 중 하나는 말단절단된 것이다 (예컨대, 단축된 것이거나, 또는 전장의 것이 아니다). 일부 실시양태에서, 말단절단된 ITR에는 기능성 말단 분해 부위 (trs)가 결여되어 있고, 자기 상보성 AAV 벡터 (scAAV 벡터) 제조에 사용된다. 일부 실시양태에서, 말단절단된 ITR은 예를 들어, 문헌 [McCarty et al. (2003) Gene Ther . 10(26):2112-8]에 기술된 바와 같이, ΔITR이다.
본 개시내용의 측면은 야생형 AAV ITR 기준으로, 예를 들어, 야생형 AAV2 ITR (예컨대, 서열식별번호 29) 기준으로 하나 이상의 변형 (예컨대, 핵산 부가, 결실, 치환 등)을 갖는 ITR을 포함하는 단리된 핵산 (예컨대, rAAV 벡터)에 관한 것이다. 야생형 AAV2 ITR의 구조는 도 19에 제시되어 있다. 일반적으로, 야생형 ITR은, 자기 어닐링하여, 각각 B/B' 및 C/C'로 지칭되는 서열에 의해 형성된) 2개의 크로스 아암, (서열 A/A'에 의해 형성된) 더욱 긴 스템 영역, 및 "D" 영역으로 지칭되는 단일-가닥 말단 영역으로 이루어진 회문 이중 가닥 T 형상의 헤어핀 구조를 형성하는 125개의 뉴클레오티드 영역을 포함한다 (도 19). 일반적으로, ITR의 "D" 영역은 A/A' 서열에 의해 형성된 스템 영역과 rAAV 벡터의 트랜스진을 함유하는 인서트 사이에 위치한다 (예컨대, ITR의 말단 기준으로 ITR의 "내부"에 또는 rAAV 벡터의 트랜스진 인서트 또는 발현 구축물에 인접하게 위치한다). 일부 실시양태에서, "D" 영역은 서열식별번호 27에 기재된 서열을 포함한다. "D" 영역은 예를 들어, 문헌 [Ling et al. (2015) J Mol Genet Med 9(3)]에 개시되어 있는 바와 같이, 캡시드 단백질에 의한 rAAV 벡터의 캡시드화에서 중요한 역할을 하는 것으로 관찰되었다.
본 개시내용은 부분적으로 ITR의 "외부"에 (예컨대, 트랜스진 인서트 또는 발현 구축물 기준으로 ITR의 말단에 인접하게) 위치하는 "D" 영역을 포함하는 rAAV 벡터가 비변형된 (예컨대, 야생형) ITR로 ITR을 갖는 rAAV 벡터보다 AAV 캡시드 단백질에 의해 효율적으로 캡시드화된다는 놀라운 발견에 기초한다. 일부 실시양태에서, 변형된 "D" 서열 (예컨대, "외부 위치에 있는 "D" 서열")을 갖는 rAAV 벡터가 야생형 ITR 서열을 갖는 rAAV 벡터 기준으로 감소된 독성을 갖는다.
일부 실시양태에서, 변형된 "D" 서열은 야생형 "D" 서열 (예컨대, 서열식별번호 27) 기준으로 적어도 하나의 뉴클레오티드를 포함한다. 변형된 "D" 서열은 야생형 "D" 서열 (예컨대, 서열식별번호 27) 기준으로 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 10개 초과의 뉴클레오티드 치환을 가질 수 있다. 일부 실시양태에서, 변형된 "D" 서열은 야생형 "D" 서열 (예컨대, 서열식별번호 27) 기준으로 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 또는 19개의 핵산 치환을 포함한다. 일부 실시양태에서, 변형된 "D" 서열은 야생형 "D" 서열 (예컨대, 서열식별번호 27)과 약 10% 내지 약 99% (예컨대, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99%) 동일하다. 일부 실시양태에서, 변형된 "D" 서열은 문헌 [Wang et al. (1995) J Mol Biol 250(5):573-80]에 기술된 바와 같이 "S" 서열로도 지칭되는, 서열식별번호 26에 기재된 서열을 포함한다.
본 개시내용에 의해 기술된 바와 같은 단리된 핵산 또는 rAAV 벡터는 예를 들어, 서열식별번호 28에 기재된 바와 같은, 또는 문헌 [Francois, et al. The Cellular TATA Binding Protein Is Required for Rep-Dependent Replication of a Minimal Adeno-Associated Virus Type 2 p5 Element. J Virol. 2005]에 기술된 바와 같은 "TRY" 서열을 추가로 포함할 수 있다. 일부 실시양태에서, TRY 서열은 ITR (예컨대, 5' ITR)과 단리된 핵산 또는 rAAV 벡터의 발현 구축물 (예컨대, 트랜스진 코딩 인서트) 사이에 위치한다.
일부 측면에서, 본 개시내용은 본 개시내용에 의해 기술된 바와 같은 단리된 핵산 또는 rAAV 벡터를 포함하는 배큘로바이러스 벡터에 관한 것이다. 일부 실시양태에서, 배큘로바이러스 벡터는 예를 들어, 문헌 [Urabe et al. (2002) Hum Gene Ther 13(16):1935-43] 및 [Smith et al. (2009) Mol Ther 17(11):1888-1896]에 의해 기술된 바와 같은, 오토그라파 칼리포르니카 핵 다각체병 (AcNPV) 벡터이다.
일부 측면에서, 본 개시내용은 본원에 기술된 바와 같은 단리된 핵산 또는 벡터를 포함하는 숙주 세포를 제공한다. 숙주 세포는 원핵 세포 또는 진핵 세포일 수 있다. 예를 들어, 숙주 세포는 포유동물 세포, 박테리아 세포, 효모 세포, 곤충 세포 등일 수 있다. 일부 실시양태에서, 숙주 세포는 포유동물 세포, 예를 들어, HEK293T 세포이다. 일부 실시양태에서, 숙주 세포는 박테리아 세포, 예를 들어, E. 콜라이(E. coli) 세포이다.
rAAV
일부 측면에서, 본 개시내용은 본원에 기술된 바와 같은 핵산을 코딩하는 트랜스진을 포함하는 재조합 AAV (rAAV) (예컨대, 본원에 기술된 바와 같은 rAAV 벡터)에 관한 것이다. "rAAV"라는 용어는 일반적으로 하나 이상의 AAV 캡시드 단백질에 의해 캡시드화된 rAAV 벡터를 포함하는 바이러스 입자를 지칭한다. 본 개시내용에 의해 기술된 rAAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, 및 AAV10으로부터 선택되는 혈청형을 갖는 캡시드 단백질을 포함할 수 있다. 일부 실시양태에서, rAAV는 비-인간 숙주로부터의 캡시드 단백질, 예를 들어, 레수스 AAV 캡시드 단백질, 예컨대, AAVrh.10, AAVrh.39 등을 포함한다. 일부 실시양태에서, 본 개시내용에 의해 기술된 rAAV는 야생형 캡시드 단백질의 변이체인 캡시드 단백질, 예컨대, 유래 기점이 되는 야생형 AAV 캡시드 단백질 기준으로 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 10개 초과의 (예컨대¸ 15, 20 25, 50, 100개 등) 아미노산 치환 (예컨대, 돌연변이)을 포함하는 캡시드 단백질 변이체를 포함한다.
일부 실시양태에서, 본 개시내용에 의해 기술된 rAAV는 특히 CSF 공간 내로, 또는 뇌 실질 내로 직접 도입되었을 때, CNS를 통해 쉽게 확산된다. 따라서, 일부 실시양태에서, 본 개시내용에 의해 기술된 rAAV는 혈액-뇌 장벽 (BBB)을 건널 수 있는 캡시드 단백질을 포함한다. 예를 들어, 일부 실시양태에서, rAAV는 AAV9 또는 AAVrh.10 혈청형을 갖는 캡시드 단백질 포함한다. rAAV 제조는 예를 들어, 문헌 [Samulski et al. (1989) J Virol . 63(9):3822-8] 및 [Wright (2009) Hum Gene Ther. 20(7): 698-706]에 의해 기술되어 있다.
일부 실시양태에서, 본 개시내용에 의해 기술된 바와 같은 rAAV (예컨대, AAV 캡시드 단백질에 의해 캡시드화되어 rAAV 캡시드 입자를 형성하는 재조합 rAAV 게놈을 포함하는 것)는 배큘로바이러스 벡터 발현 시스템 (BEVS)에서 제조된다. BEVS를 이용하여 rAAV를 제조하는 것은 예를 들어, 문헌 [Urabe et al. (2002) Hum Gene Ther 13(16):1935-43], [Smith et al. (2009) Mol Ther 17(11):1888-1896], 미국 특허 번호 8,945,918, 미국 특허 번호 9,879,282, 및 국제 PCT 공개 WO 2017/184879에 의해 기술되어 있다. 그러나, rAAV는 임의의 적합한 방법 (예컨대, 재조합 rep 및 cap 유전자를 이용하는 방법)을 이용하여 제조될 수 있다.
제약 조성물
일부 측면에서, 본 개시내용은 본원에 기술된 바와 같은 단리된 핵산 또는 rAAV 및 제약상 허용되는 담체를 포함하는 제약 조성물을 제공한다. 본원에서 사용되는 바, "제약상 허용되는"이라는 용어는 물질, 예컨대, 담체 또는 희석제가 화합물의 생물학적 활성 또는 특성을 폐기하지 않고, 비교적 비독성이라는 것, 예컨대, 물질이 비바람직한 생물학적 효과를 유발하지 않거나, 또는 그와 함께 함유되어 있는 조성물의 성분 중 어느 것과도 유해한 방식으로 상호작용하지 않으면서, 개체에게 투여될 수 있다는 것을 지칭한다.
본원에서 사용되는 바, "제약상 허용되는 담체"라는 용어는 본 발명 내에서 유용한 화합물이 그의 의도된 기능을 수행할 수 있도록 상기 화합물을 환자 내에 또는 환자에게 운반 또는 수송하는 데 관여하는, 제약상 허용되는 물질, 조성물 또는 담체, 예컨대, 액체 또는 고체 충전제, 안정제, 분산화제, 현탁화제, 희석제, 부형제, 증점제, 용매 또는 캡슐화 물질을 의미한다. 본 발명의 실시에서 사용되는 제약 조성물에 포함될 수 있는 추가 성분은 관련 기술분야에 공지되어 있고, 예를 들어, 문헌 [Remington's Pharmaceutical Sciences (Genaro, Ed., Mack Publishing Co., 1985, Easton, PA)] (상기 문헌은 본원에서 참조로 포함된다)에 기술되어 있다.
본원에서 제공된 조성물 (예컨대, 제약 조성물)은 장관 (예컨대, 경구적), 비경구적, 정맥내, 근육내, 동맥내, 골수내, 경막내, 피하, 뇌실내, 경피, 피부간(interdermal), 직장, 질내, 복강내, 국소 (분제, 연고, 크림제, 및/또는 점적제에 의한 경우), 점막, 비강, 협착, 설하를 비롯한, 임의의 경로에 의해; 기관내 주입, 기관지 주입, 및/또는 흡입에 의해; 및/또는 경구용 스프레이, 비강용 스프레이, 및/또는 에어로졸로서 투여될 수 있다. 경구 투여, 정맥내 투여 (예컨대, 전신 정맥내 주사), 혈액 및/또는 림프 공급을 통한 국부 투여, 및/또는 환부로의 직접 투여가 구체적으로 고려되는 경로이다. 일반적으로, 가장 적절한 투여 경로는 작용제의 성질 (예컨대, 위장관 환경에서의 그의 안정성), 및/또는 대상체의 상태 (예컨대, 대상체가 경구 투여를 허용할 수 있는지 여부)를 비롯한, 다양한 인자에 의존할 것이다. 특정 실시양태에서, 본원에 기술된 화합물 또는 제약 조성물은 대상체의 안구로의 국소 투여에 적합하다.
방법
본 개시내용은 부분적으로 함께 (예컨대, 시너지적으로) 작용하여 파킨슨병을 치료하는, 대상체에서의 PD 연관 유전자 생성물의 조합의 발현을 위한 조성물에 기초한다. 본원에서 사용되는 바, "치료하다" 또는 "치료하는"이라는 것은 (a) 파킨슨병의 발병을 예방하거나, 또는 지연시키고/거나; (b) 파킨슨병의 중증도를 감소시키고/거나; (c) 파킨슨병의 특징적인 증상의 발생을 감소시키거나, 또는 예방하고/거나; (d) 파킨슨병의 특징적인 증상의 악화를 예방하는 것을 지칭한다. 파킨슨병의 증상으로는 예를 들어, 운동 기능장애 (예컨대, 떨림, 경직, 몸동작이 느려지는 서동, 보행 곤란), 인지 기능장애 (예컨대, 치매, 우울증, 불안), 감정 및 행동 기능장애를 포함한다.
따라서, 일부 측면에서, 본 개시내용은 파킨슨병을 앓거나 또는 앓을 것으로 의심되는 대상체에게 본 개시내용에 의해 기술된 바와 같은 조성물 (예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)을 투여하는 단계를 포함하는, 파킨슨병을 앓거나 또는 앓을 것으로 의심되는 대상체를 치료하는 방법을 제공한다.
일부 실시양태에서, 조성물은 대상체의 CNS로 직접, 예를 들어, 대상체의 뇌 및/또는 척수 내로의 직접 주사에 의해 투여된다. CNS에의 직접 주사 방식의 예로는 대뇌내 주사, 뇌실내 주사, 수조내 주사, 실질내 주사, 경막내 주사, 및 상기의 임의의 조합을 포함하나, 이에 제한되지 않는다. 일부 실시양태에서, 대상체의 CNS 내로 직접 주사하면, 그 결과로 트랜스진은 대상체의 중뇌, 선조체 및/또는 대뇌 피질에서 발현된다 (예컨대, 제1 유전자 생성물, 제2 유전자 생성물, 및 적용가능할 경우, 제3 유전자 생성물은 발현된다). 일부 실시양태에서, CNS 내로 직접 주사하면, 그 결과로 트랜스진은 대상체의 척수 및/또는 CSF에서 발현된다 (예컨대, 제1 유전자 생성물, 제2 유전자 생성물, 및 적용가능할 경우, 제3 유전자 생성물은 발현된다).
일부 실시양태에서, 대상체의 CNS로의 직접 주사는 컨벡션 강화 전달법 (CED)을 포함한다. 컨벡션 강화 전달법은 뇌를 외과적으로 노출시키고, 뇌의 표적 부위 내로 직접 소경 카테터를 배치한 후, 이어서, 치료제 (예컨대, 본원에 기술된 바와 같은 조성물 또는 rAAV)를 대상체의 뇌로 직접 주입하는 것을 포함하는 치료 전략법이다. CED는 예를 들어, 문헌 [Debinski et al. (2009) Expert Rev Neurother . 9(10):1519-27]에 의해 기술되어 있다.
일부 실시양태에서, 조성물은 대상체에게 예를 들어, 말초 주사에 의해 말초적으로 투여된다. 말초 주사의 예로는 피하 주사, 정맥내 주사, 동맥내 주사, 복강내 주사, 또는 상기의 임의의 조합을 포함한다. 일부 실시양태에서, 말초 주사는 동맥내 주사, 예를 들어, 대상체의 경동맥 내로의 주사이다.
일부 실시양태에서, 본 개시내용에 의해 기술된 바와 같은 조성물 (예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)은 말초적으로 및 대상체의 CNS로 직접, 상기 두 방식 모두에 의해 투여된다. 예를 들어, 일부 실시양태에서, 대상체는 동맥내 주사에 의해 (예컨대, 경동맥 내로의 주사에 의해), 및 실질내 주사에 의해 (예컨대, CED에 의한 실질내 주사에 의해) 조성물을 투여받는다. 일부 실시양태에서, CNS로의 직접 주사 및 말초 주사는 동시에 이루어진다 (예컨대, 같은 시간에 수행된다). 일부 실시양태에서, 직접 주사는 말초 주사 이전에 (예컨대, 말초 주사 전 1분 내지 1주 사이에, 또는 그를 초과하는 시간에) 이루어진다. 일부 실시양태에서, 직접 주사는 말초 주사 이후에 (예컨대, 말초 주사 후 1분 내지 1주 사이에, 또는 그를 초과하는 시간에) 이루어진다.
대상체에게 투여되는 본 개시내용에 의해 기술된 바와 같은 조성물 (예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)의 양은 투여 방법에 의존하여 달라질 것이다. 예를 들어, 일부 실시양태에서, 본원에 기술된 바와 같은 rAAV는 약 109 게놈 카피 (GC)/kg 내지 약 1014 GC/kg (예컨대, 약 109 GC/kg, 약 1010 GC/kg, 약 1011 GC/kg, 약 1012 GC/kg, 약 1012 GC/kg, 또는 약 1014 GC/kg)의 역가로 대상체에게 투여된다. 일부 실시양태에서, 대상체는 CSF 공간으로의 주사에 의해, 또는 실질내 주사에 의해 고역가로 (예컨대, >1012 게놈 카피 GC/kg (rAAV)) 투여받는다.
본 개시내용에 의해 기술된 바와 같은 조성물 (예컨대, 단리된 핵산 또는 벡터 또는 rAAV를 포함하는 조성물)은 1회 또는 다회에 걸쳐 (예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20회 또는 그 초과) 대상체에게 투여될 수 있다. 일부 실시양태에서, 조성물은 대상체에게 연속하여 (예컨대, 만성적으로), 예를 들어, 주입 펌프를 통해 투여된다.
실시예
실시예
1:
rAAV
벡터
삼중-플라스미드 형질감염을 위해 세포, 예컨대, HEK293 세포를 사용하여 AAV 벡터를 생성한다. ITR 서열은 각 관심 트랜스진에 대한 프로모터/인핸서 요소, 3' 폴리A 신호, 및 번역 후 신호, 예컨대, WPRE 요소를 포함하는 발현 구축물에 플랭킹된다. 단백질 서열의 융합에 의해; 또는 2A 펩티드 링커, 예컨대, T2A 또는 P2A 사용으로 펩티드 결합이 생성되지 못하게 방해됨에 따라 아미노산이 부가된 2개의 펩티드 단편이 유도됨으로써; IRES 요소를 사용하여; 또는 2개의 별개의 발현 카세트를 이용하는 발현에 의해 예컨대, GBA1 및 LIMP2 및/또는 프로사포신과 같은 다중 유전자 생성물이 동시에 발현될 수 있다. 발현 유전자 상류쪽의 효율적으로 스플라이싱된 짧은 인트론 서열의 존재가 발현 수준을 개선시킬 수 있다. shRNA 및 다른 조절 RNA가 잠재적으로 상기 서열 내에 포함될 수 있다. 본 개시내용에 의해 기술된 rAAV 벡터를 포함하는 플라스미드의 예는 도 1-6 및 하기 표 2에 제시되어 있다.
<표 2>
실시예
2:
GBA
결핍 세포로의 바이러스 형질도입에 관한 세포 기반 검정법
예를 들어, GD 환자 단핵구, 또는 hES 세포로부터의 섬유모세포, 또는 환자 유래의 유도 만능 줄기 세포 (iPSC)로서 GBA1 결핍 세포를 수득한다. 이들 세포는 기질, 예컨대, 글루코실세라미드 및 글루코실스핑고신 (GluCer 및 GluSph)을 축적한다. 야생형 또는 돌연변이체 배양 세포주를 Gcase 억제제, 예컨대, CBE로 처리하는 것 또한 GBA 결핍 세포를 수득하는 데 사용된다.
상기 세포 모델을 이용하여, 해당 단백질에 대한 항체 또는 포스포-αSyn을 이용한 후, 형광 현미경법을 이용하여 영상화함으로써 단백질 응집체, 예컨대, α-시누클레인의 축적에 의해 리소좀 결함을 정량화한다. 단백질 마커, 예컨대, LAMP1, LAMP2, LIMP1, LIMP2에 대한 ICC에 의해, 또는 염료, 예컨대, 리소트래커(Lysotracker)를 사용하여, 또는 형광성 덱스트란 또는 다른 마커의 세포내이입 구획을 통한 흡수에 의해 리소좀 이상에 대한 영상화 또한 수행한다. 리소좀과의 결함성 융합에 기인하는 자가포식 마커 축적에 대한, 예컨대 LC3에 대한 영상화 또한 수행될 수 있다. 웨스턴 블롯 및/또는 ELISA는 상기 마커의 비정상적인 축적을 정량화하는 데 사용된다. 또한, 당지질 기질 및 GBA1의 생성물의 축적은 표준 접근법을 이용하여 측정된다.
치료 종점 (예컨대, PD 연관 병상의 감소)은 활성 및 기능을 확인하고, 정량화하기 위해 AAV 벡터의 형질도임의 발현과 관련하여 측정된다. Gcase는 또한 단백질 ELISA 측정을 사용하여, 또는 표준 Gcase 활성 검정법에 의해 정량화될 수 있다.
실시예
3: 돌연변이체 마우스를 이용한
생체내
검정법
본 실시예는 돌연변이체 마우스를 이용한 AAV 벡터에 관한 생체내 검정법을 기술한다. 돌연변이체 마우스에서의 상기와 같은 AAV 벡터에 관한 생체내 연구는 예를 들어, 문헌 [Liou et al. (2006) J. Biol . Chem . 281(7): 4242-4253], [Sun et al. (2005) J. Lipid Res. 46:2102-2113], 및 [Farfel-Becker et al. (2011) Dis. Model Mech . 4(6):746-752]에 의해 기술된 검정법을 이용하여 수행된다.
예를 들어, 5-10 ㎕의 주사 부피로 진한 AAV 스톡을 사용하여 (예컨대, 2x1011 vg/마우스 용량의) 비히클 대조군 및 AAV 벡터의 경막내 또는 뇌실내 전달을 수행한다. 컨벡션 강화 전달법에 의한 실질내 전달을 수행한다.
처리는 증상 발병 이전 또는 발병 이후에 개시한다. 측정되는 종점은 CNS 및 CSF 중 기질 축적, ELISA에 의한 Gcase 효소 축적 및 효소 활성의 축적, 운동 및 인지 종점, 리소좀 기능장애, 및 α-시누클레인 단량체, 원시섬유 또는 원섬유의 축적이다.
실시예
4: 질환의 화학적 모델
본 실시예는 화학적으로 유도된 고셰병을 앓는 마우스 모델 (예컨대, CBE 마우스 모델)을 이용하는 AAV 벡터에 관한 생체내 검정법을 기술한다. 예를 들어, 문헌 [Vardi et al. (2016) J Pathol . 239(4):496-509]에 기술된 바와 같이, 화학적으로 유도된 고셰병을 앓는 마우스 모델에서 상기 AAV 벡터에 관한 생체내 연구를 수행한다.
예를 들어, 5-10 ㎕의 주사 부피로 진한 AAV 스톡을 사용하여 (예컨대, 2x1011 vg/마우스의) 비히클 대조군 및 AAV 벡터의 경막내 또는 뇌실내 전달을 수행한다. 컨벡션 강화 전달법에 의한 실질내 전달을 수행한다. 꼬리 정맥 주사에 의해 말초 전달을 달성한다.
처리는 증상 발병 이전 또는 발병 이후에 개시한다. 측정되는 종점은 CNS 및 CSF 중 기질 축적, ELISA에 의한 Gcase 효소 축적 및 효소 활성의 축적, 운동 및 인지 종점, 리소좀 기능장애, 및 α-시누클레인 단량체, 원시섬유 또는 원섬유의 축적이다.
실시예
5: PD,
LBD
,
고셰병
환자에서의
임상 시험
일부 실시양태에서, 특정 형태의 고셰병 (예컨대, GD1)을 앓는 환자는 파킨슨병 (PD) 또는 루이소체 치매 (LBD)가 발생할 위험이 증가되어 있다. 본 실시예는 고셰병, PD 및/또는 LBD를 앓는 환자에서 본 개시내용에 의해 기술된 바와 같은 rAAV의 안전성 및 효능을 사정하는 임상 시험을 기술한다.
문헌 [Grabowski et al. (1995) Ann. Intern. Med . 122(1):33-39]에 기술된 것과 유사한 연구 디자인을 사용하여 고셰병, PD 및/또는 LBD 치료를 위한 상기 벡터의 임상 시험을 수행한다.
실시예
6: 말초 질환 치료
일부 실시양태에서, 예를 들어, 문헌 [Biegstraaten et al. (2010) Brain 133(10):2909-2919]에 기술된 바와 같이, 특정 형태의 고셰병을 앓는 환자는 말초 신경병증의 증상을 보인다.
본 실시예는 고셰병 (예컨대, 타입 1 고셰병)과 연관된 말초 신경병증의 치료를 위한 본원에 기술된 바와 같은 AAV 벡터에 관한 생체내 검정법을 기술한다. 간략하면, 말초 신경병증의 징후 또는 증상을 앓는 것으로 확인된 타입 1 고셰병 환자는 본 개시내용에 의해 기술된 바와 같은 rAAV를 투여받는다. 일부 실시양태에서, rAAV의 투여 후에, 예를 들어, 문헌 [Biegstraaten et al.]에 기술된 방법을 사용하여 대상체의 말초 신경병증 징후 및 증상을 모니터링한다.
환자에 (예컨대, 환자의 혈청에, 환자의 말초 조직에 (예컨대, 간 조직, 비장 조직 등에) 존재하는 본 개시내용에 의해 기술된 바와 같은 형질도입된 유전자 생성물의 수준을 예를 들어, 웨스턴 블롯 분석, 효소 기능성 검정법, 또는 영상화 연구에 의해 검정한다.
실시예
7: CNS 형태의 치료
본 실시예는 CNS 형태의 고셰병의 치료를 위한 본원에 기술된 바와 같은 rAAV 벡터에 관한 생체내 검정법을 기술한다. 간략하면, CNS 형태의 고셰병 (예컨대, 타입 2 또는 타입 3 고셰병)을 앓는 것으로 확인된 고셰병 환자는 본 개시내용에 의해 기술된 바와 같은 rAAV를 투여받는다. 환자의 CNS에 (예컨대, 환자의 CNS의 혈청에, 환자의 뇌척수액 (CSF)에, 또는 환자의 CNS 조직에) 존재하는 본 개시내용에 의해 기술된 바와 같은 형질도입된 유전자 생성물의 수준을 예를 들어, 웨스턴 블롯 분석, 효소 기능성 검정법, 또는 영상화 연구에 의해 검정한다.
실시예
8:
GBA1에
돌연변이를 갖는
대상체에서
파킨슨병의 유
전자
요법
본 실시예는 GBA1 중의 돌연변이를 특징으로 하는 파킨슨병을 앓는 대상체에게 GBA1을 코딩하는 재조합 아데노-연관 바이러스 (rAAV)를 투여하는 것을 기술한다.
rAAV 벡터 인서트는, 인간 GBA1 (마룬)의 코돈 최적화된 코딩 서열 (CDS)을 구성적으로 발현하기 위해, 4개 파트: CMV 인핸서 (CMVe), CBA 프로모터 (CBAp), 엑손 1, 및 인트론 (int)으로 이루어진, CBA 프로모터 요소 (CBA)를 함유한다. 3' 영역은 또한 우드척 간염 바이러스 전사후 조절 요소(Woodchuck hepatitis virus Posttranscriptional Regulatory Element: WPRE), 전사후 조절 요소, 이어서, 소 성장 호르몬 폴리A 신호 (bGH 폴리A) 테일을 함유한다. 플랭킹 ITR을 통해 개재 서열은 정확하게 패키징될 수 있다. 5' ITR 서열의 두 변이체 (도 7, 삽입 박스, 하단 서열)를 평가하였다: 상기 변이체들은 ITR의 20-뉴클레오티드 "D" 영역 내에서 수개의 뉴클레오티드 차이를 보이며, 이는 패키징 및 발현 효율에 영향을 미치는 것으로 간주된다. rAAV 생성물은 도 7 (삽입 박스, 상단 서열)에 제시된 "D" 도메인 뉴클레오티드 서열을 함유한다. 변이체 벡터는 임상전 연구에서 유사하게 수행된, 돌연변이체 "D" 도메인 (본원에서 "S" 도메인으로 명명, 여기서 뉴클레오티드 변이는 음영 표시로 제시)을 보유한다. 백본은 카나마이신에 대한 내성을 부여하는 유전자 뿐만 아니라, 역 패키징을 막는 스터퍼(stuffer) 서열을 함유한다. rAAV 벡터를 도시하는 개략도는 도 8에 제시되어 있다. rAAV 벡터는 AAV9 혈청형 캡시드 단백질을 이용하여 rAAV로 패키징된다.
대수조 내로의 (대수조내; ICM) 투시 조영 유도하의 후두하 주사를 통해 GBA1-rAAV를 단일 용량으로 대상체에게 투여한다. 투약 요법 연구의 한 실시양태는 하기와 같다:
단일 용량의 rAAV를, 비임상 약리학 및 독성 연구의 결과에 기초하여 결정된 두 용량 수준 (3e13 vg (저용량); 1e14 vg (고용량) 등) 중 하나로 환자 (N=12)에게 투여한다.
초기 연구는 rAAV 벡터 및 변이체 rAAV S-변이체 구축물 (하기에서 추가로 기술)의 효능 및 안전성을 사정하기 위해, GCase의 억제제인 콘두리톨-b-에폭시드 (CBE)를 매일 전달하는 것을 포함하는 화학적 마우스 모델에서 수행하였다. 추가로, 동형접합성 GBA1 돌연변이를 보유하고, 사포신 (4L/PS-NA)이 부분적으로 결핍되어 있는 유전적 마우스 모델에서도 초기 연구를 수행하였다. 벡터 안전성 및 효능을 추가로 평가하기 위해 마우스 및 비인간 영장류 (NHP)에서 추가의 용량 범위 연구를 수행한다.
AAV 백본 중의 약간 다른 두 버전의 5' 역전된 말단 반복부 (ITR)를 시험하여 제조가능성 및 트랜스진 발현을 사정하였다 (도 7). 145 bp 5' ITR 내의 20 bp "D" 도메인은 최적의 바이러스 벡터 제조를 위해 필요한 것으로 간주되지만, "D" 도메인 내의 돌연변이 또한 일부 경우에 트랜스진 발현을 증가시키는 것으로 보고된 바 있다. 따라서, 무손상 "D" 도메인을 보유하는 바이러스 벡터 이외에, 돌연변이체 D 도메인 (본원에서 "S" 도메인으로 명명)을 포함하는 제2 벡터 형태 또한 평가하였다. rAAV 및 변이체 rAAV, 둘 모두 동일한 트랜스진을 발현한다. 하기에서 상세하게 설명되는 바와 같이, 상기 두 벡터 모두 생체내에서 효과적인 바이러스를 생산한 반면, 야생형 "D" 도메인을 함유하는 rAAV는 추가 개발을 위해 선택하였다.
GCase 결핍인 CBE 모델을 확립하기 위해, 어린 마우스에 GCase의 특정 억제제인 CBE를 투약하였다. 생후 8일째 (P8)를 시작으로 매일 IP 주사에 의해 CBE를 마우스에 제공하였다. 행동 표현형을 보이는 모델을 확립하기 위해 3개의 상이한 CBE 용량 (25 mg/kg, 37.5 mg/kg, 50 mg/kg) 및 PBS를 시험하였다 (도 9). 더 높은 고용량의 CBE는 용량에 의존하는 방식으로 치사에 이르게 하였다. 50 mg/kg CBE로 처리된 마우스는 모두 P23까지 사망하였고, 37.5 mg/kg CBE로 처리된 8마리의 마우스 중 5마리는 P27까지 사망하였다. 25 mg/kg CBE로 처리된 마우스 중에서 치사는 없었다. CBE 주사맞은 마우스는 오픈 필드 검정법에서 일반적인 운동 장애를 보이지 않은 반면 (PBS를 받은 마우스와 동일한 속도로 동일한 거리를 이동), CBE로 처리된 마우스는 로타로드 검정법에 의해 측정된 바, 운동 협조 및 균형 장애를 보였다.
연구 종료시까지 살아남은 마우스를 그의 최종 CBE 투약 후 그 다음날 (P27, "1일째"), 또는 CBE 중단 3일 후 (P29, "3일째") 희생시켰다. 1일째 및 3일째 코호트, 둘 모두에서 GCase 기질의 축적을 평가하기 위해 25 mg/kg CBE를 받은 마우스의 피질에서 지질 분석을 수행하였다. (본 실시예에서 응집체로 측정된) GluSph 및 GalSph 수준은, GCase 부전증과 일치하는 PBS로 처리된 대조군과 비교하였을 때, CBE로 처리된 마우스에서 유의적으로 축적되었다.
상기 기술된 연구에 기초하여, 25 mg/kg CBE 용량은 생존에는 영향을 주지 않으면서, 행동 장애를 일으켰는 바, 이에, 상기 용량을 선택하였다. CBE 처리 동안 뇌 전역에 걸쳐 GBA1을 광범위하게 분포시키고, 트랜스진을 발현시키기 위해, 생후 3일째 (P3) 뇌실내 (ICV) 주사에 의해 rAAV 또는 부형제를 전달한 후, 이어서, P8에 IP CBE 또는 PBS의 매일 처리를 개시하였다 (도 10).
rAAV를 받은, CBE로 처리된 마우스는 로타로드에서 부형제를 받은 것보다 통계학상 유의적으로 더욱 우수한 수행능을 보였다 (도 11). 변이체 벡터 처리군의 마우스는 다른 행동 척도, 예컨대, 검사 동안 이동한 총 거리에 있어서는 부형제로 처리된 마우스와 다르지 않았다 (도 11).
생전 연구 완료시, 생화학적 분석을 위해, 마우스 중 절반을 최종 CBE 투약 후 그 다음날 (P36, "1일째"), 또는 CBE 중단 3일 후 (P38, "3일째") 희생시켰다 (도 12). 생물학적으로 삼중으로 수행된 형광분석 효소 검정법을 이용하여, 피질에서 GCase 활성을 사정하였다. GBA1 rAAV로 처리된 마우스에서는 GCase 활성이 증가한 반면, CBE 처리는 GCase 활성을 감소시켰다. 추가로, CBE 및 GBA1-rAAV, 둘 모두를 받은 마우스는 PBS 처리군과 유사한 GCase 활성 수준을 보였는데, 이는 rAAV 전달이 CBE 처리에 의해 유도된 GCase 활성 억제를 극복할 수 있다는 것을 시사하는 것이다. 기질 GluCer 및 GluSph의 수준을 조사하기 위해 마우스의 운동 피질에서 지질 분석을 수행하였다. 두 지질 모두 CBE를 받은 마우스의 뇌에 축적되었고, rAAV 처리는 기질 축적을 유의적으로 감소시켰다.
지질 수준은 처리군 간에 GCase 활성 및 로타로드에서의 수행능, 둘 모두와 음의 상관관계를 가졌다. rAAV 투여 후 GCase 활성 증가는 기질 감소 및 운동 기능 증진과 연관이 있었다 (도 13). 도 14에 제시된 바와 같이, qPCR에 의해 측정된 바, 벡터 게놈 존재에 의해 예비 생체분포를 사정하였다 (여기서 게놈 DNA 1 ㎍당 >100 벡터 게놈인 것을 양성인 것으로 정의한다). CBE로 처리 및 비처리된, GBA1-rAAV를 받은 마우스, 둘 모두 피질에서 rAAV 벡터 게놈에 대해 양성이었고, 이는 ICV 전달을 통해 rAAV가 피질로 전달된다는 것을 시사하는 것이다. 추가로, 벡터 게놈이 간에서 검출되었고, 비장에서는 거의 검출되지 않았고, 심장, 신장 또는 생식선에서는 전혀 검출되지 않았다. 모든 척도에서 1일째 군과 3일째 군 사이에 통계학상 유의적인 차이는 없었다.
CBE 모델에서의 좀더 큰 대규모 연구를 통해 CBE 모델에서 GBA1-rAAV의 유효 용량을 추가로 조사하였다. 25 mg/kg CBE 용량 모델을 이용하여, 부형제 또는 GBA1-rAAV를 P3에 ICV를 통해 전달하고, P8에 IP PBS 또는 CBE의 매일 처리를 개시하였다. 이전 연구에서 CBE를 중단한 군과 CBE를 중단하지 않은 군 사이에 유사성이 관찰되었다는 점을 고려하여, 모든 마우스를 최종 CBE 투약 (P38-40) 후 다음날 희생시켰다. 군당 마우스 10마리씩 (5M/5F), 하기 5개 군으로 하여, 3개의 상이한 rAAV 용량의 효과를 사정하였다:
부형제 ICV + PBS IP
부형제 ICV + 25 mg/kg CBE IP
3.2e9 vg (2.13e10 vg/g 뇌) rAAV ICV + 25 mg/kg CBE IP
1.0e10 vg (6.67e10 vg/g 뇌) rAAV ICV + 25 mg/kg CBE IP
3.2e10 vg (2.13e11 vg/g 뇌) rAAV ICV + 25 mg/kg CBE IP.
최고 용량의 rAAV는 P37에 CBE 처리와 관련된 체중 증가 불능을 구제하였다. 추가로, 부형제 + CBE 처리군과 비교하였을 때, 상기 용량은 로타로드 및 테이퍼 빔(tapered beam)에서의 수행능을 통계학상 유의적으로 증가시켰다 (도 15). 부형제 처리군 및 rAAV 처리군, 둘 모두를 포함하는, 여러 군에서 치사가 관찰되었다 (부형제 + PBS: 0; 부형제 + 25 mg/kg CBE: 1; 3.2e9 vg rAAV + 25 mg/kg CBE: 4; 1.0e10 vg rAAV + 25 mg/kg CBE: 0; 3.2e10 vg rAAV + 25 mg/kg CBE: 3).
생전 연구 완료시, 생화학적 분석을 위해, 마우스를 희생시켰다 (도 16). 형광분석 검정법에 의해 생물학적으로 삼중으로 피질에서 GCase 활성을 사정하였다. CBE로 처리된 마우스는 감소된 GCase 활성을 보인 반면, 고용량의 rAAV를 받은 마우스는 CBE 처리군과 비교하였을 때, GCase 활성의 통계학상 유의적인 증가를 보였다. CBE로 처리된 마우스는 또한 GluCer 및 GluSph의 축적을 보였으며, 이 둘 모두는 고용량의 rAAV 투여에 의해 구제되었다.
확립된 화학적 CBE 모델에 추가로, Gba1에서의 V394L GD 돌연변이에 대해 동형접합성이고, 또한 GCase 국재화 및 활성에 영향을 주는 사포신이 부분적으로 결핍되어 있는 4L/PS-NA 유전적 모델에서도 또한 GBA1-rAAV를 평가한다. 상기 마우스는 빔 워크, 로타로드, 및 와이어 행(wire hang) 검정법에서의 그의 수행능에 의해 입증되는 바와 같이, 운동 강도, 협조, 및 균형 장애를 보인다. 전형적으로, 이들 마우스의 수명은 22주 미만이다. 초기 연구에서, P23에 3 ㎕의 최대 역가 바이러스를 ICV에 의해 전달하였고, 여기서 최종 용량은 2.4e10 vg (6.0e10 vg/g 뇌)였다. 군당 마우스 6마리씩이며, 처리군은 하기와 같았다:
WT + 부형제 ICV
4L/PS-NA + 부형제 ICV
4L/PS-NA + 2.4e10 vg (6.0e10 vg/g 뇌) rAAV ICV.
rAAV 전달 후 4주째에 빔 워크 검사에 의한 운동 수행능을 사정하였다. GBA1-rAAV를 받은 돌연변이체 마우스 군은, 운동 기능은 거의 WT 수준으로까지 회복되면서, 부형제로 처리된 돌연변이체 마우스와 비교하였을 때, 총 슬립수는 더 적고, 속도당 슬립수도 더 적은 경향을 보였다 (도 17). 운동 표현형은 상기 마우스가 노화됨에 따라 점점 더 심각해지기 때문에, 상기 행동 및 다른 행동 검사에서의 그의 수행능은 더 늦은 후속 시점에 사정한다. 생전 연구 완료시, 상기 마우스에서 지질 수준, GCase 활성, 및 생체분포를 사정한다.
0.03x, 0.1x, 및 1x 제안된 1상의 임상 고용량에 상응하는, 추가의 더 낮은 용량의 rAAV를 CBE 모델을 이용하여 현재 시험하고 있다. 각 군은 군당 마우스 10마리씩 (5M/5F) 포함한다:
부형제 ICV
부형제 ICV + 25 mg/kg CBE IP
3.2e8 vg (2.13e9 vg/g 뇌) rAAV ICV + 25 mg/kg CBE IP
1.0e9 vg (6.67e9 vg/g 뇌) rAAV ICV + 25 mg/kg CBE IP
1.0e10 vg (6.67e10 vg/g 뇌) rAAV ICV + 25 mg/kg CBE IP.
운동 표현형 이외에도, 피질에서 지질 수준 및 GCase 활성을 사정한다. 시간 경과에 따른 처리 및 분석 또한 수행한다.
효능 및 안전성 데이터를 평가하기 위해 더 큰 용량 범위의 연구를 개시하였다. 10마리의 4L/PS-NA 마우스 (군당 5M/5F)에 10 ㎕의 rAAV를 주사하였다. 상대 성장 측정 뇌 중량 계산을 이용하면, 용량은 0.15x, 1.5x, 4.4x, 및 14.5x 제안된 1상의 임상 고용량과 상관관계가 있다. 주사군은 하기 군으로 이루어진다:
WT + 부형제 ICV
4L/PS-NA + 부형제 ICV
4L/PS-NA + 4.3e9 vg (1.1e10 vg/g 뇌) rAAV ICV
4L/PS-NA + 4.3e10 vg (1.1e11 vg/g/ 뇌) rAAV ICV
4L/PS-NA + 1.3e11 vg (3.2e11 vg/g 뇌) rAAV ICV
4L/PS-NA + 4.3e11 vg (1.1e12 vg/g 뇌) rAAV ICV.
CBE 모델에서의 비임상 연구에 관한 요약은 하기 표 3에 제시되어 있다.
<표 3>
CBE 마우스 모델에서의 결과 요약
양성 생체분포는 >100 vg/1 ㎍ 게놈 DNA인 것으로 정의된다는 점에 주의한다.
약어: BD = 생체분포; NS = 비유의적; T = 경향; S = 유의적; N/A = 적용불가능; + = 양성; - = 음성.
실시예
9:
rAAV
벡터의
시험관내
분석
프로사포신 (PSAP) 및 SCARB2를 단독으로, 또는 GBA1 및/또는 하나 이상의 억제성 RNA와 함께 조합하여 코딩하는 rAAV 벡터의 시험관내 활성을 사정하는 예비 연구를 수행하였다. PSAP 및 프로그래뉼린 (PGRN)을 코딩하는 한 구축물도 시험하였다. 시험된 벡터는 표 4에 제시된 것을 포함한다. "Opt"는 포유동물 세포 (예컨대, 인간 세포)에서의 발현을 위해 코돈 최적화된 핵산 서열을 지칭한다. 도 18은 HEK293 세포를 각 구축물로 형질감염시켰을 때, 모의 형질감염된 세포와 비교하여 상응한 유전자 생성물이 과다발현되었다는 것을 나타내는 대표적인 데이터를 보여주는 것이다.
<표 4>
실시예
10:
ITR
"D" 서열 배치 및 세포 형질도입
ITR "D" 서열의 배치가 rAAV 벡터의 세포 형질도입에 미치는 효과를 조사하였다. 도 19에 제시된 바와 같은, 1) 야생형 ITR (예컨대, 트랜스진 인서트에 인접하게 위치하고, ITR의 말단에는 원위에 위치하는 "D" 서열) 또는 2) "D" 서열이 벡터의 "외부"에 위치하는 ITR (예컨대, ITR의 말단에 인접하게 위치하고, 트랜스진 인서트에는 원위에 위치하는 "D" 서열)을 갖는 Gcase 코딩 rAAV를 HEK293 세포에 형질도입시켰다. 놀랍게도, 데이터는 "외부" 위치에 위치하는 "D" 서열을 갖는 rAAV가 효율적으로 패키징될 수 있고, 세포를 형질도입시킬 수 있는 능력을 보유한다는 것을 나타낸다 (도 20).
실시예
11:
시험관내
독성 연구
오십 (50) 마리의 마우스에 생후 3일째 GBA1 코딩 rAAV를 4 ㎕ 뇌실내 (ICV) 주사를 통해 투여하였다. 모든 마우스는 처리군에 따라 콘두리톨 B-에폭시드 (CBE) 또는 PBS를 생후 8일째부터 연구 종료시까지 매일 복강내 (IP) 주사로 받았다. 마우스를 그의 최종 IP 투약 후 24시간째에 안락사시켰다. 안락사시킨 후, 표적 조직을 수거하고, 냉각 4% 파라포름알데히드 중에 점적 고정시키고, 4℃에서 보관한 후, 조직병리학 프로세싱 및 평가를 위해 보냈다. 연구 진행 동안 여덟 (8)마리의 동물이 사망하였고, 이들은 보내거나, 분석하거나 하지 않았다.
38-40일째에 안락사된 마흔 두 (42) 마리의 동물로부터 얻은 조직을 트리밍하고, 프로세싱하고, 파라핀 블록 중에 포매시켰다. 이어서, ~5 ㎛ 절편을 제작하고, 헤마톡실린 및 에오신 (H&E)으로 염색하고, 평가를 위해 슬라이드에 부착시켰다.
rAAV 처리에 기인하여, 조직병리학적 소견 또는 독성의 증거는 없었다. 콘두리톨 B-에폭시드 (CBE)로 처리된 마우스에서는 중추 신경계 (CNS)에 대뇌 피질 중 신경교 흉터 및 뉴런 괴사, 및 뇌간 및 흉부 척수 중 뉴런 괴사를 포함하는 소견이 있었다. 고용량의 rAAV 처리는 상기 CNS 소견의 발병률을 현저히 감소시킨 반면, 저용량 및 중간 용량의 바이러스는 용량에 의존하는 방식으로 대뇌 피질 중 신경교 흉터의 발병률을 감소시켰고, 다른 CNS 소견에 미치는 효과는 모호하였다.
등가물
본 출원은 하기 문헌의 내용, 그 전문을 참조로 포함한다: 2018년 10월 3일 출원된, 대리인 사건 번호 P1094.70003WO00으로 언급되는 국제 PCT 출원; 2018년 10월 3일 출원된, 대리인 사건 번호 P1094.70004WO00으로 언급되는 국제 PCT 출원; 2017년 10월 3일 출원된 가출원 일련 번호 62/567,311 (발명의 명칭: "GENE THERAPIES FOR LYSOSOMAL DISORDERS"); 2017년 10월 3일 출원된 가출원 일련 번호 62/567,319 (발명의 명칭: "GENE THERAPIES FOR LYSOSOMAL DISORDERS"); 2017년 10월 3일 출원된 가출원 일련 번호 62/567,301 (발명의 명칭: "GENE THERAPIES FOR LYSOSOMAL DISORDERS"); 2017년 10월 3일 출원된 가출원 일련 번호 62/567,310 (발명의 명칭: "GENE THERAPIES FOR LYSOSOMAL DISORDERS"); 2017년 10월 3일 출원된 가출원 일련 번호 가출원 일련 번호 62/567,303 (발명의 명칭: "GENE THERAPIES FOR LYSOSOMAL DISORDERS"); 및 2017년 10월 3일 출원된 가출원 일련 번호 62/567,305 (발명의 명칭: "GENE THERAPIES FOR LYSOSOMAL DISORDERS").
따라서, 본 발명의 적어도 하나의 실시양태의 여러 측면을 기술하였는 바, 관련 기술분야의 통상의 기술자는 다양한 변경, 변형 및 개선을 쉽게 착안해 낼 수 있음을 이해하여야 한다. 상기 변경, 변형 및 개선은 본 개시내용의 일부가 되는 것으로 의도되고, 본 발명의 정신 및 범주 내에 포함되는 것으로 의도된다. 따라서, 상기 설명 및 도면은 단지 예일 뿐이다.
본원에 본 발명의 여러 실시양태가 기술되고, 예시되었지만, 관련 기술분야의 통상의 기술자는 기능을 수행하고/거나, 본원에 기술된 결과 및/또는 이점들 중 하나 이상의 것을 수득하기 위해 각종의 다른 수단 및/또는 구조를 쉽게 구상해 낼 수 있을 것이며, 상기 변이 및/또는 변형은 각각 본 발명의 범주 내에 포함되는 것으로 간주된다. 더욱 일반적으로, 관련 기술분야의 통상의 기술자는 본원에 기술된 모든 파라미터, 치수, 물질 및 구성은 예시적인 것임을 의미하며, 실제 파라미터, 치수, 물질 및/또는 구성은 본 발명의 교시(들)가 사용되는 구체적인 적용 또는 적용들에 의존하게 된다는 것을 쉽게 이해할 것이다. 관련 기술분야의 통상의 기술자는 단지 통상의 실험만을 사용하고도, 본원에 기술된 본 발명의 구체적인 실시양태에 대한 다수의 등가물을 쉽게 이해하거나, 또는 확인할 수 있을 것이다. 그러므로, 상기 실시양태는 단지 예시로서 제공되는 것이며, 첨부된 청구범위 및 그의 등가물의 범주 내에서 본 발명은 구체적으로 기술되고, 청구된 것과 다르게 실시될 수 있다는 것을 이해하여야 한다. 본 발명은 본원에 기술된 각각의 개별 특징, 시스템, 물품, 물질, 및/또는 방법에 관한 것이다. 추가로, 상기 특징, 시스템, 물품, 물질, 및/또는 방법이 서로 모순되지 않는다면, 둘 이상의 상기 특징, 시스템, 물품, 물질, 및/또는 방법의 임의의 조합이 본 발명의 범주 내에 포함된다.
명세서 중 및 청구범위 중 본원에서 사용되는 바, "단수형태"는 달리 명확하게 그 반대로 명시되지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다.
명세서 중 및 청구범위 중 본원에서 사용되는 바, "및/또는"이라는 어구는 그렇게 결합되어 있는 요소 중 "어느 하나 또는 그 둘 모두," 즉, 일부 경우에서는 공동으로 존재하고, 다른 경우에는 분리되어 존재하는 요소를 의미하는 것으로 이해되어야 한다. 달리 명확하게 그 반대로 명시되지 않는 한, 구체적으로 확인된 요소와 관련이 있든 또는 관련이 없든 상관없이, "및/또는" 절에 의해 구체적으로 확인된 요소 이외의 다른 요소가 임의적으로 존재할 수 있다. 따라서, 비제한적인 예로서, 예컨대, "포함하는"이라는 제한을 두지 않은 개방형의 표현과 함께 결합하여 사용될 때, "A 및/또는 B"라고 언급하는 것은 한 실시양태에서는 (임의적으로 B 이외의 다른 요소를 포함하면서) B 없이 A를 지칭할 수 있고; 또 다른 실시양태에서는 (임의적으로 A 이외의 다른 요소를 포함하면서) A 없이 B를 지칭할 수 있고; 추가의 또 다른 실시양태에서는 (임의적으로 다른 요소를 포함하면서) A 및 B, 둘 모두를 지칭할 수 있으며; 기타의 경우도 존재할 수 있다.
명세서 중 및 청구범위 중 본원에서 사용되는 바, "또는"은 상기 정의된 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 의미로, 즉, 요소의 개수 또는 요소의 목록 중 적어도 하나를 포함할 뿐만 아니라, 그 중 1개 초과의 것을 포함하고, 열거되지 않은 추가 항목을 포함하는 것으로 해석되어야 한다. 그 반대로 명확하게 명시된 용어, 예컨대, "~중 단 하나만" 또는 "~중 정확하게 하나," 또는 청구범위에서 사용될 때, "~으로 이루어진"이라는 용어만이 요소의 개수 또는 요소의 목록 중 정확히 하나의 요소를 포함하는 것을 의미할 것이다. 일반적으로, 본원에서 사용되는 바, "또는"이라는 용어는 오직, 배타적인 용어, 예컨대, "둘 중 어느 하나," "~중 하나," "~중 단 하나만" 또는 "~중 정확하게 하나"라는 용어가 선행될 때 배타적인 대안 (즉, "하나 또는 나머지 다른 하나이지만, 그 둘 모두는 아닌 것")을 나타내는 것으로 해석되어야한다. 청구범위에서 사용될 때, "본질적으로 ~으로 이루어진"이라는 것은 특허법 분야에서 사용되는 바와 같이, 그의 일반적인 의미를 가져야 한다.
본원, 본 명세서 및 청구범위에서 사용되는 바, 하나 이상의 요소의 목록과 관련하여, "적어도 하나의"라는 어구는, 반드시 요소의 목록 내에 구체적으로 열거된 각각의 모든 요소 중 적어도 하나를 포함하여야 하는 것이 아니라, 요소의 목록에서 요소의 임의의 조합을 배제하는 것이 아니라, 적어도 하나의 요소가 요소의 목록에서 요소 중 임의의 하나 이상의 것으로부터 선택된다는 것을 의미하는 것으로 이해되어야 한다. 상기 정의는 또한, 구체적으로 확인된 요소와 관련이 있든 또는 없든 그에 상관없이, "적어도 하나의"라는 어구가 지칭하는 요소의 목록 내에 구체적으로 확인된 요소 이외의 요소가 임의적으로 존재할 수 있다는 것도 허용한다. 따라서, 비제한적인 예로서, "A 및 B 중 적어도 하나의" (또는 동일하게, "A 또는 B 중 적어도 하나의," 또는 동일하게, "A 및/또는 B 중 적어도 하나의")라는 것은 한 실시양태에서는 (임의적으로 B 이외의 다른 요소를 포함하면서) B는 존재하지 않고, 임의적으로 1개 초과의 A를 포함하는 적어도 하나의 A를 지칭할 수 있고; 또 다른 실시양태에서는, (임의적으로 A 이외의 다른 요소를 포함하면서) A는 존재하지 않고, 임의적으로 1개 초과의 B를 포함하는 적어도 하나의 B를 지칭할 수 있고; 추가의 또 다른 실시양태에서, 임의적으로 1개 초과의 A를 포함하는 적어도 하나의 A, 및 임의적으로 1개 초과의 B를 포함하는 적어도 하나의 B (및 다른 요소를 포함하는 것) 등을 칭할 수 있다.
상기 명세서 뿐만 아니라, 청구항에서, 예컨대, "포함하는," "비롯한," "보유하는," "갖는," "함유하는," "수반하는," "보유하는" 등의 모든 전환 어구는 제한을 두지 않은 개방형인 것으로, 즉, ~을 포함하나, 이에 제한되지 않는다는 것을 의미하는 것으로 이해되어야 한다. 미국 특허청의 심사 절차에 관한 매뉴얼, 섹션 2111.03(United States Patent Office Manual of Patent Examining Procedures, Section 2111.03)에 기재되어 있는 바와 같이, 오직 "~으로 이루어진" 및 "본질적으로 ~으로 이루어진"이라는 전환 어구만이 각각 폐쇄형 또는 반-폐쇄형 전환 어구여야 한다.
청구항 중의 청구항을 수식하는 서수 용어, 예컨대, "제1," "제2," "제3" 등의 사용은 그 단독으로 한 청구항의 또 다른 청구항 대비의 임의의 우선함, 우위임, 또는 순서, 또는 방법의 조치가 수행되는 시간적 순서를 내포하는 것이 아니라, 이는 단지 청구항을 구별하기 위해 특정명을 갖는 한 청구항을 동일명을 갖는 또 다른 항을 구별하는 (서수 용어의 사용을 위한) 라벨로서 사용된다.
명백하게 반대로 명시되지 않는 한, 1개 초과의 단계 또는 조치를 포함하는 본원에서 청구되는 임의의 방법에서, 본 방법의 단계 또는 조치의 순서가 반드시 본 방법의 단계 또는 조치가 언급된 순서로 제한되는 것은 아니라는 것도 또한 이해하여야 한다.
서열
일부 실시양태에서, 하나 이상의 유전자 생성물 (예컨대, 제1, 제2 및/또는 제3 유전자 생성물)을 코딩하는 발현 카세트는 서열식별번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 중 어느 하나에 기재된 서열을 포함하거나 또는 그로 이루어진다 (또는 상기 서열을 갖는 펩티드를 코딩한다). 일부 실시양태에서, 유전자 생성물은 서열식별번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 중 어느 하나의 일부 (예컨대, 단편)에 의해 코딩된다.
SEQUENCE LISTING
<110> Prevail Therapeutics, Inc.
<120> GENE THERAPIES FOR LYSOSOMAL DISORDERS
<130> P1094.70002WO00
<140> Not Yet Assigned
<141> Concurrently herewith
<150> US 62/567,296
<151> 2017-10-03
<160> 31
<170> PatentIn version 3.5
<210> 1
<211> 10697
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 1
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300
cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 360
cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 420
ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 480
caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 540
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 600
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 660
accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 720
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 780
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 840
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 900
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 960
ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1020
gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1080
gcgcttggtt taatgacggc ttgttttctg tggctgcgtg aaagccttga ggggctccgg 1140
gagctagagc ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca 1200
acgtgctggt tattgtgctg tctcatcatt ttggcaaaga attcctcgaa gatccgaagg 1260
gaaagtcttc cacgactgtg ggatccgttc gaagatatca ccggttgagc caccatggaa 1320
ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc aatcatggcc 1380
ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg cgctagacct 1440
tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc cacctactgc 1500
gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata cgagagcacc 1560
agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca cacaggcact 1620
ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg cttcggcgga 1680
gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc tcagaacctg 1740
ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag agtgcccatg 1800
gccagctgcg acttcagcat caggacctac acctacgccg acacacccga cgatttccag 1860
ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct gatccacaga 1920
gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac atctcccacc 1980
tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca acctggcgac 2040
atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta tgccgagcac 2100
aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact gctgagcggc 2160
tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat cgcccgtgat 2220
ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat gctggacgac 2280
cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga ggccgccaaa 2340
tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc caaggccaca 2400
ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga agcctgtgtg 2460
ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg catgcagtac 2520
agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga ctggaatctg 2580
gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag ccccatcatc 2640
gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct gggacacttc 2700
agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca gaagaacgat 2760
ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt cctgaaccgc 2820
agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct ggaaacaatc 2880
agccctggct actccatcca cacctacctg tggcgtagac agtgacaatt gttaattaag 2940
tttaaaccct cgaggccgca agcttatcga taatcaacct ctggattaca aaatttgtga 3000
aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 3060
aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 3120
atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 3180
gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 3240
cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 3300
ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 3360
ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg 3420
gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 3480
gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 3540
cctttgggcc gcctccccgc atcgataccg tcgactagag ctcgctgatc agcctcgact 3600
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 3660
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 3720
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 3780
gaagacaata gcaggcatgc tggggagaga tccacgataa caaacagctt ttttggggtg 3840
aacatattga ctgaattccc tgcaggttgg ccactccctc tctgcgcgct cgctcgctca 3900
ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 3960
gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc tgcggccgct 4020
cgtacggtct cgaggaattc ctgcaggata acttgccaac ctcattctaa aatgtatata 4080
gaagcccaaa agacaataac aaaaatattc ttgtagaaca aaatgggaaa gaatgttcca 4140
ctaaatatca agatttagag caaagcatga gatgtgtggg gatagacagt gaggctgata 4200
aaatagagta gagctcagaa acagacccat tgatatatgt aagtgaccta tgaaaaaaat 4260
atggcatttt acaatgggaa aatgatggtc tttttctttt ttagaaaaac agggaaatat 4320
atttatatgt aaaaaataaa agggaaccca tatgtcatac catacacaca aaaaaattcc 4380
agtgaattat aagtctaaat ggagaaggca aaactttaaa tcttttagaa aataatatag 4440
aagcatgcag accagcctgg ccaacatgat gaaaccctct ctactaataa taaaatcagt 4500
agaactactc aggactactt tgagtgggaa gtccttttct atgaagactt ctttggccaa 4560
aattaggctc taaatgcaag gagatagtgc atcatgcctg gctgcactta ctgataaatg 4620
atgttatcac catctttaac caaatgcaca ggaacaagtt atggtactga tgtgctggat 4680
tgagaaggag ctctacttcc ttgacaggac acatttgtat caacttaaaa aagcagattt 4740
ttgccagcag aactattcat tcagaggtag gaaacttaga atagatgatg tcactgatta 4800
gcatggcttc cccatctcca cagctgcttc ccacccaggt tgcccacagt tgagtttgtc 4860
cagtgctcag ggctgcccac tctcagtaag aagccccaca ccagcccctc tccaaatatg 4920
ttggctgttc cttccattaa agtgacccca ctttagagca gcaagtggat ttctgtttct 4980
tacagttcag gaaggaggag tcagctgtga gaacctggag cctgagatgc ttctaagtcc 5040
cactgctact ggggtcaggg aagccagact ccagcatcag cagtcaggag cactaagccc 5100
ttgccaacat cctgtttctc agagaaactg cttccattat aatggttgtc cttttttaag 5160
ctatcaagcc aaacaaccag tgtctaccat tattctcatc acctgaagcc aagggttcta 5220
gcaaaagtca agctgtcttg taatggttga tgtgcctcca gcttctgtct tcagtcactc 5280
cactcttagc ctgctctgaa tcaactctga ccacagttcc ctggagcccc tgccacctgc 5340
tgcccctgcc accttctcca tctgcagtgc tgtgcagcct tctgcactct tgcagagcta 5400
ataggtggag acttgaagga agaggaggaa agtttctcat aatagccttg ctgcaagctc 5460
aaatgggagg tgggcactgt gcccaggagc cttggagcaa aggctgtgcc caacctctga 5520
ctgcatccag gtttggtctt gacagagata agaagccctg gcttttggag ccaaaatcta 5580
ggtcagactt aggcaggatt ctcaaagttt atcagcagaa catgaggcag aagacccttt 5640
ctgctccagc ttcttcaggc tcaaccttca tcagaataga tagaaagaga ggctgtgagg 5700
gttcttaaaa cagaagcaaa tctgactcag agaataaaca acctcctagt aaactacagc 5760
ttagacagag catctggtgg tgagtgtgct cagtgtccta ctcaactgtc tggtatcagc 5820
cctcatgagg acttctcttc tttccctcat agacctccat ctctgttttc cttagcctgc 5880
agaaatctgg atggctattc acagaatgcc tgtgctttca gagttgcatt ttttctctgg 5940
tattctggtt caagcatttg aaggtaggaa aggttctcca agtgcaagaa agccagccct 6000
gagcctcaac tgcctggcta gtgtggtcag taggatgcaa aggctgttga atgccacaag 6060
gccaaacttt aacctgtgta ccacaagcct agcagcagag gcagctctgc tcactggaac 6120
tctctgtctt ctttctcctg agccttttct tttcctgagt tttctagctc tcctcaacct 6180
tacctctgcc ctacccagga caaacccaag agccactgtt tctgtgatgt cctctccagc 6240
cctaattagg catcatgact tcagcctgac cttccatgct cagaagcagt gctaatccac 6300
ttcagatgag ctgctctatg caacacaggc agagcctaca aacctttgca ccagagccct 6360
ccacatatca gtgtttgttc atactcactt caacagcaaa tgtgactgct gagattaaga 6420
ttttacacaa gatggtctgt aatttcacag ttagttttat cccattaggt atgaaagaat 6480
tagcataatt ccccttaaac atgaatgaat cttagatttt ttaataaata gttttggaag 6540
taaagacaga gacatcagga gcacaaggaa tagcctgaga ggacaaacag aacaagaaag 6600
agtctggaaa tacacaggat gttcttggcc tcctcaaagc aagtgcaagc agatagtacc 6660
agcagcccca ggctatcaga gcccagtgaa gagaagtacc atgaaagcca cagctctaac 6720
caccctgttc cagagtgaca gacagtcccc aagacaagcc agcctgagcc agagagagaa 6780
ctgcaagaga aagtttctaa tttaggttct gttagattca gacaagtgca ggtcatcctc 6840
tctccacagc tactcacctc tccagcctaa caaagcctgc agtccacact ccaaccctgg 6900
tgtctcacct cctagcctct cccaacatcc tgctctctga ccatcttctg catctctcat 6960
ctcaccatct cccactgtct acagcctact cttgcaacta ccatctcatt ttctgacatc 7020
ctgtctacat cttctgccat actctgccat ctaccatacc acctcttacc atctaccaca 7080
ccatctttta tctccatccc tctcagaagc ctccaagctg aatcctgctt tatgtgttca 7140
tctcagcccc tgcatggaaa gctgacccca gaggcagaac tattcccaga gagcttggcc 7200
aagaaaaaca aaactaccag cctggccagg ctcaggagta gtaagctgca gtgtctgttg 7260
tgttctagct tcaacagctg caggagttcc actctcaaat gctccacatt tctcacatcc 7320
tcctgattct ggtcactacc catcttcaaa gaacagaata tctcacatca gcatactgtg 7380
aaggactagt catgggtgca gctgctcaga gctgcaaagt cattctggat ggtggagagc 7440
ttacaaacat ttcatgatgc tccccccgct ctgatggctg gagcccaatc cctacacaga 7500
ctcctgctgt atgtgttttc ctttcactct gagccacagc cagagggcag gcattcagtc 7560
tcctcttcag gctggggctg gggcactgag aactcaccca acaccttgct ctcactcctt 7620
ctgcaaaaca agaaagagct ttgtgctgca gtagccatga agaatgaaag gaaggcttta 7680
actaaaaaat gtcagagatt attttcaacc ccttactgtg gatcaccagc aaggaggaaa 7740
cacaacacag agacattttt tcccctcaaa ttatcaaaag aatcactgca tttgttaaag 7800
agagcaactg aatcaggaag cagagttttg aacatatcag aagttaggaa tctgcatcag 7860
agacaaatgc agtcatggtt gtttgctgca taccagccct aatcattaga agcctcatgg 7920
acttcaaaca tcattccctc tgacaagatg ctctagccta actccatgag ataaaataaa 7980
tctgcctttc agagccaaag aagagtccac cagcttcttc tcagtgtgaa caagagctcc 8040
agtcaggtta gtcagtccag tgcagtagag gagaccagtc tgcatcctct aattttcaaa 8100
ggcaagaaga tttgtttacc ctggacacca ggcacaagtg aggtcacaga gctcttagat 8160
atgcagtcct catgagtgag gagactaaag cgcatgccat caagacttca gtgtagagaa 8220
aacctccaaa aaagcctcct cactacttct ggaatagctc agaggccgag gcggcctcgg 8280
cctctgcata aataaaaaaa attagtcagc catggggcgg agaatgggcg gaactgggcg 8340
gagttagggg cgggatgggc ggagttaggg gcgggactat ggttgctgac taattgagat 8400
gcatgctttg catacttctg cctgctgggg agcctgggga ctttccacac ctggttgctg 8460
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 8520
accctaactg acacacattc cacagctgca ttaatgaatc ggccaacgcg cggggagagg 8580
cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 8640
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 8700
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 8760
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 8820
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 8880
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 8940
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 9000
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 9060
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 9120
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 9180
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 9240
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 9300
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 9360
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 9420
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 9480
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 9540
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 9600
agttgcctga ctcctgcaaa ccacgttgtg tctcaaaatc tctgatgtta cattgcacaa 9660
gataaaaata tatcatcatg aacaataaaa ctgtctgctt acataaacag taatacaagg 9720
ggtgttatga gccatattca acgggaaacg tcttgctcga ggccgcgatt aaattccaac 9780
atggatgctg atttatatgg gtataaatgg gctcgcgata atgtcgggca atcaggtgcg 9840
acaatctatc gattgtatgg gaagcccgat gcgccagagt tgtttctgaa acatggcaaa 9900
ggtagcgttg ccaatgatgt tacagatgag atggtcagac taaactggct gacggaattt 9960
atgcctcttc cgaccatcaa gcattttatc cgtactcctg atgatgcatg gttactcacc 10020
actgcgatcc ccgggaaaac agcattccag gtattagaag aatatcctga ttcaggtgaa 10080
aatattgttg atgcgctggc agtgttcctg cgccggttgc attcgattcc tgtttgtaat 10140
tgtcctttta acagcgatcg cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac 10200
ggtttggttg atgcgagtga ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc 10260
tggaaagaaa tgcataagct tttgccattc tcaccggatt cagtcgtcac tcatggtgat 10320
ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat tgatgttgga 10380
cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg cctcggtgag 10440
ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa tcctgatatg 10500
aataaattgc agtttcattt gatgctcgat gagtttttct aagggcggcc tgccaccata 10560
cccacgccga aacaagcgct catgagcccg aagtggcgag cccgatcttc cccatcggtg 10620
atgtcggcga tataggcgcc agcaaccgca cctgtggcgc cggtgatgag ggcgcgccaa 10680
gtcgacgtcc ggcagtc 10697
<210> 2
<211> 11355
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 2
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300
tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360
atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420
tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480
agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540
tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600
ctttcctctc ctgacagtcc ggaaagccac catgggccgc tgctgcttct acaccgccgg 660
caccctgagc ctgctgctgc tggtgaccag cgtgaccctg ctggtggccc gcgtgttcca 720
gaaggccgtg gaccagagca tcgagaagaa gatcgtgctg cgcaacggca ccgaggcctt 780
cgacagctgg gagaagcccc ccctgcccgt gtacacccag ttctacttct tcaacgtgac 840
caaccccgag gagatcctgc gcggcgagac cccccgcgtg gaggaggtgg gcccctacac 900
ctaccgcgag ctgcgcaaca aggccaacat ccagttcggc gacaacggca ccaccatcag 960
cgccgtgagc aacaaggcct acgtgttcga gcgcgaccag agcgtgggcg accccaagat 1020
cgacctgatc cgcaccctga acatccccgt gctgaccgtg atcgagtgga gccaggtgca 1080
cttcctgcgc gagatcatcg aggccatgct gaaggcctac cagcagaagc tgttcgtgac 1140
ccacaccgtg gacgagctgc tgtggggcta caaggacgag atcctgagcc tgatccacgt 1200
gttccgcccc gacatcagcc cctacttcgg cctgttctac gagaagaacg gcaccaacga 1260
cggcgactac gtgttcctga ccggcgagga cagctacctg aacttcacca agatcgtgga 1320
gtggaacggc aagaccagcc tggactggtg gatcaccgac aagtgcaaca tgatcaacgg 1380
caccgacggc gacagcttcc accccctgat caccaaggac gaggtgctgt acgtgttccc 1440
cagcgacttc tgccgcagcg tgtacatcac cttcagcgac tacgagagcg tgcagggcct 1500
gcccgccttc cgctacaagg tgcccgccga gatcctggcc aacaccagcg acaacgccgg 1560
cttctgcatc cccgagggca actgcctggg cagcggcgtg ctgaacgtga gcatctgcaa 1620
gaacggcgcc cccatcatca tgagcttccc ccacttctac caggccgacg agcgcttcgt 1680
gagcgccatc gagggcatgc accccaacca ggaggaccac gagaccttcg tggacatcaa 1740
ccccctgacc ggcatcatcc tgaaggccgc caagcgcttc cagatcaaca tctacgtgaa 1800
gaagctggac gacttcgtgg agaccggcga catccgcacc atggtgttcc ccgtgatgta 1860
cctgaacgag agcgtgcaca tcgacaagga gaccgccagc cgcctgaaga gcatgatcaa 1920
caccaccctg atcatcacca acatccccta catcatcatg gccctgggcg tgttcttcgg 1980
cctggtgttc acctggctgg cctgcaaggg ccagggcagc atggacgagg gcaccgccga 2040
cgagcgcgcc cccctgatcc gcacctgatt gtggccgaac cgccgaactc agaggccggc 2100
cccagaaaac ccgagcgagt agggggcggc gcgcaggagg gaggagaact gggggcgcgg 2160
gaggctggtg ggtgtggggg gtggagatgt agaagatgtg acgccgcggc ccggcgggtg 2220
ccagattagc ggacgcggtg cccgcggttg caacgggatc ccgggcgctg cagcttggga 2280
ggcggctctc cccaggcggc gtccgcggag acacccatcc gtgaacccca ggtcccgggc 2340
cgccggctcg ccgcgcacca ggggccggcg gacagaagag cggccgagcg gctcgaggct 2400
gggggaccgc gggcgcggcc gcgcgctgcc gggcgggagg ctggggggcc ggggccgggg 2460
ccgtgccccg gagcgggtcg gaggccgggg ccggggccgg gggacggcgg ctccccgcgc 2520
ggctccagcg gctcggggat cccggccggg ccccgcaggg accatgatgg aattcagcag 2580
ccccagcaga gaggaatgcc ccaagcctct gagccgggtg tcaatcatgg ccggatctct 2640
gacaggactg ctgctgcttc aggccgtgtc ttgggcttct ggcgctagac cttgcatccc 2700
caagagcttc ggctacagca gcgtcgtgtg cgtgtgcaat gccacctact gcgacagctt 2760
cgaccctcct acctttcctg ctctgggcac cttcagcaga tacgagagca ccagatccgg 2820
cagacggatg gaactgagca tgggacccat ccaggccaat cacacaggca ctggcctgct 2880
gctgacactg cagcctgagc agaaattcca gaaagtgaaa ggcttcggcg gagccatgac 2940
agatgccgcc gctctgaata tcctggctct gtctccacca gctcagaacc tgctgctcaa 3000
gagctacttc agcgaggaag gcatcggcta caacatcatc agagtgccca tggccagctg 3060
cgacttcagc atcaggacct acacctacgc cgacacaccc gacgatttcc agctgcacaa 3120
cttcagcctg cctgaagagg acaccaagct gaagatccct ctgatccaca gagccctgca 3180
gctggcacaa agacccgtgt cactgctggc ctctccatgg acatctccca cctggctgaa 3240
aacaaatggc gccgtgaatg gcaagggcag cctgaaaggc caacctggcg acatctacca 3300
ccagacctgg gccagatact tcgtgaagtt cctggacgcc tatgccgagc acaagctgca 3360
gttttgggcc gtgacagccg agaacgaacc ttctgctgga ctgctgagcg gctacccctt 3420
tcagtgcctg ggctttacac ccgagcacca gcgggacttt atcgcccgtg atctgggacc 3480
cacactggcc aatagcaccc accataatgt gcggctgctg atgctggacg accagagact 3540
gcttctgccc cactgggcta aagtggtgct gacagatcct gaggccgcca aatacgtgca 3600
cggaatcgcc gtgcactggt atctggactt tctggcccct gccaaggcca cactgggaga 3660
gacacacaga ctgttcccca acaccatgct gttcgccagc gaagcctgtg tgggcagcaa 3720
gttttgggaa cagagcgtgc ggctcggcag ctgggataga ggcatgcagt acagccacag 3780
catcatcacc aacctgctgt accacgtcgt cggctggacc gactggaatc tggccctgaa 3840
tcctgaaggc ggccctaact gggtccgaaa cttcgtggac agccccatca tcgtggacat 3900
caccaaggac accttctaca agcagcccat gttctaccac ctgggacact tcagcaagtt 3960
catccccgag ggctctcagc gcgttggact ggtggcttcc cagaagaacg atctggacgc 4020
cgtggctctg atgcaccctg atggatctgc tgtggtggtg gtcctgaacc gcagcagcaa 4080
agatgtgccc ctgaccatca aggatcccgc cgtgggattc ctggaaacaa tcagccctgg 4140
ctactccatc cacacctacc tgtggcgtag acagtgacaa ttgttaatta agtttaaacc 4200
ctcgaggccg caagccgcat cgataccgtc gactagagct cgctgatcag cctcgactgt 4260
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 4320
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 4380
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 4440
agacaatagc aggcatgctg gggagagatc cacgataaca aacagctttt ttggggtgaa 4500
catattgact gaattccctg caggttggcc actccctctc tgcgcgctcg ctcgctcact 4560
gaggccgccc gggcaaagcc cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc 4620
gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg cggccgctcg 4680
tacggtctcg aggaattcct gcaggataac ttgccaacct cattctaaaa tgtatataga 4740
agcccaaaag acaataacaa aaatattctt gtagaacaaa atgggaaaga atgttccact 4800
aaatatcaag atttagagca aagcatgaga tgtgtgggga tagacagtga ggctgataaa 4860
atagagtaga gctcagaaac agacccattg atatatgtaa gtgacctatg aaaaaaatat 4920
ggcattttac aatgggaaaa tgatggtctt tttctttttt agaaaaacag ggaaatatat 4980
ttatatgtaa aaaataaaag ggaacccata tgtcatacca tacacacaaa aaaattccag 5040
tgaattataa gtctaaatgg agaaggcaaa actttaaatc ttttagaaaa taatatagaa 5100
gcatgcagac cagcctggcc aacatgatga aaccctctct actaataata aaatcagtag 5160
aactactcag gactactttg agtgggaagt ccttttctat gaagacttct ttggccaaaa 5220
ttaggctcta aatgcaagga gatagtgcat catgcctggc tgcacttact gataaatgat 5280
gttatcacca tctttaacca aatgcacagg aacaagttat ggtactgatg tgctggattg 5340
agaaggagct ctacttcctt gacaggacac atttgtatca acttaaaaaa gcagattttt 5400
gccagcagaa ctattcattc agaggtagga aacttagaat agatgatgtc actgattagc 5460
atggcttccc catctccaca gctgcttccc acccaggttg cccacagttg agtttgtcca 5520
gtgctcaggg ctgcccactc tcagtaagaa gccccacacc agcccctctc caaatatgtt 5580
ggctgttcct tccattaaag tgaccccact ttagagcagc aagtggattt ctgtttctta 5640
cagttcagga aggaggagtc agctgtgaga acctggagcc tgagatgctt ctaagtccca 5700
ctgctactgg ggtcagggaa gccagactcc agcatcagca gtcaggagca ctaagccctt 5760
gccaacatcc tgtttctcag agaaactgct tccattataa tggttgtcct tttttaagct 5820
atcaagccaa acaaccagtg tctaccatta ttctcatcac ctgaagccaa gggttctagc 5880
aaaagtcaag ctgtcttgta atggttgatg tgcctccagc ttctgtcttc agtcactcca 5940
ctcttagcct gctctgaatc aactctgacc acagttccct ggagcccctg ccacctgctg 6000
cccctgccac cttctccatc tgcagtgctg tgcagccttc tgcactcttg cagagctaat 6060
aggtggagac ttgaaggaag aggaggaaag tttctcataa tagccttgct gcaagctcaa 6120
atgggaggtg ggcactgtgc ccaggagcct tggagcaaag gctgtgccca acctctgact 6180
gcatccaggt ttggtcttga cagagataag aagccctggc ttttggagcc aaaatctagg 6240
tcagacttag gcaggattct caaagtttat cagcagaaca tgaggcagaa gaccctttct 6300
gctccagctt cttcaggctc aaccttcatc agaatagata gaaagagagg ctgtgagggt 6360
tcttaaaaca gaagcaaatc tgactcagag aataaacaac ctcctagtaa actacagctt 6420
agacagagca tctggtggtg agtgtgctca gtgtcctact caactgtctg gtatcagccc 6480
tcatgaggac ttctcttctt tccctcatag acctccatct ctgttttcct tagcctgcag 6540
aaatctggat ggctattcac agaatgcctg tgctttcaga gttgcatttt ttctctggta 6600
ttctggttca agcatttgaa ggtaggaaag gttctccaag tgcaagaaag ccagccctga 6660
gcctcaactg cctggctagt gtggtcagta ggatgcaaag gctgttgaat gccacaaggc 6720
caaactttaa cctgtgtacc acaagcctag cagcagaggc agctctgctc actggaactc 6780
tctgtcttct ttctcctgag ccttttcttt tcctgagttt tctagctctc ctcaacctta 6840
cctctgccct acccaggaca aacccaagag ccactgtttc tgtgatgtcc tctccagccc 6900
taattaggca tcatgacttc agcctgacct tccatgctca gaagcagtgc taatccactt 6960
cagatgagct gctctatgca acacaggcag agcctacaaa cctttgcacc agagccctcc 7020
acatatcagt gtttgttcat actcacttca acagcaaatg tgactgctga gattaagatt 7080
ttacacaaga tggtctgtaa tttcacagtt agttttatcc cattaggtat gaaagaatta 7140
gcataattcc ccttaaacat gaatgaatct tagatttttt aataaatagt tttggaagta 7200
aagacagaga catcaggagc acaaggaata gcctgagagg acaaacagaa caagaaagag 7260
tctggaaata cacaggatgt tcttggcctc ctcaaagcaa gtgcaagcag atagtaccag 7320
cagccccagg ctatcagagc ccagtgaaga gaagtaccat gaaagccaca gctctaacca 7380
ccctgttcca gagtgacaga cagtccccaa gacaagccag cctgagccag agagagaact 7440
gcaagagaaa gtttctaatt taggttctgt tagattcaga caagtgcagg tcatcctctc 7500
tccacagcta ctcacctctc cagcctaaca aagcctgcag tccacactcc aaccctggtg 7560
tctcacctcc tagcctctcc caacatcctg ctctctgacc atcttctgca tctctcatct 7620
caccatctcc cactgtctac agcctactct tgcaactacc atctcatttt ctgacatcct 7680
gtctacatct tctgccatac tctgccatct accataccac ctcttaccat ctaccacacc 7740
atcttttatc tccatccctc tcagaagcct ccaagctgaa tcctgcttta tgtgttcatc 7800
tcagcccctg catggaaagc tgaccccaga ggcagaacta ttcccagaga gcttggccaa 7860
gaaaaacaaa actaccagcc tggccaggct caggagtagt aagctgcagt gtctgttgtg 7920
ttctagcttc aacagctgca ggagttccac tctcaaatgc tccacatttc tcacatcctc 7980
ctgattctgg tcactaccca tcttcaaaga acagaatatc tcacatcagc atactgtgaa 8040
ggactagtca tgggtgcagc tgctcagagc tgcaaagtca ttctggatgg tggagagctt 8100
acaaacattt catgatgctc cccccgctct gatggctgga gcccaatccc tacacagact 8160
cctgctgtat gtgttttcct ttcactctga gccacagcca gagggcaggc attcagtctc 8220
ctcttcaggc tggggctggg gcactgagaa ctcacccaac accttgctct cactccttct 8280
gcaaaacaag aaagagcttt gtgctgcagt agccatgaag aatgaaagga aggctttaac 8340
taaaaaatgt cagagattat tttcaacccc ttactgtgga tcaccagcaa ggaggaaaca 8400
caacacagag acattttttc ccctcaaatt atcaaaagaa tcactgcatt tgttaaagag 8460
agcaactgaa tcaggaagca gagttttgaa catatcagaa gttaggaatc tgcatcagag 8520
acaaatgcag tcatggttgt ttgctgcata ccagccctaa tcattagaag cctcatggac 8580
ttcaaacatc attccctctg acaagatgct ctagcctaac tccatgagat aaaataaatc 8640
tgcctttcag agccaaagaa gagtccacca gcttcttctc agtgtgaaca agagctccag 8700
tcaggttagt cagtccagtg cagtagagga gaccagtctg catcctctaa ttttcaaagg 8760
caagaagatt tgtttaccct ggacaccagg cacaagtgag gtcacagagc tcttagatat 8820
gcagtcctca tgagtgagga gactaaagcg catgccatca agacttcagt gtagagaaaa 8880
cctccaaaaa agcctcctca ctacttctgg aatagctcag aggccgaggc ggcctcggcc 8940
tctgcataaa taaaaaaaat tagtcagcca tggggcggag aatgggcgga actgggcgga 9000
gttaggggcg ggatgggcgg agttaggggc gggactatgg ttgctgacta attgagatgc 9060
atgctttgca tacttctgcc tgctggggag cctggggact ttccacacct ggttgctgac 9120
taattgagat gcatgctttg catacttctg cctgctgggg agcctgggga ctttccacac 9180
cctaactgac acacattcca cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 9240
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 9300
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 9360
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 9420
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 9480
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 9540
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 9600
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 9660
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 9720
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 9780
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 9840
agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 9900
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 9960
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 10020
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 10080
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 10140
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 10200
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 10260
ttgcctgact cctgcaaacc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga 10320
taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 10380
tgttatgagc catattcaac gggaaacgtc ttgctcgagg ccgcgattaa attccaacat 10440
ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 10500
aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 10560
tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 10620
gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 10680
tgcgatcccc gggaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa 10740
tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg 10800
tccttttaac agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg 10860
tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 10920
gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt 10980
ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 11040
agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 11100
ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 11160
taaattgcag tttcatttga tgctcgatga gtttttctaa gggcggcctg ccaccatacc 11220
cacgccgaaa caagcgctca tgagcccgaa gtggcgagcc cgatcttccc catcggtgat 11280
gtcggcgata taggcgccag caaccgcacc tgtggcgccg gtgatgaggg cgcgccaagt 11340
cgacgtccgg cagtc 11355
<210> 3
<211> 11420
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 3
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300
tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360
atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420
tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480
agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540
tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600
ctttcctctc ctgacagtcc ggaaagccac catggaattc agcagcccca gcagagagga 660
atgccccaag cctctgagcc gggtgtcaat catggccgga tctctgacag gactgctgct 720
gcttcaggcc gtgtcttggg cttctggcgc tagaccttgc atccccaaga gcttcggcta 780
cagcagcgtc gtgtgcgtgt gcaatgccac ctactgcgac agcttcgacc ctcctacctt 840
tcctgctctg ggcaccttca gcagatacga gagcaccaga tccggcagac ggatggaact 900
gagcatggga cccatccagg ccaatcacac aggcactggc ctgctgctga cactgcagcc 960
tgagcagaaa ttccagaaag tgaaaggctt cggcggagcc atgacagatg ccgccgctct 1020
gaatatcctg gctctgtctc caccagctca gaacctgctg ctcaagagct acttcagcga 1080
ggaaggcatc ggctacaaca tcatcagagt gcccatggcc agctgcgact tcagcatcag 1140
gacctacacc tacgccgaca cacccgacga tttccagctg cacaacttca gcctgcctga 1200
agaggacacc aagctgaaga tccctctgat ccacagagcc ctgcagctgg cacaaagacc 1260
cgtgtcactg ctggcctctc catggacatc tcccacctgg ctgaaaacaa atggcgccgt 1320
gaatggcaag ggcagcctga aaggccaacc tggcgacatc taccaccaga cctgggccag 1380
atacttcgtg aagttcctgg acgcctatgc cgagcacaag ctgcagtttt gggccgtgac 1440
agccgagaac gaaccttctg ctggactgct gagcggctac ccctttcagt gcctgggctt 1500
tacacccgag caccagcggg actttatcgc ccgtgatctg ggacccacac tggccaatag 1560
cacccaccat aatgtgcggc tgctgatgct ggacgaccag agactgcttc tgccccactg 1620
ggctaaagtg gtgctgacag atcctgaggc cgccaaatac gtgcacggaa tcgccgtgca 1680
ctggtatctg gactttctgg cccctgccaa ggccacactg ggagagacac acagactgtt 1740
ccccaacacc atgctgttcg ccagcgaagc ctgtgtgggc agcaagtttt gggaacagag 1800
cgtgcggctc ggcagctggg atagaggcat gcagtacagc cacagcatca tcaccaacct 1860
gctgtaccac gtcgtcggct ggaccgactg gaatctggcc ctgaatcctg aaggcggccc 1920
taactgggtc cgaaacttcg tggacagccc catcatcgtg gacatcacca aggacacctt 1980
ctacaagcag cccatgttct accacctggg acacttcagc aagttcatcc ccgagggctc 2040
tcagcgcgtt ggactggtgg cttcccagaa gaacgatctg gacgccgtgg ctctgatgca 2100
ccctgatgga tctgctgtgg tggtggtcct gaaccgcagc agcaaagatg tgcccctgac 2160
catcaaggat cccgccgtgg gattcctgga aacaatcagc cctggctact ccatccacac 2220
ctacctgtgg cgtagacagt gacaattgtt aattaagttt catcgatacc gtcgactaga 2280
gctcgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc 2340
cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 2400
gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 2460
gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggagag atccacgata 2520
acaaacagct tttttggggg ggcggagtta gggcggagcc aatcagcgtg cgccgttccg 2580
aaagttgcct tttatggctg ggcggagaat gggcggtgaa cgccgatgat tatataagga 2640
cgcgccgggt gtggcacagc tagttccgtc gcagccggga tttgggtcgc ggttcttgtt 2700
tgtggatccc tgtgatcgtc acttggtaag tcactgactg tctatgcctg ggaaagggtg 2760
ggcaggagat ggggcagtgc aggaaaagtg gcactatgaa ccctgcagcc ctaggaatgc 2820
atctagacaa ttgtactaac cttcttctct ttcctctcct gacagtccgg aaagccacca 2880
tgggccgctg ctgcttctac accgccggca ccctgagcct gctgctgctg gtgaccagcg 2940
tgaccctgct ggtggcccgc gtgttccaga aggccgtgga ccagagcatc gagaagaaga 3000
tcgtgctgcg caacggcacc gaggccttcg acagctggga gaagcccccc ctgcccgtgt 3060
acacccagtt ctacttcttc aacgtgacca accccgagga gatcctgcgc ggcgagaccc 3120
cccgcgtgga ggaggtgggc ccctacacct accgcgagct gcgcaacaag gccaacatcc 3180
agttcggcga caacggcacc accatcagcg ccgtgagcaa caaggcctac gtgttcgagc 3240
gcgaccagag cgtgggcgac cccaagatcg acctgatccg caccctgaac atccccgtgc 3300
tgaccgtgat cgagtggagc caggtgcact tcctgcgcga gatcatcgag gccatgctga 3360
aggcctacca gcagaagctg ttcgtgaccc acaccgtgga cgagctgctg tggggctaca 3420
aggacgagat cctgagcctg atccacgtgt tccgccccga catcagcccc tacttcggcc 3480
tgttctacga gaagaacggc accaacgacg gcgactacgt gttcctgacc ggcgaggaca 3540
gctacctgaa cttcaccaag atcgtggagt ggaacggcaa gaccagcctg gactggtgga 3600
tcaccgacaa gtgcaacatg atcaacggca ccgacggcga cagcttccac cccctgatca 3660
ccaaggacga ggtgctgtac gtgttcccca gcgacttctg ccgcagcgtg tacatcacct 3720
tcagcgacta cgagagcgtg cagggcctgc ccgccttccg ctacaaggtg cccgccgaga 3780
tcctggccaa caccagcgac aacgccggct tctgcatccc cgagggcaac tgcctgggca 3840
gcggcgtgct gaacgtgagc atctgcaaga acggcgcccc catcatcatg agcttccccc 3900
acttctacca ggccgacgag cgcttcgtga gcgccatcga gggcatgcac cccaaccagg 3960
aggaccacga gaccttcgtg gacatcaacc ccctgaccgg catcatcctg aaggccgcca 4020
agcgcttcca gatcaacatc tacgtgaaga agctggacga cttcgtggag accggcgaca 4080
tccgcaccat ggtgttcccc gtgatgtacc tgaacgagag cgtgcacatc gacaaggaga 4140
ccgccagccg cctgaagagc atgatcaaca ccaccctgat catcaccaac atcccctaca 4200
tcatcatggc cctgggcgtg ttcttcggcc tggtgttcac ctggctggcc tgcaagggcc 4260
agggcagcat ggacgagggc accgccgacg agcgcgcccc cctgatccgc acctgaccca 4320
ggggactcaa tcagcctcga agacatgata agatacattg atgagtttgg acaaaccaca 4380
acaagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 4440
gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt 4500
caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt 4560
atgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 4620
tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 4680
tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4740
gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4800
atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4860
ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4920
ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4980
aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 5040
tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 5100
tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 5160
tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 5220
agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 5280
caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 5340
atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 5400
gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 5460
tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 5520
ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 5580
gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 5640
atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 5700
tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5760
tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5820
cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5880
aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5940
ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 6000
ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 6060
tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 6120
ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 6180
ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 6240
tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 6300
ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 6360
tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 6420
agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 6480
agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 6540
agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 6600
tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 6660
tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6720
cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6780
aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6840
aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6900
ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6960
agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 7020
cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 7080
cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 7140
agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 7200
aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 7260
aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 7320
aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 7380
accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 7440
aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 7500
gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 7560
ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 7620
tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 7680
catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7740
atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7800
acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7860
tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7920
gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7980
ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 8040
tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 8100
gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 8160
agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 8220
agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 8280
gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 8340
cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 8400
ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 8460
aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 8520
aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 8580
cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 8640
tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 8700
aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8760
tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8820
aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8880
gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8940
gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 9000
cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 9060
gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 9120
gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 9180
ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 9240
cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 9300
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 9360
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 9420
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 9480
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 9540
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 9600
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 9660
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9720
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9780
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9840
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9900
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9960
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 10020
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 10080
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 10140
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 10200
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 10260
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 10320
catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 10380
caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 10440
aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 10500
aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 10560
gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 10620
aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 10680
tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10740
accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10800
gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10860
aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10920
aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10980
gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 11040
gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 11100
ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 11160
gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 11220
atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 11280
atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 11340
gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 11400
caagtcgacg tccggcagtc 11420
<210> 4
<211> 11171
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 4
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300
tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360
atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420
tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480
agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540
tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600
actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660
tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720
ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780
tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840
gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatgggc 900
cgctgctgct tctacaccgc cggcaccctg agcctgctgc tgctggtgac cagcgtgacc 960
ctgctggtgg cccgcgtgtt ccagaaggcc gtggaccaga gcatcgagaa gaagatcgtg 1020
ctgcgcaacg gcaccgaggc cttcgacagc tgggagaagc cccccctgcc cgtgtacacc 1080
cagttctact tcttcaacgt gaccaacccc gaggagatcc tgcgcggcga gaccccccgc 1140
gtggaggagg tgggccccta cacctaccgc gagctgcgca acaaggccaa catccagttc 1200
ggcgacaacg gcaccaccat cagcgccgtg agcaacaagg cctacgtgtt cgagcgcgac 1260
cagagcgtgg gcgaccccaa gatcgacctg atccgcaccc tgaacatccc cgtgctgacc 1320
gtgatcgagt ggagccaggt gcacttcctg cgcgagatca tcgaggccat gctgaaggcc 1380
taccagcaga agctgttcgt gacccacacc gtggacgagc tgctgtgggg ctacaaggac 1440
gagatcctga gcctgatcca cgtgttccgc cccgacatca gcccctactt cggcctgttc 1500
tacgagaaga acggcaccaa cgacggcgac tacgtgttcc tgaccggcga ggacagctac 1560
ctgaacttca ccaagatcgt ggagtggaac ggcaagacca gcctggactg gtggatcacc 1620
gacaagtgca acatgatcaa cggcaccgac ggcgacagct tccaccccct gatcaccaag 1680
gacgaggtgc tgtacgtgtt ccccagcgac ttctgccgca gcgtgtacat caccttcagc 1740
gactacgaga gcgtgcaggg cctgcccgcc ttccgctaca aggtgcccgc cgagatcctg 1800
gccaacacca gcgacaacgc cggcttctgc atccccgagg gcaactgcct gggcagcggc 1860
gtgctgaacg tgagcatctg caagaacggc gcccccatca tcatgagctt cccccacttc 1920
taccaggccg acgagcgctt cgtgagcgcc atcgagggca tgcaccccaa ccaggaggac 1980
cacgagacct tcgtggacat caaccccctg accggcatca tcctgaaggc cgccaagcgc 2040
ttccagatca acatctacgt gaagaagctg gacgacttcg tggagaccgg cgacatccgc 2100
accatggtgt tccccgtgat gtacctgaac gagagcgtgc acatcgacaa ggagaccgcc 2160
agccgcctga agagcatgat caacaccacc ctgatcatca ccaacatccc ctacatcatc 2220
atggccctgg gcgtgttctt cggcctggtg ttcacctggc tggcctgcaa gggccagggc 2280
agcatggacg agggcaccgc cgacgagcgc gcccccctga tccgcaccga gggcagagga 2340
agtcttctga catgcggaga cgtggaagag aatcccggcc ctatggaatt cagcagcccc 2400
agcagagagg aatgccccaa gcctctgagc cgggtgtcaa tcatggccgg atctctgaca 2460
ggactgctgc tgcttcaggc cgtgtcttgg gcttctggcg ctagaccttg catccccaag 2520
agcttcggct acagcagcgt cgtgtgcgtg tgcaatgcca cctactgcga cagcttcgac 2580
cctcctacct ttcctgctct gggcaccttc agcagatacg agagcaccag atccggcaga 2640
cggatggaac tgagcatggg acccatccag gccaatcaca caggcactgg cctgctgctg 2700
acactgcagc ctgagcagaa attccagaaa gtgaaaggct tcggcggagc catgacagat 2760
gccgccgctc tgaatatcct ggctctgtct ccaccagctc agaacctgct gctcaagagc 2820
tacttcagcg aggaaggcat cggctacaac atcatcagag tgcccatggc cagctgcgac 2880
ttcagcatca ggacctacac ctacgccgac acacccgacg atttccagct gcacaacttc 2940
agcctgcctg aagaggacac caagctgaag atccctctga tccacagagc cctgcagctg 3000
gcacaaagac ccgtgtcact gctggcctct ccatggacat ctcccacctg gctgaaaaca 3060
aatggcgccg tgaatggcaa gggcagcctg aaaggccaac ctggcgacat ctaccaccag 3120
acctgggcca gatacttcgt gaagttcctg gacgcctatg ccgagcacaa gctgcagttt 3180
tgggccgtga cagccgagaa cgaaccttct gctggactgc tgagcggcta cccctttcag 3240
tgcctgggct ttacacccga gcaccagcgg gactttatcg cccgtgatct gggacccaca 3300
ctggccaata gcacccacca taatgtgcgg ctgctgatgc tggacgacca gagactgctt 3360
ctgccccact gggctaaagt ggtgctgaca gatcctgagg ccgccaaata cgtgcacgga 3420
atcgccgtgc actggtatct ggactttctg gcccctgcca aggccacact gggagagaca 3480
cacagactgt tccccaacac catgctgttc gccagcgaag cctgtgtggg cagcaagttt 3540
tgggaacaga gcgtgcggct cggcagctgg gatagaggca tgcagtacag ccacagcatc 3600
atcaccaacc tgctgtacca cgtcgtcggc tggaccgact ggaatctggc cctgaatcct 3660
gaaggcggcc ctaactgggt ccgaaacttc gtggacagcc ccatcatcgt ggacatcacc 3720
aaggacacct tctacaagca gcccatgttc taccacctgg gacacttcag caagttcatc 3780
cccgagggct ctcagcgcgt tggactggtg gcttcccaga agaacgatct ggacgccgtg 3840
gctctgatgc accctgatgg atctgctgtg gtggtggtcc tgaaccgcag cagcaaagat 3900
gtgcccctga ccatcaagga tcccgccgtg ggattcctgg aaacaatcag ccctggctac 3960
tccatccaca cctacctgtg gcgtagacag tgacaattgt taattaagtt taaaccctcg 4020
aggccgcaag ccgcatcgat accgtcgact agagctcgct gatcagcctc gactgtgcct 4080
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 4140
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 4200
tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 4260
aatagcaggc atgctgggga gagatccacg ataacaaaca gcttttttgg ggtgaacata 4320
ttgactgaat tccctgcagg ttggccactc cctctctgcg cgctcgctcg ctcactgagg 4380
ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 4440
gagcgcgcag agagggagtg gccaactcca tcactagggg ttcctgcggc cgctcgtacg 4500
gtctcgagga attcctgcag gataacttgc caacctcatt ctaaaatgta tatagaagcc 4560
caaaagacaa taacaaaaat attcttgtag aacaaaatgg gaaagaatgt tccactaaat 4620
atcaagattt agagcaaagc atgagatgtg tggggataga cagtgaggct gataaaatag 4680
agtagagctc agaaacagac ccattgatat atgtaagtga cctatgaaaa aaatatggca 4740
ttttacaatg ggaaaatgat ggtctttttc ttttttagaa aaacagggaa atatatttat 4800
atgtaaaaaa taaaagggaa cccatatgtc ataccataca cacaaaaaaa ttccagtgaa 4860
ttataagtct aaatggagaa ggcaaaactt taaatctttt agaaaataat atagaagcat 4920
gcagaccagc ctggccaaca tgatgaaacc ctctctacta ataataaaat cagtagaact 4980
actcaggact actttgagtg ggaagtcctt ttctatgaag acttctttgg ccaaaattag 5040
gctctaaatg caaggagata gtgcatcatg cctggctgca cttactgata aatgatgtta 5100
tcaccatctt taaccaaatg cacaggaaca agttatggta ctgatgtgct ggattgagaa 5160
ggagctctac ttccttgaca ggacacattt gtatcaactt aaaaaagcag atttttgcca 5220
gcagaactat tcattcagag gtaggaaact tagaatagat gatgtcactg attagcatgg 5280
cttccccatc tccacagctg cttcccaccc aggttgccca cagttgagtt tgtccagtgc 5340
tcagggctgc ccactctcag taagaagccc cacaccagcc cctctccaaa tatgttggct 5400
gttccttcca ttaaagtgac cccactttag agcagcaagt ggatttctgt ttcttacagt 5460
tcaggaagga ggagtcagct gtgagaacct ggagcctgag atgcttctaa gtcccactgc 5520
tactggggtc agggaagcca gactccagca tcagcagtca ggagcactaa gcccttgcca 5580
acatcctgtt tctcagagaa actgcttcca ttataatggt tgtccttttt taagctatca 5640
agccaaacaa ccagtgtcta ccattattct catcacctga agccaagggt tctagcaaaa 5700
gtcaagctgt cttgtaatgg ttgatgtgcc tccagcttct gtcttcagtc actccactct 5760
tagcctgctc tgaatcaact ctgaccacag ttccctggag cccctgccac ctgctgcccc 5820
tgccaccttc tccatctgca gtgctgtgca gccttctgca ctcttgcaga gctaataggt 5880
ggagacttga aggaagagga ggaaagtttc tcataatagc cttgctgcaa gctcaaatgg 5940
gaggtgggca ctgtgcccag gagccttgga gcaaaggctg tgcccaacct ctgactgcat 6000
ccaggtttgg tcttgacaga gataagaagc cctggctttt ggagccaaaa tctaggtcag 6060
acttaggcag gattctcaaa gtttatcagc agaacatgag gcagaagacc ctttctgctc 6120
cagcttcttc aggctcaacc ttcatcagaa tagatagaaa gagaggctgt gagggttctt 6180
aaaacagaag caaatctgac tcagagaata aacaacctcc tagtaaacta cagcttagac 6240
agagcatctg gtggtgagtg tgctcagtgt cctactcaac tgtctggtat cagccctcat 6300
gaggacttct cttctttccc tcatagacct ccatctctgt tttccttagc ctgcagaaat 6360
ctggatggct attcacagaa tgcctgtgct ttcagagttg cattttttct ctggtattct 6420
ggttcaagca tttgaaggta ggaaaggttc tccaagtgca agaaagccag ccctgagcct 6480
caactgcctg gctagtgtgg tcagtaggat gcaaaggctg ttgaatgcca caaggccaaa 6540
ctttaacctg tgtaccacaa gcctagcagc agaggcagct ctgctcactg gaactctctg 6600
tcttctttct cctgagcctt ttcttttcct gagttttcta gctctcctca accttacctc 6660
tgccctaccc aggacaaacc caagagccac tgtttctgtg atgtcctctc cagccctaat 6720
taggcatcat gacttcagcc tgaccttcca tgctcagaag cagtgctaat ccacttcaga 6780
tgagctgctc tatgcaacac aggcagagcc tacaaacctt tgcaccagag ccctccacat 6840
atcagtgttt gttcatactc acttcaacag caaatgtgac tgctgagatt aagattttac 6900
acaagatggt ctgtaatttc acagttagtt ttatcccatt aggtatgaaa gaattagcat 6960
aattcccctt aaacatgaat gaatcttaga ttttttaata aatagttttg gaagtaaaga 7020
cagagacatc aggagcacaa ggaatagcct gagaggacaa acagaacaag aaagagtctg 7080
gaaatacaca ggatgttctt ggcctcctca aagcaagtgc aagcagatag taccagcagc 7140
cccaggctat cagagcccag tgaagagaag taccatgaaa gccacagctc taaccaccct 7200
gttccagagt gacagacagt ccccaagaca agccagcctg agccagagag agaactgcaa 7260
gagaaagttt ctaatttagg ttctgttaga ttcagacaag tgcaggtcat cctctctcca 7320
cagctactca cctctccagc ctaacaaagc ctgcagtcca cactccaacc ctggtgtctc 7380
acctcctagc ctctcccaac atcctgctct ctgaccatct tctgcatctc tcatctcacc 7440
atctcccact gtctacagcc tactcttgca actaccatct cattttctga catcctgtct 7500
acatcttctg ccatactctg ccatctacca taccacctct taccatctac cacaccatct 7560
tttatctcca tccctctcag aagcctccaa gctgaatcct gctttatgtg ttcatctcag 7620
cccctgcatg gaaagctgac cccagaggca gaactattcc cagagagctt ggccaagaaa 7680
aacaaaacta ccagcctggc caggctcagg agtagtaagc tgcagtgtct gttgtgttct 7740
agcttcaaca gctgcaggag ttccactctc aaatgctcca catttctcac atcctcctga 7800
ttctggtcac tacccatctt caaagaacag aatatctcac atcagcatac tgtgaaggac 7860
tagtcatggg tgcagctgct cagagctgca aagtcattct ggatggtgga gagcttacaa 7920
acatttcatg atgctccccc cgctctgatg gctggagccc aatccctaca cagactcctg 7980
ctgtatgtgt tttcctttca ctctgagcca cagccagagg gcaggcattc agtctcctct 8040
tcaggctggg gctggggcac tgagaactca cccaacacct tgctctcact ccttctgcaa 8100
aacaagaaag agctttgtgc tgcagtagcc atgaagaatg aaaggaaggc tttaactaaa 8160
aaatgtcaga gattattttc aaccccttac tgtggatcac cagcaaggag gaaacacaac 8220
acagagacat tttttcccct caaattatca aaagaatcac tgcatttgtt aaagagagca 8280
actgaatcag gaagcagagt tttgaacata tcagaagtta ggaatctgca tcagagacaa 8340
atgcagtcat ggttgtttgc tgcataccag ccctaatcat tagaagcctc atggacttca 8400
aacatcattc cctctgacaa gatgctctag cctaactcca tgagataaaa taaatctgcc 8460
tttcagagcc aaagaagagt ccaccagctt cttctcagtg tgaacaagag ctccagtcag 8520
gttagtcagt ccagtgcagt agaggagacc agtctgcatc ctctaatttt caaaggcaag 8580
aagatttgtt taccctggac accaggcaca agtgaggtca cagagctctt agatatgcag 8640
tcctcatgag tgaggagact aaagcgcatg ccatcaagac ttcagtgtag agaaaacctc 8700
caaaaaagcc tcctcactac ttctggaata gctcagaggc cgaggcggcc tcggcctctg 8760
cataaataaa aaaaattagt cagccatggg gcggagaatg ggcggaactg ggcggagtta 8820
ggggcgggat gggcggagtt aggggcggga ctatggttgc tgactaattg agatgcatgc 8880
tttgcatact tctgcctgct ggggagcctg gggactttcc acacctggtt gctgactaat 8940
tgagatgcat gctttgcata cttctgcctg ctggggagcc tggggacttt ccacacccta 9000
actgacacac attccacagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 9060
gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 9120
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 9180
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 9240
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 9300
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 9360
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 9420
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 9480
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 9540
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 9600
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 9660
cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 9720
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 9780
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 9840
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 9900
ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 9960
aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 10020
atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 10080
ctgactcctg caaaccacgt tgtgtctcaa aatctctgat gttacattgc acaagataaa 10140
aatatatcat catgaacaat aaaactgtct gcttacataa acagtaatac aaggggtgtt 10200
atgagccata ttcaacggga aacgtcttgc tcgaggccgc gattaaattc caacatggat 10260
gctgatttat atgggtataa atgggctcgc gataatgtcg ggcaatcagg tgcgacaatc 10320
tatcgattgt atgggaagcc cgatgcgcca gagttgtttc tgaaacatgg caaaggtagc 10380
gttgccaatg atgttacaga tgagatggtc agactaaact ggctgacgga atttatgcct 10440
cttccgacca tcaagcattt tatccgtact cctgatgatg catggttact caccactgcg 10500
atccccggga aaacagcatt ccaggtatta gaagaatatc ctgattcagg tgaaaatatt 10560
gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga ttcctgtttg taattgtcct 10620
tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat cacgaatgaa taacggtttg 10680
gttgatgcga gtgattttga tgacgagcgt aatggctggc ctgttgaaca agtctggaaa 10740
gaaatgcata agcttttgcc attctcaccg gattcagtcg tcactcatgg tgatttctca 10800
cttgataacc ttatttttga cgaggggaaa ttaataggtt gtattgatgt tggacgagtc 10860
ggaatcgcag accgatacca ggatcttgcc atcctatgga actgcctcgg tgagttttct 10920
ccttcattac agaaacggct ttttcaaaaa tatggtattg ataatcctga tatgaataaa 10980
ttgcagtttc atttgatgct cgatgagttt ttctaagggc ggcctgccac catacccacg 11040
ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc ggtgatgtcg 11100
gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgagggcgcg ccaagtcgac 11160
gtccggcagt c 11171
<210> 5
<211> 11309
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 5
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300
tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360
atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420
tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480
agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540
tggcactatg aaccctcctg gtggcgaggg gaggggggtg gtcctcgaac gccttgcaga 600
actggcctgg atacagagtg gaccggctgg ccccatctgg aagacttcga gatacactgt 660
tgtcttactg cgctcaacag tgtatctcga agtcttccaa atggtgccag ccatcgcagc 720
ggggtgcagg aaatgggggc agcccccctt tttggctatc cttccacgtg ttcttttttg 780
tatcttttgt gtttcctaga aaacatctca gtcaccaccg cagccctagg aatgcatcta 840
gacaattgta ctaaccttct tctctttcct ctcctgacag tccggaaagc caccatgtac 900
gccctgttcc tgctggccag cctgctgggc gccgccctgg ccggccccgt gctgggcctg 960
aaggagtgca cccgcggcag cgccgtgtgg tgccagaacg tgaagaccgc cagcgactgc 1020
ggcgccgtga agcactgcct gcagaccgtg tggaacaagc ccaccgtgaa gagcctgccc 1080
tgcgacatct gcaaggacgt ggtgaccgcc gccggcgaca tgctgaagga caacgccacc 1140
gaggaggaga tcctggtgta cctggagaag acctgcgact ggctgcccaa gcccaacatg 1200
agcgccagct gcaaggagat cgtggacagc tacctgcccg tgatcctgga catcatcaag 1260
ggcgagatga gccgccccgg cgaggtgtgc agcgccctga acctgtgcga gagcctgcag 1320
aagcacctgg ccgagctgaa ccaccagaag cagctggaga gcaacaagat ccccgagctg 1380
gacatgaccg aggtggtggc ccccttcatg gccaacatcc ccctgctgct gtacccccag 1440
gacggccccc gcagcaagcc ccagcccaag gacaacggcg acgtgtgcca ggactgcatc 1500
cagatggtga ccgacatcca gaccgccgtg cgcaccaaca gcaccttcgt gcaggccctg 1560
gtggagcacg tgaaggagga gtgcgaccgc ctgggccccg gcatggccga catctgcaag 1620
aactacatca gccagtacag cgagatcgcc atccagatga tgatgcacat gcagcccaag 1680
gagatctgcg ccctggtggg cttctgcgac gaggtgaagg agatgcccat gcagaccctg 1740
gtgcccgcca aggtggccag caagaacgtg atccccgccc tggagctggt ggagcccatc 1800
aagaagcacg aggtgcccgc caagagcgac gtgtactgcg aggtgtgcga gttcctggtg 1860
aaggaggtga ccaagctgat cgacaacaac aagaccgaga aggagatcct ggacgccttc 1920
gacaagatgt gcagcaagct gcccaagagc ctgagcgagg agtgccagga ggtggtggac 1980
acctacggca gcagcatcct gagcatcctg ctggaggagg tgagccccga gctggtgtgc 2040
agcatgctgc acctgtgcag cggcacccgc ctgcccgccc tgaccgtgca cgtgacccag 2100
cccaaggacg gcggcttctg cgaggtgtgc aagaagctgg tgggctacct ggaccgcaac 2160
ctggagaaga acagcaccaa gcaggagatc ctggccgccc tggagaaggg ctgcagcttc 2220
ctgcccgacc cctaccagaa gcagtgcgac cagttcgtgg ccgagtacga gcccgtgctg 2280
atcgagatcc tggtggaggt gatggacccc agcttcgtgt gcctgaagat cggcgcctgc 2340
cccagcgccc acaagcccct gctgggcacc gagaagtgca tctggggccc cagctactgg 2400
tgccagaaca ccgagaccgc cgcccagtgc aacgccgtgg agcactgcaa gcgccacgtg 2460
tggaacgagg gcagaggaag tcttctgaca tgcggagacg tggaagagaa tcccggccct 2520
atggaattca gcagccccag cagagaggaa tgccccaagc ctctgagccg ggtgtcaatc 2580
atggccggat ctctgacagg actgctgctg cttcaggccg tgtcttgggc ttctggcgct 2640
agaccttgca tccccaagag cttcggctac agcagcgtcg tgtgcgtgtg caatgccacc 2700
tactgcgaca gcttcgaccc tcctaccttt cctgctctgg gcaccttcag cagatacgag 2760
agcaccagat ccggcagacg gatggaactg agcatgggac ccatccaggc caatcacaca 2820
ggcactggcc tgctgctgac actgcagcct gagcagaaat tccagaaagt gaaaggcttc 2880
ggcggagcca tgacagatgc cgccgctctg aatatcctgg ctctgtctcc accagctcag 2940
aacctgctgc tcaagagcta cttcagcgag gaaggcatcg gctacaacat catcagagtg 3000
cccatggcca gctgcgactt cagcatcagg acctacacct acgccgacac acccgacgat 3060
ttccagctgc acaacttcag cctgcctgaa gaggacacca agctgaagat ccctctgatc 3120
cacagagccc tgcagctggc acaaagaccc gtgtcactgc tggcctctcc atggacatct 3180
cccacctggc tgaaaacaaa tggcgccgtg aatggcaagg gcagcctgaa aggccaacct 3240
ggcgacatct accaccagac ctgggccaga tacttcgtga agttcctgga cgcctatgcc 3300
gagcacaagc tgcagttttg ggccgtgaca gccgagaacg aaccttctgc tggactgctg 3360
agcggctacc cctttcagtg cctgggcttt acacccgagc accagcggga ctttatcgcc 3420
cgtgatctgg gacccacact ggccaatagc acccaccata atgtgcggct gctgatgctg 3480
gacgaccaga gactgcttct gccccactgg gctaaagtgg tgctgacaga tcctgaggcc 3540
gccaaatacg tgcacggaat cgccgtgcac tggtatctgg actttctggc ccctgccaag 3600
gccacactgg gagagacaca cagactgttc cccaacacca tgctgttcgc cagcgaagcc 3660
tgtgtgggca gcaagttttg ggaacagagc gtgcggctcg gcagctggga tagaggcatg 3720
cagtacagcc acagcatcat caccaacctg ctgtaccacg tcgtcggctg gaccgactgg 3780
aatctggccc tgaatcctga aggcggccct aactgggtcc gaaacttcgt ggacagcccc 3840
atcatcgtgg acatcaccaa ggacaccttc tacaagcagc ccatgttcta ccacctggga 3900
cacttcagca agttcatccc cgagggctct cagcgcgttg gactggtggc ttcccagaag 3960
aacgatctgg acgccgtggc tctgatgcac cctgatggat ctgctgtggt ggtggtcctg 4020
aaccgcagca gcaaagatgt gcccctgacc atcaaggatc ccgccgtggg attcctggaa 4080
acaatcagcc ctggctactc catccacacc tacctgtggc gtagacagtg acaattgtta 4140
attaagttta aaccctcgag gccgcaagcc gcatcgatac cgtcgactag agctcgctga 4200
tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct 4260
tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca 4320
tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag 4380
ggggaggatt gggaagacaa tagcaggcat gctggggaga gatccacgat aacaaacagc 4440
ttttttgggg tgaacatatt gactgaattc cctgcaggtt ggccactccc tctctgcgcg 4500
ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc 4560
cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt 4620
cctgcggccg ctcgtacggt ctcgaggaat tcctgcagga taacttgcca acctcattct 4680
aaaatgtata tagaagccca aaagacaata acaaaaatat tcttgtagaa caaaatggga 4740
aagaatgttc cactaaatat caagatttag agcaaagcat gagatgtgtg gggatagaca 4800
gtgaggctga taaaatagag tagagctcag aaacagaccc attgatatat gtaagtgacc 4860
tatgaaaaaa atatggcatt ttacaatggg aaaatgatgg tctttttctt ttttagaaaa 4920
acagggaaat atatttatat gtaaaaaata aaagggaacc catatgtcat accatacaca 4980
caaaaaaatt ccagtgaatt ataagtctaa atggagaagg caaaacttta aatcttttag 5040
aaaataatat agaagcatgc agaccagcct ggccaacatg atgaaaccct ctctactaat 5100
aataaaatca gtagaactac tcaggactac tttgagtggg aagtcctttt ctatgaagac 5160
ttctttggcc aaaattaggc tctaaatgca aggagatagt gcatcatgcc tggctgcact 5220
tactgataaa tgatgttatc accatcttta accaaatgca caggaacaag ttatggtact 5280
gatgtgctgg attgagaagg agctctactt ccttgacagg acacatttgt atcaacttaa 5340
aaaagcagat ttttgccagc agaactattc attcagaggt aggaaactta gaatagatga 5400
tgtcactgat tagcatggct tccccatctc cacagctgct tcccacccag gttgcccaca 5460
gttgagtttg tccagtgctc agggctgccc actctcagta agaagcccca caccagcccc 5520
tctccaaata tgttggctgt tccttccatt aaagtgaccc cactttagag cagcaagtgg 5580
atttctgttt cttacagttc aggaaggagg agtcagctgt gagaacctgg agcctgagat 5640
gcttctaagt cccactgcta ctggggtcag ggaagccaga ctccagcatc agcagtcagg 5700
agcactaagc ccttgccaac atcctgtttc tcagagaaac tgcttccatt ataatggttg 5760
tcctttttta agctatcaag ccaaacaacc agtgtctacc attattctca tcacctgaag 5820
ccaagggttc tagcaaaagt caagctgtct tgtaatggtt gatgtgcctc cagcttctgt 5880
cttcagtcac tccactctta gcctgctctg aatcaactct gaccacagtt ccctggagcc 5940
cctgccacct gctgcccctg ccaccttctc catctgcagt gctgtgcagc cttctgcact 6000
cttgcagagc taataggtgg agacttgaag gaagaggagg aaagtttctc ataatagcct 6060
tgctgcaagc tcaaatggga ggtgggcact gtgcccagga gccttggagc aaaggctgtg 6120
cccaacctct gactgcatcc aggtttggtc ttgacagaga taagaagccc tggcttttgg 6180
agccaaaatc taggtcagac ttaggcagga ttctcaaagt ttatcagcag aacatgaggc 6240
agaagaccct ttctgctcca gcttcttcag gctcaacctt catcagaata gatagaaaga 6300
gaggctgtga gggttcttaa aacagaagca aatctgactc agagaataaa caacctccta 6360
gtaaactaca gcttagacag agcatctggt ggtgagtgtg ctcagtgtcc tactcaactg 6420
tctggtatca gccctcatga ggacttctct tctttccctc atagacctcc atctctgttt 6480
tccttagcct gcagaaatct ggatggctat tcacagaatg cctgtgcttt cagagttgca 6540
ttttttctct ggtattctgg ttcaagcatt tgaaggtagg aaaggttctc caagtgcaag 6600
aaagccagcc ctgagcctca actgcctggc tagtgtggtc agtaggatgc aaaggctgtt 6660
gaatgccaca aggccaaact ttaacctgtg taccacaagc ctagcagcag aggcagctct 6720
gctcactgga actctctgtc ttctttctcc tgagcctttt cttttcctga gttttctagc 6780
tctcctcaac cttacctctg ccctacccag gacaaaccca agagccactg tttctgtgat 6840
gtcctctcca gccctaatta ggcatcatga cttcagcctg accttccatg ctcagaagca 6900
gtgctaatcc acttcagatg agctgctcta tgcaacacag gcagagccta caaacctttg 6960
caccagagcc ctccacatat cagtgtttgt tcatactcac ttcaacagca aatgtgactg 7020
ctgagattaa gattttacac aagatggtct gtaatttcac agttagtttt atcccattag 7080
gtatgaaaga attagcataa ttccccttaa acatgaatga atcttagatt ttttaataaa 7140
tagttttgga agtaaagaca gagacatcag gagcacaagg aatagcctga gaggacaaac 7200
agaacaagaa agagtctgga aatacacagg atgttcttgg cctcctcaaa gcaagtgcaa 7260
gcagatagta ccagcagccc caggctatca gagcccagtg aagagaagta ccatgaaagc 7320
cacagctcta accaccctgt tccagagtga cagacagtcc ccaagacaag ccagcctgag 7380
ccagagagag aactgcaaga gaaagtttct aatttaggtt ctgttagatt cagacaagtg 7440
caggtcatcc tctctccaca gctactcacc tctccagcct aacaaagcct gcagtccaca 7500
ctccaaccct ggtgtctcac ctcctagcct ctcccaacat cctgctctct gaccatcttc 7560
tgcatctctc atctcaccat ctcccactgt ctacagccta ctcttgcaac taccatctca 7620
ttttctgaca tcctgtctac atcttctgcc atactctgcc atctaccata ccacctctta 7680
ccatctacca caccatcttt tatctccatc cctctcagaa gcctccaagc tgaatcctgc 7740
tttatgtgtt catctcagcc cctgcatgga aagctgaccc cagaggcaga actattccca 7800
gagagcttgg ccaagaaaaa caaaactacc agcctggcca ggctcaggag tagtaagctg 7860
cagtgtctgt tgtgttctag cttcaacagc tgcaggagtt ccactctcaa atgctccaca 7920
tttctcacat cctcctgatt ctggtcacta cccatcttca aagaacagaa tatctcacat 7980
cagcatactg tgaaggacta gtcatgggtg cagctgctca gagctgcaaa gtcattctgg 8040
atggtggaga gcttacaaac atttcatgat gctccccccg ctctgatggc tggagcccaa 8100
tccctacaca gactcctgct gtatgtgttt tcctttcact ctgagccaca gccagagggc 8160
aggcattcag tctcctcttc aggctggggc tggggcactg agaactcacc caacaccttg 8220
ctctcactcc ttctgcaaaa caagaaagag ctttgtgctg cagtagccat gaagaatgaa 8280
aggaaggctt taactaaaaa atgtcagaga ttattttcaa ccccttactg tggatcacca 8340
gcaaggagga aacacaacac agagacattt tttcccctca aattatcaaa agaatcactg 8400
catttgttaa agagagcaac tgaatcagga agcagagttt tgaacatatc agaagttagg 8460
aatctgcatc agagacaaat gcagtcatgg ttgtttgctg cataccagcc ctaatcatta 8520
gaagcctcat ggacttcaaa catcattccc tctgacaaga tgctctagcc taactccatg 8580
agataaaata aatctgcctt tcagagccaa agaagagtcc accagcttct tctcagtgtg 8640
aacaagagct ccagtcaggt tagtcagtcc agtgcagtag aggagaccag tctgcatcct 8700
ctaattttca aaggcaagaa gatttgttta ccctggacac caggcacaag tgaggtcaca 8760
gagctcttag atatgcagtc ctcatgagtg aggagactaa agcgcatgcc atcaagactt 8820
cagtgtagag aaaacctcca aaaaagcctc ctcactactt ctggaatagc tcagaggccg 8880
aggcggcctc ggcctctgca taaataaaaa aaattagtca gccatggggc ggagaatggg 8940
cggaactggg cggagttagg ggcgggatgg gcggagttag gggcgggact atggttgctg 9000
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 9060
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 9120
gggactttcc acaccctaac tgacacacat tccacagctg cattaatgaa tcggccaacg 9180
cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 9240
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 9300
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 9360
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 9420
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 9480
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 9540
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 9600
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 9660
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 9720
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 9780
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 9840
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 9900
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 9960
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 10020
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 10080
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 10140
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 10200
tcgttcatcc atagttgcct gactcctgca aaccacgttg tgtctcaaaa tctctgatgt 10260
tacattgcac aagataaaaa tatatcatca tgaacaataa aactgtctgc ttacataaac 10320
agtaatacaa ggggtgttat gagccatatt caacgggaaa cgtcttgctc gaggccgcga 10380
ttaaattcca acatggatgc tgatttatat gggtataaat gggctcgcga taatgtcggg 10440
caatcaggtg cgacaatcta tcgattgtat gggaagcccg atgcgccaga gttgtttctg 10500
aaacatggca aaggtagcgt tgccaatgat gttacagatg agatggtcag actaaactgg 10560
ctgacggaat ttatgcctct tccgaccatc aagcatttta tccgtactcc tgatgatgca 10620
tggttactca ccactgcgat ccccgggaaa acagcattcc aggtattaga agaatatcct 10680
gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt 10740
cctgtttgta attgtccttt taacagcgat cgcgtatttc gtctcgctca ggcgcaatca 10800
cgaatgaata acggtttggt tgatgcgagt gattttgatg acgagcgtaa tggctggcct 10860
gttgaacaag tctggaaaga aatgcataag cttttgccat tctcaccgga ttcagtcgtc 10920
actcatggtg atttctcact tgataacctt atttttgacg aggggaaatt aataggttgt 10980
attgatgttg gacgagtcgg aatcgcagac cgataccagg atcttgccat cctatggaac 11040
tgcctcggtg agttttctcc ttcattacag aaacggcttt ttcaaaaata tggtattgat 11100
aatcctgata tgaataaatt gcagtttcat ttgatgctcg atgagttttt ctaagggcgg 11160
cctgccacca tacccacgcc gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct 11220
tccccatcgg tgatgtcggc gatataggcg ccagcaaccg cacctgtggc gccggtgatg 11280
agggcgcgcc aagtcgacgt ccggcagtc 11309
<210> 6
<211> 11293
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 6
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg agggcggagt 300
tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 360
atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 420
tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttggta 480
agtcactgac tgtctatgcc tgggaaaggg tgggcaggag atggggcagt gcaggaaaag 540
tggcactatg aaccctgcag ccctaggaat gcatctagac aattgtacta accttcttct 600
ctttcctctc ctgacagtcc ggaaagccac catgtacgcc ctgttcctgc tggccagcct 660
gctgggcgcc gccctggccg gccccgtgct gggcctgaag gagtgcaccc gcggcagcgc 720
cgtgtggtgc cagaacgtga agaccgccag cgactgcggc gccgtgaagc actgcctgca 780
gaccgtgtgg aacaagccca ccgtgaagag cctgccctgc gacatctgca aggacgtggt 840
gaccgccgcc ggcgacatgc tgaaggacaa cgccaccgag gaggagatcc tggtgtacct 900
ggagaagacc tgcgactggc tgcccaagcc caacatgagc gccagctgca aggagatcgt 960
ggacagctac ctgcccgtga tcctggacat catcaagggc gagatgagcc gccccggcga 1020
ggtgtgcagc gccctgaacc tgtgcgagag cctgcagaag cacctggccg agctgaacca 1080
ccagaagcag ctggagagca acaagatccc cgagctggac atgaccgagg tggtggcccc 1140
cttcatggcc aacatccccc tgctgctgta cccccaggac ggcccccgca gcaagcccca 1200
gcccaaggac aacggcgacg tgtgccagga ctgcatccag atggtgaccg acatccagac 1260
cgccgtgcgc accaacagca ccttcgtgca ggccctggtg gagcacgtga aggaggagtg 1320
cgaccgcctg ggccccggca tggccgacat ctgcaagaac tacatcagcc agtacagcga 1380
gatcgccatc cagatgatga tgcacatgca gcccaaggag atctgcgccc tggtgggctt 1440
ctgcgacgag gtgaaggaga tgcccatgca gaccctggtg cccgccaagg tggccagcaa 1500
gaacgtgatc cccgccctgg agctggtgga gcccatcaag aagcacgagg tgcccgccaa 1560
gagcgacgtg tactgcgagg tgtgcgagtt cctggtgaag gaggtgacca agctgatcga 1620
caacaacaag accgagaagg agatcctgga cgccttcgac aagatgtgca gcaagctgcc 1680
caagagcctg agcgaggagt gccaggaggt ggtggacacc tacggcagca gcatcctgag 1740
catcctgctg gaggaggtga gccccgagct ggtgtgcagc atgctgcacc tgtgcagcgg 1800
cacccgcctg cccgccctga ccgtgcacgt gacccagccc aaggacggcg gcttctgcga 1860
ggtgtgcaag aagctggtgg gctacctgga ccgcaacctg gagaagaaca gcaccaagca 1920
ggagatcctg gccgccctgg agaagggctg cagcttcctg cccgacccct accagaagca 1980
gtgcgaccag ttcgtggccg agtacgagcc cgtgctgatc gagatcctgg tggaggtgat 2040
ggaccccagc ttcgtgtgcc tgaagatcgg cgcctgcccc agcgcccaca agcccctgct 2100
gggcaccgag aagtgcatct ggggccccag ctactggtgc cagaacaccg agaccgccgc 2160
ccagtgcaac gccgtggagc actgcaagcg ccacgtgtgg aactgattgt ggccgaaccg 2220
ccgaactcag aggccggccc cagaaaaccc gagcgagtag ggggcggcgc gcaggaggga 2280
ggagaactgg gggcgcggga ggctggtggg tgtggggggt ggagatgtag aagatgtgac 2340
gccgcggccc ggcgggtgcc agattagcgg acgcggtgcc cgcggttgca acgggatccc 2400
gggcgctgca gcttgggagg cggctctccc caggcggcgt ccgcggagac acccatccgt 2460
gaaccccagg tcccgggccg ccggctcgcc gcgcaccagg ggccggcgga cagaagagcg 2520
gccgagcggc tcgaggctgg gggaccgcgg gcgcggccgc gcgctgccgg gcgggaggct 2580
ggggggccgg ggccggggcc gtgccccgga gcgggtcgga ggccggggcc ggggccgggg 2640
gacggcggct ccccgcgcgg ctccagcggc tcggggatcc cggccgggcc ccgcagggac 2700
catgatggaa ttcagcagcc ccagcagaga ggaatgcccc aagcctctga gccgggtgtc 2760
aatcatggcc ggatctctga caggactgct gctgcttcag gccgtgtctt gggcttctgg 2820
cgctagacct tgcatcccca agagcttcgg ctacagcagc gtcgtgtgcg tgtgcaatgc 2880
cacctactgc gacagcttcg accctcctac ctttcctgct ctgggcacct tcagcagata 2940
cgagagcacc agatccggca gacggatgga actgagcatg ggacccatcc aggccaatca 3000
cacaggcact ggcctgctgc tgacactgca gcctgagcag aaattccaga aagtgaaagg 3060
cttcggcgga gccatgacag atgccgccgc tctgaatatc ctggctctgt ctccaccagc 3120
tcagaacctg ctgctcaaga gctacttcag cgaggaaggc atcggctaca acatcatcag 3180
agtgcccatg gccagctgcg acttcagcat caggacctac acctacgccg acacacccga 3240
cgatttccag ctgcacaact tcagcctgcc tgaagaggac accaagctga agatccctct 3300
gatccacaga gccctgcagc tggcacaaag acccgtgtca ctgctggcct ctccatggac 3360
atctcccacc tggctgaaaa caaatggcgc cgtgaatggc aagggcagcc tgaaaggcca 3420
acctggcgac atctaccacc agacctgggc cagatacttc gtgaagttcc tggacgccta 3480
tgccgagcac aagctgcagt tttgggccgt gacagccgag aacgaacctt ctgctggact 3540
gctgagcggc tacccctttc agtgcctggg ctttacaccc gagcaccagc gggactttat 3600
cgcccgtgat ctgggaccca cactggccaa tagcacccac cataatgtgc ggctgctgat 3660
gctggacgac cagagactgc ttctgcccca ctgggctaaa gtggtgctga cagatcctga 3720
ggccgccaaa tacgtgcacg gaatcgccgt gcactggtat ctggactttc tggcccctgc 3780
caaggccaca ctgggagaga cacacagact gttccccaac accatgctgt tcgccagcga 3840
agcctgtgtg ggcagcaagt tttgggaaca gagcgtgcgg ctcggcagct gggatagagg 3900
catgcagtac agccacagca tcatcaccaa cctgctgtac cacgtcgtcg gctggaccga 3960
ctggaatctg gccctgaatc ctgaaggcgg ccctaactgg gtccgaaact tcgtggacag 4020
ccccatcatc gtggacatca ccaaggacac cttctacaag cagcccatgt tctaccacct 4080
gggacacttc agcaagttca tccccgaggg ctctcagcgc gttggactgg tggcttccca 4140
gaagaacgat ctggacgccg tggctctgat gcaccctgat ggatctgctg tggtggtggt 4200
cctgaaccgc agcagcaaag atgtgcccct gaccatcaag gatcccgccg tgggattcct 4260
ggaaacaatc agccctggct actccatcca cacctacctg tggcgtagac agtgacaatt 4320
gttaattaag tttaaaccct cgaggccgca agcaataaaa tatctttatt ttcattacat 4380
ctgtgtgttg gttttttgtg tggagatcca cgataacaaa cagctttttt ggggtgaaca 4440
tattgactga attccctgca ggttggccac tccctctctg cgcgctcgct cgctcactga 4500
ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct cagtgagcga 4560
gcgagcgcgc agagagggag tggccaactc catcactagg ggttcctgcg gccgctcgta 4620
cggtctcgag gaattcctgc aggataactt gccaacctca ttctaaaatg tatatagaag 4680
cccaaaagac aataacaaaa atattcttgt agaacaaaat gggaaagaat gttccactaa 4740
atatcaagat ttagagcaaa gcatgagatg tgtggggata gacagtgagg ctgataaaat 4800
agagtagagc tcagaaacag acccattgat atatgtaagt gacctatgaa aaaaatatgg 4860
cattttacaa tgggaaaatg atggtctttt tcttttttag aaaaacaggg aaatatattt 4920
atatgtaaaa aataaaaggg aacccatatg tcataccata cacacaaaaa aattccagtg 4980
aattataagt ctaaatggag aaggcaaaac tttaaatctt ttagaaaata atatagaagc 5040
atgcagacca gcctggccaa catgatgaaa ccctctctac taataataaa atcagtagaa 5100
ctactcagga ctactttgag tgggaagtcc ttttctatga agacttcttt ggccaaaatt 5160
aggctctaaa tgcaaggaga tagtgcatca tgcctggctg cacttactga taaatgatgt 5220
tatcaccatc tttaaccaaa tgcacaggaa caagttatgg tactgatgtg ctggattgag 5280
aaggagctct acttccttga caggacacat ttgtatcaac ttaaaaaagc agatttttgc 5340
cagcagaact attcattcag aggtaggaaa cttagaatag atgatgtcac tgattagcat 5400
ggcttcccca tctccacagc tgcttcccac ccaggttgcc cacagttgag tttgtccagt 5460
gctcagggct gcccactctc agtaagaagc cccacaccag cccctctcca aatatgttgg 5520
ctgttccttc cattaaagtg accccacttt agagcagcaa gtggatttct gtttcttaca 5580
gttcaggaag gaggagtcag ctgtgagaac ctggagcctg agatgcttct aagtcccact 5640
gctactgggg tcagggaagc cagactccag catcagcagt caggagcact aagcccttgc 5700
caacatcctg tttctcagag aaactgcttc cattataatg gttgtccttt tttaagctat 5760
caagccaaac aaccagtgtc taccattatt ctcatcacct gaagccaagg gttctagcaa 5820
aagtcaagct gtcttgtaat ggttgatgtg cctccagctt ctgtcttcag tcactccact 5880
cttagcctgc tctgaatcaa ctctgaccac agttccctgg agcccctgcc acctgctgcc 5940
cctgccacct tctccatctg cagtgctgtg cagccttctg cactcttgca gagctaatag 6000
gtggagactt gaaggaagag gaggaaagtt tctcataata gccttgctgc aagctcaaat 6060
gggaggtggg cactgtgccc aggagccttg gagcaaaggc tgtgcccaac ctctgactgc 6120
atccaggttt ggtcttgaca gagataagaa gccctggctt ttggagccaa aatctaggtc 6180
agacttaggc aggattctca aagtttatca gcagaacatg aggcagaaga ccctttctgc 6240
tccagcttct tcaggctcaa ccttcatcag aatagataga aagagaggct gtgagggttc 6300
ttaaaacaga agcaaatctg actcagagaa taaacaacct cctagtaaac tacagcttag 6360
acagagcatc tggtggtgag tgtgctcagt gtcctactca actgtctggt atcagccctc 6420
atgaggactt ctcttctttc cctcatagac ctccatctct gttttcctta gcctgcagaa 6480
atctggatgg ctattcacag aatgcctgtg ctttcagagt tgcatttttt ctctggtatt 6540
ctggttcaag catttgaagg taggaaaggt tctccaagtg caagaaagcc agccctgagc 6600
ctcaactgcc tggctagtgt ggtcagtagg atgcaaaggc tgttgaatgc cacaaggcca 6660
aactttaacc tgtgtaccac aagcctagca gcagaggcag ctctgctcac tggaactctc 6720
tgtcttcttt ctcctgagcc ttttcttttc ctgagttttc tagctctcct caaccttacc 6780
tctgccctac ccaggacaaa cccaagagcc actgtttctg tgatgtcctc tccagcccta 6840
attaggcatc atgacttcag cctgaccttc catgctcaga agcagtgcta atccacttca 6900
gatgagctgc tctatgcaac acaggcagag cctacaaacc tttgcaccag agccctccac 6960
atatcagtgt ttgttcatac tcacttcaac agcaaatgtg actgctgaga ttaagatttt 7020
acacaagatg gtctgtaatt tcacagttag ttttatccca ttaggtatga aagaattagc 7080
ataattcccc ttaaacatga atgaatctta gattttttaa taaatagttt tggaagtaaa 7140
gacagagaca tcaggagcac aaggaatagc ctgagaggac aaacagaaca agaaagagtc 7200
tggaaataca caggatgttc ttggcctcct caaagcaagt gcaagcagat agtaccagca 7260
gccccaggct atcagagccc agtgaagaga agtaccatga aagccacagc tctaaccacc 7320
ctgttccaga gtgacagaca gtccccaaga caagccagcc tgagccagag agagaactgc 7380
aagagaaagt ttctaattta ggttctgtta gattcagaca agtgcaggtc atcctctctc 7440
cacagctact cacctctcca gcctaacaaa gcctgcagtc cacactccaa ccctggtgtc 7500
tcacctccta gcctctccca acatcctgct ctctgaccat cttctgcatc tctcatctca 7560
ccatctccca ctgtctacag cctactcttg caactaccat ctcattttct gacatcctgt 7620
ctacatcttc tgccatactc tgccatctac cataccacct cttaccatct accacaccat 7680
cttttatctc catccctctc agaagcctcc aagctgaatc ctgctttatg tgttcatctc 7740
agcccctgca tggaaagctg accccagagg cagaactatt cccagagagc ttggccaaga 7800
aaaacaaaac taccagcctg gccaggctca ggagtagtaa gctgcagtgt ctgttgtgtt 7860
ctagcttcaa cagctgcagg agttccactc tcaaatgctc cacatttctc acatcctcct 7920
gattctggtc actacccatc ttcaaagaac agaatatctc acatcagcat actgtgaagg 7980
actagtcatg ggtgcagctg ctcagagctg caaagtcatt ctggatggtg gagagcttac 8040
aaacatttca tgatgctccc cccgctctga tggctggagc ccaatcccta cacagactcc 8100
tgctgtatgt gttttccttt cactctgagc cacagccaga gggcaggcat tcagtctcct 8160
cttcaggctg gggctggggc actgagaact cacccaacac cttgctctca ctccttctgc 8220
aaaacaagaa agagctttgt gctgcagtag ccatgaagaa tgaaaggaag gctttaacta 8280
aaaaatgtca gagattattt tcaacccctt actgtggatc accagcaagg aggaaacaca 8340
acacagagac attttttccc ctcaaattat caaaagaatc actgcatttg ttaaagagag 8400
caactgaatc aggaagcaga gttttgaaca tatcagaagt taggaatctg catcagagac 8460
aaatgcagtc atggttgttt gctgcatacc agccctaatc attagaagcc tcatggactt 8520
caaacatcat tccctctgac aagatgctct agcctaactc catgagataa aataaatctg 8580
cctttcagag ccaaagaaga gtccaccagc ttcttctcag tgtgaacaag agctccagtc 8640
aggttagtca gtccagtgca gtagaggaga ccagtctgca tcctctaatt ttcaaaggca 8700
agaagatttg tttaccctgg acaccaggca caagtgaggt cacagagctc ttagatatgc 8760
agtcctcatg agtgaggaga ctaaagcgca tgccatcaag acttcagtgt agagaaaacc 8820
tccaaaaaag cctcctcact acttctggaa tagctcagag gccgaggcgg cctcggcctc 8880
tgcataaata aaaaaaatta gtcagccatg gggcggagaa tgggcggaac tgggcggagt 8940
taggggcggg atgggcggag ttaggggcgg gactatggtt gctgactaat tgagatgcat 9000
gctttgcata cttctgcctg ctggggagcc tggggacttt ccacacctgg ttgctgacta 9060
attgagatgc atgctttgca tacttctgcc tgctggggag cctggggact ttccacaccc 9120
taactgacac acattccaca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 9180
ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 9240
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 9300
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 9360
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 9420
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 9480
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 9540
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 9600
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 9660
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 9720
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 9780
ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct 9840
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 9900
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 9960
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 10020
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 10080
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 10140
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 10200
gcctgactcc tgcaaaccac gttgtgtctc aaaatctctg atgttacatt gcacaagata 10260
aaaatatatc atcatgaaca ataaaactgt ctgcttacat aaacagtaat acaaggggtg 10320
ttatgagcca tattcaacgg gaaacgtctt gctcgaggcc gcgattaaat tccaacatgg 10380
atgctgattt atatgggtat aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa 10440
tctatcgatt gtatgggaag cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta 10500
gcgttgccaa tgatgttaca gatgagatgg tcagactaaa ctggctgacg gaatttatgc 10560
ctcttccgac catcaagcat tttatccgta ctcctgatga tgcatggtta ctcaccactg 10620
cgatccccgg gaaaacagca ttccaggtat tagaagaata tcctgattca ggtgaaaata 10680
ttgttgatgc gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc 10740
cttttaacag cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg aataacggtt 10800
tggttgatgc gagtgatttt gatgacgagc gtaatggctg gcctgttgaa caagtctgga 10860
aagaaatgca taagcttttg ccattctcac cggattcagt cgtcactcat ggtgatttct 10920
cacttgataa ccttattttt gacgagggga aattaatagg ttgtattgat gttggacgag 10980
tcggaatcgc agaccgatac caggatcttg ccatcctatg gaactgcctc ggtgagtttt 11040
ctccttcatt acagaaacgg ctttttcaaa aatatggtat tgataatcct gatatgaata 11100
aattgcagtt tcatttgatg ctcgatgagt ttttctaagg gcggcctgcc accataccca 11160
cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt 11220
cggcgatata ggcgccagca accgcacctg tggcgccggt gatgagggcg cgccaagtcg 11280
acgtccggca gtc 11293
<210> 7
<211> 10700
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 7
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140
cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200
gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260
agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320
gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1380
gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1440
ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1500
tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1560
accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1620
actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1680
ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1740
ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 1800
atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 1860
cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 1920
agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 1980
acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2040
gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2100
cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2160
ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2220
gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2280
gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2340
aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2400
acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2460
gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2520
tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2580
ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2640
atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2700
ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 2760
gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 2820
cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 2880
atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 2940
aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3000
tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3060
tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3120
taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3180
ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3240
gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3300
ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3360
gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3420
cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3480
cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3540
ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3600
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3660
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3720
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3780
tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 3840
gtgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 3900
tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 3960
tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4020
gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4080
atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4140
ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4200
ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4260
aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4320
tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4380
tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4440
tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4500
agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4560
caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4620
atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4680
gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4740
tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 4800
ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 4860
gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 4920
atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 4980
tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5040
tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5100
cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5160
aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5220
ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5280
ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5340
tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5400
ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5460
ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5520
tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5580
ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5640
tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5700
agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 5760
agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 5820
agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 5880
tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 5940
tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6000
cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6060
aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6120
aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6180
ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6240
agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6300
cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6360
cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6420
agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6480
aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6540
aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6600
aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6660
accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6720
aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 6780
gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 6840
ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 6900
tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 6960
catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7020
atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7080
acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7140
tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7200
gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7260
ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7320
tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7380
gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7440
agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7500
agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7560
gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7620
cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7680
ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7740
aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 7800
aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 7860
cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 7920
tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 7980
aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8040
tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8100
aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8160
gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8220
gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8280
cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8340
gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8400
gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8460
ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8520
cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8580
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8640
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8700
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8760
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8820
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8880
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8940
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9000
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9060
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9120
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9180
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9240
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9300
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9360
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9420
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9480
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9540
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9600
catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9660
caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9720
aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 9780
aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 9840
gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 9900
aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 9960
tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10020
accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10080
gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10140
aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10200
aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10260
gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10320
gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10380
ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10440
gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10500
atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10560
atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10620
gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10680
caagtcgacg tccggcagtc 10700
<210> 8
<211> 10700
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 8
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactatt agatctgatg gccgcgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140
cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200
gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260
agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320
gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1380
gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1440
ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1500
tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1560
accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1620
actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1680
ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1740
ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 1800
atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 1860
cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 1920
agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 1980
acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2040
gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2100
cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2160
ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2220
gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2280
gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2340
aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2400
acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2460
gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2520
tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2580
ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2640
atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2700
ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 2760
gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 2820
cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 2880
atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 2940
aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3000
tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3060
tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3120
taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3180
ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3240
gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3300
ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3360
gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3420
cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3480
cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3540
ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3600
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3660
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3720
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3780
tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 3840
gtgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 3900
tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 3960
tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4020
gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4080
atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4140
ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4200
ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4260
aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4320
tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4380
tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4440
tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4500
agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4560
caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4620
atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4680
gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4740
tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 4800
ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 4860
gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 4920
atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 4980
tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5040
tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5100
cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5160
aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5220
ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5280
ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5340
tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5400
ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5460
ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5520
tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5580
ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5640
tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5700
agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 5760
agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 5820
agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 5880
tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 5940
tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6000
cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6060
aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6120
aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6180
ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6240
agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6300
cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6360
cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6420
agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6480
aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6540
aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6600
aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6660
accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6720
aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 6780
gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 6840
ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 6900
tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 6960
catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7020
atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7080
acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7140
tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7200
gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7260
ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7320
tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7380
gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7440
agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7500
agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7560
gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7620
cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7680
ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7740
aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 7800
aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 7860
cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 7920
tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 7980
aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8040
tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8100
aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8160
gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8220
gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8280
cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8340
gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8400
gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8460
ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8520
cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8580
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8640
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8700
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8760
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8820
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8880
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8940
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9000
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9060
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9120
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9180
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9240
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9300
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9360
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9420
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9480
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9540
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9600
catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9660
caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9720
aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 9780
aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 9840
gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 9900
aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 9960
tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10020
accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10080
gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10140
aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10200
aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10260
gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10320
gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10380
ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10440
gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10500
atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10560
atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10620
gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10680
caagtcgacg tccggcagtc 10700
<210> 9
<211> 10700
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 9
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140
cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200
gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260
agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320
gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1380
gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1440
ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1500
tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1560
accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1620
actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1680
ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1740
ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 1800
atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 1860
cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 1920
agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 1980
acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2040
gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2100
cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2160
ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2220
gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2280
gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2340
aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2400
acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2460
gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2520
tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2580
ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2640
atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2700
ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 2760
gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 2820
cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 2880
atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 2940
aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3000
tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3060
tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3120
taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3180
ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3240
gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3300
ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3360
gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3420
cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3480
cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3540
ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3600
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3660
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3720
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3780
tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 3840
gtgaacatat tgactgaatt ccctgcaggt tggccactcc ctctctgcgc gctcgctcgc 3900
tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 3960
tgagcgagcg agcgcgcaga gagggagtgg ccaactccat cactaggggt tcctgcggcc 4020
gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4080
atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4140
ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4200
ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4260
aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4320
tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4380
tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4440
tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4500
agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4560
caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4620
atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4680
gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4740
tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 4800
ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 4860
gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 4920
atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 4980
tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5040
tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5100
cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5160
aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5220
ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5280
ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5340
tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5400
ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5460
ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5520
tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5580
ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5640
tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5700
agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 5760
agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 5820
agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 5880
tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 5940
tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6000
cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6060
aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6120
aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6180
ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6240
agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6300
cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6360
cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6420
agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6480
aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6540
aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6600
aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6660
accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6720
aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 6780
gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 6840
ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 6900
tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 6960
catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7020
atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7080
acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7140
tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7200
gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7260
ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7320
tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7380
gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7440
agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7500
agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7560
gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7620
cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7680
ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7740
aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 7800
aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 7860
cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 7920
tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 7980
aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8040
tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8100
aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8160
gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8220
gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8280
cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8340
gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8400
gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8460
ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8520
cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8580
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8640
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8700
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8760
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8820
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8880
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8940
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9000
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9060
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9120
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9180
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9240
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9300
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9360
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9420
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9480
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9540
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9600
catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9660
caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9720
aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 9780
aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 9840
gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 9900
aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 9960
tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10020
accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10080
gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10140
aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10200
aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10260
gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10320
gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10380
ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10440
gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10500
atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10560
atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10620
gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10680
caagtcgacg tccggcagtc 10700
<210> 10
<211> 10700
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 10
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 360
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 420
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 480
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 540
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 600
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 660
ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 720
ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 780
ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 840
gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 900
ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgacgc 960
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 1020
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 1080
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1140
cgggagctag agcctctgct aaccatgttc atgccttctt ctttttccta cagctcctgg 1200
gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcctc gaagatccga 1260
agggaaagtc ttccacgact gtgggatccg ttcgaagata tcaccggttg agccaccatg 1320
gaattcagca gccccagcag agaggaatgc cccaagcctc tgagccgggt gtcaatcatg 1380
gccggatctc tgacaggact gctgctgctt caggccgtgt cttgggcttc tggcgctaga 1440
ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt gcgtgtgcaa tgccacctac 1500
tgcgacagct tcgaccctcc tacctttcct gctctgggca ccttcagcag atacgagagc 1560
accagatccg gcagacggat ggaactgagc atgggaccca tccaggccaa tcacacaggc 1620
actggcctgc tgctgacact gcagcctgag cagaaattcc agaaagtgaa aggcttcggc 1680
ggagccatga cagatgccgc cgctctgaat atcctggctc tgtctccacc agctcagaac 1740
ctgctgctca agagctactt cagcgaggaa ggcatcggct acaacatcat cagagtgccc 1800
atggccagct gcgacttcag catcaggacc tacacctacg ccgacacacc cgacgatttc 1860
cagctgcaca acttcagcct gcctgaagag gacaccaagc tgaagatccc tctgatccac 1920
agagccctgc agctggcaca aagacccgtg tcactgctgg cctctccatg gacatctccc 1980
acctggctga aaacaaatgg cgccgtgaat ggcaagggca gcctgaaagg ccaacctggc 2040
gacatctacc accagacctg ggccagatac ttcgtgaagt tcctggacgc ctatgccgag 2100
cacaagctgc agttttgggc cgtgacagcc gagaacgaac cttctgctgg actgctgagc 2160
ggctacccct ttcagtgcct gggctttaca cccgagcacc agcgggactt tatcgcccgt 2220
gatctgggac ccacactggc caatagcacc caccataatg tgcggctgct gatgctggac 2280
gaccagagac tgcttctgcc ccactgggct aaagtggtgc tgacagatcc tgaggccgcc 2340
aaatacgtgc acggaatcgc cgtgcactgg tatctggact ttctggcccc tgccaaggcc 2400
acactgggag agacacacag actgttcccc aacaccatgc tgttcgccag cgaagcctgt 2460
gtgggcagca agttttggga acagagcgtg cggctcggca gctgggatag aggcatgcag 2520
tacagccaca gcatcatcac caacctgctg taccacgtcg tcggctggac cgactggaat 2580
ctggccctga atcctgaagg cggccctaac tgggtccgaa acttcgtgga cagccccatc 2640
atcgtggaca tcaccaagga caccttctac aagcagccca tgttctacca cctgggacac 2700
ttcagcaagt tcatccccga gggctctcag cgcgttggac tggtggcttc ccagaagaac 2760
gatctggacg ccgtggctct gatgcaccct gatggatctg ctgtggtggt ggtcctgaac 2820
cgcagcagca aagatgtgcc cctgaccatc aaggatcccg ccgtgggatt cctggaaaca 2880
atcagccctg gctactccat ccacacctac ctgtggcgta gacagtgaca attgttaatt 2940
aagtttaaac cctcgaggcc gcaagcttat cgataatcaa cctctggatt acaaaatttg 3000
tgaaagattg actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc 3060
tttaatgcct ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta 3120
taaatcctgg ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt 3180
ggtgtgcact gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca 3240
gctcctttcc gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc 3300
ctgccttgcc cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt 3360
gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt gttgccacct ggattctgcg 3420
cgggacgtcc ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg 3480
cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat 3540
ctccctttgg gccgcctccc cgcatcgata ccgtcgacta gagctcgctg atcagcctcg 3600
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3660
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3720
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3780
tgggaagaca atagcaggca tgctggggag agatccacga taacaaacag cttttttggg 3840
gtgaacatat tgactgaatt ccctgcagga ggaaccccta gtgatggagt tggccactcc 3900
ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 3960
ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaagcggcc 4020
gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc aacctcattc taaaatgtat 4080
atagaagccc aaaagacaat aacaaaaata ttcttgtaga acaaaatggg aaagaatgtt 4140
ccactaaata tcaagattta gagcaaagca tgagatgtgt ggggatagac agtgaggctg 4200
ataaaataga gtagagctca gaaacagacc cattgatata tgtaagtgac ctatgaaaaa 4260
aatatggcat tttacaatgg gaaaatgatg gtctttttct tttttagaaa aacagggaaa 4320
tatatttata tgtaaaaaat aaaagggaac ccatatgtca taccatacac acaaaaaaat 4380
tccagtgaat tataagtcta aatggagaag gcaaaacttt aaatctttta gaaaataata 4440
tagaagcatg cagaccagcc tggccaacat gatgaaaccc tctctactaa taataaaatc 4500
agtagaacta ctcaggacta ctttgagtgg gaagtccttt tctatgaaga cttctttggc 4560
caaaattagg ctctaaatgc aaggagatag tgcatcatgc ctggctgcac ttactgataa 4620
atgatgttat caccatcttt aaccaaatgc acaggaacaa gttatggtac tgatgtgctg 4680
gattgagaag gagctctact tccttgacag gacacatttg tatcaactta aaaaagcaga 4740
tttttgccag cagaactatt cattcagagg taggaaactt agaatagatg atgtcactga 4800
ttagcatggc ttccccatct ccacagctgc ttcccaccca ggttgcccac agttgagttt 4860
gtccagtgct cagggctgcc cactctcagt aagaagcccc acaccagccc ctctccaaat 4920
atgttggctg ttccttccat taaagtgacc ccactttaga gcagcaagtg gatttctgtt 4980
tcttacagtt caggaaggag gagtcagctg tgagaacctg gagcctgaga tgcttctaag 5040
tcccactgct actggggtca gggaagccag actccagcat cagcagtcag gagcactaag 5100
cccttgccaa catcctgttt ctcagagaaa ctgcttccat tataatggtt gtcctttttt 5160
aagctatcaa gccaaacaac cagtgtctac cattattctc atcacctgaa gccaagggtt 5220
ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct ccagcttctg tcttcagtca 5280
ctccactctt agcctgctct gaatcaactc tgaccacagt tccctggagc ccctgccacc 5340
tgctgcccct gccaccttct ccatctgcag tgctgtgcag ccttctgcac tcttgcagag 5400
ctaataggtg gagacttgaa ggaagaggag gaaagtttct cataatagcc ttgctgcaag 5460
ctcaaatggg aggtgggcac tgtgcccagg agccttggag caaaggctgt gcccaacctc 5520
tgactgcatc caggtttggt cttgacagag ataagaagcc ctggcttttg gagccaaaat 5580
ctaggtcaga cttaggcagg attctcaaag tttatcagca gaacatgagg cagaagaccc 5640
tttctgctcc agcttcttca ggctcaacct tcatcagaat agatagaaag agaggctgtg 5700
agggttctta aaacagaagc aaatctgact cagagaataa acaacctcct agtaaactac 5760
agcttagaca gagcatctgg tggtgagtgt gctcagtgtc ctactcaact gtctggtatc 5820
agccctcatg aggacttctc ttctttccct catagacctc catctctgtt ttccttagcc 5880
tgcagaaatc tggatggcta ttcacagaat gcctgtgctt tcagagttgc attttttctc 5940
tggtattctg gttcaagcat ttgaaggtag gaaaggttct ccaagtgcaa gaaagccagc 6000
cctgagcctc aactgcctgg ctagtgtggt cagtaggatg caaaggctgt tgaatgccac 6060
aaggccaaac tttaacctgt gtaccacaag cctagcagca gaggcagctc tgctcactgg 6120
aactctctgt cttctttctc ctgagccttt tcttttcctg agttttctag ctctcctcaa 6180
ccttacctct gccctaccca ggacaaaccc aagagccact gtttctgtga tgtcctctcc 6240
agccctaatt aggcatcatg acttcagcct gaccttccat gctcagaagc agtgctaatc 6300
cacttcagat gagctgctct atgcaacaca ggcagagcct acaaaccttt gcaccagagc 6360
cctccacata tcagtgtttg ttcatactca cttcaacagc aaatgtgact gctgagatta 6420
agattttaca caagatggtc tgtaatttca cagttagttt tatcccatta ggtatgaaag 6480
aattagcata attcccctta aacatgaatg aatcttagat tttttaataa atagttttgg 6540
aagtaaagac agagacatca ggagcacaag gaatagcctg agaggacaaa cagaacaaga 6600
aagagtctgg aaatacacag gatgttcttg gcctcctcaa agcaagtgca agcagatagt 6660
accagcagcc ccaggctatc agagcccagt gaagagaagt accatgaaag ccacagctct 6720
aaccaccctg ttccagagtg acagacagtc cccaagacaa gccagcctga gccagagaga 6780
gaactgcaag agaaagtttc taatttaggt tctgttagat tcagacaagt gcaggtcatc 6840
ctctctccac agctactcac ctctccagcc taacaaagcc tgcagtccac actccaaccc 6900
tggtgtctca cctcctagcc tctcccaaca tcctgctctc tgaccatctt ctgcatctct 6960
catctcacca tctcccactg tctacagcct actcttgcaa ctaccatctc attttctgac 7020
atcctgtcta catcttctgc catactctgc catctaccat accacctctt accatctacc 7080
acaccatctt ttatctccat ccctctcaga agcctccaag ctgaatcctg ctttatgtgt 7140
tcatctcagc ccctgcatgg aaagctgacc ccagaggcag aactattccc agagagcttg 7200
gccaagaaaa acaaaactac cagcctggcc aggctcagga gtagtaagct gcagtgtctg 7260
ttgtgttcta gcttcaacag ctgcaggagt tccactctca aatgctccac atttctcaca 7320
tcctcctgat tctggtcact acccatcttc aaagaacaga atatctcaca tcagcatact 7380
gtgaaggact agtcatgggt gcagctgctc agagctgcaa agtcattctg gatggtggag 7440
agcttacaaa catttcatga tgctcccccc gctctgatgg ctggagccca atccctacac 7500
agactcctgc tgtatgtgtt ttcctttcac tctgagccac agccagaggg caggcattca 7560
gtctcctctt caggctgggg ctggggcact gagaactcac ccaacacctt gctctcactc 7620
cttctgcaaa acaagaaaga gctttgtgct gcagtagcca tgaagaatga aaggaaggct 7680
ttaactaaaa aatgtcagag attattttca accccttact gtggatcacc agcaaggagg 7740
aaacacaaca cagagacatt ttttcccctc aaattatcaa aagaatcact gcatttgtta 7800
aagagagcaa ctgaatcagg aagcagagtt ttgaacatat cagaagttag gaatctgcat 7860
cagagacaaa tgcagtcatg gttgtttgct gcataccagc cctaatcatt agaagcctca 7920
tggacttcaa acatcattcc ctctgacaag atgctctagc ctaactccat gagataaaat 7980
aaatctgcct ttcagagcca aagaagagtc caccagcttc ttctcagtgt gaacaagagc 8040
tccagtcagg ttagtcagtc cagtgcagta gaggagacca gtctgcatcc tctaattttc 8100
aaaggcaaga agatttgttt accctggaca ccaggcacaa gtgaggtcac agagctctta 8160
gatatgcagt cctcatgagt gaggagacta aagcgcatgc catcaagact tcagtgtaga 8220
gaaaacctcc aaaaaagcct cctcactact tctggaatag ctcagaggcc gaggcggcct 8280
cggcctctgc ataaataaaa aaaattagtc agccatgggg cggagaatgg gcggaactgg 8340
gcggagttag gggcgggatg ggcggagtta ggggcgggac tatggttgct gactaattga 8400
gatgcatgct ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg 8460
ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc 8520
cacaccctaa ctgacacaca ttccacagct gcattaatga atcggccaac gcgcggggag 8580
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 8640
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 8700
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 8760
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 8820
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 8880
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 8940
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 9000
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 9060
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 9120
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 9180
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 9240
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 9300
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 9360
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 9420
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 9480
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 9540
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 9600
catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa atctctgatg ttacattgca 9660
caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca 9720
aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 9780
aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 9840
gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 9900
aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa 9960
tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 10020
accactgcga tccccgggaa aacagcattc caggtattag aagaatatcc tgattcaggt 10080
gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 10140
aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 10200
aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 10260
gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 10320
gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 10380
ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 10440
gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 10500
atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaagggcg gcctgccacc 10560
atacccacgc cgaaacaagc gctcatgagc ccgaagtggc gagcccgatc ttccccatcg 10620
gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gagggcgcgc 10680
caagtcgacg tccggcagtc 10700
<210> 11
<211> 11188
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 11
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactatt agatctgatg gccgcgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
gtggtgactg agatgttttc taggaaacac aaaagataca aaaaagaaca cgtggaagga 300
tagccaaaaa ggggggctgc ccccatttcc tgcaccccgc tgcgatggct ggcaccattt 360
ggaagacttc gagatacact gttgagcgca gtaagacaac agtgtatctc gaagtcttcc 420
agatggggcc agccggtcca ctctgtatcc aggccagttc tgcaaggcgt tcgaggacca 480
cccccctccc ctcgccacca gggtggtctc atacagaact tataagattc ccaaatccaa 540
agacatttca cgtttatggt gatttcccag aacacatagc gacatgcaaa tattgcaggg 600
cgccactccc ctgtccctca cagccatctt cctgccaggg cgcacgcgcg ctgggtgttc 660
ccgcctagtg acactgggcc cgcgattcct tggagcgggt tgatgacgtc agcgtttccc 720
atggtgaatc cctaggttct agaaccggtg acgtctccca tggtgaagct tggatctgaa 780
ttcggtacct agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat 840
ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 900
ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 960
ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 1020
tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 1080
tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat 1140
cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca tctccccccc 1200
ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag cgatgggggc 1260
gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc 1320
gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat 1380
ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cgggagtcgc 1440
tgcgacgctg ccttcgcccc gtgccccgct ccgccgccgc ctcgcgccgc ccgccccggc 1500
tctgactgac cgcgttactc ccacaggtga gcgggcggga cggcccttct cctccgggct 1560
gtaattagcg cttggtttaa tgacggcttg tttcttttct gtggctgcgt gaaagccttg 1620
aggggctccg ggagctagag cctctgctaa ccatgttcat gccttcttct ttttcctaca 1680
gctcctgggc aacgtgctgg ttattgtgct gtctcatcat tttggcaaag aattcctcga 1740
agatccgaag ggaaagtctt ccacgactgt gggatccgtt cgaagatatc accggttgag 1800
ccaccatgga attcagcagc cccagcagag aggaatgccc caagcctctg agccgggtgt 1860
caatcatggc cggatctctg acaggactgc tgctgcttca ggccgtgtct tgggcttctg 1920
gcgctagacc ttgcatcccc aagagcttcg gctacagcag cgtcgtgtgc gtgtgcaatg 1980
ccacctactg cgacagcttc gaccctccta cctttcctgc tctgggcacc ttcagcagat 2040
acgagagcac cagatccggc agacggatgg aactgagcat gggacccatc caggccaatc 2100
acacaggcac tggcctgctg ctgacactgc agcctgagca gaaattccag aaagtgaaag 2160
gcttcggcgg agccatgaca gatgccgccg ctctgaatat cctggctctg tctccaccag 2220
ctcagaacct gctgctcaag agctacttca gcgaggaagg catcggctac aacatcatca 2280
gagtgcccat ggccagctgc gacttcagca tcaggaccta cacctacgcc gacacacccg 2340
acgatttcca gctgcacaac ttcagcctgc ctgaagagga caccaagctg aagatccctc 2400
tgatccacag agccctgcag ctggcacaaa gacccgtgtc actgctggcc tctccatgga 2460
catctcccac ctggctgaaa acaaatggcg ccgtgaatgg caagggcagc ctgaaaggcc 2520
aacctggcga catctaccac cagacctggg ccagatactt cgtgaagttc ctggacgcct 2580
atgccgagca caagctgcag ttttgggccg tgacagccga gaacgaacct tctgctggac 2640
tgctgagcgg ctaccccttt cagtgcctgg gctttacacc cgagcaccag cgggacttta 2700
tcgcccgtga tctgggaccc acactggcca atagcaccca ccataatgtg cggctgctga 2760
tgctggacga ccagagactg cttctgcccc actgggctaa agtggtgctg acagatcctg 2820
aggccgccaa atacgtgcac ggaatcgccg tgcactggta tctggacttt ctggcccctg 2880
ccaaggccac actgggagag acacacagac tgttccccaa caccatgctg ttcgccagcg 2940
aagcctgtgt gggcagcaag ttttgggaac agagcgtgcg gctcggcagc tgggatagag 3000
gcatgcagta cagccacagc atcatcacca acctgctgta ccacgtcgtc ggctggaccg 3060
actggaatct ggccctgaat cctgaaggcg gccctaactg ggtccgaaac ttcgtggaca 3120
gccccatcat cgtggacatc accaaggaca ccttctacaa gcagcccatg ttctaccacc 3180
tgggacactt cagcaagttc atccccgagg gctctcagcg cgttggactg gtggcttccc 3240
agaagaacga tctggacgcc gtggctctga tgcaccctga tggatctgct gtggtggtgg 3300
tcctgaaccg cagcagcaaa gatgtgcccc tgaccatcaa ggatcccgcc gtgggattcc 3360
tggaaacaat cagccctggc tactccatcc acacctacct gtggcgtaga cagtgacaat 3420
tgttaattaa gtttaaaccc tcgaggccgc aagcttatcg ataatcaacc tctggattac 3480
aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 3540
tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 3600
tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa 3660
cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc 3720
acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc 3780
atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc 3840
gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg 3900
attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct 3960
tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg 4020
agtcggatct ccctttgggc cgcctccccg catcgatacc gtcgactaga gctcgctgat 4080
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 4140
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 4200
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 4260
gggaggattg ggaagacaat agcaggcatg ctggggagag atccacgata acaaacagct 4320
tttttggggt gaacatattg actgaattcc ctgcaggttg gccactccct ctctgcgcgc 4380
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 4440
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 4500
ctgcggccgc tcgtacggtc tcgaggaatt cctgcaggat aacttgccaa cctcattcta 4560
aaatgtatat agaagcccaa aagacaataa caaaaatatt cttgtagaac aaaatgggaa 4620
agaatgttcc actaaatatc aagatttaga gcaaagcatg agatgtgtgg ggatagacag 4680
tgaggctgat aaaatagagt agagctcaga aacagaccca ttgatatatg taagtgacct 4740
atgaaaaaaa tatggcattt tacaatggga aaatgatggt ctttttcttt tttagaaaaa 4800
cagggaaata tatttatatg taaaaaataa aagggaaccc atatgtcata ccatacacac 4860
aaaaaaattc cagtgaatta taagtctaaa tggagaaggc aaaactttaa atcttttaga 4920
aaataatata gaagcatgca gaccagcctg gccaacatga tgaaaccctc tctactaata 4980
ataaaatcag tagaactact caggactact ttgagtggga agtccttttc tatgaagact 5040
tctttggcca aaattaggct ctaaatgcaa ggagatagtg catcatgcct ggctgcactt 5100
actgataaat gatgttatca ccatctttaa ccaaatgcac aggaacaagt tatggtactg 5160
atgtgctgga ttgagaagga gctctacttc cttgacagga cacatttgta tcaacttaaa 5220
aaagcagatt tttgccagca gaactattca ttcagaggta ggaaacttag aatagatgat 5280
gtcactgatt agcatggctt ccccatctcc acagctgctt cccacccagg ttgcccacag 5340
ttgagtttgt ccagtgctca gggctgccca ctctcagtaa gaagccccac accagcccct 5400
ctccaaatat gttggctgtt ccttccatta aagtgacccc actttagagc agcaagtgga 5460
tttctgtttc ttacagttca ggaaggagga gtcagctgtg agaacctgga gcctgagatg 5520
cttctaagtc ccactgctac tggggtcagg gaagccagac tccagcatca gcagtcagga 5580
gcactaagcc cttgccaaca tcctgtttct cagagaaact gcttccatta taatggttgt 5640
ccttttttaa gctatcaagc caaacaacca gtgtctacca ttattctcat cacctgaagc 5700
caagggttct agcaaaagtc aagctgtctt gtaatggttg atgtgcctcc agcttctgtc 5760
ttcagtcact ccactcttag cctgctctga atcaactctg accacagttc cctggagccc 5820
ctgccacctg ctgcccctgc caccttctcc atctgcagtg ctgtgcagcc ttctgcactc 5880
ttgcagagct aataggtgga gacttgaagg aagaggagga aagtttctca taatagcctt 5940
gctgcaagct caaatgggag gtgggcactg tgcccaggag ccttggagca aaggctgtgc 6000
ccaacctctg actgcatcca ggtttggtct tgacagagat aagaagccct ggcttttgga 6060
gccaaaatct aggtcagact taggcaggat tctcaaagtt tatcagcaga acatgaggca 6120
gaagaccctt tctgctccag cttcttcagg ctcaaccttc atcagaatag atagaaagag 6180
aggctgtgag ggttcttaaa acagaagcaa atctgactca gagaataaac aacctcctag 6240
taaactacag cttagacaga gcatctggtg gtgagtgtgc tcagtgtcct actcaactgt 6300
ctggtatcag ccctcatgag gacttctctt ctttccctca tagacctcca tctctgtttt 6360
ccttagcctg cagaaatctg gatggctatt cacagaatgc ctgtgctttc agagttgcat 6420
tttttctctg gtattctggt tcaagcattt gaaggtagga aaggttctcc aagtgcaaga 6480
aagccagccc tgagcctcaa ctgcctggct agtgtggtca gtaggatgca aaggctgttg 6540
aatgccacaa ggccaaactt taacctgtgt accacaagcc tagcagcaga ggcagctctg 6600
ctcactggaa ctctctgtct tctttctcct gagccttttc ttttcctgag ttttctagct 6660
ctcctcaacc ttacctctgc cctacccagg acaaacccaa gagccactgt ttctgtgatg 6720
tcctctccag ccctaattag gcatcatgac ttcagcctga ccttccatgc tcagaagcag 6780
tgctaatcca cttcagatga gctgctctat gcaacacagg cagagcctac aaacctttgc 6840
accagagccc tccacatatc agtgtttgtt catactcact tcaacagcaa atgtgactgc 6900
tgagattaag attttacaca agatggtctg taatttcaca gttagtttta tcccattagg 6960
tatgaaagaa ttagcataat tccccttaaa catgaatgaa tcttagattt tttaataaat 7020
agttttggaa gtaaagacag agacatcagg agcacaagga atagcctgag aggacaaaca 7080
gaacaagaaa gagtctggaa atacacagga tgttcttggc ctcctcaaag caagtgcaag 7140
cagatagtac cagcagcccc aggctatcag agcccagtga agagaagtac catgaaagcc 7200
acagctctaa ccaccctgtt ccagagtgac agacagtccc caagacaagc cagcctgagc 7260
cagagagaga actgcaagag aaagtttcta atttaggttc tgttagattc agacaagtgc 7320
aggtcatcct ctctccacag ctactcacct ctccagccta acaaagcctg cagtccacac 7380
tccaaccctg gtgtctcacc tcctagcctc tcccaacatc ctgctctctg accatcttct 7440
gcatctctca tctcaccatc tcccactgtc tacagcctac tcttgcaact accatctcat 7500
tttctgacat cctgtctaca tcttctgcca tactctgcca tctaccatac cacctcttac 7560
catctaccac accatctttt atctccatcc ctctcagaag cctccaagct gaatcctgct 7620
ttatgtgttc atctcagccc ctgcatggaa agctgacccc agaggcagaa ctattcccag 7680
agagcttggc caagaaaaac aaaactacca gcctggccag gctcaggagt agtaagctgc 7740
agtgtctgtt gtgttctagc ttcaacagct gcaggagttc cactctcaaa tgctccacat 7800
ttctcacatc ctcctgattc tggtcactac ccatcttcaa agaacagaat atctcacatc 7860
agcatactgt gaaggactag tcatgggtgc agctgctcag agctgcaaag tcattctgga 7920
tggtggagag cttacaaaca tttcatgatg ctccccccgc tctgatggct ggagcccaat 7980
ccctacacag actcctgctg tatgtgtttt cctttcactc tgagccacag ccagagggca 8040
ggcattcagt ctcctcttca ggctggggct ggggcactga gaactcaccc aacaccttgc 8100
tctcactcct tctgcaaaac aagaaagagc tttgtgctgc agtagccatg aagaatgaaa 8160
ggaaggcttt aactaaaaaa tgtcagagat tattttcaac cccttactgt ggatcaccag 8220
caaggaggaa acacaacaca gagacatttt ttcccctcaa attatcaaaa gaatcactgc 8280
atttgttaaa gagagcaact gaatcaggaa gcagagtttt gaacatatca gaagttagga 8340
atctgcatca gagacaaatg cagtcatggt tgtttgctgc ataccagccc taatcattag 8400
aagcctcatg gacttcaaac atcattccct ctgacaagat gctctagcct aactccatga 8460
gataaaataa atctgccttt cagagccaaa gaagagtcca ccagcttctt ctcagtgtga 8520
acaagagctc cagtcaggtt agtcagtcca gtgcagtaga ggagaccagt ctgcatcctc 8580
taattttcaa aggcaagaag atttgtttac cctggacacc aggcacaagt gaggtcacag 8640
agctcttaga tatgcagtcc tcatgagtga ggagactaaa gcgcatgcca tcaagacttc 8700
agtgtagaga aaacctccaa aaaagcctcc tcactacttc tggaatagct cagaggccga 8760
ggcggcctcg gcctctgcat aaataaaaaa aattagtcag ccatggggcg gagaatgggc 8820
ggaactgggc ggagttaggg gcgggatggg cggagttagg ggcgggacta tggttgctga 8880
ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg actttccaca 8940
cctggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg gggagcctgg 9000
ggactttcca caccctaact gacacacatt ccacagctgc attaatgaat cggccaacgc 9060
gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 9120
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 9180
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 9240
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 9300
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 9360
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 9420
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 9480
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 9540
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 9600
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 9660
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 9720
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 9780
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 9840
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 9900
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 9960
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 10020
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 10080
cgttcatcca tagttgcctg actcctgcaa accacgttgt gtctcaaaat ctctgatgtt 10140
acattgcaca agataaaaat atatcatcat gaacaataaa actgtctgct tacataaaca 10200
gtaatacaag gggtgttatg agccatattc aacgggaaac gtcttgctcg aggccgcgat 10260
taaattccaa catggatgct gatttatatg ggtataaatg ggctcgcgat aatgtcgggc 10320
aatcaggtgc gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga 10380
aacatggcaa aggtagcgtt gccaatgatg ttacagatga gatggtcaga ctaaactggc 10440
tgacggaatt tatgcctctt ccgaccatca agcattttat ccgtactcct gatgatgcat 10500
ggttactcac cactgcgatc cccgggaaaa cagcattcca ggtattagaa gaatatcctg 10560
attcaggtga aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc 10620
ctgtttgtaa ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac 10680
gaatgaataa cggtttggtt gatgcgagtg attttgatga cgagcgtaat ggctggcctg 10740
ttgaacaagt ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca 10800
ctcatggtga tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta 10860
ttgatgttgg acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact 10920
gcctcggtga gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata 10980
atcctgatat gaataaattg cagtttcatt tgatgctcga tgagtttttc taagggcggc 11040
ctgccaccat acccacgccg aaacaagcgc tcatgagccc gaagtggcga gcccgatctt 11100
ccccatcggt gatgtcggcg atataggcgc cagcaaccgc acctgtggcg ccggtgatga 11160
gggcgcgcca agtcgacgtc cggcagtc 11188
<210> 12
<211> 11187
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 12
ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac ctagttataa 60
tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 120
cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 180
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 240
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 300
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 360
tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtcgag 420
gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg 480
tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg gggggggcgc 540
gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg 600
gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg 660
cggccctata aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc 720
cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga ccgcgttact 780
cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc gcttggttta 840
atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc gggagctaga 900
gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg caacgtgctg 960
gttattgtgc tgtctcatca ttttggcaaa gaattcctcg aagatccgaa gggaaagtct 1020
tccacgactg tgggatccgt tcgaagatat caccggttga gccaccatgg aattcagcag 1080
ccccagcaga gaggaatgcc ccaagcctct gagccgggtg tcaatcatgg ccggatctct 1140
gacaggactg ctgctgcttc aggccgtgtc ttgggcttct ggcgctagac cttgcatccc 1200
caagagcttc ggctacagca gcgtcgtgtg cgtgtgcaat gccacctact gcgacagctt 1260
cgaccctcct acctttcctg ctctgggcac cttcagcaga tacgagagca ccagatccgg 1320
cagacggatg gaactgagca tgggacccat ccaggccaat cacacaggca ctggcctgct 1380
gctgacactg cagcctgagc agaaattcca gaaagtgaaa ggcttcggcg gagccatgac 1440
agatgccgcc gctctgaata tcctggctct gtctccacca gctcagaacc tgctgctcaa 1500
gagctacttc agcgaggaag gcatcggcta caacatcatc agagtgccca tggccagctg 1560
cgacttcagc atcaggacct acacctacgc cgacacaccc gacgatttcc agctgcacaa 1620
cttcagcctg cctgaagagg acaccaagct gaagatccct ctgatccaca gagccctgca 1680
gctggcacaa agacccgtgt cactgctggc ctctccatgg acatctccca cctggctgaa 1740
aacaaatggc gccgtgaatg gcaagggcag cctgaaaggc caacctggcg acatctacca 1800
ccagacctgg gccagatact tcgtgaagtt cctggacgcc tatgccgagc acaagctgca 1860
gttttgggcc gtgacagccg agaacgaacc ttctgctgga ctgctgagcg gctacccctt 1920
tcagtgcctg ggctttacac ccgagcacca gcgggacttt atcgcccgtg atctgggacc 1980
cacactggcc aatagcaccc accataatgt gcggctgctg atgctggacg accagagact 2040
gcttctgccc cactgggcta aagtggtgct gacagatcct gaggccgcca aatacgtgca 2100
cggaatcgcc gtgcactggt atctggactt tctggcccct gccaaggcca cactgggaga 2160
gacacacaga ctgttcccca acaccatgct gttcgccagc gaagcctgtg tgggcagcaa 2220
gttttgggaa cagagcgtgc ggctcggcag ctgggataga ggcatgcagt acagccacag 2280
catcatcacc aacctgctgt accacgtcgt cggctggacc gactggaatc tggccctgaa 2340
tcctgaaggc ggccctaact gggtccgaaa cttcgtggac agccccatca tcgtggacat 2400
caccaaggac accttctaca agcagcccat gttctaccac ctgggacact tcagcaagtt 2460
catccccgag ggctctcagc gcgttggact ggtggcttcc cagaagaacg atctggacgc 2520
cgtggctctg atgcaccctg atggatctgc tgtggtggtg gtcctgaacc gcagcagcaa 2580
agatgtgccc ctgaccatca aggatcccgc cgtgggattc ctggaaacaa tcagccctgg 2640
ctactccatc cacacctacc tgtggcgtag acagtgacaa ttgttaatta agtttaaacc 2700
ctcgaggccg caagcttatc gataatcaac ctctggatta caaaatttgt gaaagattga 2760
ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 2820
tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 2880
tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg 2940
tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg 3000
ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc 3060
gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat 3120
catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct 3180
tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg 3240
ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg 3300
ccgcctcccc gcatcgatac cgtcgactag agctcgctga tcagcctcga ctgtgccttc 3360
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 3420
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 3480
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 3540
tagcaggcat gctggggaga gatccacgat aacaaacagc ttttttgggg tgaacatatt 3600
gactgaattc cctgcaggtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 3660
gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt gagcgagcga 3720
gcgcgcagag agggagtggc caactccatc actaggggtt cctgcggccg ctcgtacggt 3780
ctcgaggaat tcctgcagga taacttgcca acctcattct aaaatgtata tagaagccca 3840
aaagacaata acaaaaatat tcttgtagaa caaaatggga aagaatgttc cactaaatat 3900
caagatttag agcaaagcat gagatgtgtg gggatagaca gtgaggctga taaaatagag 3960
tagagctcag aaacagaccc attgatatat gtaagtgacc tatgaaaaaa atatggcatt 4020
ttacaatggg aaaatgatgg tctttttctt ttttagaaaa acagggaaat atatttatat 4080
gtaaaaaata aaagggaacc catatgtcat accatacaca caaaaaaatt ccagtgaatt 4140
ataagtctaa atggagaagg caaaacttta aatcttttag aaaataatat agaagcatgc 4200
agaccagcct ggccaacatg atgaaaccct ctctactaat aataaaatca gtagaactac 4260
tcaggactac tttgagtggg aagtcctttt ctatgaagac ttctttggcc aaaattaggc 4320
tctaaatgca aggagatagt gcatcatgcc tggctgcact tactgataaa tgatgttatc 4380
accatcttta accaaatgca caggaacaag ttatggtact gatgtgctgg attgagaagg 4440
agctctactt ccttgacagg acacatttgt atcaacttaa aaaagcagat ttttgccagc 4500
agaactattc attcagaggt aggaaactta gaatagatga tgtcactgat tagcatggct 4560
tccccatctc cacagctgct tcccacccag gttgcccaca gttgagtttg tccagtgctc 4620
agggctgccc actctcagta agaagcccca caccagcccc tctccaaata tgttggctgt 4680
tccttccatt aaagtgaccc cactttagag cagcaagtgg atttctgttt cttacagttc 4740
aggaaggagg agtcagctgt gagaacctgg agcctgagat gcttctaagt cccactgcta 4800
ctggggtcag ggaagccaga ctccagcatc agcagtcagg agcactaagc ccttgccaac 4860
atcctgtttc tcagagaaac tgcttccatt ataatggttg tcctttttta agctatcaag 4920
ccaaacaacc agtgtctacc attattctca tcacctgaag ccaagggttc tagcaaaagt 4980
caagctgtct tgtaatggtt gatgtgcctc cagcttctgt cttcagtcac tccactctta 5040
gcctgctctg aatcaactct gaccacagtt ccctggagcc cctgccacct gctgcccctg 5100
ccaccttctc catctgcagt gctgtgcagc cttctgcact cttgcagagc taataggtgg 5160
agacttgaag gaagaggagg aaagtttctc ataatagcct tgctgcaagc tcaaatggga 5220
ggtgggcact gtgcccagga gccttggagc aaaggctgtg cccaacctct gactgcatcc 5280
aggtttggtc ttgacagaga taagaagccc tggcttttgg agccaaaatc taggtcagac 5340
ttaggcagga ttctcaaagt ttatcagcag aacatgaggc agaagaccct ttctgctcca 5400
gcttcttcag gctcaacctt catcagaata gatagaaaga gaggctgtga gggttcttaa 5460
aacagaagca aatctgactc agagaataaa caacctccta gtaaactaca gcttagacag 5520
agcatctggt ggtgagtgtg ctcagtgtcc tactcaactg tctggtatca gccctcatga 5580
ggacttctct tctttccctc atagacctcc atctctgttt tccttagcct gcagaaatct 5640
ggatggctat tcacagaatg cctgtgcttt cagagttgca ttttttctct ggtattctgg 5700
ttcaagcatt tgaaggtagg aaaggttctc caagtgcaag aaagccagcc ctgagcctca 5760
actgcctggc tagtgtggtc agtaggatgc aaaggctgtt gaatgccaca aggccaaact 5820
ttaacctgtg taccacaagc ctagcagcag aggcagctct gctcactgga actctctgtc 5880
ttctttctcc tgagcctttt cttttcctga gttttctagc tctcctcaac cttacctctg 5940
ccctacccag gacaaaccca agagccactg tttctgtgat gtcctctcca gccctaatta 6000
ggcatcatga cttcagcctg accttccatg ctcagaagca gtgctaatcc acttcagatg 6060
agctgctcta tgcaacacag gcagagccta caaacctttg caccagagcc ctccacatat 6120
cagtgtttgt tcatactcac ttcaacagca aatgtgactg ctgagattaa gattttacac 6180
aagatggtct gtaatttcac agttagtttt atcccattag gtatgaaaga attagcataa 6240
ttccccttaa acatgaatga atcttagatt ttttaataaa tagttttgga agtaaagaca 6300
gagacatcag gagcacaagg aatagcctga gaggacaaac agaacaagaa agagtctgga 6360
aatacacagg atgttcttgg cctcctcaaa gcaagtgcaa gcagatagta ccagcagccc 6420
caggctatca gagcccagtg aagagaagta ccatgaaagc cacagctcta accaccctgt 6480
tccagagtga cagacagtcc ccaagacaag ccagcctgag ccagagagag aactgcaaga 6540
gaaagtttct aatttaggtt ctgttagatt cagacaagtg caggtcatcc tctctccaca 6600
gctactcacc tctccagcct aacaaagcct gcagtccaca ctccaaccct ggtgtctcac 6660
ctcctagcct ctcccaacat cctgctctct gaccatcttc tgcatctctc atctcaccat 6720
ctcccactgt ctacagccta ctcttgcaac taccatctca ttttctgaca tcctgtctac 6780
atcttctgcc atactctgcc atctaccata ccacctctta ccatctacca caccatcttt 6840
tatctccatc cctctcagaa gcctccaagc tgaatcctgc tttatgtgtt catctcagcc 6900
cctgcatgga aagctgaccc cagaggcaga actattccca gagagcttgg ccaagaaaaa 6960
caaaactacc agcctggcca ggctcaggag tagtaagctg cagtgtctgt tgtgttctag 7020
cttcaacagc tgcaggagtt ccactctcaa atgctccaca tttctcacat cctcctgatt 7080
ctggtcacta cccatcttca aagaacagaa tatctcacat cagcatactg tgaaggacta 7140
gtcatgggtg cagctgctca gagctgcaaa gtcattctgg atggtggaga gcttacaaac 7200
atttcatgat gctccccccg ctctgatggc tggagcccaa tccctacaca gactcctgct 7260
gtatgtgttt tcctttcact ctgagccaca gccagagggc aggcattcag tctcctcttc 7320
aggctggggc tggggcactg agaactcacc caacaccttg ctctcactcc ttctgcaaaa 7380
caagaaagag ctttgtgctg cagtagccat gaagaatgaa aggaaggctt taactaaaaa 7440
atgtcagaga ttattttcaa ccccttactg tggatcacca gcaaggagga aacacaacac 7500
agagacattt tttcccctca aattatcaaa agaatcactg catttgttaa agagagcaac 7560
tgaatcagga agcagagttt tgaacatatc agaagttagg aatctgcatc agagacaaat 7620
gcagtcatgg ttgtttgctg cataccagcc ctaatcatta gaagcctcat ggacttcaaa 7680
catcattccc tctgacaaga tgctctagcc taactccatg agataaaata aatctgcctt 7740
tcagagccaa agaagagtcc accagcttct tctcagtgtg aacaagagct ccagtcaggt 7800
tagtcagtcc agtgcagtag aggagaccag tctgcatcct ctaattttca aaggcaagaa 7860
gatttgttta ccctggacac caggcacaag tgaggtcaca gagctcttag atatgcagtc 7920
ctcatgagtg aggagactaa agcgcatgcc atcaagactt cagtgtagag aaaacctcca 7980
aaaaagcctc ctcactactt ctggaatagc tcagaggccg aggcggcctc ggcctctgca 8040
taaataaaaa aaattagtca gccatggggc ggagaatggg cggaactggg cggagttagg 8100
ggcgggatgg gcggagttag gggcgggact atggttgctg actaattgag atgcatgctt 8160
tgcatacttc tgcctgctgg ggagcctggg gactttccac acctggttgc tgactaattg 8220
agatgcatgc tttgcatact tctgcctgct ggggagcctg gggactttcc acaccctaac 8280
tgacacacat tccacagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 8340
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 8400
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 8460
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 8520
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 8580
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 8640
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 8700
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 8760
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 8820
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 8880
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 8940
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 9000
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 9060
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 9120
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 9180
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 9240
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 9300
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 9360
gactcctgca aaccacgttg tgtctcaaaa tctctgatgt tacattgcac aagataaaaa 9420
tatatcatca tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat 9480
gagccatatt caacgggaaa cgtcttgctc gaggccgcga ttaaattcca acatggatgc 9540
tgatttatat gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta 9600
tcgattgtat gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt 9660
tgccaatgat gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct 9720
tccgaccatc aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat 9780
ccccgggaaa acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt 9840
tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt 9900
taacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt 9960
tgatgcgagt gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga 10020
aatgcataag cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact 10080
tgataacctt atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg 10140
aatcgcagac cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc 10200
ttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt 10260
gcagtttcat ttgatgctcg atgagttttt ctaagggcgg cctgccacca tacccacgcc 10320
gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg tgatgtcggc 10380
gatataggcg ccagcaaccg cacctgtggc gccggtgatg agggcgcgcc aagtcgacgt 10440
ccggcagtct tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca 10500
aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga 10560
gagggagtgg ccaactccat cactaggggt tcctgctagc tctgggtatt taagcccgag 10620
tgagcacgca gggtctccat tttgaagcgg gaggttacgc gttcgtcgac tactagtggg 10680
taccagagcg tggtgactga gatgttttct aggaaacaca aaagatacaa aaaagaacac 10740
gtggaaggat agccaaaaag gggggctgcc cccatttcct gcaccccgct gcgatggctg 10800
gcaccatttg gaagacttcg agatacactg ttgagcgcag taagacaaca gtgtatctcg 10860
aagtcttcca gatggggcca gccggtccac tctgtatcca ggccagttct gcaaggcgtt 10920
cgaggaccac ccccctcccc tcgccaccag ggtggtctca tacagaactt ataagattcc 10980
caaatccaaa gacatttcac gtttatggtg atttcccaga acacatagcg acatgcaaat 11040
attgcagggc gccactcccc tgtccctcac agccatcttc ctgccagggc gcacgcgcgc 11100
tgggtgttcc cgcctagtga cactgggccc gcgattcctt ggagcgggtt gatgacgtca 11160
gcgtttccca tggtgaatcc ctaggtt 11187
<210> 13
<211> 10960
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 13
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgctag ctctgggtat ttaagcccga gtgagcacgc 180
agggtctcca ttttgaagcg ggaggttacg cgttcgtcga ctactagtgg gtaccagagc 240
tccctaggtt ctagaaccgg tgacgtctcc catggtgaag cttggatctg aattcggtac 300
cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 360
cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 420
ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 480
caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 540
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 600
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 660
accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 720
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 780
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 840
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 900
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgacg 960
ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1020
gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg gctgtaatta 1080
gcgcttggtt taatgacggc ttgtcctggt ggcgagggga ggggggtggt cctcgaacgc 1140
cttgcagaac tggcctggat acagagtgga ccggctggcc ccatctggaa gacttcgaga 1200
tacactgttg tcttactgcg ctcaacagtg tatctcgaag tcttccaaat ggtgccagcc 1260
atcgcagcgg ggtgcaggaa atgggggcag cccccctttt tggctatcct tccacgtgtt 1320
cttttttgta tcttttgtgt ttcctagaaa acatctcagt caccaccttt ctgtggctgc 1380
gtgaaagcct tgaggggctc cgggagctag agcctctgct aaccatgttc atgccttctt 1440
ctttttccta cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa 1500
agaattcctc gaagatccga agggaaagtc ttccacgact gtgggatccg ttcgaagata 1560
tcaccggttg agccaccatg gaattcagca gccccagcag agaggaatgc cccaagcctc 1620
tgagccgggt gtcaatcatg gccggatctc tgacaggact gctgctgctt caggccgtgt 1680
cttgggcttc tggcgctaga ccttgcatcc ccaagagctt cggctacagc agcgtcgtgt 1740
gcgtgtgcaa tgccacctac tgcgacagct tcgaccctcc tacctttcct gctctgggca 1800
ccttcagcag atacgagagc accagatccg gcagacggat ggaactgagc atgggaccca 1860
tccaggccaa tcacacaggc actggcctgc tgctgacact gcagcctgag cagaaattcc 1920
agaaagtgaa aggcttcggc ggagccatga cagatgccgc cgctctgaat atcctggctc 1980
tgtctccacc agctcagaac ctgctgctca agagctactt cagcgaggaa ggcatcggct 2040
acaacatcat cagagtgccc atggccagct gcgacttcag catcaggacc tacacctacg 2100
ccgacacacc cgacgatttc cagctgcaca acttcagcct gcctgaagag gacaccaagc 2160
tgaagatccc tctgatccac agagccctgc agctggcaca aagacccgtg tcactgctgg 2220
cctctccatg gacatctccc acctggctga aaacaaatgg cgccgtgaat ggcaagggca 2280
gcctgaaagg ccaacctggc gacatctacc accagacctg ggccagatac ttcgtgaagt 2340
tcctggacgc ctatgccgag cacaagctgc agttttgggc cgtgacagcc gagaacgaac 2400
cttctgctgg actgctgagc ggctacccct ttcagtgcct gggctttaca cccgagcacc 2460
agcgggactt tatcgcccgt gatctgggac ccacactggc caatagcacc caccataatg 2520
tgcggctgct gatgctggac gaccagagac tgcttctgcc ccactgggct aaagtggtgc 2580
tgacagatcc tgaggccgcc aaatacgtgc acggaatcgc cgtgcactgg tatctggact 2640
ttctggcccc tgccaaggcc acactgggag agacacacag actgttcccc aacaccatgc 2700
tgttcgccag cgaagcctgt gtgggcagca agttttggga acagagcgtg cggctcggca 2760
gctgggatag aggcatgcag tacagccaca gcatcatcac caacctgctg taccacgtcg 2820
tcggctggac cgactggaat ctggccctga atcctgaagg cggccctaac tgggtccgaa 2880
acttcgtgga cagccccatc atcgtggaca tcaccaagga caccttctac aagcagccca 2940
tgttctacca cctgggacac ttcagcaagt tcatccccga gggctctcag cgcgttggac 3000
tggtggcttc ccagaagaac gatctggacg ccgtggctct gatgcaccct gatggatctg 3060
ctgtggtggt ggtcctgaac cgcagcagca aagatgtgcc cctgaccatc aaggatcccg 3120
ccgtgggatt cctggaaaca atcagccctg gctactccat ccacacctac ctgtggcgta 3180
gacagtgaca attgttaatt aagtttaaac cctcgaggcc gcaagcttat cgataatcaa 3240
cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt tgctcctttt 3300
acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc ccgtatggct 3360
ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga gttgtggccc 3420
gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc cactggttgg 3480
ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct ccctattgcc 3540
acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg gctgttgggc 3600
actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct gctcgcctgt 3660
gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc cctcaatcca 3720
gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg tcttcgcctt 3780
cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcatcgata ccgtcgacta 3840
gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct 3900
cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 3960
aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 4020
aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggag agatccacga 4080
taacaaacag cttttttggg gtgaacatat tgactgaatt ccctgcaggt tggccactcc 4140
ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4200
ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaactccat 4260
cactaggggt tcctgcggcc gctcgtacgg tctcgaggaa ttcctgcagg ataacttgcc 4320
aacctcattc taaaatgtat atagaagccc aaaagacaat aacaaaaata ttcttgtaga 4380
acaaaatggg aaagaatgtt ccactaaata tcaagattta gagcaaagca tgagatgtgt 4440
ggggatagac agtgaggctg ataaaataga gtagagctca gaaacagacc cattgatata 4500
tgtaagtgac ctatgaaaaa aatatggcat tttacaatgg gaaaatgatg gtctttttct 4560
tttttagaaa aacagggaaa tatatttata tgtaaaaaat aaaagggaac ccatatgtca 4620
taccatacac acaaaaaaat tccagtgaat tataagtcta aatggagaag gcaaaacttt 4680
aaatctttta gaaaataata tagaagcatg cagaccagcc tggccaacat gatgaaaccc 4740
tctctactaa taataaaatc agtagaacta ctcaggacta ctttgagtgg gaagtccttt 4800
tctatgaaga cttctttggc caaaattagg ctctaaatgc aaggagatag tgcatcatgc 4860
ctggctgcac ttactgataa atgatgttat caccatcttt aaccaaatgc acaggaacaa 4920
gttatggtac tgatgtgctg gattgagaag gagctctact tccttgacag gacacatttg 4980
tatcaactta aaaaagcaga tttttgccag cagaactatt cattcagagg taggaaactt 5040
agaatagatg atgtcactga ttagcatggc ttccccatct ccacagctgc ttcccaccca 5100
ggttgcccac agttgagttt gtccagtgct cagggctgcc cactctcagt aagaagcccc 5160
acaccagccc ctctccaaat atgttggctg ttccttccat taaagtgacc ccactttaga 5220
gcagcaagtg gatttctgtt tcttacagtt caggaaggag gagtcagctg tgagaacctg 5280
gagcctgaga tgcttctaag tcccactgct actggggtca gggaagccag actccagcat 5340
cagcagtcag gagcactaag cccttgccaa catcctgttt ctcagagaaa ctgcttccat 5400
tataatggtt gtcctttttt aagctatcaa gccaaacaac cagtgtctac cattattctc 5460
atcacctgaa gccaagggtt ctagcaaaag tcaagctgtc ttgtaatggt tgatgtgcct 5520
ccagcttctg tcttcagtca ctccactctt agcctgctct gaatcaactc tgaccacagt 5580
tccctggagc ccctgccacc tgctgcccct gccaccttct ccatctgcag tgctgtgcag 5640
ccttctgcac tcttgcagag ctaataggtg gagacttgaa ggaagaggag gaaagtttct 5700
cataatagcc ttgctgcaag ctcaaatggg aggtgggcac tgtgcccagg agccttggag 5760
caaaggctgt gcccaacctc tgactgcatc caggtttggt cttgacagag ataagaagcc 5820
ctggcttttg gagccaaaat ctaggtcaga cttaggcagg attctcaaag tttatcagca 5880
gaacatgagg cagaagaccc tttctgctcc agcttcttca ggctcaacct tcatcagaat 5940
agatagaaag agaggctgtg agggttctta aaacagaagc aaatctgact cagagaataa 6000
acaacctcct agtaaactac agcttagaca gagcatctgg tggtgagtgt gctcagtgtc 6060
ctactcaact gtctggtatc agccctcatg aggacttctc ttctttccct catagacctc 6120
catctctgtt ttccttagcc tgcagaaatc tggatggcta ttcacagaat gcctgtgctt 6180
tcagagttgc attttttctc tggtattctg gttcaagcat ttgaaggtag gaaaggttct 6240
ccaagtgcaa gaaagccagc cctgagcctc aactgcctgg ctagtgtggt cagtaggatg 6300
caaaggctgt tgaatgccac aaggccaaac tttaacctgt gtaccacaag cctagcagca 6360
gaggcagctc tgctcactgg aactctctgt cttctttctc ctgagccttt tcttttcctg 6420
agttttctag ctctcctcaa ccttacctct gccctaccca ggacaaaccc aagagccact 6480
gtttctgtga tgtcctctcc agccctaatt aggcatcatg acttcagcct gaccttccat 6540
gctcagaagc agtgctaatc cacttcagat gagctgctct atgcaacaca ggcagagcct 6600
acaaaccttt gcaccagagc cctccacata tcagtgtttg ttcatactca cttcaacagc 6660
aaatgtgact gctgagatta agattttaca caagatggtc tgtaatttca cagttagttt 6720
tatcccatta ggtatgaaag aattagcata attcccctta aacatgaatg aatcttagat 6780
tttttaataa atagttttgg aagtaaagac agagacatca ggagcacaag gaatagcctg 6840
agaggacaaa cagaacaaga aagagtctgg aaatacacag gatgttcttg gcctcctcaa 6900
agcaagtgca agcagatagt accagcagcc ccaggctatc agagcccagt gaagagaagt 6960
accatgaaag ccacagctct aaccaccctg ttccagagtg acagacagtc cccaagacaa 7020
gccagcctga gccagagaga gaactgcaag agaaagtttc taatttaggt tctgttagat 7080
tcagacaagt gcaggtcatc ctctctccac agctactcac ctctccagcc taacaaagcc 7140
tgcagtccac actccaaccc tggtgtctca cctcctagcc tctcccaaca tcctgctctc 7200
tgaccatctt ctgcatctct catctcacca tctcccactg tctacagcct actcttgcaa 7260
ctaccatctc attttctgac atcctgtcta catcttctgc catactctgc catctaccat 7320
accacctctt accatctacc acaccatctt ttatctccat ccctctcaga agcctccaag 7380
ctgaatcctg ctttatgtgt tcatctcagc ccctgcatgg aaagctgacc ccagaggcag 7440
aactattccc agagagcttg gccaagaaaa acaaaactac cagcctggcc aggctcagga 7500
gtagtaagct gcagtgtctg ttgtgttcta gcttcaacag ctgcaggagt tccactctca 7560
aatgctccac atttctcaca tcctcctgat tctggtcact acccatcttc aaagaacaga 7620
atatctcaca tcagcatact gtgaaggact agtcatgggt gcagctgctc agagctgcaa 7680
agtcattctg gatggtggag agcttacaaa catttcatga tgctcccccc gctctgatgg 7740
ctggagccca atccctacac agactcctgc tgtatgtgtt ttcctttcac tctgagccac 7800
agccagaggg caggcattca gtctcctctt caggctgggg ctggggcact gagaactcac 7860
ccaacacctt gctctcactc cttctgcaaa acaagaaaga gctttgtgct gcagtagcca 7920
tgaagaatga aaggaaggct ttaactaaaa aatgtcagag attattttca accccttact 7980
gtggatcacc agcaaggagg aaacacaaca cagagacatt ttttcccctc aaattatcaa 8040
aagaatcact gcatttgtta aagagagcaa ctgaatcagg aagcagagtt ttgaacatat 8100
cagaagttag gaatctgcat cagagacaaa tgcagtcatg gttgtttgct gcataccagc 8160
cctaatcatt agaagcctca tggacttcaa acatcattcc ctctgacaag atgctctagc 8220
ctaactccat gagataaaat aaatctgcct ttcagagcca aagaagagtc caccagcttc 8280
ttctcagtgt gaacaagagc tccagtcagg ttagtcagtc cagtgcagta gaggagacca 8340
gtctgcatcc tctaattttc aaaggcaaga agatttgttt accctggaca ccaggcacaa 8400
gtgaggtcac agagctctta gatatgcagt cctcatgagt gaggagacta aagcgcatgc 8460
catcaagact tcagtgtaga gaaaacctcc aaaaaagcct cctcactact tctggaatag 8520
ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc agccatgggg 8580
cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta ggggcgggac 8640
tatggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg gggagcctgg 8700
ggactttcca cacctggttg ctgactaatt gagatgcatg ctttgcatac ttctgcctgc 8760
tggggagcct ggggactttc cacaccctaa ctgacacaca ttccacagct gcattaatga 8820
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 8880
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 8940
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 9000
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 9060
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 9120
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 9180
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 9240
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 9300
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 9360
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 9420
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 9480
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 9540
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 9600
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 9660
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 9720
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 9780
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 9840
atctgtctat ttcgttcatc catagttgcc tgactcctgc aaaccacgtt gtgtctcaaa 9900
atctctgatg ttacattgca caagataaaa atatatcatc atgaacaata aaactgtctg 9960
cttacataaa cagtaataca aggggtgtta tgagccatat tcaacgggaa acgtcttgct 10020
cgaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa tgggctcgcg 10080
ataatgtcgg gcaatcaggt gcgacaatct atcgattgta tgggaagccc gatgcgccag 10140
agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtca 10200
gactaaactg gctgacggaa tttatgcctc ttccgaccat caagcatttt atccgtactc 10260
ctgatgatgc atggttactc accactgcga tccccgggaa aacagcattc caggtattag 10320
aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt 10380
tgcattcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc 10440
aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgta 10500
atggctggcc tgttgaacaa gtctggaaag aaatgcataa gcttttgcca ttctcaccgg 10560
attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac gaggggaaat 10620
taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcttgcca 10680
tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt tttcaaaaat 10740
atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt 10800
tctaagggcg gcctgccacc atacccacgc cgaaacaagc gctcatgagc ccgaagtggc 10860
gagcccgatc ttccccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg 10920
cgccggtgat gagggcgcgc caagtcgacg tccggcagtc 10960
<210> 14
<211> 536
<212> PRT
<213> Homo sapiens
<400> 14
Met Glu Phe Ser Ser Pro Ser Arg Glu Glu Cys Pro Lys Pro Leu Ser
1 5 10 15
Arg Val Ser Ile Met Ala Gly Ser Leu Thr Gly Leu Leu Leu Leu Gln
20 25 30
Ala Val Ser Trp Ala Ser Gly Ala Arg Pro Cys Ile Pro Lys Ser Phe
35 40 45
Gly Tyr Ser Ser Val Val Cys Val Cys Asn Ala Thr Tyr Cys Asp Ser
50 55 60
Phe Asp Pro Pro Thr Phe Pro Ala Leu Gly Thr Phe Ser Arg Tyr Glu
65 70 75 80
Ser Thr Arg Ser Gly Arg Arg Met Glu Leu Ser Met Gly Pro Ile Gln
85 90 95
Ala Asn His Thr Gly Thr Gly Leu Leu Leu Thr Leu Gln Pro Glu Gln
100 105 110
Lys Phe Gln Lys Val Lys Gly Phe Gly Gly Ala Met Thr Asp Ala Ala
115 120 125
Ala Leu Asn Ile Leu Ala Leu Ser Pro Pro Ala Gln Asn Leu Leu Leu
130 135 140
Lys Ser Tyr Phe Ser Glu Glu Gly Ile Gly Tyr Asn Ile Ile Arg Val
145 150 155 160
Pro Met Ala Ser Cys Asp Phe Ser Ile Arg Thr Tyr Thr Tyr Ala Asp
165 170 175
Thr Pro Asp Asp Phe Gln Leu His Asn Phe Ser Leu Pro Glu Glu Asp
180 185 190
Thr Lys Leu Lys Ile Pro Leu Ile His Arg Ala Leu Gln Leu Ala Gln
195 200 205
Arg Pro Val Ser Leu Leu Ala Ser Pro Trp Thr Ser Pro Thr Trp Leu
210 215 220
Lys Thr Asn Gly Ala Val Asn Gly Lys Gly Ser Leu Lys Gly Gln Pro
225 230 235 240
Gly Asp Ile Tyr His Gln Thr Trp Ala Arg Tyr Phe Val Lys Phe Leu
245 250 255
Asp Ala Tyr Ala Glu His Lys Leu Gln Phe Trp Ala Val Thr Ala Glu
260 265 270
Asn Glu Pro Ser Ala Gly Leu Leu Ser Gly Tyr Pro Phe Gln Cys Leu
275 280 285
Gly Phe Thr Pro Glu His Gln Arg Asp Phe Ile Ala Arg Asp Leu Gly
290 295 300
Pro Thr Leu Ala Asn Ser Thr His His Asn Val Arg Leu Leu Met Leu
305 310 315 320
Asp Asp Gln Arg Leu Leu Leu Pro His Trp Ala Lys Val Val Leu Thr
325 330 335
Asp Pro Glu Ala Ala Lys Tyr Val His Gly Ile Ala Val His Trp Tyr
340 345 350
Leu Asp Phe Leu Ala Pro Ala Lys Ala Thr Leu Gly Glu Thr His Arg
355 360 365
Leu Phe Pro Asn Thr Met Leu Phe Ala Ser Glu Ala Cys Val Gly Ser
370 375 380
Lys Phe Trp Glu Gln Ser Val Arg Leu Gly Ser Trp Asp Arg Gly Met
385 390 395 400
Gln Tyr Ser His Ser Ile Ile Thr Asn Leu Leu Tyr His Val Val Gly
405 410 415
Trp Thr Asp Trp Asn Leu Ala Leu Asn Pro Glu Gly Gly Pro Asn Trp
420 425 430
Val Arg Asn Phe Val Asp Ser Pro Ile Ile Val Asp Ile Thr Lys Asp
435 440 445
Thr Phe Tyr Lys Gln Pro Met Phe Tyr His Leu Gly His Phe Ser Lys
450 455 460
Phe Ile Pro Glu Gly Ser Gln Arg Val Gly Leu Val Ala Ser Gln Lys
465 470 475 480
Asn Asp Leu Asp Ala Val Ala Leu Met His Pro Asp Gly Ser Ala Val
485 490 495
Val Val Val Leu Asn Arg Ser Ser Lys Asp Val Pro Leu Thr Ile Lys
500 505 510
Asp Pro Ala Val Gly Phe Leu Glu Thr Ile Ser Pro Gly Tyr Ser Ile
515 520 525
His Thr Tyr Leu Trp Arg Arg Gln
530 535
<210> 15
<211> 1608
<212> DNA
<213> Homo sapiens
<400> 15
atggaattca gcagccccag cagagaggaa tgccccaagc ctctgagccg ggtgtcaatc 60
atggccggat ctctgacagg actgctgctg cttcaggccg tgtcttgggc ttctggcgct 120
agaccttgca tccccaagag cttcggctac agcagcgtcg tgtgcgtgtg caatgccacc 180
tactgcgaca gcttcgaccc tcctaccttt cctgctctgg gcaccttcag cagatacgag 240
agcaccagat ccggcagacg gatggaactg agcatgggac ccatccaggc caatcacaca 300
ggcactggcc tgctgctgac actgcagcct gagcagaaat tccagaaagt gaaaggcttc 360
ggcggagcca tgacagatgc cgccgctctg aatatcctgg ctctgtctcc accagctcag 420
aacctgctgc tcaagagcta cttcagcgag gaaggcatcg gctacaacat catcagagtg 480
cccatggcca gctgcgactt cagcatcagg acctacacct acgccgacac acccgacgat 540
ttccagctgc acaacttcag cctgcctgaa gaggacacca agctgaagat ccctctgatc 600
cacagagccc tgcagctggc acaaagaccc gtgtcactgc tggcctctcc atggacatct 660
cccacctggc tgaaaacaaa tggcgccgtg aatggcaagg gcagcctgaa aggccaacct 720
ggcgacatct accaccagac ctgggccaga tacttcgtga agttcctgga cgcctatgcc 780
gagcacaagc tgcagttttg ggccgtgaca gccgagaacg aaccttctgc tggactgctg 840
agcggctacc cctttcagtg cctgggcttt acacccgagc accagcggga ctttatcgcc 900
cgtgatctgg gacccacact ggccaatagc acccaccata atgtgcggct gctgatgctg 960
gacgaccaga gactgcttct gccccactgg gctaaagtgg tgctgacaga tcctgaggcc 1020
gccaaatacg tgcacggaat cgccgtgcac tggtatctgg actttctggc ccctgccaag 1080
gccacactgg gagagacaca cagactgttc cccaacacca tgctgttcgc cagcgaagcc 1140
tgtgtgggca gcaagttttg ggaacagagc gtgcggctcg gcagctggga tagaggcatg 1200
cagtacagcc acagcatcat caccaacctg ctgtaccacg tcgtcggctg gaccgactgg 1260
aatctggccc tgaatcctga aggcggccct aactgggtcc gaaacttcgt ggacagcccc 1320
atcatcgtgg acatcaccaa ggacaccttc tacaagcagc ccatgttcta ccacctggga 1380
cacttcagca agttcatccc cgagggctct cagcgcgttg gactggtggc ttcccagaag 1440
aacgatctgg acgccgtggc tctgatgcac cctgatggat ctgctgtggt ggtggtcctg 1500
aaccgcagca gcaaagatgt gcccctgacc atcaaggatc ccgccgtggg attcctggaa 1560
acaatcagcc ctggctactc catccacacc tacctgtggc gtagacag 1608
<210> 16
<211> 524
<212> PRT
<213> Homo sapiens
<400> 16
Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala
1 5 10 15
Gly Pro Val Leu Gly Leu Lys Glu Cys Thr Arg Gly Ser Ala Val Trp
20 25 30
Cys Gln Asn Val Lys Thr Ala Ser Asp Cys Gly Ala Val Lys His Cys
35 40 45
Leu Gln Thr Val Trp Asn Lys Pro Thr Val Lys Ser Leu Pro Cys Asp
50 55 60
Ile Cys Lys Asp Val Val Thr Ala Ala Gly Asp Met Leu Lys Asp Asn
65 70 75 80
Ala Thr Glu Glu Glu Ile Leu Val Tyr Leu Glu Lys Thr Cys Asp Trp
85 90 95
Leu Pro Lys Pro Asn Met Ser Ala Ser Cys Lys Glu Ile Val Asp Ser
100 105 110
Tyr Leu Pro Val Ile Leu Asp Ile Ile Lys Gly Glu Met Ser Arg Pro
115 120 125
Gly Glu Val Cys Ser Ala Leu Asn Leu Cys Glu Ser Leu Gln Lys His
130 135 140
Leu Ala Glu Leu Asn His Gln Lys Gln Leu Glu Ser Asn Lys Ile Pro
145 150 155 160
Glu Leu Asp Met Thr Glu Val Val Ala Pro Phe Met Ala Asn Ile Pro
165 170 175
Leu Leu Leu Tyr Pro Gln Asp Gly Pro Arg Ser Lys Pro Gln Pro Lys
180 185 190
Asp Asn Gly Asp Val Cys Gln Asp Cys Ile Gln Met Val Thr Asp Ile
195 200 205
Gln Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gln Ala Leu Val Glu
210 215 220
His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp Ile
225 230 235 240
Cys Lys Asn Tyr Ile Ser Gln Tyr Ser Glu Ile Ala Ile Gln Met Met
245 250 255
Met His Met Gln Pro Lys Glu Ile Cys Ala Leu Val Gly Phe Cys Asp
260 265 270
Glu Val Lys Glu Met Pro Met Gln Thr Leu Val Pro Ala Lys Val Ala
275 280 285
Ser Lys Asn Val Ile Pro Ala Leu Glu Leu Val Glu Pro Ile Lys Lys
290 295 300
His Glu Val Pro Ala Lys Ser Asp Val Tyr Cys Glu Val Cys Glu Phe
305 310 315 320
Leu Val Lys Glu Val Thr Lys Leu Ile Asp Asn Asn Lys Thr Glu Lys
325 330 335
Glu Ile Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu Pro Lys Ser
340 345 350
Leu Ser Glu Glu Cys Gln Glu Val Val Asp Thr Tyr Gly Ser Ser Ile
355 360 365
Leu Ser Ile Leu Leu Glu Glu Val Ser Pro Glu Leu Val Cys Ser Met
370 375 380
Leu His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr Val His Val
385 390 395 400
Thr Gln Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys Lys Leu Val
405 410 415
Gly Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys Gln Glu Ile
420 425 430
Leu Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp Pro Tyr Gln
435 440 445
Lys Gln Cys Asp Gln Phe Val Ala Glu Tyr Glu Pro Val Leu Ile Glu
450 455 460
Ile Leu Val Glu Val Met Asp Pro Ser Phe Val Cys Leu Lys Ile Gly
465 470 475 480
Ala Cys Pro Ser Ala His Lys Pro Leu Leu Gly Thr Glu Lys Cys Ile
485 490 495
Trp Gly Pro Ser Tyr Trp Cys Gln Asn Thr Glu Thr Ala Ala Gln Cys
500 505 510
Asn Ala Val Glu His Cys Lys Arg His Val Trp Asn
515 520
<210> 17
<211> 1572
<212> DNA
<213> Homo sapiens
<400> 17
atgtacgccc tgttcctgct ggccagcctg ctgggcgccg ccctggccgg ccccgtgctg 60
ggcctgaagg agtgcacccg cggcagcgcc gtgtggtgcc agaacgtgaa gaccgccagc 120
gactgcggcg ccgtgaagca ctgcctgcag accgtgtgga acaagcccac cgtgaagagc 180
ctgccctgcg acatctgcaa ggacgtggtg accgccgccg gcgacatgct gaaggacaac 240
gccaccgagg aggagatcct ggtgtacctg gagaagacct gcgactggct gcccaagccc 300
aacatgagcg ccagctgcaa ggagatcgtg gacagctacc tgcccgtgat cctggacatc 360
atcaagggcg agatgagccg ccccggcgag gtgtgcagcg ccctgaacct gtgcgagagc 420
ctgcagaagc acctggccga gctgaaccac cagaagcagc tggagagcaa caagatcccc 480
gagctggaca tgaccgaggt ggtggccccc ttcatggcca acatccccct gctgctgtac 540
ccccaggacg gcccccgcag caagccccag cccaaggaca acggcgacgt gtgccaggac 600
tgcatccaga tggtgaccga catccagacc gccgtgcgca ccaacagcac cttcgtgcag 660
gccctggtgg agcacgtgaa ggaggagtgc gaccgcctgg gccccggcat ggccgacatc 720
tgcaagaact acatcagcca gtacagcgag atcgccatcc agatgatgat gcacatgcag 780
cccaaggaga tctgcgccct ggtgggcttc tgcgacgagg tgaaggagat gcccatgcag 840
accctggtgc ccgccaaggt ggccagcaag aacgtgatcc ccgccctgga gctggtggag 900
cccatcaaga agcacgaggt gcccgccaag agcgacgtgt actgcgaggt gtgcgagttc 960
ctggtgaagg aggtgaccaa gctgatcgac aacaacaaga ccgagaagga gatcctggac 1020
gccttcgaca agatgtgcag caagctgccc aagagcctga gcgaggagtg ccaggaggtg 1080
gtggacacct acggcagcag catcctgagc atcctgctgg aggaggtgag ccccgagctg 1140
gtgtgcagca tgctgcacct gtgcagcggc acccgcctgc ccgccctgac cgtgcacgtg 1200
acccagccca aggacggcgg cttctgcgag gtgtgcaaga agctggtggg ctacctggac 1260
cgcaacctgg agaagaacag caccaagcag gagatcctgg ccgccctgga gaagggctgc 1320
agcttcctgc ccgaccccta ccagaagcag tgcgaccagt tcgtggccga gtacgagccc 1380
gtgctgatcg agatcctggt ggaggtgatg gaccccagct tcgtgtgcct gaagatcggc 1440
gcctgcccca gcgcccacaa gcccctgctg ggcaccgaga agtgcatctg gggccccagc 1500
tactggtgcc agaacaccga gaccgccgcc cagtgcaacg ccgtggagca ctgcaagcgc 1560
cacgtgtgga ac 1572
<210> 18
<211> 478
<212> PRT
<213> Homo sapiens
<400> 18
Met Gly Arg Cys Cys Phe Tyr Thr Ala Gly Thr Leu Ser Leu Leu Leu
1 5 10 15
Leu Val Thr Ser Val Thr Leu Leu Val Ala Arg Val Phe Gln Lys Ala
20 25 30
Val Asp Gln Ser Ile Glu Lys Lys Ile Val Leu Arg Asn Gly Thr Glu
35 40 45
Ala Phe Asp Ser Trp Glu Lys Pro Pro Leu Pro Val Tyr Thr Gln Phe
50 55 60
Tyr Phe Phe Asn Val Thr Asn Pro Glu Glu Ile Leu Arg Gly Glu Thr
65 70 75 80
Pro Arg Val Glu Glu Val Gly Pro Tyr Thr Tyr Arg Glu Leu Arg Asn
85 90 95
Lys Ala Asn Ile Gln Phe Gly Asp Asn Gly Thr Thr Ile Ser Ala Val
100 105 110
Ser Asn Lys Ala Tyr Val Phe Glu Arg Asp Gln Ser Val Gly Asp Pro
115 120 125
Lys Ile Asp Leu Ile Arg Thr Leu Asn Ile Pro Val Leu Thr Val Ile
130 135 140
Glu Trp Ser Gln Val His Phe Leu Arg Glu Ile Ile Glu Ala Met Leu
145 150 155 160
Lys Ala Tyr Gln Gln Lys Leu Phe Val Thr His Thr Val Asp Glu Leu
165 170 175
Leu Trp Gly Tyr Lys Asp Glu Ile Leu Ser Leu Ile His Val Phe Arg
180 185 190
Pro Asp Ile Ser Pro Tyr Phe Gly Leu Phe Tyr Glu Lys Asn Gly Thr
195 200 205
Asn Asp Gly Asp Tyr Val Phe Leu Thr Gly Glu Asp Ser Tyr Leu Asn
210 215 220
Phe Thr Lys Ile Val Glu Trp Asn Gly Lys Thr Ser Leu Asp Trp Trp
225 230 235 240
Ile Thr Asp Lys Cys Asn Met Ile Asn Gly Thr Asp Gly Asp Ser Phe
245 250 255
His Pro Leu Ile Thr Lys Asp Glu Val Leu Tyr Val Phe Pro Ser Asp
260 265 270
Phe Cys Arg Ser Val Tyr Ile Thr Phe Ser Asp Tyr Glu Ser Val Gln
275 280 285
Gly Leu Pro Ala Phe Arg Tyr Lys Val Pro Ala Glu Ile Leu Ala Asn
290 295 300
Thr Ser Asp Asn Ala Gly Phe Cys Ile Pro Glu Gly Asn Cys Leu Gly
305 310 315 320
Ser Gly Val Leu Asn Val Ser Ile Cys Lys Asn Gly Ala Pro Ile Ile
325 330 335
Met Ser Phe Pro His Phe Tyr Gln Ala Asp Glu Arg Phe Val Ser Ala
340 345 350
Ile Glu Gly Met His Pro Asn Gln Glu Asp His Glu Thr Phe Val Asp
355 360 365
Ile Asn Pro Leu Thr Gly Ile Ile Leu Lys Ala Ala Lys Arg Phe Gln
370 375 380
Ile Asn Ile Tyr Val Lys Lys Leu Asp Asp Phe Val Glu Thr Gly Asp
385 390 395 400
Ile Arg Thr Met Val Phe Pro Val Met Tyr Leu Asn Glu Ser Val His
405 410 415
Ile Asp Lys Glu Thr Ala Ser Arg Leu Lys Ser Met Ile Asn Thr Thr
420 425 430
Leu Ile Ile Thr Asn Ile Pro Tyr Ile Ile Met Ala Leu Gly Val Phe
435 440 445
Phe Gly Leu Val Phe Thr Trp Leu Ala Cys Lys Gly Gln Gly Ser Met
450 455 460
Asp Glu Gly Thr Ala Asp Glu Arg Ala Pro Leu Ile Arg Thr
465 470 475
<210> 19
<211> 1434
<212> DNA
<213> Homo sapiens
<400> 19
atgggccgct gctgcttcta caccgccggc accctgagcc tgctgctgct ggtgaccagc 60
gtgaccctgc tggtggcccg cgtgttccag aaggccgtgg accagagcat cgagaagaag 120
atcgtgctgc gcaacggcac cgaggccttc gacagctggg agaagccccc cctgcccgtg 180
tacacccagt tctacttctt caacgtgacc aaccccgagg agatcctgcg cggcgagacc 240
ccccgcgtgg aggaggtggg cccctacacc taccgcgagc tgcgcaacaa ggccaacatc 300
cagttcggcg acaacggcac caccatcagc gccgtgagca acaaggccta cgtgttcgag 360
cgcgaccaga gcgtgggcga ccccaagatc gacctgatcc gcaccctgaa catccccgtg 420
ctgaccgtga tcgagtggag ccaggtgcac ttcctgcgcg agatcatcga ggccatgctg 480
aaggcctacc agcagaagct gttcgtgacc cacaccgtgg acgagctgct gtggggctac 540
aaggacgaga tcctgagcct gatccacgtg ttccgccccg acatcagccc ctacttcggc 600
ctgttctacg agaagaacgg caccaacgac ggcgactacg tgttcctgac cggcgaggac 660
agctacctga acttcaccaa gatcgtggag tggaacggca agaccagcct ggactggtgg 720
atcaccgaca agtgcaacat gatcaacggc accgacggcg acagcttcca ccccctgatc 780
accaaggacg aggtgctgta cgtgttcccc agcgacttct gccgcagcgt gtacatcacc 840
ttcagcgact acgagagcgt gcagggcctg cccgccttcc gctacaaggt gcccgccgag 900
atcctggcca acaccagcga caacgccggc ttctgcatcc ccgagggcaa ctgcctgggc 960
agcggcgtgc tgaacgtgag catctgcaag aacggcgccc ccatcatcat gagcttcccc 1020
cacttctacc aggccgacga gcgcttcgtg agcgccatcg agggcatgca ccccaaccag 1080
gaggaccacg agaccttcgt ggacatcaac cccctgaccg gcatcatcct gaaggccgcc 1140
aagcgcttcc agatcaacat ctacgtgaag aagctggacg acttcgtgga gaccggcgac 1200
atccgcacca tggtgttccc cgtgatgtac ctgaacgaga gcgtgcacat cgacaaggag 1260
accgccagcc gcctgaagag catgatcaac accaccctga tcatcaccaa catcccctac 1320
atcatcatgg ccctgggcgt gttcttcggc ctggtgttca cctggctggc ctgcaagggc 1380
cagggcagca tggacgaggg caccgccgac gagcgcgccc ccctgatccg cacc 1434
<210> 20
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 20
tggaagactt cgagatacac tgt 23
<210> 21
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 21
acagtgtatc tcgaagtctt cca 23
<210> 22
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 22
tttagaaata agtggtagtc a 21
<210> 23
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 23
tgactaccac ttatttctaa a 21
<210> 24
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 24
agggtatcaa gactacgaa 19
<210> 25
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 25
ttcgtagtct tgataccct 19
<210> 26
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 26
tattagatct gatggccgc 19
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 27
ctccatcact aggggttcct 20
<210> 28
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 28
agctctgggt atttaagccc gagtgagcac gcagggtctc cattttgaag cgggaggtta 60
<210> 29
<211> 145
<212> DNA
<213> Unknown
<220>
<223> AAV2 ITR
<400> 29
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 30
tattagatct gatggccgcg 20
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic polynucleotide
<400> 31
tccatcacta ggggttcctg 20
Claims (43)
- (i) 발현 구축물로서,
서열식별번호(SEQ ID NO) 15에 기재된 서열을 포함하는 베타-글루코세레브로시다제 (Gcase) 단백질 코딩 서열을 포함하는 트랜스진;
닭 베타 액틴 (CBA) 프로모터;
CMV 인핸서;
우드척 간염 바이러스 전사후 조절 요소(Woodchuck hepatitis virus Posttranscriptional Regulatory Element: WPRE); 및
소 성장 호르몬 폴리A 신호 테일
을 포함하는 것인 발현 구축물; 및
(ii) 상기 발현 구축물에 플랭킹된 2개의 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR) 서열로서, 제1 ITR 서열은 5' ITR이고, 제2 ITR 서열은 3' ITR인 ITR 서열;
을 포함하는 단리된 핵산이며,
트랜스진은 프로모터에 작동가능하게 연결된 것인, 단리된 핵산. - 제1항에 있어서, 트랜스진이 α-시누클레인을 표적화하는 억제성 핵산을 코딩하는 코딩 서열을 추가로 포함하고, 여기서 억제성 핵산은 서열식별번호 20에 기재된 서열에 의해 코딩되는 것인 단리된 핵산.
- 제1항 또는 제2항에 있어서, 2개의 ITR 서열 각각이 야생형 AAV2 ITR 서열인 단리된 핵산.
- 제1항 또는 제2항에 있어서, 2개의 ITR 서열 각각이 발현 구축물에 인접한 "D" 영역 (서열식별번호 27)을 포함하는 것인 단리된 핵산.
- 제1항 또는 제2항에 있어서, ITR 서열 중 적어도 하나가 발현 구축물 기준으로 ITR 서열의 외부에 위치하는 "D" 영역 (서열식별번호 27)을 포함하는 것인 단리된 핵산.
- 제1항 또는 제2항에 있어서, 발현 구축물 기준으로 5'에 위치하는 ITR 서열이 발현 구축물에 인접한 "D" 영역 (서열식별번호 27)을 포함하고, 발현 구축물 기준으로 3'에 위치하는 ITR 서열이 발현 구축물 기준으로 ITR 서열의 외부에 위치하는 "D" 영역 (서열식별번호 27)을 포함하는 것인 단리된 핵산.
- 제1항 또는 제2항에 있어서, 5' ITR의 핵산 서열이 서열식별번호 1의 뉴클레오티드 1 - 145이고, 3' ITR의 핵산 서열이 서열식별번호 1의 뉴클레오티드 3867 - 4011인 단리된 핵산.
- 제1항 또는 제2항에 있어서, 5' ITR과 발현 구축물 사이에 TRY 영역을 추가로 포함하고, 여기서 TRY 영역은 서열식별번호 28에 기재된 서열을 갖는 것인 단리된 핵산.
- (i) 발현 구축물로서,
서열식별번호 15에 기재된 서열을 포함하는 Gcase 단백질 코딩 서열을 포함하는 트랜스진;
닭 베타 액틴 (CBA) 프로모터;
CMV 인핸서;
우드척 간염 바이러스 전사후 조절 요소; 및
소 성장 호르몬 폴리A 신호 테일
을 포함하는 발현 구축물; 및
(ii) 상기 발현 구축물에 플랭킹된 2개의 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR) 서열로서, 제1 ITR 서열은 5' ITR이고, 제2 ITR 서열은 3' ITR인 ITR 서열;
을 포함하는 재조합 아데노-연관 바이러스 (rAAV) 벡터이며,
트랜스진은 프로모터에 작동가능하게 연결된 것인, rAAV 벡터. - 제9항에 있어서, 트랜스진이 α-시누클레인을 표적화하는 억제성 핵산을 코딩하는 코딩 서열을 추가로 포함하고, 여기서 억제성 핵산은 서열식별번호 20에 기재된 서열에 의해 코딩되는 것인 rAAV 벡터.
- 제9항 또는 제10항에 있어서, 2개의 ITR 서열 각각이 야생형 AAV2 ITR 서열인 rAAV 벡터.
- 제9항 또는 제10항에 있어서, 2개의 ITR 서열 각각이 발현 구축물에 인접한 "D" 영역 (서열식별번호 27)을 포함하는 것인 rAAV 벡터.
- 제9항 또는 제10항에 있어서, ITR 서열 중 적어도 하나가 발현 구축물 기준으로 ITR 서열의 외부에 위치하는 "D" 영역 (서열식별번호 27)을 포함하는 것인 rAAV 벡터.
- 제9항 또는 제10항에 있어서, 발현 구축물 기준으로 5'에 위치하는 ITR 서열이 발현 구축물에 인접한 "D" 영역 (서열식별번호 27)을 포함하고, 발현 구축물 기준으로 3'에 위치하는 ITR 서열이 발현 구축물 기준으로 ITR 서열의 외부에 위치하는 "D" 영역 (서열식별번호 27)을 포함하는 것인 rAAV 벡터.
- 제9항 또는 제10항에 있어서, 5' ITR의 핵산 서열이 서열식별번호 1의 뉴클레오티드 1 - 145이고, 3' ITR의 핵산 서열이 서열식별번호 1의 뉴클레오티드 3867 - 4011인 rAAV 벡터.
- 제9항 또는 제10항에 있어서, 5' ITR과 발현 구축물 사이에 TRY 영역을 추가로 포함하고, 여기서 TRY 영역은 서열식별번호 28에 기재된 서열을 갖는 것인 rAAV 벡터.
- (i) 아데노-연관 바이러스 (AAV) 캡시드 단백질; 및
(ii) 제9항 또는 제10항의 rAAV 벡터
를 포함하는 재조합 아데노-연관 바이러스 (rAAV). - 제17항에 있어서, AAV 캡시드 단백질이 AAV9 캡시드 단백질인 rAAV.
- 5'에서 3' 순으로
(a) 5' 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR);
(b) CMV 인핸서;
(c) 닭 베타 액틴 (CBA) 프로모터;
(d) 서열식별번호 15에 기재된 서열을 포함하는 베타-글루코세레브로시다제 (Gcase) 코딩 서열을 포함하는 트랜스진;
(e) 우드척 간염 바이러스 전사후 조절 요소 (WPRE);
(f) 소 성장 호르몬 폴리A 신호 테일; 및
(g) 3' AAV ITR
을 포함하는 핵산을 포함하는 재조합 아데노-연관 바이러스 (rAAV) 벡터. - 제19항에 있어서, 트랜스진이 α-시누클레인을 표적화하는 억제성 핵산을 코딩하는 코딩 서열을 추가로 포함하고, 여기서 억제성 핵산은 서열식별번호 20에 기재된 서열에 의해 코딩되는 것인 rAAV 벡터.
- (i) 아데노-연관 바이러스 (AAV) 캡시드 단백질; 및
(ii) 제19항 또는 제20항의 rAAV 벡터
를 포함하는 재조합 아데노-연관 바이러스 (rAAV). - 제21항에 있어서, AAV 캡시드 단백질이 AAV9 캡시드 단백질인 rAAV.
- 제9항, 제10항, 제19항, 및 제20항 중 어느 한 항의 rAAV 벡터를 포함하는 플라스미드.
- (i) 발현 구축물로서,
서열식별번호 15에 기재된 서열을 포함하는 베타-글루코세레브로시다제 (Gcase) 단백질 코딩 서열을 포함하는 트랜스진;
CBA 프로모터;
CMV 인핸서;
WPRE; 및
소 성장 호르몬 폴리A 신호 테일
을 포함하는 것인 발현 구축물; 및
(ii) 상기 발현 구축물에 플랭킹된 2개의 AAV ITR 서열
을 포함하는 배큘로바이러스 벡터이며,
트랜스진은 프로모터에 작동가능하게 연결된 것인, 배큘로바이러스 벡터. - 제24항에 있어서, 트랜스진이 α-시누클레인을 표적화하는 억제성 핵산을 코딩하는 코딩 서열을 추가로 포함하고, 여기서 억제성 핵산은 서열식별번호 20에 기재된 서열에 의해 코딩되는 것인, 배큘로바이러스 벡터.
- (i) 하나 이상의 아데노-연관 바이러스 rep 단백질 및/또는 하나 이상의 아데노-연관 바이러스 cap 단백질을 코딩하는 제1 벡터; 및
(ii) 제2 벡터로서,
(a) 발현 구축물이며,
서열식별번호 15에 기재된 서열을 포함하는 베타-글루코세레브로시다제 (Gcase) 단백질 코딩 서열을 포함하는 트랜스진;
CBA 프로모터;
CMV 인핸서;
WPRE; 및
소 성장 호르몬 폴리A 신호 테일
을 포함하는 것인 발현 구축물; 및
(b) 상기 발현 구축물에 플랭킹된 2개의 AAV ITR 서열
을 포함하는 제2 벡터
를 포함하는 세포이며,
트랜스진은 프로모터에 작동가능하게 연결된 것인, 세포. - 제26항에 있어서, 트랜스진이 α-시누클레인을 표적화하는 억제성 핵산을 코딩하는 코딩 서열을 추가로 포함하고, 여기서 억제성 핵산은 서열식별번호 20에 기재된 서열에 의해 코딩되는 것인 세포.
- 제26항 또는 제27항에 있어서, 제1 벡터가 플라스미드이고, 제2 벡터가 플라스미드인 세포.
- 제28항에 있어서, 포유동물 세포인 세포.
- 제29항에 있어서, 포유동물 세포가 HEK293 세포인 세포.
- 제26항 또는 제27항에 있어서, 제1 벡터가 배큘로바이러스 벡터이고, 제2 벡터가 배큘로바이러스 벡터인 세포.
- 제31항에 있어서, 곤충 세포인 세포.
- 아데노-연관 바이러스 (AAV) 캡시드 단백질 및 제9항, 제10항, 제19항, 및 제20항 중 어느 한 항의 rAAV 벡터를 포함하는 재조합 아데노-연관 바이러스 (rAAV)를 제조하는 방법이며,
(i) 하나 이상의 AAV rep 단백질 및/또는 하나 이상의 AAV cap 단백질을 코딩하는 제1 벡터, 및 rAAV 벡터를 세포로 전달하는 단계;
(ii) rAAV의 패키징을 허용하는 조건하에서 상기 (i)의 세포를 배양하는 단계; 및
(iii) rAAV 수집을 위해, 배양된 숙주 세포 또는 배양 배지를 수거하는 단계
를 포함하는 방법. - 제1항의 단리된 핵산, 제9항 또는 제19항의 rAAV 벡터, 또는 아데노-연관 바이러스 (AAV) 캡시드 단백질 및 상기 rAAV 벡터를 포함하는 rAAV를 포함하는, 파킨슨병 또는 고셰병을 앓거나 또는 앓을 것으로 의심되는 대상체를 치료하기 위한 제약 조성물.
- 제34항에 있어서, 대상체의 중추 신경계 (CNS)에의 직접 주사용으로 제형화된 제약 조성물.
- 제35항에 있어서, 대상체의 CNS에의 직접 주사가 대뇌내 주사, 실질내 주사, 경막내 주사, 대수조내 주사, 또는 그의 조합인 제약 조성물.
- 제35항에 있어서, 대상체의 CNS에의 직접 주사가 컨벡션 강화 전달법 (CED)을 포함하는 것인 제약 조성물.
- 제34항에 있어서, 말초 주사용으로 제형화된 제약 조성물.
- 제38항에 있어서, 말초 주사가 정맥내 주사인 제약 조성물.
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762567296P | 2017-10-03 | 2017-10-03 | |
US62/567,296 | 2017-10-03 | ||
PCT/US2018/054225 WO2019070893A1 (en) | 2017-10-03 | 2018-10-03 | GENE THERAPIES FOR LYSOSOMAL DISORDERS |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200078512A KR20200078512A (ko) | 2020-07-01 |
KR102693318B1 true KR102693318B1 (ko) | 2024-08-07 |
Family
ID=65994357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207012188A KR102693318B1 (ko) | 2017-10-03 | 2018-10-03 | 리소좀 장애를 위한 유전자 요법 |
Country Status (11)
Country | Link |
---|---|
US (4) | US11802294B2 (ko) |
EP (1) | EP3692075A4 (ko) |
JP (2) | JP7254815B2 (ko) |
KR (1) | KR102693318B1 (ko) |
CN (1) | CN111542549A (ko) |
AU (2) | AU2018346104B2 (ko) |
BR (1) | BR112020006633A2 (ko) |
CA (1) | CA3078371A1 (ko) |
IL (2) | IL273776A (ko) |
MX (2) | MX2020003557A (ko) |
WO (1) | WO2019070893A1 (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11993790B2 (en) | 2017-10-03 | 2024-05-28 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
CN111465691A (zh) | 2017-10-03 | 2020-07-28 | 普利维尔治疗公司 | 用于溶酶体障碍的基因疗法 |
US11802294B2 (en) | 2017-10-03 | 2023-10-31 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
US11999974B2 (en) | 2019-04-10 | 2024-06-04 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
CA3136117A1 (en) | 2019-04-10 | 2020-10-15 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
CA3149844A1 (en) * | 2019-08-12 | 2021-02-18 | Fundacion Para La Investigacion Medica Aplicada | Viral particles for use in treating synucleinopathies such as parkinson's diseases by gene therapy |
WO2021081201A1 (en) * | 2019-10-22 | 2021-04-29 | Applied Genetic Technologies Corporation | Adeno-associated virus (aav) systems for treatment of progranulin associated neurodegeneative diseases or disorders |
WO2021258074A2 (en) * | 2020-06-18 | 2021-12-23 | Lundkvist Johan | Cell lines secreting alpha-synuclein targeting antibodies, progranulin and prosaposin and a complex of both, and gdnf |
CN117120619A (zh) | 2020-07-27 | 2023-11-24 | 沃雅戈治疗公司 | 用于治疗与葡萄糖神经酰胺酶β缺陷相关的神经病症的组合物和方法 |
MX2023001137A (es) | 2020-07-29 | 2023-02-22 | Freeline Therapeutics Ltd | Beta-glucocerebrosidasa mutada con estabilidad mejorada. |
CN116437968A (zh) | 2020-08-10 | 2023-07-14 | 普利维尔治疗公司 | 用于神经退行性病症的基因疗法 |
CN116157527A (zh) * | 2020-08-10 | 2023-05-23 | 普利维尔治疗公司 | 用于溶酶体病症的基因疗法 |
AU2021359852A1 (en) | 2020-10-15 | 2023-06-08 | Prevail Therapeutics, Inc. | Recombinant adeno-associated virus compositions and methods for producing same |
EP4229213A1 (en) | 2020-10-15 | 2023-08-23 | Prevail Therapeutics, Inc. | Assay for measuring potency of gene therapy drug product |
EP4433490A2 (en) | 2021-11-17 | 2024-09-25 | Voyager Therapeutics, Inc. | Compositions and methods for the treatment of neurological disorders related to glucosylceramidase beta deficiency |
WO2024163012A1 (en) | 2023-02-02 | 2024-08-08 | Voyager Therapeutics, Inc. | Compositions and methods for the treatment of neurological disorders related to glucosylceramidase beta deficiency |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5879680A (en) | 1987-12-23 | 1999-03-09 | The United States Of America As Represented By The Department Of Health And Human Services | Cloned DNA for synthesizing unique glucocerebrosidase |
EP0933997A4 (en) | 1996-09-06 | 2000-08-16 | Chiron Corp | METHODS AND COMPOSITIONS FOR LIVER-SPECIFIC ADMINISTRATION OF THERAPEUTIC MOLECULES USING RECOMBINANT AAV VECTORS |
ES2340230T3 (es) | 1998-11-10 | 2010-05-31 | University Of North Carolina At Chapel Hill | Vectores viricos y sus procedimientos de preparacion y administracion. |
US6696272B1 (en) | 1999-06-02 | 2004-02-24 | Hsc Research & Development Limited Partnership | Products and methods for gaucher disease therapy |
GB0009887D0 (en) | 2000-04-20 | 2000-06-07 | Btg Int Ltd | Cytotoxic agents |
AU2001255575B2 (en) | 2000-04-28 | 2006-08-31 | The Trustees Of The University Of Pennsylvania | Recombinant aav vectors with aav5 capsids and aav5 vectors pseudotyped in heterologous capsids |
ES2252293T3 (es) | 2000-09-18 | 2006-05-16 | Genzyme Corporation | Vectores de expresion que contienene promotores hibridos de ubiquitina. |
US20030133924A1 (en) * | 2001-12-21 | 2003-07-17 | Novazyme Pharmaceuticals, Inc. | Highly phosphorylated acid beta-glucocerebrosidase and methods of treating gaucher's disease |
WO2003089612A2 (en) | 2002-04-17 | 2003-10-30 | University Of Florida Research Foundation, Inc. | IMPROVED rAAV VECTORS |
WO2004098648A1 (en) | 2003-05-01 | 2004-11-18 | Genzyme Corporation | Gene therapy for neurometabolic disorders |
WO2006036465A2 (en) | 2004-09-03 | 2006-04-06 | University Of Florida | Compositions and methods for treating cystic fibrosis |
DE602005015994D1 (de) | 2004-09-29 | 2009-09-24 | Childrens Memorial Hospital | siRNA-VERMITTELTES GEN-SILENCING VON ALPHA-SYNUKLEIN |
LT2489733T (lt) | 2006-06-07 | 2019-05-27 | Genzyme Corporation | Šoninės amiotrofinės sklerozės ir kitų nugaros smegenų sutrikimų genų terapija |
EP3456733A1 (en) | 2007-05-11 | 2019-03-20 | Genzyme Corporation | Methods of producing a secreted protein |
US8454954B2 (en) | 2007-05-16 | 2013-06-04 | The Brigham And Women's Hospital, Inc. | Treatment of synucleinopathies |
WO2009079399A2 (en) | 2007-12-14 | 2009-06-25 | Alnylam Pharmaceuticals, Inc. | Method of treating neurodegenerative disease |
US9255266B2 (en) | 2009-05-06 | 2016-02-09 | Rutgers, The State University Of New Jersey | RNA targeting in alpha-synucleinopathies |
US9290759B2 (en) | 2010-08-25 | 2016-03-22 | The Trustees Of Columbia University In The City Of New York | Optimized miRNA constructs |
WO2012027713A2 (en) | 2010-08-26 | 2012-03-01 | Alnylam Pharmaceuticals, Inc. | Compositions and methods for inhibition of snca |
JP6312436B2 (ja) | 2010-11-16 | 2018-04-18 | ニューロダイン ライフ サイエンシズ インコーポレイテッドNeurodyn Life Sciences Inc. | ネプリライシンの発現および活性を増大させるための方法および医薬組成物 |
BR112014021067A2 (pt) * | 2012-02-19 | 2018-10-30 | Protalix Ltd | formas unitárias de dosagem oral e usos das mesmas para o tratamento da doença de gaucher |
CA2889990A1 (en) * | 2012-11-05 | 2014-05-08 | Genzyme Corporation | Compositions and methods for treating proteinopathies |
SG11201509419QA (en) | 2013-05-15 | 2015-12-30 | Univ Minnesota | Adeno-associated virus mediated gene transfer to the central nervous system |
US9347107B2 (en) | 2013-05-23 | 2016-05-24 | Norman Z Lai | Vector containing multiple nucleotide sequences for the expression of enzymes |
US9574184B2 (en) | 2013-09-25 | 2017-02-21 | Children's Hospital Medical Center | Lysosomal protein targeting sequence and therapeutic applications of same |
EP3221456B1 (en) * | 2014-11-21 | 2021-09-22 | University of Florida Research Foundation, Inc. | Genome-modified recombinant adeno-associated virus vectors |
US20170035860A1 (en) | 2015-04-02 | 2017-02-09 | Alexander C. Flynn | Compositions and methods for treatment of neurogenerative diseases |
JP2015180203A (ja) * | 2015-04-17 | 2015-10-15 | ザ スクリプス リサーチ インスティテュート | タンパク質生産の増強のためのmRNAの一次構造の再操作 |
CA2985235A1 (en) | 2015-05-07 | 2016-11-10 | Shire Human Genetic Therapies, Inc. | Glucocerebrosidase gene therapy for parkinson's disease |
EP3091087A1 (en) | 2015-05-08 | 2016-11-09 | Fundació Institut d'Investigació en Ciències de la Salut Germans Trias i Pujol | Method for in vitro diagnosis of synucleinopathies using alpha-synuclein gene transcripts |
WO2016187017A1 (en) | 2015-05-15 | 2016-11-24 | Mcivor R Scott | Adeno-associated for therapeutic delivery to central nervous system |
US20190055578A1 (en) | 2015-10-29 | 2019-02-21 | Voyager Therapeutics, Inc. | Delivery of central nervous system targeting polynucleotides |
RU2021102893A (ru) * | 2015-11-05 | 2021-03-03 | Бамбу Терапьютикс, Инк. | Модифицированные гены атаксии фридрейха и векторы для генной терапии |
CA3011939A1 (en) | 2016-02-02 | 2017-08-10 | University Of Massachusetts | Method to enhance the efficiency of systemic aav gene delivery to the central nervous system |
FI3411484T3 (fi) | 2016-02-05 | 2023-11-15 | Univ Emory | Yksisäikeisen tai itsekomplementaarisen adenoassosioidun viruksen 9 injektio serebrospinaaliseen fluidiin |
WO2017151884A1 (en) | 2016-03-02 | 2017-09-08 | The Children's Hospital Of Philadelphia | Therapy for frontotemporal dementia |
US11993790B2 (en) | 2017-10-03 | 2024-05-28 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
CN111465691A (zh) | 2017-10-03 | 2020-07-28 | 普利维尔治疗公司 | 用于溶酶体障碍的基因疗法 |
US11802294B2 (en) | 2017-10-03 | 2023-10-31 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
EP3701030A4 (en) | 2017-10-23 | 2022-04-20 | Prevail Therapeutics, Inc. | GENE THERAPIES FOR NEURODEGENERATIVE DISEASES |
CA3136117A1 (en) | 2019-04-10 | 2020-10-15 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
AU2020272974A1 (en) | 2019-04-10 | 2021-11-11 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
US20220211871A1 (en) | 2019-04-10 | 2022-07-07 | Prevail Therapeutics, Inc. | Gene therapies for lysosomal disorders |
-
2018
- 2018-10-03 US US16/753,016 patent/US11802294B2/en active Active
- 2018-10-03 WO PCT/US2018/054225 patent/WO2019070893A1/en unknown
- 2018-10-03 JP JP2020540682A patent/JP7254815B2/ja active Active
- 2018-10-03 KR KR1020207012188A patent/KR102693318B1/ko active IP Right Grant
- 2018-10-03 EP EP18865080.8A patent/EP3692075A4/en active Pending
- 2018-10-03 AU AU2018346104A patent/AU2018346104B2/en active Active
- 2018-10-03 BR BR112020006633-8A patent/BR112020006633A2/pt unknown
- 2018-10-03 CA CA3078371A patent/CA3078371A1/en active Pending
- 2018-10-03 MX MX2020003557A patent/MX2020003557A/es unknown
- 2018-10-03 CN CN201880075674.4A patent/CN111542549A/zh active Pending
-
2019
- 2019-11-20 US US16/689,865 patent/US10837028B2/en active Active
-
2020
- 2020-04-02 IL IL273776A patent/IL273776A/en unknown
- 2020-07-13 MX MX2020011745A patent/MX2020011745A/es unknown
- 2020-07-14 AU AU2020205228A patent/AU2020205228B2/en active Active
- 2020-09-17 US US17/024,117 patent/US11060113B2/en active Active
- 2020-11-22 IL IL278868A patent/IL278868A/en unknown
-
2021
- 2021-07-07 US US17/369,168 patent/US20210332385A1/en active Pending
-
2023
- 2023-03-29 JP JP2023052515A patent/JP2023086740A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2023086740A (ja) | 2023-06-22 |
AU2018346104A1 (en) | 2020-04-30 |
JP7254815B2 (ja) | 2023-04-10 |
US20200071726A1 (en) | 2020-03-05 |
EP3692075A4 (en) | 2022-02-09 |
US10837028B2 (en) | 2020-11-17 |
AU2020205228A1 (en) | 2020-07-30 |
CA3078371A1 (en) | 2019-04-11 |
JP2020537543A (ja) | 2020-12-24 |
CN111542549A (zh) | 2020-08-14 |
EP3692075A1 (en) | 2020-08-12 |
IL278868A (en) | 2021-01-31 |
MX2020011745A (es) | 2021-01-08 |
AU2018346104B2 (en) | 2023-07-27 |
US20200231954A1 (en) | 2020-07-23 |
BR112020006633A2 (pt) | 2020-10-06 |
AU2020205228B2 (en) | 2023-09-07 |
KR20200078512A (ko) | 2020-07-01 |
US20210332385A1 (en) | 2021-10-28 |
US11802294B2 (en) | 2023-10-31 |
US20210010032A1 (en) | 2021-01-14 |
IL273776A (en) | 2020-05-31 |
WO2019070893A1 (en) | 2019-04-11 |
MX2020003557A (es) | 2020-10-07 |
US11060113B2 (en) | 2021-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020205228B2 (en) | Gene therapies for lysosomal disorders | |
AU2020260491B2 (en) | Gene therapies for lysosomal disorders | |
AU2020260476B2 (en) | Gene therapies for lysosomal disorders | |
KR20220006527A (ko) | 리소좀 장애에 대한 유전자 요법 | |
KR20210086645A (ko) | Aav 삼중-플라스미드 시스템 | |
RU2758489C2 (ru) | Композиции и способы для экспрессии нескольких биологически активных полипептидов с одного вектора для лечения заболеваний сердца и других патологий | |
CA2776272C (en) | Development of a preventive vaccine for filovirus infection in primates | |
CN113005123A (zh) | 用于神经变性疾病的基因疗法 | |
KR20210150486A (ko) | 리소좀 장애에 대한 유전자 요법 | |
KR20230066360A (ko) | 신경퇴행성 장애를 위한 유전자 요법 | |
KR20220035107A (ko) | Arsa 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 | |
KR20220112283A (ko) | Hunter 질환 치료용 아데노-연합된 바이러스 벡터 | |
KR20080030956A (ko) | 개선된 조절 발현 체계를 사용한 질병의 치료 | |
KR20230051529A (ko) | 리소좀 장애에 대한 유전자 요법 | |
KR20210150487A (ko) | 리소좀 장애를 위한 유전자 요법 | |
TW202233830A (zh) | 使用下一代工程化t細胞療法治療癌症之組合物及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |