KR20230160411A - 윌슨병을 치료하기 위한 유전자 치료 - Google Patents
윌슨병을 치료하기 위한 유전자 치료 Download PDFInfo
- Publication number
- KR20230160411A KR20230160411A KR1020237039367A KR20237039367A KR20230160411A KR 20230160411 A KR20230160411 A KR 20230160411A KR 1020237039367 A KR1020237039367 A KR 1020237039367A KR 20237039367 A KR20237039367 A KR 20237039367A KR 20230160411 A KR20230160411 A KR 20230160411A
- Authority
- KR
- South Korea
- Prior art keywords
- atp7b
- raav
- copper
- mice
- aav8
- Prior art date
Links
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 title claims abstract description 67
- 208000018839 Wilson disease Diseases 0.000 title claims abstract description 67
- 238000001415 gene therapy Methods 0.000 title description 26
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 claims abstract description 64
- 239000003623 enhancer Substances 0.000 claims abstract description 40
- 241000702421 Dependoparvovirus Species 0.000 claims abstract description 16
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 171
- 239000013598 vector Substances 0.000 claims description 117
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 claims description 57
- 238000000034 method Methods 0.000 claims description 36
- 210000000234 capsid Anatomy 0.000 claims description 35
- 238000011282 treatment Methods 0.000 claims description 29
- 108091026890 Coding region Proteins 0.000 claims description 28
- 239000000725 suspension Substances 0.000 claims description 14
- 239000007900 aqueous suspension Substances 0.000 claims description 8
- 108091006112 ATPases Proteins 0.000 claims description 6
- 102000057290 Adenosine Triphosphatases Human genes 0.000 claims description 6
- 239000004094 surface-active agent Substances 0.000 claims description 6
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 4
- 101000727865 Homo sapiens Copper transport protein ATOX1 Proteins 0.000 claims description 4
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 claims description 4
- 102000051131 human ATOX1 Human genes 0.000 claims description 4
- 239000007788 liquid Substances 0.000 claims description 4
- 238000010253 intravenous injection Methods 0.000 claims description 3
- 102000013918 Apolipoproteins E Human genes 0.000 claims description 2
- 108010025628 Apolipoproteins E Proteins 0.000 claims description 2
- 239000006172 buffering agent Substances 0.000 claims description 2
- 239000003755 preservative agent Substances 0.000 claims description 2
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 claims 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 claims 1
- 230000002335 preservative effect Effects 0.000 claims 1
- 229910052709 silver Inorganic materials 0.000 claims 1
- 239000004332 silver Substances 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 14
- 108010071690 Prealbumin Proteins 0.000 abstract description 7
- 102000009190 Transthyretin Human genes 0.000 abstract description 7
- 102000050677 human ATP7B Human genes 0.000 abstract description 7
- 241000699670 Mus sp. Species 0.000 description 193
- 239000010949 copper Substances 0.000 description 193
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 191
- 229910052802 copper Inorganic materials 0.000 description 191
- 101150075644 ATP7B gene Proteins 0.000 description 164
- 210000004185 liver Anatomy 0.000 description 103
- 210000002966 serum Anatomy 0.000 description 61
- 241000699666 Mus <mouse, genus> Species 0.000 description 39
- 108020004414 DNA Proteins 0.000 description 38
- 108090000623 proteins and genes Proteins 0.000 description 34
- 238000009825 accumulation Methods 0.000 description 30
- 238000010186 staining Methods 0.000 description 28
- 210000003494 hepatocyte Anatomy 0.000 description 27
- 102100023321 Ceruloplasmin Human genes 0.000 description 26
- 208000019423 liver disease Diseases 0.000 description 26
- 108010075016 Ceruloplasmin Proteins 0.000 description 24
- 206010016654 Fibrosis Diseases 0.000 description 23
- 238000010172 mouse model Methods 0.000 description 23
- 230000004761 fibrosis Effects 0.000 description 21
- 102100028709 Thyroxine-binding globulin Human genes 0.000 description 20
- 230000000694 effects Effects 0.000 description 20
- 230000029142 excretion Effects 0.000 description 16
- 150000007523 nucleic acids Chemical group 0.000 description 16
- 230000002485 urinary effect Effects 0.000 description 16
- 239000013607 AAV vector Substances 0.000 description 15
- 108700019146 Transgenes Proteins 0.000 description 15
- 150000001413 amino acids Chemical group 0.000 description 15
- 239000002245 particle Substances 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 210000002700 urine Anatomy 0.000 description 13
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 201000010099 disease Diseases 0.000 description 12
- 238000001095 inductively coupled plasma mass spectrometry Methods 0.000 description 12
- 230000003902 lesion Effects 0.000 description 12
- 235000018102 proteins Nutrition 0.000 description 12
- 102000004169 proteins and genes Human genes 0.000 description 12
- 241000282414 Homo sapiens Species 0.000 description 11
- 238000008050 Total Bilirubin Reagent Methods 0.000 description 11
- 239000013608 rAAV vector Substances 0.000 description 11
- 238000011161 development Methods 0.000 description 10
- 230000018109 developmental process Effects 0.000 description 10
- 230000017074 necrotic cell death Effects 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- 230000003612 virological effect Effects 0.000 description 10
- 238000001262 western blot Methods 0.000 description 10
- 238000013459 approach Methods 0.000 description 9
- 208000019425 cirrhosis of liver Diseases 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 238000002360 preparation method Methods 0.000 description 9
- 230000008929 regeneration Effects 0.000 description 9
- 238000011069 regeneration method Methods 0.000 description 9
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 8
- 108010082126 Alanine transaminase Proteins 0.000 description 8
- 108010003415 Aspartate Aminotransferases Proteins 0.000 description 8
- 102000004625 Aspartate Aminotransferases Human genes 0.000 description 8
- 102000020856 Copper Transport Proteins Human genes 0.000 description 8
- 108091004554 Copper Transport Proteins Proteins 0.000 description 8
- 108090000854 Oxidoreductases Proteins 0.000 description 8
- 102000004316 Oxidoreductases Human genes 0.000 description 8
- 235000001014 amino acid Nutrition 0.000 description 8
- 229940024606 amino acid Drugs 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 230000002440 hepatic effect Effects 0.000 description 8
- 238000001990 intravenous administration Methods 0.000 description 8
- -1 that is Substances 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 102000012437 Copper-Transporting ATPases Human genes 0.000 description 7
- 206010020880 Hypertrophy Diseases 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 230000002950 deficient Effects 0.000 description 7
- 230000007850 degeneration Effects 0.000 description 7
- 108010078144 glutaminyl-glycine Proteins 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 210000003462 vein Anatomy 0.000 description 7
- 108010067770 Endopeptidase K Proteins 0.000 description 6
- 241000880493 Leptailurus serval Species 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000001802 infusion Methods 0.000 description 6
- 210000003593 megakaryocyte Anatomy 0.000 description 6
- 229910052751 metal Inorganic materials 0.000 description 6
- 239000002184 metal Substances 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 5
- 206010010957 Copper deficiency Diseases 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 206010061218 Inflammation Diseases 0.000 description 5
- 206010060860 Neurological symptom Diseases 0.000 description 5
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 5
- 108010077245 asparaginyl-proline Proteins 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 239000008187 granular material Substances 0.000 description 5
- 230000004054 inflammatory process Effects 0.000 description 5
- 238000002347 injection Methods 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- 230000004060 metabolic process Effects 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 230000000384 rearing effect Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 230000010415 tropism Effects 0.000 description 5
- 239000013603 viral vector Substances 0.000 description 5
- 108091006566 Copper transporters Proteins 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- 102000003929 Transaminases Human genes 0.000 description 4
- 108090000340 Transaminases Proteins 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 238000004132 cross linking Methods 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 4
- 235000005911 diet Nutrition 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 206010020718 hyperplasia Diseases 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 230000003442 weekly effect Effects 0.000 description 4
- VILCJCGEZXAXTO-UHFFFAOYSA-N 2,2,2-tetramine Chemical compound NCCNCCNCCN VILCJCGEZXAXTO-UHFFFAOYSA-N 0.000 description 3
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 3
- 108090000565 Capsid Proteins Proteins 0.000 description 3
- 108010022637 Copper-Transporting ATPases Proteins 0.000 description 3
- VVNCNSJFMMFHPL-VKHMYHEASA-N D-penicillamine Chemical compound CC(C)(S)[C@@H](N)C(O)=O VVNCNSJFMMFHPL-VKHMYHEASA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 3
- 208000024556 Mendelian disease Diseases 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 3
- 108010029485 Protein Isoforms Proteins 0.000 description 3
- 102000001708 Protein Isoforms Human genes 0.000 description 3
- 108091034057 RNA (poly(A)) Proteins 0.000 description 3
- SWIQQMYVHIXPEK-FXQIFTODSA-N Ser-Cys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O SWIQQMYVHIXPEK-FXQIFTODSA-N 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 210000000941 bile Anatomy 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 230000037396 body weight Effects 0.000 description 3
- 230000004663 cell proliferation Effects 0.000 description 3
- 239000002738 chelating agent Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 229910000365 copper sulfate Inorganic materials 0.000 description 3
- ARUVKPQLZAKDPS-UHFFFAOYSA-L copper(II) sulfate Chemical compound [Cu+2].[O-][S+2]([O-])([O-])[O-] ARUVKPQLZAKDPS-UHFFFAOYSA-L 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000032798 delamination Effects 0.000 description 3
- 230000037213 diet Effects 0.000 description 3
- 231100000673 dose–response relationship Toxicity 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 238000007490 hematoxylin and eosin (H&E) staining Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 210000005229 liver cell Anatomy 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 235000013336 milk Nutrition 0.000 description 3
- 239000008267 milk Substances 0.000 description 3
- 210000004080 milk Anatomy 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 230000000926 neurological effect Effects 0.000 description 3
- 230000007170 pathology Effects 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 229920001983 poloxamer Polymers 0.000 description 3
- 229920001993 poloxamer 188 Polymers 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 238000013424 sirius red staining Methods 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- CXVCSRUYMINUSF-UHFFFAOYSA-N tetrathiomolybdate(2-) Chemical compound [S-][Mo]([S-])(=S)=S CXVCSRUYMINUSF-UHFFFAOYSA-N 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- UXTIAFYTYOEQHV-UHFFFAOYSA-N 4-(4-amino-3-methoxyphenyl)-2-methoxyaniline;hydron;dichloride Chemical compound [Cl-].[Cl-].C1=C([NH3+])C(OC)=CC(C=2C=C(OC)C([NH3+])=CC=2)=C1 UXTIAFYTYOEQHV-UHFFFAOYSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- 206010019695 Hepatic neoplasm Diseases 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 2
- 101000797623 Homo sapiens Protein AMBP Proteins 0.000 description 2
- QIGBRXMKCJKVMJ-UHFFFAOYSA-N Hydroquinone Chemical compound OC1=CC=C(O)C=C1 QIGBRXMKCJKVMJ-UHFFFAOYSA-N 0.000 description 2
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 2
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 2
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- 206010067125 Liver injury Diseases 0.000 description 2
- 241001424392 Lucia limbaria Species 0.000 description 2
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 2
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 2
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010065395 Neuropep-1 Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 102000003697 P-type ATPases Human genes 0.000 description 2
- 108090000069 P-type ATPases Proteins 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 2
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- 102100032859 Protein AMBP Human genes 0.000 description 2
- 206010037180 Psychiatric symptoms Diseases 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- 108010000259 Thyroxine-Binding Globulin Proteins 0.000 description 2
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 2
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 2
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 210000000013 bile duct Anatomy 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 208000006990 cholangiocarcinoma Diseases 0.000 description 2
- 230000007882 cirrhosis Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 238000000326 densiometry Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 231100000234 hepatic damage Toxicity 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 230000008818 liver damage Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 210000005075 mammary gland Anatomy 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 208000030159 metabolic disease Diseases 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 229960001639 penicillamine Drugs 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 229960000502 poloxamer Drugs 0.000 description 2
- 229940044519 poloxamer 188 Drugs 0.000 description 2
- 229920001451 polypropylene glycol Polymers 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 239000013647 rAAV8 vector Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000009738 saturating Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- SQGYOTSLMSWVJD-UHFFFAOYSA-N silver(1+) nitrate Chemical compound [Ag+].[O-]N(=O)=O SQGYOTSLMSWVJD-UHFFFAOYSA-N 0.000 description 2
- BCWRXLLYMXFJDY-UHFFFAOYSA-M sodium;4-hydroxy-4-oxo-2,3-bis(sulfanyl)butanoate Chemical compound [Na+].OC(=O)C(S)C(S)C([O-])=O BCWRXLLYMXFJDY-UHFFFAOYSA-M 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000012289 standard assay Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- ACTRVOBWPAIOHC-UHFFFAOYSA-N succimer Chemical compound OC(=O)C(S)C(S)C(O)=O ACTRVOBWPAIOHC-UHFFFAOYSA-N 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- XUIIKFGFIJCVMT-UHFFFAOYSA-N thyroxine-binding globulin Natural products IC1=CC(CC([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-UHFFFAOYSA-N 0.000 description 2
- 210000003412 trans-golgi network Anatomy 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 229960001124 trientine Drugs 0.000 description 2
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 2
- 230000036325 urinary excretion Effects 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- FFJCNSLCJOQHKM-CLFAGFIQSA-N (z)-1-[(z)-octadec-9-enoxy]octadec-9-ene Chemical compound CCCCCCCC\C=C/CCCCCCCCOCCCCCCCC\C=C/CCCCCCCC FFJCNSLCJOQHKM-CLFAGFIQSA-N 0.000 description 1
- JVKUCNQGESRUCL-UHFFFAOYSA-N 2-Hydroxyethyl 12-hydroxyoctadecanoate Chemical compound CCCCCCC(O)CCCCCCCCCCC(=O)OCCO JVKUCNQGESRUCL-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 101150009299 5.1 gene Proteins 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 208000009304 Acute Kidney Injury Diseases 0.000 description 1
- 208000007788 Acute Liver Failure Diseases 0.000 description 1
- 206010000804 Acute hepatic failure Diseases 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- YHOPXCAOTRUGLV-XAMCCFCMSA-N Ala-Ala-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YHOPXCAOTRUGLV-XAMCCFCMSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- SHKGHIFSEAGTNL-DLOVCJGASA-N Ala-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 SHKGHIFSEAGTNL-DLOVCJGASA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108010071619 Apolipoproteins Proteins 0.000 description 1
- 102000007592 Apolipoproteins Human genes 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- NXVGBGZQQFDUTM-XVYDVKMFSA-N Asn-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N NXVGBGZQQFDUTM-XVYDVKMFSA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- JPSODRNUDXONAS-XIRDDKMYSA-N Asn-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC(=O)N)N JPSODRNUDXONAS-XIRDDKMYSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 1
- JOCQXVJCTCEFAZ-CIUDSAMLSA-N Asp-His-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O JOCQXVJCTCEFAZ-CIUDSAMLSA-N 0.000 description 1
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 1
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- SAKCBXNPWDRWPE-BQBZGAKWSA-N Asp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N SAKCBXNPWDRWPE-BQBZGAKWSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 206010010940 Coombs negative haemolytic anaemia Diseases 0.000 description 1
- 208000029011 Copper metabolism disease Diseases 0.000 description 1
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 1
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 1
- ZQHQTSONVIANQR-BQBZGAKWSA-N Cys-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N ZQHQTSONVIANQR-BQBZGAKWSA-N 0.000 description 1
- VTJLJQGUMBWHBP-GUBZILKMSA-N Cys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N VTJLJQGUMBWHBP-GUBZILKMSA-N 0.000 description 1
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 1
- LYSHSHHDBVKJRN-JBDRJPRFSA-N Cys-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N LYSHSHHDBVKJRN-JBDRJPRFSA-N 0.000 description 1
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 1
- RAGIABZNLPZBGS-FXQIFTODSA-N Cys-Pro-Cys Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O RAGIABZNLPZBGS-FXQIFTODSA-N 0.000 description 1
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 1
- LLUXQOVDMQZMPJ-KKUMJFAQSA-N Cys-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CS)CC1=CC=C(O)C=C1 LLUXQOVDMQZMPJ-KKUMJFAQSA-N 0.000 description 1
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 1
- XUIIKFGFIJCVMT-GFCCVEGCSA-N D-thyroxine Chemical class IC1=CC(C[C@@H](N)C(O)=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-GFCCVEGCSA-N 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 208000014094 Dystonic disease Diseases 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- 108010088842 Fibrinolysin Proteins 0.000 description 1
- 238000001159 Fisher's combined probability test Methods 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 1
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- PONUFVLSGMQFAI-AVGNSLFASA-N Gln-Asn-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PONUFVLSGMQFAI-AVGNSLFASA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ATTWDCRXQNKRII-GUBZILKMSA-N Gln-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ATTWDCRXQNKRII-GUBZILKMSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- FGWRYRAVBVOHIB-XIRDDKMYSA-N Gln-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O FGWRYRAVBVOHIB-XIRDDKMYSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- GTFYQOVVVJASOA-ACZMJKKPSA-N Glu-Ser-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N GTFYQOVVVJASOA-ACZMJKKPSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- ZKLYPEGLWFVRGF-IUCAKERBSA-N Gly-His-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZKLYPEGLWFVRGF-IUCAKERBSA-N 0.000 description 1
- UUWOBINZFGTFMS-UWVGGRQHSA-N Gly-His-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O UUWOBINZFGTFMS-UWVGGRQHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- IROABALAWGJQGM-OALUTQOASA-N Gly-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)CN IROABALAWGJQGM-OALUTQOASA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 1
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 1
- DVHGLDYMGWTYKW-GUBZILKMSA-N His-Gln-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DVHGLDYMGWTYKW-GUBZILKMSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- 101100436485 Homo sapiens ATP7B gene Proteins 0.000 description 1
- 101000581507 Homo sapiens Methyl-CpG-binding domain protein 1 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000615495 Homo sapiens Methyl-CpG-binding domain protein 3 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 1
- SHBUUTHKGIVMJT-UHFFFAOYSA-N Hydroxystearate Chemical compound CCCCCCCCCCCCCCCCCC(=O)OO SHBUUTHKGIVMJT-UHFFFAOYSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 1
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- OEQKGSPBDVKYOC-ZKWXMUAHSA-N Ile-Gly-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OEQKGSPBDVKYOC-ZKWXMUAHSA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- QQVXERGIFIRCGW-NAKRPEOUSA-N Ile-Ser-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N QQVXERGIFIRCGW-NAKRPEOUSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- HODVZHLJUUWPKY-STECZYCISA-N Ile-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=C(O)C=C1 HODVZHLJUUWPKY-STECZYCISA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 206010023321 Kayser-Fleischer ring Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- ZCWWVXAXWUAEPZ-SRVKXCTJSA-N Lys-Met-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZCWWVXAXWUAEPZ-SRVKXCTJSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- HOLJKDOBVJDHCA-DCAQKATOSA-N Met-His-Cys Chemical compound N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(O)=O HOLJKDOBVJDHCA-DCAQKATOSA-N 0.000 description 1
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 1
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 1
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 1
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 102100027383 Methyl-CpG-binding domain protein 1 Human genes 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100021291 Methyl-CpG-binding domain protein 3 Human genes 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 238000011887 Necropsy Methods 0.000 description 1
- 208000008457 Neurologic Manifestations Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- HGNGAMWHGGANAU-WHOFXGATSA-N Phe-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HGNGAMWHGGANAU-WHOFXGATSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 1
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920001214 Polysorbate 60 Polymers 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 208000033626 Renal failure acute Diseases 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- CJNCVBHTDXKTMJ-CYDGBPFRSA-N Ser-Asp-Lys-Pro Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(O)=O CJNCVBHTDXKTMJ-CYDGBPFRSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- HAYADTTXNZFUDM-IHRRRGAJSA-N Ser-Tyr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HAYADTTXNZFUDM-IHRRRGAJSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 229920001304 Solutol HS 15 Polymers 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 1
- UTCFSBBXPWKLTG-XKBZYTNZSA-N Thr-Cys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O UTCFSBBXPWKLTG-XKBZYTNZSA-N 0.000 description 1
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- WYHIICXRPHEJKI-UHFFFAOYSA-N Trientine hydrochloride Chemical compound Cl.Cl.NCCNCCNCCN WYHIICXRPHEJKI-UHFFFAOYSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 1
- SSNGFWKILJLTQM-QEJZJMRPSA-N Trp-Gln-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SSNGFWKILJLTQM-QEJZJMRPSA-N 0.000 description 1
- KDWZQYUTMJSYRJ-BHYGNILZSA-N Trp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O KDWZQYUTMJSYRJ-BHYGNILZSA-N 0.000 description 1
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 1
- 238000010162 Tukey test Methods 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- FFCRCJZJARTYCG-KKUMJFAQSA-N Tyr-Cys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O FFCRCJZJARTYCG-KKUMJFAQSA-N 0.000 description 1
- UMXSDHPSMROQRB-YJRXYDGGSA-N Tyr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UMXSDHPSMROQRB-YJRXYDGGSA-N 0.000 description 1
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 1
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- DLMNFMXSNGTSNJ-PYJNHQTQSA-N Val-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N DLMNFMXSNGTSNJ-PYJNHQTQSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 1
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 201000011040 acute kidney failure Diseases 0.000 description 1
- 231100000836 acute liver failure Toxicity 0.000 description 1
- 208000012998 acute renal failure Diseases 0.000 description 1
- 238000009098 adjuvant therapy Methods 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- UYJXRRSPUVSSMN-UHFFFAOYSA-P ammonium sulfide Chemical compound [NH4+].[NH4+].[S-2] UYJXRRSPUVSSMN-UHFFFAOYSA-P 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003957 anion exchange resin Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 108010003875 apoceruloplasmin Proteins 0.000 description 1
- 239000008365 aqueous carrier Substances 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 208000025341 autosomal recessive disease Diseases 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 230000036765 blood level Effects 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 238000002655 chelation therapy Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000002038 chemiluminescence detection Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 150000001879 copper Chemical class 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 201000004997 drug-induced lupus erythematosus Diseases 0.000 description 1
- 208000010118 dystonia Diseases 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000003366 endpoint assay Methods 0.000 description 1
- 210000001842 enterocyte Anatomy 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000011544 gradient gel Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000010224 hepatic metabolism Effects 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 229940072106 hydroxystearate Drugs 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000031891 intestinal absorption Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- MEFBJEMVZONFCJ-UHFFFAOYSA-N molybdate Chemical compound [O-][Mo]([O-])(=O)=O MEFBJEMVZONFCJ-UHFFFAOYSA-N 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 230000008816 organ damage Effects 0.000 description 1
- 230000000803 paradoxical effect Effects 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 102000013415 peroxidase activity proteins Human genes 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- NTGBUUXKGAZMSE-UHFFFAOYSA-N phenyl n-[4-[4-(4-methoxyphenyl)piperazin-1-yl]phenyl]carbamate Chemical compound C1=CC(OC)=CC=C1N1CCN(C=2C=CC(NC(=O)OC=3C=CC=CC=3)=CC=2)CC1 NTGBUUXKGAZMSE-UHFFFAOYSA-N 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- OXNIZHLAWKMVMX-UHFFFAOYSA-N picric acid Chemical compound OC1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-N 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 229940012957 plasmin Drugs 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000009528 severe injury Effects 0.000 description 1
- 229910001961 silver nitrate Inorganic materials 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000011272 standard treatment Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229940036222 syprine Drugs 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 231100000033 toxigenic Toxicity 0.000 description 1
- 230000001551 toxigenic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 229920000428 triblock copolymer Polymers 0.000 description 1
- 229960002408 trientine hydrochloride Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 210000001635 urinary tract Anatomy 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
- 150000003738 xylenes Chemical class 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0075—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/745—Blood coagulation or fibrinolysis factors
- C07K14/755—Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/48—Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Animal Behavior & Ethology (AREA)
- Zoology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Epidemiology (AREA)
- Virology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Hematology (AREA)
- Gastroenterology & Hepatology (AREA)
- Neurosurgery (AREA)
- Obesity (AREA)
- Diabetes (AREA)
- Neurology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Environmental Sciences (AREA)
Abstract
윌슨병을 치료하는 데 유용한 조성물 및 섭생이 제공된다. 상기 조성물은 인간 ATP7B의 발현을 추진시키는 트란스타이레틴 인핸서 및 촉진자를 갖는 재조합 아데노 연관된 바이러스(rAAV)를 포함한다.
Description
전자 형태로 제출된 자료의 참고에 의한 포함
출원인은 본 명세서로부터 전자 형태로 제출된 서열 목록 자료를 참고로 본 명세서에 포함시킨다. 이 파일은 "UPN-16-7940PCT_ST25.txt"로 표지된다.
1. 도입
본 출원은 윌슨병(Wilson's Disease)을 치료하기 위한 유전자 치료에 유용한 실시형태에 관한 것이다.
본 출원은 윌슨병을 치료하기 위한 유전자 치료에 유용한 실시형태에 관한 것이다. 윌슨병은 13번 염색체에서 구리 수송 ATPase 2(ATP7B) 유전자의 돌연변이로 인한 상염색체 열성 유전 장애 구리 저장 장애이다. 구리는, 통상적으로 12세 내지 23세에 관찰되는, 신경학적 또는 정신의학적 증상 및 간 질환으로서 표출되는 조직에서 축적한다. 적절한 치료 없이 시간이 지나면서, 높은 구리 수준은 삶을 위협하는 기관 손상을 야기할 수 있다.
윌슨병에 대한 현재의 치료 접근법은 이환된 개체가 평생 약제를 섭취할 것을 필요로 하는 킬레이트화제(페니실라민[Cuprimine] 및 트라이엔틴 하이드로클로라이드[Syprine]), (구리의 장세포 흡수를 차단하기 위한) 아연 및 테트라티오몰리브데이트(TM), 순환 시 알부민과 착체를 형성하는 구리 킬레이터에 의한 매일의 경구 치료이다. 더욱이, 이 치료는 부작용, 예컨대 약물 유도된 루푸스, 근무력증, 역설적인 악화를 야기할 수 있고, 일반 구리 대사를 복원하지 않는다. 간 이식은 윌슨병에 치유력이 있지만, 이식 수혜자는 거부를 막기 위해 일정한 면역 억제 섭생을 유지할 것이 요구된다.
본 명세서에 기재된 실시형태는, 윌슨병("WD")의 임상적으로 의미 있는 수정을 장기간, 아마도 10년 이상 발생시키는, 벡터의 정맥내(IV) 투여 이후에 이를 필요로 하는 대상체에게 정상 인간 구리 수송 ATPase 2(ATP7B)를 전달하기 위한 AAV 유전자 치료 벡터에 관한 것이다. 벡터 용량은 순환 구리 수준을 약 25% 이상 감소시키도록 ATP7B의 혈액 수준을 전달하도록 의도된다. 일 실시형태에서, 순환 구리의 수준을 뇨에서의 구리의 배설을 통해 평가하였다. 또 다른 실시형태에서, 혈장에서의 순환 구리의 수준을 평가하였다.
일 양태에서, 본 출원은 WD로 진단된 환자(인간 대상체)의 간 세포에 인간 구리 수송 ATPase 2(ATP7B) 유전자를 전달하기 위한 복제 결핍 아데노 연관된 바이러스(AAV)의 용도를 제공한다. hATP7B 유전자("rAAV.hATP7B")를 전달하기 위해 사용된 재조합 AAV 벡터(rAAV)는 간에 대한 지향성(tropism)(예를 들어, AAV8 캡시드를 보유하는 rAAV)을 가져야 하고, hATP7B 전이유전자는 간 특이적 발현 제어 요소에 의해 제어되어야 한다. 일 실시형태에서, 발현 제어 요소는 하기 중 하나 이상을 포함한다: 인핸서; 촉진자; 인트론; WPRE; 및 polyA 신호. 이러한 요소는 본 명세서에 추가로 기재되어 있다. hATP7B 암호화 서열의 크기로 인해, 효과적인 발현을 허용하는 제어 요소의 선택이 중요하다. 전이유전자의 발현이 충분하지 않는 경우, 결함의 수정에 필요한 벡터 투약량은 실행하기에 너무 높을 것이다. 따라서, 본 명세서에 기재된 바대로, 예를 들어 인핸서, 촉진자 및 polyA의 선택은 중요하다.
일 실시형태에서, hATP7B 암호화 서열은 서열 번호 1에 기재되어 있다. 일 실시형태에서, ATP7B 단백질 서열은 서열 번호 2에 기재되어 있다. hATP7B에 대한 암호화 서열은, 일 실시형태에서, 인간에서의 발현을 위해 코돈 최적화된다. 이러한 서열은 네이티브 hATP7B 암호화 서열(서열 번호 3)과 80% 미만의 동일성을 공유할 수 있다. 일 실시형태에서, hATP7B 암호화 서열은 서열 번호 1에 기재된 것이다.
또 다른 양태에서, 본 명세서에 기재된 rAAV를 포함하는, WD 환자에게 투여하기에 적합한, 수성 현탁액이 본 명세서에 제공된다. 몇몇 실시형태에서, 현탁액은 수성 현탁 액체 및 약 1x1012 내지 약 1x1014의 rAAV의 게놈 카피(GC)/㎖를 포함한다. 현탁액은, 일 실시형태에서, 정맥내 주사에 적합하다. 다른 실시형태에서, 현탁액은 수성 현탁 액체 중에 용해된 계면활성제, 보존제, 및/또는 완충제를 추가로 포함한다.
또 다른 실시형태에서, 본 명세서에 기재된 바대로 rAAV에 의해 WD를 갖는 환자를 치료하는 방법이 본 명세서에 제공된다. 일 실시형태에서, 약 1x1011 내지 약 3x1013의 rAAV의 게놈 카피(GC)/환자 체중(㎏)은 수성 현탁액 중에 환자 전달된다.
도 1은 AAV8.En34.TBG-S1.hATP7Bco.PA75 벡터의 도식적 표시이다.
도 2a 내지 도 2b는 뇨 및 혈청 구리 수준이 Atp7b KO 마우스에서 시간이 지나면서 증가한다는 것을 나타낸다. 시간에 걸친 Atp7b KO 마우스에서의 (a) 뇨 및 (b) 혈청 구리 수준(검정). 이형접합성 한배새끼(Het)는 대조군으로서 작용하였다(회색). 샘플은 자연사 연구에서 주마다 수집되고, 유도 커플링된 플라즈마-질량 분광법은 구리 수준을 평가하도록 수행되었다.
도 3a 내지 도 3c는 Atp7b KO 마우스에서 뇨, 구리 수준, 혈청 구리 수준, 및 간 질환 스코어링을 나타낸다. (a) 뇨 및 (b) 혈청 구리 수준은 시간이 지나면서 수컷 및 암컷 이형접합성(Het) 및 Atp7b KO 마우스(KO)에서 유도 커플링된 플라즈마-질량 분광법에 의해 평가되었다. (c) Atp7b KO 마우스를 2, 3, 4, 5, 9, 10 및 12개월령에 부검하였다. 간을 수확하고, H&E에 의해 염색하고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가하였다. 값은 평균±SEM으로 표시되었다.
도 4는 Atp7b KO 마우스에서의 팀 염색(Timm's staining)을 나타낸다. 확인 번호 1345를 갖는 2개월령 Atp7b KO 마우스의 간에서의 구리에 대한 팀 염색의 대표적인 결과. 검정 침착물은 구리에 대한 양성 염색을 나타낸다. 확인 번호 307을 갖는 3.7개월령 야생형 마우스는 음성 대조군으로서 작용하였다.
도 5는 Atp7b KO 마우스에서 간 질환이 시간이 지나면서 발생한다는 것을 나타낸다. Atp7b KO 마우스를 2, 3, 4, 5, 9, 10 및 12개월령에 부검하고, 간을 수확하여 간 질환을 평가하였다. H&E, 씨리우스 레드 및 팀 염색을 섬유증 및 구리 축적을 포함하는 간 병변의 조직병리학적 평가를 위해 수행하였다. *, 12개월령 Atp7b KO 마우스의 간 내의 재생의 부위. WT, 팀 염색에 의해 보이는 것처럼 구리 축적에 대한 음성 대조군으로서의 야생형 마우스로부터의 절편.
도 6a 내지 도 6c는 8개월령 Atp7b KO 마우스에서의 혈청 화학 값을 나타낸다. 8개월령 Atp7b KO 마우스(KO) 및 이형접합성 마우스(Het)에서의 (a) ALT, (b) AST 및 (c) 총 빌리루빈 수준.
도 7은 8개월령 Atp7b KO 마우스에서의 간 질환을 나타낸다. Atp7b KO 및 이형접합성(Het) 마우스를 8개월령에 부검하였다. 간을 수확하고, H&E에 의해 염색하고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가하였다. 값은 평균±SEM으로 표시되었다.
도 8a 및 도 8b는 8개월령 Atp7b KO 마우스에서의 간 섬유증 및 구리 축적을 나타낸다. Atp7b KO(KO) 및 이형접합성(Het) 마우스를 8개월령에 부검하였다. 간을 수확하고, 각각 섬유증 및 구리 축적의 평가를 위해 씨리우스 레드 및 팀 염색에 의해 염색하였다. (a) 섬유증 및 (b) 구리 축적을 포함하는 간 병변의 조직병리학적 평가를 1 내지 5 스코어링 시스템에 따라 수행하였다. 값은 평균±SEM으로 표시되었다.
도 9는 8개월령 Atp7b KO 마우스 Atp7b KO(KO) 및 이형접합성(Het) 마우스에서의 간 구리 수준이 8개월령에 부검된다는 것을 나타낸다. 간을 수확하고, 간 구리 수준을 유도 커플링된 플라즈마-질량 분광법에 의해 평가하였다. 값은 평균±SEM으로 표시되었다.
도 10a 내지 도 10c는 AAV8 유전자 치료가 Atp7b KO 마우스에서 정상 간 구리 대사를 복원할 수 있다는 것을 나타낸다. 수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1011 GC/마우스 및 1010 GC/마우스에 의해 i.v. 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 1011, 1010 및 109 GC/마우스에 의해 i.v. 주사하였다. (a) 수컷 및 (b) 암컷에서의 혈청 구리 수준은 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 연령 일치된 수컷 및 암컷 이형접합성(het) 및 Atp7b KO 마우스로부터의 혈청 구리 수준과 비교되었다. 마우스를 9개월령에 부검하고, 간을 수확하였다. (c) 간 구리 수준은 또한 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 연령 일치된 비주사된 이형접합성(het) 및 Atp7b KO 마우스와 비교되었다. 값은 평균±SEM으로 표시되었다. ns, 무의미; ** p<0.01, **** p<0.0001.
도 11은 고용량 AAV8 유전자 치료가 Atp7b KO 마우스에서 간 질환의 발생을 예방한다는 것을 나타낸다. 수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1011 GC/마우스 및 1010 GC/마우스에 의해 i.v. 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 1011, 1010 및 109 GC/마우스에 의해 i.v. 주사하였다. 마우스를 9개월령에 부검하고, 간을 수확하여 간 질환을 평가하였다. H&E, 씨리우스 레드 및 팀 염색을 수행하여 섬유증 및 구리 축적을 포함하는 간의 조직병리학적 병변을 평가하였다. 연령 일치된 비주사된 Atp7b KO 마우스로부터의 영상은 비교에 포함되었다(또한 도 2에 제시됨). WT, 팀 염색에 의해 보이는 것처럼 구리 축적에 대한 음성 대조군으로서의 야생형(WT) 마우스로부터의 절편. KO, 팀 염색에 의해 보이는 것처럼 구리 축적에 대한 양성 대조군으로서의 2개월령 Atp7b KO 마우스로부터의 절편.
도 12a 내지 도 12c는 Atp7b KO 마우스에서의 고용량 AAV8 유전자 치료 이후에 간 질환의 예방의 정량화를 나타낸다. 수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1011 GC/마우스 및 1010 GC/마우스에 의해 i.v. 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 1011, 1010 및 109 GC/마우스에 의해 i.v. 주사하였다. 마우스를 9개월령에 부검하고, 조직학적 평가를 위해 간을 수확하였다. (a) 간 절편을 H&E에 의해 염색하고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가하였다. (b) 간 절편을 씨리우스 레드에 의해 염색하고, 1 내지 3 스코어링 시스템에 따라 섬유증에 대해 평가하고, (c) 팀 염색을 1 내지 5 스코어링 시스템에 따라 구리 축적의 평가를 위해 간 절편에서 수행하였다. 평균±SEM으로 표시된 값은 연령 일치된 비주사된 이형접합성(Het) 및 Atp7b KO 마우스와 비교되었다, ns, 무의미; * p<0.05, ** p<0.01, *** p<0.001, **** p<0.0001.
도 13a 내지 도 13c는 AAV8 유전자 치료 이후에 Atp7b KO 마우스에서의 혈청 화학 수준을 나타낸다. 수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1011 GC/마우스 및 1010 GC/마우스에 의해 IV 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 1011, 1010, 및 109 GC/마우스에 의해 i.v. 주사하였다. (a) ALT, (b) AST 및 (c) 총 빌리루빈 수준을 혈청에서 평가하였다.
도 14는 웨스턴 블롯에 의한 세룰로플라스민의 검출을 나타낸다. 마우스당 AAV8.EnTTR.TTR.hATP7Bco.PA75의 1010 또는 1011 GC가 i.v. 주사된 Atp7b KO 마우스에서의 세룰로플라스민의 구리 결합(Holo, 하부 밴드) 및 구리 비결합(Apo, 상부 밴드) 형태를 검출하는 웨스턴 블롯. 혈액 샘플을 투여 후 21에 수집하였다. 단백질 마커는 비교를 위해 중앙 레인에 제공되었다. 벡터 주사가 없는 Atp7b KO 및 이형접합성(het) 한배새끼는 대조군으로서 작용하였다(1318, 6개월령 het; 1313, 6개월령 Atp7b KO; 388, Atp7b KO).
도 15a 내지 도 15b는 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 혈청 구리 수준을 나타낸다. Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(원, EnTTR.TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; 정사각형, En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; 정삼각형, En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; 역삼각형, ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; 마름모, En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 비주사된 Atp7b KO 및 이형접합성(Het) 마우스는 대조군으로서 작용하였다. 혈청 구리 수준은 (a) 암컷 및 (b) 수컷 Atp7b KO 마우스에서 유도 커플링된 플라즈마-질량 분광법에 의해 평가되었다. 값은 평균±SEM으로 표시되었다.
도 16a 내지 도 16c는 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 혈청 화학을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTR.TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. (a) ALT, (b) AST 및 (c) 총 빌리루빈 수준은 혈청에서 평가되었다. 값은 평균±SEM으로 표시되었다.
도 17은 웨스턴 블롯에 의해 결정된 간 ATP7Bco 발현을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTR TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하고, 6개월령에 희생시켰다. Atp7b KO 마우스에서 ATP7B를 검출하는 웨스턴 블롯은 밴드 농도계에 의해 정량화되었다. 값은 평균±SEM으로 표시되었다.
도 18은 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 간 질환을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTR.TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하고, 6개월령에 희생시켰다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. 간 절편은 H&E에 의해 염색되고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가되었다. 값은 평균±SEM으로 표시되었다.
도 19a 내지 도 19b는 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 간 섬유증 및 구리 축적을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTRTTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하고, 6개월령에 희생시켰다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. (a) 간 절편은 씨리우스 레드에 의해 염색되고, 1 내지 3 스코어링 시스템에 따라 섬유증에 대해 평가되고, (b) 팀 염색은 1 내지 5 스코어링 시스템에 따라 구리 축적의 평가를 위해 간 절편에서 수행되었다. 평균±SEM으로 표시된 값은 연령 일치된 비주사된 이형접합성(Het) 및 Atp7b KO(KO) 마우스와 비교되었다.
도 20은 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 간 구리 수준을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTR.TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하고, 6개월령에 희생시켰다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. 간 구리 수준은 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 연령 일치된 비주사된 이형접합성(het) 및 Atp7b KO(KO) 마우스와 비교되었다. 값은 평균±SEM으로 표시되었다.
도 21은 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 웨스턴 블롯에 의한 세룰로플라스민의 검출을 나타낸다. 수컷 Atp7b KO 마우스에서의 세룰로플라스민의 구리 결합(Holo, 하부 밴드) 및 구리 비결합(Apo, 상부 밴드) 형태를 검출하는 웨스턴 블롯은 상이한 인핸서/촉진자 조합(1, AAV8.EnTTR.TTR.hATP7Bco.PA75; 2, AAV8.En34.TBG-S1.hATP7Bco.PA75; 3, AAV8.En34.TTR.hATP7Bco.PA75; 4, AAV8.ABPS.TBG-S1.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 혈액 샘플을 투여 후 21일에 수집하였다. 단백질 마커는 비교를 위해 중앙 레인에 제공되었다. 벡터 주사가 없는 Atp7b KO, 이형접합성(het) 및 야생형(WT) 한배새끼는 대조군으로서 작용하였다(1313, 6개월령 Atp7b KO; 1318, 6개월령 het; 1345, 2개월령 Atp7b KO; 1945, WT).
도 22는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 혈청 구리 수준을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 혈청 구리 수준은 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 시간이 지나면서 이형접합성(Het) 및 Atp7b KO 마우스(KO)와 비교되었다. 값은 평균±SEM으로 표시되었다.
도 23a 내지 도 23c는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 혈청 화학을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하고, (a) ALT, (b) AST 및 (c) 총 빌리루빈 수준은 혈청에서 평가되었다. 값은 평균±SEM으로 표시되었다.
도 24는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서 웨스턴 블롯에 의해 결정된 간 ATP7Bco 발현을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하였다. Atp7b KO 마우스에서 ATP7B를 검출하는 웨스턴 블롯은 밴드 농도계에 의해 정량화되었다. 값은 평균±SEM으로 표시되었다.
도 25는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 간 질환을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하였다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. 간 절편은 H&E에 의해 염색되고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가되었다. 값은 평균±SEM으로 표시되었다.
도 26a 내지 도 26b는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 간 섬유증 및 구리 축적을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하였다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. (a) 간 절편은 씨리우스 레드에 의해 염색되고, 1 내지 3 스코어링 시스템에 따라 섬유증에 대해 평가되고, (b) 팀 염색은 1 내지 5 스코어링 시스템에 따라 구리 축적의 평가를 위해 간 절편에서 수행되었다. 평균±SEM으로 표시된 값은 연령 일치된 비주사된 이형접합성(Het) 및 Atp7b KO(KO) 마우스와 비교되었다.
도 27은 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 간 구리 수준을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하였다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. 간 구리 수준은 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 연령 일치된 비주사된 이형접합성(het) 및 Atp7b KO(KO) 마우스와 비교되었다. 평균±SEM으로 표시된 값은 연령 일치된 비주사된 이형접합성(Het) 및 Atp7b KO(KO) 마우스와 비교되었다.
도 2a 내지 도 2b는 뇨 및 혈청 구리 수준이 Atp7b KO 마우스에서 시간이 지나면서 증가한다는 것을 나타낸다. 시간에 걸친 Atp7b KO 마우스에서의 (a) 뇨 및 (b) 혈청 구리 수준(검정). 이형접합성 한배새끼(Het)는 대조군으로서 작용하였다(회색). 샘플은 자연사 연구에서 주마다 수집되고, 유도 커플링된 플라즈마-질량 분광법은 구리 수준을 평가하도록 수행되었다.
도 3a 내지 도 3c는 Atp7b KO 마우스에서 뇨, 구리 수준, 혈청 구리 수준, 및 간 질환 스코어링을 나타낸다. (a) 뇨 및 (b) 혈청 구리 수준은 시간이 지나면서 수컷 및 암컷 이형접합성(Het) 및 Atp7b KO 마우스(KO)에서 유도 커플링된 플라즈마-질량 분광법에 의해 평가되었다. (c) Atp7b KO 마우스를 2, 3, 4, 5, 9, 10 및 12개월령에 부검하였다. 간을 수확하고, H&E에 의해 염색하고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가하였다. 값은 평균±SEM으로 표시되었다.
도 4는 Atp7b KO 마우스에서의 팀 염색(Timm's staining)을 나타낸다. 확인 번호 1345를 갖는 2개월령 Atp7b KO 마우스의 간에서의 구리에 대한 팀 염색의 대표적인 결과. 검정 침착물은 구리에 대한 양성 염색을 나타낸다. 확인 번호 307을 갖는 3.7개월령 야생형 마우스는 음성 대조군으로서 작용하였다.
도 5는 Atp7b KO 마우스에서 간 질환이 시간이 지나면서 발생한다는 것을 나타낸다. Atp7b KO 마우스를 2, 3, 4, 5, 9, 10 및 12개월령에 부검하고, 간을 수확하여 간 질환을 평가하였다. H&E, 씨리우스 레드 및 팀 염색을 섬유증 및 구리 축적을 포함하는 간 병변의 조직병리학적 평가를 위해 수행하였다. *, 12개월령 Atp7b KO 마우스의 간 내의 재생의 부위. WT, 팀 염색에 의해 보이는 것처럼 구리 축적에 대한 음성 대조군으로서의 야생형 마우스로부터의 절편.
도 6a 내지 도 6c는 8개월령 Atp7b KO 마우스에서의 혈청 화학 값을 나타낸다. 8개월령 Atp7b KO 마우스(KO) 및 이형접합성 마우스(Het)에서의 (a) ALT, (b) AST 및 (c) 총 빌리루빈 수준.
도 7은 8개월령 Atp7b KO 마우스에서의 간 질환을 나타낸다. Atp7b KO 및 이형접합성(Het) 마우스를 8개월령에 부검하였다. 간을 수확하고, H&E에 의해 염색하고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가하였다. 값은 평균±SEM으로 표시되었다.
도 8a 및 도 8b는 8개월령 Atp7b KO 마우스에서의 간 섬유증 및 구리 축적을 나타낸다. Atp7b KO(KO) 및 이형접합성(Het) 마우스를 8개월령에 부검하였다. 간을 수확하고, 각각 섬유증 및 구리 축적의 평가를 위해 씨리우스 레드 및 팀 염색에 의해 염색하였다. (a) 섬유증 및 (b) 구리 축적을 포함하는 간 병변의 조직병리학적 평가를 1 내지 5 스코어링 시스템에 따라 수행하였다. 값은 평균±SEM으로 표시되었다.
도 9는 8개월령 Atp7b KO 마우스 Atp7b KO(KO) 및 이형접합성(Het) 마우스에서의 간 구리 수준이 8개월령에 부검된다는 것을 나타낸다. 간을 수확하고, 간 구리 수준을 유도 커플링된 플라즈마-질량 분광법에 의해 평가하였다. 값은 평균±SEM으로 표시되었다.
도 10a 내지 도 10c는 AAV8 유전자 치료가 Atp7b KO 마우스에서 정상 간 구리 대사를 복원할 수 있다는 것을 나타낸다. 수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1011 GC/마우스 및 1010 GC/마우스에 의해 i.v. 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 1011, 1010 및 109 GC/마우스에 의해 i.v. 주사하였다. (a) 수컷 및 (b) 암컷에서의 혈청 구리 수준은 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 연령 일치된 수컷 및 암컷 이형접합성(het) 및 Atp7b KO 마우스로부터의 혈청 구리 수준과 비교되었다. 마우스를 9개월령에 부검하고, 간을 수확하였다. (c) 간 구리 수준은 또한 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 연령 일치된 비주사된 이형접합성(het) 및 Atp7b KO 마우스와 비교되었다. 값은 평균±SEM으로 표시되었다. ns, 무의미; ** p<0.01, **** p<0.0001.
도 11은 고용량 AAV8 유전자 치료가 Atp7b KO 마우스에서 간 질환의 발생을 예방한다는 것을 나타낸다. 수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1011 GC/마우스 및 1010 GC/마우스에 의해 i.v. 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 1011, 1010 및 109 GC/마우스에 의해 i.v. 주사하였다. 마우스를 9개월령에 부검하고, 간을 수확하여 간 질환을 평가하였다. H&E, 씨리우스 레드 및 팀 염색을 수행하여 섬유증 및 구리 축적을 포함하는 간의 조직병리학적 병변을 평가하였다. 연령 일치된 비주사된 Atp7b KO 마우스로부터의 영상은 비교에 포함되었다(또한 도 2에 제시됨). WT, 팀 염색에 의해 보이는 것처럼 구리 축적에 대한 음성 대조군으로서의 야생형(WT) 마우스로부터의 절편. KO, 팀 염색에 의해 보이는 것처럼 구리 축적에 대한 양성 대조군으로서의 2개월령 Atp7b KO 마우스로부터의 절편.
도 12a 내지 도 12c는 Atp7b KO 마우스에서의 고용량 AAV8 유전자 치료 이후에 간 질환의 예방의 정량화를 나타낸다. 수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1011 GC/마우스 및 1010 GC/마우스에 의해 i.v. 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 1011, 1010 및 109 GC/마우스에 의해 i.v. 주사하였다. 마우스를 9개월령에 부검하고, 조직학적 평가를 위해 간을 수확하였다. (a) 간 절편을 H&E에 의해 염색하고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가하였다. (b) 간 절편을 씨리우스 레드에 의해 염색하고, 1 내지 3 스코어링 시스템에 따라 섬유증에 대해 평가하고, (c) 팀 염색을 1 내지 5 스코어링 시스템에 따라 구리 축적의 평가를 위해 간 절편에서 수행하였다. 평균±SEM으로 표시된 값은 연령 일치된 비주사된 이형접합성(Het) 및 Atp7b KO 마우스와 비교되었다, ns, 무의미; * p<0.05, ** p<0.01, *** p<0.001, **** p<0.0001.
도 13a 내지 도 13c는 AAV8 유전자 치료 이후에 Atp7b KO 마우스에서의 혈청 화학 수준을 나타낸다. 수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1011 GC/마우스 및 1010 GC/마우스에 의해 IV 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 1011, 1010, 및 109 GC/마우스에 의해 i.v. 주사하였다. (a) ALT, (b) AST 및 (c) 총 빌리루빈 수준을 혈청에서 평가하였다.
도 14는 웨스턴 블롯에 의한 세룰로플라스민의 검출을 나타낸다. 마우스당 AAV8.EnTTR.TTR.hATP7Bco.PA75의 1010 또는 1011 GC가 i.v. 주사된 Atp7b KO 마우스에서의 세룰로플라스민의 구리 결합(Holo, 하부 밴드) 및 구리 비결합(Apo, 상부 밴드) 형태를 검출하는 웨스턴 블롯. 혈액 샘플을 투여 후 21에 수집하였다. 단백질 마커는 비교를 위해 중앙 레인에 제공되었다. 벡터 주사가 없는 Atp7b KO 및 이형접합성(het) 한배새끼는 대조군으로서 작용하였다(1318, 6개월령 het; 1313, 6개월령 Atp7b KO; 388, Atp7b KO).
도 15a 내지 도 15b는 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 혈청 구리 수준을 나타낸다. Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(원, EnTTR.TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; 정사각형, En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; 정삼각형, En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; 역삼각형, ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; 마름모, En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 비주사된 Atp7b KO 및 이형접합성(Het) 마우스는 대조군으로서 작용하였다. 혈청 구리 수준은 (a) 암컷 및 (b) 수컷 Atp7b KO 마우스에서 유도 커플링된 플라즈마-질량 분광법에 의해 평가되었다. 값은 평균±SEM으로 표시되었다.
도 16a 내지 도 16c는 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 혈청 화학을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTR.TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. (a) ALT, (b) AST 및 (c) 총 빌리루빈 수준은 혈청에서 평가되었다. 값은 평균±SEM으로 표시되었다.
도 17은 웨스턴 블롯에 의해 결정된 간 ATP7Bco 발현을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTR TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하고, 6개월령에 희생시켰다. Atp7b KO 마우스에서 ATP7B를 검출하는 웨스턴 블롯은 밴드 농도계에 의해 정량화되었다. 값은 평균±SEM으로 표시되었다.
도 18은 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 간 질환을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTR.TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하고, 6개월령에 희생시켰다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. 간 절편은 H&E에 의해 염색되고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가되었다. 값은 평균±SEM으로 표시되었다.
도 19a 내지 도 19b는 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 간 섬유증 및 구리 축적을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTRTTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하고, 6개월령에 희생시켰다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. (a) 간 절편은 씨리우스 레드에 의해 염색되고, 1 내지 3 스코어링 시스템에 따라 섬유증에 대해 평가되고, (b) 팀 염색은 1 내지 5 스코어링 시스템에 따라 구리 축적의 평가를 위해 간 절편에서 수행되었다. 평균±SEM으로 표시된 값은 연령 일치된 비주사된 이형접합성(Het) 및 Atp7b KO(KO) 마우스와 비교되었다.
도 20은 암컷 및 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 간 구리 수준을 나타낸다. 암컷 및 수컷 Atp7b KO 마우스에 상이한 인핸서/촉진자 조합(EnTTR.TTR, AAV8.EnTTR.TTR.hATP7Bco.PA75; En34.TBG-S1, AAV8.En34.TBG-S1.hATP7Bco.PA75; En34.TTR, AAV8.En34.TTR.hATP7Bco.PA75; ABPS.TBG-S1, AAV8.ABPS.TBG-S1.hATP7Bco.PA75; En34.mTTR, AAV8.En34.mTTR.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하고, 6개월령에 희생시켰다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. 간 구리 수준은 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 연령 일치된 비주사된 이형접합성(het) 및 Atp7b KO(KO) 마우스와 비교되었다. 값은 평균±SEM으로 표시되었다.
도 21은 수컷 AAV8 벡터 투여된 Atp7b KO 마우스에서의 웨스턴 블롯에 의한 세룰로플라스민의 검출을 나타낸다. 수컷 Atp7b KO 마우스에서의 세룰로플라스민의 구리 결합(Holo, 하부 밴드) 및 구리 비결합(Apo, 상부 밴드) 형태를 검출하는 웨스턴 블롯은 상이한 인핸서/촉진자 조합(1, AAV8.EnTTR.TTR.hATP7Bco.PA75; 2, AAV8.En34.TBG-S1.hATP7Bco.PA75; 3, AAV8.En34.TTR.hATP7Bco.PA75; 4, AAV8.ABPS.TBG-S1.hATP7Bco.PA75)에 의한 hATP7Bco의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 혈액 샘플을 투여 후 21일에 수집하였다. 단백질 마커는 비교를 위해 중앙 레인에 제공되었다. 벡터 주사가 없는 Atp7b KO, 이형접합성(het) 및 야생형(WT) 한배새끼는 대조군으로서 작용하였다(1313, 6개월령 Atp7b KO; 1318, 6개월령 het; 1345, 2개월령 Atp7b KO; 1945, WT).
도 22는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 혈청 구리 수준을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 혈청 구리 수준은 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 시간이 지나면서 이형접합성(Het) 및 Atp7b KO 마우스(KO)와 비교되었다. 값은 평균±SEM으로 표시되었다.
도 23a 내지 도 23c는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 혈청 화학을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하고, (a) ALT, (b) AST 및 (c) 총 빌리루빈 수준은 혈청에서 평가되었다. 값은 평균±SEM으로 표시되었다.
도 24는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서 웨스턴 블롯에 의해 결정된 간 ATP7Bco 발현을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하였다. Atp7b KO 마우스에서 ATP7B를 검출하는 웨스턴 블롯은 밴드 농도계에 의해 정량화되었다. 값은 평균±SEM으로 표시되었다.
도 25는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 간 질환을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하였다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. 간 절편은 H&E에 의해 염색되고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가되었다. 값은 평균±SEM으로 표시되었다.
도 26a 내지 도 26b는 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 간 섬유증 및 구리 축적을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하였다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. (a) 간 절편은 씨리우스 레드에 의해 염색되고, 1 내지 3 스코어링 시스템에 따라 섬유증에 대해 평가되고, (b) 팀 염색은 1 내지 5 스코어링 시스템에 따라 구리 축적의 평가를 위해 간 절편에서 수행되었다. 평균±SEM으로 표시된 값은 연령 일치된 비주사된 이형접합성(Het) 및 Atp7b KO(KO) 마우스와 비교되었다.
도 27은 수컷 AAV8 절두된 ATP7B 벡터 투여된 Atp7b KO 마우스에서의 간 구리 수준을 나타낸다. 수컷 Atp7b KO 마우스에 hATP7Bco의 상이한 절두된 버전(MBD1Del, AAV8.En34.TBG-S1.hATP7BcoMBD1Del.PA75; MBD2Del, AAV8.En34.TBG-S1.hATP7BcoMBD2Del.PA75; MBD3Del, AAV8.En34.TBG-S1.hATP7BcoMBD3Del.PA75; MBD1-2Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-2Del.PA75; MBD1-4Del, AAV8.En34.TBG-S1hATP7BcoMBD1-4Del.PA75; MBD1-5Del, AAV8.En34.TBG-S1.hATP7BcoMBD1-5Del.PA75; TBG-MBD1-4Del, AAV8.TBG.hATP7BcoMBD1-4Del.PA75; TBG-MBD1-5Del, AAV8.TBG.hATP7BcoMBD1-5Del.PA75)의 발현을 위해 AAV8 벡터의 3x1012 GC/㎏를 i.v. 투여하였다. 마우스를 6개월령에 부검하였다. 비히클 대조군 투여된 Atp7b KO(PBS) 마우스는 대조군으로서 작용하였다. 간 구리 수준은 유도 커플링된 플라즈마-질량 분광법에 의해 평가되고, 연령 일치된 비주사된 이형접합성(het) 및 Atp7b KO(KO) 마우스와 비교되었다. 평균±SEM으로 표시된 값은 연령 일치된 비주사된 이형접합성(Het) 및 Atp7b KO(KO) 마우스와 비교되었다.
본 출원에 기재된 실시형태는 윌슨병(WD)으로 진단된 환자(인간 대상체)의 간 세포에 인간 구리 수송 ATPase 2(ATP7B) 유전자를 전달하기 위한 복제 결핍 아데노 연관된 바이러스(AAV)의 용도에 관한 것이다. hATP7B 유전자("rAAV.hATP7B")를 전달하기 위해 사용된 재조합 AAV 벡터(rAAV)는 간에 대한 지향성(예를 들어, AAV8 캡시드를 보유하는 rAAV)을 가져야 하고, hATP7B 전이유전자는 간 특이적 발현 제어 요소에 의해 제어되어야 한다. 일 실시형태에서, 발현 제어 요소는 하기 중 하나 이상을 포함한다: 인핸서; 촉진자; 인트론; WPRE; 및 polyA 신호. 이러한 요소는 본 명세서에 추가로 기재되어 있다.
본 명세서에 사용된 바대로, "AAV8 캡시드"는 GenBank, 수탁번호: YP_077180.1, 서열 번호 16(본 명세서에 참고로 포함됨)의 아미노산 서열을 갖는 AAV8 캡시드를 의미한다. 이 암호화된 서열로부터의 약간의 변동이 허용되고, 이는 YP_077180.1 및 WO 제2003/052051호(본 명세서에 참고로 포함됨)에서 기준 아미노산 서열과 약 99% 동일성을 갖는 서열(즉, 기준 서열로부터 약 1% 미만의 변동)을 포함할 수 있다. 캡시드를 생성하는 방법, 이에 대한 암호화 서열 및 rAAV 바이러스 벡터를 제조하는 방법이 기재되어 있다. 예를 들어, 문헌[Gao, et al, Proc. Natl. Acad. Sci. U.S.A. 100 (10), 6081-6086 (2003)] 및 US 제2015/0315612호를 참조한다.
본 명세서에 사용된 바대로, 용어 "NAb 역가"는 이의 표적화된 에피토프(예를 들어, AAV)의 생리학적 효과를 중화시키는 중화 항체(예를 들어, 항-AAV Nab)가 얼마나 많이 생성되는지의 측정치이다. 항-AAV NAb 역가는 예를 들어 문헌[Calcedo, R., et al., Worldwide Epidemiology of Neutralizing Antibodies to Adeno-Associated Viruses. Journal of Infectious Diseases, 2009. 199(3): p. 381-390](본 명세서에 참고로 포함됨)에 기재된 바대로 측정될 수 있다.
아미노산 서열의 맥락에서 용어 "동일성 백분율(%)", "서열 동일성", "서열 동일성 백분율" 또는 "동일 백분율"은 관련성에 대해 정렬될 때 동일한 2개의 서열에서의 잔기를 의미한다. 동일성 백분율은 단백질의 전장, 폴리펩타이드, 약 32개의 아미노산, 약 330개의 아미노산, 또는 이의 펩타이드 단편 또는 상응하는 핵산 서열 암호화 시퀀서에 대해 아미노산 서열에 대해 용이하게 결정될 수 있다. 적합한 아미노산 단편은 적어도 약 8개의 아미노산 길이일 수 있고, 약 700개 이하의 아미노산일 수 있다. 일반적으로, 2개의 상이한 서열 사이의 "동일성 ", "상동성" 또는 "유사성"을 언급할 때, "동일성", "상동성" 또는 "유사성"은 "정렬된" 서열을 참조하여 결정된다. "정렬된" 서열 또는 "정렬"은 기준 서열과 비교하여 미싱 또는 추가적인 염기 또는 아미노산에 대한 수정을 대개 함유하는 다수의 핵산 서열 또는 단백질(아미노산) 서열을 의미한다. 정렬은 임의의 다양한 공공으로 또는 상업적으로 이용 가능한 Multiple Sequence Alignment Programs를 이용하여 수행된다. 서열 정렬 프로그램, 예를 들어 "Clustal Omega", "Clustal X", "MAP", "PIMA", "MSA", "BLOCKMAKER", "MEME" 및 "Match-Box" 프로그램은 아미노산 서열에 이용 가능하다. 일반적으로, 임의의 이들 프로그램은 디폴트 설정에서 사용되지만, 당업자는 필요한 바대로 이 설정을 변경할 수 있다. 대안적으로, 당업자는 언급된 알고리즘 및 프로그램에 의해 제공된 것과 적어도 동일성 또는 정렬의 수준을 제공하는 또 다른 알고리즘 또는 컴퓨터 프로그램을 이용할 수 있다. 예를 들어, 문헌[J. D. Thomson et al, Nucl. Acids. Res., "A comprehensive comparison of multiple sequence alignments", 27(13):2682-2690 (1999)]을 참조한다.
본 명세서에 사용된 바대로, 용어 "작동 가능하게 연결된"은 관심 대상의 유전자와 인접한 발현 제어 서열 및 관심 대상의 유전자를 제어하도록 트랜스로 또는 일정한 거리에서 작용하는 발현 제어 서열 둘 다를 의미한다.
"복제 결핍 바이러스" 또는 "바이러스 벡터"는 관심 대상의 유전자를 함유하는 발현 카세트가 바이러스 캡시드 또는 엔벨로프에 패키징된 합성 또는 인공 바이러스 입자를 의미하고, 바이러스 캡시드 또는 엔벨로프 내에 또한 패키징된 임의의 바이러스 게놈 서열은 복제 결핍이고; 즉, 이들은 자손 비리온을 생성할 수 없지만, 표적 세포를 감염시키는 능력을 보유한다. 일 실시형태에서, 바이러스 벡터의 게놈은 복제하는 데 필요한 효소를 암호화하는 유전자를 포함하지 않지만(게놈은 "무장(gutless)"이도록 조작될 수 있다 - 인공 게놈의 증폭 및 패키징에 필요한 신호에 의해 측접된 관심 대상의 전이유전자를 오직 함유), 이들 유전자는 제조 동안 공급될 수 있다. 따라서, 자손 비리온에 의한 복제 및 감염이 복제에 필요한 바이러스 효소의 존재 하에를 제외하고 생길 수 없으므로, 이것은 유전자 치료에서 사용하기에 안전하다고 간주된다.
용어 "일" 또는 "하나"는 하나 이상을 의미한다는 것이 주목되어야 한다. 그러므로, 용어 "일"(또는 "하나"), "하나 이상" 및 "적어도 하나"는 본 명세서에서 상호 교환되어 사용된다.
단어 "포함한다", "포함" 및 "포함하는"은 배타적이기보다는 포함적으로 해석되어야 한다. 단어 "이루어진다", "이루어지는" 및 이의 변형어는 포함적이기보다는 배타적으로 해석되어야 한다. 본 명세서에서 다양한 실시형태가 "포함하는" 언어를 사용하여 제시되어 있지만, 다른 상황 하에, 관련된 실시형태는 "이루어진' 또는 "본질적으로 이루어진' 언어를 사용하여 해석되고 기재되는 것으로 또한 의도된다.
본 명세서에 사용된 바대로, 용어 "약"은, 달리 기재되지 않는 한, 주어진 기준으로부터 10%의 변동을 의미한다.
본 명세서에서 달리 정의되지 않는 한, 본 명세서에서 사용된 기술 및 과학 용어는 본 출원에 사용된 많은 용어에 일반 가이드를 제공하는 공개 텍스트에 참고로 당업자에 의해 흔히 이해되는 것과 동일한 의미를 갖는다.
5.1 유전자 치료 벡터
일 양태에서, 인간 ATP7B 유전자를 보유하는 재조합 아데노 연관된 바이러스(rAAV) 벡터는 유전자 치료에서 사용하기 위해 제공된다. rAAV.hATP7B 벡터는 간에 대한 지향성(예를 들어, AAV8 캡시드를 보유하는 rAAV)을 가져야 하고, hATP7B 전이유전자는 간 특이적 발현 제어 요소에 의해 제어되어야 한다. 벡터는 인간 대상체에 대한 점적주사에 적합한 완충제/캐리어에서 제제화된다. 완충제/캐리어는 rAAV가 점적주사 배관에 점착하는 것을 막지만 생체내 rAAV 결합 활성을 방해하지 않는 성분을 포함해야 한다.
5.1.1. rAAV.hATP7B 벡터
5.1.1.1. hATP7B 서열
윌슨병은 구리 수송 P형 ATPase를 암호화하는 ATP7B 유전자의 돌연변이에 의해 주로 생기는 대사의 유전적 오류이다. ATP7B는 담즙으로의 배설 및 기능적 세룰로플라스민의 합성을 위한 아포-세룰로플라스민으로의 도입 둘 다를 위해 세포내 샤페론 단백질로부터 분비 경로로의 구리의 수송을 담당한다. 윌슨병의 발생은 이환된 조직에서의 구리의 축적으로 인한다. 문헌[EASL Clinical Practice Guidelines: Wilson's disease, EASL Journal of Hepatology, 2012, 56(671-85)](본 명세서에 참고로 포함됨)을 참조한다.
윌슨병의 임상 특징은 신경학적 증상을 갖는 환자의 95% 및 신경학적 증상이 없는 사람의 다소 절반 너머 존재하는 카이저-플리셔 고리(Kayser-Fleischer ring)이다. 신경학적 징후, 가장 대개 진전, 운동실조 및 근긴장이상증은 가변적이다. 임의의 유형의 간 질환은 윌슨병을 갖는 환자에 맞닥쳐질 수 있다. 임상적으로 명확한 간 질환이 10년만큼 신경학적 표출에 앞서갈 수 있고, 신경학적 증상을 갖는 대부분의 환자는 제시에서 간 질환의 약간의 정도를 갖는다. 간 질환의 증상의 제시는 오직 생화학 비정상에 의한 무증상으로부터 모든 이의 합병증을 갖는 명확한 간경변까지의 범위로 고도로 가변적일 수 있다. 윌슨병은 또한 때때로 쿠움스(Coombs) 음성 용혈 빈혈과 연관된 급성 간부전 및 급성 신부전으로 제시될 수 있다. 하기 표 1은 WD에서의 예후 지수를 제공한다. (문헌[EASL Clinical Practice Guidelines: Wilson's disease, EASL Journal of Hepatology, 2012, 56(671-85)](본 명세서에 참고로 포함됨)을 참조한다.)
ATP7B는 구리 전좌를 위해 세포막을 통한 경로를 형성하는 8개의 막관통 도메인; 및 6개의 금속 결합 도메인(MBD)을 갖는 큰 N 말단(각각 대략 70개의 아미노산 및 고도로 보존된 금속 결합 모티프 GMxCxxC(여기서, x는 임의의 아미노산임)를 포함함)을 갖는다. 다른 도메인은 막을 통한 구리 전좌에 필요한 막내 CPC 모티프, ATP 결합 부위를 함유하는 N-도메인, 보존된 아스파르트산 잔기를 함유하는 P-도메인 및 포스파타제 도메인을 포함하는 A-도메인을 포함한다. hATP7B 유전자 및/또는 생성된 단백질의 다양한 돌연변이는 윌슨병을 갖는 몇몇의 또는 모든 환자에서 존재한다고 공지되어 있다. WB에 기여하는 공지된 돌연변이의 완전한 목록은 http://www.uniprot.org/uniprot/P35670(본 명세서에 참고로 포함됨)에서 발견될 수 있다. 추가로, 정규 서열(가장 긴 아이소폼인 아이소폼 a라고도 칭함; NCBI 기준 서열: NP_000044.2) 이외에, 4개의 추가적인 아이소폼이 공지되어 있다: NCBI 기준 서열 NP_001005918.1, NP_001230111.1, NP_001317507.1, NP_001317508.1(이들의 각각은 본 명세서에 참고로 포함됨). 본 명세서에 기재된 조성물 및 방법은 질환을 야기하는 임의의 ATP7B 변이체 단백질을 갖는 대상체를 치료하기 위해 사용될 수 있다.
일 실시형태에서, hATP7B 유전자는 서열 번호 2에 기재된 hATP7B 단백질을 암호화한다. 따라서, 일 실시형태에서, hATP7B 전이유전자는 첨부된 서열 목록(본 명세서에 참고로 포함됨)에 제공된 서열 번호 1 또는 서열 번호 3에 의해 제공된 서열을 포함할 수 있지만, 이들로 제한되지는 않는다. 서열 번호 3은 네이티브 인간 ATP7B에 대한 cDNA를 제공한다. 서열 번호 1은 인간에서의 발현에 코돈 최적화된 인간 ATP7B에 대한 조직된 cDNA(때때로 본 명세서에 hATP7Bco라 칭해짐)를 제공한다. 본 명세서에서 hATP7B에 대한 언급은, 몇몇 실시형태에서, 본 명세서에 기재된 hATP7B 네이티브 또는 코돈 최적화된 서열, 또는 임의의 변이체를 의미할 수 있다고 이해되어야 한다. 대안적으로 또는 추가적으로, 웹 기반 또는 상업적으로 구입 가능한 컴퓨터 프로그램, 및 서비스 기반 회사는 RNA 및/또는 cDNA 둘 다를 포함하는 핵산 암호화 서열로 아미노산 서열을 다시 번역하도록 사용될 수 있다. 예를 들어, EMBOSS에 의한 backtranseq, www.ebi.ac.uk/Tools/st/; Gene Infinity (www.geneinfinity.org/sms-/sms_backtranslation.html); ExPasy(www.expasy.org/tools/)를 참조한다. (예를 들어, 코돈 최적화에 의해) 원하는 표적 대상체에서의 발현에 최적화된 핵산 서열을 포함하는, 기재된 hATP7B 폴리펩타이드 서열을 암호화하는 모든 핵산이 포함되는 것으로 의도된다.
ATP7B의 네이티브 암호화 서열은 1465개의 아미노산 단백질(서열 번호 2)을 생성시키는 4.3kb 초과이다(서열 번호 3; Genbank 수탁번호 XM_005266430). ATP7B의 큰 크기 및 AAV 벡터를 포함하는 바이러스 벡터의 패키징 능력으로 인해, 몇몇 실시형태에서, ATP7B 암호화 서열이 짧아지는 것이 바람직하다. 처음의 5개의 MBD의 결실이 야생형과 일치하는 생성된 단백질의 촉매 인산화의 수준을 나타낸다는 것이 밝혀졌다. 문헌[Huster and Lutsenko, J. Biological Chem, June 2003(본 명세서에 참고로 포함됨)]을 참조한다. 따라서, 일 실시형태에서, ATP7B 암호화 서열은 하나 이상의 MDB를 결실시킴으로써 짧아진다. 일 실시형태에서, ATP7B 암호화 서열은 (예를 들어, 서열 번호 17 및 서열 번호 35의 403번 nt 내지 4368번 nt에 기재된 바대로) MBD1-2 결실된다. 또 다른 실시형태에서, ATP7B 암호화 서열은 MBD1-3 결실된다. 또 다른 실시형태에서, ATP7B 암호화 서열은 (예를 들어, 서열 번호 18, 및 서열 번호 34의 403번 nt 내지 3762번 nt 및 서열 번호 29의 1059번 nt 내지 4418번 nt에 기재된 바대로) MBD1-4 결실된다. 또 다른 실시형태에서, ATP7B 암호화 서열은 (예를 들어, 서열 번호 19, 서열 번호 33의 403번 nt 내지 3369번 nt 및 서열 번호 28의 1059번 nt 내지 4025번 nt에 기재된 바대로) MBD1-5 결실된다. 또 다른 실시형태에서, ATP7B 암호화 서열은 (예를 들어, 서열 번호 20 및 서열 번호 32의 403번 nt 내지 4686번 nt에 기재된 바대로) MBD1 결실된다. 또 다른 실시형태에서, ATP7B 암호화 서열은 (예를 들어, 서열 번호 21 및 서열 번호 31의 403번 nt 내지 4617번 nt에 기재된 바대로) MBD2 결실된다. 또 다른 실시형태에서, ATP7B 암호화 서열은 (예를 들어, 서열 번호 22 및 서열 번호 30의 403번 nt 내지 4719번 nt에 기재된 바대로) MBD3 결실된다. 또 다른 실시형태에서, ATP7B 암호화 서열은 (예를 들어, 문헌[Cater et al, Biochem J. 2004 Jun 15; 380(Pt 3): 805-813](본 명세서에 참고로 포함됨)에 기재된 바대로) MBD1-4 및 6 결실된다. 또한, 문헌[Gourdon et al, Biol Chem. 2012 Apr;393(4):205-16; Lutsenko, S., et al. (2007). "Function and regulation of human copper-transporting ATPases." Physiological reviews 87(3): 1011-1046; Safaei, R., et al. (2013). "The role of metal binding and phosphorylation domains in the regulation of cisplatin-induced trafficking of ATP7B." Metallomics 5(8): 964-972]; 및 미국 특허 공보 제2015/0045284호(이들은 각각 본 명세서에 참고로 포함됨)를 참조한다.
일 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 3 또는 서열 번호 1, 또는 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 20, 서열 번호 21 또는 서열 번호 22에 기재된 임의의 변이체의 네이티브 hATP7B 암호화 서열과 적어도 95%의 동일성을 공유한다. 또 다른 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 3 또는 서열 번호 1, 또는 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 20, 서열 번호 21 또는 서열 번호 22에 기재된 임의의 변이체의 네이티브 hATP7B 암호화 서열과 적어도 90%, 85%, 80%, 75%, 70% 또는 65%의 동일성을 공유한다. 일 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 3 또는 서열 번호 1, 또는 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 20, 서열 번호 21 또는 서열 번호 22에 기재된 임의의 변이체의 네이티브 hATP7B 암호화 서열과 적어도 79%의 동일성을 공유한다. 일 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 1이다. 또 다른 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 17이다. 또 다른 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 18이다. 또 다른 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 19이다. 또 다른 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 20이다. 또 다른 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 21이다. 또 다른 실시형태에서, hATP7B를 암호화하는 핵산 서열은 서열 번호 22이다.
코돈 최적화된 암호화 영역은 다양한 상이한 방법에 의해 설계될 수 있다. 이 최적화는 온라인으로 이용 가능한 방법(예를 들어, GeneArt), 공개된 방법 또는 예를 들어 DNA2.0(캘리포니아주 멜론 파크)으로서 코돈 최적화 서비스를 제공하는 회사를 사용하여 수행될 수 있다. 하나의 코돈 최적화 접근법은 예를 들어 국제 특허 공보 WO 제2015/012924호(본 명세서에 참고로 포함됨)에 기재되어 있다. 또한, 예를 들어 미국 특허 공보 제2014/0032186호 및 미국 특허 공보 제2006/0136184호를 참조한다. 적합하게, 생성물에 대한 오픈 리딩 프레임(open reading frame: ORF)의 전체 길이는 변형된다. 그러나, 몇몇 실시형태에서, 오직 ORF의 단편이 변경될 수 있다. 이들 방법 중 하나를 사용함으로써, 임의의 소정의 폴리펩타이드 서열에 빈도수를 적용하고, 폴리펩타이드를 암호화하는 코돈 최적화된 암호화 영역의 핵산 단편을 생성할 수 있다.
코돈에 실제 변형을 수행하거나 또는 본 명세서에 기재된 바대로 설계된 코돈 최적화된 암호화 영역을 합성하기 위한 다수의 옵션이 이용 가능하다. 이러한 변형 또는 합성은 당업자에게 널리 공지된 표준 및 일상적 분자 생물학적 조작을 이용하여 수행될 수 있다. 하나의 접근법에서, 각각 원하는 서열의 길이의 및 이 길이에 이르는 80개 내지 90개의 뉴클레오타이드의 일련의 상보성 올리고뉴클레오타이드 쌍은 표준 방법에 의해 합성된다. 이 올리고뉴클레오타이드 쌍은 어닐링 시 이들이 응집성 말단을 함유하는 80개 내지 90개의 염기쌍의 이중 표준 단편을 형성하도록 합성되고, 예를 들어 쌍에서의 각각의 올리고뉴클레오타이드는 쌍에서의 다른 올리고뉴클레오타이드에 상보성인 영역을 넘어 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 또는 이것 초과의 염기를 확장하도록 합성된다. 올리고뉴클레오타이드의 각각의 쌍의 단일 가닥 말단은 올리고뉴클레오타이드의 또 다른 쌍의 단일 가닥 말단과 어닐링하도록 설계된다. 올리고뉴클레오타이드 쌍은 어닐링하도록 허용되고, 이들 이중 가닥 단편의 대략 5개 내지 6개는 이후 응집성 단일 가닥 말단을 통해 함께 어닐링하도록 허용되고, 이후 이들은 함께 결찰되고, 표준 박테리아 클로닝 벡터, 예를 들어 Thermo Fisher Scientific Inc.로부터 구입 가능한 TOPO(등록상표) 벡터로 클로닝된다. 작제물은 이후 표준 방법에 의해 서열분석된다. 함께 결찰되는 80개 내지 90개의 염기쌍 단편의 5개 내지 6개의 단편, 즉 약 500개의 염기쌍의 단편으로 이루어진 이들 작제물 중 몇몇은 제조되어서, 전체 원하는 서열은 일련의 플라스미드 작제물에서 표시된다. 이들 플라스미드의 인서트는 이후 적절한 제한 효소에 의해 절단되고 함께 결찰되어 최종 작제물을 형성한다. 최종 작제물은 이후 표준 박테리아 클로닝 벡터로 클로닝되고 서열분석된다. 추가적인 방법은 당업자에게 즉시 명확할 것이다. 또한, 유전자 합성은 용이하게 상업적으로 이용 가능하다.
본 명세서에 기재된 치료의 목표는 25% 이상의 혈청 구리 수준을 감소시키는 기능적 ATP7B 효소를 제공하는 것이다. 일 실시형태에서, 24시간마다 3 내지 8pmol 이하의 뇨 구리 배설이 요망된다.
본 명세서에 기재된 치료의 1차/2차 목표는, 제한 없이, 하기를 포함한다.
혈청 비세룰로플라스민 결합된 구리(NCC)의 정상화(150㎍/ℓ 미만)
혈청 아미노전환효소의 정상화(간 생화학물질, ALT/AST)
뇨 Cu의 정상화(40㎍/24시간(0.6μmol/24시간) ULN 미만)
혈청 세룰로플라스민의 정상화(200㎎/ℓ 초과)[부합하지 않을 수 있음]
Clinician Global Impression(CGI) 척도의 개선[1: 중증도 및 2: 전체 개선)
AE의 발생률
배타적:
65Cu, 질량 분광법에 의해 검출될 수 있는 구리의 비방사성 동위원소
IQ, 신경인지 및 정신의학 기능의 개선(통합된 윌슨병 순취 척도(Unified Wilson's Disease Rating Scale: UWDRS) 및 미니 국제 신경정신의학 인터뷰(Mini International Neuropsychiatric Interview: M.I.N.I.)); 및
PRO(EQ5D, MMAS-8, TSQM)
일 실시형태에서, "대상체" 또는 "환자"는 상기 기재된 바와 같은 WD를 갖는 포유류 대상체이다. 임의의 중증도의 WD를 갖는 환자가 의도된 대상체인 것으로 의도된다.
5.1.1.2. rAAV 벡터
ATP7B가 간에서 자연적으로 발현되므로, 간에 대한 지향성을 나타내는 AAV를 사용하는 것이 바람직하다. 일 실시형태에서, 캡시드를 공급하는 AAV는 AAV8이다. 또 다른 실시형태에서, 캡시드를 공급하는 AAV는 AAVrh.10이다. 더욱 또 다른 실시형태에서, 캡시드를 공급하는 AAV는 계통군 E AAV이다. 이러한 AAV는 rh.2; rh.10; rh.25; bb.1, bb.2, pi.1, pi.2, pi.3, rh.38, rh.40, rh.43, rh.49, rh.50, rh.51, rh.52, rh.53, rh.57, rh.58, rh.61, rh.64, hu.6, hu.17, hu.37, hu.39, hu.40, hu.41, hu.42, hu.66 및 hu.67을 포함한다. 이 계통군은 변형된 rh.2; 변형된 rh.58; 및 변형된 rh.64를 추가로 포함한다. WO 제2005/033321호(본 명세서에 참고로 포함됨)를 참조한다. 그러나, 간 지향성을 갖는 임의의 다수의 rAAV 벡터를 사용할 수 있다.
하기에, 실시예에 기재된 구체적인 실시형태에서, 유전자 치료 벡터는 AAV8.En34.TBG-S1.hATP7Bco.PA75라 칭해지는 타이록신 결합 글로불린(TBG-S1) 촉진자의 제어 하에 hATP7B 전이유전자를 발현하는 AAV8 벡터이다. 외부 AAV 벡터 성분은 혈청형 8이다, T = 1, 1:1:10의 비율로 VP1, VP2 및 VP3인 3개의 AAV 바이러스 단백질의 60개의 카피로 이루어진 20면체 캡시드. 캡시드는 단일 가닥 DNA rAAV 벡터 게놈을 함유한다.
일 실시형태에서, rAAV.hATP7B 게놈은 2개의 AAV 역위 말단 반복(ITR)에 의해 측접된 hATP7B 전이유전자를 함유한다. 일 실시형태에서, hATP7B 전이유전자는 인핸서, 촉진자, hATP7B 암호화 서열 및 폴리아데닐화(polyA) 신호 중 하나 이상을 포함한다. 이 제어 서열은 hATP7B 유전자 서열에 "작동 가능하게 연결"된다. 이 서열을 함유하는 발현 카세트는 바이러스 벡터의 제조에 사용된 플라스미드로 조작될 수 있다.
ITR은 벡터 제조 동안 게놈의 복제 및 패키징을 담당하는 유전 요소이고, rAAV를 생성하기 위해 필요한 유일한 바이러스 cis 요소이다. AAV 바이러스 입자로 발현 카세트를 패키징하기 위해 필요한 최소 서열은 캡시드와 동일한 AAV 기원이거나, (AAV 위형을 제조하기 위한) 상이한 AAV 기원일 수 있는 AAV 5' 및 3' ITR이다. 일 실시형태에서, AAV2로부터의 ITR 서열, 또는 이의 결실된 버전(ΔITR)을 사용한다. 그러나, 다른 AAV 소스로부터의 ITR을 선택할 수 있다. ITR의 소스가 AAV2 유래이고 AAV 캡시드가 또 다른 AAV 소스 유래일 때, 생성된 벡터는 위형이라 칭해질 수 있다. 통상적으로, AAV 벡터에 대한 발현 카세트는 AAV 5' ITR, hATP7B 암호화 서열 및 임의의 조절 서열 및 AAV 3' ITR을 포함한다. 그러나, 이 요소의 다른 구성이 적합할 수 있다. D-서열 및 말단 분해 부위(trs)가 결실된, ΔITR이라 칭해지는, 5' ITR의 짧아진 버전이 기재되어 있다. 다른 실시형태에서, 전장 AAV 5' 및 3' ITR을 사용한다. 일 실시형태에서, 5' ITR은 서열 번호 14에 기재된 것이다. 일 실시형태에서, 3' ITR은 서열 번호 15에 기재된 것이다.
일 실시형태에서, 발현 제어 서열은 하나 이상의 인핸서를 포함한다. 일 실시형태에서, 서열 번호 4에 기재된 En34 인핸서(인간 아포리포단백질 간 제어 영역으로부터의 34bp 코어 인핸서)가 포함된다. 또 다른 실시형태에서, EnTTR(트란스타이레틴으로부터의 100bp 인핸서 서열)이 포함된다. 이러한 서열은 서열 번호 5에 기재되어 있다. 문헌[Wu et al, Molecular Therapy, 16(2):280-289, Feb. 2008](본 명세서에 참고로 포함됨)을 참조한다. 더욱 또 다른 실시형태에서, α1-마이크로글로불린/비쿠닌 전구체 인핸서가 포함된다. 더욱 또 다른 실시형태에서, ABPS(α1-마이크로글로불린/비쿠닌 전구체[ABP]로부터 42bp로 100bp 원위 인핸서의 짧아진 버전) 인핸서가 포함된다. 이러한 서열은 서열 번호 6에 기재되어 있다. 더욱 또 다른 실시형태에서, ApoE 인핸서가 포함된다. 이러한 서열은 서열 번호 7에 기재되어 있다. 또 다른 실시형태에서, 하나 초과의 인핸서가 존재한다. 이러한 조합은 본 명세서에 기재된 임의의 인핸서의 하나 초과의 카피, 및/또는 인핸서의 하나 초과의 유형을 포함할 수 있다.
hATP7B 암호화 서열의 발현은 간 특이적 촉진자로부터 추진된다. ATP7B 전이유전자의 크기 때문에, 비교적 작은 크기의 촉진자의 사용이 바람직하다. 본 명세서에 기재된 예시적인 플라스미드 및 벡터는 변형된 타이록신 결합 글로불린(TBG-S1) 촉진자(서열 번호 8)를 사용한다. 또 다른 실시형태에서, TBG 촉진자를 사용한다. TBG 촉진자 서열은 서열 번호 9에 기재되어 있다. 대안적으로, 다른 간 특이적 촉진자, 예컨대 서열 번호 11에 기재된 바와 같은 트란스타이레틴 촉진자(TTR 촉진자) 또는 서열 번호 11의 21번 nt 내지 190번 nt에 기재된 바와 같은 변형된 트란스타이레틴 촉진자(mTTR 촉진자)를 사용할 수 있다. 또 다른 적합한 촉진자는 알파 1 항-트립신(AlAT), 또는 이의 변형된 버전(이의 서열은 서열 번호 10에 기재됨)이다. 다양한 촉진자 및 인핸서 조합은 하기 실시예에 기재되어 있다.
다른 적합한 촉진자는 인간 알부민(Miyatake et al., J. Virol., 71:5124 32 (1997)), humAlb; 간 특이적 촉진자(LSP) 및 B형 간염 바이러스 코어 촉진자(Sandig et al., Gene Ther., 3:1002-9 (1996))를 포함한다. 예를 들어, 문헌[The Liver Specific Gene Promoter Database, Cold Spring Harbor, http://rulai.schl.edu/LSPDrulai.schl.edu/LSPD](참고로 포함됨)을 참조한다. 덜 바람직하지만, 다른 촉진자, 예컨대 바이러스 촉진자, 구성적 촉진자, 조절 가능한 촉진자[예를 들어, WO 제2011/126808호 및 WO 제2013/04943호 참조], 또는 생리학적 신호에 반응하는 촉진자는 본 명세서에 기재된 벡터에서 사용될 수 있다.
촉진자 이외에, 발현 카세트 및/또는 벡터는 다른 적절한 전사 개시, 종결, 인핸서 서열 및 효율적인 RNA 처리 신호를 함유할 수 있다. 이러한 서열은 스플라이싱 및 폴리아데닐화(polyA) 신호; 발현을 증대시키는 조절 요소(예를 들어, WPRE); 세포질 mRNA를 안정화시키는 서열; 번역 효율을 증대시키는 서열(즉, Kozak 공통 서열); 단백질 안정성을 증대시키는 서열; 및 원할 때, 암호화된 생성물의 분비를 증대시키는 서열을 포함한다. 일 실시형태에서, KOZAK 서열이 포함된다. 일 실시형태에서, 폴리아데닐화(polyA) 신호는 hATP7B mRNA 전사체의 종결을 매개하도록 포함된다. 본 명세서에서 유용한 polyA 신호는 서열 번호 13에 기재된 약 75bp 크기인 인공 polyA(PA75)이다. 다른 적합한 polyA 서열의 예는 무엇보다도 예를 들어 소 성장 호르몬(서열 번호 12), SV40, 토끼 베타 글로빈 및 TK polyA를 포함한다.
일 실시형태에서, 조절 서열은 전체 rAAV 벡터 게놈이 약 3.0 내지 약 5.5 킬로염기 크기이도록 선택된다. 일 실시형태에서, rAAV 벡터 게놈가 네이티브 AAV 게놈의 크기에 근접한 것이 바람직하다. 따라서, 일 실시형태에서, 조절 서열은 전체 rAAV 벡터 게놈이 약 4.7kb 크기이도록 선택된다. 또 다른 실시형태에서, 전체 rAAV 벡터 게놈은 5.2kb 크기 미만이다. 추가의 실시형태에서, 전체 rAAV 벡터 게놈은 약 5.1kb 또는 약 5.0kb 크기이다. 벡터 게놈의 크기는 촉진자, 인핸서, 인트론, polyA 등을 포함하는 조절 서열의 크기에 기초하여 조작될 수 있다. 문헌[Wu et al, Mol Ther, Jan 2010 18(1): 80-6](본 명세서에 참고로 포함됨)을 참조한다.
일 실시형태에서, rAAV 벡터 게놈은 서열 번호 23의 1번 nt 내지 5134번 nt, 서열 번호 24의 1번 nt 내지 5056번 nt, 서열 번호 25의 1번 nt 내지 5064번 nt, 서열 번호 26의 1번 nt 내지 5068번 nt, 서열 번호 27의 1번 nt 내지 5048번 nt, 서열 번호 28의 1번 nt 내지 4284번 nt, 서열 번호 29의 1번 nt 내지 4677번 nt, 서열 번호 30의 1번 nt 내지 4978번 nt, 서열 번호 31의 1번 nt 내지 4876번 nt, 서열 번호 32의 1번 nt 내지 4945번 nt, 서열 번호 33의 1번 nt 내지 3628번 nt, 서열 번호 34의 1번 nt 내지 4021번 nt 또는 서열 번호 35의 1번 nt 내지 4627번 nt를 포함한다.
rAAV를 생성하기 위한 예시적인 제조 플라스미드는 서열 번호 23, 서열 번호 24, 서열 번호 25, 서열 번호 26, 서열 번호 27, 서열 번호 28, 서열 번호 29, 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33, 서열 번호 34 및 서열 번호 35에 기재되어 있다.
5.1.2. 조성물
일 실시형태에서, rAAV.hATP7B 바이러스는 수성 담체, 부형제, 희석제 또는 완충제를 포함하는 약제학적 조성물에 제공된다. 일 실시형태에서, 완충제는 PBS이다. 구체적인 실시형태에서, rAAV.hATP7B 제제는 TMN200(200mM 염화나트륨, 1mM 염화마그네슘, 20mM Tris(pH 8.0)) 중에 0,001% Pluronic F-68을 함유하는 수성 용액 중에 현탁된 유효량의 rAAV.hATP7B 벡터를 함유하는 현탁액이다. 그러나, 완충 식염수, 계면활성제 및 약 100mM 염화나트륨(NaCl) 내지 약 250mM 염화나트륨에 동등한 이온 농도로 조정된 생리학적으로 상용성인 염 또는 염의 혼합물, 또는 동등한 이온 농도로 조정된 생리학적으로 상용성인 염 중 하나 이상을 포함하는 것을 포함하는, 다양한 적합한 용액이 공지되어 있다.
예를 들어, 본 명세서에 제공된 바와 같은 현탁액은 NaCl 및 KCl 둘 다를 함유할 수 있다. pH는 6.5 내지 8.5, 또는 7 내지 8.5, 또는 7.5 내지 8의 범위일 수 있다. 적합한 계면활성제, 또는 계면활성제의 조합은 폴록사머, 즉 폴리옥시에틸렌(폴리에틸렌 옥사이드)의 2개의 친수성 사슬에 의해 측접된 폴리옥시프로필렌(폴리프로필렌 옥사이드)의 중앙 소수성 사슬로 이루어진 비이온성 삼중블록 공중합체, SOLUTOL HS 15(마크로골-15 하이드록시스테아레이트), LABRASOL(폴리옥시 카프릴릭 글라이세라이드), 폴리옥시 10 올레일 에터, TWEEN(폴리옥시에틸렌 소르비탄 지방산 에스터), 에탄올 및 폴리에틸렌 글라이콜 중에서 선택될 수 있다. 일 실시형태에서, 제제는 폴록사머를 함유한다. 이 공중합체는 흔히 철자 "P"(폴록사머에 대해), 이어서 3개의 숫자에 의해 명명된다: 처음의 2개의 숫자 x 100은 폴리옥시프로필렌 코어의 근사 분자 질량을 주고, 마지막 숫자 x 10은 백분율 폴리옥시에틸렌 함량을 준다. 일 실시형태에서, 폴록사머 188이 선택된다. 계면활성제는 현탁액의 약 0.0005% 내지 약 0.001% 이하의 양으로 존재할 수 있다. 또 다른 실시형태에서, 벡터는 180mM 염화나트륨, 10mM 인산나트륨, 0.001% 폴록사머 188(pH 7.3)을 함유하는 수성 용액 중에 현탁된다.
일 실시형태에서, 제제는 인간 대상체에서 사용하기에 적합하고, 정맥내 투여된다. 일 실시형태에서, 제제는 볼루스 주사에 의해 말초 정맥을 통해 전달된다. 일 실시형태에서, 제제는 약 10분(±5분)에 걸쳐 점적주사에 의해 말초 정맥을 통해 전달된다. 일 실시형태에서, 제제는 약 20분(±5분)에 걸쳐 점적주사에 의해 말초 정맥을 통해 전달된다. 일 실시형태에서, 제제는 약 30분(±5분)에 걸쳐 점적주사에 의해 말초 정맥을 통해 전달된다. 일 실시형태에서, 제제는 약 60분(±5분)에 걸쳐 점적주사에 의해 말초 정맥을 통해 전달된다. 일 실시형태에서, 제제는 약 90분(±10분)에 걸쳐 점적주사에 의해 말초 정맥을 통해 전달된다. 그러나, 이 시간은 필요한 바대로 또는 원하는 바대로 조정될 수 있다. 임의의 적합한 방법 또는 경로는 본 명세서에 기재된 바대로 AAV 함유 조성물을 투여하고, 선택적으로, 본 명세서에 기재된 hATP7B의 AAV 매개된 전달과 함께 다른 활성 약물 또는 치료제를 동시투여하도록 사용될 수 있다. 투여의 경로는 예를 들어 전신, 경구, 흡입, 비강내, 기관내, 동맥내, 눈내, 정맥내, 근육내, 피하, 피내 및 투여의 다른 비경구 경로를 포함한다.
일 실시형태에서, 제제는 예를 들어 문헌[M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2): 115-25. doi: 10.1089/hgtb.2013.131. Epub 2014 Feb 14](본 명세서에 참고로 포함됨)에 기재된 바와 같은 oqPCR 또는 디지털 드롭플렛 PCR(ddPCR)에 측정될 때 예를 들어 환자 체중의 1킬로그램당 약 1.0x1011 게놈 카피(GC/㎏) 내지 약 1x1014 GC/㎏, 환자 체중의 1킬로그램당 약 5x1011 게놈 카피(GC/㎏) 내지 약 3x1013 GC/㎏, 또는 약 1x1012 내지 약 1x1014 GC/㎏를 함유할 수 있다. 일 실시형태에서, rAAV.hATP7B 제제는 예를 들어 상기 M. Lock 등의 문헌에 기재된 바와 같은 oqPCR 또는 디지털 드롭플렛 PCR(ddPCR)에 측정될 때 적어도 1x1O13 게놈 카피(GC)/㎖, 또는 이것 초과를 함유하는 현탁액이다.
빈 캡시드가 환자에게 투여되는 AAV hATP7B의 용량으로부터 제거되도록 보장하도록, 빈 캡시드는 예를 들어 본 명세서에 기재된 방법을 이용하여 벡터 정제 공정 동안 벡터 입자로부터 분리된다. 일 실시형태에서, 패키징된 게놈을 함유하는 벡터 입자는 발명의 명칭이 "Scalable Purification Method for AAV8"인 WO 제2017/100676호(본 명세서에 참고로 포함됨)에 기재된 공정을 이용하여 빈 캡시드로부터 정제된다. 간단히, rAAV 제조 세포 배양의 청징된 농축 상청액으로부터 게놈 함유 rAAV 벡터 입자를 선택적으로 포획하고 단리시키는, 2단계 정제 계획이 기재되어 있다. 상기 공정은 실질적으로 rAAV 중간체가 없는 rAAV 벡터 입자를 제공하도록 고염 농도에서 수행된 친화도 포획 방법, 이어서 높은 pH에서 수행된 음이온 교환 수지 방법을 이용한다. 유사한 정제 방법은 다른 캡시드를 갖는 벡터에 사용될 수 있다.
임의의 종래의 제조 공정을 사용할 수 있지만, 본 명세서(및 WO 제2017/100676호)에 기재된 공정은 입자의 50% 내지 70%가 벡터 게놈을 갖는(즉, 50 내지 70% 충전 입자) 벡터 제제를 생성한다. 따라서, 1.6x1012 GC/㎏의 예시적인 용량에 대해, 전체 입자 용량은 2.3x1012 내지 3x1012 입자일 것이다. 또 다른 실시형태에서, 제안된 용량은 로그의 반 초과 또는 5x1012 GC/㎏이고, 전체 입자 용량은 7.6x1012 내지 1.1x1013 입자일 것이다. 일 실시형태에서, 제제는 1 이하, 바람직하게는 0.75 미만, 더 바람직하게는, 0.5, 바람직하게는 0.3 미만의 "빈" 대 "충전"의 비율을 갖는 rAAV 스톡을 특징으로 한다.
rAAV8 입자(패키징된 게놈)의 스톡 또는 제제는, 스톡 중의 rAAV8 입자가 스톡 중에 적어도 약 75% 내지 약 100%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95% 또는 적어도 99%의 rAAV8이거나, "빈 캡시드"가 스톡 또는 제제 중에 약 1% 미만, 약 5% 미만, 약 10% 미만, 약 15% 미만의 rAAV8일 때, AAV 빈 캡시드(및 다른 중간체)가 "실질적으로 없다".
일반적으로, 패키징된 게놈을 갖는 빈 캡시드 및 AAV 벡터 입자를 평가하는 방법은 당해 분야에 공지되어 있다. 예를 들어, 문헌[Grimm et al., Gene Therapy (1999) 6:1322-1330; Sommer et al., Molec. Ther. (2003) 7:122-128]을 참조한다. 변성된 캡시드를 시험하기 위해, 상기 방법은 처리된 AAV 스톡을 3개의 캡시드 단백질을 분리시킬 수 있는 임의의 겔로 이루어진 SDS-폴리아크릴아마이드 겔 전기영동, 예를 들어 완충제 중에 3% 내지 8% Tris-아세테이트를 함유하는 구배 겔로 처리하고, 이후 샘플 재료가 분리될 때까지 겔을 흐르게 하고, 겔을 나일론 또는 나이트로셀룰로스 막, 바람직하게는 나일론으로 블로팅하는 것을 포함한다. 항-AAV 캡시드 항체는 이후 변성된 캡시드 단백질, 바람직하게는 항-AAV 캡시드 단일클론 항체, 가장 바람직하게는 B1 항-AAV-2 단일클론 항체에 결합하는 1차 항체로서 사용된다(Wobus et al., J. Virol. (2000) 74:9281-9293). 이후, 1차 항체에 결합하는 것인 2차 항체를 사용하고, 1차 항체, 더 바람직하게는 이것에 공유 결합된 검출 분자를 함유하는 항-IgG 항체, 가장 바람직하게는 겨자무 과산화효소에 공유 연결된 양 항-마우스 IgG 항체와의 결합을 검출하기 위한 수단을 함유한다. 결합을 검출하기 위한 방법, 바람직하게는 방사성 동위원소 방출, 전자기 방사선 또는 비색 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트는 1차 항체와 2차 항체 사이의 결합을 반정량적으로 결정하도록 사용된다. 예를 들어, SDS-PAGE에 대해, 칼럼 분획으로부터의 샘플을 환원제(예를 들어, DTE)를 함유하는 SDS-PAGE 로딩 완충제 중에 취해지고 가열될 수 있고, 캡시드 단백질은 프리 캐스팅된 구배 폴리 아크릴아마이드 겔(예를 들어, Novex)에서 해상되었다. 은 염색은 제조사의 지시에 따라 SilverXpress(Invitrogen(캘리포니아주))를 사용하여 수행될 수 있다. 일 실시형태에서, 칼럼 분획에서의 AAV 벡터 게놈(vg)의 농도는 정량적 실시간 PCR(Q-PCR)에 의해 측정될 수 있다. 샘플은 희석되고, 외인성 DNA를 제거하도록 DNase I(또는 또 다른 적합한 뉴클레아제)에 의해 분해된다. 뉴클레아제의 불활화 후, 샘플은 추가로 희석되고, 프라이머 및 프라이머 사이의 DNA 서열에 특이적인 TaqMan(상표명) 형광원 프로브를 사용하여 증폭된다. 한정된 형광 수준에 도달하는 데 필요한 사이클의 횟수(한계치 사이클, Ct)는 Applied Biosystems Prism 7700 Sequence Detection System에서 각각의 샘플에 대해 측정된다. AAV 벡터에 함유된 것과 동일한 서열을 함유하는 플라스미드 DNA는 Q-PCR 반응에서 표준 곡선을 생성하도록 사용된다. 샘플로부터 얻은 사이클 한계치(Ct) 값은 플라스미드 표준 곡선의 Ct 값에 이것을 정규화함으로써 벡터 게놈을 결정하도록 사용된다. 디지털 PCR에 기초한 종점 검정을 또한 사용할 수 있다.
일 양태에서, 광범위 세린 프로테아제, 예를 들어 단백분해효소 K(예컨대, Qiagen으로부터 상업적으로 구입 가능)를 사용하는 최적화된 q-PCR 방법이 본 명세서에 제공된다. 더 특히, 최적화된 qPCR 게놈 역가 검정은, DNase I 분해 후, 샘플이 단백분해효소 K 완충제에 의해 희석되고 단백분해효소 K에 의해 처리된 후 열 불활화된다는 것을 제외하고는, 표준 검정과 유사하다. 적합하게, 샘플은 샘플 크기와 동일한 양으로 단백분해효소 K 완충제에 의해 희석된다. 단백분해효소 K 완충제는 2배 이상으로 농축될 수 있다. 통상적으로, 단백분해효소 K 처리는 약 0.2㎎/㎖이지만, 0.1㎎/㎖ 내지 약 1㎎/㎖로 변할 수 있다. 처리 단계는 일반적으로 약 15분 동안 약 55℃에서 수행되지만, 더 긴 시간 기간(예를 들어, 약 20분 내지 약 30분)에 걸쳐 더 낮은 온도(예를 들어, 약 37℃ 내지 약 50℃)에서 또는 더 짧은 시간 기간(예를 들어, 약 5 내지 10분) 동안 더 높은 온도(예를 들어. 약 60℃ 이하)에서 수행될 수 있다. 유사하게, 열 불활화는 일반적으로 약 15분 동안 약 95℃에 있지만, 온도는 낮아지고(예를 들어, 약 70 내지 약 90℃), 시간 연장(예를 들어, 약 20분 내지 약 30분)이 될 수 있다. 샘플은 이후 희석(예를 들어, 1000배)되고, 표준 검정에 기재된 바대로 TaqMan 분석으로 처리될 수 있다.
추가적으로, 또는 대안적으로, 디지털 드롭플렛 PCR(ddPCR)을 사용할 수 있다. 예를 들어, ddPCR에 의해 단일 가닥 및 자가 상보성 AAV 벡터 게놈 역가를 결정하기 위한 방법은 기재되어 있다. 예를 들어, 문헌[M. Lock et al, Hu Gene Therapy Methods, Hum Gene Ther Methods. 2014 Apr;25(2): 115-25. doi: 10.1089/hgtb.2013.131. Epub 2014 Feb 14]을 참조한다.
5.2. 환자 집단
상기 기재된 바대로, 임의의 중증도의 WD를 갖는 대상체는 본 명세서에 기재된 조성물 및 방법의 의도된 수혜자이다.
대상체는 이의 보호 의사의 결정에 의해 유전자 치료제 치료 전에 및 이와 동시에 이의 관리 표준 치료(들)(예를 들어, 저 구리 식이; 킬레이트화제, 예컨대 D-페니실라민 및 트라이엔틴에 의한 치료. 다른 물질은 나트륨 다이머캅토숙시네이트, 다이머캅토숙신산, 아연 및 테트라티오몰리브데이트를 포함)를 계속하도록 허용될 수 있다. 대안에서, 의사는 유전자 치료제 치료를 투여하기 전에 관리 표준 치료를 중단하는 것을 선호하고, 선택적으로, 유전자 치료의 투여 후 동시치료로서 관리 표준 치료를 재개할 수 있다.
유전자 치료 섭생의 원하는 종점이 25% 이상의 혈청 구리 수준을 감소시키는 기능적 ATP7B 효소를 제공할 것이다. 일 실시형태에서, 24시간당 3 내지 8pmol 이하의 뇨 구리 배설이 바람직하다.
윌슨병을 가질 수 있는 환자를 조사하기 위해 비세룰로플라스민 결합된 구리(NCC; 또한 "유리 구리" 또는 구리 지수라 칭함), 24시간 뇨 구리, 간 구리 및 유전자 돌연변이 시험을 포함하는, 많은 시험이 사용될 수 있다. 구리 수준을 측정하는 방법은 예를 들어 문헌[McMillin et al, Am J Clin Pathol. 2009; 131(2): 160-165](본 명세서에 참고로 포함됨)에 기재된 바대로 당해 분야에 공지되어 있다. 일 실시형태에서, 환자는 단독의 및/또는 보조 치료의 사용과 조합된 rAAV.hATP7B에 의한 치료 후 원하는 순환 ATP7B 수준을 달성한다.
5.3. 투약 및 투여의 경로
일 실시형태에서, rAAV.hATP7B 벡터는 환자마다 단일 용량으로 전달된다. 일 실시형태에서, 대상체는 (본 명세서에서 실시예에 기재된 전임상 연구에 의해 결정된 바대로) 최소 유효 용량(minimal effective dose: MED)이 전달된다. 본 명세서에 사용된 바대로, MED는 25% 이상의 혈청 구리 수준을 감소시키는 기능적 ATP7B 효소를 제공하는 데 필요한 rAAV.hATP7B 용량을 의미한다.
종래처럼, 벡터 역가는 벡터 제제의 DNA 함량에 기초하여 결정된다. 일 실시형태에서, 실시예에 기재된 바와 같은 정량적 PCR 또는 최적화된 정량적 PCR은 rAAV.hATP7B 벡터 제제의 DNA 함량을 결정하도록 사용된다. 일 실시형태에서, 상기에 기재된 바와 같은 디지털 드롭플렛 PCR은 rAAV.hATP7B 벡터 제제의 DNA 함량을 결정하도록 사용된다. 일 실시형태에서, 투약량은 종점을 포함하여 약 1x1O11 게놈 카피(GC)/㎏(체중) 내지 약 1x1013 GC/㎏이다. 일 실시형태에서, 투약량은 5x1011 GC/㎏이다. 또 다른 실시형태에서, 투약량은 5x1012 GC/㎏이다. 구체적인 실시형태에서, 환자에게 투여되는 rAAV.hATP7B의 용량은 적어도 5x1011 GC/㎏, 1x1012 GC/㎏, 1.5x1012 GC/㎏, 2.0x1012 GC/㎏, 2.5x1012 GC/㎏, 3.0x1012 GC/㎏, 3.5x1012 GC/㎏, 4.0x1012 GC/㎏, 4.5x1012 GC/㎏, 5.0x1012 GC/㎏, 5.5x1012 GC/㎏, 6.0x1012 GC/㎏, 6.5x1012 GC/㎏, 7.0x1012 GC/㎏, 또는 7.5x1012 GC/㎏이다. 또한, 복제 결핍 바이러스 조성물은 약 1.0x109 GC 내지 약 1.0x1015 GC의 범위인 복제 결핍 바이러스의 양을 함유하도록 투약량 단위에서 제제화될 수 있다. 본 명세서에 사용된 바대로, 용어 "투약량"은 치료 과정에서 대상체에게 전달되는 전체 투약량, 또는 단일(또는 복수) 투여에서 전달되는 양을 의미할 수 있다.
몇몇 실시형태에서, rAAV.hATP7B는 WD의 치료를 위한 하나 이상의 치료, 예컨대 저 구리 식이 또는 D-페니실라민, 트라이엔틴, 나트륨 다이머캅토숙시네이트, 다이머캅토숙신산, 아연, 및/또는 테트라티오몰리브데이트의 투여와 조합되어 투여된다.
5.4. 임상 목적의 측정
치료의 효율의 측정은 ATP7B 활성 및 또는 비세룰로플라스민 결합된 구리(NCC; 또한 "유리 구리" 또는 구리 지수라고 칭함), 24시간 뇨 구리 또는 간 구리 수준에 의해 결정된 바대로 전이유전자 발현 및 활성에 의해 측정될 수 있다. 효율의 추가의 평가는 식이 구리 내약성의 임상 평가에 의해 결정될 수 있다.
본 명세서에 사용된 바대로, 본 명세서에서 rAAV.hATP7B 벡터는, 환자가 비세룰로플라스민 결합된 구리, 24시간 뇨 구리, 및/또는 간 구리의 25% 이상 감소를 발생시키는 ATP7B 활성을 달성하도록 충분한 수준의 ATP7B를 발현할 때 활성 ATP7B에 의해 환자 결핍 ATP7B를 "기능적으로 대체한다" 또는 "기능적으로 보충한다".
하기 실시예는 오직 예시적이고 본 발명을 제한하도록 의도되지 않는다.
실시예
하기 실시예는 오직 예시적이고 본 발명을 제한하도록 의도되지 않는다.
실시예 1: hATP7B를 함유하는 AAV 벡터(AAV.hATP7Bco)
예시적인 유전자 치료 벡터 AAV8.En34.TBG-S1.hATP7Bco.PA75를 TBG-S1 촉진자 및 En34 인핸서의 제어 하에 코돈 최적화된 인간 hATP7B cDNA(hATP7Bco)를 보유하는 AAV8 벡터에 의해 작제하였다(도 1). ATP7B 발현 카세트는 AAV2 유래 역위 말단 반복(ITR)에 의해 측접되고 Kozak 공통 서열 및 PA75 poly(A) 신호를 추가로 포함하였다. AAV8.En34.TBG-S1.hATP7Bco.PA75 게놈의 서열은 서열 번호 24의 1번 nt 내지 5056번 nt에 기재되어 있다.
벡터 AAV8.En34.TTR.hATP7Bco.PA75를 TBG-S1 대신에 간세포 특이적 TTR 촉진자에 의해 상기 기재된 바대로 작제하였다. AAV8.En34.TTR.hATP7Bco.PA75의 서열은 서열 번호 26의 1번 nt 내지 5068번 nt에 기재되어 있다.
TBG-S1 대신에 서열 번호 11의 21번 nt 내지 190번 nt로 기재된 서열을 갖는 변형된 TTR 촉진자는 벡터 AAV.En34.mTTR.hATP7Bco.PA75를 작제하도록 사용되었다. AAV.En34.mTTR.hATP7Bco.PA75의 서열은 서열 번호 27의 1번 nt 내지 5048번 nt에 기재되어 있다.
AAV8.EnTTR.TTR.hATP7Bco.PA75 벡터의 ATP7B 발현 카세트는 Kozak 공통 서열 및 PA75 poly(A) 신호를 갖는 EnTTR 인핸서 및 TTR 촉진자에 의해 추진되었다. AAV8.EnTTR.TTR.hATP7Bco.PA75의 서열은 서열 번호 23의 1번 nt 내지 5134번 nt에 기재되어 있다.
AAV8.EnABPS.TBG-S1.hATP7Bco.PA75 벡터는 Kozak 공통 서열 및 PA75 poly(A) 신호를 갖는 ABP-S2(ABPS 인핸서) 인핸서 및 TBG-S1 촉진자의 제어 하에 코돈 최적화된 인간 ATP7B cDNA(hATP7Bco)를 암호화한다. AAV8.ABPS.TBG-S1.hATP7Bco.PA75의 서열은 서열 번호 25의 1번 nt 내지 5064번 nt에 기재되어 있다.
추가적으로, AAV8.En34.TBG-S1.hATP7Bco(MBD1Del).PA75(서열 번호 32의 1번 nt 내지 4945번 nt에 기재됨), AAV8.En34.TBG-S1.hATP7Bco(MBD2Del).PA75(서열 번호 31의 1번 nt 내지 4876번 nt에 기재됨), AAV8.En34.TBG-S1.hATP7Bco(MBD3Del).PA75(서열 번호 30의 1번 nt 내지 4978번 nt), AAV8.En34.TBG-S1.hATP7Bco(MBD1-2Del).PA75(서열 번호 35의 1번 nt 내지 4627번 nt), AAV8.En34.TBG-S1.hATP7Bco(MBD1-4Del).PA75(서열 번호 34의 1번 nt 내지 4021번 nt), AAV8.En34.TBG-S1.hATP7Bco(MBD1-5Del).PA75(서열 번호 33의 1번 nt 내지 3628번 nt), AAV8.TBG.hATP7Bco(MBD1-4Del).PA75(서열 번호 29의 1번 nt 내지 4677번 nt) 및 AAV8.TBG.hATP7Bco(MBD1-5Del).PA75(서열 번호 28의 1번 nt 내지 4284번 nt)를 포함하는 절두된 hATP7Bco 벡터를 표 2에 기재된 바대로 Kozak 공통 서열, PA75 Ploy(A) 신호 및 촉진자 및 인핸서를 갖는 표시된 절두된 hATP7Bco로서 설계하고 작제하고 제조하였다.
간단히, 감소된 크기의 트란스타이레틴 인핸서 및 촉진자로부터의 hATP7B(hATP7Bco)의 코돈 최적화된 버전을 발현하는 플라스미드를 AAV8 바이러스 캡시드에 의해 패키징하였다.
예를 들어, 문헌[Mizukami, Hiroaki, et al. A Protocol for AAV vector production and purification. Diss. Division of Genetic Therapeutics, Center for MolecularMedicine, 1998](본 명세서에 참고로 포함됨)에 의해 기재된 바대로 293 세포에서 종래의 삼중 형질주입 기법을 이용하여 벡터를 제조하였다. 모든 벡터는 이전에 기재된 바대로[Lock, M., et al, Hum Gene Ther, 21: 1259-1271 (2010)] 펜실베니아 대학교(University of Pennsylvania)에서의 Vector Core에 의해 제조되었다.
실시예 2: 윌슨병의 마우스 모델
윌슨병의 치료를 위한 유전자 치료학적 접근법의 개발 전에, 질환 표현형의 동물 모델은 완전히 규명되어야 한다. 본 명세서에 기재된 연구는 tx j 마우스 균주 둘 다의 처음의 자세한 규명 및 모든 Atp7b KO 마우스의 출생부터 양육 이후에 구리 대사 및 질환 병리학의 평가이다. 질환이 있는 모체의 유선의 Atp7b 결핍증으로 인해 약해지기 전에 제공된 상반되는 구리 결핍증의 부재 하에, 질환 진행의 시간 선은 정확히 결정되었다. Atp7b KO 마우스는 출생부터 간에 구리를 축적하고, 2개월령에 심각한 구리 축적이 공존하는 간 질환으로 명확하다.
단일 기관에 영향을 미치는 단일유전자 질환은 특히 비교적 조금 연관된 조직학적 병변이 있는 경우 유전자 치료 접근법에 대한 매력적인 표적이다. 그러나, 간에 영향을 미치는 대사 장애에 대해, 질환의 결과로서 간 유조직에 심각한 손상이 있을 수 있다. 이의 고전적인 예의 하나는 윌슨병 단백질(구리 수송 P형 ATPase, Atp7b)에서의 돌연변이에 의해 생긴 상염색체 열성 질환인 윌슨병이다. 기능적 Atp7b의 결여는 간 및 다른 조직에서 구리를 축적시키고, 이는 신경학적 또는 정신의학적 증상을 갖는 간 질환으로서 표출된다. 윌슨병은 킬레이트화 치료를 이용하여 구리 흡수를 감소시키거나 신체로부터 과도한 구리를 제거함으로써 치료될 수 있지만, 많은 다른 대사 장애에 대해서는, 간 이식은 질환과 연관된 유전자 결핍증을 수정하면서 기능이상 기관을 대체할 수 있다.
윌슨병은 상이한 질환 증상 및 진행을 갖는 30,000명 중 1명의 사람에게 영향을 미친다. 킬레이트화 및 간 이식에 대한 새로운 치료학적 대안의 개발이 가능하게 하도록, 이 질환의 신뢰할만한 동물 모델은 완전히 규명되어야 한다. 롱-에반스 계피(Long-Evans Cinnamon: LEC) 래트 및 다양한 형질전환 마우스 균주를 포함하는 윌슨병의 몇몇 이전에 보고된 래트 및 마우스 동물 모델이 있다(1-6). 마우스 모델에서의 윌슨병 표현형의 평가를 위해, 본 발명자들은 Jackson Labs로부터 구입 가능한 독성 젖 마우스(tx j )를 선택하였다(2). 이 마우스는 Atp7b 유전자에서 Gly712Asp 미스센스 돌연변이를 갖고, 이것은 암호화된 단백질의 제2 추정상 막-스패닝 도메인에 위치하고 기능이상 Atp7b 단백질을 발생시킨다.
독성 젖 마우스인 이 균주의 원래의 이름은 간 이외의 유방 조직에서 또한 발현되는 Atp7b의 결과이다. 따라서, 이 모델에서의 독성 젖 표현형의 "자발적 발생"은 윌슨병의 직접적인 결과이다(7). Atp7b 단백질의 결핍증으로 인해, 구리는 모체로부터 모유로 운반될 수 없다(8). 이환된 모체로부터 젖을 빠는 이환된 새끼는 이들이 젖을 떼고 일반 마우스 먹이를 소비할 때까지 식이에서 어떠한 구리도 받을 수 없으므로 윌슨병의 역형식(구리 결핍증)이 제시될 것이다. 윌슨병의 이 역형식은 또한 이전에 기재된 백색 코트 색상 및 정신 결함을 설명한다(9). 여기서, 본 발명자들은, 기능이상 Atp7b 단백질 및 이 연구에서 사용된 모든 마우스가 독성 젖 논의를 완화시키도록 출생의 72시간 내에 Balb/c 양육 모체로 양육된다는 사실로 인해, 이 마우스 모델을 tx j 로서가 아니라 Atp7b 넉아웃(KO)으로 기재하는 것을 선호한다. 따라서, 여기에 기재된 윌슨병 표현형의 규명은 젖 떼기 전에 구리 결핍증과 관련된 임의의 기초하는 논의로부터 분리된다.
모든 동물 절차는 펜실베니아 대학교의 동물 실험 윤리 위원회(Institutional Animal Care and Use Committee: IACUC)가 승인한 프로토콜에 따라 수행되었다.
ATP7B KO 마우스는 기능적 구리 수송 ATPase를 발현하지 않고(Lutsenko et al, Function and Regulation of Human Copper-Transporting ATPases, Physiological Reviews, 87(3): 1011-46 (July 2007), 이에 따라 윌슨병에 대한 마우스 모델로서 작용한다. 자연사 연구는 ATP7B KO 마우스에서 윌슨병의 진행을 평가하도록 수행되었다. 연구는 2개 단계로 수행되었다. 처음에, 마우스는 간 질환의 평가를 위한 다른 연령에 부검되었다 제2 단계에서, 마우스는 몇몇 바이오마커의 평가를 위해 9개월령으로 이어졌다.
Atp7b 이형접합성 및 KO 마우스는 2개월령으로부터 7개월 동안 각각 주마다 및 2주마다 기준으로 뇨 및 혈청 구리 수준에 대해 평가되었다(도 3a 및 도 3b). 간에서의 Atp7b는 대변에서의 배설을 위해 담즙으로 구리를 내보낸다(7). Atp7b의 부재 하에, 구리의 배설은 요로를 통해 발생할 것이다. 뇨 구리 수준은 시험된 유전자형 둘 다에서 초기에 유사하지만, 3개월령에 Atp7b KO 마우스의 뇨에서의 구리의 수준은 이형접합성 동물과 비교하여 증가하기 시작하였다(도 3a). 연구의 완료 시, 뇨 구리 수준은 평균하여 이형접합성 마우스에서 0.18pg/g 및 Atp7b KO 마우스에서 1.08pg/g이었다. 2개월령에 Atp7b KO 마우스에서의 혈청 구리 수준은 0.47pg/g와 비교하여 0.07pg/g에서 이형접합성 동물로부터 유의미하게 상이하였다(스튜던츠 t 시험에 의해 p<0.0001, 도 3b). 3 내지 4개월령에, Atp7b KO 마우스에서의 혈청 구리 수준은 상승하기 시작하여서, 이형접합성 마우스의 것과 동등한 수준에 도달하였다. 수컷 또는 암컷 마우스에서의 뇨 또는 혈청 구리 수준의 차이가 없거나 아주 적었다. 제1 단계의 결과는 출생부터 간에서의 구리의 축적이 관찰된다는 것을 보여준다. Atp7b KO 마우스가 2개월령에 도달할 때, Timm 구리 염색은 간에서의 심각한 구리 축적을 나타냈다(도 4).
간 대사에 영향을 미치는 단일유전자 질환은 간 병변을 갖는 것 및 갖지 않는 것의 2개의 하위카테고리로 분할될 수 있다. 윌슨병 환자는 보통 간경변으로 표출되는 증등도 내지 중증도의 간 질환을 나타낸다(13, 14). 따라서, 본 발명자들은 윌슨병의 이 마우스 모델에서 간 병리학의 발생에 대한 시간 과정을 평가하기를 원했다. Atp7b KO 마우스를 시간에 걸쳐 간 경변의 평가를 위해 2, 3, 4, 5, 9, 10 및 12개월령에 부검하였다(도 5). 간의 절편은 H&E에 의해 염색하고, 1 내지 5 스코어링 시스템에 따라 조직병리학에 대해 평가하였다(도 3c). 단일 세포 괴사 및 염증과 함께 최소 간세포 비대 및 퇴행은 2개월령으로부터의 Atp7b KO 마우스에 존재하였다. 간세포 비대, 퇴행 및 괴사의 중증도는 6개월령에 가장 높았고, 이후 일정하게 있었다. 염증, 담관 증생 및 타원형 세포 증생을 포함하는 평가된 다른 매개변수는 2 내지 3개월령으로부터 7개월령으로 시간이 지나면서 증가하였다. 각각 ALT 및 AST에 대해 10개월에 2개월령에서의 정상 값으로부터 199 U/ℓ 및 381 U/ℓ로, ALT 및 AST인 간 아미노기전이효소의 공존하는 상승이 있었다(표 3). 10개월령에서의 간 손상의 정도는 2.5㎎/㎗에서 급격히 스파이킹된 것으로서 혈청 총 빌리루빈 수준으로부터 또한 명확했다. 간 병변 이외에, 간 결절 재생의 부위는 이 마우스 모델에서 6개월령으로부터 명확했다(예는 도 5에서 별표로 표시됨). 이것은 아마도 간 질환의 중증도로 인해 놀랍지 않다.
간 절편을 또한 각각 씨리우스 레드 및 팀 염색에 의해 섬유증 및 구리 축적에 대해 평가하였다(도 5). 국소 또는 다원성 문맥주위 섬유증은 Atp7b KO 마우스에서 3개월령에 보였다. 이것은 7개월령에 구성적 파괴에 의해 미만성 가교 섬유증으로 빠르게 진행하였다. 간 병변의 발생은 아마도 팀 염색에 의해 보인 것처럼 간에서의 거대한 구리 축적으로 인한다(도 5). 2개월령으로부터, Atp7b KO 마우스의 간은 검정 염색에 의해 보인 것처럼 구리에 의해 포화되었다. 간에서의 구리의 축적은 기능적 Atp7b의 부재 하에 담즙으로의 구리의 방해된 배출로 인해 생긴다. 간에서의 구리의 수준은 아마도 간세포 손상 및 혈청으로의 구리의 방출로 인해 시간이 지나면서 감소하였다. 이것은 이전에 나타났고, 여기서 구리 값은 준거대 또는 거대 괴사에 의해 유의미하게 감소하고, 재생 및 섬유증에 의해 더욱 더 감소하였다(1, 15-17). 섬유성 연결 조직 및 재생 간세포는 과도한 구리 농도를 함유하지 않는다(18).
ATP7B KO 마우스의 뇨에서의 구리 수준은 또한 모니터링되었다. 샘플을 자연사 연구에서 주마다 수집하고, 이후 유도 커플링된 플라즈마-질량 분광법을 수행하여 구리 농도를 평가하였다. 결과는 이형접합성 한배새끼가 낮은 구리 수준을 유지하는 한편, Atp7b KO 마우스가 약 제3 주에 시작하여 뇨에서의 구리의 오버플로우, 이어서 관찰 기간에 걸쳐 구리의 뇨 농도의 정상상태 성장을 나타낸다는 것을 입증하여서(도 2a, 도 3a), 윌슨병 환자에서 관찰된 높은 뇨 구리 배설률을 나타낸다.
Atp7b KO 마우스의 혈청은 유도 커플링된 플라즈마-질량 분광법을 통해 구리 농도를 평가하도록 2주마다 수집되었다. 결과는 이형접합성 한배새끼와 비교하여 2개월령까지 매우 낮은 혈청 구리 수준을 나타내서, Atp7b KO 마우스에서 조직으로부터 혈액으로 구리를 추출하는 손상된 능력을 제안한다. Atp7b KO 마우스가 3 내지 4개월령일 때, 구리의 혈청 농도는 유의미하게 증가하고, 이형접합성 한배새끼의 수준에 도달하였다(도 2b, 도 3b).
이 Atp7b KO 마우스 모델에서, 질환의 진행은 하기와 같다: 간에서의 중증 구리 축적은 2개월령에 Timm의 구리 염색에 의해 보이지만, 다른 사람에 의해 이전에 기재된 것과 유사하게 시간에 따른 감소하였다(1, 15-17). 새끼의 양육으로 인해, 구리는 아마도 출생으로부터 Atp7b KO 마우스의 간에서 축적하고 대략 2 내지 3개월령에 포화 수준에 도달하였다. 2개월령에 간 질환의 발생 이후에, 구리는 아마도 혈청으로 방출되어서, 3 내지 4개월령에 간세포에서의 명확한 축적 감소 및 혈청 구리 수준 상승을 발생시켰다. 초기에서 낮은 수준으로부터 이형접합성 마우스와 유사한 것으로의 혈청 구리 수준의 이 상승은 윌슨병의 또 다른 마우스 모델에 대해 이전에 보고된 것과 다르고(17), 여기서 Atp7b-/- 균주의 혈청 구리 수준은 6주령에 야생형 마우스에서 보인 것과 유사하고, 시간이 지나면서 44주령에 야생형 마우스보다 2배 내지 3배 높게 증가하였다.
본 발명자들은 뇨로의 구리의 오버플로우가 약 3개월령에 시작한다는 것을 관찰하였고, 이것은 유사하게 간세포 괴사 및 축적된 구리의 후속하는 방출로 인할 수 있다. 배설 증가를 발생시키는 신장에서의 Atp7b 활성의 결여(23-25), 또는 Ctrl인 간 구리 운반체의 하향조절을 발생시키는 간에서의 구리의 축적, 및 작은 구리 운반체에 의한 뇨 배설(26)을 포함하는, 신장을 통한 구리의 배설에 대안적인 기전이 제안되어 있다. 다시, 뇨 구리 배설의 시간 경과는 이전에 보고된 이 마우스 모델에서 다르다. 여기서, 뇨 구리 배설은 초기에 이형접합성 및 Atp7b KO 마우스에서 유사하지만, 연구의 과정에 걸쳐 KO 마우스에서 증가하였다. 비교하면, 뇨 구리 수준은 Atp7b-/- 균주에서 6주령에서 야생형 마우스의 3배 초과이고, 14 내지 20주령까지 증가하고, 이후 20주령에 실질적으로 감소하였다(26).
간세포 비대, 퇴행 및 괴사는 이 연령으로부터 앞으로 간 결절 재생의 부위의 그럴듯한 동반한 관찰에 의해 6개월령에 피크이다. 재생에 대한 이 진행은 윌슨병의 다른 마우스 모델에 대해 보고되었다(17). 그러나, 다른 마우스 모델에서와 달리, 여기에 기재된 Atp7b KO 마우스에서 담관암종의 증거가 없었다. 섬유증의 영역은 3개월령에 보였고, 이는 7개월령에 구성적 파괴에 의해 시간이 지나면서 중증도에서 신속히 증가하였다. 3 내지 4개월령에 혈청 아미노기전이효소의 현저한 증가가 있지만, 혈청 총 빌리루빈 수준의 증가는 오직 9개월에 나타나기 시작하여서, 진행된 간 질환을 나타낸다.
자연사 연구의 2 단계에서, Atp7b KO 및 이형접합성 한배새끼를 8개월령에 희생시켰다. ALT, AST 및 총 빌리루빈 수준을 얻었다. 도 6a 내지 도 6c. H&E 염색 및 이후 조직병리학은 도 7에 도시된 스코어링 계획에 대해 병리학자에 의해 평가되었다. 각각 도 8a 및 도 8b에 도시된 바와 같은 섬유증 점수 및 팀 염색에 의한 구리 염색 점수. 간에서의 구리 수준은 도 9에 도시되어 있다.
실시예 3: 윌슨병의 모델에서의 AAV8.hATP7Bco 벡터
수컷 Atp7b KO 마우스에 AAV8.TTR.hATP7Bco의 1010 GC/마우스 및 1011 GC/마우스에 의해 IV 주사하고, 암컷 Atp7b KO 마우스에 동일한 벡터의 109, 1010 및 1011 GC/마우스에 의해 IV 주사하였다. 혈청 구리 수준을 벡터 주사 후 모니터링하였다(도 10a 및 도 10b). 수컷 Atp7b KO 마우스에서의 1010 또는 1011 GC/마우스의 투여는 각각 벡터 투여 후 2주에 0.11pg/g 내지 0.52pg/g 및 0.34pg/g의 평균으로부터 혈청 구리 수준을 증가시켰다(도 10a). 그러나, 암컷 마우스에서 더 적은 효과가 있었다(도 10b). 마우스를 약 9개월령에 벡터 투여 후 7개월에 희생시키고, 간 구리 수준의 평가를 위해 간을 수확하였다. 이형접합성 및 Atp7b KO 마우스에서의 간 구리 수준은 각각 평균 6pg/g 및 222pg/g이었다(도 10c). 용량 > 109 GC/마우스에서의 AAV8 벡터 투여는 연령 일치된 비주사된 Atp7b KO 마우스와 비교하여 간 구리 수준의 유의미한 감소를 발생시켰다. 그러나, 109 GC/마우스가 투여된 암컷 마우스와 대조군 Atp7b KO 마우스에서 간 구리 수준 사이의 유의미한 차이가 없었다. 이 측정을 위해, 간 구리 수준이 이형접합성 마우스로부터 유의미하게 다르지 않으므로, 암컷 마우스에서 높은 벡터 용량의 더 강한 효과가 있었다(도 10c).
AAV8 벡터가 투여된 마우스를 9개월령에 부검하고, 섬유증 및 팀 염색에 의한 구리 수준을 포함하는 구리 연관된 간 질환의 매개변수에 대해 간을 조직학적으로 평가하였다(도 11). 간의 절편을 H&E에 의해 염색하고, 1 내지 5 스코어링 시스템에 따라 조직학적으로 평가하였다(도 12a). 간 구리 수준에 보인 것과 유사하게, 연령 일치된 비주사된 Atp7b KO 마우스와 AAV8 벡터의 109 GC/마우스가 투여된 암컷 마우스 사이에 간 병변의 유의미한 차이가 없었다. 오직 경증의 거대핵세포(간세포 비대 및 퇴행을 나타냄), 경증의 염증 및 국소 또는 다원성 문맥주위 타원형 세포 증생을 갖는다고 관찰된, 1011 GC/마우스가 주사된 수컷 마우스에 의해 간 병변의 용량 의존적 감소가 있었다. 1010 및 1011 GC/마우스가 투여된 마우스에서 연령 일치된 비주사된 Atp7b KO 마우스와 비교하여 간세포 비대, 퇴행/괴사 및 담관 증생의 유의미한 감소가 있었다(p<0.05). 염증 및 타원형 세포 증생에 대해, 연령 일치된 비주사된 Atp7b KO 마우스와 비교된 유의미한 감소는 1011 GC/마우스의 용량에서 오직 관찰되었다(p<0.05). 조직병리학적 매개변수가 조합되고 Fisher 조합 확률 시험을 이용하여 평가될 때, 1010 및 1011 GC/마우스 둘 다의 투여 이후에 연령 일치된 비주사된 Atp7b KO 마우스와 비교하여 유의미한 차이가 있었다(p<0.0001).
가장 높은 벡터 용량을 받은 수컷 마우스는 또한 섬유증을 갖지 않았고, 이는 씨리우스 레드 염색에 의해 평가되었다(도 11 및 도 12b). 모든 다른 벡터 투여된 마우스에 대해, 연령 일치된 비주사된 Atp7b KO 마우스와 비교하여 섬유증의 유의미한 차이가 없었다(도 12b). 그러나, 1011 GC/마우스가 투여된 암컷 마우스에서 보인 섬유증의 감소는 충분하여서, 이들 마우스 및 암컷 Atp7b 이형접합성 마우스에서의 간 섬유증 점수 사이의 유의미한 차이가 또한 없었다. 간에서의 구리 축적에 대한 팀 염색은 유도 커플링된 플라즈마-질량 분광법에 의해 결정된 정량적 간 구리 수준에 의해 보인 유사한 결과를 나타냈다(도 12c). 연령 일치된 비주사된 Atp7b KO 마우스와 임의의 벡터 투여된 그룹 사이에 팀 염색 점수의 유의미한 차이가 없었다. AAV8.hATP7Bco 벡터의 효율을 평가하기 위해, Atp7b KO 마우스는 AAV8.EnTTR.TTR.hATP7Bco.PA75(도 21, 그룹 1), AAV8.En34.TBG-S1.hATP7Bco.PA75(도 21, 그룹 2), AAV8.En34.TTR.hATP7Bco.PA75(도 21, 그룹 3) 및 AAV8.EnABPS.TBG-S1.hATP7Bco.PA75(도 21, 그룹 4)를 포함하는 3x1012 GC/㎏에서의 다양한 유전자 치료 벡터의 i.v. 투여를 받았다. 치료가 없는 이형접합성 및 야생형 한배새끼 및 Atp7b KO 마우스는 대조군으로서 작용하였다. 혈액 샘플을 주마다 수집하여 웨스턴 블롯을 통해 세룰로플라스민의 구리 결합 형태 및 구리 비결합 형태 둘 다의 수준을 평가하였다. 투여 후 21일에, 구리 결합된 세룰로플라스민의 출현이 AAV8.En34.TBG-S1.hATP7Bco.PA75에 의해 치료된 Atp7b KO 마우스에서 관찰되어서, 혈액으로의 촉진된 구리 추출을 나타냈다(도 21, 그룹 2). 그러나, 상기 기재된 실험 환경 하에, 다른 3개의 시험된 벡터는 구리 결합된 세룰로플라스민의 증가를 나타내지 않았다(도 21).
본 명세서에 기재된 AAV8.hATP7Bco 벡터가 주사된 ATP7B KO 마우스의 간에서의 구리 축적을 평가하기 위해, Timm 구리 염색은 이의 간 절편에서 수행되었다. 검정 침착물은 구리 축적을 나타낸다. 결과는 도 19b에 도시되어 있다. 수컷 Atp7b KO 마우스에 대한 모든 5개의 벡터에 의한 주사는 비치료된 또는 PBS-단독 마우스로부터의 샘플과 비교하여 간 절편의 검정 침착물을 감소시키는 한편, AAV8.EnTTR.TTR.hATP7Bco.PA75 벡터는 가장 적은 검정 침착물 및 야생형과 유사한 패턴을 나타냈다(도 19b). 암컷 Atp7b KO 마우스(도 19b)는 수컷과 비교하여 간에서 더 많은 구리 침착물을 나타내서, 성별 차이를 나타낸다. 여전히 비치료된 마우스와 비교하여, 암컷 Atp7b KO 마우스는 간에서의 더 적은 구리 침착물을 나타냈다. 본 명세서에 기재된 AAV hATP7Bco 벡터가 주사된 수컷 및 암컷 Atp7b KO 마우스 둘 다에서의 인간 ATP7B 단백질에 대한 항체의 생성은 조사 중에 있다.
한편, 혈청 샘플은 수집되고, 구리 농도는 실시예 2에 기재된 바대로 평가되었다. 데이터는 각각 암컷 및 수컷 마우스에 대해 도 15a 및 도 15b에 작도되어 있다. 결과는 본 명세서에 기재된 AAV8.hATP7Bco 벡터의 3x1O12 GC/㎏의 치료가 Atp7b KO 마우스에서 혈청 구리 수준을 성공적으로 증가시켰다는 것을 나타낸다(도 15a 및 도 15b).
추가의 시험을 하기와 같이 수행하였다:
시간에 걸친 혈청 구리 수준은 도 15a 및 도 15b에 도시되어 있다. ALT, AST 및 총 빌리루빈 수준을 얻었다. 도 16a 내지 도 16c. 상대 ATP7B 발현은 도 17에 도시되어 있다. H&E 염색 및 이후 조직병리학은 도 18에 도시된 스코어링 계획에 대해 병리학자에 의해 평가되었다. 팀 염색에 의한 섬유증 점수 및 구리 염색 점수는 각각 도 19a 및 도 19b에 도시되어 있다.
실시예 4: AAV.hATP7Bco 벡터가 주사된 윌슨병의 모델에서의 세룰로플라스민의 산화효소 활성
구리는 잠재적으로 독성인 금속이지만, 이것은 다양한 효소의 보인자로서 작용하는 매우 많은 수의 생리학적 기능에 필수적이다. 이의 장 흡수 후, 구리는 간세포로 운반되고, 여기서 이것은 이동-골지망(trans-Golgi network: TGN)의 막에 위치한 ATP7B에 결합한다. 이 큰 막관통 단백질은 구리 의존적 효소로의 금속의 이동을 담당한다. 세룰로플라스민으로의 구리의 로딩은 이 효소의 페록시다제 활성에 필수적이고, 건강한 개체의 혈장에 존재하는 구리의 95%가 세룰로플라스민에 결합되면서, 금속의 중요한 분비 경로를 구성한다. 예를 들어, 문헌[Murillo, Oihana, et al. "Long-term metabolic correction of Wilson's disease in a murine model by gene therapy" Journal of Hepatology 64.2 (2016): 419-426](본 명세서에 참고로 포함됨)을 참조한다.
산화효소 활성을 측정하기 위해, 20㎕의 혈청을 상응하는 제품 정보(본 명세서에 참고로 포함됨)에 기재된 프로토콜에 따라 Sigma Ceruloplasmin Activity Colorimetric Kit(MAK177) 또는 BioVision Ceruloplasmin Activity Colorimetric Kit를 사용하여 처리하였다. 산화효소 활성 검정은 또한 문헌[Schosinsky et al, "Measurement of ceruloplasmin from its oxidase activity in serum by use of o-dianisidine dihydrochloride" Clinical Chemistry 20.12 (1974): 1556-1563 및 Murillo et al. "Long-term metabolic correction of Wilson's disease in a murine model by gene therapy" Journal of Hepatology 64.2 (2016): 419-426](본 명세서에 참고로 포함됨)에 기재된 프로토콜에 따라 수행되었다.
Atp7b KO 마우스의 혈청 세룰로플라스민의 산화효소 활성은 상기 기재된 4개의 검정을 이용하여 측정되었다. 야생형 및 이형접합성 마우스로부터의 샘플은 대조군으로서 작용하였다. 야생형과 Atp7b KO 마우스 사이의 차이가 검출되지 않았다.
더욱이, Atp7b KO 마우스를 황산암모늄에 의해 또는 이것 없이 처리하였다. 야생형 마우스는 대조군으로서 제공되었다. 문헌[Schosinsky et al, "Measurement of ceruloplasmin from its oxidase activity in serum by use of o-dianisidine dihydrochloride" Clinical Chemistry 20.12 (1974): 1556-1563]에 기재된 프로토콜을 이용하여 야생형 또는 Atp7b KO 마우스 사이에 세룰로플라스민 산화효소 활성 검정의 차이가 없었다.
또 다른 실험에서, Atp7b KO 마우스를 황산구리에 의해 또는 이것 없이 처리하였다. 야생형 마우스는 대조군으로서 제공되었다. 상기 기재된 4개의 방법을 이용하여 황산구리에 의해 또는 이것 없이 처리된 마우스 사이의 차이를 검출하도록 세룰로플라스민 산화효소 활성 검정을 수행하였다. 본 명세서에 기재된 마우스의 간 균질액을 또한 수집하고, 상기 기재된 4개의 방법을 이용하여 세룰로플라스민의 산화효소 활성에 대해 시험하였다. 황산구리는 추가로 간 균질액에 첨가되고, 양성 대조군으로서 작용하였다.
실시예 5: AAV8.TTR.hATP7Bco 벡터의 추가의 시험
AAV8.EnTTR.TTR.hATP7Bco.PA75 벡터의 용량 의존적 효과 및 최소 유효 용량(MED)을 결정하기 위해, 수컷 및 암컷 2개월령 ATP7B KO 마우스 둘 다에 벡터의 1x109, 1x1010 또는 1x1011 GC/마우스를 정맥내 주사하였다. 세룰로플라스민에 대한 웨스턴 블롯은 AAV8.EnTTR.TTR.hATP7Bco.PA75의 1x1011 GC를 받은 4마리 중 3마리의 시험된 마우스의 혈청에서의 구리 결합된 세룰로플라스민의 출혈은 나타내어서, 구리 추출의 증가를 제안한다(도 14). 동일한 벡터의 1x1010 GC에 의한 치료 시, 5마리 중 1마리의 시험된 마우스가 혈액에서 구리 결합된 세룰로플라스민을 나타냈다(도 14). 이 데이터는 마우스당 1x1011 GC의 용량에서 AAV8.EnTTR.TTR.hATP7Bco.PA75의 단일 정맥내 주사가 윌슨병의 쥣과 모델에서 구리 추출을 성공적으로 촉진한다는 것을 검증하였다.
실시예 6: 절두된 벡터
단일유전자 질환은 AAV 벡터를 사용한 유전자 대체 치료 접근법에 대한 훌륭한 후보이다. 그러나, AAV 벡터 캡시드 내부에 패키징될 수 있는 cDNA의 크기에 재한이 있다. 야생형 AAV 게놈은 4,700bp이고, 더 큰 게놈을 패키징하려는 요청은 AAV 캡시드 내에 캡슐화된 DNA 서열의 통합성을 감소시킬 수 있다(19). 이전에, 소정의 전이유전자 및 발현에 필요한 전사 및 polyA 제어 서열의 크기 둘 다를 감소시키는 방식을 조사하기 위해 광범위한 조사가 수행되었다. 이것이 어디서 성공적으로 수행되는지의 일 예는 4,374bp 길이인 인간 응고 VIII 인자에 대한 B 도메인 결실된 전이유전자 서열의 생성을 수반하는 A 혈우병의 치료를 위한 유전자 치료 벡터의 개발이다(19-21). 윌슨병의 치료를 위해, ATP7B cDNA가 4,395bp이면서 문제가 증가한다. 따라서, 본 발명자들은 75bp 합성 polyA 서열(PA75)와 조합된 인간 ATP7B 전이유전자의 코돈 최적화된 버전의 발현을 위해 감소된 크기의 트란스타이레틴 인핸서 및 촉진자(TTR) 서열을 사용할 것을 선택하였다(19). 생성된 AAV 게놈은 5.1kb이고, AAV8 캡시드 내에 패키징되었다.
추가적으로, AAV8.En34.TBG-S1.hATP7Bco(MBD1Del).PA75, AAV8.En34.TBG-S1.hATP7Bco(MBD2Del).PA75, AAV8.En34.TBG-S1.hATP7Bco(MBD3Del).PA75, AAV8.En34.TBG-S1.hATP7Bco(MBD1-2Del).PA75, AAV8.En34.TBG-S1.hATP7Bco(MBD1-4Del).PA75, AAV8.En34.TBG-S1.hATP7Bco(MBD1-5Del).PA75, AAV8.TBG.PI.hATP7Bco(MBD1-4Del).PA75 및 AAV8.TBG.PI.hATP7Bco(MBD1-5Del).PA75를 포함하는 절두된 hATP7Bco 벡터가 설계되고 제조되고 3x1012 GC/㎏의 용량으로 정맥내 ATP7B KO 마우스에 주사되었다.
상기 기재된 다양한 절두된 벡터에 의해 처리된 Atp7b KO 마우스, 및 이형접합성 한배새끼를 연구하고 6개월령에 희생시켰다. 시간에 따른 혈청 구리 수준은 도 22에 도시되어 있다. ALT, AST 및 총 빌리루빈 수준을 얻었다. 도 23. 상대 ATP7B 발현은 도 24에 도시되어 있다. H&E 염색 및 이후 조직병리학은 도 25에 도시된 스코어링 계획에 대해 병리학자에 의해 평가되었다. 팀 염색에 의한 섬유증 점수 및 구리 염색 점수는 도 26에 도시되어 있다. 부검 시 간 구리 수준은 도 27에 도시되어 있다.
실시예 7: 상기 실험에 대한 재료 및 방법
A. AAV 벡터 제조
모든 AAV 벡터는 이전에 기재된 바대로 펜실베니아 대학교에서의 Penn Vector Core에 의해 제조되었다(10). 간단히, 감소된 크기의 트란스타이레틴 인핸서 및 촉진자로부터 hATP7B의 코돈 최적화된 버전(hATP7Bco)을 발현하는 플라스미드는 AAV8 바이러스 캡시드에 의해 패키징되었다.
B. 마우스
이형접합성 Atp7b+/_ 마우스의 교배 쌍을 The Jackson Laboratory(미국 메인주 바 하버)로부터 얻고, 콜로니를 특별한 무균 조건 하에 펜실베니아 대학교에서 유지시켰다. 모든 동물 절차 및 프로토콜은 펜실베니아 대학교의 동물 실험 윤리 위원회(IACUC)에 의해 승인되었다. Atp7b KO를 생성하고 후속하는 교배에 사용하였다. Atp7b KO 짝짓기 쌍으로부터 생성된 모든 새끼를 출생의 72시간 내에 Balb/c 양육 모체에서 양육하였다. 수컷 및 암컷 Atp7b KO 마우스 2개월령에 꼬리 정맥을 통해 AAV8.TTR.hATP7Bco의 109 내지 1011 게놈 카피(GC)/마우스를 IV 주사하였다(n = 5/성/그룹).
C. 혈청 분석
혈액을 혈청 세퍼레이터 관에서 표시된 시점에서 수집하고, 응고되게 하고, 혈청을 실온에서 5분 동안 3,500 x g에서 원심분리에 의해 단리하였다. 혈청은 Antech Diagnostics(미국 캘리포니아주 어바인)에 의해 알라닌 아미노전환효소(ALT), 아스파르테이트 아미노전환효소(AST) 및 총 빌리루빈 수준에 대해 분석되었다. 혈청 및 뇨는 또한 Exova(영국 에딘버러)에 의해 구리 수준에 대해 분석되었다.
D. 간 구리 분석
부검 시 취한 간 샘플은 Exova(영국 에딘버러)에 의해 구리 수준에 대해 분석되었다.
E. 조직병리학
포르말린 고정된 파라핀 포매된 조직 샘플은 절편화되고, 표준 프로토콜에 따라 헤마톡실린 및 에오신(H&E)에 대해 염색되었다. 간 섬유증을 검출하기 위해, 씨리우스 레드 염색을 파라핀 절편에서 수행하였다. 절편을 탈파라핀화하고, 0.1%(w/v) Direct Red(Sigma), 4%(w/v) 피크르산(Sigma)의 용액 중에 90분 동안 염색하고, 0.01N HCl(2x1분)에 의해 세척하고, 에탄올 및 자일렌 시리즈를 통해 탈수시키고, 커버 슬립을 적용하였다.
F. Timm 구리 염색
포르말린 고정된 파라핀 포매된 간으로부터의 절편을 탈랍하고, 0.5% 황화암모늄(5분), 탈이온수(1분 세정), 0.1N HCl(2분 내지 3분), 탈이온수(2분 내지 3분 세정) 및 현상제(대략 10분 동안 1부 5% 질산은, 5부 2%(w/v) 하이드로퀴논/5%(w/v) 시트르산) 중에 순차적으로 항온처리하였다. 대조군 동물(야생형 및 ATP7B KO)로부터의 간 절편은 각각의 실행에 포함되고, 한결같은 염색 강도에 대해 모니터링하였다. 절편을 마지막으로 물 중에 세척하고, Nuclear Fast Red에 의해 대조염색하고, 탈수시키고, 커버 슬립을 적용하였다.
G. 조직병리학 스코어링
하기 기준에 기초하여 조직병리학적 병변을 점수 매겼다. 간세포 비대 및 퇴행: 0, 무의미한 병변; 1, 최소 거대핵세포(드물거나 때때로, 소엽 내 1-2 간세포), 2, 경증 거대핵세포(소엽 내 간세포의 10% 미만); 3, 중등도 거대핵세포(소엽 내 간세포의 10% 내지 50%)와 함께 간세포 분해 및 드물거나 아주 적은 단일 세포 괴사; 4, 중증 거대핵세포(소엽 내 간세포의 51% 내지 90%)와 함께 광범위한 간세포 분해 및 빈번한 단일 세포 괴사; 비교적 정상인 간 구조가 유지됨; 5, 현저한 거대핵세포(소엽 내 간세포의 90% 초과)와 함께 소엽 붕괴 및 많은 단일 세포 괴사. 염증: 0, 무; 1, 문맥 부위 내에 경증 내지 아주 적은 응집체 및 유조직 내의 드문 병소; 정상 한계 내로 생각됨; 2, 중등도 - 둘러싼 문맥주위 간세포로 또는 유조직 내에 다원성으로 확장; 3, 현저한 - 가교 또는 박리하는 간세포 또는 유조직 내에 유착으로 다원성. 담관 증생: 0, 무; 1, 문맥 부위 내에 국소 또는 다원성; 2, 문맥주위 부위에서 박리하는 간세포; 3, 구조 왜곡과 함께 가교 또는 박리하는 간세포. 타원형 세포 증생: 0, 무; 1, 국소 또는 다원성(문맥주위); 2, 가교 또는 박리하는 간세포; 3, 구조 왜곡과 함께 가교 또는 박리하는 간세포. 결절 재생: 0, 부재; 1, 존재.
씨리우스 레드 염색에 기초한 섬유증에 대한 등급화 계획은 문헌에 보고된 것으로부터 유래되었다(11): 분포가 중심소엽, 중간대, 문맥주위 또는 미만성인지에 대한 표기에 의해, 0, 무; 1, 국소 또는 다원성; 2, 가교; 3, 구조 왜곡과 함께 가교.
H. 팀 염색에 기초한 구리 축적에 대한 등급화 계획은 문헌에 이전에 기재된 것과 동일하였다(12): 1, 때때로 간세포의 세포질에서의 부재하거나 아주 적은 구리 함유 과립; 정상 한계로 생각됨; 2, 일부 중심소엽 간세포에서의 명확한 구리 함유 과립; 정상 한계로 생각됨; 3, 경증 - 가장 중심소엽 간세포에서의 많은 과립(각각의 소엽의 ⅓); 4, 중등도 - 모든 중심소엽 및 중간대 간세포에서의 많은 과립의 존재(모든 소엽에서 간세포의 대략 ⅔); 5 현저한 - 모든 소엽에서 간 세포의 ⅔ 초과로 풍부한 과립. 통계 분석
모든 데이터에 대해, 그룹 평균 및 평균의 표준 오차(SEM)가 계산되고 보고되었다. 스튜던츠 t 시험은 2개의 그룹을 비교하도록 수행되고, Tukey 다중 비교 시험에 의한 변량의 1방향 분석(AVOVA)은 그룹에 걸쳐 수행되고, 성별에 의해 계층화되었다. 5개의 병리학 매개변수는 벡터 투여에서 분석되고, 연령 일치된 비주사된 Atp7b KO 마우스에서의 것과 비교되었다. 비교는 R 프로그램(버전 3.3.1; https//cran.r-project.org) 내에 Wilcoxon 순위 합 시험을 이용하여 수행되었다. 조합된 병리학 매개변수의 차이는 "metap" 패키지에서 함수 "sumlog"를 사용하여 R 프로그램 내에 Fisher 조합 확률 시험을 이용하여 연령 일치된 비주사된 ATP7B KO 마우스와 비교하여 각각의 용량 그룹에 대해 또한 평가되었다. 0.05의 p 값은 유의미하다고 생각되었다.
실시예 8: 토의
질환의 마우스 모델이 클리닉에 대한 치료학적 접근법의 번역 가능성을 평가하기 위해 사용될 수 있기 전에, 모델을 광범위하게 규명해야 한다. 윌슨병의 다른 마우스 모델의 규명이 수행되었지만(1, 15, 17), 이 연구는 출생으로부터 모든 Atp7b KO 마우스의 양육 이후에 txJ 마우스 염색 및 구리 대사 및 간 질환의 평가 둘 다의 처음의 자세한 규명이다. 이환된 모체의 유선에서의 Atp7b 결핍증으로 인한 젖떼기 전에 생기는 상충하는 구리 결핍증의 부재에서, 이 마우스에서의 질환 진행의 시간 선은 젖떼기 전에 구리 결핍증과 관련된 임의의 기초하는 논의로부터 질환 표현형의 분리를 보장함으로써 더 정확히 결정될 수 있다. 이 마우스 모델에서의 간 질환의 발생 및 결절 재생은 다른 사람에 의해 개발된 Atplb -/- 균주에 대해 이전에 보고된 것과 유사하였다(1, 17). 그러나, 시간 선은 구리의 연속 공급을 발생시키는, 아마도 출생으로부터의 새끼의 양육으로 인해, 이 마우스 균주에서 약간 증가하였다.
이 Atp7b KO 마우스 모델에서, 질환의 진행은 하기와 같다: 간에서의 중증 구리 축적은 2개월령에 Timm의 구리 염색에 의해 보이지만, 다른 사람에 의해 이전에 기재된 것과 유사하게 시간에 따른 감소하였다(1, 15-17). 새끼의 양육으로 인해, 구리는 아마도 출생으로부터 Atp7b KO 마우스의 간에서 축적하고 대략 2 내지 3개월령에 포화 수준에 도달하였다. 2개월령에 간 질환의 발생 이후에, 구리는 아마도 혈청으로 방출되어서, 3 내지 4개월령에 간세포에서의 명확한 축적 감소 및 혈청 구리 수준 상승을 발생시켰다. 초기에서 낮은 수준으로부터 이형접합성 마우스와 유사한 것으로의 혈청 구리 수준의 이 상승은 윌슨병의 또 다른 마우스 모델에 대해 이전에 보고된 것과 다르고(17), 여기서 Atp7b -/- 균주의 혈청 구리 수준은 6주령에 야생형 마우스에서 보인 것과 유사하고, 시간이 지나면서 44주령에 야생형 마우스보다 2배 내지 3배 높게 증가하였다.
본 발명자들은 뇨로의 구리의 오버플로우가 약 3개월령에 시작한다는 것을 관찰하였고, 이것은 유사하게 간세포 괴사 및 축적된 구리의 후속하는 방출로 인할 수 있다. 배설 증가를 발생시키는 신장에서의 Atp7b 활성의 결여(23-25), 또는 Ctrl인 간 구리 운반체의 하향조절을 발생시키는 간에서의 구리의 축적, 및 작은 구리 운반체에 의한 뇨 배설(26)을 포함하는, 신장을 통한 구리의 배설에 대안적인 기전이 제안되어 있다. 다시, 뇨 구리 배설의 시간 경과는 이전에 보고된 이 마우스 모델에서 다르다. 여기서, 뇨 구리 배설은 초기에 이형접합성 및 Atp7b KO 마우스에서 유사하지만, 연구의 과정에 걸쳐 KO 마우스에서 증가하였다. 비교하면, 뇨 구리 수준은 Atp7b -/- 균주에서 6주령에서 야생형 마우스의 3배 초과이고, 14 내지 20주령까지 증가하고, 이후 20주령에 실질적으로 감소하였다(26).
간세포 비대, 퇴행 및 괴사는 이 연령으로부터 앞으로 간 결절 재생의 부위의 그럴듯한 동반한 관찰에 의해 6개월령에 피크이다. 재생에 대한 이 진행은 윌슨병의 다른 마우스 모델에 대해 보고되었다(17). 그러나, 다른 마우스 모델에서와 달리, 여기에 기재된 Atp7b KO 마우스에서 담관암종의 증거가 없었다. 섬유증의 영역은 3개월령에 보였고, 이는 7개월령에 구성적 파괴에 의해 시간이 지나면서 중증도에서 신속히 증가하였다. 3 내지 4개월령에 혈청 아미노기전이효소의 현저한 증가가 있지만, 혈청 총 빌리루빈 수준의 증가는 오직 9개월에 나타나기 시작하여서, 진행된 간 질환을 나타낸다.
이 Atp7b KO 마우스 모델의 규명 이후에, 본 발명자들은 윌슨병의 치료를 위한 유전자 치료 접근법을 개발하였다. 2개월령에 Atp7b KO 마우스로 인간 ATP7B 전이유전자의 코돈 최적화된 버전을 발현하는 AAV8 벡터의 IV 투여는 벡터 투여 후 2주에 혈청 구리 수준의 증가를 발생시켰다. 여기서 평가된 벡터의 더 높은 용량(109 GC/마우스 초과)은 연령 일치된 비주사된 Atp7b KO 마우스와 비교하여 간 구리 수준의 유의미한 감소를 발생시켰다. 오직 1011 GC/마우스가 주사된 수컷 마우스에 존재하는 경증의 조직병리학적 발견 및 간 섬유증의 완전한 결여에 의해, 간 병변의 유의미한 용량 의존적 감소가 있었다. 따라서, 질환 발생의 초기 병기 동안 유전자 치료 접근법의 투여는 윌슨병의 마우스 모델에서 간 손상을 막고, 구리 대사를 수정하였다.
본 명세서에 인용된 모든 공보, 및 미국 특허 가출원 제62/440,659호 및 제62/473,656호는 본 명세서에 참고로 포함된다. 유사하게, 본 명세서에 언급되고 첨부된 서열 목록에 보이는 서열 번호는 참고로 포함된다. 본 발명이 특정한 실시형태와 관련하여 기재되어 있지만, 본 발명의 사상으로부터 벗어나지 않으면서 변형이 이루어질 수 있는 것으로 이해될 것이다. 이러한 변형은 첨부된 청구항의 범위 내에 해당하도록 의도된다.
[서열목록 자유텍스트]
참고문헌
SEQUENCE LISTING
<110> Trustees of the University of Pennsylvania
<120> GENE THERAPY FOR TREATING WILSON'S DISEASE
<130> WO2018/126116
<140> PCT/US2017/068919
<141> 2017-12-29
<150> US 62/440,659
<151> 2016-12-30
<150> US 62/473,656
<151> 2017-03-20
<160> 35
<170> PatentIn version 3.5
<210> 1
<211> 4395
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 1
atgcccgagc aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc 60
aagctgagcc tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac 120
aacgtgggct acgagggcgg cctggacgga ctgggaccat cttctcaggt ggccacaagc 180
accgtgcgca tcctgggcat gacctgccag agctgcgtga agtccatcga ggaccggatc 240
agcaacctga agggcatcat cagcatgaag gtgtccctgg aacagggcag cgccaccgtg 300
aaatacgtgc cctctgtcgt gtgcctgcag caggtgtgcc accagatcgg cgacatgggc 360
ttcgaggcct ctatcgccga gggaaaggcc gcctcttggc cctctagaag cctgcctgct 420
caggaagccg tcgtgaagct gcgggtggaa gggatgacct gtcagtcctg cgtgtccagc 480
atcgagggca aagtgcggaa gctgcagggc gtggtgcgcg tgaaagtgtc tctgagcaac 540
caggaagctg tgatcaccta ccagccctac ctgatccagc ccgaggacct gagggaccac 600
gtgaacgata tgggatttga ggccgccatc aagagcaagg tggcccctct gtctctgggc 660
cccatcgaca tcgagagact gcagagcacc aaccccaagc ggcctctgag cagcgccaac 720
cagaacttca acaacagcga gacactgggc caccagggca gccacgtcgt gacactgcag 780
ctgcggatcg acggaatgca ctgcaagagc tgtgtgctga acatcgagga aaacatcggc 840
cagctgctgg gagtgcagag catccaggtg tcactggaaa acaagaccgc ccaggtgaag 900
tacgacccca gctgcacaag ccccgtggcc ctgcagagag ccattgaagc tctgccccct 960
ggcaacttca aagtgtccct gcctgacgga gccgagggct ccggaacaga tcacagaagc 1020
agcagcagcc acagccctgg cagcccccct agaaatcagg tgcagggcac ctgtagcacc 1080
accctgatcg ccattgccgg catgacatgc gccagctgcg tgcactctat tgagggcatg 1140
atctcccagc tggaaggcgt gcagcagatc agtgtgtctc tggccgaggg caccgccaca 1200
gtgctgtaca accctagcgt gatcagcccc gaagaactga gagccgccat tgaggacatg 1260
ggattcgaag ccagcgtggt gtccgagagc tgctccacca accctctggg caatcacagc 1320
gccggcaaca gcatggtgca gaccaccgac ggcaccccca ccagcgtgca ggaagtggcc 1380
ccacatacag gcagactgcc cgccaatcac gcccccgata tcctggccaa gagcccccag 1440
agtacaagag ccgtggcccc ccagaagtgc ttcctgcaga tcaagggcat gacttgtgcc 1500
tcttgtgtgt ccaatatcga gcggaacctg cagaaagagg ccggcgtgct gtctgtgctg 1560
gtggctctga tggccggcaa ggccgagatc aaatacgacc ccgaagtgat tcagcccctg 1620
gaaatcgccc agtttatcca ggacctgggc tttgaagccg ccgtgatgga agattacgcc 1680
ggctccgacg gcaacatcga gctgaccatc accggaatga cctgcgcctc ctgtgtgcac 1740
aacattgagt ccaagctgac ccggaccaac ggcatcacct acgcctctgt ggctctggcc 1800
acctccaagg ccctcgtgaa gttcgatccc gagatcatcg gccccaggga catcatcaag 1860
atcatcgaag agatcggctt ccacgccagc ctggcccaga ggaaccctaa cgcccaccac 1920
ctggaccaca agatggaaat caagcagtgg aagaaaagct tcctgtgcag cctggtgttc 1980
ggcatccccg tgatggccct gatgatctac atgctgatcc ccagcaacga gccccaccag 2040
tccatggtgc tggatcacaa catcatcccc ggcctgtcta tcctgaacct gatcttcttc 2100
atcctgtgca ccttcgtgca gctgctgggc ggctggtact tctacgtgca ggcctacaag 2160
tccctgcggc acagatccgc caacatggac gtgctgatcg tgctggccac atctatcgcc 2220
tacgtgtact ccctcgtgat cctggtggtg gccgtggccg agaaagccga gagaagccct 2280
gtgaccttct tcgacacccc ccctatgctg ttcgtgttta tcgccctggg ccggtggctg 2340
gaacacctgg ccaaaagcaa gaccagcgag gccctggcta agctgatgag tctgcaggcc 2400
accgaggcca cagtcgtgac cctgggcgag gacaacctga tcatccgcga ggaacaggtg 2460
ccaatggaac tggtgcagcg gggcgacatc gtgaaggtgg tgcctggcgg caagttcccc 2520
gtggacggaa aagtgctgga agggaatacc atggccgacg agagcctgat cacaggcgag 2580
gccatgcccg tgaccaagaa acctggcagc acagtgatcg ccggcagcat caatgcccac 2640
ggcagcgtgc tgattaaggc cacacacgtg ggcaacgata ccaccctggc tcagattgtg 2700
aagctggtgg aagaggccca gatgagcaag gcccccattc agcagctggc tgaccggttc 2760
agcggctact tcgtgccctt tatcatcatc atgagcaccc tgacactggt cgtgtggatc 2820
gtgatcggct ttatcgactt cggagtggtg cagagatact tccccaaccc taacaagcac 2880
atcagccaga cagaagtgat catcagattc gcctttcaga ccagcatcac cgtgctgtgt 2940
atcgcctgcc cctgtagcct gggactggcc acacctaccg ctgtgatggt gggaacaggc 3000
gtggccgctc agaacggcat cctgatcaag gggggcaagc ctctggaaat ggctcacaag 3060
atcaagaccg tgatgttcga caagaccggc accatcaccc acggcgtgcc cagagtgatg 3120
agagtgctgc tgctggggga tgtggccacc ctgcctctga gaaaggtgct ggctgtcgtg 3180
ggcacagccg aggctagctc tgaacaccca ctgggagtgg ccgtgacaaa gtactgcaaa 3240
gaggaactgg gcaccgaaac cctgggctac tgcaccgact ttcaggccgt gcctggctgt 3300
ggcatcggct gcaaggtgtc caacgtggaa ggcatcctgg cccacagcga gaggccactg 3360
tctgcccctg ccagccacct gaacgaggcc ggatctctgc ccgccgaaaa ggacgctgtg 3420
ccccagacct tctctgtgct gattggcaac agagagtggc tgcggcggaa cggcctgacc 3480
atctcctccg atgtgtccga cgccatgacc gaccacgaga tgaagggcca gaccgccatt 3540
ctggtggcca ttgacggggt gctgtgcggc atgatcgcaa tcgccgatgc cgtgaaacag 3600
gaagcagcac tggccgtgca caccctgcag tctatgggag tggatgtggt gctgatcacc 3660
ggcgacaaca gaaagaccgc cagggccatt gccacccagg tgggcatcaa caaggtgttc 3720
gccgaggtgc tgcccagcca caaagtggcc aaggtgcagg aactgcagaa caaaggcaaa 3780
aaggtggcca tggtgggaga tggcgtgaac gactctcctg ctctggccca ggcagatatg 3840
ggcgtggcca tcggcacagg caccgacgtg gcaattgagg ctgctgacgt ggtgctgatt 3900
cggaacgacc tgctggacgt ggtggcctcc atccacctgt ccaagagaac cgtgcggcgg 3960
atcagaatca acctggtgct ggcactgatc tataacctcg tgggcatccc tatcgccgct 4020
ggcgtgttca tgcctatcgg aatcgtgctg cagccctgga tgggctctgc cgccatggct 4080
gcaagctccg tgtctgtggt gctgtccagc ctgcagctga agtgctacaa gaagcccgac 4140
ctggaaagat acgaggccca ggcccacgga cacatgaagc ctctgacagc ctcccaggtg 4200
tccgtgcaca tcggcatgga cgacagatgg cgggacagcc ctagagccac cccttgggat 4260
caggtgtcat acgtgtcaca ggtgtccctg agcagcctga ccagcgacaa gcccagcaga 4320
catagcgccg ctgccgacga cgatggggac aagtggtccc tgctgctgaa cggccgggat 4380
gaggaacagt acatc 4395
<210> 2
<211> 1465
<212> PRT
<213> Homo sapiens
<400> 2
Met Pro Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg
1 5 10 15
Lys Ile Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala
20 25 30
Met Lys Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu
35 40 45
Asp Gly Leu Gly Pro Ser Ser Gln Val Ala Thr Ser Thr Val Arg Ile
50 55 60
Leu Gly Met Thr Cys Gln Ser Cys Val Lys Ser Ile Glu Asp Arg Ile
65 70 75 80
Ser Asn Leu Lys Gly Ile Ile Ser Met Lys Val Ser Leu Glu Gln Gly
85 90 95
Ser Ala Thr Val Lys Tyr Val Pro Ser Val Val Cys Leu Gln Gln Val
100 105 110
Cys His Gln Ile Gly Asp Met Gly Phe Glu Ala Ser Ile Ala Glu Gly
115 120 125
Lys Ala Ala Ser Trp Pro Ser Arg Ser Leu Pro Ala Gln Glu Ala Val
130 135 140
Val Lys Leu Arg Val Glu Gly Met Thr Cys Gln Ser Cys Val Ser Ser
145 150 155 160
Ile Glu Gly Lys Val Arg Lys Leu Gln Gly Val Val Arg Val Lys Val
165 170 175
Ser Leu Ser Asn Gln Glu Ala Val Ile Thr Tyr Gln Pro Tyr Leu Ile
180 185 190
Gln Pro Glu Asp Leu Arg Asp His Val Asn Asp Met Gly Phe Glu Ala
195 200 205
Ala Ile Lys Ser Lys Val Ala Pro Leu Ser Leu Gly Pro Ile Asp Ile
210 215 220
Glu Arg Leu Gln Ser Thr Asn Pro Lys Arg Pro Leu Ser Ser Ala Asn
225 230 235 240
Gln Asn Phe Asn Asn Ser Glu Thr Leu Gly His Gln Gly Ser His Val
245 250 255
Val Thr Leu Gln Leu Arg Ile Asp Gly Met His Cys Lys Ser Cys Val
260 265 270
Leu Asn Ile Glu Glu Asn Ile Gly Gln Leu Leu Gly Val Gln Ser Ile
275 280 285
Gln Val Ser Leu Glu Asn Lys Thr Ala Gln Val Lys Tyr Asp Pro Ser
290 295 300
Cys Thr Ser Pro Val Ala Leu Gln Arg Ala Ile Glu Ala Leu Pro Pro
305 310 315 320
Gly Asn Phe Lys Val Ser Leu Pro Asp Gly Ala Glu Gly Ser Gly Thr
325 330 335
Asp His Arg Ser Ser Ser Ser His Ser Pro Gly Ser Pro Pro Arg Asn
340 345 350
Gln Val Gln Gly Thr Cys Ser Thr Thr Leu Ile Ala Ile Ala Gly Met
355 360 365
Thr Cys Ala Ser Cys Val His Ser Ile Glu Gly Met Ile Ser Gln Leu
370 375 380
Glu Gly Val Gln Gln Ile Ser Val Ser Leu Ala Glu Gly Thr Ala Thr
385 390 395 400
Val Leu Tyr Asn Pro Ser Val Ile Ser Pro Glu Glu Leu Arg Ala Ala
405 410 415
Ile Glu Asp Met Gly Phe Glu Ala Ser Val Val Ser Glu Ser Cys Ser
420 425 430
Thr Asn Pro Leu Gly Asn His Ser Ala Gly Asn Ser Met Val Gln Thr
435 440 445
Thr Asp Gly Thr Pro Thr Ser Val Gln Glu Val Ala Pro His Thr Gly
450 455 460
Arg Leu Pro Ala Asn His Ala Pro Asp Ile Leu Ala Lys Ser Pro Gln
465 470 475 480
Ser Thr Arg Ala Val Ala Pro Gln Lys Cys Phe Leu Gln Ile Lys Gly
485 490 495
Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu Gln Lys
500 505 510
Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly Lys Ala
515 520 525
Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile Ala Gln
530 535 540
Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp Tyr Ala
545 550 555 560
Gly Ser Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr Cys Ala
565 570 575
Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn Gly Ile
580 585 590
Thr Tyr Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val Lys Phe
595 600 605
Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile Glu Glu
610 615 620
Ile Gly Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala His His
625 630 635 640
Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe Leu Cys
645 650 655
Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr Met Leu
660 665 670
Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His Asn Ile
675 680 685
Ile Pro Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu Cys Thr
690 695 700
Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala Tyr Lys
705 710 715 720
Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val Leu Ala
725 730 735
Thr Ser Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val Ala Val
740 745 750
Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr Pro Pro
755 760 765
Met Leu Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His Leu Ala
770 775 780
Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu Gln Ala
785 790 795 800
Thr Glu Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile Ile Arg
805 810 815
Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile Val Lys
820 825 830
Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu Glu Gly
835 840 845
Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met Pro Val
850 855 860
Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn Ala His
865 870 875 880
Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr Thr Leu
885 890 895
Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys Ala Pro
900 905 910
Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro Phe Ile
915 920 925
Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile Gly Phe
930 935 940
Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn Lys His
945 950 955 960
Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr Ser Ile
965 970 975
Thr Val Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala Thr Pro
980 985 990
Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly Ile Leu
995 1000 1005
Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys Thr
1010 1015 1020
Val Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg
1025 1030 1035
Val Met Arg Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu
1040 1045 1050
Arg Lys Val Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu
1055 1060 1065
His Pro Leu Gly Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu
1070 1075 1080
Gly Thr Glu Thr Leu Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro
1085 1090 1095
Gly Cys Gly Ile Gly Cys Lys Val Ser Asn Val Glu Gly Ile Leu
1100 1105 1110
Ala His Ser Glu Arg Pro Leu Ser Ala Pro Ala Ser His Leu Asn
1115 1120 1125
Glu Ala Gly Ser Leu Pro Ala Glu Lys Asp Ala Val Pro Gln Thr
1130 1135 1140
Phe Ser Val Leu Ile Gly Asn Arg Glu Trp Leu Arg Arg Asn Gly
1145 1150 1155
Leu Thr Ile Ser Ser Asp Val Ser Asp Ala Met Thr Asp His Glu
1160 1165 1170
Met Lys Gly Gln Thr Ala Ile Leu Val Ala Ile Asp Gly Val Leu
1175 1180 1185
Cys Gly Met Ile Ala Ile Ala Asp Ala Val Lys Gln Glu Ala Ala
1190 1195 1200
Leu Ala Val His Thr Leu Gln Ser Met Gly Val Asp Val Val Leu
1205 1210 1215
Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile Ala Thr Gln
1220 1225 1230
Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser His Lys
1235 1240 1245
Val Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val Ala
1250 1255 1260
Met Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala
1265 1270 1275
Asp Met Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu
1280 1285 1290
Ala Ala Asp Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val
1295 1300 1305
Ala Ser Ile His Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile
1310 1315 1320
Asn Leu Val Leu Ala Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile
1325 1330 1335
Ala Ala Gly Val Phe Met Pro Ile Gly Ile Val Leu Gln Pro Trp
1340 1345 1350
Met Gly Ser Ala Ala Met Ala Ala Ser Ser Val Ser Val Val Leu
1355 1360 1365
Ser Ser Leu Gln Leu Lys Cys Tyr Lys Lys Pro Asp Leu Glu Arg
1370 1375 1380
Tyr Glu Ala Gln Ala His Gly His Met Lys Pro Leu Thr Ala Ser
1385 1390 1395
Gln Val Ser Val His Ile Gly Met Asp Asp Arg Trp Arg Asp Ser
1400 1405 1410
Pro Arg Ala Thr Pro Trp Asp Gln Val Ser Tyr Val Ser Gln Val
1415 1420 1425
Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro Ser Arg His Ser Ala
1430 1435 1440
Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu Leu Leu Asn Gly
1445 1450 1455
Arg Asp Glu Glu Gln Tyr Ile
1460 1465
<210> 3
<211> 4395
<212> DNA
<213> Homo sapiens
<400> 3
atgcctgagc aggagagaca gatcacagcc agagaagggg ccagtcggaa aatcttatct 60
aagctttctt tgcctacccg tgcctgggaa ccagcaatga agaagagttt tgcttttgac 120
aatgttggct atgaaggtgg tctggatggc ctgggccctt cttctcaggt ggccaccagc 180
acagtcagga tcttgggcat gacttgccag tcatgtgtga agtccattga ggacaggatt 240
tccaatttga aaggcatcat cagcatgaag gtttccctgg aacaaggcag tgccactgtg 300
aaatatgtgc catcggttgt gtgcctgcaa caggtttgcc atcaaattgg ggacatgggc 360
ttcgaggcca gcattgcaga aggaaaggca gcctcctggc cctcaaggtc cttgcctgcc 420
caggaggctg tggtcaagct ccgggtggag ggcatgacct gccagtcctg tgtcagctcc 480
attgaaggca aggtccggaa actgcaagga gtagtgagag tcaaagtctc actcagcaac 540
caagaggccg tcatcactta tcagccttat ctcattcagc ccgaagacct cagggaccat 600
gtaaatgaca tgggatttga agctgccatc aagagcaaag tggctccctt aagcctggga 660
ccaattgata ttgagcggtt acaaagcact aacccaaaga gacctttatc ttctgctaac 720
cagaatttta ataattctga gaccttgggg caccaaggaa gccatgtggt caccctccaa 780
ctgagaatag atggaatgca ttgtaagtct tgcgtcttga atattgaaga aaatattggc 840
cagctcctag gggttcaaag tattcaagtg tccttggaga acaaaactgc ccaagtaaag 900
tatgaccctt cttgtaccag cccagtggct ctgcagaggg ctatcgaggc acttccacct 960
gggaatttta aagtttctct tcctgatgga gccgaaggga gtgggacaga tcacaggtct 1020
tccagttctc attcccctgg ctccccaccg agaaaccagg tccagggcac atgcagtacc 1080
actctgattg ccattgccgg catgacctgt gcatcctgtg tccattccat tgaaggcatg 1140
atctcccaac tggaaggggt gcagcaaata tcggtgtctt tggccgaagg gactgcaaca 1200
gttctttata atccctctgt aattagccca gaagaactca gagctgctat agaagacatg 1260
ggatttgagg cttcagtcgt ttctgaaagc tgttctacta accctcttgg aaaccacagt 1320
gctgggaatt ccatggtgca aactacagat ggtacaccta catctgtgca ggaagtggct 1380
ccccacactg ggaggctccc tgcaaaccat gccccggaca tcttggcaaa gtccccacaa 1440
tcaaccagag cagtggcacc gcagaagtgc ttcttacaga tcaaaggcat gacctgtgca 1500
tcctgtgtgt ctaacataga aaggaatctg cagaaagaag ctggtgttct ctccgtgttg 1560
gttgccttga tggcaggaaa ggcagagatc aagtatgacc cagaggtcat ccagcccctc 1620
gagatagctc agttcatcca ggacctgggt tttgaggcag cagtcatgga ggactacgca 1680
ggctccgatg gcaacattga gctgacaatc acagggatga cctgcgcgtc ctgtgtccac 1740
aacatagagt ccaaactcac gaggacaaat ggcatcactt atgcctccgt tgcccttgcc 1800
accagcaaag cccttgttaa gtttgacccg gaaattatcg gtccacggga tattatcaaa 1860
attattgagg aaattggctt tcatgcttcc ctggcccaga gaaaccccaa cgctcatcac 1920
ttggaccaca agatggaaat aaagcagtgg aagaagtctt tcctgtgcag cctggtgttt 1980
ggcatccctg tcatggcctt aatgatctat atgctgatac ccagcaacga gccccaccag 2040
tccatggtcc tggaccacaa catcattcca ggactgtcca ttctaaatct catcttcttt 2100
atcttgtgta cctttgtcca gctcctcggt gggtggtact tctacgttca ggcctacaaa 2160
tctctgagac acaggtcagc caacatggac gtgctcatcg tcctggccac aagcattgct 2220
tatgtttatt ctctggtcat cctggtggtt gctgtggctg agaaggcgga gaggagccct 2280
gtgacattct tcgacacgcc ccccatgctc tttgtgttca ttgccctggg ccggtggctg 2340
gaacacttgg caaagagcaa aacctcagaa gccctggcta aactcatgtc tctccaagcc 2400
acagaagcca ccgttgtgac ccttggtgag gacaatttaa tcatcaggga ggagcaagtc 2460
cccatggagc tggtgcagcg gggcgatatc gtcaaggtgg tccctggggg aaagtttcca 2520
gtggatggga aagtcctgga aggcaatacc atggctgatg agtccctcat cacaggagaa 2580
gccatgccag tcactaagaa acccggaagc actgtaattg cggggtctat aaatgcacat 2640
ggctctgtgc tcattaaagc tacccacgtg ggcaatgaca ccactttggc tcagattgtg 2700
aaactggtgg aagaggctca gatgtcaaag gcacccattc agcagctggc tgaccggttt 2760
agtggatatt ttgtcccatt tatcatcatc atgtcaactt tgacgttggt ggtatggatt 2820
gtaatcggtt ttatcgattt tggtgttgtt cagagatact ttcctaaccc caacaagcac 2880
atctcccaga cagaggtgat catccggttt gctttccaga cgtccatcac ggtgctgtgc 2940
attgcctgcc cctgctccct ggggctggcc acgcccacgg ctgtcatggt gggcaccggg 3000
gtggccgcgc agaacggcat cctcatcaag ggaggcaagc ccctggagat ggcgcacaag 3060
ataaagactg tgatgtttga caagactggc accattaccc atggcgtccc cagggtcatg 3120
cgggtgctcc tgctggggga tgtggccaca ctgcccctca ggaaggttct ggctgtggtg 3180
gggactgcgg aggccagcag tgaacacccc ttgggcgtgg cagtcaccaa atactgtaaa 3240
gaggaacttg gaacagagac cttgggatac tgcacggact tccaggcagt gccaggctgt 3300
ggaattgggt gcaaagtcag caacgtggaa ggcatcctgg cccacagtga gcgccctttg 3360
agtgcaccgg ccagtcacct gaatgaggct ggcagccttc ccgcagaaaa agatgcagtc 3420
ccccagacct tctctgtgct gattggaaac cgtgagtggc tgaggcgcaa cggtttaacc 3480
atttctagcg atgtcagtga cgctatgaca gaccacgaga tgaaaggaca gacagccatc 3540
ctggtggcta ttgacggtgt gctctgtggg atgatcgcaa tcgcagacgc tgtcaagcag 3600
gaggctgccc tggctgtgca cacgctgcag agcatgggtg tggacgtggt tctgatcacg 3660
ggggacaacc ggaagacagc cagagctatt gccacccagg ttggcatcaa caaagtcttt 3720
gcagaggtgc tgccttcgca caaggtggcc aaggtccagg agctccagaa taaagggaag 3780
aaagtcgcca tggtggggga tggggtcaat gactccccgg ccttggccca ggcagacatg 3840
ggtgtggcca ttggcaccgg cacggatgtg gccatcgagg cagccgacgt cgtccttatc 3900
agaaatgatt tgctggatgt ggtggctagc attcaccttt ccaagaggac tgtccgaagg 3960
atacgcatca acctggtcct ggcactgatt tataacctgg ttgggatacc cattgcagca 4020
ggtgtcttca tgcccatcgg cattgtgctg cagccctgga tgggctcagc ggccatggca 4080
gcctcctctg tgtctgtggt gctctcatcc ctgcagctca agtgctataa gaagcctgac 4140
ctggagaggt atgaggcaca ggcgcatggc cacatgaagc ccctgacggc atcccaggtc 4200
agtgtgcaca taggcatgga tgacaggtgg cgggactccc ccagggccac accatgggac 4260
caggtcagct atgtcagcca ggtgtcgctg tcctccctga cgtccgacaa gccatctcgg 4320
cacagcgctg cagcagacga tgatggggac aagtggtctc tgctcctgaa tggcagggat 4380
gaggagcagt acatc 4395
<210> 4
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 4
tgtttgctgc ttgcaatgtt tgcccatttt aggg 34
<210> 5
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 5
ctacctcgtg atcgcccggc ccctgttcaa acatgtccta atactctgtc tctgcaaggg 60
tcatcagtag ttttccatct tactcaacat cctcccagtg 100
<210> 6
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 6
aggttaattt ttaaactgtt tgctctggtt aataatctca gg 42
<210> 7
<211> 322
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 7
aaggctcaga ggcacacagg agtttctggg ctcaccctgc ccccttccaa cccctcagtt 60
cccatcctcc agcagctgtt tgtgtgctgc ctctgaagtc cacactgaac aaacttcagc 120
ctactcatgt ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct 180
ccctgcctgc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac 240
ctccaacatc cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg 300
tggtttaggt agtgtgagag gg 322
<210> 8
<211> 178
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 8
actcaaagtt caaaccttat cattttttgc tttgttcctc ttggccttgg ttttgtacat 60
cagctttgaa aataccatcc cagggttaat gctggggtta atttataact aagagtgctc 120
tagttttgca atacaggaca tgctataaaa atggaaagat gttgctttct gagagaca 178
<210> 9
<211> 477
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 9
agggctggaa gctacctttg acatcatttc ctctgcgaat gcatgtataa tttctacaga 60
acctattaga aaggatcacc cagcctctgc ttttgtacaa ctttccctta aaaaactgcc 120
aattccactg ctgtttggcc caatagtgag aactttttcc tgctgcctct tggtgctttt 180
gcctatggcc cctattctgc ctgctgaaga cactcttgcc agcatggact taaacccctc 240
cagctctgac aatcctcttt ctcttttgtt ttacatgaag ggtctggcag ccaaagcaat 300
cactcaaagt tcaaacctta tcattttttg ctttgttcct cttggccttg gttttgtaca 360
tcagctttga aaataccatc ccagggttaa tgctggggtt aatttataac taagagtgct 420
ctagttttgc aatacaggac atgctataaa aatggaaaga tgttgctttc tgagaga 477
<210> 10
<211> 218
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 10
tggacacagg acgctgtggt ttctgagcca gggggcgact cagatcccag ccagtggact 60
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 120
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 180
cagcttcagg caccaccact gacctgggac agtgaata 218
<210> 11
<211> 190
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 11
atttcataga acgaatgttc cgatgctcta atctctctag acaaggttca tatttgtatg 60
ggttacttat tctctctttg ttgactaagt caataatcag aatcagcagg tttgcagtca 120
gattggcagg gataagcagc ctagctcagg agaagtgagt ataaaagccc caggctggga 180
gcagccatca 190
<210> 12
<211> 215
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 12
gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 60
ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 120
cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 180
gaggattggg aagacaatag caggcatgct gggga 215
<210> 13
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 13
aataaagtct gagtgggcgg cagcctgtgt gtgcctgggt tctctctgtc ccggaatgtg 60
caaacaatgg aggtg 75
<210> 14
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 14
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacg 168
<210> 15
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 15
cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 60
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 120
acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 168
<210> 16
<211> 738
<212> PRT
<213> adeno-associated virus 8
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 17
<211> 3966
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 17
atgcccgagc aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc 60
aagctgagcc tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac 120
aacgtgggct acgagggcgg cctggacgga ctgggaccat cttctcaggt ggccacaagc 180
accgtgcgcg aggccgccat caagagcaag gtggcccctc tgtctctggg ccccatcgac 240
atcgagagac tgcagagcac caaccccaag cggcctctga gcagcgccaa ccagaacttc 300
aacaacagcg agacactggg ccaccagggc agccacgtcg tgacactgca gctgcggatc 360
gacggaatgc actgcaagag ctgtgtgctg aacatcgagg aaaacatcgg ccagctgctg 420
ggagtgcaga gcatccaggt gtcactggaa aacaagaccg cccaggtgaa gtacgacccc 480
agctgcacaa gccccgtggc cctgcagaga gccattgaag ctctgccccc tggcaacttc 540
aaagtgtccc tgcctgacgg agccgagggc tccggaacag atcacagaag cagcagcagc 600
cacagccctg gcagcccccc tagaaatcag gtgcagggca cctgtagcac caccctgatc 660
gccattgccg gcatgacatg cgccagctgc gtgcactcta ttgagggcat gatctcccag 720
ctggaaggcg tgcagcagat cagtgtgtct ctggccgagg gcaccgccac agtgctgtac 780
aaccctagcg tgatcagccc cgaagaactg agagccgcca ttgaggacat gggattcgaa 840
gccagcgtgg tgtccgagag ctgctccacc aaccctctgg gcaatcacag cgccggcaac 900
agcatggtgc agaccaccga cggcaccccc accagcgtgc aggaagtggc cccacataca 960
ggcagactgc ccgccaatca cgcccccgat atcctggcca agagccccca gagtacaaga 1020
gccgtggccc cccagaagtg cttcctgcag atcaagggca tgacttgtgc ctcttgtgtg 1080
tccaatatcg agcggaacct gcagaaagag gccggcgtgc tgtctgtgct ggtggctctg 1140
atggccggca aggccgagat caaatacgac cccgaagtga ttcagcccct ggaaatcgcc 1200
cagtttatcc aggacctggg ctttgaagcc gccgtgatgg aagattacgc cggctccgac 1260
ggcaacatcg agctgaccat caccggaatg acctgcgcct cctgtgtgca caacattgag 1320
tccaagctga cccggaccaa cggcatcacc tacgcctctg tggctctggc cacctccaag 1380
gccctcgtga agttcgatcc cgagatcatc ggccccaggg acatcatcaa gatcatcgaa 1440
gagatcggct tccacgccag cctggcccag aggaacccta acgcccacca cctggaccac 1500
aagatggaaa tcaagcagtg gaagaaaagc ttcctgtgca gcctggtgtt cggcatcccc 1560
gtgatggccc tgatgatcta catgctgatc cccagcaacg agccccacca gtccatggtg 1620
ctggatcaca acatcatccc cggcctgtct atcctgaacc tgatcttctt catcctgtgc 1680
accttcgtgc agctgctggg cggctggtac ttctacgtgc aggcctacaa gtccctgcgg 1740
cacagatccg ccaacatgga cgtgctgatc gtgctggcca catctatcgc ctacgtgtac 1800
tccctcgtga tcctggtggt ggccgtggcc gagaaagccg agagaagccc tgtgaccttc 1860
ttcgacaccc cccctatgct gttcgtgttt atcgccctgg gccggtggct ggaacacctg 1920
gccaaaagca agaccagcga ggccctggct aagctgatga gtctgcaggc caccgaggcc 1980
acagtcgtga ccctgggcga ggacaacctg atcatccgcg aggaacaggt gccaatggaa 2040
ctggtgcagc ggggcgacat cgtgaaggtg gtgcctggcg gcaagttccc cgtggacgga 2100
aaagtgctgg aagggaatac catggccgac gagagcctga tcacaggcga ggccatgccc 2160
gtgaccaaga aacctggcag cacagtgatc gccggcagca tcaatgccca cggcagcgtg 2220
ctgattaagg ccacacacgt gggcaacgat accaccctgg ctcagattgt gaagctggtg 2280
gaagaggccc agatgagcaa ggcccccatt cagcagctgg ctgaccggtt cagcggctac 2340
ttcgtgccct ttatcatcat catgagcacc ctgacactgg tcgtgtggat cgtgatcggc 2400
tttatcgact tcggagtggt gcagagatac ttccccaacc ctaacaagca catcagccag 2460
acagaagtga tcatcagatt cgcctttcag accagcatca ccgtgctgtg tatcgcctgc 2520
ccctgtagcc tgggactggc cacacctacc gctgtgatgg tgggaacagg cgtggccgct 2580
cagaacggca tcctgatcaa ggggggcaag cctctggaaa tggctcacaa gatcaagacc 2640
gtgatgttcg acaagaccgg caccatcacc cacggcgtgc ccagagtgat gagagtgctg 2700
ctgctggggg atgtggccac cctgcctctg agaaaggtgc tggctgtcgt gggcacagcc 2760
gaggctagct ctgaacaccc actgggagtg gccgtgacaa agtactgcaa agaggaactg 2820
ggcaccgaaa ccctgggcta ctgcaccgac tttcaggccg tgcctggctg tggcatcggc 2880
tgcaaggtgt ccaacgtgga aggcatcctg gcccacagcg agaggccact gtctgcccct 2940
gccagccacc tgaacgaggc cggatctctg cccgccgaaa aggacgctgt gccccagacc 3000
ttctctgtgc tgattggcaa cagagagtgg ctgcggcgga acggcctgac catctcctcc 3060
gatgtgtccg acgccatgac cgaccacgag atgaagggcc agaccgccat tctggtggcc 3120
attgacgggg tgctgtgcgg catgatcgca atcgccgatg ccgtgaaaca ggaagcagca 3180
ctggccgtgc acaccctgca gtctatggga gtggatgtgg tgctgatcac cggcgacaac 3240
agaaagaccg ccagggccat tgccacccag gtgggcatca acaaggtgtt cgccgaggtg 3300
ctgcccagcc acaaagtggc caaggtgcag gaactgcaga acaaaggcaa aaaggtggcc 3360
atggtgggag atggcgtgaa cgactctcct gctctggccc aggcagatat gggcgtggcc 3420
atcggcacag gcaccgacgt ggcaattgag gctgctgacg tggtgctgat tcggaacgac 3480
ctgctggacg tggtggcctc catccacctg tccaagagaa ccgtgcggcg gatcagaatc 3540
aacctggtgc tggcactgat ctataacctc gtgggcatcc ctatcgccgc tggcgtgttc 3600
atgcctatcg gaatcgtgct gcagccctgg atgggctctg ccgccatggc tgcaagctcc 3660
gtgtctgtgg tgctgtccag cctgcagctg aagtgctaca agaagcccga cctggaaaga 3720
tacgaggccc aggcccacgg acacatgaag cctctgacag cctcccaggt gtccgtgcac 3780
atcggcatgg acgacagatg gcgggacagc cctagagcca ccccttggga tcaggtgtca 3840
tacgtgtcac aggtgtccct gagcagcctg accagcgaca agcccagcag acatagcgcc 3900
gctgccgacg acgatgggga caagtggtcc ctgctgctga acggccggga tgaggaacag 3960
tacatc 3966
<210> 18
<211> 3360
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 18
atgcccgagc aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc 60
aagctgagcc tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac 120
aacgtgggct acgagggcgg cctggacgga ctgggaccat cttctcaggt ggccacaagc 180
accgtgcgca gccccgaaga actgagagcc gccattgagg acatgggatt cgaagccagc 240
gtggtgtccg agagctgctc caccaaccct ctgggcaatc acagcgccgg caacagcatg 300
gtgcagacca ccgacggcac ccccaccagc gtgcaggaag tggccccaca tacaggcaga 360
ctgcccgcca atcacgcccc cgatatcctg gccaagagcc cccagagtac aagagccgtg 420
gccccccaga agtgcttcct gcagatcaag ggcatgactt gtgcctcttg tgtgtccaat 480
atcgagcgga acctgcagaa agaggccggc gtgctgtctg tgctggtggc tctgatggcc 540
ggcaaggccg agatcaaata cgaccccgaa gtgattcagc ccctggaaat cgcccagttt 600
atccaggacc tgggctttga agccgccgtg atggaagatt acgccggctc cgacggcaac 660
atcgagctga ccatcaccgg aatgacctgc gcctcctgtg tgcacaacat tgagtccaag 720
ctgacccgga ccaacggcat cacctacgcc tctgtggctc tggccacctc caaggccctc 780
gtgaagttcg atcccgagat catcggcccc agggacatca tcaagatcat cgaagagatc 840
ggcttccacg ccagcctggc ccagaggaac cctaacgccc accacctgga ccacaagatg 900
gaaatcaagc agtggaagaa aagcttcctg tgcagcctgg tgttcggcat ccccgtgatg 960
gccctgatga tctacatgct gatccccagc aacgagcccc accagtccat ggtgctggat 1020
cacaacatca tccccggcct gtctatcctg aacctgatct tcttcatcct gtgcaccttc 1080
gtgcagctgc tgggcggctg gtacttctac gtgcaggcct acaagtccct gcggcacaga 1140
tccgccaaca tggacgtgct gatcgtgctg gccacatcta tcgcctacgt gtactccctc 1200
gtgatcctgg tggtggccgt ggccgagaaa gccgagagaa gccctgtgac cttcttcgac 1260
acccccccta tgctgttcgt gtttatcgcc ctgggccggt ggctggaaca cctggccaaa 1320
agcaagacca gcgaggccct ggctaagctg atgagtctgc aggccaccga ggccacagtc 1380
gtgaccctgg gcgaggacaa cctgatcatc cgcgaggaac aggtgccaat ggaactggtg 1440
cagcggggcg acatcgtgaa ggtggtgcct ggcggcaagt tccccgtgga cggaaaagtg 1500
ctggaaggga ataccatggc cgacgagagc ctgatcacag gcgaggccat gcccgtgacc 1560
aagaaacctg gcagcacagt gatcgccggc agcatcaatg cccacggcag cgtgctgatt 1620
aaggccacac acgtgggcaa cgataccacc ctggctcaga ttgtgaagct ggtggaagag 1680
gcccagatga gcaaggcccc cattcagcag ctggctgacc ggttcagcgg ctacttcgtg 1740
ccctttatca tcatcatgag caccctgaca ctggtcgtgt ggatcgtgat cggctttatc 1800
gacttcggag tggtgcagag atacttcccc aaccctaaca agcacatcag ccagacagaa 1860
gtgatcatca gattcgcctt tcagaccagc atcaccgtgc tgtgtatcgc ctgcccctgt 1920
agcctgggac tggccacacc taccgctgtg atggtgggaa caggcgtggc cgctcagaac 1980
ggcatcctga tcaagggggg caagcctctg gaaatggctc acaagatcaa gaccgtgatg 2040
ttcgacaaga ccggcaccat cacccacggc gtgcccagag tgatgagagt gctgctgctg 2100
ggggatgtgg ccaccctgcc tctgagaaag gtgctggctg tcgtgggcac agccgaggct 2160
agctctgaac acccactggg agtggccgtg acaaagtact gcaaagagga actgggcacc 2220
gaaaccctgg gctactgcac cgactttcag gccgtgcctg gctgtggcat cggctgcaag 2280
gtgtccaacg tggaaggcat cctggcccac agcgagaggc cactgtctgc ccctgccagc 2340
cacctgaacg aggccggatc tctgcccgcc gaaaaggacg ctgtgcccca gaccttctct 2400
gtgctgattg gcaacagaga gtggctgcgg cggaacggcc tgaccatctc ctccgatgtg 2460
tccgacgcca tgaccgacca cgagatgaag ggccagaccg ccattctggt ggccattgac 2520
ggggtgctgt gcggcatgat cgcaatcgcc gatgccgtga aacaggaagc agcactggcc 2580
gtgcacaccc tgcagtctat gggagtggat gtggtgctga tcaccggcga caacagaaag 2640
accgccaggg ccattgccac ccaggtgggc atcaacaagg tgttcgccga ggtgctgccc 2700
agccacaaag tggccaaggt gcaggaactg cagaacaaag gcaaaaaggt ggccatggtg 2760
ggagatggcg tgaacgactc tcctgctctg gcccaggcag atatgggcgt ggccatcggc 2820
acaggcaccg acgtggcaat tgaggctgct gacgtggtgc tgattcggaa cgacctgctg 2880
gacgtggtgg cctccatcca cctgtccaag agaaccgtgc ggcggatcag aatcaacctg 2940
gtgctggcac tgatctataa cctcgtgggc atccctatcg ccgctggcgt gttcatgcct 3000
atcggaatcg tgctgcagcc ctggatgggc tctgccgcca tggctgcaag ctccgtgtct 3060
gtggtgctgt ccagcctgca gctgaagtgc tacaagaagc ccgacctgga aagatacgag 3120
gcccaggccc acggacacat gaagcctctg acagcctccc aggtgtccgt gcacatcggc 3180
atggacgaca gatggcggga cagccctaga gccacccctt gggatcaggt gtcatacgtg 3240
tcacaggtgt ccctgagcag cctgaccagc gacaagccca gcagacatag cgccgctgcc 3300
gacgacgatg gggacaagtg gtccctgctg ctgaacggcc gggatgagga acagtacatc 3360
<210> 19
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 19
atgcccgagc aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc 60
aagctgagcc tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac 120
aacgtgggct acgagggcgg cctggacgga ctgggaccat cttctcaggt ggccacaagc 180
accgtgcgcc tggaaatcgc ccagtttatc caggacctgg gctttgaagc cgccgtgatg 240
gaagattacg ccggctccga cggcaacatc gagctgacca tcaccggaat gacctgcgcc 300
tcctgtgtgc acaacattga gtccaagctg acccggacca acggcatcac ctacgcctct 360
gtggctctgg ccacctccaa ggccctcgtg aagttcgatc ccgagatcat cggccccagg 420
gacatcatca agatcatcga agagatcggc ttccacgcca gcctggccca gaggaaccct 480
aacgcccacc acctggacca caagatggaa atcaagcagt ggaagaaaag cttcctgtgc 540
agcctggtgt tcggcatccc cgtgatggcc ctgatgatct acatgctgat ccccagcaac 600
gagccccacc agtccatggt gctggatcac aacatcatcc ccggcctgtc tatcctgaac 660
ctgatcttct tcatcctgtg caccttcgtg cagctgctgg gcggctggta cttctacgtg 720
caggcctaca agtccctgcg gcacagatcc gccaacatgg acgtgctgat cgtgctggcc 780
acatctatcg cctacgtgta ctccctcgtg atcctggtgg tggccgtggc cgagaaagcc 840
gagagaagcc ctgtgacctt cttcgacacc ccccctatgc tgttcgtgtt tatcgccctg 900
ggccggtggc tggaacacct ggccaaaagc aagaccagcg aggccctggc taagctgatg 960
agtctgcagg ccaccgaggc cacagtcgtg accctgggcg aggacaacct gatcatccgc 1020
gaggaacagg tgccaatgga actggtgcag cggggcgaca tcgtgaaggt ggtgcctggc 1080
ggcaagttcc ccgtggacgg aaaagtgctg gaagggaata ccatggccga cgagagcctg 1140
atcacaggcg aggccatgcc cgtgaccaag aaacctggca gcacagtgat cgccggcagc 1200
atcaatgccc acggcagcgt gctgattaag gccacacacg tgggcaacga taccaccctg 1260
gctcagattg tgaagctggt ggaagaggcc cagatgagca aggcccccat tcagcagctg 1320
gctgaccggt tcagcggcta cttcgtgccc tttatcatca tcatgagcac cctgacactg 1380
gtcgtgtgga tcgtgatcgg ctttatcgac ttcggagtgg tgcagagata cttccccaac 1440
cctaacaagc acatcagcca gacagaagtg atcatcagat tcgcctttca gaccagcatc 1500
accgtgctgt gtatcgcctg cccctgtagc ctgggactgg ccacacctac cgctgtgatg 1560
gtgggaacag gcgtggccgc tcagaacggc atcctgatca aggggggcaa gcctctggaa 1620
atggctcaca agatcaagac cgtgatgttc gacaagaccg gcaccatcac ccacggcgtg 1680
cccagagtga tgagagtgct gctgctgggg gatgtggcca ccctgcctct gagaaaggtg 1740
ctggctgtcg tgggcacagc cgaggctagc tctgaacacc cactgggagt ggccgtgaca 1800
aagtactgca aagaggaact gggcaccgaa accctgggct actgcaccga ctttcaggcc 1860
gtgcctggct gtggcatcgg ctgcaaggtg tccaacgtgg aaggcatcct ggcccacagc 1920
gagaggccac tgtctgcccc tgccagccac ctgaacgagg ccggatctct gcccgccgaa 1980
aaggacgctg tgccccagac cttctctgtg ctgattggca acagagagtg gctgcggcgg 2040
aacggcctga ccatctcctc cgatgtgtcc gacgccatga ccgaccacga gatgaagggc 2100
cagaccgcca ttctggtggc cattgacggg gtgctgtgcg gcatgatcgc aatcgccgat 2160
gccgtgaaac aggaagcagc actggccgtg cacaccctgc agtctatggg agtggatgtg 2220
gtgctgatca ccggcgacaa cagaaagacc gccagggcca ttgccaccca ggtgggcatc 2280
aacaaggtgt tcgccgaggt gctgcccagc cacaaagtgg ccaaggtgca ggaactgcag 2340
aacaaaggca aaaaggtggc catggtggga gatggcgtga acgactctcc tgctctggcc 2400
caggcagata tgggcgtggc catcggcaca ggcaccgacg tggcaattga ggctgctgac 2460
gtggtgctga ttcggaacga cctgctggac gtggtggcct ccatccacct gtccaagaga 2520
accgtgcggc ggatcagaat caacctggtg ctggcactga tctataacct cgtgggcatc 2580
cctatcgccg ctggcgtgtt catgcctatc ggaatcgtgc tgcagccctg gatgggctct 2640
gccgccatgg ctgcaagctc cgtgtctgtg gtgctgtcca gcctgcagct gaagtgctac 2700
aagaagcccg acctggaaag atacgaggcc caggcccacg gacacatgaa gcctctgaca 2760
gcctcccagg tgtccgtgca catcggcatg gacgacagat ggcgggacag ccctagagcc 2820
accccttggg atcaggtgtc atacgtgtca caggtgtccc tgagcagcct gaccagcgac 2880
aagcccagca gacatagcgc cgctgccgac gacgatgggg acaagtggtc cctgctgctg 2940
aacggccggg atgaggaaca gtacatc 2967
<210> 20
<211> 4284
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 20
atgcccgagc aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc 60
aagctgagcc tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac 120
aacgtgggct acgagggcgg cctggacgga ctgggaccat cttctcaggt ggccacaagc 180
accgtgcgca aatacgtgcc ctctgtcgtg tgcctgcagc aggtgtgcca ccagatcggc 240
gacatgggct tcgaggcctc tatcgccgag ggaaaggccg cctcttggcc ctctagaagc 300
ctgcctgctc aggaagccgt cgtgaagctg cgggtggaag ggatgacctg tcagtcctgc 360
gtgtccagca tcgagggcaa agtgcggaag ctgcagggcg tggtgcgcgt gaaagtgtct 420
ctgagcaacc aggaagctgt gatcacctac cagccctacc tgatccagcc cgaggacctg 480
agggaccacg tgaacgatat gggatttgag gccgccatca agagcaaggt ggcccctctg 540
tctctgggcc ccatcgacat cgagagactg cagagcacca accccaagcg gcctctgagc 600
agcgccaacc agaacttcaa caacagcgag acactgggcc accagggcag ccacgtcgtg 660
acactgcagc tgcggatcga cggaatgcac tgcaagagct gtgtgctgaa catcgaggaa 720
aacatcggcc agctgctggg agtgcagagc atccaggtgt cactggaaaa caagaccgcc 780
caggtgaagt acgaccccag ctgcacaagc cccgtggccc tgcagagagc cattgaagct 840
ctgccccctg gcaacttcaa agtgtccctg cctgacggag ccgagggctc cggaacagat 900
cacagaagca gcagcagcca cagccctggc agccccccta gaaatcaggt gcagggcacc 960
tgtagcacca ccctgatcgc cattgccggc atgacatgcg ccagctgcgt gcactctatt 1020
gagggcatga tctcccagct ggaaggcgtg cagcagatca gtgtgtctct ggccgagggc 1080
accgccacag tgctgtacaa ccctagcgtg atcagccccg aagaactgag agccgccatt 1140
gaggacatgg gattcgaagc cagcgtggtg tccgagagct gctccaccaa ccctctgggc 1200
aatcacagcg ccggcaacag catggtgcag accaccgacg gcacccccac cagcgtgcag 1260
gaagtggccc cacatacagg cagactgccc gccaatcacg cccccgatat cctggccaag 1320
agcccccaga gtacaagagc cgtggccccc cagaagtgct tcctgcagat caagggcatg 1380
acttgtgcct cttgtgtgtc caatatcgag cggaacctgc agaaagaggc cggcgtgctg 1440
tctgtgctgg tggctctgat ggccggcaag gccgagatca aatacgaccc cgaagtgatt 1500
cagcccctgg aaatcgccca gtttatccag gacctgggct ttgaagccgc cgtgatggaa 1560
gattacgccg gctccgacgg caacatcgag ctgaccatca ccggaatgac ctgcgcctcc 1620
tgtgtgcaca acattgagtc caagctgacc cggaccaacg gcatcaccta cgcctctgtg 1680
gctctggcca cctccaaggc cctcgtgaag ttcgatcccg agatcatcgg ccccagggac 1740
atcatcaaga tcatcgaaga gatcggcttc cacgccagcc tggcccagag gaaccctaac 1800
gcccaccacc tggaccacaa gatggaaatc aagcagtgga agaaaagctt cctgtgcagc 1860
ctggtgttcg gcatccccgt gatggccctg atgatctaca tgctgatccc cagcaacgag 1920
ccccaccagt ccatggtgct ggatcacaac atcatccccg gcctgtctat cctgaacctg 1980
atcttcttca tcctgtgcac cttcgtgcag ctgctgggcg gctggtactt ctacgtgcag 2040
gcctacaagt ccctgcggca cagatccgcc aacatggacg tgctgatcgt gctggccaca 2100
tctatcgcct acgtgtactc cctcgtgatc ctggtggtgg ccgtggccga gaaagccgag 2160
agaagccctg tgaccttctt cgacaccccc cctatgctgt tcgtgtttat cgccctgggc 2220
cggtggctgg aacacctggc caaaagcaag accagcgagg ccctggctaa gctgatgagt 2280
ctgcaggcca ccgaggccac agtcgtgacc ctgggcgagg acaacctgat catccgcgag 2340
gaacaggtgc caatggaact ggtgcagcgg ggcgacatcg tgaaggtggt gcctggcggc 2400
aagttccccg tggacggaaa agtgctggaa gggaatacca tggccgacga gagcctgatc 2460
acaggcgagg ccatgcccgt gaccaagaaa cctggcagca cagtgatcgc cggcagcatc 2520
aatgcccacg gcagcgtgct gattaaggcc acacacgtgg gcaacgatac caccctggct 2580
cagattgtga agctggtgga agaggcccag atgagcaagg cccccattca gcagctggct 2640
gaccggttca gcggctactt cgtgcccttt atcatcatca tgagcaccct gacactggtc 2700
gtgtggatcg tgatcggctt tatcgacttc ggagtggtgc agagatactt ccccaaccct 2760
aacaagcaca tcagccagac agaagtgatc atcagattcg cctttcagac cagcatcacc 2820
gtgctgtgta tcgcctgccc ctgtagcctg ggactggcca cacctaccgc tgtgatggtg 2880
ggaacaggcg tggccgctca gaacggcatc ctgatcaagg ggggcaagcc tctggaaatg 2940
gctcacaaga tcaagaccgt gatgttcgac aagaccggca ccatcaccca cggcgtgccc 3000
agagtgatga gagtgctgct gctgggggat gtggccaccc tgcctctgag aaaggtgctg 3060
gctgtcgtgg gcacagccga ggctagctct gaacacccac tgggagtggc cgtgacaaag 3120
tactgcaaag aggaactggg caccgaaacc ctgggctact gcaccgactt tcaggccgtg 3180
cctggctgtg gcatcggctg caaggtgtcc aacgtggaag gcatcctggc ccacagcgag 3240
aggccactgt ctgcccctgc cagccacctg aacgaggccg gatctctgcc cgccgaaaag 3300
gacgctgtgc cccagacctt ctctgtgctg attggcaaca gagagtggct gcggcggaac 3360
ggcctgacca tctcctccga tgtgtccgac gccatgaccg accacgagat gaagggccag 3420
accgccattc tggtggccat tgacggggtg ctgtgcggca tgatcgcaat cgccgatgcc 3480
gtgaaacagg aagcagcact ggccgtgcac accctgcagt ctatgggagt ggatgtggtg 3540
ctgatcaccg gcgacaacag aaagaccgcc agggccattg ccacccaggt gggcatcaac 3600
aaggtgttcg ccgaggtgct gcccagccac aaagtggcca aggtgcagga actgcagaac 3660
aaaggcaaaa aggtggccat ggtgggagat ggcgtgaacg actctcctgc tctggcccag 3720
gcagatatgg gcgtggccat cggcacaggc accgacgtgg caattgaggc tgctgacgtg 3780
gtgctgattc ggaacgacct gctggacgtg gtggcctcca tccacctgtc caagagaacc 3840
gtgcggcgga tcagaatcaa cctggtgctg gcactgatct ataacctcgt gggcatccct 3900
atcgccgctg gcgtgttcat gcctatcgga atcgtgctgc agccctggat gggctctgcc 3960
gccatggctg caagctccgt gtctgtggtg ctgtccagcc tgcagctgaa gtgctacaag 4020
aagcccgacc tggaaagata cgaggcccag gcccacggac acatgaagcc tctgacagcc 4080
tcccaggtgt ccgtgcacat cggcatggac gacagatggc gggacagccc tagagccacc 4140
ccttgggatc aggtgtcata cgtgtcacag gtgtccctga gcagcctgac cagcgacaag 4200
cccagcagac atagcgccgc tgccgacgac gatggggaca agtggtccct gctgctgaac 4260
ggccgggatg aggaacagta catc 4284
<210> 21
<211> 4215
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 21
atgcccgagc aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc 60
aagctgagcc tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac 120
aacgtgggct acgagggcgg cctggacgga ctgggaccat cttctcaggt ggccacaagc 180
accgtgcgca tcctgggcat gacctgccag agctgcgtga agtccatcga ggaccggatc 240
agcaacctga agggcatcat cagcatgaag gtgtccctgg aacagggcag cgccaccgtg 300
aaatacgtgc cctctgtcgt gtgcctgcag caggtgtgcc accagatcgg cgacatgggc 360
ttcgaggcct ctatcgccga gggaaaggcc gcctcttggc cctctagaag cctgcctgct 420
caggaagccg tcgtgaagga ggccgccatc aagagcaagg tggcccctct gtctctgggc 480
cccatcgaca tcgagagact gcagagcacc aaccccaagc ggcctctgag cagcgccaac 540
cagaacttca acaacagcga gacactgggc caccagggca gccacgtcgt gacactgcag 600
ctgcggatcg acggaatgca ctgcaagagc tgtgtgctga acatcgagga aaacatcggc 660
cagctgctgg gagtgcagag catccaggtg tcactggaaa acaagaccgc ccaggtgaag 720
tacgacccca gctgcacaag ccccgtggcc ctgcagagag ccattgaagc tctgccccct 780
ggcaacttca aagtgtccct gcctgacgga gccgagggct ccggaacaga tcacagaagc 840
agcagcagcc acagccctgg cagcccccct agaaatcagg tgcagggcac ctgtagcacc 900
accctgatcg ccattgccgg catgacatgc gccagctgcg tgcactctat tgagggcatg 960
atctcccagc tggaaggcgt gcagcagatc agtgtgtctc tggccgaggg caccgccaca 1020
gtgctgtaca accctagcgt gatcagcccc gaagaactga gagccgccat tgaggacatg 1080
ggattcgaag ccagcgtggt gtccgagagc tgctccacca accctctggg caatcacagc 1140
gccggcaaca gcatggtgca gaccaccgac ggcaccccca ccagcgtgca ggaagtggcc 1200
ccacatacag gcagactgcc cgccaatcac gcccccgata tcctggccaa gagcccccag 1260
agtacaagag ccgtggcccc ccagaagtgc ttcctgcaga tcaagggcat gacttgtgcc 1320
tcttgtgtgt ccaatatcga gcggaacctg cagaaagagg ccggcgtgct gtctgtgctg 1380
gtggctctga tggccggcaa ggccgagatc aaatacgacc ccgaagtgat tcagcccctg 1440
gaaatcgccc agtttatcca ggacctgggc tttgaagccg ccgtgatgga agattacgcc 1500
ggctccgacg gcaacatcga gctgaccatc accggaatga cctgcgcctc ctgtgtgcac 1560
aacattgagt ccaagctgac ccggaccaac ggcatcacct acgcctctgt ggctctggcc 1620
acctccaagg ccctcgtgaa gttcgatccc gagatcatcg gccccaggga catcatcaag 1680
atcatcgaag agatcggctt ccacgccagc ctggcccaga ggaaccctaa cgcccaccac 1740
ctggaccaca agatggaaat caagcagtgg aagaaaagct tcctgtgcag cctggtgttc 1800
ggcatccccg tgatggccct gatgatctac atgctgatcc ccagcaacga gccccaccag 1860
tccatggtgc tggatcacaa catcatcccc ggcctgtcta tcctgaacct gatcttcttc 1920
atcctgtgca ccttcgtgca gctgctgggc ggctggtact tctacgtgca ggcctacaag 1980
tccctgcggc acagatccgc caacatggac gtgctgatcg tgctggccac atctatcgcc 2040
tacgtgtact ccctcgtgat cctggtggtg gccgtggccg agaaagccga gagaagccct 2100
gtgaccttct tcgacacccc ccctatgctg ttcgtgttta tcgccctggg ccggtggctg 2160
gaacacctgg ccaaaagcaa gaccagcgag gccctggcta agctgatgag tctgcaggcc 2220
accgaggcca cagtcgtgac cctgggcgag gacaacctga tcatccgcga ggaacaggtg 2280
ccaatggaac tggtgcagcg gggcgacatc gtgaaggtgg tgcctggcgg caagttcccc 2340
gtggacggaa aagtgctgga agggaatacc atggccgacg agagcctgat cacaggcgag 2400
gccatgcccg tgaccaagaa acctggcagc acagtgatcg ccggcagcat caatgcccac 2460
ggcagcgtgc tgattaaggc cacacacgtg ggcaacgata ccaccctggc tcagattgtg 2520
aagctggtgg aagaggccca gatgagcaag gcccccattc agcagctggc tgaccggttc 2580
agcggctact tcgtgccctt tatcatcatc atgagcaccc tgacactggt cgtgtggatc 2640
gtgatcggct ttatcgactt cggagtggtg cagagatact tccccaaccc taacaagcac 2700
atcagccaga cagaagtgat catcagattc gcctttcaga ccagcatcac cgtgctgtgt 2760
atcgcctgcc cctgtagcct gggactggcc acacctaccg ctgtgatggt gggaacaggc 2820
gtggccgctc agaacggcat cctgatcaag gggggcaagc ctctggaaat ggctcacaag 2880
atcaagaccg tgatgttcga caagaccggc accatcaccc acggcgtgcc cagagtgatg 2940
agagtgctgc tgctggggga tgtggccacc ctgcctctga gaaaggtgct ggctgtcgtg 3000
ggcacagccg aggctagctc tgaacaccca ctgggagtgg ccgtgacaaa gtactgcaaa 3060
gaggaactgg gcaccgaaac cctgggctac tgcaccgact ttcaggccgt gcctggctgt 3120
ggcatcggct gcaaggtgtc caacgtggaa ggcatcctgg cccacagcga gaggccactg 3180
tctgcccctg ccagccacct gaacgaggcc ggatctctgc ccgccgaaaa ggacgctgtg 3240
ccccagacct tctctgtgct gattggcaac agagagtggc tgcggcggaa cggcctgacc 3300
atctcctccg atgtgtccga cgccatgacc gaccacgaga tgaagggcca gaccgccatt 3360
ctggtggcca ttgacggggt gctgtgcggc atgatcgcaa tcgccgatgc cgtgaaacag 3420
gaagcagcac tggccgtgca caccctgcag tctatgggag tggatgtggt gctgatcacc 3480
ggcgacaaca gaaagaccgc cagggccatt gccacccagg tgggcatcaa caaggtgttc 3540
gccgaggtgc tgcccagcca caaagtggcc aaggtgcagg aactgcagaa caaaggcaaa 3600
aaggtggcca tggtgggaga tggcgtgaac gactctcctg ctctggccca ggcagatatg 3660
ggcgtggcca tcggcacagg caccgacgtg gcaattgagg ctgctgacgt ggtgctgatt 3720
cggaacgacc tgctggacgt ggtggcctcc atccacctgt ccaagagaac cgtgcggcgg 3780
atcagaatca acctggtgct ggcactgatc tataacctcg tgggcatccc tatcgccgct 3840
ggcgtgttca tgcctatcgg aatcgtgctg cagccctgga tgggctctgc cgccatggct 3900
gcaagctccg tgtctgtggt gctgtccagc ctgcagctga agtgctacaa gaagcccgac 3960
ctggaaagat acgaggccca ggcccacgga cacatgaagc ctctgacagc ctcccaggtg 4020
tccgtgcaca tcggcatgga cgacagatgg cgggacagcc ctagagccac cccttgggat 4080
caggtgtcat acgtgtcaca ggtgtccctg agcagcctga ccagcgacaa gcccagcaga 4140
catagcgccg ctgccgacga cgatggggac aagtggtccc tgctgctgaa cggccgggat 4200
gaggaacagt acatc 4215
<210> 22
<211> 4317
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 22
atgcccgagc aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc 60
aagctgagcc tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac 120
aacgtgggct acgagggcgg cctggacgga ctgggaccat cttctcaggt ggccacaagc 180
accgtgcgca tcctgggcat gacctgccag agctgcgtga agtccatcga ggaccggatc 240
agcaacctga agggcatcat cagcatgaag gtgtccctgg aacagggcag cgccaccgtg 300
aaatacgtgc cctctgtcgt gtgcctgcag caggtgtgcc accagatcgg cgacatgggc 360
ttcgaggcct ctatcgccga gggaaaggcc gcctcttggc cctctagaag cctgcctgct 420
caggaagccg tcgtgaagct gcgggtggaa gggatgacct gtcagtcctg cgtgtccagc 480
atcgagggca aagtgcggaa gctgcagggc gtggtgcgcg tgaaagtgtc tctgagcaac 540
caggaagctg tgatcaccta ccagccctac ctgatccagc ccgaggacct gagggaccac 600
gtgaacgata tgggatttga ggccgccatc aagagcaagg tggcccctct gtctctgggc 660
cccatcgaca tcgagagact gcagagcacc aaccccaagc ggcctctgag cagcgccaac 720
cagaacttca acaacagcga gacactgggc caccagggca gccacgtcgt gacactgcag 780
agcatccagg tgtcactgga aaacaagacc gcccaggtga agtacgaccc cagctgcaca 840
agccccgtgg ccctgcagag agccattgaa gctctgcccc ctggcaactt caaagtgtcc 900
ctgcctgacg gagccgaggg ctccggaaca gatcacagaa gcagcagcag ccacagccct 960
ggcagccccc ctagaaatca ggtgcagggc acctgtagca ccaccctgat cgccattgcc 1020
ggcatgacat gcgccagctg cgtgcactct attgagggca tgatctccca gctggaaggc 1080
gtgcagcaga tcagtgtgtc tctggccgag ggcaccgcca cagtgctgta caaccctagc 1140
gtgatcagcc ccgaagaact gagagccgcc attgaggaca tgggattcga agccagcgtg 1200
gtgtccgaga gctgctccac caaccctctg ggcaatcaca gcgccggcaa cagcatggtg 1260
cagaccaccg acggcacccc caccagcgtg caggaagtgg ccccacatac aggcagactg 1320
cccgccaatc acgcccccga tatcctggcc aagagccccc agagtacaag agccgtggcc 1380
ccccagaagt gcttcctgca gatcaagggc atgacttgtg cctcttgtgt gtccaatatc 1440
gagcggaacc tgcagaaaga ggccggcgtg ctgtctgtgc tggtggctct gatggccggc 1500
aaggccgaga tcaaatacga ccccgaagtg attcagcccc tggaaatcgc ccagtttatc 1560
caggacctgg gctttgaagc cgccgtgatg gaagattacg ccggctccga cggcaacatc 1620
gagctgacca tcaccggaat gacctgcgcc tcctgtgtgc acaacattga gtccaagctg 1680
acccggacca acggcatcac ctacgcctct gtggctctgg ccacctccaa ggccctcgtg 1740
aagttcgatc ccgagatcat cggccccagg gacatcatca agatcatcga agagatcggc 1800
ttccacgcca gcctggccca gaggaaccct aacgcccacc acctggacca caagatggaa 1860
atcaagcagt ggaagaaaag cttcctgtgc agcctggtgt tcggcatccc cgtgatggcc 1920
ctgatgatct acatgctgat ccccagcaac gagccccacc agtccatggt gctggatcac 1980
aacatcatcc ccggcctgtc tatcctgaac ctgatcttct tcatcctgtg caccttcgtg 2040
cagctgctgg gcggctggta cttctacgtg caggcctaca agtccctgcg gcacagatcc 2100
gccaacatgg acgtgctgat cgtgctggcc acatctatcg cctacgtgta ctccctcgtg 2160
atcctggtgg tggccgtggc cgagaaagcc gagagaagcc ctgtgacctt cttcgacacc 2220
ccccctatgc tgttcgtgtt tatcgccctg ggccggtggc tggaacacct ggccaaaagc 2280
aagaccagcg aggccctggc taagctgatg agtctgcagg ccaccgaggc cacagtcgtg 2340
accctgggcg aggacaacct gatcatccgc gaggaacagg tgccaatgga actggtgcag 2400
cggggcgaca tcgtgaaggt ggtgcctggc ggcaagttcc ccgtggacgg aaaagtgctg 2460
gaagggaata ccatggccga cgagagcctg atcacaggcg aggccatgcc cgtgaccaag 2520
aaacctggca gcacagtgat cgccggcagc atcaatgccc acggcagcgt gctgattaag 2580
gccacacacg tgggcaacga taccaccctg gctcagattg tgaagctggt ggaagaggcc 2640
cagatgagca aggcccccat tcagcagctg gctgaccggt tcagcggcta cttcgtgccc 2700
tttatcatca tcatgagcac cctgacactg gtcgtgtgga tcgtgatcgg ctttatcgac 2760
ttcggagtgg tgcagagata cttccccaac cctaacaagc acatcagcca gacagaagtg 2820
atcatcagat tcgcctttca gaccagcatc accgtgctgt gtatcgcctg cccctgtagc 2880
ctgggactgg ccacacctac cgctgtgatg gtgggaacag gcgtggccgc tcagaacggc 2940
atcctgatca aggggggcaa gcctctggaa atggctcaca agatcaagac cgtgatgttc 3000
gacaagaccg gcaccatcac ccacggcgtg cccagagtga tgagagtgct gctgctgggg 3060
gatgtggcca ccctgcctct gagaaaggtg ctggctgtcg tgggcacagc cgaggctagc 3120
tctgaacacc cactgggagt ggccgtgaca aagtactgca aagaggaact gggcaccgaa 3180
accctgggct actgcaccga ctttcaggcc gtgcctggct gtggcatcgg ctgcaaggtg 3240
tccaacgtgg aaggcatcct ggcccacagc gagaggccac tgtctgcccc tgccagccac 3300
ctgaacgagg ccggatctct gcccgccgaa aaggacgctg tgccccagac cttctctgtg 3360
ctgattggca acagagagtg gctgcggcgg aacggcctga ccatctcctc cgatgtgtcc 3420
gacgccatga ccgaccacga gatgaagggc cagaccgcca ttctggtggc cattgacggg 3480
gtgctgtgcg gcatgatcgc aatcgccgat gccgtgaaac aggaagcagc actggccgtg 3540
cacaccctgc agtctatggg agtggatgtg gtgctgatca ccggcgacaa cagaaagacc 3600
gccagggcca ttgccaccca ggtgggcatc aacaaggtgt tcgccgaggt gctgcccagc 3660
cacaaagtgg ccaaggtgca ggaactgcag aacaaaggca aaaaggtggc catggtggga 3720
gatggcgtga acgactctcc tgctctggcc caggcagata tgggcgtggc catcggcaca 3780
ggcaccgacg tggcaattga ggctgctgac gtggtgctga ttcggaacga cctgctggac 3840
gtggtggcct ccatccacct gtccaagaga accgtgcggc ggatcagaat caacctggtg 3900
ctggcactga tctataacct cgtgggcatc cctatcgccg ctggcgtgtt catgcctatc 3960
ggaatcgtgc tgcagccctg gatgggctct gccgccatgg ctgcaagctc cgtgtctgtg 4020
gtgctgtcca gcctgcagct gaagtgctac aagaagcccg acctggaaag atacgaggcc 4080
caggcccacg gacacatgaa gcctctgaca gcctcccagg tgtccgtgca catcggcatg 4140
gacgacagat ggcgggacag ccctagagcc accccttggg atcaggtgtc atacgtgtca 4200
caggtgtccc tgagcagcct gaccagcgac aagcccagca gacatagcgc cgctgccgac 4260
gacgatgggg acaagtggtc cctgctgctg aacggccggg atgaggaaca gtacatc 4317
<210> 23
<211> 7944
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 23
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agctacctcg 180
tgatcgcccg gcccctgttc aaacatgtcc taatactctg tctctgcaag ggtcatcagt 240
agttttccat cttactcaac atcctcccag tggaattcat ttcatagaac gaatgttccg 300
atgctctaat ctctctagac aaggttcata tttgtatggg ttacttattc tctctttgtt 360
gactaagtca ataatcagaa tcagcaggtt tgcagtcaga ttggcaggga taagcagcct 420
agctcaggag aagtgagtat aaaagcccca ggctgggagc agccatcagc ggccgccacc 480
atgcccgagc aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc 540
aagctgagcc tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac 600
aacgtgggct acgagggcgg cctggatgga ctgggaccat cttctcaggt ggccacaagc 660
accgtgcgca tcctgggcat gacctgccag agctgcgtga agtccatcga ggaccggatc 720
agcaacctga agggcatcat cagcatgaag gtgtccctgg aacagggcag cgccaccgtg 780
aaatacgtgc cctctgtcgt gtgcctgcag caagtgtgcc accagatcgg cgacatgggc 840
ttcgaggcct ctatcgccga gggaaaggcc gcctcttggc cctctagaag cctgcctgct 900
caggaagccg tcgtgaagct gcgggtggaa gggatgacct gtcagtcctg cgtgtccagc 960
atcgagggca aagtgcggaa gctgcagggc gtggtgcgcg tgaaagtgtc tctgagcaac 1020
caggaagctg tgatcaccta ccagccctac ctgatccagc ccgaggacct gagggaccac 1080
gtgaacgata tgggatttga ggccgccatc aagagcaagg tggcccctct gtctctgggc 1140
cccatcgaca tcgagagact gcagagcacc aaccccaagc ggcctctgag cagcgccaac 1200
cagaacttca acaacagcga gacactgggc caccagggca gccacgtcgt gacactgcag 1260
ctgcggatcg acggaatgca ctgcaagagc tgtgtgctga acatcgagga aaacatcggc 1320
cagctgctgg gagtgcagag catccaggtg tcactggaaa acaagaccgc ccaagtgaag 1380
tacgacccca gctgcacaag ccccgtggcc ctgcagagag ccattgaagc tctgccccct 1440
ggcaacttca aagtgtccct gcctgatggc gccgagggct ccggaacaga tcacagaagc 1500
agcagcagcc acagccctgg cagcccccct agaaatcagg tgcagggcac ctgtagcacc 1560
accctgatcg ccattgccgg catgacatgc gccagctgcg tgcactctat tgagggcatg 1620
atctcccagc tggaaggcgt gcagcagatc agtgtgtctc tggccgaggg caccgccaca 1680
gtgctgtaca accctagcgt gatcagcccc gaagaactga gagccgccat tgaggacatg 1740
ggattcgaag ccagcgtggt gtccgagagc tgctccacca accctctggg caatcacagc 1800
gccggcaaca gcatggtgca gaccaccgat ggcaccccca ccagcgtgca ggaagtggcc 1860
ccacatacag gcagactgcc cgccaatcac gcccccgata tcctggccaa gagcccccag 1920
agtacaagag ccgtggcccc ccagaagtgc ttcctgcaga tcaagggcat gacttgtgcc 1980
tcttgtgtgt ccaatatcga gcggaacctg cagaaagagg ccggcgtgct gtctgtgctg 2040
gtggctctga tggccggcaa ggccgagatc aaatacgacc ccgaagtgat tcagcccctg 2100
gaaatcgccc agtttatcca ggacctgggc tttgaagccg ccgtgatgga agattacgcc 2160
ggctccgacg gcaacatcga gctgaccatc accggaatga cctgcgcctc ctgtgtgcac 2220
aacattgagt ccaagctgac ccggaccaac ggcatcacct acgcctctgt ggctctggcc 2280
acctccaagg ccctcgtgaa gttcgatccc gagatcatcg gccccaggga catcatcaag 2340
atcatcgaag agatcggctt ccacgccagc ctggcccaga ggaaccctaa tgcccaccac 2400
ctggaccaca agatggaaat caagcagtgg aagaaaagct tcctgtgcag cctggtgttc 2460
ggcatccccg tgatggccct gatgatctac atgctgatcc ccagcaacga gccccaccag 2520
tccatggtgc tggatcacaa catcatcccc ggcctgtcta tcctgaacct gatcttcttc 2580
atcctgtgca ccttcgtgca gctgctgggc ggctggtact tctatgtgca agcctacaag 2640
tccctgcggc acagatccgc caacatggac gtgctgatcg tgctggccac atctatcgcc 2700
tacgtgtact ccctcgtgat cctggtggtg gccgtggccg agaaagccga gagaagccct 2760
gtgaccttct tcgacacccc ccctatgctg ttcgtgttta tcgccctggg ccggtggctg 2820
gaacacctgg ccaaaagcaa gaccagcgag gccctggcta agctgatgag tctgcaggcc 2880
accgaggcca cagtcgtgac cctgggcgag gacaacctga tcatccgcga ggaacaggtg 2940
ccaatggaac tggtgcagcg gggcgacatc gtgaaggtgg tgcctggcgg caagttcccc 3000
gtggacggaa aagtgctgga agggaatacc atggccgacg agagcctgat cacaggcgag 3060
gccatgcccg tgaccaagaa acctggcagc acagtgatcg ccggcagcat caatgcccac 3120
ggcagcgtgc tgattaaggc cacacacgtg ggcaacgata ccaccctggc tcagattgtg 3180
aagctggtgg aagaggccca gatgagcaag gcccccattc agcagctggc tgaccggttc 3240
agcggctact tcgtgccctt tatcatcatc atgagcaccc tgacactggt cgtgtggatc 3300
gtgatcggct ttatcgactt cggagtggtg cagagatact tccccaaccc taacaagcac 3360
atcagccaga cagaagtgat catcagattc gcctttcaga ccagcatcac cgtgctgtgt 3420
atcgcctgcc cctgtagcct gggactggcc acacctaccg ctgtgatggt gggaacaggc 3480
gtggccgctc agaacggcat cctgatcaag gggggcaagc ctctggaaat ggctcacaag 3540
atcaagaccg tgatgttcga caagaccggc accatcaccc acggcgtgcc cagagtgatg 3600
agagtgctgc tgctggggga tgtggccacc ctgcctctga gaaaggtgct ggctgtcgtg 3660
ggcacagccg aggctagctc tgaacaccca ctgggagtgg ccgtgacaaa gtactgcaaa 3720
gaggaactgg gcaccgaaac cctgggctac tgcaccgact ttcaggccgt gcctggctgt 3780
ggcatcggct gcaaggtgtc caacgtggaa ggcatcctgg cccacagcga gaggccactg 3840
tctgcccctg ccagccacct gaatgaggcc ggatctctgc ccgccgaaaa ggacgctgtg 3900
ccccagacct tctctgtgct gattggcaac agagagtggc tgcggcggaa cggcctgacc 3960
atctcctccg atgtgtccga cgccatgacc gaccacgaga tgaagggcca gaccgccatt 4020
ctggtggcca ttgacggggt gctgtgcggc atgatcgcaa tcgccgatgc cgtgaaacag 4080
gaagcagcac tggccgtgca caccctgcag tctatgggag tggatgtggt gctgatcacc 4140
ggcgacaaca gaaagaccgc cagggccatt gccacccaag tgggcatcaa caaggtgttc 4200
gccgaggtgc tgcccagcca caaagtggcc aaggtgcagg aactgcagaa caaaggcaaa 4260
aaggtggcca tggtgggaga tggcgtgaac gactctcctg ctctggccca ggcagatatg 4320
ggcgtggcca tcggcacagg caccgacgtg gcaattgagg ctgctgacgt ggtgctgatt 4380
cggaacgacc tgctggacgt ggtggcctcc atccacctgt ccaagagaac cgtgcggcgg 4440
atcagaatca acctggtgct ggcactgatc tataacctcg tgggcatccc tatcgccgct 4500
ggcgtgttca tgcctatcgg aatcgtgctg cagccctgga tgggctctgc cgccatggct 4560
gcaagctccg tgtctgtggt gctgtccagc ctgcagctga agtgctacaa gaagcccgac 4620
ctggaaagat acgaggccca ggcccacgga cacatgaagc ctctgacagc ctcccaggtg 4680
tccgtgcaca tcggcatgga cgacagatgg cgggacagcc ctagagccac cccttgggat 4740
caggtgtcat acgtgtcaca ggtgtccctg agcagcctga ccagcgacaa gcccagcaga 4800
catagcgccg ctgccgacga cgatggggac aaatggtccc tgctgctgaa cggccgggat 4860
gaggaacagt acatctgata agcatgcaat aaagtctgag tgggcggcag cctgtgtgtg 4920
cctgggttct ctctgtcccg gaatgtgcaa acaatggagg tgctcgagta gataagtagc 4980
atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc 5040
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 5100
cccgggcggc ctcagtgagc gagcgagcgc gcagccttaa ttaacctaat tcactggccg 5160
tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 5220
cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 5280
aacagttgcg cagcctgaat ggcgaatggg acgcgccctg tagcggcgca ttaagcgcgg 5340
cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc 5400
ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa 5460
atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac 5520
ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt 5580
tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca 5640
accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt 5700
taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta 5760
caatttaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 5820
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 5880
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 5940
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 6000
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 6060
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 6120
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 6180
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 6240
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 6300
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 6360
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 6420
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 6480
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 6540
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 6600
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 6660
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 6720
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 6780
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 6840
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 6900
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 6960
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 7020
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgttcttct 7080
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 7140
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 7200
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 7260
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 7320
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 7380
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 7440
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 7500
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 7560
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 7620
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 7680
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 7740
tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc 7800
aattaatgtg agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc 7860
tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca 7920
tgattacgcc agatttaatt aagg 7944
<210> 24
<211> 7866
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 24
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tcactcaaag ttcaaacctt atcatttttt 240
gctttgttcc tcttggcctt ggttttgtac atcagctttg aaaataccat cccagggtta 300
atgctggggt taatttataa ctaagagtgc tctagttttg caatacagga catgctataa 360
aaatggaaag atgttgcttt ctgagagaca gcggccgcca ccatgcccga gcaggaaaga 420
cagatcaccg ccagagaggg cgccagccgg aagatcctga gcaagctgag cctgcccacc 480
agagcctggg agcccgccat gaagaagtcc ttcgccttcg acaacgtggg ctacgagggc 540
ggcctggacg gactgggacc atcttctcag gtggccacaa gcaccgtgcg catcctgggc 600
atgacctgcc agagctgcgt gaagtccatc gaggaccgga tcagcaacct gaagggcatc 660
atcagcatga aggtgtccct ggaacagggc agcgccaccg tgaaatacgt gccctctgtc 720
gtgtgcctgc agcaggtgtg ccaccagatc ggcgacatgg gcttcgaggc ctctatcgcc 780
gagggaaagg ccgcctcttg gccctctaga agcctgcctg ctcaggaagc cgtcgtgaag 840
ctgcgggtgg aagggatgac ctgtcagtcc tgcgtgtcca gcatcgaggg caaagtgcgg 900
aagctgcagg gcgtggtgcg cgtgaaagtg tctctgagca accaggaagc tgtgatcacc 960
taccagccct acctgatcca gcccgaggac ctgagggacc acgtgaacga tatgggattt 1020
gaggccgcca tcaagagcaa ggtggcccct ctgtctctgg gccccatcga catcgagaga 1080
ctgcagagca ccaaccccaa gcggcctctg agcagcgcca accagaactt caacaacagc 1140
gagacactgg gccaccaggg cagccacgtc gtgacactgc agctgcggat cgacggaatg 1200
cactgcaaga gctgtgtgct gaacatcgag gaaaacatcg gccagctgct gggagtgcag 1260
agcatccagg tgtcactgga aaacaagacc gcccaggtga agtacgaccc cagctgcaca 1320
agccccgtgg ccctgcagag agccattgaa gctctgcccc ctggcaactt caaagtgtcc 1380
ctgcctgacg gagccgaggg ctccggaaca gatcacagaa gcagcagcag ccacagccct 1440
ggcagccccc ctagaaatca ggtgcagggc acctgtagca ccaccctgat cgccattgcc 1500
ggcatgacat gcgccagctg cgtgcactct attgagggca tgatctccca gctggaaggc 1560
gtgcagcaga tcagtgtgtc tctggccgag ggcaccgcca cagtgctgta caaccctagc 1620
gtgatcagcc ccgaagaact gagagccgcc attgaggaca tgggattcga agccagcgtg 1680
gtgtccgaga gctgctccac caaccctctg ggcaatcaca gcgccggcaa cagcatggtg 1740
cagaccaccg acggcacccc caccagcgtg caggaagtgg ccccacatac aggcagactg 1800
cccgccaatc acgcccccga tatcctggcc aagagccccc agagtacaag agccgtggcc 1860
ccccagaagt gcttcctgca gatcaagggc atgacttgtg cctcttgtgt gtccaatatc 1920
gagcggaacc tgcagaaaga ggccggcgtg ctgtctgtgc tggtggctct gatggccggc 1980
aaggccgaga tcaaatacga ccccgaagtg attcagcccc tggaaatcgc ccagtttatc 2040
caggacctgg gctttgaagc cgccgtgatg gaagattacg ccggctccga cggcaacatc 2100
gagctgacca tcaccggaat gacctgcgcc tcctgtgtgc acaacattga gtccaagctg 2160
acccggacca acggcatcac ctacgcctct gtggctctgg ccacctccaa ggccctcgtg 2220
aagttcgatc ccgagatcat cggccccagg gacatcatca agatcatcga agagatcggc 2280
ttccacgcca gcctggccca gaggaaccct aacgcccacc acctggacca caagatggaa 2340
atcaagcagt ggaagaaaag cttcctgtgc agcctggtgt tcggcatccc cgtgatggcc 2400
ctgatgatct acatgctgat ccccagcaac gagccccacc agtccatggt gctggatcac 2460
aacatcatcc ccggcctgtc tatcctgaac ctgatcttct tcatcctgtg caccttcgtg 2520
cagctgctgg gcggctggta cttctacgtg caggcctaca agtccctgcg gcacagatcc 2580
gccaacatgg acgtgctgat cgtgctggcc acatctatcg cctacgtgta ctccctcgtg 2640
atcctggtgg tggccgtggc cgagaaagcc gagagaagcc ctgtgacctt cttcgacacc 2700
ccccctatgc tgttcgtgtt tatcgccctg ggccggtggc tggaacacct ggccaaaagc 2760
aagaccagcg aggccctggc taagctgatg agtctgcagg ccaccgaggc cacagtcgtg 2820
accctgggcg aggacaacct gatcatccgc gaggaacagg tgccaatgga actggtgcag 2880
cggggcgaca tcgtgaaggt ggtgcctggc ggcaagttcc ccgtggacgg aaaagtgctg 2940
gaagggaata ccatggccga cgagagcctg atcacaggcg aggccatgcc cgtgaccaag 3000
aaacctggca gcacagtgat cgccggcagc atcaatgccc acggcagcgt gctgattaag 3060
gccacacacg tgggcaacga taccaccctg gctcagattg tgaagctggt ggaagaggcc 3120
cagatgagca aggcccccat tcagcagctg gctgaccggt tcagcggcta cttcgtgccc 3180
tttatcatca tcatgagcac cctgacactg gtcgtgtgga tcgtgatcgg ctttatcgac 3240
ttcggagtgg tgcagagata cttccccaac cctaacaagc acatcagcca gacagaagtg 3300
atcatcagat tcgcctttca gaccagcatc accgtgctgt gtatcgcctg cccctgtagc 3360
ctgggactgg ccacacctac cgctgtgatg gtgggaacag gcgtggccgc tcagaacggc 3420
atcctgatca aggggggcaa gcctctggaa atggctcaca agatcaagac cgtgatgttc 3480
gacaagaccg gcaccatcac ccacggcgtg cccagagtga tgagagtgct gctgctgggg 3540
gatgtggcca ccctgcctct gagaaaggtg ctggctgtcg tgggcacagc cgaggctagc 3600
tctgaacacc cactgggagt ggccgtgaca aagtactgca aagaggaact gggcaccgaa 3660
accctgggct actgcaccga ctttcaggcc gtgcctggct gtggcatcgg ctgcaaggtg 3720
tccaacgtgg aaggcatcct ggcccacagc gagaggccac tgtctgcccc tgccagccac 3780
ctgaacgagg ccggatctct gcccgccgaa aaggacgctg tgccccagac cttctctgtg 3840
ctgattggca acagagagtg gctgcggcgg aacggcctga ccatctcctc cgatgtgtcc 3900
gacgccatga ccgaccacga gatgaagggc cagaccgcca ttctggtggc cattgacggg 3960
gtgctgtgcg gcatgatcgc aatcgccgat gccgtgaaac aggaagcagc actggccgtg 4020
cacaccctgc agtctatggg agtggatgtg gtgctgatca ccggcgacaa cagaaagacc 4080
gccagggcca ttgccaccca ggtgggcatc aacaaggtgt tcgccgaggt gctgcccagc 4140
cacaaagtgg ccaaggtgca ggaactgcag aacaaaggca aaaaggtggc catggtggga 4200
gatggcgtga acgactctcc tgctctggcc caggcagata tgggcgtggc catcggcaca 4260
ggcaccgacg tggcaattga ggctgctgac gtggtgctga ttcggaacga cctgctggac 4320
gtggtggcct ccatccacct gtccaagaga accgtgcggc ggatcagaat caacctggtg 4380
ctggcactga tctataacct cgtgggcatc cctatcgccg ctggcgtgtt catgcctatc 4440
ggaatcgtgc tgcagccctg gatgggctct gccgccatgg ctgcaagctc cgtgtctgtg 4500
gtgctgtcca gcctgcagct gaagtgctac aagaagcccg acctggaaag atacgaggcc 4560
caggcccacg gacacatgaa gcctctgaca gcctcccagg tgtccgtgca catcggcatg 4620
gacgacagat ggcgggacag ccctagagcc accccttggg atcaggtgtc atacgtgtca 4680
caggtgtccc tgagcagcct gaccagcgac aagcccagca gacatagcgc cgctgccgac 4740
gacgatgggg acaagtggtc cctgctgctg aacggccggg atgaggaaca gtacatctga 4800
taagcatgca ataaagtctg agtgggcggc agcctgtgtg tgcctgggtt ctctctgtcc 4860
cggaatgtgc aaacaatgga ggtgctcgag tagataagta gcatggcggg ttaatcatta 4920
actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4980
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 5040
gcgagcgagc gcgcagcctt aattaaccta attcactggc cgtcgtttta caacgtcgtg 5100
actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca 5160
gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga 5220
atggcgaatg ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 5280
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 5340
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 5400
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 5460
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 5520
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 5580
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 5640
aacaaaaatt taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt 5700
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 5760
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 5820
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 5880
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 5940
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 6000
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 6060
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 6120
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 6180
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 6240
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 6300
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 6360
tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 6420
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 6480
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 6540
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 6600
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 6660
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 6720
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 6780
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 6840
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 6900
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 6960
aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg 7020
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 7080
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 7140
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 7200
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 7260
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 7320
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 7380
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 7440
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 7500
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 7560
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 7620
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 7680
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 7740
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 7800
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccagatttaa 7860
ttaagg 7866
<210> 25
<211> 7874
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 25
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agaggttaat 180
ttttaaactg tttgctctgg ttaataatct cagggaattc actcaaagtt caaaccttat 240
cattttttgc tttgttcctc ttggccttgg ttttgtacat cagctttgaa aataccatcc 300
cagggttaat gctggggtta atttataact aagagtgctc tagttttgca atacaggaca 360
tgctataaaa atggaaagat gttgctttct gagagacagc ggccgccacc atgcccgagc 420
aggaaagaca gatcaccgcc agagagggcg ccagccggaa gatcctgagc aagctgagcc 480
tgcccaccag agcctgggag cccgccatga agaagtcctt cgccttcgac aacgtgggct 540
acgagggcgg cctggacgga ctgggaccat cttctcaggt ggccacaagc accgtgcgca 600
tcctgggcat gacctgccag agctgcgtga agtccatcga ggaccggatc agcaacctga 660
agggcatcat cagcatgaag gtgtccctgg aacagggcag cgccaccgtg aaatacgtgc 720
cctctgtcgt gtgcctgcag caggtgtgcc accagatcgg cgacatgggc ttcgaggcct 780
ctatcgccga gggaaaggcc gcctcttggc cctctagaag cctgcctgct caggaagccg 840
tcgtgaagct gcgggtggaa gggatgacct gtcagtcctg cgtgtccagc atcgagggca 900
aagtgcggaa gctgcagggc gtggtgcgcg tgaaagtgtc tctgagcaac caggaagctg 960
tgatcaccta ccagccctac ctgatccagc ccgaggacct gagggaccac gtgaacgata 1020
tgggatttga ggccgccatc aagagcaagg tggcccctct gtctctgggc cccatcgaca 1080
tcgagagact gcagagcacc aaccccaagc ggcctctgag cagcgccaac cagaacttca 1140
acaacagcga gacactgggc caccagggca gccacgtcgt gacactgcag ctgcggatcg 1200
acggaatgca ctgcaagagc tgtgtgctga acatcgagga aaacatcggc cagctgctgg 1260
gagtgcagag catccaggtg tcactggaaa acaagaccgc ccaggtgaag tacgacccca 1320
gctgcacaag ccccgtggcc ctgcagagag ccattgaagc tctgccccct ggcaacttca 1380
aagtgtccct gcctgacgga gccgagggct ccggaacaga tcacagaagc agcagcagcc 1440
acagccctgg cagcccccct agaaatcagg tgcagggcac ctgtagcacc accctgatcg 1500
ccattgccgg catgacatgc gccagctgcg tgcactctat tgagggcatg atctcccagc 1560
tggaaggcgt gcagcagatc agtgtgtctc tggccgaggg caccgccaca gtgctgtaca 1620
accctagcgt gatcagcccc gaagaactga gagccgccat tgaggacatg ggattcgaag 1680
ccagcgtggt gtccgagagc tgctccacca accctctggg caatcacagc gccggcaaca 1740
gcatggtgca gaccaccgac ggcaccccca ccagcgtgca ggaagtggcc ccacatacag 1800
gcagactgcc cgccaatcac gcccccgata tcctggccaa gagcccccag agtacaagag 1860
ccgtggcccc ccagaagtgc ttcctgcaga tcaagggcat gacttgtgcc tcttgtgtgt 1920
ccaatatcga gcggaacctg cagaaagagg ccggcgtgct gtctgtgctg gtggctctga 1980
tggccggcaa ggccgagatc aaatacgacc ccgaagtgat tcagcccctg gaaatcgccc 2040
agtttatcca ggacctgggc tttgaagccg ccgtgatgga agattacgcc ggctccgacg 2100
gcaacatcga gctgaccatc accggaatga cctgcgcctc ctgtgtgcac aacattgagt 2160
ccaagctgac ccggaccaac ggcatcacct acgcctctgt ggctctggcc acctccaagg 2220
ccctcgtgaa gttcgatccc gagatcatcg gccccaggga catcatcaag atcatcgaag 2280
agatcggctt ccacgccagc ctggcccaga ggaaccctaa cgcccaccac ctggaccaca 2340
agatggaaat caagcagtgg aagaaaagct tcctgtgcag cctggtgttc ggcatccccg 2400
tgatggccct gatgatctac atgctgatcc ccagcaacga gccccaccag tccatggtgc 2460
tggatcacaa catcatcccc ggcctgtcta tcctgaacct gatcttcttc atcctgtgca 2520
ccttcgtgca gctgctgggc ggctggtact tctacgtgca ggcctacaag tccctgcggc 2580
acagatccgc caacatggac gtgctgatcg tgctggccac atctatcgcc tacgtgtact 2640
ccctcgtgat cctggtggtg gccgtggccg agaaagccga gagaagccct gtgaccttct 2700
tcgacacccc ccctatgctg ttcgtgttta tcgccctggg ccggtggctg gaacacctgg 2760
ccaaaagcaa gaccagcgag gccctggcta agctgatgag tctgcaggcc accgaggcca 2820
cagtcgtgac cctgggcgag gacaacctga tcatccgcga ggaacaggtg ccaatggaac 2880
tggtgcagcg gggcgacatc gtgaaggtgg tgcctggcgg caagttcccc gtggacggaa 2940
aagtgctgga agggaatacc atggccgacg agagcctgat cacaggcgag gccatgcccg 3000
tgaccaagaa acctggcagc acagtgatcg ccggcagcat caatgcccac ggcagcgtgc 3060
tgattaaggc cacacacgtg ggcaacgata ccaccctggc tcagattgtg aagctggtgg 3120
aagaggccca gatgagcaag gcccccattc agcagctggc tgaccggttc agcggctact 3180
tcgtgccctt tatcatcatc atgagcaccc tgacactggt cgtgtggatc gtgatcggct 3240
ttatcgactt cggagtggtg cagagatact tccccaaccc taacaagcac atcagccaga 3300
cagaagtgat catcagattc gcctttcaga ccagcatcac cgtgctgtgt atcgcctgcc 3360
cctgtagcct gggactggcc acacctaccg ctgtgatggt gggaacaggc gtggccgctc 3420
agaacggcat cctgatcaag gggggcaagc ctctggaaat ggctcacaag atcaagaccg 3480
tgatgttcga caagaccggc accatcaccc acggcgtgcc cagagtgatg agagtgctgc 3540
tgctggggga tgtggccacc ctgcctctga gaaaggtgct ggctgtcgtg ggcacagccg 3600
aggctagctc tgaacaccca ctgggagtgg ccgtgacaaa gtactgcaaa gaggaactgg 3660
gcaccgaaac cctgggctac tgcaccgact ttcaggccgt gcctggctgt ggcatcggct 3720
gcaaggtgtc caacgtggaa ggcatcctgg cccacagcga gaggccactg tctgcccctg 3780
ccagccacct gaacgaggcc ggatctctgc ccgccgaaaa ggacgctgtg ccccagacct 3840
tctctgtgct gattggcaac agagagtggc tgcggcggaa cggcctgacc atctcctccg 3900
atgtgtccga cgccatgacc gaccacgaga tgaagggcca gaccgccatt ctggtggcca 3960
ttgacggggt gctgtgcggc atgatcgcaa tcgccgatgc cgtgaaacag gaagcagcac 4020
tggccgtgca caccctgcag tctatgggag tggatgtggt gctgatcacc ggcgacaaca 4080
gaaagaccgc cagggccatt gccacccagg tgggcatcaa caaggtgttc gccgaggtgc 4140
tgcccagcca caaagtggcc aaggtgcagg aactgcagaa caaaggcaaa aaggtggcca 4200
tggtgggaga tggcgtgaac gactctcctg ctctggccca ggcagatatg ggcgtggcca 4260
tcggcacagg caccgacgtg gcaattgagg ctgctgacgt ggtgctgatt cggaacgacc 4320
tgctggacgt ggtggcctcc atccacctgt ccaagagaac cgtgcggcgg atcagaatca 4380
acctggtgct ggcactgatc tataacctcg tgggcatccc tatcgccgct ggcgtgttca 4440
tgcctatcgg aatcgtgctg cagccctgga tgggctctgc cgccatggct gcaagctccg 4500
tgtctgtggt gctgtccagc ctgcagctga agtgctacaa gaagcccgac ctggaaagat 4560
acgaggccca ggcccacgga cacatgaagc ctctgacagc ctcccaggtg tccgtgcaca 4620
tcggcatgga cgacagatgg cgggacagcc ctagagccac cccttgggat caggtgtcat 4680
acgtgtcaca ggtgtccctg agcagcctga ccagcgacaa gcccagcaga catagcgccg 4740
ctgccgacga cgatggggac aagtggtccc tgctgctgaa cggccgggat gaggaacagt 4800
acatctgata agcatgcaat aaagtctgag tgggcggcag cctgtgtgtg cctgggttct 4860
ctctgtcccg gaatgtgcaa acaatggagg tgctcgagta gataagtagc atggcgggtt 4920
aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4980
ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 5040
ctcagtgagc gagcgagcgc gcagccttaa ttaacctaat tcactggccg tcgttttaca 5100
acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 5160
tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 5220
cagcctgaat ggcgaatggg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 5280
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 5340
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 5400
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 5460
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 5520
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 5580
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 5640
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttaggt 5700
ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca 5760
aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg 5820
aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc 5880
cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg 5940
ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt 6000
cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta 6060
ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat 6120
gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga 6180
gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca 6240
acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact 6300
cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc 6360
acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact 6420
ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt 6480
ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt 6540
gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt 6600
atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata 6660
ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag 6720
attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat 6780
ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 6840
aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 6900
aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 6960
ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg 7020
tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 7080
ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 7140
cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 7200
agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 7260
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 7320
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 7380
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 7440
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 7500
cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 7560
tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 7620
gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc 7680
agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg 7740
agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg 7800
tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc 7860
agatttaatt aagg 7874
<210> 26
<211> 7878
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 26
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tcatttcata gaacgaatgt tccgatgctc 240
taatctctct agacaaggtt catatttgta tgggttactt attctctctt tgttgactaa 300
gtcaataatc agaatcagca ggtttgcagt cagattggca gggataagca gcctagctca 360
ggagaagtga gtataaaagc cccaggctgg gagcagccat cagcggccgc caccatgccc 420
gagcaggaaa gacagatcac cgccagagag ggcgccagcc ggaagatcct gagcaagctg 480
agcctgccca ccagagcctg ggagcccgcc atgaagaagt ccttcgcctt cgacaacgtg 540
ggctacgagg gcggcctgga cggactggga ccatcttctc aggtggccac aagcaccgtg 600
cgcatcctgg gcatgacctg ccagagctgc gtgaagtcca tcgaggaccg gatcagcaac 660
ctgaagggca tcatcagcat gaaggtgtcc ctggaacagg gcagcgccac cgtgaaatac 720
gtgccctctg tcgtgtgcct gcagcaggtg tgccaccaga tcggcgacat gggcttcgag 780
gcctctatcg ccgagggaaa ggccgcctct tggccctcta gaagcctgcc tgctcaggaa 840
gccgtcgtga agctgcgggt ggaagggatg acctgtcagt cctgcgtgtc cagcatcgag 900
ggcaaagtgc ggaagctgca gggcgtggtg cgcgtgaaag tgtctctgag caaccaggaa 960
gctgtgatca cctaccagcc ctacctgatc cagcccgagg acctgaggga ccacgtgaac 1020
gatatgggat ttgaggccgc catcaagagc aaggtggccc ctctgtctct gggccccatc 1080
gacatcgaga gactgcagag caccaacccc aagcggcctc tgagcagcgc caaccagaac 1140
ttcaacaaca gcgagacact gggccaccag ggcagccacg tcgtgacact gcagctgcgg 1200
atcgacggaa tgcactgcaa gagctgtgtg ctgaacatcg aggaaaacat cggccagctg 1260
ctgggagtgc agagcatcca ggtgtcactg gaaaacaaga ccgcccaggt gaagtacgac 1320
cccagctgca caagccccgt ggccctgcag agagccattg aagctctgcc ccctggcaac 1380
ttcaaagtgt ccctgcctga cggagccgag ggctccggaa cagatcacag aagcagcagc 1440
agccacagcc ctggcagccc ccctagaaat caggtgcagg gcacctgtag caccaccctg 1500
atcgccattg ccggcatgac atgcgccagc tgcgtgcact ctattgaggg catgatctcc 1560
cagctggaag gcgtgcagca gatcagtgtg tctctggccg agggcaccgc cacagtgctg 1620
tacaacccta gcgtgatcag ccccgaagaa ctgagagccg ccattgagga catgggattc 1680
gaagccagcg tggtgtccga gagctgctcc accaaccctc tgggcaatca cagcgccggc 1740
aacagcatgg tgcagaccac cgacggcacc cccaccagcg tgcaggaagt ggccccacat 1800
acaggcagac tgcccgccaa tcacgccccc gatatcctgg ccaagagccc ccagagtaca 1860
agagccgtgg ccccccagaa gtgcttcctg cagatcaagg gcatgacttg tgcctcttgt 1920
gtgtccaata tcgagcggaa cctgcagaaa gaggccggcg tgctgtctgt gctggtggct 1980
ctgatggccg gcaaggccga gatcaaatac gaccccgaag tgattcagcc cctggaaatc 2040
gcccagttta tccaggacct gggctttgaa gccgccgtga tggaagatta cgccggctcc 2100
gacggcaaca tcgagctgac catcaccgga atgacctgcg cctcctgtgt gcacaacatt 2160
gagtccaagc tgacccggac caacggcatc acctacgcct ctgtggctct ggccacctcc 2220
aaggccctcg tgaagttcga tcccgagatc atcggcccca gggacatcat caagatcatc 2280
gaagagatcg gcttccacgc cagcctggcc cagaggaacc ctaacgccca ccacctggac 2340
cacaagatgg aaatcaagca gtggaagaaa agcttcctgt gcagcctggt gttcggcatc 2400
cccgtgatgg ccctgatgat ctacatgctg atccccagca acgagcccca ccagtccatg 2460
gtgctggatc acaacatcat ccccggcctg tctatcctga acctgatctt cttcatcctg 2520
tgcaccttcg tgcagctgct gggcggctgg tacttctacg tgcaggccta caagtccctg 2580
cggcacagat ccgccaacat ggacgtgctg atcgtgctgg ccacatctat cgcctacgtg 2640
tactccctcg tgatcctggt ggtggccgtg gccgagaaag ccgagagaag ccctgtgacc 2700
ttcttcgaca ccccccctat gctgttcgtg tttatcgccc tgggccggtg gctggaacac 2760
ctggccaaaa gcaagaccag cgaggccctg gctaagctga tgagtctgca ggccaccgag 2820
gccacagtcg tgaccctggg cgaggacaac ctgatcatcc gcgaggaaca ggtgccaatg 2880
gaactggtgc agcggggcga catcgtgaag gtggtgcctg gcggcaagtt ccccgtggac 2940
ggaaaagtgc tggaagggaa taccatggcc gacgagagcc tgatcacagg cgaggccatg 3000
cccgtgacca agaaacctgg cagcacagtg atcgccggca gcatcaatgc ccacggcagc 3060
gtgctgatta aggccacaca cgtgggcaac gataccaccc tggctcagat tgtgaagctg 3120
gtggaagagg cccagatgag caaggccccc attcagcagc tggctgaccg gttcagcggc 3180
tacttcgtgc cctttatcat catcatgagc accctgacac tggtcgtgtg gatcgtgatc 3240
ggctttatcg acttcggagt ggtgcagaga tacttcccca accctaacaa gcacatcagc 3300
cagacagaag tgatcatcag attcgccttt cagaccagca tcaccgtgct gtgtatcgcc 3360
tgcccctgta gcctgggact ggccacacct accgctgtga tggtgggaac aggcgtggcc 3420
gctcagaacg gcatcctgat caaggggggc aagcctctgg aaatggctca caagatcaag 3480
accgtgatgt tcgacaagac cggcaccatc acccacggcg tgcccagagt gatgagagtg 3540
ctgctgctgg gggatgtggc caccctgcct ctgagaaagg tgctggctgt cgtgggcaca 3600
gccgaggcta gctctgaaca cccactggga gtggccgtga caaagtactg caaagaggaa 3660
ctgggcaccg aaaccctggg ctactgcacc gactttcagg ccgtgcctgg ctgtggcatc 3720
ggctgcaagg tgtccaacgt ggaaggcatc ctggcccaca gcgagaggcc actgtctgcc 3780
cctgccagcc acctgaacga ggccggatct ctgcccgccg aaaaggacgc tgtgccccag 3840
accttctctg tgctgattgg caacagagag tggctgcggc ggaacggcct gaccatctcc 3900
tccgatgtgt ccgacgccat gaccgaccac gagatgaagg gccagaccgc cattctggtg 3960
gccattgacg gggtgctgtg cggcatgatc gcaatcgccg atgccgtgaa acaggaagca 4020
gcactggccg tgcacaccct gcagtctatg ggagtggatg tggtgctgat caccggcgac 4080
aacagaaaga ccgccagggc cattgccacc caggtgggca tcaacaaggt gttcgccgag 4140
gtgctgccca gccacaaagt ggccaaggtg caggaactgc agaacaaagg caaaaaggtg 4200
gccatggtgg gagatggcgt gaacgactct cctgctctgg cccaggcaga tatgggcgtg 4260
gccatcggca caggcaccga cgtggcaatt gaggctgctg acgtggtgct gattcggaac 4320
gacctgctgg acgtggtggc ctccatccac ctgtccaaga gaaccgtgcg gcggatcaga 4380
atcaacctgg tgctggcact gatctataac ctcgtgggca tccctatcgc cgctggcgtg 4440
ttcatgccta tcggaatcgt gctgcagccc tggatgggct ctgccgccat ggctgcaagc 4500
tccgtgtctg tggtgctgtc cagcctgcag ctgaagtgct acaagaagcc cgacctggaa 4560
agatacgagg cccaggccca cggacacatg aagcctctga cagcctccca ggtgtccgtg 4620
cacatcggca tggacgacag atggcgggac agccctagag ccaccccttg ggatcaggtg 4680
tcatacgtgt cacaggtgtc cctgagcagc ctgaccagcg acaagcccag cagacatagc 4740
gccgctgccg acgacgatgg ggacaagtgg tccctgctgc tgaacggccg ggatgaggaa 4800
cagtacatct gataagcatg caataaagtc tgagtgggcg gcagcctgtg tgtgcctggg 4860
ttctctctgt cccggaatgt gcaaacaatg gaggtgctcg agtagataag tagcatggcg 4920
ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4980
ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 5040
cggcctcagt gagcgagcga gcgcgcagcc ttaattaacc taattcactg gccgtcgttt 5100
tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 5160
cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt 5220
tgcgcagcct gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg 5280
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 5340
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 5400
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 5460
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 5520
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 5580
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 5640
atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt 5700
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 5760
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 5820
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 5880
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 5940
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 6000
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 6060
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 6120
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 6180
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 6240
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 6300
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 6360
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 6420
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 6480
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 6540
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 6600
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 6660
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 6720
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 6780
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 6840
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 6900
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 6960
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 7020
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 7080
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 7140
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 7200
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 7260
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 7320
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 7380
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 7440
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 7500
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 7560
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 7620
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 7680
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 7740
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 7800
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 7860
cgccagattt aattaagg 7878
<210> 27
<211> 7858
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 27
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tccgatgctc taatctctct agacaaggtt 240
catatttgta tgggttactt attctctctt tgttgactaa gtcaataatc agaatcagca 300
ggtttgcagt cagattggca gggataagca gcctagctca ggagaagtga gtataaaagc 360
cccaggctgg gagcagccat cagcggccgc caccatgccc gagcaggaaa gacagatcac 420
cgccagagag ggcgccagcc ggaagatcct gagcaagctg agcctgccca ccagagcctg 480
ggagcccgcc atgaagaagt ccttcgcctt cgacaacgtg ggctacgagg gcggcctgga 540
cggactggga ccatcttctc aggtggccac aagcaccgtg cgcatcctgg gcatgacctg 600
ccagagctgc gtgaagtcca tcgaggaccg gatcagcaac ctgaagggca tcatcagcat 660
gaaggtgtcc ctggaacagg gcagcgccac cgtgaaatac gtgccctctg tcgtgtgcct 720
gcagcaggtg tgccaccaga tcggcgacat gggcttcgag gcctctatcg ccgagggaaa 780
ggccgcctct tggccctcta gaagcctgcc tgctcaggaa gccgtcgtga agctgcgggt 840
ggaagggatg acctgtcagt cctgcgtgtc cagcatcgag ggcaaagtgc ggaagctgca 900
gggcgtggtg cgcgtgaaag tgtctctgag caaccaggaa gctgtgatca cctaccagcc 960
ctacctgatc cagcccgagg acctgaggga ccacgtgaac gatatgggat ttgaggccgc 1020
catcaagagc aaggtggccc ctctgtctct gggccccatc gacatcgaga gactgcagag 1080
caccaacccc aagcggcctc tgagcagcgc caaccagaac ttcaacaaca gcgagacact 1140
gggccaccag ggcagccacg tcgtgacact gcagctgcgg atcgacggaa tgcactgcaa 1200
gagctgtgtg ctgaacatcg aggaaaacat cggccagctg ctgggagtgc agagcatcca 1260
ggtgtcactg gaaaacaaga ccgcccaggt gaagtacgac cccagctgca caagccccgt 1320
ggccctgcag agagccattg aagctctgcc ccctggcaac ttcaaagtgt ccctgcctga 1380
cggagccgag ggctccggaa cagatcacag aagcagcagc agccacagcc ctggcagccc 1440
ccctagaaat caggtgcagg gcacctgtag caccaccctg atcgccattg ccggcatgac 1500
atgcgccagc tgcgtgcact ctattgaggg catgatctcc cagctggaag gcgtgcagca 1560
gatcagtgtg tctctggccg agggcaccgc cacagtgctg tacaacccta gcgtgatcag 1620
ccccgaagaa ctgagagccg ccattgagga catgggattc gaagccagcg tggtgtccga 1680
gagctgctcc accaaccctc tgggcaatca cagcgccggc aacagcatgg tgcagaccac 1740
cgacggcacc cccaccagcg tgcaggaagt ggccccacat acaggcagac tgcccgccaa 1800
tcacgccccc gatatcctgg ccaagagccc ccagagtaca agagccgtgg ccccccagaa 1860
gtgcttcctg cagatcaagg gcatgacttg tgcctcttgt gtgtccaata tcgagcggaa 1920
cctgcagaaa gaggccggcg tgctgtctgt gctggtggct ctgatggccg gcaaggccga 1980
gatcaaatac gaccccgaag tgattcagcc cctggaaatc gcccagttta tccaggacct 2040
gggctttgaa gccgccgtga tggaagatta cgccggctcc gacggcaaca tcgagctgac 2100
catcaccgga atgacctgcg cctcctgtgt gcacaacatt gagtccaagc tgacccggac 2160
caacggcatc acctacgcct ctgtggctct ggccacctcc aaggccctcg tgaagttcga 2220
tcccgagatc atcggcccca gggacatcat caagatcatc gaagagatcg gcttccacgc 2280
cagcctggcc cagaggaacc ctaacgccca ccacctggac cacaagatgg aaatcaagca 2340
gtggaagaaa agcttcctgt gcagcctggt gttcggcatc cccgtgatgg ccctgatgat 2400
ctacatgctg atccccagca acgagcccca ccagtccatg gtgctggatc acaacatcat 2460
ccccggcctg tctatcctga acctgatctt cttcatcctg tgcaccttcg tgcagctgct 2520
gggcggctgg tacttctacg tgcaggccta caagtccctg cggcacagat ccgccaacat 2580
ggacgtgctg atcgtgctgg ccacatctat cgcctacgtg tactccctcg tgatcctggt 2640
ggtggccgtg gccgagaaag ccgagagaag ccctgtgacc ttcttcgaca ccccccctat 2700
gctgttcgtg tttatcgccc tgggccggtg gctggaacac ctggccaaaa gcaagaccag 2760
cgaggccctg gctaagctga tgagtctgca ggccaccgag gccacagtcg tgaccctggg 2820
cgaggacaac ctgatcatcc gcgaggaaca ggtgccaatg gaactggtgc agcggggcga 2880
catcgtgaag gtggtgcctg gcggcaagtt ccccgtggac ggaaaagtgc tggaagggaa 2940
taccatggcc gacgagagcc tgatcacagg cgaggccatg cccgtgacca agaaacctgg 3000
cagcacagtg atcgccggca gcatcaatgc ccacggcagc gtgctgatta aggccacaca 3060
cgtgggcaac gataccaccc tggctcagat tgtgaagctg gtggaagagg cccagatgag 3120
caaggccccc attcagcagc tggctgaccg gttcagcggc tacttcgtgc cctttatcat 3180
catcatgagc accctgacac tggtcgtgtg gatcgtgatc ggctttatcg acttcggagt 3240
ggtgcagaga tacttcccca accctaacaa gcacatcagc cagacagaag tgatcatcag 3300
attcgccttt cagaccagca tcaccgtgct gtgtatcgcc tgcccctgta gcctgggact 3360
ggccacacct accgctgtga tggtgggaac aggcgtggcc gctcagaacg gcatcctgat 3420
caaggggggc aagcctctgg aaatggctca caagatcaag accgtgatgt tcgacaagac 3480
cggcaccatc acccacggcg tgcccagagt gatgagagtg ctgctgctgg gggatgtggc 3540
caccctgcct ctgagaaagg tgctggctgt cgtgggcaca gccgaggcta gctctgaaca 3600
cccactggga gtggccgtga caaagtactg caaagaggaa ctgggcaccg aaaccctggg 3660
ctactgcacc gactttcagg ccgtgcctgg ctgtggcatc ggctgcaagg tgtccaacgt 3720
ggaaggcatc ctggcccaca gcgagaggcc actgtctgcc cctgccagcc acctgaacga 3780
ggccggatct ctgcccgccg aaaaggacgc tgtgccccag accttctctg tgctgattgg 3840
caacagagag tggctgcggc ggaacggcct gaccatctcc tccgatgtgt ccgacgccat 3900
gaccgaccac gagatgaagg gccagaccgc cattctggtg gccattgacg gggtgctgtg 3960
cggcatgatc gcaatcgccg atgccgtgaa acaggaagca gcactggccg tgcacaccct 4020
gcagtctatg ggagtggatg tggtgctgat caccggcgac aacagaaaga ccgccagggc 4080
cattgccacc caggtgggca tcaacaaggt gttcgccgag gtgctgccca gccacaaagt 4140
ggccaaggtg caggaactgc agaacaaagg caaaaaggtg gccatggtgg gagatggcgt 4200
gaacgactct cctgctctgg cccaggcaga tatgggcgtg gccatcggca caggcaccga 4260
cgtggcaatt gaggctgctg acgtggtgct gattcggaac gacctgctgg acgtggtggc 4320
ctccatccac ctgtccaaga gaaccgtgcg gcggatcaga atcaacctgg tgctggcact 4380
gatctataac ctcgtgggca tccctatcgc cgctggcgtg ttcatgccta tcggaatcgt 4440
gctgcagccc tggatgggct ctgccgccat ggctgcaagc tccgtgtctg tggtgctgtc 4500
cagcctgcag ctgaagtgct acaagaagcc cgacctggaa agatacgagg cccaggccca 4560
cggacacatg aagcctctga cagcctccca ggtgtccgtg cacatcggca tggacgacag 4620
atggcgggac agccctagag ccaccccttg ggatcaggtg tcatacgtgt cacaggtgtc 4680
cctgagcagc ctgaccagcg acaagcccag cagacatagc gccgctgccg acgacgatgg 4740
ggacaagtgg tccctgctgc tgaacggccg ggatgaggaa cagtacatct gataagcatg 4800
caataaagtc tgagtgggcg gcagcctgtg tgtgcctggg ttctctctgt cccggaatgt 4860
gcaaacaatg gaggtgctcg agtagataag tagcatggcg ggttaatcat taactacaag 4920
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 4980
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 5040
gcgcgcagcc ttaattaacc taattcactg gccgtcgttt tacaacgtcg tgactgggaa 5100
aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt 5160
aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa 5220
tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 5280
accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 5340
gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 5400
tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 5460
gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 5520
agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 5580
ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 5640
tttaacgcga attttaacaa aatattaacg cttacaattt aggtggcact tttcggggaa 5700
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 5760
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 5820
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 5880
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 5940
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 6000
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 6060
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 6120
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 6180
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 6240
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 6300
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 6360
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 6420
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 6480
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 6540
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 6600
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 6660
agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc 6720
atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc 6780
cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 6840
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 6900
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 6960
tcagcagagc gcagatacca aatactgttc ttctagtgta gccgtagtta ggccaccact 7020
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 7080
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 7140
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 7200
cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 7260
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 7320
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 7380
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 7440
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 7500
cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 7560
gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcccaa 7620
tacgcaaacc gcctctcccc gcgcgttggc cgattcatta atgcagctgg cacgacaggt 7680
ttcccgactg gaaagcgggc agtgagcgca acgcaattaa tgtgagttag ctcactcatt 7740
aggcacccca ggctttacac tttatgcttc cggctcgtat gttgtgtgga attgtgagcg 7800
gataacaatt tcacacagga aacagctatg accatgatta cgccagattt aattaagg 7858
<210> 28
<211> 7094
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 28
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agctagcagg 180
ttaattttta aaaagcagtc aaaagtccaa gtggcccttg gcagcattta ctctctctgt 240
ttgctctggt taataatctc aggagcacaa acattccaga tccaggttaa tttttaaaaa 300
gcagtcaaaa gtccaagtgg cccttggcag catttactct ctctgtttgc tctggttaat 360
aatctcagga gcacaaacat tccagatccg gcgcgccagg gctggaagct acctttgaca 420
tcatttcctc tgcgaatgca tgtataattt ctacagaacc tattagaaag gatcacccag 480
cctctgcttt tgtacaactt tcccttaaaa aactgccaat tccactgctg tttggcccaa 540
tagtgagaac tttttcctgc tgcctcttgg tgcttttgcc tatggcccct attctgcctg 600
ctgaagacac tcttgccagc atggacttaa acccctccag ctctgacaat cctctttctc 660
ttttgtttta catgaagggt ctggcagcca aagcaatcac tcaaagttca aaccttatca 720
ttttttgctt tgttcctctt ggccttggtt ttgtacatca gctttgaaaa taccatccca 780
gggttaatgc tggggttaat ttataactaa gagtgctcta gttttgcaat acaggacatg 840
ctataaaaat ggaaagatgt tgctttctga gagactgcag aagttggtcg tgaggcactg 900
ggcaggtaag tatcaaggtt acaagacagg tttaaggaga ccaatagaaa ctgggcttgt 960
cgagacagag aagactcttg cgtttctgat aggcacctat tggtcttact gacatccact 1020
ttgcctttct ctccacaggt gtccaggcgg ccgccaccat gcccgagcag gaaagacaga 1080
tcaccgccag agagggcgcc agccggaaga tcctgagcaa gctgagcctg cccaccagag 1140
cctgggagcc cgccatgaag aagtccttcg ccttcgacaa cgtgggctac gagggcggcc 1200
tggacggact gggaccatct tctcaggtgg ccacaagcac cgtgcgcctg gaaatcgccc 1260
agtttatcca ggacctgggc tttgaagccg ccgtgatgga agattacgcc ggctccgacg 1320
gcaacatcga gctgaccatc accggaatga cctgcgcctc ctgtgtgcac aacattgagt 1380
ccaagctgac ccggaccaac ggcatcacct acgcctctgt ggctctggcc acctccaagg 1440
ccctcgtgaa gttcgatccc gagatcatcg gccccaggga catcatcaag atcatcgaag 1500
agatcggctt ccacgccagc ctggcccaga ggaaccctaa cgcccaccac ctggaccaca 1560
agatggaaat caagcagtgg aagaaaagct tcctgtgcag cctggtgttc ggcatccccg 1620
tgatggccct gatgatctac atgctgatcc ccagcaacga gccccaccag tccatggtgc 1680
tggatcacaa catcatcccc ggcctgtcta tcctgaacct gatcttcttc atcctgtgca 1740
ccttcgtgca gctgctgggc ggctggtact tctacgtgca ggcctacaag tccctgcggc 1800
acagatccgc caacatggac gtgctgatcg tgctggccac atctatcgcc tacgtgtact 1860
ccctcgtgat cctggtggtg gccgtggccg agaaagccga gagaagccct gtgaccttct 1920
tcgacacccc ccctatgctg ttcgtgttta tcgccctggg ccggtggctg gaacacctgg 1980
ccaaaagcaa gaccagcgag gccctggcta agctgatgag tctgcaggcc accgaggcca 2040
cagtcgtgac cctgggcgag gacaacctga tcatccgcga ggaacaggtg ccaatggaac 2100
tggtgcagcg gggcgacatc gtgaaggtgg tgcctggcgg caagttcccc gtggacggaa 2160
aagtgctgga agggaatacc atggccgacg agagcctgat cacaggcgag gccatgcccg 2220
tgaccaagaa acctggcagc acagtgatcg ccggcagcat caatgcccac ggcagcgtgc 2280
tgattaaggc cacacacgtg ggcaacgata ccaccctggc tcagattgtg aagctggtgg 2340
aagaggccca gatgagcaag gcccccattc agcagctggc tgaccggttc agcggctact 2400
tcgtgccctt tatcatcatc atgagcaccc tgacactggt cgtgtggatc gtgatcggct 2460
ttatcgactt cggagtggtg cagagatact tccccaaccc taacaagcac atcagccaga 2520
cagaagtgat catcagattc gcctttcaga ccagcatcac cgtgctgtgt atcgcctgcc 2580
cctgtagcct gggactggcc acacctaccg ctgtgatggt gggaacaggc gtggccgctc 2640
agaacggcat cctgatcaag gggggcaagc ctctggaaat ggctcacaag atcaagaccg 2700
tgatgttcga caagaccggc accatcaccc acggcgtgcc cagagtgatg agagtgctgc 2760
tgctggggga tgtggccacc ctgcctctga gaaaggtgct ggctgtcgtg ggcacagccg 2820
aggctagctc tgaacaccca ctgggagtgg ccgtgacaaa gtactgcaaa gaggaactgg 2880
gcaccgaaac cctgggctac tgcaccgact ttcaggccgt gcctggctgt ggcatcggct 2940
gcaaggtgtc caacgtggaa ggcatcctgg cccacagcga gaggccactg tctgcccctg 3000
ccagccacct gaacgaggcc ggatctctgc ccgccgaaaa ggacgctgtg ccccagacct 3060
tctctgtgct gattggcaac agagagtggc tgcggcggaa cggcctgacc atctcctccg 3120
atgtgtccga cgccatgacc gaccacgaga tgaagggcca gaccgccatt ctggtggcca 3180
ttgacggggt gctgtgcggc atgatcgcaa tcgccgatgc cgtgaaacag gaagcagcac 3240
tggccgtgca caccctgcag tctatgggag tggatgtggt gctgatcacc ggcgacaaca 3300
gaaagaccgc cagggccatt gccacccagg tgggcatcaa caaggtgttc gccgaggtgc 3360
tgcccagcca caaagtggcc aaggtgcagg aactgcagaa caaaggcaaa aaggtggcca 3420
tggtgggaga tggcgtgaac gactctcctg ctctggccca ggcagatatg ggcgtggcca 3480
tcggcacagg caccgacgtg gcaattgagg ctgctgacgt ggtgctgatt cggaacgacc 3540
tgctggacgt ggtggcctcc atccacctgt ccaagagaac cgtgcggcgg atcagaatca 3600
acctggtgct ggcactgatc tataacctcg tgggcatccc tatcgccgct ggcgtgttca 3660
tgcctatcgg aatcgtgctg cagccctgga tgggctctgc cgccatggct gcaagctccg 3720
tgtctgtggt gctgtccagc ctgcagctga agtgctacaa gaagcccgac ctggaaagat 3780
acgaggccca ggcccacgga cacatgaagc ctctgacagc ctcccaggtg tccgtgcaca 3840
tcggcatgga cgacagatgg cgggacagcc ctagagccac cccttgggat caggtgtcat 3900
acgtgtcaca ggtgtccctg agcagcctga ccagcgacaa gcccagcaga catagcgccg 3960
ctgccgacga cgatggggac aagtggtccc tgctgctgaa cggccgggat gaggaacagt 4020
acatctgata agcatgcaat aaagtctgag tgggcggcag cctgtgtgtg cctgggttct 4080
ctctgtcccg gaatgtgcaa acaatggagg tgctcgagta gataagtagc atggcgggtt 4140
aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4200
ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4260
ctcagtgagc gagcgagcgc gcagccttaa ttaacctaat tcactggccg tcgttttaca 4320
acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 4380
tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 4440
cagcctgaat ggcgaatggg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 4500
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 4560
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 4620
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 4680
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 4740
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 4800
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 4860
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttaggt 4920
ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca 4980
aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg 5040
aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc 5100
cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg 5160
ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt 5220
cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta 5280
ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat 5340
gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga 5400
gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca 5460
acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact 5520
cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc 5580
acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact 5640
ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt 5700
ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt 5760
gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt 5820
atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata 5880
ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag 5940
attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat 6000
ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 6060
aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 6120
aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 6180
ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg 6240
tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 6300
ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 6360
cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 6420
agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 6480
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 6540
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 6600
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 6660
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 6720
cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 6780
tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 6840
gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc 6900
agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg 6960
agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg 7020
tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc 7080
agatttaatt aagg 7094
<210> 29
<211> 7487
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 29
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agctagcagg 180
ttaattttta aaaagcagtc aaaagtccaa gtggcccttg gcagcattta ctctctctgt 240
ttgctctggt taataatctc aggagcacaa acattccaga tccaggttaa tttttaaaaa 300
gcagtcaaaa gtccaagtgg cccttggcag catttactct ctctgtttgc tctggttaat 360
aatctcagga gcacaaacat tccagatccg gcgcgccagg gctggaagct acctttgaca 420
tcatttcctc tgcgaatgca tgtataattt ctacagaacc tattagaaag gatcacccag 480
cctctgcttt tgtacaactt tcccttaaaa aactgccaat tccactgctg tttggcccaa 540
tagtgagaac tttttcctgc tgcctcttgg tgcttttgcc tatggcccct attctgcctg 600
ctgaagacac tcttgccagc atggacttaa acccctccag ctctgacaat cctctttctc 660
ttttgtttta catgaagggt ctggcagcca aagcaatcac tcaaagttca aaccttatca 720
ttttttgctt tgttcctctt ggccttggtt ttgtacatca gctttgaaaa taccatccca 780
gggttaatgc tggggttaat ttataactaa gagtgctcta gttttgcaat acaggacatg 840
ctataaaaat ggaaagatgt tgctttctga gagactgcag aagttggtcg tgaggcactg 900
ggcaggtaag tatcaaggtt acaagacagg tttaaggaga ccaatagaaa ctgggcttgt 960
cgagacagag aagactcttg cgtttctgat aggcacctat tggtcttact gacatccact 1020
ttgcctttct ctccacaggt gtccaggcgg ccgccaccat gcccgagcag gaaagacaga 1080
tcaccgccag agagggcgcc agccggaaga tcctgagcaa gctgagcctg cccaccagag 1140
cctgggagcc cgccatgaag aagtccttcg ccttcgacaa cgtgggctac gagggcggcc 1200
tggacggact gggaccatct tctcaggtgg ccacaagcac cgtgcgcagc cccgaagaac 1260
tgagagccgc cattgaggac atgggattcg aagccagcgt ggtgtccgag agctgctcca 1320
ccaaccctct gggcaatcac agcgccggca acagcatggt gcagaccacc gacggcaccc 1380
ccaccagcgt gcaggaagtg gccccacata caggcagact gcccgccaat cacgcccccg 1440
atatcctggc caagagcccc cagagtacaa gagccgtggc cccccagaag tgcttcctgc 1500
agatcaaggg catgacttgt gcctcttgtg tgtccaatat cgagcggaac ctgcagaaag 1560
aggccggcgt gctgtctgtg ctggtggctc tgatggccgg caaggccgag atcaaatacg 1620
accccgaagt gattcagccc ctggaaatcg cccagtttat ccaggacctg ggctttgaag 1680
ccgccgtgat ggaagattac gccggctccg acggcaacat cgagctgacc atcaccggaa 1740
tgacctgcgc ctcctgtgtg cacaacattg agtccaagct gacccggacc aacggcatca 1800
cctacgcctc tgtggctctg gccacctcca aggccctcgt gaagttcgat cccgagatca 1860
tcggccccag ggacatcatc aagatcatcg aagagatcgg cttccacgcc agcctggccc 1920
agaggaaccc taacgcccac cacctggacc acaagatgga aatcaagcag tggaagaaaa 1980
gcttcctgtg cagcctggtg ttcggcatcc ccgtgatggc cctgatgatc tacatgctga 2040
tccccagcaa cgagccccac cagtccatgg tgctggatca caacatcatc cccggcctgt 2100
ctatcctgaa cctgatcttc ttcatcctgt gcaccttcgt gcagctgctg ggcggctggt 2160
acttctacgt gcaggcctac aagtccctgc ggcacagatc cgccaacatg gacgtgctga 2220
tcgtgctggc cacatctatc gcctacgtgt actccctcgt gatcctggtg gtggccgtgg 2280
ccgagaaagc cgagagaagc cctgtgacct tcttcgacac cccccctatg ctgttcgtgt 2340
ttatcgccct gggccggtgg ctggaacacc tggccaaaag caagaccagc gaggccctgg 2400
ctaagctgat gagtctgcag gccaccgagg ccacagtcgt gaccctgggc gaggacaacc 2460
tgatcatccg cgaggaacag gtgccaatgg aactggtgca gcggggcgac atcgtgaagg 2520
tggtgcctgg cggcaagttc cccgtggacg gaaaagtgct ggaagggaat accatggccg 2580
acgagagcct gatcacaggc gaggccatgc ccgtgaccaa gaaacctggc agcacagtga 2640
tcgccggcag catcaatgcc cacggcagcg tgctgattaa ggccacacac gtgggcaacg 2700
ataccaccct ggctcagatt gtgaagctgg tggaagaggc ccagatgagc aaggccccca 2760
ttcagcagct ggctgaccgg ttcagcggct acttcgtgcc ctttatcatc atcatgagca 2820
ccctgacact ggtcgtgtgg atcgtgatcg gctttatcga cttcggagtg gtgcagagat 2880
acttccccaa ccctaacaag cacatcagcc agacagaagt gatcatcaga ttcgcctttc 2940
agaccagcat caccgtgctg tgtatcgcct gcccctgtag cctgggactg gccacaccta 3000
ccgctgtgat ggtgggaaca ggcgtggccg ctcagaacgg catcctgatc aaggggggca 3060
agcctctgga aatggctcac aagatcaaga ccgtgatgtt cgacaagacc ggcaccatca 3120
cccacggcgt gcccagagtg atgagagtgc tgctgctggg ggatgtggcc accctgcctc 3180
tgagaaaggt gctggctgtc gtgggcacag ccgaggctag ctctgaacac ccactgggag 3240
tggccgtgac aaagtactgc aaagaggaac tgggcaccga aaccctgggc tactgcaccg 3300
actttcaggc cgtgcctggc tgtggcatcg gctgcaaggt gtccaacgtg gaaggcatcc 3360
tggcccacag cgagaggcca ctgtctgccc ctgccagcca cctgaacgag gccggatctc 3420
tgcccgccga aaaggacgct gtgccccaga ccttctctgt gctgattggc aacagagagt 3480
ggctgcggcg gaacggcctg accatctcct ccgatgtgtc cgacgccatg accgaccacg 3540
agatgaaggg ccagaccgcc attctggtgg ccattgacgg ggtgctgtgc ggcatgatcg 3600
caatcgccga tgccgtgaaa caggaagcag cactggccgt gcacaccctg cagtctatgg 3660
gagtggatgt ggtgctgatc accggcgaca acagaaagac cgccagggcc attgccaccc 3720
aggtgggcat caacaaggtg ttcgccgagg tgctgcccag ccacaaagtg gccaaggtgc 3780
aggaactgca gaacaaaggc aaaaaggtgg ccatggtggg agatggcgtg aacgactctc 3840
ctgctctggc ccaggcagat atgggcgtgg ccatcggcac aggcaccgac gtggcaattg 3900
aggctgctga cgtggtgctg attcggaacg acctgctgga cgtggtggcc tccatccacc 3960
tgtccaagag aaccgtgcgg cggatcagaa tcaacctggt gctggcactg atctataacc 4020
tcgtgggcat ccctatcgcc gctggcgtgt tcatgcctat cggaatcgtg ctgcagccct 4080
ggatgggctc tgccgccatg gctgcaagct ccgtgtctgt ggtgctgtcc agcctgcagc 4140
tgaagtgcta caagaagccc gacctggaaa gatacgaggc ccaggcccac ggacacatga 4200
agcctctgac agcctcccag gtgtccgtgc acatcggcat ggacgacaga tggcgggaca 4260
gccctagagc caccccttgg gatcaggtgt catacgtgtc acaggtgtcc ctgagcagcc 4320
tgaccagcga caagcccagc agacatagcg ccgctgccga cgacgatggg gacaagtggt 4380
ccctgctgct gaacggccgg gatgaggaac agtacatctg ataagcatgc aataaagtct 4440
gagtgggcgg cagcctgtgt gtgcctgggt tctctctgtc ccggaatgtg caaacaatgg 4500
aggtgctcga gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt 4560
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 4620
ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagcct 4680
taattaacct aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 4740
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 4800
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc 4860
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 4920
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 4980
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 5040
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 5100
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 5160
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 5220
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 5280
ttttaacaaa atattaacgc ttacaattta ggtggcactt ttcggggaaa tgtgcgcgga 5340
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 5400
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 5460
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 5520
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 5580
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 5640
agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 5700
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 5760
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 5820
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 5880
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 5940
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 6000
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 6060
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 6120
tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 6180
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 6240
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 6300
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 6360
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 6420
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 6480
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 6540
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 6600
cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct 6660
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 6720
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 6780
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 6840
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 6900
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 6960
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 7020
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 7080
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct 7140
gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga 7200
acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat acgcaaaccg 7260
cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt tcccgactgg 7320
aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta ggcaccccag 7380
gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt 7440
cacacaggaa acagctatga ccatgattac gccagattta attaagg 7487
<210> 30
<211> 7788
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 30
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tcactcaaag ttcaaacctt atcatttttt 240
gctttgttcc tcttggcctt ggttttgtac atcagctttg aaaataccat cccagggtta 300
atgctggggt taatttataa ctaagagtgc tctagttttg caatacagga catgctataa 360
aaatggaaag atgttgcttt ctgagagaca gcggccgcca ccatgcccga gcaggaaaga 420
cagatcaccg ccagagaggg cgccagccgg aagatcctga gcaagctgag cctgcccacc 480
agagcctggg agcccgccat gaagaagtcc ttcgccttcg acaacgtggg ctacgagggc 540
ggcctggacg gactgggacc atcttctcag gtggccacaa gcaccgtgcg catcctgggc 600
atgacctgcc agagctgcgt gaagtccatc gaggaccgga tcagcaacct gaagggcatc 660
atcagcatga aggtgtccct ggaacagggc agcgccaccg tgaaatacgt gccctctgtc 720
gtgtgcctgc agcaggtgtg ccaccagatc ggcgacatgg gcttcgaggc ctctatcgcc 780
gagggaaagg ccgcctcttg gccctctaga agcctgcctg ctcaggaagc cgtcgtgaag 840
ctgcgggtgg aagggatgac ctgtcagtcc tgcgtgtcca gcatcgaggg caaagtgcgg 900
aagctgcagg gcgtggtgcg cgtgaaagtg tctctgagca accaggaagc tgtgatcacc 960
taccagccct acctgatcca gcccgaggac ctgagggacc acgtgaacga tatgggattt 1020
gaggccgcca tcaagagcaa ggtggcccct ctgtctctgg gccccatcga catcgagaga 1080
ctgcagagca ccaaccccaa gcggcctctg agcagcgcca accagaactt caacaacagc 1140
gagacactgg gccaccaggg cagccacgtc gtgacactgc agagcatcca ggtgtcactg 1200
gaaaacaaga ccgcccaggt gaagtacgac cccagctgca caagccccgt ggccctgcag 1260
agagccattg aagctctgcc ccctggcaac ttcaaagtgt ccctgcctga cggagccgag 1320
ggctccggaa cagatcacag aagcagcagc agccacagcc ctggcagccc ccctagaaat 1380
caggtgcagg gcacctgtag caccaccctg atcgccattg ccggcatgac atgcgccagc 1440
tgcgtgcact ctattgaggg catgatctcc cagctggaag gcgtgcagca gatcagtgtg 1500
tctctggccg agggcaccgc cacagtgctg tacaacccta gcgtgatcag ccccgaagaa 1560
ctgagagccg ccattgagga catgggattc gaagccagcg tggtgtccga gagctgctcc 1620
accaaccctc tgggcaatca cagcgccggc aacagcatgg tgcagaccac cgacggcacc 1680
cccaccagcg tgcaggaagt ggccccacat acaggcagac tgcccgccaa tcacgccccc 1740
gatatcctgg ccaagagccc ccagagtaca agagccgtgg ccccccagaa gtgcttcctg 1800
cagatcaagg gcatgacttg tgcctcttgt gtgtccaata tcgagcggaa cctgcagaaa 1860
gaggccggcg tgctgtctgt gctggtggct ctgatggccg gcaaggccga gatcaaatac 1920
gaccccgaag tgattcagcc cctggaaatc gcccagttta tccaggacct gggctttgaa 1980
gccgccgtga tggaagatta cgccggctcc gacggcaaca tcgagctgac catcaccgga 2040
atgacctgcg cctcctgtgt gcacaacatt gagtccaagc tgacccggac caacggcatc 2100
acctacgcct ctgtggctct ggccacctcc aaggccctcg tgaagttcga tcccgagatc 2160
atcggcccca gggacatcat caagatcatc gaagagatcg gcttccacgc cagcctggcc 2220
cagaggaacc ctaacgccca ccacctggac cacaagatgg aaatcaagca gtggaagaaa 2280
agcttcctgt gcagcctggt gttcggcatc cccgtgatgg ccctgatgat ctacatgctg 2340
atccccagca acgagcccca ccagtccatg gtgctggatc acaacatcat ccccggcctg 2400
tctatcctga acctgatctt cttcatcctg tgcaccttcg tgcagctgct gggcggctgg 2460
tacttctacg tgcaggccta caagtccctg cggcacagat ccgccaacat ggacgtgctg 2520
atcgtgctgg ccacatctat cgcctacgtg tactccctcg tgatcctggt ggtggccgtg 2580
gccgagaaag ccgagagaag ccctgtgacc ttcttcgaca ccccccctat gctgttcgtg 2640
tttatcgccc tgggccggtg gctggaacac ctggccaaaa gcaagaccag cgaggccctg 2700
gctaagctga tgagtctgca ggccaccgag gccacagtcg tgaccctggg cgaggacaac 2760
ctgatcatcc gcgaggaaca ggtgccaatg gaactggtgc agcggggcga catcgtgaag 2820
gtggtgcctg gcggcaagtt ccccgtggac ggaaaagtgc tggaagggaa taccatggcc 2880
gacgagagcc tgatcacagg cgaggccatg cccgtgacca agaaacctgg cagcacagtg 2940
atcgccggca gcatcaatgc ccacggcagc gtgctgatta aggccacaca cgtgggcaac 3000
gataccaccc tggctcagat tgtgaagctg gtggaagagg cccagatgag caaggccccc 3060
attcagcagc tggctgaccg gttcagcggc tacttcgtgc cctttatcat catcatgagc 3120
accctgacac tggtcgtgtg gatcgtgatc ggctttatcg acttcggagt ggtgcagaga 3180
tacttcccca accctaacaa gcacatcagc cagacagaag tgatcatcag attcgccttt 3240
cagaccagca tcaccgtgct gtgtatcgcc tgcccctgta gcctgggact ggccacacct 3300
accgctgtga tggtgggaac aggcgtggcc gctcagaacg gcatcctgat caaggggggc 3360
aagcctctgg aaatggctca caagatcaag accgtgatgt tcgacaagac cggcaccatc 3420
acccacggcg tgcccagagt gatgagagtg ctgctgctgg gggatgtggc caccctgcct 3480
ctgagaaagg tgctggctgt cgtgggcaca gccgaggcta gctctgaaca cccactggga 3540
gtggccgtga caaagtactg caaagaggaa ctgggcaccg aaaccctggg ctactgcacc 3600
gactttcagg ccgtgcctgg ctgtggcatc ggctgcaagg tgtccaacgt ggaaggcatc 3660
ctggcccaca gcgagaggcc actgtctgcc cctgccagcc acctgaacga ggccggatct 3720
ctgcccgccg aaaaggacgc tgtgccccag accttctctg tgctgattgg caacagagag 3780
tggctgcggc ggaacggcct gaccatctcc tccgatgtgt ccgacgccat gaccgaccac 3840
gagatgaagg gccagaccgc cattctggtg gccattgacg gggtgctgtg cggcatgatc 3900
gcaatcgccg atgccgtgaa acaggaagca gcactggccg tgcacaccct gcagtctatg 3960
ggagtggatg tggtgctgat caccggcgac aacagaaaga ccgccagggc cattgccacc 4020
caggtgggca tcaacaaggt gttcgccgag gtgctgccca gccacaaagt ggccaaggtg 4080
caggaactgc agaacaaagg caaaaaggtg gccatggtgg gagatggcgt gaacgactct 4140
cctgctctgg cccaggcaga tatgggcgtg gccatcggca caggcaccga cgtggcaatt 4200
gaggctgctg acgtggtgct gattcggaac gacctgctgg acgtggtggc ctccatccac 4260
ctgtccaaga gaaccgtgcg gcggatcaga atcaacctgg tgctggcact gatctataac 4320
ctcgtgggca tccctatcgc cgctggcgtg ttcatgccta tcggaatcgt gctgcagccc 4380
tggatgggct ctgccgccat ggctgcaagc tccgtgtctg tggtgctgtc cagcctgcag 4440
ctgaagtgct acaagaagcc cgacctggaa agatacgagg cccaggccca cggacacatg 4500
aagcctctga cagcctccca ggtgtccgtg cacatcggca tggacgacag atggcgggac 4560
agccctagag ccaccccttg ggatcaggtg tcatacgtgt cacaggtgtc cctgagcagc 4620
ctgaccagcg acaagcccag cagacatagc gccgctgccg acgacgatgg ggacaagtgg 4680
tccctgctgc tgaacggccg ggatgaggaa cagtacatct gataagcatg caataaagtc 4740
tgagtgggcg gcagcctgtg tgtgcctggg ttctctctgt cccggaatgt gcaaacaatg 4800
gaggtgctcg agtagataag tagcatggcg ggttaatcat taactacaag gaacccctag 4860
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 4920
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagcc 4980
ttaattaacc taattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 5040
ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 5100
aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgggacgcgc 5160
cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac 5220
ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg 5280
ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt 5340
tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc 5400
cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct 5460
tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga 5520
ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga 5580
attttaacaa aatattaacg cttacaattt aggtggcact tttcggggaa atgtgcgcgg 5640
aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 5700
accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 5760
tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 5820
gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 5880
ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 5940
gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga 6000
gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 6060
agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 6120
gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 6180
cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct 6240
gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac 6300
gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 6360
ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 6420
gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 6480
ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 6540
tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 6600
actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 6660
taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 6720
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 6780
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 6840
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 6900
gcagatacca aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc 6960
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 7020
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 7080
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 7140
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 7200
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 7260
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 7320
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 7380
tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc 7440
tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg 7500
aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc 7560
gcctctcccc gcgcgttggc cgattcatta atgcagctgg cacgacaggt ttcccgactg 7620
gaaagcgggc agtgagcgca acgcaattaa tgtgagttag ctcactcatt aggcacccca 7680
ggctttacac tttatgcttc cggctcgtat gttgtgtgga attgtgagcg gataacaatt 7740
tcacacagga aacagctatg accatgatta cgccagattt aattaagg 7788
<210> 31
<211> 7686
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 31
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tcactcaaag ttcaaacctt atcatttttt 240
gctttgttcc tcttggcctt ggttttgtac atcagctttg aaaataccat cccagggtta 300
atgctggggt taatttataa ctaagagtgc tctagttttg caatacagga catgctataa 360
aaatggaaag atgttgcttt ctgagagaca gcggccgcca ccatgcccga gcaggaaaga 420
cagatcaccg ccagagaggg cgccagccgg aagatcctga gcaagctgag cctgcccacc 480
agagcctggg agcccgccat gaagaagtcc ttcgccttcg acaacgtggg ctacgagggc 540
ggcctggacg gactgggacc atcttctcag gtggccacaa gcaccgtgcg catcctgggc 600
atgacctgcc agagctgcgt gaagtccatc gaggaccgga tcagcaacct gaagggcatc 660
atcagcatga aggtgtccct ggaacagggc agcgccaccg tgaaatacgt gccctctgtc 720
gtgtgcctgc agcaggtgtg ccaccagatc ggcgacatgg gcttcgaggc ctctatcgcc 780
gagggaaagg ccgcctcttg gccctctaga agcctgcctg ctcaggaagc cgtcgtgaag 840
gaggccgcca tcaagagcaa ggtggcccct ctgtctctgg gccccatcga catcgagaga 900
ctgcagagca ccaaccccaa gcggcctctg agcagcgcca accagaactt caacaacagc 960
gagacactgg gccaccaggg cagccacgtc gtgacactgc agctgcggat cgacggaatg 1020
cactgcaaga gctgtgtgct gaacatcgag gaaaacatcg gccagctgct gggagtgcag 1080
agcatccagg tgtcactgga aaacaagacc gcccaggtga agtacgaccc cagctgcaca 1140
agccccgtgg ccctgcagag agccattgaa gctctgcccc ctggcaactt caaagtgtcc 1200
ctgcctgacg gagccgaggg ctccggaaca gatcacagaa gcagcagcag ccacagccct 1260
ggcagccccc ctagaaatca ggtgcagggc acctgtagca ccaccctgat cgccattgcc 1320
ggcatgacat gcgccagctg cgtgcactct attgagggca tgatctccca gctggaaggc 1380
gtgcagcaga tcagtgtgtc tctggccgag ggcaccgcca cagtgctgta caaccctagc 1440
gtgatcagcc ccgaagaact gagagccgcc attgaggaca tgggattcga agccagcgtg 1500
gtgtccgaga gctgctccac caaccctctg ggcaatcaca gcgccggcaa cagcatggtg 1560
cagaccaccg acggcacccc caccagcgtg caggaagtgg ccccacatac aggcagactg 1620
cccgccaatc acgcccccga tatcctggcc aagagccccc agagtacaag agccgtggcc 1680
ccccagaagt gcttcctgca gatcaagggc atgacttgtg cctcttgtgt gtccaatatc 1740
gagcggaacc tgcagaaaga ggccggcgtg ctgtctgtgc tggtggctct gatggccggc 1800
aaggccgaga tcaaatacga ccccgaagtg attcagcccc tggaaatcgc ccagtttatc 1860
caggacctgg gctttgaagc cgccgtgatg gaagattacg ccggctccga cggcaacatc 1920
gagctgacca tcaccggaat gacctgcgcc tcctgtgtgc acaacattga gtccaagctg 1980
acccggacca acggcatcac ctacgcctct gtggctctgg ccacctccaa ggccctcgtg 2040
aagttcgatc ccgagatcat cggccccagg gacatcatca agatcatcga agagatcggc 2100
ttccacgcca gcctggccca gaggaaccct aacgcccacc acctggacca caagatggaa 2160
atcaagcagt ggaagaaaag cttcctgtgc agcctggtgt tcggcatccc cgtgatggcc 2220
ctgatgatct acatgctgat ccccagcaac gagccccacc agtccatggt gctggatcac 2280
aacatcatcc ccggcctgtc tatcctgaac ctgatcttct tcatcctgtg caccttcgtg 2340
cagctgctgg gcggctggta cttctacgtg caggcctaca agtccctgcg gcacagatcc 2400
gccaacatgg acgtgctgat cgtgctggcc acatctatcg cctacgtgta ctccctcgtg 2460
atcctggtgg tggccgtggc cgagaaagcc gagagaagcc ctgtgacctt cttcgacacc 2520
ccccctatgc tgttcgtgtt tatcgccctg ggccggtggc tggaacacct ggccaaaagc 2580
aagaccagcg aggccctggc taagctgatg agtctgcagg ccaccgaggc cacagtcgtg 2640
accctgggcg aggacaacct gatcatccgc gaggaacagg tgccaatgga actggtgcag 2700
cggggcgaca tcgtgaaggt ggtgcctggc ggcaagttcc ccgtggacgg aaaagtgctg 2760
gaagggaata ccatggccga cgagagcctg atcacaggcg aggccatgcc cgtgaccaag 2820
aaacctggca gcacagtgat cgccggcagc atcaatgccc acggcagcgt gctgattaag 2880
gccacacacg tgggcaacga taccaccctg gctcagattg tgaagctggt ggaagaggcc 2940
cagatgagca aggcccccat tcagcagctg gctgaccggt tcagcggcta cttcgtgccc 3000
tttatcatca tcatgagcac cctgacactg gtcgtgtgga tcgtgatcgg ctttatcgac 3060
ttcggagtgg tgcagagata cttccccaac cctaacaagc acatcagcca gacagaagtg 3120
atcatcagat tcgcctttca gaccagcatc accgtgctgt gtatcgcctg cccctgtagc 3180
ctgggactgg ccacacctac cgctgtgatg gtgggaacag gcgtggccgc tcagaacggc 3240
atcctgatca aggggggcaa gcctctggaa atggctcaca agatcaagac cgtgatgttc 3300
gacaagaccg gcaccatcac ccacggcgtg cccagagtga tgagagtgct gctgctgggg 3360
gatgtggcca ccctgcctct gagaaaggtg ctggctgtcg tgggcacagc cgaggctagc 3420
tctgaacacc cactgggagt ggccgtgaca aagtactgca aagaggaact gggcaccgaa 3480
accctgggct actgcaccga ctttcaggcc gtgcctggct gtggcatcgg ctgcaaggtg 3540
tccaacgtgg aaggcatcct ggcccacagc gagaggccac tgtctgcccc tgccagccac 3600
ctgaacgagg ccggatctct gcccgccgaa aaggacgctg tgccccagac cttctctgtg 3660
ctgattggca acagagagtg gctgcggcgg aacggcctga ccatctcctc cgatgtgtcc 3720
gacgccatga ccgaccacga gatgaagggc cagaccgcca ttctggtggc cattgacggg 3780
gtgctgtgcg gcatgatcgc aatcgccgat gccgtgaaac aggaagcagc actggccgtg 3840
cacaccctgc agtctatggg agtggatgtg gtgctgatca ccggcgacaa cagaaagacc 3900
gccagggcca ttgccaccca ggtgggcatc aacaaggtgt tcgccgaggt gctgcccagc 3960
cacaaagtgg ccaaggtgca ggaactgcag aacaaaggca aaaaggtggc catggtggga 4020
gatggcgtga acgactctcc tgctctggcc caggcagata tgggcgtggc catcggcaca 4080
ggcaccgacg tggcaattga ggctgctgac gtggtgctga ttcggaacga cctgctggac 4140
gtggtggcct ccatccacct gtccaagaga accgtgcggc ggatcagaat caacctggtg 4200
ctggcactga tctataacct cgtgggcatc cctatcgccg ctggcgtgtt catgcctatc 4260
ggaatcgtgc tgcagccctg gatgggctct gccgccatgg ctgcaagctc cgtgtctgtg 4320
gtgctgtcca gcctgcagct gaagtgctac aagaagcccg acctggaaag atacgaggcc 4380
caggcccacg gacacatgaa gcctctgaca gcctcccagg tgtccgtgca catcggcatg 4440
gacgacagat ggcgggacag ccctagagcc accccttggg atcaggtgtc atacgtgtca 4500
caggtgtccc tgagcagcct gaccagcgac aagcccagca gacatagcgc cgctgccgac 4560
gacgatgggg acaagtggtc cctgctgctg aacggccggg atgaggaaca gtacatctga 4620
taagcatgca ataaagtctg agtgggcggc agcctgtgtg tgcctgggtt ctctctgtcc 4680
cggaatgtgc aaacaatgga ggtgctcgag tagataagta gcatggcggg ttaatcatta 4740
actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4800
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4860
gcgagcgagc gcgcagcctt aattaaccta attcactggc cgtcgtttta caacgtcgtg 4920
actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca 4980
gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga 5040
atggcgaatg ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 5100
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 5160
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 5220
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 5280
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 5340
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 5400
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 5460
aacaaaaatt taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt 5520
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 5580
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 5640
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 5700
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 5760
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 5820
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 5880
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 5940
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 6000
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 6060
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 6120
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 6180
tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 6240
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 6300
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 6360
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 6420
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 6480
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 6540
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 6600
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 6660
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 6720
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 6780
aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg 6840
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 6900
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 6960
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 7020
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 7080
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 7140
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 7200
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 7260
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 7320
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 7380
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 7440
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 7500
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 7560
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 7620
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccagatttaa 7680
ttaagg 7686
<210> 32
<211> 7755
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 32
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tcactcaaag ttcaaacctt atcatttttt 240
gctttgttcc tcttggcctt ggttttgtac atcagctttg aaaataccat cccagggtta 300
atgctggggt taatttataa ctaagagtgc tctagttttg caatacagga catgctataa 360
aaatggaaag atgttgcttt ctgagagaca gcggccgcca ccatgcccga gcaggaaaga 420
cagatcaccg ccagagaggg cgccagccgg aagatcctga gcaagctgag cctgcccacc 480
agagcctggg agcccgccat gaagaagtcc ttcgccttcg acaacgtggg ctacgagggc 540
ggcctggacg gactgggacc atcttctcag gtggccacaa gcaccgtgcg caaatacgtg 600
ccctctgtcg tgtgcctgca gcaggtgtgc caccagatcg gcgacatggg cttcgaggcc 660
tctatcgccg agggaaaggc cgcctcttgg ccctctagaa gcctgcctgc tcaggaagcc 720
gtcgtgaagc tgcgggtgga agggatgacc tgtcagtcct gcgtgtccag catcgagggc 780
aaagtgcgga agctgcaggg cgtggtgcgc gtgaaagtgt ctctgagcaa ccaggaagct 840
gtgatcacct accagcccta cctgatccag cccgaggacc tgagggacca cgtgaacgat 900
atgggatttg aggccgccat caagagcaag gtggcccctc tgtctctggg ccccatcgac 960
atcgagagac tgcagagcac caaccccaag cggcctctga gcagcgccaa ccagaacttc 1020
aacaacagcg agacactggg ccaccagggc agccacgtcg tgacactgca gctgcggatc 1080
gacggaatgc actgcaagag ctgtgtgctg aacatcgagg aaaacatcgg ccagctgctg 1140
ggagtgcaga gcatccaggt gtcactggaa aacaagaccg cccaggtgaa gtacgacccc 1200
agctgcacaa gccccgtggc cctgcagaga gccattgaag ctctgccccc tggcaacttc 1260
aaagtgtccc tgcctgacgg agccgagggc tccggaacag atcacagaag cagcagcagc 1320
cacagccctg gcagcccccc tagaaatcag gtgcagggca cctgtagcac caccctgatc 1380
gccattgccg gcatgacatg cgccagctgc gtgcactcta ttgagggcat gatctcccag 1440
ctggaaggcg tgcagcagat cagtgtgtct ctggccgagg gcaccgccac agtgctgtac 1500
aaccctagcg tgatcagccc cgaagaactg agagccgcca ttgaggacat gggattcgaa 1560
gccagcgtgg tgtccgagag ctgctccacc aaccctctgg gcaatcacag cgccggcaac 1620
agcatggtgc agaccaccga cggcaccccc accagcgtgc aggaagtggc cccacataca 1680
ggcagactgc ccgccaatca cgcccccgat atcctggcca agagccccca gagtacaaga 1740
gccgtggccc cccagaagtg cttcctgcag atcaagggca tgacttgtgc ctcttgtgtg 1800
tccaatatcg agcggaacct gcagaaagag gccggcgtgc tgtctgtgct ggtggctctg 1860
atggccggca aggccgagat caaatacgac cccgaagtga ttcagcccct ggaaatcgcc 1920
cagtttatcc aggacctggg ctttgaagcc gccgtgatgg aagattacgc cggctccgac 1980
ggcaacatcg agctgaccat caccggaatg acctgcgcct cctgtgtgca caacattgag 2040
tccaagctga cccggaccaa cggcatcacc tacgcctctg tggctctggc cacctccaag 2100
gccctcgtga agttcgatcc cgagatcatc ggccccaggg acatcatcaa gatcatcgaa 2160
gagatcggct tccacgccag cctggcccag aggaacccta acgcccacca cctggaccac 2220
aagatggaaa tcaagcagtg gaagaaaagc ttcctgtgca gcctggtgtt cggcatcccc 2280
gtgatggccc tgatgatcta catgctgatc cccagcaacg agccccacca gtccatggtg 2340
ctggatcaca acatcatccc cggcctgtct atcctgaacc tgatcttctt catcctgtgc 2400
accttcgtgc agctgctggg cggctggtac ttctacgtgc aggcctacaa gtccctgcgg 2460
cacagatccg ccaacatgga cgtgctgatc gtgctggcca catctatcgc ctacgtgtac 2520
tccctcgtga tcctggtggt ggccgtggcc gagaaagccg agagaagccc tgtgaccttc 2580
ttcgacaccc cccctatgct gttcgtgttt atcgccctgg gccggtggct ggaacacctg 2640
gccaaaagca agaccagcga ggccctggct aagctgatga gtctgcaggc caccgaggcc 2700
acagtcgtga ccctgggcga ggacaacctg atcatccgcg aggaacaggt gccaatggaa 2760
ctggtgcagc ggggcgacat cgtgaaggtg gtgcctggcg gcaagttccc cgtggacgga 2820
aaagtgctgg aagggaatac catggccgac gagagcctga tcacaggcga ggccatgccc 2880
gtgaccaaga aacctggcag cacagtgatc gccggcagca tcaatgccca cggcagcgtg 2940
ctgattaagg ccacacacgt gggcaacgat accaccctgg ctcagattgt gaagctggtg 3000
gaagaggccc agatgagcaa ggcccccatt cagcagctgg ctgaccggtt cagcggctac 3060
ttcgtgccct ttatcatcat catgagcacc ctgacactgg tcgtgtggat cgtgatcggc 3120
tttatcgact tcggagtggt gcagagatac ttccccaacc ctaacaagca catcagccag 3180
acagaagtga tcatcagatt cgcctttcag accagcatca ccgtgctgtg tatcgcctgc 3240
ccctgtagcc tgggactggc cacacctacc gctgtgatgg tgggaacagg cgtggccgct 3300
cagaacggca tcctgatcaa ggggggcaag cctctggaaa tggctcacaa gatcaagacc 3360
gtgatgttcg acaagaccgg caccatcacc cacggcgtgc ccagagtgat gagagtgctg 3420
ctgctggggg atgtggccac cctgcctctg agaaaggtgc tggctgtcgt gggcacagcc 3480
gaggctagct ctgaacaccc actgggagtg gccgtgacaa agtactgcaa agaggaactg 3540
ggcaccgaaa ccctgggcta ctgcaccgac tttcaggccg tgcctggctg tggcatcggc 3600
tgcaaggtgt ccaacgtgga aggcatcctg gcccacagcg agaggccact gtctgcccct 3660
gccagccacc tgaacgaggc cggatctctg cccgccgaaa aggacgctgt gccccagacc 3720
ttctctgtgc tgattggcaa cagagagtgg ctgcggcgga acggcctgac catctcctcc 3780
gatgtgtccg acgccatgac cgaccacgag atgaagggcc agaccgccat tctggtggcc 3840
attgacgggg tgctgtgcgg catgatcgca atcgccgatg ccgtgaaaca ggaagcagca 3900
ctggccgtgc acaccctgca gtctatggga gtggatgtgg tgctgatcac cggcgacaac 3960
agaaagaccg ccagggccat tgccacccag gtgggcatca acaaggtgtt cgccgaggtg 4020
ctgcccagcc acaaagtggc caaggtgcag gaactgcaga acaaaggcaa aaaggtggcc 4080
atggtgggag atggcgtgaa cgactctcct gctctggccc aggcagatat gggcgtggcc 4140
atcggcacag gcaccgacgt ggcaattgag gctgctgacg tggtgctgat tcggaacgac 4200
ctgctggacg tggtggcctc catccacctg tccaagagaa ccgtgcggcg gatcagaatc 4260
aacctggtgc tggcactgat ctataacctc gtgggcatcc ctatcgccgc tggcgtgttc 4320
atgcctatcg gaatcgtgct gcagccctgg atgggctctg ccgccatggc tgcaagctcc 4380
gtgtctgtgg tgctgtccag cctgcagctg aagtgctaca agaagcccga cctggaaaga 4440
tacgaggccc aggcccacgg acacatgaag cctctgacag cctcccaggt gtccgtgcac 4500
atcggcatgg acgacagatg gcgggacagc cctagagcca ccccttggga tcaggtgtca 4560
tacgtgtcac aggtgtccct gagcagcctg accagcgaca agcccagcag acatagcgcc 4620
gctgccgacg acgatgggga caagtggtcc ctgctgctga acggccggga tgaggaacag 4680
tacatctgat aagcatgcaa taaagtctga gtgggcggca gcctgtgtgt gcctgggttc 4740
tctctgtccc ggaatgtgca aacaatggag gtgctcgagt agataagtag catggcgggt 4800
taatcattaa ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 4860
gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 4920
cctcagtgag cgagcgagcg cgcagcctta attaacctaa ttcactggcc gtcgttttac 4980
aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc 5040
ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 5100
gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 5160
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 5220
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 5280
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 5340
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 5400
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 5460
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 5520
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttagg 5580
tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc 5640
aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag 5700
gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg 5760
ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt 5820
gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt 5880
tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt 5940
attatcccgt attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa 6000
tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag 6060
agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac 6120
aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac 6180
tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac 6240
cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac 6300
tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact 6360
tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg 6420
tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt 6480
tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat 6540
aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta 6600
gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa 6660
tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga 6720
aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac 6780
aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt 6840
tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc 6900
gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat 6960
cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag 7020
acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc 7080
cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag 7140
cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac 7200
aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg 7260
gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct 7320
atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc 7380
tcacatgttc tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga 7440
gtgagctgat accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga 7500
agcggaagag cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg 7560
cagctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt 7620
gagttagctc actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt 7680
gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc 7740
cagatttaat taagg 7755
<210> 33
<211> 6438
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 33
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tcactcaaag ttcaaacctt atcatttttt 240
gctttgttcc tcttggcctt ggttttgtac atcagctttg aaaataccat cccagggtta 300
atgctggggt taatttataa ctaagagtgc tctagttttg caatacagga catgctataa 360
aaatggaaag atgttgcttt ctgagagaca gcggccgcca ccatgcccga gcaggaaaga 420
cagatcaccg ccagagaggg cgccagccgg aagatcctga gcaagctgag cctgcccacc 480
agagcctggg agcccgccat gaagaagtcc ttcgccttcg acaacgtggg ctacgagggc 540
ggcctggacg gactgggacc atcttctcag gtggccacaa gcaccgtgcg cctggaaatc 600
gcccagttta tccaggacct gggctttgaa gccgccgtga tggaagatta cgccggctcc 660
gacggcaaca tcgagctgac catcaccgga atgacctgcg cctcctgtgt gcacaacatt 720
gagtccaagc tgacccggac caacggcatc acctacgcct ctgtggctct ggccacctcc 780
aaggccctcg tgaagttcga tcccgagatc atcggcccca gggacatcat caagatcatc 840
gaagagatcg gcttccacgc cagcctggcc cagaggaacc ctaacgccca ccacctggac 900
cacaagatgg aaatcaagca gtggaagaaa agcttcctgt gcagcctggt gttcggcatc 960
cccgtgatgg ccctgatgat ctacatgctg atccccagca acgagcccca ccagtccatg 1020
gtgctggatc acaacatcat ccccggcctg tctatcctga acctgatctt cttcatcctg 1080
tgcaccttcg tgcagctgct gggcggctgg tacttctacg tgcaggccta caagtccctg 1140
cggcacagat ccgccaacat ggacgtgctg atcgtgctgg ccacatctat cgcctacgtg 1200
tactccctcg tgatcctggt ggtggccgtg gccgagaaag ccgagagaag ccctgtgacc 1260
ttcttcgaca ccccccctat gctgttcgtg tttatcgccc tgggccggtg gctggaacac 1320
ctggccaaaa gcaagaccag cgaggccctg gctaagctga tgagtctgca ggccaccgag 1380
gccacagtcg tgaccctggg cgaggacaac ctgatcatcc gcgaggaaca ggtgccaatg 1440
gaactggtgc agcggggcga catcgtgaag gtggtgcctg gcggcaagtt ccccgtggac 1500
ggaaaagtgc tggaagggaa taccatggcc gacgagagcc tgatcacagg cgaggccatg 1560
cccgtgacca agaaacctgg cagcacagtg atcgccggca gcatcaatgc ccacggcagc 1620
gtgctgatta aggccacaca cgtgggcaac gataccaccc tggctcagat tgtgaagctg 1680
gtggaagagg cccagatgag caaggccccc attcagcagc tggctgaccg gttcagcggc 1740
tacttcgtgc cctttatcat catcatgagc accctgacac tggtcgtgtg gatcgtgatc 1800
ggctttatcg acttcggagt ggtgcagaga tacttcccca accctaacaa gcacatcagc 1860
cagacagaag tgatcatcag attcgccttt cagaccagca tcaccgtgct gtgtatcgcc 1920
tgcccctgta gcctgggact ggccacacct accgctgtga tggtgggaac aggcgtggcc 1980
gctcagaacg gcatcctgat caaggggggc aagcctctgg aaatggctca caagatcaag 2040
accgtgatgt tcgacaagac cggcaccatc acccacggcg tgcccagagt gatgagagtg 2100
ctgctgctgg gggatgtggc caccctgcct ctgagaaagg tgctggctgt cgtgggcaca 2160
gccgaggcta gctctgaaca cccactggga gtggccgtga caaagtactg caaagaggaa 2220
ctgggcaccg aaaccctggg ctactgcacc gactttcagg ccgtgcctgg ctgtggcatc 2280
ggctgcaagg tgtccaacgt ggaaggcatc ctggcccaca gcgagaggcc actgtctgcc 2340
cctgccagcc acctgaacga ggccggatct ctgcccgccg aaaaggacgc tgtgccccag 2400
accttctctg tgctgattgg caacagagag tggctgcggc ggaacggcct gaccatctcc 2460
tccgatgtgt ccgacgccat gaccgaccac gagatgaagg gccagaccgc cattctggtg 2520
gccattgacg gggtgctgtg cggcatgatc gcaatcgccg atgccgtgaa acaggaagca 2580
gcactggccg tgcacaccct gcagtctatg ggagtggatg tggtgctgat caccggcgac 2640
aacagaaaga ccgccagggc cattgccacc caggtgggca tcaacaaggt gttcgccgag 2700
gtgctgccca gccacaaagt ggccaaggtg caggaactgc agaacaaagg caaaaaggtg 2760
gccatggtgg gagatggcgt gaacgactct cctgctctgg cccaggcaga tatgggcgtg 2820
gccatcggca caggcaccga cgtggcaatt gaggctgctg acgtggtgct gattcggaac 2880
gacctgctgg acgtggtggc ctccatccac ctgtccaaga gaaccgtgcg gcggatcaga 2940
atcaacctgg tgctggcact gatctataac ctcgtgggca tccctatcgc cgctggcgtg 3000
ttcatgccta tcggaatcgt gctgcagccc tggatgggct ctgccgccat ggctgcaagc 3060
tccgtgtctg tggtgctgtc cagcctgcag ctgaagtgct acaagaagcc cgacctggaa 3120
agatacgagg cccaggccca cggacacatg aagcctctga cagcctccca ggtgtccgtg 3180
cacatcggca tggacgacag atggcgggac agccctagag ccaccccttg ggatcaggtg 3240
tcatacgtgt cacaggtgtc cctgagcagc ctgaccagcg acaagcccag cagacatagc 3300
gccgctgccg acgacgatgg ggacaagtgg tccctgctgc tgaacggccg ggatgaggaa 3360
cagtacatct gataagcatg caataaagtc tgagtgggcg gcagcctgtg tgtgcctggg 3420
ttctctctgt cccggaatgt gcaaacaatg gaggtgctcg agtagataag tagcatggcg 3480
ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3540
ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3600
cggcctcagt gagcgagcga gcgcgcagcc ttaattaacc taattcactg gccgtcgttt 3660
tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 3720
cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt 3780
tgcgcagcct gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg 3840
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 3900
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 3960
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 4020
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 4080
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 4140
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 4200
atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt 4260
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4320
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4380
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 4440
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 4500
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 4560
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 4620
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 4680
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 4740
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 4800
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 4860
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 4920
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 4980
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 5040
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 5100
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 5160
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 5220
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 5280
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 5340
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 5400
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 5460
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 5520
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 5580
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 5640
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 5700
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 5760
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 5820
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 5880
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 5940
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 6000
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 6060
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 6120
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 6180
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 6240
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 6300
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 6360
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 6420
cgccagattt aattaagg 6438
<210> 34
<211> 6831
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 34
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tcactcaaag ttcaaacctt atcatttttt 240
gctttgttcc tcttggcctt ggttttgtac atcagctttg aaaataccat cccagggtta 300
atgctggggt taatttataa ctaagagtgc tctagttttg caatacagga catgctataa 360
aaatggaaag atgttgcttt ctgagagaca gcggccgcca ccatgcccga gcaggaaaga 420
cagatcaccg ccagagaggg cgccagccgg aagatcctga gcaagctgag cctgcccacc 480
agagcctggg agcccgccat gaagaagtcc ttcgccttcg acaacgtggg ctacgagggc 540
ggcctggacg gactgggacc atcttctcag gtggccacaa gcaccgtgcg cagccccgaa 600
gaactgagag ccgccattga ggacatggga ttcgaagcca gcgtggtgtc cgagagctgc 660
tccaccaacc ctctgggcaa tcacagcgcc ggcaacagca tggtgcagac caccgacggc 720
acccccacca gcgtgcagga agtggcccca catacaggca gactgcccgc caatcacgcc 780
cccgatatcc tggccaagag cccccagagt acaagagccg tggcccccca gaagtgcttc 840
ctgcagatca agggcatgac ttgtgcctct tgtgtgtcca atatcgagcg gaacctgcag 900
aaagaggccg gcgtgctgtc tgtgctggtg gctctgatgg ccggcaaggc cgagatcaaa 960
tacgaccccg aagtgattca gcccctggaa atcgcccagt ttatccagga cctgggcttt 1020
gaagccgccg tgatggaaga ttacgccggc tccgacggca acatcgagct gaccatcacc 1080
ggaatgacct gcgcctcctg tgtgcacaac attgagtcca agctgacccg gaccaacggc 1140
atcacctacg cctctgtggc tctggccacc tccaaggccc tcgtgaagtt cgatcccgag 1200
atcatcggcc ccagggacat catcaagatc atcgaagaga tcggcttcca cgccagcctg 1260
gcccagagga accctaacgc ccaccacctg gaccacaaga tggaaatcaa gcagtggaag 1320
aaaagcttcc tgtgcagcct ggtgttcggc atccccgtga tggccctgat gatctacatg 1380
ctgatcccca gcaacgagcc ccaccagtcc atggtgctgg atcacaacat catccccggc 1440
ctgtctatcc tgaacctgat cttcttcatc ctgtgcacct tcgtgcagct gctgggcggc 1500
tggtacttct acgtgcaggc ctacaagtcc ctgcggcaca gatccgccaa catggacgtg 1560
ctgatcgtgc tggccacatc tatcgcctac gtgtactccc tcgtgatcct ggtggtggcc 1620
gtggccgaga aagccgagag aagccctgtg accttcttcg acaccccccc tatgctgttc 1680
gtgtttatcg ccctgggccg gtggctggaa cacctggcca aaagcaagac cagcgaggcc 1740
ctggctaagc tgatgagtct gcaggccacc gaggccacag tcgtgaccct gggcgaggac 1800
aacctgatca tccgcgagga acaggtgcca atggaactgg tgcagcgggg cgacatcgtg 1860
aaggtggtgc ctggcggcaa gttccccgtg gacggaaaag tgctggaagg gaataccatg 1920
gccgacgaga gcctgatcac aggcgaggcc atgcccgtga ccaagaaacc tggcagcaca 1980
gtgatcgccg gcagcatcaa tgcccacggc agcgtgctga ttaaggccac acacgtgggc 2040
aacgatacca ccctggctca gattgtgaag ctggtggaag aggcccagat gagcaaggcc 2100
cccattcagc agctggctga ccggttcagc ggctacttcg tgccctttat catcatcatg 2160
agcaccctga cactggtcgt gtggatcgtg atcggcttta tcgacttcgg agtggtgcag 2220
agatacttcc ccaaccctaa caagcacatc agccagacag aagtgatcat cagattcgcc 2280
tttcagacca gcatcaccgt gctgtgtatc gcctgcccct gtagcctggg actggccaca 2340
cctaccgctg tgatggtggg aacaggcgtg gccgctcaga acggcatcct gatcaagggg 2400
ggcaagcctc tggaaatggc tcacaagatc aagaccgtga tgttcgacaa gaccggcacc 2460
atcacccacg gcgtgcccag agtgatgaga gtgctgctgc tgggggatgt ggccaccctg 2520
cctctgagaa aggtgctggc tgtcgtgggc acagccgagg ctagctctga acacccactg 2580
ggagtggccg tgacaaagta ctgcaaagag gaactgggca ccgaaaccct gggctactgc 2640
accgactttc aggccgtgcc tggctgtggc atcggctgca aggtgtccaa cgtggaaggc 2700
atcctggccc acagcgagag gccactgtct gcccctgcca gccacctgaa cgaggccgga 2760
tctctgcccg ccgaaaagga cgctgtgccc cagaccttct ctgtgctgat tggcaacaga 2820
gagtggctgc ggcggaacgg cctgaccatc tcctccgatg tgtccgacgc catgaccgac 2880
cacgagatga agggccagac cgccattctg gtggccattg acggggtgct gtgcggcatg 2940
atcgcaatcg ccgatgccgt gaaacaggaa gcagcactgg ccgtgcacac cctgcagtct 3000
atgggagtgg atgtggtgct gatcaccggc gacaacagaa agaccgccag ggccattgcc 3060
acccaggtgg gcatcaacaa ggtgttcgcc gaggtgctgc ccagccacaa agtggccaag 3120
gtgcaggaac tgcagaacaa aggcaaaaag gtggccatgg tgggagatgg cgtgaacgac 3180
tctcctgctc tggcccaggc agatatgggc gtggccatcg gcacaggcac cgacgtggca 3240
attgaggctg ctgacgtggt gctgattcgg aacgacctgc tggacgtggt ggcctccatc 3300
cacctgtcca agagaaccgt gcggcggatc agaatcaacc tggtgctggc actgatctat 3360
aacctcgtgg gcatccctat cgccgctggc gtgttcatgc ctatcggaat cgtgctgcag 3420
ccctggatgg gctctgccgc catggctgca agctccgtgt ctgtggtgct gtccagcctg 3480
cagctgaagt gctacaagaa gcccgacctg gaaagatacg aggcccaggc ccacggacac 3540
atgaagcctc tgacagcctc ccaggtgtcc gtgcacatcg gcatggacga cagatggcgg 3600
gacagcccta gagccacccc ttgggatcag gtgtcatacg tgtcacaggt gtccctgagc 3660
agcctgacca gcgacaagcc cagcagacat agcgccgctg ccgacgacga tggggacaag 3720
tggtccctgc tgctgaacgg ccgggatgag gaacagtaca tctgataagc atgcaataaa 3780
gtctgagtgg gcggcagcct gtgtgtgcct gggttctctc tgtcccggaa tgtgcaaaca 3840
atggaggtgc tcgagtagat aagtagcatg gcgggttaat cattaactac aaggaacccc 3900
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3960
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 4020
gccttaatta acctaattca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg 4080
gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg 4140
aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatgggacg 4200
cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 4260
cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 4320
tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 4380
ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 4440
cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 4500
tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 4560
ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 4620
cgaattttaa caaaatatta acgcttacaa tttaggtggc acttttcggg gaaatgtgcg 4680
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4740
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4800
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4860
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4920
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4980
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 5040
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 5100
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 5160
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 5220
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 5280
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 5340
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 5400
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 5460
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5520
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5580
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5640
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5700
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5760
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5820
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5880
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5940
agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 6000
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 6060
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 6120
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 6180
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 6240
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 6300
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 6360
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 6420
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc 6480
ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag 6540
ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa 6600
accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga 6660
ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc 6720
ccaggcttta cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca 6780
atttcacaca ggaaacagct atgaccatga ttacgccaga tttaattaag g 6831
<210> 35
<211> 7437
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 35
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctactta agtgtttgct 180
gcttgcaatg tttgcccatt ttaggggaat tcactcaaag ttcaaacctt atcatttttt 240
gctttgttcc tcttggcctt ggttttgtac atcagctttg aaaataccat cccagggtta 300
atgctggggt taatttataa ctaagagtgc tctagttttg caatacagga catgctataa 360
aaatggaaag atgttgcttt ctgagagaca gcggccgcca ccatgcccga gcaggaaaga 420
cagatcaccg ccagagaggg cgccagccgg aagatcctga gcaagctgag cctgcccacc 480
agagcctggg agcccgccat gaagaagtcc ttcgccttcg acaacgtggg ctacgagggc 540
ggcctggacg gactgggacc atcttctcag gtggccacaa gcaccgtgcg cgaggccgcc 600
atcaagagca aggtggcccc tctgtctctg ggccccatcg acatcgagag actgcagagc 660
accaacccca agcggcctct gagcagcgcc aaccagaact tcaacaacag cgagacactg 720
ggccaccagg gcagccacgt cgtgacactg cagctgcgga tcgacggaat gcactgcaag 780
agctgtgtgc tgaacatcga ggaaaacatc ggccagctgc tgggagtgca gagcatccag 840
gtgtcactgg aaaacaagac cgcccaggtg aagtacgacc ccagctgcac aagccccgtg 900
gccctgcaga gagccattga agctctgccc cctggcaact tcaaagtgtc cctgcctgac 960
ggagccgagg gctccggaac agatcacaga agcagcagca gccacagccc tggcagcccc 1020
cctagaaatc aggtgcaggg cacctgtagc accaccctga tcgccattgc cggcatgaca 1080
tgcgccagct gcgtgcactc tattgagggc atgatctccc agctggaagg cgtgcagcag 1140
atcagtgtgt ctctggccga gggcaccgcc acagtgctgt acaaccctag cgtgatcagc 1200
cccgaagaac tgagagccgc cattgaggac atgggattcg aagccagcgt ggtgtccgag 1260
agctgctcca ccaaccctct gggcaatcac agcgccggca acagcatggt gcagaccacc 1320
gacggcaccc ccaccagcgt gcaggaagtg gccccacata caggcagact gcccgccaat 1380
cacgcccccg atatcctggc caagagcccc cagagtacaa gagccgtggc cccccagaag 1440
tgcttcctgc agatcaaggg catgacttgt gcctcttgtg tgtccaatat cgagcggaac 1500
ctgcagaaag aggccggcgt gctgtctgtg ctggtggctc tgatggccgg caaggccgag 1560
atcaaatacg accccgaagt gattcagccc ctggaaatcg cccagtttat ccaggacctg 1620
ggctttgaag ccgccgtgat ggaagattac gccggctccg acggcaacat cgagctgacc 1680
atcaccggaa tgacctgcgc ctcctgtgtg cacaacattg agtccaagct gacccggacc 1740
aacggcatca cctacgcctc tgtggctctg gccacctcca aggccctcgt gaagttcgat 1800
cccgagatca tcggccccag ggacatcatc aagatcatcg aagagatcgg cttccacgcc 1860
agcctggccc agaggaaccc taacgcccac cacctggacc acaagatgga aatcaagcag 1920
tggaagaaaa gcttcctgtg cagcctggtg ttcggcatcc ccgtgatggc cctgatgatc 1980
tacatgctga tccccagcaa cgagccccac cagtccatgg tgctggatca caacatcatc 2040
cccggcctgt ctatcctgaa cctgatcttc ttcatcctgt gcaccttcgt gcagctgctg 2100
ggcggctggt acttctacgt gcaggcctac aagtccctgc ggcacagatc cgccaacatg 2160
gacgtgctga tcgtgctggc cacatctatc gcctacgtgt actccctcgt gatcctggtg 2220
gtggccgtgg ccgagaaagc cgagagaagc cctgtgacct tcttcgacac cccccctatg 2280
ctgttcgtgt ttatcgccct gggccggtgg ctggaacacc tggccaaaag caagaccagc 2340
gaggccctgg ctaagctgat gagtctgcag gccaccgagg ccacagtcgt gaccctgggc 2400
gaggacaacc tgatcatccg cgaggaacag gtgccaatgg aactggtgca gcggggcgac 2460
atcgtgaagg tggtgcctgg cggcaagttc cccgtggacg gaaaagtgct ggaagggaat 2520
accatggccg acgagagcct gatcacaggc gaggccatgc ccgtgaccaa gaaacctggc 2580
agcacagtga tcgccggcag catcaatgcc cacggcagcg tgctgattaa ggccacacac 2640
gtgggcaacg ataccaccct ggctcagatt gtgaagctgg tggaagaggc ccagatgagc 2700
aaggccccca ttcagcagct ggctgaccgg ttcagcggct acttcgtgcc ctttatcatc 2760
atcatgagca ccctgacact ggtcgtgtgg atcgtgatcg gctttatcga cttcggagtg 2820
gtgcagagat acttccccaa ccctaacaag cacatcagcc agacagaagt gatcatcaga 2880
ttcgcctttc agaccagcat caccgtgctg tgtatcgcct gcccctgtag cctgggactg 2940
gccacaccta ccgctgtgat ggtgggaaca ggcgtggccg ctcagaacgg catcctgatc 3000
aaggggggca agcctctgga aatggctcac aagatcaaga ccgtgatgtt cgacaagacc 3060
ggcaccatca cccacggcgt gcccagagtg atgagagtgc tgctgctggg ggatgtggcc 3120
accctgcctc tgagaaaggt gctggctgtc gtgggcacag ccgaggctag ctctgaacac 3180
ccactgggag tggccgtgac aaagtactgc aaagaggaac tgggcaccga aaccctgggc 3240
tactgcaccg actttcaggc cgtgcctggc tgtggcatcg gctgcaaggt gtccaacgtg 3300
gaaggcatcc tggcccacag cgagaggcca ctgtctgccc ctgccagcca cctgaacgag 3360
gccggatctc tgcccgccga aaaggacgct gtgccccaga ccttctctgt gctgattggc 3420
aacagagagt ggctgcggcg gaacggcctg accatctcct ccgatgtgtc cgacgccatg 3480
accgaccacg agatgaaggg ccagaccgcc attctggtgg ccattgacgg ggtgctgtgc 3540
ggcatgatcg caatcgccga tgccgtgaaa caggaagcag cactggccgt gcacaccctg 3600
cagtctatgg gagtggatgt ggtgctgatc accggcgaca acagaaagac cgccagggcc 3660
attgccaccc aggtgggcat caacaaggtg ttcgccgagg tgctgcccag ccacaaagtg 3720
gccaaggtgc aggaactgca gaacaaaggc aaaaaggtgg ccatggtggg agatggcgtg 3780
aacgactctc ctgctctggc ccaggcagat atgggcgtgg ccatcggcac aggcaccgac 3840
gtggcaattg aggctgctga cgtggtgctg attcggaacg acctgctgga cgtggtggcc 3900
tccatccacc tgtccaagag aaccgtgcgg cggatcagaa tcaacctggt gctggcactg 3960
atctataacc tcgtgggcat ccctatcgcc gctggcgtgt tcatgcctat cggaatcgtg 4020
ctgcagccct ggatgggctc tgccgccatg gctgcaagct ccgtgtctgt ggtgctgtcc 4080
agcctgcagc tgaagtgcta caagaagccc gacctggaaa gatacgaggc ccaggcccac 4140
ggacacatga agcctctgac agcctcccag gtgtccgtgc acatcggcat ggacgacaga 4200
tggcgggaca gccctagagc caccccttgg gatcaggtgt catacgtgtc acaggtgtcc 4260
ctgagcagcc tgaccagcga caagcccagc agacatagcg ccgctgccga cgacgatggg 4320
gacaagtggt ccctgctgct gaacggccgg gatgaggaac agtacatctg ataagcatgc 4380
aataaagtct gagtgggcgg cagcctgtgt gtgcctgggt tctctctgtc ccggaatgtg 4440
caaacaatgg aggtgctcga gtagataagt agcatggcgg gttaatcatt aactacaagg 4500
aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 4560
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 4620
cgcgcagcct taattaacct aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa 4680
accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta 4740
atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat 4800
gggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 4860
ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg 4920
ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 4980
ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 5040
ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 5100
gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 5160
tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 5220
ttaacgcgaa ttttaacaaa atattaacgc ttacaattta ggtggcactt ttcggggaaa 5280
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 5340
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 5400
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 5460
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 5520
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 5580
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc 5640
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 5700
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 5760
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 5820
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 5880
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 5940
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 6000
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 6060
ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 6120
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 6180
tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 6240
gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 6300
tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 6360
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 6420
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 6480
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 6540
cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt 6600
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 6660
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 6720
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 6780
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 6840
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 6900
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 6960
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 7020
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 7080
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 7140
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat 7200
acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt 7260
tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta 7320
ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg 7380
ataacaattt cacacaggaa acagctatga ccatgattac gccagattta attaagg 7437
Claims (24)
- 윌슨병(Wilson's Disease: WD)에 대한 간 지향된 치료제로서 유용한 재조합 아데노 연관된 바이러스(recombinant adeno-associated virus: rAAV)로서, 상기 rAAV는 AAV 캡시드 및 내부에 패키징된 벡터 게놈을 포함하고, 상기 벡터 게놈은
(a) AAV 5' 역위 말단 반복(inverted terminal repeat: ITR) 서열;
(b) 촉진자;
(c) 인간 구리 수송 ATPase 2(ATP7B)를 암호화하는 암호화 서열;
(d) AAV 3' ITR을 포함하는, rAAV. - 제1항에 있어서, 상기 (c)의 암호화 서열은 서열 번호 1인, rAAV.
- 제1항 또는 제2항에 있어서, 상기 rAAV 캡시드는 AAV8 캡시드 또는 이의 변이체인, rAAV.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 촉진자는 TBG 촉진자 또는 TBG-S1 촉진자인, rAAV.
- (내용 무)
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 촉진자는 TTR 촉진자인, rAAV.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 촉진자는 변형된 TTR 촉진자인, rAAV.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 AAV 5' ITR 및/또는 AAV 3' ITR은 AAV2 유래인, rAAV.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 벡터 게놈은 polyA를 추가로 포함하는, rAAV.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 polyA는 약 75개의 aa 길이인, rAAV.
- 제1항 내지 제10항 중 어느 한 항에 있어서, WPRE를 추가로 포함하는, rAAV.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 인트론을 추가로 포함하는, rAAV.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 인트론은 인간 베타 글로빈 IVS2 또는 SV40 유래인, rAAV.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 인핸서를 추가로 포함하는, rAAV.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 인핸서는 APB 인핸서, ABPS 인핸서, 알파 mic/bik 인핸서, TTR 인핸서, en34 또는 ApoE 인핸서인, rAAV.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 벡터 게놈은 약 3 킬로염기 내지 약 5.5 킬로염기 크기인, rAAV.
- 윌슨병 환자에 대한 투여에 적합한 수성 현탁액으로서, 상기 현탁액은 수성 현탁 액체 및 윌슨병에 대한 간 지향된 치료제로서 유용한 약 1x1012 GC/㎖ 내지 약 1x1014 GC/㎖의 재조합 아데노 연관된 바이러스(rAAV)를 포함하고, 상기 rAAV는 AAV 캡시드를 갖고, 그리고
(a) AAV 5' 역위 말단 반복(ITR) 서열;
(b) 촉진자;
(c) 인간 구리 수송 ATPase 2(ATP7B)를 암호화하는 암호화 서열; 및
(d) AAV 3' ITR
을 포함하는 벡터 게놈이 내부에 패키징된, 현탁액. - 제17항에 있어서, 상기 현탁액은 정맥내 주사에 적합한, 현탁액.
- 제17항 또는 제18항에 있어서, 상기 현탁액은 상기 수성 현탁 액체 중에 용해된 계면활성제, 보존제, 및/또는 완충제를 추가로 포함하는, 현탁액.
- 제1항에 따른 rAAV에 의해 윌슨병을 갖는 환자를 치료하는 방법으로서, 상기 rAAV는 수성 현탁액 중에 약 1x1012 내지 약 1x1014 게놈 카피(GC)/㎏ 전달되고, 상기 GC는 oqPCR 또는 ddPCR에 기초하여 결정된 바대로 계산되는, 윌슨병을 갖는 환자를 치료하는 방법.
- 제1항에 있어서, 상기 벡터 게놈은 서열 번호 23, 서열 번호 24, 서열 번호 25, 서열 번호 26 또는 서열 번호 27을 포함하는, rAAV.
- 제17항에 있어서, 상기 rAAV 캡시드는 AAV8 캡시드인, 현탁액.
- 제1항에 있어서, En34.TBG-S1 인핸서/촉진자를 포함하는, rAAV.
- 윌슨병의 치료를 필요로 하는 대상체에서 윌슨병을 치료하는 데 사용하기 위한, 제1항 내지 제16항 중 어느 한 항에 따른 rAAV의 용도.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662440659P | 2016-12-30 | 2016-12-30 | |
US62/440,659 | 2016-12-30 | ||
US201762473656P | 2017-03-20 | 2017-03-20 | |
US62/473,656 | 2017-03-20 | ||
PCT/US2017/068919 WO2018126116A1 (en) | 2016-12-30 | 2017-12-29 | Gene therapy for treating wilson's disease |
KR1020197021756A KR102604096B1 (ko) | 2016-12-30 | 2017-12-29 | 윌슨병을 치료하기 위한 유전자 치료 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197021756A Division KR102604096B1 (ko) | 2016-12-30 | 2017-12-29 | 윌슨병을 치료하기 위한 유전자 치료 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230160411A true KR20230160411A (ko) | 2023-11-23 |
Family
ID=62710046
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237039367A KR20230160411A (ko) | 2016-12-30 | 2017-12-29 | 윌슨병을 치료하기 위한 유전자 치료 |
KR1020197021756A KR102604096B1 (ko) | 2016-12-30 | 2017-12-29 | 윌슨병을 치료하기 위한 유전자 치료 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197021756A KR102604096B1 (ko) | 2016-12-30 | 2017-12-29 | 윌슨병을 치료하기 위한 유전자 치료 |
Country Status (9)
Country | Link |
---|---|
US (2) | US11473106B2 (ko) |
EP (2) | EP3562514A4 (ko) |
JP (1) | JP7128190B2 (ko) |
KR (2) | KR20230160411A (ko) |
CN (1) | CN110290814A (ko) |
BR (1) | BR112019013245A2 (ko) |
CA (1) | CA3048044A1 (ko) |
MX (1) | MX2019007873A (ko) |
WO (1) | WO2018126116A1 (ko) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10610606B2 (en) | 2018-02-01 | 2020-04-07 | Homology Medicines, Inc. | Adeno-associated virus compositions for PAH gene transfer and methods of use thereof |
US11306329B2 (en) | 2018-02-19 | 2022-04-19 | City Of Hope | Adeno-associated virus compositions for restoring F8 gene function and methods of use thereof |
TW202039854A (zh) * | 2018-11-16 | 2020-11-01 | 美商編碼製藥公司 | 治療威爾遜氏病的組合物和方法 |
ES2970216T3 (es) * | 2019-01-04 | 2024-05-27 | Ultragenyx Pharmaceutical Inc | Constructos de terapia génica para tratar la enfermedad de Wilson |
CN111088285B (zh) * | 2019-08-15 | 2021-12-28 | 北京锦篮基因科技有限公司 | 携带atp7b基因表达框及变异体的aav载体及应用 |
TW202140791A (zh) | 2020-01-13 | 2021-11-01 | 美商霍蒙拉奇醫藥公司 | 治療苯酮尿症之方法 |
WO2022165313A1 (en) | 2021-02-01 | 2022-08-04 | Regenxbio Inc. | Gene therapy for neuronal ceroid lipofuscinoses |
WO2022208342A1 (en) * | 2021-04-01 | 2022-10-06 | Pfizer Inc. | Pharmaceutical compositions containing adeno-associated viral vector |
CN115216481A (zh) * | 2021-04-21 | 2022-10-21 | 四川至善唯新生物科技有限公司 | 一种表达量提高的截短型atp7b基因及其应用 |
WO2023230466A1 (en) * | 2022-05-23 | 2023-11-30 | Lutsenka Svetlana | Compositions and methods for treating wilson's disease |
CN115216533A (zh) * | 2022-06-30 | 2022-10-21 | 湖南家辉生物技术有限公司 | 一种用于诊断威尔逊病的生物标志物、扩增引物组、检测试剂及应用 |
CN117947035A (zh) * | 2024-03-25 | 2024-04-30 | 上海凌医生物科技有限公司 | 一种增强基因表达的启动子 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK1453547T3 (en) | 2001-12-17 | 2016-12-05 | Univ Pennsylvania | ADENOASSOCATED VIRUS (AAV) SEROTYPE 8 SEQUENCES, VECTORS CONTAINING THESE AND APPLICATIONS THEREOF |
WO2005013090A2 (en) | 2003-08-01 | 2005-02-10 | Dna Twopointo Inc. | Systems and methods for biopolymer engineering |
US8005620B2 (en) | 2003-08-01 | 2011-08-23 | Dna Twopointo Inc. | Systems and methods for biopolymer engineering |
AU2004278684B2 (en) | 2003-09-30 | 2011-05-12 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses therefor |
US9315825B2 (en) | 2010-03-29 | 2016-04-19 | The Trustees Of The University Of Pennsylvania | Pharmacologically induced transgene ablation system |
CN102869779A (zh) | 2010-03-29 | 2013-01-09 | 宾夕法尼亚大学托管会 | 药理学诱导的转基因消融系统 |
US20150045284A1 (en) | 2011-01-21 | 2015-02-12 | Aarhus Universitet | CRYSTAL STRUCTURE OF A TYPE IB P-TYPE ATPase |
FR2977562B1 (fr) | 2011-07-06 | 2016-12-23 | Gaztransport Et Technigaz | Cuve etanche et thermiquement isolante integree dans une structure porteuse |
AU2013243946A1 (en) * | 2012-04-02 | 2014-10-30 | Moderna Therapeutics, Inc. | Modified polynucleotides for the production of membrane proteins |
WO2015012924A2 (en) | 2013-04-29 | 2015-01-29 | The Trustees Of The University Of Pennsylvania | Tissue preferential codon modified expression cassettes, vectors containing same, and use thereof |
WO2016097218A1 (en) | 2014-12-17 | 2016-06-23 | Fundación Para La Investigación Mèdica Aplicada | Nucleic acid constructs and gene therapy vectors for use in the treatment of wilson's disease and other conditions |
JP6865167B2 (ja) | 2014-12-17 | 2021-04-28 | フンダシオン パラ ラ インベスティガシオン メディカ アプリカダ | ウィルソン病の処置に使用するための核酸構築物及び遺伝子治療ベクター |
ES2934848T3 (es) | 2015-12-11 | 2023-02-27 | Univ Pennsylvania | Método de purificación escalable para AAV8 |
TW202039854A (zh) * | 2018-11-16 | 2020-11-01 | 美商編碼製藥公司 | 治療威爾遜氏病的組合物和方法 |
ES2970216T3 (es) | 2019-01-04 | 2024-05-27 | Ultragenyx Pharmaceutical Inc | Constructos de terapia génica para tratar la enfermedad de Wilson |
-
2017
- 2017-12-29 KR KR1020237039367A patent/KR20230160411A/ko active Search and Examination
- 2017-12-29 EP EP17888104.1A patent/EP3562514A4/en active Pending
- 2017-12-29 WO PCT/US2017/068919 patent/WO2018126116A1/en unknown
- 2017-12-29 MX MX2019007873A patent/MX2019007873A/es unknown
- 2017-12-29 EP EP24161028.6A patent/EP4361277A2/en active Pending
- 2017-12-29 KR KR1020197021756A patent/KR102604096B1/ko active Application Filing
- 2017-12-29 BR BR112019013245-7A patent/BR112019013245A2/pt unknown
- 2017-12-29 CN CN201780085376.9A patent/CN110290814A/zh active Pending
- 2017-12-29 US US16/474,958 patent/US11473106B2/en active Active
- 2017-12-29 JP JP2019535891A patent/JP7128190B2/ja active Active
- 2017-12-29 CA CA3048044A patent/CA3048044A1/en active Pending
-
2022
- 2022-07-13 US US17/812,322 patent/US20220389455A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN110290814A (zh) | 2019-09-27 |
EP4361277A2 (en) | 2024-05-01 |
WO2018126116A1 (en) | 2018-07-05 |
JP7128190B2 (ja) | 2022-08-30 |
US11473106B2 (en) | 2022-10-18 |
MX2019007873A (es) | 2019-11-18 |
US20190338310A1 (en) | 2019-11-07 |
EP3562514A4 (en) | 2020-08-05 |
US20220389455A1 (en) | 2022-12-08 |
KR20190101410A (ko) | 2019-08-30 |
EP3562514A1 (en) | 2019-11-06 |
CA3048044A1 (en) | 2018-07-05 |
JP2020514286A (ja) | 2020-05-21 |
KR102604096B1 (ko) | 2023-11-23 |
BR112019013245A2 (pt) | 2020-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102604096B1 (ko) | 윌슨병을 치료하기 위한 유전자 치료 | |
KR102451510B1 (ko) | Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법 | |
CN108753824B (zh) | 用于治疗视网膜营养不良的病毒载体 | |
KR20200032174A (ko) | 강화된 키메라 항원 수용체 및 이의 용도 | |
KR20180097631A (ko) | 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법 | |
KR20170108946A (ko) | Fc 수용체-유사 5를 표적화하는 키메라 항원 수용체 및 그의 용도 | |
JP2023036921A (ja) | 蝸牛および前庭細胞に核酸を送達するための物質および方法 | |
DK2768848T3 (en) | METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS | |
CN107580503B (zh) | 用于治疗细菌感染的杀菌剂与亲溶酶体碱化剂的组合 | |
KR102628872B1 (ko) | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 | |
SK264192A3 (en) | Direct molecular cloning of modificated gen of eucaryotic cytoplasmic dna-virus | |
CN112041334A (zh) | 人foxp3在经基因编辑的t细胞中的表达 | |
CN112912112A (zh) | 肝特异性核酸调节元件以及其方法及用途 | |
CN116083398B (zh) | 分离的Cas13蛋白及其应用 | |
KR102409420B1 (ko) | 형질전환 생물체 선별용 마커 조성물, 형질전환 생물체 및 형질전환 방법 | |
KR20230069157A (ko) | GJB2를 코딩하는 재조합 아데노 연관 바이러스 (rAAV) 및 그의 용도 | |
CN115298307A (zh) | 核酸调节元件的新组合及其方法和用途 | |
CN114990157B (zh) | 用于构建lmna基因突变的扩张型心肌病模型猪核移植供体细胞的基因编辑系统及其应用 | |
KR20240032025A (ko) | 내이의 세포 유형-특이적 유전자 발현을 위한 조성물 및 방법 | |
KR20220142502A (ko) | 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도 | |
CN110831614A (zh) | 用于递送Na/K ATP酶/Src受体复合物拮抗剂的表达载体和相关方法 | |
CN114958758B (zh) | 一种乳腺癌模型猪的构建方法及应用 | |
RU2781083C2 (ru) | Варианты, композиции и методы применения хоминг-эндонуклеазы pd-1 | |
RU2779747C2 (ru) | Химерные антигенные рецепторы, нацеленные на подобный fc-рецептору белок 5, и их применение | |
KR20220037964A (ko) | 재조합 발생이 최소화된 유전자치료 벡터, 상기 벡터를 포함하는 재조합 레트로바이러스 및 상기 재조합 레트로바이러스를 포함하는 암의 예방 또는 치료용 약학 조성물 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination |