KR102484553B1 - A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터 - Google Patents
A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터 Download PDFInfo
- Publication number
- KR102484553B1 KR102484553B1 KR1020187015189A KR20187015189A KR102484553B1 KR 102484553 B1 KR102484553 B1 KR 102484553B1 KR 1020187015189 A KR1020187015189 A KR 1020187015189A KR 20187015189 A KR20187015189 A KR 20187015189A KR 102484553 B1 KR102484553 B1 KR 102484553B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- factor viii
- polynucleotide
- sequence
- nucleotide sequence
- Prior art date
Links
- 208000009292 Hemophilia A Diseases 0.000 title claims abstract description 43
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 title claims abstract description 39
- 102100026735 Coagulation factor VIII Human genes 0.000 title claims abstract description 28
- 201000003542 Factor VIII deficiency Diseases 0.000 title claims abstract description 23
- 230000014509 gene expression Effects 0.000 title abstract description 67
- 238000001415 gene therapy Methods 0.000 title abstract description 54
- 230000001965 increasing effect Effects 0.000 title description 29
- 239000013603 viral vector Substances 0.000 title description 7
- 102000001690 Factor VIII Human genes 0.000 claims abstract description 684
- 108010054218 Factor VIII Proteins 0.000 claims abstract description 684
- 229960000301 factor viii Drugs 0.000 claims abstract description 684
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 396
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 396
- 239000002157 polynucleotide Substances 0.000 claims abstract description 396
- 239000013598 vector Substances 0.000 claims abstract description 123
- 238000000034 method Methods 0.000 claims abstract description 41
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 403
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 378
- 229920001184 polypeptide Polymers 0.000 claims description 342
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 308
- 125000003729 nucleotide group Chemical group 0.000 claims description 296
- 239000002773 nucleotide Substances 0.000 claims description 293
- 238000006467 substitution reaction Methods 0.000 claims description 209
- 238000003776 cleavage reaction Methods 0.000 claims description 24
- 230000007017 scission Effects 0.000 claims description 24
- 241000702421 Dependoparvovirus Species 0.000 claims description 23
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 claims description 18
- 238000000338 in vitro Methods 0.000 claims description 10
- 210000004185 liver Anatomy 0.000 claims description 9
- 230000010076 replication Effects 0.000 claims description 5
- 239000002245 particle Substances 0.000 claims 15
- 239000008194 pharmaceutical composition Substances 0.000 claims 3
- 230000002463 transducing effect Effects 0.000 claims 3
- 238000011144 upstream manufacturing Methods 0.000 claims 3
- 210000004962 mammalian cell Anatomy 0.000 abstract description 5
- 235000001014 amino acid Nutrition 0.000 description 321
- 150000001413 amino acids Chemical class 0.000 description 128
- 230000035772 mutation Effects 0.000 description 68
- 108091028043 Nucleic acid sequence Proteins 0.000 description 58
- 108090000623 proteins and genes Proteins 0.000 description 56
- 108020004705 Codon Proteins 0.000 description 47
- 230000000694 effects Effects 0.000 description 39
- 241000282414 Homo sapiens Species 0.000 description 37
- 102000004169 proteins and genes Human genes 0.000 description 37
- 108091026890 Coding region Proteins 0.000 description 34
- 238000001727 in vivo Methods 0.000 description 34
- 235000018102 proteins Nutrition 0.000 description 34
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 33
- 239000013607 AAV vector Substances 0.000 description 29
- 150000007523 nucleic acids Chemical class 0.000 description 29
- 238000004422 calculation algorithm Methods 0.000 description 28
- 102000039446 nucleic acids Human genes 0.000 description 24
- 108020004707 nucleic acids Proteins 0.000 description 24
- 239000013612 plasmid Substances 0.000 description 24
- 238000012217 deletion Methods 0.000 description 22
- 230000037430 deletion Effects 0.000 description 22
- 208000031220 Hemophilia Diseases 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 17
- 230000013595 glycosylation Effects 0.000 description 17
- 238000006206 glycosylation reaction Methods 0.000 description 17
- 238000003780 insertion Methods 0.000 description 16
- 230000037431 insertion Effects 0.000 description 16
- 238000004806 packaging method and process Methods 0.000 description 16
- 238000002560 therapeutic procedure Methods 0.000 description 16
- 102100022641 Coagulation factor IX Human genes 0.000 description 15
- 230000004988 N-glycosylation Effects 0.000 description 14
- 238000003556 assay Methods 0.000 description 14
- 239000008280 blood Substances 0.000 description 14
- 210000004369 blood Anatomy 0.000 description 14
- 108010076504 Protein Sorting Signals Proteins 0.000 description 12
- 241000700605 Viruses Species 0.000 description 12
- 102000057593 human F8 Human genes 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- 238000002360 preparation method Methods 0.000 description 12
- 108010076282 Factor IX Proteins 0.000 description 11
- 241000699670 Mus sp. Species 0.000 description 11
- 229960004222 factor ix Drugs 0.000 description 11
- 229960000900 human factor viii Drugs 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 10
- 239000003814 drug Substances 0.000 description 10
- 238000011282 treatment Methods 0.000 description 10
- 108010014173 Factor X Proteins 0.000 description 9
- 238000005457 optimization Methods 0.000 description 9
- 230000028327 secretion Effects 0.000 description 9
- 210000002845 virion Anatomy 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 8
- 108010025139 recombinant factor VIII SQ Proteins 0.000 description 8
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 7
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 7
- 208000032843 Hemorrhage Diseases 0.000 description 7
- 208000034158 bleeding Diseases 0.000 description 7
- 230000000740 bleeding effect Effects 0.000 description 7
- 238000004113 cell culture Methods 0.000 description 7
- 238000010367 cloning Methods 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 230000035800 maturation Effects 0.000 description 7
- 238000003753 real-time PCR Methods 0.000 description 7
- 230000009261 transgenic effect Effects 0.000 description 7
- 208000002109 Argyria Diseases 0.000 description 6
- 108700010070 Codon Usage Proteins 0.000 description 6
- 108091029523 CpG island Proteins 0.000 description 6
- 108010048049 Factor IXa Proteins 0.000 description 6
- 102000004961 Furin Human genes 0.000 description 6
- 108090001126 Furin Proteins 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 108090000190 Thrombin Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 239000008188 pellet Substances 0.000 description 6
- 229960004072 thrombin Drugs 0.000 description 6
- 239000004475 Arginine Substances 0.000 description 5
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 5
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108010061932 Factor VIIIa Proteins 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 5
- 239000003114 blood coagulation factor Substances 0.000 description 5
- 230000015271 coagulation Effects 0.000 description 5
- 238000005345 coagulation Methods 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000000126 in silico method Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 5
- 210000004897 n-terminal region Anatomy 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 4
- 108090000565 Capsid Proteins Proteins 0.000 description 4
- 102100023321 Ceruloplasmin Human genes 0.000 description 4
- 108091029430 CpG site Proteins 0.000 description 4
- 241001529936 Murinae Species 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 238000000246 agarose gel electrophoresis Methods 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 230000023555 blood coagulation Effects 0.000 description 4
- 229910052791 calcium Inorganic materials 0.000 description 4
- 239000011575 calcium Substances 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 208000009429 hemophilia B Diseases 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 238000011813 knockout mouse model Methods 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 238000010172 mouse model Methods 0.000 description 4
- 150000003904 phospholipids Chemical class 0.000 description 4
- 230000000069 prophylactic effect Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 229940124597 therapeutic agent Drugs 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- LGGRPYXPOUIMKG-OJICBBQQSA-N (2S)-2-[[(2S)-2-[[(2S,3S)-2-[[(2S,3R)-2-[[2-[[(2S,3S)-2-[[(2S,3S)-2-[[(2S)-4-amino-2-[[(2S)-6-amino-2-[[(2S,3R)-2-[[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-1-[2-[[(2S,3S)-2-[[(2S)-2-[[(2S,3S)-2-[[(2S)-2-[[(2S)-6-amino-2-[[(2S)-2-[[(2S)-6-amino-2-[[(2S)-4-amino-2-[[(2S)-2-[[(2S)-4-amino-2-[[(2S)-1-[(2S)-2-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]-4-oxobutanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-oxobutanoyl]amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-methylpentanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-methylpentanoyl]amino]acetyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]propanoyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-hydroxybutanoyl]amino]-3-hydroxybutanoyl]amino]hexanoyl]amino]-4-oxobutanoyl]amino]-3-methylpentanoyl]amino]-3-methylpentanoyl]amino]acetyl]amino]-3-hydroxybutanoyl]amino]-3-methylpentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-N-[(2S)-1-[[(2S)-1-amino-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]pentanediamide Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N2CCC[C@H]2C(=O)NCC(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)N[C@@H](CC4=CC=C(C=C4)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC5=CNC=N5)C(=O)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC6=CC=C(C=C6)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]7CCCN7C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H]([C@@H](C)O)N LGGRPYXPOUIMKG-OJICBBQQSA-N 0.000 description 3
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 3
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 3
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 3
- 108010089996 B-domain-deleted factor VIII Proteins 0.000 description 3
- 206010053567 Coagulopathies Diseases 0.000 description 3
- 108010074864 Factor XI Proteins 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 108700026226 TATA Box Proteins 0.000 description 3
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000037396 body weight Effects 0.000 description 3
- 210000000234 capsid Anatomy 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 230000009465 prokaryotic expression Effects 0.000 description 3
- 229940024790 prothrombin complex concentrate Drugs 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 108010027345 wheylin-1 peptide Proteins 0.000 description 3
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- OLDOLPWZEMHNIA-PJODQICGSA-N Arg-Ala-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OLDOLPWZEMHNIA-PJODQICGSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 2
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 2
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 2
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- -1 Bebulin®-VH Proteins 0.000 description 2
- 102000002110 C2 domains Human genes 0.000 description 2
- 108050009459 C2 domains Proteins 0.000 description 2
- 102220497982 Coagulation factor VIII_T2105N_mutation Human genes 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- CHRCKSPMGYDLIA-SRVKXCTJSA-N Cys-Phe-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O CHRCKSPMGYDLIA-SRVKXCTJSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 229940124135 Factor VIII inhibitor Drugs 0.000 description 2
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 2
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- YYQGVXNKAXUTJU-YUMQZZPRSA-N Gly-Cys-His Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O YYQGVXNKAXUTJU-YUMQZZPRSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 2
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 2
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 2
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 2
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 2
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 2
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 2
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 2
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 2
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 2
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 2
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 2
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 230000004989 O-glycosylation Effects 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 2
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 2
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 2
- PUQRDHNIOONJJN-AVGNSLFASA-N Pro-Lys-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PUQRDHNIOONJJN-AVGNSLFASA-N 0.000 description 2
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 2
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 2
- 101100273112 Pseudomonas aeruginosa cap8 gene Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 2
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 2
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 2
- LOHBIDZYHQQTDM-IXOXFDKPSA-N Thr-Cys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LOHBIDZYHQQTDM-IXOXFDKPSA-N 0.000 description 2
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 2
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 2
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 2
- 102000002689 Toll-like receptor Human genes 0.000 description 2
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 2
- JLTQXEOXIJMCLZ-ZVZYQTTQSA-N Trp-Gln-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 JLTQXEOXIJMCLZ-ZVZYQTTQSA-N 0.000 description 2
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 2
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 2
- VNRTXOUAOUZCFW-WDSOQIARSA-N Trp-Val-His Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O VNRTXOUAOUZCFW-WDSOQIARSA-N 0.000 description 2
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 2
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 2
- ULUXAIYMVXLDQP-PMVMPFDFSA-N Tyr-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC4=CC=C(C=C4)O)N ULUXAIYMVXLDQP-PMVMPFDFSA-N 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 2
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 2
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 108010018823 anti-inhibitor coagulant complex Proteins 0.000 description 2
- 229940030225 antihemorrhagics Drugs 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 2
- 102220353179 c.256A>G Human genes 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 108090001015 cancer procoagulant Proteins 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003593 chromogenic compound Substances 0.000 description 2
- 230000035602 clotting Effects 0.000 description 2
- 208000011664 congenital factor XI deficiency Diseases 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 201000007219 factor XI deficiency Diseases 0.000 description 2
- JGBUYEVOKHLFID-UHFFFAOYSA-N gelred Chemical compound [I-].[I-].C=1C(N)=CC=C(C2=CC=C(N)C=C2[N+]=2CCCCCC(=O)NCCCOCCOCCOCCCNC(=O)CCCCC[N+]=3C4=CC(N)=CC=C4C4=CC=C(N)C=C4C=3C=3C=CC=CC=3)C=1C=2C1=CC=CC=C1 JGBUYEVOKHLFID-UHFFFAOYSA-N 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000002874 hemostatic agent Substances 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 2
- 229960004359 iodixanol Drugs 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 239000012474 protein marker Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000013014 purified material Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- 102220494582 60S ribosomal protein L10_S202N_mutation Human genes 0.000 description 1
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 1
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- DEAGTWNKODHUIY-MRFFXTKBSA-N Ala-Tyr-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DEAGTWNKODHUIY-MRFFXTKBSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 102100036826 Aldehyde oxidase Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 101100437118 Arabidopsis thaliana AUG1 gene Proteins 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- NTXNUXPCNRDMAF-WFBYXXMGSA-N Asn-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC(N)=O)C)C(O)=O)=CNC2=C1 NTXNUXPCNRDMAF-WFBYXXMGSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 1
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 1
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 1
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 1
- KYQJHBWHRASMKG-ZLUOBGJFSA-N Asn-Ser-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O KYQJHBWHRASMKG-ZLUOBGJFSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 1
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 1
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- QCMYYKRYFNMIEC-UHFFFAOYSA-N COP(O)=O Chemical class COP(O)=O QCMYYKRYFNMIEC-UHFFFAOYSA-N 0.000 description 1
- 102000005701 Calcium-Binding Proteins Human genes 0.000 description 1
- 108010045403 Calcium-Binding Proteins Proteins 0.000 description 1
- 241001146702 Candidatus Entotheonella factor Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 102000005483 Cell Cycle Proteins Human genes 0.000 description 1
- 108010031896 Cell Cycle Proteins Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 208000000094 Chronic Pain Diseases 0.000 description 1
- 102220498811 Coagulation factor VIII_A1610S_mutation Human genes 0.000 description 1
- 102220498795 Coagulation factor VIII_A1720V_mutation Human genes 0.000 description 1
- 102220498754 Coagulation factor VIII_A1798P_mutation Human genes 0.000 description 1
- 102220498204 Coagulation factor VIII_A1853T_mutation Human genes 0.000 description 1
- 102220498233 Coagulation factor VIII_A1939T_mutation Human genes 0.000 description 1
- 102220497985 Coagulation factor VIII_A2058P_mutation Human genes 0.000 description 1
- 102220497994 Coagulation factor VIII_A2070V_mutation Human genes 0.000 description 1
- 102220497461 Coagulation factor VIII_A2220P_mutation Human genes 0.000 description 1
- 102220510125 Coagulation factor VIII_A97P_mutation Human genes 0.000 description 1
- 102220526942 Coagulation factor VIII_C172W_mutation Human genes 0.000 description 1
- 102220498257 Coagulation factor VIII_C1877R_mutation Human genes 0.000 description 1
- 102220497550 Coagulation factor VIII_C2193G_mutation Human genes 0.000 description 1
- 102220497721 Coagulation factor VIII_C2345S_mutation Human genes 0.000 description 1
- 102220527983 Coagulation factor VIII_C348R_mutation Human genes 0.000 description 1
- 102220498781 Coagulation factor VIII_D1727V_mutation Human genes 0.000 description 1
- 102220498745 Coagulation factor VIII_D1788H_mutation Human genes 0.000 description 1
- 102220498032 Coagulation factor VIII_D2286G_mutation Human genes 0.000 description 1
- 102220497737 Coagulation factor VIII_D2307A_mutation Human genes 0.000 description 1
- 102220510142 Coagulation factor VIII_D75E_mutation Human genes 0.000 description 1
- 102220498788 Coagulation factor VIII_E1701K_mutation Human genes 0.000 description 1
- 102220498209 Coagulation factor VIII_E1848G_mutation Human genes 0.000 description 1
- 102220498227 Coagulation factor VIII_E1894G_mutation Human genes 0.000 description 1
- 102220498222 Coagulation factor VIII_E1904D_mutation Human genes 0.000 description 1
- 102220515324 Coagulation factor VIII_E2018G_mutation Human genes 0.000 description 1
- 102220497558 Coagulation factor VIII_E2200D_mutation Human genes 0.000 description 1
- 102220510141 Coagulation factor VIII_E72K_mutation Human genes 0.000 description 1
- 102220527732 Coagulation factor VIII_E98K_mutation Human genes 0.000 description 1
- 102220498769 Coagulation factor VIII_F1762L_mutation Human genes 0.000 description 1
- 102220498208 Coagulation factor VIII_F1804S_mutation Human genes 0.000 description 1
- 102220515392 Coagulation factor VIII_F1982I_mutation Human genes 0.000 description 1
- 102220497964 Coagulation factor VIII_F2120C_mutation Human genes 0.000 description 1
- 102220497929 Coagulation factor VIII_F2145C_mutation Human genes 0.000 description 1
- 102220498039 Coagulation factor VIII_F2279C_mutation Human genes 0.000 description 1
- 102220527152 Coagulation factor VIII_F455C_mutation Human genes 0.000 description 1
- 102220527141 Coagulation factor VIII_F484C_mutation Human genes 0.000 description 1
- 102220498245 Coagulation factor VIII_G1869D_mutation Human genes 0.000 description 1
- 102220515630 Coagulation factor VIII_G1942A_mutation Human genes 0.000 description 1
- 102220515372 Coagulation factor VIII_G2000A_mutation Human genes 0.000 description 1
- 102220515367 Coagulation factor VIII_G2013R_mutation Human genes 0.000 description 1
- 102220515325 Coagulation factor VIII_G2022D_mutation Human genes 0.000 description 1
- 102220515313 Coagulation factor VIII_G2028R_mutation Human genes 0.000 description 1
- 102220515332 Coagulation factor VIII_G2045E_mutation Human genes 0.000 description 1
- 102220497965 Coagulation factor VIII_G2107S_mutation Human genes 0.000 description 1
- 102220497546 Coagulation factor VIII_G2198V_mutation Human genes 0.000 description 1
- 102220497738 Coagulation factor VIII_G2304V_mutation Human genes 0.000 description 1
- 102220497720 Coagulation factor VIII_G2344C_mutation Human genes 0.000 description 1
- 102220527147 Coagulation factor VIII_G474E_mutation Human genes 0.000 description 1
- 102220526688 Coagulation factor VIII_G705V_mutation Human genes 0.000 description 1
- 102220526698 Coagulation factor VIII_G710W_mutation Human genes 0.000 description 1
- 102220527393 Coagulation factor VIII_G720D_mutation Human genes 0.000 description 1
- 102220510135 Coagulation factor VIII_G92A_mutation Human genes 0.000 description 1
- 102220498803 Coagulation factor VIII_H1066Y_mutation Human genes 0.000 description 1
- 102220527717 Coagulation factor VIII_H113R_mutation Human genes 0.000 description 1
- 102220498193 Coagulation factor VIII_H1867P_mutation Human genes 0.000 description 1
- 102220515388 Coagulation factor VIII_H1973L_mutation Human genes 0.000 description 1
- 102220515407 Coagulation factor VIII_H1980P_mutation Human genes 0.000 description 1
- 102220497986 Coagulation factor VIII_H2101D_mutation Human genes 0.000 description 1
- 102220497902 Coagulation factor VIII_H2174D_mutation Human genes 0.000 description 1
- 102220527768 Coagulation factor VIII_H275L_mutation Human genes 0.000 description 1
- 102220498806 Coagulation factor VIII_I1698T_mutation Human genes 0.000 description 1
- 102220498746 Coagulation factor VIII_I1782R_mutation Human genes 0.000 description 1
- 102220498223 Coagulation factor VIII_I1901F_mutation Human genes 0.000 description 1
- 102220515310 Coagulation factor VIII_I2051S_mutation Human genes 0.000 description 1
- 102220497989 Coagulation factor VIII_I2056N_mutation Human genes 0.000 description 1
- 102220497967 Coagulation factor VIII_I2117F_mutation Human genes 0.000 description 1
- 102220497553 Coagulation factor VIII_I2204T_mutation Human genes 0.000 description 1
- 102220497552 Coagulation factor VIII_I2209N_mutation Human genes 0.000 description 1
- 102220498038 Coagulation factor VIII_I2281T_mutation Human genes 0.000 description 1
- 102220527965 Coagulation factor VIII_I405F_mutation Human genes 0.000 description 1
- 102220527156 Coagulation factor VIII_I438F_mutation Human genes 0.000 description 1
- 102220527131 Coagulation factor VIII_I522Y_mutation Human genes 0.000 description 1
- 102220527305 Coagulation factor VIII_I585R_mutation Human genes 0.000 description 1
- 102220498813 Coagulation factor VIII_K1289Q_mutation Human genes 0.000 description 1
- 102220498767 Coagulation factor VIII_K1751Q_mutation Human genes 0.000 description 1
- 102220498195 Coagulation factor VIII_K1864E_mutation Human genes 0.000 description 1
- 102220527967 Coagulation factor VIII_K427I_mutation Human genes 0.000 description 1
- 102220511028 Coagulation factor VIII_K67E_mutation Human genes 0.000 description 1
- 102220526957 Coagulation factor VIII_L117F_mutation Human genes 0.000 description 1
- 102220498771 Coagulation factor VIII_L1771P_mutation Human genes 0.000 description 1
- 102220498764 Coagulation factor VIII_L1777P_mutation Human genes 0.000 description 1
- 102220498250 Coagulation factor VIII_L1875P_mutation Human genes 0.000 description 1
- 102220498251 Coagulation factor VIII_L1882P_mutation Human genes 0.000 description 1
- 102220515634 Coagulation factor VIII_L1963P_mutation Human genes 0.000 description 1
- 102220515351 Coagulation factor VIII_L1994P_mutation Human genes 0.000 description 1
- 102220497534 Coagulation factor VIII_L2229F_mutation Human genes 0.000 description 1
- 102220511030 Coagulation factor VIII_L26P_mutation Human genes 0.000 description 1
- 102220527302 Coagulation factor VIII_L594Q_mutation Human genes 0.000 description 1
- 102220526739 Coagulation factor VIII_L644V_mutation Human genes 0.000 description 1
- 102220511020 Coagulation factor VIII_L69P_mutation Human genes 0.000 description 1
- 102220527390 Coagulation factor VIII_L725Q_mutation Human genes 0.000 description 1
- 102220515373 Coagulation factor VIII_M1966I_mutation Human genes 0.000 description 1
- 102220515366 Coagulation factor VIII_M2007I_mutation Human genes 0.000 description 1
- 102220497921 Coagulation factor VIII_M2143V_mutation Human genes 0.000 description 1
- 102220497471 Coagulation factor VIII_M2183R_mutation Human genes 0.000 description 1
- 102220526924 Coagulation factor VIII_M339T_mutation Human genes 0.000 description 1
- 102220526732 Coagulation factor VIII_M633I_mutation Human genes 0.000 description 1
- 102220526695 Coagulation factor VIII_M699T_mutation Human genes 0.000 description 1
- 102220527391 Coagulation factor VIII_M721I_mutation Human genes 0.000 description 1
- 102220498807 Coagulation factor VIII_N1460K_mutation Human genes 0.000 description 1
- 102220515387 Coagulation factor VIII_N1971T_mutation Human genes 0.000 description 1
- 102220497924 Coagulation factor VIII_N2148S_mutation Human genes 0.000 description 1
- 102220497923 Coagulation factor VIII_N2157D_mutation Human genes 0.000 description 1
- 102220527781 Coagulation factor VIII_N254I_mutation Human genes 0.000 description 1
- 102220527408 Coagulation factor VIII_N609I_mutation Human genes 0.000 description 1
- 102220526730 Coagulation factor VIII_N637D_mutation Human genes 0.000 description 1
- 102220526703 Coagulation factor VIII_N713I_mutation Human genes 0.000 description 1
- 102220498749 Coagulation factor VIII_P1780L_mutation Human genes 0.000 description 1
- 102220498741 Coagulation factor VIII_P1801A_mutation Human genes 0.000 description 1
- 102220497987 Coagulation factor VIII_P2067L_mutation Human genes 0.000 description 1
- 102220497920 Coagulation factor VIII_P2162L_mutation Human genes 0.000 description 1
- 102220497919 Coagulation factor VIII_P2172L_mutation Human genes 0.000 description 1
- 102220497549 Coagulation factor VIII_P2196R_mutation Human genes 0.000 description 1
- 102220497556 Coagulation factor VIII_P2224L_mutation Human genes 0.000 description 1
- 102220527132 Coagulation factor VIII_P540T_mutation Human genes 0.000 description 1
- 102220510131 Coagulation factor VIII_P83R_mutation Human genes 0.000 description 1
- 102220498809 Coagulation factor VIII_P947R_mutation Human genes 0.000 description 1
- 102220498812 Coagulation factor VIII_Q1336K_mutation Human genes 0.000 description 1
- 102220498787 Coagulation factor VIII_Q1705H_mutation Human genes 0.000 description 1
- 102220497968 Coagulation factor VIII_Q2106E_mutation Human genes 0.000 description 1
- 102220497969 Coagulation factor VIII_Q2119R_mutation Human genes 0.000 description 1
- 102220497713 Coagulation factor VIII_Q2330P_mutation Human genes 0.000 description 1
- 102220527314 Coagulation factor VIII_Q584H_mutation Human genes 0.000 description 1
- 102220526708 Coagulation factor VIII_Q664P_mutation Human genes 0.000 description 1
- 102220498772 Coagulation factor VIII_R1740G_mutation Human genes 0.000 description 1
- 102220498777 Coagulation factor VIII_R1768H_mutation Human genes 0.000 description 1
- 102220498228 Coagulation factor VIII_R1888I_mutation Human genes 0.000 description 1
- 102220515370 Coagulation factor VIII_R2016P_mutation Human genes 0.000 description 1
- 102220497970 Coagulation factor VIII_R2109C_mutation Human genes 0.000 description 1
- 102220497917 Coagulation factor VIII_R2169C_mutation Human genes 0.000 description 1
- 102220511039 Coagulation factor VIII_R22T_mutation Human genes 0.000 description 1
- 102220497744 Coagulation factor VIII_R2326G_mutation Human genes 0.000 description 1
- 102220527399 Coagulation factor VIII_R437P_mutation Human genes 0.000 description 1
- 102220511026 Coagulation factor VIII_R48C_mutation Human genes 0.000 description 1
- 102220527143 Coagulation factor VIII_R490G_mutation Human genes 0.000 description 1
- 102220527410 Coagulation factor VIII_R602G_mutation Human genes 0.000 description 1
- 102220526701 Coagulation factor VIII_R717L_mutation Human genes 0.000 description 1
- 102220526947 Coagulation factor VIII_S138R_mutation Human genes 0.000 description 1
- 102220498751 Coagulation factor VIII_S1799H_mutation Human genes 0.000 description 1
- 102220498192 Coagulation factor VIII_S1858C_mutation Human genes 0.000 description 1
- 102220498229 Coagulation factor VIII_S1907C_mutation Human genes 0.000 description 1
- 102220515640 Coagulation factor VIII_S1965I_mutation Human genes 0.000 description 1
- 102220515394 Coagulation factor VIII_S1968R_mutation Human genes 0.000 description 1
- 102220511038 Coagulation factor VIII_S19R_mutation Human genes 0.000 description 1
- 102220497474 Coagulation factor VIII_S2192I_mutation Human genes 0.000 description 1
- 102220527321 Coagulation factor VIII_S553P_mutation Human genes 0.000 description 1
- 102220526953 Coagulation factor VIII_T137A_mutation Human genes 0.000 description 1
- 102220498790 Coagulation factor VIII_T1714S_mutation Human genes 0.000 description 1
- 102220515365 Coagulation factor VIII_T2004R_mutation Human genes 0.000 description 1
- 102220497922 Coagulation factor VIII_T2141N_mutation Human genes 0.000 description 1
- 102220497898 Coagulation factor VIII_T2173A_mutation Human genes 0.000 description 1
- 102220498033 Coagulation factor VIII_T2264A_mutation Human genes 0.000 description 1
- 102220527142 Coagulation factor VIII_T479R_mutation Human genes 0.000 description 1
- 102220526692 Coagulation factor VIII_T686R_mutation Human genes 0.000 description 1
- 102220526956 Coagulation factor VIII_V147D_mutation Human genes 0.000 description 1
- 102220498249 Coagulation factor VIII_V1876L_mutation Human genes 0.000 description 1
- 102220515326 Coagulation factor VIII_V2035A_mutation Human genes 0.000 description 1
- 102220527780 Coagulation factor VIII_V220G_mutation Human genes 0.000 description 1
- 102220527319 Coagulation factor VIII_V556D_mutation Human genes 0.000 description 1
- 102220527389 Coagulation factor VIII_V727F_mutation Human genes 0.000 description 1
- 102220498226 Coagulation factor VIII_W1908L_mutation Human genes 0.000 description 1
- 102220515369 Coagulation factor VIII_W2015C_mutation Human genes 0.000 description 1
- 102220498045 Coagulation factor VIII_W2290L_mutation Human genes 0.000 description 1
- 102220497723 Coagulation factor VIII_W2332R_mutation Human genes 0.000 description 1
- 102220511025 Coagulation factor VIII_W33G_mutation Human genes 0.000 description 1
- 102220527960 Coagulation factor VIII_W401G_mutation Human genes 0.000 description 1
- 102220527962 Coagulation factor VIII_W412G_mutation Human genes 0.000 description 1
- 102220527133 Coagulation factor VIII_W532G_mutation Human genes 0.000 description 1
- 102220498786 Coagulation factor VIII_Y1699C_mutation Human genes 0.000 description 1
- 102220498212 Coagulation factor VIII_Y1802C_mutation Human genes 0.000 description 1
- 102220498239 Coagulation factor VIII_Y1909C_mutation Human genes 0.000 description 1
- 102220515352 Coagulation factor VIII_Y1998C_mutation Human genes 0.000 description 1
- 102220515327 Coagulation factor VIII_Y2036C_mutation Human genes 0.000 description 1
- 102220511032 Coagulation factor VIII_Y24C_mutation Human genes 0.000 description 1
- 102220511033 Coagulation factor VIII_Y25C_mutation Human genes 0.000 description 1
- 102220527137 Coagulation factor VIII_Y492H_mutation Human genes 0.000 description 1
- 102220527406 Coagulation factor VIII_Y605H_mutation Human genes 0.000 description 1
- 102220526714 Coagulation factor VIII_Y683C_mutation Human genes 0.000 description 1
- 102220526675 Coagulation factor VIII_Y742C_mutation Human genes 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 208000034656 Contusions Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 1
- VNXXMHTZQGGDSG-CIUDSAMLSA-N Cys-His-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O VNXXMHTZQGGDSG-CIUDSAMLSA-N 0.000 description 1
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 1
- 108010041986 DNA Vaccines Proteins 0.000 description 1
- 229940021995 DNA vaccine Drugs 0.000 description 1
- 108010000437 Deamino Arginine Vasopressin Proteins 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 108010054265 Factor VIIa Proteins 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- ZKLYPEGLWFVRGF-IUCAKERBSA-N Gly-His-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZKLYPEGLWFVRGF-IUCAKERBSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 241000713858 Harvey murine sarcoma virus Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- DPQIPEAHIYMUEJ-IHRRRGAJSA-N His-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N DPQIPEAHIYMUEJ-IHRRRGAJSA-N 0.000 description 1
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101000851018 Homo sapiens Vascular endothelial growth factor receptor 1 Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 108700039609 IRW peptide Proteins 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- WNQKUUQIVDDAFA-ZPFDUUQYSA-N Ile-Gln-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N WNQKUUQIVDDAFA-ZPFDUUQYSA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 1
- UOPBQSJRBONRON-STECZYCISA-N Ile-Met-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOPBQSJRBONRON-STECZYCISA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 206010023230 Joint stiffness Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- 101710141347 Major envelope glycoprotein Proteins 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 1
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 1
- MIAZEQZXAFTCCG-UBHSHLNASA-N Met-Phe-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 MIAZEQZXAFTCCG-UBHSHLNASA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- 102220517722 Microtubule-associated protein 9_N601D_mutation Human genes 0.000 description 1
- 208000033375 Moderate hemophilia A Diseases 0.000 description 1
- 101100335921 Mus musculus Gapt gene Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 241001028048 Nicola Species 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- FQUUYTNBMIBOHS-IHRRRGAJSA-N Phe-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FQUUYTNBMIBOHS-IHRRRGAJSA-N 0.000 description 1
- ROOQMPCUFLDOSB-FHWLQOOXSA-N Phe-Phe-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=CC=C1 ROOQMPCUFLDOSB-FHWLQOOXSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 1
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 1
- LUGOKRWYNMDGTD-FXQIFTODSA-N Pro-Cys-Asn Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O LUGOKRWYNMDGTD-FXQIFTODSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102220475346 Protein MCM10 homolog_T541S_mutation Human genes 0.000 description 1
- 108010094028 Prothrombin Proteins 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 102220515607 Pterin-4-alpha-carbinolamine dehydratase 2_T454I_mutation Human genes 0.000 description 1
- 208000018239 Reduced factor VIII activity Diseases 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 1
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- YVXIAOOYAKBAAI-SZMVWBNQSA-N Trp-Leu-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 YVXIAOOYAKBAAI-SZMVWBNQSA-N 0.000 description 1
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 1
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- GZOCMHSZGGJBCX-ULQDDVLXSA-N Tyr-Lys-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O GZOCMHSZGGJBCX-ULQDDVLXSA-N 0.000 description 1
- FASACHWGQBNSRO-ZEWNOJEFSA-N Tyr-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FASACHWGQBNSRO-ZEWNOJEFSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 1
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 1
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- AHHJARQXFFGOKF-NRPADANISA-N Val-Glu-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N AHHJARQXFFGOKF-NRPADANISA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- 102100033178 Vascular endothelial growth factor receptor 1 Human genes 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 239000013602 bacteriophage vector Substances 0.000 description 1
- 229940004970 bebulin Drugs 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 102200003990 c.1094A>G Human genes 0.000 description 1
- 102200077346 c.1706C>G Human genes 0.000 description 1
- 102220349309 c.1786T>C Human genes 0.000 description 1
- 102220348314 c.1916A>G Human genes 0.000 description 1
- 102220397813 c.2043G>C Human genes 0.000 description 1
- 102200003655 c.2044G>T Human genes 0.000 description 1
- 102220367307 c.256G>A Human genes 0.000 description 1
- 102220411728 c.386A>T Human genes 0.000 description 1
- 102220362037 c.535T>C Human genes 0.000 description 1
- 102200004515 c.5954G>A Human genes 0.000 description 1
- 102200004341 c.6245G>A Human genes 0.000 description 1
- 102220360075 c.755C>T Human genes 0.000 description 1
- 102220357454 c.968G>A Human genes 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 239000000701 coagulant Substances 0.000 description 1
- 229940105774 coagulation factor ix Drugs 0.000 description 1
- 229940105778 coagulation factor viii Drugs 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 230000001447 compensatory effect Effects 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 230000009519 contusion Effects 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 229960004281 desmopressin Drugs 0.000 description 1
- NFLWUMRGJYTJIN-NXBWRCJVSA-N desmopressin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSCCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(N)=O)=O)CCC(=O)N)C1=CC=CC=C1 NFLWUMRGJYTJIN-NXBWRCJVSA-N 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 230000003090 exacerbative effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229940105776 factor viii inhibitor bypassing activity Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 208000035474 group of disease Diseases 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 208000031169 hemorrhagic disease Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 150000002431 hydrogen Chemical group 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 238000012405 in silico analysis Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010075702 lysyl-valyl-aspartyl-leucine Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- LSDPWZHWYPCBBB-UHFFFAOYSA-O methylsulfide anion Chemical compound [SH2+]C LSDPWZHWYPCBBB-UHFFFAOYSA-O 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- 230000036470 plasma concentration Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 229940039716 prothrombin Drugs 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000013608 rAAV vector Substances 0.000 description 1
- 101150079601 recA gene Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 102200059332 rs104894339 Human genes 0.000 description 1
- 102220220610 rs1060502522 Human genes 0.000 description 1
- 102220229725 rs1064793080 Human genes 0.000 description 1
- 102200004529 rs111033613 Human genes 0.000 description 1
- 102200004507 rs111033615 Human genes 0.000 description 1
- 102200012057 rs111033728 Human genes 0.000 description 1
- 102220007423 rs111033806 Human genes 0.000 description 1
- 102220038599 rs114901298 Human genes 0.000 description 1
- 102200075150 rs118204110 Human genes 0.000 description 1
- 102220328783 rs1192969297 Human genes 0.000 description 1
- 102200001682 rs121434542 Human genes 0.000 description 1
- 102200039395 rs121908403 Human genes 0.000 description 1
- 102220003017 rs121909185 Human genes 0.000 description 1
- 102200011608 rs121913087 Human genes 0.000 description 1
- 102220315636 rs1224235194 Human genes 0.000 description 1
- 102220307703 rs1309129145 Human genes 0.000 description 1
- 102200004163 rs137852355 Human genes 0.000 description 1
- 102200003958 rs137852359 Human genes 0.000 description 1
- 102200004536 rs137852362 Human genes 0.000 description 1
- 102200003997 rs137852364 Human genes 0.000 description 1
- 102200004113 rs137852365 Human genes 0.000 description 1
- 102200004334 rs137852366 Human genes 0.000 description 1
- 102200005694 rs137852367 Human genes 0.000 description 1
- 102200004452 rs137852369 Human genes 0.000 description 1
- 102200004534 rs137852373 Human genes 0.000 description 1
- 102200004398 rs137852375 Human genes 0.000 description 1
- 102200005898 rs137852378 Human genes 0.000 description 1
- 102200005861 rs137852379 Human genes 0.000 description 1
- 102200005595 rs137852380 Human genes 0.000 description 1
- 102200005603 rs137852382 Human genes 0.000 description 1
- 102200005555 rs137852383 Human genes 0.000 description 1
- 102200005556 rs137852384 Human genes 0.000 description 1
- 102200005557 rs137852385 Human genes 0.000 description 1
- 102200005647 rs137852387 Human genes 0.000 description 1
- 102200005648 rs137852388 Human genes 0.000 description 1
- 102200005649 rs137852389 Human genes 0.000 description 1
- 102200005650 rs137852390 Human genes 0.000 description 1
- 102200005630 rs137852393 Human genes 0.000 description 1
- 102200005686 rs137852395 Human genes 0.000 description 1
- 102200003892 rs137852396 Human genes 0.000 description 1
- 102200003905 rs137852397 Human genes 0.000 description 1
- 102200003951 rs137852399 Human genes 0.000 description 1
- 102200003956 rs137852400 Human genes 0.000 description 1
- 102200003962 rs137852401 Human genes 0.000 description 1
- 102200003968 rs137852402 Human genes 0.000 description 1
- 102200003934 rs137852404 Human genes 0.000 description 1
- 102200003935 rs137852405 Human genes 0.000 description 1
- 102200003936 rs137852406 Human genes 0.000 description 1
- 102200004019 rs137852407 Human genes 0.000 description 1
- 102200003567 rs137852413 Human genes 0.000 description 1
- 102200003569 rs137852414 Human genes 0.000 description 1
- 102200003555 rs137852415 Human genes 0.000 description 1
- 102200003556 rs137852416 Human genes 0.000 description 1
- 102200003557 rs137852417 Human genes 0.000 description 1
- 102200003586 rs137852420 Human genes 0.000 description 1
- 102200003619 rs137852425 Human genes 0.000 description 1
- 102200003621 rs137852426 Human genes 0.000 description 1
- 102200003625 rs137852428 Human genes 0.000 description 1
- 102200003605 rs137852430 Human genes 0.000 description 1
- 102200003651 rs137852433 Human genes 0.000 description 1
- 102200003653 rs137852434 Human genes 0.000 description 1
- 102200003483 rs137852436 Human genes 0.000 description 1
- 102200004532 rs137852439 Human genes 0.000 description 1
- 102200004414 rs137852440 Human genes 0.000 description 1
- 102200004416 rs137852441 Human genes 0.000 description 1
- 102200004401 rs137852443 Human genes 0.000 description 1
- 102200004406 rs137852444 Human genes 0.000 description 1
- 102200004408 rs137852445 Human genes 0.000 description 1
- 102200004511 rs137852450 Human genes 0.000 description 1
- 102200004310 rs137852454 Human genes 0.000 description 1
- 102200004307 rs137852455 Human genes 0.000 description 1
- 102200004342 rs137852456 Human genes 0.000 description 1
- 102200004343 rs137852457 Human genes 0.000 description 1
- 102200004333 rs137852459 Human genes 0.000 description 1
- 102200004326 rs137852460 Human genes 0.000 description 1
- 102200004194 rs137852468 Human genes 0.000 description 1
- 102200004242 rs137852470 Human genes 0.000 description 1
- 102200004214 rs137852472 Human genes 0.000 description 1
- 102200004216 rs137852473 Human genes 0.000 description 1
- 102200003896 rs137852475 Human genes 0.000 description 1
- 102200005858 rs137852476 Human genes 0.000 description 1
- 102220083766 rs140130291 Human genes 0.000 description 1
- 102220237115 rs144457722 Human genes 0.000 description 1
- 102220049521 rs147445499 Human genes 0.000 description 1
- 102220257935 rs1553768963 Human genes 0.000 description 1
- 102220250061 rs1553967623 Human genes 0.000 description 1
- 102200042586 rs1555167156 Human genes 0.000 description 1
- 102220252081 rs1555491645 Human genes 0.000 description 1
- 102220344016 rs1556486551 Human genes 0.000 description 1
- 102200003471 rs1800291 Human genes 0.000 description 1
- 102200004544 rs1800294 Human genes 0.000 description 1
- 102200004239 rs1800297 Human genes 0.000 description 1
- 102200020355 rs193302866 Human genes 0.000 description 1
- 102220050400 rs193921060 Human genes 0.000 description 1
- 102200038648 rs199472805 Human genes 0.000 description 1
- 102220211907 rs201773300 Human genes 0.000 description 1
- 102200003488 rs2228152 Human genes 0.000 description 1
- 102200145057 rs2288022 Human genes 0.000 description 1
- 102200004001 rs28933668 Human genes 0.000 description 1
- 102200003714 rs28933671 Human genes 0.000 description 1
- 102200003721 rs28933672 Human genes 0.000 description 1
- 102200004442 rs28933674 Human genes 0.000 description 1
- 102200004443 rs28933675 Human genes 0.000 description 1
- 102200004444 rs28933676 Human genes 0.000 description 1
- 102200004450 rs28933678 Human genes 0.000 description 1
- 102200004435 rs28933680 Human genes 0.000 description 1
- 102200003688 rs28937272 Human genes 0.000 description 1
- 102200003591 rs28937282 Human genes 0.000 description 1
- 102200003485 rs28937285 Human genes 0.000 description 1
- 102200004419 rs28937289 Human genes 0.000 description 1
- 102200043618 rs28939677 Human genes 0.000 description 1
- 102200044484 rs28997572 Human genes 0.000 description 1
- 102220005505 rs34629158 Human genes 0.000 description 1
- 102200081916 rs35937854 Human genes 0.000 description 1
- 102200004318 rs369414658 Human genes 0.000 description 1
- 102220069767 rs374675592 Human genes 0.000 description 1
- 102200142073 rs3757370 Human genes 0.000 description 1
- 102200050876 rs386833825 Human genes 0.000 description 1
- 102220020432 rs397508288 Human genes 0.000 description 1
- 102220039983 rs397509318 Human genes 0.000 description 1
- 102200075211 rs397515524 Human genes 0.000 description 1
- 102220013575 rs397516675 Human genes 0.000 description 1
- 102220234476 rs398123325 Human genes 0.000 description 1
- 102220074175 rs533055438 Human genes 0.000 description 1
- 102200053954 rs57155193 Human genes 0.000 description 1
- 102220259498 rs576890188 Human genes 0.000 description 1
- 102200018333 rs587779605 Human genes 0.000 description 1
- 102220045310 rs587782000 Human genes 0.000 description 1
- 102220048789 rs587783439 Human genes 0.000 description 1
- 102200054009 rs59642296 Human genes 0.000 description 1
- 102220032689 rs63750007 Human genes 0.000 description 1
- 102200101882 rs72556296 Human genes 0.000 description 1
- 102220236487 rs72658864 Human genes 0.000 description 1
- 102200077474 rs72768728 Human genes 0.000 description 1
- 102200031604 rs750730042 Human genes 0.000 description 1
- 102220327085 rs750741214 Human genes 0.000 description 1
- 102200061426 rs760101382 Human genes 0.000 description 1
- 102200037525 rs761954844 Human genes 0.000 description 1
- 102220248333 rs763060505 Human genes 0.000 description 1
- 102200007223 rs772416503 Human genes 0.000 description 1
- 102200005464 rs7732589 Human genes 0.000 description 1
- 102220276925 rs774708147 Human genes 0.000 description 1
- 102220341238 rs776355907 Human genes 0.000 description 1
- 102220218311 rs780434261 Human genes 0.000 description 1
- 102200005953 rs7823979 Human genes 0.000 description 1
- 102200004168 rs782654096 Human genes 0.000 description 1
- 102200003573 rs782657516 Human genes 0.000 description 1
- 102200128229 rs80055610 Human genes 0.000 description 1
- 102220081821 rs863223969 Human genes 0.000 description 1
- 102220093759 rs876661252 Human genes 0.000 description 1
- 102220122334 rs886043064 Human genes 0.000 description 1
- 102220138164 rs886055667 Human genes 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/36—Blood coagulation or fibrinolysis factors
- A61K38/37—Factors VIII
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/04—Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/745—Blood coagulation or fibrinolysis factors
- C07K14/755—Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14142—Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/007—Vectors comprising a special translation-regulating system cell or tissue specific
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Hematology (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Diabetes (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 발명은 다른 양상 중에서, 포유류 세포에서 발현을 위한 인자 VIII 변이체를 인코딩하는 코돈-변경된 폴리뉴클레오티드를 제공한다. 일부 구체예에서, 본 발명은 또한, A형 혈우병을 치료하기 위한 포유류 유전자 요법 벡터 및 방법을 제공한다.
Description
관련된 출원에 대한 교차 참조
본 출원은 2015년 11월 13일자 제출된 US 특허가출원 번호 62/255,317에 우선권을 주장하고, 이것은 전체적으로 본원에 참조로서 편입된다.
서열 목록
본 출원은 서열 목록을 내포하는데, 이것은 ASCII 형식으로 전자적으로 제출되었고 전체적으로 본원에 참조로서 편입된다. 2016년 11월 9일자에 창출된 상기 ASCII 사본은 008073_5107_WO_Sequence_Listing.txt로 명명되고 크기에서 353,479 바이트이다.
발명의 배경
혈액 응고는 응고 연쇄 반응으로서 지칭된, 상호의존성 생화학적 반응의 복합적이고 동적인 생물학적 경로를 통해 진행된다. 응고 인자 VIII (FVIII)는 이러한 연쇄 반응에서 핵심 성분이다. 인자 VIII는 출혈 부위로 모집되고, 그리고 활성화된 인자 IX (FIXa) 및 인자 X (FX)와 Xase 복합체를 형성한다. Xase 복합체는 FX를 활성화시키고, 이것은 차례로, 프로트롬빈을 트롬빈으로 활성화시키고, 이것은 이후, 응고 연쇄 반응에서 다른 성분을 활성화시켜 안정된 응괴를 산출한다 (Saenko et al., Trends Cardiovasc. Med., 9:185-192 (1999); Lenting et al., Blood, 92:3983-3996 (1998)에서 리뷰됨).
A형 혈우병은 인자 VIII 활성에서 결함에 의해 특징되는 선천성 X 연관된 출혈 장애이다. 축소된 인자 VIII 활성은 응고 연쇄 반응에서 양성 피드백 루프를 저해한다. 이것은 불완전 응고를 유발하고, 이것은 증가된 지속 기간을 갖는 출혈 에피소드, 광범위한 타박상, 자발적 입과 코 출혈, 관절 경직 및 만성 통증, 그리고 아마도 심각한 사례에서 내출혈 및 빈혈로서 현성한다 (Zhang et al., Clinic. Rev. Allerg. Immunol., 37:114-124 (2009)).
전통적으로, A형 혈우병은 인자 VIII 보상 요법에 의해 치료되는데, 이것은 인자 VIII 단백질 (가령, 혈장-유래된 또는 재조합적으로-생산된 인자 VIII)을 A형 혈우병을 앓는 개체에 투여하는 것으로 구성된다. 인자 VIII는 급성 출혈 에피소드에 대한 응답으로 및/또는 수술 동안 출혈을 관리하기 위해 수술전후에 출혈 에피소드의 빈도를 예방하거나 또는 감소시키기 위해 예방적으로 투여된다. 하지만, 인자 VIII 보상 요법의 여러 바람직하지 않은 특질이 있다.
첫 번째, 인자 VIII 보상 요법은 A형 혈우병을 치료하거나 또는 관리하는데 이용되지만, 근원적인 인자 VIII 결함을 치유하지 못한다. 이것 때문에, A형 혈우병을 앓는 개체는 그들의 삶의 지속 기간 동안 인자 VIII 보상 요법을 필요로 한다. 연속 치료는 값비싸고, 그리고 단지 몇 번의 예방적 용량의 결여도 중증도 A형 혈우병을 앓는 개체에게 심각한 결과를 초래할 수 있기 때문에, 개체가 엄격한 순응도를 유지하는 것을 필요로 한다.
두 번째, 인자 VIII가 생체내에서 상대적으로 짧은 반감기를 갖기 때문에, 전통적인 예방적 인자 VIII 보상 요법은 2 일 또는 3 일 마다 투여를 필요로 한다. 이것은 개체에게 그들의 일생 동안 순응도를 유지해야 하는 부담을 준다. 비록 3세대 "지속성" 인자 VIII 약물이 투여 빈도를 감소시킬 수 있긴 하지만, 이들 약물로 예방적 인자 FVIII 보상 요법은 여전히 영구적으로 월 1회, 주 1회, 또는 더욱 빈번한 투여를 필요로 한다. 가령, ELOCTATE™ [항혈우병 인자 (재조합), Fc 융합 단백질]로 예방적 처치는 3 일 내지 5 일 마다 투여를 필요로 한다 (ELOCTATE™ Prescribing Information, Biogen Idec Inc., (2015)). 게다가, 화학적으로 변형된 생물제제 (가령, 페길화된 폴리펩티드)의 장기간 효과는 아직 완전히 이해되지는 않고 있다.
세 번째, 인자 VIII 보상 요법을 제공받는 모든 개체 중에서 15% 및 30% 사이가 항-인자 VIII 저해제 항체를 형성하고, 상기 요법을 비효율적으로 만든다. 인자 VIII 우회로 요법 (가령, 혈장-유래된 또는 재조합적으로-생산된 프로트롬빈 복합체 농축물의 투여)이 저해제 항체를 형성하는 개체에서 혈우병을 치료하는데 이용될 수 있다. 하지만, 인자 VIII 우회로 요법은 인자 VIII 보상 요법보다 덜 효과적이고 (Mannucci P.M., J Thromb Haemost., 1(7):1349-55 (2003)), 그리고 심혈관 합병증의 증가된 위험과 연관될 수 있다 (Luu and Ewenstein, Haemophilia, 10 Suppl. 2:10-16 (2004)).
체세포 유전자 요법은 A형 혈우병의 치료에 대한 큰 희망을 여전히 주고 있는데, 그 이유는 이것이 인자 VIII 활성의 1회 용량을 개체에게 제공하기 보다는, 근원적인 과소발현 기능적 인자 VIII 활성 (가령, 미스센스 또는 넌센스 돌연변이로 인해)을 치료할 것이기 때문이다. 인자 VIII 보상 요법과 비교하여, 작용 기전에서 이러한 차이 때문에, 인자 VIII 유전자 요법 벡터의 1회 투여는 인자 VIII를 수년 동안 개체에 제공하고, 치료 비용을 감소시키고, 그리고 지속된 환자 순응도에 대한 요구를 제거할 수 있다.
응고 인자 IX (FIX) 유전자 요법은 축소된 인자 IX 활성에 의해 특징되는 관련된 혈액 응고 장애인 B형 혈우병을 앓는 개체를 치료하는데 효과적으로 이용되었다 (Manno C.S., et al., Nat Med., 12(3):342-47 (2006)). 하지만, 인자 VIII 유전자 요법은 여러 독특한 과제를 제시한다. 가령, 전장, 야생형 인자 VIII 폴리펩티드 (2351개 아미노산; UniProt 수탁 번호 P00451)는 전장, 야생형 인자 IX 폴리펩티드 (461개 아미노산; UniProt 수탁 번호 P00740)보다 5배 크다. 따라서, 야생형 인자 VIII의 코딩 서열은 7053개 염기쌍인데, 이것은 전통적인 AAV 유전자 요법 벡터에서 포장되기에는 너무 크다. 게다가, 인자 VIII의 B-도메인 결실된 변이체의 보고된 재조합 발현 (BDD-FVIII)이 불량하였다. 따라서, 여러 그룹이 BDD-FVIII 구조체의 코돈 사용빈도를 변경하는 것을 시도하였지만, 성공은 제한적이었다.
발명의 짧은 요약
따라서, 코딩 서열이 유전자 요법 벡터 내로 더욱 효율적으로 포장되고, 그리고 이들을 통해 전달되는 인자 VIII 변이체가 요구된다. 인자 VIII를 더욱 효율적으로 발현하는 합성, 코돈-변경된 핵산이 또한 필요하다. 이런 인자 VIII 변이체 및 코돈-변경된 핵산은 인자 VIII 결함 (가령, A형 혈우병)의 향상된 치료를 허용한다. 상기 결함 및 인자 VIII 결함 (가령, A형 혈우병)의 치료와 연관된 다른 문제는 개시된 코돈-변경된 인자 VIII 변이체에 의해 감소되거나 또는 제거된다.
일부 구체예에 따라서, 본 발명은 인자 VIII 중쇄 (가령, CS01-HC-NA, CS04-HC-NA, 또는 CS23-HC-NA) 및 경쇄 (CS01-LC-NA, CS04-LC-NA, 또는 CS23-LC-NA)의 개시된 코돈-변경된 서열에 높은 서열 동일성을 갖는 인자 VIII 변이체를 인코딩하는 핵산을 제공한다. 일부 구체예에서, 이들 핵산은 인자 VIII 중쇄와 경쇄를 코딩하는 서열 사이에, 선천적 인자 VIII B-도메인을 대체하는 링커 서열 (가령, 퓨린 개열 부위를 포함하는 링커 서열)을 인코딩하는 서열을 더욱 포함한다.
한 양상에서, 본 발명은 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공한다. 인자 VIII 폴리펩티드는 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 CS04-HC-NA (서열 번호: 3)와 최소한 95% 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 FVIII 폴리펩티드의 경쇄는 CS04-LC-NA (서열 번호: 4)와 최소한 95% 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 폴리펩티드 링커는 퓨린 개열 부위를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리펩티드 링커는 BDLO04 (서열 번호: 6)와 최소한 95% 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩된다.
한 양상에서, 본 발명은 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공한다. 인자 VIII 폴리펩티드는 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 CS01-HC-NA (서열 번호: 24)와 최소한 95% 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 FVIII 폴리펩티드의 경쇄는 CS01-LC-NA (서열 번호: 25)와 최소한 95% 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 폴리펩티드 링커는 퓨린 개열 부위를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리펩티드 링커는 BDLO01 (서열 번호: 5)과 최소한 95% 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩된다.
한 양상에서, 본 발명은 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공한다. 인자 VIII 폴리펩티드는 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 CS23-HC-NA (서열 번호: 22)와 최소한 95% 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 FVIII 폴리펩티드의 경쇄는 CS23-LC-NA (서열 번호: 23)와 최소한 95% 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 폴리펩티드 링커는 퓨린 개열 부위를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리펩티드 링커는 BDLO23 (서열 번호: 7)과 최소한 95% 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩된다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 개별 중쇄 서열 (가령, CS04-HC-NA (서열 번호: 3), CS01-HC-NA (서열 번호: 24), 또는 CS23-HC-NA (서열 번호: 22))와 최소한 96% 동일성을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 개별 경쇄 서열 (가령, CS04-LC-NA (서열 번호: 4), CS01-LC-NA (서열 번호: 25), 또는 CS23-LC-NA (서열 번호: 23))와 최소한 96% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 개별 중쇄 서열 (가령, CS04-HC-NA (서열 번호: 3), CS01-HC-NA (서열 번호: 24), 또는 CS23-HC-NA (서열 번호: 22))와 최소한 97% 동일성을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 개별 경쇄 서열 (가령, CS04-LC-NA (서열 번호: 4), CS01-LC-NA (서열 번호: 25), 또는 CS23-LC-NA (서열 번호: 23))와 최소한 97% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 개별 중쇄 서열 (가령, CS04-HC-NA (서열 번호: 3), CS01-HC-NA (서열 번호: 24), 또는 CS23-HC-NA (서열 번호: 22))와 최소한 98% 동일성을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 개별 경쇄 서열 (가령, CS04-LC-NA (서열 번호: 4), CS01-LC-NA (서열 번호: 25), 또는 CS23-LC-NA (서열 번호: 23))와 최소한 98% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 개별 중쇄 서열 (가령, CS04-HC-NA (서열 번호: 3), CS01-HC-NA (서열 번호: 24), 또는 CS23-HC-NA (서열 번호: 22))와 최소한 99% 동일성을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 개별 경쇄 서열 (가령, CS04-LC-NA (서열 번호: 4), CS01-LC-NA (서열 번호: 25), 또는 CS23-LC-NA (서열 번호: 23))와 최소한 99% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 개별 중쇄 서열 (가령, CS04-HC-NA (서열 번호: 3), CS01-HC-NA (서열 번호: 24), 또는 CS23-HC-NA (서열 번호: 22))와 최소한 99.5% 동일성을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 개별 경쇄 서열 (가령, CS04-LC-NA (서열 번호: 4), CS01-LC-NA (서열 번호: 25), 또는 CS23-LC-NA (서열 번호: 23))와 최소한 99.5% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 개별 중쇄 서열 (가령, CS04-HC-NA (서열 번호: 3), CS01-HC-NA (서열 번호: 24), 또는 CS23-HC-NA (서열 번호: 22))와 최소한 99.9% 동일성을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 개별 경쇄 서열 (가령, CS04-LC-NA (서열 번호: 4), CS01-LC-NA (서열 번호: 25), 또는 CS23-LC-NA (서열 번호: 23))와 최소한 99.9% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 CS04-HC-NA (서열 번호: 3)이고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 CS04-LC-NA (서열 번호: 4)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 CS01-HC-NA (서열 번호: 24)이고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 CS01-LC-NA (서열 번호: 25)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄를 인코딩하는 첫 번째 뉴클레오티드 서열은 CS23-HC-NA (서열 번호: 22)이고, 그리고 인자 FVIII 폴리펩티드의 경쇄를 인코딩하는 두 번째 뉴클레오티드 서열은 CS23-LC-NA (서열 번호: 23)이다.
한 양상에서, 본 발명은 CS04-FL-NA와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 인자 VIII 폴리펩티드를 인코딩한다.
한 양상에서, 본 발명은 CS01-FL-NA와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 인자 VIII 폴리펩티드를 인코딩한다.
한 양상에서, 본 발명은 CS23-FL-NA와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-FL-NA (서열 번호: 1), CS01-FL-NA (서열 번호: 13), 또는 CS23-FL-NA (서열 번호: 20))와 최소한 96% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-FL-NA (서열 번호: 1), CS01-FL-NA (서열 번호: 13), 또는 CS23-FL-NA (서열 번호: 20))와 최소한 97% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-FL-NA (서열 번호: 1), CS01-FL-NA (서열 번호: 13), 또는 CS23-FL-NA (서열 번호: 20))와 최소한 98% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-FL-NA (서열 번호: 1), CS01-FL-NA (서열 번호: 13), 또는 CS23-FL-NA (서열 번호: 20))와 최소한 99% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-FL-NA (서열 번호: 1), CS01-FL-NA (서열 번호: 13), 또는 CS23-FL-NA (서열 번호: 20))와 최소한 99.5% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-FL-NA (서열 번호: 1), CS01-FL-NA (서열 번호: 13), 또는 CS23-FL-NA (서열 번호: 20))와 최소한 99.9% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 CS04-FL-AA (서열 번호: 2)와 최소한 95% 동일성을 갖는 아미노산 서열을 포함하는 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 CS04-FL-AA (서열 번호: 2)와 최소한 96% 동일성을 갖는 아미노산 서열을 포함하는 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 CS04-FL-AA (서열 번호: 2)와 최소한 97% 동일성을 갖는 아미노산 서열을 포함하는 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 CS04-FL-AA (서열 번호: 2)와 최소한 98% 동일성을 갖는 아미노산 서열을 포함하는 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 CS04-FL-AA (서열 번호: 2)와 최소한 99% 동일성을 갖는 아미노산 서열을 포함하는 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 CS04-FL-AA (서열 번호: 2)와 최소한 99.5% 동일성을 갖는 아미노산 서열을 포함하는 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 CS04-FL-AA (서열 번호: 2)와 최소한 99.9% 동일성을 갖는 아미노산 서열을 포함하는 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 CS04-FL-AA (서열 번호: 2)의 아미노산 서열을 포함하는 인자 VIII 폴리펩티드를 인코딩한다.
한 양상에서, 본 발명은 CS04-SC1-NA (서열 번호: 9)와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 단일 사슬 인자 VIII 폴리펩티드를 인코딩한다.
한 양상에서, 본 발명은 CS04-SC2-NA (서열 번호: 11)와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 단일 사슬 인자 VIII 폴리펩티드를 인코딩한다.
한 양상에서, 본 발명은 CS01-SC1-NA (서열 번호: 26)와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 단일 사슬 인자 VIII 폴리펩티드를 인코딩한다.
한 양상에서, 본 발명은 CS01-SC2-NA (서열 번호: 27)와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 단일 사슬 인자 VIII 폴리펩티드를 인코딩한다.
한 양상에서, 본 발명은 CS23-SC1-NA (서열 번호: 28)와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 단일 사슬 인자 VIII 폴리펩티드를 인코딩한다.
한 양상에서, 본 발명은 CS23-SC2-NA (서열 번호: 29)와 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 제공하고, 여기서 상기 폴리뉴클레오티드는 단일 사슬 인자 VIII 폴리펩티드를 인코딩한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-SC1-NA (서열 번호: 9), CS04-SC2-NA (서열 번호: 11), CS01-SC1-NA (서열 번호: 26), CS01-SC2-NA (서열 번호: 27), CS23-SC1-NA (서열 번호: 28), 또는 CS23-SC2-NA (서열 번호: 29))와 최소한 96% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-SC1-NA (서열 번호: 9), CS04-SC2-NA (서열 번호: 11), CS01-SC1-NA (서열 번호: 26), CS01-SC2-NA (서열 번호: 27), CS23-SC1-NA (서열 번호: 28), 또는 CS23-SC2-NA (서열 번호: 29))와 최소한 97% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-SC1-NA (서열 번호: 9), CS04-SC2-NA (서열 번호: 11), CS01-SC1-NA (서열 번호: 26), CS01-SC2-NA (서열 번호: 27), CS23-SC1-NA (서열 번호: 28), 또는 CS23-SC2-NA (서열 번호: 29))와 최소한 98% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-SC1-NA (서열 번호: 9), CS04-SC2-NA (서열 번호: 11), CS01-SC1-NA (서열 번호: 26), CS01-SC2-NA (서열 번호: 27), CS23-SC1-NA (서열 번호: 28), 또는 CS23-SC2-NA (서열 번호: 29))와 최소한 99% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-SC1-NA (서열 번호: 9), CS04-SC2-NA (서열 번호: 11), CS01-SC1-NA (서열 번호: 26), CS01-SC2-NA (서열 번호: 27), CS23-SC1-NA (서열 번호: 28), 또는 CS23-SC2-NA (서열 번호: 29))와 최소한 99.5% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 개별 전장 폴리뉴클레오티드 서열 (가령, CS04-SC1-NA (서열 번호: 9), CS04-SC2-NA (서열 번호: 11), CS01-SC1-NA (서열 번호: 26), CS01-SC2-NA (서열 번호: 27), CS23-SC1-NA (서열 번호: 28), 또는 CS23-SC2-NA (서열 번호: 29))와 최소한 99.9% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)이다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA, CS01-HC-NA, CS01-LC-NA, CS04-FL-NA, CS04-HC-NA, CS04-LC-NA, CS23-FL-NA, CS23-HC-NA, CS23-LC-NA, CS01m1-FL-NA, CS01m2-FL-NA, CS01m3-FL-NA, CS01m4-FL-NA, CS01m12-FL-NA, CS01m13-FL-NA, CS01m23-FL-NA, CS01m24-FL-NA, CS01m34-FL-NA, CS01m123-FL-NA, CS01m234-FL-NA, CS04m1-FL-NA, CS04m2-FL-NA, CS04m3-FL-NA, CS04m4-FL-NA, CS04m12-FL-NA, CS04m13-FL-NA, CS04m23-FL-NA, CS04m24-FL-NA, CS04m34-FL-NA, CS04m123-FL-NA, CS04m234-FL-NA, CS23m1-FL-NA, CS23m2-FL-NA, CS23m3-FL-NA, CS23m4-FL-NA, CS23m12-FL-NA, CS23m13-FL-NA, CS23m23-FL-NA, CS23m24-FL-NA, CS23m34-FL-NA, CS23m123-FL-NA, CS23m234-FL-NA, CS01-SC1-NA, CS04-SC1-NA, CS23-SC1-NA, CS01m1-SC1-NA, CS01m2-SC1-NA, CS01m3-SC1-NA, CS01m4-SC1-NA, CS01m12-SC1-NA, CS01m13-SC1-NA, CS01m23-SC1-NA, CS01m24-SC1-NA, CS01m34-SC1-NA, CS01m123-SC1-NA, CS01m234-SC1-NA, CS04m1-SC1-NA, CS04m2-SC1-NA, CS04m3-SC1-NA, CS04m4-SC1-NA, CS04m12-SC1-NA, CS04m13-SC1-NA, CS04m23-SC1-NA, CS04m24-SC1-NA, CS04m34-SC1-NA, CS04m123-SC1-NA, CS04m234-SC1-NA, CS23m1-SC1-NA, CS23m2-SC1-NA, CS23m3-SC1-NA, CS23m4-SC1-NA, CS23m12-SC1-NA, CS23m13-SC1-NA, CS23m23-SC1-NA, CS23m24-SC1-NA, CS23m34-SC1-NA, CS23m123-SC1-NA, CS23m234-SC1-NA, CS01-SC2-NA, CS04-SC2-NA, CS23-SC2-NA, CS01m1-SC2-NA, CS01m2-SC2-NA, CS01m3-SC2-NA, CS01m4-SC2-NA, CS01m12-SC2-NA, CS01m13-SC2-NA, CS01m23-SC2-NA, CS01m24-SC2-NA, CS01m34-SC2-NA, CS01m123-SC2-NA, CS01m234-SC2-NA, CS04m1-SC2-NA, CS04m2-SC2-NA, CS04m3-SC2-NA, CS04m4-SC2-NA, CS04m12-SC2-NA, CS04m13-SC2-NA, CS04m23-SC2-NA, CS04m24-SC2-NA, CS04m34-SC2-NA, CS04m123-SC2-NA, CS04m234-SC2-NA, CS23m1-SC2-NA, CS23m2-SC2-NA, CS23m3-SC2-NA, CS23m4-SC2-NA, CS23m12-SC2-NA, CS23m13-SC2-NA, CS23m23-SC2-NA, CS23m24-SC2-NA, CS23m34-SC2-NA, CS23m123-SC2-NA, 그리고 CS23m234-SC2-NA로 구성된 군에서 선택되는 서열과 최소한 95% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA, CS01-HC-NA, CS01-LC-NA, CS04-FL-NA, CS04-HC-NA, CS04-LC-NA, CS23-FL-NA, CS23-HC-NA, CS23-LC-NA, CS01m1-FL-NA, CS01m2-FL-NA, CS01m3-FL-NA, CS01m4-FL-NA, CS01m12-FL-NA, CS01m13-FL-NA, CS01m23-FL-NA, CS01m24-FL-NA, CS01m34-FL-NA, CS01m123-FL-NA, CS01m234-FL-NA, CS04m1-FL-NA, CS04m2-FL-NA, CS04m3-FL-NA, CS04m4-FL-NA, CS04m12-FL-NA, CS04m13-FL-NA, CS04m23-FL-NA, CS04m24-FL-NA, CS04m34-FL-NA, CS04m123-FL-NA, CS04m234-FL-NA, CS23m1-FL-NA, CS23m2-FL-NA, CS23m3-FL-NA, CS23m4-FL-NA, CS23m12-FL-NA, CS23m13-FL-NA, CS23m23-FL-NA, CS23m24-FL-NA, CS23m34-FL-NA, CS23m123-FL-NA, CS23m234-FL-NA, CS01-SC1-NA, CS04-SC1-NA, CS23-SC1-NA, CS01m1-SC1-NA, CS01m2-SC1-NA, CS01m3-SC1-NA, CS01m4-SC1-NA, CS01m12-SC1-NA, CS01m13-SC1-NA, CS01m23-SC1-NA, CS01m24-SC1-NA, CS01m34-SC1-NA, CS01m123-SC1-NA, CS01m234-SC1-NA, CS04m1-SC1-NA, CS04m2-SC1-NA, CS04m3-SC1-NA, CS04m4-SC1-NA, CS04m12-SC1-NA, CS04m13-SC1-NA, CS04m23-SC1-NA, CS04m24-SC1-NA, CS04m34-SC1-NA, CS04m123-SC1-NA, CS04m234-SC1-NA, CS23m1-SC1-NA, CS23m2-SC1-NA, CS23m3-SC1-NA, CS23m4-SC1-NA, CS23m12-SC1-NA, CS23m13-SC1-NA, CS23m23-SC1-NA, CS23m24-SC1-NA, CS23m34-SC1-NA, CS23m123-SC1-NA, CS23m234-SC1-NA, CS01-SC2-NA, CS04-SC2-NA, CS23-SC2-NA, CS01m1-SC2-NA, CS01m2-SC2-NA, CS01m3-SC2-NA, CS01m4-SC2-NA, CS01m12-SC2-NA, CS01m13-SC2-NA, CS01m23-SC2-NA, CS01m24-SC2-NA, CS01m34-SC2-NA, CS01m123-SC2-NA, CS01m234-SC2-NA, CS04m1-SC2-NA, CS04m2-SC2-NA, CS04m3-SC2-NA, CS04m4-SC2-NA, CS04m12-SC2-NA, CS04m13-SC2-NA, CS04m23-SC2-NA, CS04m24-SC2-NA, CS04m34-SC2-NA, CS04m123-SC2-NA, CS04m234-SC2-NA, CS23m1-SC2-NA, CS23m2-SC2-NA, CS23m3-SC2-NA, CS23m4-SC2-NA, CS23m12-SC2-NA, CS23m13-SC2-NA, CS23m23-SC2-NA, CS23m24-SC2-NA, CS23m34-SC2-NA, CS23m123-SC2-NA, 그리고 CS23m234-SC2-NA로 구성된 군에서 선택되는 서열과 최소한 96% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA, CS01-HC-NA, CS01-LC-NA, CS04-FL-NA, CS04-HC-NA, CS04-LC-NA, CS23-FL-NA, CS23-HC-NA, CS23-LC-NA, CS01m1-FL-NA, CS01m2-FL-NA, CS01m3-FL-NA, CS01m4-FL-NA, CS01m12-FL-NA, CS01m13-FL-NA, CS01m23-FL-NA, CS01m24-FL-NA, CS01m34-FL-NA, CS01m123-FL-NA, CS01m234-FL-NA, CS04m1-FL-NA, CS04m2-FL-NA, CS04m3-FL-NA, CS04m4-FL-NA, CS04m12-FL-NA, CS04m13-FL-NA, CS04m23-FL-NA, CS04m24-FL-NA, CS04m34-FL-NA, CS04m123-FL-NA, CS04m234-FL-NA, CS23m1-FL-NA, CS23m2-FL-NA, CS23m3-FL-NA, CS23m4-FL-NA, CS23m12-FL-NA, CS23m13-FL-NA, CS23m23-FL-NA, CS23m24-FL-NA, CS23m34-FL-NA, CS23m123-FL-NA, CS23m234-FL-NA, CS01-SC1-NA, CS04-SC1-NA, CS23-SC1-NA, CS01m1-SC1-NA, CS01m2-SC1-NA, CS01m3-SC1-NA, CS01m4-SC1-NA, CS01m12-SC1-NA, CS01m13-SC1-NA, CS01m23-SC1-NA, CS01m24-SC1-NA, CS01m34-SC1-NA, CS01m123-SC1-NA, CS01m234-SC1-NA, CS04m1-SC1-NA, CS04m2-SC1-NA, CS04m3-SC1-NA, CS04m4-SC1-NA, CS04m12-SC1-NA, CS04m13-SC1-NA, CS04m23-SC1-NA, CS04m24-SC1-NA, CS04m34-SC1-NA, CS04m123-SC1-NA, CS04m234-SC1-NA, CS23m1-SC1-NA, CS23m2-SC1-NA, CS23m3-SC1-NA, CS23m4-SC1-NA, CS23m12-SC1-NA, CS23m13-SC1-NA, CS23m23-SC1-NA, CS23m24-SC1-NA, CS23m34-SC1-NA, CS23m123-SC1-NA, CS23m234-SC1-NA, CS01-SC2-NA, CS04-SC2-NA, CS23-SC2-NA, CS01m1-SC2-NA, CS01m2-SC2-NA, CS01m3-SC2-NA, CS01m4-SC2-NA, CS01m12-SC2-NA, CS01m13-SC2-NA, CS01m23-SC2-NA, CS01m24-SC2-NA, CS01m34-SC2-NA, CS01m123-SC2-NA, CS01m234-SC2-NA, CS04m1-SC2-NA, CS04m2-SC2-NA, CS04m3-SC2-NA, CS04m4-SC2-NA, CS04m12-SC2-NA, CS04m13-SC2-NA, CS04m23-SC2-NA, CS04m24-SC2-NA, CS04m34-SC2-NA, CS04m123-SC2-NA, CS04m234-SC2-NA, CS23m1-SC2-NA, CS23m2-SC2-NA, CS23m3-SC2-NA, CS23m4-SC2-NA, CS23m12-SC2-NA, CS23m13-SC2-NA, CS23m23-SC2-NA, CS23m24-SC2-NA, CS23m34-SC2-NA, CS23m123-SC2-NA, 그리고 CS23m234-SC2-NA로 구성된 군에서 선택되는 서열과 최소한 97% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA, CS01-HC-NA, CS01-LC-NA, CS04-FL-NA, CS04-HC-NA, CS04-LC-NA, CS23-FL-NA, CS23-HC-NA, CS23-LC-NA, CS01m1-FL-NA, CS01m2-FL-NA, CS01m3-FL-NA, CS01m4-FL-NA, CS01m12-FL-NA, CS01m13-FL-NA, CS01m23-FL-NA, CS01m24-FL-NA, CS01m34-FL-NA, CS01m123-FL-NA, CS01m234-FL-NA, CS04m1-FL-NA, CS04m2-FL-NA, CS04m3-FL-NA, CS04m4-FL-NA, CS04m12-FL-NA, CS04m13-FL-NA, CS04m23-FL-NA, CS04m24-FL-NA, CS04m34-FL-NA, CS04m123-FL-NA, CS04m234-FL-NA, CS23m1-FL-NA, CS23m2-FL-NA, CS23m3-FL-NA, CS23m4-FL-NA, CS23m12-FL-NA, CS23m13-FL-NA, CS23m23-FL-NA, CS23m24-FL-NA, CS23m34-FL-NA, CS23m123-FL-NA, CS23m234-FL-NA, CS01-SC1-NA, CS04-SC1-NA, CS23-SC1-NA, CS01m1-SC1-NA, CS01m2-SC1-NA, CS01m3-SC1-NA, CS01m4-SC1-NA, CS01m12-SC1-NA, CS01m13-SC1-NA, CS01m23-SC1-NA, CS01m24-SC1-NA, CS01m34-SC1-NA, CS01m123-SC1-NA, CS01m234-SC1-NA, CS04m1-SC1-NA, CS04m2-SC1-NA, CS04m3-SC1-NA, CS04m4-SC1-NA, CS04m12-SC1-NA, CS04m13-SC1-NA, CS04m23-SC1-NA, CS04m24-SC1-NA, CS04m34-SC1-NA, CS04m123-SC1-NA, CS04m234-SC1-NA, CS23m1-SC1-NA, CS23m2-SC1-NA, CS23m3-SC1-NA, CS23m4-SC1-NA, CS23m12-SC1-NA, CS23m13-SC1-NA, CS23m23-SC1-NA, CS23m24-SC1-NA, CS23m34-SC1-NA, CS23m123-SC1-NA, CS23m234-SC1-NA, CS01-SC2-NA, CS04-SC2-NA, CS23-SC2-NA, CS01m1-SC2-NA, CS01m2-SC2-NA, CS01m3-SC2-NA, CS01m4-SC2-NA, CS01m12-SC2-NA, CS01m13-SC2-NA, CS01m23-SC2-NA, CS01m24-SC2-NA, CS01m34-SC2-NA, CS01m123-SC2-NA, CS01m234-SC2-NA, CS04m1-SC2-NA, CS04m2-SC2-NA, CS04m3-SC2-NA, CS04m4-SC2-NA, CS04m12-SC2-NA, CS04m13-SC2-NA, CS04m23-SC2-NA, CS04m24-SC2-NA, CS04m34-SC2-NA, CS04m123-SC2-NA, CS04m234-SC2-NA, CS23m1-SC2-NA, CS23m2-SC2-NA, CS23m3-SC2-NA, CS23m4-SC2-NA, CS23m12-SC2-NA, CS23m13-SC2-NA, CS23m23-SC2-NA, CS23m24-SC2-NA, CS23m34-SC2-NA, CS23m123-SC2-NA, 그리고 CS23m234-SC2-NA로 구성된 군에서 선택되는 서열과 최소한 98% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA, CS01-HC-NA, CS01-LC-NA, CS04-FL-NA, CS04-HC-NA, CS04-LC-NA, CS23-FL-NA, CS23-HC-NA, CS23-LC-NA, CS01m1-FL-NA, CS01m2-FL-NA, CS01m3-FL-NA, CS01m4-FL-NA, CS01m12-FL-NA, CS01m13-FL-NA, CS01m23-FL-NA, CS01m24-FL-NA, CS01m34-FL-NA, CS01m123-FL-NA, CS01m234-FL-NA, CS04m1-FL-NA, CS04m2-FL-NA, CS04m3-FL-NA, CS04m4-FL-NA, CS04m12-FL-NA, CS04m13-FL-NA, CS04m23-FL-NA, CS04m24-FL-NA, CS04m34-FL-NA, CS04m123-FL-NA, CS04m234-FL-NA, CS23m1-FL-NA, CS23m2-FL-NA, CS23m3-FL-NA, CS23m4-FL-NA, CS23m12-FL-NA, CS23m13-FL-NA, CS23m23-FL-NA, CS23m24-FL-NA, CS23m34-FL-NA, CS23m123-FL-NA, CS23m234-FL-NA, CS01-SC1-NA, CS04-SC1-NA, CS23-SC1-NA, CS01m1-SC1-NA, CS01m2-SC1-NA, CS01m3-SC1-NA, CS01m4-SC1-NA, CS01m12-SC1-NA, CS01m13-SC1-NA, CS01m23-SC1-NA, CS01m24-SC1-NA, CS01m34-SC1-NA, CS01m123-SC1-NA, CS01m234-SC1-NA, CS04m1-SC1-NA, CS04m2-SC1-NA, CS04m3-SC1-NA, CS04m4-SC1-NA, CS04m12-SC1-NA, CS04m13-SC1-NA, CS04m23-SC1-NA, CS04m24-SC1-NA, CS04m34-SC1-NA, CS04m123-SC1-NA, CS04m234-SC1-NA, CS23m1-SC1-NA, CS23m2-SC1-NA, CS23m3-SC1-NA, CS23m4-SC1-NA, CS23m12-SC1-NA, CS23m13-SC1-NA, CS23m23-SC1-NA, CS23m24-SC1-NA, CS23m34-SC1-NA, CS23m123-SC1-NA, CS23m234-SC1-NA, CS01-SC2-NA, CS04-SC2-NA, CS23-SC2-NA, CS01m1-SC2-NA, CS01m2-SC2-NA, CS01m3-SC2-NA, CS01m4-SC2-NA, CS01m12-SC2-NA, CS01m13-SC2-NA, CS01m23-SC2-NA, CS01m24-SC2-NA, CS01m34-SC2-NA, CS01m123-SC2-NA, CS01m234-SC2-NA, CS04m1-SC2-NA, CS04m2-SC2-NA, CS04m3-SC2-NA, CS04m4-SC2-NA, CS04m12-SC2-NA, CS04m13-SC2-NA, CS04m23-SC2-NA, CS04m24-SC2-NA, CS04m34-SC2-NA, CS04m123-SC2-NA, CS04m234-SC2-NA, CS23m1-SC2-NA, CS23m2-SC2-NA, CS23m3-SC2-NA, CS23m4-SC2-NA, CS23m12-SC2-NA, CS23m13-SC2-NA, CS23m23-SC2-NA, CS23m24-SC2-NA, CS23m34-SC2-NA, CS23m123-SC2-NA, 그리고 CS23m234-SC2-NA로 구성된 군에서 선택되는 서열과 최소한 99% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA, CS01-HC-NA, CS01-LC-NA, CS04-FL-NA, CS04-HC-NA, CS04-LC-NA, CS23-FL-NA, CS23-HC-NA, CS23-LC-NA, CS01m1-FL-NA, CS01m2-FL-NA, CS01m3-FL-NA, CS01m4-FL-NA, CS01m12-FL-NA, CS01m13-FL-NA, CS01m23-FL-NA, CS01m24-FL-NA, CS01m34-FL-NA, CS01m123-FL-NA, CS01m234-FL-NA, CS04m1-FL-NA, CS04m2-FL-NA, CS04m3-FL-NA, CS04m4-FL-NA, CS04m12-FL-NA, CS04m13-FL-NA, CS04m23-FL-NA, CS04m24-FL-NA, CS04m34-FL-NA, CS04m123-FL-NA, CS04m234-FL-NA, CS23m1-FL-NA, CS23m2-FL-NA, CS23m3-FL-NA, CS23m4-FL-NA, CS23m12-FL-NA, CS23m13-FL-NA, CS23m23-FL-NA, CS23m24-FL-NA, CS23m34-FL-NA, CS23m123-FL-NA, CS23m234-FL-NA, CS01-SC1-NA, CS04-SC1-NA, CS23-SC1-NA, CS01m1-SC1-NA, CS01m2-SC1-NA, CS01m3-SC1-NA, CS01m4-SC1-NA, CS01m12-SC1-NA, CS01m13-SC1-NA, CS01m23-SC1-NA, CS01m24-SC1-NA, CS01m34-SC1-NA, CS01m123-SC1-NA, CS01m234-SC1-NA, CS04m1-SC1-NA, CS04m2-SC1-NA, CS04m3-SC1-NA, CS04m4-SC1-NA, CS04m12-SC1-NA, CS04m13-SC1-NA, CS04m23-SC1-NA, CS04m24-SC1-NA, CS04m34-SC1-NA, CS04m123-SC1-NA, CS04m234-SC1-NA, CS23m1-SC1-NA, CS23m2-SC1-NA, CS23m3-SC1-NA, CS23m4-SC1-NA, CS23m12-SC1-NA, CS23m13-SC1-NA, CS23m23-SC1-NA, CS23m24-SC1-NA, CS23m34-SC1-NA, CS23m123-SC1-NA, CS23m234-SC1-NA, CS01-SC2-NA, CS04-SC2-NA, CS23-SC2-NA, CS01m1-SC2-NA, CS01m2-SC2-NA, CS01m3-SC2-NA, CS01m4-SC2-NA, CS01m12-SC2-NA, CS01m13-SC2-NA, CS01m23-SC2-NA, CS01m24-SC2-NA, CS01m34-SC2-NA, CS01m123-SC2-NA, CS01m234-SC2-NA, CS04m1-SC2-NA, CS04m2-SC2-NA, CS04m3-SC2-NA, CS04m4-SC2-NA, CS04m12-SC2-NA, CS04m13-SC2-NA, CS04m23-SC2-NA, CS04m24-SC2-NA, CS04m34-SC2-NA, CS04m123-SC2-NA, CS04m234-SC2-NA, CS23m1-SC2-NA, CS23m2-SC2-NA, CS23m3-SC2-NA, CS23m4-SC2-NA, CS23m12-SC2-NA, CS23m13-SC2-NA, CS23m23-SC2-NA, CS23m24-SC2-NA, CS23m34-SC2-NA, CS23m123-SC2-NA, 그리고 CS23m234-SC2-NA로 구성된 군에서 선택되는 서열과 최소한 99.5% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA, CS01-HC-NA, CS01-LC-NA, CS04-FL-NA, CS04-HC-NA, CS04-LC-NA, CS23-FL-NA, CS23-HC-NA, CS23-LC-NA, CS01m1-FL-NA, CS01m2-FL-NA, CS01m3-FL-NA, CS01m4-FL-NA, CS01m12-FL-NA, CS01m13-FL-NA, CS01m23-FL-NA, CS01m24-FL-NA, CS01m34-FL-NA, CS01m123-FL-NA, CS01m234-FL-NA, CS04m1-FL-NA, CS04m2-FL-NA, CS04m3-FL-NA, CS04m4-FL-NA, CS04m12-FL-NA, CS04m13-FL-NA, CS04m23-FL-NA, CS04m24-FL-NA, CS04m34-FL-NA, CS04m123-FL-NA, CS04m234-FL-NA, CS23m1-FL-NA, CS23m2-FL-NA, CS23m3-FL-NA, CS23m4-FL-NA, CS23m12-FL-NA, CS23m13-FL-NA, CS23m23-FL-NA, CS23m24-FL-NA, CS23m34-FL-NA, CS23m123-FL-NA, CS23m234-FL-NA, CS01-SC1-NA, CS04-SC1-NA, CS23-SC1-NA, CS01m1-SC1-NA, CS01m2-SC1-NA, CS01m3-SC1-NA, CS01m4-SC1-NA, CS01m12-SC1-NA, CS01m13-SC1-NA, CS01m23-SC1-NA, CS01m24-SC1-NA, CS01m34-SC1-NA, CS01m123-SC1-NA, CS01m234-SC1-NA, CS04m1-SC1-NA, CS04m2-SC1-NA, CS04m3-SC1-NA, CS04m4-SC1-NA, CS04m12-SC1-NA, CS04m13-SC1-NA, CS04m23-SC1-NA, CS04m24-SC1-NA, CS04m34-SC1-NA, CS04m123-SC1-NA, CS04m234-SC1-NA, CS23m1-SC1-NA, CS23m2-SC1-NA, CS23m3-SC1-NA, CS23m4-SC1-NA, CS23m12-SC1-NA, CS23m13-SC1-NA, CS23m23-SC1-NA, CS23m24-SC1-NA, CS23m34-SC1-NA, CS23m123-SC1-NA, CS23m234-SC1-NA, CS01-SC2-NA, CS04-SC2-NA, CS23-SC2-NA, CS01m1-SC2-NA, CS01m2-SC2-NA, CS01m3-SC2-NA, CS01m4-SC2-NA, CS01m12-SC2-NA, CS01m13-SC2-NA, CS01m23-SC2-NA, CS01m24-SC2-NA, CS01m34-SC2-NA, CS01m123-SC2-NA, CS01m234-SC2-NA, CS04m1-SC2-NA, CS04m2-SC2-NA, CS04m3-SC2-NA, CS04m4-SC2-NA, CS04m12-SC2-NA, CS04m13-SC2-NA, CS04m23-SC2-NA, CS04m24-SC2-NA, CS04m34-SC2-NA, CS04m123-SC2-NA, CS04m234-SC2-NA, CS23m1-SC2-NA, CS23m2-SC2-NA, CS23m3-SC2-NA, CS23m4-SC2-NA, CS23m12-SC2-NA, CS23m13-SC2-NA, CS23m23-SC2-NA, CS23m24-SC2-NA, CS23m34-SC2-NA, CS23m123-SC2-NA, 그리고 CS23m234-SC2-NA로 구성된 군에서 선택되는 서열과 최소한 99.5% 동일성을 갖는다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA, CS01-HC-NA, CS01-LC-NA, CS04-FL-NA, CS04-HC-NA, CS04-LC-NA, CS23-FL-NA, CS23-HC-NA, CS23-LC-NA, CS01m1-FL-NA, CS01m2-FL-NA, CS01m3-FL-NA, CS01m4-FL-NA, CS01m12-FL-NA, CS01m13-FL-NA, CS01m23-FL-NA, CS01m24-FL-NA, CS01m34-FL-NA, CS01m123-FL-NA, CS01m234-FL-NA, CS04m1-FL-NA, CS04m2-FL-NA, CS04m3-FL-NA, CS04m4-FL-NA, CS04m12-FL-NA, CS04m13-FL-NA, CS04m23-FL-NA, CS04m24-FL-NA, CS04m34-FL-NA, CS04m123-FL-NA, CS04m234-FL-NA, CS23m1-FL-NA, CS23m2-FL-NA, CS23m3-FL-NA, CS23m4-FL-NA, CS23m12-FL-NA, CS23m13-FL-NA, CS23m23-FL-NA, CS23m24-FL-NA, CS23m34-FL-NA, CS23m123-FL-NA, CS23m234-FL-NA, CS01-SC1-NA, CS04-SC1-NA, CS23-SC1-NA, CS01m1-SC1-NA, CS01m2-SC1-NA, CS01m3-SC1-NA, CS01m4-SC1-NA, CS01m12-SC1-NA, CS01m13-SC1-NA, CS01m23-SC1-NA, CS01m24-SC1-NA, CS01m34-SC1-NA, CS01m123-SC1-NA, CS01m234-SC1-NA, CS04m1-SC1-NA, CS04m2-SC1-NA, CS04m3-SC1-NA, CS04m4-SC1-NA, CS04m12-SC1-NA, CS04m13-SC1-NA, CS04m23-SC1-NA, CS04m24-SC1-NA, CS04m34-SC1-NA, CS04m123-SC1-NA, CS04m234-SC1-NA, CS23m1-SC1-NA, CS23m2-SC1-NA, CS23m3-SC1-NA, CS23m4-SC1-NA, CS23m12-SC1-NA, CS23m13-SC1-NA, CS23m23-SC1-NA, CS23m24-SC1-NA, CS23m34-SC1-NA, CS23m123-SC1-NA, CS23m234-SC1-NA, CS01-SC2-NA, CS04-SC2-NA, CS23-SC2-NA, CS01m1-SC2-NA, CS01m2-SC2-NA, CS01m3-SC2-NA, CS01m4-SC2-NA, CS01m12-SC2-NA, CS01m13-SC2-NA, CS01m23-SC2-NA, CS01m24-SC2-NA, CS01m34-SC2-NA, CS01m123-SC2-NA, CS01m234-SC2-NA, CS04m1-SC2-NA, CS04m2-SC2-NA, CS04m3-SC2-NA, CS04m4-SC2-NA, CS04m12-SC2-NA, CS04m13-SC2-NA, CS04m23-SC2-NA, CS04m24-SC2-NA, CS04m34-SC2-NA, CS04m123-SC2-NA, CS04m234-SC2-NA, CS23m1-SC2-NA, CS23m2-SC2-NA, CS23m3-SC2-NA, CS23m4-SC2-NA, CS23m12-SC2-NA, CS23m13-SC2-NA, CS23m23-SC2-NA, CS23m24-SC2-NA, CS23m34-SC2-NA, CS23m123-SC2-NA, 그리고 CS23m234-SC2-NA로 구성된 군에서 선택된다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 2개 연속 아미노산 사이에 배치된 글리코실화 폴리펩티드를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 폴리펩티드 링커는 NG1-AA, NG4-AA, NG5-AA, NG6-AA, NG7-AA, NG9-AA, NG10-AA, NG16-AA, NG17-AA, NG18-AA, NG19-AA, NG20-AA, NG21-AA 및 NGV-AA로 구성된 군에서 선택되는 글리코실화 펩티드와 최소한 92% 동일성을 갖는 아미노산 서열을 갖는 글리코실화 펩티드를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 폴리펩티드 링커는 NG1-AA, NG4-AA, NG5-AA, NG6-AA, NG7-AA, NG9-AA, NG10-AA, NG16-AA, NG17-AA, NG18-AA, NG19-AA, NG20-AA, NG21-AA 및 NGV-AA로 구성된 군에서 선택되는 아미노산 서열을 갖는 글리코실화 펩티드를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 글리코실화 펩티드는 NG1-NA, NG4-NA, NG5-NA, NG6-NA, NG7-NA, NG9-NA, NG10-NA, NG16-NA, NG17-NA, NG18-NA, NG19-NA, NG20-NA, NG21-NA 및 NGV-NA로 구성된 군에서 선택되는 서열과 최소한 95% 동일성을 갖는 뉴클레오티드 서열을 갖는 폴리뉴클레오티드에 의해 인코딩된다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 글리코실화 펩티드는 NG1-NA, NG4-NA, NG5-NA, NG6-NA, NG7-NA, NG9-NA, NG10-NA, NG16-NA, NG17-NA, NG18-NA, NG19-NA, NG20-NA, NG21-NA 및 NGV-NA 중에서 한 가지에서 선택되는 뉴클레오티드 서열을 갖는 폴리뉴클레오티드에 의해 인코딩된다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리펩티드 링커는 BDLNG1-NA, BDLNG3-NA, BDLNG5-NA, BDLNG6-NA, BDLNG9-NA, BDLNG10-NA, BDLNG16-NA, BDLNG17-NA, BDLNG18-NA, BDLNG19-NA, BDLNG20-NA 및 BDLNG21-NA로 구성된 군에서 선택되는 서열과 최소한 95% 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩된다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 FVIII-FL-AA (서열 번호: 19)에 비하여, F328S (SPI, F309S SPE) 아미노산 치환을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 FVIII-FL-AA (서열 번호: 19)에 비하여, I105V, A127S, G151K, M166T 및 L171P (SPI; I86V, A108S, G132K, M147T 및 L152P, SPE, 각각) 아미노산 치환을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 a) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, 그리고 b) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입을 포함한다. 일부 구체예에서 (가령, 인코딩된 FVIII 분자가 야생형 B-도메인의 N 말단 영역의 부분을 포함하는 경우에), 인코딩된 인자 VIII 폴리펩티드는 또한, FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 SF760-761의 결실을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 a) FVIII-FL-AA (서열 번호: 19)에 비하여, F328S (SPI; F309S SPE) 아미노산 치환, 그리고 b) FVIII-FL-AA (서열 번호: 19)에 비하여, C1918G 및 C1922G (SPI; C1899G 및 C1903 SPE, 각각) 아미노산 치환을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 a) FVIII-FL-AA (서열 번호: 19)에 비하여, F328S (SPI; F309S SPE) 아미노산 치환, 그리고 b) FVIII-FL-AA (서열 번호: 19)에 비하여, I105V, A127S, G151K, M166T 및 L171P (SPI; I86V, A108S, G132K, M147T 및 L152P, SPE, 각각) 아미노산 치환을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 a) FVIII-FL-AA (서열 번호: 19)에 비하여, F328S 아미노산 치환, b) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, 그리고 c) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입을 포함한다. 일부 구체예에서 (가령, 인코딩된 FVIII 분자가 야생형 B-도메인의 N 말단 영역의 부분을 포함하는 경우에), 인코딩된 인자 VIII 폴리펩티드는 또한, FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 SF760-761의 결실을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 a) FVIII-FL-AA (서열 번호: 19)에 비하여, I105V, A127S, G151K, M166T 및 L171P 아미노산 치환, b) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, 그리고 c) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입을 포함한다. 일부 구체예에서 (가령, 인코딩된 FVIII 분자가 야생형 B-도메인의 N 말단 영역의 부분을 포함하는 경우에), 인코딩된 인자 VIII 폴리펩티드는 또한, FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 SF760-761의 결실을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 a) FVIII-FL-AA (서열 번호: 19)에 비하여, F328S 아미노산 치환, b) FVIII-FL-AA (서열 번호: 19)에 비하여, C1918G 및 C1922G 아미노산 치환, 그리고 c) FVIII-FL-AA (서열 번호: 19)에 비하여, I105V, A127S, G151K, M166T 및 L171P 아미노산 치환을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 a) FVIII-FL-AA (서열 번호: 19)에 비하여, F328S 아미노산 치환, b) FVIII-FL-AA (서열 번호: 19)에 비하여, C1918G 및 C1922G 아미노산 치환, c) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, 그리고 d) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입을 포함한다. 일부 구체예에서 (가령, 인코딩된 FVIII 분자가 야생형 B-도메인의 N 말단 영역의 부분을 포함하는 경우에), 인코딩된 인자 VIII 폴리펩티드는 또한, FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 SF760-761의 결실을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 a) FVIII-FL-AA (서열 번호: 19)에 비하여, I105V, A127S, G151K, M166T 및 L171P 아미노산 치환, b) FVIII-FL-AA (서열 번호: 19)에 비하여, F328S 아미노산 치환, c) FVIII-FL-AA (서열 번호: 19)에 비하여, C1918G 및 C1922G 아미노산 치환, d) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, 그리고 e) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입을 포함한다. 일부 구체예에서 (가령, 인코딩된 FVIII 분자가 야생형 B-도메인의 N 말단 영역의 부분을 포함하는 경우에), 인코딩된 인자 VIII 폴리펩티드는 또한, FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 SF760-761의 결실을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 또한, 인자 VIII 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 프로모터 요소를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 또한, 인자 VIII 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 인핸서 요소를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 또한, 인자 VIII 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 폴리아데닐화 요소를 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 폴리뉴클레오티드는 또한, 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 인트론을 포함한다.
앞서 설명된 폴리뉴클레오티드의 한 구체예에서, 인트론은 프로모터 요소 및 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열의 번역 개시 부위 (가령, 첫 번째 코딩 ATG) 사이에 배치된다.
다른 양상에서, 본 발명은 앞서 설명된 바와 같은 폴리뉴클레오티드를 포함하는 포유류 유전자 요법 벡터를 제공한다.
앞서 설명된 포유류 유전자 요법 벡터의 한 구체예에서, 포유류 유전자 요법 벡터는 아데노 연관된 바이러스 (AAV) 벡터이다.
앞서 설명된 포유류 유전자 요법 벡터의 한 구체예에서, AAV 벡터는 AAV-8 벡터이다.
다른 양상에서, 본 발명은 A형 혈우병을 치료하기 위한 방법을 제공하고, 상기 방법은 앞서 설명된 바와 같은 포유류 유전자 요법 벡터를 치료가 필요한 환자에 투여하는 것을 포함한다.
다른 양상에서, 본 발명은 A형 혈우병을 치료하기 위한, 앞서 설명된 바와 같은 포유류 유전자 요법 벡터를 제공한다.
다른 양상에서, 본 발명은 A형 혈우병을 치료하기 위한 약제의 제조에서, 앞서 설명된 바와 같은 포유류 유전자 요법 벡터의 용도를 제공한다.
다른 양상에서, 본 발명은 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함하는 인자 VIII 폴리펩티드를 제공한다. 인자 VIII 폴리펩티드의 중쇄는 서열 CS01-HC-AAm23과 최소한 95% 동일한 서열을 갖는다. 인자 VIII 폴리펩티드의 경쇄는 서열 CS01-LC-AAm23과 최소한 95% 동일한 서열을 갖는다. 인자 VIII 폴리펩티드의 폴리펩티드 링커는 퓨린 개열 부위를 포함한다. 인자 VIII 폴리펩티드는 i) I105V, A127S, G151K, M166T 및 L171P 아미노산 치환, ii) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, 그리고 iii) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입을 포함한다.
다른 양상에서, 본 발명은 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함하는 인자 VIII 폴리펩티드를 제공한다. 인자 VIII 폴리펩티드의 중쇄는 서열 CS01-HC-AAm123과 최소한 95% 동일한 서열을 갖는다. 인자 VIII 폴리펩티드의 경쇄는 서열 CS01-LC-AAm123과 최소한 95% 동일한 서열을 갖는다. 인자 VIII 폴리펩티드의 폴리펩티드 링커는 퓨린 개열 부위를 포함한다. 인자 VIII 폴리펩티드는 i) I105V, A127S, G151K, M166T 및 L171P 아미노산 치환, ii) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, iii) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입, 그리고 iv) F328S 아미노산 치환을 포함한다.
다른 양상에서, 본 발명은 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함하는 인자 VIII 폴리펩티드를 제공한다. 인자 VIII 폴리펩티드의 중쇄는 서열 CS01-HC-AAm234와 최소한 95% 동일한 서열을 갖는다. 인자 VIII 폴리펩티드의 경쇄는 서열 CS01-LC-AAm234와 최소한 95% 동일한 서열을 갖는다. 인자 VIII 폴리펩티드의 폴리펩티드 링커는 퓨린 개열 부위를 포함한다. 인자 VIII 폴리펩티드는 i) I105V, A127S, G151K, M166T 및 L171P 아미노산 치환, ii) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, iii) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입, 그리고 iv) F328S/C1918G/C1922G 아미노산 치환을 포함한다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄는 개별 중쇄 서열 (가령, CS01-HC-AAm23, CS01-HC-AAm123, 또는 CS01-HC-AAm234)과 최소한 96% 동일한 서열을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄는 개별 경쇄 서열 (가령, CS01-LC-AAm23, CS01-LC-AAm123, 또는 CS01-LC-AAm234)과 최소한 96% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄는 개별 중쇄 서열 (가령, CS01-HC-AAm23, CS01-HC-AAm123, 또는 CS01-HC-AAm234)과 최소한 97% 동일한 서열을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄는 개별 경쇄 서열 (가령, CS01-LC-AAm23, CS01-LC-AAm123, 또는 CS01-LC-AAm234)과 최소한 97% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄는 개별 중쇄 서열 (가령, CS01-HC-AAm23, CS01-HC-AAm123, 또는 CS01-HC-AAm234)과 최소한 98% 동일한 서열을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄는 개별 경쇄 서열 (가령, CS01-LC-AAm23, CS01-LC-AAm123, 또는 CS01-LC-AAm234)과 최소한 98% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄는 개별 중쇄 서열 (가령, CS01-HC-AAm23, CS01-HC-AAm123, 또는 CS01-HC-AAm234)과 최소한 99% 동일한 서열을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄는 개별 경쇄 서열 (가령, CS01-LC-AAm23, CS01-LC-AAm123, 또는 CS01-LC-AAm234)과 최소한 99% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄는 개별 중쇄 서열 (가령, CS01-HC-AAm23, CS01-HC-AAm123, 또는 CS01-HC-AAm234)과 최소한 99.5% 동일한 서열을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄는 개별 경쇄 서열 (가령, CS01-LC-AAm23, CS01-LC-AAm123, 또는 CS01-LC-AAm234)과 최소한 99.5% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드의 중쇄는 개별 중쇄 서열 (가령, CS01-HC-AAm23, CS01-HC-AAm123, 또는 CS01-HC-AAm234)과 동일한 서열을 갖고, 그리고 인자 FVIII 폴리펩티드의 경쇄는 개별 경쇄 서열 (가령, CS01-LC-AAm23, CS01-LC-AAm123, 또는 CS01-LC-AAm234)과 동일한 서열을 갖는다.
앞서 설명된 인자 VIII 폴리펩티드의 한 구체예에서, 폴리펩티드 링커는 BDL-SQ-AA (서열 번호: 30)와 최소한 95% 동일성을 갖는다.
앞서 설명된 인자 VIII 폴리펩티드의 한 구체예에서, 폴리펩티드 링커는 BDL-SQ-AA (서열 번호: 30)의 아미노산 서열을 갖는다.
앞서 설명된 인자 VIII 폴리펩티드의 한 구체예에서, 폴리펩티드 링커는 NG1-AA, NG4-AA, NG5-AA, NG6-AA, NG7-AA, NG9-AA, NG10-AA, NG16-AA, NG17-AA, NG18-AA, NG19-AA, NG20-AA, NG21-AA 및 NGV-AA로 구성된 군에서 선택되는 글리코실화 펩티드와 최소한 92% 동일성을 갖는 아미노산 서열을 갖는 글리코실화 펩티드를 포함한다.
앞서 설명된 인자 VIII 폴리펩티드의 한 구체예에서, 폴리펩티드 링커는 NG1-AA, NG4-AA, NG5-AA, NG6-AA, NG7-AA, NG9-AA, NG10-AA, NG16-AA, NG17-AA, NG18-AA, NG19-AA, NG20-AA, NG21-AA 및 NGV-AA로 구성된 군에서 선택되는 글리코실화 펩티드를 포함한다.
앞서 설명된 인자 VIII 폴리펩티드의 한 구체예에서, 폴리펩티드 링커는 BDLNG1-AA, BDLNG3-AA, BDLNG5-AA, BDLNG6-AA, BDLNG9-AA, BDLNG10-AA, BDLNG16-AA, BDLNG17-AA, BDLNG18-AA, BDLNG19-AA, BDLNG20-AA 및 BDLNG21-AA로 구성된 군에서 선택되는 서열과 최소한 95% 동일성을 갖는 아미노산 서열을 갖는다.
앞서 설명된 인자 VIII 폴리펩티드의 한 구체예에서, 폴리펩티드 링커는 BDLNG1-AA, BDLNG3-AA, BDLNG5-AA, BDLNG6-AA, BDLNG9-AA, BDLNG10-NA, BDLNG16-AA, BDLNG17-AA, BDLNG18-AA, BDLNG19-AA, BDLNG20-AA 및 BDLNG21-AA로 구성된 군에서 선택되는 아미노산 서열을 갖는다.
다른 양상에서, 본 발명은 CS40-FL-AAm23 (서열 번호: 104)과 최소한 95% 동일성을 갖는 아미노산 서열을 갖는 인자 VIII 폴리펩티드를 제공한다. 인자 VIII 폴리펩티드는 i) I105V, A127S, G151K, M166T 및 L171P 아미노산 치환, ii) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, 그리고 iii) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입을 포함한다.
다른 양상에서, 본 발명은 CS40-FL-AAm123과 최소한 95% 동일성을 갖는 아미노산 서열을 갖는 인자 VIII 폴리펩티드를 제공한다. 인자 VIII 폴리펩티드는 i) I105V, A127S, G151K, M166T 및 L171P 아미노산 치환, ii) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, iii) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입, 그리고 iv) F328S 아미노산 치환을 포함한다.
다른 양상에서, 본 발명은 CS40-FL-AAm234와 최소한 95% 동일성을 갖는 아미노산 서열을 갖는 인자 VIII 폴리펩티드를 제공한다. 인자 VIII 폴리펩티드는 i) I105V, A127S, G151K, M166T 및 L171P 아미노산 치환, ii) FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실, iii) FVIII-FL-AA (서열 번호: 19)에 비하여, N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입, 그리고 iv) F328S/C1918G/C1922G 아미노산 치환을 포함한다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드는 개별 전장 서열 (가령, CS40-FL-AAm23 (서열 번호: 104), CS40-FL-AAm123, 또는 CS40-FL-AAm234)과 최소한 96% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드는 개별 전장 서열 (가령, CS40-FL-AAm23 (서열 번호: 104), CS40-FL-AAm123, 또는 CS40-FL-AAm234)과 최소한 97% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드는 개별 전장 서열 (가령, CS40-FL-AAm23 (서열 번호: 104), CS40-FL-AAm123, 또는 CS40-FL-AAm234)과 최소한 98% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드는 개별 전장 서열 (가령, CS40-FL-AAm23 (서열 번호: 104), CS40-FL-AAm123, 또는 CS40-FL-AAm234)과 최소한 99% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드는 개별 전장 서열 (가령, CS40-FL-AAm23 (서열 번호: 104), CS40-FL-AAm123, 또는 CS40-FL-AAm234)과 최소한 99.5% 동일한 서열을 갖는다.
설명된 인자 VIII 폴리펩티드의 한 구체예에서, 인자 VIII 폴리펩티드는 개별 전장 서열 (가령, CS40-FL-AAm23 (서열 번호: 104), CS40-FL-AAm123, 또는 CS40-FL-AAm234)과 동일한 서열을 갖는다.
도면의 간단한 설명
도면 1은 야생형 및 ReFacto-유형 인간 인자 VIII 단백질 구조체의 개략적 도해를 보여준다.
도면 2a 및 2b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS04 코돈-변경된 뉴클레오티드 서열 (서열 번호: 1) (전장 코딩 서열의 경우 "CS04-FL-NA")을 보여준다.
도면 3은 일부 구체예에 따른 CS04 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 2) (전장 아미노산 서열의 경우 "CS04-FL-AA")을 보여준다.
도면 4는 일부 구체예에 따른 인자 VIII 변이체의 중쇄를 인코딩하는 CS04 코돈-변경된 뉴클레오티드 서열 (서열 번호: 3) ("CS04-HC-NA")의 부분을 보여준다.
도면 5는 일부 구체예에 따른 인자 VIII 변이체의 경쇄를 인코딩하는 CS04 코돈-변경된 뉴클레오티드 서열 (서열 번호: 4) ("CS04-LC-NA")의 부분을 보여준다.
도면 6은 일부 구체예에 따라서 B-도메인 치환된 링커에 대한 예시적인 코딩 서열 (서열 번호 5-7 및 36-48, 각각, 등장 순서로)을 보여준다. BDLO01 (서열 번호: 5), BDLO04 (서열 번호: 6) 및 BDLO23 (서열 번호: 7)은 B-도메인 치환된 링커를 각각 인코딩하는 CS01, CS04 및 CS23 코돈-변경된 뉴클레오티드 서열의 개별 부분이다.
도면 7a, 7b 및 7c는 일부 구체예에 따라서 CS04 코돈-변경된 뉴클레오티드 서열을 내포하는 AAV 벡터 서열 (서열 번호: 8) ("CS04-AV-NA")을 보여준다.
도면 8a 및 8b는 일부 구체예에 따라서 F328S 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m1 코돈-변경된 뉴클레오티드 서열 (서열 번호: 49) ("CS01m1-FL-NA")을 보여준다.
도면 9a 및 9b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS04△(760-1667) (SPI; CS04△(741-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 9) ("CS04-SC1-NA")을 보여준다.
도면 10은 일부 구체예에 따라서 CS01△(760-1667) (SPI; CS01△(741-1648), SPE), CS04△(760-1667) (SPI; CS04△(741-1648), SPE) 및 CS23△(760-1667) (SPI; CS23△(741-1648), SPE) 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 10) (각각, "CS01-SC1-AA", "CS04-SC1-AA" 및 "CS23-SC1-AA")을 보여준다.
도면 11a 및 11b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS04△(772-1667) (SPI; CS04△ (753-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 11) ("CS04-SC2-NA")을 보여준다.
도면 12는 일부 구체예에 따른 CS01△(772-1667) (SPI; CS01△(753-1648), SPE), CS04△(772-1667) (SPI; CS04△(753-1648), SPE) 및 CS23△(772-1667) (SPI; CS23△(753-1648), SPE) 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 12) (각각, "CS01-SC2-AA", "CS04-SC2-AA" 및 "CS23-SC2-AA")을 보여준다.
도면 13a 및 13b는 일부 구체예에 따라서 B-도메인 치환된 링커 내로 삽입되는 예시적인 글리코실화 펩티드에 대한 아미노산 및 뉴클레오티드 서열을 보여준다. "NG1" 또는 NG1-AA"는 위쪽 라인에서 도시된, 아미노산 서열에 대한 코드이다. "NG1-NA"는 각 세트에 대한 아래쪽 라인에서 도시된, 핵산 서열에 대한 코드이다. 도면 13a 및 13b는 아미노산 서열을 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75로서, 그리고 뉴클레오티드 서열을 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74로서 각각, 등장 순서로 개시한다.
도면 14는 야생형 인자 VIII B-도메인의 생체내 N-글리코실화의 인실리코 예측의 결과를 보여준다. 도면은 서열 번호 76 및 76-82를 각각, 등장 순서로 개시한다.
도면 15는 V3 펩티드 링커의 생체내 N-글리코실화의 인실리코 예측의 결과를 보여준다. 도면은 서열 번호 83 및 83-89를 각각, 등장 순서로 개시한다.
도면 16a 및 16b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS01 코돈-변경된 뉴클레오티드 서열 (서열 번호: 13) ("CS01-FL-NA")을 보여준다.
도면 17a 및 17b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS08 코돈-변경된 뉴클레오티드 서열 (서열 번호: 14) ("CS08-FL-NA")을 보여준다.
도면 18a 및 18b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS10 코돈-변경된 뉴클레오티드 서열 (서열 번호: 15) ("CS10-FL-NA")을 보여준다.
도면 19a 및 19b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS11 코돈-변경된 뉴클레오티드 서열 (서열 번호: 16) ("CS11-FL-NA")을 보여준다.
도면 20a 및 20b는 일부 구체예에 따른 CS40 야생형 ReFacto 코딩 서열 (서열 번호: 17) ("CS40-FL-NA")을 보여준다.
도면 21a 및 21b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CH25 코돈-변경된 뉴클레오티드 서열 (서열 번호: 18) ("CH25-FL-NA")을 보여준다.
도면 22는 일부 구체예에 따른 야생형 인간 인자 VIII 아미노산 서열 (서열 번호: 19) ("FVIII-FL-AA")을 보여준다.
도면 23은 AscI 및 NotI 제한 부위를 통해, 합성 Refacto-유형 BDD-FVIII DNA 서열을 벡터 중추 pCh-BB01 내로 삽입함으로써, pCS40, pCS01, pCS04, pCS08, pCS10, pCS11 및 pCh25 구조체를 클로닝하기 위한 반응식을 도해한다.
도면 24는 아가로즈 겔 전기이동에 의해 분석될 때, AAV 벡터 유전체 제조물의 완전성을 보여준다. 레인 1, DNA 마커; 레인 2, vCS40; 레인 3, vCS01; 레인 4, vCS04. AAV 벡터는 모두 동일한-크기의 유전체를 갖고, 거의 5 kb에서 이동한다 (화살표, 오른쪽). 왼쪽 측면에서 척도는 킬로베이스 (kb)에서 DNA 단편의 크기를 지시한다.
도면 25는 PAGE 및 은 염색에 의한 AAV 벡터 제조물의 단백질 분석을 보여준다. 레인 1, 단백질 마커 (M); 레인 2, vCS40, 레인 3, vCS01; 및 레인 4, vCS04. 이들 구조체 모두 VP1, VP2 및 VP3으로 구성되는 동일한 AAV8 캡시드를 갖는다 (오른쪽 화살표). 왼쪽 측면에 척도는 킬로달톤 (kDa)에서 단백질 마커의 크기를 지시한다.
도면 26a 및 26b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 20) ("CS23-FL-NA")을 보여준다.
도면 27은 일부 구체예에 따른 CS23 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 21) ("CS23-FL-AA")을 보여준다.
도면 28은 일부 구체예에 따른 인자 VIII 변이체의 중쇄를 인코딩하는 CS23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 22) ("CS23-HC-NA")의 부분을 보여준다.
도면 29는 일부 구체예에 따른 인자 VIII 변이체의 경쇄를 인코딩하는 CS23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 23) ("CS23-LC-NA")의 부분을 보여준다.
도면 30a 및 30b는 일부 구체예에 따라서 m1 (F328S) 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m13 코돈-변경된 뉴클레오티드 서열 (서열 번호: 90) ("CS01-FL-NA-m13")을 보여준다.
도면 31a 및 31b는 일부 구체예에 따라서 m2 및 m3 돌연변이 세트를 갖는 인자 VIII 변이체를 인코딩하는 CS01m23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 91) ("CS01-FL-NA-m23")을 보여준다.
도면 32a 및 32b는 일부 구체예에 따라서 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m3 코돈-변경된 뉴클레오티드 서열 (서열 번호: 92) ("CS01-FL-NA-m3")을 보여준다.
도면 33a 및 33b는 일부 구체예에 따라서 m2 돌연변이 세트 (I105V/A127S/G151K/M166T/L171P (SPI)) 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m2 코돈-변경된 뉴클레오티드 서열 (서열 번호: 93) ("CS01-FL-NA-m2")을 보여준다.
도면 34a 및 34b는 일부 구체예에 따라서 m2 돌연변이체 (I105V/A127S/G151K/M166T/L171P (SPI)) 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m2 코돈-변경된 뉴클레오티드 서열 (서열 번호: 94) ("CS01-FL-NA-m2")을 보여준다.
도면 35a 및 35b는 일부 구체예에 따라서 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m3 코돈-변경된 뉴클레오티드 서열 (서열 번호: 95) ("CS04-FL-NA-m3")을 보여준다.
도면 36a 및 36b는 일부 구체예에 따라서 m2 돌연변이체 세트 (I105V/A127S/G151K/M166T/L171P (SPI)) 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 96) ("CS04-FL-NA-m23")을 보여준다.
도면 37a 및 37b는 일부 구체예에 따라서 m1 (F328S) 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m1 코돈-변경된 뉴클레오티드 서열 (서열 번호: 97) ("CS04-FL-NA-m1")을 보여준다.
도면 38a 및 38b는 일부 구체예에 따라서 m1 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m13 코돈-변경된 뉴클레오티드 서열 (서열 번호: 98) ("CS04-FL-NA-m13")을 보여준다.
도면 39a 및 39b는 일부 구체예에 따라서 m1 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS23m13 코돈-변경된 뉴클레오티드 서열 (서열 번호: 99) ("CS23m13-FL-NA")을 보여준다.
도면 40a 및 40b는 일부 구체예에 따라서 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS23m3 코돈-변경된 뉴클레오티드 서열 (서열 번호: 100) ("CS23-FL-NA-m3")을 보여준다.
도면 41a 및 41b는 일부 구체예에 따라서 m2 돌연변이체 세트 (I105V/A127S/G151K/M166T/L171P 아미노산 치환)를 갖는 인자 VIII 변이체를 인코딩하는 CS23m2 코돈-변경된 뉴클레오티드 서열 (서열 번호: 101) ("CS23-FL-NA-m2")을 보여준다.
도면 42a 및 42b는 일부 구체예에 따라서 m1 (F328S) 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS23m1 코돈-변경된 뉴클레오티드 서열 (서열 번호: 102) ("CS23-FL-NA-m1")을 보여준다.
도면 43a 및 43b는 일부 구체예에 따라서 m2 돌연변이체 세트 (I105V/A127S/G151K/M166T/L171P) 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS23m23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 103) ("CS23-FL-NA-m23")을 보여준다.
도면 44는 상이한 돌연변이를 보유하는 합성 Refacto-유형 BDD-FVIII (삽입된 표를 참조한다)를 AscI 및 NotI 제한 부위를 통해 벡터 중추 pCh-BB01 내로 삽입함으로써 행위된 pCS 구조체의 클로닝을 묘사한다.
도면 45는 PAGE 및 은 염색에 의한 AAV 벡터 제조물의 단백질 분석을 묘사한다. 레인 1, 단백질 마커 (M); 레인 2, vCS01, 레인 3, vCS17; 레인 4, vCS19; 레인 5, vCS20; 레인 6, vCS40; 레인 7, vCS04; 레인 8, vCS17; 레인 9, vCS24 구조체. 이들 구조체 모두 VP1, VP2 및 VP3으로 구성되는 동일한 AAV8 캡시드를 갖는다 (오른쪽 화살표). 왼쪽 측면에 척도는 킬로달톤 (kDa)에서 단백질 마커의 크기를 지시한다.
도면 46은 아가로즈 겔 전기이동에 의해 분석된 AAV 벡터 유전체 제조물의 완전성을 보여준다. 레인 1, DNA 마커 (M); 레인 2, vCS04, 레인 3, vCS17; 레인 4, vCS20; 레인 5, vCS24; 레인 6, vCS16; 레인 7, vCS40 구조체. 벡터 부하는 레인마다 1.5E10 vg이다. AAV 벡터는 동일한-크기의 유전체를 갖고, 거의 5 kb에서 이동한다 (화살표, 오른쪽). 왼쪽 측면에서 척도는 킬로베이스 (kb)에서 DNA 단편의 크기를 지시한다.
도면 47은 일부 구체예에 따른 인자 VIII 변이체의 중쇄를 인코딩하는 CS01 코돈-변경된 뉴클레오티드 서열 (서열 번호: 24) ("CS01-HC-NA")의 부분을 보여준다.
도면 48은 일부 구체예에 따른 인자 VIII 변이체의 경쇄를 인코딩하는 CS01 코돈-변경된 뉴클레오티드 서열 (서열 번호: 25) ("CS01-LC-NA")의 부분을 보여준다.
도면 49a 및 49b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS01△(760-1667) (SPI; CS01△(741-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 26) ("CS01-SC1-NA")을 보여준다.
도면 50a 및 50b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS01△(772-1667) (SPI; CS01△(753-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 27) ("CS01-SC2-NA")을 보여준다.
도면 51a 및 51b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS23△(760-1667) (SPI; CS23△(741-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 28) ("CS23-SC1-NA")을 보여준다.
도면 52a 및 52b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS23△(772-1667) (SPI; CS23△ (753-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 29) ("CS23-SC2-NA")을 보여준다.
도면 53은 일부 구체예에 따른 CS01m23 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 104) ("CS01m23-FL-AA")을 보여준다.
도면 54는 일부 구체예에 따른 CS04m3 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 105) ("CS01m23-FL-AA")을 보여준다.
도면 55는 일부 구체예에 따른 CS01m12 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 106) ("CS01m12-FL-AA")을 보여준다.
도면 56은 일부 구체예에 따른 CS04m12 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 107) ("CS04m12-FL-AA")을 보여준다.
도면 57a 및 57b는 일부 구체예에 따라서 m1 (F328S) 및 m2 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m12 코돈-변경된 뉴클레오티드 서열 (서열 번호: 108) ("CS01-FL-NAm12")을 보여준다.
도면 58a 및 58b는 일부 구체예에 따라서 m1 (F328S) 및 m2 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m12 코돈-변경된 뉴클레오티드 서열 (서열 번호: 109) ("CS04-FL-NAm12")을 보여준다.
도면 1은 야생형 및 ReFacto-유형 인간 인자 VIII 단백질 구조체의 개략적 도해를 보여준다.
도면 2a 및 2b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS04 코돈-변경된 뉴클레오티드 서열 (서열 번호: 1) (전장 코딩 서열의 경우 "CS04-FL-NA")을 보여준다.
도면 3은 일부 구체예에 따른 CS04 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 2) (전장 아미노산 서열의 경우 "CS04-FL-AA")을 보여준다.
도면 4는 일부 구체예에 따른 인자 VIII 변이체의 중쇄를 인코딩하는 CS04 코돈-변경된 뉴클레오티드 서열 (서열 번호: 3) ("CS04-HC-NA")의 부분을 보여준다.
도면 5는 일부 구체예에 따른 인자 VIII 변이체의 경쇄를 인코딩하는 CS04 코돈-변경된 뉴클레오티드 서열 (서열 번호: 4) ("CS04-LC-NA")의 부분을 보여준다.
도면 6은 일부 구체예에 따라서 B-도메인 치환된 링커에 대한 예시적인 코딩 서열 (서열 번호 5-7 및 36-48, 각각, 등장 순서로)을 보여준다. BDLO01 (서열 번호: 5), BDLO04 (서열 번호: 6) 및 BDLO23 (서열 번호: 7)은 B-도메인 치환된 링커를 각각 인코딩하는 CS01, CS04 및 CS23 코돈-변경된 뉴클레오티드 서열의 개별 부분이다.
도면 7a, 7b 및 7c는 일부 구체예에 따라서 CS04 코돈-변경된 뉴클레오티드 서열을 내포하는 AAV 벡터 서열 (서열 번호: 8) ("CS04-AV-NA")을 보여준다.
도면 8a 및 8b는 일부 구체예에 따라서 F328S 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m1 코돈-변경된 뉴클레오티드 서열 (서열 번호: 49) ("CS01m1-FL-NA")을 보여준다.
도면 9a 및 9b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS04△(760-1667) (SPI; CS04△(741-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 9) ("CS04-SC1-NA")을 보여준다.
도면 10은 일부 구체예에 따라서 CS01△(760-1667) (SPI; CS01△(741-1648), SPE), CS04△(760-1667) (SPI; CS04△(741-1648), SPE) 및 CS23△(760-1667) (SPI; CS23△(741-1648), SPE) 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 10) (각각, "CS01-SC1-AA", "CS04-SC1-AA" 및 "CS23-SC1-AA")을 보여준다.
도면 11a 및 11b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS04△(772-1667) (SPI; CS04△ (753-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 11) ("CS04-SC2-NA")을 보여준다.
도면 12는 일부 구체예에 따른 CS01△(772-1667) (SPI; CS01△(753-1648), SPE), CS04△(772-1667) (SPI; CS04△(753-1648), SPE) 및 CS23△(772-1667) (SPI; CS23△(753-1648), SPE) 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 12) (각각, "CS01-SC2-AA", "CS04-SC2-AA" 및 "CS23-SC2-AA")을 보여준다.
도면 13a 및 13b는 일부 구체예에 따라서 B-도메인 치환된 링커 내로 삽입되는 예시적인 글리코실화 펩티드에 대한 아미노산 및 뉴클레오티드 서열을 보여준다. "NG1" 또는 NG1-AA"는 위쪽 라인에서 도시된, 아미노산 서열에 대한 코드이다. "NG1-NA"는 각 세트에 대한 아래쪽 라인에서 도시된, 핵산 서열에 대한 코드이다. 도면 13a 및 13b는 아미노산 서열을 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75로서, 그리고 뉴클레오티드 서열을 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74로서 각각, 등장 순서로 개시한다.
도면 14는 야생형 인자 VIII B-도메인의 생체내 N-글리코실화의 인실리코 예측의 결과를 보여준다. 도면은 서열 번호 76 및 76-82를 각각, 등장 순서로 개시한다.
도면 15는 V3 펩티드 링커의 생체내 N-글리코실화의 인실리코 예측의 결과를 보여준다. 도면은 서열 번호 83 및 83-89를 각각, 등장 순서로 개시한다.
도면 16a 및 16b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS01 코돈-변경된 뉴클레오티드 서열 (서열 번호: 13) ("CS01-FL-NA")을 보여준다.
도면 17a 및 17b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS08 코돈-변경된 뉴클레오티드 서열 (서열 번호: 14) ("CS08-FL-NA")을 보여준다.
도면 18a 및 18b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS10 코돈-변경된 뉴클레오티드 서열 (서열 번호: 15) ("CS10-FL-NA")을 보여준다.
도면 19a 및 19b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS11 코돈-변경된 뉴클레오티드 서열 (서열 번호: 16) ("CS11-FL-NA")을 보여준다.
도면 20a 및 20b는 일부 구체예에 따른 CS40 야생형 ReFacto 코딩 서열 (서열 번호: 17) ("CS40-FL-NA")을 보여준다.
도면 21a 및 21b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CH25 코돈-변경된 뉴클레오티드 서열 (서열 번호: 18) ("CH25-FL-NA")을 보여준다.
도면 22는 일부 구체예에 따른 야생형 인간 인자 VIII 아미노산 서열 (서열 번호: 19) ("FVIII-FL-AA")을 보여준다.
도면 23은 AscI 및 NotI 제한 부위를 통해, 합성 Refacto-유형 BDD-FVIII DNA 서열을 벡터 중추 pCh-BB01 내로 삽입함으로써, pCS40, pCS01, pCS04, pCS08, pCS10, pCS11 및 pCh25 구조체를 클로닝하기 위한 반응식을 도해한다.
도면 24는 아가로즈 겔 전기이동에 의해 분석될 때, AAV 벡터 유전체 제조물의 완전성을 보여준다. 레인 1, DNA 마커; 레인 2, vCS40; 레인 3, vCS01; 레인 4, vCS04. AAV 벡터는 모두 동일한-크기의 유전체를 갖고, 거의 5 kb에서 이동한다 (화살표, 오른쪽). 왼쪽 측면에서 척도는 킬로베이스 (kb)에서 DNA 단편의 크기를 지시한다.
도면 25는 PAGE 및 은 염색에 의한 AAV 벡터 제조물의 단백질 분석을 보여준다. 레인 1, 단백질 마커 (M); 레인 2, vCS40, 레인 3, vCS01; 및 레인 4, vCS04. 이들 구조체 모두 VP1, VP2 및 VP3으로 구성되는 동일한 AAV8 캡시드를 갖는다 (오른쪽 화살표). 왼쪽 측면에 척도는 킬로달톤 (kDa)에서 단백질 마커의 크기를 지시한다.
도면 26a 및 26b는 일부 구체예에 따른 인자 VIII 변이체를 인코딩하는 CS23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 20) ("CS23-FL-NA")을 보여준다.
도면 27은 일부 구체예에 따른 CS23 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 21) ("CS23-FL-AA")을 보여준다.
도면 28은 일부 구체예에 따른 인자 VIII 변이체의 중쇄를 인코딩하는 CS23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 22) ("CS23-HC-NA")의 부분을 보여준다.
도면 29는 일부 구체예에 따른 인자 VIII 변이체의 경쇄를 인코딩하는 CS23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 23) ("CS23-LC-NA")의 부분을 보여준다.
도면 30a 및 30b는 일부 구체예에 따라서 m1 (F328S) 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m13 코돈-변경된 뉴클레오티드 서열 (서열 번호: 90) ("CS01-FL-NA-m13")을 보여준다.
도면 31a 및 31b는 일부 구체예에 따라서 m2 및 m3 돌연변이 세트를 갖는 인자 VIII 변이체를 인코딩하는 CS01m23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 91) ("CS01-FL-NA-m23")을 보여준다.
도면 32a 및 32b는 일부 구체예에 따라서 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m3 코돈-변경된 뉴클레오티드 서열 (서열 번호: 92) ("CS01-FL-NA-m3")을 보여준다.
도면 33a 및 33b는 일부 구체예에 따라서 m2 돌연변이 세트 (I105V/A127S/G151K/M166T/L171P (SPI)) 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m2 코돈-변경된 뉴클레오티드 서열 (서열 번호: 93) ("CS01-FL-NA-m2")을 보여준다.
도면 34a 및 34b는 일부 구체예에 따라서 m2 돌연변이체 (I105V/A127S/G151K/M166T/L171P (SPI)) 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m2 코돈-변경된 뉴클레오티드 서열 (서열 번호: 94) ("CS01-FL-NA-m2")을 보여준다.
도면 35a 및 35b는 일부 구체예에 따라서 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m3 코돈-변경된 뉴클레오티드 서열 (서열 번호: 95) ("CS04-FL-NA-m3")을 보여준다.
도면 36a 및 36b는 일부 구체예에 따라서 m2 돌연변이체 세트 (I105V/A127S/G151K/M166T/L171P (SPI)) 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 96) ("CS04-FL-NA-m23")을 보여준다.
도면 37a 및 37b는 일부 구체예에 따라서 m1 (F328S) 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m1 코돈-변경된 뉴클레오티드 서열 (서열 번호: 97) ("CS04-FL-NA-m1")을 보여준다.
도면 38a 및 38b는 일부 구체예에 따라서 m1 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m13 코돈-변경된 뉴클레오티드 서열 (서열 번호: 98) ("CS04-FL-NA-m13")을 보여준다.
도면 39a 및 39b는 일부 구체예에 따라서 m1 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS23m13 코돈-변경된 뉴클레오티드 서열 (서열 번호: 99) ("CS23m13-FL-NA")을 보여준다.
도면 40a 및 40b는 일부 구체예에 따라서 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS23m3 코돈-변경된 뉴클레오티드 서열 (서열 번호: 100) ("CS23-FL-NA-m3")을 보여준다.
도면 41a 및 41b는 일부 구체예에 따라서 m2 돌연변이체 세트 (I105V/A127S/G151K/M166T/L171P 아미노산 치환)를 갖는 인자 VIII 변이체를 인코딩하는 CS23m2 코돈-변경된 뉴클레오티드 서열 (서열 번호: 101) ("CS23-FL-NA-m2")을 보여준다.
도면 42a 및 42b는 일부 구체예에 따라서 m1 (F328S) 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS23m1 코돈-변경된 뉴클레오티드 서열 (서열 번호: 102) ("CS23-FL-NA-m1")을 보여준다.
도면 43a 및 43b는 일부 구체예에 따라서 m2 돌연변이체 세트 (I105V/A127S/G151K/M166T/L171P) 및 m3 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS23m23 코돈-변경된 뉴클레오티드 서열 (서열 번호: 103) ("CS23-FL-NA-m23")을 보여준다.
도면 44는 상이한 돌연변이를 보유하는 합성 Refacto-유형 BDD-FVIII (삽입된 표를 참조한다)를 AscI 및 NotI 제한 부위를 통해 벡터 중추 pCh-BB01 내로 삽입함으로써 행위된 pCS 구조체의 클로닝을 묘사한다.
도면 45는 PAGE 및 은 염색에 의한 AAV 벡터 제조물의 단백질 분석을 묘사한다. 레인 1, 단백질 마커 (M); 레인 2, vCS01, 레인 3, vCS17; 레인 4, vCS19; 레인 5, vCS20; 레인 6, vCS40; 레인 7, vCS04; 레인 8, vCS17; 레인 9, vCS24 구조체. 이들 구조체 모두 VP1, VP2 및 VP3으로 구성되는 동일한 AAV8 캡시드를 갖는다 (오른쪽 화살표). 왼쪽 측면에 척도는 킬로달톤 (kDa)에서 단백질 마커의 크기를 지시한다.
도면 46은 아가로즈 겔 전기이동에 의해 분석된 AAV 벡터 유전체 제조물의 완전성을 보여준다. 레인 1, DNA 마커 (M); 레인 2, vCS04, 레인 3, vCS17; 레인 4, vCS20; 레인 5, vCS24; 레인 6, vCS16; 레인 7, vCS40 구조체. 벡터 부하는 레인마다 1.5E10 vg이다. AAV 벡터는 동일한-크기의 유전체를 갖고, 거의 5 kb에서 이동한다 (화살표, 오른쪽). 왼쪽 측면에서 척도는 킬로베이스 (kb)에서 DNA 단편의 크기를 지시한다.
도면 47은 일부 구체예에 따른 인자 VIII 변이체의 중쇄를 인코딩하는 CS01 코돈-변경된 뉴클레오티드 서열 (서열 번호: 24) ("CS01-HC-NA")의 부분을 보여준다.
도면 48은 일부 구체예에 따른 인자 VIII 변이체의 경쇄를 인코딩하는 CS01 코돈-변경된 뉴클레오티드 서열 (서열 번호: 25) ("CS01-LC-NA")의 부분을 보여준다.
도면 49a 및 49b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS01△(760-1667) (SPI; CS01△(741-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 26) ("CS01-SC1-NA")을 보여준다.
도면 50a 및 50b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS01△(772-1667) (SPI; CS01△(753-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 27) ("CS01-SC2-NA")을 보여준다.
도면 51a 및 51b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS23△(760-1667) (SPI; CS23△(741-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 28) ("CS23-SC1-NA")을 보여준다.
도면 52a 및 52b는 일부 구체예에 따른 단일 사슬 인자 VIII 변이체를 인코딩하는 CS23△(772-1667) (SPI; CS23△ (753-1648), SPE) 코돈-변경된 뉴클레오티드 서열 (서열 번호: 29) ("CS23-SC2-NA")을 보여준다.
도면 53은 일부 구체예에 따른 CS01m23 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 104) ("CS01m23-FL-AA")을 보여준다.
도면 54는 일부 구체예에 따른 CS04m3 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 105) ("CS01m23-FL-AA")을 보여준다.
도면 55는 일부 구체예에 따른 CS01m12 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 106) ("CS01m12-FL-AA")을 보여준다.
도면 56은 일부 구체예에 따른 CS04m12 코돈-변경된 뉴클레오티드 서열에 의해 인코딩된 인자 VIII 변이체 아미노산 서열 (서열 번호: 107) ("CS04m12-FL-AA")을 보여준다.
도면 57a 및 57b는 일부 구체예에 따라서 m1 (F328S) 및 m2 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS01m12 코돈-변경된 뉴클레오티드 서열 (서열 번호: 108) ("CS01-FL-NAm12")을 보여준다.
도면 58a 및 58b는 일부 구체예에 따라서 m1 (F328S) 및 m2 아미노산 치환을 갖는 인자 VIII 변이체를 인코딩하는 CS04m12 코돈-변경된 뉴클레오티드 서열 (서열 번호: 109) ("CS04-FL-NAm12")을 보여준다.
발명의 상세한 설명
I. 도입
AAV-기초된 유전자 요법은 혈우병 환자의 치료에 대한 큰 희망을 여전히 주고 있다. B형 혈우병의 경우에, 첫 번째 임상적 데이터는 약 10%의 FIX 수준이 1 년 이상 동안 최소한 일부 환자에서 유지될 수 있다는 점에서 고무적이다. 하지만, A형 혈우병의 경우에, AAV 벡터로 5-10%의 치료적 발현 수준을 달성하는 것이 다양한 이유로 인해 과제로 남아있다. 첫 번째, 인자 VIII 코딩 서열은 전통적인 AAV-기초된 벡터에게는 너무 크다. 두 번째, 가공된 B-도메인 결실되거나 또는 절두된 인자 VIII 구조체는 심지어 코돈-최적화될 때에도 생체내에서 불량한 발현을 겪는다. 세 번째, 이들 B-도메인 결실되거나 또는 절두된 인자 VIII 변이체 구조체는 생체내에서 짧은 반감기를 갖고, 불량한 발현의 효과를 악화시킨다. 네 번째, 심지어 발현될 때에도, FVIII는 다른 응고 인자, 예를 들면, 인자 IX처럼, 세포로부터 효율적으로 분비되지 않는다.
게다가, 이들 과제는 더욱 높은 용량의 유전자 요법 구조체를 단순히 투여함으로써 다뤄질 수 없다. 현재 지식에 따르면, AAV-기초된 유전자 요법 벡터의 벡터 용량은 2x1012 vg/kg 체중을 초과하여 증가되어야 한다. 이것은 이런 고용량에서 T 세포 면역 반응이 촉발되기 때문인데, 상기 반응은 형질도입된 세포를 파괴하고, 그리고 결과로서, 도입유전자 발현이 감소되거나 또는 심지어 제거된다. 이런 이유로, FVIII의 발현을 향상시키는 전략이 FVIII 유전자 요법을 A형 혈우병 환자에 대한 실행가능한 치료 옵션으로 만드는데 필요하다.
본 발명은 인자 VIII 유전자 요법과 연관된 이런 저런 문제를 해결하는 코돈-변경된 인자 VIII 변이체 코딩 서열의 발견에 관계한다. 가령, 본원에서 개시된 폴리뉴클레오티드는 포유류 세포에서 현저하게 향상된 발현을 제공하고, 그리고 안정된 패킹 상호작용으로 인해 향상된 비리온 포장을 전시한다. 일부 실행에서, 이들 이점은 코돈 변경된 CS01, CS04 및 CS23 구조체에 높은 서열 동일성 (가령, CS01-HC, CS04-HC 및 CS23-HC 중쇄 코딩 서열 중에서 한 가지에 높은 서열 동일성, 그리고 CS01-LC, CS04-LC 및 CS23-LC 경쇄 코딩 서열 중에서 한 가지에 높은 서열 동일성)을 갖는 인자 VIII의 중쇄와 경쇄에 대한 코딩 서열을 이용함으로써 실현된다.
일부 실행에서, 본원에서 설명된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 분자는 야생형 B-도메인을 절두시키거나, 결실시키거나, 또는 대체함으로써 단축되었다. 따라서, 이들 폴리뉴클레오티드는 더욱 큰 폴리펩티드, 예를 들면, 야생형 인자 VIII를 비효율적으로 발현하는 전통적인 유전자 요법 벡터를 통해 인자 VIII를 발현하는데 더욱 적합하다.
유리하게는, CS01, CS04 및 CS23 코돈-변경된 인자 VIII 변이체 코딩 서열은 생체내에서 B-도메인 결실된 인자 VIII 구조체의 우수한 발현을 제공하는 것으로 본원에서 밝혀진다. 가령, 실시예 2 및 실시예 4에서, CS01 (서열 번호: 13), CS04 (서열 번호: 1) 및 CS23 (서열 번호: 20) 코딩 서열을 갖는 AAV-기초된 유전자 요법 벡터의 정맥내 투여는 인자 VIII 녹아웃 생쥐에서, 야생형 폴리뉴클레오티드 서열 (서열 번호: 17)로 인코딩된 상응하는 CS40 구조체에 비하여, 인자 VIII 발현에서 18-배, 74-배 및 30-배 증가를 제공하는 것으로 증명된다 (표 4 및 표 7).
게다가, CS01 및 CS04 코돈-변경된 인자 VIII 변이체 코딩 서열은 우수한 비리온 포장 및 바이러스 생산을 제공하는 것으로 본원에서 또한 밝혀진다. 가령, 실시예 1에서, CS01 및 CS04 구조체를 내포하는 AAV 벡터 구조체는 동일한 양의 세포 펠렛으로부터 단리될 때, 야생형 폴리뉴클레오티드 서열로 인코딩된 상응하는 CS40 구조체에 비하여, 5 내지 7-배 큰 바이러스 수율을 제공하는 것으로 증명된다.
유리하게는, 출원인은 또한, CS01, CS04 및 CS23 코돈 변경된 서열로부터 산출된 향상된 인자 VIII 활성이 돌연변이를 근원적인 인자 VIII 폴리펩티드 서열내로 도입함으로써 더욱 증강될 수 있었다는 것을 발견하였다. 가령, 실시예 4에서 증명된 바와 같이, F328S, X5 및 X1 돌연변이는 단독으로 및 서로 합동으로, 생체내에서 CS01 또는 CS04 코돈 변경된 배경에서 발현될 때, FVIII 활성을 야생형, 코돈 변경된 구조체에 비하여, 2 내지 7-배 더욱 증가시켰다 (표 7). 더욱 두드러지게는, 돌연변이체 인자 VIII 돌연변이체를 인코딩하는 이들 코돈 변경된 서열은 야생형 폴리뉴클레오티드 서열로 인코딩된 상응하는 CS40 구조체와 비교하여 최대 246-배 큰 증가를 제공하였다 (표 7).
II. 정의
본원에서 이용된 바와 같이, 다음의 용어는 달리 명시되지 않으면, 그들에 생득된 의미를 갖는다.
본원에서 이용된 바와 같이, 용어 "인자 VIII" 및 "FVIII"는 교체가능하게 이용되고, 그리고 인자 VIII 활성을 갖는 임의의 단백질 (가령, 활성 FVIII, FVIIIa로서 종종 지칭됨) 또는 인자 VIII 활성, 특히 인자 IXa 보조인자 활성을 갖는 단백질의 단백질 전구체 (가령, 프로-단백질 또는 프리-프로-단백질)를 지칭한다. 한 예시적인 구체예에서, 인자 VIII 폴리펩티드는 야생형 인자 VIII 폴리펩티드의 중쇄와 경쇄에 높은 서열 동일성 (가령, 최소한 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 그 이상)을 갖는 서열을 갖는 폴리펩티드를 지칭한다. 일부 구체예에서, 인자 VIII 폴리펩티드의 B-도메인은 인자 VIII 폴리펩티드를 인코딩하는 폴리뉴클레오티드의 크기를 감소시키기 위해 결실되거나, 절두되거나, 또는 링커 폴리펩티드로 대체된다. 한 예시적인 구체예에서, 서열 번호: 2의 아미노산 20-1457은 인자 VIII 폴리펩티드를 구성한다.
야생형 인자 VIII 폴리펩티드의 무제한적 실례는 인간 프리-프로-인자 VIII (가령, GenBank 수탁 번호 AAA52485, CAA25619, AAA58466, AAA52484, AAA52420, AAV85964, BAF82636, BAG36452, CAI41660, CAI41666, CAI41672, CAI43241, CAO03404, EAW72645, AAH22513, AAH64380, AAH98389, AAI11968, AAI11970, 또는 AAB61261), 상응하는 프로-인자 VIII 및 이들의 자연 변이체; 돼지 프리-프로-인자 VIII (가령, UniProt 수탁 번호 F1RZ36 또는 K7GSZ5), 상응하는 프로-인자 VIII 및 이들의 자연 변이체; 생쥐 프리-프로-인자 VIII (가령, GenBank 수탁 번호 AAA37385, CAM15581, CAM26492, 또는 EDL29229), 상응하는 프로-인자 VIII 및 이들의 자연 변이체; 쥐 프리-프로-인자 VIII (가령, GenBank 수탁 번호 AAQ21580), 상응하는 프로-인자 VIII 및 이들의 자연 변이체; 쥐 프리-프로-인자 VIII; 그리고 다른 포유류 인자 VIII 동족체 (가령, 원숭이, 유인원, 햄스터, 기니 피그 등)를 포함한다.
본원에서 이용된 바와 같이, 인자 VIII 폴리펩티드는 인자 IX 보조인자 활성을 갖는 자연 변이체 및 인공 구조체를 포함한다. 본 발명에서 이용된 바와 같이, 인자 VIII는 일부 기저 인자 IX 보조인자 활성 (가령, 상응하는 야생형 활성의 최소한 5%, 10%, 25%, 50%, 75%, 또는 그 이상)을 유지하는 임의의 자연 변이체, 대안적 서열, 동종형, 또는 돌연변이체 단백질을 포괄한다. 인간 개체군에서 발견된 인자 VIII 아미노산 변이 (FVIII-FL-AA (서열 번호: 19)에 비하여)의 실례는 제한 없이, S19R, R22T, Y24C, Y25C, L26P/R, E30V, W33G, Y35C/H, G41C, R48C/K, K67E/N, L69P, E72K, D75E/V/Y, P83R, G89D/V, G92A/V, A97P, E98K, V99D, D101G/H/V, V104D, K108T, M110V, A111T/V, H113R/Y, L117F/R, G121S, E129V, G130R, E132D, Y133C, D135G/Y, T137A/I, S138R, E141K, D145H, V147D, Y155H, V159A, N163K, G164D/V, P165S, C172W, S176P, S179P, V181E/M, K185T, D186G/N/Y, S189L, L191F, G193R, L195P, C198G, S202N/R, F214V, L217H, A219D/T, V220G, D222V, E223K, G224W, T252I, V253F, N254I, G255V, L261P, P262L, G263S, G266F, C267Y, W274C, H275L, G278R, G280D, E284K, V285G, E291G/K, T294I, F295L, V297A, N299I, R301C/H/L, A303E/P, I307S, S308L, F312S, T314A/I, A315V, G323E, L326P, L327P/V, C329F, I331V, M339T, E340K, V345A/L, C348R/S/Y, Y365C, R391C/H/P, S392L/P, A394S, W401G, I405F/S, E409G, W412G/R, K427I, L431F/S, R437P/W, I438F, G439D/S/V, Y442C, K444R, Y450D/N, T454I, F455C, G466E, P470L/R/T, G474E/R/V, E475K, G477V, D478N, T479R, F484C, A488G, R490G, Y492C/H, Y492H, I494T, P496R, G498R, R503H, G513S/V, I522Y, K529E, W532G, P540T, T541S, D544N, R546W, R550C/G/H, S553P, S554C/G, V556D, R560T, D561G/H/Y, I567T, P569R, S577F, V578A, D579A/H, N583S, Q584H/K/R, I585R/T, M586V, D588G/Y, L594Q, S596P, N601D/K, R602G, S603I/R, W604C, Y605H/S, N609I, R612C, N631K/S, M633I, S635N, N637D/I/S, Y639C, L644V, L650F, V653A/M, L659P, A663V, Q664P, F677L, M681I, V682F, Y683C/N, T686R, F698L, M699T/V, M701I, G705V, G710W, N713I, R717L/W, G720D/S, M721I/L, A723T, L725Q, V727F, E739K, Y742C, R795G, P947R, V1012L, E1057K, H1066Y, D1260E, K1289Q, Q1336K, N1460K, L1481P, A1610S, I1698T, Y1699C/F, E1701K, Q1705H, R1708C/H, T1714S, R1715G, A1720V, E1723K, D1727V, Y1728C, R1740G, K1751Q, F1762L, R1768H, G1769R, L1771P, L1775F/V, L1777P, G1779E/R, P1780L, I1782R, D1788H, M1791T, A1798P, S1799H, R1800C/G/H, P1801A, Y1802C, S1803Y, F1804S, L1808F, M1842I, P1844S, T1845P, E1848G, A1853T/V, S1858C, K1864E, D1865N/Y, H1867P/R, G1869D/V, G1872E, P1873R, L1875P, V1876L, C1877R/Y, L1882P, R1888I, E1894G, I1901F, E1904D/K, S1907C/R, W1908L, Y1909C, A1939T/V, N1941D/S, G1942A, M1945V, L1951F, R1960L/Q, L1963P, S1965I, M1966I/V, G1967D, S1968R, N1971T, H1973L, G1979V, H1980P/Y, F1982I, R1985Q, L1994P, Y1998C, G2000A, T2004R, M2007I, G2013R, W2015C, R2016P/W, E2018G, G2022D, G2028R, S2030N, V2035A, Y2036C, N2038S, 2040Y, G2045E/V, I2051S, I2056N, A2058P, W2065R, P2067L, A2070V, S2082N, S2088F, D2093G/Y, H2101D, T2105N, Q2106E/P/R, G2107S, R2109C, I2117F/S, Q2119R, F2120C/L, Y2124C, R2135P, S2138Y, T2141N, M2143V, F2145C, N2148S, N2157D, P2162L, R2169C/H, P2172L/Q/R, T2173A/I, H2174D, R2178C/H/L, R2182C/H/P, M2183R/V, L2185S/W, S2192I, C2193G, P2196R, G2198V, E2200D, I2204T, I2209N, A2211P, A2220P, P2224L, R2228G/L/P/Q, L2229F, V2242M, W2248C/S, V2251A/E, M2257V, T2264A, Q2265R, F2279C/I, I2281T, D2286G, W2290L, G2304V, D2307A, P2319L/S, R2323C/G/H/L, R2326G/L/P/Q, Q2330P, W2332R, I2336F, R2339T, G2344C/D/S, 그리고 C2345S/Y를 포함한다. 인자 VIII 단백질은 또한, 번역후 변형을 내포하는 폴리펩티드를 포함한다.
일반적으로, 인자 VIII를 인코딩하는 폴리뉴클레오티드는 활성 인자 VIII 단백질 (가령, FVIIIa)을 형성하는 번역후 처리를 겪는 비활성 단일 사슬 폴리펩티드 (가령, 프리-프로-단백질)을 인코딩한다. 가령, 도면 1을 참고하면, 야생형 인간 인자 VIII 프리-프로-단백질은 먼저 개열되어 인코딩된 신호 펩티드 (도시되지 않음)를 방출하고, 첫 번째 단일 사슬 프로-단백질 ("인간 야생형 FVIII로서 도시됨)을 형성한다. 프로-단백질은 이후, B 및 A3 도메인 사이에 개열되어, 인자 VIII 중쇄 (가령, A1 및 A2 도메인) 및 B-도메인을 포함하는 첫 번째 폴리펩티드, 그리고 인자 VIII 경쇄 (가령, A3, C1 및 C3 도메인 포함)를 포함하는 두 번째 폴리펩티드를 형성한다. 첫 번째 폴리펩티드는 B-도메인을 제거하고, 그리고 또한, 성숙 인자 VIIIa 단백질에서 인자 VIII 경쇄와 연관된 상태로 남아있는 A1 및 A2 도메인을 분리하기 위해 더욱 개열된다. 인자 VIII 성숙 과정의 리뷰를 위해, Graw et al., Nat Rev Genet., 6(6):488-501 (2005)을 참조하고, 이것의 내용은 모든 점에서 본원에 전체적으로 참조로서 편입된다.
하지만, 일부 구체예에서, 인자 VIII 폴리펩티드는 단일 사슬 인자 VIII 폴리펩티드이다. 단일 사슬 인자 VIII 폴리펩티드는 자연 개열 부위를 제거하고, 그리고 임의선택적으로, 인자 VIII의 B-도메인을 제거하거나, 절두하거나, 또는 대체하도록 가공된다. 따라서, 이들은 개열 (임의선택적 신호 및/또는 리더 펩티드의 개열 제외)에 의해 성숙되지 않고, 그리고 단일 사슬로서 활성이다. 단일 사슬 인자 VIII 폴리펩티드의 무제한적 실례는 Zollner et al. (Thromb Res, 134(1):125-31 (2014)) 및 Donath et al. (Biochem J., 312(1):49-55 (1995))에서 설명되고, 이들의 개시는 모든 점에서 본원에 전체적으로 참조로서 편입된다.
본원에서 이용된 바와 같이, 용어 "인자 VIII 중쇄" 또는 단순히 "중쇄"는 인자 VIII 폴리펩티드의 A1 및 A2 도메인의 응집체를 지칭한다. 한 예시적인 구체예에서, CS04-FL-AA (서열 번호: 2)의 아미노산 20-759는 인자 VIII 중쇄를 구성한다.
본원에서 이용된 바와 같이, 용어 "인자 VIII 경쇄" 또는 단순히 "경쇄"는 인자 VIII 폴리펩티드의 A3, C1 및 C2 도메인의 응집체를 지칭한다. 한 예시적인 구체예에서, 아미노산 774-1457 CS04-FL-AA (서열 번호: 2)는 인자 VIII 경쇄를 구성한다. 일부 구체예에서, 인자 VIII 경쇄는 생체내에서 성숙 동안 방출되는 산성 a3 펩티드를 배제한다.
일반적으로, 인자 VIII 중쇄와 경쇄는 예로서, 임의선택적 B-도메인 또는 B-도메인 치환된 링커와 함께, 단일 폴리펩티드 사슬로서 발현된다. 하지만, 일부 구체예에서, 인자 VIII 중쇄 및 인자 VIII 경쇄는 별개의 폴리펩티드 사슬로서 발현되고 (가령, 공동발현되고), 그리고 재구성되어 인자 VIII 단백질을 형성한다 (가령, 생체내에서 또는 시험관내에서).
본원에서 이용된 바와 같이, 용어 "B-도메인 치환된 링커" 및 "인자 VIII 링커"는 교체가능하게 이용되고, 그리고 야생형 인자 VIII B-도메인의 절두된 이형 (가령, FVIII-FL-AA (서열 번호: 19)의 아미노산 760-1667) 또는 인자 VIII 폴리펩티드의 B-도메인을 대체하도록 가공된 펩티드를 지칭한다. 본원에서 이용된 바와 같이, 인자 VIII 링커는 일부 구체예에 따라서 인자 VIII 변이체 폴리펩티드에서 인자 VIII 중쇄의 C 말단 및 인자 VIII 경쇄의 N 말단 사이에 배치된다. B-도메인 치환된 링커의 무제한적 실례는 U.S. 특허 번호 4,868,112, 5,112,950, 5,171,844, 5,543,502, 5,595,886, 5,610,278, 5,789,203, 5,972,885, 6,048,720, 6,060,447, 6,114,148, 6,228,620, 6,316,226, 6,346,513, 6,458,563, 6,924,365, 7,041,635 및 7,943,374; U.S. 특허 출원 공개 번호 2013/024960, 2015/0071883 및 2015/0158930; 그리고 PCT 공개 번호 WO 2014/064277 및 WO 2014/127215에서 개시되고, 이들의 개시는 모든 점에서 본원에 전체적으로 참조로서 편입된다.
본원에서 달리 특정되지 않으면, 인자 VIII 아미노산의 넘버링은 도면 22에서 서열 번호: 19로서 제공된, 전장, 야생형 인간 인자 VIII 서열에서 상응하는 아미노산 (FVIII-FL-AA)을 지칭한다. 따라서, 본원에서 개시된 인자 VIII 변이체 단백질에서 아미노산 치환을 지칭할 때, 언급된 아미노산 번호는 전장, 야생형 인자 VIII 서열에서 유사한 (가령, 구조적으로 또는 기능적으로 동등한) 및/또는 상동한 (가령, 일차 아미노산 서열에서 진화적으로 보존된) 아미노산을 지칭한다. 가령, T2105N 아미노산 치환은 전장, 야생형 인간 인자 VIII 서열 (FVIII-FL-AA; 서열 번호: 19)의 위치 2105에서 T에서 N으로 치환, CS04에 의해 인코딩된 인자 VIII 변이체 단백질 (CS04-FL-AA; 서열 번호: 2)의 위치 1211에서 T에서 N으로 치환, 그리고 CS04m3에 의해 인코딩된 인자 VIII 변이체 (CS04m3-FL-AA; 서열 번호: 105)의 위치 1212에서 T에서 N으로 치환을 지칭한다.
본원에서 설명된 바와 같이, 인자 VIII 아미노산 넘버링 시스템은 인자 VIII 신호 펩티드 (가령, 전장, 야생형 인간 인자 VIII 서열의 아미노산 1-19)가 포함되는 지에 의존한다. 신호 펩티드가 포함되는 경우에, 넘버링은 "신호 펩티드 포함" 또는 "SPI"로서 지칭된다. 신호 펩티드가 포함되지 않는 경우에, 넘버링은 "신호 펩티드 배제" 또는 "SPE"로서 지칭된다. 가령, F328S는 SPE 넘버링에서 F309S와 동일한 아미노산에 대한 SPI 넘버링이다. 달리 지시되지 않으면, 모든 아미노산 넘버링은 도면 22에서 서열 번호: 19로서 제공된, 전장, 야생형 인간 인자 VIII 서열 (FVIII-FL-AA)에서 상응하는 아미노산을 지칭한다.
본원에서 설명된 바와 같이, 코돈-변경된 폴리뉴클레오티드는 선천적으로-코딩된 인자 VIII 구조체 (가령, 야생형 인간 코돈을 이용하여 동일한 인자 VIII 구조체를 인코딩하는 폴리뉴클레오티드)에 의해 제공된 인자 VIII 발현의 수준과 비교하여, 생체내에서 (가령, 유전자 요법 벡터의 일부로서 투여될 때) 유전자도입 인자 VIII의 증가된 발현을 제공한다. 본원에서 이용된 바와 같이, 용어 "증가된 발현"은 선천적으로-코딩된 인자 VIII 구조체가 투여된 동물의 혈액 내에 유전자도입 인자 VIII 활성의 수준과 비교하여, 코돈-변경된 폴리뉴클레오티드 인코딩 인자 VIII이 투여된 동물의 혈액 내에 유전자도입 인자 VIII 활성의 증가된 수준을 지칭한다. 활성 수준은 당해 분야에서 공지된 임의의 인자 VIII 활성을 이용하여 계측될 수 있다. 인자 VIII 활성을 결정하기 위한 예시적인 검정은 Technochrome FVIII 검정 (Technoclone, Vienna, Austria)이다.
일부 구체예에서, 증가된 발현은 선천적으로 코딩된 인자 VIII 폴리뉴클레오티드가 투여된 동물의 혈액 내에 유전자도입 인자 VIII 활성의 수준과 비교하여, 코돈-변경된 인자 VIII 폴리뉴클레오티드가 투여된 동물의 혈액 내에 최소한 25% 큰 유전자도입 인자 VIII 활성을 지칭한다. 일부 구체예에서, 증가된 발현은 선천적으로 코딩된 인자 VIII 폴리뉴클레오티드가 투여된 동물의 혈액 내에 유전자도입 인자 VIII 활성의 수준과 비교하여, 코돈-변경된 인자 VIII 폴리뉴클레오티드가 투여된 동물의 혈액 내에 최소한 50% 큰, 최소한 75% 큰, 최소한 100% 큰, 최소한 3-배 큰, 최소한 4-배 큰, 최소한 5-배 큰, 최소한 6-배 큰, 최소한 7-배 큰, 최소한 8-배 큰, 최소한 9-배 큰, 최소한 10-배 큰, 최소한 15-배 큰, 최소한 20-배 큰, 최소한 25-배 큰, 최소한 30-배 큰, 최소한 40-배 큰, 최소한 50-배 큰, 최소한 60-배 큰, 최소한 70-배 큰, 최소한 80-배 큰, 최소한 90-배 큰, 최소한 100-배 큰, 최소한 125-배 큰, 최소한 150-배 큰, 최소한 175-배 큰, 최소한 200-배 큰, 최소한 225-배 큰, 또는 최소한 250-배 큰 유전자도입 인자 VIII 활성을 지칭한다.
본원에서 설명된 바와 같이, 코돈-변경된 폴리뉴클레오티드는 선천적으로-코딩된 인자 VIII 구조체 (가령, 야생형 인간 코돈을 이용하여 동일한 인자 VIII 구조체를 인코딩하는 폴리뉴클레오티드)에 의해 제공된 벡터 생산의 수준과 비교하여 증가된 벡터 생산을 제공한다. 본원에서 이용된 바와 같이, 용어 "증가된 바이러스 생산"은 선천적으로-코딩된 인자 VIII 구조체로 접종된 세포 배양액에서 벡터 수율과 비교하여, 코돈-변경된 폴리뉴클레오티드 인코딩 인자 VIII로 접종된 세포 배양액에서 증가된 벡터 수율 (가령, 배양액 리터당 역가)을 지칭한다. 벡터 수율은 당해 분야에서 공지된 임의의 벡터 역가 검정을 이용하여 계측될 수 있다. 벡터 수율 (가령, AAV 벡터의)을 결정하기 위한 예시적인 검정은 AAV2 반전된 말단 반복을 표적으로 하는 qPCR이다 (Aurnhammer, Human Gene Therapy Methods: Part B 23:18-28 (2012)).
일부 구체예에서, 증가된 바이러스 생산은 동일한 유형의 배양액에서 선천적으로-코딩된 인자 VIII 구조체의 수율과 비교하여, 최소한 25% 큰 코돈-변경된 벡터 수율을 지칭한다. 일부 구체예에서, 증가된 벡터 생산은 동일한 유형의 배양액에서 선천적으로-코딩된 인자 VIII 구조체의 수율과 비교하여, 최소한 50% 큰, 최소한 75% 큰, 최소한 100% 큰, 최소한 3-배 큰, 최소한 4-배 큰, 최소한 5-배 큰, 최소한 6-배 큰, 최소한 7-배 큰, 최소한 8-배 큰, 최소한 9-배 큰, 최소한 10-배 큰, 최소한 15-배 큰, 또는 최소한 20-배 큰 코돈-변경된 벡터 수율을 지칭한다.
본원에서 이용된 바와 같이, 용어 "혈우병"은 감소된 혈액 응고 또는 응고에 의해 광범위하게 특징되는 일군의 질환 상태를 지칭한다. 혈우병은 유형 A, 유형 B, 또는 유형 C 혈우병, 또는 3개 질환 유형 모두의 복합을 지칭할 수 있다. 유형 A 혈우병 (A형 혈우병)은 인자 VIII (FVIII) 활성의 감소 또는 상실에 의해 유발되고, 그리고 혈우병 아형 중에서 가장 두드러진다. 유형 B 혈우병 (B형 혈우병)은 인자 IX (FIX) 응고 기능의 상실 또는 감소로부터 발생한다. 유형 C 혈우병 (C형 혈우병)은 인자 XI (FXI) 응고 활성에서 상실 또는 감소의 결과이다. A형과 B형 혈우병은 X 연관된 질환이고, 반면 C형 혈우병은 상염색체 연관된 질환이다. 혈우병에 대한 전통적인 치료는 응고 인자, 예를 들면, FVIII, Bebulin®-VH를 비롯한 FIX 및 FXI뿐만 아니라 FEIBA-VH, 데스모프레신, 그리고 혈장 주입의 예방적 및 주문형 투여 둘 모두를 포함한다.
본원에서 이용된 바와 같이, 용어 "FVIII 유전자 요법"은 혈우병과 연관된 하나 또는 그 이상의 증상 (가령, 임상적 인자)을 완화하거나, 축소하거나, 또는 이의 재발을 예방하기 위해, 인자 VIII를 인코딩하는 핵산을 환자에게 제공하는 임의의 치료적 접근법을 포함한다. 상기 용어는 혈우병을 앓는 개체의 건강을 유지하거나 또는 향상시키기 위해, 인자 VIII의 임의의 변형된 형태 (가령, 인자 VIII 변이체)를 비롯하여, 인자 VIII 분자를 인코딩하는 핵산을 포함하는 임의의 화합물, 약물, 시술, 또는 섭생을 투여하는 것을 포괄한다. 당업자는 FVIII 요법의 코스 또는 FVIII 치료적 작용제의 용량이 예로서, 본 발명에 따라 획득된 결과에 근거하여 변화될 수 있다는 것을 인지할 것이다.
본원에서 이용된 바와 같이, 용어 "우회로 요법"은 혈우병과 연관된 하나 또는 그 이상의 증상 (가령, 임상적 인자)을 완화하거나, 축소하거나, 또는 이의 재발을 예방하기 위해, 비-인자 VIII 지혈 작용제, 화합물 또는 응고 인자를 환자에게 제공하는 임의의 치료적 접근법을 포함한다. 비-인자 VIII 화합물 및 응고 인자는 인자 VIII 저해제 우회로 활성 (FEIBA), 재조합 활성화된 인자 VII (FVIIa), 프로트롬빈 복합체 농축물, 그리고 활성화된 프로트롬빈 복합체 농축물을 포함하지만 이들에 한정되지 않는다. 이들 비-인자 VIII 화합물 및 응고 인자는 재조합이거나 또는 혈장-유래될 수 있다. 당업자는 우회로 요법의 코스 또는 우회로 요법의 용량이 예로서, 본 발명에 따라 획득된 결과에 근거하여 변화될 수 있다는 것을 인지할 것이다.
본원에서 이용된 바와 같이, 인자 VIII 분자를 인코딩하는 핵산 및 전통적인 A형 혈우병 치료적 작용제를 투여하는 것을 포함하는 "복합 요법"은 혈우병과 연관된 하나 또는 그 이상의 증상 (가령, 임상적 인자)을 완화하거나, 축소하거나, 또는 이의 재발을 예방하기 위해, 인자 VIII 분자를 인코딩하는 핵산 및 인자 VIII 분자 및/또는 비-인자 VIII 지혈 작용제 (가령, 우회로 치료적 작용제) 둘 모두를 환자에게 제공하는 임의의 치료적 접근법을 포함한다. 상기 용어는 인자 VIII의 임의의 변형된 형태를 비롯하여, 인자 VIII 분자를 인코딩하는 핵산을 포함하는 임의의 화합물, 약물, 시술, 또는 섭생을 투여하는 것을 포괄하는데, 이것은 혈우병을 앓는 개체의 건강을 유지하거나 또는 향상시키는데 유용하고 본원에서 설명된 치료적 작용제 중에서 한 가지를 포함한다.
용어 "치료 효과량 또는 용량" 또는 "치료적으로 충분한 양 또는 용량" 또는 "효과적인 또는 충분한 양 또는 용량"은 이것이 투여되면 치료 효과를 산출하는 용량을 지칭한다. 가령, 혈우병을 치료하는데 유용한 약물의 치료 효과량은 혈우병과 연관된 하나 또는 그 이상의 증상을 예방하거나 또는 완화할 수 있는 양일 수 있다. 정확한 용량은 치료의 목적에 의존할 것이고, 그리고 공지된 기술을 이용하여 당업자에 의해 확인될 수 있을 것이다 (가령, Lieberman, Pharmaceutical Dosage Forms (vols. 13, 1992); Lloyd, The Art, Science and Technology of Pharmaceutical Compounding (1999); Pickar, Dosage Calculations (1999); 및 Remington: The Science and Practice of Pharmacy, 20th Edition, 2003, Gennaro, Ed., Lippincott, Williams & Wilkins를 참조한다).
본원에서 이용된 바와 같이, 용어 "유전자"는 폴리펩티드 사슬을 코딩하는 DNA 분자의 분절 (가령, 코딩 영역)을 지칭한다. 일부 구체예에서, 유전자는 폴리펩티드 사슬을 생산하는데 관련되는, 코딩 영역 직전에, 코딩 영역 이후에 및/또는 코딩 영역을 개재하는 영역 (가령, 조절 요소, 예를 들면, 프로모터, 인핸서, 폴리아데닐화 서열, 5'-비번역 영역, 3'-비번역 영역, 또는 인트론)에 의해 배치된다.
본원에서 이용된 바와 같이, 용어 "조절 요소"는 세포에서 코딩 서열의 발현을 제공하는 뉴클레오티드 서열, 예를 들면, 프로모터, 인핸서, 종결인자, 폴리아데닐화 서열, 인트론 등을 지칭한다.
본원에서 이용된 바와 같이, 용어 "프로모터 요소"는 코딩 서열의 발현을 제어하는데 보조하는 뉴클레오티드 서열을 지칭한다. 일반적으로, 프로모터 요소는 유전자의 번역 시작 부위의 5'에 위치된다. 하지만, 일정한 구체예에서, 프로모터 요소는 인트론 서열, 또는 코딩 서열의 3' 내에 위치될 수 있다. 일부 구체예에서, 유전자 요법 벡터에 유용한 프로모터는 표적 단백질의 선천적 유전자로부터 유래된다 (가령, 인자 VIII 프로모터). 일부 구체예에서, 유전자 요법 벡터에 유용한 프로모터는 표적 생물체의 특정 세포 또는 조직에서 발현에 특이적이다 (가령, 간-특이적 프로모터). 또 다른 구체예에서, 복수의 충분히 특징된 프로모터 요소 중에서 한 가지가 본원에서 설명된 유전자 요법 벡터에서 이용된다. 충분히 특징된 프로모터 요소의 무제한적 실례는 CMV 초기 프로모터, β-액틴 프로모터 및 메틸 CpG 결합 단백질 2 (MeCP2) 프로모터를 포함한다. 일부 구체예에서, 프로모터는 구조성 프로모터인데, 이것은 표적 단백질의 실제적으로 일정한 발현을 주동한다. 다른 구체예에서, 프로모터는 유도성 프로모터인데, 이것은 특정 자극 (가령, 특정 치료 또는 작용제에 노출)에 대한 응답으로 표적 단백질의 발현을 주동한다. AAV-매개된 유전자 요법을 위한 프로모터 설계의 리뷰를 위해, Gray et al. (Human Gene Therapy 22:1143-53 (2011))을 참조하고, 이의 내용은 모든 점에서 전체적으로 명시적으로 참조로서 편입된다.
본원에서 이용된 바와 같이, 용어 "벡터"는 핵산 (가령, 인자 VIII 유전자 요법 구조체를 인코딩하는)을 숙주 세포 내로 전달하는데 이용되는 임의의 운반제를 지칭한다. 일부 구체예에서, 벡터는 레플리콘을 포함하는데, 이것은 표적 핵산과 함께, 운반제를 복제하는 기능을 한다. 유전자 요법에 유용한 벡터의 무제한적 실례는 플라스미드, 파지, 코스미드, 인공 염색체 및 바이러스를 포함하는데, 이들은 생체내에서 복제의 자율적인 단위로서 기능한다. 일부 구체예에서, 벡터는 표적 핵산 (가령, 인자 VIII 변이체를 인코딩하는 코돈-변경된 폴리뉴클레오티드)을 도입하기 위한 바이러스 운반제이다. 유전자 요법에 유용한 많은 변형된 진핵 바이러스는 당해 분야에서 공지된다. 가령, 아데노 연관된 바이러스 (AAVs)가 인간 유전자 요법에서 이용하기 특히 충분히 적합한데, 그 이유는 인간이 상기 바이러스에 대한 자연 숙주이고, 선천적 바이러스가 임의의 질환에 기여하는 것으로 알려져 있지 않고, 그리고 상기 바이러스가 경미한 면역 반응을 유발하기 때문이다.
본원에서 이용된 바와 같이, 용어 "CpG 섬"은 CpG 디뉴클레오티드의 통계학적으로 상승된 밀도를 갖는, 폴리뉴클레오티드 내에 영역을 지칭한다. 본원에서 이용된 바와 같이, 폴리뉴클레오티드 (가령, 코돈-변경된 인자 VIII 단백질을 인코딩하는 폴리뉴클레오티드)의 영역은 200-염기쌍 윈도우 위에서: (i) 상기 영역이 50%보다 큰 GC 함량을 갖고, 그리고 (ii) 예상된 CpG 디뉴클레오티드마다 관찰된 CpG 디뉴클레오티드의 비율이 아래의 관계에 의해 규정된 바와 같이, 최소한 0.6이면, CpG 섬이다:
CpG 섬을 확인하기 위한 방법에 관한 추가 정보를 위해, Gardiner-Garden M. et al., J Mol Biol., 196(2):261-82 (1987)를 참조하고, 이것의 내용은 모든 점에서 명시적으로 본원에 전체적으로 참조로서 편입된다.
본원에서 이용된 바와 같이, 용어 "핵산"은 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 및 단일- 또는 이중 가닥 형태에서 이들의 중합체, 그리고 이들의 보체를 지칭한다. 상기 용어는 공지된 뉴클레오티드 유사체 또는 변형된 중추 잔기 또는 연쇄를 내포하는 핵산을 포괄하는데, 이들은 합성, 자연발생 및 비자연발생이고, 참고 핵산과 유사한 결합 성질을 갖고, 그리고 참고 뉴클레오티드와 유사한 방식으로 물질대사된다. 이런 유사체의 실례는 제한 없이, 포스포로티오에이트, 포스포라미데이트, 메틸 포스포네이트, 키랄-메틸 포스포네이트, 2-O-메틸 리보뉴클레오티드, 그리고 펩티드-핵산 (PNAs)을 포함한다.
용어 "아미노산"은 자연발생 및 비자연 아미노산뿐만 아니라 자연발생 아미노산과 유사한 방식으로 기능하는 아미노산 유사체 및 아미노산 모방체를 지칭한다. 자연발생 아미노산은 유전자 코드에 의해 인코딩된 아미노산뿐만 아니라 추후 변형되는 아미노산, 예를 들면, 히드록시프롤린, y-카르복시글루타메이트 및 O-포스포세린이다. 자연발생 아미노산은 예로서, D- 및 L-아미노산을 포함할 수 있다. 본원에서 이용된 아미노산은 또한, 비자연 아미노산을 포함할 수 있다. 아미노산 유사체는 자연 발생 아미노산과 동일한 기본 화학 구조, 다시 말하면, 수소에 결합된 임의의 탄소, 카르복실 기, 아미노 기, 그리고 R 기를 갖는 화합물, 예를 들면, 호모세린, 노르류신, 메티오닌 술폭시드, 또는 메티오닌 메틸 술포늄을 지칭한다. 이런 유사체는 변형된 R 기 (가령, 노르류신) 또는 변형된 펩티드 중추를 갖지만, 자연 발생 아미노산과 동일한 기본 화학 구조를 유지한다. 아미노산 모방체는 아미노산의 일반적인 화학 구조와 상이한 구조를 갖지만, 자연발생 아미노산과 유사한 방식으로 기능하는 화학적 화합물을 지칭한다. 아미노산은 본원에서, 그들의 통상적으로 알려진 3 문자 기호에 의해 또는 IUPAC-IUB Biochemical Nomenclature Commission에 의해 권장되는 1-문자 기호에 의해 지칭될 수 있다. 뉴클레오티드는 유사하게, 그들의 통상적으로 인정되는 1-문자 코드에 의해 지칭될 수 있다.
본원에서 돌연변이체 인자 VIII 구조체를 인코딩하는 뉴클레오티드 서열은 본원에서 제공된 코딩 서열과 동일할 수 있거나 또는 상이한 코딩 서열일 수 있고, 상기 서열은 유전자 코드의 중복성 또는 축중성의 결과로서, 본원에서 제공된 코딩 서열과 동일한 폴리펩티드를 인코딩한다. 당업자는 핵산 내에 각 코돈 (통상적으로, 메티오닌에 대한 유일 코돈인 AUG, 그리고 통상적으로, 트립토판에 대한 유일 코돈인 TGG 제외)이 기능적으로 동일한 분자를 산출하기 위해 변형될 수 있다는 것을 인지할 것이다. 따라서, 동일한 폴리펩티드를 인코딩하는 핵산의 각 변이는 발현 산물에 대하여 각 설명된 서열에 내포되지만, 실제 유전자 요법 구조체에 대하여는 그렇지 않다.
아미노산 서열에 관하여, 당업자는 인코딩된 서열 내에 단일 아미노산 또는 적은 비율의 아미노산을 변경, 부가 또는 결실하는 핵산 또는 펩티드 서열에 개별 치환, 결실 또는 부가가 이런 변경이 화학적으로 유사한 아미노산으로 아미노산의 치환을 유발하는 경우에, "보존성으로 변형된 변이체"라는 것을 인지할 것이다. 기능적으로 유사한 아미노산을 제공하는 보존성 치환 표는 당업자에게 알려져 있다. 이런 보존성으로 변형된 변이체는 본 발명의 다형성 변이체, 종간 동족체, 그리고 대립유전자에 더해지고 이들을 배제하지 않는다.
기능적으로 유사한 아미노산을 제공하는 보존성 아미노산 치환은 당업자에게 알려져 있다. 특정 아미노산, 예를 들면, 촉매성, 구조적, 또는 입체적으로 중요한 아미노산의 기능성에 따라, 아미노산의 상이한 군화가 서로에 대해 보존성 치환인 것으로 고려될 수 있다. 표 1은 아미노산의 전하 및 극성, 아미노산의 소수성, 아미노산의 표면 노출/구조적 본성, 그리고 아미노산의 이차 구조 성향에 근거하여 보존성 치환인 것으로 고려되는 아미노산의 군화를 제공한다.
표 1. 단백질 내에 잔기의 기능성에 근거된 보존성 아미노산 치환의 군화
중요한 특질 | 보존성 군화 |
전하/극성 | 1. H, R 및 K 2. D 및 E 3. C, T, S, G, N, Q 및 Y 4. A, P, M, L, I, V, F 및 W |
소수성 | 1. D, E, N, Q, R 및 K 2. C, S, T, P, G, H 및 Y 3. A, M, I, L, V, F 및 W |
구조/표면 노출 | 1. D, E, N, Q, H, R 및 K 2. C, S, T, P, A, G, W 및 Y 3. M, I, L, V 및 F |
이차 구조 성향 | 1. A, E, Q, H, K, M, L 및 R 2. C, T, I, V, F, Y 및 W 3. S, G, P, D 및 N |
진화적 보존 | 1. D 및 E 2. H, K 및 R 3. N 및 Q 4. S 및 T 5. L, I 및 V 6. F, Y 및 W 7. A 및 G 8. M 및 C |
2개 또는 그 이상의 핵산 또는 펩티드 서열의 맥락에서 용어 "동일한," 또는 "동일성" 퍼센트는 아래에 설명된 디폴트 파라미터를 갖는 BLAST 또는 BLAST 2.0 서열 비교 알고리즘을 이용하여, 또는 수동 정렬과 시각적 검사에 의해 계측될 때 동일하거나 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정된 백분율 (즉, 비교 윈도우 또는 지정된 영역에 걸쳐 최고 상응을 위해 비교되고 정렬될 때, 특정된 영역에 걸쳐 약 60% 동일성, 바람직하게는 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 더욱 높은 동일성)을 갖는 2개 또는 그 이상의 서열 또는 하위서열을 지칭한다.
당해 분야에서 공지된 바와 같이, 다수의 상이한 프로그램이 단백질 (또는 아래에 논의된 바와 같이 핵산)이 공지된 서열에 서열 동일성 또는 유사성을 갖는 지를 확인하는데 이용될 수 있다. 서열 동일성 및/또는 유사성은 Smith & Waterman, Adv. Appl. Math., 2:482 (1981)의 국부 서열 동일성 알고리즘, Needleman & Wunsch, J. Mol. Biol., 48:443 (1970)의 서열 동일성 정렬 알고리즘, Pearson & Lipman, Proc. Natl. Acad. Sci. U.S.A., 85:2444 (1988)의 유사성 방법, 이들 알고리즘의 컴퓨터화 실행 (Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Drive, Madison, WI에서 GAP, BESTFIT, FASTA 및 TFASTA), Devereux et al., Nucl. Acid Res., 12:387-395 (1984)에 의해 설명된 최고 적합 서열 프로그램 (바람직하게는, 디폴트 세팅을 이용), 또는 검사를 포함하지만 이들에 한정되지 않는, 당해 분야에서 공지된 표준 기술을 이용하여 결정된다. 바람직하게는, 동일성 퍼센트는 다음의 파라미터에 근거하여 FastDB에 의해 계산된다: 1의 부정합 페널티; 1의 갭 페널티; 0.33의 갭 크기 페널티; 및 30의 연결 페널티, "Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149 (1988), Alan R. Liss, Inc, 이들 모두 참조로서 편입됨.
유용한 알고리즘의 실례는 PILEUP이다. PILEUP는 진행성, 쌍별 정렬을 이용하여 일군의 관련된 서열로부터 복수 서열 정렬을 창출한다. 이것은 또한, 정렬을 창출하는데 이용된 군집화 관계를 보여주는 나무를 플롯팅할 수 있다. PILEUP는 Feng & Doolittle, J. Mol. Evol. 35:351-360 (1987)의 진행성 정렬 방법의 단순화를 이용하고; 상기 방법은 Higgins & Sharp CABIOS 5:151-153 (1989)에 의해 설명된 방법과 유사한데, 이들 둘 모두 참조로서 편입된다. 유용한 PILEUP 파라미터는 3.00의 디폴트 갭 가중, 0.10의 디폴트 갭 길이 가중, 그리고 가중된 단부 갭을 포함한다.
유용한 알고리즘의 다른 실례는 참조로서 편입되는 Altschul et al., J. Mol. Biol. 215, 403-410, (1990); Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997); 및 Karlin et al., Proc. Natl. Acad. Sci. U.S.A. 90:5873-5787 (1993)에서 설명된 BLAST 알고리즘이다. 특히 유용한 BLAST 프로그램은 Altschul et al., Methods in Enzymology, 266:460-480 (1996); http://blast.wustl/edu/blast/ README.html]으로부터 획득된 WU-BLAST-2 프로그램이다. WU-BLAST-2는 여러 검색 파라미터를 이용하는데, 이들 중에서 대부분은 디폴트 값에 세팅된다. 조정가능한 파라미터는 다음의 값으로 세팅된다: 중복 스팬 =1, 중복 분율 = 0.125, 단어 역치 (T) = 11. HSP S 및 HSP S2 파라미터는 동적 값이고, 그리고 특정 서열의 구성 및 관심되는 서열이 검색되는 특정 데이터베이스의 구성에 따라 프로그램 그 자체에 의해 확립된다; 하지만, 이들 값은 감수성을 증가시키기 위해 조정될 수 있다.
추가 유용한 알고리즘은 참조로서 편입되는 Altschul et al., Nucl. Acids Res., 25:3389-3402에 의해 보고된 바와 같은 갭트 BLAST이다. 갭트 BLAST는 BLOSUM-62 치환 점수; 9로 세팅된 역치 T 파라미터; 갭이 없는 연장을 촉발하기 위한 2-히트 방법; 10+k의 비용으로 k의 충전 갭 길이; 16에 세팅된 Xu, 그리고 데이터베이스 검색 시기의 경우 40 및 알고리즘의 출력 시기의 경우 67에 세팅된 Xg를 이용한다. 갭트 정렬은 ~22 비트에 상응하는 점수에 의해 촉발된다.
% 아미노산 서열 동일성 값은 정렬된 영역 내에 "더욱 긴" 서열의 잔기의 총수에 의해 나눗셈된 정합 동일한 잔기의 숫자에 의해 결정된다. "더욱 긴" 서열은 정렬된 영역 내에 가장 많은 실제 잔기를 갖는 것이다 (정렬 점수를 최대화하기 위해 WU-Blast-2에 의해 도입된 갭은 무시된다). 유사한 방식으로, 확인된 폴리펩티드의 코딩 서열에 대하여 "핵산 서열 동일성 퍼센트 (%)"는 세포 주기 단백질의 코딩 서열 내에 뉴클레오티드 잔기와 동일한, 후보 서열 내에 뉴클레오티드 잔기의 백분율로서 규정된다. 바람직한 방법은 각각, 1 및 0.125에 세팅된 중복 스팬 및 중복 분율을 갖는 디폴트 파라미터에 세팅된 WU-BLAST-2의 BLASTN 모듈을 활용한다.
정렬은 정렬되는 서열 내에 갭의 도입을 포함할 수 있다. 이에 더하여, 도면 2의 서열 (서열 번호:1)에 의해 인코딩된 단백질보다 더욱 많은 또는 더욱 적은 아미노산을 내포하는 서열의 경우에, 한 구체예에서, 서열 동일성의 백분율은 아미노산 또는 뉴클레오티드의 총수에 관계하여 동일한 아미노산 또는 뉴클레오티드의 숫자에 근거하여 결정될 것으로 이해된다. 따라서, 한 구체예에서, 예로서 도면 2에서 도시된 서열 (서열 번호:1)보다 짧은 서열의 서열 동일성은 아래에 논의된 바와 같이, 더욱 짧은 서열에서 뉴클레오티드의 숫자를 이용하여 결정될 것이다. 동일성 퍼센트 계산에서 상대적 가중은 서열 변이의 다양한 현성, 예를 들면, 삽입, 결실, 치환 등에 배정되지 않는다.
한 구체예에서, 단지 동일성만 양으로 (+1) 채점되고, 그리고 갭을 포함하는 서열 변이의 모든 형태는 "0"의 값이 배정되는데, 이것은 서열 유사성 계산을 위해 아래에 설명된 바와 같은 가중된 척도 또는 파라미터에 대한 필요를 배제시킨다. 서열 동일성 퍼센트는 예로서, 정합 동일한 잔기의 숫자를 정렬된 영역 내에 "더욱 짧은" 서열의 잔기의 총수로 나누고 100을 곱함으로써 계산될 수 있다. "더욱 긴" 서열은 정렬된 영역 내에 가장 많은 실제 잔기를 갖는 것이다.
용어 "대립형질 변이체"는 특정 유전자 좌위에서 유전자의 결정다형뿐만 아니라 이들 유전자의 mRNA 전사체로부터 유래된 cDNAs, 그리고 이들에 의해 인코딩된 폴리펩티드를 지칭한다. 용어 "바람직한 포유류 코돈"은 다음의 목록에서 선택되는, 포유류 세포에서 발현되는 단백질에서 가장 빈번하게 이용되는, 아미노산을 인코딩하는 코돈의 세트 중에서 코돈의 부분집합을 지칭한다: Gly (GGC, GGG); Glu (GAG); Asp (GAC); Val (GTG, GTC); Ala (GCC, GCT); Ser (AGC, TCC); Lys (AAG); Asn (AAC); Met (ATG); Ile (ATC); Thr (ACC); Trp (TGG); Cys (TGC); Tyr (TAT, TAC); Leu (CTG); Phe (TTC); Arg (CGC, AGG, AGA); Gln (CAG); His (CAC); 및 Pro (CCC).
본원에서 이용된 바와 같이, 용어 "코돈-변경된"은 폴리펩티드 (가령, 인자 VIII 변이체 단백질)를 인코딩하는 선천적 폴리뉴클레오티드의 최소한 하나의 코돈이 폴리뉴클레오티드 서열의 성질을 향상시키기 위해 변화된, 상기 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 지칭한다. 일부 구체예에서, 향상된 성질은 폴리펩티드를 코딩하는 mRNA의 증가된 전사, mRNA의 증가된 안정성 (가령, 향상된 mRNA 반감기), 폴리펩티드의 증가된 번역 및/또는 벡터 내에 폴리뉴클레오티드의 증가된 포장을 증진한다. 향상된 성질을 달성하는데 이용될 수 있는 변경의 무제한적 실례는 특정 아미노산에 대한 코돈의 사용빈도 및/또는 분포를 변화시키고, 전역 및/또는 국부 GC 함량을 조정하고, AT-풍부한 서열을 제거하고, 반복된 서열 요소를 제거하고, 전역 및/또는 국부 CpG 디뉴클레오티드 함량을 조정하고, 잠적 조절 요소 (가령, TATA 상자 및 CCAAT 상자 요소)를 제거하고, 인트론/엑손 스플라이스 부위를 제거하고, 조절 서열을 향상시키고 (가령, 코자크 공통 서열의 도입), 그리고 전사된 mRNA 내에 이차 구조 (가령, 스템-루프)를 형성할 수 있는 서열 요소를 제거하는 것을 포함한다.
본원에서 논의된 바와 같이, 본원에서 발명의 성분을 지칭하는 다양한 명명법이 있다. "CS-숫자" (가령, "CS04", "CS01", "CS23" 등)는 변이체를 비롯하여, FVIII 폴리펩티드를 인코딩하는 코돈 변경된 폴리뉴클레오티드 및/또는 인코딩된 폴리펩티드를 지칭한다. 가령, CS01-FL은 CS01 폴리뉴클레오티드 서열에 의해 인코딩된 전장 코돈 변경된 CS01 폴리뉴클레오티드 서열 또는 아미노산 서열을 지칭한다 (때때로, 아미노산 서열의 경우 "CS01-FL-AA" 및 핵산 서열의 경우 "CS01-FL-NA"로서 본원에서 지칭됨). 유사하게, "CS01-LC"는 FVIII 폴리펩티드의 경쇄를 인코딩하는 코돈 변경된 핵산 서열 ("CS01-LC-NA") 또는 CS01 폴리뉴클레오티드 서열에 의해 인코딩된 FVIII 경쇄의 아미노산 서열 (때때로, "CS01-LC-AA"로서 본원에서 또한 지칭됨)을 지칭한다. 유사하게, CS01-HC, CS01-HC-AA 및 CS01-HC-NA는 FVIII 중쇄에서와 동일하다. 당업자에 의해 인지되는 바와 같이, 단지 코돈-변경된 구조체, 예를 들면, CS01, CS04, CS23 등 (가령, 이들은 Refacto와 비교하여 추가 아미노산 치환을 내포하지 않는다)의 경우에, 아미노산 서열은 동일할 것인데, 그 이유는 아미노산 서열이 코돈 최적화에 의해 변경되지 않기 때문이다. 따라서, 본 발명의 서열 구조체는 CS01-FL-NA, CS01-FL-AA, CS01-LC-NA, CS01-LC-AA, CS01-HC-AA, CS01-HC-NA, CS04-FL-NA, CS04-FL-AA, CS04-LC-NA, CS04-LC-AA, CS04-HC-AA, CS04-HC-NA, CS23-FL-NA, CS23-FL-AA, CS23-LC-NA, CS23-LC-AA, CS23-HC-AA 및 CS23-HC-NA를 포함하지만 이들에 한정되지 않는다.
이러한 명명법은 도면 13에서 보여 지는 바와 같은 글리코실화 펩티드에도 적용되고, 따라서 "NGA1-AA"는 아미노산 서열을 지칭하고 NGA1-NA는 핵산 서열을 지칭한다.
본 발명은 또한, 적절한 명명법을 갖는, 아래에 설명된 바와 같은 추가 새로운 인자 VIII 변이체를 포함한다.
III. 코돈-변경된 인자 VIII 변이체
일부 구체예에서, 본 발명은 인자 VIII 변이체를 인코딩하는 코돈-변경된 폴리뉴클레오티드를 제공한다. 이들 코돈-변경된 폴리뉴클레오티드는 AAV-기초된 유전자 요법 구조체에서 투여될 때, 인자 VIII의 현저하게 향상된 발현을 제공한다. 코돈-변경된 폴리뉴클레오티드는 또한, 전통적으로 코돈-최적화된 구조체와 비교하여, 향상된 AAV-비리온 포장을 보여준다. 실시예 2 및 실시예 4에서 증명된 바와 같이, 출원인은 인간 야생형 인자 VIII 중쇄와 경쇄, 그리고 생체내에서 활성 FVIIIa 단백질의 성숙을 조장하는 퓨린 개열 부위를 내포하는 짧은, 14개 아미노산, B-도메인 치환된 링커 ("SQ" 링커)를 갖는 인자 VIII 폴리펩티드를 인코딩하는 3개의 코돈-변경된 폴리뉴클레오티드 (CS01-FL-NA, CS04-FL-NA 및 CS23-FL-NA)의 발견을 통해 이들 이점을 달성하였다. 실시예 4에서 더욱 증명된 바와 같이, 인코딩된 인자 VIII 분자 내로 F328S, X5 및 X1 아미노산 돌연변이의 다양한 조합의 통합은 인자 VIII 활성의 생체내 발현을 더욱 증가시켰다.
한 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 최소한, 인자 VIII 중쇄 및 인자 VIII 경쇄를 인코딩하는 CS01, CS04 또는 CS23 내에 서열 (각각, 서열 번호 13, 1 및 20)과 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 당해 분야에서 공지된 바와 같이, 인자 VIII의 B-도메인은 생체내 활성에 불필요하다. 따라서, 일부 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 인자 VIII B-도메인을 완전하게 결여한다. 일부 구체예에서, 선천적 인자 VIII B-도메인은 퓨린 개열 부위를 내포하는 짧은 아미노산 링커, 예를 들면, CS01, CS04 또는 CS23의 아미노산 760-773으로 구성되는 "SQ" 링커 (각각, 서열 번호 2, 2 및 21) 구조체로 대체된다. "SQ" 링커는 BDLO04로서 또한 지칭된다 (도면 6에서 도시된, 아미노산 서열의 경우 -AA 및 뉴클레오티드 서열의 경우 -NA).
한 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 중쇄와 경쇄는 각각, 인간 인자 VIII 중쇄와 경쇄이다. 다른 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 중쇄와 경쇄는 다른 포유동물로부터 중쇄와 경쇄 서열 (가령, 돼지 인자 VIII)이다. 또 다른 구체예에서, 인자 VIII 중쇄와 경쇄는 키메라 중쇄와 경쇄 (가령, 인간 및 두 번째 포유류 서열의 조합)이다. 또 다른 구체예에서, 인자 VIII 중쇄와 경쇄는 다른 포유동물로부터 중쇄와 경쇄의 인간화 버전, 예를 들면, 인간에 투여될 때 결과의 펩티드의 면역원성을 감소시키기 위해 선별된 위치에서 인간 잔기가 치환되는 다른 포유동물로부터 중쇄와 경쇄 서열이다.
인간 유전자의 GC 함량은 25% 이하로부터 90% 이상까지 폭넓게 변한다. 하지만, 일반적으로, 더욱 높은 GC 함량을 갖는 인간 유전자는 더욱 높은 수준에서 발현된다. 가령, Kudla et al. (PLoS Biol., 4(6):80 (2006))은 유전자의 GC 함량을 증가시키는 것이 일차적으로, 전사를 증가시키고 mRNA 전사체의 더욱 높은 항정 상태 수준을 달성함으로써, 인코딩된 폴리펩티드의 발현을 증가시킨다는 것을 증명한다. 일반적으로, 코돈-최적화된 유전자 구조체의 원하는 GC 함량은 60%와 동등하거나 또는 이보다 크다. 하지만, 선천적 AAV 유전체는 대략 56%의 GC 함량을 갖는다.
따라서, 일부 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 선천적 AAV 비리온의 GC 함량 (가령, 대략 56% GC)에 더욱 가깝게 정합하는 CG 함량을 갖는데, 이것은 포유류 세포에서 발현을 위해 전통적으로 코돈-최적화되는 폴리뉴클레오티드의 바람직한 CG 함량 (가령, 60% GC에서 또는 이를 초과)보다 낮다. 실시예 1에서 개설된 바와 같이, 약 56%의 GC 함량을 갖는 CS04-FL-NA (서열 번호: 1)은 더욱 높은 GC 함량을 갖는 유사하게 코돈-변경된 코딩 서열과 비교하여, 향상된 비리온 포장을 갖는다.
따라서, 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 60%보다 적다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 59%보다 적다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 58%보다 적다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 57%보다 적다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56% 이내이다.
일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 54% 내지 59%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 55% 내지 59%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56% 내지 59%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 54% 내지 58%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 55% 내지 58%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56% 내지 58%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 54% 내지 57%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 55% 내지 57%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56% 내지 57%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 54% 내지 56%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 55% 내지 56%이다.
일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56±0.5%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56±0.4%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56±0.3%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56±0.2%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56±0.1%이다. 일부 구체예에서, 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드의 전반적인 GC 함량은 56%이다.
A. 인자 VIII 아미노산 치환
본원에서 설명된 인자 VIII 구조체의 AAV-벡터 기초된 발현의 효율을 더욱 증가시키기 위해, 인자 VIII의 분비를 향상시키고, 이의 비활성도를 증가시키고 및/또는 이의 안정성을 증강하는 것으로 알려진 아미노산 치환이 일부 실행에서 더욱 통합된다. 소정의 벡터 용량에서 FVIII 활성의 혈장 수준을 증가시키는 다수의 잠재적 변이체가 확인되었다. 이들 변이체는 더욱 효율적인 신호 펩티드, BiP 상호작용을 예방하는 아미노산 치환, 더욱 효율적으로 분비된 인자 VIII 오르소로그 (가령, 돼지 인자 VIII)와 닮은 아미노산 치환, 단일 사슬 인자 VIII 변이체, 그리고 인자 VIII를 안정시키고 및/또는 아단위 해리를 감소시키는 아미노산 치환을 갖는 것들을 포함한다.
A1 및 C2 도메인 사이의 인터페이스에서 위치된, 잔기 A108, R121 및 L2302 (SPE)의 돌연변이는 인자 VIII의 안정성을 증가시킨다. 가령, A108I 아미노산 치환은 도메인간 공간을 더욱 잘 채우고, 상호작용을 안정시키는 소수성 잔기를 도입한다. 유사하게, R121C/L2302C (SPE) 이중 아미노산 치환은 A1-C2 도메인에 걸쳐 있는 이황화 결합을 도입하고, 상호작용을 더욱 안정시킨다. 종합하면, 3개 아미노산 치환 모두 인자 VIII의 열 안정성을 3 내지 4-배 증가시킨다. 리뷰를 위해, Wakabayashi et al., J Biol Chem. 286(29):25748-55 (2011) 및 Wakabayashi et al., Thromb Haemost. 10(3):492-95 (2012)를 참조한다. 따라서, 일부 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 A108I 및/또는 R121C/L2302C 아미노산 치환을 포함한다.
인자 VIII의 칼슘 결합 도메인 내에 위치된 E113의 돌연변이 (SPE)는 특정한 FVIII 응고 활성을 증가시킨다. 가령, E113A는 인자 IXa에 대한 증가된 FVIII 친화성을 통해 FXase 형성을 증가시키는 것으로 보인다. 구체적으로, E113A 아미노산 치환은 특이적 FVIII 응고 활성을 2-배 증가시키고 인자 IXa에 대한 친화성을 4-배 증가시킨다 (Biochemistry, 41:8485 (2002); J. Biol. Chem., 279:12677 (2004); and Biochemistry, 44:10298 (2005)). 따라서, 일부 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 E113A 아미노산 치환을 포함한다.
인자 VIII APC 개열 부위를 둘러싸는 하나 또는 그 이상의 아미노산 잔기 (잔기 331-341 (SPE))의 치환은 FVIII 활성에 영향을 주지 않으면서, 활성화된 단백질 C에 의한 인자 VIIIa 비활성화를 감소시킨다. 가령, PQL333-335VDQ (SPE) 아미노산 치환은 인자 VIII 비활성화를 16-배 감소시킨다. 유사하게, MKN336-339GNQ 아미노산 치환은 인자 VIII 비활성화를 9-배 감소시킨다. 합동될 때, 2개의 삼중 아미노산 치환 (가령, PQLRMKN333-339VDQRGNQ) (각각, 서열 번호 34 및 35)은 인자 VIII 비활성화를 100-배 감소시킨다 (J. Biol. Chem., 282:20264 (2007). 따라서, 일부 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 PQL333-335VDQ 및/또는 MKN337-339GNQ (SPE) 아미노산 치환을 포함한다.
A2 도메인 인터페이스 내에 돌연변이 역시 인자 VIII 안정성을 증가시킨다. 구체적으로, A1-A2 및 A2-A3 도메인 인터페이스에서 하전된 잔기를 돌연변이시키는 것은 인자 VIIIa에서 A2 아단위의 안정성 및 체류를 증가시킨다. 가령, D519, E665 및 E1984의 V 또는 A로의 돌연변이는 인자 VIII에서 2-배까지 증가된 안정성 및 인자 VIIIa에서 5-배까지의 안정성을 산출한다. 구체적으로, D519A/E665V 아미노산 치환은 안정성에서 3-배 증가를 제공한다; D519V/E665V 아미노산 치환은 안정성에서 2-배 증가, A2 해리에서 8-배 감소, 그리고 트롬빈 산출 잠재력에서 2-4-배 증가를 제공한다; D519V/E1984A 아미노산 치환은 안정성에서 2-배 증가를 제공한다; 그리고 D519V/E665V/E1984A 아미노산 치환은 안정성에서 2-배 증가를 제공한다 (Blood 112:2761-69 (2008); J. Thromb. Haemost., 7:438-44 (2009)). 따라서, 일부 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 D519A/V, E665A/V 및 E1984A/V 아미노산 치환 중에서 하나 또는 그 이상을 포함한다.
별개로 또는 본원에서 설명된 다른 변이체와 합동으로 포함될 수 있는 다수의 특정한 돌연변이가 본 발명과 특히 관련된다. 이들 변이체는 본원에서 아래와 같이 세트로서 코딩된다: "m1"은 단일 아미노산 변화를 지칭하고, "m2"는 5개 아미노산 변이체의 한 세트이고, "m3"은 7개 아미노산의 결실 및 폴리펩티드 링커와 중쇄 사이의 접합부에 걸치는 6개 아미노산의 삽입의 조합이고, "m4"는 m1 단일 돌연변이 및 m5 이중 돌연변이의 조합이고, 그리고 "m5"는 2개 시스테인 제거의 한 세트이다. 이들 돌연변이는 아래에 설명된다. 이들은 단독으로 또는 다른 변이체와 합동으로 임의의 특정 구조체 내에 포함될 수 있고, 그리고 이들은 그에 맞춰 코딩된다. 가령, "m23"은 본원에서 개설된 바와 같이, 특정 골격 위에 m2 및 m3 변이체의 조합이다; 따라서 "CS01m23-FL-NA" 또는 "CS01-FL-NAm23"은 m2 및 m3 돌연변이를 인코딩하는 뉴클레오티드가 포함된 CS01 코돈-변경된 폴리뉴클레오티드 서열을 지칭하고, 그리고 "CS01m23-FL-AA" 또는 "CS01-FL-AAm23"은 이의 아미노산 서열을 지칭한다. CS01이 코돈-변경되지만, Refacto의 아미노산 서열을 변화시키지는 않기 때문에, 이들은 CS01-FL-AA의 Refacto 아미노산 서열 (서열 번호: 2)과 비교하여, 아미노산 수준에서 돌연변이로서 생각될 수 있다.
많은 구체예에서, 본 발명의 폴리펩티드는 "m1" 변이체가 포함되도록 만들어진다. BiP와 상호작용하는 A1 도메인에서 11개 아미노산 소수성 β-시트 내에서 돌연변이는 인자 VIII의 분비를 증가시킨다. 가령, 포켓 내에 F328S (SPI, F309S SPE) 아미노산 치환은 인자 VIII 분비를 3-배 증가시켰다. F328S 변이체는 본원에서 "m1" 돌연변이로서 지칭되고 중쇄 범위 안에 있다. 다시 한 번, 본원에서 설명된 바와 같이, 변이체의 숫자는 신호 펩티드를 포함하여, "신호 펩티드 포함" 또는 "SPI"로서 행위되거나, 또는 처리된 최종 단백질 서열로부터 시작하여, "신호 펩티드 배제" 또는 "SPE"로서 행위될 수 있다. 따라서, SPI 넘버링을 이용하면, 돌연변이 F328S는 F309 SPE 돌연변이체와 동일하다. 일반적으로, 본 명세서는 SPI 넘버링을 이용하지만, 당업자에 의해 인지되는 바와 같이, 양쪽 넘버링 시스템은 동일한 돌연변이(들)를 유발한다.
따라서, CS01-FL-AAm1, CS01-HC-AAm1, CS04-FL-AAm1, CS04-HC-AAm1 CS23-FL-AAm1, CS23-HC-AAm1, CS40-FL-AAm1 및 CS40-HC-AAm1 (이들 모두 동일한 상응하는 단백질 서열을 인코딩한다)을 비롯하여, m1 돌연변이를 포함하는 폴리펩티드는 본 발명에 포함된다.
이에 더하여, m1 돌연변이를 포함하는 폴리펩티드 서열뿐만 아니라 m1 돌연변이를 갖는 단백질을 인코딩하는 코돈-변경된 폴리뉴클레오티드 서열, 예를 들면, CS01-FL-NAm1, CS01-HC-NAm1, CS04-FL-NAm1, CS04-HC-NAm1, CS23-FL-NAm1, CS23-HC-NA-m1, CS40-FL-NAm1 및 CS40-HC-NAm1은 본 발명에 포함된다.
많은 구체예에서, 본 발명의 폴리펩티드는 "m2" 변이체 세트가 포함되도록 만들어지는데, 이것은 I105V/A127S/G151K/M166T/L171P 돌연변이이다 (SPI 넘버링; (SPE 넘버링은 각각, V86I/S108A/K132G/T147M/P152L). m2 돌연변이 세트는 B-도메인 결실된 유전자 요법 구조체에서 상응하는 인간 아미노산에 대한 돼지 아미노산 82-176의 치환이 HEK293 세포에서 발현될 때 인자 VIII 활성을 증가시켰다는 사실에 근거된다 (W. Xiao, 통신). 동일 저자. 인간 BDD-FVIII 구조체 내로 단일 돼지 아미노산의 복귀 돌연변이는 이러한 현상에 기여하는 A1 도메인 내에 5개 아미노산을 확인하였다: I105V, A127S, G151K, M166T 및 L171P (SPI). 인간 구조체 내로 이들 돌연변이의 조합의 도입은 더욱 큰 돼지 치환의 향상된 활성을 개괄하였다. 동일 저자. 따라서, 일부 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 I105V, A127S, G151K, M166T 및 L171P에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함하는데, 전체 5개 아미노산 세트, m2가 많은 구체예에서 특정 용도를 발견한다. m1 돌연변이에서처럼, m2 변이체는 중쇄에 있고, 그리고 따라서, 본 발명은 CS01-FL-AAm2, CS01-HC-AAm2, CS04-FL-AAm2, CS04-HC-AAm2, CS23-FL-AAm2, CS23-HC-AAm2, CS40-FL-AAm2 및 CS40-HC-AAm2 (이들 모두 동일한 상응하는 단백질 서열을 인코딩한다)를 비롯하여, m2 돌연변이를 포함하는 폴리펩티드를 포함한다.
이에 더하여, m2 돌연변이를 포함하는 폴리펩티드 서열뿐만 아니라 m2 돌연변이를 갖는 단백질을 인코딩하는 코돈-변경된 폴리뉴클레오티드 서열, 예를 들면, CS01-FL-NAm2, CS01-HC-NAm2, CS04-FL-NAm2, CS04-HC-NAm2, CS23-FL-NAm2, CS23-HC-NA-m2, CS40-FL-NAm2 및 CS40-HC-NAm2는 본 발명에 포함된다.
추가 구체예에서, 본 발명의 폴리펩티드 및 폴리뉴클레오티드는 m3 돌연변이를 포함한다. m3은 인터페이스에 가깝게 도입된 추가 글리코실화 부위를 도입하는 HC-B 도메인 인터페이스를 교차하여 6개 아미노산으로 7개 아미노산의 치환이다. 따라서, 일부 구체예에서, m3은 FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPRSF755-761의 결실 및 N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입이다 (가령, AIEPRSF755-761TTYVNRSL) (서열 번호: 33으로서 개시된 "TTYVNRSL"). 서열 번호: 19에 비하여, 잔기 AIEPR755-759는 중쇄의 단부 범위에 들어가고, 반면 잔기 S760 및 F761은 B-도메인 범위에 들어간다. 일부 구체예에서, FVIII B-도메인이 결실되거나, 절두되거나, 또는 대체되는 경우에, 잔기 S760 및 F761은 돌연변이되는 근원적인 아미노산 서열 내에 존재할 수 없다. 따라서, 일부 구체예에서, m3은 FVIII-FL-AA (서열 번호: 19)에 비하여, 아미노산 AIEPR755-759의 결실 및 N754 뒤에 아미노산 TTYVNRSL (서열 번호: 33)의 삽입이다 (가령, AIEPR755-759TTYVNRSL (서열 번호: 33으로서 개시된 "TTYVNRSL")
m3 변이체는 중쇄 및 B 도메인 사이의 접합부에 있고, 그리고 따라서, 본 발명은 CS01-FL-AAm3, CS01-HC-AAm3, CS04-FL-AAm3, CS04-HC-AAm3, CS23-FL-AAm3, CS23-HC-AAm3, CS40-FL-AAm3 및 CS40-HC-AAm3 (이들 모두 동일한 상응하는 단백질 서열을 인코딩한다)을 비롯하여, m3 돌연변이를 포함하는 폴리펩티드를 포함한다.
이에 더하여, m3 돌연변이를 포함하는 폴리펩티드 서열뿐만 아니라 m3 돌연변이를 갖는 단백질을 인코딩하는 코돈-변경된 폴리뉴클레오티드 서열, 예를 들면, CS01-FL-NAm3, CS01-HC-NAm3, CS04-FL-NAm3, CS04-HC-NAm3, CS23-FL-NAm3, CS23-HC-NA-m3, CS40-FL-NAm3 및 CS40-HC-NAm3은 본 발명에 포함된다.
추가 구체예에서, 본 발명의 폴리펩티드 및 폴리뉴클레오티드는 m4 돌연변이를 포함한다. 인자 VIII에서 C1899-C1903 이황화 결합의 제거 또한, 분비를 증가시켰다. 게다가, 인자 VIII 분비에서 증가는 F328S (SPI, F309S SPE) 및 C1918G/C1922G 아미노산 치환의 조합의 경우에 부가적이다 (Miao et al., Blood, 103:3412-19 (2004); Selvaraj et al., J. Thromb. Haemost., 10:107-15 (2012)). 따라서, 일부 구체예에서, 인코딩된 인자 VIII 폴리펩티드는 m4 돌연변이를 포함하는데, 이것은 F328S (SPI, F309S SPE) 및 C1918G/C1922G (SPI) 아미노산 치환이다. F328S 변이체가 중쇄에 있고, 그리고 2개의 시스테인 변이체가 경쇄에 있기 때문에, m4 돌연변이를 포함하는 폴리펩티드 서열은 CS01-FL-AAm4, CS01-HC-AAm4, CS01-LC-AAm4, CS04-FL-AAm4, CS04-HC-AAm4, CS04-LC-AAm4, CS23-FL-AAm4, CS23-HC-AAm4 및 CS23-LC-AAm4이다.
이에 더하여, m4 돌연변이를 포함하는 폴리펩티드 서열뿐만 아니라 m4 돌연변이를 갖는 단백질을 인코딩하는 코돈-변경된 폴리뉴클레오티드 서열, 예를 들면, CS01-FL-NAm4, CS01-HC-NAm4, CS01-LC-NAm4, CS04-FL-NAm4, CS04-HC-NAm4, CS04-LC-NAm4, CS23-FL-NAm4, CS23-HC-NAm4, CS23-LC-NAm4, CS40-FL-NA-m4, CS40-HC-NA-m4 및 CS40-LC-NA-m4는 본 발명에 포함된다.
추가 구체예에서, 본 발명의 폴리펩티드 및 폴리뉴클레오티드는 m5 돌연변이를 포함한다. 상기와 같이, 인자 VIII에서 C1899-C1903 이황화 결합의 제거 또한, 분비를 증가시켰다. 경쇄 내에 내포된 C1918G/C1922G (SPI) 아미노산 치환은 본원에서 m5 돌연변이 세트로서 지칭된다.
m5 변이체는 경쇄에 있고, 그리고 따라서, 본 발명은 CS01-FL-AAm5, CS01-LC-AAm5, CS04-FL-AAm5, CS04-LC-AAm5, CS23-FL-AAm5, CS23-LC-AAm5, CS40-FL-AAm5 및 CS40-LC-AAm5 (이들 모두 동일한 상응하는 단백질 서열을 인코딩한다)를 비롯하여, m5 돌연변이를 포함하는 폴리펩티드를 포함한다.
이에 더하여, m5 돌연변이를 포함하는 폴리펩티드 서열뿐만 아니라 m5 돌연변이를 갖는 단백질을 인코딩하는 코돈-변경된 폴리뉴클레오티드 서열, 예를 들면, CS01-FL-NAm5, CS01-LC-NAm5, CS04-FL-NAm5, CS04-LC-NAm5, CS23-FL-NA-m5, CS23-LC-NA-m5, CS40-FL-NA-m5 및 CS40-LC-NA-m5는 본 발명에 포함된다.
m1, m2, m3, m4 및 m5를 개별적으로 포함하는 특정한 구조체 (아미노산 및 핵산 둘 모두)에 더하여, 돌연변이 세트의 조합이 본원에서 개설된 바와 같이 만들어질 수 있다. 본원에서 언급된 바와 같이, 이들은 m1 및 m2 세트의 조합인 "m12", 또는 m1, m2 및 m3 세트의 조합인 "m123"으로서 언급된다. 따라서, m12, m13, m14, m15, m23, m24, m25, m34, m35 및 m45를 비롯한 이중 조합이 본 발명에 포함된다. 삼중 조합, m123, m124, m125, m234, m235 및 m345 또한 포함된다. 사중 조합, m1234, m1235, m1345 및 m12345 조합이 더욱 포함된다.
일부 구체예에서 다음의 돌연변이 세트가 특히 관심된다: m1, m2, m3 및 m4, m23, m123, 그리고 m234.
B. 인자 VIII B-도메인 치환된 링커
일부 구체예에서, FVIII 중쇄 및 경쇄 사이에 연쇄 (가령, 야생형 인자 VIII에서 B-도메인)는 더욱 변경된다. AAV 포장 능력의 크기 제약으로 인해, B-도메인 결실된, 절두된, 및 또는 링커 치환된 변이체는 FVIII 유전자 요법 구조체의 효력을 향상시킬 것이다. 가장 전통적으로 이용되는 B-도메인 치환된 링커는 SQ FVIII의 링커인데, 이것은 B 도메인의 단지 14개 아미노산만 링커 서열로서 유지한다. 돼지 VIII의 다른 변이체 (U.S. 특허 번호 6,458,563에서 설명된 "OBI-1")는 CHO 세포에서 충분히 발현되고, 그리고 24개 아미노산의 약간 더욱 긴 링커를 갖는다. 일부 구체예에서, 본원에서 설명된 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 구조체는 SQ-유형 B-도메인 링커 서열을 포함한다. 다른 구체예에서, 본원에서 설명된 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 구조체는 OBI-1-유형 B-도메인 링커 서열을 포함한다.
일부 구체예에서, 본원에서 설명된 인코딩된 인자 VIII 폴리펩티드는 야생형 인간 인자 VIII B-도메인 (FVIII-FL-AA; 서열 번호: 19)의 아미노산 760-762/1657-1667을 포함하는 SQ-유형 B-도메인 링커를 포함한다 (Sandberg et al. Thromb. Haemost. 85:93 (2001)). 일부 구체예에서, SQ-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 하나의 아미노산 치환을 갖는다. 일부 구체예에서, SQ-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 2개의 아미노산 치환을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 SQ-유형 B-도메인 링커 내로 삽입된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13에서 도시된 것들 (서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75, 각각, 등장 순서로)에서 선택된다.
일부 구체예에서, 본원에서 설명된 인코딩된 인자 VIII 폴리펩티드는 야생형 인간 인자 VIII B-도메인 (FVIII-FL-AA; 서열 번호: 19)의 아미노산 760/1582-1667을 포함하는 Greengene-유형 B-도메인 링커를 포함한다 (Oh et al., Biotechnol. Prog., 17:1999 (2001)). 일부 구체예에서, Greengene-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 하나의 아미노산 치환을 갖는다. 일부 구체예에서, Greengene-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 2개의 아미노산 치환을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 Greengene-유형 B-도메인 링커 내로 삽입된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13에서 도시된 것들 (서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75, 각각, 등장 순서로)에서 선택된다.
일부 구체예에서, 본원에서 설명된 인코딩된 인자 VIII 폴리펩티드는 야생형 인간 인자 VIII B-도메인 (FVIII-FL-AA; 서열 번호: 19)의 아미노산 760-769/1657-1667을 포함하는 연장된 SQ-유형 B-도메인 링커 (SFSQNPPVLKRHQR; BDL-SQ-AA; 서열 번호: 30)를 포함한다 (Thim et al., Haemophilia, 16:349 (2010)). 일부 구체예에서, 연장된 SQ-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 하나의 아미노산 치환을 갖는다. 일부 구체예에서, 연장된 SQ-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 2개의 아미노산 치환을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 연장된 SQ-유형 B-도메인 링커 내로 삽입된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13에서 도시된 것들 (서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75, 각각, 등장 순서로)에서 선택된다.
일부 구체예에서, 본원에서 설명된 인코딩된 인자 VIII 폴리펩티드는 야생형 돼지 인자 VIII B-도메인으로부터 아미노산 SFAQNSRPPSASAPKPPVLRRHQR (서열 번호: 31)을 포함하는 돼지 OBI-1-유형 B-도메인 링커를 포함한다 (Toschi et al., Curr. Opin. Mol. Ther. 12:517 (2010)). 일부 구체예에서, 돼지 OBI-1-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 하나의 아미노산 치환을 갖는다. 일부 구체예에서, 돼지 OBI-1-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 2개의 아미노산 치환을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 돼지 OBI-1-유형 B-도메인 링커 내로 삽입된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13에서 도시된 것들 (서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75, 각각, 등장 순서로)에서 선택된다.
일부 구체예에서, 본원에서 설명된 인코딩된 인자 VIII 폴리펩티드는 야생형 인간 인자 VIII B-도메인 (FVIII-FL-AA; 서열 번호: 19)의 아미노산 760-772/1655-1667을 포함하는 인간 OBI-1-유형 B-도메인 링커를 포함한다. 일부 구체예에서, 인간 OBI-1-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 하나의 아미노산 치환을 갖는다. 일부 구체예에서, 인간 OBI-1-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 2개의 아미노산 치환을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 인간 OBI-1-유형 B-도메인 링커 내로 삽입된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13에서 도시된 것들 (서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75, 각각, 등장 순서로)에서 선택된다.
일부 구체예에서, 본원에서 설명된 인코딩된 인자 VIII 폴리펩티드는 야생형 돼지 인자 VIII B-도메인으로부터 아미노산 SFSQNSRHQAYRYRRG (서열 번호: 32)를 포함하는 O8-유형 B-도메인 링커를 포함한다 (Toschi et al., Curr. Opin. Mol. Ther. 12:517 (2010)). 일부 구체예에서, 돼지 OBI-1-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 하나의 아미노산 치환을 갖는다. 일부 구체예에서, 돼지 OBI-1-유형 B-도메인 링커는 상응하는 야생형 서열에 비하여, 2개의 아미노산 치환을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 돼지 OBI-1-유형 B-도메인 링커 내로 삽입된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13에서 도시된 것들 (서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75, 각각, 등장 순서로)에서 선택된다.
인자 VIII 구조체로부터 B-도메인의 제거는 아마도 B-도메인이 활성화 동안 제거되기 때문에, 활성화된 효소 (가령, FVIIIa)의 활성에 영향을 주는 것으로 보이지 않는다. 하지만, 인자 VIII의 B-도메인은 예로서, N- 또는 O-연결된 글리코실화에 의해 번역후 변형되는 여러 잔기를 내포한다. 야생형 인자 VIII B-도메인의 인실리코 분석 (Prediction of N-glycosylation sites in human proteins, R. Gupta, E. Jung and S. Brunak, in preparation (2004))은 이들 부위 중에서 최소한 4개가 생체내에서 글리코실화되는 것으로 예측한다 (도면 14). B-도메인 내에 이들 변형은 생체내에서 인자 VIII의 번역후 조절 및/또는 반감기에 기여하는 것으로 생각된다.
인자 VIII B-도메인이 성숙 인자 VIIIa 단백질에서 부재하긴 하지만, 전구체 인자 VIII 분자의 B-도메인 내에 글리코실화는 활성화에 앞서 상기 단백질의 순환 반감기를 증가시킬 수 있다. 따라서, 일부 구체예에서, 본원에서 설명된 인코딩된 인자 VIII 구조체의 폴리펩티드 링커는 생체내에서 글리코실화를 허용하는, 하나 또는 그 이상의 글리코실화 서열을 포함한다. 일부 구체예에서, 폴리펩티드 링커는 최소한 하나의 공통 글리코실화 서열 (가령, N- 또는 O-연결된 글리코실화 공통 서열)을 포함한다. 일부 구체예에서, 폴리펩티드 링커는 최소한 2개의 공통 글리코실화 서열을 포함한다. 일부 구체예에서, 폴리펩티드 링커는 최소한 3개의 공통 글리코실화 서열을 포함한다. 일부 구체예에서, 폴리펩티드 링커는 최소한 4개의 공통 글리코실화 서열을 포함한다. 일부 구체예에서, 폴리펩티드 링커는 최소한 5개의 공통 글리코실화 서열을 포함한다. 일부 구체예에서, 폴리펩티드 링커는 최소한 6, 7, 8, 9, 10개, 또는 그 이상의 공통 글리코실화 서열을 포함한다.
일부 구체예에서, 폴리펩티드 링커는 최소한 하나의 N-연결된 글리코실화 서열 N-X-S/T를 내포하고, 여기서 X는 P, S 또는 T 이외에 임의의 아미노산이다. 일부 구체예에서, 폴리펩티드 링커는 최소한 2개의 N-연결된 글리코실화 서열 N-X-S/T를 내포하고, 여기서 X는 P, S 또는 T 이외에 임의의 아미노산이다. 일부 구체예에서, 폴리펩티드 링커는 최소한 3개의 N-연결된 글리코실화 서열 N-X-S/T를 내포하고, 여기서 X는 P, S 또는 T 이외에 임의의 아미노산이다. 일부 구체예에서, 폴리펩티드 링커는 최소한 4개의 N-연결된 글리코실화 서열 N-X-S/T를 내포하고, 여기서 X는 P, S 또는 T 이외에 임의의 아미노산이다. 일부 구체예에서, 폴리펩티드 링커는 최소한 5개의 N-연결된 글리코실화 서열 N-X-S/T를 내포하고, 여기서 X는 P, S 또는 T 이외에 임의의 아미노산이다. 일부 구체예에서, 폴리펩티드 링커는 최소한 6, 7, 8, 9, 10개, 또는 그 이상의 N-연결된 글리코실화 서열 N-X-S/T를 내포하고, 여기서 X는 P, S 또는 T 이외에 임의의 아미노산이다.
일부 구체예에서, 폴리펩티드 링커는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지와 높은 서열 동일성을 갖는 글리코실화 펩티드를 포함한다. 일부 구체예에서, 글리코실화 폴리펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지와 최소한 92% 동일성을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 2개 이내의 아미노산 치환을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 단지 하나의 아미노산 치환을 갖는다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에서 선택되는 아미노산 서열을 갖는다.
일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지와 최소한 92% 동일성을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 90% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지와 최소한 92% 동일성을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 95% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지와 최소한 92% 동일성을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 98% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다.
일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 2개 이내의 아미노산 치환을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 90% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 2개 이내의 아미노산 치환을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 95% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 2개 이내의 아미노산 치환을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 98% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다.
일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 단지 하나의 아미노산 치환을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 90% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 단지 하나의 아미노산 치환을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 95% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 단지 하나의 아미노산 치환을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 98% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다.
일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에서 선택되는 서열을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 90% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에서 선택되는 서열을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 95% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에서 선택되는 서열을 갖고, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74에서 선택되는 상응하는 뉴클레오티드 서열과 최소한 98% 동일성을 갖는 폴리뉴클레오티드 서열에 의해 인코딩된다.
일부 구체예에서, 본원에서 설명된 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 폴리펩티드는 글리코실화 펩티드가 SQ 링커 서열 (CS04-FL-AA; 서열 번호: 2의 아미노산 760-773) 내로 삽입되는 B-도메인 치환된 링커를 갖는다. 특정한 구체예에서, 글리코실화 펩티드는 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75, 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지와 최소한 92% 동일성을 갖는 글리코실화 펩티드, 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 2개 이내의 아미노산 치환을 갖는 글리코실화 펩티드, 그리고 도면 13a-13b에서 보여 지는 바와 같이, 각각 등장 순서로 서열 번호 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 및 75 중에서 한 가지에 비하여, 단지 하나의 아미노산 치환을 갖는 글리코실화 펩티드 중에서 한 가지에서 선택된다. 일부 구체예에서, 글리코실화 펩티드는 잔기 N768 및 P769 사이에 SQ 펩티드에 삽입된다 (CS04-FL-AA; 서열 번호: 2에 비하여).
일부 구체예에서, 인자 VIII 구조체의 폴리펩티드 링커는 도면 6에서 도시된 것들 (서열 번호 5-7 및 36-48, 각각, 등장 순서로) 중에서 한 가지와 높은 서열 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 도면 13에서 도시된 것들 (서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74, 각각, 등장 순서로) 중에서 한 가지와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 도면 13에서 도시된 것들 (서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74, 각각, 등장 순서로) 중에서 한 가지와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 도면 13에서 도시된 것들 (서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74, 각각, 등장 순서로) 중에서 한 가지와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 도면 13에서 도시된 것들 (서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74, 각각, 등장 순서로) 중에서 한 가지와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 도면 13에서 도시된 것들 (서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74, 각각, 등장 순서로) 중에서 한 가지와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 도면 13에서 도시된 것들 (서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74, 각각, 등장 순서로) 중에서 한 가지와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 도면 13에서 도시된 것들 (서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74, 각각, 등장 순서로) 중에서 한 가지와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 도면 13에서 도시된 것들 (서열 번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74, 각각, 등장 순서로) 중에서 한 가지와 동일하다.
C. 개열가능한 링커를 갖는 인자 VIII 변이체를 인코딩하는 코돈-변경된 폴리뉴클레오티드
CS04 코돈 변경된 폴리뉴클레오티드
한 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 생체내에서 개열가능한 링커를 갖는 인자 VIII 변이체 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함한다. 인자 VIII 폴리펩티드는 인자 VIII 경쇄, 인자 VIII 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 인자 VIII 중쇄를 인코딩하는 CS04-FL-NA (서열 번호: 1)의 일부인 CS04-HC-NA (서열 번호: 3)와 높은 서열 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 VIII 폴리펩티드의 경쇄는 인자 VIII 경쇄를 인코딩하는 CS04-FL-NA (서열 번호: 1)의 일부인 CS04-LC-NA (서열 번호: 4)와 높은 서열 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 폴리펩티드 링커는 퓨린 개열 부위를 포함하는데, 이것은 생체내에서 성숙을 허용한다 (가령, 전구체 폴리펩티드의 생체내 발현 또는 투여 후).
일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 95% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 96% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 97% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 98% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 99% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 99.5% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 99.9% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 동일하다.
일부 구체예에서, 인자 VIII 구조체의 폴리펩티드 링커는 CS04-FL-AA (서열 번호: 2)의 아미노산 760-773에 상응하는 14개-아미노산 링커를 인코딩하는 BDLO04 (서열 번호: 6)와 높은 서열 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS04-FL-NA (서열 번호: 1)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-FL-NA (서열 번호: 1)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS04-FL-AA (서열 번호: 2)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-FL-AA (서열 번호: 2)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-FL-AA (서열 번호: 2)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-FL-AA (서열 번호: 2)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-FL-AA (서열 번호: 2)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-FL-AA (서열 번호: 2)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-FL-AA (서열 번호: 2)와 동일하다.
일부 구체예에서, CS04-FL-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m2 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m3 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m4 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m5 아미노산 치환을 포함한다.
한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m12 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m13 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m23 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m24 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m25 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m34 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m35 아미노산 치환을 포함한다.
한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m123 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m234 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m125 아미노산 치환을 포함한다.
CS01 코돈 변경된 폴리뉴클레오티드
한 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 생체내에서 개열가능한 링커를 갖는 인자 VIII 변이체 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함한다. 인자 VIII 폴리펩티드는 인자 VIII 경쇄, 인자 VIII 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 인자 VIII 중쇄를 인코딩하는 CS01-FL-NA (서열 번호: 13)의 일부인 CS01-HC-NA (서열 번호: 24)와 높은 서열 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 VIII 폴리펩티드의 경쇄는 인자 VIII 경쇄를 인코딩하는 CS01-FL-NA (서열 번호: 13)의 일부인 CS01-LC-NA (서열 번호: 25)와 높은 서열 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 폴리펩티드 링커는 퓨린 개열 부위를 포함하는데, 이것은 생체내에서 성숙을 허용한다 (가령, 전구체 폴리펩티드의 생체내 발현 또는 투여 후).
일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 95% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 96% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 97% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 98% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 99% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 99.5% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 99.9% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 동일하다.
일부 구체예에서, 인자 VIII 구조체의 폴리펩티드 링커는 CS01-FL-AA (서열 번호: 2)의 아미노산 760-773에 상응하는 14개-아미노산 링커를 인코딩하는 BDLO04 (서열 번호: 6)와 높은 서열 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS01-FL-NA (서열 번호: 13)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-FL-NA (서열 번호: 13)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS01-FL-AA (서열 번호: 2)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-FL-AA (서열 번호: 2)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-FL-AA (서열 번호: 2)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-FL-AA (서열 번호: 2)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-FL-AA (서열 번호: 2)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-FL-AA (서열 번호: 2)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-FL-AA (서열 번호: 2)와 동일하다.
일부 구체예에서, CS01-FL-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m2 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m3 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m4 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m5 아미노산 치환을 포함한다.
한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m12 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m13 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m23 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m24 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m25 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m34 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m35 아미노산 치환을 포함한다.
한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m123 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m234 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m125 아미노산 치환을 포함한다.
CS23 코돈 변경된 폴리뉴클레오티드
한 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 생체내에서 개열가능한 링커를 갖는 인자 VIII 변이체 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함한다. 인자 VIII 폴리펩티드는 인자 VIII 경쇄, 인자 VIII 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 인자 VIII 중쇄를 인코딩하는 CS23-FL-NA (서열 번호: 20)의 일부인 CS23-HC-NA (서열 번호: 22)와 높은 서열 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 VIII 폴리펩티드의 경쇄는 인자 VIII 경쇄를 인코딩하는 CS23-FL-NA (서열 번호: 20)의 일부인 CS23-LC-NA (서열 번호: 23)와 높은 서열 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 폴리펩티드 링커는 퓨린 개열 부위를 포함하는데, 이것은 생체내에서 성숙을 허용한다 (가령, 전구체 폴리펩티드의 생체내 발현 또는 투여 후).
일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 95% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 96% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 97% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 98% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 99% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 99.5% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 99.9% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 동일하다.
일부 구체예에서, 인자 VIII 구조체의 폴리펩티드 링커는 CS23-FL-AA (서열 번호: 21)의 아미노산 760-773에 상응하는 14개-아미노산 링커를 인코딩하는 BDLO04 (서열 번호: 6)와 높은 서열 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 세 번째 뉴클레오티드 서열은 BDLO04 (서열 번호: 6)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS23-FL-NA (서열 번호: 20)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-FL-NA (서열 번호: 20)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS23-FL-AA (서열 번호: 21)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-FL-AA (서열 번호: 21)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-FL-AA (서열 번호: 21)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-FL-AA (서열 번호: 21)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-FL-AA (서열 번호: 21)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-FL-AA (서열 번호: 21)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-FL-AA (서열 번호: 21)와 동일하다.
일부 구체예에서, CS23-FL-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m2 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m3 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m4 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m5 아미노산 치환을 포함한다.
한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m12 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m13 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m23 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m24 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m25 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m34 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m35 아미노산 치환을 포함한다.
한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m123 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m234 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m125 아미노산 치환을 포함한다.
D. 단일 사슬 인자 VIII 단백질을 인코딩하는 코돈-변경된 폴리뉴클레오티드
B-도메인의 C 말단 단부에서 위치된 퓨린 개열 부위가 제거되는 인자 VIII 구조체는 인자 VIII 분자의 정상적인 성숙이 일어날 수 없음에도 불구하고, 단일 사슬 폴리펩티드로서 활성을 유지한다 (Leyte et al. (1991)). 유사하게, 약독화된 퓨린 부위를 갖는 B-도메인 결실된 인자 VIII 구조체 (R1664H 아미노산 치환을 내포)는 야생형 퓨린 개열 부위를 갖는 상응하는 인자 VIII 구조체보다 생물학적으로 더욱 활성이다 (Siner et al. (2013)). 따라서, 일부 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 단일 사슬 인자 VIII 변이체 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함한다. 단일 사슬 인자 VIII 폴리펩티드는 인자 VIII 경쇄, 인자 VIII 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함한다. 폴리펩티드 링커는 퓨린 개열 부위를 포함하지 않는다.
단일 사슬 CS04 코돈 변경된 폴리뉴클레오티드
한 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 단일 사슬 인자 VIII 변이체 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함한다. 인자 VIII 폴리펩티드는 인자 VIII 경쇄, 인자 VIII 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 임의선택적 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 인자 VIII 중쇄를 인코딩하는 CS04-FL-NA (서열 번호: 1)의 일부인 CS04-HC-NA (서열 번호: 3)와 높은 서열 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 VIII 폴리펩티드의 경쇄는 인자 VIII 경쇄를 인코딩하는 CS04-FL-NA (서열 번호: 1)의 일부인 CS04-LC-NA (서열 번호: 4)와 높은 서열 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 임의선택적 폴리펩티드 링커는 퓨린 개열 부위를 포함하지 않는다.
일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 95% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 96% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 97% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 98% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 99% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 99.5% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 최소한 99.9% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS04-HC-NA 및 CS04-LC-NA (서열 번호 3 및 4)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS04-SC1-NA (서열 번호: 9)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC1-NA (서열 번호: 9)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS04-SC2-NA (서열 번호: 11)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS04-SC2-NA (서열 번호: 11)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 CS04-SC1-AA (서열 번호: 10; 인간 인자 VIII△(760-1667) (SPI; HsFVIII△(741-1648), SPE))와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS04-SC1-AA (서열 번호: 10)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC1-AA (서열 번호: 10)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC1-AA (서열 번호: 10)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC1-AA (서열 번호: 10)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC1-AA (서열 번호: 10)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC1-AA (서열 번호: 10)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC1-AA (서열 번호: 10)와 동일하다.
일부 구체예에서, CS04-SC1-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS04-SC1 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 CS04-SC2-AA (서열 번호: 12; 인간 인자 VIII△(772-1667) (SPI; HsFVIII△(753-1648), SPE))와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS04-SC2-AA (서열 번호: 12)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC2-AA (서열 번호: 12)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC2-AA (서열 번호: 12)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC2-AA (서열 번호: 12)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC2-AA (서열 번호: 12)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC2-AA (서열 번호: 12)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS04-SC2-AA (서열 번호: 12)와 동일하다.
일부 구체예에서, CS04-SC2-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS04-SC2 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m1 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m2 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m3 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m4 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m5 아미노산 치환을 포함한다.
한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m12 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m13 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m23 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m24 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m25 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m34 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m35 아미노산 치환을 포함한다.
한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m123 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m234 아미노산 치환을 포함한다. 한 구체예에서, CS04 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m125 아미노산 치환을 포함한다.
단일 사슬 CS01 코돈 변경된 폴리뉴클레오티드
한 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 단일 사슬 인자 VIII 변이체 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함한다. 인자 VIII 폴리펩티드는 인자 VIII 경쇄, 인자 VIII 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 임의선택적 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 인자 VIII 중쇄를 인코딩하는 CS01-FL-NA (서열 번호: 13)의 일부인 CS01-HC-NA (서열 번호: 24)와 높은 서열 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 VIII 폴리펩티드의 경쇄는 인자 VIII 경쇄를 인코딩하는 CS01-FL-NA (서열 번호: 13)의 일부인 CS01-LC-NA (서열 번호: 25)와 높은 서열 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 임의선택적 폴리펩티드 링커는 퓨린 개열 부위를 포함하지 않는다.
일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 95% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 96% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 97% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 98% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 99% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 99.5% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 최소한 99.9% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS01-HC-NA 및 CS01-LC-NA (서열 번호 24 및 25)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS01-SC1-NA (서열 번호: 26)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC1-NA (서열 번호: 26)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS01-SC2-NA (서열 번호: 27)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS01-SC2-NA (서열 번호: 27)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 CS01-SC1-AA (서열 번호: 10; 인간 인자 VIII△(760-1667) (SPI; HsFVIII△(741-1648), SPE))와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS01-SC1-AA (서열 번호: 10)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC1-AA (서열 번호: 10)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC1-AA (서열 번호: 10)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC1-AA (서열 번호: 10)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC1-AA (서열 번호: 10)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC1-AA (서열 번호: 10)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC1-AA (서열 번호: 10)와 동일하다.
일부 구체예에서, CS01-SC1-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS01-SC1 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 CS01-SC2-AA (서열 번호: 12; 인간 인자 VIII△(772-1667) (SPI; HsFVIII△(753-1648), SPE))와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS01-SC2-AA (서열 번호: 12)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC2-AA (서열 번호: 12)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC2-AA (서열 번호: 12)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC2-AA (서열 번호: 12)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC2-AA (서열 번호: 12)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC2-AA (서열 번호: 12)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS01-SC2-AA (서열 번호: 12)와 동일하다.
일부 구체예에서, CS01-SC2-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS01-SC2 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m1 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m2 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m3 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m4 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m5 아미노산 치환을 포함한다.
한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m12 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m13 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m23 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m24 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m25 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m34 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m35 아미노산 치환을 포함한다.
한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m123 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m234 아미노산 치환을 포함한다. 한 구체예에서, CS01 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m125 아미노산 치환을 포함한다.
단일 사슬 CS23 코돈 변경된 폴리뉴클레오티드
한 구체예에서, 본원에서 제공된 코돈-변경된 폴리뉴클레오티드는 단일 사슬 인자 VIII 변이체 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함한다. 인자 VIII 폴리펩티드는 인자 VIII 경쇄, 인자 VIII 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 임의선택적 폴리펩티드 링커를 포함한다. 인자 VIII 폴리펩티드의 중쇄는 인자 VIII 중쇄를 인코딩하는 CS23-FL-NA (서열 번호: 20)의 일부인 CS23-HC-NA (서열 번호: 22)와 높은 서열 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩된다. 인자 VIII 폴리펩티드의 경쇄는 인자 VIII 경쇄를 인코딩하는 CS23-FL-NA (서열 번호: 20)의 일부인 CS23-LC-NA (서열 번호: 23)와 높은 서열 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩된다. 임의선택적 폴리펩티드 링커는 퓨린 개열 부위를 포함하지 않는다.
일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 95% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 96% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 97% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 98% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 99% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 99.5% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 최소한 99.9% 서열 동일성을 갖는다. 일부 구체예에서, 첫 번째와 두 번째 뉴클레오티드 서열은 각각, CS23-HC-NA 및 CS23-LC-NA (서열 번호 22 및 23)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS23-SC1-NA (서열 번호: 28)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC1-NA (서열 번호: 28)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드는 CS23-SC2-NA (서열 번호: 29)와 높은 서열 동일성을 갖는 뉴클레오티드 서열을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)와 최소한 95% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)와 최소한 96% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 CS23-SC2-NA (서열 번호: 29)와 동일하다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 CS23-SC1-AA (서열 번호: 10; 인간 인자 VIII△(760-1667) (SPI; CS04△(741-1648), SPE))와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS23-SC1-AA (서열 번호: 10)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC1-AA (서열 번호: 10)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC1-AA (서열 번호: 10)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC1-AA (서열 번호: 10)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC1-AA (서열 번호: 10)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC1-AA (서열 번호: 10)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC1-AA (서열 번호: 10)와 동일하다.
일부 구체예에서, CS23-SC1-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS23-SC1 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 CS23-SC2-AA (서열 번호: 12; 인간 인자 VIII△(772-1667) (SPI; HsFVIII△(753-1648), SPE))와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 코돈-변경된 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 CS23-SC2-AA (서열 번호: 12)와 높은 서열 동일성을 갖는 아미노산 서열을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC2-AA (서열 번호: 12)와 최소한 97% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC2-AA (서열 번호: 12)와 최소한 98% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC2-AA (서열 번호: 12)와 최소한 99% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC2-AA (서열 번호: 12)와 최소한 99.5% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC2-AA (서열 번호: 12)와 최소한 99.9% 동일성을 갖는다. 일부 구체예에서, 아미노산 서열은 CS23-SC2-AA (서열 번호: 12)와 동일하다.
일부 구체예에서, CS23-SC2-AA와 높은 서열 상동성 (가령, 최소한 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.9% 동일성)을 갖는 CS23-SC2 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m1, m2, m3, m4 및 m5에서 선택되는 하나 또는 그 이상의 아미노산 치환을 포함한다.
한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m1 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m2 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m3 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m4 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m5 아미노산 치환을 포함한다.
한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m12 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m13 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m23 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m24 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m25 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m34 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m35 아미노산 치환을 포함한다.
한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 단일 사슬 인자 VIII 변이체는 m123 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m234 아미노산 치환을 포함한다. 한 구체예에서, CS23 폴리뉴클레오티드에 의해 인코딩된 인자 VIII 변이체는 m125 아미노산 치환을 포함한다.
E. 인자 VIII 발현 벡터
일부 구체예에서, 본원에서 설명된 코돈-변경된 폴리뉴클레오티드는 발현 벡터 내로 통합된다. 발현 벡터의 무제한적 실례는 바이러스 벡터 (가령, 유전자 요법에 적합한 벡터), 플라스미드 벡터, 박테리오파지 벡터, 코스미드, 파지미드, 인공 염색체 등을 포함한다.
바이러스 벡터의 무제한적 실례는 다음을 포함한다: 레트로바이러스, 예를 들면, 몰로니 뮤린 백혈병 바이러스 (MMLV), 하비 뮤린 육종 바이러스, 뮤린 유방 종양 바이러스 및 라우스 육종 바이러스; 아데노바이러스, 아데노 연관된 바이러스; SV40-유형 바이러스; 폴리오마바이러스; 엡스타인 바르 바이러스; 유두종 바이러스; 헤르페스 바이러스; 우두바이러스; 그리고 소아마비 바이러스.
일부 구체예에서, 본원에서 설명된 코돈-변경된 폴리뉴클레오티드는 유전자 요법 벡터 내로 통합된다. 일부 구체예에서, 유전자 요법 벡터는 레트로바이러스, 그리고 특히, 복제-결함성 레트로바이러스이다. 복제-결함성 레트로바이러스의 생산을 위한 프로토콜은 당해 분야에서 공지된다. 리뷰를 위해, Kriegler, M., Gene Transfer and Expression, A Laboratory Manual, W.H. Freeman Co., New York (1990) 및 Murry, E. J., Methods in Molecular Biology, Vol. 7, Humana Press, Inc., Cliffton, N.J. (1991)를 참조한다.
한 구체예에서, 유전자 요법 벡터는 아데노 연관된 바이러스 (AAV) 기초된 유전자 요법 벡터이다. AAV 시스템은 앞서 설명되었고 전반적으로 당해 분야에서 널리 공지된다 (Kelleher and Vos, Biotechniques, 17(6):1110-17 (1994); Cotten et al., Proc Natl Acad Sci USA, 89(13):6094-98 (1992); Curiel, Nat Immun, 13(2-3):141-64 (1994); Muzyczka, Curr Top Microbiol Immunol, 158:97-129 (1992); 및 Asokan A, et al., Mol. Ther., 20(4):699-708 (2012), 이들은 각각 모든 점에서 본원에 전체적으로 참조로서 편입된다). rAAV 벡터의 산출 및 이용에 관련된 상세는 예로서, U.S. 특허 번호 5,139,941 및 4,797,368에서 설명되고, 이들은 각각 모든 점에서 본원에 전체적으로 참조로서 편입된다. 특정한 구체예에서, AAV 벡터는 AAV-8 벡터이다.
일부 구체예에서, 본원에서 설명된 코돈-변경된 폴리뉴클레오티드는 레트로바이러스 발현 벡터 내로 통합된다. 이들 시스템은 앞서 설명되었고 전반적으로 당해 분야에서 널리 공지된다 (Mann et al., Cell, 33:153-159, 1983; Nicolas and Rubinstein, In: Vectors: A survey of molecular cloning vectors and their uses, Rodriguez and Denhardt, eds., Stoneham: Butterworth, pp. 494-513, 1988; Temin, In: Gene Transfer, Kucherlapati (ed.), New York: Plenum Press, pp. 149-188, 1986). 특정한 구체예에서, 레트로바이러스 벡터는 렌티바이러스 벡터이다 (가령, Naldini et al., Science, 272(5259):263-267, 1996; Zufferey et al., Nat Biotechnol, 15(9):871-875, 1997; Blomer et al., J Virol., 71(9):6641-6649, 1997; U.S. 특허 번호 6,013,516 및 5,994,136을 참조한다).
진핵 및 원핵 발현 벡터를 비롯하여, 매우 다양한 벡터가 세포 배양 동안 코돈-변경된 폴리펩티드로부터 인자 VIII 폴리펩티드의 발현에 이용될 수 있다. 일정한 구체예에서, 플라스미드 벡터가 세포 배양 동안 인자 VIII 폴리펩티드를 발현하는데 이용이 예기된다. 일반적으로, 숙주 세포와 양립성인 종으로부터 유래되는 레플리콘 및 제어 서열을 내포하는 플라스미드 벡터가 이들 숙주와 관련하여 이용된다. 벡터는 복제 부위뿐만 아니라 형질전환된 세포에서 표현형 선별을 제공할 수 있는 표지 서열을 보유할 수 있다. 플라스미드는 하나 또는 그 이상의 제어 서열, 예를 들면, 프로모터에 작동가능하게 연결된 인자 VIII 폴리펩티드를 인코딩하는 코돈-변경된 폴리뉴클레오티드를 포함할 것이다.
원핵 발현을 위한 벡터의 무제한적 실례는 플라스미드, 예를 들면, pRSET, pET, pBAD 등을 포함하는데, 여기서 원핵 발현 벡터에서 이용된 프로모터는 lac, trc, trp, recA, araBAD 등을 포함한다. 진핵 발현을 위한 벡터의 실례는 다음을 포함한다: (i) 효모에서 발현의 경우, AOX1, GAP, GAL1, AUG1 등과 같은 프로모터를 이용하는, pAO, pPIC, pYES, pMET와 같은 벡터; (ii) 곤충 세포에서 발현의 경우, PH, p10, MT, Ac5, OpIE2, gp64, polh 등과 같은 프로모터를 이용하는, pMT, pAc5, pIB, pMIB, pBAC 등과 같은 벡터, 그리고 (iii) 포유류 세포에서 발현의 경우, CMV, SV40, EF-1, UbC, RSV, ADV, BPV 및 β-액틴과 같은 프로모터를 이용하는, pSVL, pCMV, pRc/RSV, pcDNA3, pBPV 등과 같은 벡터, 그리고 바이러스 시스템, 예를 들면, 우두바이러스, 아데노 연관된 바이러스, 헤르페스 바이러스, 레트로바이러스 등으로부터 유래된 벡터.
IV. 실시예
실시예 1 - 코돈-변경된 인자 VIII 변이체 발현 서열의 작제
A형 혈우병의 유전자 요법에 효과적인 인자 VIII 코딩 서열을 창출하기 위해, 2개의 장애물이 극복되어야 했다. 첫 번째, 전통적인 유전자 요법 전달 벡터 (가령, AAV 비리온)의 유전체 크기 제한 때문에, 인코딩된 인자 VIII 폴리펩티드는 상당히 단축되어야 했다. 두 번째, (i) 전달 벡터 내에 포장 상호작용을 안정시키고, (ii) mRNA 중간을 안정시키고, 그리고 (iii) mRNA의 전사/번역의 견고성을 향상시키기 위해 코딩 서열이 변경되어야 했다.
첫 번째 목적을 달성하기 위해, 출원인은 본원에서 "FVIII-BDD-SQ"로서 지칭되는 B-도메인 결실된 인자 VIII 변이체 구조체로 시작하였다. 이러한 구조체에서, B-도메인은 "SQ" 서열로서 지칭되는 14개 아미노산 서열로 대체된다. 재조합 FVIII-BDD-SQ는 상품명 REFACTO® 하에 판매되고, 그리고 A형 혈우병의 관리에 효과적인 것으로 나타났다. 하지만, 인자 VIII 중쇄와 경쇄에 대한 인간 야생형 핵산 서열을 포함하는, FVIII-BDD-SQ에 대한 선천적 코딩 서열은 유전자 요법 벡터에서 무효하게 발현된다.
선천적 FVIII-BDD-SQ의 불량한 발현을 다루기 위해, Ward et al. (Blood, 117:798 (2011)) 및 McIntosh et al. (Blood, 121, 3335-3344 (2013))에서 설명된 바와 같이 변형된, Fath et al. (PLoS ONE, 6:e17596 (2011))에서 설명된 코돈 최적화 알고리즘이 첫 번째 중간 코딩 서열 CS04a를 창출하기 위해 FVIII-BDD-SQ 서열에 적용되었다. 하지만, 출원인은 변형된 알고리즘을 이용하여 창출된 CS04a 서열이 상기 서열을 더욱 변형함으로써 향상될 수 있다는 것을 인식하였다. 따라서, 출원인은 CpG 섬, 그리고 AT-풍부한 및 GC-풍부한 스트레치의 국부 과다표현을 방지하면서, CpG 디뉴클레오티드를 재도입하고, 아르기닌에 대한 CGC 코돈을 재도입하고, 류신 및 세린 코돈 분포를 변화시키고, 고도로 보존된 코돈 쌍을 재도입하고, 그리고 잠적 TATA 상자, CCAAT 상자 및 스플라이스 부위 요소를 제거하였다.
첫 번째, 변형된 알고리즘은 CpG-디뉴클레오티드를 내포하는 코돈 (가령, 아르기닌 코돈)을 비-CpG-디뉴클레오티드 코돈으로 조직적으로 대체하고, 그리고 인접한 코돈에 의해 창출된 CpG-디뉴클레오티드를 제거하거나/방지한다. CpG 디뉴클레오티드의 이러한 엄격한 회피는 통상적으로, DNA 백신의 근육내 주사 후 TLR-유도된 면역성을 예방하기 위해 행위된다. 하지만, 이렇게 하는 것은 코돈 최적화 가능성을 제한한다. 가령, 변형된 알고리즘은 CGX 아르기닌 코돈의 완전한 세트의 이용을 배제한다. 이것은 인간 세포에서 발현을 위한 유전자의 코딩에서 특히 파괴적인데, 그 이유는 CGC가 고도로 발현된 인간 유전자에서 가장 빈번하게 이용되는 아르기닌 코돈이기 때문이다. 추가적으로, 인접한 코돈에 의한 CpGs의 창출을 방지하는 것은 최적화 가능성을 더욱 제한한다 (가령, 함께 이용될 수 있는 코돈 쌍의 숫자를 제한한다).
TLR-유도된 면역성이 간-지향된, AAV-기초된 유전자 요법과 연관된 문제점일 것으로 예상되지 않기 때문에, CpGs를 포함하는 코돈 및 CpGs를 창출하는 인접한 코돈은 우선적으로 인자 VIII 경쇄를 코딩하는 서열에서 중간 코딩 서열 CS04a 내로 (가령, FVIII-BDD-SQ 코딩 서열의 3' 단부에서) 재도입되었다. 이것은 바람직한 인간 코돈, 특히 아르기닌에 대한 것들의 더욱 빈번한 이용을 허용하였다.
하지만, CpG 부위의 높은 빈도를 갖는 코딩 서열의 영역인 CpG 섬의 창출을 방지하기 위해 주의를 기울였다. 이것은 전사 시작 부위의 하류에 CpG 도메인이 유전자 발현의 높은 수준을 증진한다는 것을 암시하는, Krinner et al. (Nucleic Acids Res., 42(6):3551-64 (2014))의 교시에 반한다.
두 번째, 변형된 알고리즘은 일정한 코돈, 예를 들면, 류신의 경우 CTG, 발린의 경우 GTG 및 글루타민의 경우 CAG를 배타적으로 적용한다. 하지만, 이것은 예로서, Haas et al. (Current Biology, 6(3):315-24 (1996))에서 제안된 바와 같이, 균형화된 코돈 이용의 원리를 위반한다. 변형된 알고리즘에 의한 바람직한 코돈의 과용을 설명하기 위해, 코돈 변경에 적용된 다른 규칙 (가령, CpG 빈도 및 GC 함량)에 의해 허용되는 경우에 대체 류신 코돈이 재도입되었다.
세 번째, 변형된 알고리즘은 일정한 규준 (가령, CG-디뉴클레오티드의 존재)이 부합될 때, 코돈 쌍이 자연에서 어떻게 보존되는 지에 대한 고려 없이 이들을 대체한다. 진화에 의해 보존되었을 수 있는 유익한 성질을 설명하기 위해, 상기 알고리즘에 의해 대체된 대부분의 보존된 코돈 쌍 및 대부분의 보존된 바람직한 코돈 쌍은 코돈 변경에 적용된 다른 규칙 (가령, CpG 빈도 및 GC 함량)에 의해 허용되는 경우에, 예로서 Tats et al. (BMC Genomics 9:463 (2008))에서 설명된 바와 같이 분석되고 조정되었다.
네 번째, 중간 코딩 서열에서 이용된 세린 코돈이 또한, 재가공되었다. 구체적으로, AGC, TCC 및 TCT 세린 코돈이 인간 코돈 사용빈도에 대해 전반적으로 더욱 우수하게 정합하도록, 더욱 높은 빈도에서 변형된 코딩 서열 내로 도입되었다 (Haas et al., 위와 같음).
다섯 번째, TATA 상자, CCAAT 상자 요소 및 인트론/엑손 스플라이스 부위가 선별검사되고, 그리고 변형된 코딩 서열로부터 제거되었다. 코딩 서열을 변형할 때, AT-풍부한 또는 GC 풍부한 스트레치의 국부 과다표현을 방지하기 위해 주의를 기울였다.
최종적으로, 코딩 서열 내에서 코돈 사용빈도를 최적화하는 것에 더하여, 중간 코딩 서열 CS04a를 더욱 정밀화할 때, 근원적인 AAV 비리온의 구조적 요건이 고려되었다. AAV 벡터 (가령, AAV 비리온의 핵산 부분)는 그들의 캡시드 내로 단일 가닥 DNA 분자로서 포장된다 (리뷰를 위해, Daya and Berns, Clin. Microbiol Rev., 21(4):583-93 (2008)을 참조한다). 벡터의 GC 함량은 이런 이유로, 유전체의 포장, 그리고 따라서, 생산 동안 벡터 수율에 영향을 줄 가능성이 높다. 많은 알고리즘과 유사하게, 여기에서 이용된 변형된 알고리즘은 최소한 60%의 GC 함량을 갖는 최적화된 유전자 서열을 창출한다 (Fath et al., PLoS One, 6(3):e17596 (2011) (erratum in: PLoS One, (6)3 (2011)을 참조한다). 하지만, AAV8 캡시드 단백질은 약 56%의 더욱 낮은 GC 함량을 갖는 뉴클레오티드 서열에 의해 인코딩된다. 따라서, 선천적 AAV8 캡시드 단백질 코딩 서열을 더욱 우수하게 모의하기 위해, 중간 코딩 서열 CS04a의 GC 함량은 56%까지 감소되었다.
도면 2에서 도시된 결과의 CS04 코딩 서열은 56%의 전체 GC 함량을 갖는다. 상기 서열의 CpG-디뉴클레오티드 함량은 중간이다. 하지만, CpG 디뉴클레오티드는 코딩 서열의 하류 부분, 예를 들면, 인자 VIII 경쇄를 코딩하는 부분 내에 지배적으로 존재한다. CS04 서열은 야생형 인자 VIII (Genbank 수탁 M14113)에서 상응하는 코딩 서열에 79.77% 뉴클레오티드 서열 동일성을 갖는다.
비교 목적을 위해, 여러 다른 코돈-최적화된, ReFacto 구조체가 제조되었다. CS01은 CS04에 대해 행위된 바와 같이 Ward et al.,에 의해 변형된 바와 같은 Fath et al.,의 코돈-최적화 알고리즘을 적용함으로써 작제되었다. 하지만, CS04와 달리, CS01 구조체는 CpG 섬을 전혀 내포하지 않는다. CS08 ReFacto 구조체는 Radcliff P.M. et al., Gene Therapy, 15:289-97 (2008)에서 설명된 바와 같이 코돈 최적화되었는데, 이의 내용은 전체적으로 모든 점에서 본원에 명시적으로 참조로서 편입된다. CS10 코돈-최적화된 ReFacto 구조체는 Eurofins Genomics (Ebersberg, Germany)로부터 획득되었다. CS11 코돈-최적화된 ReFacto 구조체는 Integrated DNA Technologies, Inc. (Coralville, USA)로부터 획득되었다. CH25 코돈-최적화된 ReFacto 구조체는 ThermoFischer Scientific의 GeneArt services (Regensburg, Germany)로부터 획득되었다. CS40 ReFacto 구조체는 야생형 인자 VIII 코딩 서열로 구성된다. CS23을 작제하는데 이용된 알고리즘은 코돈-최적화를 위한 온라인 도구인 JCAT 도구 (www.jcat.de)에 근거된다 (Grote et al., 2005; Nucl. Acids Res. W526-31). 상기 서열은 알부민 상과의 코돈 사용빈도를 더욱 반영하기 위해 더욱 변형되었다 (Mirsafian et al. 2014: Sc. Word Journal 2014, ID 639682). 각각의 ReFacto 코딩 서열 사이에 공유된 서열 동일성은 아래의 표 2에서 제시된다.
표 2 - 코돈-변경된 인자 VIII 구조체에 대한 동일성 퍼센트 매트릭스.
CS01 | CS04 | CS08 | CS10 | CS11 | CS40 | CH25 | CS23 | |
CS01 | 100% | |||||||
CS04 | 93.0% | 100% | ||||||
CS08 | 80.7% | 82.2.% | 100% | |||||
CS10 | 79.1% | 79.4% | 78.4% | 100% | ||||
CS11 | 78.3% | 78.3% | 78.1% | 77.5% | 100% | |||
CS40 | 79.6% | 79.8% | 76.7% | 77.6% | 75.4% | 100% | ||
CH25 | 81.3% | 85.1% | 85.0% | 79.9% | 79.4% | 75.8% | 100% | |
CS23 | 84.3% | 89.2% | 85.1% | 80.3% | 79.9 | 76.5% | 93.2% | 100% |
각 구조체의 플라스미드는 상이한 합성 DNA 단편을 동일한 벡터 중추 플라스미드 (pCh-BB01) 내로 클로닝함으로써 작제되었다. 측면에서 접하는 AscI 및 NotI 효소 제한 부위를 갖는 Refacto-유형 BDD-FVIII 단편의 DNA 합성은 ThermoFischer Scientific (Regensburg, Germany)에 의해 행위되었다. 벡터 중추는 간-특이적 뮤린 트렌스티레틴 유전자로부터 유래된 프로모터/ 인핸서 서열, 개별 Refacto-유형 BDD-FVIII의 삽입을 위한 AscI 및 NotI 효소 제한 부위, 그리고 합성 polyA 부위를 포괄하는 2개의 측면에서 접하는 AAV2-유래된 반전된 말단 반복 (ITRs)을 내포한다. AscI 및 NotI 부위를 통해, 제조된 벡터 중추 및 삽입물의 결찰 후, 결과의 플라스미드는 밀리그램 규모에서 증폭되었다. 이들 구조체의 Refacto-유형 BDD-FVIII 서열은 직접적인 염기서열결정 (Microsynth, Balgach, Switzerland)에 의해 실증되었다. 이러한 클로닝은 pCS40, pCS01, pCS04, pCS08, pCS10, pCS11 및 pCh25로 명명된 7개의 상이한 플라스미드 구조체를 유발하였다 (도면 23). 이들 구조체는 동일한 벡터 중추를 갖고, 그리고 동일한 B-도메인 결실된 FVIII 단백질 (Refacto-유형 BDD-FVIII)을 인코딩하지만, 그들의 FVIII 코딩 서열에 대해 다르다.
AAV8-기초된 벡터는 Grieger JC, et al. (Virus Vectors Using Suspension HEK293 Cells and Continuous Harvest of Vector From the Culture Media for GMP FIX and FLT1 Clinical Vector, Mol Ther., Oct 6. (2015) doi: 10.1038/mt.2015.187. [인쇄에 앞서 Epub])에서 설명된 바와 같이, 3가지 플라스미드 형질감염 방법에 의해 제조되었는데, 이의 내용은 전체적으로 모든 점에서 본원에 명시적으로 참조로서 편입된다. HEK293 현탁액 세포가 상응하는 FVIII 벡터 플라스미드, 보조 플라스미드 pXX6-80 (아데노바이러스 보조 유전자를 보유), 그리고 포장 플라스미드 pGSK2/8 (rep2 및 cap8 유전자를 기여)을 이용한 플라스미드 형질감염에 이용되었다. AAV8 구조체를 단리하기 위해, 1 리터 배양액의 세포 펠렛이 Grieger et al. (2015, 위와 같음)에서 설명된 바와 같이, 아이오딕사놀 구배를 이용하여 처리되었다. 이러한 절차는 vCS01, vCS04, vCS08, vCS10, vCS11 및 vCH25로 불리는 벡터 제조물을 유발하였다. 벡터는 AAV2 반전된 말단 반복을 표적으로 하는 보편적인 qPCR 절차를 이용한 qPCR에 의해 정량되었다 (Aurnhammer, Human Gene Therapy Methods: Part B 23:18-28 (2012)). AAV2 반전된 말단 반복을 보유하는 대조 벡터 플라스미드는 표준 곡선을 준비하는데 적합하였다. 결과의 vCS04 구조체는 도면 7a-7c에서 서열 번호: 8로서 표시된다.
벡터 유전체의 완전성은 AAV 아가로즈 겔 전기이동에 의해 분석되었다. 전기이동은 Fagone et al., Human Gene Therapy Methods 23:1-7 (2012)에서 설명된 바와 같이 수행되었다. 간단히 말하면, AAV 벡터 제조물은 0.5% SDS의 존재에서 75 ℃에서 10 분 동안 배양되고, 그리고 이후, 실온으로 식혀졌다. 거의 1.5E10 벡터 유전체 (vg)가 1% 1xTAE 아가로오스 겔 상에서 레인마다 부하되고, 그리고 7 V/cm의 겔 길이에서 60 분 동안 전기영동되었다. 겔은 이후, 2x GelRed (Biotium Cat# 41003) 용액에서 염색되고 ChemiDocTMMP (Biorad)에 의해 영상화되었다. 도면 24에서 도시된 결과는 vCS01, vCS04 및 vCS40 바이러스 벡터가 5kb 범위에서 상이한 띠에 의해 지시된, 동일한-크기산정된 유전체를 갖는다는 것을 증명한다 (도면 24, 레인 2-4). 대략 5.2 kb의 벡터 크기에도 불구하고, 상기 유전체는 다소간 과대 유전체 (4.7 kb의 AAV 야생형 유전체에 비하여)의 정확한 포장을 확증하는 균질한 띠이다. 모든 다른 vCS 벡터 제조물은 동일한 유전체 크기를 보여준다 (데이터 제시되지 않음).
캡시드 단백질의 예상된 패턴을 확증하기 위해, SDS PAGE, 그 이후에 은 염색이 벡터 vCS01, vCS04 및 vCS40으로 수행되었다 (도면 25). 상기 도면에서 보여 지는 바와 같이, 하류 정제 절차는 VP1, VP2 및 VP3의 예상된 단백질 패턴을 전시하는 고도로 정제된 물질을 유발하였다 (도면 25, 레인 2-4). 동일한 패턴이 모든 다른 바이러스 제조물에서 목격되었다 (도시되지 않음). AAV 제조물의 SDS-PAGE 절차는 표준 절차에 따라 행위되었다. 각 레인은 1E10 vg의 개별 바이러스 구조체를 내포하였고, 그리고 제조업체의 사용설명서에 따라서 4-12% Bis-Tris (NuPAGE® Novex, Life Technologies) 겔에서 분리되었다. 은 염색은 제조업체의 사용설명서에 따라서 SilverQuestTM 키트 (Novex, Life Technologies)로 수행되었다.
놀랍게도, AAV 벡터 vCS01 및 vCS04는 vCS40 야생형 코딩 구조체 및 다른 코돈-최적화된 구조체와 비교하여, AAV 바이러스 생산에서 더욱 높은 수율에 의해 계측된 더욱 높은 비리온 포장을 가졌다. 표 3에서 보여 지는 바와 같이, vCS01 및 vCS04 벡터는 vCS40보다 훨씬 우수하게 복제되고, AAV 역가에서 5-7 배 수율 증가를 제공하였다.
표 3 - 세포 펠렛으로부터 정제될 때, AAV 벡터 구조체 vCS01, vCS04 및 vCD40으로 획득된 세포 배양액 리터당 수율.
구조체 |
벡터 농도
[vg/ml] x10E12 |
수율
[vg /리터] x10E12 |
배수적 증가
wt와 대비하여 |
vCS40 | 2.0 | 11.0 | - |
vCS01 | 9.2 | 51.4 | 4.7 |
vCS04 - 표본 1 | 17.6 | 79.2 | 7.2 |
vCS04 - 표본 2 | 15.9 | 58.8 | 5.4 |
실시예 2 - 코돈-변경된 인자 VIII 변이체 발현 서열의 생체내 발현
코돈-변경된 인자 VIII 변이체 서열의 생물학적 효능을 시험하기 위해, 실시예 1에서 설명된 ReFacto-유형 FVIII 구조체가 인자 VIII을 결여하는 생쥐에게 투여되었다. 간단히 말하면, 이들 검정은 생쥐의 체중 킬로그램당 4E12 벡터 유전체 (vg)의 꼬리 정맥 주사에 의해 C57Bl/6 FVIII 녹아웃 (ko) 생쥐 (군마다 6-8마리 동물)에서 수행되었다. 혈액은 안와후방 천자에 의해 주사 후 14 일에 뽑혀졌고, 그리고 혈장이 표준 절차를 이용하여 준비되고 동결되었다. 14 일자에 발현 수준이 선택되었는데, 그 이유는 이러한 시점에서 저해성 항체의 영향이 최소이기 때문인데, 이들 항체는 추후 시점에 이러한 생쥐 모형의 일부 동물에서 목격된다. 생쥐 혈장에서 FVIII 활성은 제조업체 (Technoclone, Vienna, Austria)에 의해 제안된 바와 같이, 단지 약간만 변형되어 수행된 Technochrome FVIII 검정을 이용하여 결정되었다. 상기 검정을 위해, 혈장 표본은 적절하게 희석되고, 그리고 트롬빈, 활성화된 인자 IX (FIXa), 인지질, 인자 X 및 칼슘을 내포하는 검정 시약과 혼합되었다. 트롬빈에 의한 FVIII 활성화 이후에, FIXa, 인지질 및 칼슘과의 복합체가 형성된다. 이러한 복합체는 FX를 활성화된 FX (FXa)로 활성화시키고, 이것은 차례로, 발색 기질로부터 파라-니트로아닐리드 (pNA)를 개열한다. pNA 형성의 동역학은 405 nm에서 계측된다. 상기 비율은 표본 내에 FVIII 농도에 직접적으로 비례한다. FVIII 농도는 참고 곡선으로부터 판독되고, 그리고 결과는 IU FVIII/밀리리터에서 제공된다.
아래 표 4에서 제시된 결과는 상업적인 알고리즘을 이용하여 설계된 코돈-변경된 서열 (CS10, CS11 및 CH25)이 야생형 BDD-인자 VIII 구조체 (CS40)와 비교하여 BDD-인자 VIII에서 단지 근소한 증가 (3-4 배)만을 제공한다는 것을 증명한다. 유사하게, Radcliffe et al.에서 설명된 바와 같이 제조된 코돈-변경된 BDD-인자 VIII 구조체 (CS08)는 BDD-FVIII 발현에서 단지 3-4 배 증가만을 제공하였다. 이러한 결과는 Radcliff et al.에서 보고된 결과와 일치한다. 놀랍게도, CS01, CS04 및 CS23 구조체는 생체내 생물효능 검정에서 훨씬 높은 BDD-FVIII 발현 (각각, 18-, 74- 및 -30-배 증가)을 제공하였다.
표 4 - 상이한 AAV 벡터 구조체에 의해 유도된 FVIII-녹아웃 생쥐의 혈장에서 FVIII의 발현.
구조체 | 코돈 알고리즘 |
평균 FVIII
14 일자에 발현 [IU/ml] |
표준 편차 | 생쥐의 숫자 |
배수적 증가
wt와 대비하여 |
vCS40 | 인간 야생형 | 0.03 | 0.03 | 12 | - |
vCS01 | 출원인' | 0.55 | 0.28 | 22 | 18.3 |
vCS04 | 출원인' | 2.21 | 1.20 | 55 | 73.7 |
vCS08 | Radcliffe et al. | 0.11 | 0.01 | 6 | 3.6 |
vCS10 | Eurofins | 0.09 | 0.01 | 7 | 3.0 |
vCS11 | IDT | 0.08 | 0.02 | 8 | 2.7 |
vCH25 | GeneArt | 0.13 | 0.12 | 18 | 4.3 |
vCS23 | 출원인' | 0.91 | 0.32 | 5 | 30.3 |
실시예 3 - B-도메인 치환된 링커를 위한 글리코실화 펩티드의 설계
다른 연구자들은 야생형 인자 VIII B-도메인으로부터 6개 추정 N-연결된 글리코실화 부위를 내포하는 작은 펩티드 ("V3 펩티드")의 B-도메인 결실된 유전자 요법 구조체 내로의 포함이 생쥐의 혈장에서 인자 VIII 수준을 증가시킨다는 것을 보여주었다 (McIntosh et al., Blood 121(17):3335-44 (2013)). 하지만, B-도메인 치환된 링커의 작은 크기를 유지하기 위해, 글리코실화 부위가 야생형 B-도메인의 콘텍스트로부터 제거되었다. V3 펩티드를 내포하는 링커의 인실리코 예측 (Gupta et al., 위와 같음)은 V3 펩티드 내에 이들 글리코실화 부위 중에서 단지 2개만 생체내에서 변형될 것이라는 것을 암시한다 (도면 15).
따라서, 출원인은 생체내에서 글리코실화의 더욱 높은 수준을 뒷받침할 대안적 글리코실화 펩티드를 확인하려 시도하였는데, 이들은 V3 펩티드보다 야생형 글리코실화에 더욱 가깝게 정합하였다. 출원인은 여러 대안적 글리코실화 펩티드를 설계하고 인실리코에서 시험하였다. 도면 13a-13b에서 도시된 이들 펩티드 중에서 몇몇은 서열 번호:2에서 B-도메인 치환된 링커의 아미노산 N768 및 P769 사이에 배치될 때, 생체내에서 V3 펩티드와 동등한 또는 이보다 큰 글리코실화를 갖는 것으로 예측되었다. 인실리코 예측의 결과는 아래의 표 5에서 제시된다. 표 5는 또한, CS01 코돈-최적화된 배경에서, 글리코실화 펩티드가 B-도메인 치환된 링커 내로 통합된 ReFacto-유형 인자 VIII 단백질을 인코딩하는 여러 구조체에 대해 수행된 발현 실험의 결과를 보고한다.
표 5 - B-도메인 치환된 링커 펩티드에서 N-글리코실화의 예측 및 생체내에서 AAV 벡터 구조체의 성과.
서열 | 예측된 N-글리코실화 부위의 숫자 | 28 일자 발현 [IU/ml] | SD | 생쥐의 숫자 [n] | 배수적 발현 |
vCS01 | 0 | 0.74 | 0.52 | 5 | 21 |
vNG1/CS01 | 4 | n.d. | - | - | - |
vNG4/CS01 | 3 | 1.93 | 0.57 | 6 | 55 |
vNG5/CS01 | 2 | n.d. | - | - | - |
vNG6/CS01 | 1 | 0.80 | 0.67 | 5 | 23 |
vNG9/CS01 | 1 | n.d. | - | - | - |
vNG10/CS01 | 2 | 2.66 | 0.52 | 6 | 76 |
vNG16/CS01 | 2 | 1.59 | 0.57 | 6 | 45 |
vNG17/CS01 | 2 | n.d. | - | - | - |
vNG18/CS01 | 2 | n.d. | - | - | - |
vNG19/CS01 | 2 | 0.88 | 0.25 | 5 | 25 |
vNG20/CS01 | 2 | n.d. | - | - | - |
vNG21/CS01 | 2 | n.d. | - | - | - |
vCS40 | 0 | 0.035 | 0.030 | 12 | 1 |
NG 변이체를 내포하는 AAV 벡터는 실시예 1에서 설명된 바와 같이 작제되고 실시예 2에서 설명된 바와 같이 FVIII 녹아웃 생쥐에서 시험되었다. 표 5에서 제시된 모든 바이러스 벡터 (대조 벡터 vCS40 제외)는 vCS01에서 이용된 바와 같은 알고리즘에 근거된다. vCS04의 알고리즘을 이용한 구조체의 병렬 세트 역시 제조되고 (vNG/CS04 계열) 생쥐 모형에서 시험된다. 결과는 야생형 vCS40 구조체로 달성된 발현 수준과 비교되었다. 28 일자 발현 수준이 본 실시예에서 선택되었는데, 그 이유는 대다수의 구조체의 발현 수준이 이러한 시점에서 가장 높은 수준에 도달하였기 때문이다. vNG4/CS01, vNG10/CS01 및 vNG16/CS01을 포함하는 3개의 AAV 벡터는 40-배보다 큰 FVIII 발현 수준을 달성하였다 (표 5). 상응하는 구조체 vNG4/CS04, vNG10/CS04 및 vNG16/CS04는 훨씬 높은 발현을 보여줄 것으로 예상되는데, 그 이유는 이들이 우수한 vCS04 알고리즘에 근거되기 때문이다.
놀랍게도, vNG/CS01 계열의 AAV 벡터는 vCS40 야생형 코딩 구조체와 비교하여, AAV 바이러스 생산에서 더욱 높은 수율에 의해 계측된 더욱 높은 비리온 포장을 가졌다. 표 6에서 보여 지는 바와 같이, vNG/CS01-기초된 벡터는 vCS40보다 훨씬 우수하게 복제하고, AAV 역가에서 거의 3-배 수율 증가를 제공하였다.
표 6 - 세포 펠렛으로부터 정제될 때 AAV 벡터 구조체로 획득된 세포 배양액 리터당 수율.
서열 |
벡터 농도
[vg/ml] x10 12 |
수율
[vg/리터] x10 12 |
야생형과 대비하여 배수적 증가 |
vCS01 | 9.17 | 51.35 | 4.7 |
vNG1/CS01 | 2.13 | 17.04 | 1.5 |
vNG4/CS01 | 5.74 | 33.01 | 3.0 |
vNG5/CS01 | 6.91 | 27.29 | 2.5 |
vNG6/CS01 | 7.01 | 40.66 | 3.7 |
vNG9/CS01 | 6.39 | 29.39 | 2.7 |
vNG10/CS01 | 8.57 | 37.71 | 3.4 |
vNG16/CS01 | 5.3 | 28.36 | 2.6 |
vNG17/CS01 | 4.24 | 32.22 | 2.9 |
vNG18/CS01 | 6.11 | 37.88 | 3.4 |
vNG19/CS01 | 9.42 | 39.56 | 3.6 |
vNG20/CS01 | 4.09 | 30.27 | 2.8 |
vNG21/CS01 | n.d | - | - |
vCS40 | 2.03 | 11 | 1.0 |
실시예 4
- 돌연변이체 BDD-FVIII 구조체의 작제
인자 VIII 중쇄 및/또는 B-도메인 치환된 링커 내에 아미노산 돌연변이를 보유하는 다양한 상이한 돌연변이된 Refacto-유형 BDD-FVIII 구조체가 클로닝되고 선별검사되었다. 본원에서 벡터의 "vCS" 계열로서 지칭된 바와 같은 상응하는 벡터는 CS01, CS04 및 CS23 코돈-변경된 배경에서 BDD-FVIII 변이체를 인코딩한다. CS01 및 CS04 배경을 작제하는데 이용된 방법은 실시예 1에서 설명된다. CS23을 작제하는데 이용된 방법은 코돈-최적화를 위한 온라인 도구인 JCAT 도구 (www.jcat.de)에 근거되었다 (Grote et al., 2005; Nucl. Acids Res. W526-31). 상기 서열은 알부민 상과의 코돈 사용빈도를 더욱 우수하게 반영하기 위해 더욱 변형되었고 (Mirsafian et al., Sc. Word Journal, ID 639682 (2014)), 이의 내용은 모든 점에서 본원에 명시적으로 전체적으로 참조로서 편입된다.
3가지 유형의 돌연변이의 조합이 vCS 계열의 구조체의 FVIII 서열 내에 포함되었다. FVIII 서열 내로 도입된 첫 번째 아미노산 변화는 X1 돌연변이 (TTYVNRSL (서열 번호: 33); X. Xiao)인데, 이것은 B-도메인 치환된 링커 인근에 추가 글리코실화 부위를 도입한다. X1 돌연변이는 본원에서 "m3" 돌연변이로서 또한 지칭된다. FVIII 서열에서 만들어진 두 번째 아미노산 변화는 FVIII의 분비를 향상시키는 것으로 알려진 아미노산 변화인 F328S (SPI, F309S SPE) 돌연변이를 포함한다 (Swaaroop, J. Biol. Chem., 272:24121-24 (1997)). 이러한 돌연변이는 본원에서 "m1" 돌연변이로서 또한 지칭된다. 세 번째 변화는 이른바 X5 돌연변이인데, 이것은 BDD-FVIII의 비활성도 및 분비를 향상시키는 중쇄의 A1 도메인에서 5개 아미노산 변화의 조합이다 (Cao et al., 2014; ASGCT 요약 #460; 구두 발표에서 개시된 돌연변이의 상세). X5 돌연변이는 본원에서 "m2" 돌연변이로서 또한 지칭된다. 그 다음, X1 및 F328S의 조합 (SPI, F309S SPE)이 만들어졌고, 그 이후에 "X6"으로서 또한 지칭되는 X1 및 X5의 조합이 만들어졌고, 그리고 X5 및 F328S의 또 다른 조합 (SPI, F309S SPE)이 만들어졌다 (표 7).
벡터 플라스미드의 유전자 합성 및 클로닝. 이들 플라스미드는 상이한 합성 DNA 단편을 동일한 벡터 중추 플라스미드 (pCh-BB01) 내로 클로닝함으로써 작제되었다. 측면에서 접하는 AscI 및 NotI 효소 제한 부위를 갖는 Refacto-유형 BDD-FVIII 단편의 DNA 합성은 ThermoFischer Scientific (Regensburg, Germany)에 의해 행위되었다. 벡터 중추는 간-특이적 뮤린 트렌스티레틴 유전자로부터 유래된 프로모터/ 인핸서 서열, 개별 Refacto-유형 BDD-FVIII의 삽입을 위한 AscI 및 NotI 효소 제한 부위, 그리고 합성 polyA 부위를 포괄하는 2개의 측면에서 접하는 AAV2-유래된 반전된 말단 반복 (ITRs)을 내포한다. AscI 및 NotI 부위를 통해, 제조된 벡터 중추 및 삽입물의 결찰 후, 결과의 플라스미드는 밀리그램 규모에서 증폭되었다. 이들 구조체의 Refacto-유형 BDD-FVIII 서열은 직접적인 염기서열결정 (Microsynth, Balgach, Switzerland)에 의해 실증되었다. 이러한 클로닝은 도면 44에서 보여 지는 바와 같이, 상이한 플라스미드 구조체를 유발하였다.
소규모 벡터 제조물 및 정량적 PCR (qPCR)에 의한 정량. AAV8-기초된 벡터는 Grieger et al. (2015, 위와 같음)에서 설명된 바와 본질적으로 동일한 3가지 플라스미드 형질감염 방법에 의해 제조되었다. HEK293 현탁액 세포가 상응하는 FVIII 벡터 플라스미드, 보조 플라스미드 pXX6X80 (아데노바이러스 보조 유전자를 보유), 그리고 포장 플라스미드 pGSK2/8 (rep2 및 cap8 유전자를 기여)을 이용한 플라스미드 형질감염에 이용되었다. 하류 과정에서 1 리터 배양액의 세포 펠렛이 앞서 설명된 바와 같이 아이오딕사놀 구배를 이용하여 처리되었다. 이러한 절차는 표 8에서 개설된 바와 같은 벡터 제조물을 유발하였다. 벡터는 AAV2 반전된 말단 반복을 표적으로 하는 보편적인 qPCR 절차를 이용한 qPCR에 의해 정량되었다 (Aurnhammer, HUMAN GENE THERAPY METHODS: Part B 23:18-28 (2012)). AAV2 반전된 말단 반복을 보유하는 정확하게 정량된 벡터 플라스미드는 표준 곡선을 준비하는데 적합하였다.
AAV 벡터 특징화. 벡터 유전체의 완전성은 AAV 아가로즈 겔 전기이동에 의해 분석되었다. 전기이동은 Fagone et al., (Human Gene Therapy Methods 23:1-7 (2012))에서 설명된 바와 유사하게 행위되었다. AAV 벡터 제조물은 0.5% SDS의 존재에서 75 ℃에서 10 분 동안 배양되고, 그리고 이후, 실온으로 식혀졌다. 거의 1.5E10 벡터 유전체 (vg)가 1% 1xTAE 아가로오스 겔 상에서 레인마다 부하되고, 그리고 7 V/cm의 겔 길이에서 60 분 동안 전기영동되었다. 겔은 이후, 2x GelRed (Biotium Cat# 41003) 용액에서 염색되고 ChemiDocTMMP (Biorad)에 의해 영상화되었다. 벡터의 선별의 결과는 도면 45에서 도시된다. 바이러스 벡터 vCS04 (대조), vCS17, vCS20, vCS24, vCS16 및 vCS40 (대조) 모두 5kb 범위에서 상이한 띠로서 동일한-크기산정된 유전체를 보여준다 (도면 45, 레인 2-7; 오른쪽 화살표). 대략 5.2 kb의 벡터 크기에도 불구하고, 상기 유전체는 다소간 과대 유전체 (4.7 kb의 AAV 야생형 유전체에 비하여)의 정확한 포장을 확증하는 균질한 띠이다.
벡터의 순도 및 캡시드 단백질의 예상된 패턴을 확증하기 위해, SDS PAGE, 그 이후에 은 염색이 도면 46에서 보여 지는 바와 같이, 이들 벡터로 수행되었다. 상기 도면에서 보여 지는 바와 같이, 하류 정제 절차는 VP1, VP2 및 VP3의 예상된 단백질 패턴을 전시하는 고도로 정제된 물질을 유발하였다 (도면 46, 레인 2-9; 오른쪽 화살표). AAV 제조물의 SDS-PAGE 절차는 표준 절차에 따라 행위되었다. 레인마다 1E10 vg의 양이 제조업체의 사용설명서에 따라서 4-12% Bis-Tris (NuPAGE® Novex, Life Technologies) 겔에서 분리되었다. 은 염색은 제조업체의 사용설명서에 따라서 SilverQuestTM 키트 (Novex, Life Technologies)로 수행되었다.
벡터의 생체내 생물효능 선별검사. 상이한 Refacto-유형 BDD-FVIII 구조체는 생쥐에서 선별검사되었다. 상기 검정은 생쥐의 체중 킬로그램당 4E12 벡터 유전체 (vg)의 꼬리 정맥 주사에 의해 C57Bl/6 FVIII 녹아웃 (ko) 생쥐 (군마다 6-8마리 동물)에서 수행되었다. 혈액은 안와후방 천자에 의해 주사 후 14 일에 뽑혀졌고, 그리고 혈장이 표준 절차를 이용하여 준비되고 동결되었다. 생쥐 혈장에서 FVIII 활성은 약간 변형된, Technoclone으로부터 발색 검정으로 결정되었다 (Technochrome FVIII, Technoclone, Vienna, Austria). 간단히 말하면, 혈장 표본은 적절하게 희석되고, 그리고 트롬빈, 활성화된 인자 IX (FIXa), 인지질, 인자 X 및 칼슘을 내포하는 검정 시약과 혼합되었다. 트롬빈에 의한 FVIII 활성화 이후에, FIXa, 인지질 및 칼슘과의 복합체가 형성된다. 이러한 복합체는 FX를 활성화된 FX (FXa)로 활성화시키고, 이것은 차례로, 발색 기질로부터 파라-니트로아닐리드 (pNA)를 개열한다. pNA 형성의 동역학은 405 nm에서 계측된다. 상기 비율은 표본 내에 FVIII 농도에 직접적으로 비례한다. FVIII 농도는 참고 곡선으로부터 판독되고, 그리고 결과는 IU FVIII/밀리리터에서 제공된다.
생쥐 생물효능 검정의 결과 (생쥐 혈장 내에 밀리리터당 국제 단위 [IU/ml]에서 FVIII의 14 일자 발현 데이터 및 야생형 vCS40 대조와 비교하여 배수적 발현)는 표 7에서 제시된다. AAV 벡터 vCS19, vCS26 및 vCS32 모두 각각, CS01, CS04 및 CS23 코돈-변경된 배경에서 X1 글리코실화 부위를 내포한다. 표 7에서 목격되는 바와 같이, 야생형 구조체 vCS40 (1로서 규정된 수준)과 비교하여, 놀라울 정도로 높은 발현 수준이 획득되었다. vCS26은 예로서, 야생형 vCS40 벡터와 비교하여 202-배 높은 수준에서 발현되었다. Geneart 코돈 콘텍스트에서 X1 돌연변이를 내포하는, X1-계열의 벡터에 대한 다른 대조 구조체, vCH111은 발현에서 더욱 근소한 증가 (12-배)를 보여주었다.
벡터 vCS16, vCS28 및 vCS34 모두 각각, CS01, CS04 및 CS23 코돈-변경된 배경에서 분비를 증강하는 F328S (SPI, F309S SPE) 돌연변이를 내포한다. 표 7에서 목격되는 바와 같이, 높은 발현 수준 (wt vCS40 대조보다 45-93-배 높은)이 vCS16 및 vCS28로 획득되었다.
벡터 vCS20, vCS24 및 vCS33은 각각, CS01, CS04 및 CS23 코돈-변경된 배경에서 X5 돌연변이를 내포한다. X5 계열에서 최고 성과 변이체는 vCS20이고, 14 일자 후 >3 단위/ml의 수준 및 wt vCS40 대조에 비하여, 121-배 증가를 달성하였다.
벡터 vCS17, vCS29 및 vCS31은 각각, CS01, CS04 및 CS23 코돈-변경된 배경에서 X1 및 F328S (SPI, F309S SPE) 돌연변이의 조합을 내포한다 (표 6). vCS17 및 vCS29 구조체는 생쥐 연구에서 매우 높은 발현 수준 (vCS40 대조에 비하여, 115 내지 246-배 증가)을 달성하였다. 두드러지게는, 이용된 FVIII KO 생쥐 모형에서, vCS17 구조체로 처리된 대다수의 생쥐는 시간의 추이에서 중화 항체가 발달하지 않았는데, 이것은 추후 시점에서 FVIII의 증가하는 수준에 의해 증거되었다 (가령, 28 일자 및 42 일자; 데이터 제시되지 않음). 이것은 예상치 못한 발견인데, 그 이유는 일부 다른 구조체에서 발현 수준이 중화 항체의 형성으로 인해, 시간이 흐름에 따라서 감소하기 시작하였기 때문이다. 분비-증강 돌연변이 F328S (SPI, F309S SPE) 및 X1과 합동된 CS01 배경은 낮은 면역원성 유도를 유발하였다.
벡터 vCS18, vCS27 및 vCS35는 각각, CS01, CS04 및 CS23 코돈-변경된 배경에서 X1 및 X5 돌연변이의 조합을 내포한다. 이들 2가지 돌연변이의 조합 역시 매우 효율적이었다. vCS40 대조에 비하여, 145-배 증가가 예로서, vCS18로 달성될 수 있었다 (표 7).
벡터 vCS48 및 vCS49는 각각, CS01 및 CS04 코돈-변경된 배경에서 X5 및 F328S (SPI, F309S SPE) 돌연변이의 조합을 내포한다. 이들 2가지 돌연변이의 조합 역시 매우 효율적이었다. vCS40 대조에 비하여, 모든 돌연변이체 중에서 가장 큰 증가 중에서 한 가지인 239-배 증가가 vCS49로 달성될 수 있었는데, 이것은 F328S (SPI, F309S SPE) 돌연변이를 포함하는 조합의 특별한 가치를 확증하였다.
더욱 놀라운 관찰 결과는 돌연변이체 AAV 벡터가 야생형 BDD-FVIII 코돈을 품는 vCS40 구조체보다 훨씬 우수하게 성장한다는 것이었다. 서열 최적화는 벡터 생산에서 몇 배의 수율 증가를 유발하였다. 최고 발현 구조체 (가령, vCS29, vCS17, vCS20 및 vCS26) 중에서 일부에서, 코돈-변경 및/또는 돌연변이체 서열로 인한 수율에서 증가는 야생형 벡터와 비교하여, 거의 3-5-배 높았다 (표 8).
상이한 AAV 벡터 구조체에 의해 유도된 FVIII-녹아웃 생쥐의 혈장에서 BDD-FVIII의 발현은 표 7에서 도시된다. 이들 구조체는 동일한 벡터 중추를 갖지만, 상이한 코돈 최적화 배경을 비롯하여 상이한 유형의 돌연변이된 FVIII를 인코딩한다. 14 일자에 발현 수준이 선택되었는데, 그 이유는 추후 시점에 생쥐 모형의 일부 동물에서 통상적으로 목격되는 저해성 항체의 영향이 이러한 시점에서 최소이기 때문이다. N.d., 결정되지 않음.
표 7 - vCS 구조체의 생체내 생물효능 데이터.
# | 벡터 | 알고리즘, 돌연변이 |
14 일자 발현
[IU/ml] |
SD |
생쥐의 숫자
[n] |
배수적 발현 |
1 | vCS19 | CS01, X1 | 2.34 | 1.10 | 13 | 78 |
2 | vCS26 | CS04, X1 | 6.07 | 2.72 | 12 | 202 |
3 | vCS32 | CS23, X1 | n.d. | - | - | - |
4 | vCS16 | CS01, F328S | 1.35 | 0.88 | 6 | 45 |
5 | vCS28 | CS04, F328S | 2.78 | 0.92 | 7 | 93 |
6 | vCS34 | CS23, F328S | n.d. | - | - | - |
7 | vCS20 | CS01, X5 | 3.62 | 1.96 | 21 | 121 |
8 | vCS24 | CS04, X5 | 0.79 | 0.89 | 18 | 26 |
9 | vCS33 | CS23, X5 | n.d. | - | - | n.d. |
10 | vCS17 | CS01, X1, F328S | 3.44 | 1.92 | 20 | 115 |
11 | vCS29 | CS04, X1, F328S | 7.39 | 2.64 | 9 | 246 |
12 | vCS31 | CS23, X1, F328S | n.d. | n.d. | ||
13 | vCS18 | CS01, X1+X5 (X6) | 4.34 | 2.50 | 6 | 145 |
14 | vCS27 | CS04, X1+X5 (X6) | 8.03 | 3.97- | 6- | 268- |
15 | vCS35 | CS23, X1+X5 (X6) | n.d. | - | - | - |
19 | vCS48 | CS01, X5, F328S | 2.54 | 0.72 | 8 | 85 |
20 | vCS49 | CS04, X5, F328S | 7.17 | 1.30 | 7 | 239 |
대조 | ||||||
16 | vCS40 | 인간 야생형 | 0.03 | 0.03 | 12 | 1 |
17 | vCh25 | Geneart | 0.13 | 0.12 | 18 | 4 |
18 | vCh111 | Geneart +X1 | 0.37 | 0.21 | 17 | 12 |
표 8 - 상이한 AAV 벡터 구조체로 획득된 세포 배양액 리터당 수율 (포장 효율). 이들 벡터는 세포 펠렛으로부터 정제되었다; n.d., 결정되지 않음.
구조체 | 알고리즘, 돌연변이 |
벡터 농도
[vg/ml] x10 12 |
수율
[vg /리터] x10 12 |
배수적 증가
wt와 대비하여 |
|
1 | vCS19 | CS01, X1 | 9.71 | 36 | 3.22 |
2 | vCS26 | CS04, X1 | 5.93 | 32 | 2.87 |
3 | vCS32 | CS23, X1 | n.d. | n.d. | n.d. |
4 | vCS16 | CS01, F328S | 6.51 | 29 | 2.56 |
5 | vCS28 | CS04, F328S | 5.85 | 32 | 2.88 |
6 | vCS34 | CS23, F328S | n.d. | n.d. | n.d. |
7 | vCS20 | CS01, X5 | 9.90 | 50 | 4.48 |
8 | vCS24 | CS04, X5 | 3.00 | 16 | 1.46 |
9 | vCS33 | CS23, X5 | n.d. | n.d. | n.d. |
10 | vCS17 | CS01, X1, F328S | 8.94 | 37 | 3.34 |
11 | vCS29 | CS04, X1, F328S | 7.42 | 53 | 4.72 |
12 | vCS31 | CS23, X1, F328S | n.d. | n.d. | n.d. |
13 | vCS18 | CS01, X1+X5 (X6) | 21.20 | 53 | 4.75 |
14 | vCS27 | CS04, X1+X5 (X6) | 4.15 | 19 | 1.67 |
15 | vCS35 | CS23, X1+X5 (X6) | n.d. | n.d. | n.d. |
16 | vCS48 | CS01, X5, F328S | 7.14 | 42.1 | 3.77 |
17 | vCS49 | CS04, X5, F328S | 8.27 | 37.2 | 3.33 |
18 | vCS40 | 인간 야생형 | 2.03 | 11 | 1.00 |
본 명세서에 기재된 실시예와 구체예는 단지 예시적인 목적을 위한 것이고, 그리고 이에 비추어 다양한 개변은 당해 분야의 당업자에게 제시되고 본원의 기술적 사상과 이해범위 및 첨부된 청구항의 범위 내에 포함되는 것으로 이해된다. 본원에서 인용된 모든 간행물, 특허 및 특허 출원은 본원에 전체적으로 참조로서 편입된다.
SEQUENCE LISTING
<110> BAXALTA INCORPORATED
BAXALTA GMBH
<120> VIRAL VECTORS ENCODING RECOMBINANT FVIII VARIANTS WITH INCREASED
EXPRESSION FOR GENE THERAPY OF HEMOPHILIA A
<130> 008073-5107-WO
<140>
<141>
<150> 62/255,317
<151> 2015-11-13
<160> 109
<170> PatentIn version 3.5
<210> 1
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccaggagc 2280
ttcagccaga atccacctgt cctgaaacgc caccagaggg agatcaccag gaccaccctc 2340
cagtctgacc aggaggagat tgactatgat gacaccattt ctgtggagat gaagaaagag 2400
gactttgaca tctatgacga ggacgagaac cagagcccaa ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagcgc ctgtgggact atggcatgag ctccagcccc 2520
catgtcctca ggaacagggc ccagtctggc tctgtgccac agttcaagaa agtggtcttc 2580
caagagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac 2640
ctgggactcc tgggcccata catcagggct gaggtggagg acaacatcat ggtgaccttc 2700
cgcaaccagg cctccaggcc ctacagcttc tacagctccc tcatcagcta tgaggaggac 2760
cagaggcagg gggctgagcc acgcaagaac tttgtgaaac ccaatgaaac caagacctac 2820
ttctggaaag tccagcacca catggccccc accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggcccactc 2940
ctggtctgcc acaccaacac cctgaaccct gcccatggaa ggcaagtgac tgtgcaggag 3000
tttgccctct tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagcgcaact gcagggcccc atgcaacatt cagatggagg accccacctt caaagagaac 3120
taccgcttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggcc 3180
caggaccaga ggatcaggtg gtacctgctt tctatgggct ccaatgagaa cattcactcc 3240
atccacttct ctgggcatgt cttcactgtg cgcaagaagg aggagtacaa gatggccctg 3300
tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360
tggagggtgg agtgcctcat tggggagcac ctgcatgctg gcatgagcac cctgttcctg 3420
gtctacagca acaagtgcca gacccccctg ggaatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctccactac 3540
tctggatcca tcaatgcctg gagcaccaag gagccattca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaaatg gcagacctac 3720
agaggcaact ccactggaac actcatggtc ttctttggca atgtggacag ctctggcatc 3780
aagcacaaca tcttcaaccc cccaatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatcc gcagcaccct caggatggag ctgatgggct gtgacctgaa ctcctgcagc 3900
atgcccctgg gcatggagag caaggccatt tctgatgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagccca agcaaggcca ggctgcacct ccagggaagg 4020
agcaatgcct ggaggcccca ggtcaacaac ccaaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtcactgg ggtgaccacc cagggggtca agagcctgct caccagcatg 4140
tatgtgaagg agttcctgat cagctccagc caggatggcc accagtggac cctcttcttc 4200
cagaatggca aggtcaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac 4260
agcctggacc cccccctcct gaccagatac ctgaggattc acccccagag ctgggtccac 4320
cagattgccc tgaggatgga ggtcctggga tgtgaggccc aggacctgta ctga 4374
<210> 2
<211> 1457
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 2
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu
755 760 765
Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln
770 775 780
Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu
785 790 795 800
Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe
805 810 815
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
820 825 830
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
835 840 845
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
850 855 860
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
865 870 875 880
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
885 890 895
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
900 905 910
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
915 920 925
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
930 935 940
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
945 950 955 960
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
965 970 975
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
980 985 990
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
995 1000 1005
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1010 1015 1020
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1025 1030 1035
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1040 1045 1050
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1055 1060 1065
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1070 1075 1080
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1085 1090 1095
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1100 1105 1110
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1115 1120 1125
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1130 1135 1140
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1145 1150 1155
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1160 1165 1170
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1175 1180 1185
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1190 1195 1200
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1205 1210 1215
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1220 1225 1230
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1235 1240 1245
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1250 1255 1260
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1265 1270 1275
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1280 1285 1290
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1295 1300 1305
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1310 1315 1320
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1325 1330 1335
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1340 1345 1350
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1355 1360 1365
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1370 1375 1380
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1385 1390 1395
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1400 1405 1410
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1415 1420 1425
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1430 1435 1440
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1445 1450 1455
<210> 3
<211> 2220
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 3
gccaccagga gatactacct gggggctgtg gagctttctt gggactacat gcagtctgac 60
ctgggggagc tgcctgtgga tgccaggttc ccacccagag tgcccaaatc cttcccattc 120
aacacctctg tggtctacaa gaagaccctc tttgtggagt tcactgacca cctgttcaac 180
attgccaaac ccaggccacc ctggatggga ctcctgggac ccaccattca ggctgaggtg 240
tatgacactg tggtcatcac cctcaagaac atggcctccc accctgtgag cctgcatgct 300
gtgggggtca gctactggaa ggcctctgag ggggctgagt atgatgacca gacctcccag 360
agggagaagg aggatgacaa agtgttccct gggggcagcc acacctatgt gtggcaggtc 420
ctcaaggaga atggccccat ggcctctgac ccactctgcc tgacctactc ctacctttct 480
catgtggacc tggtcaagga cctcaactct ggactgattg gggccctgct ggtgtgcagg 540
gagggctccc tggccaaaga gaagacccag accctgcaca agttcattct cctgtttgct 600
gtctttgatg agggcaagag ctggcactct gaaaccaaga actccctgat gcaggacagg 660
gatgctgcct ctgccagggc ctggcccaag atgcacactg tgaatggcta tgtgaacagg 720
agcctgcctg gactcattgg ctgccacagg aaatctgtct actggcatgt gattggcatg 780
gggacaaccc ctgaggtgca ctccattttc ctggagggcc acaccttcct ggtcaggaac 840
cacagacagg ccagcctgga gatcagcccc atcaccttcc tcactgccca gaccctgctg 900
atggacctcg gacagttcct gctgttctgc cacatcagct cccaccagca tgatggcatg 960
gaggcctatg tcaaggtgga cagctgccct gaggagccac agctcaggat gaagaacaat 1020
gaggaggctg aggactatga tgatgacctg actgactctg agatggatgt ggtccgcttt 1080
gatgatgaca acagcccatc cttcattcag atcaggtctg tggccaagaa acaccccaag 1140
acctgggtgc actacattgc tgctgaggag gaggactggg actatgcccc actggtcctg 1200
gcccctgatg acaggagcta caagagccag tacctcaaca atggcccaca gaggattgga 1260
cgcaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccattcagc atgagtctgg catcctgggc ccactcctgt atggggaggt gggggacacc 1380
ctgctcatca tcttcaagaa ccaggcctcc aggccctaca acatctaccc acatggcatc 1440
actgatgtca ggcccctgta cagccgcagg ctgccaaagg gggtgaaaca cctcaaggac 1500
ttccccattc tgcctgggga gatcttcaag tacaagtgga ctgtcactgt ggaggatgga 1560
ccaaccaaat ctgaccccag gtgcctcacc agatactact ccagctttgt gaacatggag 1620
agggacctgg cctctggcct gattggccca ctgctcatct gctacaagga gtctgtggac 1680
cagaggggaa accagatcat gtctgacaag aggaatgtga ttctgttctc tgtctttgat 1740
gagaacagga gctggtacct gactgagaac attcagcgct tcctgcccaa ccctgctggg 1800
gtgcagctgg aggaccctga gttccaggcc agcaacatca tgcactccat caatggctat 1860
gtgtttgaca gcctccagct ttctgtctgc ctgcatgagg tggcctactg gtacattctt 1920
tctattgggg cccagactga cttcctttct gtcttcttct ctggctacac cttcaaacac 1980
aagatggtgt atgaggacac cctgaccctc ttcccattct ctggggagac tgtgttcatg 2040
agcatggaga accctggcct gtggattctg ggatgccaca actctgactt ccgcaacagg 2100
ggcatgactg ccctgctcaa agtctcctcc tgtgacaaga acactgggga ctactatgag 2160
gacagctatg aggacatctc tgcctacctg ctcagcaaga acaatgccat tgagcccagg 2220
<210> 4
<211> 2052
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 4
gagatcacca ggaccaccct ccagtctgac caggaggaga ttgactatga tgacaccatt 60
tctgtggaga tgaagaaaga ggactttgac atctatgacg aggacgagaa ccagagccca 120
aggagcttcc agaagaagac caggcactac ttcattgctg ctgtggagcg cctgtgggac 180
tatggcatga gctccagccc ccatgtcctc aggaacaggg cccagtctgg ctctgtgcca 240
cagttcaaga aagtggtctt ccaagagttc actgatggca gcttcaccca gcccctgtac 300
agaggggagc tgaatgagca cctgggactc ctgggcccat acatcagggc tgaggtggag 360
gacaacatca tggtgacctt ccgcaaccag gcctccaggc cctacagctt ctacagctcc 420
ctcatcagct atgaggagga ccagaggcag ggggctgagc cacgcaagaa ctttgtgaaa 480
cccaatgaaa ccaagaccta cttctggaaa gtccagcacc acatggcccc caccaaggat 540
gagtttgact gcaaggcctg ggcctacttc tctgatgtgg acctggagaa ggatgtgcac 600
tctggcctga ttggcccact cctggtctgc cacaccaaca ccctgaaccc tgcccatgga 660
aggcaagtga ctgtgcagga gtttgccctc ttcttcacca tctttgatga aaccaagagc 720
tggtacttca ctgagaacat ggagcgcaac tgcagggccc catgcaacat tcagatggag 780
gaccccacct tcaaagagaa ctaccgcttc catgccatca atggctacat catggacacc 840
ctgcctgggc ttgtcatggc ccaggaccag aggatcaggt ggtacctgct ttctatgggc 900
tccaatgaga acattcactc catccacttc tctgggcatg tcttcactgt gcgcaagaag 960
gaggagtaca agatggccct gtacaacctc taccctgggg tctttgagac tgtggagatg 1020
ctgccctcca aagctggcat ctggagggtg gagtgcctca ttggggagca cctgcatgct 1080
ggcatgagca ccctgttcct ggtctacagc aacaagtgcc agacccccct gggaatggcc 1140
tctggccaca tcagggactt ccagatcact gcctctggcc agtatggcca gtgggccccc 1200
aagctggcca ggctccacta ctctggatcc atcaatgcct ggagcaccaa ggagccattc 1260
agctggatca aagtggacct gctggccccc atgatcatcc atggcatcaa gacccagggg 1320
gccaggcaga agttctccag cctgtacatc agccagttca tcatcatgta cagcctggat 1380
ggcaagaaat ggcagaccta cagaggcaac tccactggaa cactcatggt cttctttggc 1440
aatgtggaca gctctggcat caagcacaac atcttcaacc ccccaatcat cgccagatac 1500
atcaggctgc accccaccca ctacagcatc cgcagcaccc tcaggatgga gctgatgggc 1560
tgtgacctga actcctgcag catgcccctg ggcatggaga gcaaggccat ttctgatgcc 1620
cagatcactg cctccagcta cttcaccaac atgtttgcca cctggagccc aagcaaggcc 1680
aggctgcacc tccagggaag gagcaatgcc tggaggcccc aggtcaacaa cccaaaggag 1740
tggctgcagg tggacttcca gaagaccatg aaggtcactg gggtgaccac ccagggggtc 1800
aagagcctgc tcaccagcat gtatgtgaag gagttcctga tcagctccag ccaggatggc 1860
caccagtgga ccctcttctt ccagaatggc aaggtcaagg tgttccaggg caaccaggac 1920
agcttcaccc ctgtggtgaa cagcctggac ccccccctcc tgaccagata cctgaggatt 1980
cacccccaga gctgggtcca ccagattgcc ctgaggatgg aggtcctggg atgtgaggcc 2040
caggacctgt ac 2052
<210> 5
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 5
agcttctctc agaatccacc tgtcctgaag agacaccaga ga 42
<210> 6
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 6
agcttcagcc agaatccacc tgtcctgaaa cgccaccaga gg 42
<210> 7
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 7
agcttcagcc agaacccccc cgtgctgaag aggcaccaga gg 42
<210> 8
<211> 7827
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 8
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cctcgagatt taaatgacgt 420
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 480
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg 540
ccaactccat cactaggggt tcctgagttt aaacttcgtc gacgattcga gcttgggctg 600
caggtcgagg gcactgggag gatgttgagt aagatggaaa actactgatg acccttgcag 660
agacagagta ttaggacatg tttgaacagg ggccgggcga tcagcaggta gctctagagg 720
atccccgtct gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc 780
aaggttcata tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa 840
tcagcaggtt tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat 900
aaaagcccct tcaccaggag aagccgtcac acagactagg cgcgccaccg ccaccatgca 960
gattgagctg agcacctgct tcttcctgtg cctgctgagg ttctgcttct ctgccaccag 1020
gagatactac ctgggggctg tggagctttc ttgggactac atgcagtctg acctggggga 1080
gctgcctgtg gatgccaggt tcccacccag agtgcccaaa tccttcccat tcaacacctc 1140
tgtggtctac aagaagaccc tctttgtgga gttcactgac cacctgttca acattgccaa 1200
acccaggcca ccctggatgg gactcctggg acccaccatt caggctgagg tgtatgacac 1260
tgtggtcatc accctcaaga acatggcctc ccaccctgtg agcctgcatg ctgtgggggt 1320
cagctactgg aaggcctctg agggggctga gtatgatgac cagacctccc agagggagaa 1380
ggaggatgac aaagtgttcc ctgggggcag ccacacctat gtgtggcagg tcctcaagga 1440
gaatggcccc atggcctctg acccactctg cctgacctac tcctaccttt ctcatgtgga 1500
cctggtcaag gacctcaact ctggactgat tggggccctg ctggtgtgca gggagggctc 1560
cctggccaaa gagaagaccc agaccctgca caagttcatt ctcctgtttg ctgtctttga 1620
tgagggcaag agctggcact ctgaaaccaa gaactccctg atgcaggaca gggatgctgc 1680
ctctgccagg gcctggccca agatgcacac tgtgaatggc tatgtgaaca ggagcctgcc 1740
tggactcatt ggctgccaca ggaaatctgt ctactggcat gtgattggca tggggacaac 1800
ccctgaggtg cactccattt tcctggaggg ccacaccttc ctggtcagga accacagaca 1860
ggccagcctg gagatcagcc ccatcacctt cctcactgcc cagaccctgc tgatggacct 1920
cggacagttc ctgctgttct gccacatcag ctcccaccag catgatggca tggaggccta 1980
tgtcaaggtg gacagctgcc ctgaggagcc acagctcagg atgaagaaca atgaggaggc 2040
tgaggactat gatgatgacc tgactgactc tgagatggat gtggtccgct ttgatgatga 2100
caacagccca tccttcattc agatcaggtc tgtggccaag aaacacccca agacctgggt 2160
gcactacatt gctgctgagg aggaggactg ggactatgcc ccactggtcc tggcccctga 2220
tgacaggagc tacaagagcc agtacctcaa caatggccca cagaggattg gacgcaagta 2280
caagaaagtc aggttcatgg cctacactga tgaaaccttc aagaccaggg aggccattca 2340
gcatgagtct ggcatcctgg gcccactcct gtatggggag gtgggggaca ccctgctcat 2400
catcttcaag aaccaggcct ccaggcccta caacatctac ccacatggca tcactgatgt 2460
caggcccctg tacagccgca ggctgccaaa gggggtgaaa cacctcaagg acttccccat 2520
tctgcctggg gagatcttca agtacaagtg gactgtcact gtggaggatg gaccaaccaa 2580
atctgacccc aggtgcctca ccagatacta ctccagcttt gtgaacatgg agagggacct 2640
ggcctctggc ctgattggcc cactgctcat ctgctacaag gagtctgtgg accagagggg 2700
aaaccagatc atgtctgaca agaggaatgt gattctgttc tctgtctttg atgagaacag 2760
gagctggtac ctgactgaga acattcagcg cttcctgccc aaccctgctg gggtgcagct 2820
ggaggaccct gagttccagg ccagcaacat catgcactcc atcaatggct atgtgtttga 2880
cagcctccag ctttctgtct gcctgcatga ggtggcctac tggtacattc tttctattgg 2940
ggcccagact gacttccttt ctgtcttctt ctctggctac accttcaaac acaagatggt 3000
gtatgaggac accctgaccc tcttcccatt ctctggggag actgtgttca tgagcatgga 3060
gaaccctggc ctgtggattc tgggatgcca caactctgac ttccgcaaca ggggcatgac 3120
tgccctgctc aaagtctcct cctgtgacaa gaacactggg gactactatg aggacagcta 3180
tgaggacatc tctgcctacc tgctcagcaa gaacaatgcc attgagccca ggagcttcag 3240
ccagaatcca cctgtcctga aacgccacca gagggagatc accaggacca ccctccagtc 3300
tgaccaggag gagattgact atgatgacac catttctgtg gagatgaaga aagaggactt 3360
tgacatctat gacgaggacg agaaccagag cccaaggagc ttccagaaga agaccaggca 3420
ctacttcatt gctgctgtgg agcgcctgtg ggactatggc atgagctcca gcccccatgt 3480
cctcaggaac agggcccagt ctggctctgt gccacagttc aagaaagtgg tcttccaaga 3540
gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg agcacctggg 3600
actcctgggc ccatacatca gggctgaggt ggaggacaac atcatggtga ccttccgcaa 3660
ccaggcctcc aggccctaca gcttctacag ctccctcatc agctatgagg aggaccagag 3720
gcagggggct gagccacgca agaactttgt gaaacccaat gaaaccaaga cctacttctg 3780
gaaagtccag caccacatgg cccccaccaa ggatgagttt gactgcaagg cctgggccta 3840
cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc cactcctggt 3900
ctgccacacc aacaccctga accctgccca tggaaggcaa gtgactgtgc aggagtttgc 3960
cctcttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga acatggagcg 4020
caactgcagg gccccatgca acattcagat ggaggacccc accttcaaag agaactaccg 4080
cttccatgcc atcaatggct acatcatgga caccctgcct gggcttgtca tggcccagga 4140
ccagaggatc aggtggtacc tgctttctat gggctccaat gagaacattc actccatcca 4200
cttctctggg catgtcttca ctgtgcgcaa gaaggaggag tacaagatgg ccctgtacaa 4260
cctctaccct ggggtctttg agactgtgga gatgctgccc tccaaagctg gcatctggag 4320
ggtggagtgc ctcattgggg agcacctgca tgctggcatg agcaccctgt tcctggtcta 4380
cagcaacaag tgccagaccc ccctgggaat ggcctctggc cacatcaggg acttccagat 4440
cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctcc actactctgg 4500
atccatcaat gcctggagca ccaaggagcc attcagctgg atcaaagtgg acctgctggc 4560
ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttct ccagcctgta 4620
catcagccag ttcatcatca tgtacagcct ggatggcaag aaatggcaga cctacagagg 4680
caactccact ggaacactca tggtcttctt tggcaatgtg gacagctctg gcatcaagca 4740
caacatcttc aaccccccaa tcatcgccag atacatcagg ctgcacccca cccactacag 4800
catccgcagc accctcagga tggagctgat gggctgtgac ctgaactcct gcagcatgcc 4860
cctgggcatg gagagcaagg ccatttctga tgcccagatc actgcctcca gctacttcac 4920
caacatgttt gccacctgga gcccaagcaa ggccaggctg cacctccagg gaaggagcaa 4980
tgcctggagg ccccaggtca acaacccaaa ggagtggctg caggtggact tccagaagac 5040
catgaaggtc actggggtga ccacccaggg ggtcaagagc ctgctcacca gcatgtatgt 5100
gaaggagttc ctgatcagct ccagccagga tggccaccag tggaccctct tcttccagaa 5160
tggcaaggtc aaggtgttcc agggcaacca ggacagcttc acccctgtgg tgaacagcct 5220
ggaccccccc ctcctgacca gatacctgag gattcacccc cagagctggg tccaccagat 5280
tgccctgagg atggaggtcc tgggatgtga ggcccaggac ctgtactgat gacgagcggc 5340
cgctcttagt agcagtatcg ataataaaag atctttattt tcattagatc tgtgtgttgg 5400
ttttttgtgt gttaattaag ctcgcgaagg aacccctagt gatggagttg gccactccct 5460
ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 5520
ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aagacgattt 5580
aaatgacaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 5640
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 5700
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 5760
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 5820
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 5880
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 5940
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 6000
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 6060
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 6120
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 6180
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 6240
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 6300
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 6360
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 6420
ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc 6480
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 6540
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 6600
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 6660
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 6720
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 6780
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 6840
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 6900
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 6960
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 7020
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 7080
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 7140
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 7200
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 7260
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 7320
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 7380
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 7440
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 7500
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 7560
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 7620
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 7680
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 7740
cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa 7800
ataggcgtat cacgaggccc tttcgtc 7827
<210> 9
<211> 4332
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 9
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagggag 2280
atcaccagga ccaccctcca gtctgaccag gaggagattg actatgatga caccatttct 2340
gtggagatga agaaagagga ctttgacatc tatgacgagg acgagaacca gagcccaagg 2400
agcttccaga agaagaccag gcactacttc attgctgctg tggagcgcct gtgggactat 2460
ggcatgagct ccagccccca tgtcctcagg aacagggccc agtctggctc tgtgccacag 2520
ttcaagaaag tggtcttcca agagttcact gatggcagct tcacccagcc cctgtacaga 2580
ggggagctga atgagcacct gggactcctg ggcccataca tcagggctga ggtggaggac 2640
aacatcatgg tgaccttccg caaccaggcc tccaggccct acagcttcta cagctccctc 2700
atcagctatg aggaggacca gaggcagggg gctgagccac gcaagaactt tgtgaaaccc 2760
aatgaaacca agacctactt ctggaaagtc cagcaccaca tggcccccac caaggatgag 2820
tttgactgca aggcctgggc ctacttctct gatgtggacc tggagaagga tgtgcactct 2880
ggcctgattg gcccactcct ggtctgccac accaacaccc tgaaccctgc ccatggaagg 2940
caagtgactg tgcaggagtt tgccctcttc ttcaccatct ttgatgaaac caagagctgg 3000
tacttcactg agaacatgga gcgcaactgc agggccccat gcaacattca gatggaggac 3060
cccaccttca aagagaacta ccgcttccat gccatcaatg gctacatcat ggacaccctg 3120
cctgggcttg tcatggccca ggaccagagg atcaggtggt acctgctttc tatgggctcc 3180
aatgagaaca ttcactccat ccacttctct gggcatgtct tcactgtgcg caagaaggag 3240
gagtacaaga tggccctgta caacctctac cctggggtct ttgagactgt ggagatgctg 3300
ccctccaaag ctggcatctg gagggtggag tgcctcattg gggagcacct gcatgctggc 3360
atgagcaccc tgttcctggt ctacagcaac aagtgccaga cccccctggg aatggcctct 3420
ggccacatca gggacttcca gatcactgcc tctggccagt atggccagtg ggcccccaag 3480
ctggccaggc tccactactc tggatccatc aatgcctgga gcaccaagga gccattcagc 3540
tggatcaaag tggacctgct ggcccccatg atcatccatg gcatcaagac ccagggggcc 3600
aggcagaagt tctccagcct gtacatcagc cagttcatca tcatgtacag cctggatggc 3660
aagaaatggc agacctacag aggcaactcc actggaacac tcatggtctt ctttggcaat 3720
gtggacagct ctggcatcaa gcacaacatc ttcaaccccc caatcatcgc cagatacatc 3780
aggctgcacc ccacccacta cagcatccgc agcaccctca ggatggagct gatgggctgt 3840
gacctgaact cctgcagcat gcccctgggc atggagagca aggccatttc tgatgcccag 3900
atcactgcct ccagctactt caccaacatg tttgccacct ggagcccaag caaggccagg 3960
ctgcacctcc agggaaggag caatgcctgg aggccccagg tcaacaaccc aaaggagtgg 4020
ctgcaggtgg acttccagaa gaccatgaag gtcactgggg tgaccaccca gggggtcaag 4080
agcctgctca ccagcatgta tgtgaaggag ttcctgatca gctccagcca ggatggccac 4140
cagtggaccc tcttcttcca gaatggcaag gtcaaggtgt tccagggcaa ccaggacagc 4200
ttcacccctg tggtgaacag cctggacccc cccctcctga ccagatacct gaggattcac 4260
ccccagagct gggtccacca gattgccctg aggatggagg tcctgggatg tgaggcccag 4320
gacctgtact ga 4332
<210> 10
<211> 1443
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 10
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser
755 760 765
Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys
770 775 780
Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg
785 790 795 800
Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg
805 810 815
Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg
820 825 830
Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu
835 840 845
Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn
850 855 860
Glu His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp
865 870 875 880
Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe
885 890 895
Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu
900 905 910
Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp
915 920 925
Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
930 935 940
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser
945 950 955 960
Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro
965 970 975
Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr
980 985 990
Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg
995 1000 1005
Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe
1010 1015 1020
Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp
1025 1030 1035
Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp
1040 1045 1050
Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His
1055 1060 1065
Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys
1070 1075 1080
Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu
1085 1090 1095
Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile
1100 1105 1110
Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr
1115 1120 1125
Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile
1130 1135 1140
Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala
1145 1150 1155
Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp
1160 1165 1170
Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala
1175 1180 1185
Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys
1190 1195 1200
Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu
1205 1210 1215
Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr
1220 1225 1230
Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His
1235 1240 1245
Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His
1250 1255 1260
Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met
1265 1270 1275
Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser
1280 1285 1290
Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr
1295 1300 1305
Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu
1310 1315 1320
Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys
1325 1330 1335
Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly
1340 1345 1350
Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val
1355 1360 1365
Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr
1370 1375 1380
Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln
1385 1390 1395
Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu
1400 1405 1410
Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile
1415 1420 1425
Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435 1440
<210> 11
<211> 4368
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 11
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccaggagc 2280
ttcagccaga attccagaca ccccagcacc agggagatca ccaggaccac cctccagtct 2340
gaccaggagg agattgacta tgatgacacc atttctgtgg agatgaagaa agaggacttt 2400
gacatctatg acgaggacga gaaccagagc ccaaggagct tccagaagaa gaccaggcac 2460
tacttcattg ctgctgtgga gcgcctgtgg gactatggca tgagctccag cccccatgtc 2520
ctcaggaaca gggcccagtc tggctctgtg ccacagttca agaaagtggt cttccaagag 2580
ttcactgatg gcagcttcac ccagcccctg tacagagggg agctgaatga gcacctggga 2640
ctcctgggcc catacatcag ggctgaggtg gaggacaaca tcatggtgac cttccgcaac 2700
caggcctcca ggccctacag cttctacagc tccctcatca gctatgagga ggaccagagg 2760
cagggggctg agccacgcaa gaactttgtg aaacccaatg aaaccaagac ctacttctgg 2820
aaagtccagc accacatggc ccccaccaag gatgagtttg actgcaaggc ctgggcctac 2880
ttctctgatg tggacctgga gaaggatgtg cactctggcc tgattggccc actcctggtc 2940
tgccacacca acaccctgaa ccctgcccat ggaaggcaag tgactgtgca ggagtttgcc 3000
ctcttcttca ccatctttga tgaaaccaag agctggtact tcactgagaa catggagcgc 3060
aactgcaggg ccccatgcaa cattcagatg gaggacccca ccttcaaaga gaactaccgc 3120
ttccatgcca tcaatggcta catcatggac accctgcctg ggcttgtcat ggcccaggac 3180
cagaggatca ggtggtacct gctttctatg ggctccaatg agaacattca ctccatccac 3240
ttctctgggc atgtcttcac tgtgcgcaag aaggaggagt acaagatggc cctgtacaac 3300
ctctaccctg gggtctttga gactgtggag atgctgccct ccaaagctgg catctggagg 3360
gtggagtgcc tcattgggga gcacctgcat gctggcatga gcaccctgtt cctggtctac 3420
agcaacaagt gccagacccc cctgggaatg gcctctggcc acatcaggga cttccagatc 3480
actgcctctg gccagtatgg ccagtgggcc cccaagctgg ccaggctcca ctactctgga 3540
tccatcaatg cctggagcac caaggagcca ttcagctgga tcaaagtgga cctgctggcc 3600
cccatgatca tccatggcat caagacccag ggggccaggc agaagttctc cagcctgtac 3660
atcagccagt tcatcatcat gtacagcctg gatggcaaga aatggcagac ctacagaggc 3720
aactccactg gaacactcat ggtcttcttt ggcaatgtgg acagctctgg catcaagcac 3780
aacatcttca accccccaat catcgccaga tacatcaggc tgcaccccac ccactacagc 3840
atccgcagca ccctcaggat ggagctgatg ggctgtgacc tgaactcctg cagcatgccc 3900
ctgggcatgg agagcaaggc catttctgat gcccagatca ctgcctccag ctacttcacc 3960
aacatgtttg ccacctggag cccaagcaag gccaggctgc acctccaggg aaggagcaat 4020
gcctggaggc cccaggtcaa caacccaaag gagtggctgc aggtggactt ccagaagacc 4080
atgaaggtca ctggggtgac cacccagggg gtcaagagcc tgctcaccag catgtatgtg 4140
aaggagttcc tgatcagctc cagccaggat ggccaccagt ggaccctctt cttccagaat 4200
ggcaaggtca aggtgttcca gggcaaccag gacagcttca cccctgtggt gaacagcctg 4260
gacccccccc tcctgaccag atacctgagg attcaccccc agagctgggt ccaccagatt 4320
gccctgagga tggaggtcct gggatgtgag gcccaggacc tgtactga 4368
<210> 12
<211> 1455
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 12
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765
Ser Thr Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu
770 775 780
Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe
785 790 795 800
Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys
805 810 815
Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr
820 825 830
Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly
835 840 845
Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly
850 855 860
Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly
865 870 875 880
Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
885 890 895
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu
900 905 910
Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn
915 920 925
Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His
930 935 940
His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr
945 950 955 960
Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly
965 970 975
Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg
980 985 990
Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu
995 1000 1005
Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg
1010 1015 1020
Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn
1025 1030 1035
Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
1040 1045 1050
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu
1055 1060 1065
Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly
1070 1075 1080
His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu
1085 1090 1095
Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro
1100 1105 1110
Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His
1115 1120 1125
Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys
1130 1135 1140
Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe
1145 1150 1155
Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu
1160 1165 1170
Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys
1175 1180 1185
Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile
1190 1195 1200
Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser
1205 1210 1215
Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys
1220 1225 1230
Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val
1235 1240 1245
Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe
1250 1255 1260
Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His
1265 1270 1275
Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp
1280 1285 1290
Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile
1295 1300 1305
Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe
1310 1315 1320
Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg
1325 1330 1335
Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu
1340 1345 1350
Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr
1355 1360 1365
Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe
1370 1375 1380
Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe
1385 1390 1395
Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe
1400 1405 1410
Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr
1415 1420 1425
Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg
1430 1435 1440
Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1445 1450 1455
<210> 13
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 13
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagaagc 2280
ttctctcaga atccacctgt cctgaagaga caccagagag agatcaccag gacaaccctc 2340
cagtctgacc aggaagagat tgactatgat gacaccattt ctgtggagat gaagaaggag 2400
gactttgaca tctatgatga ggacgagaac cagtctccaa gatcattcca gaagaagaca 2460
agacactact tcattgctgc tgtggaaaga ctgtgggact atggcatgtc ttcctctccc 2520
catgtcctca ggaacagggc acagtctggc tctgtgccac agttcaagaa agtggtcttc 2580
caggagttca ctgatggctc attcacccag cccctgtaca gaggggaact gaatgagcac 2640
ctgggactcc tgggaccata catcagggct gaggtggaag acaacatcat ggtgacattc 2700
agaaaccagg cctccaggcc ctacagcttc tactcttccc tcatcagcta tgaggaagac 2760
cagagacaag gggctgagcc aagaaagaac tttgtgaaac ccaatgaaac caagacctac 2820
ttctggaaag tccagcacca catggcaccc accaaggatg agtttgactg caaggcctgg 2880
gcatacttct ctgatgtgga cctggagaaa gatgtgcact ctggcctgat tggcccactc 2940
ctggtctgcc acaccaacac cctgaaccct gcacatggaa ggcaagtgac tgtgcaggag 3000
tttgccctct tcttcaccat ctttgatgaa accaagtcat ggtacttcac tgagaacatg 3060
gagagaaact gcagagcacc atgcaacatt cagatggaag accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggca 3180
caggaccaga gaatcagatg gtacctgctt tctatgggat ccaatgagaa cattcactcc 3240
atccacttct ctgggcatgt cttcactgtg agaaagaagg aggaatacaa gatggccctg 3300
tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360
tggagggtgg aatgcctcat tggggagcac ctgcatgctg gcatgtcaac cctgttcctg 3420
gtctacagca acaagtgcca gacacccctg ggaatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtatggccag tgggcaccca aactggccag gctccactac 3540
tctggctcca tcaatgcatg gtcaaccaag gagccattct cttggatcaa ggtggacctg 3600
ctggcaccca tgatcattca tggcatcaag acacaggggg caagacagaa attctcctct 3660
ctgtacatct cacagttcat catcatgtac tctctggatg gcaagaagtg gcagacatac 3720
agaggcaact ccactggcac cctcatggtc ttctttggca atgtggacag ctctggcatc 3780
aagcacaaca tcttcaaccc tcccatcatt gccagataca tcaggctgca ccccacccac 3840
tactcaatca gatcaaccct caggatggaa ctgatgggat gtgacctgaa ctcctgctca 3900
atgcccctgg gaatggagag caaggccatt tctgatgccc agatcactgc atcctcttac 3960
ttcaccaaca tgtttgccac ctggtcacca tcaaaagcca ggctgcacct ccagggaaga 4020
agcaatgcct ggagacccca ggtcaacaac ccaaaggaat ggctgcaagt ggacttccag 4080
aagacaatga aagtcactgg ggtgacaacc cagggggtca agtctctgct cacctcaatg 4140
tatgtgaagg agttcctgat ctcttcctca caggatggcc accagtggac actcttcttc 4200
cagaatggca aagtcaaggt gttccagggc aaccaggact ctttcacacc tgtggtgaac 4260
tcactggacc cccccctcct gacaagatac ctgagaattc acccccagtc ttgggtccac 4320
cagattgccc tgagaatgga agtcctggga tgtgaggcac aagacctgta ctga 4374
<210> 14
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 14
atgcagatcg aactgagcac ttgcttcttc ctgtgtctcc tgcgcttttg cttctccgcc 60
acaaggagat actatctcgg tgccgtggag ctcagctggg actacatgca gagcgacttg 120
ggtgaactgc ctgtggacgc caggtttcca ccccgcgtgc ccaagagttt cccgttcaac 180
accagtgtcg tgtacaagaa aaccctcttc gtggaattca ccgaccacct gttcaacatc 240
gccaaaccgc gccctccctg gatggggctg ctcggcccga cgatccaggc tgaggtctat 300
gacacggtgg tgattaccct caagaacatg gctagccacc cggtgagcct gcacgccgtg 360
ggcgtgtcct attggaaagc gtccgagggt gcggagtacg atgaccagac ttcacagcgg 420
gagaaggaag acgacaaagt gttccccggg ggttcccaca cctatgtctg gcaggtcctg 480
aaggagaatg gtcctatggc ctccgaccca ttgtgcctca cctactctta cctaagccat 540
gtggatctcg tcaaggacct gaactcgggg ctgatcggcg ccctgctcgt gtgccgggag 600
ggctcactgg ccaaggagaa gacccaaact ctgcacaagt tcatcctgct gttcgcggta 660
ttcgacgagg ggaagtcctg gcactccgag accaagaaca gcctgatgca ggaccgcgac 720
gcagcctcgg cccgtgcgtg gccaaagatg cacaccgtga acggctacgt taacaggagc 780
ctacccggcc tgatcggctg ccaccgcaaa tcggtctact ggcatgtgat cggaatgggc 840
acaacgcccg aggtccacag tatcttcctc gagggccaca ctttcctggt ccggaatcac 900
cgccaggcca gcctggagat cagccccata acctttctga cggcgcagac cttactcatg 960
gatctcggcc agttcctcct gttctgccac atttcgtccc accagcacga tgggatggaa 1020
gcatatgtga aagtggactc ctgccccgag gaaccccagc ttaggatgaa gaacaatgag 1080
gaggccgagg actacgacga tgaccttacc gattcagaaa tggacgtagt acgctttgac 1140
gacgacaact ctccatcctt catacagatt cgctccgtcg ccaagaagca ccctaagact 1200
tgggtgcact acatcgcggc cgaggaggag gactgggatt atgctcccct ggtgctggcc 1260
cccgacgacc gcagctacaa gagccagtac ctgaataacg ggccccagcg catcggccgg 1320
aagtacaaga aagtgcggtt catggcttac acggacgaga ccttcaagac ccgggaggct 1380
atccagcatg agagcggcat cttggggccc ctcctgtacg gcgaagttgg agacacactg 1440
ctgatcatct tcaagaacca ggcgagcagg ccctacaaca tctaccccca cggcattacc 1500
gatgtccggc cgttgtacag ccgacggctg cccaagggcg tgaagcacct gaaggacttt 1560
ccgatcctgc cgggcgagat cttcaagtac aagtggactg tgaccgtgga ggatgggccg 1620
accaagagcg atccgcgctg cctgacccgt tactactcca gctttgtcaa tatggagcgc 1680
gacctcgcta gcggcttgat tggccctctg ctgatctgct acaaggagtc cgtggaccag 1740
agggggaatc agatcatgag tgacaagagg aacgtgatcc tgttctccgt gttcgacgaa 1800
aaccgcagct ggtatctcac cgagaatatc cagcgcttcc tgcccaaccc ggccggtgtg 1860
cagctggagg accccgagtt tcaggccagc aacatcatgc attctatcaa cggatatgtg 1920
tttgattccc tgcagctctc agtgtgtctg cacgaggtcg cctactggta tatcctcagc 1980
attggggcac agaccgactt cctgagcgtg ttcttctccg ggtatacctt caagcacaag 2040
atggtgtacg aggataccct gaccctgttc ccctttagcg gcgaaaccgt gtttatgtct 2100
atggagaacc ccgggctctg gatccttggc tgccataact ccgacttccg caaccgcgga 2160
atgaccgcgc tcctgaaagt gtcgagttgt gacaagaaca ccggcgacta ttacgaggac 2220
agttacgagg acatctctgc gtacctcctt agcaagaata acgccatcga gccaagatcc 2280
ttcagccaga accccccagt gctgaagagg catcagcggg agatcacccg cacgaccctg 2340
cagtcggatc aggaggagat tgattacgac gacacgatca gtgtggagat gaagaaggag 2400
gacttcgaca tctacgacga agatgaaaac cagtcccctc ggtccttcca aaagaagacc 2460
cggcactact tcatcgccgc tgtggaacgc ctgtgggact atggaatgtc ttctagccct 2520
cacgttttga ggaaccgcgc ccagtcgggc agcgtgcccc agttcaagaa agtggtgttc 2580
caggagttca ccgacggctc cttcacccag ccactttacc ggggcgagct caatgaacat 2640
ctgggcctgc tgggacccta catcagggct gaggtggagg acaacatcat ggtgacattc 2700
cggaatcagg ccagcagacc atacagtttc tacagttcac tcatctccta cgaggaggac 2760
cagcgccagg gggctgaacc ccgtaagaac ttcgtgaagc caaacgaaac aaagacctac 2820
ttctggaagg tccagcacca catggcacct accaaggacg agttcgattg caaggcctgg 2880
gcctacttct ccgacgtgga cctggagaaa gatgtgcaca gcggcctgat tggccctctg 2940
ctggtgtgtc acacgaacac actcaaccct gcacacgggc ggcaggtcac tgtgcaggaa 3000
ttcgccctgt tctttaccat ctttgatgag acgaagtcct ggtatttcac cgaaaacatg 3060
gagaggaact gccgcgcacc ctgcaacatc cagatggaag atccgacatt caaggagaac 3120
taccggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct cgtgatggcc 3180
caagaccagc gtatccgctg gtatctgctg tcgatgggct ccaacgagaa catccatagt 3240
atccacttca gcgggcatgt cttcacggtg aggaaaaagg aggagtacaa gatggcactg 3300
tacaacctct atcccggcgt gttcgagacc gtggagatgc tgccctccaa ggccggcatc 3360
tggagagtgg aatgcctgat cggcgagcac ctccacgctg ggatgtccac gctgttcctc 3420
gtttacagca ataagtgcca gacccctctg ggcatggcga gcggccacat ccgcgacttc 3480
cagattacag ccagcggcca gtacggtcag tgggctccaa agctggcccg tctgcactac 3540
tccggatcca tcaacgcctg gtccaccaag gaaccgttct cctggatcaa agtagacctg 3600
ctagccccca tgatcattca cggcatcaag acacaaggcg cccgacagaa gttctcgagc 3660
ctctatatct cccagttcat catcatgtat agcctggacg gaaagaagtg gcagacttac 3720
cgcggaaact cgacagggac cctgatggta ttcttcggta acgtggacag ctccggaatc 3780
aagcacaaca tcttcaaccc acccattatc gcccgctaca tccgcctgca ccccactcac 3840
tatagcatta ggtccaccct gcgaatggag ctcatgggct gtgacctgaa cagctgtagc 3900
atgcccctcg gcatggagtc taaggcgatc tccgacgcac agataacggc atcatcctac 3960
tttaccaaca tgttcgctac ctggtccccc tccaaggccc gactccacct gcaagggaga 4020
tccaacgcct ggcggccaca ggtcaacaat cccaaggagt ggctgcaagt ggactttcag 4080
aaaactatga aagtcaccgg agtgaccaca cagggagtga agtctctgct gaccagcatg 4140
tacgtgaagg agttcctcat ctccagttcg caggatggcc accagtggac gttgttcttc 4200
caaaacggta aagtcaaagt cttccaaggg aaccaggaca gctttacacc cgtcgtgaac 4260
tccctggacc ccccgcttct cactagatac ctccgcatcc accctcagag ctgggtgcac 4320
cagattgccc tgcgcatgga ggttctgggg tgtgaagccc aggacctgta ctaa 4374
<210> 15
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 15
atgcagattg agctctccac ctgcttcttt ctctgccttc ttcgcttctg cttttctgcc 60
acacgcaggt actatttggg agcagtggaa ctgagctggg attacatgca gagtgacctt 120
ggtgaacttc ctgtggacgc tcgttttcca cctagagttc ccaagtcctt ccccttcaac 180
acctcagtgg tctacaagaa aacgctgttt gtggagttca ctgaccacct cttcaacatt 240
gccaaaccaa gacccccttg gatgggattg ctgggaccca caatacaagc agaagtctac 300
gacacggtgg tgattaccct gaagaacatg gcgtcacacc ctgtttcact tcacgctgtt 360
ggggtcagtt attggaaagc ctcagagggt gcggaatacg atgatcaaac cagccagagg 420
gagaaggaag atgacaaggt ctttcctggg ggtagccata cctatgtttg gcaggtgctg 480
aaagagaatg ggcctatggc ctctgatccc ttgtgcctca catactctta cctgagtcac 540
gtcgacctgg tgaaagacct gaatagcggt ctgattggtg cactgcttgt ttgtagagag 600
gggagtttgg ccaaggagaa aactcagact ctccacaagt ttatcctcct gtttgctgtg 660
ttcgacgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca ggacagagat 720
gctgcatctg caagggcttg gccaaaaatg cacacagtga acggctatgt gaatcgatca 780
ctgccaggac tgataggctg tcatcgcaag tcagtgtatt ggcacgttat cgggatggga 840
acaactccag aagtgcacag catcttcctt gagggccaca ctttcctggt tcggaatcat 900
agacaggcca gccttgagat cagcccaatc acctttctga ctgcccaaac cttgctgatg 960
gatctgggac agttcctcct gttttgtcac atctcctccc accaacatga cgggatggag 1020
gcttatgtga aggtcgatag ctgtccggag gaaccacaac tgaggatgaa gaacaacgaa 1080
gaggcagagg actatgacga cgatctgact gacagtgaaa tggacgtggt tcggttcgac 1140
gatgacaatt ctccttcatt tatccagatc cgttccgtgg ccaagaagca ccccaagact 1200
tgggttcatt acatcgctgc tgaggaggag gattgggact acgcgccctt ggtgttggcc 1260
ccagacgatc gctcatacaa gagccagtac cttaacaatg gtccacaaag gatcggccgg 1320
aagtacaaga aggttagatt tatggcttat accgacgaga cttttaaaac tagggaagca 1380
attcagcatg aaagtggcat tcttggaccc ctgctgtatg gcgaggttgg cgacaccctg 1440
ctgattatct ttaagaacca ggcaagccgg ccctacaaca tctacccgca cggcataacc 1500
gatgtacgac ccctgtacag tcgcagactt cctaaagggg tgaaacacct gaaggacttc 1560
ccaattctgc ccggggagat cttcaagtat aaatggaccg tgacggttga ggatggtccc 1620
acaaagtccg atccgagatg ccttacccga tattattcca gcttcgtgaa catggaaagg 1680
gacctggcca gcgggctgat tggcccactg ctgatttgtt acaaggagtc tgtcgatcaa 1740
agaggaaacc aaataatgag cgacaaacgt aacgtcatcc tgttcagcgt ctttgatgag 1800
aatagaagct ggtacctcac agaaaatatt cagcggtttc tgcctaaccc cgcaggcgtc 1860
cagctggaag atcccgagtt ccaagcctca aacatcatgc atagcatcaa cggatacgta 1920
ttcgatagcc tgcagctgtc cgtctgtctc catgaagtgg catattggta catcctgagt 1980
atcggggcgc agaccgactt cctgagcgtg ttcttttctg gatacacgtt caaacacaaa 2040
atggtctatg aagataccct gactctgttt ccattctcag gagagacagt ctttatgagt 2100
atggaaaatc ctggactgtg gatcctgggc tgtcacaatt ctgattttcg gaacagaggc 2160
atgacagccc tgcttaaagt gagctcatgc gacaagaaca ccggtgatta ctacgaagat 2220
agctatgagg acatcagtgc gtatttgctc tccaagaaca acgctatcga gccacggtct 2280
ttcagtcaga atcctcccgt tctgaagcgg catcagcgcg aaataacacg cacaaccctt 2340
cagtcagacc aagaggaaat cgactacgat gatactatct ctgtggagat gaagaaggag 2400
gatttcgaca tttacgacga ggacgagaat cagtccccaa ggagctttca gaagaaaaca 2460
agacactatt tcattgccgc cgtggagcga ctgtgggact acggcatgtc tagctctccg 2520
catgtactta gaaatagggc acaaagcgga tccgtgcctc agtttaagaa agttgtcttt 2580
caggagttta cagatggctc cttcacccag cccttgtatc gcggggaact caatgaacac 2640
ctgggcctcc tgggtcctta tattagggcc gaagtcgagg acaatatcat ggtgaccttt 2700
aggaaccagg catctagacc ttactctttc tactcctccc tgatatccta tgaggaggac 2760
cagcggcaag gcgctgagcc tcggaagaac tttgtgaagc caaatgaaac caaaacatac 2820
ttttggaaag ttcagcacca catggctccc acgaaggacg aatttgactg taaagcctgg 2880
gcctacttct cagatgtaga tctcgagaaa gacgtgcact cagggctcat tggtcccctc 2940
ctggtctgtc atactaatac cctcaatcca gcacacggac gtcaggtaac cgtccaggaa 3000
tttgccctgt tctttaccat tttcgatgag actaaatcct ggtactttac cgaaaacatg 3060
gagaggaatt gcagagcccc atgcaacatc cagatggagg accctacctt caaagagaac 3120
tatcgcttcc atgccattaa cggttacatt atggatactc tcccaggact tgtgatggca 3180
caggatcagc ggataagatg gtatctgttg agcatgggct ccaacgagaa tattcacagc 3240
atccatttct ccggtcacgt gtttacagtg agaaagaaag aagagtacaa gatggctctg 3300
tataatctct atccaggcgt attcgaaacg gtggagatgt tgcctagcaa ggccggcatt 3360
tggcgagtag aatgccttat cggggaacat ctgcatgccg gaatgagcac gctcttcctg 3420
gtgtatagta acaagtgcca gactccgctg ggcatggcat ctggccatat acgggacttt 3480
cagattacgg ctagcgggca gtatgggcag tgggcaccca aacttgcgcg actgcactat 3540
tcaggctcta tcaatgcatg gtccaccaag gaacccttct cttggattaa ggtggacctt 3600
ttggcgccca tgataatcca tgggatcaaa acccagggcg ctcgtcagaa attctcatca 3660
ctctacatct ctcagttcat aataatgtat tcactggatg ggaagaaatg gcagacttac 3720
agaggaaaca gcaccgggac gctgatggtg ttctttggca acgtggacag cagcggcatc 3780
aaacacaaca tcttcaatcc tcccattatt gcccgttata ttagactgca tcccactcac 3840
tactctatac gcagcacact taggatggag ctcatgggat gcgacctgaa cagttgtagt 3900
atgcccttgg ggatggagtc caaagctata agcgacgcac aaattacagc tagctcttac 3960
tttacgaata tgttcgccac gtggagccca agcaaagccc ggctgcattt gcagggtcgg 4020
agtaatgctt ggcgcccaca ggtgaataac cctaaggaat ggttgcaagt agatttccag 4080
aaaactatga aggtaaccgg cgtcactaca cagggagtca agtccctctt gacctctatg 4140
tacgtcaagg agttcctgat tagcagcagt caggatgggc accaatggac actgttcttc 4200
cagaatggga aagttaaagt atttcagggt aaccaggact cctttacacc tgtggtgaat 4260
agcctcgacc cacccctgct gacacgatac ctccgcatcc accctcagtc ttgggtgcat 4320
caaattgccc tgcgaatgga ggtgttggga tgcgaagctc aggacctcta ctga 4374
<210> 16
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 16
atgcagatcg aactctctac ttgcttcttc ctgtgccttc tgaggttctg cttctctgcc 60
actcgccgat attacctcgg ggccgtggag ttgagttggg actacatgca atcagatctg 120
ggcgaactcc ctgtggatgc ccgattccca ccgcgcgtgc ccaagtcttt cccatttaat 180
acttctgtgg tgtacaagaa gacattgttt gtggagttta ccgatcacct gttcaacatc 240
gccaaaccgc ggcccccatg gatgggtctg cttgggccca ccattcaagc ggaggtctat 300
gatacagtgg tgataacgct taagaacatg gcgagccacc cagtgtctct gcatgccgtt 360
ggtgtatcat attggaaggc cagcgaagga gcggagtacg atgaccagac ctctcagaga 420
gagaaggaag acgataaggt ttttcctggc ggaagtcata catatgtatg gcaggtcctg 480
aaagagaatg ggccgatggc ttctgacccc ctttgtctta cctatagtta tctgagccac 540
gtggacctgg tcaaggacct caacagtggt ctgattgggg ctctgcttgt ttgtagagag 600
ggtagcttgg ctaaggagaa aacccaaaca ctccataagt tcattttgct gttcgcggtg 660
ttcgacgagg gaaagagttg gcacagcgaa acaaagaatt cactgatgca agacagggac 720
gccgcttccg caagggcttg gcctaagatg catacggtga atgggtatgt gaaccggagc 780
ctcccggggc tgatcgggtg ccatcgcaag tctgtttact ggcacgtcat tggaatgggg 840
acaacgccag aggtacatag tatatttctt gaaggccaca cgttcctcgt acggaaccac 900
cgacaggctt ccctggagat aagccccatt acctttctga ccgctcagac tctgctgatg 960
gaccttggcc agtttctcct gttctgccat attagcagcc accagcacga cggtatggaa 1020
gcatacgtga aagtcgatag ctgtcctgag gagcctcagc tcagaatgaa gaacaacgag 1080
gaggccgaag actatgacga tgaccttaca gattccgaga tggacgtggt gcgctttgac 1140
gacgataaca gtcctagttt cattcaaatc agatccgtag ccaaaaagca tccaaagaca 1200
tgggtgcatt acattgcagc cgaagaggag gattgggatt atgcgcccct tgttctggct 1260
ccagatgaca ggagctataa gtcccagtac ttgaacaacg ggccacagcg aatcggtaga 1320
aaatataaga aggtaagatt catggcctac actgacgaaa catttaaaac cagggaagct 1380
atccaacacg aatctggaat tctcggccct ctgctctacg gtgaggtggg ggacaccttg 1440
ctgatcattt tcaaaaatca ggcatccagg ccttacaaca tataccccca tggcatcacc 1500
gatgtccgcc cgctgtattc cagaagactc cccaagggag tgaaacatct gaaagatttt 1560
cccatcctgc cgggcgagat ctttaaatac aaatggactg tgactgtaga ggacgggcct 1620
acaaaatcag acccacggtg cctgacaagg tattacagta gcttcgtcaa catggaacgc 1680
gacctcgcca gcggactcat tggcccactg ttgatctgtt acaaagagtc agtggatcag 1740
aggggaaatc agatcatgag cgataagaga aacgttatcc tgtttagtgt cttcgacgag 1800
aaccggtctt ggtaccttac tgagaacatc cagaggttcc tgccgaatcc ggctggcgtt 1860
cagctcgagg acccagagtt ccaggccagt aatataatgc actcaatcaa cggttatgtg 1920
ttcgatagcc tgcagctgag cgtctgcctc cacgaggtag cctattggta catattgtcc 1980
atcggggctc agaccgattt tctgtccgtg ttctttagcg ggtatacctt taaacataaa 2040
atggtctatg aagacaccct gaccctgttc ccattctccg gtgagactgt gttcatgtcc 2100
atggagaacc cagggctgtg gatcctgggg tgtcacaata gtgactttag gaatcgggga 2160
atgacggcac tgctgaaggt gagttcttgc gataaaaata caggagatta ctatgaggat 2220
agttacgagg atatcagtgc ctatctgctt tcaaaaaaca acgcaattga gccccggtct 2280
ttctcacaaa accccccggt gctgaagcgc caccagcgcg aaattacccg gacaaccttg 2340
cagtccgacc aggaggaaat cgattatgac gatactatca gtgtagaaat gaaaaaggag 2400
gattttgata tttacgacga agacgagaac cagtctccgc gaagttttca gaagaaaacg 2460
cgacactact ttatagctgc cgtggaacga ctctgggatt atggcatgtc ctccagccct 2520
catgtcctta ggaatcgagc gcagagtggc tctgtgcctc agttcaaaaa ggttgtgttc 2580
caggaattca ccgacggctc atttacccag ccgctgtaca gaggcgaact caacgaacac 2640
cttgggctgc ttgggccata tattcgagca gaggtggaag ataatatcat ggtaaccttt 2700
agaaaccagg cgtcaagacc ctattccttc tacagttctc tgatcagcta cgaggaggac 2760
caaagacagg gagctgaacc caggaagaac tttgtgaaac ctaatgagac caagacctac 2820
ttctggaagg tccagcacca tatggcccca actaaagatg aattcgattg caaggcctgg 2880
gcttatttca gcgacgtgga tctcgaaaag gatgtgcaca gcgggttgat cggaccgctt 2940
ttggtgtgcc acacaaatac cctcaatcct gcccacgggc ggcaggtcac agttcaagag 3000
tttgcactct tctttacaat atttgacgag acaaagtcat ggtattttac agagaatatg 3060
gagagaaatt gtcgcgcacc ttgcaacatt cagatggagg accccacatt taaggagaat 3120
tacagatttc atgctatcaa tgggtacatt atggatactc tgcctggtct ggtcatggcc 3180
caggatcagc gcataaggtg gtacttgctg agcatgggat ctaatgagaa tatacacagc 3240
attcacttca gtggccacgt ttttactgtt agaaagaagg aggagtacaa aatggcgctc 3300
tacaaccttt acccgggtgt gtttgagaca gtggagatgc tgccaagcaa ggcaggcatc 3360
tggagggttg agtgtcttat tggggagcat ctgcatgctg gaatgtccac cctctttctt 3420
gtgtacagca ataagtgcca gacaccgctt ggcatggcca gcggccacat tagggacttt 3480
cagataactg ccagtggaca gtacggccag tgggctccca agcttgcaag actccactac 3540
tccggaagca taaacgcatg gagcaccaag gaacccttct cttggattaa ggtggacctg 3600
ctggcgccaa tgatcattca cggcataaaa acccaagggg cacgacagaa attttcatct 3660
ttgtatatta gtcagtttat catcatgtac agcttggatg gaaagaagtg gcagacgtac 3720
aggggcaatt ctacaggaac acttatggtg ttttttggga atgtcgattc cagcgggatc 3780
aaacataaca tcttcaatcc tcctattatc gcccgatata tccgcctgca ccctacgcat 3840
tactccatca ggtccacatt gagaatggaa ctgatggggt gcgacctgaa tagttgtagt 3900
atgccactgg gcatggagtc taaagccatc agcgatgcac agatcactgc cagctcttac 3960
ttcaccaaca tgtttgcaac ttggtccccc tctaaagctc gcctgcatct gcagggacgc 4020
tcaaatgcat ggcgaccaca ggtgaacaat ccaaaagagt ggctccaggt cgactttcag 4080
aagacaatga aggtaacagg agtgacaacc cagggtgtaa aaagcctcct tacgagtatg 4140
tacgttaagg agtttctgat ttctagctcc caggacggac accagtggac tctgttcttc 4200
cagaacggca aagtgaaggt atttcaggga aaccaggatt cttttacccc ggtagtgaat 4260
agcctggatc caccgttgct gacccgctat ctgagaattc atccacaatc ctgggtgcat 4320
cagattgccc tccggatgga agtgctcggc tgtgaagctc aggatctgta ttag 4374
<210> 17
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 17
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctcccaga atccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctga 4374
<210> 18
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 18
atgcagatcg agctgtccac atgctttttt ctgtgcctgc tgcggttctg cttcagcgcc 60
acccggcggt actacctggg cgccgtggag ctgtcctggg actacatgca gagcgacctg 120
ggcgagctgc ccgtggacgc ccggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa aaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc ctccgagggc gccgagtacg acgaccagac cagccagcgg 420
gagaaagagg acgacaaagt ctttcctggc ggcagccaca cctacgtgtg gcaggtcctg 480
aaagaaaacg gccccatggc ctccgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaacagcggg ctgattgggg ccctgctggt ctgccgggag 600
ggcagcctgg ccaaagagaa aacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgggac 720
gccgcctctg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacagaagc 780
ctgcccggcc tgattggctg ccaccggaag agcgtgtact ggcacgtgat cggcatgggc 840
accacacccg aggtgcacag catctttctg gaagggcaca cctttctggt gcggaaccac 900
cggcaggcca gcctggaaat cagccctatc accttcctga ccgcccagac actgctgatg 960
gacctgggcc agttcctgct gttttgccac atcagctctc accagcacga cggcatggaa 1020
gcctacgtga aggtggactc ctgccccgag gaaccccagc tgcggatgaa gaacaacgag 1080
gaagccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcggttcgac 1140
gacgacaaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaagag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca gaagctacaa gagccagtac ctgaacaatg gcccccagcg gatcggccgg 1320
aagtacaaga aagtgcggtt catggcctac accgacgaga ccttcaagac ccgggaggcc 1380
atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaagtggg cgacacactg 1440
ctgatcatct tcaagaacca ggccagccgg ccctacaaca tctaccccca cggcatcacc 1500
gacgtgcggc ccctgtacag caggcggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc 1620
accaagagcg accccagatg cctgacccgg tactacagca gcttcgtgaa catggaacgg 1680
gacctggcct ccgggctgat cggacctctg ctgatctgct acaaagaaag cgtggaccag 1740
cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgatgag 1800
aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaaccc tgccggggtg 1860
cagctggaag atcccgagtt ccaggccagc aacatcatgc actccatcaa tggctacgtg 1920
ttcgacagcc tgcagctgtc cgtgtgtctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cctttcagcg gcgagaccgt gttcatgagc 2100
atggaaaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg gaaccggggc 2160
atgaccgccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg atatcagcgc ctacctgctg tccaagaaca acgccatcga gcccagaagc 2280
ttcagccaga acccccctgt gctgaagcgg caccagagag agatcacccg gaccaccctg 2340
cagtccgacc aggaagagat cgattacgac gacaccatca gcgtggagat gaaaaaagaa 2400
gatttcgaca tctacgacga ggacgagaac cagagccccc ggtccttcca gaagaaaacc 2460
cggcactact ttatcgccgc cgtggagcgg ctgtgggact acggcatgag cagcagcccc 2520
cacgtgctgc ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc 2580
caggaattca ccgacggcag cttcacccag cccctgtacc ggggcgagct gaacgagcac 2640
ctggggctgc tggggcccta catcagggcc gaagtggagg acaacatcat ggtgaccttc 2700
cggaatcagg ccagcagacc ctactccttc tacagcagcc tgatcagcta cgaagaggac 2760
cagcggcagg gcgctgaacc ccggaagaac ttcgtgaagc ccaatgagac caagacctac 2820
ttctggaaag tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttca gcgacgtgga tctggaaaag gacgtgcact ctggactgat tggccctctg 2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggcc ggcaggtgac cgtgcaggaa 3000
ttcgccctgt tcttcaccat cttcgacgag accaagtcct ggtacttcac cgagaatatg 3060
gaacggaact gcagagcccc ctgcaacatc cagatggaag atcctacctt caaagagaac 3120
taccggttcc acgccatcaa cggctacatc atggacaccc tgcctggcct ggtgatggcc 3180
caggaccaga ggatccggtg gtatctgctg tccatgggca gcaacgagaa tatccacagc 3240
atccacttca gcggccacgt gttcaccgtg aggaagaaag aagagtacaa gatggccctg 3300
tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggcgggtgg agtgtctgat cggcgagcac ctgcatgccg ggatgagcac cctgtttctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgggacttc 3480
cagatcaccg cctccggcca gtacggccag tgggccccca agctggcccg gctgcactac 3540
agcggcagca tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg 3600
ctggccccta tgatcatcca cggcattaag acccagggcg ccaggcagaa gttcagcagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
cggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tccggctgca ccccacccac 3840
tacagcatca gatccaccct gcggatggaa ctgatgggct gcgacctgaa ctcctgcagc 3900
atgcctctgg gcatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac 3960
ttcaccaaca tgttcgccac ctggtccccc tccaaggcca ggctgcacct gcagggccgg 4020
tccaacgcct ggcggcctca ggtgaacaac cccaaagaat ggctgcaggt ggactttcag 4080
aaaaccatga aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct gaccagcatg 4140
tacgtgaaag agtttctgat cagcagcagc caggacggcc accagtggac cctgttcttt 4200
cagaacggca aggtgaaagt gttccagggc aaccaggact ccttcacccc cgtggtgaac 4260
tccctggacc cccccctgct gacccgctac ctgcggatcc acccccagtc ttgggtgcac 4320
cagatcgccc tgaggatgga agtgctggga tgtgaggccc aggatctgta ctga 4374
<210> 19
<211> 2351
<212> PRT
<213> Homo sapiens
<400> 19
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765
Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp
770 775 780
Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys
785 790 795 800
Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser
805 810 815
Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr
820 825 830
Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn
835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly
850 855 860
Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu
865 870 875 880
Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys
885 890 895
Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn
900 905 910
Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met
915 920 925
Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys
930 935 940
Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu
945 950 955 960
Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu
965 970 975
Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe
980 985 990
Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala
995 1000 1005
Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser
1010 1015 1020
Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser
1025 1030 1035
Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu
1040 1045 1050
Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg
1055 1060 1065
Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met
1070 1075 1080
Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln
1085 1090 1095
Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met
1100 1105 1110
Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile
1115 1120 1125
Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro
1130 1135 1140
Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu
1145 1150 1155
Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys
1160 1165 1170
Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro
1175 1180 1185
Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu
1190 1195 1200
Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu
1205 1210 1215
Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile
1220 1225 1230
His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu
1235 1240 1245
Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr
1250 1255 1260
Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn
1265 1270 1275
Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu
1280 1285 1290
Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu
1295 1300 1305
Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln
1310 1315 1320
Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg
1325 1330 1335
Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp
1340 1345 1350
Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro
1355 1360 1365
Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala
1370 1375 1380
Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser
1385 1390 1395
Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser
1400 1405 1410
Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe
1415 1420 1425
Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys
1430 1435 1440
Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys
1445 1450 1455
Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly
1460 1465 1470
Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser
1475 1480 1485
Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp
1490 1495 1500
Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His
1505 1510 1515
Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser
1520 1525 1530
Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr
1535 1540 1545
Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val
1550 1555 1560
Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser
1565 1570 1575
Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln
1580 1585 1590
Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys
1595 1600 1605
Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys
1610 1615 1620
Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys
1625 1630 1635
Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg
1640 1645 1650
Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu
1655 1660 1665
Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr
1670 1675 1680
Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile
1685 1690 1695
Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
1700 1705 1710
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr
1715 1720 1725
Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
1730 1735 1740
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
1745 1750 1755
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
1760 1765 1770
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp
1775 1780 1785
Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser
1790 1795 1800
Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly
1805 1810 1815
Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr
1820 1825 1830
Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu
1835 1840 1845
Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu
1850 1855 1860
Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His
1865 1870 1875
Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln
1880 1885 1890
Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp
1895 1900 1905
Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn
1910 1915 1920
Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His
1925 1930 1935
Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met
1940 1945 1950
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser
1955 1960 1965
Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr
1970 1975 1980
Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1985 1990 1995
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly
2000 2005 2010
Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly
2015 2020 2025
Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro
2030 2035 2040
Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala
2045 2050 2055
Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His
2060 2065 2070
Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser
2075 2080 2085
Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile
2090 2095 2100
Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser
2105 2110 2115
Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr
2120 2125 2130
Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn
2135 2140 2145
Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile
2150 2155 2160
Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg
2165 2170 2175
Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
2180 2185 2190
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln
2195 2200 2205
Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser
2210 2215 2220
Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
2225 2230 2235
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe
2240 2245 2250
Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys
2255 2260 2265
Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser
2270 2275 2280
Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys
2285 2290 2295
Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val
2300 2305 2310
Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His
2315 2320 2325
Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu
2330 2335 2340
Gly Cys Glu Ala Gln Asp Leu Tyr
2345 2350
<210> 20
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 20
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc 780
ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag 1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat 1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg 1320
aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc 1380
atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc 1500
gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc 1620
accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg 1680
gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag 1740
aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag 1800
aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc 2280
ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagagcgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcatcgccgc cgtggagagg ctgtgggact atggcatgag cagcagcccc 2520
cacgtgctga ggaacagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggcgagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgatgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg 2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat cagggacttc 3480
cagatcaccg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccagggcg ccaggcagaa gttcagcagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gcggatggaa ctgatgggct gcgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcaccgc cagcagctac 3960
ttcaccaaca tgttcgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc 4200
cagaacggca aagtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac 4260
agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgagaatgga agtgctggga tgcgaggccc aggacctgta ctga 4374
<210> 21
<211> 1457
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 21
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu
755 760 765
Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln
770 775 780
Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu
785 790 795 800
Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe
805 810 815
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
820 825 830
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
835 840 845
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
850 855 860
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
865 870 875 880
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
885 890 895
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
900 905 910
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
915 920 925
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
930 935 940
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
945 950 955 960
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
965 970 975
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
980 985 990
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
995 1000 1005
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1010 1015 1020
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1025 1030 1035
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1040 1045 1050
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1055 1060 1065
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1070 1075 1080
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1085 1090 1095
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1100 1105 1110
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1115 1120 1125
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1130 1135 1140
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1145 1150 1155
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1160 1165 1170
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1175 1180 1185
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1190 1195 1200
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1205 1210 1215
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1220 1225 1230
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1235 1240 1245
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1250 1255 1260
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1265 1270 1275
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1280 1285 1290
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1295 1300 1305
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1310 1315 1320
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1325 1330 1335
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1340 1345 1350
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1355 1360 1365
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1370 1375 1380
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1385 1390 1395
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1400 1405 1410
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1415 1420 1425
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1430 1435 1440
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1445 1450 1455
<210> 22
<211> 2220
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 22
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgcctgtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacacctcag tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtgatcac cctgaagaac atggccagcc accccgtgag cctgcacgcc 300
gtgggcgtga gctactggaa ggcctctgag ggcgccgagt atgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttcccc ggcggcagcc acacctacgt gtggcaggtg 420
ctgaaggaga acggccccat ggccagcgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgatcg gcgccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgatg agggcaagag ctggcacagc gagaccaaga acagcctgat gcaggacagg 660
gatgccgcct ctgccagggc ctggcccaag atgcacaccg tgaacggcta cgtgaacagg 720
agcctgcccg gcctgatcgg ctgccacagg aagtctgtgt actggcacgt gatcggcatg 780
ggcaccaccc ccgaggtgca cagcatcttc ctggagggcc acaccttcct ggtgaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatcagca gccaccagca cgacggcatg 960
gaggcctacg tgaaggtgga cagctgcccc gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgatgacctg accgactctg agatggacgt ggtgaggttt 1080
gatgatgaca acagccccag cttcatccag atcaggtctg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc cgccgaggag gaggactggg actacgcccc cctggtgctg 1200
gcccccgacg acaggagcta caagagccag tacctgaaca acggccccca gaggatcggc 1260
aggaagtaca agaaggtcag attcatggcc tacaccgacg agaccttcaa gaccagggag 1320
gccatccagc acgagtctgg catcctgggc cccctgctgt acggcgaggt gggcgacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccacggcatc 1440
accgatgtga ggcccctgta cagcaggagg ctgcccaagg gcgtgaagca cctgaaggac 1500
ttccccatcc tgcccggcga gatcttcaag tacaagtgga ccgtgaccgt ggaggatggc 1560
cccaccaagt ctgaccccag gtgcctgacc aggtactaca gcagcttcgt gaacatggag 1620
agggacctgg cctctggcct gatcggcccc ctgctgatct gctacaagga gagcgtggac 1680
cagaggggca accagatcat gtctgacaag aggaacgtga tcctgttctc tgtgttcgat 1740
gagaacagga gctggtatct gaccgagaac atccagaggt tcctgcccaa ccccgccggc 1800
gtgcagctgg aggaccccga gttccaggcc agcaacatca tgcacagcat caacggctac 1860
gtgttcgaca gcctgcagct gtctgtgtgc ctgcacgagg tggcctactg gtacatcctg 1920
agcatcggcg cccagaccga cttcctgtct gtgttcttct ctggctacac cttcaagcac 1980
aagatggtgt acgaggacac cctgaccctg ttccccttca gcggcgagac cgtgttcatg 2040
agcatggaga accccggcct gtggatcctg ggctgccaca acagcgactt caggaacagg 2100
ggcatgaccg ccctgctgaa agtcagcagc tgcgacaaga acaccggcga ctactacgag 2160
gacagctacg aggacatcag cgcctacctg ctgagcaaga acaacgccat cgagcccagg 2220
<210> 23
<211> 2052
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 23
gagatcacca ggaccaccct gcagagcgac caggaggaga tcgactatga tgacaccatc 60
agcgtggaga tgaagaagga ggacttcgac atctacgacg aggacgagaa ccagagcccc 120
aggagcttcc agaagaagac caggcactac ttcatcgccg ccgtggagag gctgtgggac 180
tatggcatga gcagcagccc ccacgtgctg aggaacaggg cccagagcgg cagcgtgccc 240
cagttcaaga aggtggtgtt ccaggagttc accgacggca gcttcaccca gcccctgtac 300
agaggcgagc tgaacgagca cctgggcctg ctgggcccct acatcagggc cgaggtggag 360
gacaacatca tggtgacctt caggaaccag gccagcaggc cctacagctt ctacagcagc 420
ctgatcagct acgaggagga ccagaggcag ggcgccgagc ccaggaagaa cttcgtgaag 480
cccaacgaga ccaagaccta cttctggaag gtgcagcacc acatggcccc caccaaggac 540
gagttcgact gcaaggcctg ggcctacttc tctgatgtgg acctggagaa ggacgtgcac 600
agcggcctga tcggccccct gctggtgtgc cacaccaaca ccctgaaccc cgcccacggc 660
aggcaggtga ccgtgcagga gttcgccctg ttcttcacca tcttcgacga gaccaagagc 720
tggtacttca ccgagaacat ggagaggaac tgcagggccc cctgcaacat ccagatggag 780
gaccccacct tcaaggagaa ctacaggttc cacgccatca acggctacat catggacacc 840
ctgcccggcc tggtgatggc ccaggaccag aggatcaggt ggtatctgct gagcatgggc 900
agcaacgaga acatccacag catccacttc agcggccacg tgttcaccgt gaggaagaag 960
gaggagtaca agatggccct gtacaacctg taccccggcg tgttcgagac cgtggagatg 1020
ctgcccagca aggccggcat ctggagggtg gagtgcctga tcggcgagca cctgcacgcc 1080
ggcatgagca ccctgttcct ggtgtacagc aacaagtgcc agacccccct gggcatggcc 1140
agcggccaca tcagggactt ccagatcacc gcctctggcc agtacggcca gtgggccccc 1200
aagctggcca ggctgcacta cagcggcagc atcaacgcct ggagcaccaa ggagcccttc 1260
agctggatca aggtggacct gctggccccc atgatcatcc acggcatcaa gacccagggc 1320
gccaggcaga agttcagcag cctgtacatc agccagttca tcatcatgta cagcctggac 1380
ggcaagaagt ggcagaccta caggggcaac agcaccggca ccctgatggt gttcttcggc 1440
aacgtggaca gcagcggcat caagcacaac atcttcaacc cccccatcat cgccaggtac 1500
atcaggctgc accccaccca ctacagcatc aggagcaccc tgcggatgga actgatgggc 1560
tgcgacctga acagctgcag catgcccctg ggcatggaga gcaaggccat ctctgacgcc 1620
cagatcaccg ccagcagcta cttcaccaac atgttcgcca cctggagccc cagcaaggcc 1680
aggctgcacc tgcagggcag gagcaacgcc tggaggcccc aggtgaacaa ccccaaggag 1740
tggctgcagg tggacttcca gaagaccatg aaggtgaccg gcgtgaccac ccagggcgtg 1800
aagagcctgc tgaccagcat gtacgtgaag gagttcctga tcagcagcag ccaggacggc 1860
caccagtgga ccctgttctt ccagaacggc aaagtgaagg tgttccaggg caaccaggac 1920
agcttcaccc ccgtggtgaa cagcctggac ccccccctgc tgaccaggta tctgaggatc 1980
cacccccaga gctgggtgca ccagatcgcc ctgagaatgg aagtgctggg atgcgaggcc 2040
caggacctgt ac 2052
<210> 24
<211> 2220
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 24
gccaccagga gatactacct gggggctgtg gaactttctt gggactacat gcagtctgac 60
ctgggagagc tgcctgtgga tgccaggttc ccacccagag tgcccaagtc cttcccattc 120
aacacctctg tggtctacaa gaagacactc tttgtggaat tcactgacca cctgttcaac 180
attgcaaaac ccagaccacc ctggatggga ctcctgggac ccaccattca ggctgaggtg 240
tatgacactg tggtcatcac cctcaagaac atggcatccc accctgtgtc tctgcatgct 300
gtgggagtct catactggaa agcctctgaa ggggctgagt atgatgacca gacatcccag 360
agagagaaag aggatgacaa ggtgttccct gggggatctc acacctatgt gtggcaagtc 420
ctcaaggaga atggacccat ggcatctgac ccactctgcc tgacatactc ctacctttct 480
catgtggacc tggtcaagga cctcaactct ggactgattg gggcactgct ggtgtgcagg 540
gaaggatccc tggccaagga gaaaacccag acactgcaca agttcattct cctgtttgct 600
gtctttgatg agggcaagtc ttggcactct gaaacaaaga actccctgat gcaagacagg 660
gatgctgcct ctgccagggc atggcccaag atgcacactg tgaatggcta tgtgaacaga 720
tcactgcctg gactcattgg ctgccacagg aaatctgtct actggcatgt gattggcatg 780
gggacaaccc ctgaagtgca ctccattttc ctggagggac acaccttcct ggtcaggaac 840
cacagacaag cctctctgga gatctctccc atcaccttcc tcactgcaca gacactgctg 900
atggaccttg gacagttcct gctgttctgc cacatctctt cccaccagca tgatggcatg 960
gaagcctatg tcaaggtgga ctcatgccct gaggaaccac agctcaggat gaagaacaat 1020
gaggaggctg aggactatga tgatgacctg actgactctg agatggatgt ggtcagattt 1080
gatgatgaca actctccatc cttcattcag atcaggtctg tggcaaagaa acaccccaag 1140
acatgggtgc actacattgc tgctgaggaa gaggactggg actatgcacc actggtcctg 1200
gcccctgatg acaggagcta caagtctcag tacctcaaca atggcccaca aagaattgga 1260
agaaagtaca agaaagtcag attcatggcc tacactgatg aaaccttcaa gacaagagaa 1320
gccattcagc atgagtctgg cattctggga ccactcctgt atggggaagt gggagacacc 1380
ctgctcatca tcttcaagaa ccaggcctcc aggccctaca acatctaccc acatggcatc 1440
actgatgtca ggcccctgta cagcaggaga ctgccaaaag gggtgaaaca cctcaaggac 1500
ttccccattc tgcctggaga gatcttcaag tacaagtgga ctgtcactgt ggaggatgga 1560
ccaacaaagt ctgaccccag gtgcctcacc agatactact cctcttttgt gaacatggag 1620
agagacctgg catctggact gattggacca ctgctcatct gctacaagga gtctgtggac 1680
cagagaggca accagatcat gtctgacaag agaaatgtga ttctgttctc tgtctttgat 1740
gagaacagat catggtacct gactgagaac attcagagat tcctgcccaa ccctgctggg 1800
gtgcaactgg aagaccctga gttccaggca agcaacatca tgcactccat caatggctat 1860
gtgtttgact ctctccagct ttctgtctgc ctgcatgagg tggcctactg gtacattctt 1920
tctattgggg cacaaactga cttcctttct gtcttcttct ctggatacac cttcaagcac 1980
aagatggtgt atgaggacac cctgacactc ttcccattct ctggggaaac tgtgttcatg 2040
agcatggaga accctggact gtggattctg ggatgccaca actctgactt cagaaacagg 2100
ggaatgactg cactgctcaa agtctcctcc tgtgacaaga acactgggga ctactatgag 2160
gactcttatg aggacatctc tgcctacctg ctcagcaaga acaatgccat tgagcccaga 2220
<210> 25
<211> 2052
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 25
gagatcacca ggacaaccct ccagtctgac caggaagaga ttgactatga tgacaccatt 60
tctgtggaga tgaagaagga ggactttgac atctatgatg aggacgagaa ccagtctcca 120
agatcattcc agaagaagac aagacactac ttcattgctg ctgtggaaag actgtgggac 180
tatggcatgt cttcctctcc ccatgtcctc aggaacaggg cacagtctgg ctctgtgcca 240
cagttcaaga aagtggtctt ccaggagttc actgatggct cattcaccca gcccctgtac 300
agaggggaac tgaatgagca cctgggactc ctgggaccat acatcagggc tgaggtggaa 360
gacaacatca tggtgacatt cagaaaccag gcctccaggc cctacagctt ctactcttcc 420
ctcatcagct atgaggaaga ccagagacaa ggggctgagc caagaaagaa ctttgtgaaa 480
cccaatgaaa ccaagaccta cttctggaaa gtccagcacc acatggcacc caccaaggat 540
gagtttgact gcaaggcctg ggcatacttc tctgatgtgg acctggagaa agatgtgcac 600
tctggcctga ttggcccact cctggtctgc cacaccaaca ccctgaaccc tgcacatgga 660
aggcaagtga ctgtgcagga gtttgccctc ttcttcacca tctttgatga aaccaagtca 720
tggtacttca ctgagaacat ggagagaaac tgcagagcac catgcaacat tcagatggaa 780
gaccccacct tcaaggagaa ctacaggttc catgccatca atggctacat catggacacc 840
ctgcctgggc ttgtcatggc acaggaccag agaatcagat ggtacctgct ttctatggga 900
tccaatgaga acattcactc catccacttc tctgggcatg tcttcactgt gagaaagaag 960
gaggaataca agatggccct gtacaacctc taccctgggg tctttgagac tgtggagatg 1020
ctgccctcca aagctggcat ctggagggtg gaatgcctca ttggggagca cctgcatgct 1080
ggcatgtcaa ccctgttcct ggtctacagc aacaagtgcc agacacccct gggaatggcc 1140
tctggccaca tcagggactt ccagatcact gcctctggcc agtatggcca gtgggcaccc 1200
aaactggcca ggctccacta ctctggctcc atcaatgcat ggtcaaccaa ggagccattc 1260
tcttggatca aggtggacct gctggcaccc atgatcattc atggcatcaa gacacagggg 1320
gcaagacaga aattctcctc tctgtacatc tcacagttca tcatcatgta ctctctggat 1380
ggcaagaagt ggcagacata cagaggcaac tccactggca ccctcatggt cttctttggc 1440
aatgtggaca gctctggcat caagcacaac atcttcaacc ctcccatcat tgccagatac 1500
atcaggctgc accccaccca ctactcaatc agatcaaccc tcaggatgga actgatggga 1560
tgtgacctga actcctgctc aatgcccctg ggaatggaga gcaaggccat ttctgatgcc 1620
cagatcactg catcctctta cttcaccaac atgtttgcca cctggtcacc atcaaaagcc 1680
aggctgcacc tccagggaag aagcaatgcc tggagacccc aggtcaacaa cccaaaggaa 1740
tggctgcaag tggacttcca gaagacaatg aaagtcactg gggtgacaac ccagggggtc 1800
aagtctctgc tcacctcaat gtatgtgaag gagttcctga tctcttcctc acaggatggc 1860
caccagtgga cactcttctt ccagaatggc aaagtcaagg tgttccaggg caaccaggac 1920
tctttcacac ctgtggtgaa ctcactggac ccccccctcc tgacaagata cctgagaatt 1980
cacccccagt cttgggtcca ccagattgcc ctgagaatgg aagtcctggg atgtgaggca 2040
caagacctgt ac 2052
<210> 26
<211> 4332
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 26
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagagag 2280
atcaccagga caaccctcca gtctgaccag gaagagattg actatgatga caccatttct 2340
gtggagatga agaaggagga ctttgacatc tatgatgagg acgagaacca gtctccaaga 2400
tcattccaga agaagacaag acactacttc attgctgctg tggaaagact gtgggactat 2460
ggcatgtctt cctctcccca tgtcctcagg aacagggcac agtctggctc tgtgccacag 2520
ttcaagaaag tggtcttcca ggagttcact gatggctcat tcacccagcc cctgtacaga 2580
ggggaactga atgagcacct gggactcctg ggaccataca tcagggctga ggtggaagac 2640
aacatcatgg tgacattcag aaaccaggcc tccaggccct acagcttcta ctcttccctc 2700
atcagctatg aggaagacca gagacaaggg gctgagccaa gaaagaactt tgtgaaaccc 2760
aatgaaacca agacctactt ctggaaagtc cagcaccaca tggcacccac caaggatgag 2820
tttgactgca aggcctgggc atacttctct gatgtggacc tggagaaaga tgtgcactct 2880
ggcctgattg gcccactcct ggtctgccac accaacaccc tgaaccctgc acatggaagg 2940
caagtgactg tgcaggagtt tgccctcttc ttcaccatct ttgatgaaac caagtcatgg 3000
tacttcactg agaacatgga gagaaactgc agagcaccat gcaacattca gatggaagac 3060
cccaccttca aggagaacta caggttccat gccatcaatg gctacatcat ggacaccctg 3120
cctgggcttg tcatggcaca ggaccagaga atcagatggt acctgctttc tatgggatcc 3180
aatgagaaca ttcactccat ccacttctct gggcatgtct tcactgtgag aaagaaggag 3240
gaatacaaga tggccctgta caacctctac cctggggtct ttgagactgt ggagatgctg 3300
ccctccaaag ctggcatctg gagggtggaa tgcctcattg gggagcacct gcatgctggc 3360
atgtcaaccc tgttcctggt ctacagcaac aagtgccaga cacccctggg aatggcctct 3420
ggccacatca gggacttcca gatcactgcc tctggccagt atggccagtg ggcacccaaa 3480
ctggccaggc tccactactc tggctccatc aatgcatggt caaccaagga gccattctct 3540
tggatcaagg tggacctgct ggcacccatg atcattcatg gcatcaagac acagggggca 3600
agacagaaat tctcctctct gtacatctca cagttcatca tcatgtactc tctggatggc 3660
aagaagtggc agacatacag aggcaactcc actggcaccc tcatggtctt ctttggcaat 3720
gtggacagct ctggcatcaa gcacaacatc ttcaaccctc ccatcattgc cagatacatc 3780
aggctgcacc ccacccacta ctcaatcaga tcaaccctca ggatggaact gatgggatgt 3840
gacctgaact cctgctcaat gcccctggga atggagagca aggccatttc tgatgcccag 3900
atcactgcat cctcttactt caccaacatg tttgccacct ggtcaccatc aaaagccagg 3960
ctgcacctcc agggaagaag caatgcctgg agaccccagg tcaacaaccc aaaggaatgg 4020
ctgcaagtgg acttccagaa gacaatgaaa gtcactgggg tgacaaccca gggggtcaag 4080
tctctgctca cctcaatgta tgtgaaggag ttcctgatct cttcctcaca ggatggccac 4140
cagtggacac tcttcttcca gaatggcaaa gtcaaggtgt tccagggcaa ccaggactct 4200
ttcacacctg tggtgaactc actggacccc cccctcctga caagatacct gagaattcac 4260
ccccagtctt gggtccacca gattgccctg agaatggaag tcctgggatg tgaggcacaa 4320
gacctgtact ga 4332
<210> 27
<211> 4368
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 27
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagaagc 2280
ttctctcaga attccagaca ccccagcacc agggagatca ccaggacaac cctccagtct 2340
gaccaggaag agattgacta tgatgacacc atttctgtgg agatgaagaa ggaggacttt 2400
gacatctatg atgaggacga gaaccagtct ccaagatcat tccagaagaa gacaagacac 2460
tacttcattg ctgctgtgga aagactgtgg gactatggca tgtcttcctc tccccatgtc 2520
ctcaggaaca gggcacagtc tggctctgtg ccacagttca agaaagtggt cttccaggag 2580
ttcactgatg gctcattcac ccagcccctg tacagagggg aactgaatga gcacctggga 2640
ctcctgggac catacatcag ggctgaggtg gaagacaaca tcatggtgac attcagaaac 2700
caggcctcca ggccctacag cttctactct tccctcatca gctatgagga agaccagaga 2760
caaggggctg agccaagaaa gaactttgtg aaacccaatg aaaccaagac ctacttctgg 2820
aaagtccagc accacatggc acccaccaag gatgagtttg actgcaaggc ctgggcatac 2880
ttctctgatg tggacctgga gaaagatgtg cactctggcc tgattggccc actcctggtc 2940
tgccacacca acaccctgaa ccctgcacat ggaaggcaag tgactgtgca ggagtttgcc 3000
ctcttcttca ccatctttga tgaaaccaag tcatggtact tcactgagaa catggagaga 3060
aactgcagag caccatgcaa cattcagatg gaagacccca ccttcaagga gaactacagg 3120
ttccatgcca tcaatggcta catcatggac accctgcctg ggcttgtcat ggcacaggac 3180
cagagaatca gatggtacct gctttctatg ggatccaatg agaacattca ctccatccac 3240
ttctctgggc atgtcttcac tgtgagaaag aaggaggaat acaagatggc cctgtacaac 3300
ctctaccctg gggtctttga gactgtggag atgctgccct ccaaagctgg catctggagg 3360
gtggaatgcc tcattgggga gcacctgcat gctggcatgt caaccctgtt cctggtctac 3420
agcaacaagt gccagacacc cctgggaatg gcctctggcc acatcaggga cttccagatc 3480
actgcctctg gccagtatgg ccagtgggca cccaaactgg ccaggctcca ctactctggc 3540
tccatcaatg catggtcaac caaggagcca ttctcttgga tcaaggtgga cctgctggca 3600
cccatgatca ttcatggcat caagacacag ggggcaagac agaaattctc ctctctgtac 3660
atctcacagt tcatcatcat gtactctctg gatggcaaga agtggcagac atacagaggc 3720
aactccactg gcaccctcat ggtcttcttt ggcaatgtgg acagctctgg catcaagcac 3780
aacatcttca accctcccat cattgccaga tacatcaggc tgcaccccac ccactactca 3840
atcagatcaa ccctcaggat ggaactgatg ggatgtgacc tgaactcctg ctcaatgccc 3900
ctgggaatgg agagcaaggc catttctgat gcccagatca ctgcatcctc ttacttcacc 3960
aacatgtttg ccacctggtc accatcaaaa gccaggctgc acctccaggg aagaagcaat 4020
gcctggagac cccaggtcaa caacccaaag gaatggctgc aagtggactt ccagaagaca 4080
atgaaagtca ctggggtgac aacccagggg gtcaagtctc tgctcacctc aatgtatgtg 4140
aaggagttcc tgatctcttc ctcacaggat ggccaccagt ggacactctt cttccagaat 4200
ggcaaagtca aggtgttcca gggcaaccag gactctttca cacctgtggt gaactcactg 4260
gacccccccc tcctgacaag atacctgaga attcaccccc agtcttgggt ccaccagatt 4320
gccctgagaa tggaagtcct gggatgtgag gcacaagacc tgtactga 4368
<210> 28
<211> 4332
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 28
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc 780
ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag 1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat 1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg 1320
aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc 1380
atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc 1500
gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc 1620
accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg 1680
gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag 1740
aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag 1800
aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccagggag 2280
atcaccagga ccaccctgca gagcgaccag gaggagatcg actatgatga caccatcagc 2340
gtggagatga agaaggagga cttcgacatc tacgacgagg acgagaacca gagccccagg 2400
agcttccaga agaagaccag gcactacttc atcgccgccg tggagaggct gtgggactat 2460
ggcatgagca gcagccccca cgtgctgagg aacagggccc agagcggcag cgtgccccag 2520
ttcaagaagg tggtgttcca ggagttcacc gacggcagct tcacccagcc cctgtacaga 2580
ggcgagctga acgagcacct gggcctgctg ggcccctaca tcagggccga ggtggaggac 2640
aacatcatgg tgaccttcag gaaccaggcc agcaggccct acagcttcta cagcagcctg 2700
atcagctacg aggaggacca gaggcagggc gccgagccca ggaagaactt cgtgaagccc 2760
aacgagacca agacctactt ctggaaggtg cagcaccaca tggcccccac caaggacgag 2820
ttcgactgca aggcctgggc ctacttctct gatgtggacc tggagaagga cgtgcacagc 2880
ggcctgatcg gccccctgct ggtgtgccac accaacaccc tgaaccccgc ccacggcagg 2940
caggtgaccg tgcaggagtt cgccctgttc ttcaccatct tcgacgagac caagagctgg 3000
tacttcaccg agaacatgga gaggaactgc agggccccct gcaacatcca gatggaggac 3060
cccaccttca aggagaacta caggttccac gccatcaacg gctacatcat ggacaccctg 3120
cccggcctgg tgatggccca ggaccagagg atcaggtggt atctgctgag catgggcagc 3180
aacgagaaca tccacagcat ccacttcagc ggccacgtgt tcaccgtgag gaagaaggag 3240
gagtacaaga tggccctgta caacctgtac cccggcgtgt tcgagaccgt ggagatgctg 3300
cccagcaagg ccggcatctg gagggtggag tgcctgatcg gcgagcacct gcacgccggc 3360
atgagcaccc tgttcctggt gtacagcaac aagtgccaga cccccctggg catggccagc 3420
ggccacatca gggacttcca gatcaccgcc tctggccagt acggccagtg ggcccccaag 3480
ctggccaggc tgcactacag cggcagcatc aacgcctgga gcaccaagga gcccttcagc 3540
tggatcaagg tggacctgct ggcccccatg atcatccacg gcatcaagac ccagggcgcc 3600
aggcagaagt tcagcagcct gtacatcagc cagttcatca tcatgtacag cctggacggc 3660
aagaagtggc agacctacag gggcaacagc accggcaccc tgatggtgtt cttcggcaac 3720
gtggacagca gcggcatcaa gcacaacatc ttcaaccccc ccatcatcgc caggtacatc 3780
aggctgcacc ccacccacta cagcatcagg agcaccctgc ggatggaact gatgggctgc 3840
gacctgaaca gctgcagcat gcccctgggc atggagagca aggccatctc tgacgcccag 3900
atcaccgcca gcagctactt caccaacatg ttcgccacct ggagccccag caaggccagg 3960
ctgcacctgc agggcaggag caacgcctgg aggccccagg tgaacaaccc caaggagtgg 4020
ctgcaggtgg acttccagaa gaccatgaag gtgaccggcg tgaccaccca gggcgtgaag 4080
agcctgctga ccagcatgta cgtgaaggag ttcctgatca gcagcagcca ggacggccac 4140
cagtggaccc tgttcttcca gaacggcaaa gtgaaggtgt tccagggcaa ccaggacagc 4200
ttcacccccg tggtgaacag cctggacccc cccctgctga ccaggtatct gaggatccac 4260
ccccagagct gggtgcacca gatcgccctg agaatggaag tgctgggatg cgaggcccag 4320
gacctgtact ga 4332
<210> 29
<211> 4368
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 29
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc 780
ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag 1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat 1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg 1320
aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc 1380
atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc 1500
gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc 1620
accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg 1680
gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag 1740
aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag 1800
aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc 2280
ttcagccaga actccagaca ccccagcacc agggagatca ccaggaccac cctgcagagc 2340
gaccaggagg agatcgacta tgatgacacc atcagcgtgg agatgaagaa ggaggacttc 2400
gacatctacg acgaggacga gaaccagagc cccaggagct tccagaagaa gaccaggcac 2460
tacttcatcg ccgccgtgga gaggctgtgg gactatggca tgagcagcag cccccacgtg 2520
ctgaggaaca gggcccagag cggcagcgtg ccccagttca agaaggtggt gttccaggag 2580
ttcaccgacg gcagcttcac ccagcccctg tacagaggcg agctgaacga gcacctgggc 2640
ctgctgggcc cctacatcag ggccgaggtg gaggacaaca tcatggtgac cttcaggaac 2700
caggccagca ggccctacag cttctacagc agcctgatca gctacgagga ggaccagagg 2760
cagggcgccg agcccaggaa gaacttcgtg aagcccaacg agaccaagac ctacttctgg 2820
aaggtgcagc accacatggc ccccaccaag gacgagttcg actgcaaggc ctgggcctac 2880
ttctctgatg tggacctgga gaaggacgtg cacagcggcc tgatcggccc cctgctggtg 2940
tgccacacca acaccctgaa ccccgcccac ggcaggcagg tgaccgtgca ggagttcgcc 3000
ctgttcttca ccatcttcga cgagaccaag agctggtact tcaccgagaa catggagagg 3060
aactgcaggg ccccctgcaa catccagatg gaggacccca ccttcaagga gaactacagg 3120
ttccacgcca tcaacggcta catcatggac accctgcccg gcctggtgat ggcccaggac 3180
cagaggatca ggtggtatct gctgagcatg ggcagcaacg agaacatcca cagcatccac 3240
ttcagcggcc acgtgttcac cgtgaggaag aaggaggagt acaagatggc cctgtacaac 3300
ctgtaccccg gcgtgttcga gaccgtggag atgctgccca gcaaggccgg catctggagg 3360
gtggagtgcc tgatcggcga gcacctgcac gccggcatga gcaccctgtt cctggtgtac 3420
agcaacaagt gccagacccc cctgggcatg gccagcggcc acatcaggga cttccagatc 3480
accgcctctg gccagtacgg ccagtgggcc cccaagctgg ccaggctgca ctacagcggc 3540
agcatcaacg cctggagcac caaggagccc ttcagctgga tcaaggtgga cctgctggcc 3600
cccatgatca tccacggcat caagacccag ggcgccaggc agaagttcag cagcctgtac 3660
atcagccagt tcatcatcat gtacagcctg gacggcaaga agtggcagac ctacaggggc 3720
aacagcaccg gcaccctgat ggtgttcttc ggcaacgtgg acagcagcgg catcaagcac 3780
aacatcttca acccccccat catcgccagg tacatcaggc tgcaccccac ccactacagc 3840
atcaggagca ccctgcggat ggaactgatg ggctgcgacc tgaacagctg cagcatgccc 3900
ctgggcatgg agagcaaggc catctctgac gcccagatca ccgccagcag ctacttcacc 3960
aacatgttcg ccacctggag ccccagcaag gccaggctgc acctgcaggg caggagcaac 4020
gcctggaggc cccaggtgaa caaccccaag gagtggctgc aggtggactt ccagaagacc 4080
atgaaggtga ccggcgtgac cacccagggc gtgaagagcc tgctgaccag catgtacgtg 4140
aaggagttcc tgatcagcag cagccaggac ggccaccagt ggaccctgtt cttccagaac 4200
ggcaaagtga aggtgttcca gggcaaccag gacagcttca cccccgtggt gaacagcctg 4260
gacccccccc tgctgaccag gtatctgagg atccaccccc agagctgggt gcaccagatc 4320
gccctgagaa tggaagtgct gggatgcgag gcccaggacc tgtactga 4368
<210> 30
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 30
Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg
1 5 10
<210> 31
<211> 24
<212> PRT
<213> Sus sp.
<400> 31
Ser Phe Ala Gln Asn Ser Arg Pro Pro Ser Ala Ser Ala Pro Lys Pro
1 5 10 15
Pro Val Leu Arg Arg His Gln Arg
20
<210> 32
<211> 16
<212> PRT
<213> Sus sp.
<400> 32
Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg Tyr Arg Arg Gly
1 5 10 15
<210> 33
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 33
Thr Thr Tyr Val Asn Arg Ser Leu
1 5
<210> 34
<211> 7
<212> PRT
<213> Homo sapiens
<400> 34
Pro Gln Leu Arg Met Lys Asn
1 5
<210> 35
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 35
Val Asp Gln Arg Gly Asn Gln
1 5
<210> 36
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 36
agcttcagcc agaatgtgag caacaatgtg agcaacaatg ccaccaataa tgctaccaac 60
ccacctgtcc tgaaacgcca ccagagg 87
<210> 37
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 37
agcttcagcc agaatgtgag caacaatgcc accaacaatg tgagcaaccc acctgtcctg 60
aaacgccacc agagg 75
<210> 38
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 38
agcttcagcc agaatgtgag caataatgcc accaacccac ctgtcctgaa acgccaccag 60
agg 63
<210> 39
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 39
agcttcagcc agaatgtgag caataatcca cctgtcctga aacgccacca gagg 54
<210> 40
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 40
agcttcagcc agaataggag cctgccacct gtcctgaaac gccaccagag g 51
<210> 41
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 41
agcttcagcc agaatgccac taatgtgtct aacaactctg ctacctctgc tgactctgct 60
gtgagcccac ctgtcctgaa acgccaccag agg 93
<210> 42
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 42
agcttcagcc agaatgccac caactatgtg aacaggagcc tgccacctgt cctgaaacgc 60
caccagagg 69
<210> 43
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 43
agcttcagcc agaatgccac caactatgtg aacaggagcc tgtctgccac ctctgctgac 60
tctgctgtga gccagaatcc acctgtcctg aaacgccacc agagg 105
<210> 44
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 44
agcttcagcc agaatgtgag caacaatgtg agcaatgctg tgtctgctgt gtctgctcca 60
cctgtcctga aacgccacca gagg 84
<210> 45
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 45
agcttcagcc agaatatcac tgtggcctct gccacctcta acatcactgt ggcctctgct 60
gacccacctg tcctgaaacg ccaccagagg 90
<210> 46
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 46
agcttcagcc agaatatcac tgtgaccaac atcactgtga ctgccccacc tgtcctgaaa 60
cgccaccaga gg 72
<210> 47
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 47
agcttcagcc agaatcagac tgtgaccaac atcactgtga ctgccccacc tgtcctgaaa 60
cgccaccaga gg 72
<210> 48
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 48
agcttcagcc agaatgccac taatgtgtct aacaacagca acaccagcaa tgacagcaat 60
gtgtctccac ctgtcctgaa acgccaccag agg 93
<210> 49
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 49
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gtcctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagaagc 2280
ttctctcaga atccacctgt cctgaagaga caccagagag agatcaccag gacaaccctc 2340
cagtctgacc aggaagagat tgactatgat gacaccattt ctgtggagat gaagaaggag 2400
gactttgaca tctatgatga ggacgagaac cagtctccaa gatcattcca gaagaagaca 2460
agacactact tcattgctgc tgtggaaaga ctgtgggact atggcatgtc ttcctctccc 2520
catgtcctca ggaacagggc acagtctggc tctgtgccac agttcaagaa agtggtcttc 2580
caggagttca ctgatggctc attcacccag cccctgtaca gaggggaact gaatgagcac 2640
ctgggactcc tgggaccata catcagggct gaggtggaag acaacatcat ggtgacattc 2700
agaaaccagg cctccaggcc ctacagcttc tactcttccc tcatcagcta tgaggaagac 2760
cagagacaag gggctgagcc aagaaagaac tttgtgaaac ccaatgaaac caagacctac 2820
ttctggaaag tccagcacca catggcaccc accaaggatg agtttgactg caaggcctgg 2880
gcatacttct ctgatgtgga cctggagaaa gatgtgcact ctggcctgat tggcccactc 2940
ctggtctgcc acaccaacac cctgaaccct gcacatggaa ggcaagtgac tgtgcaggag 3000
tttgccctct tcttcaccat ctttgatgaa accaagtcat ggtacttcac tgagaacatg 3060
gagagaaact gcagagcacc atgcaacatt cagatggaag accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggca 3180
caggaccaga gaatcagatg gtacctgctt tctatgggat ccaatgagaa cattcactcc 3240
atccacttct ctgggcatgt cttcactgtg agaaagaagg aggaatacaa gatggccctg 3300
tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360
tggagggtgg aatgcctcat tggggagcac ctgcatgctg gcatgtcaac cctgttcctg 3420
gtctacagca acaagtgcca gacacccctg ggaatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtatggccag tgggcaccca aactggccag gctccactac 3540
tctggctcca tcaatgcatg gtcaaccaag gagccattct cttggatcaa ggtggacctg 3600
ctggcaccca tgatcattca tggcatcaag acacaggggg caagacagaa attctcctct 3660
ctgtacatct cacagttcat catcatgtac tctctggatg gcaagaagtg gcagacatac 3720
agaggcaact ccactggcac cctcatggtc ttctttggca atgtggacag ctctggcatc 3780
aagcacaaca tcttcaaccc tcccatcatt gccagataca tcaggctgca ccccacccac 3840
tactcaatca gatcaaccct caggatggaa ctgatgggat gtgacctgaa ctcctgctca 3900
atgcccctgg gaatggagag caaggccatt tctgatgccc agatcactgc atcctcttac 3960
ttcaccaaca tgtttgccac ctggtcacca tcaaaagcca ggctgcacct ccagggaaga 4020
agcaatgcct ggagacccca ggtcaacaac ccaaaggaat ggctgcaagt ggacttccag 4080
aagacaatga aagtcactgg ggtgacaacc cagggggtca agtctctgct cacctcaatg 4140
tatgtgaagg agttcctgat ctcttcctca caggatggcc accagtggac actcttcttc 4200
cagaatggca aagtcaaggt gttccagggc aaccaggact ctttcacacc tgtggtgaac 4260
tcactggacc cccccctcct gacaagatac ctgagaattc acccccagtc ttgggtccac 4320
cagattgccc tgagaatgga agtcctggga tgtgaggcac aagacctgta ctga 4374
<210> 50
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(45)
<400> 50
gtg agc aac aat gtg agc aac aat gcc acc aat aat gct acc aac 45
Val Ser Asn Asn Val Ser Asn Asn Ala Thr Asn Asn Ala Thr Asn
1 5 10 15
<210> 51
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 51
Val Ser Asn Asn Val Ser Asn Asn Ala Thr Asn Asn Ala Thr Asn
1 5 10 15
<210> 52
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(33)
<400> 52
gtg agc aac aat gcc acc aac aat gtg agc aac 33
Val Ser Asn Asn Ala Thr Asn Asn Val Ser Asn
1 5 10
<210> 53
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 53
Val Ser Asn Asn Ala Thr Asn Asn Val Ser Asn
1 5 10
<210> 54
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(21)
<400> 54
gtg agc aat aat gcc acc aac 21
Val Ser Asn Asn Ala Thr Asn
1 5
<210> 55
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 55
Val Ser Asn Asn Ala Thr Asn
1 5
<210> 56
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(12)
<400> 56
gtg agc aat aat 12
Val Ser Asn Asn
1
<210> 57
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 57
Val Ser Asn Asn
1
<210> 58
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(9)
<400> 58
agg agc ctg 9
Arg Ser Leu
1
<210> 59
<211> 3
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 59
Arg Ser Leu
1
<210> 60
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(51)
<400> 60
gcc act aat gtg tct aac aac tct gct acc tct gct gac tct gct gtg 48
Ala Thr Asn Val Ser Asn Asn Ser Ala Thr Ser Ala Asp Ser Ala Val
1 5 10 15
agc 51
Ser
<210> 61
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 61
Ala Thr Asn Val Ser Asn Asn Ser Ala Thr Ser Ala Asp Ser Ala Val
1 5 10 15
Ser
<210> 62
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(27)
<400> 62
gcc acc aac tat gtg aac agg agc ctg 27
Ala Thr Asn Tyr Val Asn Arg Ser Leu
1 5
<210> 63
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 63
Ala Thr Asn Tyr Val Asn Arg Ser Leu
1 5
<210> 64
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(63)
<400> 64
gcc acc aac tat gtg aac agg agc ctg tct gcc acc tct gct gac tct 48
Ala Thr Asn Tyr Val Asn Arg Ser Leu Ser Ala Thr Ser Ala Asp Ser
1 5 10 15
gct gtg agc cag aat 63
Ala Val Ser Gln Asn
20
<210> 65
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 65
Ala Thr Asn Tyr Val Asn Arg Ser Leu Ser Ala Thr Ser Ala Asp Ser
1 5 10 15
Ala Val Ser Gln Asn
20
<210> 66
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(42)
<400> 66
gtg agc aac aat gtg agc aat gct gtg tct gct gtg tct gct 42
Val Ser Asn Asn Val Ser Asn Ala Val Ser Ala Val Ser Ala
1 5 10
<210> 67
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 67
Val Ser Asn Asn Val Ser Asn Ala Val Ser Ala Val Ser Ala
1 5 10
<210> 68
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(48)
<400> 68
atc act gtg gcc tct gcc acc tct aac atc act gtg gcc tct gct gac 48
Ile Thr Val Ala Ser Ala Thr Ser Asn Ile Thr Val Ala Ser Ala Asp
1 5 10 15
<210> 69
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 69
Ile Thr Val Ala Ser Ala Thr Ser Asn Ile Thr Val Ala Ser Ala Asp
1 5 10 15
<210> 70
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(30)
<400> 70
atc act gtg acc aac atc act gtg act gcc 30
Ile Thr Val Thr Asn Ile Thr Val Thr Ala
1 5 10
<210> 71
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 71
Ile Thr Val Thr Asn Ile Thr Val Thr Ala
1 5 10
<210> 72
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(30)
<400> 72
cag act gtg acc aac atc act gtg act gcc 30
Gln Thr Val Thr Asn Ile Thr Val Thr Ala
1 5 10
<210> 73
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 73
Gln Thr Val Thr Asn Ile Thr Val Thr Ala
1 5 10
<210> 74
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> CDS
<222> (1)..(51)
<400> 74
gcc act aat gtg tct aac aac agc aac acc agc aat gac agc aat gtg 48
Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val
1 5 10 15
tct 51
Ser
<210> 75
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 75
Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val
1 5 10 15
Ser
<210> 76
<211> 405
<212> PRT
<213> Homo sapiens
<400> 76
Met Pro Leu Leu Leu Tyr Thr Cys Leu Leu Trp Leu Pro Thr Ser Gly
1 5 10 15
Leu Trp Thr Val Gln Ala Met Asp Pro Asn Ala Ala Tyr Val Asn Met
20 25 30
Ser Asn His His Arg Gly Leu Ala Ser Ala Asn Val Asp Phe Ala Phe
35 40 45
Ser Leu Tyr Lys His Leu Val Ala Leu Ser Pro Lys Lys Asn Ile Phe
50 55 60
Ile Ser Pro Val Ser Ile Ser Met Ala Leu Ala Met Leu Ser Leu Gly
65 70 75 80
Thr Cys Gly His Thr Arg Ala Gln Leu Leu Gln Gly Leu Gly Phe Asn
85 90 95
Leu Thr Glu Arg Ser Glu Thr Glu Ile His Gln Gly Phe Gln His Leu
100 105 110
His Gln Leu Phe Ala Lys Ser Asp Thr Ser Leu Glu Met Thr Met Gly
115 120 125
Asn Ala Leu Phe Leu Asp Gly Ser Leu Glu Leu Leu Glu Ser Phe Ser
130 135 140
Ala Asp Ile Lys His Tyr Tyr Glu Ser Glu Val Leu Ala Met Asn Phe
145 150 155 160
Gln Asp Trp Ala Thr Ala Ser Arg Gln Ile Asn Ser Tyr Val Lys Asn
165 170 175
Lys Thr Gln Gly Lys Ile Val Asp Leu Phe Ser Gly Leu Asp Ser Pro
180 185 190
Ala Ile Leu Val Leu Val Asn Tyr Ile Phe Phe Lys Gly Thr Trp Thr
195 200 205
Gln Pro Phe Asp Leu Ala Ser Thr Arg Glu Glu Asn Phe Tyr Val Asp
210 215 220
Glu Thr Thr Val Val Lys Val Pro Met Met Leu Gln Ser Ser Thr Ile
225 230 235 240
Ser Tyr Leu His Asp Ser Glu Leu Pro Cys Gln Leu Val Gln Met Asn
245 250 255
Tyr Val Gly Asn Gly Thr Val Phe Phe Ile Leu Pro Asp Lys Gly Lys
260 265 270
Met Asn Thr Val Ile Ala Ala Leu Ser Arg Asp Thr Ile Asn Arg Trp
275 280 285
Ser Ala Gly Leu Thr Ser Ser Gln Val Asp Leu Tyr Ile Pro Lys Val
290 295 300
Thr Ile Ser Gly Val Tyr Asp Leu Gly Asp Val Leu Glu Glu Met Gly
305 310 315 320
Ile Ala Asp Leu Phe Thr Asn Gln Ala Asn Phe Ser Arg Ile Thr Gln
325 330 335
Asp Ala Gln Leu Lys Ser Ser Lys Val Val His Lys Ala Val Leu Gln
340 345 350
Leu Asn Glu Glu Gly Val Asp Thr Ala Gly Ser Thr Gly Val Thr Leu
355 360 365
Asn Leu Thr Ser Lys Pro Ile Ile Leu Arg Phe Asn Gln Pro Phe Ile
370 375 380
Ile Met Ile Phe Asp His Phe Thr Trp Ser Ser Leu Phe Leu Ala Arg
385 390 395 400
Val Met Asn Pro Val
405
<210> 77
<211> 4
<212> PRT
<213> Homo sapiens
<400> 77
Asn Met Ser Asn
1
<210> 78
<211> 4
<212> PRT
<213> Homo sapiens
<400> 78
Asn Leu Thr Glu
1
<210> 79
<211> 4
<212> PRT
<213> Homo sapiens
<400> 79
Asn Lys Thr Gln
1
<210> 80
<211> 4
<212> PRT
<213> Homo sapiens
<400> 80
Asn Gly Thr Val
1
<210> 81
<211> 4
<212> PRT
<213> Homo sapiens
<400> 81
Asn Phe Ser Arg
1
<210> 82
<211> 4
<212> PRT
<213> Homo sapiens
<400> 82
Asn Leu Thr Ser
1
<210> 83
<211> 41
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 83
Leu Ser Lys Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ala
1 5 10 15
Thr Asn Val Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val Ser
20 25 30
Pro Pro Val Leu Lys Arg His Gln Arg
35 40
<210> 84
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 84
Asn Ala Thr Asn
1
<210> 85
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 85
Asn Val Ser Asn
1
<210> 86
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 86
Asn Asn Ser Asn
1
<210> 87
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 87
Asn Thr Ser Asn
1
<210> 88
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 88
Asn Asp Ser Asn
1
<210> 89
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 89
Asn Val Ser Pro
1
<210> 90
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 90
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gtcctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca ataccaccta cgtgaaccgc 2280
tccctgtctc agaatccacc tgtcctgaag agacaccaga gagagatcac caggacaacc 2340
ctccagtctg accaggaaga gattgactat gatgacacca tttctgtgga gatgaagaag 2400
gaggactttg acatctatga tgaggacgag aaccagtctc caagatcatt ccagaagaag 2460
acaagacact acttcattgc tgctgtggaa agactgtggg actatggcat gtcttcctct 2520
ccccatgtcc tcaggaacag ggcacagtct ggctctgtgc cacagttcaa gaaagtggtc 2580
ttccaggagt tcactgatgg ctcattcacc cagcccctgt acagagggga actgaatgag 2640
cacctgggac tcctgggacc atacatcagg gctgaggtgg aagacaacat catggtgaca 2700
ttcagaaacc aggcctccag gccctacagc ttctactctt ccctcatcag ctatgaggaa 2760
gaccagagac aaggggctga gccaagaaag aactttgtga aacccaatga aaccaagacc 2820
tacttctgga aagtccagca ccacatggca cccaccaagg atgagtttga ctgcaaggcc 2880
tgggcatact tctctgatgt ggacctggag aaagatgtgc actctggcct gattggccca 2940
ctcctggtct gccacaccaa caccctgaac cctgcacatg gaaggcaagt gactgtgcag 3000
gagtttgccc tcttcttcac catctttgat gaaaccaagt catggtactt cactgagaac 3060
atggagagaa actgcagagc accatgcaac attcagatgg aagaccccac cttcaaggag 3120
aactacaggt tccatgccat caatggctac atcatggaca ccctgcctgg gcttgtcatg 3180
gcacaggacc agagaatcag atggtacctg ctttctatgg gatccaatga gaacattcac 3240
tccatccact tctctgggca tgtcttcact gtgagaaaga aggaggaata caagatggcc 3300
ctgtacaacc tctaccctgg ggtctttgag actgtggaga tgctgccctc caaagctggc 3360
atctggaggg tggaatgcct cattggggag cacctgcatg ctggcatgtc aaccctgttc 3420
ctggtctaca gcaacaagtg ccagacaccc ctgggaatgg cctctggcca catcagggac 3480
ttccagatca ctgcctctgg ccagtatggc cagtgggcac ccaaactggc caggctccac 3540
tactctggct ccatcaatgc atggtcaacc aaggagccat tctcttggat caaggtggac 3600
ctgctggcac ccatgatcat tcatggcatc aagacacagg gggcaagaca gaaattctcc 3660
tctctgtaca tctcacagtt catcatcatg tactctctgg atggcaagaa gtggcagaca 3720
tacagaggca actccactgg caccctcatg gtcttctttg gcaatgtgga cagctctggc 3780
atcaagcaca acatcttcaa ccctcccatc attgccagat acatcaggct gcaccccacc 3840
cactactcaa tcagatcaac cctcaggatg gaactgatgg gatgtgacct gaactcctgc 3900
tcaatgcccc tgggaatgga gagcaaggcc atttctgatg cccagatcac tgcatcctct 3960
tacttcacca acatgtttgc cacctggtca ccatcaaaag ccaggctgca cctccaggga 4020
agaagcaatg cctggagacc ccaggtcaac aacccaaagg aatggctgca agtggacttc 4080
cagaagacaa tgaaagtcac tggggtgaca acccaggggg tcaagtctct gctcacctca 4140
atgtatgtga aggagttcct gatctcttcc tcacaggatg gccaccagtg gacactcttc 4200
ttccagaatg gcaaagtcaa ggtgttccag ggcaaccagg actctttcac acctgtggtg 4260
aactcactgg acccccccct cctgacaaga tacctgagaa ttcaccccca gtcttgggtc 4320
caccagattg ccctgagaat ggaagtcctg ggatgtgagg cacaagacct gtactga 4377
<210> 91
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 91
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcgtcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaatc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg aagtctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccactgc atctgaccca ccctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca ataccaccta cgtgaaccgc 2280
tccctgtctc agaatccacc tgtcctgaag agacaccaga gagagatcac caggacaacc 2340
ctccagtctg accaggaaga gattgactat gatgacacca tttctgtgga gatgaagaag 2400
gaggactttg acatctatga tgaggacgag aaccagtctc caagatcatt ccagaagaag 2460
acaagacact acttcattgc tgctgtggaa agactgtggg actatggcat gtcttcctct 2520
ccccatgtcc tcaggaacag ggcacagtct ggctctgtgc cacagttcaa gaaagtggtc 2580
ttccaggagt tcactgatgg ctcattcacc cagcccctgt acagagggga actgaatgag 2640
cacctgggac tcctgggacc atacatcagg gctgaggtgg aagacaacat catggtgaca 2700
ttcagaaacc aggcctccag gccctacagc ttctactctt ccctcatcag ctatgaggaa 2760
gaccagagac aaggggctga gccaagaaag aactttgtga aacccaatga aaccaagacc 2820
tacttctgga aagtccagca ccacatggca cccaccaagg atgagtttga ctgcaaggcc 2880
tgggcatact tctctgatgt ggacctggag aaagatgtgc actctggcct gattggccca 2940
ctcctggtct gccacaccaa caccctgaac cctgcacatg gaaggcaagt gactgtgcag 3000
gagtttgccc tcttcttcac catctttgat gaaaccaagt catggtactt cactgagaac 3060
atggagagaa actgcagagc accatgcaac attcagatgg aagaccccac cttcaaggag 3120
aactacaggt tccatgccat caatggctac atcatggaca ccctgcctgg gcttgtcatg 3180
gcacaggacc agagaatcag atggtacctg ctttctatgg gatccaatga gaacattcac 3240
tccatccact tctctgggca tgtcttcact gtgagaaaga aggaggaata caagatggcc 3300
ctgtacaacc tctaccctgg ggtctttgag actgtggaga tgctgccctc caaagctggc 3360
atctggaggg tggaatgcct cattggggag cacctgcatg ctggcatgtc aaccctgttc 3420
ctggtctaca gcaacaagtg ccagacaccc ctgggaatgg cctctggcca catcagggac 3480
ttccagatca ctgcctctgg ccagtatggc cagtgggcac ccaaactggc caggctccac 3540
tactctggct ccatcaatgc atggtcaacc aaggagccat tctcttggat caaggtggac 3600
ctgctggcac ccatgatcat tcatggcatc aagacacagg gggcaagaca gaaattctcc 3660
tctctgtaca tctcacagtt catcatcatg tactctctgg atggcaagaa gtggcagaca 3720
tacagaggca actccactgg caccctcatg gtcttctttg gcaatgtgga cagctctggc 3780
atcaagcaca acatcttcaa ccctcccatc attgccagat acatcaggct gcaccccacc 3840
cactactcaa tcagatcaac cctcaggatg gaactgatgg gatgtgacct gaactcctgc 3900
tcaatgcccc tgggaatgga gagcaaggcc atttctgatg cccagatcac tgcatcctct 3960
tacttcacca acatgtttgc cacctggtca ccatcaaaag ccaggctgca cctccaggga 4020
agaagcaatg cctggagacc ccaggtcaac aacccaaagg aatggctgca agtggacttc 4080
cagaagacaa tgaaagtcac tggggtgaca acccaggggg tcaagtctct gctcacctca 4140
atgtatgtga aggagttcct gatctcttcc tcacaggatg gccaccagtg gacactcttc 4200
ttccagaatg gcaaagtcaa ggtgttccag ggcaaccagg actctttcac acctgtggtg 4260
aactcactgg acccccccct cctgacaaga tacctgagaa ttcaccccca gtcttgggtc 4320
caccagattg ccctgagaat ggaagtcctg ggatgtgagg cacaagacct gtactga 4377
<210> 92
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 92
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaagc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg ggatctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccatggc atctgaccca ctctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca ataccaccta cgtgaaccgc 2280
tccctgtctc agaatccacc tgtcctgaag agacaccaga gagagatcac caggacaacc 2340
ctccagtctg accaggaaga gattgactat gatgacacca tttctgtgga gatgaagaag 2400
gaggactttg acatctatga tgaggacgag aaccagtctc caagatcatt ccagaagaag 2460
acaagacact acttcattgc tgctgtggaa agactgtggg actatggcat gtcttcctct 2520
ccccatgtcc tcaggaacag ggcacagtct ggctctgtgc cacagttcaa gaaagtggtc 2580
ttccaggagt tcactgatgg ctcattcacc cagcccctgt acagagggga actgaatgag 2640
cacctgggac tcctgggacc atacatcagg gctgaggtgg aagacaacat catggtgaca 2700
ttcagaaacc aggcctccag gccctacagc ttctactctt ccctcatcag ctatgaggaa 2760
gaccagagac aaggggctga gccaagaaag aactttgtga aacccaatga aaccaagacc 2820
tacttctgga aagtccagca ccacatggca cccaccaagg atgagtttga ctgcaaggcc 2880
tgggcatact tctctgatgt ggacctggag aaagatgtgc actctggcct gattggccca 2940
ctcctggtct gccacaccaa caccctgaac cctgcacatg gaaggcaagt gactgtgcag 3000
gagtttgccc tcttcttcac catctttgat gaaaccaagt catggtactt cactgagaac 3060
atggagagaa actgcagagc accatgcaac attcagatgg aagaccccac cttcaaggag 3120
aactacaggt tccatgccat caatggctac atcatggaca ccctgcctgg gcttgtcatg 3180
gcacaggacc agagaatcag atggtacctg ctttctatgg gatccaatga gaacattcac 3240
tccatccact tctctgggca tgtcttcact gtgagaaaga aggaggaata caagatggcc 3300
ctgtacaacc tctaccctgg ggtctttgag actgtggaga tgctgccctc caaagctggc 3360
atctggaggg tggaatgcct cattggggag cacctgcatg ctggcatgtc aaccctgttc 3420
ctggtctaca gcaacaagtg ccagacaccc ctgggaatgg cctctggcca catcagggac 3480
ttccagatca ctgcctctgg ccagtatggc cagtgggcac ccaaactggc caggctccac 3540
tactctggct ccatcaatgc atggtcaacc aaggagccat tctcttggat caaggtggac 3600
ctgctggcac ccatgatcat tcatggcatc aagacacagg gggcaagaca gaaattctcc 3660
tctctgtaca tctcacagtt catcatcatg tactctctgg atggcaagaa gtggcagaca 3720
tacagaggca actccactgg caccctcatg gtcttctttg gcaatgtgga cagctctggc 3780
atcaagcaca acatcttcaa ccctcccatc attgccagat acatcaggct gcaccccacc 3840
cactactcaa tcagatcaac cctcaggatg gaactgatgg gatgtgacct gaactcctgc 3900
tcaatgcccc tgggaatgga gagcaaggcc atttctgatg cccagatcac tgcatcctct 3960
tacttcacca acatgtttgc cacctggtca ccatcaaaag ccaggctgca cctccaggga 4020
agaagcaatg cctggagacc ccaggtcaac aacccaaagg aatggctgca agtggacttc 4080
cagaagacaa tgaaagtcac tggggtgaca acccaggggg tcaagtctct gctcacctca 4140
atgtatgtga aggagttcct gatctcttcc tcacaggatg gccaccagtg gacactcttc 4200
ttccagaatg gcaaagtcaa ggtgttccag ggcaaccagg actctttcac acctgtggtg 4260
aactcactgg acccccccct cctgacaaga tacctgagaa ttcaccccca gtcttgggtc 4320
caccagattg ccctgagaat ggaagtcctg ggatgtgagg cacaagacct gtactga 4377
<210> 93
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 93
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcgtcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaatc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg aagtctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccactgc atctgaccca ccctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gttctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagaagc 2280
ttctctcaga atccacctgt cctgaagaga caccagagag agatcaccag gacaaccctc 2340
cagtctgacc aggaagagat tgactatgat gacaccattt ctgtggagat gaagaaggag 2400
gactttgaca tctatgatga ggacgagaac cagtctccaa gatcattcca gaagaagaca 2460
agacactact tcattgctgc tgtggaaaga ctgtgggact atggcatgtc ttcctctccc 2520
catgtcctca ggaacagggc acagtctggc tctgtgccac agttcaagaa agtggtcttc 2580
caggagttca ctgatggctc attcacccag cccctgtaca gaggggaact gaatgagcac 2640
ctgggactcc tgggaccata catcagggct gaggtggaag acaacatcat ggtgacattc 2700
agaaaccagg cctccaggcc ctacagcttc tactcttccc tcatcagcta tgaggaagac 2760
cagagacaag gggctgagcc aagaaagaac tttgtgaaac ccaatgaaac caagacctac 2820
ttctggaaag tccagcacca catggcaccc accaaggatg agtttgactg caaggcctgg 2880
gcatacttct ctgatgtgga cctggagaaa gatgtgcact ctggcctgat tggcccactc 2940
ctggtctgcc acaccaacac cctgaaccct gcacatggaa ggcaagtgac tgtgcaggag 3000
tttgccctct tcttcaccat ctttgatgaa accaagtcat ggtacttcac tgagaacatg 3060
gagagaaact gcagagcacc atgcaacatt cagatggaag accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggca 3180
caggaccaga gaatcagatg gtacctgctt tctatgggat ccaatgagaa cattcactcc 3240
atccacttct ctgggcatgt cttcactgtg agaaagaagg aggaatacaa gatggccctg 3300
tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360
tggagggtgg aatgcctcat tggggagcac ctgcatgctg gcatgtcaac cctgttcctg 3420
gtctacagca acaagtgcca gacacccctg ggaatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtatggccag tgggcaccca aactggccag gctccactac 3540
tctggctcca tcaatgcatg gtcaaccaag gagccattct cttggatcaa ggtggacctg 3600
ctggcaccca tgatcattca tggcatcaag acacaggggg caagacagaa attctcctct 3660
ctgtacatct cacagttcat catcatgtac tctctggatg gcaagaagtg gcagacatac 3720
agaggcaact ccactggcac cctcatggtc ttctttggca atgtggacag ctctggcatc 3780
aagcacaaca tcttcaaccc tcccatcatt gccagataca tcaggctgca ccccacccac 3840
tactcaatca gatcaaccct caggatggaa ctgatgggat gtgacctgaa ctcctgctca 3900
atgcccctgg gaatggagag caaggccatt tctgatgccc agatcactgc atcctcttac 3960
ttcaccaaca tgtttgccac ctggtcacca tcaaaagcca ggctgcacct ccagggaaga 4020
agcaatgcct ggagacccca ggtcaacaac ccaaaggaat ggctgcaagt ggacttccag 4080
aagacaatga aagtcactgg ggtgacaacc cagggggtca agtctctgct cacctcaatg 4140
tatgtgaagg agttcctgat ctcttcctca caggatggcc accagtggac actcttcttc 4200
cagaatggca aagtcaaggt gttccagggc aaccaggact ctttcacacc tgtggtgaac 4260
tcactggacc cccccctcct gacaagatac ctgagaattc acccccagtc ttgggtccac 4320
cagattgccc tgagaatgga agtcctggga tgtgaggcac aagacctgta ctga 4374
<210> 94
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 94
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcgtcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaagtc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg aagagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccactgc ctctgaccca ccctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccaggagc 2280
ttcagccaga atccacctgt cctgaaacgc caccagaggg agatcaccag gaccaccctc 2340
cagtctgacc aggaggagat tgactatgat gacaccattt ctgtggagat gaagaaagag 2400
gactttgaca tctatgacga ggacgagaac cagagcccaa ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagcgc ctgtgggact atggcatgag ctccagcccc 2520
catgtcctca ggaacagggc ccagtctggc tctgtgccac agttcaagaa agtggtcttc 2580
caagagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac 2640
ctgggactcc tgggcccata catcagggct gaggtggagg acaacatcat ggtgaccttc 2700
cgcaaccagg cctccaggcc ctacagcttc tacagctccc tcatcagcta tgaggaggac 2760
cagaggcagg gggctgagcc acgcaagaac tttgtgaaac ccaatgaaac caagacctac 2820
ttctggaaag tccagcacca catggccccc accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggcccactc 2940
ctggtctgcc acaccaacac cctgaaccct gcccatggaa ggcaagtgac tgtgcaggag 3000
tttgccctct tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagcgcaact gcagggcccc atgcaacatt cagatggagg accccacctt caaagagaac 3120
taccgcttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggcc 3180
caggaccaga ggatcaggtg gtacctgctt tctatgggct ccaatgagaa cattcactcc 3240
atccacttct ctgggcatgt cttcactgtg cgcaagaagg aggagtacaa gatggccctg 3300
tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360
tggagggtgg agtgcctcat tggggagcac ctgcatgctg gcatgagcac cctgttcctg 3420
gtctacagca acaagtgcca gacccccctg ggaatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctccactac 3540
tctggatcca tcaatgcctg gagcaccaag gagccattca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaaatg gcagacctac 3720
agaggcaact ccactggaac actcatggtc ttctttggca atgtggacag ctctggcatc 3780
aagcacaaca tcttcaaccc cccaatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatcc gcagcaccct caggatggag ctgatgggct gtgacctgaa ctcctgcagc 3900
atgcccctgg gcatggagag caaggccatt tctgatgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagccca agcaaggcca ggctgcacct ccagggaagg 4020
agcaatgcct ggaggcccca ggtcaacaac ccaaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtcactgg ggtgaccacc cagggggtca agagcctgct caccagcatg 4140
tatgtgaagg agttcctgat cagctccagc caggatggcc accagtggac cctcttcttc 4200
cagaatggca aggtcaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac 4260
agcctggacc cccccctcct gaccagatac ctgaggattc acccccagag ctgggtccac 4320
cagattgccc tgaggatgga ggtcctggga tgtgaggccc aggacctgta ctga 4374
<210> 95
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 95
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca ataccaccta cgtgaaccgc 2280
tccctgagcc agaatccacc tgtcctgaaa cgccaccaga gggagatcac caggaccacc 2340
ctccagtctg accaggagga gattgactat gatgacacca tttctgtgga gatgaagaaa 2400
gaggactttg acatctatga cgaggacgag aaccagagcc caaggagctt ccagaagaag 2460
accaggcact acttcattgc tgctgtggag cgcctgtggg actatggcat gagctccagc 2520
ccccatgtcc tcaggaacag ggcccagtct ggctctgtgc cacagttcaa gaaagtggtc 2580
ttccaagagt tcactgatgg cagcttcacc cagcccctgt acagagggga gctgaatgag 2640
cacctgggac tcctgggccc atacatcagg gctgaggtgg aggacaacat catggtgacc 2700
ttccgcaacc aggcctccag gccctacagc ttctacagct ccctcatcag ctatgaggag 2760
gaccagaggc agggggctga gccacgcaag aactttgtga aacccaatga aaccaagacc 2820
tacttctgga aagtccagca ccacatggcc cccaccaagg atgagtttga ctgcaaggcc 2880
tgggcctact tctctgatgt ggacctggag aaggatgtgc actctggcct gattggccca 2940
ctcctggtct gccacaccaa caccctgaac cctgcccatg gaaggcaagt gactgtgcag 3000
gagtttgccc tcttcttcac catctttgat gaaaccaaga gctggtactt cactgagaac 3060
atggagcgca actgcagggc cccatgcaac attcagatgg aggaccccac cttcaaagag 3120
aactaccgct tccatgccat caatggctac atcatggaca ccctgcctgg gcttgtcatg 3180
gcccaggacc agaggatcag gtggtacctg ctttctatgg gctccaatga gaacattcac 3240
tccatccact tctctgggca tgtcttcact gtgcgcaaga aggaggagta caagatggcc 3300
ctgtacaacc tctaccctgg ggtctttgag actgtggaga tgctgccctc caaagctggc 3360
atctggaggg tggagtgcct cattggggag cacctgcatg ctggcatgag caccctgttc 3420
ctggtctaca gcaacaagtg ccagaccccc ctgggaatgg cctctggcca catcagggac 3480
ttccagatca ctgcctctgg ccagtatggc cagtgggccc ccaagctggc caggctccac 3540
tactctggat ccatcaatgc ctggagcacc aaggagccat tcagctggat caaagtggac 3600
ctgctggccc ccatgatcat ccatggcatc aagacccagg gggccaggca gaagttctcc 3660
agcctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa atggcagacc 3720
tacagaggca actccactgg aacactcatg gtcttctttg gcaatgtgga cagctctggc 3780
atcaagcaca acatcttcaa ccccccaatc atcgccagat acatcaggct gcaccccacc 3840
cactacagca tccgcagcac cctcaggatg gagctgatgg gctgtgacct gaactcctgc 3900
agcatgcccc tgggcatgga gagcaaggcc atttctgatg cccagatcac tgcctccagc 3960
tacttcacca acatgtttgc cacctggagc ccaagcaagg ccaggctgca cctccaggga 4020
aggagcaatg cctggaggcc ccaggtcaac aacccaaagg agtggctgca ggtggacttc 4080
cagaagacca tgaaggtcac tggggtgacc acccaggggg tcaagagcct gctcaccagc 4140
atgtatgtga aggagttcct gatcagctcc agccaggatg gccaccagtg gaccctcttc 4200
ttccagaatg gcaaggtcaa ggtgttccag ggcaaccagg acagcttcac ccctgtggtg 4260
aacagcctgg acccccccct cctgaccaga tacctgagga ttcaccccca gagctgggtc 4320
caccagattg ccctgaggat ggaggtcctg ggatgtgagg cccaggacct gtactga 4377
<210> 96
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 96
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcgtcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaagtc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg aagagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccactgc ctctgaccca ccctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gttctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca ataccaccta cgtgaaccgc 2280
tccctgagcc agaatccacc tgtcctgaaa cgccaccaga gggagatcac caggaccacc 2340
ctccagtctg accaggagga gattgactat gatgacacca tttctgtgga gatgaagaaa 2400
gaggactttg acatctatga cgaggacgag aaccagagcc caaggagctt ccagaagaag 2460
accaggcact acttcattgc tgctgtggag cgcctgtggg actatggcat gagctccagc 2520
ccccatgtcc tcaggaacag ggcccagtct ggctctgtgc cacagttcaa gaaagtggtc 2580
ttccaagagt tcactgatgg cagcttcacc cagcccctgt acagagggga gctgaatgag 2640
cacctgggac tcctgggccc atacatcagg gctgaggtgg aggacaacat catggtgacc 2700
ttccgcaacc aggcctccag gccctacagc ttctacagct ccctcatcag ctatgaggag 2760
gaccagaggc agggggctga gccacgcaag aactttgtga aacccaatga aaccaagacc 2820
tacttctgga aagtccagca ccacatggcc cccaccaagg atgagtttga ctgcaaggcc 2880
tgggcctact tctctgatgt ggacctggag aaggatgtgc actctggcct gattggccca 2940
ctcctggtct gccacaccaa caccctgaac cctgcccatg gaaggcaagt gactgtgcag 3000
gagtttgccc tcttcttcac catctttgat gaaaccaaga gctggtactt cactgagaac 3060
atggagcgca actgcagggc cccatgcaac attcagatgg aggaccccac cttcaaagag 3120
aactaccgct tccatgccat caatggctac atcatggaca ccctgcctgg gcttgtcatg 3180
gcccaggacc agaggatcag gtggtacctg ctttctatgg gctccaatga gaacattcac 3240
tccatccact tctctgggca tgtcttcact gtgcgcaaga aggaggagta caagatggcc 3300
ctgtacaacc tctaccctgg ggtctttgag actgtggaga tgctgccctc caaagctggc 3360
atctggaggg tggagtgcct cattggggag cacctgcatg ctggcatgag caccctgttc 3420
ctggtctaca gcaacaagtg ccagaccccc ctgggaatgg cctctggcca catcagggac 3480
ttccagatca ctgcctctgg ccagtatggc cagtgggccc ccaagctggc caggctccac 3540
tactctggat ccatcaatgc ctggagcacc aaggagccat tcagctggat caaagtggac 3600
ctgctggccc ccatgatcat ccatggcatc aagacccagg gggccaggca gaagttctcc 3660
agcctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa atggcagacc 3720
tacagaggca actccactgg aacactcatg gtcttctttg gcaatgtgga cagctctggc 3780
atcaagcaca acatcttcaa ccccccaatc atcgccagat acatcaggct gcaccccacc 3840
cactacagca tccgcagcac cctcaggatg gagctgatgg gctgtgacct gaactcctgc 3900
agcatgcccc tgggcatgga gagcaaggcc atttctgatg cccagatcac tgcctccagc 3960
tacttcacca acatgtttgc cacctggagc ccaagcaagg ccaggctgca cctccaggga 4020
aggagcaatg cctggaggcc ccaggtcaac aacccaaagg agtggctgca ggtggacttc 4080
cagaagacca tgaaggtcac tggggtgacc acccaggggg tcaagagcct gctcaccagc 4140
atgtatgtga aggagttcct gatcagctcc agccaggatg gccaccagtg gaccctcttc 4200
ttccagaatg gcaaggtcaa ggtgttccag ggcaaccagg acagcttcac ccctgtggtg 4260
aacagcctgg acccccccct cctgaccaga tacctgagga ttcaccccca gagctgggtc 4320
caccagattg ccctgaggat ggaggtcctg ggatgtgagg cccaggacct gtactga 4377
<210> 97
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 97
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gtcctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccaggagc 2280
ttcagccaga atccacctgt cctgaaacgc caccagaggg agatcaccag gaccaccctc 2340
cagtctgacc aggaggagat tgactatgat gacaccattt ctgtggagat gaagaaagag 2400
gactttgaca tctatgacga ggacgagaac cagagcccaa ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagcgc ctgtgggact atggcatgag ctccagcccc 2520
catgtcctca ggaacagggc ccagtctggc tctgtgccac agttcaagaa agtggtcttc 2580
caagagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac 2640
ctgggactcc tgggcccata catcagggct gaggtggagg acaacatcat ggtgaccttc 2700
cgcaaccagg cctccaggcc ctacagcttc tacagctccc tcatcagcta tgaggaggac 2760
cagaggcagg gggctgagcc acgcaagaac tttgtgaaac ccaatgaaac caagacctac 2820
ttctggaaag tccagcacca catggccccc accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggcccactc 2940
ctggtctgcc acaccaacac cctgaaccct gcccatggaa ggcaagtgac tgtgcaggag 3000
tttgccctct tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagcgcaact gcagggcccc atgcaacatt cagatggagg accccacctt caaagagaac 3120
taccgcttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggcc 3180
caggaccaga ggatcaggtg gtacctgctt tctatgggct ccaatgagaa cattcactcc 3240
atccacttct ctgggcatgt cttcactgtg cgcaagaagg aggagtacaa gatggccctg 3300
tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360
tggagggtgg agtgcctcat tggggagcac ctgcatgctg gcatgagcac cctgttcctg 3420
gtctacagca acaagtgcca gacccccctg ggaatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctccactac 3540
tctggatcca tcaatgcctg gagcaccaag gagccattca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaaatg gcagacctac 3720
agaggcaact ccactggaac actcatggtc ttctttggca atgtggacag ctctggcatc 3780
aagcacaaca tcttcaaccc cccaatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatcc gcagcaccct caggatggag ctgatgggct gtgacctgaa ctcctgcagc 3900
atgcccctgg gcatggagag caaggccatt tctgatgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagccca agcaaggcca ggctgcacct ccagggaagg 4020
agcaatgcct ggaggcccca ggtcaacaac ccaaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtcactgg ggtgaccacc cagggggtca agagcctgct caccagcatg 4140
tatgtgaagg agttcctgat cagctccagc caggatggcc accagtggac cctcttcttc 4200
cagaatggca aggtcaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac 4260
agcctggacc cccccctcct gaccagatac ctgaggattc acccccagag ctgggtccac 4320
cagattgccc tgaggatgga ggtcctggga tgtgaggccc aggacctgta ctga 4374
<210> 98
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 98
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcatcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaaggc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg ggcagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccatggc ctctgaccca ctctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gtcctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca ataccaccta cgtgaaccgc 2280
tccctgagcc agaatccacc tgtcctgaaa cgccaccaga gggagatcac caggaccacc 2340
ctccagtctg accaggagga gattgactat gatgacacca tttctgtgga gatgaagaaa 2400
gaggactttg acatctatga cgaggacgag aaccagagcc caaggagctt ccagaagaag 2460
accaggcact acttcattgc tgctgtggag cgcctgtggg actatggcat gagctccagc 2520
ccccatgtcc tcaggaacag ggcccagtct ggctctgtgc cacagttcaa gaaagtggtc 2580
ttccaagagt tcactgatgg cagcttcacc cagcccctgt acagagggga gctgaatgag 2640
cacctgggac tcctgggccc atacatcagg gctgaggtgg aggacaacat catggtgacc 2700
ttccgcaacc aggcctccag gccctacagc ttctacagct ccctcatcag ctatgaggag 2760
gaccagaggc agggggctga gccacgcaag aactttgtga aacccaatga aaccaagacc 2820
tacttctgga aagtccagca ccacatggcc cccaccaagg atgagtttga ctgcaaggcc 2880
tgggcctact tctctgatgt ggacctggag aaggatgtgc actctggcct gattggccca 2940
ctcctggtct gccacaccaa caccctgaac cctgcccatg gaaggcaagt gactgtgcag 3000
gagtttgccc tcttcttcac catctttgat gaaaccaaga gctggtactt cactgagaac 3060
atggagcgca actgcagggc cccatgcaac attcagatgg aggaccccac cttcaaagag 3120
aactaccgct tccatgccat caatggctac atcatggaca ccctgcctgg gcttgtcatg 3180
gcccaggacc agaggatcag gtggtacctg ctttctatgg gctccaatga gaacattcac 3240
tccatccact tctctgggca tgtcttcact gtgcgcaaga aggaggagta caagatggcc 3300
ctgtacaacc tctaccctgg ggtctttgag actgtggaga tgctgccctc caaagctggc 3360
atctggaggg tggagtgcct cattggggag cacctgcatg ctggcatgag caccctgttc 3420
ctggtctaca gcaacaagtg ccagaccccc ctgggaatgg cctctggcca catcagggac 3480
ttccagatca ctgcctctgg ccagtatggc cagtgggccc ccaagctggc caggctccac 3540
tactctggat ccatcaatgc ctggagcacc aaggagccat tcagctggat caaagtggac 3600
ctgctggccc ccatgatcat ccatggcatc aagacccagg gggccaggca gaagttctcc 3660
agcctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa atggcagacc 3720
tacagaggca actccactgg aacactcatg gtcttctttg gcaatgtgga cagctctggc 3780
atcaagcaca acatcttcaa ccccccaatc atcgccagat acatcaggct gcaccccacc 3840
cactacagca tccgcagcac cctcaggatg gagctgatgg gctgtgacct gaactcctgc 3900
agcatgcccc tgggcatgga gagcaaggcc atttctgatg cccagatcac tgcctccagc 3960
tacttcacca acatgtttgc cacctggagc ccaagcaagg ccaggctgca cctccaggga 4020
aggagcaatg cctggaggcc ccaggtcaac aacccaaagg agtggctgca ggtggacttc 4080
cagaagacca tgaaggtcac tggggtgacc acccaggggg tcaagagcct gctcaccagc 4140
atgtatgtga aggagttcct gatcagctcc agccaggatg gccaccagtg gaccctcttc 4200
ttccagaatg gcaaggtcaa ggtgttccag ggcaaccagg acagcttcac ccctgtggtg 4260
aacagcctgg acccccccct cctgaccaga tacctgagga ttcaccccca gagctgggtc 4320
caccagattg ccctgaggat ggaggtcctg ggatgtgagg cccaggacct gtactga 4377
<210> 99
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 99
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc 780
ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gtcctgccac atcagcagcc accagcacga cggcatggag 1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat 1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg 1320
aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc 1380
atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc 1500
gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc 1620
accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg 1680
gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag 1740
aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag 1800
aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acaccaccta cgtgaaccgc 2280
tccctgagcc agaacccccc cgtgctgaag aggcaccaga gggagatcac caggaccacc 2340
ctgcagagcg accaggagga gatcgactat gatgacacca tcagcgtgga gatgaagaag 2400
gaggacttcg acatctacga cgaggacgag aaccagagcc ccaggagctt ccagaagaag 2460
accaggcact acttcatcgc cgccgtggag aggctgtggg actatggcat gagcagcagc 2520
ccccacgtgc tgaggaacag ggcccagagc ggcagcgtgc cccagttcaa gaaggtggtg 2580
ttccaggagt tcaccgacgg cagcttcacc cagcccctgt acagaggcga gctgaacgag 2640
cacctgggcc tgctgggccc ctacatcagg gccgaggtgg aggacaacat catggtgacc 2700
ttcaggaacc aggccagcag gccctacagc ttctacagca gcctgatcag ctacgaggag 2760
gaccagaggc agggcgccga gcccaggaag aacttcgtga agcccaacga gaccaagacc 2820
tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ctgcaaggcc 2880
tgggcctact tctctgatgt ggacctggag aaggacgtgc acagcggcct gatcggcccc 2940
ctgctggtgt gccacaccaa caccctgaac cccgcccacg gcaggcaggt gaccgtgcag 3000
gagttcgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac 3060
atggagagga actgcagggc cccctgcaac atccagatgg aggaccccac cttcaaggag 3120
aactacaggt tccacgccat caacggctac atcatggaca ccctgcccgg cctggtgatg 3180
gcccaggacc agaggatcag gtggtatctg ctgagcatgg gcagcaacga gaacatccac 3240
agcatccact tcagcggcca cgtgttcacc gtgaggaaga aggaggagta caagatggcc 3300
ctgtacaacc tgtaccccgg cgtgttcgag accgtggaga tgctgcccag caaggccggc 3360
atctggaggg tggagtgcct gatcggcgag cacctgcacg ccggcatgag caccctgttc 3420
ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggcca catcagggac 3480
ttccagatca ccgcctctgg ccagtacggc cagtgggccc ccaagctggc caggctgcac 3540
tacagcggca gcatcaacgc ctggagcacc aaggagccct tcagctggat caaggtggac 3600
ctgctggccc ccatgatcat ccacggcatc aagacccagg gcgccaggca gaagttcagc 3660
agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc 3720
tacaggggca acagcaccgg caccctgatg gtgttcttcg gcaacgtgga cagcagcggc 3780
atcaagcaca acatcttcaa cccccccatc atcgccaggt acatcaggct gcaccccacc 3840
cactacagca tcaggagcac cctgcggatg gaactgatgg gctgcgacct gaacagctgc 3900
agcatgcccc tgggcatgga gagcaaggcc atctctgacg cccagatcac cgccagcagc 3960
tacttcacca acatgttcgc cacctggagc cccagcaagg ccaggctgca cctgcagggc 4020
aggagcaacg cctggaggcc ccaggtgaac aaccccaagg agtggctgca ggtggacttc 4080
cagaagacca tgaaggtgac cggcgtgacc acccagggcg tgaagagcct gctgaccagc 4140
atgtacgtga aggagttcct gatcagcagc agccaggacg gccaccagtg gaccctgttc 4200
ttccagaacg gcaaagtgaa ggtgttccag ggcaaccagg acagcttcac ccccgtggtg 4260
aacagcctgg acccccccct gctgaccagg tatctgagga tccaccccca gagctgggtg 4320
caccagatcg ccctgagaat ggaagtgctg ggatgcgagg cccaggacct gtactga 4377
<210> 100
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 100
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc 780
ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag 1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat 1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg 1320
aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc 1380
atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc 1500
gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc 1620
accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg 1680
gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag 1740
aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag 1800
aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acaccaccta cgtgaaccgc 2280
tccctgagcc agaacccccc cgtgctgaag aggcaccaga gggagatcac caggaccacc 2340
ctgcagagcg accaggagga gatcgactat gatgacacca tcagcgtgga gatgaagaag 2400
gaggacttcg acatctacga cgaggacgag aaccagagcc ccaggagctt ccagaagaag 2460
accaggcact acttcatcgc cgccgtggag aggctgtggg actatggcat gagcagcagc 2520
ccccacgtgc tgaggaacag ggcccagagc ggcagcgtgc cccagttcaa gaaggtggtg 2580
ttccaggagt tcaccgacgg cagcttcacc cagcccctgt acagaggcga gctgaacgag 2640
cacctgggcc tgctgggccc ctacatcagg gccgaggtgg aggacaacat catggtgacc 2700
ttcaggaacc aggccagcag gccctacagc ttctacagca gcctgatcag ctacgaggag 2760
gaccagaggc agggcgccga gcccaggaag aacttcgtga agcccaacga gaccaagacc 2820
tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ctgcaaggcc 2880
tgggcctact tctctgatgt ggacctggag aaggacgtgc acagcggcct gatcggcccc 2940
ctgctggtgt gccacaccaa caccctgaac cccgcccacg gcaggcaggt gaccgtgcag 3000
gagttcgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac 3060
atggagagga actgcagggc cccctgcaac atccagatgg aggaccccac cttcaaggag 3120
aactacaggt tccacgccat caacggctac atcatggaca ccctgcccgg cctggtgatg 3180
gcccaggacc agaggatcag gtggtatctg ctgagcatgg gcagcaacga gaacatccac 3240
agcatccact tcagcggcca cgtgttcacc gtgaggaaga aggaggagta caagatggcc 3300
ctgtacaacc tgtaccccgg cgtgttcgag accgtggaga tgctgcccag caaggccggc 3360
atctggaggg tggagtgcct gatcggcgag cacctgcacg ccggcatgag caccctgttc 3420
ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggcca catcagggac 3480
ttccagatca ccgcctctgg ccagtacggc cagtgggccc ccaagctggc caggctgcac 3540
tacagcggca gcatcaacgc ctggagcacc aaggagccct tcagctggat caaggtggac 3600
ctgctggccc ccatgatcat ccacggcatc aagacccagg gcgccaggca gaagttcagc 3660
agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc 3720
tacaggggca acagcaccgg caccctgatg gtgttcttcg gcaacgtgga cagcagcggc 3780
atcaagcaca acatcttcaa cccccccatc atcgccaggt acatcaggct gcaccccacc 3840
cactacagca tcaggagcac cctgcggatg gaactgatgg gctgcgacct gaacagctgc 3900
agcatgcccc tgggcatgga gagcaaggcc atctctgacg cccagatcac cgccagcagc 3960
tacttcacca acatgttcgc cacctggagc cccagcaagg ccaggctgca cctgcagggc 4020
aggagcaacg cctggaggcc ccaggtgaac aaccccaagg agtggctgca ggtggacttc 4080
cagaagacca tgaaggtgac cggcgtgacc acccagggcg tgaagagcct gctgaccagc 4140
atgtacgtga aggagttcct gatcagcagc agccaggacg gccaccagtg gaccctgttc 4200
ttccagaacg gcaaagtgaa ggtgttccag ggcaaccagg acagcttcac ccccgtggtg 4260
aacagcctgg acccccccct gctgaccagg tatctgagga tccaccccca gagctgggtg 4320
caccagatcg ccctgagaat ggaagtgctg ggatgcgagg cccaggacct gtactga 4377
<210> 101
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 101
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tggtcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaagtc ctctgagggc gccgagtatg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc aagagccaca cctacgtgtg gcaggtgctg 480
aaggagaacg gccccactgc cagcgacccc ccctgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc 780
ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag 1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat 1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg 1320
aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc 1380
atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc 1500
gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc 1620
accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg 1680
gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag 1740
aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag 1800
aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc 2280
ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagagcgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcatcgccgc cgtggagagg ctgtgggact atggcatgag cagcagcccc 2520
cacgtgctga ggaacagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggcgagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgatgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg 2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat cagggacttc 3480
cagatcaccg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccagggcg ccaggcagaa gttcagcagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gcggatggaa ctgatgggct gcgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcaccgc cagcagctac 3960
ttcaccaaca tgttcgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc 4200
cagaacggca aagtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac 4260
agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgagaatgga agtgctggga tgcgaggccc aggacctgta ctga 4374
<210> 102
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 102
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc ctctgagggc gccgagtatg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc 780
ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gtcctgccac atcagcagcc accagcacga cggcatggag 1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat 1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg 1320
aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc 1380
atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc 1500
gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc 1620
accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg 1680
gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag 1740
aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag 1800
aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc 2280
ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagagcgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcatcgccgc cgtggagagg ctgtgggact atggcatgag cagcagcccc 2520
cacgtgctga ggaacagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggcgagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgatgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg 2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat cagggacttc 3480
cagatcaccg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccagggcg ccaggcagaa gttcagcagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gcggatggaa ctgatgggct gcgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcaccgc cagcagctac 3960
ttcaccaaca tgttcgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc 4200
cagaacggca aagtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac 4260
agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgagaatgga agtgctggga tgcgaggccc aggacctgta ctga 4374
<210> 103
<211> 4377
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 103
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc ctgtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
acctcagtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tggtcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaagtc ctctgagggc gccgagtatg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc aagagccaca cctacgtgtg gcaggtgctg 480
aaggagaacg gccccactgc cagcgacccc ccctgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgatgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagggat 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc 780
ctgcccggcc tgatcggctg ccacaggaag tctgtgtact ggcacgtgat cggcatgggc 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag 1020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga tgacctgacc gactctgaga tggacgtggt gaggtttgat 1140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcagg 1320
aagtacaaga aggtcagatt catggcctac accgacgaga ccttcaagac cagggaggcc 1380
atccagcacg agtctggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca cggcatcacc 1500
gatgtgaggc ccctgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggatggcccc 1620
accaagtctg accccaggtg cctgaccagg tactacagca gcttcgtgaa catggagagg 1680
gacctggcct ctggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag 1740
aggggcaacc agatcatgtc tgacaagagg aacgtgatcc tgttctctgt gttcgatgag 1800
aacaggagct ggtatctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgtc tgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgaccgccc tgctgaaagt cagcagctgc gacaagaaca ccggcgacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acaccaccta cgtgaaccgc 2280
tccctgagcc agaacccccc cgtgctgaag aggcaccaga gggagatcac caggaccacc 2340
ctgcagagcg accaggagga gatcgactat gatgacacca tcagcgtgga gatgaagaag 2400
gaggacttcg acatctacga cgaggacgag aaccagagcc ccaggagctt ccagaagaag 2460
accaggcact acttcatcgc cgccgtggag aggctgtggg actatggcat gagcagcagc 2520
ccccacgtgc tgaggaacag ggcccagagc ggcagcgtgc cccagttcaa gaaggtggtg 2580
ttccaggagt tcaccgacgg cagcttcacc cagcccctgt acagaggcga gctgaacgag 2640
cacctgggcc tgctgggccc ctacatcagg gccgaggtgg aggacaacat catggtgacc 2700
ttcaggaacc aggccagcag gccctacagc ttctacagca gcctgatcag ctacgaggag 2760
gaccagaggc agggcgccga gcccaggaag aacttcgtga agcccaacga gaccaagacc 2820
tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ctgcaaggcc 2880
tgggcctact tctctgatgt ggacctggag aaggacgtgc acagcggcct gatcggcccc 2940
ctgctggtgt gccacaccaa caccctgaac cccgcccacg gcaggcaggt gaccgtgcag 3000
gagttcgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac 3060
atggagagga actgcagggc cccctgcaac atccagatgg aggaccccac cttcaaggag 3120
aactacaggt tccacgccat caacggctac atcatggaca ccctgcccgg cctggtgatg 3180
gcccaggacc agaggatcag gtggtatctg ctgagcatgg gcagcaacga gaacatccac 3240
agcatccact tcagcggcca cgtgttcacc gtgaggaaga aggaggagta caagatggcc 3300
ctgtacaacc tgtaccccgg cgtgttcgag accgtggaga tgctgcccag caaggccggc 3360
atctggaggg tggagtgcct gatcggcgag cacctgcacg ccggcatgag caccctgttc 3420
ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggcca catcagggac 3480
ttccagatca ccgcctctgg ccagtacggc cagtgggccc ccaagctggc caggctgcac 3540
tacagcggca gcatcaacgc ctggagcacc aaggagccct tcagctggat caaggtggac 3600
ctgctggccc ccatgatcat ccacggcatc aagacccagg gcgccaggca gaagttcagc 3660
agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc 3720
tacaggggca acagcaccgg caccctgatg gtgttcttcg gcaacgtgga cagcagcggc 3780
atcaagcaca acatcttcaa cccccccatc atcgccaggt acatcaggct gcaccccacc 3840
cactacagca tcaggagcac cctgcggatg gaactgatgg gctgcgacct gaacagctgc 3900
agcatgcccc tgggcatgga gagcaaggcc atctctgacg cccagatcac cgccagcagc 3960
tacttcacca acatgttcgc cacctggagc cccagcaagg ccaggctgca cctgcagggc 4020
aggagcaacg cctggaggcc ccaggtgaac aaccccaagg agtggctgca ggtggacttc 4080
cagaagacca tgaaggtgac cggcgtgacc acccagggcg tgaagagcct gctgaccagc 4140
atgtacgtga aggagttcct gatcagcagc agccaggacg gccaccagtg gaccctgttc 4200
ttccagaacg gcaaagtgaa ggtgttccag ggcaaccagg acagcttcac ccccgtggtg 4260
aacagcctgg acccccccct gctgaccagg tatctgagga tccaccccca gagctgggtg 4320
caccagatcg ccctgagaat ggaagtgctg ggatgcgagg cccaggacct gtactga 4377
<210> 104
<211> 1458
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 104
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ser Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Lys Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Thr Thr Tyr Val Asn Arg Ser Leu Ser Gln Asn Pro Pro Val
755 760 765
Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp
770 775 780
Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys
785 790 795 800
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
805 810 815
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
820 825 830
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
835 840 845
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
850 855 860
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
865 870 875 880
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
885 890 895
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
900 905 910
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
915 920 925
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
930 935 940
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
945 950 955 960
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
965 970 975
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
980 985 990
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
995 1000 1005
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg
1010 1015 1020
Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe
1025 1030 1035
Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp
1040 1045 1050
Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp
1055 1060 1065
Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His
1070 1075 1080
Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys
1085 1090 1095
Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu
1100 1105 1110
Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile
1115 1120 1125
Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr
1130 1135 1140
Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile
1145 1150 1155
Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala
1160 1165 1170
Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp
1175 1180 1185
Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala
1190 1195 1200
Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys
1205 1210 1215
Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu
1220 1225 1230
Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr
1235 1240 1245
Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His
1250 1255 1260
Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His
1265 1270 1275
Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met
1280 1285 1290
Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser
1295 1300 1305
Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr
1310 1315 1320
Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu
1325 1330 1335
Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys
1340 1345 1350
Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly
1355 1360 1365
Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val
1370 1375 1380
Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr
1385 1390 1395
Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln
1400 1405 1410
Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu
1415 1420 1425
Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile
1430 1435 1440
Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1445 1450 1455
<210> 105
<211> 1458
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 105
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Thr Thr Tyr Val Asn Arg Ser Leu Ser Gln Asn Pro Pro Val
755 760 765
Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp
770 775 780
Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys
785 790 795 800
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
805 810 815
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
820 825 830
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
835 840 845
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
850 855 860
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
865 870 875 880
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
885 890 895
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
900 905 910
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
915 920 925
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
930 935 940
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
945 950 955 960
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
965 970 975
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
980 985 990
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
995 1000 1005
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg
1010 1015 1020
Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe
1025 1030 1035
Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp
1040 1045 1050
Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp
1055 1060 1065
Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His
1070 1075 1080
Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys
1085 1090 1095
Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu
1100 1105 1110
Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile
1115 1120 1125
Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr
1130 1135 1140
Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile
1145 1150 1155
Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala
1160 1165 1170
Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp
1175 1180 1185
Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala
1190 1195 1200
Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys
1205 1210 1215
Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu
1220 1225 1230
Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr
1235 1240 1245
Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His
1250 1255 1260
Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His
1265 1270 1275
Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met
1280 1285 1290
Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser
1295 1300 1305
Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr
1310 1315 1320
Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu
1325 1330 1335
Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys
1340 1345 1350
Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly
1355 1360 1365
Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val
1370 1375 1380
Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr
1385 1390 1395
Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln
1400 1405 1410
Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu
1415 1420 1425
Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile
1430 1435 1440
Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1445 1450 1455
<210> 106
<211> 1457
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 106
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ser Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Lys Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Ser Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu
755 760 765
Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln
770 775 780
Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu
785 790 795 800
Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe
805 810 815
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
820 825 830
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
835 840 845
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
850 855 860
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
865 870 875 880
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
885 890 895
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
900 905 910
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
915 920 925
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
930 935 940
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
945 950 955 960
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
965 970 975
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
980 985 990
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
995 1000 1005
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1010 1015 1020
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1025 1030 1035
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1040 1045 1050
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1055 1060 1065
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1070 1075 1080
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1085 1090 1095
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1100 1105 1110
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1115 1120 1125
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1130 1135 1140
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1145 1150 1155
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1160 1165 1170
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1175 1180 1185
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1190 1195 1200
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1205 1210 1215
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1220 1225 1230
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1235 1240 1245
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1250 1255 1260
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1265 1270 1275
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1280 1285 1290
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1295 1300 1305
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1310 1315 1320
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1325 1330 1335
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1340 1345 1350
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1355 1360 1365
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1370 1375 1380
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1385 1390 1395
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1400 1405 1410
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1415 1420 1425
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1430 1435 1440
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1445 1450 1455
<210> 107
<211> 1457
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 107
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ser Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Lys Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Ser Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu
755 760 765
Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln
770 775 780
Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu
785 790 795 800
Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe
805 810 815
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
820 825 830
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
835 840 845
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
850 855 860
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
865 870 875 880
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
885 890 895
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
900 905 910
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
915 920 925
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
930 935 940
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
945 950 955 960
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
965 970 975
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
980 985 990
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
995 1000 1005
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1010 1015 1020
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1025 1030 1035
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1040 1045 1050
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1055 1060 1065
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1070 1075 1080
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1085 1090 1095
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1100 1105 1110
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1115 1120 1125
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1130 1135 1140
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1145 1150 1155
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1160 1165 1170
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1175 1180 1185
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1190 1195 1200
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1205 1210 1215
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1220 1225 1230
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1235 1240 1245
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1250 1255 1260
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1265 1270 1275
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1280 1285 1290
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1295 1300 1305
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1310 1315 1320
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1325 1330 1335
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1340 1345 1350
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1355 1360 1365
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1370 1375 1380
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1385 1390 1395
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1400 1405 1410
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1415 1420 1425
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1430 1435 1440
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1445 1450 1455
<210> 108
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 108
atgcagattg agctgtccac ctgcttcttt ctgtgcctgc tgagattctg cttctctgcc 60
accaggagat actacctggg ggctgtggaa ctttcttggg actacatgca gtctgacctg 120
ggagagctgc ctgtggatgc caggttccca cccagagtgc ccaagtcctt cccattcaac 180
acctctgtgg tctacaagaa gacactcttt gtggaattca ctgaccacct gttcaacatt 240
gcaaaaccca gaccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcgtcaccct caagaacatg gcatcccacc ctgtgtctct gcatgctgtg 360
ggagtctcat actggaaatc ctctgaaggg gctgagtatg atgaccagac atcccagaga 420
gagaaagagg atgacaaggt gttccctggg aagtctcaca cctatgtgtg gcaagtcctc 480
aaggagaatg gacccactgc atctgaccca ccctgcctga catactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg cactgctggt gtgcagggaa 600
ggatccctgg ccaaggagaa aacccagaca ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagtcttg gcactctgaa acaaagaact ccctgatgca agacagggat 720
gctgcctctg ccagggcatg gcccaagatg cacactgtga atggctatgt gaacagatca 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aagtgcactc cattttcctg gagggacaca ccttcctggt caggaaccac 900
agacaagcct ctctggagat ctctcccatc accttcctca ctgcacagac actgctgatg 960
gaccttggac agttcctgct gtcctgccac atctcttccc accagcatga tggcatggaa 1020
gcctatgtca aggtggactc atgccctgag gaaccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt cagatttgat 1140
gatgacaact ctccatcctt cattcagatc aggtctgtgg caaagaaaca ccccaagaca 1200
tgggtgcact acattgctgc tgaggaagag gactgggact atgcaccact ggtcctggcc 1260
cctgatgaca ggagctacaa gtctcagtac ctcaacaatg gcccacaaag aattggaaga 1320
aagtacaaga aagtcagatt catggcctac actgatgaaa ccttcaagac aagagaagcc 1380
attcagcatg agtctggcat tctgggacca ctcctgtatg gggaagtggg agacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag caggagactg ccaaaagggg tgaaacacct caaggacttc 1560
cccattctgc ctggagagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
acaaagtctg accccaggtg cctcaccaga tactactcct cttttgtgaa catggagaga 1680
gacctggcat ctggactgat tggaccactg ctcatctgct acaaggagtc tgtggaccag 1740
agaggcaacc agatcatgtc tgacaagaga aatgtgattc tgttctctgt ctttgatgag 1800
aacagatcat ggtacctgac tgagaacatt cagagattcc tgcccaaccc tgctggggtg 1860
caactggaag accctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg 1920
tttgactctc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggcac aaactgactt cctttctgtc ttcttctctg gatacacctt caagcacaag 2040
atggtgtatg aggacaccct gacactcttc ccattctctg gggaaactgt gttcatgagc 2100
atggagaacc ctggactgtg gattctggga tgccacaact ctgacttcag aaacagggga 2160
atgactgcac tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
tcttatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccagaagc 2280
ttctctcaga atccacctgt cctgaagaga caccagagag agatcaccag gacaaccctc 2340
cagtctgacc aggaagagat tgactatgat gacaccattt ctgtggagat gaagaaggag 2400
gactttgaca tctatgatga ggacgagaac cagtctccaa gatcattcca gaagaagaca 2460
agacactact tcattgctgc tgtggaaaga ctgtgggact atggcatgtc ttcctctccc 2520
catgtcctca ggaacagggc acagtctggc tctgtgccac agttcaagaa agtggtcttc 2580
caggagttca ctgatggctc attcacccag cccctgtaca gaggggaact gaatgagcac 2640
ctgggactcc tgggaccata catcagggct gaggtggaag acaacatcat ggtgacattc 2700
agaaaccagg cctccaggcc ctacagcttc tactcttccc tcatcagcta tgaggaagac 2760
cagagacaag gggctgagcc aagaaagaac tttgtgaaac ccaatgaaac caagacctac 2820
ttctggaaag tccagcacca catggcaccc accaaggatg agtttgactg caaggcctgg 2880
gcatacttct ctgatgtgga cctggagaaa gatgtgcact ctggcctgat tggcccactc 2940
ctggtctgcc acaccaacac cctgaaccct gcacatggaa ggcaagtgac tgtgcaggag 3000
tttgccctct tcttcaccat ctttgatgaa accaagtcat ggtacttcac tgagaacatg 3060
gagagaaact gcagagcacc atgcaacatt cagatggaag accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggca 3180
caggaccaga gaatcagatg gtacctgctt tctatgggat ccaatgagaa cattcactcc 3240
atccacttct ctgggcatgt cttcactgtg agaaagaagg aggaatacaa gatggccctg 3300
tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360
tggagggtgg aatgcctcat tggggagcac ctgcatgctg gcatgtcaac cctgttcctg 3420
gtctacagca acaagtgcca gacacccctg ggaatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtatggccag tgggcaccca aactggccag gctccactac 3540
tctggctcca tcaatgcatg gtcaaccaag gagccattct cttggatcaa ggtggacctg 3600
ctggcaccca tgatcattca tggcatcaag acacaggggg caagacagaa attctcctct 3660
ctgtacatct cacagttcat catcatgtac tctctggatg gcaagaagtg gcagacatac 3720
agaggcaact ccactggcac cctcatggtc ttctttggca atgtggacag ctctggcatc 3780
aagcacaaca tcttcaaccc tcccatcatt gccagataca tcaggctgca ccccacccac 3840
tactcaatca gatcaaccct caggatggaa ctgatgggat gtgacctgaa ctcctgctca 3900
atgcccctgg gaatggagag caaggccatt tctgatgccc agatcactgc atcctcttac 3960
ttcaccaaca tgtttgccac ctggtcacca tcaaaagcca ggctgcacct ccagggaaga 4020
agcaatgcct ggagacccca ggtcaacaac ccaaaggaat ggctgcaagt ggacttccag 4080
aagacaatga aagtcactgg ggtgacaacc cagggggtca agtctctgct cacctcaatg 4140
tatgtgaagg agttcctgat ctcttcctca caggatggcc accagtggac actcttcttc 4200
cagaatggca aagtcaaggt gttccagggc aaccaggact ctttcacacc tgtggtgaac 4260
tcactggacc cccccctcct gacaagatac ctgagaattc acccccagtc ttgggtccac 4320
cagattgccc tgagaatgga agtcctggga tgtgaggcac aagacctgta ctga 4374
<210> 109
<211> 4374
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 109
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg ggctgtggag ctttcttggg actacatgca gtctgacctg 120
ggggagctgc ctgtggatgc caggttccca cccagagtgc ccaaatcctt cccattcaac 180
acctctgtgg tctacaagaa gaccctcttt gtggagttca ctgaccacct gttcaacatt 240
gccaaaccca ggccaccctg gatgggactc ctgggaccca ccattcaggc tgaggtgtat 300
gacactgtgg tcgtcaccct caagaacatg gcctcccacc ctgtgagcct gcatgctgtg 360
ggggtcagct actggaagtc ctctgagggg gctgagtatg atgaccagac ctcccagagg 420
gagaaggagg atgacaaagt gttccctggg aagagccaca cctatgtgtg gcaggtcctc 480
aaggagaatg gccccactgc ctctgaccca ccctgcctga cctactccta cctttctcat 540
gtggacctgg tcaaggacct caactctgga ctgattgggg ccctgctggt gtgcagggag 600
ggctccctgg ccaaagagaa gacccagacc ctgcacaagt tcattctcct gtttgctgtc 660
tttgatgagg gcaagagctg gcactctgaa accaagaact ccctgatgca ggacagggat 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc 780
ctgcctggac tcattggctg ccacaggaaa tctgtctact ggcatgtgat tggcatgggg 840
acaacccctg aggtgcactc cattttcctg gagggccaca ccttcctggt caggaaccac 900
agacaggcca gcctggagat cagccccatc accttcctca ctgcccagac cctgctgatg 960
gacctcggac agttcctgct gtcctgccac atcagctccc accagcatga tggcatggag 1020
gcctatgtca aggtggacag ctgccctgag gagccacagc tcaggatgaa gaacaatgag 1080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt ccgctttgat 1140
gatgacaaca gcccatcctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc 1200
tgggtgcact acattgctgc tgaggaggag gactgggact atgccccact ggtcctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctcaacaatg gcccacagag gattggacgc 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
attcagcatg agtctggcat cctgggccca ctcctgtatg gggaggtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcctccagg ccctacaaca tctacccaca tggcatcact 1500
gatgtcaggc ccctgtacag ccgcaggctg ccaaaggggg tgaaacacct caaggacttc 1560
cccattctgc ctggggagat cttcaagtac aagtggactg tcactgtgga ggatggacca 1620
accaaatctg accccaggtg cctcaccaga tactactcca gctttgtgaa catggagagg 1680
gacctggcct ctggcctgat tggcccactg ctcatctgct acaaggagtc tgtggaccag 1740
aggggaaacc agatcatgtc tgacaagagg aatgtgattc tgttctctgt ctttgatgag 1800
aacaggagct ggtacctgac tgagaacatt cagcgcttcc tgcccaaccc tgctggggtg 1860
cagctggagg accctgagtt ccaggccagc aacatcatgc actccatcaa tggctatgtg 1920
tttgacagcc tccagctttc tgtctgcctg catgaggtgg cctactggta cattctttct 1980
attggggccc agactgactt cctttctgtc ttcttctctg gctacacctt caaacacaag 2040
atggtgtatg aggacaccct gaccctcttc ccattctctg gggagactgt gttcatgagc 2100
atggagaacc ctggcctgtg gattctggga tgccacaact ctgacttccg caacaggggc 2160
atgactgccc tgctcaaagt ctcctcctgt gacaagaaca ctggggacta ctatgaggac 2220
agctatgagg acatctctgc ctacctgctc agcaagaaca atgccattga gcccaggagc 2280
ttcagccaga atccacctgt cctgaaacgc caccagaggg agatcaccag gaccaccctc 2340
cagtctgacc aggaggagat tgactatgat gacaccattt ctgtggagat gaagaaagag 2400
gactttgaca tctatgacga ggacgagaac cagagcccaa ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagcgc ctgtgggact atggcatgag ctccagcccc 2520
catgtcctca ggaacagggc ccagtctggc tctgtgccac agttcaagaa agtggtcttc 2580
caagagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac 2640
ctgggactcc tgggcccata catcagggct gaggtggagg acaacatcat ggtgaccttc 2700
cgcaaccagg cctccaggcc ctacagcttc tacagctccc tcatcagcta tgaggaggac 2760
cagaggcagg gggctgagcc acgcaagaac tttgtgaaac ccaatgaaac caagacctac 2820
ttctggaaag tccagcacca catggccccc accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggcccactc 2940
ctggtctgcc acaccaacac cctgaaccct gcccatggaa ggcaagtgac tgtgcaggag 3000
tttgccctct tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagcgcaact gcagggcccc atgcaacatt cagatggagg accccacctt caaagagaac 3120
taccgcttcc atgccatcaa tggctacatc atggacaccc tgcctgggct tgtcatggcc 3180
caggaccaga ggatcaggtg gtacctgctt tctatgggct ccaatgagaa cattcactcc 3240
atccacttct ctgggcatgt cttcactgtg cgcaagaagg aggagtacaa gatggccctg 3300
tacaacctct accctggggt ctttgagact gtggagatgc tgccctccaa agctggcatc 3360
tggagggtgg agtgcctcat tggggagcac ctgcatgctg gcatgagcac cctgttcctg 3420
gtctacagca acaagtgcca gacccccctg ggaatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctccactac 3540
tctggatcca tcaatgcctg gagcaccaag gagccattca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaaatg gcagacctac 3720
agaggcaact ccactggaac actcatggtc ttctttggca atgtggacag ctctggcatc 3780
aagcacaaca tcttcaaccc cccaatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatcc gcagcaccct caggatggag ctgatgggct gtgacctgaa ctcctgcagc 3900
atgcccctgg gcatggagag caaggccatt tctgatgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagccca agcaaggcca ggctgcacct ccagggaagg 4020
agcaatgcct ggaggcccca ggtcaacaac ccaaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtcactgg ggtgaccacc cagggggtca agagcctgct caccagcatg 4140
tatgtgaagg agttcctgat cagctccagc caggatggcc accagtggac cctcttcttc 4200
cagaatggca aggtcaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac 4260
agcctggacc cccccctcct gaccagatac ctgaggattc acccccagag ctgggtccac 4320
cagattgccc tgaggatgga ggtcctggga tgtgaggccc aggacctgta ctga 4374
Claims (74)
- 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 있어서, 상기 인자 VIII 폴리펩티드는 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함하고,
여기서 인자 VIII 폴리펩티드의 중쇄는 서열 번호: 3의 전체 길이에 걸쳐 최소한 99% 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩되고;
여기서 인자 FVIII 폴리펩티드의 경쇄는 서열 번호: 4의 전체 길이에 걸쳐 최소한 99% 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩되고; 그리고
여기서 폴리펩티드 링커는 퓨린 개열 부위 및 서열 번호: 55의 아미노산 서열을 갖는 글리코실화 펩티드를 포함하는 것을 특징으로 하는 폴리뉴클레오티드. - 청구항 1에 있어서, 폴리펩티드 링커는 서열 번호: 38의 전체 길이에 걸쳐 최소한 95% 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩되는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 1에 있어서, 폴리펩티드 링커는 서열 번호: 38의 세 번째 뉴클레오티드 서열에 의해 인코딩되는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 1에 있어서,
첫 번째 뉴클레오티드 서열은 서열 번호: 3이고;
두 번째 뉴클레오티드 서열은 서열 번호: 4인 것을 특징으로 하는 폴리뉴클레오티드. - 청구항 2에 있어서,
첫 번째 뉴클레오티드 서열은 서열 번호: 3이고;
두 번째 뉴클레오티드 서열은 서열 번호: 4인 것을 특징으로 하는 폴리뉴클레오티드. - 청구항 3에 있어서,
첫 번째 뉴클레오티드 서열은 서열 번호: 3이고;
두 번째 뉴클레오티드 서열은 서열 번호: 4인 것을 특징으로 하는 폴리뉴클레오티드. - 청구항 1 내지 6 중에서 어느 한 항에 있어서, 인자 VIII 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 프로모터 요소를 더욱 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 7에 있어서, 프로모터 요소는 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열의 상류에 간-특이적 프로모터 서열인 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 8에 있어서, 간-특이적 프로모터 서열 및 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열 사이에 배치된 인트론 서열을 더욱 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 1 내지 6 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 벡터.
- 청구항 1 내지 6 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 입자.
- 청구항 1 내지 6 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 입자로 감염된 시험관 내 숙주 세포.
- 청구항 1 내지 6 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포유류 숙주 세포 내로 도입하는 것을 포함하고, 여기서 상기 폴리뉴클레오티드는 포유류 숙주 세포에서 복제에 적격성인 것을 특징으로 하는, 아데노 연관된 바이러스 (AAV) 입자를 생산하기 위한 시험관 내 방법.
- 청구항 11에 따른 아데노 연관된 바이러스 (AAV) 입자를 포함하는, A형 혈우병을 치료하기 위한 약학 조성물.
- 숙주 세포를 청구항 11에 따른 아데노 연관된 바이러스 (AAV) 입자와 접촉시키는 것을 포함하는 것을 특징으로 하는, 숙주 세포를 형질도입하기 위한 시험관 내 방법.
- 서열 번호: 1의 전체 길이에 걸쳐 최소한 99% 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드이며, 여기서 폴리뉴클레오티드는, 서열 번호: 19에 비하여, I105V, A127S, G151K, M166T 및 L171P 아미노산 치환을 갖는 인자 VIII 폴리펩티드를 인코딩하는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 16에 있어서,
인자 VIII 폴리펩티드는 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함하고; 그리고
폴리펩티드 링커는 경쇄와 중쇄 사이에 삽입된 서열 번호: 55의 아미노산 서열을 갖는 글리코실화 펩티드를 포함하는 것을 특징으로 하는 폴리뉴클레오티드. - 청구항 16에 있어서, 서열 번호: 94의 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 16 내지 18 중에서 어느 한 항에 있어서, 인자 VIII 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 프로모터 요소를 더욱 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 19에 있어서, 프로모터 요소는 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열의 상류에 간-특이적 프로모터 서열인 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 20에 있어서, 간-특이적 프로모터 서열 및 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열 사이에 배치된 인트론 서열을 더욱 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 16 내지 18 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 벡터.
- 청구항 16 내지 18 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 입자.
- 청구항 16 내지 18 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 입자로 감염된 시험관 내 숙주 세포.
- 청구항 16 내지 18 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포유류 숙주 세포 내로 도입하는 것을 포함하고, 여기서 상기 폴리뉴클레오티드는 포유류 숙주 세포에서 복제에 적격성인 것을 특징으로 하는, 아데노 연관된 바이러스 (AAV) 입자를 생산하기 위한 시험관 내 방법.
- 청구항 23에 따른 아데노 연관된 바이러스 (AAV) 입자를 포함하는, A형 혈우병을 치료하기 위한 약학 조성물.
- 숙주 세포를 청구항 23에 따른 아데노 연관된 바이러스 (AAV) 입자와 접촉시키는 것을 포함하는 것을 특징으로 하는, 숙주 세포를 형질도입하기 위한 시험관 내 방법.
- 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 있어서, 상기 인자 VIII 폴리펩티드는 경쇄, 중쇄, 그리고 중쇄의 C 말단을 경쇄의 N 말단에 연결하는 폴리펩티드 링커를 포함하고, 상기 인자 VIII 폴리펩티드는 서열 번호: 19에 비하여, I105V, A127S, G151K, M166T 및 L171P 아미노산 치환을 가지며,
여기서 인자 VIII 폴리펩티드의 중쇄는 서열 번호: 3의 전체 길이에 걸쳐 최소한 99% 동일성을 갖는 첫 번째 뉴클레오티드 서열에 의해 인코딩되고;
여기서 인자 FVIII 폴리펩티드의 경쇄는 서열 번호: 4의 전체 길이에 걸쳐 최소한 99% 동일성을 갖는 두 번째 뉴클레오티드 서열에 의해 인코딩되고; 그리고
여기서 폴리펩티드 링커는 퓨린 개열 부위 및 서열 번호: 55의 아미노산 서열을 갖는 글리코실화 펩티드를 포함하는 것을 특징으로 하는 폴리뉴클레오티드. - 청구항 28에 있어서, 폴리펩티드 링커는 서열 번호: 38의 전체 길이에 걸쳐 최소한 95% 동일성을 갖는 세 번째 뉴클레오티드 서열에 의해 인코딩되는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 28에 있어서, 폴리펩티드 링커는 서열 번호: 38의 세 번째 뉴클레오티드 서열에 의해 인코딩되는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 28 내지 30 중에서 어느 한 항에 있어서, 인자 VIII 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 프로모터 요소를 더욱 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 31에 있어서, 프로모터 요소는 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열의 상류에 간-특이적 프로모터 서열인 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 32에 있어서, 간-특이적 프로모터 서열 및 인자 VIII 폴리펩티드를 인코딩하는 뉴클레오티드 서열 사이에 배치된 인트론 서열을 더욱 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 청구항 28 내지 30 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 벡터.
- 청구항 28 내지 30 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 입자.
- 청구항 28 내지 30 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 아데노 연관된 바이러스 (AAV) 입자로 감염된 시험관 내 숙주 세포.
- 청구항 28 내지 30 중에서 어느 한 항에 따른 폴리뉴클레오티드를 포유류 숙주 세포 내로 도입하는 것을 포함하고, 여기서 상기 폴리뉴클레오티드는 포유류 숙주 세포에서 복제에 적격성인 것을 특징으로 하는, 아데노 연관된 바이러스 (AAV) 입자를 생산하기 위한 시험관 내 방법.
- 청구항 35에 따른 아데노 연관된 바이러스 (AAV) 입자를 포함하는, A형 혈우병을 치료하기 위한 약학 조성물.
- 숙주 세포를 청구항 35에 따른 아데노 연관된 바이러스 (AAV) 입자와 접촉시키는 것을 포함하는 것을 특징으로 하는, 숙주 세포를 형질도입하기 위한 시험관 내 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020227046419A KR20230008256A (ko) | 2015-11-13 | 2016-11-11 | A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562255317P | 2015-11-13 | 2015-11-13 | |
US62/255,317 | 2015-11-13 | ||
PCT/US2016/061684 WO2017083762A1 (en) | 2015-11-13 | 2016-11-11 | Viral vectors encoding recombinant fviii variants with increased expression for gene therapy of hemophilia a |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227046419A Division KR20230008256A (ko) | 2015-11-13 | 2016-11-11 | A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180070699A KR20180070699A (ko) | 2018-06-26 |
KR102484553B1 true KR102484553B1 (ko) | 2023-01-04 |
Family
ID=57539605
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227046419A KR20230008256A (ko) | 2015-11-13 | 2016-11-11 | A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터 |
KR1020187015189A KR102484553B1 (ko) | 2015-11-13 | 2016-11-11 | A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227046419A KR20230008256A (ko) | 2015-11-13 | 2016-11-11 | A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터 |
Country Status (18)
Country | Link |
---|---|
US (4) | US10189888B2 (ko) |
EP (1) | EP3374387A1 (ko) |
JP (4) | JP6768798B2 (ko) |
KR (2) | KR20230008256A (ko) |
CN (3) | CN108884145B (ko) |
AU (4) | AU2016353353B2 (ko) |
BR (1) | BR112018009717B1 (ko) |
CA (1) | CA3005334A1 (ko) |
CL (1) | CL2018001299A1 (ko) |
CO (1) | CO2018005377A2 (ko) |
EA (2) | EA202190827A1 (ko) |
IL (3) | IL305526A (ko) |
MX (1) | MX2018005982A (ko) |
MY (1) | MY190067A (ko) |
SG (2) | SG10202106307UA (ko) |
TW (3) | TW202302627A (ko) |
WO (1) | WO2017083762A1 (ko) |
ZA (2) | ZA201803443B (ko) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3002524A1 (en) | 2015-10-28 | 2017-05-04 | Sangamo Therapeutics, Inc. | Liver-specific constructs, factor viii expression cassettes and methods of use thereof |
TW202302627A (zh) | 2015-11-13 | 2023-01-16 | 日商武田藥品工業股份有限公司 | 用於a型血友病基因治療之編碼表現增加之重組fviii變異體之病毒載體 |
BR112018009732A8 (pt) | 2015-11-13 | 2019-02-26 | Baxalta GmbH | ?polinucleotídeo, vetor de vírus adeno-associado, partícula de vírus adeno-associado, célula hospedeira, métodos para produzir uma partícula de vírus adeno-associado, para tratar hemofilia a, para transduzir uma célula hospedeira, e, uso de uma partícula de vírus adeno-associado? |
KR102450833B1 (ko) * | 2016-04-15 | 2022-10-05 | 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 | 혈우병 a 치료용 유전자 요법 |
WO2017180861A1 (en) | 2016-04-15 | 2017-10-19 | The Trustees Of The University Of Pennsulvania | Gene therapy for treating hemophilia b |
CA3042689A1 (en) | 2016-11-04 | 2018-07-12 | Baxalta Incorporated | Adeno-associated virus formulations |
US20200263196A1 (en) * | 2017-09-27 | 2020-08-20 | Sigilon Therapeutics, Inc. | Methods, compositions, and implantable elements comprising active cells |
KR102105145B1 (ko) * | 2017-10-13 | 2020-05-13 | 영남대학교 산학협력단 | 촬영 장치 및 용기 |
KR101952102B1 (ko) * | 2017-12-07 | 2019-02-26 | 주식회사 지앤피바이오사이언스 | 단백질 발현량이 증대된 인자 ⅷ 변이체 발현벡터 |
CA3106590A1 (en) * | 2018-07-16 | 2020-01-23 | Baxalta Incorporated | Gene therapy of hemophilia a using viral vectors encoding recombinant fviii variants with increased expression |
MX2021001375A (es) * | 2018-08-03 | 2021-04-19 | Sangamo Therapeutics Inc | Parametros clinicos mejorados por la expresion del factor viii. |
US10842885B2 (en) | 2018-08-20 | 2020-11-24 | Ucl Business Ltd | Factor IX encoding nucleotides |
TW202039546A (zh) | 2019-01-16 | 2020-11-01 | 美商巴克斯歐塔公司 | 用於a型血友病基因治療之編碼表現增加之重組fviii變異體的病毒載體 |
WO2020168362A1 (en) | 2019-02-15 | 2020-08-20 | Crispr Therapeutics Ag | Gene editing for hemophilia a with improved factor viii expression |
WO2020257586A2 (en) * | 2019-06-20 | 2020-12-24 | Baxalta Incorporated | Method of treatment with viral-based gene therapy |
CN114929735A (zh) * | 2019-11-01 | 2022-08-19 | 自由行疗法有限公司 | 因子viii构建体 |
US20230023826A1 (en) * | 2019-12-12 | 2023-01-26 | Takeda Pharmaceutical Company Limited | Gene therapy of hemophilia a using viral vectors encoding recombinant fviii variants with increased expression |
KR20220138346A (ko) * | 2021-04-02 | 2022-10-12 | 연세대학교 산학협력단 | Fe-fviii 변이 유전자로 교정된 줄기세포, 이로부터 분화된 내피 세포 및 이를 포함하는 혈우병 예방 또는 치료용 약제학적 조성물 |
WO2023211316A1 (en) * | 2022-04-28 | 2023-11-02 | Joint Stock Company "Biocad" | Codon-optimized nucleic acid encoding the fviii-bdd |
CN115948408A (zh) * | 2022-09-23 | 2023-04-11 | 上海信致医药科技有限公司 | 改进的人凝血因子viii基因表达盒及其应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130017997A1 (en) | 2010-08-19 | 2013-01-17 | Amunix Operating Inc. | Factor VIII Compositions and Methods of Making and Using Same |
US20150071883A1 (en) | 2013-09-12 | 2015-03-12 | Biomarin Pharmaceutical Inc. | Adeno-Associated Virus Factor VIII Vectors |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
AU5772886A (en) | 1985-04-12 | 1986-11-05 | Genetics Institute Inc. | Novel procoagulant proteins |
US5139941A (en) | 1985-10-31 | 1992-08-18 | University Of Florida Research Foundation, Inc. | AAV transduction vectors |
US5595886A (en) | 1986-01-27 | 1997-01-21 | Chiron Corporation | Protein complexes having Factor VIII:C activity and production thereof |
US5610278A (en) | 1986-06-24 | 1997-03-11 | Novo Nordisk A/S | Process for producing a coagulation active complex of factor VIII fragments |
US6060447A (en) | 1987-05-19 | 2000-05-09 | Chiron Corporation | Protein complexes having Factor VIII:C activity and production thereof |
US6346513B1 (en) | 1987-06-12 | 2002-02-12 | Baxter Trading Gmbh | Proteins with factor VIII activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them |
US5171844A (en) | 1987-06-12 | 1992-12-15 | Gist-Brocades N.W. | Proteins with factor viii activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them |
FR2619314B1 (fr) | 1987-08-11 | 1990-06-15 | Transgene Sa | Analogue du facteur viii, procede de preparation et composition pharmaceutique le contenant |
CA2162497A1 (en) | 1993-06-10 | 1994-12-22 | Sheila Connelly | Adenoviral vectors for treatment of hemophilia |
SE504074C2 (sv) | 1993-07-05 | 1996-11-04 | Pharmacia Ab | Proteinberedning för subkutan, intramuskulär eller intradermal administrering |
US6818439B1 (en) | 1994-12-30 | 2004-11-16 | Chiron Corporation | Methods for administration of recombinant gene delivery vehicles for treatment of hemophilia and other disorders |
SE9503380D0 (sv) | 1995-09-29 | 1995-09-29 | Pharmacia Ab | Protein derivatives |
US6013516A (en) | 1995-10-06 | 2000-01-11 | The Salk Institute For Biological Studies | Vector and method of use for nucleic acid delivery to non-dividing cells |
US6458563B1 (en) | 1996-06-26 | 2002-10-01 | Emory University | Modified factor VIII |
US6114148C1 (en) | 1996-09-20 | 2012-05-01 | Gen Hospital Corp | High level expression of proteins |
US5994136A (en) | 1997-12-12 | 1999-11-30 | Cell Genesys, Inc. | Method and means for producing high titer, safe, recombinant lentivirus vectors |
US6924365B1 (en) | 1998-09-29 | 2005-08-02 | Transkaryotic Therapies, Inc. | Optimized messenger RNA |
US6200560B1 (en) | 1998-10-20 | 2001-03-13 | Avigen, Inc. | Adeno-associated virus vectors for expression of factor VIII by target cells |
US6221349B1 (en) * | 1998-10-20 | 2001-04-24 | Avigen, Inc. | Adeno-associated vectors for expression of factor VIII by target cells |
US20060099685A1 (en) | 1999-04-15 | 2006-05-11 | Yallop Christopher A | Recombinant expression of factor VIII in human cells |
CN1179976C (zh) * | 2000-12-29 | 2004-12-15 | 中国科学院上海生物化学研究所 | 产生凝血因子ⅷ的生产方法和宿主细胞 |
EP1572889B1 (en) | 2001-10-05 | 2008-12-17 | Expression Therapeutics, LLC | Nucleic acid and amino acid sequences encoding high-level expressor factor viii polypeptides and methods of use |
EP1453547B1 (en) | 2001-12-17 | 2016-09-21 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus (aav) serotype 8 sequences, vectors containing same, and uses therefor |
US7041635B2 (en) | 2003-01-28 | 2006-05-09 | In2Gen Co., Ltd. | Factor VIII polypeptide |
CA2526120A1 (en) * | 2003-06-03 | 2005-02-24 | Cell Genesys, Inc. | Compositions and methods for enhanced expression of recombinant polypeptides from a single vector using a peptide cleavage site |
US7943374B2 (en) | 2005-08-21 | 2011-05-17 | Markus Hildinger | Super-size adeno-associated viral vector harboring a recombinant genome larger than 5.7 kb |
EP2037892B1 (en) | 2006-06-19 | 2015-03-18 | Asklepios Biopharmaceutical, Inc. | Modified factor viii and factor ix genes and vectors for gene therapy |
JP5448839B2 (ja) | 2006-12-22 | 2014-03-19 | ツェー・エス・エル・ベーリング・ゲー・エム・ベー・ハー | インビボで長い半減期を有する修飾された凝固因子 |
KR100959454B1 (ko) | 2007-12-10 | 2010-05-25 | 주식회사 동부하이텍 | 반도체 소자 및 그 제조 방법 |
JP5797551B2 (ja) | 2008-04-22 | 2015-10-21 | フエー・イー・ベー・フエー・ゼツト・ウエー | 肝特異的核酸調節要素ならびにその方法および用途 |
US20120093840A1 (en) | 2009-04-06 | 2012-04-19 | Novo Nordisk A/S | Targeted delivery of factor viii proteins to platelets |
GB0911870D0 (en) | 2009-07-08 | 2009-08-19 | Ucl Business Plc | Optimised coding sequence and promoter |
DK2591099T3 (da) | 2010-07-09 | 2021-02-15 | Bioverativ Therapeutics Inc | Kimære koagulationsfaktorer |
EA028914B1 (ru) | 2011-07-25 | 2018-01-31 | Байоджен Хемофилия Инк. | Исследования для мониторинга нарушений свертываемости крови |
ES2700583T3 (es) | 2012-01-12 | 2019-02-18 | Bioverativ Therapeutics Inc | Procedimientos para reducir la inmunogenicidad contra el Factor VIII en individuos sometidos a terapia con Factor VIII |
KR102212098B1 (ko) * | 2012-01-12 | 2021-02-03 | 바이오버라티브 테라퓨틱스 인크. | 키메라 인자 viii 폴리펩티드들과 이의 용도 |
SG11201404885RA (en) * | 2012-02-15 | 2014-09-26 | Amunix Operating Inc | Factor viii compositions and methods of making and using same |
WO2013123503A1 (en) | 2012-02-17 | 2013-08-22 | The Children's Hospital Of Philadelphia | Aav vector compositions and methods for gene transfer to cells, organs and tissues |
WO2013151666A2 (en) | 2012-04-02 | 2013-10-10 | modeRNA Therapeutics | Modified polynucleotides for the production of biologics and proteins associated with human disease |
GB201210357D0 (en) | 2012-06-12 | 2012-07-25 | Ucl Business Plc | Factor VIII sequences |
WO2014008172A2 (en) | 2012-07-03 | 2014-01-09 | Expression Therapeutics, Llc | High yield suspension cell line, system and method for making same |
US10398787B2 (en) | 2012-10-26 | 2019-09-03 | Vrije Universiteit Brussel | Vectors for liver-directed gene therapy of hemophilia and methods and use thereof |
AU2013336601B2 (en) | 2012-10-26 | 2018-01-25 | Vrije Universiteit Brussel | Vector for liver-directed gene therapy of hemophilia and methods and use thereof |
DK3889173T3 (da) | 2013-02-15 | 2023-10-09 | Bioverativ Therapeutics Inc | Optimeret faktor viii-gen |
CN105209487A (zh) | 2013-03-15 | 2015-12-30 | 拜耳医药保健有限公司 | 重组因子viii制剂 |
WO2014209942A1 (en) * | 2013-06-24 | 2014-12-31 | Weidong Xiao | Mutant factor viii compositions and methods |
WO2016025764A2 (en) | 2014-08-13 | 2016-02-18 | The Children's Hospital Of Philadelphia | An improved expression cassette for packaging and expression of variant factor viii for the treatment of hemostasis disorders |
EP3253786A4 (en) * | 2015-02-06 | 2018-10-17 | The University of North Carolina at Chapel Hill | Optimized human clotting factor viii gene expression cassettes and their use |
DK3270944T3 (da) | 2015-03-17 | 2020-01-27 | Univ Brussel Vrije | Optimerede leverspecifikke ekspressionssystemer til FVIII og FIX |
TW202302627A (zh) | 2015-11-13 | 2023-01-16 | 日商武田藥品工業股份有限公司 | 用於a型血友病基因治療之編碼表現增加之重組fviii變異體之病毒載體 |
-
2016
- 2016-11-11 TW TW111137316A patent/TW202302627A/zh unknown
- 2016-11-11 EA EA202190827A patent/EA202190827A1/ru unknown
- 2016-11-11 EA EA201891137A patent/EA038288B1/ru unknown
- 2016-11-11 KR KR1020227046419A patent/KR20230008256A/ko active Application Filing
- 2016-11-11 CN CN201680067846.4A patent/CN108884145B/zh active Active
- 2016-11-11 SG SG10202106307UA patent/SG10202106307UA/en unknown
- 2016-11-11 CN CN202310490697.4A patent/CN116479001A/zh active Pending
- 2016-11-11 CA CA3005334A patent/CA3005334A1/en active Pending
- 2016-11-11 JP JP2018524747A patent/JP6768798B2/ja active Active
- 2016-11-11 MX MX2018005982A patent/MX2018005982A/es unknown
- 2016-11-11 KR KR1020187015189A patent/KR102484553B1/ko active IP Right Grant
- 2016-11-11 BR BR112018009717-9A patent/BR112018009717B1/pt active IP Right Grant
- 2016-11-11 TW TW109118505A patent/TWI777175B/zh active
- 2016-11-11 SG SG11201804070XA patent/SG11201804070XA/en unknown
- 2016-11-11 US US15/349,930 patent/US10189888B2/en active Active
- 2016-11-11 IL IL305526A patent/IL305526A/en unknown
- 2016-11-11 MY MYPI2018000735A patent/MY190067A/en unknown
- 2016-11-11 WO PCT/US2016/061684 patent/WO2017083762A1/en active Application Filing
- 2016-11-11 IL IL281038A patent/IL281038B2/en unknown
- 2016-11-11 EP EP16809573.5A patent/EP3374387A1/en active Pending
- 2016-11-11 TW TW105136965A patent/TWI695069B/zh active
- 2016-11-11 CN CN202310964403.7A patent/CN116949052A/zh active Pending
- 2016-11-11 AU AU2016353353A patent/AU2016353353B2/en active Active
-
2018
- 2018-05-13 IL IL259302A patent/IL259302B/en active IP Right Grant
- 2018-05-14 CL CL2018001299A patent/CL2018001299A1/es unknown
- 2018-05-23 CO CONC2018/0005377A patent/CO2018005377A2/es unknown
- 2018-05-24 ZA ZA2018/03443A patent/ZA201803443B/en unknown
- 2018-12-05 US US16/211,201 patent/US11492388B2/en active Active
- 2018-12-05 US US16/211,202 patent/US11254731B2/en active Active
-
2019
- 2019-07-23 ZA ZA2019/04814A patent/ZA201904814B/en unknown
-
2020
- 2020-06-05 AU AU2020203760A patent/AU2020203760B2/en active Active
- 2020-06-05 AU AU2020203761A patent/AU2020203761B2/en active Active
- 2020-08-04 JP JP2020132079A patent/JP7069258B2/ja active Active
-
2022
- 2022-01-06 US US17/570,187 patent/US20220213172A1/en active Pending
- 2022-02-25 AU AU2022201319A patent/AU2022201319B2/en active Active
- 2022-05-02 JP JP2022075864A patent/JP7307836B2/ja active Active
-
2023
- 2023-06-30 JP JP2023108132A patent/JP2023115348A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130017997A1 (en) | 2010-08-19 | 2013-01-17 | Amunix Operating Inc. | Factor VIII Compositions and Methods of Making and Using Same |
US20150071883A1 (en) | 2013-09-12 | 2015-03-12 | Biomarin Pharmaceutical Inc. | Adeno-Associated Virus Factor VIII Vectors |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022201319B2 (en) | Viral vectors encoding recombinant fviii variants with increased expression for gene therapy of hemophilia a | |
KR102551733B1 (ko) | B형 혈우병 유전자 요법을 위한 증가된 발현을 가지는 재조합 fix 변이체를 암호화하는 바이러스 벡터 | |
KR102404550B1 (ko) | A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터 | |
CN109957569A (zh) | 基于cpf1蛋白的碱基编辑系统和方法 | |
CN106544361B (zh) | 哺乳动物细胞表达载体、表达系统、制备方法和应用 | |
US6686159B2 (en) | Methods and compositions for modulating telomerase reverse transcriptase (TERT) expression | |
KR20220139924A (ko) | 큰 유전자 벡터 및 그의 전달 및 용도 | |
CN108913718A (zh) | 一种靶向EGFR vⅢ的CAR-T细胞的制备方法及应用 | |
KR20210034013A (ko) | 발현이 증가된 재조합 fviii 변이체들을 인코딩하는 바이러스 벡터를 이용한 혈우병의 유전적 치료법 | |
KR20190056656A (ko) | 구제역 O-Thi60 주의 방어 항원이 발현되는 재조합 바이러스 | |
CN114981299A (zh) | 使用编码具有增加的表达的重组fviii变体的病毒载体的a型血友病的基因疗法 | |
CN117858895A (zh) | 使用表达增强的编码重组fviii变体的病毒载体的血友病a基因疗法 | |
RU2773956C2 (ru) | Вирусные векторы, кодирующие рекомбинантные варианты fix с повышенной экспрессией, для генотерапии гемофилии в | |
EA046432B1 (ru) | Вирусные векторы, кодирующие рекомбинантные варианты fviii с повышенной экспрессией для генной терапии гемофилии a |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |