KR20180128016A - 피부의 상처, 장애 및 질환의 치료를 위한 조성물 및 방법 - Google Patents
피부의 상처, 장애 및 질환의 치료를 위한 조성물 및 방법 Download PDFInfo
- Publication number
- KR20180128016A KR20180128016A KR1020187030112A KR20187030112A KR20180128016A KR 20180128016 A KR20180128016 A KR 20180128016A KR 1020187030112 A KR1020187030112 A KR 1020187030112A KR 20187030112 A KR20187030112 A KR 20187030112A KR 20180128016 A KR20180128016 A KR 20180128016A
- Authority
- KR
- South Korea
- Prior art keywords
- polypeptide
- pharmaceutical composition
- vector
- transgene
- vii
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 161
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 48
- 201000010099 disease Diseases 0.000 title claims abstract description 26
- 208000035475 disorder Diseases 0.000 title claims abstract description 22
- 206010052428 Wound Diseases 0.000 title claims abstract description 18
- 208000027418 Wounds and injury Diseases 0.000 title claims abstract description 17
- 239000000203 mixture Substances 0.000 title claims description 12
- 238000011282 treatment Methods 0.000 title description 7
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 826
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 824
- 229920001184 polypeptide Polymers 0.000 claims abstract description 822
- 102100035199 Procollagen glycosyltransferase Human genes 0.000 claims abstract description 240
- 101710102040 Procollagen glycosyltransferase Proteins 0.000 claims abstract description 239
- 102000004510 Collagen Type VII Human genes 0.000 claims abstract description 220
- 108010017377 Collagen Type VII Proteins 0.000 claims abstract description 220
- 108010076876 Keratins Proteins 0.000 claims abstract description 131
- 102000011782 Keratins Human genes 0.000 claims abstract description 131
- 230000001086 cytosolic effect Effects 0.000 claims abstract description 116
- 230000001965 increasing effect Effects 0.000 claims abstract description 50
- 206010053177 Epidermolysis Diseases 0.000 claims abstract description 39
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 16
- 230000000069 prophylactic effect Effects 0.000 claims abstract description 9
- 241000700584 Simplexvirus Species 0.000 claims description 258
- 108700019146 Transgenes Proteins 0.000 claims description 255
- 108091033319 polynucleotide Proteins 0.000 claims description 253
- 239000002157 polynucleotide Substances 0.000 claims description 253
- 102000040430 polynucleotide Human genes 0.000 claims description 253
- 239000013598 vector Substances 0.000 claims description 198
- 239000008194 pharmaceutical composition Substances 0.000 claims description 196
- 230000035772 mutation Effects 0.000 claims description 170
- 101150027427 ICP4 gene Proteins 0.000 claims description 157
- 108700026244 Open Reading Frames Proteins 0.000 claims description 156
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 claims description 143
- 210000004027 cell Anatomy 0.000 claims description 137
- 230000000415 inactivating effect Effects 0.000 claims description 111
- 108090000623 proteins and genes Proteins 0.000 claims description 103
- 101001042049 Human herpesvirus 1 (strain 17) Transcriptional regulator ICP22 Proteins 0.000 claims description 99
- 101000999690 Human herpesvirus 2 (strain HG52) E3 ubiquitin ligase ICP22 Proteins 0.000 claims description 99
- 241000700605 Viruses Species 0.000 claims description 87
- 101710130522 mRNA export factor Proteins 0.000 claims description 79
- 101150081415 UL55 gene Proteins 0.000 claims description 61
- 101150044021 UL41 gene Proteins 0.000 claims description 58
- 101150029683 gB gene Proteins 0.000 claims description 58
- 108091093088 Amplicon Proteins 0.000 claims description 56
- 239000012634 fragment Substances 0.000 claims description 56
- 239000003937 drug carrier Substances 0.000 claims description 46
- 230000002779 inactivation Effects 0.000 claims description 45
- 150000001413 amino acids Chemical class 0.000 claims description 43
- 102000008186 Collagen Human genes 0.000 claims description 38
- 108010035532 Collagen Proteins 0.000 claims description 38
- 229920001436 collagen Polymers 0.000 claims description 38
- 238000012217 deletion Methods 0.000 claims description 38
- 230000037430 deletion Effects 0.000 claims description 38
- 108700005077 Viral Genes Proteins 0.000 claims description 37
- 101150090364 ICP0 gene Proteins 0.000 claims description 34
- 230000015572 biosynthetic process Effects 0.000 claims description 32
- 230000024900 basement membrane organization Effects 0.000 claims description 29
- 108091026890 Coding region Proteins 0.000 claims description 24
- 230000002708 enhancing effect Effects 0.000 claims description 21
- 241000701074 Human alphaherpesvirus 2 Species 0.000 claims description 20
- 241000702421 Dependoparvovirus Species 0.000 claims description 19
- 239000013589 supplement Substances 0.000 claims description 18
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 16
- 230000000699 topical effect Effects 0.000 claims description 16
- 230000001502 supplementing effect Effects 0.000 claims description 15
- 201000004681 Psoriasis Diseases 0.000 claims description 13
- 230000002500 effect on skin Effects 0.000 claims description 13
- 240000007019 Oxalis corniculata Species 0.000 claims description 12
- 241000701161 unidentified adenovirus Species 0.000 claims description 12
- 201000004624 Dermatitis Diseases 0.000 claims description 11
- 208000007514 Herpes zoster Diseases 0.000 claims description 11
- 230000003436 cytoskeletal effect Effects 0.000 claims description 11
- 108091070501 miRNA Proteins 0.000 claims description 11
- 239000002679 microRNA Substances 0.000 claims description 11
- 241000700618 Vaccinia virus Species 0.000 claims description 10
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 claims description 10
- 241000713666 Lentivirus Species 0.000 claims description 9
- 241000711408 Murine respirovirus Species 0.000 claims description 9
- 241001430294 unidentified retrovirus Species 0.000 claims description 9
- 239000003623 enhancer Substances 0.000 claims description 8
- 239000007924 injection Substances 0.000 claims description 8
- 238000002347 injection Methods 0.000 claims description 8
- 102000003886 Glycoproteins Human genes 0.000 claims description 7
- 108090000288 Glycoproteins Proteins 0.000 claims description 7
- 241000701024 Human betaherpesvirus 5 Species 0.000 claims description 7
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 claims description 7
- 230000003190 augmentative effect Effects 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 6
- 230000029663 wound healing Effects 0.000 claims description 6
- 241000222122 Candida albicans Species 0.000 claims description 5
- 206010007134 Candida infections Diseases 0.000 claims description 5
- 206010010356 Congenital anomaly Diseases 0.000 claims description 5
- 101100181372 Homo sapiens LAMB3 gene Proteins 0.000 claims description 5
- 101150063253 LAMB3 gene Proteins 0.000 claims description 5
- 206010039710 Scleroderma Diseases 0.000 claims description 5
- 208000000453 Skin Neoplasms Diseases 0.000 claims description 5
- 208000010668 atopic eczema Diseases 0.000 claims description 5
- 201000003984 candidiasis Diseases 0.000 claims description 5
- 206010025135 lupus erythematosus Diseases 0.000 claims description 5
- 201000000849 skin cancer Diseases 0.000 claims description 5
- 108010020504 2-Oxoglutarate 5-Dioxygenase Procollagen-Lysine Proteins 0.000 claims description 4
- 102000008490 2-Oxoglutarate 5-Dioxygenase Procollagen-Lysine Human genes 0.000 claims description 4
- 241000721454 Pemphigus Species 0.000 claims description 4
- 208000025865 Ulcer Diseases 0.000 claims description 4
- 239000003708 ampul Substances 0.000 claims description 4
- 230000000295 complement effect Effects 0.000 claims description 4
- 208000002474 Tinea Diseases 0.000 claims description 3
- 230000035557 fibrillogenesis Effects 0.000 claims description 3
- 208000011580 syndromic disease Diseases 0.000 claims description 3
- 230000009261 transgenic effect Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 210000000981 epithelium Anatomy 0.000 claims description 2
- 210000003705 ribosome Anatomy 0.000 claims description 2
- 241000700588 Human alphaherpesvirus 1 Species 0.000 claims 18
- 230000009849 deactivation Effects 0.000 claims 7
- 102000016559 DNA Primase Human genes 0.000 claims 5
- 108010092681 DNA Primase Proteins 0.000 claims 5
- 238000004806 packaging method and process Methods 0.000 claims 2
- 102000000503 Collagen Type II Human genes 0.000 claims 1
- 108010041390 Collagen Type II Proteins 0.000 claims 1
- 206010012504 Dermatophytosis Diseases 0.000 claims 1
- LCWXJXMHJVIJFK-UHFFFAOYSA-N Hydroxylysine Natural products NCC(O)CC(N)CC(O)=O LCWXJXMHJVIJFK-UHFFFAOYSA-N 0.000 claims 1
- 241001460074 Microsporum distortum Species 0.000 claims 1
- 229910002651 NO3 Inorganic materials 0.000 claims 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 claims 1
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 claims 1
- 201000001981 dermatomyositis Diseases 0.000 claims 1
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 claims 1
- 150000003839 salts Chemical class 0.000 claims 1
- 230000009772 tissue formation Effects 0.000 claims 1
- 208000024891 symptom Diseases 0.000 abstract description 9
- 230000003247 decreasing effect Effects 0.000 abstract description 3
- 230000014509 gene expression Effects 0.000 description 55
- 108020004999 messenger RNA Proteins 0.000 description 38
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 30
- 210000003491 skin Anatomy 0.000 description 25
- 239000003981 vehicle Substances 0.000 description 24
- 230000003612 virological effect Effects 0.000 description 23
- 241000282414 Homo sapiens Species 0.000 description 22
- 238000003776 cleavage reaction Methods 0.000 description 21
- 230000007017 scission Effects 0.000 description 21
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 20
- 101100114362 Caenorhabditis elegans col-7 gene Proteins 0.000 description 18
- 102000004169 proteins and genes Human genes 0.000 description 18
- 229940024606 amino acid Drugs 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 17
- 210000004899 c-terminal region Anatomy 0.000 description 15
- -1 e.g. Proteins 0.000 description 14
- 230000002327 eosinophilic effect Effects 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 14
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 13
- 239000002773 nucleotide Substances 0.000 description 12
- 150000007523 nucleic acids Chemical class 0.000 description 11
- 125000003729 nucleotide group Chemical group 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 108020004414 DNA Proteins 0.000 description 9
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 9
- 102000039446 nucleic acids Human genes 0.000 description 9
- 108020004707 nucleic acids Proteins 0.000 description 9
- 229960002756 azacitidine Drugs 0.000 description 8
- 230000003412 degenerative effect Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 210000002510 keratinocyte Anatomy 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 7
- 210000002950 fibroblast Anatomy 0.000 description 7
- 108020005345 3' Untranslated Regions Proteins 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 108091036066 Three prime untranslated region Proteins 0.000 description 6
- 210000004292 cytoskeleton Anatomy 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000028327 secretion Effects 0.000 description 6
- QROZCFCNYCVEDO-KQYNXXCUSA-N (2r,3r,4s,5r)-2-[6-(hydroxyamino)purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(NO)=C2N=C1 QROZCFCNYCVEDO-KQYNXXCUSA-N 0.000 description 5
- 208000010975 Dystrophic epidermolysis bullosa Diseases 0.000 description 5
- 206010014989 Epidermolysis bullosa Diseases 0.000 description 5
- 210000002469 basement membrane Anatomy 0.000 description 5
- 208000004298 epidermolysis bullosa dystrophica Diseases 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000002502 liposome Substances 0.000 description 5
- 210000004400 mucous membrane Anatomy 0.000 description 5
- 239000002674 ointment Substances 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000037390 scarring Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 4
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 230000003902 lesion Effects 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 230000002062 proliferating effect Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 108010010803 Gelatin Proteins 0.000 description 3
- 101001066129 Homo sapiens Glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 229920006317 cationic polymer Polymers 0.000 description 3
- 239000006071 cream Substances 0.000 description 3
- 231100000409 cytocidal Toxicity 0.000 description 3
- 230000000445 cytocidal effect Effects 0.000 description 3
- 239000000412 dendrimer Substances 0.000 description 3
- 229920000736 dendritic polymer Polymers 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 239000000839 emulsion Substances 0.000 description 3
- 210000001808 exosome Anatomy 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 239000008273 gelatin Substances 0.000 description 3
- 229920000159 gelatin Polymers 0.000 description 3
- 235000019322 gelatine Nutrition 0.000 description 3
- 235000011852 gelatine desserts Nutrition 0.000 description 3
- 102000047486 human GAPDH Human genes 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 210000003127 knee Anatomy 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 239000006210 lotion Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 3
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 3
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 230000003449 preventive effect Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000007921 spray Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000011200 topical administration Methods 0.000 description 3
- 241001529453 unidentified herpesvirus Species 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- IYPBDMKBQJGCLT-KVTDHHQDSA-N 3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-hydroxy-6-(hydroxyamino)-2h-1,3,5-triazin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(NO)N(O)C1 IYPBDMKBQJGCLT-KVTDHHQDSA-N 0.000 description 2
- PXAVPJLBJSKTBJ-UAKXSSHOSA-N 5-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-hydrazinylpyrimidin-2-one Chemical compound C1=C(N)C(NN)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 PXAVPJLBJSKTBJ-UAKXSSHOSA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 201000004384 Alopecia Diseases 0.000 description 2
- 108700031308 Antennapedia Homeodomain Proteins 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 208000031229 Cardiomyopathies Diseases 0.000 description 2
- 206010008631 Cholera Diseases 0.000 description 2
- 229920002261 Corn starch Polymers 0.000 description 2
- 102100037912 Cyclin-dependent kinase 11A Human genes 0.000 description 2
- 206010011985 Decubitus ulcer Diseases 0.000 description 2
- 241000991587 Enterovirus C Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 2
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 2
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000711549 Hepacivirus C Species 0.000 description 2
- 101000738403 Homo sapiens Cyclin-dependent kinase 11A Proteins 0.000 description 2
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 101150103126 ICP22 gene Proteins 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 206010021531 Impetigo Diseases 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 2
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 2
- 101100496574 Mus musculus Col7a1 gene Proteins 0.000 description 2
- 206010030113 Oedema Diseases 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Natural products OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 208000004210 Pressure Ulcer Diseases 0.000 description 2
- 108010050808 Procollagen Proteins 0.000 description 2
- 102000004433 Proto-Oncogene Proteins c-pim-1 Human genes 0.000 description 2
- 108010017121 Proto-Oncogene Proteins c-pim-1 Proteins 0.000 description 2
- 108010019674 Proto-Oncogene Proteins c-sis Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 241000893966 Trichophyton verrucosum Species 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N aldehydo-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- OSGAYBCDTDRGGQ-UHFFFAOYSA-L calcium sulfate Chemical compound [Ca+2].[O-]S([O-])(=O)=O OSGAYBCDTDRGGQ-UHFFFAOYSA-L 0.000 description 2
- YCIMNLLNPGFGHC-UHFFFAOYSA-N catechol Chemical compound OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 239000008120 corn starch Substances 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000008021 deposition Effects 0.000 description 2
- 210000004207 dermis Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 210000003238 esophagus Anatomy 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- ZSIAUFGUXNUGDI-UHFFFAOYSA-N hexan-1-ol Chemical compound CCCCCCO ZSIAUFGUXNUGDI-UHFFFAOYSA-N 0.000 description 2
- 238000010166 immunofluorescence Methods 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 239000007927 intramuscular injection Substances 0.000 description 2
- 238000010255 intramuscular injection Methods 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- RLSSMJSEOOYNOY-UHFFFAOYSA-N m-cresol Chemical compound CC1=CC=CC(O)=C1 RLSSMJSEOOYNOY-UHFFFAOYSA-N 0.000 description 2
- 235000019359 magnesium stearate Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 2
- 239000006072 paste Substances 0.000 description 2
- AQIXEPGDORPWBJ-UHFFFAOYSA-N pentan-3-ol Chemical compound CCC(O)CC AQIXEPGDORPWBJ-UHFFFAOYSA-N 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- QELSKZZBTMNZEB-UHFFFAOYSA-N propylparaben Chemical compound CCCOC(=O)C1=CC=C(O)C=C1 QELSKZZBTMNZEB-UHFFFAOYSA-N 0.000 description 2
- 230000001185 psoriatic effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 210000004761 scalp Anatomy 0.000 description 2
- 231100000241 scar Toxicity 0.000 description 2
- 208000017520 skin disease Diseases 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000000454 talc Substances 0.000 description 2
- 229910052623 talc Inorganic materials 0.000 description 2
- 229960004072 thrombin Drugs 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- IMEBVVPYOVUBKA-UUOKFMHZSA-N (2R,3R,4S,5R)-2-[7-(hydroxyamino)triazolo[4,5-d]pyrimidin-3-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1nnc2c(NO)ncnc12 IMEBVVPYOVUBKA-UUOKFMHZSA-N 0.000 description 1
- KLNYEFMNJOUCTO-UUOKFMHZSA-N (2r,3r,4s,5r)-2-(7-hydrazinyltriazolo[4,5-d]pyrimidin-3-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound N1=NC=2C(NN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O KLNYEFMNJOUCTO-UUOKFMHZSA-N 0.000 description 1
- IFCGNCLEKGDBDJ-KQYNXXCUSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-[7-(methylamino)triazolo[4,5-d]pyrimidin-3-yl]oxolane-3,4-diol Chemical compound N1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IFCGNCLEKGDBDJ-KQYNXXCUSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- ABGLXZLYLBSFDZ-KVTDHHQDSA-N 1,6-diamino-3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2h-1,3,5-triazin-4-one Chemical compound O=C1N=C(N)N(N)CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ABGLXZLYLBSFDZ-KVTDHHQDSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- ARYVNLRUDOYCGR-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(hydroxyamino)-1,3,5-triazin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(NO)N=C1 ARYVNLRUDOYCGR-KVTDHHQDSA-N 0.000 description 1
- FIAQJMSWEWAREU-JXOAFFINSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(hydroxyamino)-5-methylpyrimidin-2-one Chemical compound O=C1N=C(NO)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 FIAQJMSWEWAREU-JXOAFFINSA-N 0.000 description 1
- WVMPZTYBROSQRJ-DBRKOABJSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(methylamino)-1,3,5-triazin-2-one Chemical compound O=C1N=C(NC)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 WVMPZTYBROSQRJ-DBRKOABJSA-N 0.000 description 1
- RSSRMDMJEZIUJX-XVFCMESISA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-hydrazinylpyrimidin-2-one Chemical compound O=C1N=C(NN)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RSSRMDMJEZIUJX-XVFCMESISA-N 0.000 description 1
- RNKDWPJBJIFTKV-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-hydroxy-1,3,5-triazinane-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N(O)C1 RNKDWPJBJIFTKV-KVTDHHQDSA-N 0.000 description 1
- QJFQWYBWIIJENY-FDDDBJFASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-4-(methylamino)pyrimidin-2-one Chemical compound C1=C(C)C(NC)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QJFQWYBWIIJENY-FDDDBJFASA-N 0.000 description 1
- WOWKPCXEBJGZMT-KVTDHHQDSA-N 1-amino-3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-6-(hydroxyamino)-2h-1,3,5-triazin-4-one Chemical compound O=C1N=C(NO)N(N)CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 WOWKPCXEBJGZMT-KVTDHHQDSA-N 0.000 description 1
- CNDJSOTUEUHZDN-KVTDHHQDSA-N 1-amino-3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-6-hydrazinyl-2h-1,3,5-triazin-4-one Chemical compound C1N(N)C(NN)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 CNDJSOTUEUHZDN-KVTDHHQDSA-N 0.000 description 1
- YIBJSENXVGMWRM-KVTDHHQDSA-N 1-amino-5-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazinane-2,4-dione Chemical compound O=C1NC(=O)N(N)CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YIBJSENXVGMWRM-KVTDHHQDSA-N 0.000 description 1
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- LWOXGYIDLHBWQL-WCTZXXKLSA-N 3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methyl-6-(methylamino)-2h-1,3,5-triazin-4-one Chemical compound C1N(C)C(NC)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LWOXGYIDLHBWQL-WCTZXXKLSA-N 0.000 description 1
- AVRXOMHHZIEGHW-KVTDHHQDSA-N 3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-6-hydrazinyl-1-hydroxy-2h-1,3,5-triazin-4-one Chemical compound C1N(O)C(NN)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 AVRXOMHHZIEGHW-KVTDHHQDSA-N 0.000 description 1
- LZWSGWMPCIAGIJ-UAKXSSHOSA-N 4,5-diamino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C(N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZWSGWMPCIAGIJ-UAKXSSHOSA-N 0.000 description 1
- ZLOIGESWDJYCTF-UHFFFAOYSA-N 4-Thiouridine Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-UHFFFAOYSA-N 0.000 description 1
- OZNGVGXAUZKJGJ-DJSMDIAISA-N 4-amino-1-[(2S,3R,4S,5R)-2-amino-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazin-2-one Chemical compound N[C@@]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=O)N=C(N)N=C1 OZNGVGXAUZKJGJ-DJSMDIAISA-N 0.000 description 1
- AGOOLAXXSHOFRL-HCWSKCQFSA-N 4-amino-1-[(2s,3r,4s,5r)-2-amino-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@@]1(N)[C@H](O)[C@H](O)[C@@H](CO)O1 AGOOLAXXSHOFRL-HCWSKCQFSA-N 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- PRZPQRIVPUNQTO-JXOAFFINSA-N 5-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(methylamino)pyrimidin-2-one Chemical compound C1=C(N)C(NC)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 PRZPQRIVPUNQTO-JXOAFFINSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- OZTOEARQSSIFOG-MWKIOEHESA-N 6-Thio-7-deaza-8-azaguanosine Chemical compound Nc1nc(=S)c2cnn([C@@H]3O[C@H](CO)[C@@H](O)[C@H]3O)c2[nH]1 OZTOEARQSSIFOG-MWKIOEHESA-N 0.000 description 1
- PRKXZPRMTSMQEP-KVTDHHQDSA-N 6-amino-3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-hydroxy-2h-1,3,5-triazin-4-one Chemical compound C1N(O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 PRKXZPRMTSMQEP-KVTDHHQDSA-N 0.000 description 1
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 102100023635 Alpha-fetoprotein Human genes 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 101100114361 Arabidopsis thaliana COL7 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 206010003645 Atopy Diseases 0.000 description 1
- 241000713842 Avian sarcoma virus Species 0.000 description 1
- 206010004446 Benign prostatic hyperplasia Diseases 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 101100326791 Caenorhabditis elegans cap-2 gene Proteins 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 208000032544 Cicatrix Diseases 0.000 description 1
- 208000032170 Congenital Abnormalities Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 208000019505 Deglutition disease Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000696272 Gull adenovirus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001027128 Homo sapiens Fibronectin Proteins 0.000 description 1
- 101000595913 Homo sapiens Procollagen glycosyltransferase Proteins 0.000 description 1
- 101000829419 Homo sapiens Spermatogenic leucine zipper protein 1 Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical class C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- 125000002059 L-arginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C([H])([H])N([H])C(=N[H])N([H])[H] 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- 239000004909 Moisturizer Substances 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 229930182474 N-glycoside Natural products 0.000 description 1
- 108010057466 NF-kappa B Proteins 0.000 description 1
- 102000003945 NF-kappa B Human genes 0.000 description 1
- 208000011219 Netherton syndrome Diseases 0.000 description 1
- 101150077518 PLOD3 gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 201000011152 Pemphigus Diseases 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 102000004079 Prolyl Hydroxylases Human genes 0.000 description 1
- 108010043005 Prolyl Hydroxylases Proteins 0.000 description 1
- 208000004403 Prostatic Hyperplasia Diseases 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 208000032023 Signs and Symptoms Diseases 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 206010040867 Skin hypertrophy Diseases 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 101000956368 Trittame loki CRISP/Allergen/PR-1 Proteins 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 238000012382 advanced drug delivery Methods 0.000 description 1
- 239000002386 air freshener Substances 0.000 description 1
- 208000004631 alopecia areata Diseases 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 229960000686 benzalkonium chloride Drugs 0.000 description 1
- UREZNYTWGJKWBI-UHFFFAOYSA-M benzethonium chloride Chemical compound [Cl-].C1=CC(C(C)(C)CC(C)(C)C)=CC=C1OCCOCC[N+](C)(C)CC1=CC=CC=C1 UREZNYTWGJKWBI-UHFFFAOYSA-M 0.000 description 1
- 229960001950 benzethonium chloride Drugs 0.000 description 1
- CADWTSSKOVRVJC-UHFFFAOYSA-N benzyl(dimethyl)azanium;chloride Chemical compound [Cl-].C[NH+](C)CC1=CC=CC=C1 CADWTSSKOVRVJC-UHFFFAOYSA-N 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- HUTDDBSSHVOYJR-UHFFFAOYSA-H bis[(2-oxo-1,3,2$l^{5},4$l^{2}-dioxaphosphaplumbetan-2-yl)oxy]lead Chemical compound [Pb+2].[Pb+2].[Pb+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O HUTDDBSSHVOYJR-UHFFFAOYSA-H 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000001217 buttock Anatomy 0.000 description 1
- LRHPLDYGYMQRHN-UHFFFAOYSA-N butyl alcohol Substances CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- FUFJGUQYACFECW-UHFFFAOYSA-L calcium hydrogenphosphate Chemical compound [Ca+2].OP([O-])([O-])=O FUFJGUQYACFECW-UHFFFAOYSA-L 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 235000011132 calcium sulphate Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 230000037319 collagen production Effects 0.000 description 1
- 229940075614 colloidal silicon dioxide Drugs 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 210000001787 dendrite Anatomy 0.000 description 1
- 210000003298 dental enamel Anatomy 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 235000019700 dicalcium phosphate Nutrition 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 208000007784 diverticulitis Diseases 0.000 description 1
- 230000002497 edematous effect Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229940093915 gynecological organic acid Drugs 0.000 description 1
- 208000024963 hair loss Diseases 0.000 description 1
- 230000003676 hair loss Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 102000049483 human SPZ1 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 239000008172 hydrogenated vegetable oil Substances 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 229920003063 hydroxymethyl cellulose Polymers 0.000 description 1
- 229940031574 hydroxymethyl cellulose Drugs 0.000 description 1
- 239000001866 hydroxypropyl methyl cellulose Substances 0.000 description 1
- 235000010979 hydroxypropyl methyl cellulose Nutrition 0.000 description 1
- 229920003088 hydroxypropyl methyl cellulose Polymers 0.000 description 1
- UFVKGYZPFZQRLF-UHFFFAOYSA-N hydroxypropyl methyl cellulose Chemical compound OC1C(O)C(OC)OC(CO)C1OC1C(O)C(O)C(OC2C(C(O)C(OC3C(C(O)C(O)C(CO)O3)O)C(CO)O2)O)C(CO)O1 UFVKGYZPFZQRLF-UHFFFAOYSA-N 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000011532 immunohistochemical staining Methods 0.000 description 1
- 238000000530 impalefection Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 239000007925 intracardiac injection Substances 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 230000007803 itching Effects 0.000 description 1
- 150000003951 lactams Chemical class 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 208000018769 loss of vision Diseases 0.000 description 1
- 231100000864 loss of vision Toxicity 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 239000004292 methyl p-hydroxybenzoate Substances 0.000 description 1
- 235000010270 methyl p-hydroxybenzoate Nutrition 0.000 description 1
- 229960002216 methylparaben Drugs 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000001333 moisturizer Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229940127249 oral antibiotic Drugs 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- LXCFILQKKLGQFO-UHFFFAOYSA-N p-hydroxybenzoic acid methyl ester Natural products COC(=O)C1=CC=C(O)C=C1 LXCFILQKKLGQFO-UHFFFAOYSA-N 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 201000001976 pemphigus vulgaris Diseases 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 235000010232 propyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004405 propyl p-hydroxybenzoate Substances 0.000 description 1
- 229960003415 propylparaben Drugs 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 201000000744 recessive dystrophic epidermolysis bullosa Diseases 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 239000012266 salt solution Substances 0.000 description 1
- 230000037387 scars Effects 0.000 description 1
- 238000006748 scratching Methods 0.000 description 1
- 230000002393 scratching effect Effects 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- RMAQACBXLXPBSY-UHFFFAOYSA-N silicic acid Chemical compound O[Si](O)(O)O RMAQACBXLXPBSY-UHFFFAOYSA-N 0.000 description 1
- 235000012239 silicon dioxide Nutrition 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- WXMKPNITSTVMEF-UHFFFAOYSA-M sodium benzoate Chemical compound [Na+].[O-]C(=O)C1=CC=CC=C1 WXMKPNITSTVMEF-UHFFFAOYSA-M 0.000 description 1
- 239000004299 sodium benzoate Substances 0.000 description 1
- 235000010234 sodium benzoate Nutrition 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 229920003109 sodium starch glycolate Polymers 0.000 description 1
- 229940079832 sodium starch glycolate Drugs 0.000 description 1
- 239000008109 sodium starch glycolate Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 229940032147 starch Drugs 0.000 description 1
- SFVFIFLLYFPGHH-UHFFFAOYSA-M stearalkonium chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CC1=CC=CC=C1 SFVFIFLLYFPGHH-UHFFFAOYSA-M 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 229910052712 strontium Inorganic materials 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000516 sunscreening agent Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/763—Herpes virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/1703—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- A61K38/1709—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- A61K38/1748—Keratin; Cytokeratin
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/39—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/44—Oxidoreductases (1)
- A61K38/443—Oxidoreductases (1) acting on CH-OH groups as donors, e.g. glucose oxidase, lactate dehydrogenase (1.1)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0014—Skin, i.e. galenical aspects of topical compositions
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/02—Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/04—Antipruritics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/16—Emollients or protectives, e.g. against radiation
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/78—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/30—Macromolecular organic or inorganic compounds, e.g. inorganic polyphosphates
- A61K47/36—Polysaccharides; Derivatives thereof, e.g. gums, starch, alginate, dextrin, hyaluronic acid, chitosan, inulin, agar or pectin
- A61K47/38—Cellulose; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/06—Ointments; Bases therefor; Other semi-solid forms, e.g. creams, sticks, gels
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16641—Use of virus, viral particle or viral elements as a vector
- C12N2710/16643—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/11—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
- C12Y114/11004—Procollagen-lysine 5-dioxygenase (1.14.11.4), i.e. lysine-hydroxylase
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Epidemiology (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Dermatology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Virology (AREA)
- Toxicology (AREA)
- Biophysics (AREA)
- Marine Sciences & Fisheries (AREA)
- Mycology (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 개시내용은, 부분적으로는, 대상체에서 콜라겐 알파-1(VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충하는데 적합한 하나 이상의 폴리뉴클레오타이드를 포함하는 약제학적 조성물에 관한 것이다. 또한, 본 개시내용은, 부분적으로는, 수포성 표피박리증의 하나 이상의 증상을 갖고 있거나 이의 발병 위험이 있는 대상체를 비롯한 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하기 위한 약제학적 조성물 및 이의 사용 방법에 관한 것이다.
Description
관련 출원에 대한 상호 참조
본 출원은 미국 가출원 일련번호 62/320,316(출원일: 2016년 4월 8일)의 우선권의 이익을 주장하며, 이 기초출원은 그의 전문이 참고로 본 명세서에 편입된다.
ASCII 텍스트 파일에 대한 서열목록의 제출
ASCII 텍스트 파일에 대한 이하의 제출의 내용은 이의 전문이 참고로 본 명세서에 편입된다: 서열목록(파일명: 761342000140SEQLIST.txt, 기록일: 2016년 12월 28일, 크기: 394 KB)의 컴퓨터 판독 가능한 형태(CRF).
본 발명의 기술분야
본 발명은, 부분적으로는, 수포성 표피박리증의 하나 이상의 증상을 갖고 있거나 이의 발병 위험이 있는 대상체를 비롯한 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하기 위한 약제학적 조성물 및 이의 사용 방법에 관한 것이다.
많은 심각한 질환-관련 피부 병태는 이러한 질환을 앓고 있는 환자에서 하나 이상의 유전자 장애와 연관된다. 하나의 이러한 질환인, 수포성 표피박리증(epidermolysis bullosa: EB)은, 병에 걸린 개체의 피부 및 점막에 긁힘, 러빙(rubbing) 또는 할큄 등과 같은 미소한 손상 또는 마찰에 반응하여 물집이 생기게 하거나 짓무름을 생기게 하는 일군의 유전자 장애이다. 이영양성 수포성 표피박리증(dystrophic epidermolysis bullosa: DEB)은 EB의 주된 형태 중 하나이다. 이 병태의 증상 및 징후는, 영향을 받은 개체에서, 경미한 것(물집이 손, 발, 무릎 및 팔꿈치에만 영향을 미칠 수 있음)에서부터 중증의 것(광범위한 물집 및 반흔, 가능하게는 시력 상실, 미관손상, 및 기타 심각하고 때로는 치명적인 의학적 병태까지 초래함)에 이르는 매우 광범위하다.
이영양성 수포성 표피박리증은 3가지 주된 유형으로 분류된다. 상염색체 우선 이영양성 수포성 표피박리증(우선 이영양성 수포성 표피박리증(dominant dystrophic epidermolysis bullosa) 또는 DDEB라 지칭됨)은 전형적으로 가장 경미한 형태이며, 이것은 물집이 흔히 손, 발, 무릎 및 팔꿈치로 제한된다. 이영양성 수포성 표피박리증, 알로프-지멘스 유형(Hallopeau-Siemens type) 퇴행적 이영양성 수포성 표피박리증, 및 비-알로프-지멘스 유형(non-Hallopeau-Siemens type) 퇴행적 수포성 표피박리증(일괄적으로 퇴행적 이영양성 수포성 표피박리증(recessive dystrophic epidermolysis bullosa) 또는 RDEB라 지칭됨)의 나머지 두 유형은 더욱 중증이다. RDEB는 대부분 피부 및 점막의 확대된 물집 및 반흔을 특징으로 한다. 물집은 점막(예컨대, 구강 및 소화관의 내벽) 위를 비롯하여 전신에 걸쳐 통상적으로 존재하며, 이러한 물집의 치유는 광범위한 반흔을 초래한다. 구강 및 식도가 손상되면, 음식을 씹거나 삼기는 것이 곤란해져서, 만성 영양실조 및 느린 성장을 초래한다. 광범위한 반흔으로부터의 합병증은 손가락과 발가락의 융합, 관절의 기형 및 시력 상실로 이어지는 눈의 염증을 포함할 수 있다. 또한, RDEB를 앓고 있는 환자는 편평 세포 암종의 발병 위험이 높으며, 이러한 암종은 이 환자 모집단에서 특이하게 공격적일 수 있어, 종종 생명을 위협하게 된다. 3가지의 유형의 이영양성 수포성 표피박리증은 중증도가 상이하지만, 이들은 많은 공통된 특징을 갖고, 동일한 유전자 돌연변이에 의해 유발된다.
이영양성 수포성 표피박리증은, 콜라겐 알파-1 (VII) 사슬 단백질(콜라겐 7)을 암호화하는, Col7a1 유전자에 돌연변이에 의해 초래된다. 이 유전자에 대해서 240개 이상의 별개의 돌연변이가 DEB 환자에서 확인, 즉, 동정되었다. 부가적으로, 라이실 하이드록실라제 3 효소(LH3)를 변형시키는 콜라겐을 암호화하는 PLOD3 유전자의 발현의 상당한 감소가 또한 이영양성 표피박리증 환자에세 관찰되었다. 콜라겐 알파-1 (VII) 사슬 단백질은 피부를 강화시키고 안정화시키는 기능을 하는 한편, 라이실 하이드록실라제 3은 기능성 콜라겐 알파-1 (VII) 사슬 단백질의 합성 및 분비에서 중요한 역할을 한다. 간략하게는, Col7a1 전사물은 번역되고, 얻어진 펩타이드가 이들의 프롤린 잔기를 (프롤릴 하이드록실라제에 의해) 그리고 이들의 라이신 잔기를 (라이실 하이드록실라제, 예컨대, LH3에 의해) 하이드록실화함으로써 번역후 변형된다. 그 후, 하이드록시라이신 잔기는 글리코실화될 수 있고, 이어서 3개의 글리코실화 펩타이드가 프로-콜라겐으로 알려진 삼중 나선을 형성하고, 세포에 분비된다. 분비된 프로-콜라겐은 이어서 고차 구조로 연합되어 고정 원섬유(anchoring fibril)를 형성할 수 있다. 그 후, 고정 원섬유는 상피 기저막의 부착에서 조직화, 안정화 및 원조에 도움을 주도록 이용 가능하다. 상피 기저막은 기저의 소성 결합 조직에 상피를 고정시키는 것을 담당하고, 표피-진피 안정성(표피진피경계 온전성(dermoepidermal junction integrity))을 위하여 필수적이다. Col7a1 유전자에서의 돌연변이, 그리고 PLOD3 발현의 감소된 수준은, 이영양성 수포성 표피박리증 환자의 진피에 상비를 적절하게 결합시키는 콜라겐 알파-1 (VII) 사슬 단백질의 능력을 손상시켜, 손상되기 쉬운 피부를 초래한다.
수포성 표피박리증 환자에 대한 치료 옵션은 제한되고, 현재의 관심사는 통증과 가려움증을 통제하기 위한 약물을 제공하는 것, 피부 및 점막 상의 개방 상처에 기인하는 감염을 모면하기 위하여 경구 항생제를 투여하는 것, 그리고 반흔 및 기형에 대처하기 위한 수술적 전략을 비롯하여, 질환의 증상을 관리하는데 초점을 맞추고 있다. 수포성 표피박리증의 근본적인 원인을 치료하기 위한 연구 방법은 정제된 콜라겐 7, 콜라겐 7을 함유하는 섬유모세포, 또는 콜라겐 7을 암호화하는 바이러스 벡터를 피부내 주사에 의해 투여하는 것을 포함한다. 많은 DEB 환자는 외상이 발생하기 쉬운 부위(예컨대, 천골, 둔부, 발, 허리 및 손)의 커다란 영역에 걸쳐 다수의 상처를 지니기 때문에, 피부내 주입을 포함하는 많은 치료가 극히 침습적이어서, 이들 커다란 상처 영역이 모두 아마도 반복적으로 주사되어야 필요가 있지만, 주사 시간 간격은 불명확하다.
따라서, 이 환자 모집단에서 관찰된, 콜라겐 알파-1 (VII) 사슬 단백질에서의 결손뿐만 아니라 라이실 하이드록실라제 3 단백질에서의 결손에 대처할 수 있는 수포성 표피박리증 환자에 대한 덜 침습적/최소 침습적/비침습적 치료 옵션에 대한 명백한 요구가 존재한다.
특허 출원, 특허 공보, 비특허 문헌 및 UniProtKB/Swiss-Prot 수탁 번호를 비롯하여 본 명세서에서 인용된 모든 참고 문헌은, 마치 각각의 개별적인 참고 문헌이 구체적으로 개별적으로 참고로 원용되도록 나타낸 것처럼 이들의 전문이 본 명세서에 참고로 편입된다.
이들 요구를 충족시키기 위하여, 본 개시내용은, 부분적으로는, 대상체에서, 특히, 수포성 표피박리증의 하나 이상의 증상을 지니거나 또는 이의 발병 위험이 있는 대상체에서 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하기 위한 약제학적 조성물 및 사용 방법에 관한 것이다. 특히, 본 개시내용은, 부분적으로는, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 약제학적 조성물을 투여(예컨대, 국소 또는 경피 투여)함으로써 개체를 치료하는 방법에 관한 것이다.
따라서, 본 개시내용의 소정의 양상은 벡터를 포함하는 바이러스를 포함하는 약제학적 조성물에 관한 것으로, 여기서 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 또는 이들의 키메라 폴리펩타이드를 암호화하는 1개 이상의 전이유전자(transgene), 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에 있어서, 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 단순 포진 바이러스(HSV)이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 변형된 외피를 포함한다. 몇몇 실시형태에 있어서, 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시킨다. 몇몇 실시형태에 있어서, 변형된 외피는 돌연변이 단순 포진 바이러스 당단백질을 포함한다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘(Sleeping Beauty hybrid amplicon)이다. 몇몇 실시형태에 있어서, 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합하다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 miRNA 결합 부위를 포함한다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 하나 이상의 이종 촉진자에 작동 가능하게 연결된다. 몇몇 실시형태에 있어서, 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물 중 하나 이상이다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 벡터는 다시스트론성(polycistronic)인 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(open reading frame: ORF) 상에서 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1 및 제2 ORF는 내부 리보솜 유입 부위(internal ribosomal entry site: IRES)에 의해 분리된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 약 등몰비로 있다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대, 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드와 라이실 하이드록실라제 3 폴리펩타이드 사이에 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다.
본 개시내용의 다른 양상은 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는 방법에 관한 것으로, 상기 방법은 대상체의 하나 이상의 세포에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 약제학적 조성물을 국소 또는 경피 투여하는 단계를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하는 바이러스를 포함하되, 여기서 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에 있어서, 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 단순 포진 바이러스(HSV)이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 변형된 외피를 포함한다. 몇몇 실시형태에 있어서, 상기 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시킨다. 몇몇 실시형태에 있어서, 변형된 외피는 돌연변이 단순 포진 바이러스 당단백질을 포함한다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합하다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 miRNA 결합 부위를 포함한다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 하나 이상의 이종 촉진자에 작동 가능하게 연결된다. 몇몇 실시형태에 있어서, 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물 중 하나 이상이다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 벡터는 다시스트론성인 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1 및 제2 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 약 등몰비로 있다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대, 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드와 라이실 하이드록실라제 3 폴리펩타이드 사이에 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 대상체의 하나 이상의 환부 영역 또는 비환부 영역에 투여된다. 몇몇 실시형태에 있어서, 피부의 질환 또는 장애는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군(nethertons syndrome), 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창 중 하나 이상이다.
본 개시내용의 다른 양상은 단리된 키메라 폴리펩타이드(여기서 단리된 키메라 폴리펩타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및 링커 폴리펩타이드를 포함하되, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 링커 폴리펩타이드에 의해 분리됨), 이를 암호화하는 폴리뉴클레오타이드, 상기 폴리뉴클레오타이드를 포함하는 벡터, 및 상기 벡터를 포함하는 숙주 세포에 관한 것이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 폴리뉴클레오타이드를 포함한다.
본 개시내용의 다른 양상은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 또는 이들의 임의의 조합을 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 벡터(여기서 벡터는 재조합 단순 포진 바이러스 게놈임), 및 벡터를 포함하는 숙주 세포에 관한 것이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다.
본 개시내용의 다른 양상은 단순 포진 바이러스를 수집하는 방법에 관한 것으로, 관심 대상 벡터는 상기 단순 포진 바이러스 내에 패키징되어 있다. 몇몇 실시형태에 있어서, 상기 방법은 숙주 세포를 헬퍼 바이러스를 암호화하는 벡터와 접촉시키는 단계, 상기 숙주 세포를 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘과 접촉시키는 단계, 및 상기 숙주 세포에 의해 생성된 단순 포진 바이러스 유전자를 수집하는 단계를 포함한다. 몇몇 실시형태에 있어서, 상기 방법은 상보성 숙주 세포를 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 재조합 단순 포진 바이러스 게놈 벡터와 접촉시키는 단계, 및 상기 상보성 숙주 세포에 의해 생성된 단순 포진 바이러스 유전자를 수집하는 단계를 포함한다. 몇몇 실시형태에 있어서, 수집된 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다.
본 개시내용의 다른 양상은 본 명세서에 기재된 약제학적 조성물 및 약제학적 조성물을 투여하기 위한 설명서를 포함하는 키트에 관한 것이다.
본 개시내용의 다른 양상은 벡터를 포함하는 바이러스를 포함하는 약제학적 조성물에 관한 것으로, 여기서 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에 있어서, 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 단순 포진 바이러스(HSV)이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 경피 또는 피부내 투여에 적합하다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 miRNA 결합 부위를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서,라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 서열번호 30의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 30의 적어도 100개 연속 아미노산이다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자 및 제2 전이유전자는 각각 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자, 제2 전이유전자 및 제3 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다.
본 개시내용의 다른 양상은 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는 방법에 관한 것으로, 상기 방법은 벡터를 포함하는 약제학적 조성물을 대상체에게 투여하는 단계를 포함하되, 벡터는 재조합 단순 포진 바이러스 게놈이고, 약제학적 조성물은 대상체의 하나 이상의 세포에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능하다. 몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하는 바이러스를 포함하되, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에 있어서, 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 단순 포진 바이러스(HSV)이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 경피 또는 피부내 투여에 적합하다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 miRNA 결합 부위를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 서열번호 30의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 30의 적어도 100개 연속 아미노산이다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자 및 제2 전이유전자는 각각 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자, 제2 전이유전자 및 제3 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 대상체에게 국소 또는 경피 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 대상체에게 경피 또는 피부내 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 대상체의 하나 이상의 환부 영역 또는 비환부 영역에 투여된다. 몇몇 실시형태에 있어서, 피부의 질환 또는 장애는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군, 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창 중 하나 이상이다.
도 1a 내지 도 1f는 야생형 및 변형된 단순 포진 바이러스 게놈의 개략도를 도시한다. 도 1a는 야생형 단순 포진 바이러스 게놈을 도시한다. 도 1b는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 1c는 2개의 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시하되, 전이유전자 중 하나는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고 다른 하나는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 전이유전자는 DNA의 동일 가닥 상에서 암호화된다. 도 1d는 2개의 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시하되, 전이유전자 중 하나는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고 다른 하나는 라이실 하이드록실라제 3 폴리펩타이드암호화하며, 전이유전자는 안티센스 배향에서 DNA의 대향하는 가닥 상에서 암호화된다. 도 1e는 내부 리보솜 유입 부위(IRES)에 의해 분리된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 다시스트론성인 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 1f는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시한다.
도 2a 내지 도 2g는 야생형 및 변형된 단순 포진 바이러스 게놈의 추가적인 개략도를 도시한다. 도 2a는 야생형 단순 포진 바이러스 게놈을 도시한다. 도 2b는 ICP4(둘 다 복제), ICP27 및 UL55의 암호화 서열의 결실과, ICP22 및 ICP47의 촉진자 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2c는 ICP4(둘 다 복제) 및 ICP22의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2d는 ICP0 및 ICP4(둘 다 복제)의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2e는 ICP0, ICP4(둘 다 복제), 및 ICP22의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2f는 ICP0, ICP4(둘 다 복제), ICP22, 및 ICP27의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2g는 ICP0, ICP4 (둘 다 복제), ICP22, ICP27, 및 UL55의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다.
도 3은 인간 콜라겐 7 (COL7A1) 발현 카세트를 보유하는 복제-결함성 제1형 단순 포진 바이러스(HSV-1)인 "KB103"의 개략도를 도시한다.
도 4A 내지 도 4B는 KB103-감염된 RDEB 인간 피부 각질세포(도 4A) 및 RDEB 인간 피부 섬유모세포(도 4B)로부터의 COL7 전사 수준의 용량-의존적 증가를 도시한다. 전사물은 β-액틴 수준에 대해서 정량화되고 비감염 세포에서의 발현에 대해서 정규화되었다.
도 5A 내지 도 5B는 KB103-감염된 세포에서 검출된 인간 Col7 단백질 발현을 도시한다. 도 5A는 표시된 감염다중도(multiplicity of infection: MOI)에서 KB103에 감염된 섬유모세포뿐만 아니라, 비감염 정상 및 RDEB 섬유모세포에서의 인간 Col7 단백질 발현을 도시한다. 도 5B는 표시된 감염다중도(MOI)에서 KB103에 감염된 각질세포뿐만 아니라, 비감염 정상 및 RDEB 각질세포에서의 인간 Col7 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군(loading control)으로서 도시되어 있다.
도 6은 면역형광법에 의해 평가된 바와 같은, 비감염(대조군) 또는 KB103 감염된 (C7, MOI 3) RDEB 인간 피부 섬유모세포(EB HDF), 정상 인간 피부 각질세포(정상 HDK), 및 RDEB 인간 피부 각질세포(RDEB HDK)에서의 인간 COL7A1 단백질 발현을 도시한다.
도 7은 표시된 MOI에서 KB103으로 감염된 각질세포뿐만 아니라, 비감염 정상 및 RDEB 인간 피부 각질세포에서의 인간 Col7 및 LH3 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군으로서 도시되어 있다.
도 8은 표시된 MOI에서 KB103으로 감염된 섬유모세포뿐만 아니라, 비감염 정상 및 RDEB 인간 피부 섬유모세포에서의 인간 TSP-1 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군으로서 도시되어 있다.
도 9A 내지 도 9B는 표시된 래트 꼬리 콜라겐 1(도 9A) 및 인간 파이브로넥틴(도 9B)의 농도 증가에 따라 처리된 웰에 대한, 표시된 MOI에서 KB103으로 감염된 각질세포 및 비감염 (대조군) RDEB 인간 피부 각질세포의 세포 부착을 도시한다.
도 10은 면역형광법에 의해 KB103 감염된 피부-등가 기관형 배양(organotypic culture)에서 기저막 구역(basement membrane zone: BMZ)에서의 Col7 침착(deposition)을 도시한다.
도 11은 KB103-감염된 마우스로부터 단리된 조직에서의 인간 Col7 전사 수준 및 바이러스 게놈 복제수의 정량화를 도시한다.
도 12는 기저막 구역(BMZ)에서 인간 Col7 침착의 개시를 비롯하여, 면역형광법에 의한 KB103-감염된 마우스로부터의 진피 조직에서의 인간 Col7 단백질 발현을 도시한다.
도 2a 내지 도 2g는 야생형 및 변형된 단순 포진 바이러스 게놈의 추가적인 개략도를 도시한다. 도 2a는 야생형 단순 포진 바이러스 게놈을 도시한다. 도 2b는 ICP4(둘 다 복제), ICP27 및 UL55의 암호화 서열의 결실과, ICP22 및 ICP47의 촉진자 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2c는 ICP4(둘 다 복제) 및 ICP22의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2d는 ICP0 및 ICP4(둘 다 복제)의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2e는 ICP0, ICP4(둘 다 복제), 및 ICP22의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2f는 ICP0, ICP4(둘 다 복제), ICP22, 및 ICP27의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2g는 ICP0, ICP4 (둘 다 복제), ICP22, ICP27, 및 UL55의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다.
도 3은 인간 콜라겐 7 (COL7A1) 발현 카세트를 보유하는 복제-결함성 제1형 단순 포진 바이러스(HSV-1)인 "KB103"의 개략도를 도시한다.
도 4A 내지 도 4B는 KB103-감염된 RDEB 인간 피부 각질세포(도 4A) 및 RDEB 인간 피부 섬유모세포(도 4B)로부터의 COL7 전사 수준의 용량-의존적 증가를 도시한다. 전사물은 β-액틴 수준에 대해서 정량화되고 비감염 세포에서의 발현에 대해서 정규화되었다.
도 5A 내지 도 5B는 KB103-감염된 세포에서 검출된 인간 Col7 단백질 발현을 도시한다. 도 5A는 표시된 감염다중도(multiplicity of infection: MOI)에서 KB103에 감염된 섬유모세포뿐만 아니라, 비감염 정상 및 RDEB 섬유모세포에서의 인간 Col7 단백질 발현을 도시한다. 도 5B는 표시된 감염다중도(MOI)에서 KB103에 감염된 각질세포뿐만 아니라, 비감염 정상 및 RDEB 각질세포에서의 인간 Col7 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군(loading control)으로서 도시되어 있다.
도 6은 면역형광법에 의해 평가된 바와 같은, 비감염(대조군) 또는 KB103 감염된 (C7, MOI 3) RDEB 인간 피부 섬유모세포(EB HDF), 정상 인간 피부 각질세포(정상 HDK), 및 RDEB 인간 피부 각질세포(RDEB HDK)에서의 인간 COL7A1 단백질 발현을 도시한다.
도 7은 표시된 MOI에서 KB103으로 감염된 각질세포뿐만 아니라, 비감염 정상 및 RDEB 인간 피부 각질세포에서의 인간 Col7 및 LH3 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군으로서 도시되어 있다.
도 8은 표시된 MOI에서 KB103으로 감염된 섬유모세포뿐만 아니라, 비감염 정상 및 RDEB 인간 피부 섬유모세포에서의 인간 TSP-1 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군으로서 도시되어 있다.
도 9A 내지 도 9B는 표시된 래트 꼬리 콜라겐 1(도 9A) 및 인간 파이브로넥틴(도 9B)의 농도 증가에 따라 처리된 웰에 대한, 표시된 MOI에서 KB103으로 감염된 각질세포 및 비감염 (대조군) RDEB 인간 피부 각질세포의 세포 부착을 도시한다.
도 10은 면역형광법에 의해 KB103 감염된 피부-등가 기관형 배양(organotypic culture)에서 기저막 구역(basement membrane zone: BMZ)에서의 Col7 침착(deposition)을 도시한다.
도 11은 KB103-감염된 마우스로부터 단리된 조직에서의 인간 Col7 전사 수준 및 바이러스 게놈 복제수의 정량화를 도시한다.
도 12는 기저막 구역(BMZ)에서 인간 Col7 침착의 개시를 비롯하여, 면역형광법에 의한 KB103-감염된 마우스로부터의 진피 조직에서의 인간 Col7 단백질 발현을 도시한다.
본 개시내용은, 부분적으로는, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 약제학적 조성물에 관한 것이다. 몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하되, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 대상체의 하나 이상의 세포에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충하는데 적합한 하나 이상의 전이유전자를 포함한다. 본 개시내용은 또한, 부분적으로는, 본 명세서에 기재된 약제학적 조성물을 투여(예컨대, 국소 또는 경피 투여)함으로써 대상체에서 피부의 상처, 장애 또는 질환(예컨대, 이영양성 수포성 표피박리증)의 예방적, 일시적 또는 치료적 완화를 제공하는 방법에 관한 것이다.
이하의 설명은 예시적인 방법, 파라미터 등을 기술한다. 이러한 설명은 본 개시내용의 범위에 대한 제한으로서 의도된 것이 아니라 대신에 예시적인 실시형태의 설명으로서 제공되는 것임이 인식되어야 한다.
일반적 수법
본 명세서에 기재된 또는 인용된 수법 및 절차는 일반적으로 잘 이해되며, 당업자에게 공지된 통상의 방법, 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual 3d edition (2001) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; Current Protocols in Molecular Biology (F.M. Ausubel, et al. eds., (2003)); the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988); Oligonucleotide Synthesis (M.J. Gait, ed., 1984); Methods in Molecular Biology, Humana Press; Cell Biology: A Laboratory Notebook (J.E. Cellis, ed., 1998) Academic Press; Animal Cell Culture (R.I. Freshney), ed., 1987); Introduction to Cell and Tissue Culture (J.P. Mather and P.E. Roberts, 1998) Plenum Press; Cell and Tissue Culture: Laboratory Procedures (A. Doyle, J.B. Griffiths, and D.G. Newell, eds., 1993-8) J. Wiley and Sons; Gene Transfer Vectors for Mammalian Cells (J.M. Miller and M.P. Calos, eds., 1987); PCR : The Polymerase Chain Reaction, (Mullis et al., eds., 1994); Short Protocols in Molecular Biology (Wiley and Sons, 1999)]에 기재된 광범위하게 이용되는 방법을 이용해서 통상적으로 이용된다.
정의
본 발명을 상세히 설명하기 전에, 본 발명은, 물론 다양할 수 있는 특정 조성물 또는 생물학적 시스템으로 한정되지 않는 것이 이해되어야 한다. 또한, 본 명세서에서 사용되는 용어는 특정 실시형태를 오로지 설명할 목적이며 제한으로 의도되지 않는 것이 이해되어야 한다.
본 명세서에서 이용되는 바와 같이, 단수 형태는 문맥이 달리 명확하게 지칭하지 않는 한 복수의 지시 대상을 포함한다. 따라서, 예를 들어, "분자"라는 언급은 선택적으로 이러한 분자의 2개 이상의 조합을 포함한다.
본 명세서에서 이용되는 바와 같이, 용어 "약"은 당해 기술 분야에서의 당업자에게 용이하게 공지된 각각의 값에 대한 통상의 오차 범위를 지칭한다. 본 명세서에서 값 또는 파라미터의 "약"으로의 언급은 그 값 또는 파라미터 자체를 지칭하는 실시형태를 포함한다(그리고 기술한다).
본 명세서에서 이용되는 바와 같이, 용어 "폴리뉴클레오타이드", "핵산 서열", "핵산", 및 이들의 변형어는 폴리데옥시리보뉴클레오타이드(2-데옥시-D-리보스를 함유), 폴리리보뉴클레오타이드(D-리보스를 함유), 퓨린 또는 피미리딘 염기의 N-글리코사이드인 폴리뉴클레오타이드의 임의의 다른 유형, 및 비-뉴클레오타이드 골격을 함유하는 기타 중합체에 대한 총칭일 것이며, 단 중합체는, DNA 및 RNA에서 발견되는 바와 같이, 염기 짝?기 및 염기 스태킹(stacking)을 허용하는 입체형태의 핵염기를 함유한다. 따라서, 이들 용어는 공지된 유형의 핵산 서열 변형, 예를 들어, 유사체 및 인터-뉴클레오타이드 변형과 함께 천연형 뉴클레오타이드들 중의 하나 이상의 뉴클레오타이드의 치환을 포함한다.
본 명세서에서 이용되는 바와 같이, 핵산은 다른 핵산 서열과의 기능적 관계에 놓일 때 "작동 가능하게 연결된" 또는 "작동적으로 연결된"다. 예를 들어, 촉진자 또는 증강자(enhancer)는 서열의 전사에 영향을 미칠 경우 암호화 서열에 작동 가능하게 연결되거나; 또는 리보솜 결합 부위는 번역을 용이하게 하기 위하여 위치될 경우 암호화 서열에 작동 가능하게 연결된다. 일반적으로, "작동 가능하게 연결된"은 연결 중인 DNA 서열이 인접해 있는 것을 의미한다.
본 명세서에서 이용되는 바와 같이, 용어 "벡터"는 이종 핵산을 그의 발현 또는 복제를 위하여 세포에 도입하는데 사용되는 별도의 요소를 지칭한다. 발현 벡터는 이러한 핵산의 발현을 수행할 수 있게 하는, 조절 서열, 예컨대, 촉진자 영역과 작동 가능하게 연결된 핵산을 발현 가능한 벡터를 포함한다. 따라서, 발현 벡터는, DNA 또는 RNA 작제물, 예컨대, 플라스미드, 파지, 재조합 바이러스 또는 기타 벡터를 지칭할 수 있으며, 이들은 적절한 숙주 세포에 도입 시, 핵산의 발현을 유발한다. 적절한 발현 벡터는 당업자에게 잘 알려져 있고, 진핵생물 세포로 복제 가능한 것들 및 에피솜인 채로 있는 것들 또는 숙주 세포 게놈에 통합되는 것들을 포함한다.
본 명세서에서 이용되는 바와 같이, "개방형 해독틀" 또는 "ORF"은, 단백질 또는 폴리펩타이드를 암호화하는, 핵산인 DNA 또는 RNA 중 하나의 연속 스트레치를 지칭한다. 전형적으로, 핵산은, 예컨대, ATG 또는 AUG, 및 종결 코돈과 같은 번역 시작 신호 또는 개시 코돈을 포함한다.
본 명세서에서 이용되는 바와 같이, "내부 리보솜 유입 부위" 또는 "IRES"는 중도에서, 예를 들어, mRNA 서열의 제1 개시 코돈 후에 번역 개시를 허용하는 뉴클레오타이드 서열을 지칭한다.
본 명세서에서 이용되는 바와 같이, "비번역(untranslated) 영역" 또는 "UTR"은 개방형 해독틀의 5' 및/또는 3' 말단에서 비번역된 핵산을 지칭한다. 폴리뉴클레오타이드에서 하나 이상의 UTR의 내포는 전사후 조절, mRNA 안정성, 및/또는 폴리뉴클레오타이드의 번역에 영향을 미칠 수 있다.
본 명세서에서 이용되는 바와 같이, 용어 "전이유전자"는 세포 내로 도입된 후에 RNA로 전사되고 적절한 조건 하에 번역 및/또는 발현되는 폴리뉴클레오타이드를 지칭한다. 몇몇 양상에 있어서, 도입되는 세포에 목적하는 특성을 부여하거나 또는 다르게는 목적하는 치료 또는 진단 성과를 초래한다.
본 명세서에서 이용되는 바와 같이, 용어 "폴리펩타이드," "단백질" 및 "펩타이드"는 호환 가능하게 사용되며 2개 이상의 아미노산의 중합체를 지칭할 수 있다.
본 명세서에서 이용되는 바와 같이, "대상체", "숙주" 또는 "개체"는 인간을 비롯한 포유동물, 가축 및 농장 동물, 및 동물원, 스포츠 또는 애완 동물, 예컨대, 개, 말, 고양이, 소뿐만 아니라, 마우스 및 래트 등과 같은 연구에 이용되는 동물로서 분류되는 임의의 동물을 지칭한다. 몇몇 실시형태에 있어서, 포유류는 인간이다.
본 명세서에서 이용되는 바와 같이, "국소 투여" 또는 "국소적으로 투여하는"은, 직접 또는 다르게는 대상체의 피부의 전부 또는 일부에 조성물을 포함하는 제형을 접촉시킴으로써 대상체에 대한 조성물의 전달을 지칭한다. 이 용어는, 국소 및 경피를 포함하지만, 이들로 제한되는 것은 아닌 여러 투여 경로를 포함한다. 국소 투여는 대상체의 표피 또는 진피에 또는 이의 특정 층에 조성물을 전달하는 수단으로서 사용된다.
본 명세서에서 이용되는 바와 같이, "유효량"은 적어도 특정 장애의 하나 이상의 증상의 측정 가능한 개선 또는 예방을 시행하는데 필요한 최소량이다. 유효량은 또한 치료의 임의의 독성 또는 유해 효과가 치료적으로 유익한 효과에 의해 능가되는 것이다. 예방적 이용을 위하여, 유리한 또는 바람직한 결과는 질환, 이의 합병증 및 질환의 발병 동안 제시되는 중간의 병리적 표현형의 위험을 제거 또는 감소, 이의 중증도를 약화, 또는 이의 발병을 지연시키는 것과 같은 결과를 포함한다. 치료적 이용을 위하여, 유리한 또는 바람직한 결과는 질환으로부터 기인되는 하나 이상의 증상의 감소, 질환을 앓고 있는 자의 삶의 질의 증가, 질환의 진행의 지연, 및/또는 생존율 연장과 같은 임상 결과를 포함한다. 유효량은 1회 이상의 투여로 투여될 수 있다.
약제학적 조성물
폴리뉴클레오타이드
일 양상에 있어서, 본 명세서에서는, 콜라겐 알파-1 (VII) 사슬(Col7) 폴리펩타이드, 라이실 하이드록실라제 3 (LH3) 폴리펩타이드, 케라틴 유형 I 세포골격 17 (KRT17) 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 약제학적 조성물이 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 키메라 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 라이실 하이드록실라제 3 폴리펩타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하되, 여기서 벡터는 본 명세서에 기재된 폴리뉴클레오타이드를 포함하는 하나 이상의 전이유전자를 암호화한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하되, 여기서 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 하나 이상의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 코라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다.
몇몇 실시형태에 있어서, 약제학적 조성물은 합성 RNA를 포함하되, 여기서 합성 RNA는 본 명세서에 기재된 폴리뉴클레오타이드를 포함하는 하나 이상의 전이유전자를 암호화한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 합성 RNA를 포함하되, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다.
콜라겐 알파-1 (VII) 사슬
몇몇 양상에 있어서, 본 개시내용의 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 1이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 1의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드는 서열번호 1의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 또는 적어도 350, 적어도 500, 적어도 1000, 적어도 2500, 적어도 5000, 적어도 7500개, 그러나 8835개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 2의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 2의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 본 개시내용은 호모 사피엔스(H. sapiens) 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 동족체인 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 관한 것이다. 관심 대상 폴리펩타이드의 동족체인 폴리펩타이드를 식별하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 2의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 2의 적어도 10, 적어도 12, 적어도 14, 적어도 16, 적어도 18, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 75, 적어도 100, 적어도 250, 적어도 500, 적어도 750, 적어도 1000, 적어도 1500, 적어도 2000, 또는 적어도 2500개, 그러나 2944개 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대상체의 하나 이상의 표적 세포에 전달될 경우 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 대상체의 표피진피경계 온전성을 증강, 증가, 증대 및/또는 보충시킨다.
라이실
하이드록실라제
3
몇몇 양상에 있어서, 본 개시내용의 폴리뉴클레오타이드는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 3이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 3의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 라이실 하이드록실라제 3 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. 라이실 하이드록실라제 3 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드는 서열번호 3의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 500, 적어도 750, 적어도 1000, 적어도 1500, 또는 적어도 2000개, 그러나 2217개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 4의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 4의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 본 개시내용은 호모 사피엔스 라이실 하이드록실라제 3 폴리펩타이드의 동족체인 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 관한 것이다. 관심 대상 폴리펩타이드의 동족체인 폴리펩타이드를 식별하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 4의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 4의 적어도 10, 적어도 12, 적어도 14, 적어도 16, 적어도 18, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 75, 적어도 100, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 또는 적어도 700개, 그러나 738개 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대상체의 하나 이상의 표적 세포에 전달될 경우 라이실 하이드록실라제 3 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 라이실 하이드록실라제 3 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 라이실 하이드록실라제 3 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 대상체의 표피진피경계 온전성을 증강, 증가, 증대 및/또는 보충시킨다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 대상체의 동일한 세포에 전달된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 사슬 (VII) 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는, 폴리뉴클레오타이드들이 대상체의 동일한 세포에 전달될 경우 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 등몰비에서 발현시킨다.
케라틴 유형 I 세포골격 17
몇몇 양상에 있어서, 본 개시내용의 폴리뉴클레오타이드는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 29이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 29의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 케라틴 유형 I 세포골격 17 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드는 서열번호 29의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 또는 적어도 350, 적어도 500, 적어도 1000, 적어도 1250개, 그러나 1299개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 30의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 30의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 본 개시내용은 호모 사피엔스 케라틴 유형 I 세포골격 17 폴리펩타이드의 동족체인 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 관한 것이다. 관심 대상 폴리펩타이드의 동족체인 폴리펩타이드를 식별하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 30의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 30의 적어도 10, 적어도 12, 적어도 14, 적어도 16, 적어도 18, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 75, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 425개, 그러나 432개 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대상체의 하나 이상의 표적 세포에 전달될 경우 케라틴 유형 I 세포골격 17 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 케라틴 유형 I 세포골격 17 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 케라틴 유형 I 세포골격 17 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드의 발현은 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시킨다.
링커를 포함하는
키메라
폴리펩타이드
몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 더 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 절단 가능한 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 절단 가능한 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 T2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 P2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 E2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 F2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다.
몇몇 양상에 있어서, 본 개시내용의 폴리뉴클레오타이드는 링커 폴리펩타이드를 암호화한다. 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 5, 서열번호 7, 서열번호 9, 또는 서열번호 11의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 링커 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. 링커 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드는 서열번호 5, 서열번호 7, 서열번호 9, 또는 서열번호 11의 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 또는 적어도 60개, 그러나 66개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 6, 서열번호 8, 서열번호 10, 또는 서열번호 12의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드는 서열번호 6, 서열번호 8, 서열번호 10, 또는 서열번호 12의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 6, 서열번호 8, 서열번호 10, 또는 서열번호 12의 적어도 4, 적어도 6, 적어도 8, 적어도 10, 적어도 12, 적어도 14, 적어도 16, 적어도 18, 또는 적어도 20개, 그러나 22개 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 1개 이상의 퓨린 절단 부위를 암호호하는 폴리뉴클레오타이드를 더 포함한다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위를 암호화하는 폴리뉴클레오타이드는 정규(canonical) 퓨린 절단 부위(Arg-X-(Arg/Lys)-Arg)의 서열과 동일한 또는 실질적으로 유사한 아미노산 서열을 암호화한다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 T2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 T2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 P2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 P2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 E2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 E2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 F2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 F2A 링커 폴리펩타이드의 하류에서 암호화된다.
몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는, 5'에서부터 3'로, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는, 5'에서부터 3'로, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다.
콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 또는 서열번호 27의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 N-말단 절단부, C-말단 절단부, 또는 키메라 폴리펩타이드의 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 키메라 폴리펩타이드의 단편을 암호화하는 폴리뉴클레오타이드는, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 또는 서열번호 27의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 450, 적어도 500, 적어도 550, 적어도 600, 적어도 650, 적어도 700, 적어도 750, 적어도 800, 적어도 850, 적어도 900, 적어도 950, 적어도 1000, 적어도 2000, 적어도 3000, 적어도 4000, 적어도 5000, 적어도 6000, 적어도 7000, 적어도 8000, 적어도 9000, 또는 적어도 10000개, 그러나 11121개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 450, 적어도 500, 적어도 550, 적어도 600, 적어도 650, 적어도 700, 적어도 750, 적어도 800, 적어도 850, 적어도 900, 적어도 950, 적어도 1000, 적어도 1250, 적어도 1500, 적어도 1750, 적어도 2000, 적어도 2250, 적어도 2500, 적어도 2750, 적어도 3000, 적어도 3250, 또는 적어도 3500개, 그러나 3706 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대상체의 하나 이상의 표적 세포에 전달될 경우 키메라 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 하나 이상의 표적 세포에서 발현된 후에 절단된다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 하나 이상의 표적 세포에서 발현된 경우 링커 폴리펩타이드 내에서 절단된다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 2개의 폴리펩타이드로 절단되는데, 그중 하나는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함하고 다른 하나는 라이실 하이드록실라제 3 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 대상체의 하나 이상의 콜라겐 폴리펩타이드 상에 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 대상체의 표피진피경계 온전성을 증강, 증가, 증대 및/또는 보충시킨다.
본 개시내용의 폴리뉴클레오타이드는 코돈-최적화될 수 있다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 인간 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 마우스 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 래트 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 햄스터 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 개 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 효모 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 박테리아 세포에 대해서 코돈-최적화된다. 본 개시내용의 폴리뉴클레오타이드는 DNA 폴리뉴클레오타이드, RNA 폴리뉴클레오타이드, 또는 하나 이상의 DNA 폴리뉴클레오타이드와 하나 이상의 RNA 폴리뉴클레오타이드의 조합일 수 있다.
벡터
몇몇 양상에 있어서, 본 개시내용은 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 함유하는 벡터, 바람직하게는 발현 벡터에 관한 것이다. 몇몇 실시형태에 있어서, 벡터는 DNA 벡터이다. 일반적으로, 대상체에서 하나 이상의 폴리펩타이드를 생산하기 위하여 폴리뉴클레오타이드를 유지, 전파 또는 발현시키는데 적합한 벡터가 사용될 수 있다. 적합한 벡터의 예는, 플라스미드, 코스미드, 에피솜, 트랜스포존(transposon), 및 바이러스 벡터(예컨대, 아데노바이러스, 백시니아 바이러스, 신드비스 바이러스(Sindbis-viral), 홍역, 포진 바이러스, 렌티 바이러스, 레트로바이러스, 아데노-연관 바이러스 벡터 등)를 포함하지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 벡터는 숙주 세포에서 자율 복제 가능하다. 몇몇 실시형태에 있어서, 벡터는 숙주 세포에서 자율 복제 불가능하다. 몇몇 실시형태에 있어서, 벡터는 숙주 DNA 내에 통합 가능하다. 관심 대상인 하나 이상의 폴리뉴클레오타이드를 함유하는 벡터를 제조하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 벡터는 단순 포진 바이러스 벡터이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 벡터는 포진 바이러스 앰플리콘 벡터이다. 구조적 특징 및 벡터를 제조하는 방법을 비롯하여 포진 바이러스 앰플리콘 벡터는, 당업자에게 일반적으로 공지되어 있다(de Silva S. and Bowers W. "Herpes Virus Amplicon Vectors". Viruses 2009, 1, 594-629). 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 혼성 앰플리콘이다. HSV-1 혼성 앰플리콘의 예는, HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, HSV/EBV/RV 혼성 앰플리콘 및 HSV/슬리핑 뷰티 혼성 앰플리콘을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 벡터는 HSV/AAV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/EBV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/EBV/RV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는HSV/슬리핑 뷰티 혼성 앰플리콘이다.
몇몇 실시형태에 있어서, 단순 포진 바이러스 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 1개 이상의 독성 단순 포진 바이러스 유전자의 발현을 감소 또는 제거하도록 조작되었다. 재조합 단순 포진 바이러스 게놈을 조작하는 방법은 일반적으로 WO2015/009952에 기재되어 있다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 비활성화 돌연변이를 포함한다. 비활성화 돌연변이의 예는, 결실, 삽입, 점 돌연변이 및 재배열을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55 단순 포진 바이러스 유전자 중 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 또는 8개 모두에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물) 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4(하나 또는 둘 다의 복제물), ICP27, 및/또는 UL55 유전자의 비활성화 돌연변이는 ICP4(하나 또는 둘 다의 복제물), ICP27, 및/또는 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자에서의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역의 결실이다(예컨대, ICP22 및 ICP47 암호화 서열은 무손상이지만 전사 활성이다). 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP27 및 UL55 유전자의 암호화 서열의 결실과 ICP22 및 ICP47 유전자의 촉진자 영역의 결실을 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4(하나 또는 둘 다의 복제물)유전자에 비활성화 돌연변이를 포함한다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물) 및 ICP22에 비활성화 돌연변이를 포함한다. 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물), ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물), ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP0, ICP4 (하나 또는 둘 다의 복제물), ICP22, ICP27 및/또는 UL55 유전자에서의 비활성화 돌연변이는 ICP0, ICP4 (하나 또는 둘 다의 복제물), ICP22, ICP27 및/또는 UL55 유전자의 암호화 서열의 결실을 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물), ICP22, ICP27 및 UL55 유전자의 암호화 서열의 결실을 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물), ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 1, 2, 3, 4, 5, 6, 7개 또는 그 이상의 바이러스 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 적합한 바이러스 좌위의 예는, 제한 없이, ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55 단순 포진 바이러스 유전자 좌위를 포함할 수 있다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 바이러스 ICP4 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다(예컨대, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스 등). 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 바이러스 UL41 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 바이러스 ICP47 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 바이러스 ICP4 유전자 좌위 중 하나 이상 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를, 그리고 바이러스 UL41 유전자 좌위 내에 하나 이상의 폴리뉴클레오타이드를 포함한다(예컨대, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스 등).
벡터는 숙주 세포에서 폴리뉴클레오타이드의 발현에 적합한 형태로 본 개시내용의 폴리뉴클레오타이드를 포함할 수 있다. 발현 벡터는 발현될 폴리뉴클레오타이드에 작동 가능하게 연결된 하나 이상의 조절 서열을 포함할 수 있다. 용어 "조절 서열"은 촉진자, 증강자 및 기타 발현 제어 요소(예컨대, 폴리아데닐화 신호)를 포함한다. 적합한 증강자의 예는, 포유류 유전자(예컨대, 글로빈, 엘라스타제, 알부민, α-태아단백질, 인슐린 등), 및 진핵생물 세포 바이러스로부터의 증강자 서열(예컨대, 복제 원점(bp 100-270)의 마지막 측면 상의 SV40 증강자, 거대세포바이러스 조기 촉진자 증강자, 복제 원점의 마지막 측면 상의 폴리오마 증강자, 아데노바이러스 증강자 등)을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 포유류 숙주 세포에서의 전사에 적합한 촉진자의 예는, 바이러스(예컨대, 폴리오마 바이러스, 계두 바이러스, 아데노바이러스(예컨대, 아데노바이러스 2), 소 유두종 바이러스, 조류 육종 바이러스, 거대세포바이러스, 레트로바이러스, B형 간염 바이러스, 유인원(Simian) 바이러스 40(SV40) 등)의 게놈으로부터, 또는 이종 포유류 촉진자(예컨대, 액틴 촉진자, 면역글로불린 촉진자, 열-충격 촉진자 등)로부터 얻어진 촉진자를 포함할 수 있지만, 이들로 제한되는 것은 아니며, 단 이러한 촉진자는 숙주 세포와 양립 가능하다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 1종 이상의 이종 촉진자에 작동 가능하게 연결된다. 몇몇 실시형태에 있어서, 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물 중 하나 이상이다. 몇몇 실시형태에 있어서, 1종 이상의 이종 촉진자는 구성적 촉진자, 조직-특이적 촉진자, 시간 촉진자, 공간 촉진자, 유도 촉진자 및 억제 촉진자 중 1종 이상이다. 조절 서열은 조직-특이적 조절 및/또는 유도성 서열뿐만 아나리, 뉴클레오타이드 서열의 구성적 발현을 지시하는 것들을 포함할 수 있다. 발현 벡터의 설계는 본 개시내용의 폴리뉴클레오타이드와 접촉될 숙주 세포, 목적하는 단백질의 발현 수준 등과 같은 이러한 인자에 좌우될 수 있다. 본 개시내용의 발현 벡터는 숙주 세포에 도입될으로써 본 명세서에 기재된 바와 같은 폴리뉴클레오타이드에 의해 암호화된 단백질 또는 폴리펩타이드(예컨대, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드s, 케라틴 유형 I 세포골격 17 폴리펩타이드, 키메라 폴리펩타이드 등)를 생산할 수 있다.
몇몇 실시형태에 있어서, 본 개시내용의 벡터는 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 하나 이상의 전이유전자를 포함한다. 하나 이상의 전이유전자는 벡터에 임의의 배향에서 삽입될 수 있다. 벡터가 2개 이상(예컨대, 2개 이상, 3개 이상 등)의 전이유전자를 포함할 경우, 전이유전자는 서로 동일 배향 또는 대향 배향(opposite orientation)으로 삽입될 수 있다. 이론에 의해 얽매이길 원치 않지만, 안티센스 배향으로 벡터 내에 2개의 전이유전자를 편입시키는 것은 각 전이유전자의 번역초과(read-through)를 회피하여 적절한 발현을 확보하는 것을 도울 수 있다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 단일의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 각각 암호화하는 2개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 각각 암호화하는 3개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 단일의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 각각 암호화하는 2개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 각각 암호화하는 3개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 단일의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 각가가 암호화하는 2개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 각각 암호화하는 3개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 단일의 전이유전자를 포함한다.
몇몇 실시형태에 있어서, 벡터는 적어도 2개의 전이유전자(예컨대, 2개, 3개, 4개, 5개, 6개, 7개 또는 그 이상의 전이유전자)를 포함한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다.
몇몇 실시형태에 있어서, 벡터는 적어도 3개의 전이유전자(예컨대, 3, 4, 5, 6, 7개 또는 그 이상의 전이유전자)를 포함한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 적어도 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다.
몇몇 실시형태에 있어서, 벡터는 다시스트론성인 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다.
몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 제2 개방형 해독틀(ORF) 상에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1 및 제2 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1, 제2 및 제3 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
적합한 IRES의 적합한 예는 바이러스-유래 IRES(예컨대, 폴리오바이러스, 리노바이러스, 뇌척수심근염바이러스, 구제역 바이러스, C형 간염 바이러스, 고전적 돼지 콜레라 바이러스, 라우스 육종 바이러스, 인간 면역결핍 바이러스, 귀뚜라미마비병 바이러스, 카포시 육종-연관 헤르페스바이러스 등으로부터 유래된 IRES) 및 세포 mRNA-유래 IRES(예컨대, 성장 인자 mRNA로부터 유래된 IRES, 예컨대, 섬유모세포 성장 인자 2, 혈소판-유래 성장 인자 B, 및 혈관 내피 성장 인자, 전사 인자 mRNA로부터 유래된 IRES, 예컨대, 안테나페디아(antennapedia), 울트라비트로락삼, 및 NF-κB 억제 인자, 종양유전자 mRNA로부터 유래된 IRES에 의해 정제시켜, c-myc, pim-1, 및 단백질 키나제 p58PITSLRE 등)를 포함할 수 있지만, 이들로 제한되는 것은 아니다.
본 개시내용의 벡터는 추가의 암호화 및 비-암호화 서열을 더 포함할 수 있다. 추가의 암호화 및 비-암호화 서열의 예는, 추가의 폴리펩타이드 태그, 인트론, 5' 및 3' UTR 등을 암호화하는 서열을 포함할 수 있지만 이들로 제한되는 것은 아니다. 적합한 폴리펩타이드 태그의 예는, 정제 태그의 임의의 조합, 예컨대, his-태그, 플래그-태그, 말토스 결합 단백질 및 글루타티온-S-전이효소 태그, 검출 태그, 예컨대, 광학 측정법으로 검출될 수 있는 태크(예컨대, 적색 형광 단백질 등) 및 검출 가능한 효소 활성도를 갖는 태그(예컨대, 알칼리성 포스파타제 등), 분비 서열, 리더 서열, 및/또는 안정화 서열, 프로테아제 절단 부위(예컨대, 퓨린 절단 부위, TEV 절단 부위, 트롬빈 절단 부위)를 함유하는 태그 등을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 폴리뉴클레오타이드의 안정성, 국부화 및/또는 번역 효율을 증가시킨다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 하나 이상의 폴리뉴클레오타이드의 안정성, 국부화 및/또는 번역 효율을 증가시키도록 변형된다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 단백질 발현의 수준 및/또는 지속기간을 개선시킨다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 오프-타깃 전이유전자 발현을 차단 또는 저감(예컨대, 특정 세포 유형(예컨대, 신경 세포)에서, 세포 주기 내 특정 시간에, 특정 발달 단계 등에서 발현을 저해)시킬 수 있는 요소(예컨대, 1개 이상의 miRNA 결합 부위 등)를 포함한다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 특정 세포 유형에서 전이유전자 발현을 증강시킬 수 있는 요소(예컨대, 1개 이상의 miRNA 결합 부위 등)를 포함한다.
합성 RNA
폴리뉴클레오타이드
몇몇 양상에 있어서, 본 개시내용은 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 함유하는 합성 RNA, 특히 합성 mRNA에 관한 것이다. 몇몇 실시형태에 있어서, 합성 mRNA 폴리뉴클레오타이드는 5'-캡(cap) 구조를 포함한다. 5'-캡 구조의 예는, 캡-0, 캡-1, 캡-2, 및 캡-3 구조, 및 이들의 유도체를 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 합성 mRNA 폴리뉴클레오타이드는 3'-폴리(A) 테일을 포함한다. 몇몇 실시형태에 있어서, 합성 mRNA 폴리뉴클레오타이드는 합성 mRNA 폴리뉴클레오타이드 내에 함유된 1개 이상의 암호화 서열에 측접하는 1개 이상의 5' 및/또는 3' UTR을 포함한다. 몇몇 실시형태에 있어서, 5' 및/또는 3' UTR은 합성 mRNA 폴리뉴클레오타이드의 안정성, 국부화 및/또는 번역 효율을 증가시킨다. 몇몇 실시형태에 있어서, 5' 및/또는 3' UTR은 합성 mRNA 폴리뉴클레오타이드의 안정성, 국부화 및/또는 번역 효율을 증가시키도록 변형된다. 몇몇 실시형태에 있어서, 5' 및/또는 3' UTR은 단백질 발현의 수준 및/또는 지속기간을 개선시킨다. 몇몇 실시형태에 있어서, 5' 및/또는 3' UTR은 단백질 발현의 수준 및/또는 지속기간을 개선시키도록 변형된다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 오프-타깃 전이유전자 발현을 제한(예컨대, 특정 세포 유형(예컨대, 신경 세포)에서, 세포 주기 내 특정 시간에, 특정 발달 단계 등에서 발현을 저해)시킬 수 있는 요소(예컨대, 1개 이상의 miRNA 결합 부위 등)를 포함한다. 몇몇 실시형태에 있어서, 5' UTR은 Kozak 서열을 포함한다. 몇몇 실시형태에 있어서, Kozak 서열은 Kozak 연속 서열과 동일하거나 또는 실질적으로 유사하다. 관심 대상인 하나 이상의 폴리뉴클레오타이드를 함유하는 합성 mRNA 폴리뉴클레오타이드의 제조 방법은 당업자에게 잘 알려져 있다.
몇몇 양상에 있어서, 본 개시내용의 합성 mRNA 폴리뉴클레오타이드는 하나 이상의 변형된 리보뉴클레오타이드를 포함한다. 변형된 리보뉴클레오타이드의 예는, 2-티오유리딘, 5-아자유리딘, 슈도유리딘, 4-티오유리딘, 5-메틸유리딘, 5-아미노유리딘, 5-하이드록시유리딘, 5-메틸-5-아자유리딘, 5-아미노-5-아자유리딘, 5-하이드록시-5-아자유리딘, 5-메틸슈도유리딘, 5-아미노슈도유리딘, 5-하이드록시슈도유리딘, 4-티오-5-아자유리딘, 4-티오슈도유리딘, 4-티오-5-메틸유리딘, 4-티오-5-아미노유리딘, 4-티오-5-하이드록시유리딘, 4-티오-5-메틸-5-아자유리딘, 4-티오-5-아미노-5-아자유리딘, 4-티오-5-하이드록시-5-아자유리딘, 4-티오-5-메틸슈도유리딘, 4-티오-5-아미노슈도유리딘, 4-티오-5-하이드록시슈도유리딘, 2-티오사이티딘, 5-아자사이티딘, 슈도아이소사이티딘, N4-메틸사이티딘, N4-아미노사이티딘, N4-하이드록시사이티딘, 5-메틸사이티딘, 5-아미노사이티딘, 5-하이드록시사이티딘, 5-메틸-5-아자사이티딘, 5-아미노-5-아자사이티딘, 5-하이드록시-5-아자사이티딘, 5-메틸슈도아이소사이티딘, 5-아미노슈도아이소사이티딘, 5-하이드록시슈도아이소사이티딘, N4-메틸-5-아자사이티딘, N4-메틸슈도아이소사이티딘, 2-티오-5-아자사이티딘, 2-티오슈도아이소사이티딘, 2-티오-N4-메틸사이티딘, 2-티오-N4-아미노사이티딘, 2-티오-N4-하이드록시사이티딘, 2-티오-5-메틸사이티딘, 2-티오-5-아미노사이티딘, 2-티오-5-하이드록시사이티딘, 2-티오-5-메틸-5-아자사이티딘, 2-티오-5-아미노-5-아자사이티딘, 2-티오-5-하이드록시-5-아자사이티딘, 2-티오-5-메틸슈도아이소사이티딘, 2-티오-5-아미노슈도아이소사이티딘, 2-티오-5-하이드록시슈도아이소사이티딘, 2-티오-N4-메틸-5-아자사이티딘, 2-티오-N4-메틸슈도아이소사이티딘, N4-메틸-5-메틸사이티딘, N4-메틸-5-아미노사이티딘, N4-메틸-5-하이드록시사이티딘, N4-메틸-5-메틸-5-아자사이티딘, N4-메틸-5-아미노-5-아자사이티딘, N4-메틸-5-하이드록시-5-아자사이티딘, N4-메틸-5-메틸슈도아이소사이티딘, N4-메틸-5-아미노슈도아이소사이티딘, N4-메틸-5-하이드록시슈도아이소사이티딘, N4-아미노-5-아자사이티딘, N4-아미노슈도아이소사이티딘, N4-아미노-5-메틸사이티딘, N4-아미노-5-아미노사이티딘, N4-아미노-5-하이드록시사이티딘, N4-아미노-5-메틸-5-아자사이티딘, N4-아미노-5-아미노-5-아자사이티딘, N4-아미노-5-하이드록시-5-아자사이티딘, N4-아미노-5-메틸슈도아이소사이티딘, N4-아미노-5-아미노슈도아이소사이티딘, N4-아미노-5-하이드록시슈도아이소사이티딘, N4-하이드록시-5-아자사이티딘, N4-하이드록시슈도아이소사이티딘, N4-하이드록시-5-메틸사이티딘, N4-하이드록시-5-아미노사이티딘, N4-하이드록시-5-하이드록시사이티딘, N4-하이드록시-5-메틸-5-아자사이티딘, N4-하이드록시-5-아미노-5-아자사이티딘, N4-하이드록시-5-하이드록시-5-아자사이티딘, N4-하이드록시-5-메틸슈도아이소사이티딘, N4-하이드록시-5-아미노슈도아이소사이티딘, N4-하이드록시-5-하이드록시슈도아이소사이티딘, 2-티오-N4-메틸-5-메틸사이티딘, 2-티오-N4-메틸-5-아미노사이티딘, 2-티오-N4-메틸-5-하이드록시사이티딘, 2-티오-N4-메틸-5-메틸-5-아자사이티딘, 2-티오-N4-메틸-5-아미노-5-아자사이티딘, 2-티오-N4-메틸-5-하이드록시-5-아자사이티딘, 2-티오-N4-메틸-5-메틸슈도아이소사이티딘, 2-티오- N4-메틸-5-아미노슈도아이소사이티딘, 2-티오-N4-메틸-5-하이드록시슈도아이소사이티딘, 2-티오-N4-아미노-5-아자사이티딘, 2-티오-N4-아미노슈도아이소사이티딘, 2-티오-N4-아미노-5-메틸사이티딘, 2-티오-N4-아미노-5-아미노사이티딘, 2-티오-N4-아미노-5-하이드록시사이티딘, 2-티오-N4-아미노-5-메틸-5-아자사이티딘, 2-티오-N4-아미노-5-아미노-5-아자사이티딘, 2-티오-N4-아미노-5-하이드록시-5-아자사이티딘, 2-티오-N4-아미노-5-메틸슈도아이소사이티딘, 2-티오-N4-아미노-5-아미노슈도아이소사이티딘, 2-티오-N4-아미노-5-하이드록시슈도아이소사이티딘, 2-티오-N4-하이드록시-5-아자사이티딘, 2-티오-N4-하이드록시슈도아이소사이티딘, 2-티오-N4-하이드록시-5-메틸사이티딘, N4-하이드록시-5-아미노사이티딘, 2-티오-N4-하이드록시-5-하이드록시사이티딘, 2-티오-N4-하이드록시-5-메틸-5-아자사이티딘, 2-티오-N4-하이드록시-5-아미노-5-아자사이티딘, 2-티오-N4-하이드록시-5-하이드록시-5-아자사이티딘, 2-티오-N4-하이드록시-5-메틸슈도아이소사이티딘, 2-티오-N4-하이드록시-5-아미노슈도아이소사이티딘, 2-티오-N4-하이드록시-5-하이드록시슈도아이소사이티딘, N6-메틸아데노신, N6-아미노아데노신, N6-하이드록시아데노신, 7-데아자아데노신, 8-아자아데노신, N6-메틸-7-데아자아데노신, N6-메틸-8-아자아데노신, 7-데아자-8-아자아데노신, N6-메틸-7-데아자-8-아자아데노신, N6-아미노-7-데아자아데노신, N6-아미노-8-아자아데노신, N6-아미노-7-데아자-8-아자아데노신, N6-하이드록시아데노신, N6-하이드록시-7-데아자아데노신, N6-하이드록시-8-아자아데노신, N6-하이드록시-7-데아자-8-아자아데노신, 6-티오구아노신, 7-데아자구아노신, 8-아자구아노신, 6-티오-7-데아자구아노신, 6-티오-8-아자구아노신, 7-데아자-8-아자구아노신, 및 6-티오-7-데아자-8-아자구아노신을 포함할 수 있지만, 이들로 제한되는 것은 아니다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 2개의 개별의 합성 mRNA 폴리뉴클레오타이드 내에 함유된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 2개의 개별의 합성 mRNA 폴리뉴클레오타이드 내에 함유된다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 2개의 개별의 합성 mRNA 폴리뉴클레오타이드 내에 함유된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 3개의 개별의 합성 mRNA 폴리뉴클레오타이드 내에 함유된다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 단일의 합성 mRNA 폴리뉴클레오타이드 내에 함유된 단일의 연속적 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 제2 개방형 해독틀(ORF) 상에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 2개의 ORF는 IRES에 의해 분리된다.
몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 17 폴리펩타이드 on 제1 개방형 해독틀(ORF), 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1, 제2 및 제3 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
적합한 IRES의 예는 바이러스-유래된 IRES(예컨대, 폴리오바이러스, 리노바이러스, 뇌척수심근염바이러스, 구제역 바이러스, C형 간염 바이러스, 고전적 돼지 콜레라 바이러스, 라우스 육종 바이러스, 인간 면역결핍 바이러스, 귀뚜라미마비병 바이러스, 카포시 육종-연관 헤르페스바이러스 등으로부터 유래된 IRES) 및 세포 mRNA-유래 IRES(예컨대, 성장 인자 mRNA로부터 유래된 IRES, 예컨대, 섬유모세포 성장 인자 2, 혈소판-유래 성장 인자 B, 및 혈관 내피 성장 인자, 전사 인자 mRNA로부터 유래된 IRES, 예컨대, 안테나페디아, 울트라비트로락삼, 및 NF-κB 억제 인자, 종양유전자 mRNA로부터 유래된 IRES에 의해 정제시켜, c-myc, pim-1, 및 단백질 키나제 p58PITSLRE 등)를 포함할 수 있지만, 이들로 제한되는 것은 아니다.
몇몇 실시형태에 있어서, 본 명세서에 기재된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드 중 임의의 것을 암호화하는 폴리뉴클레오타이드는 합성 mRNA 폴리뉴클레오타이드 내에서 단일 ORF 상에서 암호화된다.
본 개시내용의 합성 mRNA 폴리뉴클레오타이드는 추가의 암호화 서열을 더 암호화할 수 있다. 추가의 암호화 서열의 예는 추가의 폴리펩타이드 태그를 암호화하는 서열을 포함할 수 있지만 이들로 제한되는 것은 아니다. 적합한 폴리펩타이드 태그의 예는 정제 태그의 임의의 조합, 예컨대, his-태그, 플래그-태그, 말토스 결합 단백질 및 글루타티온-S-전이효소 태그, 검출 태그, 예컨대, 광학 측정법으로 검출될 수 있는 태크(예컨대, 적색 형광 단백질 등) 및 검출 가능한 효소 활성도를 갖는 태그(예컨대, 알칼리성 포스파타제 등), 분비 서열, 리더 서열, 및/또는 안정화 서열, 프로테아제 절단 부위(예컨대, 퓨린 절단 부위, TEV 절단 부위, 트롬빈 절단 부위)를 함유하는 태그 등을 포함할 수 있지만, 이들로 제한되는 것은 아니다.
전달
비히클
본 개시내용의 소정의 양상은 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 전달 비히클을 포함하는 약제학적 조성물에 관한 것이다. 몇몇 실시형태에 있어서, 전달 비히클은 하나 이상의 폴리뉴클레오타이드를하나 이상의 표적 세포에 전달하는데 적합하다.
몇몇 실시형태에 있어서, 전달 비히클은 바이러스이다. 바이러스 전달 비히클의 예는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스를 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 복제 가능하다. 몇몇 실시형태에 있어서, 바이러스는 비변형된, 야생형 바이러스의 조직 친화도에 대해서 그의 조직 친화도를 변화시키도록 변형되었다. 하나 이상의 폴리뉴클레오타이드를 포함하는 바이러스를 제조하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 바이러스 전달 비히클은 단순 포진 바이러스이다. 단순 포진 바이러스 전달 비히클은, 예를 들어, WO2015/009952에 개시된 방법에 의해 제조될 수 있다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 변형된 외피를 포함한다. 몇몇 실시형태에 있어서, 변형된 외피는 1개 이상(예컨대, 1, 2, 3, 4 또는 그 이상)의 돌연변이 단순 포진 바이러스 당단백질을 포함한다. 단순 포진 바이러스 당단백질의 예는 당단백질 gB, gD, gH 및 gL을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 상기 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시킨다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 바이러스는 제1형 단순 포진 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 제2형 단순 포진 바이러스이다.
몇몇 실시형태에 있어서, 전달 비히클은 비-바이러스 전달 비히클이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 화학물질-기반 전달 비히클(화학물질-기반 전달 시약)이다. 화학물질-기반 전달 비히클의 예는 인산칼슘, 덴드리머, 리포솜(양이온성 리포솜, 비-양이온성 리포솜, 및 혼합물), 엑소솜, 하전된 지질, 및 양이온성 중합체(예컨대, DEAE-덱스트란, 폴리에틸렌이민 등)를 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 비-화학 전달 비히클이다. 비-화학물질 전달 비히클의 예는, 전기영동, 뉴클레오펙션, 초음파천공법, 광학 형질주입, 및 입자-기반 비히클(예컨대, 유전자 건, 자기-보조 형질주입, 임페일펙선(impalefection), 입자 충격 등)을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 덴드리머, 리포솜, 엑소솜, 하전된 지질 또는 양이온성 중합체이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 덴드리머이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 리포솜이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 엑소솜이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 하전된 지질이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 양이온성 중합체이다. 비-바이러스 전달 비히클과의 복합체 중에서 관심 대상인 하나 이상의 폴리뉴클레오타이드를 제조하는 방법은 당업자에게 잘 알려져 있다.
약제학적으로 허용 가능한 담체
본 개시내용의 소정의 양상은 약제학적으로 허용 가능한 담체를 포함하는 약제학적 조성물에 관한 것이다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 및/또는 경피 투여/도포에 충분한 담체이다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 피하 및/또는 피부내 투여/도포하기에 충분한 담체이다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 최소 침습적 또는 비-침습적이다. 약제학적으로 허용 가능한 담체는 일반적으로 이용된 농도 및 투약량 및 농도에서 수용자에게 비독성이고, 완충액, 예컨대, 인산염, 시트르산염 및 기타 유기산; 아스코르브산 및 메티오닌을 포함하는 항산화제; 보존제(예컨대, 옥타데실다이메틸벤질 암모늄 클로라이드; 헥사메토늄 클로라이드; 벤잘코늄 클로라이드; 벤제토늄 클로라이드; 페놀; 부틸 또는 벤질 알코올; 알킬 파라벤, 예컨대, 메틸 또는 프로필 파라벤; 카테콜; 제졸시놀; 사이클로헥산올; 3-펜탄올; 및 m-크레졸); 저분자량(약 10개 미만의 잔기) 폴리펩타이드; 단백질, 예컨대, 혈청 알부민, 젤라틴 또는 면역글로불린; 친수성 중합체, 예컨대, 폴리비닐피롤리돈; 아미노산, 예컨대, 글리신, 글루타민; 아스파라긴, 히스티딘, 아르기닌 또는 라이신; 단당류, 이당류 및 기타 탄수화물(글루코스, 만노스 또는 덱스트린을 포함); 킬레이트제, 예컨대, EDTA; 당류, 예컨대, 수크로스, 만니놀, 트레할로스 또는 솔비톨; 폴리올, 예컨대, 글리세롤(예컨대, 10% 글리세롤을 포함하는 제형); 염-형성 반대이온, 예컨대, 나트륨; 금속 착물(예컨대, Zn-단백질 착물); 및/또는 비이온성 계면활성제, 예컨대, 폴리에틸렌 글리콜(PEG)을 포함할 수 있지만 이들로 제한되는 것은 아니다. 약제학적으로 허용 가능한 담체의 철저한 논의는 문헌[REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991)]에서 입수 가능하다.
몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 도포/투여에 적합하다. 국소 또는 경피 도포/투여에 이용하기에 적합한 담체의 예는 연고, 페이스트, 크림, 현탁액, 에멀션, 지방 연고, 겔, 분말, 로션, 용액, 스프레이, 패취, 마이크로니들 어레이(microneedle array), 및 흡입제를 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 연고, 페이스트, 크림, 현탁액, 에멀션, 지방 연고, 겔, 분말, 로션, 용액, 스프레이, 및 흡입제 중 하나 이상을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 연고를 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 페이스트를 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 크림을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 현탁액을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 에멀션을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 겔을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 분말을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 로션을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 용액을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 스프레이를 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 흡입제를 포함한다. 몇몇 실시형태에 있어서, 약제학적 담체는 패취(예컨대, 피부에 부착하는 패취)를 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 마이크로니들 어레이를 포함한다. 약제학적 조성물 전달에 적합한 마이크로니들 어레이를 제조하고 이용하느 방법은 당업계에 일반적으로 공지되어 있다(Kim Y. et al. "Microneedles for drug and vaccine delivery". Advanced Drug Delivery Reviews 2012, 64 (14): 1547-68).
몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 도포/투여에 적합한 2종, 3종, 4종, 5종 또는 그 이상의 상이한 약제학적으로 허용 가능한 담체의 조합물을 포함한다.
몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 1종 이상의 추가의 성분을 더 포함한다. 추가의 성분의 예는 결합제(예컨대, 전호화 옥수수 전분, 폴리비닐피롤리돈 또는 하이드록시프로필 메틸셀룰로스 등); 충전제(예컨대, 락토스 및 기타 당, 미세결정성 셀룰로스, 펙틴, 젤라틴, 황산칼슘, 에틸 셀룰로스, 폴리아크릴레이트 또는 인산수소칼슘 등); 윤활제(예컨대, 스테아르산마그네슘, 탤크, 실리카, 콜로이드성 이산화규소, 스테아르산, 금속성 스테아르산염, 수소화 식물성 오일, 옥수수 전분, 폴리 에틸렌 글리콜, 벤조산나트륨, 아세트산나트륨 등); 붕해제(예컨대, 전분, 나트륨 전분 글리콜레이트 등); 습윤제(예컨대, 라우릴황산나트륨 등); 염 용액; 알코올; 폴리에틸렌 글리콜; 젤라틴; 락토스; 아밀라제; 스테아르산마그네슘; 탤크; 규산; 점성 파라핀; 하이드록시메틸셀룰로스; 폴리비닐피롤리돈; 감미제; 착향제; 방향제; 착색제; 보습제; 썬크림; 항박테리아제; 폴리뉴클레오타이드를 안정화시키거나 이의 분해를 방지할 수 있는 제제 등을 포함할 수 있지만 이들로 제한되는 것은 아니다.
본 명세서에 기재된 바와 같은 약제학적 조성물 및 제형은 하나 이상의 폴리뉴클레오타이드를 포함하는 전달 비히클를 1종 이상의 약제학적으로 허용 가능한 담체와 혼합함으로써 제조될 수 있다. 생체내 투여에 이용될 제형은 일반적으로 멸균성이다. 멸균은, 예컨대, 멸균 여과막에 의해 용이하게 달성될 수 있다.
치료 방법
본 개시내용은, 부분적으로는, 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하기 위한 약제학적 조성물 및 사용 방법에 관한 것이다. 피부의 질환 또는 장애의 예는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군, 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 피부의 질환 또는 장애는 수포성 표피박리증이다. 몇몇 실시형태에 있어서, 대상체는 수포성 표피박리증의 하나 이상의 증상을 갖거나 이의 발병 위험이 있다.
본 명세서에 기재된 폴리뉴클레오타이드 및 약제학적 조성물은, 수포성 표피박리증(예컨대, 퇴행적 이영양성 수포성 표피박리증, 우선 이영양성 수포성 표피박리증 등)의 하나 이상의 증상을 치료를 포함하는, 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는데 유용하다. 본 개시내용의 약제학적 조성물은, 제한 없이, 경구 투여, 설하 투여, 협측 투여, 국소 투여, 직장 투여, 흡입을 통해, 경피 투여, 피하 주사, 피부내 주사, 정맥내(IV) 주사, 관절내 주사, 근육내 주사, 심장내 주사, 골내 주사, 복강내 주사, 경점막 투여, 질 투여, 유리체내 투여, 관절내 투여, 관절 주위 투여, 국부 투여, 표피(epicutaneous) 투여, 또는 이들의 임의의 조합을 비롯하여, 당업계에 공지된 임의의 적합한 방법에 의해 투여될 수 있다. 약제학적 조성물은, 피하, 피부내, 국소, 경피, 및 경점막 투여를 포함하지만, 이들로 제한되는 것은 아닌 각종 경로를 통해서 개체에게 전달될 수 있다. 따라서, 본 개시내용은 또한 개체(예컨대, 수포성 표피박리증을 지니거나 이의 발병 위험이 있는 개체)에게 본 명세서에 기재된 폴리뉴클레오타이드 또는 약제학적 조성물 중 어느 것인가를 전달하는 방법을 포함한다.
몇몇 실시형태에 있어서, 대상체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 것을 포함하는, 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화가 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 피부내 및/또는 피하 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 국소 및/또는 경피 투여된다. 몇몇 실시형태에 있어서, 대상체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 국소 투여하는 것을 포함하는, 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화가 제공된다. 약제학적 조성물은 본 명세서에 기재된 임의의 약제학적 조성물일 수 있다. 몇몇 실시형태에 있어서, 개체는 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 우선 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 퇴행적 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 환부에 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 비환부에 투여된다.
몇몇 실시형태에 있어서, 본 명세서에 기재된 약제학적 조성물은 수포성 표피박리증의 하나 이상의 증상을 치료 또는 완화시키는데 사용될 수 있다. 수포성 표피박리증(예컨대, 퇴행적 이영양성 수포성 표피박리증, 우선 이영양성 수포성 표피박리증 등)의 증상은 피부 상의 물집(특히 손, 발, 무릎 및 팔꿈치 상의 물집), 점막 상의 물집, 피부의 반흔, 점막의 반흔, 피부 침식, 손가락 및/또는 발가락의 기형, 손가락 및/또는 발가락의 손실, 내부 물집(성대, 식도, 및 상기도 상의 것을 포함), 피부의 두꺼워짐(특히 손바닥 및 발의 발바닥 상의 피부의 두꺼워짐), 두피의 물집, 두피의 반흔, 탈모(반흔 탈모증), 야위어 보이는 피부, 아토피성 반흔, 패립종, 치아 병태(예컨대, 충치 및 불량하게 형성된 법랑질), 관절 기형, 손가락 및 발가락의 융합 및 연하곤란을 포함할 수 있다지만 이들로 제한되는 것은 아니다.
몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증을 앓고 있는 개체를 치료적으로 치료하는 방법이 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 피부내 및/또는 피하 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 국소 및/또는 경피 투여된다. 몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증을 앓고 있는 개체를 치료적으로 치료하는 방법이 제공된다. 약제학적 조성물은 본 명세서에 기재된 임의의 약제학적 조성물일 수 있다. 몇몇 실시형태에 있어서, 개체는 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 우선 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 퇴행적 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 환부에 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 비환부에 투여된다.
몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증을 앓고 있는 개체를 예방적으로 치료하는 방법이 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 피부내 및/또는 피하 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 국소 및/또는 경피 투여된다. 몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 국소 투여하는 것을 포함하는, 수포성 표피박리증을 앓고 있는 개체를 예방적으로 치료하는 방법이 제공된다. 약제학적 조성물은 본 명세서에 기재된 임의의 약제학적 조성물일 수 있다. 몇몇 실시형태에 있어서, 개체는 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는우선 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 퇴행적 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 환부에 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 비환부에 투여된다.
몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증의 발병의 위험이 있는 있는 개체를 예방적으로 치료하는 방법이 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 피부내 및/또는 피하 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 국소 및/또는 경피 투여된다. 몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증의 발병의 위험이 있는 있는 개체를 예방적으로 치료하는 방법이 제공된다. 약제학적 조성물은 본 명세서에 기재된 임의의 약제학적 조성물일 수 있다. 몇몇 실시형태에 있어서, 개체는 이영양성 수포성 표피박리증의 발병의 위험이 있다. 몇몇 실시형태에 있어서, 개체는 우선 이영양성 수포성 표피박리증의 발병의 위험이 있다. 몇몇 실시형태에 있어서, 개체는 퇴행적 이영양성 수포성 표피박리증의 발병의 위험이 있다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 환부에 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 비환부에 투여된다.
몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다.
몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 상피 기저막 조직화를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 표피진피경계 온전성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 상처 치유를 증강, 증가, 증대 및/또는 보충시킨다. 이론에 얽매이길 원치 않지만, 본 명세서에 기재된 약제학적 조성물의 하나 이상을 투여함으로써 개체의 하나 이상의 세포에 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 수준을 증가, 증대 및/또는 보충시키는 것에 의해서, 개체의 기능적 콜라겐 알파-1 (VII) 사슬 단백질의 생산 및 분비의 증가를 허용할 것으로 여겨진다. 이론에 얽매이길 원치 않지만, 본 명세서에 기재된 약제학적 조성물의 하나 이상을 투여함으로써 개체의 하나 이상의 세포에 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증가, 증대 및/또는 보충시키는 것에 의해서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 전사후 변형을 증가시켜서, 개체의 기능적 콜라겐 알파-1 (VII) 사슬 단백질의 생산 및/또는 분비를 증강시킬 것으로 여겨진다. 이론에 얽매이길 원치 않지만, 추가적으로, 본 명세서에 기재된 약제학적 조성물의 하나 이상을 투여함으로써(세포를 폴리펩타이드를 발현하는 2가지 별도의 폴리뉴클레오타이드와 접촉시킴으로써, 세포를 2가지 폴리펩타이드를 개별적으로 발현시키는 단일의 연속적 폴리뉴클레오타이드와 접촉시킴으로써, 또는 세포를 키메라 폴리펩타이드를 발현시키는 단일의 연속적 폴리뉴클레오타이드와 접촉시킴으로써), 개체의 하나 이상의 세포에 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 수준을 증가, 증대 및/또는 보충시키는 것에 의해서, 개체의 동일 세포에 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증가, 증대 및/또는 보충시키는 것에 의해서, 기능적 콜라겐 알파-1 (VII) 사슬 단백질의 생산 및 분비의 증강에 부가적인 효과를 지닐 것으로 여겨진다. 이론에 얽매이길 원치 않지만, 기능적 콜라겐 알파-1 (VII) 사슬 단백질의 생산 및 분비의 증가는 개선된 고정 원섬유 형성을 허용하고, 개체의 상피 기저막의 부착을 도울 것으로 여겨진다. 이론에 얽매이길 원치 않지만, 궁극적으로, 이것은 수포성 표피박리증을 앓고 있는 자에게 증가된 표피-진피 안정성을 초래하여, 기존의 상처를 치료하고, 치료된 영역에서의 상처의 재형성을 예방 또는 지연시킬 것으로 여겨진다.
단리된
폴리뉴클레오타이드
및
폴리펩타이드
본 개시내용의 소정의 양상은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다. 본 개시내용의 다른 양상은 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다. 본 개시내용의 다른 양상은 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다.
본 개시내용의 다른 양상은 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 의해 분리된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드와 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다. 몇몇 실시형태에 있어서, 단리된 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 1개 이상의 퓨린 절단 부위를 암호화하는 폴리뉴클레오타이드를 더 포함한다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 T2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 T2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 P2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 P2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 E2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 E2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 F2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 F2A 링커 폴리펩타이드의 하류에서 암호화된다.
콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 1이다. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 1의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 3이다. 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 3의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 29이다. 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 29에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 5, 서열번호 7, 서열번호 9, 및 서열번호 11이다. 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 5, 서열번호 7, 서열번호 9, 또는 서열번호 11의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27이다. 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 또는 서열번호 27의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
본 개시내용의 추가의 양상은 벡터 내에 함유된 본 명세서에 기재된 1개 이상(예컨대, 1개 이상, 2개 이상, 3개 이상 등)의 단리된 폴리뉴클레오타이드에 관한 것이다. 몇몇 실시형태에 있어서, 벡터는 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 벡터, 백시니아 바이러스 벡터, 또는 이들의 임의의 잡종 바이러스 벡터이다. 몇몇 실시형태에 있어서, 벡터는 단순 포진 바이러스 벡터이다. 몇몇 실시형태에 있어서, 벡터는 1개 이상(예컨대, 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상 등)의 전이유전자를 포함한다.
몇몇 실시형태에 있어서, 단순 포진 바이러스 벡터는 포진 바이러스 앰플리콘 벡터이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 혼성 앰플리콘이다. HSV-1 혼성 앰플리콘의 예는 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, HSV/EBV/RV 혼성 앰플리콘, 및 HSV/슬리핑 뷰티 혼성 앰플리콘을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 벡터는 HSV/AAV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/EBV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/EBV/RV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/슬리핑 뷰티 혼성 앰플리콘이다. 본 개시내용의 추가의 양상은 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 함유하는 바이러스 전달 비히클을 제조하는 방법에 관한 것이다. 몇몇 실시형태에 있어서, 상기 방법은 숙주 세포를 본 명세서에 기재된 하나 이상의 단리된 폴리뉴클레오타이드를 함유하는 하나 이상의 바이러스 벡터와 접촉시키는 단계 및 숙주 세포에 의해 생성된 바이러스 전달 비히클을 수집하는 단계를 포함한다. 세포를 배양하고 세포를 관심 대상인 하나 이상의 바이러스 벡터와 예컨대, 형질도입 또는 형질주입에 의해 접촉시키는 방법은 당업자에 잘 알려져 있다.
몇몇 실시형태에 있어서, 단순 포진 바이러스 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 1개 이상의 독성 단순 포진 바이러스 유전자의 발현을 감소 또는 제거하도록 조작되어 있었다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 비활성화 돌연변이를 포함한다. 비활성화 돌연변이의 예는 결실(예컨대, 유전자의 암호화 서열의 결실 또는 유전자의 전사 조절 요소의 하나 이상의 결실), 삽입, 점 돌연변이 및 재배열을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 1개 이상의 급초기 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55 단순 포진 바이러스 유전자 중 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 또는 8개 모두에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 1, 2, 3, 4, 5, 6, 7개 또는 그 이상의 바이러스 유전자 좌위 내에 본 개시내용의 1개 이상(예컨대, 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상 등)의 폴리뉴클레오타이드(예컨대, 전이유전자)를 포함한다. 적합한 바이러스 좌위의 예는, 제한 없이, ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55 단순 포진 바이러스 유전자 좌위를 포함할 수 있다. 몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 1개 이상의 바이러스 ICP4 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다(예컨대, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스 등). 몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 바이러스 UL41 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 바이러스 ICP47 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 바이러스 ICP4 유전자 좌위 중 하나 이상 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를, 그리고 바이러스 UL41 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다(예컨대, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스 등).
몇몇 양상에 있어서, 본 명세서에 기재된 단리된 폴리뉴클레오타이드는 합성 mRNA 내에 함유된다. 몇몇 실시형태에 있어서, 합성 mRNA는 하나 이상의 변형된 리보뉴클레오타이드를 포함한다.
본 개시내용의 소정의 양상은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함하는 단리된 폴리펩타이드에 관한 것이다. 본 개시내용의 다른 양상은 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 단리된 폴리펩타이드에 관한 것이다. 본 개시내용의 다른 양상은 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 단리된 폴리펩타이드에 관한 것이다.
본 개시내용의 다른 양상은 링커 폴리펩타이드에 의해 분리된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 단리된 키메라 폴리펩타이드에 관한 것이다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드는 1개 이상의 퓨린 절단 부위를 더 포함한다. 몇몇 실시형태에 있어서, 퓨린 절단 부위의 아미노산 서열은 정규 퓨린 절단 부위(Arg-X-(Arg/Lys)-Arg)의 서열과 동일하거나 또는 실질적으로 유사하다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 N-말단에 있다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 C-말단에 있다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, 1개 이상의 퓨린 절단 부위 및 T2A 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, T2A 링커 폴리펩타이드 및 1개 이상의 퓨린 절단 부위를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, 1개 이상의 퓨린 절단 부위 및 P2A 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, P2A 링커 폴리펩타이드 및 1개 이상의 퓨린 절단 부위를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, 1개 이상의 퓨린 절단 부위 및 E2A 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, E2A 링커 폴리펩타이드 및 1개 이상의 퓨린 절단 부위를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, 1개 이상의 퓨린 절단 부위 및 F2A 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, F2A 링커 폴리펩타이드 및 1개 이상의 퓨린 절단 부위를 포함한다.
몇몇 양상에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함하는 단리된 폴리펩타이드는 서열번호 2의 아미노산 서열을 포함한다. 단리된 폴리펩타이드는 또한 서열번호 2의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함하는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함한다.
몇몇 양상에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 단리된 폴리펩타이드는 서열번호 4를 포함한다. 단리된 폴리펩타이드는 또한 서열번호 4의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 라이실 하이드록실라제 3 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 단리된 폴리펩타이드는 서열번호 30을 포함한다. 단리된 폴리펩타이드는 또한 서열번호 30의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 키메라 폴리펩타이드는 서열번호 2의 아미노산 서열을 포함하는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함한다. 키메라 폴리펩타이드는 또한 서열번호 2의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 키메라 폴리펩타이드는 서열번호 4의 아미노산 서열을 포함하는 라이실 하이드록실라제 3 폴리펩타이드를 포함한다. 키메라 폴리펩타이드는 또한 서열번호 4의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 라이실 하이드록실라제 3 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 키메라 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 아미노산 서열을 함유하는 링커 폴리펩타이드를 포함한다. 키메라 폴리펩타이드는 또한 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 링커 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 아미노산 서열이다. 키메라 폴리펩타이드는 또한 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열일 수 있다.
숙주 세포
본 개시내용의 소정의 양상은 본 명세서에 기재된 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 1개 이상의 숙주 세포에 관한 것이다. 몇몇 실시형태에 있어서, 벡터는 본 명세서에 기재된 단리된 재조합 단순 포진 바이러스 벡터 중 임의의 것이다. 몇몇 실시형태에 있어서, 숙주 세포는 박테리아 세포(예컨대, 이.콜라이(E. coli) 세포 등)이다. 몇몇 실시형태에 있어서, 숙주 세포는 진균 세포(예컨대, 에스. 세레비시애(S. cerevisiae) 세포 등)이다. 몇몇 실시형태에 있어서, 숙주 세포는 곤충 세포(예컨대, S2 세포 등)이다. 몇몇 실시형태에 있어서, 숙주 세포는 포유류 세포이다. 몇몇 실시형태에 있어서, 숙주 세포는 세포주로부터의 세포이다. 적합한 숙주 세포 또는 세포주의 예는, 293, HeLa, SH-Sy5y, Hep G2, CACO-2, A549, L929, 3T3, K562, CHO-K1, MDCK, HUVEC, Vero, N20, COS-7, PSN1, VCaP, CHO 세포 등을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 벡터는 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 벡터, 백시니아 바이러스 벡터, 또는 이들의 임의의 잡종 바이러스 벡터이다. 몇몇 실시형태에 있어서, 벡터는 단순 포진 바이러스 벡터이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 숙주 세포는 헬퍼 바이러스를 포함한다. 몇몇 실시형태에 있어서, 헬퍼 바이러스를 포함하는 숙주 세포는 본 명세서에 기재된 벡터와 접촉된다. 몇몇 실시형태에 있어서, 헬퍼 바이러스를 포함하는 숙수 세포를 본 명세서에 기재된 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘과 접촉시킴으로써 본 명세서에 기재된 1개 이상의 벡터를 포함하는 바이러스의 생산을 초래한다. 몇몇 실시형태에 있어서, 바이러스는 접촉된 숙주 세포의 상청액으로부터 수집된다. 헬퍼 바이러스를 포함하는 숙수 세포를 HSV-1 앰플리콘 또는 HSV-1/혼성 앰플리콘과 접촉시킴으로써 바이러스를 생성하는 방법은 당업계에 공지되어 있다. 몇몇 실시형태에 있어서, 숙주 세포는 상보성 숙주 세포이다. 몇몇 실시형태에 있어서, 상보성 숙주 세포는 본 명세서에 기재된 바이러스 벡터 중 임의의 것에서 비활성화된 1개 이상의 유전자를 발현시킨다. 몇몇 실시형태에 있어서, 상보성 숙주 세포는 본 명세서에 기재된 재조합 단순 포진 바이러스 게놈과 접촉된다. 몇몇 실시형태에 있어서, 상보성 숙주 세포를 본 명세서에 기재된 재조합 단순 포진 바이러스 게놈과 접촉시킴으로써 본 명세서에 기재된 1개 이상의 벡터를 포함하는 바이러스의 생산을 초래한다. 몇몇 실시형태에 있어서, 바이러스는 접촉된 숙주 세포의 상청액으로부터 수집된다. 재조합 단순 포진 바이러스와 접촉시킴으로써 바이러스를 생성하는 방법은 일반적으로 WO2015/009952에 기재되어 있다.
제조 물품 또는
키트
본 개시내용의 소정의 양상은 본 명세서에 기재된 약제학적 조성물을 포함하는 제조 물품 또는 키트에 관한 것이다. 몇몇 실시형태에 있어서, 제조 물품 또는 키트는 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하도록 약제학적 조성물을 투여하기 위한 설명서를 포함하는 패키지 삽입물(package insert)을 포함한다.
몇몇 실시형태에 있어서, 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 전달 비히클 및 약제학적으로 허용 가능한 담체는 동일한 용기 또는 별도의 용기에 있다. 적합한 용기는, 예를 들어, 병, 바이알, 백 및 시린지를 포함한다. 용기는 유기, 플라스틱(예컨대, 폴리염화비닐 또는 폴리올레핀) 또는 금속 합금(예컨대, 스테인리스강 또는 하스텔로이)과 같은 각종 재료로 형성될 수 있다. 몇몇 실시형태에 있어서, 용기는 용기 상에 또는 용기와 연관된 라벨을 포함하되, 여기서 라벨은 사용법을 나타낸다. 제조 물품 또는 키트는 기타 완충제, 희석제, 필터 등을 비롯하여 상업적 사용자 관점으로부터 바람직한 기타 재료를 더 포함할 수 있다.
본 명세서는 당업자가 본 발명을 실시할 수 있도록 충분한 것으로 여겨진다. 본 명세서에 도시되고 기재된 것 이외에 본 발명의 각종 변형이 전술한 설명으로부터 당업자에게 명백하게 될 것이고 첨부된 청구범위의 범주 내에 들어갈 것이다.
실시예
본 개시내용은 이하의 실시예를 참조하여 더욱 완전히 이해될 것이다. 그러나, 이것은 본 개시내용의 범위를 제한하는 것으로 해석되어서는 안 된다. 본 명세서에 기재된 실시예 및 실시형태는 단지 예시적인 목적을 위한 것이고 이를 감안하여 각종 변형 또는 변화가 당업자에게 제시될 것이며 본 출원의 정신과 권한 그리고 첨부된 청구범위의 범주 내에 포함되는 것으로 이해된다.
실시예
1: 변형된 단순 포진 바이러스 벡터의 생성, 및 벡터를 함유하는 바이러스를 생산/단리
표적 포유류 세포에서 하나 이상의 전이유전자를 발현시킬 수 있는 변형된 단순 포진 바이러스 게놈 벡터를 생성하기 위해, 단순 포진 바이러스 게놈(도 1a)을 급초기 유전자 ICP0, ICP4 및 ICP27을 비활성화시키도록 변형시킨 한편, 급초기 유전자 ICP22는 이종성, 유도 촉진자를 유도하도록 변형된다. 이는 포유류 세포에서 게놈의 독성을 감소시킨다. 다음에, 카세트는 제한 클로닝에 의해 변형된 포진 바이러스 게놈 내로 삽입된다. 상기 카세트는 표적 포유류 세포에서 전이유전자를 발현시킬 수 있는 이종 촉진자를 함유한다. 촉진자는 콜라겐 알파-1(VII) 사슬 폴리펩타이드를 암호화하는 핵산 서열뿐만 아니라 mRNA의 적절한 생성을 보장하는 하류의 조절 요소(도 1b)에 작동 가능하게 연결된다. 대안적으로, 카세트는 2개의 전이유전자를 포함하는데, 이들 각각은 콜라겐 알파-1(VII) 사슬 폴리펩타이드 또는 라이실 하이드록실라제 3 폴리펩타이드 중 하나를 암호화하는 핵산에 작동 가능하게 연결되는 그 자신의 이종 촉진자를 가진다. 전이유전자는 DNA의 동일한 가닥 중 하나 상에서(도 1c), 또는 안티센스 배향으로 DNA의 반대편 가닥 상에서(도 1d) 암호화된다. 그 자신의 촉진자 및 조절 요소를 갖는 각각의 전이유전자를 연결하는 것은 별개의 mRNA 전사물 상에서 각각의 암호화 서열의 독립적 발현을 허용한다. 별개의 촉진자로부터의 전이유전자를 발현시키는 것은 상이한 촉진자 유형에 암호화 서열을 작동 가능하게 연결시키는 능력을 허용하는데, 이는 상이한 수준에서 세포 주기 내 상이한 시간에, 상이한 세포 유형에서, 또는 상이한 유도자 또는 억제자의 제어 하에서 전이유전자의 발현을 유도할 수 있다.
내부 리보솜 유입 부위에 의해 분리된 단일 mRNA 암호화 콜라겐 알파-1(VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 발현하는 카세트를 포함하는 변형된 포진 바이러스 게놈이 또한 작제된다(도 1e). 이것은 표적 세포에서 발현될 때 각각의 폴리펩타이드의 대략 등몰의 생성을 허용한다. 최종적으로, 키메라 폴리펩타이드를 발현시키는 카세트를 포함하는 변형된 포진 바이러스 게놈이 작제된다. 이 키메라 폴리펩타이드는 N-말단에서부터 C-말단까지, 콜라겐 알파-1(VII) 사슬 폴리펩타이드, 절단 가능한 펩타이드 링커 및 라이실 하이드록실라제 3 폴리펩타이드를 포함한다(도 1f).
각각 콜라겐 알파-1(VII) 사슬 폴리펩타이드를 발현시키는 2개의 카세트를 포함하는 추가적인 변형된 포진 바이러스 게놈이 작제되며, 여기서 각각의 카세트는 야생형 단순 포진 바이러스 게놈(도 2a)의 ICP4 유전자 좌위(도 2b 내지 도 2g)의 복제물 내로 삽입된다. 이들 추가적인 재조합 포진 바이러스 게놈은 포진 바이러스 유전자 결실/변형의 다양한 조합에 의해 작제된다.
ICP4 유전자의 두 복제의 암호화 서열의 결실뿐만 아니라, ICP27 및 UL55 유전자의 암호화 서열의 결실을 함유하는 재조합 포진 바이러스 게놈이 작제된다. 이들 재조합 바이러스는 ICP22 및 ICP47 유전자가 정상 역학(normal kinetics)으로 발현되지 않게끔 ICP22 및 ICP47 유전자의 촉진자 영역에 비활성화 돌연변이를 함유하도록 더욱 변형된다(도 2b).
포진 ICP4 유전자의 두 좌위 내로 콜라겐 알파-1(VII) 사슬 폴리펩타이드용의 발현 카세트를 편입하는 추가의 재조합 단순 포진 바이러스가 작제된다. 이들 재조합 바이러스는, ICP22 유전자 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2c); ICP0 유전자 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2d); ICP0 및 ICP22 유전자, 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2e); ICP0, ICP22 및 ICP27 유전자, 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2f); 및 ICP0, ICP22, ICP27, 및 UL55 유전자, 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2g)을 함유하는 바이러스를 포함한다. 추가의 벡터는 도 2c 내지 도 2g에 도시된 벡터에 기반하여 작제되고, 이는 ICP0 및/또는 UL41 좌위에 하나 이상의 추가의 효과기(예컨대, LH3, KRT17)를 암호화하는 하나 이상의 전이유전자를 더 포함한다.
이들 변형된 단순 포진 바이러스 게놈 벡터는 포진 바이러스 유전자를 발현시키도록 변형된 조작된 Vero 세포에 감염시킨다. 이들 조작된 Vero 세포는 상청액 내에서 패키징된 변형된 게놈을 가진 복제-결함성 단순 포진 바이러스를 분비한다. 이어서, 상청액을 수집하여, 농축시키고, 5㎛ 필터를 통해서 멸균 여과시킨다.
실시예 2: 복제 결핍성 HSV-1을 이용한 Col7 발현의 구제(rescuing)
이하의 실시예는 인간 COL7A1 유전자를 발현시키도록 변형된 복제 결핍성 제1형 단순 포진 바이러스의 작제, 및 RDEB 환자로부터 단리된 세포에서 관찰된 몇 가지 결함을 구제하기 위하여 이러한 바이러스 벡터의 사용을 기술한다.
방법
세포 및 세포 배양액
정상 및 RDEB 인간 피부 섬유모세포 및 각질세포를 앞서 기재된 바와 같이 단리시켰다(NG, Y. Z. et al. (2012) Cancer Res. 72: 3522-3534; Rheinwald, J. G. and Green, H. (1975) Cell 6: 331-42). 세포는 표준 수법에 따라서 배양시켰다.
KB103의 작제
KB103 벡터를 바이러스 ICP4 대신에 GFP를 보유하는 복제-결함성 HSV-1 벡터인 D3GFP로부터 생성하였다. ICP4 재조합 플라스미드 pSASB3의 EcoRI 부위 내로 COL7A1을 클로닝시킴으로써 D3GFP에서 GFP의 서열을 전달 플라스미드를 이용하여 인간 COL7A1의 암호화 서열로 대체하였다. COL7A1 함유 전달 플라스미드 및 D3GFP 벡터의 혼합된 형질감염/감염을 VeroD 세포 상에서 수행하였다. GFP를 발현시키지 않은 얻어진 플라크를 단리시키고, Col7 단백질 발현에 대한 웨스턴 블롯에 의해 시험하였다.
바이러스 정제
표준 기법에 따라 KB103 바이러스를 정제하였다(문헌[Diefenbach, R. and Fraefel, C. Herpes Simplex Virus. New York: Humana Press, 2014] 참조).
바이러스 감염
바이러스 감염 1일 전에 대략 50% 합류에서 6-웰 플레이트에서 2회 또는 3회 중복하여 세포를 파종시켰다. 세포 계수화 및 MOI 결정을 위해 추가적인 웰을 동시에 파종시켰다. 세포 파종 후 24시간에, 하나의 웰로부터의 세포를 트립신처리하고 계수화하여 MOI를 계산하고, 그리고 바이러스 저장액을 해동시키고 나서, 세포 배양 배지에서 희석시켜 목적으로 하는 MOI를 달성하였다. 감염될 각각의 웰로부터 배양 배지를 흡입하고 나서, 500㎕의 KB103-함유 배지(또는 대조군 배지)를 각각의 웰에 첨가하였다. 플레이트를 37℃에서 5 내지 7.5% CO2와 함께 1.5 내지 2시간 동안 15 내지 20분마다 간헐적으로 로킹(rocking)하면서 항온처리시키고, 이어서, 1.5 내지 2 mL의 완전 세포 배양 배지를 각각의 웰에 첨가하고 나서, 플레이트를 24 내지 72시간 동안 37℃에서 항온처리시켰다. 항온처리 후에, 세포 및 상청액을 채취하고 나서, 분석을 위해 처리하였다.
mRNA 정량화
제조업자의 프로토콜에 따라 SYBR PCR 분석(사이버 셀렉트 마스터 믹스(Sybr Select Master Mix), 라이프 테크놀로지즈(Life Technologies))을 이용하는 감염 후에 1차 RDEB 각질세포로부터 단리시킨 RNA로부터 Col7 전사물을 증폭시켰다. Col7 전사 수준을 β-액틴 전사 수준으로 정규화시켰다.
웨스턴 블롯 분석
감염 후 48시간에 세포로부터 세포 채취물을 생성하고 나서, 다음의 항체를 이용하여 표준 기법에 따라 웨스턴 블롯을 수행하였다: 토끼 항-인간 Col7 다클론성 항체(시그마(Sigma), 카탈로그 번호 HPA042420), 마우스 항-인간 GAPDH 항체(산타 크루즈 바이오테크놀로지(Santa Cruz Biotechnology), 카탈로그 번호 sc-365062), 토끼 항-LH3 항체(프로테인 테크(Protein Tech), 카탈로그 번호 11027-1-AP), 및 마우스 항-TSP1 항체(산타 크루즈 바이오테크놀로지, 카탈로그 번호 sc-59887).
면역형광법
감염 전에 세포를 커버 슬립 상에서 플레이팅하고 나서, 감염 48시간 후에 고정시키고, 1차 토끼 항-인간 Col7 다클론성 항체(시그마(Sigma), 카탈로그 번호 HPA042420)로 염색하고 나서, 세척 후, 형광 표지된 항-토끼 2차 항체(인비트로젠(Invitrogen), 카탈로그 3 A11012)를 이용하여 추가로 염색하였다. 표준 기법을 이용하여 DAPI에 의해 세포핵을 염색하였다.
세포 접착
96-웰 플레이트를 100㎕ 반응 용적에서 4℃에서 밤새 10, 20, 또는 50 ㎍/㎖ 래트 꼬리 콜라겐 1(마라톤 래버러토리 서플라이(Marathon Laboratory Supply)) 또는 인간 파이브로넥틴(Sigma-Aldrich)으로 코팅하고, 이어서, PBS로 세척하고 나서, PBS + 0.1% BSA 1시간 동안 37℃에서 차단시켰다. 모의(대조군) 감염 또는 KB103 감염 RDEB 각질세포(100㎕의 DMEM/HamF12 + 0.1% BSA 중의 2.4*104개의 세포)를 플레이트에 첨가하였고, 37℃에서 40 내지 90분 동안 항온처리시켰다. 웰을 PBS로 3회 세척하여 임의의 비결합 세포를 제거하고, 접착 세포를 20분 동안 PFE를 이용하여 고정시켰다. 이어서, 고정 세포를 70% 에탄올로 처리하고 나서, 크리스탈 바이올렛으로 염색하고, 100% 에탄올 중에 용해시키고, 630㎚에서 흡광도를 측정함으로써 정량화하였다.
피부 등가(Skin equivalent: SE) 기관형 배양물
RDEB 섬유모세포 및 각질세포로 구성된 피부 등가 기관형 배양물을 사용하여 기저막 구역(BMZ)에서의 Col7의 발현을 평가하였다. 간략하게, RDEB 섬유모세포(2*105개의 세포/웰)를 6-웰 플레이트에서 피브린 겔 매트릭스에 포매시키고, DMEM + 아스코르브산 및 아프로티닌을 함유하는 10% 혈청 중에서 24시간 동안 37℃ 및 5% CO2에서 항온처리시켰다. 이어서, RDEB 각질세포(1*106개의 세포/웰)를 기질 상에 파종시키고, 50 mg/㎖의 아스코르브산을 함유하는 DMEM/F-12 각질세포 배지에서 합류까지 성장시키고 나서, 공기-액체 계면에서 상승시켰다. 상승 2일 후에, KB103 바이러스를 (MOI 3에서) 배양물에 첨가하고 나서, 1.5시간 동안 항온처리시켰다. 항온처리 후에, 배양물을 세척하고 나서, 상피로의 계층화 및 분화에 바람직하도록 5 내지 14일 동안 항온처리시켰다. 피부 등가(SE)을 플레이트로부터 수동으로 탈착하고 나서, 최적의 절단 온도 화합물에서 포매하고, 액체 질소에서 냉동시키고 나서, 단클론성 항-Col7 항체를 이용하여 면역형광법을 위해 6㎜ 절편으로 절단하였다.
결과
정상 및 RDEB 세포에서 KB103 약리학
Col7 결손을 수정하기 위한 시도에서 RDEB 환자로부터 단리된 1차 세포에 인간 COL7A1 유전자를 전달하기 위한 다수의 생체외 접근에 착수하였다(Ortiz-Urda, S. et al. (2003) J. Clin. Invest. 111(2) 251-5; Woodley, D.T. et al. (2003) J. Invest. Dematol. 121(5) 1021-8). 중요한 질환 특징의 지속 가능한 수정을 달성하는 데 성공적이지만, 수포성 표피박리증을 치료하기 위한 생체내 유전자 전달 전략은 고비용, 불량한 이식, 수술적인 괴사 조직 제거, 복잡한 붕대 및 상처치료, 및 수술 후 감염에 대한 높은 가능성을 포함하는 다수의 중요한 단점을 가진다. 유전자 요법을 위한 매력적인 대안의 경로는 유전자 산물을 전달하기 위한 바이러스 또는 비-바이러스 벡터의 사용이다. 그러나, 플라스미드 DNA를 이용하는 비-바이러스 벡터는 주사될 때 또는 국소로 투여될 때 매우 낮은 유전자 전달 효율을 겪는 한편, 인간 유전자 요법 시험(레트로바이러스 벡터)에서 대부분의 널리 사용되는 바이러스 벡터는 비분할 세포를 감염시키지 않는다. 이는 분할 세포의 적절한 집단을 생성하기 위한 조직의 조작(예컨대 상처 치유)이 레트로바이러스 유전자 요법에 필요하기 때문에 피부에 대한 유전자 전달에 문제가 된다. 대용량 아데노바이러스 벡터는 게놈-크기 전사 단위를 전달할 수 있고, 장기간의 시간 동안 형질도입 세포에서 생존하지만, 아데노바이러스 입자의 독성 및 면역원성뿐만 아니라 벡터 생성 동안의 헬퍼 바이러스에 대한 필요는 인간 유전자 요법 전략에서 그들의 사용을 위한 상당한 장애물로서 남아있다. 복제-결함성 HSV 벡터는 다수의 전임상 연구에서 전달 비히클로서 사용되었지만, 수포성 표피박리증 또는 다른 피부 적용을 위한 HSV-기반 바이러스 벡터의 용도를 뒷받침하는 전임상 증거는 보고되지 않았다.
이를 위하여, 인간 COL7A1 유전자를 암호화하는 복제 결핍성 제1형 단순 포진 바이러스(HSV-1)를 DEB 환자의 유전자 요법에 유용한 신규한 벡터로서 개발하였다. 바이러스 ICP4, ICP27 및 UL55 유전자의 완전한 결실을 보유하도록 HSV-1 바이러스를 변형시켰고, ICP4 결실은 급초기 바이러스 유전자 ICP22 및 ICP47의 전사를 유도하는 상류의 촉진자 서열의 제거를 초래한다. 결실된 ICP4 좌위의 두 복제 내에서 암호화된 인간 거대세포바이러스(HCMV) 급초기 촉진자-유래 인간 COL7A1 발현 카세트를 포함하기 위해 바이러스를 추가로 변형시켜, 표적 세포에 인간 COL7A1를 전달하기에 적합한 KB103으로 칭하는 복제-결함성 HSV-1 벡터를 생성하였다(도 3).
인간 세포에서 Col7을 전달하고 발현시키기 위한 KB103의 능력을 시험하기 위해, 그리고 RDEB 환자에서 Col7 결손을 구제하기 위해, 환자-유래 인간 피부 섬유모세포 및 각질세포를 건강한 개체뿐만 아니라 RDEB를 앓는 개체로부터 단리시키고, 이들 1차 세포를 다양한 MOI에서 KB103으로 감염시켰다. 감염 후 24 내지 72시간에, 형질도입 세포에서 실시간 PCR에 의해 COL7A1 유전자 발현을 측정한 한편, Col7 단백질 발현을 웨스턴 블롯과 면역형광법 분석을 둘 다 병행하여 분석하였다.
COL7A1 유전자 발현에서 용량-의존적 증가를 KB103으로 감염시킨 RDEB 각질세포(도 4A) 및 섬유모세포(도 4B)로 관찰하였다. KB103 감염은 각각 0.3, 1 및 3의 MOI로 감염시킨 RDEB 각질세포에서 대략 7.5배, 12.5배, 및 25배만큼 COL7A1 유전자 발현을 증가시켰다(도 4A). 놀랍게도, 감염된 RDEB 섬유모세포에서 COL7A1 유전자 발현에서 훨씬 더 극적인 변화가 관찰되었다. MOI 0.1 및 0.3에서의 감염은 COL7A1 유전자 발현의 보통의 증가를 나타내었지만, MOI 1으로 감염된 RDEB 섬유모세포에 대해 COL7A1 유전자 발현의 대략 30배 증가가 측정된 반면, MOI 3으로 감염된 이런 세포 유형에서 60배 증가가 관찰되었다. 이 데이터는 COL7A1 유전자 발현이 KB103에 의한 감염 후 RDEB 1차 세포에서 대량으로 상향조절되었다는 것을 나타내었다.
결과적으로, KB103으로 감염된 세포에서 강한 Col7 단백질 발현이 또한 관찰되었다. 0.3, 1 및 3의 MOI에서 KB103로 감염 48시간 후에 정상 및 RDEB 각질세포(도 5A)와 섬유모세포(도 5B) 둘 다에서 Col7 단백질 발현이 검출되었고, 더 높은 바이러스 역가에서 관찰된 Col7 단백질 발현에서 명백한 용량-의존적 증가가 있었다. 감염된 세포로부터의 상청액과 세포 용해물 둘 다에서 Col7의 발현이 관찰되었다. 놀랍게도, MOI 0.3에서 감염된 RDEB 섬유모세포는 더 고수준의 Col7이 비감염 정상 섬유모세포에서 관찰되었다는 것을 나타내는데(도 5B), 이는 낮은 바이러스 역가에서조차 KB103을 이용하는 RDEB 섬유모세포에서 Col7 발현의 완전한 구제를 시사한다. 높은 바이러스 용량(MOI 3)을 이용하는 세포 형태에 대한 분명한 효과는 관찰되지 않았다. 추가적으로, GAPDH 발현에 의해 결정하여 고용량의 KB103을 이용하는 섬유모세포 또는 각질세포 세포 증식에 대한 부정적 영향은 이들 실험에서 나타나지 않았다.
상기 실험과 일치되게, Col7 단백질 발현의 면역형광 검출에 의해 입증되는 바와 같은 KB103으로 감염된 정상 및 RDEB 세포에서 Col7 단백질 발현에서 강한 그리고 용량 의존적 증가가 확인되었다(도 6). 예상된 바와 같이, 비감염 RDEB 인간 피부 섬유모세포 또는 각질세포에서 Col7 단백질은 검출되지 않았고; 제한된 Col7 단백질은 비감염 정상 각질세포 및 섬유모세포에서 검출되었다. 그러나, KB103에 의한 감염은 비감염 정상 세포에서 관찰된 수준 이상에서 RDEB 섬유모세포 및 각질세포 내 Col7 단백질 발현을 구제할 수 있었다. 더 나아가, (MOI 3에서) KB103의 감염 효율은 각각의 감염 복제물에 대한 3개 이상의 독립적 패널의 평가에 기반하여 95% 이상이 되는 것으로 계산되었는데, 이는 KB103이 COL7A1 발현 카세트를 효율적으로 전달하고 발현시킨다는 것을 나타낸다. 종합하면, 이 데이터는 KB103이 정상 및 RDEB 1차 세포에서 COL7A1을 전달하고 발현시킬 수 있다는 것과, KB103이 인간 피부 섬유모세포와 각질세포 둘 다에 의해 잘 용인되었다는 것을 시사한다.
RDEB 세포에서 KB103의 기능성 평가
KB103으로부터 발현된 인간 Col7 단백질의 기능성을 다음에 인간 피부 섬유모세포 및 각질세포에서 연구하였다. 처음에, 라이실 하이드록실라제 3의 수준에 대한 Col7 발현 효과를 KB103-감염된 세포에서 시험하였다. 세포외 기질의 침착 및 조직화에 LH3이 필요하며, LH3 수준이 RDEB 피부에서 감소된다는 것이 보고되었다(Watt, S. A. et al. (2015) PLoS One 10(9): p. e0137639). 이전의 연구와 일치되게 정상 각질세포에 비해 비감염 RDEB 각질세포에서 LH3은 거의 또는 전혀 관찰되지 않았다(도 7, 레인 1 대 5). 그러나, 예상치 못하게, Col7 단백질 발현에 부수적으로 LH3 수준에서의 용량-의존적 증가가 KB103으로 감염된 RDEB 각질세포에서 관찰되었는데(도 7), 이는 KB103이 Col7 단백질 발현뿐만 아니라 RDEB 세포에서의 LH3 발현을 구제할 수 있다는 것을 시사한다.
다음에, TSP-1 수준에 대한 Col7 발현 효과를 시험하였다. TSP-1은 혈관신생의 음성 조절제이며, RDEB 섬유모세포에서 증가될 것으로 보고되었다(Ng, Y. Z. et al. (2012) Cancer Res. 72(14): p. 3522-34). 이전의 연구와 일치되게, 비감염 RDEB 대 정상 인간 피부 섬유모세포에서 더 고수준의 TSP-1이 관찰되었다(도 8, 레인 1 및 4). 놀랍게도, KB103으로 감염된 정상 또는 RDEB 섬유모세포 중 하나의 감염 시 TSP-1 단백질 발현은 강하게 저해되었다(도 8). 이 데이터는 KB103이 감염된 세포에서 Col7 및 LH3 수준을 증가시킬 뿐만 아니라, 음성 조절자 TSP-1을 저해함으로써 혈관신생을 촉진시킬 수 있다는 것을 시사하였다.
최종적으로, 콜라겐 1 또는 파이브로넥틴 중 하나에 대한 RDEB 각질세포의 세포 접작을 증가시키는 KB103의 능력을 시험하였다. 다양한 MOI에서 KB103으로 감염된 RDEB 각질세포에서 콜라겐 1과 파이브로넥틴 둘 다에 대한 세포 접착에서의 용량-의존적 증가가 관찰되었다(도 9A 및 도 9B). 모든 MOI에서 RDEB 각질세포의 감염은 비감염(대조군) 세포에 대한 물질 둘 다의 모든 농도에 의해 처리된 웰에 대해 더 큰 접착을 나타내었다. 종합하면, 이 데이터는 KB103으로부터 발현된 인간 Col7 단백질이 형질도입 세포에서 기능성이었다는 것을 나타내었다. 이 단백질의 기능성은 LH3 단백질 수준을 증가시키고, TSP-1 단백질 수준을 감소시키며, 그리고 모의-감염 샘플에 비해 콜라겐 1과 파이브로넥틴 둘 다에 대한 세포 접착을 개선시키는 그의 능력에 의해 나타났다.
RDEB 기관형 배양물에서의 KB103 약리학 및 독성
RDEB 섬유모세포 및 각질세포로 구성된 피부 등가(SE) 기관형 배양물을 사용하여 기저막 구역(BMZ)에서 KB103으로부터 발현된 Col7 단백질의 발현을 평가하였다. RDEB 섬유모세포 및 각질세포를 모의 감염시키거나 또는 MOI 3으로 KB103에 의해 감염시키고, 상피로의 계층화 및 분화에 바람직하도록 5일 동안 항온처리시켰다. 피부 등가(SE)을 단리시키고, 절편화하고 나서, Col7 단백질 발현을 검출하기 위한 면역형광법을 위해 염색하였다. KB103으로 감염시킨 세포로부터의 이들 기관 배양물에서 Col7 발현을 검출하였고, BMZ에서 Col7 단백질 침착의 개시를 모의-감염 대조군에 대해 관찰하였다(도 10). 이 데이터는 KB103가 COL7A1을 전달하고 Col7 단백질을 효율적으로 발현시킬 뿐만 아니라, Col7 단백질이 생체내 Col7 단백질에 대해 예상되는 조직화 패턴과 유사하게 기관형 배양물에서 조직화하기 시작한다는 것을 시사한다.
전부 종합하면, 이들 실험은 처음 시기 동안 복제-결함성 HSV-1 벡터가 수포성 표피박리증 환자로부터 단리된 1차 세포 내로 COL7A1발현 카세트를 전달하기 위한 비히클로서 사용될 수 있다는 것을 나타내었다. 게다가, 이들 데이터는 건강한 개체뿐만 아니라 피부 장애를 앓는 개체로부터의 2종의 상이한 인간 세포에서 이 발현 카세트로부터 Col7 단백질이 고수준으로 발현될 수 있었다는 것을 나타내었다. 최종적으로, Col7 단백질은 기능성이되는 것으로 나타났는데, LH3의 발현을 증가시키고, TSP-1의 발현을 감소시키며, 콜라겐 1 및 파이브로넥틴에 대한 세포 접착을 증가시킬 수 있기 때문이며, 생체내 Col7의 조직과 유사한 패턴으로 기관형 배양물에서 조직화할 수 있다. 이론에 얽매이길 원치 않지만, 본 명세서에 제시된 데이터는 KB103 및 다른 HSV-1 벡터가 수포성 표피박리증 및/또는 다른 피부과적 적용을 위한 신규한 생체내 치료 전략으로서 유용할 수 있다는 것을 시사한다.
실시예 3: 복제 결핍성 HSV-1을 사용한 생체내 Col7 발현
이하의 실시예는 생체내 인간 Col7 단백질의 발현을 위한 전달 비히클로서 복제 결핍성 제1형 단순 포진 바이러스(인간 COL7A1 전이유전자를 함유하도록 변형됨)의 용도를 기재한다.
방법
KB103의 작제 및 정제
KB103 바이러스를 작제하고 상기 실시예 2에 기재한 바와 같이 정제하였다.
바이러스 감염
KB103 바이러스를 다음과 같이 피부내 주사에 의해 야생형 Balb/c 또는 skh1-엘리트 마우스에게 전달하였다: 각각의 동물에 50㎕ 용적으로 바이러스/부위의 1x108개의 플라크 형성 단위(plaque forming unit: PFU)로 동물의 옆구리 영역 내의 2 내지 4개 부위에 1회 주사하였다. KB103 투여 48시간 후에 동물을 희생시키고, 주사 부위를 채취하고 나서, 실시간 qPCR 또는 면역형광법 분석 중 하나를 위해 처리하였다.
qPCR 분석을 위해, 6㎜ 펀치 생검 도구를 이용하여 근막까지 피부 조직을 해부하였다. 생검을 2개 조각으로 2등분하고, 각각의 조각을 액체 질소를 이용하여 순간 냉동시켰다. 퀴아젠 올프렙(Qiagen AllPrep) DNA/RNA 키트를 이용하여 생검의 하나의 절반으로부터 총 RNA 및 DNA를 단리시켰다.
면역형광법 분석을 위해, 직경이 대략 1 cm인 원형 면적을 주사 부위에서 피부로부터 절개하였고, 절반으로 절단한 다음, 원형 면적의 중심 부분이 위쪽으로 향하도록 OCT에 장착하였다. 준비한 샘플을 액체 질소 냉각된 아이소펜탄으로 급속 냉동시키고, -80℃에서 저장하였다.
mRNA 정량화
2-단계 프로토콜을 이용하여 KB103 주사 후에 마우스 진피 조직으로부터 단리시킨 RNA로부터 Col7 전사물을 증폭시켰다: 1) 슈퍼스크립트 III(superscript III) 제1 가닥 합성 키트(써모피셔(Thermofisher), 카탈로그 번호 18-080-051)를 이용하여 cDNA 합성을 수행하였고, 그리고 2) 제조업자의 프로토콜에 따라 퀀티텍트 프로브(Quantitect Probe) PCR 키트(퀴아젠, 카탈로그 번호 204345)를 이용하여 qPCR 증폭을 수행하였다. 100ng의 cDNA를 각각의 반응에서 사용하였다. Col7 전사 수준을 GAPDH 전사 수준으로 정규화하였다.
게놈 복제 정량화
퀀티텍트 프로브 PCR 키트(퀴아젠 카탈로그 번호 204345)를 이용하여 qPCR 증폭에 의해 KB103 감염된 마우스에서 KB103 바이러스 게놈의 복제 수를 정량화하였다. 100ng의 마우스 게놈 DNA를 각각의 반응에서 사용하였고, 마우스 게놈 GAPDH를 대조군으로서 사용하였다.
면역형광법
KB103으로 주사한 마우스로부터의 조직 절편을 고정시키고, 후속적으로 1차 토끼 항-인간 Col7 다클론성 항체(시그마, 카탈로그 번호 HPA042420)로 염색하고, 세척 후, 추가로 형광 표지된 항-토끼 2차 항체(인비트로젠, 카탈로그 3 A11012)로 염색하였다. 표준 기법을 이용하는 DAPI에 의해 세포핵을 염색하였다.
결과
생체내 인간 Col7 단백질을 성공적으로 전달하고 발현시키는 KB103의 능력을 시험하기 위해, 마우스에 KB103 바이러스를 피부내로 투여하였다. 감염 마우스 조직에서의 바이러스 게놈 복제수를 평가하였고, KB103 바이러스 게놈의 고수준의 전달(>1,000,000 바이러스 게놈 복제수/100ng 마우스 DNA)을 마우스에서 관찰하였다(도 11). 다음에, 생체내 인간 Col7을 발현시키는 바이러스의 능력을 시험하였다. KB103-감염된 마우스에서 인간 Col7 전사물의 정량화를 측정하고 나서, 대조군 마우스 하우스키핑 유전자의 발현에 비교하여 평가하였다. 감염 마우스 조직에서 고수준의 인간 Col7 전사를 관찰하였는데(도 11), 이는 전달된 바이러스 게놈이 그들의 인간 유전자 화물(cargo)을 성공적으로 발현시킬 수 있다는 것을 시사한다. 최종적으로, Col7 단백질을 발현시키는 KB103의 능력을 감염된 마우스에서 시험하였다. 감염 후 마우스로부터 마우스 진피 조직을 절개하였고, 마우스 조직의 면역조직화학적 염색에 의해 Col7 단백질 발현을 평가하였다. 조직 염색 후에 고수준의 인간 Col7 단백질을 검출하였다(도 12). 놀랍게도, 마우스 진피에서 KB103 바이러스로부터 인간 Col7 단백질이 발현되었을 뿐만 아니라, KB103-감염된 마우스에서의 기저막 구역에서 인간 Col7의 침착 개시가 관찰되었다(도 12). 이론에 얽매이길 원치 않지만, 이 데이터는: 1) KB103 바이러스가 생체내 적절한 조직을 성공적으로 감염시켜 이들 조직에 높은 게놈 복제 수를 전달할 수 있고, 2) 적절한 조직에 대한 KB103 바이러스의 전달이 이 바이러스 상에서 암호화된 인간 유전자의 상당한 발현을 초래하며, 그리고 3) KB103이 생체내 인간 Col7 단백질을 성공적으로 발현시킬 뿐만 아니라, 영향받은 개체에서 내인성 Col7 결함을 구제하는 그의 능력을 시사하는 방법에서 이 단백질이 (예컨대 기저막 구역에서) 조직화를 시작할 수 있다는 것을 시사한다.
SEQUENCE LISTING
<110> Krystal Biotech, LLC
<120> COMPOSITIONS AND METHODS FOR THE
TREATMENT OF WOUNDS, DISORDERS, AND DISEASES OF THE SKIN
<130> WO/2017/176336
<140> WO/2017/176336
<141> 2016-12-28
<150> US 62/320,316
<151> 2016-04-08
<160> 30
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 8835
<212> DNA
<213> Homo sapiens
<400> 1
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg actga 8835
<210> 2
<211> 2944
<212> PRT
<213> Homo sapiens
<400> 2
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
<210> 3
<211> 2217
<212> DNA
<213> Homo sapiens
<400> 3
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga cccctga 2217
<210> 4
<211> 738
<212> PRT
<213> Homo sapiens
<400> 4
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro
<210> 5
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 5
agggccaaga ggggcagcgg cgagggcagg ggcagcctgc tgacctgcgg cgacgtggag 60
gagaaccccg gcccc 75
<210> 6
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 6
Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
1 5 10 15
Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25
<210> 7
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 7
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66
<210> 8
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 8
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 9
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 9
ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60
cctggacct 69
<210> 10
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 10
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 11
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 11
ggaagcggag tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60
tccaaccctg gacct 75
<210> 12
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 12
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 13
<211> 11121
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 13
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg acagggccaa gaggggcagc ggcgagggca ggggcagcct gctgacctgc 8880
ggcgacgtgg aggagaaccc cggccccacc tcctcggggc ctggaccccg gttcctgctg 8940
ctgctgccgc tgctgctgcc ccctgcggcc tcagcctccg accggccccg gggccgagac 9000
ccggtcaacc cagagaagct gctggtgatc actgtggcca cagctgaaac cgaggggtac 9060
ctgcgtttcc tgcgctctgc ggagttcttc aactacactg tgcggaccct gggcctggga 9120
gaggagtggc gagggggtga tgtggctcga acagttggtg gaggacagaa ggtccggtgg 9180
ttaaagaagg aaatggagaa atacgctgac cgggaggata tgatcatcat gtttgtggat 9240
agctacgacg tgattctggc cggcagcccc acagagctgc tgaagaagtt cgtccagagt 9300
ggcagccgcc tgctcttctc tgcagagagc ttctgctggc ccgagtgggg gctggcggag 9360
cagtaccctg aggtgggcac ggggaagcgc ttcctcaatt ctggtggatt catcggtttt 9420
gccaccacca tccaccaaat cgtgcgccag tggaagtaca aggatgatga cgacgaccag 9480
ctgttctaca cacggctcta cctggaccca ggactgaggg agaaactcag ccttaatctg 9540
gatcataagt ctcggatctt tcagaacctc aacggggctt tagatgaagt ggttttaaag 9600
tttgatcgga accgtgtgcg tatccggaac gtggcctacg acacgctccc cattgtggtc 9660
catggaaacg gtcccactaa gctgcagctc aactacctgg gaaactacgt ccccaatggc 9720
tggactcctg agggaggctg tggcttctgc aaccaggacc ggaggacact cccggggggg 9780
cagcctcccc cccgggtgtt tctggccgtg tttgtggaac agcctactcc gtttctgccc 9840
cgcttcctgc agcggctgct actcctggac tatccccccg acagggtcac ccttttcctg 9900
cacaacaacg aggtcttcca tgaaccccac atcgctgact cctggccgca gctccaggac 9960
cacttctcag ctgtgaagct cgtggggccg gaggaggctc tgagcccagg cgaggccagg 10020
gacatggcca tggacctgtg tcggcaggac cccgagtgtg agttctactt cagcctggac 10080
gccgacgctg tcctcaccaa cctgcagacc ctgcgtatcc tcattgagga gaacaggaag 10140
gtgatcgccc ccatgctgtc ccgccacggc aagctgtggt ccaacttctg gggcgccctg 10200
agccccgatg agtactacgc ccgctccgag gactacgtgg agctggtgca gcggaagcga 10260
gtgggtgtgt ggaatgtacc atacatctcc caggcctatg tgatccgggg tgataccctg 10320
cggatggagc tgccccagag ggatgtgttc tcgggcagtg acacagaccc ggacatggcc 10380
ttctgtaaga gctttcgaga caagggcatc ttcctccatc tgagcaatca gcatgaattt 10440
ggccggctcc tggccacttc cagatacgac acggagcacc tgcaccccga cctctggcag 10500
atcttcgaca accccgtcga ctggaaggag cagtacatcc acgagaacta cagccgggcc 10560
ctggaagggg aaggaatcgt ggagcagcca tgcccggacg tgtactggtt cccactgctg 10620
tcagaacaaa tgtgtgatga gctggtggca gagatggagc actacggcca gtggtcaggc 10680
ggccggcatg aggattcaag gctggctgga ggctacgaga atgtgcccac cgtggacatc 10740
cacatgaagc aggtggggta cgaggaccag tggctgcagc tgctgcggac gtatgtgggc 10800
cccatgaccg agagcctgtt tcccggttac cacaccaagg cgcgggcggt gatgaacttt 10860
gtggttcgct accggccaga cgagcagccg tctctgcggc cacaccacga ctcatccacc 10920
ttcaccctca acgttgccct caaccacaag ggcctggact atgagggagg tggctgccgc 10980
ttcctgcgct acgactgtgt gatctcctcc ccgaggaagg gctgggcact cctgcacccc 11040
ggccgcctca cccactacca cgaggggctg ccaacgacct ggggcacacg ctacatcatg 11100
gtgtcctttg tcgacccctg a 11121
<210> 14
<211> 3706
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 14
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
2945 2950 2955 2960
Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro
2965 2970 2975
Arg Phe Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala
2980 2985 2990
Ser Asp Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu
2995 3000 3005
Val Ile Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu
3010 3015 3020
Arg Ser Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly
3025 3030 3035 3040
Glu Glu Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln
3045 3050 3055
Lys Val Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu
3060 3065 3070
Asp Met Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly
3075 3080 3085
Ser Pro Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu
3090 3095 3100
Leu Phe Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu
3105 3110 3115 3120
Gln Tyr Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly
3125 3130 3135
Phe Ile Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys
3140 3145 3150
Tyr Lys Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu
3155 3160 3165
Asp Pro Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser
3170 3175 3180
Arg Ile Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys
3185 3190 3195 3200
Phe Asp Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu
3205 3210 3215
Pro Ile Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr
3220 3225 3230
Leu Gly Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly
3235 3240 3245
Phe Cys Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro
3250 3255 3260
Arg Val Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro
3265 3270 3275 3280
Arg Phe Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val
3285 3290 3295
Thr Leu Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala
3300 3305 3310
Asp Ser Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val
3315 3320 3325
Gly Pro Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met
3330 3335 3340
Asp Leu Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp
3345 3350 3355 3360
Ala Asp Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu
3365 3370 3375
Glu Asn Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu
3380 3385 3390
Trp Ser Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg
3395 3400 3405
Ser Glu Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp
3410 3415 3420
Asn Val Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu
3425 3430 3435 3440
Arg Met Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp
3445 3450 3455
Pro Asp Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu
3460 3465 3470
His Leu Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg
3475 3480 3485
Tyr Asp Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn
3490 3495 3500
Pro Val Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala
3505 3510 3515 3520
Leu Glu Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp
3525 3530 3535
Phe Pro Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met
3540 3545 3550
Glu His Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu
3555 3560 3565
Ala Gly Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln
3570 3575 3580
Val Gly Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly
3585 3590 3595 3600
Pro Met Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala
3605 3610 3615
Val Met Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu
3620 3625 3630
Arg Pro His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn
3635 3640 3645
His Lys Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr
3650 3655 3660
Asp Cys Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro
3665 3670 3675 3680
Gly Arg Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr
3685 3690 3695
Arg Tyr Ile Met Val Ser Phe Val Asp Pro
3700 3705
<210> 15
<211> 11121
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 15
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccagggcc 2220
aagaggggca gcggcgaggg caggggcagc ctgctgacct gcggcgacgt ggaggagaac 2280
cccggcccca cgctgcggct tctggtggcc gcgctctgcg ccgggatcct ggcagaggcg 2340
ccccgagtgc gagcccagca cagggagaga gtgacctgca cgcgccttta cgccgctgac 2400
attgtgttct tactggatgg ctcctcatcc attggccgca gcaatttccg cgaggtccgc 2460
agctttctcg aagggctggt gctgcctttc tctggagcag ccagtgcaca gggtgtgcgc 2520
tttgccacag tgcagtacag cgatgaccca cggacagagt tcggcctgga tgcacttggc 2580
tctgggggtg atgtgatccg cgccatccgt gagcttagct acaagggggg caacactcgc 2640
acaggggctg caattctcca tgtggctgac catgtcttcc tgccccagct ggcccgacct 2700
ggtgtcccca aggtctgcat cctgatcaca gacgggaagt cccaggacct ggtggacaca 2760
gctgcccaaa ggctgaaggg gcagggggtc aagctatttg ctgtggggat caagaatgct 2820
gaccctgagg agctgaagcg agttgcctca cagcccacca gtgacttctt cttcttcgtc 2880
aatgacttca gcatcttgag gacactactg cccctcgttt cccggagagt gtgcacgact 2940
gctggtggcg tgcctgtgac ccgacctccg gatgactcga cctctgctcc acgagacctg 3000
gtgctgtctg agccaagcag ccaatccttg agagtacagt ggacagcggc cagtggccct 3060
gtgactggct acaaggtcca gtacactcct ctgacggggc tgggacagcc actgccgagt 3120
gagcggcagg aggtgaacgt cccagctggt gagaccagtg tgcggctgcg gggtctccgg 3180
ccactgaccg agtaccaagt gactgtgatt gccctctacg ccaacagcat cggggaggct 3240
gtgagcggga cagctcggac cactgcccta gaagggccgg aactgaccat ccagaatacc 3300
acagcccaca gcctcctggt ggcctggcgg agtgtgccag gtgccactgg ctaccgtgtg 3360
acatggcggg tcctcagtgg tgggcccaca cagcagcagg agctgggccc tgggcagggt 3420
tcagtgttgc tgcgtgactt ggagcctggc acggactatg aggtgaccgt gagcacccta 3480
tttggccgca gtgtggggcc cgccacttcc ctgatggctc gcactgacgc ttctgttgag 3540
cagaccctgc gcccggtcat cctgggcccc acatccatcc tcctttcctg gaacttggtg 3600
cctgaggccc gtggctaccg gttggaatgg cggcgtgaga ctggcttgga gccaccgcag 3660
aaggtggtac tgccctctga tgtgacccgc taccagttgg atgggctgca gccgggcact 3720
gagtaccgcc tcacactcta cactctgctg gagggccacg aggtggccac ccctgcaacc 3780
gtggttccca ctggaccaga gctgcctgtg agccctgtaa cagacctgca agccaccgag 3840
ctgcccgggc agcgggtgcg agtgtcctgg agcccagtcc ctggtgccac ccagtaccgc 3900
atcattgtgc gcagcaccca gggggttgag cggaccctgg tgcttcctgg gagtcagaca 3960
gcattcgact tggatgacgt tcaggctggg cttagctaca ctgtgcgggt gtctgctcga 4020
gtgggtcccc gtgagggcag tgccagtgtc ctcactgtcc gccgggagcc ggaaactcca 4080
cttgctgttc cagggctgcg ggttgtggtg tcagatgcaa cgcgagtgag ggtggcctgg 4140
ggacccgtcc ctggagccag tggatttcgg attagctgga gcacaggcag tggtccggag 4200
tccagccaga cactgccccc agactctact gccacagaca tcacagggct gcagcctgga 4260
accacctacc aggtggctgt gtcggtactg cgaggcagag aggagggccc tgctgcagtc 4320
atcgtggctc gaacggaccc actgggccca gtgaggacgg tccatgtgac tcaggccagc 4380
agctcatctg tcaccattac ctggaccagg gttcctggcg ccacaggata cagggtttcc 4440
tggcactcag cccacggccc agagaaatcc cagttggttt ctggggaggc cacggtggct 4500
gagctggatg gactggagcc agatactgag tatacggtgc atgtgagggc ccatgtggct 4560
ggcgtggatg ggccccctgc ctctgtggtt gtgaggactg cccctgagcc tgtgggtcgt 4620
gtgtcgaggc tgcagatcct caatgcttcc agcgacgttc tacggatcac ctgggtaggg 4680
gtcactggag ccacagctta cagactggcc tggggccgga gtgaaggcgg ccccatgagg 4740
caccagatac tcccaggaaa cacagactct gcagagatcc ggggtctcga aggtggagtc 4800
agctactcag tgcgagtgac tgcacttgtc ggggaccgcg agggcacacc tgtctccatt 4860
gttgtcacta cgccgcctga ggctccgcca gccctgggga cgcttcacgt ggtgcagcgc 4920
ggggagcact cgctgaggct gcgctgggag ccggtgccca gagcgcaggg cttccttctg 4980
cactggcaac ctgagggtgg ccaggaacag tcccgggtcc tggggcccga gctcagcagc 5040
tatcacctgg acgggctgga gccagcgaca cagtaccgcg tgaggctgag tgtcctaggg 5100
ccagctggag aagggccctc tgcagaggtg actgcgcgca ctgagtcacc tcgtgttcca 5160
agcattgaac tacgtgtggt ggacacctcg atcgactcgg tgactttggc ctggactcca 5220
gtgtccaggg catccagcta catcctatcc tggcggccac tcagaggccc tggccaggaa 5280
gtgcctgggt ccccgcagac acttccaggg atctcaagct cccagcgggt gacagggcta 5340
gagcctggcg tctcttacat cttctccctg acgcctgtcc tggatggtgt gcggggtcct 5400
gaggcatctg tcacacagac gccagtgtgc ccccgtggcc tggcggatgt ggtgttccta 5460
ccacatgcca ctcaagacaa tgctcaccgt gcggaggcta cgaggagggt cctggagcgt 5520
ctggtgttgg cacttgggcc tcttgggcca caggcagttc aggttggcct gctgtcttac 5580
agtcatcggc cctccccact gttcccactg aatggctccc atgaccttgg cattatcttg 5640
caaaggatcc gtgacatgcc ctacatggac ccaagtggga acaacctggg cacagccgtg 5700
gtcacagctc acagatacat gttggcacca gatgctcctg ggcgccgcca gcacgtacca 5760
ggggtgatgg ttctgctagt ggatgaaccc ttgagaggtg acatattcag ccccatccgt 5820
gaggcccagg cttctgggct taatgtggtg atgttgggaa tggctggagc ggacccagag 5880
cagctgcgtc gcttggcgcc gggtatggac tctgtccaga ccttcttcgc cgtggatgat 5940
gggccaagcc tggaccaggc agtcagtggt ctggccacag ccctgtgtca ggcatccttc 6000
actactcagc cccggccaga gccctgccca gtgtattgtc caaagggcca gaagggggaa 6060
cctggagaga tgggcctgag aggacaagtt gggcctcctg gcgaccctgg cctcccgggc 6120
aggaccggtg ctcccggccc ccaggggccc cctggaagtg ccactgccaa gggcgagagg 6180
ggcttccctg gagcagatgg gcgtccaggc agccctggcc gcgccgggaa tcctgggacc 6240
cctggagccc ctggcctaaa gggctctcca gggttgcctg gccctcgtgg ggacccggga 6300
gagcgaggac ctcgaggccc aaagggggag ccgggggctc ccggacaagt catcggaggt 6360
gaaggacctg ggcttcctgg gcggaaaggg gaccctggac catcgggccc ccctggacct 6420
cgtggaccac tgggggaccc aggaccccgt ggccccccag ggcttcctgg aacagccatg 6480
aagggtgaca aaggcgatcg tggggagcgg ggtccccctg gaccaggtga aggtggcatt 6540
gctcctgggg agcctgggct gccgggtctt cccggaagcc ctggacccca aggccccgtt 6600
ggcccccctg gaaagaaagg agaaaaaggt gactctgagg atggagctcc aggcctccca 6660
ggacaacctg ggtctccggg tgagcagggc ccacggggac ctcctggagc tattggcccc 6720
aaaggtgacc ggggctttcc agggcccctg ggtgaggctg gagagaaggg cgaacgtgga 6780
cccccaggcc cagcgggatc ccgggggctg ccaggggttg ctggacgtcc tggagccaag 6840
ggtcctgaag ggccaccagg acccactggc cgccaaggag agaaggggga gcctggtcgc 6900
cctggggacc ctgcagtggt gggacctgct gttgctggac ccaaaggaga aaagggagat 6960
gtggggcccg ctgggcccag aggagctacc ggagtccaag gggaacgggg cccacccggc 7020
ttggttcttc ctggagaccc tggccccaag ggagaccctg gagaccgggg tcccattggc 7080
cttactggca gagcaggacc cccaggtgac tcagggcctc ctggagagaa gggagaccct 7140
gggcggcctg gccccccagg acctgttggc ccccgaggac gagatggtga agttggagag 7200
aaaggtgacg agggtcctcc gggtgacccg ggtttgcctg gaaaagcagg cgagcgtggc 7260
cttcgggggg cacctggagt tcgggggcct gtgggtgaaa agggagacca gggagatcct 7320
ggagaggatg gacgaaatgg cagccctgga tcatctggac ccaagggtga ccgtggggag 7380
ccgggtcccc caggaccccc gggacggctg gtagacacag gacctggagc cagagagaag 7440
ggagagcctg gggaccgcgg acaagagggt cctcgagggc ccaagggtga tcctggcctc 7500
cctggagccc ctggggaaag gggcattgaa gggtttcggg gacccccagg cccacagggg 7560
gacccaggtg tccgaggccc agcaggagaa aagggtgacc ggggtccccc tgggctggat 7620
ggccggagcg gactggatgg gaaaccagga gccgctgggc cctctgggcc gaatggtgct 7680
gcaggcaaag ctggggaccc agggagagac gggcttccag gcctccgtgg agaacagggc 7740
ctccctggcc cctctggtcc ccctggatta ccgggaaagc caggcgagga tggcaaacct 7800
ggcctgaatg gaaaaaacgg agaacctggg gaccctggag aagacgggag gaagggagag 7860
aaaggagatt caggcgcctc tgggagagaa ggtcgtgatg gccccaaggg tgagcgtgga 7920
gctcctggta tccttggacc ccaggggcct ccaggcctcc cagggccagt gggccctcct 7980
ggccagggtt ttcctggtgt cccaggaggc acgggcccca agggtgaccg tggggagact 8040
ggatccaaag gggagcaggg cctccctgga gagcgtggcc tgcgaggaga gcctggaagt 8100
gtgccgaatg tggatcggtt gctggaaact gctggcatca aggcatctgc cctgcgggag 8160
atcgtggaga cctgggatga gagctctggt agcttcctgc ctgtgcccga acggcgtcga 8220
ggccccaagg gggactcagg cgaacagggc cccccaggca aggagggccc catcggcttt 8280
cctggagaac gcgggctgaa gggcgaccgt ggagaccctg gccctcaggg gccacctggt 8340
ctggcccttg gggagagggg cccccccggg ccttccggcc ttgccgggga gcctggaaag 8400
cctggtattc ccgggctccc aggcagggct gggggtgtgg gagaggcagg aaggccagga 8460
gagaggggag aacggggaga gaaaggagaa cgtggagaac agggcagaga tggccctcct 8520
ggactccctg gaacccctgg gccccccgga ccccctggcc ccaaggtgtc tgtggatgag 8580
ccaggtcctg gactctctgg agaacaggga ccccctggac tcaagggtgc taagggggag 8640
ccgggcagca atggtgacca aggtcccaaa ggagacaggg gtgtgccagg catcaaagga 8700
gaccggggag agcctggacc gaggggtcag gacggcaacc cgggtctacc aggagagcgt 8760
ggtatggctg ggcctgaagg gaagccgggt ctgcagggtc caagaggccc ccctggccca 8820
gtgggtggtc atggagaccc tggaccacct ggtgccccgg gtcttgctgg ccctgcagga 8880
ccccaaggac cttctggcct gaagggggag cctggagaga caggacctcc aggacggggc 8940
ctgactggac ctactggagc tgtgggactt cctggacccc ccggcccttc aggccttgtg 9000
ggtccacagg ggtctccagg tttgcctgga caagtggggg agacagggaa gccgggagcc 9060
ccaggtcgag atggtgccag tggaaaagat ggagacagag ggagccctgg tgtgccaggg 9120
tcaccaggtc tgcctggccc tgtcggacct aaaggagaac ctggccccac gggggcccct 9180
ggacaggctg tggtcgggct ccctggagca aagggagaga agggagcccc tggaggcctt 9240
gctggagacc tggtgggtga gccgggagcc aaaggtgacc gaggactgcc agggccgcga 9300
ggcgagaagg gtgaagctgg ccgtgcaggg gagcccggag accctgggga agatggtcag 9360
aaaggggctc caggacccaa aggtttcaag ggtgacccag gagtcggggt cccgggctcc 9420
cctgggcctc ctggccctcc aggtgtgaag ggagatctgg gcctccctgg cctgcccggt 9480
gctcctggtg ttgttgggtt cccgggtcag acaggccctc gaggagagat gggtcagcca 9540
ggccctagtg gagagcgggg tctggcaggc cccccaggga gagaaggaat cccaggaccc 9600
ctggggccac ctggaccacc ggggtcagtg ggaccacctg gggcctctgg actcaaagga 9660
gacaagggag accctggagt agggctgcct gggccccgag gcgagcgtgg ggagccaggc 9720
atccggggtg aagatggccg ccccggccag gagggacccc gaggactcac ggggccccct 9780
ggcagcaggg gagagcgtgg ggagaagggt gatgttggga gtgcaggact aaagggtgac 9840
aagggagact cagctgtgat cctggggcct ccaggcccac ggggtgccaa gggggacatg 9900
ggtgaacgag ggcctcgggg cttggatggt gacaaaggac ctcggggaga caatggggac 9960
cctggtgaca agggcagcaa gggagagcct ggtgacaagg gctcagccgg gttgccagga 10020
ctgcgtggac tcctgggacc ccagggtcaa cctggtgcag cagggatccc tggtgacccg 10080
ggatccccag gaaaggatgg agtgcctggt atccgaggag aaaaaggaga tgttggcttc 10140
atgggtcccc ggggcctcaa gggtgaacgg ggagtgaagg gagcctgtgg ccttgatgga 10200
gagaagggag acaagggaga agctggtccc ccaggccgcc ccgggctggc aggacacaaa 10260
ggagagatgg gggagcctgg tgtgccgggc cagtcggggg cccctggcaa ggagggcctg 10320
atcggtccca agggtgaccg aggctttgac gggcagccag gccccaaggg tgaccagggc 10380
gagaaagggg agcggggaac cccaggaatt gggggcttcc caggccccag tggaaatgat 10440
ggctctgctg gtcccccagg gccacctggc agtgttggtc ccagaggccc cgaaggactt 10500
cagggccaga agggtgagcg aggtcccccc ggagagagag tggtgggggc tcctggggtc 10560
cctggagctc ctggcgagag aggggagcag gggcggccag ggcctgccgg tcctcgaggc 10620
gagaagggag aagctgcact gacggaggat gacatccggg gctttgtgcg ccaagagatg 10680
agtcagcact gtgcctgcca gggccagttc atcgcatctg gatcacgacc cctccctagt 10740
tatgctgcag acactgccgg ctcccagctc catgctgtgc ctgtgctccg cgtctctcat 10800
gcagaggagg aagagcgggt accccctgag gatgatgagt actctgaata ctccgagtat 10860
tctgtggagg agtaccagga ccctgaagct ccttgggata gtgatgaccc ctgttccctg 10920
ccactggatg agggctcctg cactgcctac accctgcgct ggtaccatcg ggctgtgaca 10980
ggcagcacag aggcctgtca cccttttgtc tatggtggct gtggagggaa tgccaaccgt 11040
tttgggaccc gtgaggcctg cgagcgccgc tgcccacccc gggtggtcca gagccagggg 11100
acaggtactg cccaggactg a 11121
<210> 16
<211> 3706
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 16
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu
740 745 750
Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Leu Arg Leu Leu
755 760 765
Val Ala Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg
770 775 780
Ala Gln His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp
785 790 795 800
Ile Val Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe
805 810 815
Arg Glu Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly
820 825 830
Ala Ala Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp
835 840 845
Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp
850 855 860
Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg
865 870 875 880
Thr Gly Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln
885 890 895
Leu Ala Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly
900 905 910
Lys Ser Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln
915 920 925
Gly Val Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu
930 935 940
Leu Lys Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val
945 950 955 960
Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg
965 970 975
Val Cys Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp
980 985 990
Ser Thr Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln
995 1000 1005
Ser Leu Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr
1010 1015 1020
Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser
1025 1030 1035 1040
Glu Arg Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu
1045 1050 1055
Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu
1060 1065 1070
Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr
1075 1080 1085
Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser
1090 1095 1100
Leu Leu Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val
1105 1110 1115 1120
Thr Trp Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly
1125 1130 1135
Pro Gly Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp
1140 1145 1150
Tyr Glu Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala
1155 1160 1165
Thr Ser Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg
1170 1175 1180
Pro Val Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val
1185 1190 1195 1200
Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu
1205 1210 1215
Glu Pro Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln
1220 1225 1230
Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr
1235 1240 1245
Leu Leu Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr
1250 1255 1260
Gly Pro Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu
1265 1270 1275 1280
Leu Pro Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala
1285 1290 1295
Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr
1300 1305 1310
Leu Val Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln
1315 1320 1325
Ala Gly Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg
1330 1335 1340
Glu Gly Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro
1345 1350 1355 1360
Leu Ala Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val
1365 1370 1375
Arg Val Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser
1380 1385 1390
Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp
1395 1400 1405
Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln
1410 1415 1420
Val Ala Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val
1425 1430 1435 1440
Ile Val Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val
1445 1450 1455
Thr Gln Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro
1460 1465 1470
Gly Ala Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu
1475 1480 1485
Lys Ser Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly
1490 1495 1500
Leu Glu Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala
1505 1510 1515 1520
Gly Val Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu
1525 1530 1535
Pro Val Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp
1540 1545 1550
Val Leu Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg
1555 1560 1565
Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu
1570 1575 1580
Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val
1585 1590 1595 1600
Ser Tyr Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr
1605 1610 1615
Pro Val Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu
1620 1625 1630
Gly Thr Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg
1635 1640 1645
Trp Glu Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro
1650 1655 1660
Glu Gly Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser
1665 1670 1675 1680
Tyr His Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu
1685 1690 1695
Ser Val Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala
1700 1705 1710
Arg Thr Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp
1715 1720 1725
Thr Ser Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala
1730 1735 1740
Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu
1745 1750 1755 1760
Val Pro Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg
1765 1770 1775
Val Thr Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro
1780 1785 1790
Val Leu Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro
1795 1800 1805
Val Cys Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr
1810 1815 1820
Gln Asp Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg
1825 1830 1835 1840
Leu Val Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly
1845 1850 1855
Leu Leu Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly
1860 1865 1870
Ser His Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr
1875 1880 1885
Met Asp Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His
1890 1895 1900
Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro
1905 1910 1915 1920
Gly Val Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe
1925 1930 1935
Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu
1940 1945 1950
Gly Met Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly
1955 1960 1965
Met Asp Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu
1970 1975 1980
Asp Gln Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe
1985 1990 1995 2000
Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly
2005 2010 2015
Gln Lys Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro
2020 2025 2030
Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln
2035 2040 2045
Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly
2050 2055 2060
Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr
2065 2070 2075 2080
Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg
2085 2090 2095
Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly
2100 2105 2110
Ala Pro Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg
2115 2120 2125
Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu
2130 2135 2140
Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met
2145 2150 2155 2160
Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly
2165 2170 2175
Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly
2180 2185 2190
Ser Pro Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu
2195 2200 2205
Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly
2210 2215 2220
Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro
2225 2230 2235 2240
Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys
2245 2250 2255
Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly
2260 2265 2270
Val Ala Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro
2275 2280 2285
Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro
2290 2295 2300
Ala Val Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp
2305 2310 2315 2320
Val Gly Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg
2325 2330 2335
Gly Pro Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp
2340 2345 2350
Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro
2355 2360 2365
Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly
2370 2375 2380
Pro Pro Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu
2385 2390 2395 2400
Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala
2405 2410 2415
Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly
2420 2425 2430
Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser
2435 2440 2445
Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro
2450 2455 2460
Gly Pro Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys
2465 2470 2475 2480
Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly
2485 2490 2495
Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe
2500 2505 2510
Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala
2515 2520 2525
Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly
2530 2535 2540
Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala
2545 2550 2555 2560
Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg
2565 2570 2575
Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly
2580 2585 2590
Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu
2595 2600 2605
Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser
2610 2615 2620
Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly
2625 2630 2635 2640
Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro
2645 2650 2655
Val Gly Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly
2660 2665 2670
Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu
2675 2680 2685
Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val
2690 2695 2700
Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu
2705 2710 2715 2720
Ile Val Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro
2725 2730 2735
Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro
2740 2745 2750
Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly
2755 2760 2765
Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly
2770 2775 2780
Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys
2785 2790 2795 2800
Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala
2805 2810 2815
Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly
2820 2825 2830
Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro
2835 2840 2845
Pro Gly Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly
2850 2855 2860
Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu
2865 2870 2875 2880
Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro
2885 2890 2895
Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly
2900 2905 2910
Asn Pro Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys
2915 2920 2925
Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His
2930 2935 2940
Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly
2945 2950 2955 2960
Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro
2965 2970 2975
Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly
2980 2985 2990
Pro Pro Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu
2995 3000 3005
Pro Gly Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp
3010 3015 3020
Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly
3025 3030 3035 3040
Ser Pro Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro
3045 3050 3055
Thr Gly Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly
3060 3065 3070
Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro
3075 3080 3085
Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly
3090 3095 3100
Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln
3105 3110 3115 3120
Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly
3125 3130 3135
Val Pro Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp
3140 3145 3150
Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro
3155 3160 3165
Gly Gln Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly
3170 3175 3180
Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro
3185 3190 3195 3200
Leu Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser
3205 3210 3215
Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro
3220 3225 3230
Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro
3235 3240 3245
Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly
3250 3255 3260
Glu Arg Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp
3265 3270 3275 3280
Lys Gly Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala
3285 3290 3295
Lys Gly Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys
3300 3305 3310
Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly
3315 3320 3325
Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu
3330 3335 3340
Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro
3345 3350 3355 3360
Gly Ser Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly
3365 3370 3375
Asp Val Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val
3380 3385 3390
Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala
3395 3400 3405
Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly
3410 3415 3420
Glu Pro Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu
3425 3430 3435 3440
Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys
3445 3450 3455
Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly
3460 3465 3470
Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro
3475 3480 3485
Pro Gly Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys
3490 3495 3500
Gly Glu Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val
3505 3510 3515 3520
Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala
3525 3530 3535
Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile
3540 3545 3550
Arg Gly Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly
3555 3560 3565
Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp
3570 3575 3580
Thr Ala Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His
3585 3590 3595 3600
Ala Glu Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu
3605 3610 3615
Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp
3620 3625 3630
Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr
3635 3640 3645
Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu
3650 3655 3660
Ala Cys His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg
3665 3670 3675 3680
Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val
3685 3690 3695
Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
3700 3705
<210> 17
<211> 11112
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 17
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg acggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 8880
gaggagaacc ctggacctac ctcctcgggg cctggacccc ggttcctgct gctgctgccg 8940
ctgctgctgc cccctgcggc ctcagcctcc gaccggcccc ggggccgaga cccggtcaac 9000
ccagagaagc tgctggtgat cactgtggcc acagctgaaa ccgaggggta cctgcgtttc 9060
ctgcgctctg cggagttctt caactacact gtgcggaccc tgggcctggg agaggagtgg 9120
cgagggggtg atgtggctcg aacagttggt ggaggacaga aggtccggtg gttaaagaag 9180
gaaatggaga aatacgctga ccgggaggat atgatcatca tgtttgtgga tagctacgac 9240
gtgattctgg ccggcagccc cacagagctg ctgaagaagt tcgtccagag tggcagccgc 9300
ctgctcttct ctgcagagag cttctgctgg cccgagtggg ggctggcgga gcagtaccct 9360
gaggtgggca cggggaagcg cttcctcaat tctggtggat tcatcggttt tgccaccacc 9420
atccaccaaa tcgtgcgcca gtggaagtac aaggatgatg acgacgacca gctgttctac 9480
acacggctct acctggaccc aggactgagg gagaaactca gccttaatct ggatcataag 9540
tctcggatct ttcagaacct caacggggct ttagatgaag tggttttaaa gtttgatcgg 9600
aaccgtgtgc gtatccggaa cgtggcctac gacacgctcc ccattgtggt ccatggaaac 9660
ggtcccacta agctgcagct caactacctg ggaaactacg tccccaatgg ctggactcct 9720
gagggaggct gtggcttctg caaccaggac cggaggacac tcccgggggg gcagcctccc 9780
ccccgggtgt ttctggccgt gtttgtggaa cagcctactc cgtttctgcc ccgcttcctg 9840
cagcggctgc tactcctgga ctatcccccc gacagggtca cccttttcct gcacaacaac 9900
gaggtcttcc atgaacccca catcgctgac tcctggccgc agctccagga ccacttctca 9960
gctgtgaagc tcgtggggcc ggaggaggct ctgagcccag gcgaggccag ggacatggcc 10020
atggacctgt gtcggcagga ccccgagtgt gagttctact tcagcctgga cgccgacgct 10080
gtcctcacca acctgcagac cctgcgtatc ctcattgagg agaacaggaa ggtgatcgcc 10140
cccatgctgt cccgccacgg caagctgtgg tccaacttct ggggcgccct gagccccgat 10200
gagtactacg cccgctccga ggactacgtg gagctggtgc agcggaagcg agtgggtgtg 10260
tggaatgtac catacatctc ccaggcctat gtgatccggg gtgataccct gcggatggag 10320
ctgccccaga gggatgtgtt ctcgggcagt gacacagacc cggacatggc cttctgtaag 10380
agctttcgag acaagggcat cttcctccat ctgagcaatc agcatgaatt tggccggctc 10440
ctggccactt ccagatacga cacggagcac ctgcaccccg acctctggca gatcttcgac 10500
aaccccgtcg actggaagga gcagtacatc cacgagaact acagccgggc cctggaaggg 10560
gaaggaatcg tggagcagcc atgcccggac gtgtactggt tcccactgct gtcagaacaa 10620
atgtgtgatg agctggtggc agagatggag cactacggcc agtggtcagg cggccggcat 10680
gaggattcaa ggctggctgg aggctacgag aatgtgccca ccgtggacat ccacatgaag 10740
caggtggggt acgaggacca gtggctgcag ctgctgcgga cgtatgtggg ccccatgacc 10800
gagagcctgt ttcccggtta ccacaccaag gcgcgggcgg tgatgaactt tgtggttcgc 10860
taccggccag acgagcagcc gtctctgcgg ccacaccacg actcatccac cttcaccctc 10920
aacgttgccc tcaaccacaa gggcctggac tatgagggag gtggctgccg cttcctgcgc 10980
tacgactgtg tgatctcctc cccgaggaag ggctgggcac tcctgcaccc cggccgcctc 11040
acccactacc acgaggggct gccaacgacc tggggcacac gctacatcat ggtgtccttt 11100
gtcgacccct ga 11112
<210> 18
<211> 3703
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 18
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
2945 2950 2955 2960
Glu Glu Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu
2965 2970 2975
Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg
2980 2985 2990
Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr
2995 3000 3005
Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala
3010 3015 3020
Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp
3025 3030 3035 3040
Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg
3045 3050 3055
Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile
3060 3065 3070
Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr
3075 3080 3085
Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser
3090 3095 3100
Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro
3105 3110 3115 3120
Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly
3125 3130 3135
Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp
3140 3145 3150
Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly
3155 3160 3165
Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe
3170 3175 3180
Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg
3185 3190 3195 3200
Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val
3205 3210 3215
Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn
3220 3225 3230
Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn
3235 3240 3245
Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe
3250 3255 3260
Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu
3265 3270 3275 3280
Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe
3285 3290 3295
Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala Asp Ser Trp
3300 3305 3310
Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val Gly Pro Glu
3315 3320 3325
Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys
3330 3335 3340
Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala
3345 3350 3355 3360
Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg
3365 3370 3375
Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn
3380 3385 3390
Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp
3395 3400 3405
Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro
3410 3415 3420
Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu
3425 3430 3435 3440
Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met
3445 3450 3455
Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser
3460 3465 3470
Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr
3475 3480 3485
Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp
3490 3495 3500
Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly
3505 3510 3515 3520
Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu
3525 3530 3535
Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr
3540 3545 3550
Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly
3555 3560 3565
Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln Val Gly Tyr
3570 3575 3580
Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr
3585 3590 3595 3600
Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn
3605 3610 3615
Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His
3620 3625 3630
His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly
3635 3640 3645
Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val
3650 3655 3660
Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu
3665 3670 3675 3680
Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile
3685 3690 3695
Met Val Ser Phe Val Asp Pro
3700
<210> 19
<211> 11112
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 19
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220
ggagctacta acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct 2280
acgctgcggc ttctggtggc cgcgctctgc gccgggatcc tggcagaggc gccccgagtg 2340
cgagcccagc acagggagag agtgacctgc acgcgccttt acgccgctga cattgtgttc 2400
ttactggatg gctcctcatc cattggccgc agcaatttcc gcgaggtccg cagctttctc 2460
gaagggctgg tgctgccttt ctctggagca gccagtgcac agggtgtgcg ctttgccaca 2520
gtgcagtaca gcgatgaccc acggacagag ttcggcctgg atgcacttgg ctctgggggt 2580
gatgtgatcc gcgccatccg tgagcttagc tacaaggggg gcaacactcg cacaggggct 2640
gcaattctcc atgtggctga ccatgtcttc ctgccccagc tggcccgacc tggtgtcccc 2700
aaggtctgca tcctgatcac agacgggaag tcccaggacc tggtggacac agctgcccaa 2760
aggctgaagg ggcagggggt caagctattt gctgtgggga tcaagaatgc tgaccctgag 2820
gagctgaagc gagttgcctc acagcccacc agtgacttct tcttcttcgt caatgacttc 2880
agcatcttga ggacactact gcccctcgtt tcccggagag tgtgcacgac tgctggtggc 2940
gtgcctgtga cccgacctcc ggatgactcg acctctgctc cacgagacct ggtgctgtct 3000
gagccaagca gccaatcctt gagagtacag tggacagcgg ccagtggccc tgtgactggc 3060
tacaaggtcc agtacactcc tctgacgggg ctgggacagc cactgccgag tgagcggcag 3120
gaggtgaacg tcccagctgg tgagaccagt gtgcggctgc ggggtctccg gccactgacc 3180
gagtaccaag tgactgtgat tgccctctac gccaacagca tcggggaggc tgtgagcggg 3240
acagctcgga ccactgccct agaagggccg gaactgacca tccagaatac cacagcccac 3300
agcctcctgg tggcctggcg gagtgtgcca ggtgccactg gctaccgtgt gacatggcgg 3360
gtcctcagtg gtgggcccac acagcagcag gagctgggcc ctgggcaggg ttcagtgttg 3420
ctgcgtgact tggagcctgg cacggactat gaggtgaccg tgagcaccct atttggccgc 3480
agtgtggggc ccgccacttc cctgatggct cgcactgacg cttctgttga gcagaccctg 3540
cgcccggtca tcctgggccc cacatccatc ctcctttcct ggaacttggt gcctgaggcc 3600
cgtggctacc ggttggaatg gcggcgtgag actggcttgg agccaccgca gaaggtggta 3660
ctgccctctg atgtgacccg ctaccagttg gatgggctgc agccgggcac tgagtaccgc 3720
ctcacactct acactctgct ggagggccac gaggtggcca cccctgcaac cgtggttccc 3780
actggaccag agctgcctgt gagccctgta acagacctgc aagccaccga gctgcccggg 3840
cagcgggtgc gagtgtcctg gagcccagtc cctggtgcca cccagtaccg catcattgtg 3900
cgcagcaccc agggggttga gcggaccctg gtgcttcctg ggagtcagac agcattcgac 3960
ttggatgacg ttcaggctgg gcttagctac actgtgcggg tgtctgctcg agtgggtccc 4020
cgtgagggca gtgccagtgt cctcactgtc cgccgggagc cggaaactcc acttgctgtt 4080
ccagggctgc gggttgtggt gtcagatgca acgcgagtga gggtggcctg gggacccgtc 4140
cctggagcca gtggatttcg gattagctgg agcacaggca gtggtccgga gtccagccag 4200
acactgcccc cagactctac tgccacagac atcacagggc tgcagcctgg aaccacctac 4260
caggtggctg tgtcggtact gcgaggcaga gaggagggcc ctgctgcagt catcgtggct 4320
cgaacggacc cactgggccc agtgaggacg gtccatgtga ctcaggccag cagctcatct 4380
gtcaccatta cctggaccag ggttcctggc gccacaggat acagggtttc ctggcactca 4440
gcccacggcc cagagaaatc ccagttggtt tctggggagg ccacggtggc tgagctggat 4500
ggactggagc cagatactga gtatacggtg catgtgaggg cccatgtggc tggcgtggat 4560
gggccccctg cctctgtggt tgtgaggact gcccctgagc ctgtgggtcg tgtgtcgagg 4620
ctgcagatcc tcaatgcttc cagcgacgtt ctacggatca cctgggtagg ggtcactgga 4680
gccacagctt acagactggc ctggggccgg agtgaaggcg gccccatgag gcaccagata 4740
ctcccaggaa acacagactc tgcagagatc cggggtctcg aaggtggagt cagctactca 4800
gtgcgagtga ctgcacttgt cggggaccgc gagggcacac ctgtctccat tgttgtcact 4860
acgccgcctg aggctccgcc agccctgggg acgcttcacg tggtgcagcg cggggagcac 4920
tcgctgaggc tgcgctggga gccggtgccc agagcgcagg gcttccttct gcactggcaa 4980
cctgagggtg gccaggaaca gtcccgggtc ctggggcccg agctcagcag ctatcacctg 5040
gacgggctgg agccagcgac acagtaccgc gtgaggctga gtgtcctagg gccagctgga 5100
gaagggccct ctgcagaggt gactgcgcgc actgagtcac ctcgtgttcc aagcattgaa 5160
ctacgtgtgg tggacacctc gatcgactcg gtgactttgg cctggactcc agtgtccagg 5220
gcatccagct acatcctatc ctggcggcca ctcagaggcc ctggccagga agtgcctggg 5280
tccccgcaga cacttccagg gatctcaagc tcccagcggg tgacagggct agagcctggc 5340
gtctcttaca tcttctccct gacgcctgtc ctggatggtg tgcggggtcc tgaggcatct 5400
gtcacacaga cgccagtgtg cccccgtggc ctggcggatg tggtgttcct accacatgcc 5460
actcaagaca atgctcaccg tgcggaggct acgaggaggg tcctggagcg tctggtgttg 5520
gcacttgggc ctcttgggcc acaggcagtt caggttggcc tgctgtctta cagtcatcgg 5580
ccctccccac tgttcccact gaatggctcc catgaccttg gcattatctt gcaaaggatc 5640
cgtgacatgc cctacatgga cccaagtggg aacaacctgg gcacagccgt ggtcacagct 5700
cacagataca tgttggcacc agatgctcct gggcgccgcc agcacgtacc aggggtgatg 5760
gttctgctag tggatgaacc cttgagaggt gacatattca gccccatccg tgaggcccag 5820
gcttctgggc ttaatgtggt gatgttggga atggctggag cggacccaga gcagctgcgt 5880
cgcttggcgc cgggtatgga ctctgtccag accttcttcg ccgtggatga tgggccaagc 5940
ctggaccagg cagtcagtgg tctggccaca gccctgtgtc aggcatcctt cactactcag 6000
ccccggccag agccctgccc agtgtattgt ccaaagggcc agaaggggga acctggagag 6060
atgggcctga gaggacaagt tgggcctcct ggcgaccctg gcctcccggg caggaccggt 6120
gctcccggcc cccaggggcc ccctggaagt gccactgcca agggcgagag gggcttccct 6180
ggagcagatg ggcgtccagg cagccctggc cgcgccggga atcctgggac ccctggagcc 6240
cctggcctaa agggctctcc agggttgcct ggccctcgtg gggacccggg agagcgagga 6300
cctcgaggcc caaaggggga gccgggggct cccggacaag tcatcggagg tgaaggacct 6360
gggcttcctg ggcggaaagg ggaccctgga ccatcgggcc cccctggacc tcgtggacca 6420
ctgggggacc caggaccccg tggcccccca gggcttcctg gaacagccat gaagggtgac 6480
aaaggcgatc gtggggagcg gggtccccct ggaccaggtg aaggtggcat tgctcctggg 6540
gagcctgggc tgccgggtct tcccggaagc cctggacccc aaggccccgt tggcccccct 6600
ggaaagaaag gagaaaaagg tgactctgag gatggagctc caggcctccc aggacaacct 6660
gggtctccgg gtgagcaggg cccacgggga cctcctggag ctattggccc caaaggtgac 6720
cggggctttc cagggcccct gggtgaggct ggagagaagg gcgaacgtgg acccccaggc 6780
ccagcgggat cccgggggct gccaggggtt gctggacgtc ctggagccaa gggtcctgaa 6840
gggccaccag gacccactgg ccgccaagga gagaaggggg agcctggtcg ccctggggac 6900
cctgcagtgg tgggacctgc tgttgctgga cccaaaggag aaaagggaga tgtggggccc 6960
gctgggccca gaggagctac cggagtccaa ggggaacggg gcccacccgg cttggttctt 7020
cctggagacc ctggccccaa gggagaccct ggagaccggg gtcccattgg ccttactggc 7080
agagcaggac ccccaggtga ctcagggcct cctggagaga agggagaccc tgggcggcct 7140
ggccccccag gacctgttgg cccccgagga cgagatggtg aagttggaga gaaaggtgac 7200
gagggtcctc cgggtgaccc gggtttgcct ggaaaagcag gcgagcgtgg ccttcggggg 7260
gcacctggag ttcgggggcc tgtgggtgaa aagggagacc agggagatcc tggagaggat 7320
ggacgaaatg gcagccctgg atcatctgga cccaagggtg accgtgggga gccgggtccc 7380
ccaggacccc cgggacggct ggtagacaca ggacctggag ccagagagaa gggagagcct 7440
ggggaccgcg gacaagaggg tcctcgaggg cccaagggtg atcctggcct ccctggagcc 7500
cctggggaaa ggggcattga agggtttcgg ggacccccag gcccacaggg ggacccaggt 7560
gtccgaggcc cagcaggaga aaagggtgac cggggtcccc ctgggctgga tggccggagc 7620
ggactggatg ggaaaccagg agccgctggg ccctctgggc cgaatggtgc tgcaggcaaa 7680
gctggggacc cagggagaga cgggcttcca ggcctccgtg gagaacaggg cctccctggc 7740
ccctctggtc cccctggatt accgggaaag ccaggcgagg atggcaaacc tggcctgaat 7800
ggaaaaaacg gagaacctgg ggaccctgga gaagacggga ggaagggaga gaaaggagat 7860
tcaggcgcct ctgggagaga aggtcgtgat ggccccaagg gtgagcgtgg agctcctggt 7920
atccttggac cccaggggcc tccaggcctc ccagggccag tgggccctcc tggccagggt 7980
tttcctggtg tcccaggagg cacgggcccc aagggtgacc gtggggagac tggatccaaa 8040
ggggagcagg gcctccctgg agagcgtggc ctgcgaggag agcctggaag tgtgccgaat 8100
gtggatcggt tgctggaaac tgctggcatc aaggcatctg ccctgcggga gatcgtggag 8160
acctgggatg agagctctgg tagcttcctg cctgtgcccg aacggcgtcg aggccccaag 8220
ggggactcag gcgaacaggg ccccccaggc aaggagggcc ccatcggctt tcctggagaa 8280
cgcgggctga agggcgaccg tggagaccct ggccctcagg ggccacctgg tctggccctt 8340
ggggagaggg gcccccccgg gccttccggc cttgccgggg agcctggaaa gcctggtatt 8400
cccgggctcc caggcagggc tgggggtgtg ggagaggcag gaaggccagg agagagggga 8460
gaacggggag agaaaggaga acgtggagaa cagggcagag atggccctcc tggactccct 8520
ggaacccctg ggccccccgg accccctggc cccaaggtgt ctgtggatga gccaggtcct 8580
ggactctctg gagaacaggg accccctgga ctcaagggtg ctaaggggga gccgggcagc 8640
aatggtgacc aaggtcccaa aggagacagg ggtgtgccag gcatcaaagg agaccgggga 8700
gagcctggac cgaggggtca ggacggcaac ccgggtctac caggagagcg tggtatggct 8760
gggcctgaag ggaagccggg tctgcagggt ccaagaggcc cccctggccc agtgggtggt 8820
catggagacc ctggaccacc tggtgccccg ggtcttgctg gccctgcagg accccaagga 8880
ccttctggcc tgaaggggga gcctggagag acaggacctc caggacgggg cctgactgga 8940
cctactggag ctgtgggact tcctggaccc cccggccctt caggccttgt gggtccacag 9000
gggtctccag gtttgcctgg acaagtgggg gagacaggga agccgggagc cccaggtcga 9060
gatggtgcca gtggaaaaga tggagacaga gggagccctg gtgtgccagg gtcaccaggt 9120
ctgcctggcc ctgtcggacc taaaggagaa cctggcccca cgggggcccc tggacaggct 9180
gtggtcgggc tccctggagc aaagggagag aagggagccc ctggaggcct tgctggagac 9240
ctggtgggtg agccgggagc caaaggtgac cgaggactgc cagggccgcg aggcgagaag 9300
ggtgaagctg gccgtgcagg ggagcccgga gaccctgggg aagatggtca gaaaggggct 9360
ccaggaccca aaggtttcaa gggtgaccca ggagtcgggg tcccgggctc ccctgggcct 9420
cctggccctc caggtgtgaa gggagatctg ggcctccctg gcctgcccgg tgctcctggt 9480
gttgttgggt tcccgggtca gacaggccct cgaggagaga tgggtcagcc aggccctagt 9540
ggagagcggg gtctggcagg ccccccaggg agagaaggaa tcccaggacc cctggggcca 9600
cctggaccac cggggtcagt gggaccacct ggggcctctg gactcaaagg agacaaggga 9660
gaccctggag tagggctgcc tgggccccga ggcgagcgtg gggagccagg catccggggt 9720
gaagatggcc gccccggcca ggagggaccc cgaggactca cggggccccc tggcagcagg 9780
ggagagcgtg gggagaaggg tgatgttggg agtgcaggac taaagggtga caagggagac 9840
tcagctgtga tcctggggcc tccaggccca cggggtgcca agggggacat gggtgaacga 9900
gggcctcggg gcttggatgg tgacaaagga cctcggggag acaatgggga ccctggtgac 9960
aagggcagca agggagagcc tggtgacaag ggctcagccg ggttgccagg actgcgtgga 10020
ctcctgggac cccagggtca acctggtgca gcagggatcc ctggtgaccc gggatcccca 10080
ggaaaggatg gagtgcctgg tatccgagga gaaaaaggag atgttggctt catgggtccc 10140
cggggcctca agggtgaacg gggagtgaag ggagcctgtg gccttgatgg agagaaggga 10200
gacaagggag aagctggtcc cccaggccgc cccgggctgg caggacacaa aggagagatg 10260
ggggagcctg gtgtgccggg ccagtcgggg gcccctggca aggagggcct gatcggtccc 10320
aagggtgacc gaggctttga cgggcagcca ggccccaagg gtgaccaggg cgagaaaggg 10380
gagcggggaa ccccaggaat tgggggcttc ccaggcccca gtggaaatga tggctctgct 10440
ggtcccccag ggccacctgg cagtgttggt cccagaggcc ccgaaggact tcagggccag 10500
aagggtgagc gaggtccccc cggagagaga gtggtggggg ctcctggggt ccctggagct 10560
cctggcgaga gaggggagca ggggcggcca gggcctgccg gtcctcgagg cgagaaggga 10620
gaagctgcac tgacggagga tgacatccgg ggctttgtgc gccaagagat gagtcagcac 10680
tgtgcctgcc agggccagtt catcgcatct ggatcacgac ccctccctag ttatgctgca 10740
gacactgccg gctcccagct ccatgctgtg cctgtgctcc gcgtctctca tgcagaggag 10800
gaagagcggg taccccctga ggatgatgag tactctgaat actccgagta ttctgtggag 10860
gagtaccagg accctgaagc tccttgggat agtgatgacc cctgttccct gccactggat 10920
gagggctcct gcactgccta caccctgcgc tggtaccatc gggctgtgac aggcagcaca 10980
gaggcctgtc acccttttgt ctatggtggc tgtggaggga atgccaaccg ttttgggacc 11040
cgtgaggcct gcgagcgccg ctgcccaccc cgggtggtcc agagccaggg gacaggtact 11100
gcccaggact ga 11112
<210> 20
<211> 3703
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 20
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly
740 745 750
Asp Val Glu Glu Asn Pro Gly Pro Thr Leu Arg Leu Leu Val Ala Ala
755 760 765
Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg Ala Gln His
770 775 780
Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp Ile Val Phe
785 790 795 800
Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe Arg Glu Val
805 810 815
Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly Ala Ala Ser
820 825 830
Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp Asp Pro Arg
835 840 845
Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp Val Ile Arg
850 855 860
Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg Thr Gly Ala
865 870 875 880
Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln Leu Ala Arg
885 890 895
Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly Lys Ser Gln
900 905 910
Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln Gly Val Lys
915 920 925
Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu Leu Lys Arg
930 935 940
Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val Asn Asp Phe
945 950 955 960
Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg Val Cys Thr
965 970 975
Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp Ser Thr Ser
980 985 990
Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln Ser Leu Arg
995 1000 1005
Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr Lys Val Gln
1010 1015 1020
Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser Glu Arg Gln
1025 1030 1035 1040
Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu Arg Gly Leu
1045 1050 1055
Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu Tyr Ala Asn
1060 1065 1070
Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr Ala Leu Glu
1075 1080 1085
Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser Leu Leu Val
1090 1095 1100
Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val Thr Trp Arg
1105 1110 1115 1120
Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly Pro Gly Gln
1125 1130 1135
Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp Tyr Glu Val
1140 1145 1150
Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala Thr Ser Leu
1155 1160 1165
Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg Pro Val Ile
1170 1175 1180
Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val Pro Glu Ala
1185 1190 1195 1200
Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu Glu Pro Pro
1205 1210 1215
Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln Leu Asp Gly
1220 1225 1230
Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr Leu Leu Glu
1235 1240 1245
Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr Gly Pro Glu
1250 1255 1260
Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu Leu Pro Gly
1265 1270 1275 1280
Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala Thr Gln Tyr
1285 1290 1295
Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr Leu Val Leu
1300 1305 1310
Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln Ala Gly Leu
1315 1320 1325
Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg Glu Gly Ser
1330 1335 1340
Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro Leu Ala Val
1345 1350 1355 1360
Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val Arg Val Ala
1365 1370 1375
Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser Trp Ser Thr
1380 1385 1390
Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp Ser Thr Ala
1395 1400 1405
Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln Val Ala Val
1410 1415 1420
Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val Ile Val Ala
1425 1430 1435 1440
Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val Thr Gln Ala
1445 1450 1455
Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro Gly Ala Thr
1460 1465 1470
Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu Lys Ser Gln
1475 1480 1485
Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly Leu Glu Pro
1490 1495 1500
Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala Gly Val Asp
1505 1510 1515 1520
Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu Pro Val Gly
1525 1530 1535
Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp Val Leu Arg
1540 1545 1550
Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg Leu Ala Trp
1555 1560 1565
Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu Pro Gly Asn
1570 1575 1580
Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val Ser Tyr Ser
1585 1590 1595 1600
Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr Pro Val Ser
1605 1610 1615
Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu Gly Thr Leu
1620 1625 1630
His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg Trp Glu Pro
1635 1640 1645
Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro Glu Gly Gly
1650 1655 1660
Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser Tyr His Leu
1665 1670 1675 1680
Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu Ser Val Leu
1685 1690 1695
Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala Arg Thr Glu
1700 1705 1710
Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp Thr Ser Ile
1715 1720 1725
Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala Ser Ser Tyr
1730 1735 1740
Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu Val Pro Gly
1745 1750 1755 1760
Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg Val Thr Gly
1765 1770 1775
Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro Val Leu Asp
1780 1785 1790
Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro Val Cys Pro
1795 1800 1805
Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr Gln Asp Asn
1810 1815 1820
Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg Leu Val Leu
1825 1830 1835 1840
Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly Leu Leu Ser
1845 1850 1855
Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly Ser His Asp
1860 1865 1870
Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr Met Asp Pro
1875 1880 1885
Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His Arg Tyr Met
1890 1895 1900
Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro Gly Val Met
1905 1910 1915 1920
Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe Ser Pro Ile
1925 1930 1935
Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu Gly Met Ala
1940 1945 1950
Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly Met Asp Ser
1955 1960 1965
Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu Asp Gln Ala
1970 1975 1980
Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe Thr Thr Gln
1985 1990 1995 2000
Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly Gln Lys Gly
2005 2010 2015
Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro Pro Gly Asp
2020 2025 2030
Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln Gly Pro Pro
2035 2040 2045
Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly Ala Asp Gly
2050 2055 2060
Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr Pro Gly Ala
2065 2070 2075 2080
Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg Gly Asp Pro
2085 2090 2095
Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly Ala Pro Gly
2100 2105 2110
Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg Lys Gly Asp
2115 2120 2125
Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu Gly Asp Pro
2130 2135 2140
Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met Lys Gly Asp
2145 2150 2155 2160
Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly Glu Gly Gly
2165 2170 2175
Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly Ser Pro Gly
2180 2185 2190
Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu Lys Gly Asp
2195 2200 2205
Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly Ser Pro Gly
2210 2215 2220
Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro Lys Gly Asp
2225 2230 2235 2240
Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys Gly Glu Arg
2245 2250 2255
Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly Val Ala Gly
2260 2265 2270
Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro Thr Gly Arg
2275 2280 2285
Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro Ala Val Val
2290 2295 2300
Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp Val Gly Pro
2305 2310 2315 2320
Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg Gly Pro Pro
2325 2330 2335
Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp Pro Gly Asp
2340 2345 2350
Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro Gly Asp Ser
2355 2360 2365
Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly Pro Pro Gly
2370 2375 2380
Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu Lys Gly Asp
2385 2390 2395 2400
Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala Gly Glu Arg
2405 2410 2415
Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly Glu Lys Gly
2420 2425 2430
Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser Pro Gly Ser
2435 2440 2445
Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro Pro
2450 2455 2460
Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys Gly Glu Pro
2465 2470 2475 2480
Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly Asp Pro Gly
2485 2490 2495
Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe Arg Gly Pro
2500 2505 2510
Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala Gly Glu Lys
2515 2520 2525
Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly Leu Asp Gly
2530 2535 2540
Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala Ala Gly Lys
2545 2550 2555 2560
Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg Gly Glu Gln
2565 2570 2575
Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly Lys Pro Gly
2580 2585 2590
Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu Pro Gly Asp
2595 2600 2605
Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser Gly Ala Ser
2610 2615 2620
Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly Ala Pro Gly
2625 2630 2635 2640
Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro Val Gly Pro
2645 2650 2655
Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly Pro Lys Gly
2660 2665 2670
Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu Pro Gly Glu
2675 2680 2685
Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val Asp Arg Leu
2690 2695 2700
Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu Ile Val Glu
2705 2710 2715 2720
Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro Glu Arg Arg
2725 2730 2735
Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro Gly Lys Glu
2740 2745 2750
Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly Asp Arg Gly
2755 2760 2765
Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly Glu Arg Gly
2770 2775 2780
Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys Pro Gly Ile
2785 2790 2795 2800
Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala Gly Arg Pro
2805 2810 2815
Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly Glu Gln Gly
2820 2825 2830
Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro Pro Gly Pro
2835 2840 2845
Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly Leu Ser Gly
2850 2855 2860
Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu Pro Gly Ser
2865 2870 2875 2880
Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro Gly Ile Lys
2885 2890 2895
Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly Asn Pro Gly
2900 2905 2910
Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys Pro Gly Leu
2915 2920 2925
Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His Gly Asp Pro
2930 2935 2940
Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly Pro Gln Gly
2945 2950 2955 2960
Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro Pro Gly Arg
2965 2970 2975
Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly Pro Pro Gly
2980 2985 2990
Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu Pro Gly Gln
2995 3000 3005
Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp Gly Ala Ser
3010 3015 3020
Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly Ser Pro Gly
3025 3030 3035 3040
Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro Thr Gly Ala
3045 3050 3055
Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly Glu Lys Gly
3060 3065 3070
Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro Gly Ala Lys
3075 3080 3085
Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly Glu Ala Gly
3090 3095 3100
Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln Lys Gly Ala
3105 3110 3115 3120
Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly Val Pro Gly
3125 3130 3135
Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp Leu Gly Leu
3140 3145 3150
Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro Gly Gln Thr
3155 3160 3165
Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly Glu Arg Gly
3170 3175 3180
Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro Leu Gly Pro
3185 3190 3195 3200
Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser Gly Leu Lys
3205 3210 3215
Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro Arg Gly Glu
3220 3225 3230
Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro Gly Gln Glu
3235 3240 3245
Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly Glu Arg Gly
3250 3255 3260
Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp Lys Gly Asp
3265 3270 3275 3280
Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala Lys Gly Asp
3285 3290 3295
Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys Gly Pro Arg
3300 3305 3310
Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly Glu Pro Gly
3315 3320 3325
Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu Leu Gly Pro
3330 3335 3340
Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro Gly Ser Pro
3345 3350 3355 3360
Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly Asp Val Gly
3365 3370 3375
Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val Lys Gly Ala
3380 3385 3390
Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala Gly Pro Pro
3395 3400 3405
Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly Glu Pro Gly
3410 3415 3420
Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu Ile Gly Pro
3425 3430 3435 3440
Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys Gly Asp Gln
3445 3450 3455
Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly Phe Pro Gly
3460 3465 3470
Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly Ser
3475 3480 3485
Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys Gly Glu Arg
3490 3495 3500
Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val Pro Gly Ala
3505 3510 3515 3520
Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala Gly Pro Arg
3525 3530 3535
Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile Arg Gly Phe
3540 3545 3550
Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly Gln Phe Ile
3555 3560 3565
Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp Thr Ala Gly
3570 3575 3580
Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His Ala Glu Glu
3585 3590 3595 3600
Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu Tyr Ser Glu
3605 3610 3615
Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp Asp Ser Asp
3620 3625 3630
Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr Ala Tyr Thr
3635 3640 3645
Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu Ala Cys His
3650 3655 3660
Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg Phe Gly Thr
3665 3670 3675 3680
Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val Gln Ser Gln
3685 3690 3695
Gly Thr Gly Thr Ala Gln Asp
3700
<210> 21
<211> 11115
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 21
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg acggaagcgg acagtgtact aattatgctc tcttgaaatt ggctggagat 8880
gttgagagca accctggacc tacctcctcg gggcctggac cccggttcct gctgctgctg 8940
ccgctgctgc tgccccctgc ggcctcagcc tccgaccggc cccggggccg agacccggtc 9000
aacccagaga agctgctggt gatcactgtg gccacagctg aaaccgaggg gtacctgcgt 9060
ttcctgcgct ctgcggagtt cttcaactac actgtgcgga ccctgggcct gggagaggag 9120
tggcgagggg gtgatgtggc tcgaacagtt ggtggaggac agaaggtccg gtggttaaag 9180
aaggaaatgg agaaatacgc tgaccgggag gatatgatca tcatgtttgt ggatagctac 9240
gacgtgattc tggccggcag ccccacagag ctgctgaaga agttcgtcca gagtggcagc 9300
cgcctgctct tctctgcaga gagcttctgc tggcccgagt gggggctggc ggagcagtac 9360
cctgaggtgg gcacggggaa gcgcttcctc aattctggtg gattcatcgg ttttgccacc 9420
accatccacc aaatcgtgcg ccagtggaag tacaaggatg atgacgacga ccagctgttc 9480
tacacacggc tctacctgga cccaggactg agggagaaac tcagccttaa tctggatcat 9540
aagtctcgga tctttcagaa cctcaacggg gctttagatg aagtggtttt aaagtttgat 9600
cggaaccgtg tgcgtatccg gaacgtggcc tacgacacgc tccccattgt ggtccatgga 9660
aacggtccca ctaagctgca gctcaactac ctgggaaact acgtccccaa tggctggact 9720
cctgagggag gctgtggctt ctgcaaccag gaccggagga cactcccggg ggggcagcct 9780
cccccccggg tgtttctggc cgtgtttgtg gaacagccta ctccgtttct gccccgcttc 9840
ctgcagcggc tgctactcct ggactatccc cccgacaggg tcaccctttt cctgcacaac 9900
aacgaggtct tccatgaacc ccacatcgct gactcctggc cgcagctcca ggaccacttc 9960
tcagctgtga agctcgtggg gccggaggag gctctgagcc caggcgaggc cagggacatg 10020
gccatggacc tgtgtcggca ggaccccgag tgtgagttct acttcagcct ggacgccgac 10080
gctgtcctca ccaacctgca gaccctgcgt atcctcattg aggagaacag gaaggtgatc 10140
gcccccatgc tgtcccgcca cggcaagctg tggtccaact tctggggcgc cctgagcccc 10200
gatgagtact acgcccgctc cgaggactac gtggagctgg tgcagcggaa gcgagtgggt 10260
gtgtggaatg taccatacat ctcccaggcc tatgtgatcc ggggtgatac cctgcggatg 10320
gagctgcccc agagggatgt gttctcgggc agtgacacag acccggacat ggccttctgt 10380
aagagctttc gagacaaggg catcttcctc catctgagca atcagcatga atttggccgg 10440
ctcctggcca cttccagata cgacacggag cacctgcacc ccgacctctg gcagatcttc 10500
gacaaccccg tcgactggaa ggagcagtac atccacgaga actacagccg ggccctggaa 10560
ggggaaggaa tcgtggagca gccatgcccg gacgtgtact ggttcccact gctgtcagaa 10620
caaatgtgtg atgagctggt ggcagagatg gagcactacg gccagtggtc aggcggccgg 10680
catgaggatt caaggctggc tggaggctac gagaatgtgc ccaccgtgga catccacatg 10740
aagcaggtgg ggtacgagga ccagtggctg cagctgctgc ggacgtatgt gggccccatg 10800
accgagagcc tgtttcccgg ttaccacacc aaggcgcggg cggtgatgaa ctttgtggtt 10860
cgctaccggc cagacgagca gccgtctctg cggccacacc acgactcatc caccttcacc 10920
ctcaacgttg ccctcaacca caagggcctg gactatgagg gaggtggctg ccgcttcctg 10980
cgctacgact gtgtgatctc ctccccgagg aagggctggg cactcctgca ccccggccgc 11040
ctcacccact accacgaggg gctgccaacg acctggggca cacgctacat catggtgtcc 11100
tttgtcgacc cctga 11115
<210> 22
<211> 3704
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 22
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
2945 2950 2955 2960
Val Glu Ser Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro Arg Phe
2965 2970 2975
Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp
2980 2985 2990
Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu Val Ile
2995 3000 3005
Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser
3010 3015 3020
Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly Glu Glu
3025 3030 3035 3040
Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln Lys Val
3045 3050 3055
Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu Asp Met
3060 3065 3070
Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro
3075 3080 3085
Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu Leu Phe
3090 3095 3100
Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr
3105 3110 3115 3120
Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile
3125 3130 3135
Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys Tyr Lys
3140 3145 3150
Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro
3155 3160 3165
Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser Arg Ile
3170 3175 3180
Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys Phe Asp
3185 3190 3195 3200
Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile
3205 3210 3215
Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly
3220 3225 3230
Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys
3235 3240 3245
Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro Arg Val
3250 3255 3260
Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe
3265 3270 3275 3280
Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu
3285 3290 3295
Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala Asp Ser
3300 3305 3310
Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val Gly Pro
3315 3320 3325
Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met Asp Leu
3330 3335 3340
Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp
3345 3350 3355 3360
Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn
3365 3370 3375
Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu Trp Ser
3380 3385 3390
Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu
3395 3400 3405
Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp Asn Val
3410 3415 3420
Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu Arg Met
3425 3430 3435 3440
Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp Pro Asp
3445 3450 3455
Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu His Leu
3460 3465 3470
Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp
3475 3480 3485
Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn Pro Val
3490 3495 3500
Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala Leu Glu
3505 3510 3515 3520
Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro
3525 3530 3535
Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met Glu His
3540 3545 3550
Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu Ala Gly
3555 3560 3565
Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln Val Gly
3570 3575 3580
Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly Pro Met
3585 3590 3595 3600
Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala Val Met
3605 3610 3615
Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro
3620 3625 3630
His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn His Lys
3635 3640 3645
Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys
3650 3655 3660
Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro Gly Arg
3665 3670 3675 3680
Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr
3685 3690 3695
Ile Met Val Ser Phe Val Asp Pro
3700
<210> 23
<211> 11115
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 23
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220
ggacagtgta ctaattatgc tctcttgaaa ttggctggag atgttgagag caaccctgga 2280
cctacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 2340
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 2400
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 2460
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 2520
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 2580
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 2640
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 2700
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 2760
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 2820
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 2880
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 2940
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 3000
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 3060
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 3120
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 3180
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 3240
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 3300
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 3360
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 3420
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 3480
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 3540
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 3600
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 3660
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 3720
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 3780
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 3840
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 3900
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 3960
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 4020
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 4080
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 4140
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 4200
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 4260
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 4320
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 4380
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 4440
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 4500
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 4560
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 4620
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 4680
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 4740
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 4800
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 4860
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 4920
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 4980
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 5040
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 5100
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 5160
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 5220
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 5280
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 5340
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 5400
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 5460
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 5520
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 5580
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 5640
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 5700
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 5760
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 5820
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 5880
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 5940
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 6000
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 6060
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 6120
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 6180
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 6240
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 6300
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 6360
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 6420
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 6480
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 6540
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 6600
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 6660
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 6720
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 6780
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 6840
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 6900
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 6960
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 7020
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 7080
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 7140
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 7200
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 7260
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 7320
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 7380
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 7440
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 7500
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 7560
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 7620
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 7680
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 7740
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 7800
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 7860
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 7920
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 7980
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 8040
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 8100
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 8160
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 8220
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 8280
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 8340
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 8400
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 8460
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 8520
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 8580
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 8640
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 8700
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 8760
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 8820
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 8880
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 8940
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 9000
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 9060
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 9120
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 9180
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 9240
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 9300
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 9360
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 9420
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 9480
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 9540
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 9600
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 9660
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 9720
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 9780
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 9840
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 9900
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 9960
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 10020
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 10080
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 10140
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 10200
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 10260
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 10320
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 10380
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 10440
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 10500
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 10560
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 10620
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 10680
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 10740
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 10800
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 10860
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 10920
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 10980
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 11040
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 11100
actgcccagg actga 11115
<210> 24
<211> 3704
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 24
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala
740 745 750
Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Leu Arg Leu Leu Val Ala
755 760 765
Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg Ala Gln
770 775 780
His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp Ile Val
785 790 795 800
Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe Arg Glu
805 810 815
Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly Ala Ala
820 825 830
Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp Asp Pro
835 840 845
Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp Val Ile
850 855 860
Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg Thr Gly
865 870 875 880
Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln Leu Ala
885 890 895
Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly Lys Ser
900 905 910
Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln Gly Val
915 920 925
Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu Leu Lys
930 935 940
Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val Asn Asp
945 950 955 960
Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg Val Cys
965 970 975
Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp Ser Thr
980 985 990
Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln Ser Leu
995 1000 1005
Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr Lys Val
1010 1015 1020
Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser Glu Arg
1025 1030 1035 1040
Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu Arg Gly
1045 1050 1055
Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu Tyr Ala
1060 1065 1070
Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr Ala Leu
1075 1080 1085
Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser Leu Leu
1090 1095 1100
Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val Thr Trp
1105 1110 1115 1120
Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly Pro Gly
1125 1130 1135
Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp Tyr Glu
1140 1145 1150
Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala Thr Ser
1155 1160 1165
Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg Pro Val
1170 1175 1180
Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val Pro Glu
1185 1190 1195 1200
Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu Glu Pro
1205 1210 1215
Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln Leu Asp
1220 1225 1230
Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr Leu Leu
1235 1240 1245
Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr Gly Pro
1250 1255 1260
Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu Leu Pro
1265 1270 1275 1280
Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala Thr Gln
1285 1290 1295
Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr Leu Val
1300 1305 1310
Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln Ala Gly
1315 1320 1325
Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg Glu Gly
1330 1335 1340
Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro Leu Ala
1345 1350 1355 1360
Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val Arg Val
1365 1370 1375
Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser Trp Ser
1380 1385 1390
Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp Ser Thr
1395 1400 1405
Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln Val Ala
1410 1415 1420
Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val Ile Val
1425 1430 1435 1440
Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val Thr Gln
1445 1450 1455
Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro Gly Ala
1460 1465 1470
Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu Lys Ser
1475 1480 1485
Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly Leu Glu
1490 1495 1500
Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala Gly Val
1505 1510 1515 1520
Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu Pro Val
1525 1530 1535
Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp Val Leu
1540 1545 1550
Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg Leu Ala
1555 1560 1565
Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu Pro Gly
1570 1575 1580
Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val Ser Tyr
1585 1590 1595 1600
Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr Pro Val
1605 1610 1615
Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu Gly Thr
1620 1625 1630
Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg Trp Glu
1635 1640 1645
Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro Glu Gly
1650 1655 1660
Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser Tyr His
1665 1670 1675 1680
Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu Ser Val
1685 1690 1695
Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala Arg Thr
1700 1705 1710
Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp Thr Ser
1715 1720 1725
Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala Ser Ser
1730 1735 1740
Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu Val Pro
1745 1750 1755 1760
Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg Val Thr
1765 1770 1775
Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro Val Leu
1780 1785 1790
Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro Val Cys
1795 1800 1805
Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr Gln Asp
1810 1815 1820
Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg Leu Val
1825 1830 1835 1840
Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly Leu Leu
1845 1850 1855
Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly Ser His
1860 1865 1870
Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr Met Asp
1875 1880 1885
Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His Arg Tyr
1890 1895 1900
Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro Gly Val
1905 1910 1915 1920
Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe Ser Pro
1925 1930 1935
Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu Gly Met
1940 1945 1950
Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly Met Asp
1955 1960 1965
Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu Asp Gln
1970 1975 1980
Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe Thr Thr
1985 1990 1995 2000
Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly Gln Lys
2005 2010 2015
Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro Pro Gly
2020 2025 2030
Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln Gly Pro
2035 2040 2045
Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly Ala Asp
2050 2055 2060
Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr Pro Gly
2065 2070 2075 2080
Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg Gly Asp
2085 2090 2095
Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly Ala Pro
2100 2105 2110
Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg Lys Gly
2115 2120 2125
Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu Gly Asp
2130 2135 2140
Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met Lys Gly
2145 2150 2155 2160
Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly Glu Gly
2165 2170 2175
Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly Ser Pro
2180 2185 2190
Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu Lys Gly
2195 2200 2205
Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly Ser Pro
2210 2215 2220
Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro Lys Gly
2225 2230 2235 2240
Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys Gly Glu
2245 2250 2255
Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly Val Ala
2260 2265 2270
Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro Thr Gly
2275 2280 2285
Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro Ala Val
2290 2295 2300
Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp Val Gly
2305 2310 2315 2320
Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg Gly Pro
2325 2330 2335
Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp Pro Gly
2340 2345 2350
Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro Gly Asp
2355 2360 2365
Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly Pro Pro
2370 2375 2380
Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu Lys Gly
2385 2390 2395 2400
Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala Gly Glu
2405 2410 2415
Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly Glu Lys
2420 2425 2430
Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser Pro Gly
2435 2440 2445
Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro
2450 2455 2460
Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys Gly Glu
2465 2470 2475 2480
Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly Asp Pro
2485 2490 2495
Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe Arg Gly
2500 2505 2510
Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala Gly Glu
2515 2520 2525
Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly Leu Asp
2530 2535 2540
Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala Ala Gly
2545 2550 2555 2560
Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg Gly Glu
2565 2570 2575
Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly Lys Pro
2580 2585 2590
Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu Pro Gly
2595 2600 2605
Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser Gly Ala
2610 2615 2620
Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly Ala Pro
2625 2630 2635 2640
Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro Val Gly
2645 2650 2655
Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly Pro Lys
2660 2665 2670
Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu Pro Gly
2675 2680 2685
Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val Asp Arg
2690 2695 2700
Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu Ile Val
2705 2710 2715 2720
Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro Glu Arg
2725 2730 2735
Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro Gly Lys
2740 2745 2750
Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly Asp Arg
2755 2760 2765
Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly Glu Arg
2770 2775 2780
Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys Pro Gly
2785 2790 2795 2800
Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala Gly Arg
2805 2810 2815
Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly Glu Gln
2820 2825 2830
Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro Pro Gly
2835 2840 2845
Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly Leu Ser
2850 2855 2860
Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu Pro Gly
2865 2870 2875 2880
Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro Gly Ile
2885 2890 2895
Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly Asn Pro
2900 2905 2910
Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys Pro Gly
2915 2920 2925
Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His Gly Asp
2930 2935 2940
Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly Pro Gln
2945 2950 2955 2960
Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro Pro Gly
2965 2970 2975
Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly Pro Pro
2980 2985 2990
Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu Pro Gly
2995 3000 3005
Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp Gly Ala
3010 3015 3020
Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly Ser Pro
3025 3030 3035 3040
Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro Thr Gly
3045 3050 3055
Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly Glu Lys
3060 3065 3070
Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro Gly Ala
3075 3080 3085
Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly Glu Ala
3090 3095 3100
Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln Lys Gly
3105 3110 3115 3120
Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly Val Pro
3125 3130 3135
Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp Leu Gly
3140 3145 3150
Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro Gly Gln
3155 3160 3165
Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly Glu Arg
3170 3175 3180
Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro Leu Gly
3185 3190 3195 3200
Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser Gly Leu
3205 3210 3215
Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro Arg Gly
3220 3225 3230
Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro Gly Gln
3235 3240 3245
Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly Glu Arg
3250 3255 3260
Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp Lys Gly
3265 3270 3275 3280
Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala Lys Gly
3285 3290 3295
Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys Gly Pro
3300 3305 3310
Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly Glu Pro
3315 3320 3325
Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu Leu Gly
3330 3335 3340
Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro Gly Ser
3345 3350 3355 3360
Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly Asp Val
3365 3370 3375
Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val Lys Gly
3380 3385 3390
Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala Gly Pro
3395 3400 3405
Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly Glu Pro
3410 3415 3420
Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu Ile Gly
3425 3430 3435 3440
Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys Gly Asp
3445 3450 3455
Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly Phe Pro
3460 3465 3470
Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly
3475 3480 3485
Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys Gly Glu
3490 3495 3500
Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val Pro Gly
3505 3510 3515 3520
Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala Gly Pro
3525 3530 3535
Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile Arg Gly
3540 3545 3550
Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly Gln Phe
3555 3560 3565
Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp Thr Ala
3570 3575 3580
Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His Ala Glu
3585 3590 3595 3600
Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu Tyr Ser
3605 3610 3615
Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp Asp Ser
3620 3625 3630
Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr Ala Tyr
3635 3640 3645
Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu Ala Cys
3650 3655 3660
His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg Phe Gly
3665 3670 3675 3680
Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val Gln Ser
3685 3690 3695
Gln Gly Thr Gly Thr Ala Gln Asp
3700
<210> 25
<211> 11121
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 25
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg acggaagcgg agtgaaacag actttgaatt ttgaccttct caagttggcg 8880
ggagacgtgg agtccaaccc tggacctacc tcctcggggc ctggaccccg gttcctgctg 8940
ctgctgccgc tgctgctgcc ccctgcggcc tcagcctccg accggccccg gggccgagac 9000
ccggtcaacc cagagaagct gctggtgatc actgtggcca cagctgaaac cgaggggtac 9060
ctgcgtttcc tgcgctctgc ggagttcttc aactacactg tgcggaccct gggcctggga 9120
gaggagtggc gagggggtga tgtggctcga acagttggtg gaggacagaa ggtccggtgg 9180
ttaaagaagg aaatggagaa atacgctgac cgggaggata tgatcatcat gtttgtggat 9240
agctacgacg tgattctggc cggcagcccc acagagctgc tgaagaagtt cgtccagagt 9300
ggcagccgcc tgctcttctc tgcagagagc ttctgctggc ccgagtgggg gctggcggag 9360
cagtaccctg aggtgggcac ggggaagcgc ttcctcaatt ctggtggatt catcggtttt 9420
gccaccacca tccaccaaat cgtgcgccag tggaagtaca aggatgatga cgacgaccag 9480
ctgttctaca cacggctcta cctggaccca ggactgaggg agaaactcag ccttaatctg 9540
gatcataagt ctcggatctt tcagaacctc aacggggctt tagatgaagt ggttttaaag 9600
tttgatcgga accgtgtgcg tatccggaac gtggcctacg acacgctccc cattgtggtc 9660
catggaaacg gtcccactaa gctgcagctc aactacctgg gaaactacgt ccccaatggc 9720
tggactcctg agggaggctg tggcttctgc aaccaggacc ggaggacact cccggggggg 9780
cagcctcccc cccgggtgtt tctggccgtg tttgtggaac agcctactcc gtttctgccc 9840
cgcttcctgc agcggctgct actcctggac tatccccccg acagggtcac ccttttcctg 9900
cacaacaacg aggtcttcca tgaaccccac atcgctgact cctggccgca gctccaggac 9960
cacttctcag ctgtgaagct cgtggggccg gaggaggctc tgagcccagg cgaggccagg 10020
gacatggcca tggacctgtg tcggcaggac cccgagtgtg agttctactt cagcctggac 10080
gccgacgctg tcctcaccaa cctgcagacc ctgcgtatcc tcattgagga gaacaggaag 10140
gtgatcgccc ccatgctgtc ccgccacggc aagctgtggt ccaacttctg gggcgccctg 10200
agccccgatg agtactacgc ccgctccgag gactacgtgg agctggtgca gcggaagcga 10260
gtgggtgtgt ggaatgtacc atacatctcc caggcctatg tgatccgggg tgataccctg 10320
cggatggagc tgccccagag ggatgtgttc tcgggcagtg acacagaccc ggacatggcc 10380
ttctgtaaga gctttcgaga caagggcatc ttcctccatc tgagcaatca gcatgaattt 10440
ggccggctcc tggccacttc cagatacgac acggagcacc tgcaccccga cctctggcag 10500
atcttcgaca accccgtcga ctggaaggag cagtacatcc acgagaacta cagccgggcc 10560
ctggaagggg aaggaatcgt ggagcagcca tgcccggacg tgtactggtt cccactgctg 10620
tcagaacaaa tgtgtgatga gctggtggca gagatggagc actacggcca gtggtcaggc 10680
ggccggcatg aggattcaag gctggctgga ggctacgaga atgtgcccac cgtggacatc 10740
cacatgaagc aggtggggta cgaggaccag tggctgcagc tgctgcggac gtatgtgggc 10800
cccatgaccg agagcctgtt tcccggttac cacaccaagg cgcgggcggt gatgaacttt 10860
gtggttcgct accggccaga cgagcagccg tctctgcggc cacaccacga ctcatccacc 10920
ttcaccctca acgttgccct caaccacaag ggcctggact atgagggagg tggctgccgc 10980
ttcctgcgct acgactgtgt gatctcctcc ccgaggaagg gctgggcact cctgcacccc 11040
ggccgcctca cccactacca cgaggggctg ccaacgacct ggggcacacg ctacatcatg 11100
gtgtcctttg tcgacccctg a 11121
<210> 26
<211> 3706
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 26
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
2945 2950 2955 2960
Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro
2965 2970 2975
Arg Phe Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala
2980 2985 2990
Ser Asp Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu
2995 3000 3005
Val Ile Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu
3010 3015 3020
Arg Ser Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly
3025 3030 3035 3040
Glu Glu Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln
3045 3050 3055
Lys Val Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu
3060 3065 3070
Asp Met Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly
3075 3080 3085
Ser Pro Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu
3090 3095 3100
Leu Phe Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu
3105 3110 3115 3120
Gln Tyr Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly
3125 3130 3135
Phe Ile Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys
3140 3145 3150
Tyr Lys Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu
3155 3160 3165
Asp Pro Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser
3170 3175 3180
Arg Ile Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys
3185 3190 3195 3200
Phe Asp Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu
3205 3210 3215
Pro Ile Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr
3220 3225 3230
Leu Gly Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly
3235 3240 3245
Phe Cys Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro
3250 3255 3260
Arg Val Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro
3265 3270 3275 3280
Arg Phe Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val
3285 3290 3295
Thr Leu Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala
3300 3305 3310
Asp Ser Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val
3315 3320 3325
Gly Pro Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met
3330 3335 3340
Asp Leu Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp
3345 3350 3355 3360
Ala Asp Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu
3365 3370 3375
Glu Asn Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu
3380 3385 3390
Trp Ser Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg
3395 3400 3405
Ser Glu Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp
3410 3415 3420
Asn Val Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu
3425 3430 3435 3440
Arg Met Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp
3445 3450 3455
Pro Asp Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu
3460 3465 3470
His Leu Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg
3475 3480 3485
Tyr Asp Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn
3490 3495 3500
Pro Val Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala
3505 3510 3515 3520
Leu Glu Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp
3525 3530 3535
Phe Pro Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met
3540 3545 3550
Glu His Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu
3555 3560 3565
Ala Gly Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln
3570 3575 3580
Val Gly Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly
3585 3590 3595 3600
Pro Met Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala
3605 3610 3615
Val Met Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu
3620 3625 3630
Arg Pro His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn
3635 3640 3645
His Lys Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr
3650 3655 3660
Asp Cys Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro
3665 3670 3675 3680
Gly Arg Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr
3685 3690 3695
Arg Tyr Ile Met Val Ser Phe Val Asp Pro
3700 3705
<210> 27
<211> 11121
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 27
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220
ggagtgaaac agactttgaa ttttgacctt ctcaagttgg cgggagacgt ggagtccaac 2280
cctggaccta cgctgcggct tctggtggcc gcgctctgcg ccgggatcct ggcagaggcg 2340
ccccgagtgc gagcccagca cagggagaga gtgacctgca cgcgccttta cgccgctgac 2400
attgtgttct tactggatgg ctcctcatcc attggccgca gcaatttccg cgaggtccgc 2460
agctttctcg aagggctggt gctgcctttc tctggagcag ccagtgcaca gggtgtgcgc 2520
tttgccacag tgcagtacag cgatgaccca cggacagagt tcggcctgga tgcacttggc 2580
tctgggggtg atgtgatccg cgccatccgt gagcttagct acaagggggg caacactcgc 2640
acaggggctg caattctcca tgtggctgac catgtcttcc tgccccagct ggcccgacct 2700
ggtgtcccca aggtctgcat cctgatcaca gacgggaagt cccaggacct ggtggacaca 2760
gctgcccaaa ggctgaaggg gcagggggtc aagctatttg ctgtggggat caagaatgct 2820
gaccctgagg agctgaagcg agttgcctca cagcccacca gtgacttctt cttcttcgtc 2880
aatgacttca gcatcttgag gacactactg cccctcgttt cccggagagt gtgcacgact 2940
gctggtggcg tgcctgtgac ccgacctccg gatgactcga cctctgctcc acgagacctg 3000
gtgctgtctg agccaagcag ccaatccttg agagtacagt ggacagcggc cagtggccct 3060
gtgactggct acaaggtcca gtacactcct ctgacggggc tgggacagcc actgccgagt 3120
gagcggcagg aggtgaacgt cccagctggt gagaccagtg tgcggctgcg gggtctccgg 3180
ccactgaccg agtaccaagt gactgtgatt gccctctacg ccaacagcat cggggaggct 3240
gtgagcggga cagctcggac cactgcccta gaagggccgg aactgaccat ccagaatacc 3300
acagcccaca gcctcctggt ggcctggcgg agtgtgccag gtgccactgg ctaccgtgtg 3360
acatggcggg tcctcagtgg tgggcccaca cagcagcagg agctgggccc tgggcagggt 3420
tcagtgttgc tgcgtgactt ggagcctggc acggactatg aggtgaccgt gagcacccta 3480
tttggccgca gtgtggggcc cgccacttcc ctgatggctc gcactgacgc ttctgttgag 3540
cagaccctgc gcccggtcat cctgggcccc acatccatcc tcctttcctg gaacttggtg 3600
cctgaggccc gtggctaccg gttggaatgg cggcgtgaga ctggcttgga gccaccgcag 3660
aaggtggtac tgccctctga tgtgacccgc taccagttgg atgggctgca gccgggcact 3720
gagtaccgcc tcacactcta cactctgctg gagggccacg aggtggccac ccctgcaacc 3780
gtggttccca ctggaccaga gctgcctgtg agccctgtaa cagacctgca agccaccgag 3840
ctgcccgggc agcgggtgcg agtgtcctgg agcccagtcc ctggtgccac ccagtaccgc 3900
atcattgtgc gcagcaccca gggggttgag cggaccctgg tgcttcctgg gagtcagaca 3960
gcattcgact tggatgacgt tcaggctggg cttagctaca ctgtgcgggt gtctgctcga 4020
gtgggtcccc gtgagggcag tgccagtgtc ctcactgtcc gccgggagcc ggaaactcca 4080
cttgctgttc cagggctgcg ggttgtggtg tcagatgcaa cgcgagtgag ggtggcctgg 4140
ggacccgtcc ctggagccag tggatttcgg attagctgga gcacaggcag tggtccggag 4200
tccagccaga cactgccccc agactctact gccacagaca tcacagggct gcagcctgga 4260
accacctacc aggtggctgt gtcggtactg cgaggcagag aggagggccc tgctgcagtc 4320
atcgtggctc gaacggaccc actgggccca gtgaggacgg tccatgtgac tcaggccagc 4380
agctcatctg tcaccattac ctggaccagg gttcctggcg ccacaggata cagggtttcc 4440
tggcactcag cccacggccc agagaaatcc cagttggttt ctggggaggc cacggtggct 4500
gagctggatg gactggagcc agatactgag tatacggtgc atgtgagggc ccatgtggct 4560
ggcgtggatg ggccccctgc ctctgtggtt gtgaggactg cccctgagcc tgtgggtcgt 4620
gtgtcgaggc tgcagatcct caatgcttcc agcgacgttc tacggatcac ctgggtaggg 4680
gtcactggag ccacagctta cagactggcc tggggccgga gtgaaggcgg ccccatgagg 4740
caccagatac tcccaggaaa cacagactct gcagagatcc ggggtctcga aggtggagtc 4800
agctactcag tgcgagtgac tgcacttgtc ggggaccgcg agggcacacc tgtctccatt 4860
gttgtcacta cgccgcctga ggctccgcca gccctgggga cgcttcacgt ggtgcagcgc 4920
ggggagcact cgctgaggct gcgctgggag ccggtgccca gagcgcaggg cttccttctg 4980
cactggcaac ctgagggtgg ccaggaacag tcccgggtcc tggggcccga gctcagcagc 5040
tatcacctgg acgggctgga gccagcgaca cagtaccgcg tgaggctgag tgtcctaggg 5100
ccagctggag aagggccctc tgcagaggtg actgcgcgca ctgagtcacc tcgtgttcca 5160
agcattgaac tacgtgtggt ggacacctcg atcgactcgg tgactttggc ctggactcca 5220
gtgtccaggg catccagcta catcctatcc tggcggccac tcagaggccc tggccaggaa 5280
gtgcctgggt ccccgcagac acttccaggg atctcaagct cccagcgggt gacagggcta 5340
gagcctggcg tctcttacat cttctccctg acgcctgtcc tggatggtgt gcggggtcct 5400
gaggcatctg tcacacagac gccagtgtgc ccccgtggcc tggcggatgt ggtgttccta 5460
ccacatgcca ctcaagacaa tgctcaccgt gcggaggcta cgaggagggt cctggagcgt 5520
ctggtgttgg cacttgggcc tcttgggcca caggcagttc aggttggcct gctgtcttac 5580
agtcatcggc cctccccact gttcccactg aatggctccc atgaccttgg cattatcttg 5640
caaaggatcc gtgacatgcc ctacatggac ccaagtggga acaacctggg cacagccgtg 5700
gtcacagctc acagatacat gttggcacca gatgctcctg ggcgccgcca gcacgtacca 5760
ggggtgatgg ttctgctagt ggatgaaccc ttgagaggtg acatattcag ccccatccgt 5820
gaggcccagg cttctgggct taatgtggtg atgttgggaa tggctggagc ggacccagag 5880
cagctgcgtc gcttggcgcc gggtatggac tctgtccaga ccttcttcgc cgtggatgat 5940
gggccaagcc tggaccaggc agtcagtggt ctggccacag ccctgtgtca ggcatccttc 6000
actactcagc cccggccaga gccctgccca gtgtattgtc caaagggcca gaagggggaa 6060
cctggagaga tgggcctgag aggacaagtt gggcctcctg gcgaccctgg cctcccgggc 6120
aggaccggtg ctcccggccc ccaggggccc cctggaagtg ccactgccaa gggcgagagg 6180
ggcttccctg gagcagatgg gcgtccaggc agccctggcc gcgccgggaa tcctgggacc 6240
cctggagccc ctggcctaaa gggctctcca gggttgcctg gccctcgtgg ggacccggga 6300
gagcgaggac ctcgaggccc aaagggggag ccgggggctc ccggacaagt catcggaggt 6360
gaaggacctg ggcttcctgg gcggaaaggg gaccctggac catcgggccc ccctggacct 6420
cgtggaccac tgggggaccc aggaccccgt ggccccccag ggcttcctgg aacagccatg 6480
aagggtgaca aaggcgatcg tggggagcgg ggtccccctg gaccaggtga aggtggcatt 6540
gctcctgggg agcctgggct gccgggtctt cccggaagcc ctggacccca aggccccgtt 6600
ggcccccctg gaaagaaagg agaaaaaggt gactctgagg atggagctcc aggcctccca 6660
ggacaacctg ggtctccggg tgagcagggc ccacggggac ctcctggagc tattggcccc 6720
aaaggtgacc ggggctttcc agggcccctg ggtgaggctg gagagaaggg cgaacgtgga 6780
cccccaggcc cagcgggatc ccgggggctg ccaggggttg ctggacgtcc tggagccaag 6840
ggtcctgaag ggccaccagg acccactggc cgccaaggag agaaggggga gcctggtcgc 6900
cctggggacc ctgcagtggt gggacctgct gttgctggac ccaaaggaga aaagggagat 6960
gtggggcccg ctgggcccag aggagctacc ggagtccaag gggaacgggg cccacccggc 7020
ttggttcttc ctggagaccc tggccccaag ggagaccctg gagaccgggg tcccattggc 7080
cttactggca gagcaggacc cccaggtgac tcagggcctc ctggagagaa gggagaccct 7140
gggcggcctg gccccccagg acctgttggc ccccgaggac gagatggtga agttggagag 7200
aaaggtgacg agggtcctcc gggtgacccg ggtttgcctg gaaaagcagg cgagcgtggc 7260
cttcgggggg cacctggagt tcgggggcct gtgggtgaaa agggagacca gggagatcct 7320
ggagaggatg gacgaaatgg cagccctgga tcatctggac ccaagggtga ccgtggggag 7380
ccgggtcccc caggaccccc gggacggctg gtagacacag gacctggagc cagagagaag 7440
ggagagcctg gggaccgcgg acaagagggt cctcgagggc ccaagggtga tcctggcctc 7500
cctggagccc ctggggaaag gggcattgaa gggtttcggg gacccccagg cccacagggg 7560
gacccaggtg tccgaggccc agcaggagaa aagggtgacc ggggtccccc tgggctggat 7620
ggccggagcg gactggatgg gaaaccagga gccgctgggc cctctgggcc gaatggtgct 7680
gcaggcaaag ctggggaccc agggagagac gggcttccag gcctccgtgg agaacagggc 7740
ctccctggcc cctctggtcc ccctggatta ccgggaaagc caggcgagga tggcaaacct 7800
ggcctgaatg gaaaaaacgg agaacctggg gaccctggag aagacgggag gaagggagag 7860
aaaggagatt caggcgcctc tgggagagaa ggtcgtgatg gccccaaggg tgagcgtgga 7920
gctcctggta tccttggacc ccaggggcct ccaggcctcc cagggccagt gggccctcct 7980
ggccagggtt ttcctggtgt cccaggaggc acgggcccca agggtgaccg tggggagact 8040
ggatccaaag gggagcaggg cctccctgga gagcgtggcc tgcgaggaga gcctggaagt 8100
gtgccgaatg tggatcggtt gctggaaact gctggcatca aggcatctgc cctgcgggag 8160
atcgtggaga cctgggatga gagctctggt agcttcctgc ctgtgcccga acggcgtcga 8220
ggccccaagg gggactcagg cgaacagggc cccccaggca aggagggccc catcggcttt 8280
cctggagaac gcgggctgaa gggcgaccgt ggagaccctg gccctcaggg gccacctggt 8340
ctggcccttg gggagagggg cccccccggg ccttccggcc ttgccgggga gcctggaaag 8400
cctggtattc ccgggctccc aggcagggct gggggtgtgg gagaggcagg aaggccagga 8460
gagaggggag aacggggaga gaaaggagaa cgtggagaac agggcagaga tggccctcct 8520
ggactccctg gaacccctgg gccccccgga ccccctggcc ccaaggtgtc tgtggatgag 8580
ccaggtcctg gactctctgg agaacaggga ccccctggac tcaagggtgc taagggggag 8640
ccgggcagca atggtgacca aggtcccaaa ggagacaggg gtgtgccagg catcaaagga 8700
gaccggggag agcctggacc gaggggtcag gacggcaacc cgggtctacc aggagagcgt 8760
ggtatggctg ggcctgaagg gaagccgggt ctgcagggtc caagaggccc ccctggccca 8820
gtgggtggtc atggagaccc tggaccacct ggtgccccgg gtcttgctgg ccctgcagga 8880
ccccaaggac cttctggcct gaagggggag cctggagaga caggacctcc aggacggggc 8940
ctgactggac ctactggagc tgtgggactt cctggacccc ccggcccttc aggccttgtg 9000
ggtccacagg ggtctccagg tttgcctgga caagtggggg agacagggaa gccgggagcc 9060
ccaggtcgag atggtgccag tggaaaagat ggagacagag ggagccctgg tgtgccaggg 9120
tcaccaggtc tgcctggccc tgtcggacct aaaggagaac ctggccccac gggggcccct 9180
ggacaggctg tggtcgggct ccctggagca aagggagaga agggagcccc tggaggcctt 9240
gctggagacc tggtgggtga gccgggagcc aaaggtgacc gaggactgcc agggccgcga 9300
ggcgagaagg gtgaagctgg ccgtgcaggg gagcccggag accctgggga agatggtcag 9360
aaaggggctc caggacccaa aggtttcaag ggtgacccag gagtcggggt cccgggctcc 9420
cctgggcctc ctggccctcc aggtgtgaag ggagatctgg gcctccctgg cctgcccggt 9480
gctcctggtg ttgttgggtt cccgggtcag acaggccctc gaggagagat gggtcagcca 9540
ggccctagtg gagagcgggg tctggcaggc cccccaggga gagaaggaat cccaggaccc 9600
ctggggccac ctggaccacc ggggtcagtg ggaccacctg gggcctctgg actcaaagga 9660
gacaagggag accctggagt agggctgcct gggccccgag gcgagcgtgg ggagccaggc 9720
atccggggtg aagatggccg ccccggccag gagggacccc gaggactcac ggggccccct 9780
ggcagcaggg gagagcgtgg ggagaagggt gatgttggga gtgcaggact aaagggtgac 9840
aagggagact cagctgtgat cctggggcct ccaggcccac ggggtgccaa gggggacatg 9900
ggtgaacgag ggcctcgggg cttggatggt gacaaaggac ctcggggaga caatggggac 9960
cctggtgaca agggcagcaa gggagagcct ggtgacaagg gctcagccgg gttgccagga 10020
ctgcgtggac tcctgggacc ccagggtcaa cctggtgcag cagggatccc tggtgacccg 10080
ggatccccag gaaaggatgg agtgcctggt atccgaggag aaaaaggaga tgttggcttc 10140
atgggtcccc ggggcctcaa gggtgaacgg ggagtgaagg gagcctgtgg ccttgatgga 10200
gagaagggag acaagggaga agctggtccc ccaggccgcc ccgggctggc aggacacaaa 10260
ggagagatgg gggagcctgg tgtgccgggc cagtcggggg cccctggcaa ggagggcctg 10320
atcggtccca agggtgaccg aggctttgac gggcagccag gccccaaggg tgaccagggc 10380
gagaaagggg agcggggaac cccaggaatt gggggcttcc caggccccag tggaaatgat 10440
ggctctgctg gtcccccagg gccacctggc agtgttggtc ccagaggccc cgaaggactt 10500
cagggccaga agggtgagcg aggtcccccc ggagagagag tggtgggggc tcctggggtc 10560
cctggagctc ctggcgagag aggggagcag gggcggccag ggcctgccgg tcctcgaggc 10620
gagaagggag aagctgcact gacggaggat gacatccggg gctttgtgcg ccaagagatg 10680
agtcagcact gtgcctgcca gggccagttc atcgcatctg gatcacgacc cctccctagt 10740
tatgctgcag acactgccgg ctcccagctc catgctgtgc ctgtgctccg cgtctctcat 10800
gcagaggagg aagagcgggt accccctgag gatgatgagt actctgaata ctccgagtat 10860
tctgtggagg agtaccagga ccctgaagct ccttgggata gtgatgaccc ctgttccctg 10920
ccactggatg agggctcctg cactgcctac accctgcgct ggtaccatcg ggctgtgaca 10980
ggcagcacag aggcctgtca cccttttgtc tatggtggct gtggagggaa tgccaaccgt 11040
tttgggaccc gtgaggcctg cgagcgccgc tgcccacccc gggtggtcca gagccagggg 11100
acaggtactg cccaggactg a 11121
<210> 28
<211> 3706
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 28
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys
740 745 750
Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Leu Arg Leu Leu
755 760 765
Val Ala Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg
770 775 780
Ala Gln His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp
785 790 795 800
Ile Val Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe
805 810 815
Arg Glu Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly
820 825 830
Ala Ala Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp
835 840 845
Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp
850 855 860
Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg
865 870 875 880
Thr Gly Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln
885 890 895
Leu Ala Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly
900 905 910
Lys Ser Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln
915 920 925
Gly Val Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu
930 935 940
Leu Lys Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val
945 950 955 960
Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg
965 970 975
Val Cys Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp
980 985 990
Ser Thr Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln
995 1000 1005
Ser Leu Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr
1010 1015 1020
Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser
1025 1030 1035 1040
Glu Arg Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu
1045 1050 1055
Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu
1060 1065 1070
Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr
1075 1080 1085
Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser
1090 1095 1100
Leu Leu Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val
1105 1110 1115 1120
Thr Trp Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly
1125 1130 1135
Pro Gly Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp
1140 1145 1150
Tyr Glu Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala
1155 1160 1165
Thr Ser Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg
1170 1175 1180
Pro Val Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val
1185 1190 1195 1200
Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu
1205 1210 1215
Glu Pro Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln
1220 1225 1230
Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr
1235 1240 1245
Leu Leu Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr
1250 1255 1260
Gly Pro Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu
1265 1270 1275 1280
Leu Pro Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala
1285 1290 1295
Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr
1300 1305 1310
Leu Val Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln
1315 1320 1325
Ala Gly Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg
1330 1335 1340
Glu Gly Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro
1345 1350 1355 1360
Leu Ala Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val
1365 1370 1375
Arg Val Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser
1380 1385 1390
Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp
1395 1400 1405
Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln
1410 1415 1420
Val Ala Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val
1425 1430 1435 1440
Ile Val Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val
1445 1450 1455
Thr Gln Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro
1460 1465 1470
Gly Ala Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu
1475 1480 1485
Lys Ser Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly
1490 1495 1500
Leu Glu Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala
1505 1510 1515 1520
Gly Val Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu
1525 1530 1535
Pro Val Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp
1540 1545 1550
Val Leu Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg
1555 1560 1565
Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu
1570 1575 1580
Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val
1585 1590 1595 1600
Ser Tyr Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr
1605 1610 1615
Pro Val Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu
1620 1625 1630
Gly Thr Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg
1635 1640 1645
Trp Glu Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro
1650 1655 1660
Glu Gly Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser
1665 1670 1675 1680
Tyr His Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu
1685 1690 1695
Ser Val Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala
1700 1705 1710
Arg Thr Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp
1715 1720 1725
Thr Ser Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala
1730 1735 1740
Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu
1745 1750 1755 1760
Val Pro Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg
1765 1770 1775
Val Thr Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro
1780 1785 1790
Val Leu Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro
1795 1800 1805
Val Cys Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr
1810 1815 1820
Gln Asp Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg
1825 1830 1835 1840
Leu Val Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly
1845 1850 1855
Leu Leu Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly
1860 1865 1870
Ser His Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr
1875 1880 1885
Met Asp Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His
1890 1895 1900
Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro
1905 1910 1915 1920
Gly Val Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe
1925 1930 1935
Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu
1940 1945 1950
Gly Met Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly
1955 1960 1965
Met Asp Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu
1970 1975 1980
Asp Gln Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe
1985 1990 1995 2000
Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly
2005 2010 2015
Gln Lys Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro
2020 2025 2030
Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln
2035 2040 2045
Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly
2050 2055 2060
Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr
2065 2070 2075 2080
Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg
2085 2090 2095
Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly
2100 2105 2110
Ala Pro Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg
2115 2120 2125
Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu
2130 2135 2140
Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met
2145 2150 2155 2160
Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly
2165 2170 2175
Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly
2180 2185 2190
Ser Pro Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu
2195 2200 2205
Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly
2210 2215 2220
Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro
2225 2230 2235 2240
Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys
2245 2250 2255
Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly
2260 2265 2270
Val Ala Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro
2275 2280 2285
Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro
2290 2295 2300
Ala Val Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp
2305 2310 2315 2320
Val Gly Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg
2325 2330 2335
Gly Pro Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp
2340 2345 2350
Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro
2355 2360 2365
Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly
2370 2375 2380
Pro Pro Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu
2385 2390 2395 2400
Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala
2405 2410 2415
Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly
2420 2425 2430
Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser
2435 2440 2445
Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro
2450 2455 2460
Gly Pro Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys
2465 2470 2475 2480
Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly
2485 2490 2495
Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe
2500 2505 2510
Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala
2515 2520 2525
Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly
2530 2535 2540
Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala
2545 2550 2555 2560
Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg
2565 2570 2575
Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly
2580 2585 2590
Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu
2595 2600 2605
Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser
2610 2615 2620
Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly
2625 2630 2635 2640
Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro
2645 2650 2655
Val Gly Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly
2660 2665 2670
Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu
2675 2680 2685
Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val
2690 2695 2700
Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu
2705 2710 2715 2720
Ile Val Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro
2725 2730 2735
Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro
2740 2745 2750
Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly
2755 2760 2765
Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly
2770 2775 2780
Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys
2785 2790 2795 2800
Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala
2805 2810 2815
Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly
2820 2825 2830
Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro
2835 2840 2845
Pro Gly Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly
2850 2855 2860
Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu
2865 2870 2875 2880
Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro
2885 2890 2895
Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly
2900 2905 2910
Asn Pro Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys
2915 2920 2925
Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His
2930 2935 2940
Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly
2945 2950 2955 2960
Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro
2965 2970 2975
Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly
2980 2985 2990
Pro Pro Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu
2995 3000 3005
Pro Gly Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp
3010 3015 3020
Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly
3025 3030 3035 3040
Ser Pro Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro
3045 3050 3055
Thr Gly Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly
3060 3065 3070
Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro
3075 3080 3085
Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly
3090 3095 3100
Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln
3105 3110 3115 3120
Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly
3125 3130 3135
Val Pro Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp
3140 3145 3150
Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro
3155 3160 3165
Gly Gln Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly
3170 3175 3180
Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro
3185 3190 3195 3200
Leu Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser
3205 3210 3215
Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro
3220 3225 3230
Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro
3235 3240 3245
Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly
3250 3255 3260
Glu Arg Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp
3265 3270 3275 3280
Lys Gly Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala
3285 3290 3295
Lys Gly Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys
3300 3305 3310
Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly
3315 3320 3325
Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu
3330 3335 3340
Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro
3345 3350 3355 3360
Gly Ser Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly
3365 3370 3375
Asp Val Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val
3380 3385 3390
Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala
3395 3400 3405
Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly
3410 3415 3420
Glu Pro Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu
3425 3430 3435 3440
Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys
3445 3450 3455
Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly
3460 3465 3470
Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro
3475 3480 3485
Pro Gly Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys
3490 3495 3500
Gly Glu Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val
3505 3510 3515 3520
Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala
3525 3530 3535
Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile
3540 3545 3550
Arg Gly Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly
3555 3560 3565
Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp
3570 3575 3580
Thr Ala Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His
3585 3590 3595 3600
Ala Glu Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu
3605 3610 3615
Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp
3620 3625 3630
Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr
3635 3640 3645
Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu
3650 3655 3660
Ala Cys His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg
3665 3670 3675 3680
Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val
3685 3690 3695
Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
3700 3705
<210> 29
<211> 1299
<212> DNA
<213> Homo sapiens
<400> 29
atgaccacct ccatccgcca gttcacctcc tccagctcca tcaagggctc ctccggcctg 60
gggggcggct cgtcccgcac ctcctgccgg ctgtctggcg gcctgggtgc cggctcctgc 120
aggctgggat ctgctggcgg cctgggcagc accctcgggg gtagcagcta ctccagctgc 180
tacagctttg gctctggtgg tggctatggc agcagctttg ggggtgttga tgggctgctg 240
gctggaggtg agaaggccac catgcagaac ctcaatgacc gcctggcctc ctacctggac 300
aaggtgcgtg ccctggagga ggccaacact gagctggagg tgaagatccg tgactggtac 360
cagaggcagg ccccggggcc cgcccgtgac tacagccagt actacaggac aattgaggag 420
ctgcagaaca agatcctcac agccaccgtg gacaatgcca acatcctgct acagattgac 480
aatgcccgtc tggctgctga tgacttccgc accaagtttg agacagagca ggccctgcgc 540
ctgagtgtgg aggccgacat caatggcctg cgcagggtgc tggatgagct gaccctggcc 600
agagccgacc tggagatgca gattgagaac ctcaaggagg agctggccta cctgaagaag 660
aaccacgagg aggagatgaa cgccctgcga ggccaggtgg gtggtgagat caatgtggag 720
atggacgctg ccccaggcgt ggacctgagc cgcatcctca acgagatgcg tgaccagtat 780
gagaagatgg cagagaagaa ccgcaaggat gccgaggatt ggttcttcag caagacagag 840
gaactgaacc gcgaggtggc caccaacagt gagctggtgc agagtggcaa gagtgagatc 900
tcggagctcc ggcgcaccat gcaggccttg gagatagagc tgcagtccca gctcagcatg 960
aaagcatccc tggagggcaa cctggcggag acagagaacc gctactgcgt gcagctgtcc 1020
cagatccagg ggctgattgg cagcgtggag gagcagctgg cccagcttcg ctgcgagatg 1080
gagcagcaga accaggaata caaaatcctg ctggatgtga agacgcggct ggagcaggag 1140
attgccacct accgccgcct gctggaggga gaggatgccc acctgactca gtacaagaaa 1200
gaaccggtga ccacccgtca ggtgcgtacc attgtggaag aggtccagga tggcaaggtc 1260
atctcctccc gcgagcaggt ccaccagacc acccgctga 1299
<210> 30
<211> 432
<212> PRT
<213> Homo sapiens
<400> 30
Met Thr Thr Ser Ile Arg Gln Phe Thr Ser Ser Ser Ser Ile Lys Gly
1 5 10 15
Ser Ser Gly Leu Gly Gly Gly Ser Ser Arg Thr Ser Cys Arg Leu Ser
20 25 30
Gly Gly Leu Gly Ala Gly Ser Cys Arg Leu Gly Ser Ala Gly Gly Leu
35 40 45
Gly Ser Thr Leu Gly Gly Ser Ser Tyr Ser Ser Cys Tyr Ser Phe Gly
50 55 60
Ser Gly Gly Gly Tyr Gly Ser Ser Phe Gly Gly Val Asp Gly Leu Leu
65 70 75 80
Ala Gly Gly Glu Lys Ala Thr Met Gln Asn Leu Asn Asp Arg Leu Ala
85 90 95
Ser Tyr Leu Asp Lys Val Arg Ala Leu Glu Glu Ala Asn Thr Glu Leu
100 105 110
Glu Val Lys Ile Arg Asp Trp Tyr Gln Arg Gln Ala Pro Gly Pro Ala
115 120 125
Arg Asp Tyr Ser Gln Tyr Tyr Arg Thr Ile Glu Glu Leu Gln Asn Lys
130 135 140
Ile Leu Thr Ala Thr Val Asp Asn Ala Asn Ile Leu Leu Gln Ile Asp
145 150 155 160
Asn Ala Arg Leu Ala Ala Asp Asp Phe Arg Thr Lys Phe Glu Thr Glu
165 170 175
Gln Ala Leu Arg Leu Ser Val Glu Ala Asp Ile Asn Gly Leu Arg Arg
180 185 190
Val Leu Asp Glu Leu Thr Leu Ala Arg Ala Asp Leu Glu Met Gln Ile
195 200 205
Glu Asn Leu Lys Glu Glu Leu Ala Tyr Leu Lys Lys Asn His Glu Glu
210 215 220
Glu Met Asn Ala Leu Arg Gly Gln Val Gly Gly Glu Ile Asn Val Glu
225 230 235 240
Met Asp Ala Ala Pro Gly Val Asp Leu Ser Arg Ile Leu Asn Glu Met
245 250 255
Arg Asp Gln Tyr Glu Lys Met Ala Glu Lys Asn Arg Lys Asp Ala Glu
260 265 270
Asp Trp Phe Phe Ser Lys Thr Glu Glu Leu Asn Arg Glu Val Ala Thr
275 280 285
Asn Ser Glu Leu Val Gln Ser Gly Lys Ser Glu Ile Ser Glu Leu Arg
290 295 300
Arg Thr Met Gln Ala Leu Glu Ile Glu Leu Gln Ser Gln Leu Ser Met
305 310 315 320
Lys Ala Ser Leu Glu Gly Asn Leu Ala Glu Thr Glu Asn Arg Tyr Cys
325 330 335
Val Gln Leu Ser Gln Ile Gln Gly Leu Ile Gly Ser Val Glu Glu Gln
340 345 350
Leu Ala Gln Leu Arg Cys Glu Met Glu Gln Gln Asn Gln Glu Tyr Lys
355 360 365
Ile Leu Leu Asp Val Lys Thr Arg Leu Glu Gln Glu Ile Ala Thr Tyr
370 375 380
Arg Arg Leu Leu Glu Gly Glu Asp Ala His Leu Thr Gln Tyr Lys Lys
385 390 395 400
Glu Pro Val Thr Thr Arg Gln Val Arg Thr Ile Val Glu Glu Val Gln
405 410 415
Asp Gly Lys Val Ile Ser Ser Arg Glu Gln Val His Gln Thr Thr Arg
420 425 430
Claims (251)
- 약제학적 조성물로서,
a) 벡터를 포함하는 바이러스로서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함하는, 상기 바이러스; 및
b) 약제학적으로 허용 가능한 담체를 포함하는, 약제학적 조성물. - 제1항에 있어서, 상기 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스인, 약제학적 조성물.
- 제1항에 있어서, 상기 바이러스는 단순 포진 바이러스(HSV)인, 약제학적 조성물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 바이러스는 복제-결함성인, 약제학적 조성물.
- 제3항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 약제학적 조성물.
- 제3항에 있어서, 상기 단순 포진 바이러스는 변형된 외피를 포함하는, 약제학적 조성물.
- 제6항에 있어서, 상기 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시키는, 약제학적 조성물.
- 제6항에 있어서, 상기 변형된 외피는 돌연변이 단순 포진 바이러스 당단백질을 포함하는, 약제학적 조성물.
- 제1항에 있어서, 상기 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘인, 약제학적 조성물.
- 제9항에 있어서, 상기 HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘(Sleeping Beauty hybrid amplicon)인, 약제학적 조성물.
- 제1항에 있어서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 약제학적 조성물.
- 제11항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 약제학적 조성물.
- 제11항 또는 제12항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에서 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제13항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 약제학적 조성물.
- 제11항 내지 제14항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제11항 내지 제14항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제15항 또는 제16항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제15항 내지 제17항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제15항 내지 제18항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제15항 내지 제18항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 약제학적 조성물.
- 제15항 내지 제20항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 약제학적 조성물.
- 제11항 내지 제21항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 약제학적 조성물.
- 제11항 내지 제22항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
- 제11항 내지 제23항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
- 제11항 내지 제24항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
- 제1항에 있어서, 상기 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능한, 약제학적 조성물.
- 제1항에 있어서, 상기 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합한, 약제학적 조성물.
- 제1항에 있어서, 상기 하나 이상의 전이유전자는 miRNA 결합 부위를 포함하는, 약제학적 조성물.
- 제1항에 있어서, 상기 하나 이상의 전이유전자는 하나 이상의 이종 촉진자에 작동 가능하게 연결되는, 약제학적 조성물.
- 제29항에 있어서, 상기 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물로 이루어진 군으로부터 선택되는, 약제학적 조성물.
- 제1항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 약제학적 조성물.
- 제1항에 있어서, 상기 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는, 약제학적 조성물.
- 제1항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
- 제1항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 상기 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
- 제1항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제1항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제1항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
- 제1항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 상기 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
- 제1항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제1항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현된 경우 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제1항에 있어서, 상기 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함하는, 약제학적 조성물.
- 제41항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는, 약제학적 조성물.
- 제1항에 있어서, 상기 벡터는 다시스트론성(polycistronic)인 전이유전자를 포함하는, 약제학적 조성물.
- 제43항에 있어서, 상기 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(open reading frame: ORF) 상에서 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화하는, 약제학적 조성물.
- 제44항에 있어서, 상기 제1 및 제2 ORF는 내부 리보솜 유입 부위(internal ribosomal entry site: IRES)에 의해 분리되는, 약제학적 조성물.
- 제42항 내지 제45항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 약 등몰비로 있는, 약제학적 조성물.
- 제42항 내지 제45항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대, 및/또는 보충시키는, 약제학적 조성물.
- 제1항에 있어서, 상기 키메라 폴리펩타이드는 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드와 상기 라이실 하이드록실라제 3 폴리펩타이드 사이에 링커 폴리펩타이드를 포함하는, 약제학적 조성물.
- 제48항에 있어서, 상기 링커 폴리펩타이드는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드인, 약제학적 조성물.
- 제48항 또는 제49항에 있어서, 상기 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 상기 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
- 제48항 내지 제51항 중 어느 한 항에 있어서, 상기 키메라 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에 발현될 경우 상기 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물
- 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는 방법으로서, 상기 대상체의 하나 이상의 세포에 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 약제학적 조성물을 국소 또는 경피 투여하는 단계를 포함하는, 방법.
- 제53항에 있어서, 상기 약제학적 조성물은,
a) 벡터를 포함하는 바이러스로서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함하는, 상기 바이러스; 및
b) 약제학적으로 허용 가능한 담체를 포함하는, 방법. - 제54항에 있어서, 상기 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스인, 방법.
- 제54항에 있어서, 상기 바이러스는 단순 포진 바이러스(HSV)인, 방법.
- 제54항 내지 제56항 중 어느 한 항에 있어서, 상기 바이러스는 복제-결함성인, 방법.
- 제56항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 방법.
- 제56항에 있어서, 상기 단순 포진 바이러스는 변형된 외피를 포함하는, 방법.
- 제59항에 있어서, 상기 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시키는, 방법.
- 제59항에 있어서, 상기 변형된 외피는 돌연변이 단순 포진 바이러스 당단백질을 포함하는, 방법.
- 제54항에 있어서, 상기 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘인, 방법.
- 제62항에 있어서, 상기 HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘인, 방법.
- 제54항에 있어서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 방법.
- 제64항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 방법.
- 제64항 또는 제65항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제66항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 방법.
- 제64항 내지 제67항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제64항 내지 제67항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제68항 또는 제69항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제68항 내지 제70항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제68항 내지 제71항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제68항 내지 제72항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 방법.
- 제68항 내지 제73항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 방법.
- 제64항 내지 제74항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 방법.
- 제64항 내지 제75항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
- 제64항 내지 제76항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
- 제64항 내지 제77항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
- 제54항에 있어서, 상기 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능한, 방법.
- 제54항에 있어서, 상기 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합한, 방법.
- 제54항에 있어서, 상기 하나 이상의 전이유전자는 miRNA 결합 부위를 포함하는, 방법.
- 제54항에 있어서, 상기 하나 이상의 전이유전자는 하나 이상의 이종 촉진자에 작동 가능하게 연결되는, 방법.
- 제82항에 있어서, 상기 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물로 이루어진 군으로부터 선택되는, 방법.
- 제54항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 방법.
- 제54항에 있어서, 상기 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는, 방법.
- 제54항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 방법.
- 제54항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 상기 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는, 방법.
- 제54항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제54항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제54항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
- 제54항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 상기 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는, 방법.
- 제54항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제54항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현된 경우 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제54항에 있어서, 상기 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함하는, 방법.
- 제94항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는, 방법.
- 제54항에 있어서, 상기 벡터는 다시스트론성인 전이유전자를 포함하는, 방법.
- 제96항에 있어서, 상기 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화하는, 방법.
- 제97항에 있어서, 상기 제1 및 제2 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리되는, 방법.
- 제95항 내지 제98항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 약 등몰비로 있는, 방법.
- 제95항 내지 제98항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대, 및/또는 보충시키는, 방법.
- 제54항에 있어서, 상기 키메라 폴리펩타이드는 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드와 상기 라이실 하이드록실라제 3 폴리펩타이드 사이에 링커 폴리펩타이드를 포함하는, 방법.
- 제101항에 있어서, 상기 링커 폴리펩타이드는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드인, 방법.
- 제101항 또는 제102항에 있어서, 상기 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
- 제101항 내지 제103항 중 어느 한 항에 있어서, 상기 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
- 제101항 내지 제104항 중 어느 한 항에 있어서, 상기 키메라 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에 발현될 경우 상기 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제53항에 있어서, 상기 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여되는, 방법.
- 제53항에 있어서, 상기 약제학적 조성물은 상기 대상체의 하나 이상의 환부 영역 또는 비환부 영역에 투여되는, 방법.
- 제53항에 있어서, 상기 피부의 상기 질환 또는 장애는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군, 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창 중 하나 이상인, 방법.
- 단리된 키메라 폴리펩타이드로서, 상기 단리된 키메라 폴리펩타이드는,
a) 콜라겐 알파-1 (VII) 사슬 폴리펩타이드;
b) 라이실 하이드록실라제 3 폴리펩타이드; 및
c) 링커 폴리펩타이드를 포함하되;
상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 링커 폴리펩타이드에 의해 분리되는, 단리된 키메라 폴리펩타이드. - 제109항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 단리된 키메라 폴리펩타이드.
- 제109항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 단리된 키메라 폴리펩타이드.
- 제109항에 있어서, 상기 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 단리된 키메라 폴리펩타이드.
- 제109항 내지 제112항 중 어느 한 항에 있어서, 상기 단리된 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 단리된 키메라 폴리펩타이드.
- 제109항 내지 제113항 중 어느 한 항의 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드.
- 제114항의 폴리뉴클레오타이드를 포함하는 벡터.
- 제115항에 있어서, 상기 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘인, 벡터.
- 제116항에 있어서, 상기 HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘인, 벡터.
- 제115항에 있어서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 벡터.
- 제118항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 벡터.
- 제118항 또는 제119항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제120항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 벡터.
- 제118항 내지 제121항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제118항 내지 제121항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제122항 또는 제123항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제122항 내지 제124항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제122항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제122항 내지 제126항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 벡터.
- 제122항 내지 제127항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 벡터.
- 제118항 내지 제128항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 벡터.
- 제118항 내지 제129항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 폴리뉴클레오타이드를 포함하는, 벡터.
- 제118항 내지 제130항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 벡터.
- 제118항 내지 제131항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 폴리뉴클레오타이드를 포함하는, 벡터.
- 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 또는 이들의 임의의 조합을 포함하는 하나 이상의 폴리뉴클레오타이드를 포함하는 벡터로서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 벡터.
- 제133항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 벡터.
- 제133항 또는 제134항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제135항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 벡터.
- 제133항 내지 제136항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제133항 내지 제136항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제137항 또는 제138항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제137항 내지 제139항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제137항 내지 제140항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 벡터.
- 제137항 내지 제141항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 벡터.
- 제137항 내지 제142항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 벡터.
- 제133항 내지 제143항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 벡터.
- 제133항 내지 제144항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 폴리뉴클레오타이드를 포함하는, 벡터.
- 제133항 내지 제145항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 벡터.
- 제133항 내지 제146항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 폴리뉴클레오타이드를 포함하는, 벡터.
- 제133항 내지 제147항 중 어느 한 항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나의 폴리펩타이드를 포함하는, 벡터.
- 제133항 내지 제147항 중 어느 한 항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 2개의 폴리뉴클레오타이드를 포함하는, 벡터.
- 제115항 내지 제149항 중 어느 한 항의 벡터를 포함하는 숙주 세포.
- 단순 포진 바이러스를 수집하는 방법으로서, 관심 대상 벡터가 상기 단순 포진 바이러스 내에 패키징되고, 상기 방법은,
a) 숙주 세포를 헬퍼 바이러스를 암호화하는 벡터와 접촉시키는 단계;
b) 상기 숙주 세포를 제115항 내지 제117항 중 어느 한 항의 벡터와 접촉시키는 단계; 및
c) 상기 숙주 세포에 의해 생성된 단순 포진 바이러스 유전자를 수집하는 단계를 포함하는, 단순 포진 바이러스를 수집하는 방법. - 단순 포진 바이러스를 수집하는 방법으로서, 관심 대상 벡터가 상기 단순 포진 바이러스 내에 패키징되고, 상기 방법은,
a) 상보성 숙주 세포를 제118항 내지 제149항 중 어느 한 항의 벡터와 접촉시키는 단계; 및
b) 상기 상보성 숙주 세포에 의해 생성된 단순 포진 바이러스 유전자를 수집하는 단계를 포함하는, 단순 포진 바이러스를 수집하는 방법. - 제151항 또는 제152항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 단순 포진 바이러스를 수집하는 방법.
- 키트로서,
a) 제1항 내지 제52항 중 어느 한 항의 약제학적 조성물; 및
b) 약제학적 조성물을 투여하기 위한 설명서를 포함하는, 키트. - 약제학적 조성물로서,
a) 벡터를 포함하는 바이러스로서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함하는, 상기 바이러스; 및
b) 약제학적으로 허용 가능한 담체를 포함하는, 약제학적 조성물. - 제155항에 있어서, 상기 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스인, 약제학적 조성물.
- 제155항에 있어서, 상기 바이러스는 단순 포진 바이러스(HSV)인, 약제학적 조성물.
- 제155항 내지 제157항 중 어느 한 항에 있어서, 상기 바이러스는 복제-결함성인, 약제학적 조성물.
- 제155항 내지 제158항 중 어느 한 항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 약제학적 조성물.
- 제155항 내지 제159항 중 어느 한 항에 있어서, 상기 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘인, 약제학적 조성물.
- 제160항에 있어서, 상기 HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘인, 약제학적 조성물.
- 제155항 내지 제159항 중 어느 한 항에 있어서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 약제학적 조성물.
- 제162항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 약제학적 조성물.
- 제162항 또는 제163항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제164항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 약제학적 조성물.
- 제162항 내지 제165항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제162항 내지 제165항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제166항 또는 제167항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제166항 내지 제168항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제166항 내지 제169항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
- 제166항 내지 제170항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 약제학적 조성물.
- 제166항 내지 제171항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 약제학적 조성물.
- 제162항 내지 제172항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 약제학적 조성물.
- 제162항 내지 제173항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
- 제162항 내지 제174항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
- 제162항 내지 제175항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
- 제155항에 있어서, 상기 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능한, 약제학적 조성물.
- 제155항에 있어서, 상기 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합한, 약제학적 조성물.
- 제155항에 있어서, 상기 약제학적으로 허용 가능한 담체는 경피 또는 피부내 투여에 적합한, 약제학적 조성물.
- 제155항에 있어서, 상기 하나 이상의 전이유전자는 miRNA 결합 부위를 포함하는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 상기 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 상기 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현된 경우 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 서열번호 30의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 단편이되, 상기 단편은 서열번호 30의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
- 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
- 제155항 내지 제194항 중 어느 한 항에 있어서, 상기 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함하는, 약제학적 조성물.
- 제195항에 있어서, 상기 제1 전이유전자 및 상기 제2 전이유전자는 각각 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는, 약제학적 조성물.
- 제195항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는, 약제학적 조성물.
- 제195항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 약제학적 조성물.
- 제195항에 있어서, 상기 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 약제학적 조성물.
- 제155항에 있어서, 상기 벡터는 적어도 제1 전이유전자, 제2 전이유전자 및 제3 전이유전자를 포함하는, 약제학적 조성물.
- 제200항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 상기 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 약제학적 조성물.
- 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는 방법으로서, 벡터를 포함하는 약제학적 조성물을 상기 대상체에 투여하는 단계를 포함하되, 상기 벡터는 재조합 단순 포진 바이러스 게놈을 포함하고, 상기 약제학적 조성물은 상기 대상체의 하나 이상의 세포에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한, 방법.
- 제202항에 있어서, 상기 약제학적 조성물은,
a) 상기 벡터를 포함하는 바이러스로서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함하는, 상기 바이러스; 및
b) 약제학적으로 허용 가능한 담체를 포함하는, 방법. - 제203항에 있어서, 상기 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스인, 방법.
- 제203항에 있어서, 상기 바이러스는 단순 포진 바이러스(HSV)인, 방법.
- 제203항 내지 제205항 중 어느 한 항에 있어서, 상기 바이러스는 복제-결함성인, 방법.
- 제203항 내지 제206항 중 어느 한 항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 방법.
- 제202항 내지 제207항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 방법.
- 제202항 내지 제208항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제209항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 방법.
- 제202항 내지 제210항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제202항 내지 제210항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제211항 또는 제212항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제211항 내지 제213항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제211항 내지 제214항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 방법.
- 제211항 내지 제215항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 방법.
- 제211항 내지 제216항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 방법.
- 제202항 내지 제217항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 방법.
- 제202항 내지 제218항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
- 제202항 내지 제219항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
- 제202항 내지 제220항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
- 제202항에 있어서, 상기 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능한, 방법.
- 제203항에 있어서, 상기 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합한, 방법.
- 제203항에 있어서, 상기 약제학적으로 허용 가능한 담체는 경피 또는 피부내 투여에 적합한, 방법.
- 제203항에 있어서, 상기 하나 이상의 전이유전자는 miRNA 결합 부위를 포함하는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 상기 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (II) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 상기 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현된 경우 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 서열번호 30의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 단편이되, 상기 단편은 서열번호 30의 적어도 100개 연속 아미노산을 갖는, 방법.
- 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시키는, 방법.
- 제202항 내지 제239항 중 어느 한 항에 있어서, 상기 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함하는, 방법.
- 제240항에 있어서, 상기 제1 전이유전자 및 상기 제2 전이유전자는 각각 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는, 방법.
- 제240항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는, 방법.
- 제240항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 방법.
- 제240항에 있어서, 상기 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 방법.
- 제202항 내지 제239항 중 어느 한 항에 있어서, 상기 벡터는 적어도 제1 전이유전자, 제2 전이유전자 및 제3 전이유전자를 포함하는, 방법.
- 제245항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 상기 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 방법.
- 제202항 내지 제246항 중 어느 한 항에 있어서, 상기 약제학적 조성물은 상기 대상체에게 국소 또는 경피 투여되는, 방법.
- 제202항 내지 제246항 중 어느 한 항에 있어서, 상기 약제학적 조성물은 상기 대상체에게 경피 또는 피부내 투여되는, 방법.
- 제202항 내지 제248항 중 어느 한 항에 있어서, 상기 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여되는, 방법.
- 제202항 내지 제249항 중 어느 한 항에 있어서, 상기 약제학적 조성물은 상기 대상체의 하나 이상의 환부 영역 또는 비환부 영역에 투여되는, 방법.
- 제202항 내지 제250항 중 어느 한 항에 있어서, 상기 피부의 상기 질환 또는 장애는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군, 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창 중 하나 이상인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662320316P | 2016-04-08 | 2016-04-08 | |
US62/320,316 | 2016-04-08 | ||
PCT/US2016/068974 WO2017176336A1 (en) | 2016-04-08 | 2016-12-28 | Compositions and methods for the treatment of wounds, disorders, and diseases of the skin |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180128016A true KR20180128016A (ko) | 2018-11-30 |
Family
ID=57822104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187030112A KR20180128016A (ko) | 2016-04-08 | 2016-12-28 | 피부의 상처, 장애 및 질환의 치료를 위한 조성물 및 방법 |
Country Status (21)
Country | Link |
---|---|
US (7) | US9877990B2 (ko) |
EP (2) | EP3377637B1 (ko) |
JP (3) | JP6970086B2 (ko) |
KR (1) | KR20180128016A (ko) |
CN (1) | CN109072255A (ko) |
AU (3) | AU2016401692B2 (ko) |
CA (1) | CA3017487A1 (ko) |
CL (3) | CL2018002814A1 (ko) |
CY (1) | CY1123024T1 (ko) |
DK (1) | DK3377637T3 (ko) |
ES (1) | ES2796488T3 (ko) |
HR (1) | HRP20200853T1 (ko) |
HU (1) | HUE049237T2 (ko) |
LT (1) | LT3377637T (ko) |
MX (2) | MX2018012135A (ko) |
PL (1) | PL3377637T3 (ko) |
PT (1) | PT3377637T (ko) |
RS (1) | RS60410B1 (ko) |
SG (1) | SG11201808314QA (ko) |
SI (1) | SI3377637T1 (ko) |
WO (1) | WO2017176336A1 (ko) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112017013858A2 (pt) | 2014-12-26 | 2018-02-27 | Univ Emory | n4-hidroxicitidina e derivados e usos antivirais relacionados aos mesmos |
JP6970086B2 (ja) | 2016-04-08 | 2021-11-24 | クリスタル バイオテック,インコーポレイティド | 皮膚の創傷、障害、及び疾患を処置するための組成物及び方法 |
CN110312506A (zh) * | 2016-11-14 | 2019-10-08 | 密歇根大学董事会 | 用于阻挡紫外线辐射的组合物和方法 |
CA3049652A1 (en) | 2017-01-10 | 2018-07-19 | Intrexon Corporation | Modulating expression of polypeptides via new gene switch expression systems |
MX2020005392A (es) | 2017-12-07 | 2020-12-07 | Univ Emory | N4-hidroxicitidina y derivados y usos antivirales relacionados con los mismos. |
CA3094345A1 (en) | 2018-04-12 | 2019-10-17 | Krystal Biotech, Inc. | Compositions and methods for the treatment of autosomal recessive congenital ichthyosis |
WO2019210219A1 (en) | 2018-04-27 | 2019-10-31 | Krystal Biotech, Inc. | Recombinant nucleic acids encoding cosmetic protein(s) for aesthetic applications |
CA3112627A1 (en) | 2018-09-24 | 2020-04-02 | Krystal Biotech, Inc. | Compositions and methods for the treatment of netherton syndrome |
CA3112633A1 (en) | 2018-09-26 | 2020-04-02 | Krystal Biotech, Inc. | Compositions and methods for the treatment of skin diseases |
WO2020149395A1 (ja) * | 2019-01-18 | 2020-07-23 | 国立大学法人大阪大学 | 栄養障害型表皮水疱症治療薬 |
US10829529B2 (en) | 2019-02-08 | 2020-11-10 | Krystal Biotech, Inc. | Compositions and methods for delivering CFTR polypeptides |
EP3946596A4 (en) * | 2019-03-27 | 2022-12-21 | Phoenix Tissue Repair, Inc. | SYSTEMS AND METHODS OF PRODUCING COLLAGEN COMPOSITIONS 7 |
EP4025699A1 (en) | 2019-09-03 | 2022-07-13 | Krystal Biotech, Inc. | Compositions and methods for the treatment of congenital ichthyoses |
CN112724225B (zh) * | 2019-10-28 | 2023-09-26 | 中国医学科学院药物研究所 | 一种角蛋白bd-6、制法和其药物组合物与用途 |
EP4077688A1 (en) | 2019-12-20 | 2022-10-26 | Krystal Biotech, Inc. | Compositions and methods for gene delivery to the airways and/or lungs |
CN117412986A (zh) | 2021-04-02 | 2024-01-16 | 克里斯托生物技术股份有限公司 | 用于癌症疗法的病毒载体 |
WO2023064806A1 (en) | 2021-10-12 | 2023-04-20 | Phoenix Tissue Repair, Inc. | Collagen 7 protein replacement therapy |
CN117143223B (zh) * | 2022-08-23 | 2024-03-08 | 山西锦波生物医药股份有限公司 | 一种生物合成人体结构性材料的制备方法 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5672344A (en) * | 1987-12-30 | 1997-09-30 | The Regents Of The University Of Michigan | Viral-mediated gene transfer system |
US5658724A (en) | 1992-07-31 | 1997-08-19 | University Of Pittsburgh Of The Commonwealth System Of Higher Education | Herpes simplex virus strains deficient for the essential immediate early genes ICP4 and ICP27 and methods for their production, growth and use |
IL132087A0 (en) * | 1997-04-10 | 2001-03-19 | Univ Southern California | Modified proteins which bind extracellular matrix components |
US5998174A (en) | 1997-05-12 | 1999-12-07 | University Of Pittsburgh Of The Commonwealth System Of Higher Education | Multigene vectors |
GB9715085D0 (en) * | 1997-07-18 | 1997-09-24 | Jahoda Amanda J | Gene therapy vehicle |
US6106826A (en) * | 1997-12-17 | 2000-08-22 | Wisconsin Alumni Research Foundation | Replication competent, avirulent Herpes simplex virus as a vector for neural and ocular gene therapy |
GB9801930D0 (en) * | 1998-01-29 | 1998-03-25 | Univ London | Mutant herpes simplex viruses and uses thereof |
WO1999064094A1 (en) * | 1998-06-12 | 1999-12-16 | Aradigm Corporation | Methods of delivering aerosolized polynucleotides to the respiratory tract |
JP2003535565A (ja) | 1998-12-31 | 2003-12-02 | アーチ ディベロプメント コーポレイション | 新生物疾患の治療に有用な組換え単純ヘルペスウイルス |
GB9930418D0 (en) * | 1999-12-22 | 2000-02-16 | Neurovex Ltd | Replication incompetent herpes virus vectors |
AU1788502A (en) * | 2000-11-28 | 2002-06-11 | Univ Chicago | Genetically engineered herpes virus for the treatment of cardiovascular disease |
AU2003298786A1 (en) | 2002-11-26 | 2004-06-18 | Protein Design Labs, Inc. | Methods of detecting soft tissue sarcoma, compositions and methods of screening for soft tissue sarcoma modulators |
CN101203530A (zh) * | 2004-10-28 | 2008-06-18 | 匹兹堡大学高等教育联邦体系 | 关于脊髓损伤疼痛的外周递送的谷氨酸脱羧酶基因治疗 |
RU2007131689A (ru) * | 2005-01-21 | 2009-02-27 | Интроджен Тетрапьютикс, Инк. (Us) | Местное введение терапевтических и профилактических нуклеиновых кислот, обеспечивающее их пролонгированное действие на клетки-мишени |
AU2006252406B2 (en) * | 2005-06-01 | 2012-05-17 | California Institute Of Technology | Method of targeted gene delivery using viral vectors |
US8703703B2 (en) * | 2006-12-20 | 2014-04-22 | University Of Central Flordia Research Foundation, Inc. | MCPIP as wound therapy |
WO2008106646A2 (en) * | 2007-03-01 | 2008-09-04 | Introgen Therapeutics, Inc | Methods and formulations for topical gene therapy |
US20080289058A1 (en) * | 2007-05-14 | 2008-11-20 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | Targeted delivery of glycine receptors to excitable cells |
WO2009105690A2 (en) * | 2008-02-21 | 2009-08-27 | Targeted Genetics Corporation | Devices and methods for delivering polynucleotides into retinal cells of the macula and fovea |
CN102212559B (zh) | 2011-04-14 | 2014-04-09 | 郑州威瑞生物技术有限公司 | 一种重组的hsv扩增子载体及其用途 |
US9340783B2 (en) * | 2011-10-11 | 2016-05-17 | Inserm (Institut National De La Sante Et De La Recherche Medicale | Exon skipping therapy for dystrophic epidermolysis bullosa |
GB201202561D0 (en) | 2012-02-15 | 2012-03-28 | Univ Dundee | Treatment of skin disorders |
CN104768567B (zh) * | 2012-05-18 | 2017-07-11 | 奥塔哥创业有限公司 | 用于伤口愈合的联合治疗和组合物 |
AU2014223243B2 (en) * | 2013-03-01 | 2019-10-17 | Regents Of The University Of Minnesota | Talen-based gene correction |
BR112015022868B1 (pt) * | 2013-03-14 | 2023-05-16 | Ethris Gmbh | Composições de mrna de cftr e usos e métodos relacionados |
WO2015009952A1 (en) * | 2013-07-17 | 2015-01-22 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | Non-toxic hsv vectors for efficient gene delivery applications and complementing cells for their production |
ES2810800T3 (es) * | 2013-10-28 | 2021-03-09 | Univ Pittsburgh Commonwealth Sys Higher Education | Vector de HSV oncolítico |
MX2016009771A (es) | 2014-01-31 | 2016-11-14 | Factor Bioscience Inc | Metodos y productos para la produccion y administracion de acido nucleico. |
GB2526339A (en) * | 2014-05-21 | 2015-11-25 | Imp Innovations Ltd | Lentiviral vectors |
WO2016049183A1 (en) * | 2014-09-24 | 2016-03-31 | Aerpio Therapeutics, Inc. | Ve-ptp extracellular domain antibodies delivered by a gene therapy vector |
JP6925805B2 (ja) * | 2014-10-31 | 2021-08-25 | 京都府公立大学法人 | ラミニンによる角膜の新規治療 |
US20180148711A1 (en) * | 2015-05-28 | 2018-05-31 | Coda Biotherapeutics, Inc. | Genome editing vectors |
CN109069668B (zh) * | 2015-12-14 | 2023-04-18 | 宾夕法尼亚州大学信托人 | 用于眼病的基因疗法 |
EP3432905B1 (en) * | 2016-03-25 | 2022-06-01 | PeriphaGen, Inc. | Hsv vectors for delivery of nt3 and treatment of cipn |
DK3432912T3 (da) * | 2016-03-25 | 2023-03-13 | Periphagen Inc | Hsv-vektorer med høj transduktion |
JP6970086B2 (ja) | 2016-04-08 | 2021-11-24 | クリスタル バイオテック,インコーポレイティド | 皮膚の創傷、障害、及び疾患を処置するための組成物及び方法 |
CA3094345A1 (en) | 2018-04-12 | 2019-10-17 | Krystal Biotech, Inc. | Compositions and methods for the treatment of autosomal recessive congenital ichthyosis |
WO2019210219A1 (en) | 2018-04-27 | 2019-10-31 | Krystal Biotech, Inc. | Recombinant nucleic acids encoding cosmetic protein(s) for aesthetic applications |
JP2021529531A (ja) | 2018-06-29 | 2021-11-04 | クリスタル バイオテック インコーポレイテッド | 抗体送達のための組成物及び方法 |
-
2016
- 2016-12-28 JP JP2018521309A patent/JP6970086B2/ja active Active
- 2016-12-28 CA CA3017487A patent/CA3017487A1/en active Pending
- 2016-12-28 PT PT168268738T patent/PT3377637T/pt unknown
- 2016-12-28 DK DK16826873.8T patent/DK3377637T3/da active
- 2016-12-28 EP EP16826873.8A patent/EP3377637B1/en active Active
- 2016-12-28 LT LTEP16826873.8T patent/LT3377637T/lt unknown
- 2016-12-28 CN CN201680084419.7A patent/CN109072255A/zh active Pending
- 2016-12-28 RS RS20200669A patent/RS60410B1/sr unknown
- 2016-12-28 PL PL16826873T patent/PL3377637T3/pl unknown
- 2016-12-28 KR KR1020187030112A patent/KR20180128016A/ko not_active Application Discontinuation
- 2016-12-28 US US15/393,151 patent/US9877990B2/en active Active
- 2016-12-28 MX MX2018012135A patent/MX2018012135A/es unknown
- 2016-12-28 EP EP20161137.3A patent/EP3712273A1/en active Pending
- 2016-12-28 WO PCT/US2016/068974 patent/WO2017176336A1/en active Application Filing
- 2016-12-28 HU HUE16826873A patent/HUE049237T2/hu unknown
- 2016-12-28 AU AU2016401692A patent/AU2016401692B2/en active Active
- 2016-12-28 SG SG11201808314QA patent/SG11201808314QA/en unknown
- 2016-12-28 SI SI201630776T patent/SI3377637T1/sl unknown
- 2016-12-28 ES ES16826873T patent/ES2796488T3/es active Active
-
2017
- 2017-12-21 US US15/851,488 patent/US10155016B2/en active Active
-
2018
- 2018-10-03 CL CL2018002814A patent/CL2018002814A1/es unknown
- 2018-10-04 MX MX2022006072A patent/MX2022006072A/es unknown
- 2018-10-31 US US16/177,153 patent/US10441614B2/en active Active
-
2019
- 2019-10-10 US US16/598,982 patent/US11185564B2/en active Active
- 2019-12-13 AU AU2019280069A patent/AU2019280069B2/en active Active
-
2020
- 2020-05-27 HR HRP20200853TT patent/HRP20200853T1/hr unknown
- 2020-06-05 CY CY20201100503T patent/CY1123024T1/el unknown
-
2021
- 2021-04-09 CL CL2021000881A patent/CL2021000881A1/es unknown
- 2021-10-27 JP JP2021175260A patent/JP7480105B2/ja active Active
- 2021-11-17 US US17/529,161 patent/US20220273737A1/en not_active Abandoned
-
2022
- 2022-06-30 AU AU2022204729A patent/AU2022204729A1/en active Pending
- 2022-11-30 US US18/060,515 patent/US11865148B2/en active Active
-
2023
- 2023-03-15 CL CL2023000743A patent/CL2023000743A1/es unknown
- 2023-06-27 US US18/342,284 patent/US20230414686A1/en active Pending
- 2023-07-04 JP JP2023109819A patent/JP2023118838A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019280069B2 (en) | Compositions and methods for the treatment of wounds, disorders, and diseases of the skin | |
JP2024056823A (ja) | 審美的用途のための美容用タンパク質をコードする組換え核酸 | |
EP1141283B1 (en) | NOVEL METHOD FOrR IDENTIFICATION OF A COMPOUND MODULATING INTERACTION BETWEEN A TNF LIGAND AND ITS RECEPTOR ON B CELLS | |
KR20100017494A (ko) | 프로테오글리칸 폴리펩타이드를 암호화하는 핵산을 이용한 상처 및 피부손상의 치료 | |
US6300484B1 (en) | DNA encoding DP. 75 and a process for its use | |
JP2024063082A (ja) | 皮膚疾患の治療のための組成物及び方法 | |
US20030175260A1 (en) | Novel DNA and a process for its use | |
US8076293B2 (en) | Use of BiP or a variant, homologue, derivative or fragment thereof in the manufacture of a medicament for the prevention or treatment of bone loss or bone resorption | |
US20230295658A1 (en) | Compositions and methods for in vivo gene transfer | |
AU759409B2 (en) | Preventives and/or remedies for obesity | |
NZ746213B2 (en) | Compositions and methods for the treatment of wounds, disorders, and diseases of the skin | |
KR19980701695A (ko) | 미오신 중쇄 sm1 이소폼 단백질을 암호화하는 dna를 벡터 dna에 삽입시킨 재조합 dna, 전기 재조합 dna가 도입된 미생물 및 재조합 dna를 포함하는 동맥경화증 치료제 | |
US20020142963A1 (en) | Methods for increasing bone formation and enhancing bone accretion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |