CN109072255A - 用于治疗皮肤的伤口、病症和疾病的组合物和方法 - Google Patents
用于治疗皮肤的伤口、病症和疾病的组合物和方法 Download PDFInfo
- Publication number
- CN109072255A CN109072255A CN201680084419.7A CN201680084419A CN109072255A CN 109072255 A CN109072255 A CN 109072255A CN 201680084419 A CN201680084419 A CN 201680084419A CN 109072255 A CN109072255 A CN 109072255A
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- herpes simplex
- pharmaceutical composition
- simplex virus
- carrier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 163
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 53
- 201000010099 disease Diseases 0.000 title claims abstract description 48
- 239000000203 mixture Substances 0.000 title claims description 12
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 781
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 685
- 229920001184 polypeptide Polymers 0.000 claims abstract description 684
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 258
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 258
- 239000002157 polynucleotide Substances 0.000 claims abstract description 257
- 102000004510 Collagen Type VII Human genes 0.000 claims abstract description 217
- 108010017377 Collagen Type VII Proteins 0.000 claims abstract description 217
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 204
- 108010020504 2-Oxoglutarate 5-Dioxygenase Procollagen-Lysine Proteins 0.000 claims abstract description 198
- 102000008490 2-Oxoglutarate 5-Dioxygenase Procollagen-Lysine Human genes 0.000 claims abstract description 198
- 102000011782 Keratins Human genes 0.000 claims abstract description 127
- 108010076876 Keratins Proteins 0.000 claims abstract description 127
- 210000004292 cytoskeleton Anatomy 0.000 claims abstract description 122
- 230000002708 enhancing effect Effects 0.000 claims abstract description 47
- 206010053177 Epidermolysis Diseases 0.000 claims abstract description 45
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 16
- 230000000116 mitigating effect Effects 0.000 claims abstract description 15
- 241000700584 Simplexvirus Species 0.000 claims description 328
- 108700026244 Open Reading Frames Proteins 0.000 claims description 165
- 101150027427 ICP4 gene Proteins 0.000 claims description 159
- 230000035772 mutation Effects 0.000 claims description 159
- 210000004027 cell Anatomy 0.000 claims description 150
- 230000000415 inactivating effect Effects 0.000 claims description 145
- 108090000623 proteins and genes Proteins 0.000 claims description 135
- 241000700605 Viruses Species 0.000 claims description 108
- 101710130522 mRNA export factor Proteins 0.000 claims description 79
- 101001042049 Human herpesvirus 1 (strain 17) Transcriptional regulator ICP22 Proteins 0.000 claims description 76
- 101000999690 Human herpesvirus 2 (strain HG52) E3 ubiquitin ligase ICP22 Proteins 0.000 claims description 76
- 101150090364 ICP0 gene Proteins 0.000 claims description 75
- 108091093088 Amplicon Proteins 0.000 claims description 67
- 101150081415 UL55 gene Proteins 0.000 claims description 63
- 108700019146 Transgenes Proteins 0.000 claims description 62
- 101150044021 UL41 gene Proteins 0.000 claims description 59
- 210000000981 epithelium Anatomy 0.000 claims description 58
- 230000015572 biosynthetic process Effects 0.000 claims description 56
- 230000006798 recombination Effects 0.000 claims description 50
- 238000005215 recombination Methods 0.000 claims description 50
- 102000008186 Collagen Human genes 0.000 claims description 45
- 108010035532 Collagen Proteins 0.000 claims description 45
- 229920001436 collagen Polymers 0.000 claims description 45
- 239000003937 drug carrier Substances 0.000 claims description 41
- 150000001413 amino acids Chemical class 0.000 claims description 39
- 108700005077 Viral Genes Proteins 0.000 claims description 37
- 230000004048 modification Effects 0.000 claims description 34
- 238000012986 modification Methods 0.000 claims description 34
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 claims description 30
- 210000002469 basement membrane Anatomy 0.000 claims description 30
- 102000008946 Fibrinogen Human genes 0.000 claims description 29
- 108010049003 Fibrinogen Proteins 0.000 claims description 29
- 229940012952 fibrinogen Drugs 0.000 claims description 29
- 239000000758 substrate Substances 0.000 claims description 29
- 230000003612 virological effect Effects 0.000 claims description 29
- 208000009889 Herpes Simplex Diseases 0.000 claims description 27
- 101150103126 ICP22 gene Proteins 0.000 claims description 25
- 241000701074 Human alphaherpesvirus 2 Species 0.000 claims description 20
- 101150029683 gB gene Proteins 0.000 claims description 19
- 241000702421 Dependoparvovirus Species 0.000 claims description 18
- 206010052428 Wound Diseases 0.000 claims description 18
- 208000027418 Wounds and injury Diseases 0.000 claims description 17
- 239000011248 coating agent Substances 0.000 claims description 15
- 238000000576 coating method Methods 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 13
- 102000008109 Mixed Function Oxygenases Human genes 0.000 claims description 12
- 108010074633 Mixed Function Oxygenases Proteins 0.000 claims description 12
- 230000010076 replication Effects 0.000 claims description 12
- 241000701161 unidentified adenovirus Species 0.000 claims description 12
- 240000007019 Oxalis corniculata Species 0.000 claims description 11
- 230000007547 defect Effects 0.000 claims description 11
- 239000003814 drug Substances 0.000 claims description 11
- 206010021198 ichthyosis Diseases 0.000 claims description 11
- 108091070501 miRNA Proteins 0.000 claims description 11
- 239000002679 microRNA Substances 0.000 claims description 11
- 238000007920 subcutaneous administration Methods 0.000 claims description 11
- 201000004624 Dermatitis Diseases 0.000 claims description 10
- 206010014989 Epidermolysis bullosa Diseases 0.000 claims description 10
- 241000701024 Human betaherpesvirus 5 Species 0.000 claims description 10
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical group NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 claims description 10
- 241000711408 Murine respirovirus Species 0.000 claims description 9
- 241000700618 Vaccinia virus Species 0.000 claims description 9
- 210000001519 tissue Anatomy 0.000 claims description 9
- 241001430294 unidentified retrovirus Species 0.000 claims description 9
- 206010064571 Gene mutation Diseases 0.000 claims description 8
- 230000000735 allogeneic effect Effects 0.000 claims description 8
- 231100000614 poison Toxicity 0.000 claims description 8
- 239000002574 poison Substances 0.000 claims description 8
- 208000010201 Exanthema Diseases 0.000 claims description 7
- 201000005884 exanthem Diseases 0.000 claims description 7
- 239000003292 glue Substances 0.000 claims description 7
- 206010037844 rash Diseases 0.000 claims description 7
- 230000005100 tissue tropism Effects 0.000 claims description 7
- 241000175212 Herpesvirales Species 0.000 claims description 6
- 208000011219 Netherton syndrome Diseases 0.000 claims description 6
- 230000029663 wound healing Effects 0.000 claims description 6
- 201000004625 Acrodermatitis Diseases 0.000 claims description 5
- 201000000297 Erysipelas Diseases 0.000 claims description 5
- 102000003886 Glycoproteins Human genes 0.000 claims description 5
- 108090000288 Glycoproteins Proteins 0.000 claims description 5
- 101100181372 Homo sapiens LAMB3 gene Proteins 0.000 claims description 5
- 101150063253 LAMB3 gene Proteins 0.000 claims description 5
- 206010034277 Pemphigoid Diseases 0.000 claims description 5
- 201000004681 Psoriasis Diseases 0.000 claims description 5
- 241001303601 Rosacea Species 0.000 claims description 5
- 206010041955 Stasis dermatitis Diseases 0.000 claims description 5
- 206010048218 Xeroderma Diseases 0.000 claims description 5
- 208000010668 atopic eczema Diseases 0.000 claims description 5
- 208000005035 cutaneous candidiasis Diseases 0.000 claims description 5
- 201000001981 dermatomyositis Diseases 0.000 claims description 5
- 201000011486 lichen planus Diseases 0.000 claims description 5
- 201000004700 rosacea Diseases 0.000 claims description 5
- 235000000346 sugar Nutrition 0.000 claims description 5
- 201000009030 Carcinoma Diseases 0.000 claims description 4
- 206010007882 Cellulitis Diseases 0.000 claims description 4
- 206010021531 Impetigo Diseases 0.000 claims description 4
- 208000004210 Pressure Ulcer Diseases 0.000 claims description 4
- 201000000751 autosomal recessive congenital ichthyosis Diseases 0.000 claims description 4
- 206010025135 lupus erythematosus Diseases 0.000 claims description 4
- 235000008331 Pinus X rigitaeda Nutrition 0.000 claims description 3
- 235000011613 Pinus brutia Nutrition 0.000 claims description 3
- 241000018646 Pinus brutia Species 0.000 claims description 3
- 230000003321 amplification Effects 0.000 claims description 2
- 210000000988 bone and bone Anatomy 0.000 claims description 2
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 2
- 238000009738 saturating Methods 0.000 claims description 2
- 241000700588 Human alphaherpesvirus 1 Species 0.000 claims 18
- 230000002779 inactivation Effects 0.000 claims 2
- 230000003834 intracellular effect Effects 0.000 claims 2
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 claims 1
- 206010061218 Inflammation Diseases 0.000 claims 1
- 230000003213 activating effect Effects 0.000 claims 1
- 102000057593 human F8 Human genes 0.000 claims 1
- 230000004054 inflammatory process Effects 0.000 claims 1
- 125000001288 lysyl group Chemical group 0.000 claims 1
- 229940047431 recombinate Drugs 0.000 claims 1
- 238000010839 reverse transcription Methods 0.000 claims 1
- 210000003705 ribosome Anatomy 0.000 claims 1
- 208000024891 symptom Diseases 0.000 abstract description 12
- 230000014509 gene expression Effects 0.000 description 62
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 43
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 43
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 43
- 108020004999 messenger RNA Proteins 0.000 description 41
- 238000003786 synthesis reaction Methods 0.000 description 39
- 210000003491 skin Anatomy 0.000 description 31
- 238000003776 cleavage reaction Methods 0.000 description 28
- 230000007017 scission Effects 0.000 description 28
- 102000004961 Furin Human genes 0.000 description 24
- 108090001126 Furin Proteins 0.000 description 24
- 102100035199 Procollagen glycosyltransferase Human genes 0.000 description 22
- 101710102040 Procollagen glycosyltransferase Proteins 0.000 description 21
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 20
- 230000003014 reinforcing effect Effects 0.000 description 20
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 19
- 101100114362 Caenorhabditis elegans col-7 gene Proteins 0.000 description 18
- 239000002253 acid Substances 0.000 description 18
- 239000002773 nucleotide Substances 0.000 description 18
- 125000003729 nucleotide group Chemical group 0.000 description 18
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 18
- 229940024606 amino acid Drugs 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 17
- 229930182470 glycoside Natural products 0.000 description 17
- 150000002338 glycosides Chemical class 0.000 description 16
- 239000002609 medium Substances 0.000 description 15
- 208000010975 Dystrophic epidermolysis bullosa Diseases 0.000 description 14
- 208000004298 epidermolysis bullosa dystrophica Diseases 0.000 description 14
- 208000015181 infectious disease Diseases 0.000 description 14
- 241000282414 Homo sapiens Species 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 12
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 12
- 108091036066 Three prime untranslated region Proteins 0.000 description 12
- 150000007523 nucleic acids Chemical group 0.000 description 12
- 229910021529 ammonia Inorganic materials 0.000 description 11
- 102000004169 proteins and genes Human genes 0.000 description 11
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 10
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 10
- 239000003981 vehicle Substances 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 9
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 9
- 238000005728 strengthening Methods 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 102000016362 Catenins Human genes 0.000 description 8
- 108010067316 Catenins Proteins 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 8
- -1 elastoser Proteins 0.000 description 8
- 210000002510 keratinocyte Anatomy 0.000 description 8
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 8
- 108020004707 nucleic acids Proteins 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 230000028327 secretion Effects 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 230000001276 controlling effect Effects 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 239000007924 injection Substances 0.000 description 7
- 238000002347 injection Methods 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 241000218636 Thuja Species 0.000 description 6
- 125000002252 acyl group Chemical group 0.000 description 6
- 208000002352 blister Diseases 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 235000013601 eggs Nutrition 0.000 description 6
- 239000006210 lotion Substances 0.000 description 6
- 210000004400 mucous membrane Anatomy 0.000 description 6
- 235000018102 proteins Nutrition 0.000 description 6
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 5
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 229930185560 Pseudouridine Natural products 0.000 description 5
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 5
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 5
- 210000004907 gland Anatomy 0.000 description 5
- 229940029575 guanosine Drugs 0.000 description 5
- 230000002787 reinforcement Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 4
- 208000032170 Congenital Abnormalities Diseases 0.000 description 4
- 208000002720 Malnutrition Diseases 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 229960005305 adenosine Drugs 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 239000003102 growth factor Substances 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 4
- 230000001071 malnutrition Effects 0.000 description 4
- 235000000824 malnutrition Nutrition 0.000 description 4
- 208000015380 nutritional deficiency disease Diseases 0.000 description 4
- 238000011321 prophylaxis Methods 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 102100034613 Annexin A2 Human genes 0.000 description 3
- 108090000668 Annexin A2 Proteins 0.000 description 3
- WVDDGKGOMKODPV-UHFFFAOYSA-N Benzyl alcohol Chemical compound OCC1=CC=CC=C1 WVDDGKGOMKODPV-UHFFFAOYSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 229920006317 cationic polymer Polymers 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 210000002615 epidermis Anatomy 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 3
- 238000010166 immunofluorescence Methods 0.000 description 3
- 210000003127 knee Anatomy 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 3
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 3
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- QROZCFCNYCVEDO-KQYNXXCUSA-N (2r,3r,4s,5r)-2-[6-(hydroxyamino)purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(NO)=C2N=C1 QROZCFCNYCVEDO-KQYNXXCUSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- WYXSYVWAUAUWLD-SHUUEZRQSA-N 6-azauridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=N1 WYXSYVWAUAUWLD-SHUUEZRQSA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 201000004384 Alopecia Diseases 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 241000710777 Classical swine fever virus Species 0.000 description 2
- 229920002261 Corn starch Polymers 0.000 description 2
- 241000710127 Cricket paralysis virus Species 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 241000710188 Encephalomyocarditis virus Species 0.000 description 2
- 241000709661 Enterovirus Species 0.000 description 2
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 2
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 2
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000711549 Hepacivirus C Species 0.000 description 2
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 208000029462 Immunodeficiency disease Diseases 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 101100496574 Mus musculus Col7a1 gene Proteins 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 208000000474 Poliomyelitis Diseases 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 108010017121 Proto-Oncogene Proteins c-pim-1 Proteins 0.000 description 2
- 102000004433 Proto-Oncogene Proteins c-pim-1 Human genes 0.000 description 2
- 108010019674 Proto-Oncogene Proteins c-sis Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N aldehydo-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- OSGAYBCDTDRGGQ-UHFFFAOYSA-L calcium sulfate Chemical compound [Ca+2].[O-]S([O-])(=O)=O OSGAYBCDTDRGGQ-UHFFFAOYSA-L 0.000 description 2
- YCIMNLLNPGFGHC-UHFFFAOYSA-N catechol Chemical compound OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 239000008120 corn starch Substances 0.000 description 2
- 229940099112 cornstarch Drugs 0.000 description 2
- 239000000412 dendrimer Substances 0.000 description 2
- 229920000736 dendritic polymer Polymers 0.000 description 2
- 230000008021 deposition Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003511 endothelial effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 210000003238 esophagus Anatomy 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- MURGITYSBWUQTI-UHFFFAOYSA-N fluorescin Chemical compound OC(=O)C1=CC=CC=C1C1C2=CC=C(O)C=C2OC2=CC(O)=CC=C21 MURGITYSBWUQTI-UHFFFAOYSA-N 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 230000007813 immunodeficiency Effects 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 235000019359 magnesium stearate Nutrition 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 210000000282 nail Anatomy 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 2
- 239000002674 ointment Substances 0.000 description 2
- 239000006072 paste Substances 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 230000006337 proteolytic cleavage Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 2
- 210000004761 scalp Anatomy 0.000 description 2
- 210000001626 skin fibroblast Anatomy 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 206010041823 squamous cell carcinoma Diseases 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 239000000454 talc Substances 0.000 description 2
- 235000012222 talc Nutrition 0.000 description 2
- 229910052623 talc Inorganic materials 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 230000004393 visual impairment Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- YUNJBQDCTLSQCZ-JXOAFFINSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-hydrazinyl-5-methylpyrimidin-2-one Chemical compound O=C1N=C(NN)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YUNJBQDCTLSQCZ-JXOAFFINSA-N 0.000 description 1
- RSSRMDMJEZIUJX-XVFCMESISA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-hydrazinylpyrimidin-2-one Chemical compound O=C1N=C(NN)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RSSRMDMJEZIUJX-XVFCMESISA-N 0.000 description 1
- QJFQWYBWIIJENY-FDDDBJFASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-4-(methylamino)pyrimidin-2-one Chemical compound C1=C(C)C(NC)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QJFQWYBWIIJENY-FDDDBJFASA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 1
- LZWSGWMPCIAGIJ-UAKXSSHOSA-N 4,5-diamino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C(N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZWSGWMPCIAGIJ-UAKXSSHOSA-N 0.000 description 1
- YUDSCJBUWTYENI-VPCXQMTMSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O YUDSCJBUWTYENI-VPCXQMTMSA-N 0.000 description 1
- 229940090248 4-hydroxybenzoic acid Drugs 0.000 description 1
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- YBTWWWIJBCCYNR-UAKXSSHOSA-N 5-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YBTWWWIJBCCYNR-UAKXSSHOSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 101100114361 Arabidopsis thaliana COL7 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000701822 Bovine papillomavirus Species 0.000 description 1
- 101100326791 Caenorhabditis elegans cap-2 gene Proteins 0.000 description 1
- 241000282461 Canis lupus Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 229920000832 Cutin Polymers 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 208000019505 Deglutition disease Diseases 0.000 description 1
- 241000555268 Dendroides Species 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 206010067671 Disease complication Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000700662 Fowlpox virus Species 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000167880 Hirundinidae Species 0.000 description 1
- 101000998027 Homo sapiens Keratin, type I cytoskeletal 17 Proteins 0.000 description 1
- 101000595913 Homo sapiens Procollagen glycosyltransferase Proteins 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 102100033511 Keratin, type I cytoskeletal 17 Human genes 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- 125000002059 L-arginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C([H])([H])N([H])C(=N[H])N([H])[H] 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000701076 Macacine alphaherpesvirus 1 Species 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- 241001448624 Miliaria Species 0.000 description 1
- 208000004221 Multiple Trauma Diseases 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- RCEAADKTGXTDOA-UHFFFAOYSA-N OS(O)(=O)=O.CCCCCCCCCCCC[Na] Chemical compound OS(O)(=O)=O.CCCCCCCCCCCC[Na] RCEAADKTGXTDOA-UHFFFAOYSA-N 0.000 description 1
- 101150077518 PLOD3 gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- 102000004079 Prolyl Hydroxylases Human genes 0.000 description 1
- 108010043005 Prolyl Hydroxylases Proteins 0.000 description 1
- QOSMNYMQXIVWKY-UHFFFAOYSA-N Propyl levulinate Chemical compound CCCOC(=O)CCC(C)=O QOSMNYMQXIVWKY-UHFFFAOYSA-N 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 206010040840 Skin erosion Diseases 0.000 description 1
- 206010040851 Skin fragility Diseases 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 108010046722 Thrombospondin 1 Proteins 0.000 description 1
- 102100036034 Thrombospondin-1 Human genes 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 101000956368 Trittame loki CRISP/Allergen/PR-1 Proteins 0.000 description 1
- 208000000260 Warts Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 238000012382 advanced drug delivery Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 231100000360 alopecia Toxicity 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O ammonium group Chemical group [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960002756 azacitidine Drugs 0.000 description 1
- 229960000686 benzalkonium chloride Drugs 0.000 description 1
- 229960001950 benzethonium chloride Drugs 0.000 description 1
- UREZNYTWGJKWBI-UHFFFAOYSA-M benzethonium chloride Chemical compound [Cl-].C1=CC(C(C)(C)CC(C)(C)C)=CC=C1OCCOCC[N+](C)(C)CC1=CC=CC=C1 UREZNYTWGJKWBI-UHFFFAOYSA-M 0.000 description 1
- 235000019445 benzyl alcohol Nutrition 0.000 description 1
- 229960004217 benzyl alcohol Drugs 0.000 description 1
- CADWTSSKOVRVJC-UHFFFAOYSA-N benzyl(dimethyl)azanium;chloride Chemical compound [Cl-].C[NH+](C)CC1=CC=CC=C1 CADWTSSKOVRVJC-UHFFFAOYSA-N 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- HUTDDBSSHVOYJR-UHFFFAOYSA-H bis[(2-oxo-1,3,2$l^{5},4$l^{2}-dioxaphosphaplumbetan-2-yl)oxy]lead Chemical compound [Pb+2].[Pb+2].[Pb+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O HUTDDBSSHVOYJR-UHFFFAOYSA-H 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000001217 buttock Anatomy 0.000 description 1
- FUFJGUQYACFECW-UHFFFAOYSA-L calcium hydrogenphosphate Chemical compound [Ca+2].OP([O-])([O-])=O FUFJGUQYACFECW-UHFFFAOYSA-L 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 235000011132 calcium sulphate Nutrition 0.000 description 1
- 102000023852 carbohydrate binding proteins Human genes 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 235000015111 chews Nutrition 0.000 description 1
- 238000005660 chlorination reaction Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 210000000589 cicatrix Anatomy 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 229940075614 colloidal silicon dioxide Drugs 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 150000004696 coordination complex Chemical class 0.000 description 1
- HPXRVTGHNJAIIH-UHFFFAOYSA-N cyclohexanol Chemical compound OC1CCCCC1 HPXRVTGHNJAIIH-UHFFFAOYSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 210000003298 dental enamel Anatomy 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 235000019700 dicalcium phosphate Nutrition 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 230000002500 effect on skin Effects 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 210000000969 egg white Anatomy 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 208000007150 epidermolysis bullosa simplex Diseases 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229930182478 glucoside Natural products 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000008172 hydrogenated vegetable oil Substances 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 229920003063 hydroxymethyl cellulose Polymers 0.000 description 1
- 229940031574 hydroxymethyl cellulose Drugs 0.000 description 1
- 239000001866 hydroxypropyl methyl cellulose Substances 0.000 description 1
- 235000010979 hydroxypropyl methyl cellulose Nutrition 0.000 description 1
- 229920003088 hydroxypropyl methyl cellulose Polymers 0.000 description 1
- UFVKGYZPFZQRLF-UHFFFAOYSA-N hydroxypropyl methyl cellulose Chemical compound OC1C(O)C(OC)OC(CO)C1OC1C(O)C(O)C(OC2C(C(O)C(OC3C(C(O)C(O)C(CO)O3)O)C(CO)O2)O)C(CO)O1 UFVKGYZPFZQRLF-UHFFFAOYSA-N 0.000 description 1
- 238000000530 impalefection Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 239000007925 intracardiac injection Substances 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 238000002647 laser therapy Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- RLSSMJSEOOYNOY-UHFFFAOYSA-N m-cresol Chemical compound CC1=CC=CC(O)=C1 RLSSMJSEOOYNOY-UHFFFAOYSA-N 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229940100630 metacresol Drugs 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- LXCFILQKKLGQFO-UHFFFAOYSA-N methylparaben Chemical compound COC(=O)C1=CC=C(O)C=C1 LXCFILQKKLGQFO-UHFFFAOYSA-N 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 231100000956 nontoxicity Toxicity 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 229940127249 oral antibiotic Drugs 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000010458 rotten stone Substances 0.000 description 1
- 108010038196 saccharide-binding proteins Proteins 0.000 description 1
- 238000009938 salting Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 231100000241 scar Toxicity 0.000 description 1
- 230000036573 scar formation Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- RMAQACBXLXPBSY-UHFFFAOYSA-N silicic acid Chemical compound O[Si](O)(O)O RMAQACBXLXPBSY-UHFFFAOYSA-N 0.000 description 1
- 235000012239 silicon dioxide Nutrition 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 201000010153 skin papilloma Diseases 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- WXMKPNITSTVMEF-UHFFFAOYSA-M sodium benzoate Chemical compound [Na+].[O-]C(=O)C1=CC=CC=C1 WXMKPNITSTVMEF-UHFFFAOYSA-M 0.000 description 1
- 239000004299 sodium benzoate Substances 0.000 description 1
- 235000010234 sodium benzoate Nutrition 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 208000017572 squamous cell neoplasm Diseases 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- SFVFIFLLYFPGHH-UHFFFAOYSA-M stearalkonium chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CC1=CC=CC=C1 SFVFIFLLYFPGHH-UHFFFAOYSA-M 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 150000005846 sugar alcohols Polymers 0.000 description 1
- 239000000516 sunscreening agent Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 210000004906 toe nail Anatomy 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
- A61K35/763—Herpes virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/1703—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- A61K38/1709—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- A61K38/1748—Keratin; Cytokeratin
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/39—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/44—Oxidoreductases (1)
- A61K38/443—Oxidoreductases (1) acting on CH-OH groups as donors, e.g. glucose oxidase, lactate dehydrogenase (1.1)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0014—Skin, i.e. galenical aspects of topical compositions
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/02—Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/04—Antipruritics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/16—Emollients or protectives, e.g. against radiation
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/78—Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/11—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
- C12Y114/11004—Procollagen-lysine 5-dioxygenase (1.14.11.4), i.e. lysine-hydroxylase
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/30—Macromolecular organic or inorganic compounds, e.g. inorganic polyphosphates
- A61K47/36—Polysaccharides; Derivatives thereof, e.g. gums, starch, alginate, dextrin, hyaluronic acid, chitosan, inulin, agar or pectin
- A61K47/38—Cellulose; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/06—Ointments; Bases therefor; Other semi-solid forms, e.g. creams, sticks, gels
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16611—Simplexvirus, e.g. human herpesvirus 1, 2
- C12N2710/16641—Use of virus, viral particle or viral elements as a vector
- C12N2710/16643—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Epidemiology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Dermatology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Virology (AREA)
- Toxicology (AREA)
- Marine Sciences & Fisheries (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
- Peptides Or Proteins (AREA)
Abstract
本公开部分地涉及包含一种或多种多核苷酸的药物组合物,所述药物组合物适于增强、增加、加强和/或强化受试者中的胶原α‑1(VII)链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平。本公开还部分地涉及用于在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的药物组合物和方法,所述受试者包括具有大疱性表皮松解症的一种或多种症状或有出现大疱性表皮松解症的一种或多种症状风险的受试者。
Description
相关申请的交叉引用
本申请要求2016年4月08日提交的美国临时申请序列号62/320,316的优先权,该临时申请以引用的方式整体并入本文。
在ASCII文本文件上提交的序列表
以下在ASCII文本文件上提交的内容以引用的方式整体并入本文:计算机可读形式(CRF)的序列表(文件名:761342000140SEQLIST.txt,记录日期:2016年12月28日,大小:394KB)。
发明领域
本公开部分地涉及用于在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的组合物和方法,所述受试者包括具有大疱性表皮松解症的一种或多种症状或有出现大疱性表皮松解症的一种或多种症状风险的受试者。
背景技术
许多严重的疾病相关皮肤状况与罹患这些疾病的患者中的一种或多种遗传性病症相关联。一种这样的疾病,即大疱性表皮松解症(EB)是一组遗传性病症,这些病症导致受影响个体的皮肤和粘膜在受到轻微损伤或摩擦(诸如刮擦、摩擦或擦伤)时就起泡和受侵蚀。营养不良型大疱性表皮松解症(DEB)是EB的主要形式之一。这种疾患的体征和症状在受影响个体中差异很大,从轻度(起泡可能只影响手部、足部、膝盖和肘部)到重度(大范围起泡和瘢痕形成,可能导致视力丧失、毁容以及其他严重的且有时是致命的医疗状况)不等。
营养不良型大疱性表皮松解症分为三个主要类型。常染色体显性营养不良型大疱性表皮松解症(称为显性营养不良型大疱性表皮松解症或DDEB)通常是最温和的形式,起泡通常局限于手部、足部膝盖和肘部。另外两种类型的营养不良型大疱性表皮松解症,即Hallopeau-Siemens型隐性营养不良型大疱性表皮松解症和非Hallopeau-Siemens型隐性大疱性表皮松解症(统称为隐性营养不良型大疱性表皮松解症或RDEB)更为严重。RDEB的特征通常为皮肤和粘膜的大量起泡和瘢痕形成。水疱通常遍布全身,包括粘膜(诸如口腔和消化道的内层),而这些水疱的愈合会导致广泛的瘢痕形成。口腔和食道受损会使食物难以咀嚼和吞咽,导致慢性营养不良和生长缓慢。广泛瘢痕形成的并发症可包括手指和脚趾融合、关节畸形和眼睛炎症而导致视力丧失。此外,罹患RDEB的患者有很高的风险发展鳞状细胞癌,鳞状细胞癌在该患者群体中可能异常具有侵袭性,通常会变得危及生命。尽管这三种类型的营养不良型大疱性表皮松解症的严重程度不同,但它们具有许多共同的特征,并且是由相同的基因突变所引起的。
营养不良型大疱性表皮松解症是由Col7a1基因的突变所引起的,该基因编码胶原α-1(VII)链蛋白(胶原7)(Collagen alpha-1(VII)chain protein(Collagen 7))。在DEB患者中已鉴别出该基因的多于240个不同突变。此外,在营养不良型表皮松解症患者中也观察到编码胶原修饰赖氨酰羟化酶3酶(LH3)的PLOD3基因表达的显着降低。胶原α-1(VII)链蛋白起到增强和稳定皮肤的作用,而赖氨酰羟化酶3在功能性胶原α-1(VII)链蛋白的合成和分泌中起关键作用。简而言之,翻译Col7a1转录物,并对所得肽进行翻译后修饰,方式为使所得肽的脯氨酸残基(通过脯氨酰羟化酶)和赖氨酸残基(通过赖氨酰羟化酶,例如LH3)羟基化。然后,可使羟基赖氨酸残基糖基化,随后三种糖基化肽形成三螺旋(称为前胶原),并从细胞分泌。然后,分泌的前胶原可以与更高级的结构缔合,形成锚原纤维。然后锚原纤维可用于帮助组织、稳定和辅助上皮基底膜的粘附。上皮基底膜负责将上皮锚定至下面的疏松结缔组织,并且对于真皮-表皮稳定性(真皮表皮连接完整性)是必需的。Col7a1基因的突变及PLOD3表达水平的降低削弱了胶原α-1(VII)链蛋白在营养不良型大疱性表皮松解症患者中正确连接表皮与真皮的能力,从而导致皮肤脆弱。
大疱性表皮松解症患者的治疗选择有限,当前的护理重点是控制疾病的症状,包括提供控制疼痛和瘙痒的药物,施用口服抗生素以避免皮肤和粘膜上的开放性伤口引起的感染,以及手术策略解决疤痕形成和畸形。用于治疗大疱性表皮松解症的根本病因的研究方法包括通过皮内注射施用纯化的胶原7、含有胶原7的成纤维细胞或编码胶原7的病毒载体。由于许多DEB患者在大面积的易受创伤的部位(诸如骶骨、臀部、足部、腰背部和手部)上有多处伤口,所以任何涉及皮内注射的治疗都会极具侵入性,因为这些大的伤口区域都将需要注射,可能要反复注射,即使注射时间间隔不清楚。
因此,显然需要针对大疱性表皮松解症患者的低创/微创/非侵入性治疗选择,这些治疗选择可以解决在该患者群体中观察到的胶原α-1(VII)链蛋白的缺陷以及赖氨酰羟化酶3蛋白的缺陷。
本文引用的所有参考文献,包括专利申请、专利公布、非专利文献和UniProtKB/Swiss-Prot登录号,均以引用的方式整体并入本文中,如同每个单独的参考文献被具体地和单独地指出以引用的方式并入。
发明内容
为了满足这些需求,本公开部分地涉及用于在受试者,特别是具有大疱性表皮松解症的一种或多种症状或有出现大疱性表皮松解症的一种或多种症状风险的受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的组合物和方法。特别地,本公开部分地涉及通过施用(例如,以局部方式或以透皮方式施用)包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的嵌合多肽的一种或多种多核苷酸的药物组合物来治疗个体的方法。
因此,本公开的某些方面涉及一种药物组合物,所述药物组合物包含:包含载体的病毒,其中所述载体包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽或它们的嵌合多肽的一种或多种转基因;以及药学上可接受的载剂。在一些实施方案中,所述病毒是腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。在一些实施方案中,病毒是复制缺陷型的。在一些实施方案中,病毒是单纯疱疹病毒(HSV)。在一些实施方案中,单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。在一些实施方案中,单纯疱疹病毒包含修饰的包膜。在一些实施方案中,相对于野生型单纯疱疹病毒,修饰的包膜改变了单纯疱疹病毒的组织嗜性。在一些实施方案中,修饰的包膜包含突变的单纯疱疹病毒糖蛋白。在一些实施方案中,载体是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中,HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子和HSV/EBV/RV杂合扩增子、或HSV/睡美人(Sleeping Beauty)杂合扩增子。在一些实施方案中,载体是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。在一些实施方案中,单纯疱疹病毒基因是ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41或UL55。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP27和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,ICP4、ICP27和UL55基因中的失活性突变是ICP4、ICP27和UL55基因的编码序列的缺失。在一些实施方案中,ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0和ICP4基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。在一些实施方案中,失活性突变是基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还包含ICP47基因中的失活性突变、UL41基因中的失活性突变或ICP47和UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种转基因。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种转基因。在一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种转基因。在一些实施方案中,载体在递送到靶细胞中时能够在所述靶细胞内复制。在一些实施方案中,药学上可接受的载剂适于局部施用或透皮施用。在一些实施方案中,所述一种或多种转基因包含miRNA结合位点。在一些实施方案中,所述一种或多种转基因与一种或多种异源启动子可操作地连接。在一些实施方案中,所述一种或多种异源启动子是人巨细胞病毒(HCMV)立即早期启动子、延伸因子-1(EF1)启动子和/或它们的任何组合中的一种或多种。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的转基因。在一些实施方案中,载体包含两种转基因,其中每种转基因均编码胶原α-1(VII)链多肽。在一些实施方案中,胶原α-1(VII)链多肽与SEQ ID NO:2的序列具有至少80%的序列同一性。在一些实施方案中,胶原α-1(VII)链多肽是片段,其中所述片段具有SEQ ID NO:2的至少100个连续氨基酸。在一些实施方案中,当胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成。在一些实施方案中,当胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,赖氨酰羟化酶3多肽与SEQ ID NO:4的序列具有至少80%的序列同一性。在一些实施方案中,赖氨酰羟化酶3多肽是片段,其中所述片段具有SEQ ID NO:4的至少100个连续氨基酸。在一些实施方案中,当赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,赖氨酰羟化酶3多肽增强、增加、加强和/或强化受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。在一些实施方案中,当赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,载体至少包含第一转基因和第二转基因。在一些实施方案中,第一转基因编码胶原α-1(VII)链多肽,并且第二转基因编码赖氨酰羟化酶3多肽。在一些实施方案中,载体包含多顺反子性的转基因。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,第一和第二ORF由内部核糖体进入位点(IRES)分开。在一些实施方案中,当胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,这些多肽处于约等摩尔比。在一些实施方案中,当胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,这些多肽增强、增加、加强和/或强化受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,嵌合多肽包含胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽之间的接头多肽。在一些实施方案中,接头多肽是T2A、P2A、E2A或F2A接头多肽。在一些实施方案中,接头多肽与SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10或SEQ ID NO:12的序列具有至少80%的序列同一性。在一些实施方案中,嵌合多肽与SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26或SEQ ID NO:28的序列具有至少80%的序列同一性。在一些实施方案中,当嵌合多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
本公开的其他方面涉及一种在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的方法,所述方法包括以局部方式或以透皮方式施用能够增强、增加、加强和/或强化受试者的一种或多种细胞中的胶原α-1(VII)链多肽和/或赖氨酰羟化酶3多肽的水平的药物组合物。在一些实施方案中,所述药物组合物包含:包含载体的病毒,其中所述载体包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽或它们的嵌合多肽的一种或多种转基因;以及药学上可接受的载剂。在一些实施方案中,所述病毒是腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。在一些实施方案中,病毒是复制缺陷型的。在一些实施方案中,病毒是单纯疱疹病毒(HSV)。在一些实施方案中,单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。在一些实施方案中,单纯疱疹病毒包含修饰的包膜。在一些实施方案中,相对于野生型单纯疱疹病毒,修饰的包膜改变了单纯疱疹病毒的组织嗜性。在一些实施方案中,修饰的包膜包含突变的单纯疱疹病毒糖蛋白。在一些实施方案中,载体是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中,HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子和HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。在一些实施方案中,载体是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。在一些实施方案中,单纯疱疹病毒基因是ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41或UL55。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP27和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,ICP4、ICP27和UL55基因中的失活性突变是ICP4、ICP27和UL55基因的编码序列的缺失。在一些实施方案中,ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0和ICP4基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。在一些实施方案中,失活性突变是基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还包含ICP47基因中的失活性突变、UL41基因中的失活性突变或ICP47和UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种转基因。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种转基因。在一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种转基因。在一些实施方案中,载体在递送到靶细胞中时能够在所述靶细胞内复制。在一些实施方案中,药学上可接受的载剂适于局部施用或透皮施用。在一些实施方案中,所述一种或多种转基因包含miRNA结合位点。在一些实施方案中,所述一种或多种转基因与一种或多种异源启动子可操作地连接。在一些实施方案中,所述一种或多种异源启动子是人巨细胞病毒(HCMV)立即早期启动子、延伸因子-1(EF1)启动子和/或它们的任何组合中的一种或多种。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的转基因。在一些实施方案中,载体包含两种转基因,其中每种转基因均编码胶原α-1(VII)链多肽。在一些实施方案中,胶原α-1(VII)链多肽与SEQ ID NO:2的序列具有至少80%的序列同一性。在一些实施方案中,胶原α-1(VII)链多肽是片段,其中所述片段具有SEQ ID NO:2的至少100个连续氨基酸。在一些实施方案中,当胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成。在一些实施方案中,当胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,赖氨酰羟化酶3多肽与SEQ ID NO:4的序列具有至少80%的序列同一性。在一些实施方案中,赖氨酰羟化酶3多肽是片段,其中所述片段具有SEQ ID NO:4的至少100个连续氨基酸。在一些实施方案中,当赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,赖氨酰羟化酶3多肽增强、增加、加强和/或强化受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。在一些实施方案中,当赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,载体至少包含第一转基因和第二转基因。在一些实施方案中,第一转基因编码胶原α-1(VII)链多肽,并且第二转基因编码赖氨酰羟化酶3多肽。在一些实施方案中,载体包含多顺反子性的转基因。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,第一和第二ORF由内部核糖体进入位点(IRES)分开。在一些实施方案中,当胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,这些多肽处于约等摩尔比。在一些实施方案中,当胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,这些多肽增强、增加、加强和/或强化受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,嵌合多肽包含胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽之间的接头多肽。在一些实施方案中,接头多肽是T2A、P2A、E2A或F2A接头多肽。在一些实施方案中,接头多肽与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10或SEQ ID NO:12的序列具有至少80%的序列同一性。在一些实施方案中,嵌合多肽与SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28的序列具有至少80%的序列同一性。在一些实施方案中,当嵌合多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,将药物组合物每天施用一次、两次、三次、四次、五次或更多次。在一些实施方案中,将药物组合物施用于受试者的一个或多个受影响和/或未受影响的区域。在一些实施方案中,皮肤的疾病或病症是大疱性表皮松解症、皮肤癌、牛皮癣、扁平苔癣、狼疮、红斑痤疮、湿疹、皮肤念珠菌病、蜂窝织炎、脓疱疮、褥疮、丹毒、寻常型鱼鳞病、皮肌炎、肢端皮炎、淤积性皮炎、内瑟顿综合征(nethertons syndrome)、单纯大疱性表皮松解症(LAMB3基因)、常染色体隐性先天性鱼鳞病、着色性干皮病和类天疱疮中的一种或多种。
本公开的其他方面涉及分离的嵌合多肽,其中分离的嵌合多肽包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和接头多肽,其中胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽被接头多肽分开;涉及编码所述分离的嵌合多肽的多核苷酸;涉及包含所述多核苷酸的载体;涉及包含所述载体的宿主细胞。在一些实施方案中,载体是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中,HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子和HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。在一些实施方案中,载体是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。在一些实施方案中,单纯疱疹病毒基因是ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41或UL55。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP27和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,ICP4、ICP27和UL55基因中的失活性突变是ICP4、ICP27和UL55基因的编码序列的缺失。在一些实施方案中,ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0和ICP4基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。在一些实施方案中,失活性突变是基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还包含ICP47基因中的失活性突变、UL41基因中的失活性突变或ICP47和UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含多核苷酸。
本公开的其他方面涉及一种载体,所述载体包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽或它们的任何组合的一种或多种多核苷酸,其中所述载体是重组单纯疱疹病毒基因组;并且涉及包含所述载体的宿主细胞。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。在一些实施方案中,单纯疱疹病毒基因是ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41或UL55。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP27和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,ICP4、ICP27和UL55基因中的失活性突变是ICP4、ICP27和UL55基因的编码序列的缺失。在一些实施方案中,ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0和ICP4基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。在一些实施方案中,失活性突变是基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还包含ICP47基因中的失活性突变、UL41基因中的失活性突变或ICP47和UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种多核苷酸。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的一种多核苷酸。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的两种多核苷酸。
本公开的其他方面涉及收集单纯疱疹病毒的方法,其中目标载体封装在所述单纯疱疹病毒中。在一些实施方案中,所述方法包括以下步骤:使宿主细胞与编码疱疹病毒的载体接触,使所述宿主细胞与包含本文所述的一种或多种多核苷酸的HSV-1扩增子或HSV-1杂合扩增子接触,以及收集由所述宿主细胞产生的单纯疱疹病毒。在一些实施方案中,所述方法包括以下步骤:使互补宿主细胞与包含本文所述的一种或多种多核苷酸的重组单纯疱疹病毒基因组载体接触,以及收集由所述互补宿主细胞产生的单纯疱疹病毒。在一些实施方案中,所收集的单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。
本公开的其他方面涉及一种药盒,所述药盒包含本文所述的药物组合物和用于施用所述药物组合物的说明书。
本公开的其他方面涉及一种药物组合物,所述药物组合物包含:包含载体的病毒,其中所述载体包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽或它们的嵌合多肽的一种或多种转基因;以及药学上可接受的载剂。在一些实施方案中,所述病毒是腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。在一些实施方案中,病毒是复制缺陷型的。在一些实施方案中,病毒是单纯疱疹病毒(HSV)。在一些实施方案中,单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。在一些实施方案中,载体是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中,HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子和HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。在一些实施方案中,载体是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。在一些实施方案中,单纯疱疹病毒基因是ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41或UL55。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP27和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,ICP4、ICP27和UL55基因中的失活性突变是ICP4、ICP27和UL55基因的编码序列的缺失。在一些实施方案中,ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0和ICP4基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。在一些实施方案中,失活性突变是基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还包含ICP47基因中的失活性突变、UL41基因中的失活性突变或ICP47和UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种转基因。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种转基因。在一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种转基因。在一些实施方案中,载体在递送到靶细胞中时能够在所述靶细胞内复制。在一些实施方案中,药学上可接受的载剂适于局部施用或透皮施用。在一些实施方案中,药学上可接受的载剂适于皮下施用或皮内施用。在一些实施方案中,所述一种或多种转基因包含miRNA结合位点。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的转基因。在一些实施方案中,载体包含编码赖氨酰羟化酶3多肽的转基因。在一些实施方案中,载体包含编码角蛋白I型细胞骨架17多肽的转基因。在一些实施方案中,载体包含两种转基因,其中每种转基因均编码胶原α-1(VII)链多肽。在一些实施方案中,胶原α-1(VII)链多肽与SEQ ID NO:2的序列具有至少80%的序列同一性。在一些实施方案中,胶原α-1(VII)链多肽是片段,其中所述片段具有SEQ ID NO:2的至少100个连续氨基酸。在一些实施方案中,当胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成。在一些实施方案中,当胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,赖氨酰羟化酶3多肽与SEQ ID NO:4的序列具有至少80%的序列同一性。在一些实施方案中,赖氨酰羟化酶3多肽是片段,其中所述片段具有SEQ ID NO:4的至少100个连续氨基酸。在一些实施方案中,当赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,赖氨酰羟化酶3多肽增强、增加、加强和/或强化受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。在一些实施方案中,当赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,角蛋白I型细胞骨架17多肽与SEQ ID NO:30的序列具有至少80%的序列同一性。在一些实施方案中,角蛋白I型细胞骨架17多肽是片段,其中所述片段具有SEQ ID NO:30的至少100个连续氨基酸。在一些实施方案中,角蛋白I型细胞骨架17多肽增强、增加、加强和/或强化受试者的伤口愈合。在一些实施方案中,载体至少包含第一转基因和第二转基因。在一些实施方案中,第一转基因和第二转基因各自编码胶原α-1(VII)链多肽。在一些实施方案中,第一转基因编码胶原α-1(VII)链多肽,并且第二转基因编码赖氨酰羟化酶3多肽。在一些实施方案中,第一转基因编码胶原α-1(VII)链多肽,并且第二转基因编码角蛋白I型细胞骨架17多肽。在一些实施方案中,第一转基因编码赖氨酰羟化酶3多肽,并且第二转基因编码角蛋白I型细胞骨架17多肽。在一些实施方案中,载体包至少含第一转基因、第二转基因和第三转基因。在一些实施方案中,第一转基因编码胶原α-1(VII)链多肽,第二转基因编码赖氨酰羟化酶3多肽,并且第三转基因编码角蛋白I型细胞骨架17多肽。
本公开的其他方面涉及一种在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的方法,所述方法包括向所述受试者施用包含载体的药物组合物,其中所述载体是重组单纯疱疹病毒基因组,并且其中所述药物组合物能够增强、增加、加强和/或强化受试者的一种或多种细胞中的胶原α-1(VII)链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平。在一些实施方案中,所述药物组合物包含:包含载体的病毒,其中所述载体包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽或它们的嵌合多肽的一种或多种转基因;以及药学上可接受的载剂。在一些实施方案中,所述病毒是腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。在一些实施方案中,病毒是复制缺陷型的。在一些实施方案中,病毒是单纯疱疹病毒(HSV)。在一些实施方案中,单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。在一些实施方案中,单纯疱疹病毒基因是ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41或UL55。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP27和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,ICP4、ICP27和UL55基因中的失活性突变是ICP4、ICP27和UL55基因的编码序列的缺失。在一些实施方案中,ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0和ICP4基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。在一些实施方案中,失活性突变是基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还包含ICP47基因中的失活性突变、UL41基因中的失活性突变或ICP47和UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种转基因。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种转基因。在一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种转基因。在一些实施方案中,载体在递送到靶细胞中时能够在所述靶细胞内复制。在一些实施方案中,药学上可接受的载剂适于局部施用或透皮施用。在一些实施方案中,药学上可接受的载剂适于皮下施用或皮内施用。在一些实施方案中,所述一种或多种转基因包含miRNA结合位点。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的转基因。在一些实施方案中,载体包含编码赖氨酰羟化酶3多肽的转基因。在一些实施方案中,载体包含编码角蛋白I型细胞骨架17多肽的转基因。在一些实施方案中,胶原α-1(VII)链多肽与SEQ ID NO:2的序列具有至少80%的序列同一性。在一些实施方案中,胶原α-1(VII)链多肽是片段,其中所述片段具有SEQ ID NO:2的至少100个连续氨基酸。在一些实施方案中,当胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成。在一些实施方案中,当胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,赖氨酰羟化酶3多肽与SEQ ID NO:4的序列具有至少80%的序列同一性。在一些实施方案中,赖氨酰羟化酶3多肽是片段,其中所述片段具有SEQID NO:4的至少100个连续氨基酸。在一些实施方案中,当赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,赖氨酰羟化酶3多肽增强、增加、加强和/或强化受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。在一些实施方案中,当赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,该多肽增强、增加、加强和/或强化受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,角蛋白I型细胞骨架17多肽与SEQ ID NO:30的序列具有至少80%的序列同一性。在一些实施方案中,角蛋白I型细胞骨架17多肽是片段,其中所述片段具有SEQ ID NO:30的至少100个连续氨基酸。在一些实施方案中,角蛋白I型细胞骨架17多肽增强、增加、加强和/或强化受试者的伤口愈合。在一些实施方案中,载体至少包含第一转基因和第二转基因。在一些实施方案中,第一转基因和第二转基因各自编码胶原α-1(VII)链多肽。在一些实施方案中,第一转基因编码胶原α-1(VII)链多肽,并且第二转基因编码赖氨酰羟化酶3多肽。在一些实施方案中,第一转基因编码胶原α-1(VII)链多肽,并且第二转基因编码角蛋白I型细胞骨架17多肽。在一些实施方案中,第一转基因编码赖氨酰羟化酶3多肽,并且第二转基因编码角蛋白I型细胞骨架17多肽。在一些实施方案中,载体包至少含第一转基因、第二转基因和第三转基因。在一些实施方案中,第一转基因编码胶原α-1(VII)链多肽,第二转基因编码赖氨酰羟化酶3多肽,并且第三转基因编码角蛋白I型细胞骨架17多肽。在一些实施方案中,将药物组合物以局部方式或以透皮方式施用于受试者。在一些实施方案中,将药物组合物以皮下方式或以皮内方式施用于受试者。在一些实施方案中,将药物组合物每天施用一次、两次、三次、四次、五次或更多次。在一些实施方案中,将药物组合物施用于受试者的一个或多个受影响和/或未受影响的区域。在一些实施方案中,皮肤的疾病或病症是大疱性表皮松解症、皮肤癌、牛皮癣、扁平苔癣、狼疮、红斑痤疮、湿疹、皮肤念珠菌病、蜂窝织炎、脓疱疮、褥疮、丹毒、寻常型鱼鳞病、皮肌炎、肢端皮炎、淤积性皮炎、内瑟顿综合征、单纯大疱性表皮松解症(LAMB3基因)、常染色体隐性先天性鱼鳞病、着色性干皮病和类天疱疮中的一种或多种。
附图说明
图1A至图1F示出野生型单纯疱疹病毒基因组和修饰的单纯疱疹病毒基因组的示意图。图1A示出野生型单纯疱疹病毒基因组。图1B示出修饰的单纯疱疹病毒基因组,所述基因组包含编码胶原α-1(VII)链多肽的转基因。图1C示出修饰的单纯疱疹病毒基因组,所述基因组包含两个转基因,一个编码胶原α-1(VII)链多肽,另一个编码赖氨酰羟化酶3多肽,其中这些转基因在同一条DNA链上编码。图1D示出修饰的单纯疱疹病毒基因组,所述基因组包含两个转基因,一个编码胶原α-1(VII)链多肽,另一个编码赖氨酰羟化酶3多肽,其中这些转基因以反义取向在相反的DNA链上编码。图1E示出修饰的单纯疱疹病毒基因组,所述基因组包含多顺反子性的、编码由内部核糖体进入位点(IRES)分开的胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽的转基因。图1F示出修饰的单纯疱疹病毒基因组,所述基因组包含编码嵌合多肽的转基因,所述嵌合多肽包含胶原α-1(VII)链多肽、接头多肽和赖氨酰羟化酶3多肽。
图2A至图2G示出野生型单纯疱疹病毒基因组和修饰的单纯疱疹病毒基因组的另外的示意图。图2A示出野生型单纯疱疹病毒基因组。图2B示出修饰的单纯疱疹病毒基因组,所述基因组包含ICP4(两个拷贝)、ICP27和UL55的编码序列的缺失以及ICP22和ICP47的启动子序列的缺失,其中编码胶原α-1(VII)链多肽的两个转基因在ICP4基因座处整合。图2C示出修饰的单纯疱疹病毒基因组,所述基因组包含ICP4(两个拷贝)和ICP22的编码序列的缺失,其中编码胶原α-1(VII)链多肽的两个转基因在ICP4基因座处整合。图2D示出修饰的单纯疱疹病毒基因组,所述基因组包含ICP0和ICP4(两个拷贝)的编码序列的缺失,其中编码胶原α-1(VII)链多肽的两个转基因在ICP4基因座处整合。图2E示出修饰的单纯疱疹病毒基因组,所述基因组包含ICP0、ICP4(两个拷贝)和ICP22的编码序列的缺失,其中编码胶原α-1(VII)链多肽的两个转基因在ICP4基因座处整合。图2F示出修饰的单纯疱疹病毒基因组,所述基因组包含ICP0、ICP4(两个拷贝)、ICP22和ICP27的编码序列的缺失,其中编码胶原α-1(VII)链多肽的两个转基因在ICP4基因座处整合。图2G示出修饰的单纯疱疹病毒基因组,所述基因组包含ICP0、ICP4(两个拷贝)、ICP22、ICP27和UL55的编码序列的缺失,其中编码胶原α-1(VII)链多肽的两个转基因在ICP4基因座处整合。
图3示出“KB103”的示意图,KB103是一种携带人胶原7(COL7A1)表达盒的复制缺陷型1型单纯疱疹病毒(HSV-1)。
图4A至图4B示出KB103感染的RDEB人皮肤角质形成细胞(图4A)和RDEB人皮肤成纤维细胞(图4B)中的COL7转录物水平的剂量依赖性增加。转录物相对于β-肌动蛋白水平进行定量并标准化为未感染细胞中的表达。
图5A至图5B示出在KB103感染的细胞中检测到的人Col7蛋白表达。图5A示出在未感染的正常和RDEB成纤维细胞中,以及在指定的感染复数(MOI)下用KB103感染的成纤维细胞中的人Col7蛋白表达。图5B示出在未感染的正常和RDEB角质形成细胞中,以及在指定的感染复数(MOI)下用KB103感染的角质形成细胞中的人Col7蛋白表达。人GAPDH蛋白表达示出为上样对照。
图6示出如通过免疫荧光所评估的,未感染(对照)或KB103感染的(C7,MOI 3)RDEB人皮肤成纤维细胞(EB HDF)、正常人皮肤角质形成细胞(正常HDK)和RDEB人皮肤角质形成细胞(RDEB HDK)中的人COL7A1蛋白表达。
图7示出在未感染的正常和RDEB人皮肤角质形成细胞中,以及在指定的MOI下用KB103感染的角质形成细胞中的人Col7和LH3蛋白表达。人GAPDH蛋白表达示出为上样对照。
图8示出在未感染的正常和RDEB人皮肤成纤维细胞中,以及在指定的MOI下用KB103感染的成纤维细胞中的人TSP-1蛋白表达。人GAPDH蛋白表达示出为上样对照。
图9A至图9B示出未感染的(对照)RDEB人皮肤角质形成细胞和在指定的MOI下用KB103感染的角质形成细胞与用增加浓度的大鼠尾胶原1(图9A)和人纤连蛋白(图9B)处理的孔的细胞粘附。
图10示出通过免疫荧光测定的在KB103感染的皮肤等效器官型培养物中在基底膜区(BMZ)处的Col7沉积。
图11示出从KB103感染的小鼠分离的组织中病毒基因组拷贝数和人Col7转录物水平的定量。
图12示出通过免疫荧光测定的来自KB103感染的小鼠的皮肤组织中的人Col7蛋白表达,包括在基底膜区(BMZ)人Col7沉积的开始。
具体实施方式
本公开部分地涉及包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的嵌合多肽的一种或多种多核苷酸的药物组合物。在一些实施方案中,所述药物组合物包含载体,其中所述载体包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的嵌合多肽的一种或多种转基因。在一些实施方案中,所述载体包含适于增强、增加、加强和/或强化受试者的一种或多种细胞中的胶原α-1(VII)链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的一种或多种转基因。本公开还部分地涉及通过施用(例如,以局部方式或以透皮方式施用)本文所述的药物组合物而在受试者中提供皮肤的伤口、病症或疾病(例如,营养不良型大疱性表皮松解症)的预防性、缓和性或治疗性缓解的方法。
以下描述阐述了示例性方法、参数等。然而,应该认识到,这样的描述并非旨在限制本公开的范围,而是作为示例性实施方案的描述而提供。
通用技术
本文描述或引用的技术和程序是本领域技术人员通常熟知的且使用常规方法经常使用的,例如像在以下文献中描述的广泛使用的方法:Sambrook等人,MolecularCloning:A Laboratory Manual 3d edition(2001)Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.;Current Protocols in Molecular Biology(F.M.Ausubel,等人编,(2003));the series Methods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编(1995)),Harlow和Lane,编(1988);Oligonucleotide Synthesis(M.J.Gait,编,1984);Methods in Molecular Biology,Humana Press;Cell Biology:A Laboratory Notebook(J.E.Cellis,编,1998)Academic Press;Animal Cell Culture(R.I.Freshney),编,1987);Introduction to Cell and Tissue Culture(J.P.Mather和P.E.Roberts,1998)Plenum Press;Cell and Tissue Culture:Laboratory Procedures(A.Doyle、J.B.Griffiths和D.G.Newell,编,1993-8)J.Wiley and Sons;Gene Transfer Vectorsfor Mammalian Cells(J.M.Miller和M.P.Calos,编,1987);PCR:The Polymerase ChainReaction,(Mullis等人,编,1994);Short Protocols in Molecular Biology(Wiley和Sons,1999)。
定义
在详细描述本发明之前,应理解本发明不限于特定的组合物或生物系统,它们当然可以变化。还应理解,本文使用的术语仅用于描述特定实施方案的目的,并非旨在进行限制。
如本文所用,除非内容另有明确说明,否则单数形式“一个/一种(a/an)”和“所述/该(the)”包括复数个指代物。因此,例如,提及“一个/种分子”任选地包括两个/种或更多个/种这样的分子的组合等。
如本文所用,术语“约”是指本技术领域的技术人员容易知晓的相应值的常见误差范围。本文提及“约”值或参数包括(并描述)针对该值或参数本身的实施方案。
如本文所用,术语“多核苷酸”、“核酸序列”、“核酸”和它们的变型应通用地指示多脱氧核糖核苷酸(含有2-脱氧-D-核糖)、多核糖核苷酸(含有D-核糖),以及为嘌呤或嘧啶碱基的N-糖苷的任何其他类型的多核苷酸,以及含有非核苷酸主链的其他聚合物,条件是这些聚合物含有核碱基,所述核碱基的构型允许碱基配对和碱基堆积,如DNA和RNA中所见的。因此,这些术语包括已知类型的核酸序列修饰,例如,以类似物对天然存在的核苷酸中的一个或多个进行的取代和核苷酸间修饰。
如本文所用,当核酸与另一核酸序列处于功能关系时,该核酸“操作性地连接”或“可操作地连接”。例如,如果启动子或增强子影响序列的转录,则该启动子或增强子与编码序列可操作地连接;或者如果核糖体结合位点被定位成使得便于翻译,则它与编码序列可操作地连接。通常,“可操作地连接”意指所连接的DNA序列是连续的。
如本文所用,术语“载体”是指用于将异源核酸引入细胞中以便于这些核酸的表达或复制的离散元件。表达载体包括能够表达与调控序列(诸如启动子区)操作性地连接的核酸的载体,所述调控序列能够影响此类核酸的表达。因此,表达载体可以指DNA或RNA构建体,诸如质粒、噬菌体、重组病毒或在引入适当的宿主细胞中之后引起核酸表达的其他载体。适当的表达载体是本领域技术人员熟知的,并且包括可在真核细胞中复制的载体和保持为附加型的载体或整合到宿主细胞基因组中的载体。
如本文所用,“开放阅读框”或“ORF”是指编码蛋白质或多肽的连续核酸序列,DNA或RNA。通常,核酸包含翻译启始信号或起始密码子(诸如ATG或AUG)和终止密码子。
如本文所用,“内部核糖体进入位点”或“IRES”是指允许在mRNA序列的中间,例如第一启始密码子后起始翻译的核苷酸序列。
如本文所用,“非翻译区”或“UTR”是指开放阅读框的5’和/或3’端处的未翻译核酸。在多核苷酸中包含一个或多个UTR可以影响多核苷酸的转录后调控、mRNA稳定性和/或翻译。
如本文所用,术语“转基因”是指在引入细胞后能够转录成RNA并在适当条件下翻译和/或表达的多核苷酸。在一些方面,它赋予其所引入的细胞所需的特性,或以其他方式产生所需的治疗或诊断结果。
如本文所用,术语“多肽”、“蛋白质”和“肽”可互换使用,并且可以指两个或更多个氨基酸的聚合物。
如本文所用,“受试者”、“宿主”或“个体”是指被分类为哺乳动物的任何动物,包括人类、家畜和农场动物;以及动物园动物、运动动物或宠物动物,诸如狗、马、猫、牛;以及研究中使用的动物,诸如小鼠和大鼠等。在一些实施方案中,哺乳动物是人。
如本文所用,“局部施用”或“以局部方式施用”是指通过使包含组合物的制剂直接或以其他方式接触受试者的全部或部分皮肤而将所述组合物递送至受试者。该术语涵盖几种施用途径,包括但不限于局部和透皮。局部施用用作将组合物递送至受试者的表皮或真皮或其特定层的手段。
如本文所用,“有效量”至少是实现可测量地改善或预防特定病症的一种或多种症状所需的最小量。有效量也是治疗有益效果超过治疗的任何毒性或有害作用的量。对于预防性用途,有益或期望的结果包括诸如消除或降低疾病风险,减轻疾病严重性或延迟疾病、疾病并发症和疾病发展期间出现的中间病理表型发生的结果。对于治疗性用途,有益或期望的结果包括诸如减少由疾病引起的一种或多种症状,提高罹患疾病的人的生活质量,延迟疾病的进展和/或延长存活的临床结果。有效量可以在一次或多次施用中施用。
药物组合物
核苷酸
在一方面,本文提供了一种药物组合物,所述药物组合物包含编码胶原α-1(VII)链(Col7)多肽、赖氨酰羟化酶3(LH3)多肽、角蛋白I型细胞骨架17(KRT17)多肽和/或它们的嵌合多肽的一种或多种多核苷酸。在一些实施方案中,药物组合物包含编码胶原α-1(VII)链多肽的一种或多种多核苷酸。在一些实施方案中,药物组合物包含编码赖氨酰羟化酶3多肽的一种或多种多核苷酸。在一些实施方案中,药物组合物包含编码角蛋白I型细胞骨架17多肽的一种或多种多核苷酸。在一些实施方案中,药物组合物包含编码嵌合多肽的一种或多种多核苷酸。在一些实施方案中,药物组合物包含编码胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽的一种或多种多核苷酸。在一些实施方案中,药物组合物包含编码胶原α-1(VII)链多肽和角蛋白I型细胞骨架17多肽的一种或多种多核苷酸。在一些实施方案中,药物组合物包含编码赖氨酰羟化酶3多肽和角蛋白I型细胞骨架17多肽的一种或多种多核苷酸。在一些实施方案中,药物组合物包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和角蛋白I型细胞骨架17多肽的一种或多种多核苷酸。
在一些实施方案中,药物组合物包含载体,其中所述载体编码包含本文所述的多核苷酸的一种或多种转基因。在一些实施方案中,所述药物组合物包含载体,其中所述载体包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的嵌合多肽的一种或多种转基因。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的一种或多种转基因。在一些实施方案中,载体包含编码赖氨酰羟化酶3多肽的一种或多种转基因。在一些实施方案中,载体包含编码角蛋白I型细胞骨架17多肽的一种或多种转基因。在一些实施方案中,载体包含编码嵌合多肽的一种或多种转基因。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的一种或多种转基因和编码赖氨酰羟化酶3多肽的一种或多种转基因。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的一种或多种转基因和编码角蛋白I型细胞骨架17多肽的一种或多种转基因。在一些实施方案中,载体包含编码赖氨酰羟化酶3多肽的一种或多种转基因和编码角蛋白I型细胞骨架17多肽的一种或多种转基因。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的一种或多种转基因、编码赖氨酰羟化酶3多肽的一种或多种转基因以及编码角蛋白I型细胞骨架17多肽的一种或多种转基因。
在一些实施方案中,药物组合物包含合成RNA,其中所述合成RNA编码包含本文所述的多核苷酸的一种或多种转基因。在一些实施方案中,药物组合物包含合成RNA,其中所述合成RNA包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的嵌合多肽的一种或多种转基因。在一些实施方案中,合成RNA包含编码胶原α-1(VII)链多肽的一种或多种转基因。在一些实施方案中,合成RNA包含编码赖氨酰羟化酶3多肽的一种或多种转基因。在一些实施方案中,合成RNA包含编码角蛋白I型细胞骨架17多肽的一种或多种转基因。在一些实施方案中,合成RNA包含编码嵌合多肽的一种或多种转基因。在一些实施方案中,合成RNA包含编码胶原α-1(VII)链多肽的一种或多种转基因和编码赖氨酰羟化酶3多肽的一种或多种转基因。在一些实施方案中,合成RNA包含编码胶原α-1(VII)链多肽的一种或多种转基因和编码角蛋白I型细胞骨架17多肽的一种或多种转基因。在一些实施方案中,合成RNA包含编码赖氨酰羟化酶3多肽的一种或多种转基因和编码角蛋白I型细胞骨架17多肽的一种或多种转基因。在一些实施方案中,合成RNA包含编码胶原α-1(VII)链多肽的一种或多种转基因、编码赖氨酰羟化酶3多肽的一种或多种转基因以及编码角蛋白I型细胞骨架17多肽的一种或多种转基因。
胶原α-1(VII)链
在一些方面,本公开的多核苷酸编码胶原α-1(VII)链多肽。编码胶原α-1(VII)链多肽的多核苷酸的实例是SEQ ID NO:1。本公开的多核苷酸还包括与SEQ ID NO:1的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸是编码胶原α-1(VII)链多肽的N-末端截短、C-末端截短或片段的多核苷酸。编码胶原α-1(VII)链多肽的N-末端截短、C-末端截短或片段的多核苷酸包括具有SEQ ID NO:1的至少25个、至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、或至少350个、至少500个、至少1000个、至少2500个、至少5000个、至少7500个(但少于8835个)连续核苷酸的多核苷酸。
在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸是编码具有SEQ ID NO:2的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸是编码多肽的多核苷酸,所述多肽的氨基酸序列与SEQ ID NO:2的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。在一些实施方案中,本公开涉及编码多肽的多核苷酸,所述多肽是智人胶原α-1(VII)链多肽的同源物。鉴别为目标多肽的同源物的多肽的方法是本领域技术人员熟知的。
在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸是编码SEQ ID NO:2的氨基酸序列的N-末端截短、C-末端截短或片段的多核苷酸。N-末端截短、C-末端截短或片段可包含SEQ ID NO:2的至少10个、至少12个、至少14个、至少16个、至少18个、至少20个、至少30个、至少40个、至少50个、至少75个、至少100个、至少250个、至少500个、至少750个、至少1000个、至少1500个、至少2000个或至少2500个(但少于2944个)连续氨基酸。
在一些实施方案中,当编码胶原α-1(VII)链多肽的多核苷酸被递送到受试者的一种或多种靶细胞中时,该多核苷酸表达胶原α-1(VII)链多肽。在一些实施方案中,胶原α-1(VII)链多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中胶原α-1链多肽的水平。在一些实施方案中,胶原α-1(VII)链多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中胶原α-1链多肽的功能。在一些实施方案中,胶原α-1(VII)链多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中胶原α-1链多肽的活性。在一些实施方案中,胶原α-1(VII)链多肽的表达增强、增加、加强和/或强化了受试者的锚原纤维形成。在一些实施方案中,胶原α-1(VII)链多肽的表达增强、增加、加强和/或强化了受试者的上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,胶原α-1(VII)链多肽的表达增强、增加、加强和/或强化了受试者的真皮表皮连接完整性。
赖氨酰羟化酶3
在一些方面,本公开的多核苷酸编码赖氨酰羟化酶3多肽。编码赖氨酰羟化酶3多肽的多核苷酸的实例是SEQ ID NO:3。本公开的多核苷酸还包括与SEQ ID NO:3的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
在一些实施方案中,编码赖氨酰羟化酶3多肽的多核苷酸是编码赖氨酰羟化酶3多肽的N-末端截短、C-末端截短或片段的多核苷酸。编码赖氨酰羟化酶3多肽的N-末端截短、C-末端截短或片段的多核苷酸包括具有SEQ ID NO:3的至少25个、至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少500个、至少750个、至少1000个、至少1500个或至少2000个(但少于2217个)连续核苷酸的多核苷酸。
在一些实施方案中,编码赖氨酰羟化酶3多肽的多核苷酸是编码具有SEQ ID NO:4的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码赖氨酰羟化酶3多肽的多核苷酸是编码多肽的多核苷酸,所述多肽的氨基酸序列与SEQ ID NO:4的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。在一些实施方案中,本公开涉及编码多肽的多核苷酸,所述多肽是智人赖氨酰羟化酶3多肽的同源物。鉴别为目标多肽的同源物的多肽的方法是本领域技术人员熟知的。
在一些实施方案中,编码赖氨酰羟化酶3多肽的多核苷酸是编码SEQ ID NO:4的氨基酸序列的N-末端截短、C-末端截短或片段的多核苷酸。N-末端截短、C-末端截短或片段可包含SEQ ID NO:4的至少10个、至少12个、至少14个、至少16个、至少18个、至少20个、至少30个、至少40个、至少50个、至少75个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个或至少700个(但少于738个)连续氨基酸。
在一些实施方案中,当编码赖氨酰羟化酶3多肽的多核苷酸被递送到受试者的一种或多种靶细胞中时,该多核苷酸表达赖氨酰羟化酶3多肽。在一些实施方案中,赖氨酰羟化酶3多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中赖氨酰羟化酶3多肽的水平。在一些实施方案中,赖氨酰羟化酶3多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中赖氨酰羟化酶3多肽的功能。在一些实施方案中,赖氨酰羟化酶3多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中赖氨酰羟化酶3多肽的活性。在一些实施方案中,赖氨酰羟化酶3多肽的表达增强、增加、加强和/或强化了受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。在一些实施方案中,赖氨酰羟化酶3多肽的表达增强、增加、加强和/或强化了受试者的锚原纤维形成。在一些实施方案中,赖氨酰羟化酶3多肽的表达增强、增加、加强和/或强化了受试者的上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,赖氨酰羟化酶3多肽的表达增强、增加、加强和/或强化了受试者的真皮表皮连接完整性。
在一些实施方案中,将编码胶原α-1(VII)链多肽的多核苷酸和编码赖氨酰羟化酶3多肽的多核苷酸递送至受试者的相同细胞。在一些实施方案中,编码胶原α-1链(VII)多肽的多核苷酸和编码赖氨酰羟化酶3多肽的多核苷酸在被递送到受试者的相同细胞时,这些多核苷酸表达胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽。在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸和编码赖氨酰羟化酶3多肽的多核苷酸以等摩尔比表达胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽。
角蛋白I型细胞骨架17
在一些方面,本公开的多核苷酸编码角蛋白I型细胞骨架17多肽。编码角蛋白I型细胞骨架17多肽的多核苷酸的实例是SEQ ID NO:29。本公开的多核苷酸还包括与SEQ IDNO:29的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
在一些实施方案中,编码角蛋白I型细胞骨架17多肽的多核苷酸是编码角蛋白I型细胞骨架17多肽的N-末端截短、C-末端截短或片段的多核苷酸。编码胶原α-1(VII)链多肽的N-末端截短、C-末端截短或片段的多核苷酸包括具有SEQ ID NO:29的至少25个、至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、或至少350个、至少500个、至少1000个、至少1250个(但少于1299个)连续核苷酸的多核苷酸。
在一些实施方案中,编码角蛋白I型细胞骨架17多肽的多核苷酸是编码具有SEQID NO:30的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码角蛋白I型细胞骨架17多肽的多核苷酸是编码多肽的多核苷酸,所述多肽的氨基酸序列与SEQ ID NO:30的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。在一些实施方案中,本公开涉及编码多肽的多核苷酸,所述多肽是智人角蛋白I型细胞骨架17多肽的同源物。鉴别为目标多肽的同源物的多肽的方法是本领域技术人员熟知的。
在一些实施方案中,编码角蛋白I型细胞骨架17多肽的多核苷酸是编码SEQ IDNO:30的氨基酸序列的N-末端截短、C-末端截短或片段的多核苷酸。N-末端截短、C-末端截短或片段可包含SEQ ID NO:30的至少10个、至少12个、至少14个、至少16个、至少18个、至少20个、至少30个、至少40个、至少50个、至少75个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少425个(但少于432个)连续氨基酸。
在一些实施方案中,当编码角蛋白I型细胞骨架17多肽的多核苷酸被递送到受试者的一种或多种靶细胞中时,该多核苷酸表达角蛋白I型细胞骨架17多肽。在一些实施方案中,角蛋白I型细胞骨架17多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中角蛋白I型细胞骨架17多肽的水平。在一些实施方案中,角蛋白I型细胞骨架17多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中角蛋白I型细胞骨架17多肽的功能。在一些实施方案中,角蛋白I型细胞骨架17多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中角蛋白I型细胞骨架17多肽的活性。在一些实施方案中,角蛋白I型细胞骨架17多肽的表达增强、增加、加强和/或强化了受试者的伤口愈合。
包含接头的嵌合多肽
在一些实施方案中,本公开的多核苷酸编码包含胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽的嵌合多肽。在一些实施方案中,编码嵌合多肽的多核苷酸还包含编码接头多肽的多核苷酸。在一些实施方案中,编码接头多肽的多核苷酸是编码可切割接头多肽的多核苷酸。编码可切割接头多肽的多核苷酸的实例可包括但不限于编码T2A、P2A、E2A或F2A接头多肽的多核苷酸。在一些实施方案中,编码接头多肽的多核苷酸是编码T2A接头多肽的多核苷酸。在一些实施方案中,编码接头多肽的多核苷酸是编码P2A接头多肽的多核苷酸。在一些实施方案中,编码接头多肽的多核苷酸是编码E2A接头多肽的多核苷酸。在一些实施方案中,编码接头多肽的多核苷酸是编码F2A接头多肽的多核苷酸。
在一些方面,本公开的多核苷酸编码接头多肽。编码接头多肽的多核苷酸的实例是SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11。本公开的多核苷酸还包括与SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:11的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
在一些实施方案中,编码接头多肽的多核苷酸是编码接头多肽的N-末端截短、C-末端截短或片段的多核苷酸。编码接头多肽的N-末端截短、C-末端截短或片段的多核苷酸包括具有SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:11的至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个或至少60个(但少于66个)连续核苷酸的多核苷酸。
在一些实施方案中,编码接头多肽的多核苷酸是编码具有SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10或SEQ ID NO:12的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码接头多肽的多核苷酸是编码多肽的多核苷酸,所述多肽的氨基酸序列与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10或SEQ ID NO:12的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一些实施方案中,编码接头多肽的多核苷酸是编码SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10或SEQ ID NO:12的氨基酸序列的N-末端截短、C-末端截短或片段的多核苷酸。N-末端截短、C-末端截短或片段可包含SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10或SEQID NO:12的至少4个、至少6个、至少8个、至少10个、至少12个、至少14个、至少16个、至少18个或至少20个(但少于22个)连续氨基酸。
在一些实施方案中,编码接头多肽的多核苷酸还包含编码一个或多个弗林蛋白酶切割位点的多核苷酸。在一些实施方案中,编码一个或多个弗林蛋白酶切割位点的多核苷酸编码与经典弗林蛋白酶切割位点(Arg-X-(Arg/Lys)-Arg)的序列相同或基本相似的氨基酸序列。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在接头多肽的下游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在T2A接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在T2A接头多肽的下游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在P2A接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在P2A接头多肽的下游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在E2A接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在E2A接头多肽的下游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在F2A接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在F2A接头多肽的下游被编码。
在一些实施方案中,编码嵌合多肽的多核苷酸编码包含胶原α-1(VII)链多肽、接头多肽和赖氨酰羟化酶3多肽的嵌合多肽。在一些实施方案中,编码嵌合多肽的多核苷酸从5’到3’包含编码胶原α-1(VII)链多肽的多核苷酸、编码接头多肽的多核苷酸和编码赖氨酰羟化酶3多肽的多核苷酸。在一些实施方案中,编码嵌合多肽的多核苷酸从5’到3’包含编码赖氨酰羟化酶3多肽的多核苷酸、编码接头多肽的多核苷酸和编码胶原α-1(VII)链多肽的多核苷酸。
编码包含胶原α-1(VII)链多肽、接头多肽和赖氨酰羟化酶3多肽的嵌合多肽的多核苷酸的实例是SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25和SEQ ID NO:27。本公开的多核苷酸还包括与SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25或SEQ ID NO:27的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
在一些实施方案中,编码嵌合多肽的多核苷酸是编码嵌合多肽的N-末端截短、C-末端截短或片段的多核苷酸。编码嵌合多肽的N-末端截短、C-末端截短或片段的多核苷酸包括具有SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQID NO:23、SEQ ID NO:25或SEQ ID NO:27的至少25个、至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个、至少550个、至少600个、至少650个、至少700个、至少750个、至少800个、至少850个、至少900个、至少950个、至少1000个、至少2000个、至少3000个、至少4000个、至少5000个、至少6000个、至少7000个、至少8000个、至少9000个或至少10000个(但少于11121个)连续核苷酸的多核苷酸。
在一些实施方案中,编码包含胶原α-1(VII)链多肽、接头多肽和赖氨酰羟化酶3多肽的嵌合多肽的多核苷酸是编码具有SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码包含胶原α-1(VII)链多肽、接头多肽和赖氨酰羟化酶3多肽的嵌合多肽的多核苷酸是编码多肽的多核苷酸,所述多肽的氨基酸序列与SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26或SEQ ID NO:28的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一些实施方案中,编码包含胶原α-1(VII)链多肽、接头多肽和赖氨酰羟化酶3多肽的嵌合多肽的多核苷酸是编码SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28的氨基酸序列的N-末端截短、C-末端截短或片段的多核苷酸。N-末端截短、C-末端截短或片段可包含SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28的至少25个、至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个、至少550个、至少600个、至少650个、至少700个、至少750个、至少800个、至少850个、至少900个、至少950个、至少1000个、至少1250个、至少1500个、至少1750个、至少2000个、至少2250个、至少2500个、至少2750个、至少3000个、至少3250个或至少3500个(但少于3706个)连续氨基酸。
在一些实施方案中,当编码嵌合多肽的多核苷酸被递送到受试者的一种或多种靶细胞中时,该多核苷酸表达嵌合多肽。在一些实施方案中,嵌合多肽在于一种或多种靶细胞中表达后被切割。在一些实施方案中,当在一种或多种靶细胞中表达时,嵌合多肽在接头多肽内被切割。在一些实施方案中,嵌合多肽被切割成两个多肽,一个包含胶原α-1(VII)链多肽,另一个包含赖氨酰羟化酶3多肽。在一些实施方案中,嵌合多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中胶原α-1链多肽和/或赖氨酰羟化酶3多肽的水平。在一些实施方案中,嵌合多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中胶原α-1链多肽和/或赖氨酰羟化酶3多肽的功能。在一些实施方案中,嵌合多肽的表达增强、增加、加强和/或强化了一种或多种靶细胞中胶原α-1链多肽和/或赖氨酰羟化酶3多肽的活性。在一些实施方案中,嵌合多肽的表达增强、增加、加强和/或强化了受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。在一些实施方案中,嵌合多肽的表达增强、增加、加强和/或强化了受试者的锚原纤维形成。在一些实施方案中,嵌合多肽的表达增强、增加、加强和/或强化了受试者的上皮基底膜组织和/或上皮基底粘附。在一些实施方案中,嵌合多肽的表达增强、增加、加强和/或强化了受试者的真皮表皮连接完整性。
本公开的多核苷酸可以是密码子优化的。在一些实施方案中,针对人细胞对本公开的多核苷酸进行了密码子优化。在一些实施方案中,针对小鼠细胞对本公开的多核苷酸进行了密码子优化。在一些实施方案中,针对大鼠细胞对本公开的多核苷酸进行了密码子优化。在一些实施方案中,针对仓鼠细胞对本公开的多核苷酸进行了密码子优化。在一些实施方案中,针对犬科动物细胞对本公开的多核苷酸进行了密码子优化。在一些实施方案中,针对酵母细胞对本公开的多核苷酸进行了密码子优化。在一些实施方案中,针对细菌细胞对本公开的多核苷酸进行了密码子优化。本公开的多核苷酸可以是DNA多核苷酸、RNA多核苷酸或一种或多种DNA多核苷酸和一种或多种RNA多核苷酸的组合。
载体
在一些方面,本公开涉及含有本文所述的一种或多种多核苷酸的载体,优选表达载体。在一些实施方案中,载体是DNA载体。通常,可以使用适于维持、繁殖或表达多核苷酸以在受试者中产生一种或多种多肽的载体。合适载体的实例包括但不限于质粒、粘粒、附加体、转座子和病毒载体(例如,腺病毒、痘苗病毒、辛德毕斯病毒(Sindbis-viral)、麻疹、疱疹病毒、慢病毒、逆转录病毒、腺相关病毒载体等)。在一些实施方案中,载体能够在宿主细胞中自主复制。在一些实施方案中,载体不能在宿主细胞中自主复制。在一些实施方案中,载体能够整合到宿主DNA中。制备含有一种或多种目标多核苷酸的载体的方法是本领域技术人员熟知的。
在一些实施方案中,载体是单纯疱疹病毒载体。在一些实施方案中,单纯疱疹病毒载体是疱疹病毒扩增子载体。疱疹病毒扩增子载体(包括结构特征)和制备载体的方法在本领域中是公知的(de Silva S.和Bowers W.“Herpes Virus Amplicon Vectors”.Viruses2009,1,594-629)。在一些实施方案中,载体是HSV-1扩增子。在一些实施方案中,载体是HSV-1杂合扩增子。HSV-1杂合扩增子的实例可包括但不限于HSV/AAV杂合扩增子、HSV/EBV杂合扩增子、HSV/EBV/RV杂合扩增子和HSV/睡美人杂合扩增子。在一些实施方案中,载体是HSV/AAV杂合扩增子。在一些实施方案中,载体是HSV/EBV杂合扩增子。在一些实施方案中,载体是HSV/EBV/RV杂合扩增子。在一些实施方案中,载体是HSV/睡美人杂合扩增子。
在一些实施方案中,单纯疱疹病毒载体是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组已被工程化以减少或消除一种或多种毒性单纯疱疹病毒基因的表达。工程化重组单纯疱疹病毒基因组的方法大体描述于WO2015/009952中。在一些实施方案中,重组单纯疱疹病毒基因组包含失活性突变。失活性突变的实例可包括但不限于缺失、插入、点突变和重排。在一些实施方案中,重组单纯疱疹病毒基因组包含在ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55单纯疱疹病毒基因中的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个或全部八个中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4(一个或两个拷贝)基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP47基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-2基因组。
在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4(一个或两个拷贝)、ICP27和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,ICP4(一个或两个拷贝)、ICP27和/或UL55基因中的失活性突变是ICP4(一个或两个拷贝)、ICP27和/或UL55基因的编码序列的缺失。在一些实施方案中,ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失(例如,ICP22和ICP47编码序列是完整的但不具有转录活性)。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4(一个或两个拷贝)、ICP27和UL55基因的编码序列中的缺失和ICP22和ICP47基因的启动子区域中的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还包含UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-2基因组。
在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4(一个或两个拷贝)和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0和ICP4(一个或两个拷贝)基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4(一个或两个拷贝)和ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4(一个或两个拷贝)、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4(一个或两个拷贝)、ICP22、ICP27和UL55基因中的失活性突变。在一些实施方案中,ICP0、ICP4(一个或两个拷贝)、ICP22、ICP27和/或UL55基因中的失活性突变包含ICP0、ICP4(一个或两个拷贝)、ICP22、ICP27和/或UL55基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4(一个或两个拷贝)、ICP22、ICP27和UL55基因的编码序列中的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还包含ICP47基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组还包含UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组还包含ICP47基因和UL41基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-2基因组。
在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4(一个或两个拷贝)、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4(一个或两个拷贝)、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-2基因组。
在一些实施方案中,重组单纯疱疹病毒基因组包含在一个、两个、三个、四个、五个、六个、七个或更多个病毒基因座内的本公开的一种或多种多核苷酸。合适的病毒基因座的实例可包括但不限于ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55单纯疱疹病毒基因座。在一些实施方案中,重组单纯疱疹病毒基因组在一个或多个病毒ICP4基因座内包含本公开的一种或多种多核苷酸(例如,重组病毒在一个或两个ICP4基因座中携带编码Col7的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码LH3的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码KRT17的多核苷酸;重组病毒在一个ICP4基因座中携带编码Col7的多核苷酸且在另一个ICP4基因座中携带编码KRT17的多核苷酸;重组病毒在一个ICP4基因座中携带编码Col7的多核苷酸且在另一个ICP4基因座中携带编码LH3的多核苷酸;重组病毒在一个ICP4基因座中携带编码LH3的多核苷酸且在另一个ICP4基因座中携带编码KRT17的多核苷酸等)。在一些实施方案中,重组单纯疱疹病毒基因组在病毒UL41基因座内包含本公开的一种或多种多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在病毒ICP47基因座内包含本公开的一种或多种多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在一个或多个病毒ICP4基因座内包含本公开的一种或多种多核苷酸,并且在病毒UL41基因座内包含本公开的一种或多种多核苷酸(例如,重组病毒在一个或两个ICP4基因座中携带编码Col7的多核苷酸且在UL41基因座中携带编码LH3的多核苷酸;重组病毒一个或两个ICP4基因座中携带编码Col7的多核苷酸且在UL41基因座中携带编码Col7的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码Col7的多核苷酸且在UL41基因座中携带编码KRT17的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码LH3的多核苷酸且在UL41基因座中携带编码LH3的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码LH3的多核苷酸且在UL41基因座中携带编码Col7的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码LH3的多核苷酸且在UL41基因座中携带编码KRT17的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码KRT17的多核苷酸且在UL41基因座中携带编码LH3的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码KRT17的多核苷酸且在UL41基因座中携带编码Col7的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码KRT17的多核苷酸且在UL41基因座中携带编码KRT1 7的多核苷酸等)。
载体可包括呈适于在宿主细胞中多核苷酸的表达的形式的本公开的多核苷酸。表达载体可包括与待表达的多核苷酸操作性地连接的一种或多种调控序列。术语“调控序列”包括启动子、增强子和其他表达控制元件(例如,多腺苷酸化信号)。合适的增强子的实例可包括但不限于来自哺乳动物基因的增强子序列(诸如球蛋白、弹性蛋白酶、白蛋白、α-胎蛋白、胰岛素等),以及来自真核细胞病毒的增强子序列(诸如在复制起点后侧上的SV40增强子(bp 100-270)、巨细胞病毒早期启动子增强子、在复制起点后侧上的多瘤增强子、腺病毒增强子等)。适于在哺乳动物宿主细胞中转录的启动子的实例可包括但不限于从病毒(诸如多瘤病毒、禽痘病毒、腺病毒(诸如腺病毒2)、牛乳头瘤病毒、禽肉瘤病毒、巨细胞病毒、逆转录病毒、乙型肝炎病毒、猿猴病毒40(SV40)等)的基因组获得的启动子,或来自异源哺乳动物的启动子(诸如肌动蛋白启动子、免疫球蛋白启动子、来自热休克的启动子等),只要这些启动子与宿主细胞相容即可。在一些实施方案中,本公开的多核苷酸与一种或多种异源启动子可操作地连接。在一些实施方案中,所述一种或多种异源启动子是人巨细胞病毒(HCMV)立即早期启动子、延伸因子-1(EF1)启动子和/或它们的任何组合中的一种或多种。在一些实施方案中,所述一种或多种异源启动子是组成型启动子、组织特异性启动子、时间启动子、空间启动子、诱导型启动子和阻抑型启动子中的一种或多种。调控序列可包括指导核苷酸序列的组成型表达的调控序列,以及组织特异性调控序列和/或诱导型序列。表达载体的设计可以取决于诸如与本公开的多核苷酸接触的宿主细胞、所需的蛋白质表达水平等因素。可以将本公开的表达载体引入宿主细胞中,从而产生由本文所述的多核苷酸编码的蛋白质或多肽(例如,胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽、嵌合多肽等)。
在一些实施方案中,本公开的载体包含一种或多种转基因,所述一种或多种转基因包含本文所述的一种或多种多核苷酸。所述一种或多种转基因可以以任何取向插入载体中。如果载体包含两种或更多种转基因(例如,两种或更多种、三种或更多种等),则这些转基因可以以相同的取向插入或以彼此相反的方向插入。不希望受理论束缚,将两种转基因以反义方向并入载体可有助于避免通读并确保每种转基因的正确表达。在一些实施方案中,载体包含编码选自由以下组成的组的多肽的一种或多种转基因:胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的嵌合多肽。在一些实施方案中,载体包含编码胶原α-1(VII)链多肽的单一转基因。在一些实施方案中,载体包含两种转基因,每种转基因均编码胶原α-1(VII)链多肽。在一些实施方案中,载体包含三种转基因,每种转基因均编码胶原α-1(VII)链多肽。在一些实施方案中,载体包含编码赖氨酰羟化酶3多肽的单一转基因。在一些实施方案中,载体包含两种转基因,每种转基因均编码赖氨酰羟化酶3多肽。在一些实施方案中,载体包含三种转基因,每种转基因均编码赖氨酰羟化酶3多肽。在一些实施方案中,载体包含编码角蛋白I型细胞骨架17多肽的单一转基因。在一些实施方案中,载体包含两种转基因,每种转基因均编码角蛋白I型细胞骨架17多肽。在一些实施方案中,载体包含三种转基因,每种转基因均编码角蛋白I型细胞骨架17多肽。在一些实施方案中,载体包含编码嵌合多肽的单一转基因,所述嵌合多肽包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽。
在一些实施方案中,载体至少包含两种转基因(例如两种、三种、四种、五种、六种、七种或更多种转基因)。在一些实施方案中,至少第一转基因编码胶原α-1(VII)链多肽,并且至少第二转基因编码赖氨酰羟化酶3多肽。在一些实施方案中,至少第一转基因编码赖氨酰羟化酶3多肽,并且至少第二转基因编码胶原α-1(VII)链多肽。在一些实施方案中,至少第一转基因编码胶原α-1(VII)链多肽,并且至少第二转基因编码角蛋白I型细胞骨架17多肽。在一些实施方案中,至少第一转基因编码角蛋白I型细胞骨架17多肽,并且至少第二转基因编码胶原α-1(VII)链多肽。在一些实施方案中,至少第一转基因编码赖氨酰羟化酶3多肽,并且至少第二转基因编码角蛋白I型细胞骨架17多肽。在一些实施方案中,至少第一转基因编码角蛋白I型细胞骨架17多肽,并且至少第二转基因编码赖氨酰羟化酶3多肽。在一些实施方案中,至少第一转基因编码胶原α-1(VII)链多肽,并且至少第二转基因编码嵌合多肽,所述嵌合多肽包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或或角蛋白I型细胞骨架17多肽。在一些实施方案中,至少第一转基因编码赖氨酰羟化酶3多肽,并且至少第二转基因编码嵌合多肽,所述嵌合多肽包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽。在一些实施方案中,至少第一转基因编码角蛋白I型细胞骨架17多肽,并且至少第二转基因编码嵌合多肽,所述嵌合多肽包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽。
在一些实施方案中,载体至少包含三种转基因(例如三种、四种、五种、六种、七种或更多种转基因)。在一些实施方案中,至少第一转基因编码胶原α-1(VII)链多肽,至少第二转基因编码赖氨酰羟化酶3多肽,并且至少第三转基因编码角蛋白I型细胞骨架17多肽。
在一些实施方案中,载体包含多顺反子性的转基因。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第二开放阅读框(ORF)上编码胶原α-1(VII)链多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架多肽,并且在第二开放阅读框(ORF)上编码胶原α-1(VII)链多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第二开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架多肽,并且在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。
在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的嵌合多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第二开放阅读框(ORF)上编码包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的嵌合多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,并且在第二开放阅读框(ORF)上编码包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的嵌合多肽。在一些实施方案中,第一和第二ORF由内部核糖体进入位点(IRES)分开。
在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,在第二开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,并且在第三开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第三开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,在第二开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第三开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,在第二开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,并且在第三开放阅读框(ORF)上编码胶原α-1(VII)链多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第三开放阅读框(ORF)上编码胶原α-1(VII)链多肽。在一些实施方案中,多顺反子性转基因在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,在第二开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第三开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,第一、第二和第三ORF由内部核糖体进入位点(IRES)分开。
合适的IRES的实例可包括但不限于病毒来源的IRES(例如,来源于脊髓灰质炎病毒、鼻病毒、脑心肌炎病毒、口蹄疫病毒、丙型肝炎病毒、经典猪瘟病毒、劳氏肉瘤病毒、人体免疫缺陷病毒、蟋蟀麻痹病毒、卡波西氏肉瘤相关疱疹病毒等的IRES)和细胞mRNA来源的IRES(例如,来源于生长因子mRNA,诸如成纤维细胞生长因子2、血小板来源生长因子B和血管内皮生长因子的IRES;来源于转录因子mRNA,诸如触角因子、ultrapithoraxm和NF-κB抑制因子的IRES;来源于致癌基因mRNA,诸如c-myc、pim-1和蛋白激酶p58PITSLRE的IRES等)。
本公开的载体可以进一步编码另外的编码和非编码序列。另外的编码和非编码序列的实例可包括但不限于编码另外的多肽标签、内含子、5’和3’UTR等的序列。合适的多肽标签的实例可包括但不限于以下标签的任何组合:纯化标签,诸如his标签、flag标签、麦芽糖结合蛋白和谷胱甘肽-S-转移酶标签;检测标签,诸如可光度测定地检测的标签(例如,红色荧光蛋白等)和具有可检测的酶活性的标签(例如,碱性磷酸酶等);含有分泌序列、前导序列和/或稳定序列的标签;蛋白酶切割位点(例如,弗林蛋白酶切割位点、TEV切割位点、凝血酶切割位点)等。在一些实施方案中,5’和/或3’UTR增加多核苷酸的稳定性、定位和/或翻译效率。在一些实施方案中,修饰5’和/或3’UTR以增加一种或多种多核苷酸的稳定性、定位和/或翻译效率。在一些实施方案中,5’和/或3’UTR改善蛋白质表达的水平和/或持续时间。在一些实施方案中,5’和/或3’UTR包括可以阻断或减少脱靶转基因表达(例如,抑制在特定发育阶段在细胞周期中的特定时间特定细胞类型(例如,神经元细胞)中的表达等)的元件(例如,一个或多个miRNA结合位点等)。在一些实施方案中,5’和/或3’UTR包括可以增强特定细胞类型中的转基因表达的元件(例如,一个或多个miRNA结合位点等)。
合成RNA多核苷酸
在一些方面,本公开涉及含有本文所述的一种或多种多核苷酸的合成RNA,特别是合成mRNA。在一些实施方案中,合成mRNA多核苷酸包含5’-帽结构。5’-帽结构的实例可包括但不限于帽-0、帽-1、帽-2和帽-3结构以及它们的衍生物。在一些实施方案中,合成mRNA多核苷酸包含3’-poly(A)尾。在一些实施方案中,合成mRNA多核苷酸包含一个或多个5’和/或3’UTR,所述5’和/或3’UTR在所述合成mRNA多核苷酸内所包含的一种或多种编码序列的侧翼。在一些实施方案中,5’和/或3’UTR增加合成mRNA多核苷酸的稳定性、定位和/或翻译效率。在一些实施方案中,修饰5’和/或3’UTR以增加合成mRNA多核苷酸的稳定性、定位和/或翻译效率。在一些实施方案中,5’和/或3’UTR改善蛋白质表达的水平和/或持续时间。在一些实施方案中,修饰5’和/或3’UTR以改善蛋白质表达的水平和/或持续时间。在一些实施方案中,5’和/或3’UTR包括可以限制脱靶表达(例如,抑制在特定发育阶段在细胞周期中的特定时间特定细胞类型(例如,神经元细胞)中的表达等)的元件(例如,miRNA结合位点等)。在一些实施方案中,5’UTR包含Kozak序列。在一些实施方案中,Kozak序列与Kozak共有序列相同或基本相似。制备含有一种或多种目标多核苷酸的合成mRNA多核苷酸的方法是本领域技术人员熟知的。
在一些方面,本公开的合成mRNA多核苷酸包含一种或多种修饰的核糖核苷酸。修饰的核糖核苷酸的实例可包括但不限于2-硫代尿苷、5-氮杂尿苷、假尿苷、4-硫代尿苷、5-甲基尿苷、5-氨基尿苷、5-羟基尿苷、5-甲基-5-氮杂尿苷、5-氨基-5-氮杂尿苷、5-羟基-5-氮杂尿苷、5-甲基假尿苷、5-氨基假尿苷、5-羟基假尿苷、4-硫代-5-氮杂尿苷、4-硫代假尿苷、4-硫代-5-甲基尿苷、4-硫代-5-氨基尿苷、4-硫代-5-羟基尿苷、4-硫代-5-甲基-5-氮杂尿苷、4-硫代-5-氨基-5-氮杂尿苷、4-硫代-5-羟基-5-氮杂尿苷、4-硫代-5-甲基假尿苷、4-硫代-5-氨基假尿苷、4-硫代-5-羟基假尿苷、2-硫代胞苷、5-氮杂胞苷、假胞苷、N4-甲基胞苷、N4-氨基胞苷、N4-羟基胞苷、5-甲基胞苷、5-氨基胞苷、5-羟基胞苷、5-甲基-5-氮杂胞苷、5-氨基-5-氮杂胞苷、5-羟基-5-氮杂胞苷、5-甲基假胞苷、5-氨基假胞苷、5-羟基假胞苷、N4-甲基-5-氮杂胞苷、N4-甲基假胞苷、2-硫代-5-氮杂胞苷、2-硫代假胞苷、2-硫代-N4-甲基胞苷、2-硫代-N4-氨基胞苷、2-硫代-N4-羟基胞苷、2-硫代-5-甲基胞苷、2-硫代-5-氨基胞苷、2-硫代-5-羟基胞苷、2-硫代-5-甲基-5-氮杂胞苷、2-硫代-5-氨基-5-氮杂胞苷、2-硫代-5-羟基-5-氮杂胞苷、2-硫代-5-甲基假胞苷、2-硫代-5-氨基假胞苷、2-硫代-5-羟基假胞苷、2-硫代-N4-甲基-5-氮杂胞苷、2-硫代-N4-甲基假胞苷、N4-甲基-5-甲基胞苷、N4-甲基-5-氨基胞苷、N4-甲基-5-羟基胞苷、N4-甲基-5-甲基-5-氮杂胞苷、N4-甲基-5-氨基-5-氮杂胞苷、N4-甲基-5-羟基-5-氮杂胞苷、N4-甲基-5-甲基假胞苷、N4-甲基-5-氨基假胞苷、N4-甲基-5-羟基假胞苷、N4-氨基-5-氮杂胞苷、N4-氨基假胞苷、N4-氨基-5-甲基胞苷、N4-氨基-5-氨基胞苷、N4-氨基-5-羟基胞苷、N4-氨基-5-甲基-5-氮杂胞苷、N4-氨基-5-氨基-5-氮杂胞苷、N4-氨基-5-羟基-5-氮杂胞苷、N4-氨基-5-甲基假胞苷、N4-氨基-5-氨基假胞苷、N4-氨基-5-羟基假胞苷、N4-羟基-5-氮杂胞苷、N4-羟基假胞苷、N4-羟基-5-甲基胞苷、N4-羟基-5-氨基胞苷、N4-羟基-5-羟基胞苷、N4-羟基-5-甲基-5-氮杂胞苷、N4-羟基-5-氨基-5-氮杂胞苷、N4-羟基-5-羟基-5-氮杂胞苷、N4-羟基-5-甲基假胞苷、N4-羟基-5-氨基假胞苷、N4-羟基-5-羟基假胞苷、2-硫代-N4-甲基-5-甲基胞苷、2-硫代-N4-甲基-5-氨基胞苷、2-硫代-N4-甲基-5-羟基胞苷、2-硫代-N4-甲基-5-甲基-5-氮杂胞苷、2-硫代-N4-甲基-5-氨基-5-氮杂胞苷、2-硫代-N4-甲基-5-羟基-5-氮杂胞苷、2-硫代-N4-甲基-5-甲基假胞苷、2-硫代-N4-甲基-5-氨基假胞苷、2-硫代-N4-甲基-5-羟基假胞苷、2-硫代-N4-氨基-5-氮杂胞苷、2-硫代-N4-氨基假胞苷、2-硫代-N4-氨基-5-甲基胞苷、2-硫代-N4-氨基-5-氨基胞苷、2-硫代-N4-氨基-5-羟基胞苷、2-硫代-N4-氨基-5-甲基-5-氮杂胞苷、2-硫代-N4-氨基-5-氨基-5-氮杂胞苷、2-硫代-N4-氨基-5-羟基-5-氮杂胞苷、2-硫代-N4-氨基-5-甲基假胞苷、2-硫代-N4-氨基-5-氨基假胞苷、2-硫代-N4-氨基-5-羟基假胞苷、2-硫代-N4-羟基-5-氮杂胞苷、2-硫代-N4-羟基假胞苷、2-硫代-N4-羟基-5-甲基胞苷、N4-羟基-5-氨基胞苷、2-硫代-N4-羟基-5-羟基胞苷、2-硫代-N4-羟基-5-甲基-5-氮杂胞苷、2-硫代-N4-羟基-5-氨基-5-氮杂胞苷、2-硫代-N4-羟基-5-羟基-5-氮杂胞苷、2-硫代-N4-羟基-5-甲基假胞苷、2-硫代-N4-羟基-5-氨基假胞苷、2-硫代-N4-羟基-5-羟基假胞苷、N6-甲基腺苷、N6-氨基腺苷、N6-羟基腺苷、7-脱氮腺苷、8-氮杂腺苷、N6-甲基-7-脱氮腺苷、N6-甲基-8-氮杂腺苷、7-脱氮-8-氮杂腺苷、N6-甲基-7-脱氮-8-氮杂腺苷、N6-氨基-7-脱氮腺苷、N6-氨基-8-氮杂腺苷、N6-氨基-7-脱氮-8-氮杂腺苷、N6-羟基腺苷、N6-羟基-7-脱氮腺苷,N6-羟基-8-氮杂腺苷、N6-羟基-7-脱氮-8-氮杂腺苷、6-硫代鸟苷、7-脱氮鸟苷、8-氮杂鸟苷、6-硫代-7-脱氮鸟苷、6-硫代-8-氮杂鸟苷、7-脱氮-8-氮杂鸟苷和6-硫代-7-脱氮-8-氮杂鸟苷。
在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸和编码赖氨酰羟化酶3多肽的多核苷酸包含在两个单独的合成mRNA多核苷酸内。在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸和编码角蛋白I型细胞骨架17多肽的多核苷酸包含在两个单独的合成mRNA多核苷酸内。在一些实施方案中,编码赖氨酰羟化酶3多肽的多核苷酸和编码角蛋白I型细胞骨架17多肽的多核苷酸包含在两个单独的合成mRNA多核苷酸内。在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸、编码赖氨酰羟化酶3多肽的多核苷酸和编码角蛋白I型细胞骨架17多肽的多核苷酸包含在三个单独的合成mRNA多核苷酸内。
在一些实施方案中,编码胶原α-1(VII)链多肽的多核苷酸、编码赖氨酰羟化酶3多肽的多核苷酸和/或编码角蛋白I型细胞骨架17多肽的多核苷酸是包含在单一合成mRNA多核苷酸内的单一连续多核苷酸。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第二开放阅读框(ORF)上编码胶原α-1(VII)链多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架多肽,并且在第二开放阅读框(ORF)上编码胶原α-1(VII)链多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第二开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架多肽,并且在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的嵌合多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第二开放阅读框(ORF)上编码包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的嵌合多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,并且在第二开放阅读框(ORF)上编码包含胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的嵌合多肽。在一些实施方案中,两个ORF由IRES分开。
在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,在第二开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,并且在第三开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第三开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,在第二开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第三开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,在第二开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,并且在第三开放阅读框(ORF)上编码胶原α-1(VII)链多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽,并且在第三开放阅读框(ORF)上编码胶原α-1(VII)链多肽。在一些实施方案中,在单一合成mRNA中,单一连续多核苷酸在第一开放阅读框(ORF)上编码角蛋白I型细胞骨架17多肽,在第二开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第三开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。在一些实施方案中,第一、第二和第三ORF由内部核糖体进入位点(IRES)分开。
合适的IRES的实例可包括但不限于病毒来源的IRES(例如,来源于脊髓灰质炎病毒、鼻病毒、脑心肌炎病毒、口蹄疫病毒、丙型肝炎病毒、经典猪瘟病毒、劳氏肉瘤病毒、人体免疫缺陷病毒、蟋蟀麻痹病毒、卡波西氏肉瘤相关疱疹病毒等的IRES)和细胞mRNA来源的IRES(例如,来源于生长因子mRNA,诸如成纤维细胞生长因子2、血小板来源生长因子B和血管内皮生长因子的IRES;来源于转录因子mRNA,诸如触角因子、ultrapithoraxm和NF-κB抑制因子的IRES;来源于致癌基因mRNA,诸如c-myc、pim-1和蛋白激酶p58PITSLRE的IRES等)。
在一些实施方案中,编码包含本文所述的胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的任何嵌合多肽的多核苷酸编码在合成mRNA多核苷酸的单一ORF内被编码。
本公开的合成mRNA多核苷酸可以进一步编码另外的编码序列。另外的编码序列的实例可包括但不限于编码另外的多肽标签的序列。合适的多肽标签的实例可包括但不限于以下标签的任何组合:纯化标签,诸如his标签、flag标签、麦芽糖结合蛋白和谷胱甘肽-S-转移酶标签;检测标签,诸如可光度测定地检测的标签(例如,红色荧光蛋白等)和具有可检测的酶活性的标签(例如,碱性磷酸酶等);含有分泌序列、前导序列和/或稳定序列的标签;蛋白酶切割位点(诸如弗林蛋白酶切割位点)等。
递送载媒介物
本公开的某些方面涉及一种包含递送媒介物的药物组合物,所述递送媒介物包含本文所述的一种或多种多核苷酸。在一些实施方案中,递送媒介物适于将一种或多种多核苷酸递送到一种或多种靶细胞中。
在一些实施方案中,递送媒介物是病毒。病毒递送媒介物的实例可包括但不限于腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。在一些实施方案中,病毒是复制缺陷型的。在一些实施方案中,病毒是具有复制能力的。在一些实施方案中,相对于未修饰的野生型病毒的组织嗜性,已对病毒进行修饰以改变其组织嗜性。制备包含一种或多种多核苷酸的病毒的方法是本领域技术人员熟知的。
在一些实施方案中,病毒递送媒介物是单纯疱疹病毒。单纯疱疹病毒递送媒介物可以通过例如WO2015/009952中公开的方法来制备。在一些实施方案中,单纯疱疹病毒包含修饰的包膜。在一些实施方案中,修饰的包膜包含一种或多种(例如,一种、两种、三种、四种或更多种)突变的单纯疱疹病毒糖蛋白。单纯疱疹病毒糖蛋白的实例可包括但不限于糖蛋白gB、gD、gH和gL。在一些实施方案中,相对于野生型单纯疱疹病毒,修饰的包膜改变了单纯疱疹病毒的组织嗜性。在一些实施方案中,单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。在一些实施方案中,病毒是1型单纯疱疹病毒。在一些实施方案中,病毒是2型单纯疱疹病毒。
在一些实施方案中,递送媒介物是非病毒递送媒介物。在一些实施方案中,非病毒递送媒介物是基于化学品的递送媒介物(基于化学品的递送试剂)。基于化学品的递送媒介物的实例可包括但不限于磷酸钙、树枝状体、脂质体(阳离子脂质体、非阳离子脂质体和混合物)、外来体、带电脂质和阳离子聚合物(诸如DEAE-葡聚糖、聚乙烯亚胺等)。在一些实施方案中,非病毒递送媒介物是非化学递送媒介物。非化学递送媒介物的实例可包括但不限于电穿孔、核转染、声致穿孔、光学转染和基于粒子的媒介物(诸如基因枪、磁辅助转染、穿刺转染(impalefection)、粒子轰击等)。在一些实施方案中,非病毒递送媒介物是树枝状体、脂质体、外来体、带电脂质或阳离子聚合物。在一些实施方案中,非病毒递送媒介物是树枝状体。在一些实施方案中,非病毒递送媒介物是脂质体。在一些实施方案中,非病毒递送媒介物是外来体。在一些实施方案中,非病毒递送媒介物是带电脂质。在一些实施方案中,非病毒递送媒介物是阳离子聚合物。在具有非病毒递送媒介物的复合物中产生一种或多种目标多核苷酸的方法是本领域技术人员熟知的。
药学上可接受的载剂
本公开的某些方面涉及一种包含药学上可接受的载剂的药物组合物。在一些实施方案中,药学上可接受的载剂是足以用于局部和/或透皮施用/应用的载剂。在一些实施方案中,药学上可接受的载剂是足以用于皮下和/或皮内施用/应用的载剂。在一些实施方案中,药学上可接受的载剂是微创或非侵入性的。药学上可接受的载剂在所采用的剂量和浓度下通常对接受者无毒性,并且包括但不限于:缓冲剂,诸如磷酸盐、柠檬酸盐和其他有机酸;抗氧化剂,包括抗坏血酸和甲硫氨酸;防腐剂(诸如十八烷基二甲基苄基氯化铵、氯化六甲双铵(hexamethonium chloride)、苯扎氯铵、苄索氯铵;苯酚、丁醇或苄醇;对羟苯甲酸烷酯,诸如对羟苯甲酸甲酯或丙酯;儿茶酚;间苯二酚;环己醇;3-戊醇和间甲酚);低分子量(小于约10个残基)多肽;蛋白质,诸如血清白蛋白、凝胶或免疫球蛋白;亲水性聚合物,诸如聚乙烯基吡咯烷酮;氨基酸,诸如甘氨酸、谷酰氨酸、天冬酰胺、组氨酸、精氨酸或赖氨酸;单糖、双糖以及其他碳水化合物,包括葡萄糖、甘露糖或糊精;螯合剂,诸如EDTA;糖,诸如蔗糖、甘露糖醇、海藻糖或山梨糖醇;多元醇,诸如甘油(例如,包含10%甘油的制剂);成盐反离子,诸如钠;金属络合物(例如,Zn-蛋白质络合物);和/或非离子表面活性剂,诸如聚乙二醇(PEG)。对药学上可接受的载剂的深入讨论可见于REMINGTON’S PHARMACEUTICALSCIENCES(Mack Pub.Co.,N.J.1991)。
在一些实施方案中,药学上可接受的载剂适于局部或透皮应用/施用。适于局部或透皮应用/施用的载剂的实例可包括但不限于膏剂、糊剂、乳膏、悬浮液、乳液、脂肪膏剂、凝胶、粉剂、洗剂、溶液、喷雾剂、贴剂、微针阵列和吸入剂。在一些实施方案中,药学上可接受的载剂包括膏剂、糊剂、乳膏、悬浮液、乳液、脂肪膏剂、凝胶、粉剂、洗剂、溶液、喷雾剂和吸入剂中的一种或多种。在一些实施方案中,药学上可接受的载剂包含膏剂。在一些实施方案中,药学上可接受的载剂包含糊剂。在一些实施方案中,药学上可接受的载剂包括乳膏。在一些实施方案中,药学上可接受的载剂包含悬浮液。在一些实施方案中,药学上可接受的载剂包含乳液。在一些实施方案中,药学上可接受的载剂包含凝胶。在一些实施方案中,药学上可接受的载剂包含粉剂。在一些实施方案中,药学上可接受的载剂包含洗剂。在一些实施方案中,药学上可接受的载剂包含溶液。在一些实施方案中,药学上可接受的载剂包含喷雾剂。在一些实施方案中,药学上可接受的载剂包含吸入剂。在一些实施方案中,药用载剂包含贴剂(例如,贴附于皮肤的贴剂)。在一些实施方案中,药学上可接受的载剂包包含微针阵列。制备和使用适于药物组合物递送的微针阵列的方法在本领域中是公知的(Kim Y.等人“Microneedles for drug and vaccine delivery”.Advanced Drug Delivery Reviews2012,64(14):1547-68)。
在一些实施方案中,药学上可接受的载剂包含适合于局部或透皮应用/施用的两种、三种、四种、五种或更多种不同的药学上可接受的载剂的组合。
在一些实施方案中,药学上可接受的载剂还包含一种或多种附加组分。附加组分的实例可包括但不限于粘合剂(例如,预凝胶化的玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素等);填充剂(例如乳糖和其他糖、微晶纤维素、果胶、明胶、硫酸钙、乙基纤维素、聚丙烯酸盐或磷酸氢钙等);润滑剂(例如硬脂酸镁、滑石、硅土、胶体二氧化硅、硬脂酸、金属的硬脂酸盐、氢化植物油、玉米淀粉、聚乙二醇、苯甲酸钠、乙酸钠等);崩解剂(例如淀粉、羟基乙酸淀粉钠等);润湿剂(例如十二烷基硫酸钠等);盐溶液;醇类;聚乙二醇;明胶;乳糖;淀粉酶;硬脂酸镁;滑石;硅酸;粘性石蜡;羟甲基纤维素;聚乙烯吡咯烷酮;甜味剂;调味剂;加香剂;着色剂;保温剂;防晒剂;抗菌剂;能够稳定多核苷酸或防止多核苷酸降解的剂等。
如本文所述的药物组合物和制剂可以通过将包含本文所述的一种或多种多核苷酸的递送媒介物与一种或多种药学上可接受的载剂混合来制备。用于体内施用的制剂通常是无菌的。无菌可易于例如通过无菌过滤膜过滤来实现。
治疗方法
本公开部分地涉及用于在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的药物组合物和方法。皮肤的疾病或病症的实例可包括但不限于大疱性表皮松解症、皮肤癌、牛皮癣、扁平苔癣、狼疮、红斑痤疮、湿疹、皮肤念珠菌病、蜂窝织炎、脓疱疮、褥疮、丹毒、寻常型鱼鳞病、皮肌炎、肢端皮炎、淤积性皮炎、内瑟顿综合征、单纯大疱性表皮松解症(LAMB3基因)、常染色体隐性先天性鱼鳞病、着色性干皮病和类天疱疮中的一种或多种。在一些实施方案中,皮肤的疾病或病症是大疱性表皮松解症。在一些实施方案中,受试者具有大疱性表皮松解症的一种或多种症状或有出现大疱性表皮松解症的一种或多种症状的风险。
本文所述的多核苷酸和药物组合物可用于在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解,包括治疗大疱性表皮松解症(例如,隐性营养不良型大疱性表皮松解症、显性营养不良型大疱性表皮松解症等)的一种或多种症状。本公开的药物组合物可以通过本领域已知的任何合适的方法来施用,这些方法包括但不限于通过口服施用、舌下施用、经颊施用、局部施用、直肠施用、通过吸入、透皮施用、皮下注射、皮内注射、静脉内(IV)注射、动脉内注射、肌内注射、心内注射、骨内注射、腹腔内注射、经粘膜施用、阴道施用、玻璃体内施用、关节内施用、关节周围施用、局部施用、表皮施用或它们的任何组合。药物组合物可通过各种途径递送至个体,包括但不限于皮下、皮内、局部、透皮和经粘膜施用。因此,本公开还涵盖将本文所述的任何多核苷酸或药物组合物递送至个体(诸如患有大疱性表皮松解症或有发展大疱性表皮松解症的风险的个体)的方法。
在一些实施方案中,提供了受试者的皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解,包括施用有效量的能够增强、增加、加强和/或强化受试者的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的药物组合物。在一些实施方案中,以皮内方式或以皮下方式施用药物组合物在一些实施方案中,以透皮方式或以局部方式施用药物组合物。在一些实施方案中,提供了受试者的皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解,包括以局部方式施用有效量的能够增强、增加、加强和/或强化受试者的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的药物组合物。药物组合物可以是本文所述的任何药物组合物。在一些实施方案中,个体罹患大疱性表皮松解症。在一些实施方案中,个体罹患营养不良型大疱性表皮松解症。在一些实施方案中,个体罹患显性营养不良型大疱性表皮松解症。在一些实施方案中,个体罹患隐性营养不良型大疱性表皮松解症。在一些实施方案中,药物组合物每天施用一次、两次、三次、四次、五次或更多次。在一些实施方案中,药物组合物施用于个体的一个或多个受影响的区域。在一些实施方案中,药物组合物施用于个体的一个或多个未受影响的区域。
在一些实施方案中,本文所述的药物组合物可用于治疗或减轻大疱性表皮松解症的一种或多种症状。大疱性表皮松解症(例如,隐性营养不良型大疱性表皮松解症、显性营养不良型大疱性表皮松解症等)的症状可包括但不限于皮肤上的水疱(尤其是手部、足部、膝盖和肘部上的水疱)、粘膜上的水疱、皮肤瘢痕形成、粘膜瘢痕形成、皮肤糜烂、指甲和/或脚趾甲畸形、指甲和/或脚趾甲脱落、内部起泡(包括声带、食道和上呼吸道上起泡)、皮肤增厚(尤其是手掌和足底皮肤增厚)、头皮起泡、头皮瘢痕形成、脱发(瘢痕性脱发)、皮肤薄感、萎缩性瘢痕、粟粒疹、牙齿状况(诸如蛀牙和牙釉质形成不良)、关节畸形、手指和脚趾融合和吞咽困难。
在一些实施方案中,提供了治疗罹患大疱性表皮松解症的个体的方法,所述方法包括施用有效量的能够增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的药物组合物。在一些实施方案中,以皮内方式或以皮下方式施用药物组合物在一些实施方案中,以透皮方式或以局部方式施用药物组合物。在一些实施方案中,提供了治疗性治疗罹患大疱性表皮松解症的个体的方法,所述方法包括以局部方式施用有效量的能够增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的药物组合物。药物组合物可以是本文所述的任何药物组合物。在一些实施方案中,个体罹患营养不良型大疱性表皮松解症。在一些实施方案中,个体罹患显性营养不良型大疱性表皮松解症。在一些实施方案中,个体罹患隐性营养不良型大疱性表皮松解症。在一些实施方案中,药物组合物每天施用一次、两次、三次、四次、五次或更多次。在一些实施方案中,药物组合物施用于个体的一个或多个受影响的区域。在一些实施方案中,药物组合物施用于个体的一个或多个未受影响的区域。
在一些实施方案中,提供了预防性治疗罹患大疱性表皮松解症的个体的方法,所述方法包括施用有效量的能够增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的药物组合物。在一些实施方案中,以皮内方式或以皮下方式施用药物组合物在一些实施方案中,以透皮方式或以局部方式施用药物组合物。在一些实施方案中,提供了预防性治疗罹患大疱性表皮松解症的个体的方法,所述方法包括以局部方式施用有效量的能够增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的药物组合物。药物组合物可以是本文所述的任何药物组合物。在一些实施方案中,个体罹患营养不良型大疱性表皮松解症。在一些实施方案中,个体罹患显性营养不良型大疱性表皮松解症。在一些实施方案中,个体罹患隐性营养不良型大疱性表皮松解症。在一些实施方案中,药物组合物每天施用一次、两次、三次、四次、五次或更多次。在一些实施方案中,药物组合物施用于个体的一个或多个受影响的区域。在一些实施方案中,药物组合物施用于个体的一个或多个未受影响的区域。
在一些实施方案中,提供了预防性治疗有发展大疱性表皮松解症风险的个体的方法,所述方法包括施用有效量的能够增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的药物组合物。在一些实施方案中,以皮内方式或以皮下方式施用药物组合物在一些实施方案中,以透皮方式或以局部方式施用药物组合物。在一些实施方案中,提供了预防性治疗有发展大疱性表皮松解症风险的个体的方法,所述方法包括以局部方式施用有效量的能够增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平的药物组合物。药物组合物可以是本文所述的任何药物组合物。在一些实施方案中,个体有发展营养不良型大疱性表皮松解症的风险。在一些实施方案中,个体有发展显性营养不良型大疱性表皮松解症的风险。在一些实施方案中,个体有发展隐性营养不良型大疱性表皮松解症的风险。在一些实施方案中,将药物组合物每天施用一次、两次、三次、四次、五次或更多次。在一些实施方案中,将药物组合物施用于个体的一个或多个受影响的区域。在一些实施方案中,将药物组合物施用于个体的一个或多个未受影响的区域。
在一些实施方案中,向个体施用有效量的本文所述的任何药物组合物增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平。在一些实施方案中,向个体施用有效量的本文所述的任何药物组合物增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的功能。在一些实施方案中,向个体施用有效量的本文所述的任何药物组合物增强、增加、加强和/或强化个体的一种或多种细胞中的胶原α-1链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的活性。
在一些实施方案中,向个体施用有效量的本文所述的任何药物组合物增强、增加、加强和/或强化个体的锚原纤维形成。在一些实施方案中,向个体施用有效量的本文所述的任何药物组合物增强、增加、加强和/或强化个体的上皮基底膜组织。在一些实施方案中,向个体施用有效量的本文所述的任何药物组合物增强、增加、加强和/或强化个体的上皮基底粘附。在一些实施方案中,向个体施用有效量的本文所述的任何药物组合物增强、增加、加强和/或强化个体的真皮表皮连接完整性。在一些实施方案中,向个体施用有效量的本文所述的任何药物组合物增强、增加、加强和/或强化个体的伤口愈合。不希望受理论束缚,据信通过施用本文所述的一种或多种药物组合物来增加、加强和/或强化个体的一种或多种细胞中的胶原α-1(VII)链多肽的水平将允许增加个体中功能性胶原α-1(VII)链蛋白的产生和分泌。不希望受理论束缚,据信通过施用本文所述的一种或多种药物组合物来增加、加强和/或强化个体的一种或多种细胞中的赖氨酰羟化酶3多肽的水平将增加个体中胶原α-1(VII)链多肽的翻译后修饰,增强功能性胶原α-1(VII)链蛋白的产生和/或分泌。不希望受理论束缚,进一步相信通过施用本文所述的一种或多种药物组合物(通过使细胞与表达多肽的两种单独的多核苷酸接触,通过使细胞与单独表达两种多肽的单一连续多核苷酸接触,或通过使细胞与表达嵌合多肽的单一连续多核苷酸接触)来增加、加强和/或强化个体的相同细胞中的胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽的水平,将对增强功能性胶原α-1(VII)链蛋白的产生和分泌产生累加效应。不希望受理论束缚,据信功能性胶原α-1(VII)链蛋白的产生和分泌的增加将允许改善个体中的锚原纤维形成,帮助组织、稳定和辅助上皮基底膜的粘附。不希望受理论束缚,据信最终这将使得罹患大疱性表皮松解症的个体的真皮-表皮稳定性增加,治疗现有伤口并预防或延迟治疗区域中伤口的再次形成。
分离的多核苷酸和多肽
本公开的某些方面涉及分离的多核苷酸,所述分离的多核苷酸包含编码胶原α-1(VII)链多肽的多核苷酸。本公开的其他方面涉及分离的多核苷酸,所述分离的多核苷酸包含编码赖氨酰羟化酶3多肽的多核苷酸。本公开的其他方面涉及分离的多核苷酸,所述分离的多核苷酸包含编码角蛋白I型细胞骨架17多肽的多核苷酸。
本公开的其他方面涉及分离的多核苷酸,所述分离的多核苷酸包含由编码接头多肽的多核苷酸分开的编码胶原α-1(VII)链多肽的多核苷酸和编码赖氨酰羟化酶3多肽的多核苷酸。在一些实施方案中,分离的多核苷酸编码包含胶原α-1(VII)链多肽、接头多肽和赖氨酰羟化酶3多肽的嵌合多肽。
在一些实施方案中,编码接头多肽的多核苷酸还包含编码一个或多个弗林蛋白酶切割位点的多核苷酸。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在接头多肽的下游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在T2A接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在T2A接头多肽的下游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在P2A接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在P2A接头多肽的下游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在E2A接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在E2A接头多肽的下游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在F2A接头多肽的上游被编码。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点在F2A接头多肽的下游被编码。
编码胶原α-1(VII)链多肽的多核苷酸的实例是SEQ ID NO:1。编码胶原α-1(VII)链多肽的多核苷酸还包括与SEQ ID NO:1的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
编码赖氨酰羟化酶3多肽的多核苷酸的实例是SEQ ID NO:3。编码赖氨酰羟化酶3多肽的多核苷酸还包括与SEQ ID NO:3的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
编码角蛋白I型细胞骨架17多肽的多核苷酸的实例是SEQ ID NO:29。编码角蛋白I型细胞骨架17多肽的多核苷酸还包括与SEQ ID NO:29的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
编码接头多肽的多核苷酸的实例是SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11。编码接头多肽的多核苷酸还包括与SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:11的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
编码包含胶原α-1(VII)链多肽、接头多肽和赖氨酰羟化酶3多肽的嵌合多肽的多核苷酸的实例是SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25和SEQ ID NO:27。编码嵌合多肽的多核苷酸还包括与SEQID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQID NO:25或SEQ ID NO:27的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多核苷酸。
本公开的其他方面涉及包含在载体内的本文所述的一种或多种(例如,一种或多种、两种或更多种、三种或更多种等)分离的多核苷酸。在一些实施方案中,载体是腺病毒载体、腺相关病毒载体、逆转录病毒载体、慢病毒载体、单纯疱疹病毒载体、痘苗病毒载体或它们的任何杂合病毒载体。在一些实施方案中,载体是单纯疱疹病毒载体。在一些实施方案中,载体包含一种或多种(例如,一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种等)转基因。
在一些实施方案中,单纯疱疹病毒载体是疱疹病毒扩增子载体。在一些实施方案中,载体是HSV-1扩增子。在一些实施方案中,载体是HSV-1杂合扩增子。HSV-1杂合扩增子的实例可包括但不限于HSV/AAV杂合扩增子、HSV/EBV杂合扩增子、HSV/EBV/RV杂合扩增子和HSV/睡美人杂合扩增子。在一些实施方案中,载体是HSV/AAV杂合扩增子。在一些实施方案中,载体是HSV/EBV杂合扩增子。在一些实施方案中,载体是HSV/EBV/RV杂合扩增子。在一些实施方案中,载体是HSV/睡美人杂合扩增子。本公开的其他方面涉及一种制备含有本文所述的一种或多种多核苷酸的病毒递送媒介物的方法。在一些实施方案中,所述方法包括使宿主细胞与含有本文所述的一种或多种分离的多核苷酸的一种或多种病毒载体接触,并收集由所述宿主细胞生成的病毒递送媒介物。培养细胞和使细胞与一种或多种目标病毒载体接触(例如通过转导或转染)的方法是本领域技术人员熟知的。
在一些实施方案中,单纯疱疹病毒载体是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组已被工程化以减少或消除一种或多种毒性单纯疱疹病毒基因的表达。在一些实施方案中,重组单纯疱疹病毒基因组包含失活性突变。失活性突变的实例可包括但不限于缺失(例如,基因编码序列的缺失或一种或多种基因转录调控元件的缺失)、插入、点突变和重排。在一些实施方案中,重组单纯疱疹病毒基因组包含一种或多种立即早期基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含在ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55单纯疱疹病毒基因中的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个或全部八个中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP22基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP27和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP4、ICP22、ICP27、ICP47和UL55基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含ICP0、ICP4、ICP22和ICP27基因中的失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-2基因组。
在一些实施方案中,分离的重组单纯疱疹病毒基因组在一个、两个、三个、四个、五个、六个、七个或更多个病毒基因座内包含本公开的一种或多种(例如,一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种等)多核苷酸(例如转基因)。合适的病毒基因座的实例可包括但不限于ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55单纯疱疹病毒基因座。在一些实施方案中,分离的重组单纯疱疹病毒基因组在一个或多个病毒ICP4基因座内包含本公开的一种或多种多核苷酸(例如,重组病毒在一个或两个ICP4基因座中携带编码Col7的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码LH3的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码KRT17的多核苷酸;重组病毒在一个ICP4基因座中携带编码Col7的多核苷酸且在另一个ICP4基因座中携带编码KRT17的多核苷酸;重组病毒在一个ICP4基因座中携带编码Col7的多核苷酸且在另一个ICP4基因座中携带编码LH3的多核苷酸;重组病毒在一个ICP4基因座中携带编码LH3的多核苷酸且在另一个ICP4基因座中携带编码KRT17的多核苷酸等)。在一些实施方案中,分离的重组单纯疱疹病毒基因组在病毒UL41基因座内包含本公开的一种或多种多核苷酸。在一些实施方案中,分离的重组单纯疱疹病毒基因组在病毒ICP47基因座内包含本公开的一种或多种多核苷酸。在一些实施方案中,分离的重组单纯疱疹病毒基因组在一个或多个病毒ICP4基因座内包含本公开的一种或多种多核苷酸,并且在病毒UL41基因座内包含本公开的一种或多种多核苷酸(例如,重组病毒在一个或两个ICP4基因座中携带编码Col7的多核苷酸且在UL41基因座中携带编码LH3的多核苷酸;重组病毒一个或两个ICP4基因座中携带编码Col7的多核苷酸且在UL41基因座中携带编码Col7的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码Col7的多核苷酸且在UL41基因座中携带编码KRT17的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码LH3的多核苷酸且在UL41基因座中携带编码LH3的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码LH3的多核苷酸且在UL41基因座中携带编码Col7的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码LH3的多核苷酸且在UL41基因座中携带编码KRT17的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码KRT17的多核苷酸且在UL41基因座中携带编码LH3的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码KRT17的多核苷酸且在UL41基因座中携带编码Col7的多核苷酸;重组病毒在一个或两个ICP4基因座中携带编码KRT17的多核苷酸且在UL41基因座中携带编码KRT17的多核苷酸等)。
在一些方面,本文描述的分离的多核苷酸包含在合成mRNA内。在一些实施方案中,合成mRNA包含一种或多种修饰的核糖核苷酸。
本公开的某些方面涉及包含胶原α-1(VII)链多肽的分离的多肽。本公开的其他方面涉及包含赖氨酰羟化酶3多肽的分离的多肽。本公开的其他方面涉及包含角蛋白I型细胞骨架17多肽的分离的多肽。
本公开的其他方面涉及分离的嵌合多肽,所述分离的嵌合多肽包含由接头多肽分开的胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽。
在一些实施方案中,接头多肽还包含一个或多个弗林蛋白酶切割位点。在一些实施方案中,弗林蛋白酶切割位点的氨基酸序列与经典弗林蛋白酶切割位点(Arg-X-(Arg/Lys)-Arg)的序列相同或基本相似。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点位于接头多肽的N-末端。在一些实施方案中,所述一个或多个弗林蛋白酶切割位点位于接头多肽的C-末端。在一些实施方案中,接头多肽从N-末端到C-末端包含一个或多个弗林蛋白酶切割位点和T2A接头多肽。在一些实施方案中,接头多肽从N-末端到C-末端包含T2A接头多肽和一个或多个弗林蛋白酶切割位点。在一些实施方案中,接头多肽从N-末端到C-末端包含一个或多个弗林蛋白酶切割位点和P2A接头多肽。在一些实施方案中,接头多肽从N-末端到C-末端包含P2A接头多肽和一个或多个弗林蛋白酶切割位点。在一些实施方案中,接头多肽从N-末端到C-末端包含一个或多个弗林蛋白酶切割位点和E2A接头多肽。在一些实施方案中,接头多肽从N-末端到C-末端包含E2A接头多肽和一个或多个弗林蛋白酶切割位点。在一些实施方案中,接头多肽从N-末端到C-末端包含一个或多个弗林蛋白酶切割位点和F2A接头多肽。在一些实施方案中,接头多肽从N-末端到C-末端包含F2A接头多肽和一个或多个弗林蛋白酶切割位点。
在一些方面,包含胶原α-1(VII)链多肽的分离的多肽包含SEQ ID NO:2的氨基酸序列。分离的多肽还可包含胶原α-1(VII)链多肽,所述胶原α-1(VII)链多肽的氨基酸序列与SEQ ID NO:2的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一些方面,包含赖氨酰羟化酶3多肽的分离的多肽包含SEQ ID NO:4的氨基酸序列。分离的多肽还可包含赖氨酰羟化酶3多肽,所述赖氨酰羟化酶3多肽的氨基酸序列与SEQID NO:4的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一些方面,包含角蛋白I型细胞骨架17多肽的分离的多肽包含SEQ ID NO:30的氨基酸序列。分离的多肽还可包含角蛋白I型细胞骨架17多肽,所述角蛋白I型细胞骨架17多肽的氨基酸序列与SEQID NO:30的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一些方面,嵌合多肽包含含有SEQ ID NO:2的氨基酸序列的胶原α-1(VII)链多肽。嵌合多肽还可包含胶原α-1(VII)链多肽,所述胶原α-1(VII)链多肽的氨基酸序列与SEQID NO:2的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一些方面,嵌合多肽包含含有SEQ ID NO:4的氨基酸序列的赖氨酰羟化酶3多肽。嵌合多肽还可包含赖氨酰羟化酶3多肽,所述赖氨酰羟化酶3多肽的氨基酸序列与SEQID NO:4的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一些方面,嵌合多肽包含含有SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10或SEQID NO:12的氨基酸序列的接头多肽。嵌合多肽还可包含接头多肽,所述接头多肽的氨基酸序列与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10或SEQ ID NO:12的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一些方面,嵌合多肽是SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28的氨基酸序列。嵌合多肽还可以是与SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28的序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的氨基酸序列。
宿主细胞
本公开的某些方面涉及一种或多种宿主细胞,所述一种或多种宿主细胞包含含有本文所述的多核苷酸的载体。在一些实施方案中,载体是本文所述的任何分离的重组单纯疱疹病毒载体。在一些实施方案中,宿主细胞是细菌细胞(例如,大肠杆菌(E.coli)细胞等)。在一些实施方案中,宿主细胞是真菌细胞(例如,酿酒酵母(S.cerevisiae)细胞等)。在一些实施方案中,宿主细胞是昆虫细胞(例如,S2细胞等)。在一些实施方案中,宿主细胞是哺乳动物细胞。在一些实施方案中,宿主细胞是来自细胞系的细胞。合适的宿主细胞或细胞系的实例可包括但不限于293、HeLa、SH-Sy5y、Hep G2、CACO-2、A549、L929、3T3、K562、CHO-K1、MDCK、HUVEC、Vero、N20、COS-7、PSN1、VCaP、CHO细胞等。在一些实施方案中,载体是腺病毒载体、腺相关病毒载体、逆转录病毒载体、慢病毒载体、单纯疱疹病毒载体、痘苗病毒载体或它们的任何杂合病毒载体。在一些实施方案中,载体是单纯疱疹病毒载体。在一些实施方案中,载体是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中,宿主细胞包含辅助病毒。在一些实施方案中,使包含辅助病毒的宿主细胞与本文所述的载体接触。在一些实施方案中,使包含辅助病毒的宿主细胞与本文所述的HSV-1扩增子或HSV-1杂合扩增子接触使得产生包含本文所述的一种或多种载体的病毒。在一些实施方案中,从接触的宿主细胞的上清液中收集病毒。通过使包含辅助病毒的宿主细胞与HSV-1扩增子或HSV-1/杂合扩增子接触来生成病毒的方法在本领域中是已知的。在一些实施方案中,宿主细胞是互补宿主细胞。在一些实施方案中,互补宿主细胞表达在本文所述的任何病毒载体中失活的一种或多种基因。在一些实施方案中,使互补宿主细胞与本文所述的重组单纯疱疹病毒基因组接触。在一些实施方案中,使互补宿主细胞与本文所述的重组单纯疱疹病毒基因组接触使得产生包含本文所述的一种或多种载体的病毒。在一些实施方案中,从接触的宿主细胞的上清液中收集病毒。通过使互补宿主细胞与重组单纯疱疹病毒接触来生成病毒的方法一般描述于WO2015/009952中。
制品或药盒
本公开的某些方面涉及一种包含本文所述的药物组合物的制品或药盒。在一些实施方案中,所述制品或药盒包含包装说明书,所述包装说明书包含用于施用所述药物组合物以在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的说明。
在一些实施方案中,包含本文所述的一种或多种多核苷酸的递送媒介物和药学上可接受的载剂在同一容器或分开的容器中。合适的容器包括例如瓶子、小瓶、袋子和注射器。容器可以由诸如玻璃、塑料(诸如聚氯乙烯或聚烯烃)或金属合金(诸如不锈钢或哈氏合金)的多种材料形成。在一些实施例中,容器包括在容器上或与容器相关联的标签,其中所述标签指示使用的方向。制品或药盒还可包括自商业及使用者观点看来合乎需要的其他材料,包括其他缓冲液、稀释剂、过滤器等。
本说明书被认为足以使本领域技术人员能够实施本发明。除了本文所示和所描述的那些之外,根据前面的描述,本发明的各种修改对于本领域技术人员而言将是显而易见的,并且落入所附权利要求的范围内。
实施例
通过参考以下实施例将更全面地理解本公开。然而,不应将其理解为限制本公开的范围。应当理解,本文所述的实施例和实施方案仅用于说明目的,并且这些实施例和实施方案的修改或改变将能被本领域技术人员联想到,且包括在本申请的精神和界限以及所附权利要求的范围内。
实施例1:生成修饰的单纯疱疹病毒载体,以及产生/分离含有载体的病毒
为了制备能够在靶哺乳动物细胞中表达一种或多种转基因的修饰的单纯疱疹病毒基因组载体,对单纯疱疹病毒基因组进行修饰(图1A)以使立即早期基因ICP0、ICP4和ICP27失活,同时修饰立即早期基因ICP22使其包括异源诱导型启动子。这降低了基因组在哺乳动物细胞中的毒性。接下来,通过限制性克隆将盒插入修饰的疱疹病毒基因组中。该盒含有能够在靶哺乳动物细胞中表达转基因的异源启动子。启动子与编码胶原α-1(VII)链多肽的核酸序列以及下游调控元件可操作地连接(图1B),确保mRNA的正确产生。另选地,该盒包括两种转基因,每种转基因具有其自身的异源启动子,所述异源启动子与编码胶原α-1(VII)链多肽或赖氨酰羟化酶3多肽的核酸可操作地连接。这些转基因在同一条DNA链上编码(图1C),或以反义取向在相反的DNA链上编码(图1D)。将每种转基因与其自身的启动子和调控元件连接允许每个编码序列在单独的mRNA转录物上独立表达。从不同启动子表达转基因使得能够将编码序列可操作地连接至不同启动子类型,这可以驱动转基因在不同水平、在细胞周期中的不同时间、在不同细胞类型中或在不同诱导物或抑制物控制下的表达。
还构建了修饰的疱疹病毒基因组,该基因组包括表达编码由内部核糖体进入位点分开的胶原α-1(VII)链多肽和赖氨酰羟化酶3多肽的单一mRNA的盒(图1E)。这使得每种多肽当在靶细胞中表达时,可大致等摩尔地产生。最后,构建包括表达嵌合多肽的盒的修饰的疱疹病毒基因组。此嵌合多肽从N-末端到C-末端包括胶原α-1(VII)链多肽、可切割肽接头和赖氨酰羟化酶3多肽(图1F)。
构建另外的修饰的疱疹病毒基因组,该基因组包括两个盒,每个盒表达胶原α-1(VII)链多肽,其中每个盒插入野生型单纯疱疹病毒基因组的ICP4基因座(图2B-2G)的拷贝中(图2A)。构建的这些另外的重组疱疹病毒基因组具有疱疹病毒基因缺失/修饰的各种组合。
构建的重组疱疹病毒基因组含有ICP4基因的两个拷贝的编码序列的缺失,以及ICP27和UL55基因的编码序列的缺失。进一步修饰这些重组病毒以在ICP22和ICP47基因的启动子区域中含有失活性突变,使得ICP22和ICP47基因不以正常动力学表达(图2B)。
构建了另外的重组单纯疱疹病毒,其将用于胶原α-1(VII)链多肽的表达盒并入疱疹ICP4基因的两个基因座中。这些重组病毒包括:含有以下缺失的病毒:ICP22基因的编码序列及ICP4基因的两个拷贝的编码序列的缺失(图2C);ICP0基因的编码序列及ICP4基因的两个拷贝的编码序列的缺失(图2D);ICP0和ICP22基因的编码序列及ICP4基因的两个拷贝的编码序列的缺失(图2E);ICP0、ICP22和ICP27基因的编码序列及ICP4基因的两个拷贝的编码序列的缺失(图2F);以及ICP0、ICP22、ICP27和UL55基因的编码序列及ICP4基因的两个拷贝的编码序列的缺失(图2G)。基于图2C-2G所示的载体构建另外的载体,所述载体还包含编码ICP0和/或UL41基因座中的一种或多种另外的效应子(例如LH3、KRT17)的一种或多种转基因。
将这些修饰的单纯疱疹病毒基因组载体转染到经修饰以表达疱疹病毒基因的工程化Vero细胞中。这些工程化Vero细胞将封装有修饰的基因组的复制缺陷型单纯疱疹病毒分泌上清液中。然后收集上清液,浓缩并通过5μm过滤器无菌过滤。
实施例2:用复制缺陷型HSV-1拯救Col7表达
以下实施例描述了经修饰以表达人COL7A1基因的复制缺陷型1型单纯疱疹病毒的构建,以及这种病毒载体拯救在从RDEB患者分离的细胞中观察到的几种缺陷的用途。
方法
细胞和细胞培养
如前所述分离正常的和RDEB人皮肤成纤维细胞和角质形成细胞(NG,Y.Z.等人(2012)Cancer Res.72:3522-3534;Rheinwald,J.G.和Green,H.(1975)Cell6:331-42)。根据标准技术培养细胞。
KB103的构建
KB103载体由D3GFP产生,D3GFP是一种复制缺陷型HSV-1载体骨架,其中GFP替代了病毒ICP4。使用转移质粒,通过将COL7A1克隆到ICP4重组质粒pSASB3的EcoRI位点,用人COL7A1的编码序列替代D3GFP中的GFP的序列。在VeroD细胞上进行含COL7A1的转移质粒和D3GFP载体的混合转染/感染。分离得到的不表达GFP的噬菌斑,并通过蛋白质印迹测试Col7蛋白的表达。
病毒纯化
根据标准技术纯化KB103病毒(参见Diefenbach,R.和Fraefel,C.Herpes SimplexVirus.New York:Humana Press,2014)。
病毒感染
在病毒感染前一天,将细胞一式两份或一式三份以50%汇合度接种在六孔板中。将另外的孔平行接种以用于细胞计数和MOI测定。细胞接种后24小时,将一个孔中的细胞用胰蛋白酶消化并计数以计算MOI,并将病毒原液解冻并在细胞培养基中稀释以达到所需的MOI。从每个孔中吸出培养基以进行感染,并向每个孔中加入500μL含KB103的培养基(或对照培养基)。将板在37℃和5-7.5%CO2下孵育1.5-2小时,每15-20分钟间歇摇动,然后向每个孔中加入1.5-2mL完全细胞培养基,并将板在37℃下培养24-72小时。孵育后,收获细胞和上清液并进行处理以便分析。
mRNA定量
根据制造商规程,使用SYBR PCR测定法(Sybr Select Master Mix,LifeTechnologies)在感染后从分离自原代RDEB角质形成细胞的RNA扩增Col7转录物。将Col7转录物水平标准化为β-肌动蛋白转录物水平。
蛋白质印迹分析
感染后48小时从细胞产生细胞裂解液,并使用以下抗体根据标准技术进行蛋白质印迹:兔抗人Col7多克隆抗体(Sigma,Cat.#HPA042420)、小鼠抗人GAPDH抗体(Santa CruzBiotechnology,Cat.#sc-365062)、兔抗LH3抗体(Protein Tech,Cat.#11027-1-AP)和小鼠抗TSP1抗体(Santa Cruz Biotechnology,Cat.#sc-59887)。
免疫荧光
在感染前将细胞铺在盖玻片上,在感染后48小时进行固定,并用原代兔抗人Col7多克隆抗体(Sigma,Cat.#HPA042420)染色,洗涤,然后用荧光标记的抗兔二抗(Invitrogen,Cat.3A11012)进一步染色。使用标准技术用DAPI染色细胞核。
细胞粘附
将96孔板用10、20或50μg/mL的大鼠尾胶原1(Marathon Laboratory Supply)或人纤连蛋白(Sigma-Aldrich)以100μL反应体积在4℃下涂覆过夜,然后用PBS洗涤,并用PBS+0.1%BSA在37℃下阻断1小时。将模拟(对照)感染的或KB103感染的RDEB角质形成细胞(在100μL的DMEM/HamF12+0.1%BSA中的2.4*104个细胞)加入板中并在37℃下孵育40-90分钟。将孔用PBS洗涤三次以除去任何未结合的细胞,并用PFE将粘附细胞固定20分钟。然后将固定的细胞用70%乙醇处理,用结晶紫染色,在100%乙醇中分解并通过测量630nm处的吸光度进行定量。
皮肤等效(SE)器官型培养物
使用由RDEB成纤维细胞和角质形成细胞组成的皮肤等效器官型培养物来评估基底膜区(BMZ)Col7的表达。简而言之,将RDEB成纤维细胞(每孔2*105个细胞)包埋在六孔板中的纤维蛋白凝胶基质中,并在含有抗坏血酸和抑肽酶的DMEM+10%血清中于37℃和5%CO2下孵育24小时。然后将RDEB角质形成细胞(每孔1*106个细胞)接种在基质上,在含有50mg/mL抗坏血酸的DMEM/F-12角质形成细胞培养基中生长至汇合,并在气-液界面处培养。培养两天后,将KB103病毒加入培养物中(MOI为3)并孵育1.5小时。孵育后,洗涤培养物并孵育5-14天以促进分层并分化成上皮细胞。将皮肤等效物(SE)从板上手动分离并包埋在最佳切割温度化合物中,在液氮中冷冻,并切成6mm切片用于用单克隆抗Col7抗体进行免疫荧光染色。
结果
KB103在正常和RDEB细胞中的药理学
已经进行了许多离体方法以将人COL7A1基因递送至从RDEB患者分离的原代细胞,以试图校正Col7缺陷(Ortiz-Urda,S.等人(2003)J.C7in.Invest.111(2)251-5;Woodley,D.T.等人(2003)J.Invest.Dematol.121(5)1021-8)。尽管已成功实现对关键疾病特征的持久校正,但用于治疗大疱性表皮松解症的离体基因递送策略仍具有许多主要缺点,包括成本高、移植物不佳、外科清创术、包扎和伤口护理复杂以及手术后感染的可能性高。用于基因疗法的有吸引力的替代途径是使用病毒或非病毒载体来递送基因产物。然而,使用质粒DNA的非病毒载体在注射或以局部方式施用时基因转移效率非常低,而人基因疗法试验中最广泛使用的病毒载体(逆转录病毒载体)不感染非分裂细胞。这对于向皮肤递送基因是有问题的,因为逆转录病毒基因疗法需要操纵组织(诸如创伤)以产生足够的分裂细胞群。大容量腺病毒载体可以递送基因组大小的转录单位并在转导细胞中存活很长一段时间,但腺病毒粒子的毒性和免疫原性以及在载体制备过程中对辅助病毒的需求仍然是它们用于人基因疗法策略的重大障碍。虽然复制缺陷型HSV载体已被用作许多临床前研究中的递送媒介物,但是尚且没有报道支持使用基于HSV的病毒载体用于大疱性表皮松解症或其他皮肤病学应用的临床前证据。
为此,开发了编码人COL7A1基因的复制缺陷型1型单纯疱疹病毒(HSV-1)作为可用于DEB患者的基因疗法治疗的新型载体。修饰HSV-1病毒以完全缺失病毒ICP4、ICP27和UL55基因,ICP4缺失导致上游启动子序列的去除,驱动立即早期病毒基因ICP22和ICP47的转录。进一步修饰病毒以包括人巨细胞病毒(HCMV)立即早期启动子驱动的人COL7A1表达盒,该表达盒在缺失的ICP4基因座的两个拷贝内编码,产生适于将人COL7A1递送至靶细胞的复制缺陷型HSV-1载体(称为KB103)(图3)。
为了测试KB103在人细胞中递送和表达Col7的能力,以及拯救RDEB患者中Col7缺陷的能力,从健康个体以及罹患RDEB的个体分离出患者来源的人皮肤成纤维细胞和角质形成细胞,并将这些原代细胞在各种MOI下用KB103感染。感染后24-72小时,通过实时PCR在转导细胞中测量COL7A1基因表达,同时通过蛋白质印迹和免疫荧光分析平行分析Col7蛋白表达。
在用KB103感染的RDEB角质形成细胞(图4A)和成纤维细胞(图4B)中观察到COL7A1基因表达的剂量依赖性增加。KB103感染使得以0.3、1和3的MOI感染的RDEB角质形成细胞中的COL7A1基因表达分别增加了约7.5倍、12.5倍和25倍(图4A)。令人惊讶的是,在感染的RDEB成纤维细胞中观察到了COL7A1基因表达的更剧烈的变化。虽然MOI为0.1和0.3时的感染显示了COL7A1基因表达的中度增加,但经测量在MOI为1时感染的RDEB成纤维细胞中COL7A1基因表达增加了约30倍,而在MOI为3时感染的这种细胞类型中观察到了60倍的增加。此数据显示在用KB103感染后,在RDEB原代细胞中COL7A1基因表达大幅上调。
因此,在用KB103感染的细胞中也观察到稳健的Col7蛋白表达。在以0.3、1和3的MOI用KB103感染后48小时,在正常和RDEB角质形成细胞(图5A)和成纤维细胞(图5B)中均检测到Col7蛋白表达,在较高的病毒滴度下观察到Col7蛋白表达的表观剂量依赖性增加。在来自感染细胞的上清液和细胞裂解液中均观察到Col7的表达。令人惊讶的是,以0.3的MOI感染的RDEB成纤维细胞显示出比在未感染的正常成纤维细胞中观察到的更高水平的Col7(图5B),这表明使用KB103完全拯救RDEB成纤维细胞中的Col7表达,即使在低病毒滴度下也是如此。使用高病毒剂量(MOI为3)对细胞形态没有明显影响。另外,如通过GAPDH表达所确定的,在这些实验中未显示出使用高剂量KB103对成纤维细胞或角质形成细胞增殖的负面影响。
与上述实验一致,如通过免疫荧光检测Col7蛋白表达所展示的,在用KB103感染的正常和RDEB细胞中证实了Col7蛋白表达的稳健和剂量依赖性增加(图6)。正如所料,在未感染的RDEB人皮肤成纤维细胞或角质形成细胞中未检测到Col7蛋白;在未感染的正常角质形成细胞和成纤维细胞中检测到有限的Col7蛋白。然而,用KB103感染能够拯救RDEB成纤维细胞和角质形成细胞中的Col7蛋白表达,使其等于或高于在未感染的正常细胞中观察到的水平。此外,基于对每个感染的复制品的三个或更多个独立小组的评估,KB103的感染效率(MOI为3)经计算为≥95%,表明KB103有效递送并表达COL7A1表达盒。总之,此数据表明KB103能够在正常和RDEB原代细胞中递送和表达COL7A1,并且KB103被人皮肤成纤维细胞和角质形成细胞良好耐受。
RDEB细胞中KB103的功能评估
接下来在人皮肤成纤维细胞和角质形成细胞中研究了由KB103表达的人Col7蛋白的功能性。首先,在KB103感染的细胞中测试Col7表达对赖氨酰羟化酶3水平的影响。LH3是细胞外基质的沉积和组织所必需的,并且据报道在RDEB皮肤中LH3水平降低(Watt,S.A.等人(2015)PLoS One 10(9):p.e0137639)。相对于正常角质形成细胞,在未感染的RDEB角质形成细胞中观察到很少甚至没有LH3(图7,泳道1对5),这与先前的研究一致。然而,出乎意料地,在用KB103感染的RDEB角质形成细胞中,伴随着Col7蛋白表达的增加观察到LH3水平的剂量依赖性增加(图7),这表明KB103不仅能够拯救RDEB细胞中的Col7蛋白表达,还能够拯救LH3表达。
接下来,测试Col7表达对TSP-1水平的影响。TSP-1是血管生成的负调控因子,据报道在RDEB成纤维细胞中增加(Ng,Y.Z.等人(2012)Cancer Res.72(14):第3522-34页)。与先前的研究一致,相对正常人皮肤成纤维细胞,在未感染的RDEB中观察到更高水平的TSP-1(图8,泳道1和4)。令人惊讶的是,用KB103感染正常或RDEB成纤维细胞后,TSP-1蛋白表达被强烈抑制(图8)。此数据表明KB103不仅可以增加感染细胞中的Col7和LH3水平,还可以通过抑制负调控因子TSP-1来促进血管生成。
最后,测试KB103增加RDEB角质形成细胞与胶原1或纤连蛋白的细胞粘附的能力。在以各种MOI用KB103感染的RDEB角质形成细胞中观察到与胶原1和纤连蛋白的细胞粘附的剂量依赖性增加(图9A和图9B)。相对于未感染(对照)细胞,在全部测试MOI下进行的RDEB角质形成细胞感染显示,与用所有浓度的两种底物处理的孔的粘附性更高。总之,此数据表明由KB103表达的人Col7蛋白在转导的细胞中具有功能性。此蛋白质的功能性通过其相对于模拟感染样品增加LH3蛋白水平、降低TSP-1蛋白水平以及改善与胶原1和纤连蛋白的细胞粘附的能力来指示。
KB103在RDEB器官型培养物中的药理学和毒性
使用由RDEB成纤维细胞和角质形成细胞组成的皮肤等效(SE)器官型培养物来评估基底膜区(BMZ)由KB103表达的Col7蛋白的表达。将RDEB成纤维细胞和角质形成细胞模拟感染或用KB103以MOI为3感染,并孵育5天以促进分层并分化成上皮细胞。分离所得的皮肤等效物(SE),切片并染色用于免疫荧光分析以检测Col7蛋白表达。在来自用KB103感染的细胞的这些器官型培养物中检测到Col7表达,并且相对于模拟感染的对照观察到在BMZ处Col7蛋白开始沉积(图10)。此数据表明,不仅KB103可以有效地递送COL7A1并表达Col7蛋白,而且Col7蛋白开始在器官型培养物中组织,其组织模式类似于体内Col7蛋白预期的组织模式。
总的来说,这些实验首次揭示了复制缺陷型HSV-1载体可用作用于将COL7A1表达盒递送到从大疱性表皮松解症患者分离的原代细胞中的媒介物。此外,这些数据揭示了Col7蛋白可以在来自健康个体以及罹患皮肤病学病症的个体的两种不同人细胞类型中由该表达盒以高水平表达。最后,Col7蛋白被证明是功能性的,因为它能够增加LH3的表达、降低TSP-1的表达、增加与胶原1和纤连蛋白的细胞粘附,并且可以以类似于体内Col7的组织模式在器官型培养物中组织。不希望受理论束缚,本文提供的数据表明KB103和其他HSV-1载体可用作用于大疱性表皮松解症和/或其他皮肤病学应用的新型体内治疗策略。
实施例3:使用复制缺陷型HSV-1进行体内Col7表达
以下实施例描述了复制缺陷型1型单纯疱疹病毒(经修饰而含有人COL7A1转基因)作为用于体内人Col7蛋白表达的递送媒介物的用途。
方法
KB103的构建和纯化
如上文实施例2中所述构建和纯化KB103病毒。
病毒感染
如下通过皮内注射将KB103病毒递送至野生型Balb/c或skh1-elite小鼠:在动物侧腹区域内的2-4个部位对每只动物注射1x108个噬菌斑形成单位(PFU)的病毒/部位,体积为50μL。施用KB103后48小时处死动物,收获注射部位并进行处理以进行实时qPCR或免疫荧光分析。
对于qPCR分析,使用6mm钻取活组织检查工具将皮肤组织切开下至筋膜。将活检物分成两块,每块用液氮快速冷冻。使用Qiagen AllPrep DNA/RNA试剂盒从一半活检物中分离总RNA和DNA。
对于免疫荧光分析,在注射部位从皮肤切下直径约1cm的圆形区域,切成两半并置于OCT中,使得圆形区域的中心部分朝上。将制备的样品冷冻投入液氮冷却的异戊烷中,并在-80℃下储存。
mRNA定量
使用以下2步法方案,在注射KB103后从自小鼠皮肤组织分离的RNA扩增Col7转录物:1)使用superscript III First Strand Synthesis试剂盒(Thermofisher,Cat.#18-080-051)进行cDNA合成,以及2)根据制造商规程使用Quantitect Probe PCR试剂盒(Qiagen,Cat.#204345)进行qPCR扩增。在每个反应中使用100ng的cDNA。将Col7转录物水平标准化为GAPDH转录物水平。
基因组拷贝定量
使用Quantitect Probe PCR试剂盒(Qiagen Cat.#204345),通过qPCR扩增定量注射KB103的小鼠中KB103病毒基因组的拷贝数。在每个反应中使用100ng小鼠基因组DNA,并使用小鼠基因组GAPDH作为对照。
免疫荧光
将来自注射了KB103的小鼠的组织切片固定,随后用原代兔抗人Col7多克隆抗体(Sigma,Cat.#HPA042420)染色,洗涤,然后用荧光标记的抗兔二抗(Invitrogen,Cat.3A11012)进一步染色。使用标准技术用DAPI染色细胞核。
结果
为了测试KB103在体内成功递送和表达人Col7蛋白的能力,向小鼠皮内施用KB103病毒。评估感染的小鼠组织中的病毒基因组拷贝数,并在小鼠中观察到KB103病毒基因组的高水平递送(>1,000,000病毒基因组拷贝/100ng小鼠DNA)(图11)。接下来,检查病毒在体内表达人Col7的能力。与对照小鼠管家基因的表达相比,测量和评估了KB103感染的小鼠中人Col7转录物的定量。在感染的小鼠组织中观察到高水平的人Col7转录物(图11),这表明所递送的病毒基因组能够成功表达其人基因货物。最后,在感染的小鼠中测试KB103表达Col7蛋白的能力。感染后从小鼠切下小鼠皮肤组织,并通过对小鼠组织进行免疫组织化学染色来评估Col7蛋白表达。在组织染色后检测到高水平的人Col7蛋白(图12)。令人惊讶的是,不仅在小鼠真皮中KB103病毒表达人Col7蛋白,而且观察到在KB103感染的小鼠的基底膜区中人Col7开始沉积(图12)。不希望受理论束缚,此数据表明:1)KB103病毒可以成功地在体内感染相关组织,向这些组织组织提供高基因组拷贝数;2)将KB103病毒递送至相关组织使得编码的人基因在此病毒上显着表达;以及3)KB103不仅成功地在体内表达人Col7蛋白,而且此蛋白能够以某种方式开始组织(例如在基底膜区),这表明KB103能够拯救受影响个体的内源性Col7缺陷。
序列表
<110> Krystal Biotech, LLC
KRISHNAN, Suma
AGARWAL, Pooja
<120> 用于治疗皮肤的伤口、病症和疾病的组合物和方法
<130> 761342000140
<140> 尚未受让
<141> 2016-12-28
<150> US 62/320,316
<151> 2016-04-08
<160> 30
<170> FastSEQ for Windows 4.0版
<210> 1
<211> 8835
<212> DNA
<213> 智人
<400> 1
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg actga 8835
<210> 2
<211> 2944
<212> PRT
<213> 智人
<400> 2
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
<210> 3
<211> 2217
<212> DNA
<213> 智人
<400> 3
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga cccctga 2217
<210> 4
<211> 738
<212> PRT
<213> 智人
<400> 4
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro
<210> 5
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
agggccaaga ggggcagcgg cgagggcagg ggcagcctgc tgacctgcgg cgacgtggag 60
gagaaccccg gcccc 75
<210> 6
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
1 5 10 15
Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25
<210> 7
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 7
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66
<210> 8
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 8
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 9
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 9
ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60
cctggacct 69
<210> 10
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 10
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 11
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 11
ggaagcggag tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60
tccaaccctg gacct 75
<210> 12
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 12
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 13
<211> 11121
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 13
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg acagggccaa gaggggcagc ggcgagggca ggggcagcct gctgacctgc 8880
ggcgacgtgg aggagaaccc cggccccacc tcctcggggc ctggaccccg gttcctgctg 8940
ctgctgccgc tgctgctgcc ccctgcggcc tcagcctccg accggccccg gggccgagac 9000
ccggtcaacc cagagaagct gctggtgatc actgtggcca cagctgaaac cgaggggtac 9060
ctgcgtttcc tgcgctctgc ggagttcttc aactacactg tgcggaccct gggcctggga 9120
gaggagtggc gagggggtga tgtggctcga acagttggtg gaggacagaa ggtccggtgg 9180
ttaaagaagg aaatggagaa atacgctgac cgggaggata tgatcatcat gtttgtggat 9240
agctacgacg tgattctggc cggcagcccc acagagctgc tgaagaagtt cgtccagagt 9300
ggcagccgcc tgctcttctc tgcagagagc ttctgctggc ccgagtgggg gctggcggag 9360
cagtaccctg aggtgggcac ggggaagcgc ttcctcaatt ctggtggatt catcggtttt 9420
gccaccacca tccaccaaat cgtgcgccag tggaagtaca aggatgatga cgacgaccag 9480
ctgttctaca cacggctcta cctggaccca ggactgaggg agaaactcag ccttaatctg 9540
gatcataagt ctcggatctt tcagaacctc aacggggctt tagatgaagt ggttttaaag 9600
tttgatcgga accgtgtgcg tatccggaac gtggcctacg acacgctccc cattgtggtc 9660
catggaaacg gtcccactaa gctgcagctc aactacctgg gaaactacgt ccccaatggc 9720
tggactcctg agggaggctg tggcttctgc aaccaggacc ggaggacact cccggggggg 9780
cagcctcccc cccgggtgtt tctggccgtg tttgtggaac agcctactcc gtttctgccc 9840
cgcttcctgc agcggctgct actcctggac tatccccccg acagggtcac ccttttcctg 9900
cacaacaacg aggtcttcca tgaaccccac atcgctgact cctggccgca gctccaggac 9960
cacttctcag ctgtgaagct cgtggggccg gaggaggctc tgagcccagg cgaggccagg 10020
gacatggcca tggacctgtg tcggcaggac cccgagtgtg agttctactt cagcctggac 10080
gccgacgctg tcctcaccaa cctgcagacc ctgcgtatcc tcattgagga gaacaggaag 10140
gtgatcgccc ccatgctgtc ccgccacggc aagctgtggt ccaacttctg gggcgccctg 10200
agccccgatg agtactacgc ccgctccgag gactacgtgg agctggtgca gcggaagcga 10260
gtgggtgtgt ggaatgtacc atacatctcc caggcctatg tgatccgggg tgataccctg 10320
cggatggagc tgccccagag ggatgtgttc tcgggcagtg acacagaccc ggacatggcc 10380
ttctgtaaga gctttcgaga caagggcatc ttcctccatc tgagcaatca gcatgaattt 10440
ggccggctcc tggccacttc cagatacgac acggagcacc tgcaccccga cctctggcag 10500
atcttcgaca accccgtcga ctggaaggag cagtacatcc acgagaacta cagccgggcc 10560
ctggaagggg aaggaatcgt ggagcagcca tgcccggacg tgtactggtt cccactgctg 10620
tcagaacaaa tgtgtgatga gctggtggca gagatggagc actacggcca gtggtcaggc 10680
ggccggcatg aggattcaag gctggctgga ggctacgaga atgtgcccac cgtggacatc 10740
cacatgaagc aggtggggta cgaggaccag tggctgcagc tgctgcggac gtatgtgggc 10800
cccatgaccg agagcctgtt tcccggttac cacaccaagg cgcgggcggt gatgaacttt 10860
gtggttcgct accggccaga cgagcagccg tctctgcggc cacaccacga ctcatccacc 10920
ttcaccctca acgttgccct caaccacaag ggcctggact atgagggagg tggctgccgc 10980
ttcctgcgct acgactgtgt gatctcctcc ccgaggaagg gctgggcact cctgcacccc 11040
ggccgcctca cccactacca cgaggggctg ccaacgacct ggggcacacg ctacatcatg 11100
gtgtcctttg tcgacccctg a 11121
<210> 14
<211> 3706
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 14
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
2945 2950 2955 2960
Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro
2965 2970 2975
Arg Phe Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala
2980 2985 2990
Ser Asp Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu
2995 3000 3005
Val Ile Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu
3010 3015 3020
Arg Ser Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly
3025 3030 3035 3040
Glu Glu Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln
3045 3050 3055
Lys Val Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu
3060 3065 3070
Asp Met Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly
3075 3080 3085
Ser Pro Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu
3090 3095 3100
Leu Phe Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu
3105 3110 3115 3120
Gln Tyr Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly
3125 3130 3135
Phe Ile Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys
3140 3145 3150
Tyr Lys Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu
3155 3160 3165
Asp Pro Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser
3170 3175 3180
Arg Ile Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys
3185 3190 3195 3200
Phe Asp Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu
3205 3210 3215
Pro Ile Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr
3220 3225 3230
Leu Gly Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly
3235 3240 3245
Phe Cys Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro
3250 3255 3260
Arg Val Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro
3265 3270 3275 3280
Arg Phe Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val
3285 3290 3295
Thr Leu Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala
3300 3305 3310
Asp Ser Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val
3315 3320 3325
Gly Pro Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met
3330 3335 3340
Asp Leu Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp
3345 3350 3355 3360
Ala Asp Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu
3365 3370 3375
Glu Asn Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu
3380 3385 3390
Trp Ser Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg
3395 3400 3405
Ser Glu Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp
3410 3415 3420
Asn Val Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu
3425 3430 3435 3440
Arg Met Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp
3445 3450 3455
Pro Asp Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu
3460 3465 3470
His Leu Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg
3475 3480 3485
Tyr Asp Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn
3490 3495 3500
Pro Val Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala
3505 3510 3515 3520
Leu Glu Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp
3525 3530 3535
Phe Pro Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met
3540 3545 3550
Glu His Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu
3555 3560 3565
Ala Gly Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln
3570 3575 3580
Val Gly Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly
3585 3590 3595 3600
Pro Met Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala
3605 3610 3615
Val Met Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu
3620 3625 3630
Arg Pro His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn
3635 3640 3645
His Lys Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr
3650 3655 3660
Asp Cys Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro
3665 3670 3675 3680
Gly Arg Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr
3685 3690 3695
Arg Tyr Ile Met Val Ser Phe Val Asp Pro
3700 3705
<210> 15
<211> 11121
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 15
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccagggcc 2220
aagaggggca gcggcgaggg caggggcagc ctgctgacct gcggcgacgt ggaggagaac 2280
cccggcccca cgctgcggct tctggtggcc gcgctctgcg ccgggatcct ggcagaggcg 2340
ccccgagtgc gagcccagca cagggagaga gtgacctgca cgcgccttta cgccgctgac 2400
attgtgttct tactggatgg ctcctcatcc attggccgca gcaatttccg cgaggtccgc 2460
agctttctcg aagggctggt gctgcctttc tctggagcag ccagtgcaca gggtgtgcgc 2520
tttgccacag tgcagtacag cgatgaccca cggacagagt tcggcctgga tgcacttggc 2580
tctgggggtg atgtgatccg cgccatccgt gagcttagct acaagggggg caacactcgc 2640
acaggggctg caattctcca tgtggctgac catgtcttcc tgccccagct ggcccgacct 2700
ggtgtcccca aggtctgcat cctgatcaca gacgggaagt cccaggacct ggtggacaca 2760
gctgcccaaa ggctgaaggg gcagggggtc aagctatttg ctgtggggat caagaatgct 2820
gaccctgagg agctgaagcg agttgcctca cagcccacca gtgacttctt cttcttcgtc 2880
aatgacttca gcatcttgag gacactactg cccctcgttt cccggagagt gtgcacgact 2940
gctggtggcg tgcctgtgac ccgacctccg gatgactcga cctctgctcc acgagacctg 3000
gtgctgtctg agccaagcag ccaatccttg agagtacagt ggacagcggc cagtggccct 3060
gtgactggct acaaggtcca gtacactcct ctgacggggc tgggacagcc actgccgagt 3120
gagcggcagg aggtgaacgt cccagctggt gagaccagtg tgcggctgcg gggtctccgg 3180
ccactgaccg agtaccaagt gactgtgatt gccctctacg ccaacagcat cggggaggct 3240
gtgagcggga cagctcggac cactgcccta gaagggccgg aactgaccat ccagaatacc 3300
acagcccaca gcctcctggt ggcctggcgg agtgtgccag gtgccactgg ctaccgtgtg 3360
acatggcggg tcctcagtgg tgggcccaca cagcagcagg agctgggccc tgggcagggt 3420
tcagtgttgc tgcgtgactt ggagcctggc acggactatg aggtgaccgt gagcacccta 3480
tttggccgca gtgtggggcc cgccacttcc ctgatggctc gcactgacgc ttctgttgag 3540
cagaccctgc gcccggtcat cctgggcccc acatccatcc tcctttcctg gaacttggtg 3600
cctgaggccc gtggctaccg gttggaatgg cggcgtgaga ctggcttgga gccaccgcag 3660
aaggtggtac tgccctctga tgtgacccgc taccagttgg atgggctgca gccgggcact 3720
gagtaccgcc tcacactcta cactctgctg gagggccacg aggtggccac ccctgcaacc 3780
gtggttccca ctggaccaga gctgcctgtg agccctgtaa cagacctgca agccaccgag 3840
ctgcccgggc agcgggtgcg agtgtcctgg agcccagtcc ctggtgccac ccagtaccgc 3900
atcattgtgc gcagcaccca gggggttgag cggaccctgg tgcttcctgg gagtcagaca 3960
gcattcgact tggatgacgt tcaggctggg cttagctaca ctgtgcgggt gtctgctcga 4020
gtgggtcccc gtgagggcag tgccagtgtc ctcactgtcc gccgggagcc ggaaactcca 4080
cttgctgttc cagggctgcg ggttgtggtg tcagatgcaa cgcgagtgag ggtggcctgg 4140
ggacccgtcc ctggagccag tggatttcgg attagctgga gcacaggcag tggtccggag 4200
tccagccaga cactgccccc agactctact gccacagaca tcacagggct gcagcctgga 4260
accacctacc aggtggctgt gtcggtactg cgaggcagag aggagggccc tgctgcagtc 4320
atcgtggctc gaacggaccc actgggccca gtgaggacgg tccatgtgac tcaggccagc 4380
agctcatctg tcaccattac ctggaccagg gttcctggcg ccacaggata cagggtttcc 4440
tggcactcag cccacggccc agagaaatcc cagttggttt ctggggaggc cacggtggct 4500
gagctggatg gactggagcc agatactgag tatacggtgc atgtgagggc ccatgtggct 4560
ggcgtggatg ggccccctgc ctctgtggtt gtgaggactg cccctgagcc tgtgggtcgt 4620
gtgtcgaggc tgcagatcct caatgcttcc agcgacgttc tacggatcac ctgggtaggg 4680
gtcactggag ccacagctta cagactggcc tggggccgga gtgaaggcgg ccccatgagg 4740
caccagatac tcccaggaaa cacagactct gcagagatcc ggggtctcga aggtggagtc 4800
agctactcag tgcgagtgac tgcacttgtc ggggaccgcg agggcacacc tgtctccatt 4860
gttgtcacta cgccgcctga ggctccgcca gccctgggga cgcttcacgt ggtgcagcgc 4920
ggggagcact cgctgaggct gcgctgggag ccggtgccca gagcgcaggg cttccttctg 4980
cactggcaac ctgagggtgg ccaggaacag tcccgggtcc tggggcccga gctcagcagc 5040
tatcacctgg acgggctgga gccagcgaca cagtaccgcg tgaggctgag tgtcctaggg 5100
ccagctggag aagggccctc tgcagaggtg actgcgcgca ctgagtcacc tcgtgttcca 5160
agcattgaac tacgtgtggt ggacacctcg atcgactcgg tgactttggc ctggactcca 5220
gtgtccaggg catccagcta catcctatcc tggcggccac tcagaggccc tggccaggaa 5280
gtgcctgggt ccccgcagac acttccaggg atctcaagct cccagcgggt gacagggcta 5340
gagcctggcg tctcttacat cttctccctg acgcctgtcc tggatggtgt gcggggtcct 5400
gaggcatctg tcacacagac gccagtgtgc ccccgtggcc tggcggatgt ggtgttccta 5460
ccacatgcca ctcaagacaa tgctcaccgt gcggaggcta cgaggagggt cctggagcgt 5520
ctggtgttgg cacttgggcc tcttgggcca caggcagttc aggttggcct gctgtcttac 5580
agtcatcggc cctccccact gttcccactg aatggctccc atgaccttgg cattatcttg 5640
caaaggatcc gtgacatgcc ctacatggac ccaagtggga acaacctggg cacagccgtg 5700
gtcacagctc acagatacat gttggcacca gatgctcctg ggcgccgcca gcacgtacca 5760
ggggtgatgg ttctgctagt ggatgaaccc ttgagaggtg acatattcag ccccatccgt 5820
gaggcccagg cttctgggct taatgtggtg atgttgggaa tggctggagc ggacccagag 5880
cagctgcgtc gcttggcgcc gggtatggac tctgtccaga ccttcttcgc cgtggatgat 5940
gggccaagcc tggaccaggc agtcagtggt ctggccacag ccctgtgtca ggcatccttc 6000
actactcagc cccggccaga gccctgccca gtgtattgtc caaagggcca gaagggggaa 6060
cctggagaga tgggcctgag aggacaagtt gggcctcctg gcgaccctgg cctcccgggc 6120
aggaccggtg ctcccggccc ccaggggccc cctggaagtg ccactgccaa gggcgagagg 6180
ggcttccctg gagcagatgg gcgtccaggc agccctggcc gcgccgggaa tcctgggacc 6240
cctggagccc ctggcctaaa gggctctcca gggttgcctg gccctcgtgg ggacccggga 6300
gagcgaggac ctcgaggccc aaagggggag ccgggggctc ccggacaagt catcggaggt 6360
gaaggacctg ggcttcctgg gcggaaaggg gaccctggac catcgggccc ccctggacct 6420
cgtggaccac tgggggaccc aggaccccgt ggccccccag ggcttcctgg aacagccatg 6480
aagggtgaca aaggcgatcg tggggagcgg ggtccccctg gaccaggtga aggtggcatt 6540
gctcctgggg agcctgggct gccgggtctt cccggaagcc ctggacccca aggccccgtt 6600
ggcccccctg gaaagaaagg agaaaaaggt gactctgagg atggagctcc aggcctccca 6660
ggacaacctg ggtctccggg tgagcagggc ccacggggac ctcctggagc tattggcccc 6720
aaaggtgacc ggggctttcc agggcccctg ggtgaggctg gagagaaggg cgaacgtgga 6780
cccccaggcc cagcgggatc ccgggggctg ccaggggttg ctggacgtcc tggagccaag 6840
ggtcctgaag ggccaccagg acccactggc cgccaaggag agaaggggga gcctggtcgc 6900
cctggggacc ctgcagtggt gggacctgct gttgctggac ccaaaggaga aaagggagat 6960
gtggggcccg ctgggcccag aggagctacc ggagtccaag gggaacgggg cccacccggc 7020
ttggttcttc ctggagaccc tggccccaag ggagaccctg gagaccgggg tcccattggc 7080
cttactggca gagcaggacc cccaggtgac tcagggcctc ctggagagaa gggagaccct 7140
gggcggcctg gccccccagg acctgttggc ccccgaggac gagatggtga agttggagag 7200
aaaggtgacg agggtcctcc gggtgacccg ggtttgcctg gaaaagcagg cgagcgtggc 7260
cttcgggggg cacctggagt tcgggggcct gtgggtgaaa agggagacca gggagatcct 7320
ggagaggatg gacgaaatgg cagccctgga tcatctggac ccaagggtga ccgtggggag 7380
ccgggtcccc caggaccccc gggacggctg gtagacacag gacctggagc cagagagaag 7440
ggagagcctg gggaccgcgg acaagagggt cctcgagggc ccaagggtga tcctggcctc 7500
cctggagccc ctggggaaag gggcattgaa gggtttcggg gacccccagg cccacagggg 7560
gacccaggtg tccgaggccc agcaggagaa aagggtgacc ggggtccccc tgggctggat 7620
ggccggagcg gactggatgg gaaaccagga gccgctgggc cctctgggcc gaatggtgct 7680
gcaggcaaag ctggggaccc agggagagac gggcttccag gcctccgtgg agaacagggc 7740
ctccctggcc cctctggtcc ccctggatta ccgggaaagc caggcgagga tggcaaacct 7800
ggcctgaatg gaaaaaacgg agaacctggg gaccctggag aagacgggag gaagggagag 7860
aaaggagatt caggcgcctc tgggagagaa ggtcgtgatg gccccaaggg tgagcgtgga 7920
gctcctggta tccttggacc ccaggggcct ccaggcctcc cagggccagt gggccctcct 7980
ggccagggtt ttcctggtgt cccaggaggc acgggcccca agggtgaccg tggggagact 8040
ggatccaaag gggagcaggg cctccctgga gagcgtggcc tgcgaggaga gcctggaagt 8100
gtgccgaatg tggatcggtt gctggaaact gctggcatca aggcatctgc cctgcgggag 8160
atcgtggaga cctgggatga gagctctggt agcttcctgc ctgtgcccga acggcgtcga 8220
ggccccaagg gggactcagg cgaacagggc cccccaggca aggagggccc catcggcttt 8280
cctggagaac gcgggctgaa gggcgaccgt ggagaccctg gccctcaggg gccacctggt 8340
ctggcccttg gggagagggg cccccccggg ccttccggcc ttgccgggga gcctggaaag 8400
cctggtattc ccgggctccc aggcagggct gggggtgtgg gagaggcagg aaggccagga 8460
gagaggggag aacggggaga gaaaggagaa cgtggagaac agggcagaga tggccctcct 8520
ggactccctg gaacccctgg gccccccgga ccccctggcc ccaaggtgtc tgtggatgag 8580
ccaggtcctg gactctctgg agaacaggga ccccctggac tcaagggtgc taagggggag 8640
ccgggcagca atggtgacca aggtcccaaa ggagacaggg gtgtgccagg catcaaagga 8700
gaccggggag agcctggacc gaggggtcag gacggcaacc cgggtctacc aggagagcgt 8760
ggtatggctg ggcctgaagg gaagccgggt ctgcagggtc caagaggccc ccctggccca 8820
gtgggtggtc atggagaccc tggaccacct ggtgccccgg gtcttgctgg ccctgcagga 8880
ccccaaggac cttctggcct gaagggggag cctggagaga caggacctcc aggacggggc 8940
ctgactggac ctactggagc tgtgggactt cctggacccc ccggcccttc aggccttgtg 9000
ggtccacagg ggtctccagg tttgcctgga caagtggggg agacagggaa gccgggagcc 9060
ccaggtcgag atggtgccag tggaaaagat ggagacagag ggagccctgg tgtgccaggg 9120
tcaccaggtc tgcctggccc tgtcggacct aaaggagaac ctggccccac gggggcccct 9180
ggacaggctg tggtcgggct ccctggagca aagggagaga agggagcccc tggaggcctt 9240
gctggagacc tggtgggtga gccgggagcc aaaggtgacc gaggactgcc agggccgcga 9300
ggcgagaagg gtgaagctgg ccgtgcaggg gagcccggag accctgggga agatggtcag 9360
aaaggggctc caggacccaa aggtttcaag ggtgacccag gagtcggggt cccgggctcc 9420
cctgggcctc ctggccctcc aggtgtgaag ggagatctgg gcctccctgg cctgcccggt 9480
gctcctggtg ttgttgggtt cccgggtcag acaggccctc gaggagagat gggtcagcca 9540
ggccctagtg gagagcgggg tctggcaggc cccccaggga gagaaggaat cccaggaccc 9600
ctggggccac ctggaccacc ggggtcagtg ggaccacctg gggcctctgg actcaaagga 9660
gacaagggag accctggagt agggctgcct gggccccgag gcgagcgtgg ggagccaggc 9720
atccggggtg aagatggccg ccccggccag gagggacccc gaggactcac ggggccccct 9780
ggcagcaggg gagagcgtgg ggagaagggt gatgttggga gtgcaggact aaagggtgac 9840
aagggagact cagctgtgat cctggggcct ccaggcccac ggggtgccaa gggggacatg 9900
ggtgaacgag ggcctcgggg cttggatggt gacaaaggac ctcggggaga caatggggac 9960
cctggtgaca agggcagcaa gggagagcct ggtgacaagg gctcagccgg gttgccagga 10020
ctgcgtggac tcctgggacc ccagggtcaa cctggtgcag cagggatccc tggtgacccg 10080
ggatccccag gaaaggatgg agtgcctggt atccgaggag aaaaaggaga tgttggcttc 10140
atgggtcccc ggggcctcaa gggtgaacgg ggagtgaagg gagcctgtgg ccttgatgga 10200
gagaagggag acaagggaga agctggtccc ccaggccgcc ccgggctggc aggacacaaa 10260
ggagagatgg gggagcctgg tgtgccgggc cagtcggggg cccctggcaa ggagggcctg 10320
atcggtccca agggtgaccg aggctttgac gggcagccag gccccaaggg tgaccagggc 10380
gagaaagggg agcggggaac cccaggaatt gggggcttcc caggccccag tggaaatgat 10440
ggctctgctg gtcccccagg gccacctggc agtgttggtc ccagaggccc cgaaggactt 10500
cagggccaga agggtgagcg aggtcccccc ggagagagag tggtgggggc tcctggggtc 10560
cctggagctc ctggcgagag aggggagcag gggcggccag ggcctgccgg tcctcgaggc 10620
gagaagggag aagctgcact gacggaggat gacatccggg gctttgtgcg ccaagagatg 10680
agtcagcact gtgcctgcca gggccagttc atcgcatctg gatcacgacc cctccctagt 10740
tatgctgcag acactgccgg ctcccagctc catgctgtgc ctgtgctccg cgtctctcat 10800
gcagaggagg aagagcgggt accccctgag gatgatgagt actctgaata ctccgagtat 10860
tctgtggagg agtaccagga ccctgaagct ccttgggata gtgatgaccc ctgttccctg 10920
ccactggatg agggctcctg cactgcctac accctgcgct ggtaccatcg ggctgtgaca 10980
ggcagcacag aggcctgtca cccttttgtc tatggtggct gtggagggaa tgccaaccgt 11040
tttgggaccc gtgaggcctg cgagcgccgc tgcccacccc gggtggtcca gagccagggg 11100
acaggtactg cccaggactg a 11121
<210> 16
<211> 3706
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 16
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu
740 745 750
Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Leu Arg Leu Leu
755 760 765
Val Ala Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg
770 775 780
Ala Gln His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp
785 790 795 800
Ile Val Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe
805 810 815
Arg Glu Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly
820 825 830
Ala Ala Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp
835 840 845
Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp
850 855 860
Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg
865 870 875 880
Thr Gly Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln
885 890 895
Leu Ala Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly
900 905 910
Lys Ser Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln
915 920 925
Gly Val Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu
930 935 940
Leu Lys Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val
945 950 955 960
Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg
965 970 975
Val Cys Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp
980 985 990
Ser Thr Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln
995 1000 1005
Ser Leu Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr
1010 1015 1020
Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser
1025 1030 1035 1040
Glu Arg Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu
1045 1050 1055
Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu
1060 1065 1070
Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr
1075 1080 1085
Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser
1090 1095 1100
Leu Leu Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val
1105 1110 1115 1120
Thr Trp Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly
1125 1130 1135
Pro Gly Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp
1140 1145 1150
Tyr Glu Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala
1155 1160 1165
Thr Ser Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg
1170 1175 1180
Pro Val Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val
1185 1190 1195 1200
Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu
1205 1210 1215
Glu Pro Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln
1220 1225 1230
Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr
1235 1240 1245
Leu Leu Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr
1250 1255 1260
Gly Pro Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu
1265 1270 1275 1280
Leu Pro Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala
1285 1290 1295
Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr
1300 1305 1310
Leu Val Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln
1315 1320 1325
Ala Gly Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg
1330 1335 1340
Glu Gly Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro
1345 1350 1355 1360
Leu Ala Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val
1365 1370 1375
Arg Val Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser
1380 1385 1390
Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp
1395 1400 1405
Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln
1410 1415 1420
Val Ala Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val
1425 1430 1435 1440
Ile Val Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val
1445 1450 1455
Thr Gln Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro
1460 1465 1470
Gly Ala Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu
1475 1480 1485
Lys Ser Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly
1490 1495 1500
Leu Glu Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala
1505 1510 1515 1520
Gly Val Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu
1525 1530 1535
Pro Val Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp
1540 1545 1550
Val Leu Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg
1555 1560 1565
Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu
1570 1575 1580
Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val
1585 1590 1595 1600
Ser Tyr Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr
1605 1610 1615
Pro Val Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu
1620 1625 1630
Gly Thr Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg
1635 1640 1645
Trp Glu Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro
1650 1655 1660
Glu Gly Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser
1665 1670 1675 1680
Tyr His Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu
1685 1690 1695
Ser Val Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala
1700 1705 1710
Arg Thr Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp
1715 1720 1725
Thr Ser Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala
1730 1735 1740
Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu
1745 1750 1755 1760
Val Pro Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg
1765 1770 1775
Val Thr Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro
1780 1785 1790
Val Leu Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro
1795 1800 1805
Val Cys Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr
1810 1815 1820
Gln Asp Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg
1825 1830 1835 1840
Leu Val Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly
1845 1850 1855
Leu Leu Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly
1860 1865 1870
Ser His Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr
1875 1880 1885
Met Asp Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His
1890 1895 1900
Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro
1905 1910 1915 1920
Gly Val Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe
1925 1930 1935
Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu
1940 1945 1950
Gly Met Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly
1955 1960 1965
Met Asp Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu
1970 1975 1980
Asp Gln Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe
1985 1990 1995 2000
Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly
2005 2010 2015
Gln Lys Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro
2020 2025 2030
Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln
2035 2040 2045
Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly
2050 2055 2060
Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr
2065 2070 2075 2080
Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg
2085 2090 2095
Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly
2100 2105 2110
Ala Pro Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg
2115 2120 2125
Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu
2130 2135 2140
Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met
2145 2150 2155 2160
Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly
2165 2170 2175
Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly
2180 2185 2190
Ser Pro Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu
2195 2200 2205
Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly
2210 2215 2220
Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro
2225 2230 2235 2240
Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys
2245 2250 2255
Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly
2260 2265 2270
Val Ala Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro
2275 2280 2285
Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro
2290 2295 2300
Ala Val Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp
2305 2310 2315 2320
Val Gly Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg
2325 2330 2335
Gly Pro Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp
2340 2345 2350
Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro
2355 2360 2365
Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly
2370 2375 2380
Pro Pro Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu
2385 2390 2395 2400
Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala
2405 2410 2415
Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly
2420 2425 2430
Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser
2435 2440 2445
Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro
2450 2455 2460
Gly Pro Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys
2465 2470 2475 2480
Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly
2485 2490 2495
Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe
2500 2505 2510
Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala
2515 2520 2525
Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly
2530 2535 2540
Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala
2545 2550 2555 2560
Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg
2565 2570 2575
Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly
2580 2585 2590
Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu
2595 2600 2605
Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser
2610 2615 2620
Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly
2625 2630 2635 2640
Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro
2645 2650 2655
Val Gly Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly
2660 2665 2670
Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu
2675 2680 2685
Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val
2690 2695 2700
Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu
2705 2710 2715 2720
Ile Val Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro
2725 2730 2735
Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro
2740 2745 2750
Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly
2755 2760 2765
Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly
2770 2775 2780
Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys
2785 2790 2795 2800
Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala
2805 2810 2815
Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly
2820 2825 2830
Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro
2835 2840 2845
Pro Gly Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly
2850 2855 2860
Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu
2865 2870 2875 2880
Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro
2885 2890 2895
Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly
2900 2905 2910
Asn Pro Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys
2915 2920 2925
Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His
2930 2935 2940
Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly
2945 2950 2955 2960
Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro
2965 2970 2975
Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly
2980 2985 2990
Pro Pro Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu
2995 3000 3005
Pro Gly Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp
3010 3015 3020
Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly
3025 3030 3035 3040
Ser Pro Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro
3045 3050 3055
Thr Gly Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly
3060 3065 3070
Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro
3075 3080 3085
Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly
3090 3095 3100
Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln
3105 3110 3115 3120
Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly
3125 3130 3135
Val Pro Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp
3140 3145 3150
Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro
3155 3160 3165
Gly Gln Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly
3170 3175 3180
Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro
3185 3190 3195 3200
Leu Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser
3205 3210 3215
Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro
3220 3225 3230
Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro
3235 3240 3245
Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly
3250 3255 3 260
Glu Arg Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp
3265 3270 3275 3280
Lys Gly Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala
3285 3290 3295
Lys Gly Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys
3300 3305 3310
Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly
3315 3320 3325
Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu
3330 3335 3340
Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro
3345 3350 3355 3360
Gly Ser Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly
3365 3370 3375
Asp Val Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val
3380 3385 3390
Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala
3395 3400 3405
Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly
3410 3415 3420
Glu Pro Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu
3425 3430 3435 3440
Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys
3445 3450 3455
Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly
3460 3465 3470
Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro
3475 3480 3485
Pro Gly Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys
3490 3495 3500
Gly Glu Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val
3505 3510 3515 3520
Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala
3525 3530 3535
Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile
3540 3545 3550
Arg Gly Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly
3555 3560 3565
Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp
3570 3575 3580
Thr Ala Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His
3585 3590 3595 3600
Ala Glu Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu
3605 3610 3615
Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp
3620 3625 3630
Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr
3635 3640 3645
Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu
3650 3655 3660
Ala Cys His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg
3665 3670 3675 3680
Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val
3685 3690 3695
Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
3700 3705
<210> 17
<211> 11112
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 17
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg acggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 8880
gaggagaacc ctggacctac ctcctcgggg cctggacccc ggttcctgct gctgctgccg 8940
ctgctgctgc cccctgcggc ctcagcctcc gaccggcccc ggggccgaga cccggtcaac 9000
ccagagaagc tgctggtgat cactgtggcc acagctgaaa ccgaggggta cctgcgtttc 9060
ctgcgctctg cggagttctt caactacact gtgcggaccc tgggcctggg agaggagtgg 9120
cgagggggtg atgtggctcg aacagttggt ggaggacaga aggtccggtg gttaaagaag 9180
gaaatggaga aatacgctga ccgggaggat atgatcatca tgtttgtgga tagctacgac 9240
gtgattctgg ccggcagccc cacagagctg ctgaagaagt tcgtccagag tggcagccgc 9300
ctgctcttct ctgcagagag cttctgctgg cccgagtggg ggctggcgga gcagtaccct 9360
gaggtgggca cggggaagcg cttcctcaat tctggtggat tcatcggttt tgccaccacc 9420
atccaccaaa tcgtgcgcca gtggaagtac aaggatgatg acgacgacca gctgttctac 9480
acacggctct acctggaccc aggactgagg gagaaactca gccttaatct ggatcataag 9540
tctcggatct ttcagaacct caacggggct ttagatgaag tggttttaaa gtttgatcgg 9600
aaccgtgtgc gtatccggaa cgtggcctac gacacgctcc ccattgtggt ccatggaaac 9660
ggtcccacta agctgcagct caactacctg ggaaactacg tccccaatgg ctggactcct 9720
gagggaggct gtggcttctg caaccaggac cggaggacac tcccgggggg gcagcctccc 9780
ccccgggtgt ttctggccgt gtttgtggaa cagcctactc cgtttctgcc ccgcttcctg 9840
cagcggctgc tactcctgga ctatcccccc gacagggtca cccttttcct gcacaacaac 9900
gaggtcttcc atgaacccca catcgctgac tcctggccgc agctccagga ccacttctca 9960
gctgtgaagc tcgtggggcc ggaggaggct ctgagcccag gcgaggccag ggacatggcc 10020
atggacctgt gtcggcagga ccccgagtgt gagttctact tcagcctgga cgccgacgct 10080
gtcctcacca acctgcagac cctgcgtatc ctcattgagg agaacaggaa ggtgatcgcc 10140
cccatgctgt cccgccacgg caagctgtgg tccaacttct ggggcgccct gagccccgat 10200
gagtactacg cccgctccga ggactacgtg gagctggtgc agcggaagcg agtgggtgtg 10260
tggaatgtac catacatctc ccaggcctat gtgatccggg gtgataccct gcggatggag 10320
ctgccccaga gggatgtgtt ctcgggcagt gacacagacc cggacatggc cttctgtaag 10380
agctttcgag acaagggcat cttcctccat ctgagcaatc agcatgaatt tggccggctc 10440
ctggccactt ccagatacga cacggagcac ctgcaccccg acctctggca gatcttcgac 10500
aaccccgtcg actggaagga gcagtacatc cacgagaact acagccgggc cctggaaggg 10560
gaaggaatcg tggagcagcc atgcccggac gtgtactggt tcccactgct gtcagaacaa 10620
atgtgtgatg agctggtggc agagatggag cactacggcc agtggtcagg cggccggcat 10680
gaggattcaa ggctggctgg aggctacgag aatgtgccca ccgtggacat ccacatgaag 10740
caggtggggt acgaggacca gtggctgcag ctgctgcgga cgtatgtggg ccccatgacc 10800
gagagcctgt ttcccggtta ccacaccaag gcgcgggcgg tgatgaactt tgtggttcgc 10860
taccggccag acgagcagcc gtctctgcgg ccacaccacg actcatccac cttcaccctc 10920
aacgttgccc tcaaccacaa gggcctggac tatgagggag gtggctgccg cttcctgcgc 10980
tacgactgtg tgatctcctc cccgaggaag ggctgggcac tcctgcaccc cggccgcctc 11040
acccactacc acgaggggct gccaacgacc tggggcacac gctacatcat ggtgtccttt 11100
gtcgacccct ga 11112
<210> 18
<211> 3703
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 18
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
2945 2950 2955 2960
Glu Glu Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu
2965 2970 2975
Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg
2980 2985 2990
Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr
2995 3000 3005
Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala
3010 3015 3020
Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp
3025 3030 3035 3040
Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg
3045 3050 3055
Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile
3060 3065 3070
Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr
3075 3080 3085
Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser
3090 3095 3100
Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro
3105 3110 3115 3120
Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly
3125 3130 3135
Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp
3140 3145 3150
Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly
3155 3160 3165
Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe
3170 3175 3180
Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg
3185 3190 3195 3200
Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val
3205 3210 3215
Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn
3220 3225 3230
Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn
3235 3240 3245
Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe
3250 3255 3260
Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu
3265 3270 3275 3280
Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe
3285 3290 3295
Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala Asp Ser Trp
3300 3305 3310
Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val Gly Pro Glu
3315 3320 3325
Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys
3330 3335 3340
Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala
3345 3350 3355 3360
Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg
3365 3370 3375
Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn
3380 3385 3390
Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp
3395 3400 3405
Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro
3410 3415 3420
Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu
3425 3430 3435 3440
Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met
3445 3450 3455
Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser
3460 3465 3470
Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr
3475 3480 3485
Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp
3490 3495 3500
Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly
3505 3510 3515 3520
Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu
3525 3530 3535
Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr
3540 3545 3550
Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly
3555 3560 3565
Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln Val Gly Tyr
3570 3575 3580
Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr
3585 3590 3595 3600
Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn
3605 3610 3615
Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His
3620 3625 3630
His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly
3635 3640 3645
Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val
3650 3655 3660
Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu
3665 3670 3675 3680
Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile
3685 3690 3695
Met Val Ser Phe Val Asp Pro
3700
<210> 19
<211> 11112
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 19
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220
ggagctacta acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct 2280
acgctgcggc ttctggtggc cgcgctctgc gccgggatcc tggcagaggc gccccgagtg 2340
cgagcccagc acagggagag agtgacctgc acgcgccttt acgccgctga cattgtgttc 2400
ttactggatg gctcctcatc cattggccgc agcaatttcc gcgaggtccg cagctttctc 2460
gaagggctgg tgctgccttt ctctggagca gccagtgcac agggtgtgcg ctttgccaca 2520
gtgcagtaca gcgatgaccc acggacagag ttcggcctgg atgcacttgg ctctgggggt 2580
gatgtgatcc gcgccatccg tgagcttagc tacaaggggg gcaacactcg cacaggggct 2640
gcaattctcc atgtggctga ccatgtcttc ctgccccagc tggcccgacc tggtgtcccc 2700
aaggtctgca tcctgatcac agacgggaag tcccaggacc tggtggacac agctgcccaa 2760
aggctgaagg ggcagggggt caagctattt gctgtgggga tcaagaatgc tgaccctgag 2820
gagctgaagc gagttgcctc acagcccacc agtgacttct tcttcttcgt caatgacttc 2880
agcatcttga ggacactact gcccctcgtt tcccggagag tgtgcacgac tgctggtggc 2940
gtgcctgtga cccgacctcc ggatgactcg acctctgctc cacgagacct ggtgctgtct 3000
gagccaagca gccaatcctt gagagtacag tggacagcgg ccagtggccc tgtgactggc 3060
tacaaggtcc agtacactcc tctgacgggg ctgggacagc cactgccgag tgagcggcag 3120
gaggtgaacg tcccagctgg tgagaccagt gtgcggctgc ggggtctccg gccactgacc 3180
gagtaccaag tgactgtgat tgccctctac gccaacagca tcggggaggc tgtgagcggg 3240
acagctcgga ccactgccct agaagggccg gaactgacca tccagaatac cacagcccac 3300
agcctcctgg tggcctggcg gagtgtgcca ggtgccactg gctaccgtgt gacatggcgg 3360
gtcctcagtg gtgggcccac acagcagcag gagctgggcc ctgggcaggg ttcagtgttg 3420
ctgcgtgact tggagcctgg cacggactat gaggtgaccg tgagcaccct atttggccgc 3480
agtgtggggc ccgccacttc cctgatggct cgcactgacg cttctgttga gcagaccctg 3540
cgcccggtca tcctgggccc cacatccatc ctcctttcct ggaacttggt gcctgaggcc 3600
cgtggctacc ggttggaatg gcggcgtgag actggcttgg agccaccgca gaaggtggta 3660
ctgccctctg atgtgacccg ctaccagttg gatgggctgc agccgggcac tgagtaccgc 3720
ctcacactct acactctgct ggagggccac gaggtggcca cccctgcaac cgtggttccc 3780
actggaccag agctgcctgt gagccctgta acagacctgc aagccaccga gctgcccggg 3840
cagcgggtgc gagtgtcctg gagcccagtc cctggtgcca cccagtaccg catcattgtg 3900
cgcagcaccc agggggttga gcggaccctg gtgcttcctg ggagtcagac agcattcgac 3960
ttggatgacg ttcaggctgg gcttagctac actgtgcggg tgtctgctcg agtgggtccc 4020
cgtgagggca gtgccagtgt cctcactgtc cgccgggagc cggaaactcc acttgctgtt 4080
ccagggctgc gggttgtggt gtcagatgca acgcgagtga gggtggcctg gggacccgtc 4140
cctggagcca gtggatttcg gattagctgg agcacaggca gtggtccgga gtccagccag 4200
acactgcccc cagactctac tgccacagac atcacagggc tgcagcctgg aaccacctac 4260
caggtggctg tgtcggtact gcgaggcaga gaggagggcc ctgctgcagt catcgtggct 4320
cgaacggacc cactgggccc agtgaggacg gtccatgtga ctcaggccag cagctcatct 4380
gtcaccatta cctggaccag ggttcctggc gccacaggat acagggtttc ctggcactca 4440
gcccacggcc cagagaaatc ccagttggtt tctggggagg ccacggtggc tgagctggat 4500
ggactggagc cagatactga gtatacggtg catgtgaggg cccatgtggc tggcgtggat 4560
gggccccctg cctctgtggt tgtgaggact gcccctgagc ctgtgggtcg tgtgtcgagg 4620
ctgcagatcc tcaatgcttc cagcgacgtt ctacggatca cctgggtagg ggtcactgga 4680
gccacagctt acagactggc ctggggccgg agtgaaggcg gccccatgag gcaccagata 4740
ctcccaggaa acacagactc tgcagagatc cggggtctcg aaggtggagt cagctactca 4800
gtgcgagtga ctgcacttgt cggggaccgc gagggcacac ctgtctccat tgttgtcact 4860
acgccgcctg aggctccgcc agccctgggg acgcttcacg tggtgcagcg cggggagcac 4920
tcgctgaggc tgcgctggga gccggtgccc agagcgcagg gcttccttct gcactggcaa 4980
cctgagggtg gccaggaaca gtcccgggtc ctggggcccg agctcagcag ctatcacctg 5040
gacgggctgg agccagcgac acagtaccgc gtgaggctga gtgtcctagg gccagctgga 5100
gaagggccct ctgcagaggt gactgcgcgc actgagtcac ctcgtgttcc aagcattgaa 5160
ctacgtgtgg tggacacctc gatcgactcg gtgactttgg cctggactcc agtgtccagg 5220
gcatccagct acatcctatc ctggcggcca ctcagaggcc ctggccagga agtgcctggg 5280
tccccgcaga cacttccagg gatctcaagc tcccagcggg tgacagggct agagcctggc 5340
gtctcttaca tcttctccct gacgcctgtc ctggatggtg tgcggggtcc tgaggcatct 5400
gtcacacaga cgccagtgtg cccccgtggc ctggcggatg tggtgttcct accacatgcc 5460
actcaagaca atgctcaccg tgcggaggct acgaggaggg tcctggagcg tctggtgttg 5520
gcacttgggc ctcttgggcc acaggcagtt caggttggcc tgctgtctta cagtcatcgg 5580
ccctccccac tgttcccact gaatggctcc catgaccttg gcattatctt gcaaaggatc 5640
cgtgacatgc cctacatgga cccaagtggg aacaacctgg gcacagccgt ggtcacagct 5700
cacagataca tgttggcacc agatgctcct gggcgccgcc agcacgtacc aggggtgatg 5760
gttctgctag tggatgaacc cttgagaggt gacatattca gccccatccg tgaggcccag 5820
gcttctgggc ttaatgtggt gatgttggga atggctggag cggacccaga gcagctgcgt 5880
cgcttggcgc cgggtatgga ctctgtccag accttcttcg ccgtggatga tgggccaagc 5940
ctggaccagg cagtcagtgg tctggccaca gccctgtgtc aggcatcctt cactactcag 6000
ccccggccag agccctgccc agtgtattgt ccaaagggcc agaaggggga acctggagag 6060
atgggcctga gaggacaagt tgggcctcct ggcgaccctg gcctcccggg caggaccggt 6120
gctcccggcc cccaggggcc ccctggaagt gccactgcca agggcgagag gggcttccct 6180
ggagcagatg ggcgtccagg cagccctggc cgcgccggga atcctgggac ccctggagcc 6240
cctggcctaa agggctctcc agggttgcct ggccctcgtg gggacccggg agagcgagga 6300
cctcgaggcc caaaggggga gccgggggct cccggacaag tcatcggagg tgaaggacct 6360
gggcttcctg ggcggaaagg ggaccctgga ccatcgggcc cccctggacc tcgtggacca 6420
ctgggggacc caggaccccg tggcccccca gggcttcctg gaacagccat gaagggtgac 6480
aaaggcgatc gtggggagcg gggtccccct ggaccaggtg aaggtggcat tgctcctggg 6540
gagcctgggc tgccgggtct tcccggaagc cctggacccc aaggccccgt tggcccccct 6600
ggaaagaaag gagaaaaagg tgactctgag gatggagctc caggcctccc aggacaacct 6660
gggtctccgg gtgagcaggg cccacgggga cctcctggag ctattggccc caaaggtgac 6720
cggggctttc cagggcccct gggtgaggct ggagagaagg gcgaacgtgg acccccaggc 6780
ccagcgggat cccgggggct gccaggggtt gctggacgtc ctggagccaa gggtcctgaa 6840
gggccaccag gacccactgg ccgccaagga gagaaggggg agcctggtcg ccctggggac 6900
cctgcagtgg tgggacctgc tgttgctgga cccaaaggag aaaagggaga tgtggggccc 6960
gctgggccca gaggagctac cggagtccaa ggggaacggg gcccacccgg cttggttctt 7020
cctggagacc ctggccccaa gggagaccct ggagaccggg gtcccattgg ccttactggc 7080
agagcaggac ccccaggtga ctcagggcct cctggagaga agggagaccc tgggcggcct 7140
ggccccccag gacctgttgg cccccgagga cgagatggtg aagttggaga gaaaggtgac 7200
gagggtcctc cgggtgaccc gggtttgcct ggaaaagcag gcgagcgtgg ccttcggggg 7260
gcacctggag ttcgggggcc tgtgggtgaa aagggagacc agggagatcc tggagaggat 7320
ggacgaaatg gcagccctgg atcatctgga cccaagggtg accgtgggga gccgggtccc 7380
ccaggacccc cgggacggct ggtagacaca ggacctggag ccagagagaa gggagagcct 7440
ggggaccgcg gacaagaggg tcctcgaggg cccaagggtg atcctggcct ccctggagcc 7500
cctggggaaa ggggcattga agggtttcgg ggacccccag gcccacaggg ggacccaggt 7560
gtccgaggcc cagcaggaga aaagggtgac cggggtcccc ctgggctgga tggccggagc 7620
ggactggatg ggaaaccagg agccgctggg ccctctgggc cgaatggtgc tgcaggcaaa 7680
gctggggacc cagggagaga cgggcttcca ggcctccgtg gagaacaggg cctccctggc 7740
ccctctggtc cccctggatt accgggaaag ccaggcgagg atggcaaacc tggcctgaat 7800
ggaaaaaacg gagaacctgg ggaccctgga gaagacggga ggaagggaga gaaaggagat 7860
tcaggcgcct ctgggagaga aggtcgtgat ggccccaagg gtgagcgtgg agctcctggt 7920
atccttggac cccaggggcc tccaggcctc ccagggccag tgggccctcc tggccagggt 7980
tttcctggtg tcccaggagg cacgggcccc aagggtgacc gtggggagac tggatccaaa 8040
ggggagcagg gcctccctgg agagcgtggc ctgcgaggag agcctggaag tgtgccgaat 8100
gtggatcggt tgctggaaac tgctggcatc aaggcatctg ccctgcggga gatcgtggag 8160
acctgggatg agagctctgg tagcttcctg cctgtgcccg aacggcgtcg aggccccaag 8220
ggggactcag gcgaacaggg ccccccaggc aaggagggcc ccatcggctt tcctggagaa 8280
cgcgggctga agggcgaccg tggagaccct ggccctcagg ggccacctgg tctggccctt 8340
ggggagaggg gcccccccgg gccttccggc cttgccgggg agcctggaaa gcctggtatt 8400
cccgggctcc caggcagggc tgggggtgtg ggagaggcag gaaggccagg agagagggga 8460
gaacggggag agaaaggaga acgtggagaa cagggcagag atggccctcc tggactccct 8520
ggaacccctg ggccccccgg accccctggc cccaaggtgt ctgtggatga gccaggtcct 8580
ggactctctg gagaacaggg accccctgga ctcaagggtg ctaaggggga gccgggcagc 8640
aatggtgacc aaggtcccaa aggagacagg ggtgtgccag gcatcaaagg agaccgggga 8700
gagcctggac cgaggggtca ggacggcaac ccgggtctac caggagagcg tggtatggct 8760
gggcctgaag ggaagccggg tctgcagggt ccaagaggcc cccctggccc agtgggtggt 8820
catggagacc ctggaccacc tggtgccccg ggtcttgctg gccctgcagg accccaagga 8880
ccttctggcc tgaaggggga gcctggagag acaggacctc caggacgggg cctgactgga 8940
cctactggag ctgtgggact tcctggaccc cccggccctt caggccttgt gggtccacag 9000
gggtctccag gtttgcctgg acaagtgggg gagacaggga agccgggagc cccaggtcga 9060
gatggtgcca gtggaaaaga tggagacaga gggagccctg gtgtgccagg gtcaccaggt 9120
ctgcctggcc ctgtcggacc taaaggagaa cctggcccca cgggggcccc tggacaggct 9180
gtggtcgggc tccctggagc aaagggagag aagggagccc ctggaggcct tgctggagac 9240
ctggtgggtg agccgggagc caaaggtgac cgaggactgc cagggccgcg aggcgagaag 9300
ggtgaagctg gccgtgcagg ggagcccgga gaccctgggg aagatggtca gaaaggggct 9360
ccaggaccca aaggtttcaa gggtgaccca ggagtcgggg tcccgggctc ccctgggcct 9420
cctggccctc caggtgtgaa gggagatctg ggcctccctg gcctgcccgg tgctcctggt 9480
gttgttgggt tcccgggtca gacaggccct cgaggagaga tgggtcagcc aggccctagt 9540
ggagagcggg gtctggcagg ccccccaggg agagaaggaa tcccaggacc cctggggcca 9600
cctggaccac cggggtcagt gggaccacct ggggcctctg gactcaaagg agacaaggga 9660
gaccctggag tagggctgcc tgggccccga ggcgagcgtg gggagccagg catccggggt 9720
gaagatggcc gccccggcca ggagggaccc cgaggactca cggggccccc tggcagcagg 9780
ggagagcgtg gggagaaggg tgatgttggg agtgcaggac taaagggtga caagggagac 9840
tcagctgtga tcctggggcc tccaggccca cggggtgcca agggggacat gggtgaacga 9900
gggcctcggg gcttggatgg tgacaaagga cctcggggag acaatgggga ccctggtgac 9960
aagggcagca agggagagcc tggtgacaag ggctcagccg ggttgccagg actgcgtgga 10020
ctcctgggac cccagggtca acctggtgca gcagggatcc ctggtgaccc gggatcccca 10080
ggaaaggatg gagtgcctgg tatccgagga gaaaaaggag atgttggctt catgggtccc 10140
cggggcctca agggtgaacg gggagtgaag ggagcctgtg gccttgatgg agagaaggga 10200
gacaagggag aagctggtcc cccaggccgc cccgggctgg caggacacaa aggagagatg 10260
ggggagcctg gtgtgccggg ccagtcgggg gcccctggca aggagggcct gatcggtccc 10320
aagggtgacc gaggctttga cgggcagcca ggccccaagg gtgaccaggg cgagaaaggg 10380
gagcggggaa ccccaggaat tgggggcttc ccaggcccca gtggaaatga tggctctgct 10440
ggtcccccag ggccacctgg cagtgttggt cccagaggcc ccgaaggact tcagggccag 10500
aagggtgagc gaggtccccc cggagagaga gtggtggggg ctcctggggt ccctggagct 10560
cctggcgaga gaggggagca ggggcggcca gggcctgccg gtcctcgagg cgagaaggga 10620
gaagctgcac tgacggagga tgacatccgg ggctttgtgc gccaagagat gagtcagcac 10680
tgtgcctgcc agggccagtt catcgcatct ggatcacgac ccctccctag ttatgctgca 10740
gacactgccg gctcccagct ccatgctgtg cctgtgctcc gcgtctctca tgcagaggag 10800
gaagagcggg taccccctga ggatgatgag tactctgaat actccgagta ttctgtggag 10860
gagtaccagg accctgaagc tccttgggat agtgatgacc cctgttccct gccactggat 10920
gagggctcct gcactgccta caccctgcgc tggtaccatc gggctgtgac aggcagcaca 10980
gaggcctgtc acccttttgt ctatggtggc tgtggaggga atgccaaccg ttttgggacc 11040
cgtgaggcct gcgagcgccg ctgcccaccc cgggtggtcc agagccaggg gacaggtact 11100
gcccaggact ga 11112
<210> 20
<211> 3703
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 20
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly
740 745 750
Asp Val Glu Glu Asn Pro Gly Pro Thr Leu Arg Leu Leu Val Ala Ala
755 760 765
Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg Ala Gln His
770 775 780
Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp Ile Val Phe
785 790 795 800
Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe Arg Glu Val
805 810 815
Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly Ala Ala Ser
820 825 830
Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp Asp Pro Arg
835 840 845
Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp Val Ile Arg
850 855 860
Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg Thr Gly Ala
865 870 875 880
Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln Leu Ala Arg
885 890 895
Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly Lys Ser Gln
900 905 910
Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln Gly Val Lys
915 920 925
Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu Leu Lys Arg
930 935 940
Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val Asn Asp Phe
945 950 955 960
Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg Val Cys Thr
965 970 975
Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp Ser Thr Ser
980 985 990
Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln Ser Leu Arg
995 1000 1005
Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr Lys Val Gln
1010 1015 1020
Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser Glu Arg Gln
1025 1030 1035 1040
Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu Arg Gly Leu
1045 1050 1055
Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu Tyr Ala Asn
1060 1065 1070
Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr Ala Leu Glu
1075 1080 1085
Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser Leu Leu Val
1090 1095 1100
Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val Thr Trp Arg
1105 1110 1115 1120
Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly Pro Gly Gln
1125 1130 1135
Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp Tyr Glu Val
1140 1145 1150
Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala Thr Ser Leu
1155 1160 1165
Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg Pro Val Ile
1170 1175 1180
Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val Pro Glu Ala
1185 1190 1195 1200
Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu Glu Pro Pro
1205 1210 1215
Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln Leu Asp Gly
1220 1225 1230
Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr Leu Leu Glu
1235 1240 1245
Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr Gly Pro Glu
1250 1255 1260
Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu Leu Pro Gly
1265 1270 1275 1280
Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala Thr Gln Tyr
1285 1290 1295
Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr Leu Val Leu
1300 1305 1310
Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln Ala Gly Leu
1315 1320 1325
Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg Glu Gly Ser
1330 1335 1340
Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro Leu Ala Val
1345 1350 1355 1360
Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val Arg Val Ala
1365 1370 1375
Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser Trp Ser Thr
1380 1385 1390
Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp Ser Thr Ala
1395 1400 1405
Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln Val Ala Val
1410 1415 1420
Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val Ile Val Ala
1425 1430 1435 1440
Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val Thr Gln Ala
1445 1450 1455
Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro Gly Ala Thr
1460 1465 1470
Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu Lys Ser Gln
1475 1480 1485
Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly Leu Glu Pro
1490 1495 1500
Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala Gly Val Asp
1505 1510 1515 1520
Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu Pro Val Gly
1525 1530 1535
Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp Val Leu Arg
1540 1545 1550
Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg Leu Ala Trp
1555 1560 1565
Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu Pro Gly Asn
1570 1575 1580
Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val Ser Tyr Ser
1585 1590 1595 1600
Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr Pro Val Ser
1605 1610 1615
Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu Gly Thr Leu
1620 1625 1630
His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg Trp Glu Pro
1635 1640 1645
Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro Glu Gly Gly
1650 1655 1660
Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser Tyr His Leu
1665 1670 1675 1680
Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu Ser Val Leu
1685 1690 1695
Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala Arg Thr Glu
1700 1705 1710
Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp Thr Ser Ile
1715 1720 1725
Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala Ser Ser Tyr
1730 1735 1740
Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu Val Pro Gly
1745 1750 1755 1760
Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg Val Thr Gly
1765 1770 1775
Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro Val Leu Asp
1780 1785 1790
Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro Val Cys Pro
1795 1800 1805
Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr Gln Asp Asn
1810 1815 1820
Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg Leu Val Leu
1825 1830 1835 1840
Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly Leu Leu Ser
1845 1850 1855
Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly Ser His Asp
1860 1865 1870
Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr Met Asp Pro
1875 1880 1885
Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His Arg Tyr Met
1890 1895 1900
Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro Gly Val Met
1905 1910 1915 1920
Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe Ser Pro Ile
1925 1930 1935
Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu Gly Met Ala
1940 1945 1950
Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly Met Asp Ser
1955 1960 1965
Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu Asp Gln Ala
1970 1975 1980
Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe Thr Thr Gln
1985 1990 1995 2000
Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly Gln Lys Gly
2005 2010 2015
Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro Pro Gly Asp
2020 2025 2030
Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln Gly Pro Pro
2035 2040 2045
Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly Ala Asp Gly
2050 2055 2060
Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr Pro Gly Ala
2065 2070 2075 2080
Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg Gly Asp Pro
2085 2090 2095
Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly Ala Pro Gly
2100 2105 2110
Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg Lys Gly Asp
2115 2120 2125
Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu Gly Asp Pro
2130 2135 2140
Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met Lys Gly Asp
2145 2150 2155 2160
Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly Glu Gly Gly
2165 2170 2175
Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly Ser Pro Gly
2180 2185 2190
Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu Lys Gly Asp
2195 2200 2205
Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly Ser Pro Gly
2210 2215 2220
Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro Lys Gly Asp
2225 2230 2235 2240
Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys Gly Glu Arg
2245 2250 2255
Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly Val Ala Gly
2260 2265 2270
Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro Thr Gly Arg
2275 2280 2285
Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro Ala Val Val
2290 2295 2300
Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp Val Gly Pro
2305 2310 2315 2320
Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg Gly Pro Pro
2325 2330 2335
Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp Pro Gly Asp
2340 2345 2350
Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro Gly Asp Ser
2355 2360 2365
Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly Pro Pro Gly
2370 2375 2380
Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu Lys Gly Asp
2385 2390 2395 2400
Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala Gly Glu Arg
2405 2410 2415
Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly Glu Lys Gly
2420 2425 2430
Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser Pro Gly Ser
2435 2440 2445
Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro Pro
2450 2455 2460
Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys Gly Glu Pro
2465 2470 2475 2480
Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly Asp Pro Gly
2485 2490 2495
Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe Arg Gly Pro
2500 2505 2510
Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala Gly Glu Lys
2515 2520 2525
Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly Leu Asp Gly
2530 2535 2540
Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala Ala Gly Lys
2545 2550 2555 2560
Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg Gly Glu Gln
2565 2570 2575
Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly Lys Pro Gly
2580 2585 2590
Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu Pro Gly Asp
2595 2600 2605
Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser Gly Ala Ser
2610 2615 2620
Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly Ala Pro Gly
2625 2630 2635 2640
Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro Val Gly Pro
2645 2650 2655
Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly Pro Lys Gly
2660 2665 2670
Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu Pro Gly Glu
2675 2680 2685
Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val Asp Arg Leu
2690 2695 2700
Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu Ile Val Glu
2705 2710 2715 2720
Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro Glu Arg Arg
2725 2730 2735
Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro Gly Lys Glu
2740 2745 2750
Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly Asp Arg Gly
2755 2760 2765
Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly Glu Arg Gly
2770 2775 2780
Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys Pro Gly Ile
2785 2790 2795 2800
Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala Gly Arg Pro
2805 2810 2815
Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly Glu Gln Gly
2820 2825 2830
Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro Pro Gly Pro
2835 2840 2845
Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly Leu Ser Gly
2850 2855 2860
Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu Pro Gly Ser
2865 2870 2875 2880
Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro Gly Ile Lys
2885 2890 2895
Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly Asn Pro Gly
2900 2905 2910
Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys Pro Gly Leu
2915 2920 2925
Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His Gly Asp Pro
2930 2935 2940
Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly Pro Gln Gly
2945 2950 2955 2960
Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro Pro Gly Arg
2965 2970 2975
Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly Pro Pro Gly
2980 2985 2990
Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu Pro Gly Gln
2995 3000 3005
Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp Gly Ala Ser
3010 3015 3020
Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly Ser Pro Gly
3025 3030 3035 3040
Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro Thr Gly Ala
3045 3050 3055
Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly Glu Lys Gly
3060 3065 3070
Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro Gly Ala Lys
3075 3080 3085
Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly Glu Ala Gly
3090 3095 3100
Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln Lys Gly Ala
3105 3110 3115 3120
Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly Val Pro Gly
3125 3130 3135
Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp Leu Gly Leu
3140 3145 3150
Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro Gly Gln Thr
3155 3160 3165
Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly Glu Arg Gly
3170 3175 3180
Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro Leu Gly Pro
3185 3190 3195 3200
Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser Gly Leu Lys
3205 3210 3215
Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro Arg Gly Glu
3220 3225 3230
Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro Gly Gln Glu
3235 3240 3245
Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly Glu Arg Gly
3250 3255 3260
Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp Lys Gly Asp
3265 3270 3275 3280
Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala Lys Gly Asp
3285 3290 3295
Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys Gly Pro Arg
3300 3305 3310
Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly Glu Pro Gly
3315 3320 3325
Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu Leu Gly Pro
3330 3335 3340
Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro Gly Ser Pro
3345 3350 3355 3360
Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly Asp Val Gly
3365 3370 3375
Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val Lys Gly Ala
3380 3385 3390
Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala Gly Pro Pro
3395 3400 3405
Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly Glu Pro Gly
3410 3415 3420
Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu Ile Gly Pro
3425 3430 3435 3440
Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys Gly Asp Gln
3445 3450 3455
Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly Phe Pro Gly
3460 3465 3470
Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly Ser
3475 3480 3485
Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys Gly Glu Arg
3490 3495 3500
Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val Pro Gly Ala
3505 3510 3515 3520
Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala Gly Pro Arg
3525 3530 3535
Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile Arg Gly Phe
3540 3545 3550
Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly Gln Phe Ile
3555 3560 3565
Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp Thr Ala Gly
3570 3575 3580
Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His Ala Glu Glu
3585 3590 3595 3600
Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu Tyr Ser Glu
3605 3610 3615
Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp Asp Ser Asp
3620 3625 3630
Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr Ala Tyr Thr
3635 3640 3645
Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu Ala Cys His
3650 3655 3660
Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg Phe Gly Thr
3665 3670 3675 3680
Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val Gln Ser Gln
3685 3690 3695
Gly Thr Gly Thr Ala Gln Asp
3700
<210> 21
<211> 11115
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 21
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg acggaagcgg acagtgtact aattatgctc tcttgaaatt ggctggagat 8880
gttgagagca accctggacc tacctcctcg gggcctggac cccggttcct gctgctgctg 8940
ccgctgctgc tgccccctgc ggcctcagcc tccgaccggc cccggggccg agacccggtc 9000
aacccagaga agctgctggt gatcactgtg gccacagctg aaaccgaggg gtacctgcgt 9060
ttcctgcgct ctgcggagtt cttcaactac actgtgcgga ccctgggcct gggagaggag 9120
tggcgagggg gtgatgtggc tcgaacagtt ggtggaggac agaaggtccg gtggttaaag 9180
aaggaaatgg agaaatacgc tgaccgggag gatatgatca tcatgtttgt ggatagctac 9240
gacgtgattc tggccggcag ccccacagag ctgctgaaga agttcgtcca gagtggcagc 9300
cgcctgctct tctctgcaga gagcttctgc tggcccgagt gggggctggc ggagcagtac 9360
cctgaggtgg gcacggggaa gcgcttcctc aattctggtg gattcatcgg ttttgccacc 9420
accatccacc aaatcgtgcg ccagtggaag tacaaggatg atgacgacga ccagctgttc 9480
tacacacggc tctacctgga cccaggactg agggagaaac tcagccttaa tctggatcat 9540
aagtctcgga tctttcagaa cctcaacggg gctttagatg aagtggtttt aaagtttgat 9600
cggaaccgtg tgcgtatccg gaacgtggcc tacgacacgc tccccattgt ggtccatgga 9660
aacggtccca ctaagctgca gctcaactac ctgggaaact acgtccccaa tggctggact 9720
cctgagggag gctgtggctt ctgcaaccag gaccggagga cactcccggg ggggcagcct 9780
cccccccggg tgtttctggc cgtgtttgtg gaacagccta ctccgtttct gccccgcttc 9840
ctgcagcggc tgctactcct ggactatccc cccgacaggg tcaccctttt cctgcacaac 9900
aacgaggtct tccatgaacc ccacatcgct gactcctggc cgcagctcca ggaccacttc 9960
tcagctgtga agctcgtggg gccggaggag gctctgagcc caggcgaggc cagggacatg 10020
gccatggacc tgtgtcggca ggaccccgag tgtgagttct acttcagcct ggacgccgac 10080
gctgtcctca ccaacctgca gaccctgcgt atcctcattg aggagaacag gaaggtgatc 10140
gcccccatgc tgtcccgcca cggcaagctg tggtccaact tctggggcgc cctgagcccc 10200
gatgagtact acgcccgctc cgaggactac gtggagctgg tgcagcggaa gcgagtgggt 10260
gtgtggaatg taccatacat ctcccaggcc tatgtgatcc ggggtgatac cctgcggatg 10320
gagctgcccc agagggatgt gttctcgggc agtgacacag acccggacat ggccttctgt 10380
aagagctttc gagacaaggg catcttcctc catctgagca atcagcatga atttggccgg 10440
ctcctggcca cttccagata cgacacggag cacctgcacc ccgacctctg gcagatcttc 10500
gacaaccccg tcgactggaa ggagcagtac atccacgaga actacagccg ggccctggaa 10560
ggggaaggaa tcgtggagca gccatgcccg gacgtgtact ggttcccact gctgtcagaa 10620
caaatgtgtg atgagctggt ggcagagatg gagcactacg gccagtggtc aggcggccgg 10680
catgaggatt caaggctggc tggaggctac gagaatgtgc ccaccgtgga catccacatg 10740
aagcaggtgg ggtacgagga ccagtggctg cagctgctgc ggacgtatgt gggccccatg 10800
accgagagcc tgtttcccgg ttaccacacc aaggcgcggg cggtgatgaa ctttgtggtt 10860
cgctaccggc cagacgagca gccgtctctg cggccacacc acgactcatc caccttcacc 10920
ctcaacgttg ccctcaacca caagggcctg gactatgagg gaggtggctg ccgcttcctg 10980
cgctacgact gtgtgatctc ctccccgagg aagggctggg cactcctgca ccccggccgc 11040
ctcacccact accacgaggg gctgccaacg acctggggca cacgctacat catggtgtcc 11100
tttgtcgacc cctga 11115
<210> 22
<211> 3704
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 22
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
2945 2950 2955 2960
Val Glu Ser Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro Arg Phe
2965 2970 2975
Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp
2980 2985 2990
Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu Val Ile
2995 3000 3005
Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser
3010 3015 3020
Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly Glu Glu
3025 3030 3035 3040
Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln Lys Val
3045 3050 3055
Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu Asp Met
3060 3065 3070
Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro
3075 3080 3085
Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu Leu Phe
3090 3095 3100
Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr
3105 3110 3115 3120
Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile
3125 3130 3135
Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys Tyr Lys
3140 3145 3150
Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro
3155 3160 3165
Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser Arg Ile
3170 3175 3180
Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys Phe Asp
3185 3190 3195 3200
Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile
3205 3210 3215
Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly
3220 3225 3230
Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys
3235 3240 3245
Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro Arg Val
3250 3255 3260
Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe
3265 3270 3275 3280
Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu
3285 3290 3295
Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala Asp Ser
3300 3305 3310
Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val Gly Pro
3315 3320 3325
Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met Asp Leu
3330 3335 3340
Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp
3345 3350 3355 3360
Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn
3365 3370 3375
Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu Trp Ser
3380 3385 3390
Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu
3395 3400 3405
Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp Asn Val
3410 3415 3420
Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu Arg Met
3425 3430 3435 3440
Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp Pro Asp
3445 3450 3455
Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu His Leu
3460 3465 3470
Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp
3475 3480 3485
Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn Pro Val
3490 3495 3500
Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala Leu Glu
3505 3510 3515 3520
Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro
3525 3530 3535
Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met Glu His
3540 3545 3550
Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu Ala Gly
3555 3560 3565
Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln Val Gly
3570 3575 3580
Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly Pro Met
3585 3590 3595 3600
Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala Val Met
3605 3610 3615
Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro
3620 3625 3630
His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn His Lys
3635 3640 3645
Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys
3650 3655 3660
Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro Gly Arg
3665 3670 3675 3680
Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr
3685 3690 3695
Ile Met Val Ser Phe Val Asp Pro
3700
<210> 23
<211> 11115
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 23
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220
ggacagtgta ctaattatgc tctcttgaaa ttggctggag atgttgagag caaccctgga 2280
cctacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 2340
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 2400
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 2460
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 2520
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 2580
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 2640
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 2700
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 2760
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 2820
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 2880
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 2940
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 3000
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 3060
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 3120
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 3180
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 3240
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 3300
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 3360
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 3420
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 3480
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 3540
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 3600
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 3660
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 3720
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 3780
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 3840
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 3900
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 3960
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 4020
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 4080
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 4140
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 4200
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 4260
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 4320
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 4380
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 4440
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 4500
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 4560
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 4620
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 4680
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 4740
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 4800
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 4860
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 4920
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 4980
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 5040
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 5100
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 5160
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 5220
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 5280
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 5340
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 5400
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 5460
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 5520
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 5580
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 5640
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 5700
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 5760
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 5820
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 5880
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 5940
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 6000
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 6060
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 6120
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 6180
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 6240
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 6300
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 6360
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 6420
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 6480
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 6540
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 6600
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 6660
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 6720
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 6780
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 6840
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 6900
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 6960
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 7020
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 7080
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 7140
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 7200
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 7260
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 7320
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 7380
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 7440
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 7500
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 7560
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 7620
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 7680
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 7740
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 7800
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 7860
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 7920
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 7980
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 8040
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 8100
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 8160
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 8220
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 8280
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 8340
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 8400
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 8460
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 8520
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 8580
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 8640
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 8700
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 8760
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 8820
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 8880
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 8940
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 9000
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 9060
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 9120
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 9180
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 9240
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 9300
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 9360
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 9420
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 9480
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 9540
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 9600
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 9660
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 9720
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 9780
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 9840
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 9900
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 9960
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 10020
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 10080
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 10140
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 10200
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 10260
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 10320
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 10380
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 10440
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 10500
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 10560
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 10620
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 10680
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 10740
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 10800
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 10860
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 10920
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 10980
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 11040
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 11100
actgcccagg actga 11115
<210> 24
<211> 3704
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 24
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala
740 745 750
Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Leu Arg Leu Leu Val Ala
755 760 765
Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg Ala Gln
770 775 780
His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp Ile Val
785 790 795 800
Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe Arg Glu
805 810 815
Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly Ala Ala
820 825 830
Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp Asp Pro
835 840 845
Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp Val Ile
850 855 860
Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg Thr Gly
865 870 875 880
Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln Leu Ala
885 890 895
Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly Lys Ser
900 905 910
Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln Gly Val
915 920 925
Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu Leu Lys
930 935 940
Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val Asn Asp
945 950 955 960
Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg Val Cys
965 970 975
Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp Ser Thr
980 985 990
Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln Ser Leu
995 1000 1005
Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr Lys Val
1010 1015 1020
Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser Glu Arg
1025 1030 1035 1040
Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu Arg Gly
1045 1050 1055
Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu Tyr Ala
1060 1065 1070
Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr Ala Leu
1075 1080 1085
Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser Leu Leu
1090 1095 1100
Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val Thr Trp
1105 1110 1115 1120
Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly Pro Gly
1125 1130 1135
Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp Tyr Glu
1140 1145 1150
Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala Thr Ser
1155 1160 1165
Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg Pro Val
1170 1175 1180
Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val Pro Glu
1185 1190 1195 1200
Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu Glu Pro
1205 1210 1215
Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln Leu Asp
1220 1225 1230
Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr Leu Leu
1235 1240 1245
Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr Gly Pro
1250 1255 1260
Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu Leu Pro
1265 1270 1275 1280
Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala Thr Gln
1285 1290 1295
Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr Leu Val
1300 1305 1310
Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln Ala Gly
1315 1320 1325
Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg Glu Gly
1330 1335 1340
Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro Leu Ala
1345 1350 1355 1360
Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val Arg Val
1365 1370 1375
Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser Trp Ser
1380 1385 1390
Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp Ser Thr
1395 1400 1405
Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln Val Ala
1410 1415 1420
Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val Ile Val
1425 1430 1435 1440
Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val Thr Gln
1445 1450 1455
Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro Gly Ala
1460 1465 1470
Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu Lys Ser
1475 1480 1485
Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly Leu Glu
1490 1495 1500
Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala Gly Val
1505 1510 1515 1520
Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu Pro Val
1525 1530 1535
Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp Val Leu
1540 1545 1550
Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg Leu Ala
1555 1560 1565
Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu Pro Gly
1570 1575 1580
Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val Ser Tyr
1585 1590 1595 1600
Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr Pro Val
1605 1610 1615
Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu Gly Thr
1620 1625 1630
Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg Trp Glu
1635 1640 1645
Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro Glu Gly
1650 1655 1660
Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser Tyr His
1665 1670 1675 1680
Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu Ser Val
1685 1690 1695
Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala Arg Thr
1700 1705 1710
Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp Thr Ser
1715 1720 1725
Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala Ser Ser
1730 1735 1740
Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu Val Pro
1745 1750 1755 1760
Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg Val Thr
1765 1770 1775
Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro Val Leu
1780 1785 1790
Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro Val Cys
1795 1800 1805
Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr Gln Asp
1810 1815 1820
Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg Leu Val
1825 1830 1835 1840
Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly Leu Leu
1845 1850 1855
Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly Ser His
1860 1865 1870
Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr Met Asp
1875 1880 1885
Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His Arg Tyr
1890 1895 1900
Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro Gly Val
1905 1910 1915 1920
Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe Ser Pro
1925 1930 1935
Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu Gly Met
1940 1945 1950
Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly Met Asp
1955 1960 1965
Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu Asp Gln
1970 1975 1980
Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe Thr Thr
1985 1990 1995 2000
Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly Gln Lys
2005 2010 2015
Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro Pro Gly
2020 2025 2030
Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln Gly Pro
2035 2040 2045
Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly Ala Asp
2050 2055 2060
Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr Pro Gly
2065 2070 2075 2080
Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg Gly Asp
2085 2090 2095
Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly Ala Pro
2100 2105 2110
Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg Lys Gly
2115 2120 2125
Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu Gly Asp
2130 2135 2140
Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met Lys Gly
2145 2150 2155 2160
Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly Glu Gly
2165 2170 2175
Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly Ser Pro
2180 2185 2190
Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu Lys Gly
2195 2200 2205
Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly Ser Pro
2210 2215 2220
Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro Lys Gly
2225 2230 2235 2240
Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys Gly Glu
2245 2250 2255
Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly Val Ala
2260 2265 2270
Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro Thr Gly
2275 2280 2285
Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro Ala Val
2290 2295 2300
Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp Val Gly
2305 2310 2315 2320
Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg Gly Pro
2325 2330 2335
Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp Pro Gly
2340 2345 2350
Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro Gly Asp
2355 2360 2365
Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly Pro Pro
2370 2375 2380
Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu Lys Gly
2385 2390 2395 2400
Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala Gly Glu
2405 2410 2415
Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly Glu Lys
2420 2425 2430
Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser Pro Gly
2435 2440 2445
Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro
2450 2455 2460
Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys Gly Glu
2465 2470 2475 2480
Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly Asp Pro
2485 2490 2495
Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe Arg Gly
2500 2505 2510
Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala Gly Glu
2515 2520 2525
Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly Leu Asp
2530 2535 2540
Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala Ala Gly
2545 2550 2555 2560
Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg Gly Glu
2565 2570 2575
Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly Lys Pro
2580 2585 2590
Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu Pro Gly
2595 2600 2605
Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser Gly Ala
2610 2615 2620
Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly Ala Pro
2625 2630 2635 2640
Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro Val Gly
2645 2650 2655
Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly Pro Lys
2660 2665 2670
Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu Pro Gly
2675 2680 2685
Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val Asp Arg
2690 2695 2700
Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu Ile Val
2705 2710 2715 2720
Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro Glu Arg
2725 2730 2735
Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro Gly Lys
2740 2745 2750
Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly Asp Arg
2755 2760 2765
Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly Glu Arg
2770 2775 2780
Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys Pro Gly
2785 2790 2795 2800
Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala Gly Arg
2805 2810 2815
Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly Glu Gln
2820 2825 2830
Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro Pro Gly
2835 2840 2845
Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly Leu Ser
2850 2855 2860
Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu Pro Gly
2865 2870 2875 2880
Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro Gly Ile
2885 2890 2895
Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly Asn Pro
2900 2905 2910
Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys Pro Gly
2915 2920 2925
Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His Gly Asp
2930 2935 2940
Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly Pro Gln
2945 2950 2955 2960
Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro Pro Gly
2965 2970 2975
Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly Pro Pro
2980 2985 2990
Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu Pro Gly
2995 3000 3005
Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp Gly Ala
3010 3015 3020
Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly Ser Pro
3025 3030 3035 3040
Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro Thr Gly
3045 3050 3055
Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly Glu Lys
3060 3065 3070
Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro Gly Ala
3075 3080 3085
Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly Glu Ala
3090 3095 3100
Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln Lys Gly
3105 3110 3115 3120
Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly Val Pro
3125 3130 3135
Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp Leu Gly
3140 3145 3150
Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro Gly Gln
3155 3160 3165
Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly Glu Arg
3170 3175 3180
Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro Leu Gly
3185 3190 3195 3200
Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser Gly Leu
3205 3210 3215
Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro Arg Gly
3220 3225 3230
Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro Gly Gln
3235 3240 3245
Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly Glu Arg
3250 3255 3260
Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp Lys Gly
3265 3270 3275 3280
Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala Lys Gly
3285 3290 3295
Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys Gly Pro
3300 3305 3310
Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly Glu Pro
3315 3320 3325
Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu Leu Gly
3330 3335 3340
Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro Gly Ser
3345 3350 3355 3360
Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly Asp Val
3365 3370 3375
Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val Lys Gly
3380 3385 3390
Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala Gly Pro
3395 3400 3405
Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly Glu Pro
3410 3415 3420
Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu Ile Gly
3425 3430 3435 3440
Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys Gly Asp
3445 3450 3455
Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly Phe Pro
3460 3465 3470
Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly
3475 3480 3485
Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys Gly Glu
3490 3495 3500
Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val Pro Gly
3505 3510 3515 3520
Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala Gly Pro
3525 3530 3535
Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile Arg Gly
3540 3545 3550
Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly Gln Phe
3555 3560 3565
Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp Thr Ala
3570 3575 3580
Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His Ala Glu
3585 3590 3595 3600
Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu Tyr Ser
3605 3610 3615
Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp Asp Ser
3620 3625 3630
Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr Ala Tyr
3635 3640 3645
Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu Ala Cys
3650 3655 3660
His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg Phe Gly
3665 3670 3675 3680
Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val Gln Ser
3685 3690 3695
Gln Gly Thr Gly Thr Ala Gln Asp
3700
<210> 25
<211> 11121
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 25
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg acggaagcgg agtgaaacag actttgaatt ttgaccttct caagttggcg 8880
ggagacgtgg agtccaaccc tggacctacc tcctcggggc ctggaccccg gttcctgctg 8940
ctgctgccgc tgctgctgcc ccctgcggcc tcagcctccg accggccccg gggccgagac 9000
ccggtcaacc cagagaagct gctggtgatc actgtggcca cagctgaaac cgaggggtac 9060
ctgcgtttcc tgcgctctgc ggagttcttc aactacactg tgcggaccct gggcctggga 9120
gaggagtggc gagggggtga tgtggctcga acagttggtg gaggacagaa ggtccggtgg 9180
ttaaagaagg aaatggagaa atacgctgac cgggaggata tgatcatcat gtttgtggat 9240
agctacgacg tgattctggc cggcagcccc acagagctgc tgaagaagtt cgtccagagt 9300
ggcagccgcc tgctcttctc tgcagagagc ttctgctggc ccgagtgggg gctggcggag 9360
cagtaccctg aggtgggcac ggggaagcgc ttcctcaatt ctggtggatt catcggtttt 9420
gccaccacca tccaccaaat cgtgcgccag tggaagtaca aggatgatga cgacgaccag 9480
ctgttctaca cacggctcta cctggaccca ggactgaggg agaaactcag ccttaatctg 9540
gatcataagt ctcggatctt tcagaacctc aacggggctt tagatgaagt ggttttaaag 9600
tttgatcgga accgtgtgcg tatccggaac gtggcctacg acacgctccc cattgtggtc 9660
catggaaacg gtcccactaa gctgcagctc aactacctgg gaaactacgt ccccaatggc 9720
tggactcctg agggaggctg tggcttctgc aaccaggacc ggaggacact cccggggggg 9780
cagcctcccc cccgggtgtt tctggccgtg tttgtggaac agcctactcc gtttctgccc 9840
cgcttcctgc agcggctgct actcctggac tatccccccg acagggtcac ccttttcctg 9900
cacaacaacg aggtcttcca tgaaccccac atcgctgact cctggccgca gctccaggac 9960
cacttctcag ctgtgaagct cgtggggccg gaggaggctc tgagcccagg cgaggccagg 10020
gacatggcca tggacctgtg tcggcaggac cccgagtgtg agttctactt cagcctggac 10080
gccgacgctg tcctcaccaa cctgcagacc ctgcgtatcc tcattgagga gaacaggaag 10140
gtgatcgccc ccatgctgtc ccgccacggc aagctgtggt ccaacttctg gggcgccctg 10200
agccccgatg agtactacgc ccgctccgag gactacgtgg agctggtgca gcggaagcga 10260
gtgggtgtgt ggaatgtacc atacatctcc caggcctatg tgatccgggg tgataccctg 10320
cggatggagc tgccccagag ggatgtgttc tcgggcagtg acacagaccc ggacatggcc 10380
ttctgtaaga gctttcgaga caagggcatc ttcctccatc tgagcaatca gcatgaattt 10440
ggccggctcc tggccacttc cagatacgac acggagcacc tgcaccccga cctctggcag 10500
atcttcgaca accccgtcga ctggaaggag cagtacatcc acgagaacta cagccgggcc 10560
ctggaagggg aaggaatcgt ggagcagcca tgcccggacg tgtactggtt cccactgctg 10620
tcagaacaaa tgtgtgatga gctggtggca gagatggagc actacggcca gtggtcaggc 10680
ggccggcatg aggattcaag gctggctgga ggctacgaga atgtgcccac cgtggacatc 10740
cacatgaagc aggtggggta cgaggaccag tggctgcagc tgctgcggac gtatgtgggc 10800
cccatgaccg agagcctgtt tcccggttac cacaccaagg cgcgggcggt gatgaacttt 10860
gtggttcgct accggccaga cgagcagccg tctctgcggc cacaccacga ctcatccacc 10920
ttcaccctca acgttgccct caaccacaag ggcctggact atgagggagg tggctgccgc 10980
ttcctgcgct acgactgtgt gatctcctcc ccgaggaagg gctgggcact cctgcacccc 11040
ggccgcctca cccactacca cgaggggctg ccaacgacct ggggcacacg ctacatcatg 11100
gtgtcctttg tcgacccctg a 11121
<210> 26
<211> 3706
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 26
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
2945 2950 2955 2960
Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro
2965 2970 2975
Arg Phe Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala
2980 2985 2990
Ser Asp Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu
2995 3000 3005
Val Ile Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu
3010 3015 3020
Arg Ser Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly
3025 3030 3035 3040
Glu Glu Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln
3045 3050 3055
Lys Val Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu
3060 3065 3070
Asp Met Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly
3075 3080 3085
Ser Pro Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu
3090 3095 3100
Leu Phe Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu
3105 3110 3115 3120
Gln Tyr Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly
3125 3130 3135
Phe Ile Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys
3140 3145 3150
Tyr Lys Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu
3155 3160 3165
Asp Pro Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser
3170 3175 3180
Arg Ile Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys
3185 3190 3195 3200
Phe Asp Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu
3205 3210 3215
Pro Ile Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr
3220 3225 3230
Leu Gly Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly
3235 3240 3245
Phe Cys Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro
3250 3255 3260
Arg Val Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro
3265 3270 3275 3280
Arg Phe Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val
3285 3290 3295
Thr Leu Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala
3300 3305 3310
Asp Ser Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val
3315 3320 3325
Gly Pro Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met
3330 3335 3340
Asp Leu Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp
3345 3350 3355 3360
Ala Asp Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu
3365 3370 3375
Glu Asn Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu
3380 3385 3390
Trp Ser Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg
3395 3400 3405
Ser Glu Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp
3410 3415 3420
Asn Val Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu
3425 3430 3435 3440
Arg Met Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp
3445 3450 3455
Pro Asp Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu
3460 3465 3470
His Leu Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg
3475 3480 3485
Tyr Asp Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn
3490 3495 3500
Pro Val Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala
3505 3510 3515 3520
Leu Glu Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp
3525 3530 3535
Phe Pro Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met
3540 3545 3550
Glu His Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu
3555 3560 3565
Ala Gly Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln
3570 3575 3580
Val Gly Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly
3585 3590 3595 3600
Pro Met Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala
3605 3610 3615
Val Met Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu
3620 3625 3630
Arg Pro His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn
3635 3640 3645
His Lys Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr
3650 3655 3660
Asp Cys Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro
3665 3670 3675 3680
Gly Arg Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr
3685 3690 3695
Arg Tyr Ile Met Val Ser Phe Val Asp Pro
3700 3705
<210> 27
<211> 11121
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 27
atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60
gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120
gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180
ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240
gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300
gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360
agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420
gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480
aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540
cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600
gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660
aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720
cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780
cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840
ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900
gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960
ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020
ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080
gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140
caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200
cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260
cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320
tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380
atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440
gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500
ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560
tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620
aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680
cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740
gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800
gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860
gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920
ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980
cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040
cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100
tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160
gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220
ggagtgaaac agactttgaa ttttgacctt ctcaagttgg cgggagacgt ggagtccaac 2280
cctggaccta cgctgcggct tctggtggcc gcgctctgcg ccgggatcct ggcagaggcg 2340
ccccgagtgc gagcccagca cagggagaga gtgacctgca cgcgccttta cgccgctgac 2400
attgtgttct tactggatgg ctcctcatcc attggccgca gcaatttccg cgaggtccgc 2460
agctttctcg aagggctggt gctgcctttc tctggagcag ccagtgcaca gggtgtgcgc 2520
tttgccacag tgcagtacag cgatgaccca cggacagagt tcggcctgga tgcacttggc 2580
tctgggggtg atgtgatccg cgccatccgt gagcttagct acaagggggg caacactcgc 2640
acaggggctg caattctcca tgtggctgac catgtcttcc tgccccagct ggcccgacct 2700
ggtgtcccca aggtctgcat cctgatcaca gacgggaagt cccaggacct ggtggacaca 2760
gctgcccaaa ggctgaaggg gcagggggtc aagctatttg ctgtggggat caagaatgct 2820
gaccctgagg agctgaagcg agttgcctca cagcccacca gtgacttctt cttcttcgtc 2880
aatgacttca gcatcttgag gacactactg cccctcgttt cccggagagt gtgcacgact 2940
gctggtggcg tgcctgtgac ccgacctccg gatgactcga cctctgctcc acgagacctg 3000
gtgctgtctg agccaagcag ccaatccttg agagtacagt ggacagcggc cagtggccct 3060
gtgactggct acaaggtcca gtacactcct ctgacggggc tgggacagcc actgccgagt 3120
gagcggcagg aggtgaacgt cccagctggt gagaccagtg tgcggctgcg gggtctccgg 3180
ccactgaccg agtaccaagt gactgtgatt gccctctacg ccaacagcat cggggaggct 3240
gtgagcggga cagctcggac cactgcccta gaagggccgg aactgaccat ccagaatacc 3300
acagcccaca gcctcctggt ggcctggcgg agtgtgccag gtgccactgg ctaccgtgtg 3360
acatggcggg tcctcagtgg tgggcccaca cagcagcagg agctgggccc tgggcagggt 3420
tcagtgttgc tgcgtgactt ggagcctggc acggactatg aggtgaccgt gagcacccta 3480
tttggccgca gtgtggggcc cgccacttcc ctgatggctc gcactgacgc ttctgttgag 3540
cagaccctgc gcccggtcat cctgggcccc acatccatcc tcctttcctg gaacttggtg 3600
cctgaggccc gtggctaccg gttggaatgg cggcgtgaga ctggcttgga gccaccgcag 3660
aaggtggtac tgccctctga tgtgacccgc taccagttgg atgggctgca gccgggcact 3720
gagtaccgcc tcacactcta cactctgctg gagggccacg aggtggccac ccctgcaacc 3780
gtggttccca ctggaccaga gctgcctgtg agccctgtaa cagacctgca agccaccgag 3840
ctgcccgggc agcgggtgcg agtgtcctgg agcccagtcc ctggtgccac ccagtaccgc 3900
atcattgtgc gcagcaccca gggggttgag cggaccctgg tgcttcctgg gagtcagaca 3960
gcattcgact tggatgacgt tcaggctggg cttagctaca ctgtgcgggt gtctgctcga 4020
gtgggtcccc gtgagggcag tgccagtgtc ctcactgtcc gccgggagcc ggaaactcca 4080
cttgctgttc cagggctgcg ggttgtggtg tcagatgcaa cgcgagtgag ggtggcctgg 4140
ggacccgtcc ctggagccag tggatttcgg attagctgga gcacaggcag tggtccggag 4200
tccagccaga cactgccccc agactctact gccacagaca tcacagggct gcagcctgga 4260
accacctacc aggtggctgt gtcggtactg cgaggcagag aggagggccc tgctgcagtc 4320
atcgtggctc gaacggaccc actgggccca gtgaggacgg tccatgtgac tcaggccagc 4380
agctcatctg tcaccattac ctggaccagg gttcctggcg ccacaggata cagggtttcc 4440
tggcactcag cccacggccc agagaaatcc cagttggttt ctggggaggc cacggtggct 4500
gagctggatg gactggagcc agatactgag tatacggtgc atgtgagggc ccatgtggct 4560
ggcgtggatg ggccccctgc ctctgtggtt gtgaggactg cccctgagcc tgtgggtcgt 4620
gtgtcgaggc tgcagatcct caatgcttcc agcgacgttc tacggatcac ctgggtaggg 4680
gtcactggag ccacagctta cagactggcc tggggccgga gtgaaggcgg ccccatgagg 4740
caccagatac tcccaggaaa cacagactct gcagagatcc ggggtctcga aggtggagtc 4800
agctactcag tgcgagtgac tgcacttgtc ggggaccgcg agggcacacc tgtctccatt 4860
gttgtcacta cgccgcctga ggctccgcca gccctgggga cgcttcacgt ggtgcagcgc 4920
ggggagcact cgctgaggct gcgctgggag ccggtgccca gagcgcaggg cttccttctg 4980
cactggcaac ctgagggtgg ccaggaacag tcccgggtcc tggggcccga gctcagcagc 5040
tatcacctgg acgggctgga gccagcgaca cagtaccgcg tgaggctgag tgtcctaggg 5100
ccagctggag aagggccctc tgcagaggtg actgcgcgca ctgagtcacc tcgtgttcca 5160
agcattgaac tacgtgtggt ggacacctcg atcgactcgg tgactttggc ctggactcca 5220
gtgtccaggg catccagcta catcctatcc tggcggccac tcagaggccc tggccaggaa 5280
gtgcctgggt ccccgcagac acttccaggg atctcaagct cccagcgggt gacagggcta 5340
gagcctggcg tctcttacat cttctccctg acgcctgtcc tggatggtgt gcggggtcct 5400
gaggcatctg tcacacagac gccagtgtgc ccccgtggcc tggcggatgt ggtgttccta 5460
ccacatgcca ctcaagacaa tgctcaccgt gcggaggcta cgaggagggt cctggagcgt 5520
ctggtgttgg cacttgggcc tcttgggcca caggcagttc aggttggcct gctgtcttac 5580
agtcatcggc cctccccact gttcccactg aatggctccc atgaccttgg cattatcttg 5640
caaaggatcc gtgacatgcc ctacatggac ccaagtggga acaacctggg cacagccgtg 5700
gtcacagctc acagatacat gttggcacca gatgctcctg ggcgccgcca gcacgtacca 5760
ggggtgatgg ttctgctagt ggatgaaccc ttgagaggtg acatattcag ccccatccgt 5820
gaggcccagg cttctgggct taatgtggtg atgttgggaa tggctggagc ggacccagag 5880
cagctgcgtc gcttggcgcc gggtatggac tctgtccaga ccttcttcgc cgtggatgat 5940
gggccaagcc tggaccaggc agtcagtggt ctggccacag ccctgtgtca ggcatccttc 6000
actactcagc cccggccaga gccctgccca gtgtattgtc caaagggcca gaagggggaa 6060
cctggagaga tgggcctgag aggacaagtt gggcctcctg gcgaccctgg cctcccgggc 6120
aggaccggtg ctcccggccc ccaggggccc cctggaagtg ccactgccaa gggcgagagg 6180
ggcttccctg gagcagatgg gcgtccaggc agccctggcc gcgccgggaa tcctgggacc 6240
cctggagccc ctggcctaaa gggctctcca gggttgcctg gccctcgtgg ggacccggga 6300
gagcgaggac ctcgaggccc aaagggggag ccgggggctc ccggacaagt catcggaggt 6360
gaaggacctg ggcttcctgg gcggaaaggg gaccctggac catcgggccc ccctggacct 6420
cgtggaccac tgggggaccc aggaccccgt ggccccccag ggcttcctgg aacagccatg 6480
aagggtgaca aaggcgatcg tggggagcgg ggtccccctg gaccaggtga aggtggcatt 6540
gctcctgggg agcctgggct gccgggtctt cccggaagcc ctggacccca aggccccgtt 6600
ggcccccctg gaaagaaagg agaaaaaggt gactctgagg atggagctcc aggcctccca 6660
ggacaacctg ggtctccggg tgagcagggc ccacggggac ctcctggagc tattggcccc 6720
aaaggtgacc ggggctttcc agggcccctg ggtgaggctg gagagaaggg cgaacgtgga 6780
cccccaggcc cagcgggatc ccgggggctg ccaggggttg ctggacgtcc tggagccaag 6840
ggtcctgaag ggccaccagg acccactggc cgccaaggag agaaggggga gcctggtcgc 6900
cctggggacc ctgcagtggt gggacctgct gttgctggac ccaaaggaga aaagggagat 6960
gtggggcccg ctgggcccag aggagctacc ggagtccaag gggaacgggg cccacccggc 7020
ttggttcttc ctggagaccc tggccccaag ggagaccctg gagaccgggg tcccattggc 7080
cttactggca gagcaggacc cccaggtgac tcagggcctc ctggagagaa gggagaccct 7140
gggcggcctg gccccccagg acctgttggc ccccgaggac gagatggtga agttggagag 7200
aaaggtgacg agggtcctcc gggtgacccg ggtttgcctg gaaaagcagg cgagcgtggc 7260
cttcgggggg cacctggagt tcgggggcct gtgggtgaaa agggagacca gggagatcct 7320
ggagaggatg gacgaaatgg cagccctgga tcatctggac ccaagggtga ccgtggggag 7380
ccgggtcccc caggaccccc gggacggctg gtagacacag gacctggagc cagagagaag 7440
ggagagcctg gggaccgcgg acaagagggt cctcgagggc ccaagggtga tcctggcctc 7500
cctggagccc ctggggaaag gggcattgaa gggtttcggg gacccccagg cccacagggg 7560
gacccaggtg tccgaggccc agcaggagaa aagggtgacc ggggtccccc tgggctggat 7620
ggccggagcg gactggatgg gaaaccagga gccgctgggc cctctgggcc gaatggtgct 7680
gcaggcaaag ctggggaccc agggagagac gggcttccag gcctccgtgg agaacagggc 7740
ctccctggcc cctctggtcc ccctggatta ccgggaaagc caggcgagga tggcaaacct 7800
ggcctgaatg gaaaaaacgg agaacctggg gaccctggag aagacgggag gaagggagag 7860
aaaggagatt caggcgcctc tgggagagaa ggtcgtgatg gccccaaggg tgagcgtgga 7920
gctcctggta tccttggacc ccaggggcct ccaggcctcc cagggccagt gggccctcct 7980
ggccagggtt ttcctggtgt cccaggaggc acgggcccca agggtgaccg tggggagact 8040
ggatccaaag gggagcaggg cctccctgga gagcgtggcc tgcgaggaga gcctggaagt 8100
gtgccgaatg tggatcggtt gctggaaact gctggcatca aggcatctgc cctgcgggag 8160
atcgtggaga cctgggatga gagctctggt agcttcctgc ctgtgcccga acggcgtcga 8220
ggccccaagg gggactcagg cgaacagggc cccccaggca aggagggccc catcggcttt 8280
cctggagaac gcgggctgaa gggcgaccgt ggagaccctg gccctcaggg gccacctggt 8340
ctggcccttg gggagagggg cccccccggg ccttccggcc ttgccgggga gcctggaaag 8400
cctggtattc ccgggctccc aggcagggct gggggtgtgg gagaggcagg aaggccagga 8460
gagaggggag aacggggaga gaaaggagaa cgtggagaac agggcagaga tggccctcct 8520
ggactccctg gaacccctgg gccccccgga ccccctggcc ccaaggtgtc tgtggatgag 8580
ccaggtcctg gactctctgg agaacaggga ccccctggac tcaagggtgc taagggggag 8640
ccgggcagca atggtgacca aggtcccaaa ggagacaggg gtgtgccagg catcaaagga 8700
gaccggggag agcctggacc gaggggtcag gacggcaacc cgggtctacc aggagagcgt 8760
ggtatggctg ggcctgaagg gaagccgggt ctgcagggtc caagaggccc ccctggccca 8820
gtgggtggtc atggagaccc tggaccacct ggtgccccgg gtcttgctgg ccctgcagga 8880
ccccaaggac cttctggcct gaagggggag cctggagaga caggacctcc aggacggggc 8940
ctgactggac ctactggagc tgtgggactt cctggacccc ccggcccttc aggccttgtg 9000
ggtccacagg ggtctccagg tttgcctgga caagtggggg agacagggaa gccgggagcc 9060
ccaggtcgag atggtgccag tggaaaagat ggagacagag ggagccctgg tgtgccaggg 9120
tcaccaggtc tgcctggccc tgtcggacct aaaggagaac ctggccccac gggggcccct 9180
ggacaggctg tggtcgggct ccctggagca aagggagaga agggagcccc tggaggcctt 9240
gctggagacc tggtgggtga gccgggagcc aaaggtgacc gaggactgcc agggccgcga 9300
ggcgagaagg gtgaagctgg ccgtgcaggg gagcccggag accctgggga agatggtcag 9360
aaaggggctc caggacccaa aggtttcaag ggtgacccag gagtcggggt cccgggctcc 9420
cctgggcctc ctggccctcc aggtgtgaag ggagatctgg gcctccctgg cctgcccggt 9480
gctcctggtg ttgttgggtt cccgggtcag acaggccctc gaggagagat gggtcagcca 9540
ggccctagtg gagagcgggg tctggcaggc cccccaggga gagaaggaat cccaggaccc 9600
ctggggccac ctggaccacc ggggtcagtg ggaccacctg gggcctctgg actcaaagga 9660
gacaagggag accctggagt agggctgcct gggccccgag gcgagcgtgg ggagccaggc 9720
atccggggtg aagatggccg ccccggccag gagggacccc gaggactcac ggggccccct 9780
ggcagcaggg gagagcgtgg ggagaagggt gatgttggga gtgcaggact aaagggtgac 9840
aagggagact cagctgtgat cctggggcct ccaggcccac ggggtgccaa gggggacatg 9900
ggtgaacgag ggcctcgggg cttggatggt gacaaaggac ctcggggaga caatggggac 9960
cctggtgaca agggcagcaa gggagagcct ggtgacaagg gctcagccgg gttgccagga 10020
ctgcgtggac tcctgggacc ccagggtcaa cctggtgcag cagggatccc tggtgacccg 10080
ggatccccag gaaaggatgg agtgcctggt atccgaggag aaaaaggaga tgttggcttc 10140
atgggtcccc ggggcctcaa gggtgaacgg ggagtgaagg gagcctgtgg ccttgatgga 10200
gagaagggag acaagggaga agctggtccc ccaggccgcc ccgggctggc aggacacaaa 10260
ggagagatgg gggagcctgg tgtgccgggc cagtcggggg cccctggcaa ggagggcctg 10320
atcggtccca agggtgaccg aggctttgac gggcagccag gccccaaggg tgaccagggc 10380
gagaaagggg agcggggaac cccaggaatt gggggcttcc caggccccag tggaaatgat 10440
ggctctgctg gtcccccagg gccacctggc agtgttggtc ccagaggccc cgaaggactt 10500
cagggccaga agggtgagcg aggtcccccc ggagagagag tggtgggggc tcctggggtc 10560
cctggagctc ctggcgagag aggggagcag gggcggccag ggcctgccgg tcctcgaggc 10620
gagaagggag aagctgcact gacggaggat gacatccggg gctttgtgcg ccaagagatg 10680
agtcagcact gtgcctgcca gggccagttc atcgcatctg gatcacgacc cctccctagt 10740
tatgctgcag acactgccgg ctcccagctc catgctgtgc ctgtgctccg cgtctctcat 10800
gcagaggagg aagagcgggt accccctgag gatgatgagt actctgaata ctccgagtat 10860
tctgtggagg agtaccagga ccctgaagct ccttgggata gtgatgaccc ctgttccctg 10920
ccactggatg agggctcctg cactgcctac accctgcgct ggtaccatcg ggctgtgaca 10980
ggcagcacag aggcctgtca cccttttgtc tatggtggct gtggagggaa tgccaaccgt 11040
tttgggaccc gtgaggcctg cgagcgccgc tgcccacccc gggtggtcca gagccagggg 11100
acaggtactg cccaggactg a 11121
<210> 28
<211> 3706
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 28
Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu
1 5 10 15
Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp
20 25 30
Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu
35 40 45
Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr
50 55 60
Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val
65 70 75 80
Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu
85 90 95
Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp
100 105 110
Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys
115 120 125
Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys
130 135 140
Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly
145 150 155 160
Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile
165 170 175
His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln
180 185 190
Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu
195 200 205
Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly
210 215 220
Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile
225 230 235 240
Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly
245 250 255
Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly
260 265 270
Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr
275 280 285
Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val
290 295 300
Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu
305 310 315 320
Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu
325 330 335
Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp
340 345 350
His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro
355 360 365
Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu
370 375 380
Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu
385 390 395 400
Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro
405 410 415
Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu
420 425 430
Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val
435 440 445
Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala
450 455 460
Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp
465 470 475 480
Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser
485 490 495
Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe
500 505 510
Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro
515 520 525
Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr
530 535 540
Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu
545 550 555 560
Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met
565 570 575
Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly
580 585 590
Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro
595 600 605
Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu
610 615 620
Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro
625 630 635 640
Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr
645 650 655
Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr
660 665 670
Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly
675 680 685
Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg
690 695 700
Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu
705 710 715 720
Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val
725 730 735
Asp Pro Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys
740 745 750
Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Leu Arg Leu Leu
755 760 765
Val Ala Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg
770 775 780
Ala Gln His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp
785 790 795 800
Ile Val Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe
805 810 815
Arg Glu Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly
820 825 830
Ala Ala Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp
835 840 845
Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp
850 855 860
Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg
865 870 875 880
Thr Gly Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln
885 890 895
Leu Ala Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly
900 905 910
Lys Ser Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln
915 920 925
Gly Val Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu
930 935 940
Leu Lys Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val
945 950 955 960
Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg
965 970 975
Val Cys Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp
980 985 990
Ser Thr Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln
995 1000 1005
Ser Leu Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr
1010 1015 1020
Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser
1025 1030 1035 1040
Glu Arg Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu
1045 1050 1055
Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu
1060 1065 1070
Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr
1075 1080 1085
Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser
1090 1095 1100
Leu Leu Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val
1105 1110 1115 1120
Thr Trp Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly
1125 1130 1135
Pro Gly Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp
1140 1145 1150
Tyr Glu Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala
1155 1160 1165
Thr Ser Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg
1170 1175 1180
Pro Val Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val
1185 1190 1195 1200
Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu
1205 1210 1215
Glu Pro Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln
1220 1225 1230
Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr
1235 1240 1245
Leu Leu Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr
1250 1255 1260
Gly Pro Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu
1265 1270 1275 1280
Leu Pro Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala
1285 1290 1295
Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr
1300 1305 1310
Leu Val Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln
1315 1320 1325
Ala Gly Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg
1330 1335 1340
Glu Gly Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro
1345 1350 1355 1360
Leu Ala Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val
1365 1370 1375
Arg Val Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser
1380 1385 1390
Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp
1395 1400 1405
Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln
1410 1415 1420
Val Ala Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val
1425 1430 1435 1440
Ile Val Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val
1445 1450 1455
Thr Gln Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro
1460 1465 1470
Gly Ala Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu
1475 1480 1485
Lys Ser Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly
1490 1495 1500
Leu Glu Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala
1505 1510 1515 1520
Gly Val Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu
1525 1530 1535
Pro Val Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp
1540 1545 1550
Val Leu Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg
1555 1560 1565
Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu
1570 1575 1580
Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val
1585 1590 1595 1600
Ser Tyr Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr
1605 1610 1615
Pro Val Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu
1620 1625 1630
Gly Thr Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg
1635 1640 1645
Trp Glu Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro
1650 1655 1660
Glu Gly Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser
1665 1670 1675 1680
Tyr His Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu
1685 1690 1695
Ser Val Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala
1700 1705 1710
Arg Thr Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp
1715 1720 1725
Thr Ser Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala
1730 1735 1740
Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu
1745 1750 1755 1760
Val Pro Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg
1765 1770 1775
Val Thr Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro
1780 1785 1790
Val Leu Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro
1795 1800 1805
Val Cys Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr
1810 1815 1820
Gln Asp Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg
1825 1830 1835 1840
Leu Val Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly
1845 1850 1855
Leu Leu Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly
1860 1865 1870
Ser His Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr
1875 1880 1885
Met Asp Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His
1890 1895 1900
Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro
1905 1910 1915 1920
Gly Val Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe
1925 1930 1935
Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu
1940 1945 1950
Gly Met Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly
1955 1960 1965
Met Asp Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu
1970 1975 1980
Asp Gln Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe
1985 1990 1995 2000
Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly
2005 2010 2015
Gln Lys Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro
2020 2025 2030
Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln
2035 2040 2045
Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly
2050 2055 2060
Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr
2065 2070 2075 2080
Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg
2085 2090 2095
Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly
2100 2105 2110
Ala Pro Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg
2115 2120 2125
Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu
2130 2135 2140
Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met
2145 2150 2155 2160
Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly
2165 2170 2175
Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly
2180 2185 2190
Ser Pro Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu
2195 2200 2205
Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly
2210 2215 2220
Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro
2225 2230 2235 2240
Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys
2245 2250 2255
Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly
2260 2265 2270
Val Ala Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro
2275 2280 2285
Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro
2290 2295 2300
Ala Val Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp
2305 2310 2315 2320
Val Gly Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg
2325 2330 2335
Gly Pro Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp
2340 2345 2350
Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro
2355 2360 2365
Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly
2370 2375 2380
Pro Pro Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu
2385 2390 2395 2400
Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala
2405 2410 2415
Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly
2420 2425 2430
Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser
2435 2440 2445
Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro
2450 2455 2460
Gly Pro Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys
2465 2470 2475 2480
Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly
2485 2490 2495
Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe
2500 2505 2510
Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala
2515 2520 2525
Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly
2530 2535 2540
Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala
2545 2550 2555 2560
Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg
2565 2570 2575
Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly
2580 2585 2590
Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu
2595 2600 2605
Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser
2610 2615 2620
Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly
2625 2630 2635 2640
Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro
2645 2650 2655
Val Gly Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly
2660 2665 2670
Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu
2675 2680 2685
Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val
2690 2695 2700
Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu
2705 2710 2715 2720
Ile Val Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro
2725 2730 2735
Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro
2740 2745 2750
Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly
2755 2760 2765
Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly
2770 2775 2780
Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys
2785 2790 2795 2800
Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala
2805 2810 2815
Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly
2820 2825 2830
Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro
2835 2840 2845
Pro Gly Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly
2850 2855 2860
Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu
2865 2870 2875 2880
Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro
2885 2890 2895
Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly
2900 2905 2910
Asn Pro Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys
2915 2920 2925
Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His
2930 2935 2940
Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly
2945 2950 2955 2960
Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro
2965 2970 2975
Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly
2980 2985 2990
Pro Pro Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu
2995 3000 3005
Pro Gly Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp
3010 3015 3020
Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly
3025 3030 3035 3040
Ser Pro Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro
3045 3050 3055
Thr Gly Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly
3060 3065 3070
Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro
3075 3080 3085
Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly
3090 3095 3100
Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln
3105 3110 3115 3120
Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly
3125 3130 3135
Val Pro Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp
3140 3145 3150
Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro
3155 3160 3165
Gly Gln Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly
3170 3175 3180
Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro
3185 3190 3195 3200
Leu Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser
3205 3210 3215
Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro
3220 3225 3230
Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro
3235 3240 3245
Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly
3250 3255 3260
Glu Arg Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp
3265 3270 3275 3280
Lys Gly Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala
3285 3290 3295
Lys Gly Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys
3300 3305 3310
Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly
3315 3320 3325
Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu
3330 3335 3340
Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro
3345 3350 3355 3360
Gly Ser Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly
3365 3370 3375
Asp Val Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val
3380 3385 3390
Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala
3395 3400 3405
Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly
3410 3415 3420
Glu Pro Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu
3425 3430 3435 3440
Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys
3445 3450 3455
Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly
3460 3465 3470
Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro
3475 3480 3485
Pro Gly Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys
3490 3495 3500
Gly Glu Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val
3505 3510 3515 3520
Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala
3525 3530 3535
Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile
3540 3545 3550
Arg Gly Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly
3555 3560 3565
Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp
3570 3575 3580
Thr Ala Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His
3585 3590 3595 3600
Ala Glu Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu
3605 3610 3615
Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp
3620 3625 3630
Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr
3635 3640 3645
Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu
3650 3655 3660
Ala Cys His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg
3665 3670 3675 3680
Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val
3685 3690 3695
Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
3700 3705
<210> 29
<211> 1299
<212> DNA
<213> 智人
<400> 29
atgaccacct ccatccgcca gttcacctcc tccagctcca tcaagggctc ctccggcctg 60
gggggcggct cgtcccgcac ctcctgccgg ctgtctggcg gcctgggtgc cggctcctgc 120
aggctgggat ctgctggcgg cctgggcagc accctcgggg gtagcagcta ctccagctgc 180
tacagctttg gctctggtgg tggctatggc agcagctttg ggggtgttga tgggctgctg 240
gctggaggtg agaaggccac catgcagaac ctcaatgacc gcctggcctc ctacctggac 300
aaggtgcgtg ccctggagga ggccaacact gagctggagg tgaagatccg tgactggtac 360
cagaggcagg ccccggggcc cgcccgtgac tacagccagt actacaggac aattgaggag 420
ctgcagaaca agatcctcac agccaccgtg gacaatgcca acatcctgct acagattgac 480
aatgcccgtc tggctgctga tgacttccgc accaagtttg agacagagca ggccctgcgc 540
ctgagtgtgg aggccgacat caatggcctg cgcagggtgc tggatgagct gaccctggcc 600
agagccgacc tggagatgca gattgagaac ctcaaggagg agctggccta cctgaagaag 660
aaccacgagg aggagatgaa cgccctgcga ggccaggtgg gtggtgagat caatgtggag 720
atggacgctg ccccaggcgt ggacctgagc cgcatcctca acgagatgcg tgaccagtat 780
gagaagatgg cagagaagaa ccgcaaggat gccgaggatt ggttcttcag caagacagag 840
gaactgaacc gcgaggtggc caccaacagt gagctggtgc agagtggcaa gagtgagatc 900
tcggagctcc ggcgcaccat gcaggccttg gagatagagc tgcagtccca gctcagcatg 960
aaagcatccc tggagggcaa cctggcggag acagagaacc gctactgcgt gcagctgtcc 1020
cagatccagg ggctgattgg cagcgtggag gagcagctgg cccagcttcg ctgcgagatg 1080
gagcagcaga accaggaata caaaatcctg ctggatgtga agacgcggct ggagcaggag 1140
attgccacct accgccgcct gctggaggga gaggatgccc acctgactca gtacaagaaa 1200
gaaccggtga ccacccgtca ggtgcgtacc attgtggaag aggtccagga tggcaaggtc 1260
atctcctccc gcgagcaggt ccaccagacc acccgctga 1299
<210> 30
<211> 432
<212> PRT
<213> 智人
<400> 30
Met Thr Thr Ser Ile Arg Gln Phe Thr Ser Ser Ser Ser Ile Lys Gly
1 5 10 15
Ser Ser Gly Leu Gly Gly Gly Ser Ser Arg Thr Ser Cys Arg Leu Ser
20 25 30
Gly Gly Leu Gly Ala Gly Ser Cys Arg Leu Gly Ser Ala Gly Gly Leu
35 40 45
Gly Ser Thr Leu Gly Gly Ser Ser Tyr Ser Ser Cys Tyr Ser Phe Gly
50 55 60
Ser Gly Gly Gly Tyr Gly Ser Ser Phe Gly Gly Val Asp Gly Leu Leu
65 70 75 80
Ala Gly Gly Glu Lys Ala Thr Met Gln Asn Leu Asn Asp Arg Leu Ala
85 90 95
Ser Tyr Leu Asp Lys Val Arg Ala Leu Glu Glu Ala Asn Thr Glu Leu
100 105 110
Glu Val Lys Ile Arg Asp Trp Tyr Gln Arg Gln Ala Pro Gly Pro Ala
115 120 125
Arg Asp Tyr Ser Gln Tyr Tyr Arg Thr Ile Glu Glu Leu Gln Asn Lys
130 135 140
Ile Leu Thr Ala Thr Val Asp Asn Ala Asn Ile Leu Leu Gln Ile Asp
145 150 155 160
Asn Ala Arg Leu Ala Ala Asp Asp Phe Arg Thr Lys Phe Glu Thr Glu
165 170 175
Gln Ala Leu Arg Leu Ser Val Glu Ala Asp Ile Asn Gly Leu Arg Arg
180 185 190
Val Leu Asp Glu Leu Thr Leu Ala Arg Ala Asp Leu Glu Met Gln Ile
195 200 205
Glu Asn Leu Lys Glu Glu Leu Ala Tyr Leu Lys Lys Asn His Glu Glu
210 215 220
Glu Met Asn Ala Leu Arg Gly Gln Val Gly Gly Glu Ile Asn Val Glu
225 230 235 240
Met Asp Ala Ala Pro Gly Val Asp Leu Ser Arg Ile Leu Asn Glu Met
245 250 255
Arg Asp Gln Tyr Glu Lys Met Ala Glu Lys Asn Arg Lys Asp Ala Glu
260 265 270
Asp Trp Phe Phe Ser Lys Thr Glu Glu Leu Asn Arg Glu Val Ala Thr
275 280 285
Asn Ser Glu Leu Val Gln Ser Gly Lys Ser Glu Ile Ser Glu Leu Arg
290 295 300
Arg Thr Met Gln Ala Leu Glu Ile Glu Leu Gln Ser Gln Leu Ser Met
305 310 315 320
Lys Ala Ser Leu Glu Gly Asn Leu Ala Glu Thr Glu Asn Arg Tyr Cys
325 330 335
Val Gln Leu Ser Gln Ile Gln Gly Leu Ile Gly Ser Val Glu Glu Gln
340 345 350
Leu Ala Gln Leu Arg Cys Glu Met Glu Gln Gln Asn Gln Glu Tyr Lys
355 360 365
Ile Leu Leu Asp Val Lys Thr Arg Leu Glu Gln Glu Ile Ala Thr Tyr
370 375 380
Arg Arg Leu Leu Glu Gly Glu Asp Ala His Leu Thr Gln Tyr Lys Lys
385 390 395 400
Glu Pro Val Thr Thr Arg Gln Val Arg Thr Ile Val Glu Glu Val Gln
405 410 415
Asp Gly Lys Val Ile Ser Ser Arg Glu Gln Val His Gln Thr Thr Arg
420 425 430
Claims (251)
1.一种药物组合物,其包含:
a)包含载体的病毒,其中所述载体包含编码选自由以下组成的组的多肽的一种或多种转基因:胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和它们的嵌合多肽;以及
b)药学上可接受的载剂。
2.如权利要求1所述的药物组合物,其中所述病毒是腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。
3.如权利要求1所述的药物组合物,其中所述病毒是单纯疱疹病毒(HSV)。
4.如权利要求1至3中任一项所述的药物组合物,其中所述病毒是复制缺陷型的。
5.如权利要求3所述的药物组合物,其中所述单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。
6.如权利要求3所述的药物组合物,其中所述单纯疱疹病毒包含修饰的包膜。
7.如权利要求6所述的药物组合物,其中相对于野生型单纯疱疹病毒,所述修饰的包膜改变了所述单纯疱疹病毒的组织嗜性。
8.如权利要求6所述的药物组合物,其中所述修饰的包膜包含突变的单纯疱疹病毒糖蛋白。
9.如权利要求1所述的药物组合物,其中所述载体是HSV-1扩增子或HSV-1杂合扩增子。
10.如权利要求9所述的药物组合物,其中所述HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子和HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。
11.如权利要求1所述的药物组合物,其中所述载体是重组单纯疱疹病毒基因组。
12.如权利要求11所述的药物组合物,其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
13.如权利要求11或12所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。
14.如权利要求13所述的药物组合物,其中所述单纯疱疹病毒基因是选自由以下组成的组:ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55。
15.如权利要求11至14中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP4和ICP22基因中的失活性突变。
16.如权利要求11至14中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP0和ICP4基因中的失活性突变。
17.如权利要求15或权利要求16所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4和ICP22基因中的失活性突变。
18.如权利要求15至17中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22和ICP27基因中的失活性突变。
19.如权利要求15至18中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。
20.如权利要求15至18中任一项所述的药物组合物,其中所述失活性突变是所述基因的编码序列的缺失。
21.如权利要求15至20中任一项所述的药物组合物,其还包含所述ICP47基因中的失活性突变。
22.如权利要求11至21中任一项所述的药物组合物,其还包含所述UL41基因中的失活性突变。
23.如权利要求11至22中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种转基因。
24.如权利要求11至23中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种转基因。
25.如权利要求11至24中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种转基因。
26.如权利要求1所述的药物组合物,其中所述载体在递送到靶细胞中时能够在所述靶细胞内复制。
27.如权利要求1所述的药物组合物,其中所述药学上可接受的载剂适于局部施用或透皮施用。
28.如权利要求1所述的药物组合物,其中所述一种或多种转基因包含miRNA结合位点。
29.如权利要求1所述的药物组合物,其中所述一种或多种转基因与一种或多种异源启动子可操作地连接。
30.如权利要求29所述的药物组合物,其中所述一种或多种异源启动子是选自由以下组成的组:人巨细胞病毒(HCMV)立即早期启动子、延伸因子-1(EF1)启动子以及它们的任何组合。
31.如权利要求1所述的药物组合物,其中所述载体包含编码胶原α-1(VII)链多肽的转基因。
32.如权利要求1所述的药物组合物,其中所述载体包含两种转基因,其中每种转基因均编码胶原α-1(VII)链多肽。
33.如权利要求1所述的药物组合物,其中所述胶原α-1(VII)链多肽与SEQ ID NO:2的序列具有至少80%的序列同一性。
34.如权利要求1所述的药物组合物,其中所述胶原α-1(VII)链多肽是片段,其中所述片段具有SEQ ID NO:2的至少100个连续氨基酸。
35.如权利要求1所述的药物组合物,其中当所述胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成。
36.如权利要求1所述的药物组合物,其中当所述胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的上皮基底膜组织和/或上皮基底粘附。
37.如权利要求1所述的药物组合物,其中所述赖氨酰羟化酶3多肽与SEQ ID NO:4的序列具有至少80%的序列同一性。
38.如权利要求1所述的药物组合物,其中所述赖氨酰羟化酶3多肽是片段,其中所述片段具有SEQ ID NO:4的至少100个连续氨基酸。
39.如权利要求1所述的药物组合物,其中当所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述赖氨酰羟化酶3多肽增强、增加、加强和/或强化所述受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。
40.如权利要求1所述的药物组合物,其中当所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
41.如权利要求1所述的药物组合物,其中所述载体至少包含第一转基因和第二转基因。
42.如权利要求41所述的药物组合物,其中所述第一转基因编码胶原α-1(VII)链多肽,并且所述第二转基因编码赖氨酰羟化酶3多肽。
43.如权利要求1所述的药物组合物,其中所述载体包含多顺反子性的转基因。
44.如权利要求43所述的药物组合物,其中所述多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。
45.如权利要求44所述的药物组合物,其中所述第一ORF和所述第二ORF由内部核糖体进入位点(IRES)分开。
46.如权利要求42至45中任一项所述的药物组合物,其中当所述胶原α-1(VII)链多肽和所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述多肽处于约等摩尔比。
47.如权利要求42至45中任一项所述的药物组合物,其中当所述胶原α-1(VII)链多肽和所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
48.如权利要求1所述的药物组合物,其中所述嵌合多肽包含在所述胶原α-1(VII)链多肽与所述赖氨酰羟化酶3多肽之间的接头多肽。
49.如权利要求48所述的药物组合物,其中所述接头多肽是T2A、P2A、E2A或F2A接头多肽。
50.如权利要求48或49所述的药物组合物,其中所述接头多肽与SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10或SEQ ID NO:12的序列具有至少80%的序列同一性。
51.如权利要求48至50中任一项所述的药物组合物,其中所述嵌合多肽与SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26或SEQ ID NO:28的序列具有至少80%的序列同一性。
52.如权利要求48至51中任一项所述的药物组合物,其中当所述嵌合多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
53.一种在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的方法,所述方法包括以局部方式或以透皮方式施用能够增强、增加、加强和/或强化所述受试者的一种或多种细胞中的胶原α-1(VII)链多肽和/或赖氨酰羟化酶3多肽的水平的药物组合物。
54.如权利要求53所述的方法,其中所述药物组合物包含:
a)包含载体的病毒,其中所述载体包含编码选自由以下组成的组的多肽的一种或多种转基因:胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽和它们的嵌合多肽;以及
b)药学上可接受的载剂。
55.如权利要求54所述的方法,其中所述病毒是腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。
56.如权利要求54所述的方法,其中所述病毒是单纯疱疹病毒(HSV)。
57.如权利要求54至56中任一项所述的方法,其中所述病毒是复制缺陷型的。
58.如权利要求56所述的方法,其中所述单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。
59.如权利要求56所述的方法,其中所述单纯疱疹病毒包含修饰的包膜。
60.如权利要求59所述的方法,其中相对于野生型单纯疱疹病毒,所述修饰的包膜改变了所述单纯疱疹病毒的组织嗜性。
61.如权利要求59所述的方法,其中所述修饰的包膜包含突变的单纯疱疹病毒糖蛋白。
62.如权利要求54所述的方法,其中所述载体是HSV-1扩增子或HSV-1杂合扩增子。
63.如权利要求62所述的方法,其中所述HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子和HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。
64.如权利要求54所述的方法,其中所述载体是重组单纯疱疹病毒基因组。
65.如权利要求64所述的方法,其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
66.如权利要求64或65所述的方法,其中所述重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。
67.如权利要求66所述的方法,其中所述单纯疱疹病毒基因是选自由以下组成的组:ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55。
68.如权利要求64至67中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP4和ICP22基因中的失活性突变。
69.如权利要求64至67中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP0和ICP4基因中的失活性突变。
70.如权利要求68或权利要求69所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4和ICP22基因中的失活性突变。
71.如权利要求68至70中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22和ICP27基因中的失活性突变。
72.如权利要求68至71中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。
73.如权利要求68至72中任一项所述的方法,其中所述失活性突变是所述基因的编码序列的缺失。
74.如权利要求68至73中任一项所述的方法,其还包括所述ICP47基因中的失活性突变。
75.如权利要求64至74中任一项所述的方法,其还包括所述UL41基因中的失活性突变。
76.如权利要求64至75中任一项所述的方法,其中所述重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种转基因。
77.如权利要求64至76中任一项所述的方法,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种转基因。
78.如权利要求64至77中任一项所述的方法,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种转基因。
79.如权利要求54所述的方法,其中所述载体在递送到靶细胞中时能够在所述靶细胞内复制。
80.如权利要求54所述的方法,其中所述药学上可接受的载剂适于局部施用或透皮施用。
81.如权利要求54所述的方法,其中所述一种或多种转基因包含miRNA结合位点。
82.如权利要求54所述的方法,其中所述一种或多种转基因与一种或多种异源启动子可操作地连接。
83.如权利要求82所述的方法,其中所述一种或多种异源启动子是选自由以下组成的组:人巨细胞病毒(HCMV)立即早期启动子、延伸因子-1(EF1)启动子以及它们的任何组合。
84.如权利要求54所述的方法,其中所述载体包含编码胶原α-1(VII)链多肽的转基因。
85.如权利要求54所述的方法,其中所述载体包含两种转基因,其中每种转基因均编码胶原α-1(VII)链多肽。
86.如权利要求54所述的方法,其中所述胶原α-1(VII)链多肽与SEQ ID NO:2的序列具有至少80%的序列同一性。
87.如权利要求54所述的方法,其中所述胶原α-1(VII)链多肽是片段,其中所述片段具有SEQ ID NO:2的至少100个连续氨基酸。
88.如权利要求54所述的方法,其中当所述胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成。
89.如权利要求54所述的方法,其中当所述胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的上皮基底膜组织和/或上皮基底粘附。
90.如权利要求54所述的方法,其中所述赖氨酰羟化酶3多肽与SEQ ID NO:4的序列具有至少80%的序列同一性。
91.如权利要求54所述的方法,其中所述赖氨酰羟化酶3多肽是片段,其中所述片段具有SEQ ID NO:4的至少100个连续氨基酸。
92.如权利要求54所述的方法,其中当所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述赖氨酰羟化酶3多肽增强、增加、加强和/或强化所述受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。
93.如权利要求54所述的方法,其中当所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
94.如权利要求54所述的方法,其中所述载体至少包含第一转基因和第二转基因。
95.如权利要求94所述的方法,其中所述第一转基因编码胶原α-1(VII)链多肽,并且所述第二转基因编码赖氨酰羟化酶3多肽。
96.如权利要求54所述的方法,其中所述载体包含多顺反子性的转基因。
97.如权利要求96所述的方法,其中所述多顺反子性转基因在第一开放阅读框(ORF)上编码胶原α-1(VII)链多肽,并且在第二开放阅读框(ORF)上编码赖氨酰羟化酶3多肽。
98.如权利要求97所述的方法,其中所述第一ORF和所述第二ORF由内部核糖体进入位点(IRES)分开。
99.如权利要求95至98中任一项所述的方法,其中当所述胶原α-1(VII)链多肽和所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述多肽处于约等摩尔比。
100.如权利要求95至98中任一项所述的方法,其中当所述胶原α-1(VII)链多肽和所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
101.如权利要求54所述的方法,其中所述嵌合多肽包含在所述胶原α-1(VII)链多肽与所述赖氨酰羟化酶3多肽之间的接头多肽。
102.如权利要求101所述的方法,其中所述接头多肽是T2A、P2A、E2A或F2A接头多肽。
103.如权利要求101或102所述的方法,其中所述接头多肽与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10或SEQ ID NO:12的序列具有至少80%的序列同一性。
104.如权利要求101至103中任一项所述的方法,其中所述嵌合多肽与SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28的序列具有至少80%的序列同一性。
105.如权利要求101至104中任一项所述的方法,其中当所述嵌合多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
106.如权利要求53所述的方法,其中所述药物组合物每天施用一次、两次、三次、四次、五次或更多次。
107.如权利要求53所述的方法,其中所述药物组合物施用于所述受试者的一个或多个受影响的区域和/或未受影响的区域。
108.如权利要求53所述的方法,其中所述皮肤的所述疾病或病症是大疱性表皮松解症、皮肤癌、牛皮癣、扁平苔癣、狼疮、红斑痤疮、湿疹、皮肤念珠菌病、蜂窝织炎、脓疱疮、褥疮、丹毒、寻常型鱼鳞病、皮肌炎、肢端皮炎、淤积性皮炎、内瑟顿综合征、单纯大疱性表皮松解症(LAMB3基因)、常染色体隐性先天性鱼鳞病、着色性干皮病和类天疱疮中的一种或多种。
109.一种分离的嵌合多肽,其中所述分离的嵌合多肽包含;
a)胶原α-1(VII)链多肽;
b)赖氨酰羟化酶3多肽;以及
c)接头多肽;
其中所述胶原α-1(VII)链多肽和所述赖氨酰羟化酶3多肽由所述接头多肽分开。
110.如权利要求109所述的分离的嵌合多肽,其中所述胶原α-1(VII)链多肽与SEQ IDNO:2的序列具有至少80%的序列同一性。
111.如权利要求109所述的分离的嵌合多肽,其中所述赖氨酰羟化酶3多肽与SEQ IDNO:4的序列具有至少80%的序列同一性。
112.如权利要求或109所述的分离的嵌合多肽,其中所述接头多肽与SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10或SEQ ID NO:12的序列具有至少80%的序列同一性。
113.如权利要求109至112中任一项所述的分离的嵌合多肽,其中所述分离的嵌合多肽与SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28的序列具有至少80%的序列同一性。
114.一种编码如权利要求109至113中任一项所述的嵌合多肽的多核苷酸。
115.一种包含如权利要求114所述的多核苷酸的载体。
116.如权利要求115所述的载体,其中所述载体是HSV-1扩增子或HSV-1杂合扩增子。
117.如权利要求116所述的载体,其中所述HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子和HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。
118.如权利要求115所述的载体,其中所述载体是重组单纯疱疹病毒基因组。
119.如权利要求118所述的载体,其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
120.如权利要求118或119所述的载体,其中所述重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。
121.如权利要求120所述的载体,其中所述单纯疱疹病毒基因是选自由以下组成的组:ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55。
122.如权利要求118至121中任一项所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP4和ICP22基因中的失活性突变。
123.如权利要求118至121中任一项所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP0和ICP4基因中的失活性突变。
124.如权利要求122或权利要求123所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4和ICP22基因中的失活性突变。
125.如权利要求122至124中任一项所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22和ICP27基因中的失活性突变。
126.如权利要求122至125中任一项所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。
127.如权利要求122至126中任一项所述的载体,其中所述失活性突变是所述基因的编码序列的缺失。
128.如权利要求122至127中任一项所述的载体,其还包含所述ICP47基因中的失活性突变。
129.如权利要求118至128中任一项所述的载体,其还包含所述UL41基因中的失活性突变。
130.如权利要求118至129中任一项所述的载体,其中所述重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述多核苷酸。
131.如权利要求118至130中任一项所述的载体,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述多核苷酸。
132.如权利要求118至131中任一项所述的载体,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述多核苷酸。
133.一种载体,其包含编码胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽或它们的任何组合的一种或多种多核苷酸,其中所述载体是重组单纯疱疹病毒基因组。
134.如权利要求133所述的载体,其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
135.如权利要求133或权利要求134所述的载体,其中所述重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。
136.如权利要求135所述的载体,其中所述单纯疱疹病毒基因是选自由以下组成的组:ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55。
137.如权利要求133至136中任一项所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP4和ICP22基因中的失活性突变。
138.如权利要求133至136中任一项所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP0和ICP4基因中的失活性突变。
139.如权利要求137或权利要求138所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4和ICP22基因中的失活性突变。
140.如权利要求137至139中任一项所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22和ICP27基因中的失活性突变。
141.如权利要求137至140中任一项所述的载体,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。
142.如权利要求137至141中任一项所述的载体,其中所述失活性突变是所述基因的编码序列的缺失。
143.如权利要求137至142中任一项所述的载体,其还包含所述ICP47基因中的失活性突变。
144.如权利要求133至143中任一项所述的载体,其还包含所述UL41基因中的失活性突变。
145.如权利要求133至144中任一项所述的载体,其中所述重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种多核苷酸。
146.如权利要求133至145中任一项所述的载体,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种多核苷酸。
147.如权利要求133至146中任一项所述的载体,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种多核苷酸。
148.如权利要求133至147中任一项所述的载体,其中所述载体包含一种编码胶原α-1(VII)链多肽的多核苷酸。
149.如权利要求133至147中任一项所述的载体,其中所述载体包含两种编码胶原α-1(VII)链多肽的多核苷酸。
150.一种包含如权利要求115至149中任一项所述的载体的宿主细胞。
151.一种收集单纯疱疹病毒的方法,其中目标载体封装在所述单纯疱疹病毒内,所述方法包括:
a)使宿主细胞与编码辅助病毒的载体接触;
b)使所述宿主细胞与如权利要求115至117中任一项所述的载体接触;以及
c)收集由所述宿主细胞产生的所述单纯疱疹病毒。
152.一种收集单纯疱疹病毒的方法,其中目标载体封装在所述单纯疱疹病毒内,所述方法包括:
a)使互补宿主细胞与如权利要求118至149中任一项所述的载体接触;以及
b)收集由所述互补宿主细胞产生的所述单纯疱疹病毒。
153.如权利要求151或152所述的方法,其中所述单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。
154.一种药盒,其包括:
a)如权利要求1至52中任一项所述的药物组合物;以及
b)用于施用所述药物组合物的说明书。
155.一种药物组合物,其包含:
a)包含载体的病毒,其中所述载体包含编码选自由以下组成的组的多肽的一种或多种转基因:胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽和它们的嵌合多肽;以及
b)药学上可接受的载剂。
156.如权利要求155所述的药物组合物,其中所述病毒是腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。
157.如权利要求155所述的药物组合物,其中所述病毒是单纯疱疹病毒(HSV)。
158.如权利要求155至157中任一项所述的药物组合物,其中所述病毒是复制缺陷型的。
159.如权利要求155至158中任一项所述的药物组合物,其中所述单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。
160.如权利要求155至159中任一项所述的药物组合物,其中所述载体是HSV-1扩增子或HSV-1杂合扩增子。
161.如权利要求160所述的药物组合物,其中所述HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子和HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。
162.如权利要求155至159中任一项所述的药物组合物,其中所述载体是重组单纯疱疹病毒基因组。
163.如权利要求162所述的药物组合物,其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
164.如权利要求162或163所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。
165.如权利要求164所述的药物组合物,其中所述单纯疱疹病毒基因是选自由以下组成的组:ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55。
166.如权利要求162至165中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP4和ICP22基因中的失活性突变。
167.如权利要求162至165中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP0和ICP4基因中的失活性突变。
168.如权利要求166或权利要求167所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4和ICP22基因中的失活性突变。
169.如权利要求166至168中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22和ICP27基因中的失活性突变。
170.如权利要求166至169中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。
171.如权利要求166至170中任一项所述的药物组合物,其中所述失活性突变是所述基因的编码序列的缺失。
172.如权利要求166至171中任一项所述的药物组合物,其还包含所述ICP47基因中的失活性突变。
173.如权利要求162至172中任一项所述的药物组合物,其还包含所述UL41基因中的失活性突变。
174.如权利要求162至173中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种转基因。
175.如权利要求162至174中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种转基因。
176.如权利要求162至175中任一项所述的药物组合物,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种转基因。
177.如权利要求155所述的药物组合物,其中所述载体在递送到靶细胞中时能够在所述靶细胞内复制。
178.如权利要求155所述的药物组合物,其中所述药学上可接受的载剂适于局部施用或透皮施用。
179.如权利要求155所述的药物组合物,其中所述药学上可接受的载剂适于皮下施用或皮内施用。
180.如权利要求155所述的药物组合物,其中所述一种或多种转基因包含miRNA结合位点。
181.如权利要求155至180中任一项所述的药物组合物,其中所述载体包含编码胶原α-1(VII)链多肽的转基因。
182.如权利要求155至180中任一项所述的药物组合物,其中所述载体包含编码赖氨酰羟化酶3多肽的转基因。
183.如权利要求155至180中任一项所述的药物组合物,其中所述载体包含编码角蛋白I型细胞骨架17多肽的转基因。
184.如权利要求155至180中任一项所述的药物组合物,其中所述胶原α-1(VII)链多肽与SEQ ID NO:2的序列具有至少80%的序列同一性。
185.如权利要求155至180中任一项所述的药物组合物,其中所述胶原α-1(VII)链多肽是片段,其中所述片段具有SEQ ID NO:2的至少100个连续氨基酸。
186.如权利要求155至180中任一项所述的药物组合物,其中当所述胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成。
187.如权利要求155至180中任一项所述的药物组合物,其中当所述胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的上皮基底膜组织和/或上皮基底粘附。
188.如权利要求155至180中任一项所述的药物组合物,其中所述赖氨酰羟化酶3多肽与SEQ ID NO:4的序列具有至少80%的序列同一性。
189.如权利要求155至180中任一项所述的药物组合物,其中所述赖氨酰羟化酶3多肽是片段,其中所述片段具有SEQ ID NO:4的至少100个连续氨基酸。
190.如权利要求155至180中任一项所述的药物组合物,其中当所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述赖氨酰羟化酶3多肽增强、增加、加强和/或强化所述受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。
191.如权利要求155至180中任一项所述的药物组合物,其中当所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
192.如权利要求155至180中任一项所述的药物组合物,其中所述角蛋白I型细胞骨架17多肽与SEQ ID NO:30的序列具有至少80%的序列同一性。
193.如权利要求155至180中任一项所述的药物组合物,其中所述角蛋白I型细胞骨架17多肽是片段,其中所述片段具有SEQ ID NO:30的至少100个连续氨基酸。
194.如权利要求155至180中任一项所述的药物组合物,其中所述角蛋白I型细胞骨架17多肽增强、增加、加强和/或强化受试者中的伤口愈合。
195.如权利要求155至194中任一项所述的药物组合物,其中所述载体至少包含第一转基因和第二转基因。
196.如权利要求195所述的药物组合物,其中所述第一转基因和所述第二转基因各自编码胶原α-1(VII)链多肽。
197.如权利要求195所述的药物组合物,其中所述第一转基因编码胶原α-1(VII)链多肽,并且所述第二转基因编码赖氨酰羟化酶3多肽。
198.如权利要求195所述的药物组合物,其中所述第一转基因编码胶原α-1(VII)链多肽,并且所述第二转基因编码角蛋白I型细胞骨架17多肽。
199.如权利要求195所述的药物组合物,其中所述第一转基因编码赖氨酰羟化酶3多肽,并且所述第二转基因编码角蛋白I型细胞骨架17多肽。
200.如权利要求155所述的药物组合物,其中所述载体至少包含第一转基因、第二转基因和第三转基因。
201.如权利要求200所述的药物组合物,其中所述第一转基因编码胶原α-1(VII)链多肽,所述第二转基因编码赖氨酰羟化酶3多肽,并且所述第三转基因编码角蛋白I型细胞骨架17多肽。
202.一种在受试者中提供皮肤的伤口、病症或疾病的预防性、缓和性或治疗性缓解的方法,所述方法包括向所述受试者施用包含载体的药物组合物,其中所述载体是重组单纯疱疹病毒基因组,并且其中所述药物组合物能够增强、增加、加强和/或强化所述受试者的一种或多种细胞中的胶原α-1(VII)链多肽和/或赖氨酰羟化酶3多肽和/或角蛋白I型细胞骨架17多肽的水平。
203.如权利要求202所述的方法,其中所述药物组合物包含:
a)包含所述载体的病毒,其中所述载体包含编码选自由以下组成的组的多肽的一种或多种转基因:胶原α-1(VII)链多肽、赖氨酰羟化酶3多肽、角蛋白I型细胞骨架17多肽和它们的嵌合多肽;以及
b)药学上可接受的载剂。
204.如权利要求203所述的方法,其中所述病毒是腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、单纯疱疹病毒、痘苗病毒或它们的任何杂合病毒。
205.如权利要求203所述的方法,其中所述病毒是单纯疱疹病毒(HSV)。
206.如权利要求203至205中任一项所述的方法,其中所述病毒是复制缺陷型的。
207.如权利要求203至206中任一项所述的方法,其中所述单纯疱疹病毒是1型单纯疱疹病毒、2型单纯疱疹病毒或它们的任何衍生物。
208.如权利要求202至207中任一项所述的方法,其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
209.如权利要求202至208中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含立即早期单纯疱疹病毒基因中的失活性突变。
210.如权利要求209所述的方法,其中所述单纯疱疹病毒基因是选自由以下组成的组:ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55。
211.如权利要求202至210中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP4和ICP22基因中的失活性突变。
212.如权利要求202至210中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP0和ICP4基因中的失活性突变。
213.如权利要求211或权利要求212所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4和ICP22基因中的失活性突变。
214.如权利要求211至213中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22和ICP27基因中的失活性突变。
215.如权利要求211至214中任一项所述的方法,其中所述重组单纯疱疹病毒基因组包含所述ICP0、ICP4、ICP22、ICP27和UL55基因中的失活性突变。
216.如权利要求211至215中任一项所述的方法,其中所述失活性突变是所述基因的编码序列的缺失。
217.如权利要求211至216中任一项所述的方法,其还包括所述ICP47基因中的失活性突变。
218.如权利要求202至217中任一项所述的方法,其还包括所述UL41基因中的失活性突变。
219.如权利要求202至218中任一项所述的方法,其中所述重组单纯疱疹病毒基因组在一个或多个病毒基因座内包含所述一种或多种转基因。
220.如权利要求202至219中任一项所述的方法,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或多个内包含所述一种或多种转基因。
221.如权利要求202至220中任一项所述的方法,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述一种或多种转基因。
222.如权利要求202所述的方法,其中所述载体在递送到靶细胞中时能够在所述靶细胞内复制。
223.如权利要求203所述的方法,其中所述药学上可接受的载剂适于局部施用或透皮施用。
224.如权利要求203所述的方法,其中所述药学上可接受的载剂适于皮下施用或皮内施用。
225.如权利要求203所述的方法,其中所述一种或多种转基因包含miRNA结合位点。
226.如权利要求202至225中任一项所述的方法,其中所述载体包含编码胶原α-1(VII)链多肽的转基因。
227.如权利要求202至225中任一项所述的方法,其中所述载体包含编码赖氨酰羟化酶3多肽的转基因。
228.如权利要求202至225中任一项所述的方法,其中所述载体包含编码角蛋白I型细胞骨架17多肽的转基因。
229.如权利要求202至225中任一项所述的方法,其中所述胶原α-1(VII)链多肽与SEQID NO:2的序列具有至少80%的序列同一性。
230.如权利要求202至225中任一项所述的方法,其中所述胶原α-1(VII)链多肽是片段,其中所述片段具有SEQ ID NO:2的至少100个连续氨基酸。
231.如权利要求202至225中任一项所述的方法,其中当所述胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成。
232.如权利要求202至225中任一项所述的方法,其中当所述胶原α-1(VII)链多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的上皮基底膜组织和/或上皮基底粘附。
233.如权利要求202至225中任一项所述的方法,其中所述赖氨酰羟化酶3多肽与SEQID NO:4的序列具有至少80%的序列同一性。
234.如权利要求202至225中任一项所述的方法,其中所述赖氨酰羟化酶3多肽是片段,其中所述片段具有SEQ ID NO:4的至少100个连续氨基酸。
235.如权利要求202至225中任一项所述的方法,其中当所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述赖氨酰羟化酶3多肽增强、增加、加强和/或强化所述受试者的一种或多种胶原多肽上羟基赖氨酸残基的形成。
236.如权利要求202至225中任一项所述的方法,其中当所述赖氨酰羟化酶3多肽在受试者的一种或多种靶细胞中表达时,所述多肽增强、增加、加强和/或强化所述受试者的锚原纤维形成、上皮基底膜组织和/或上皮基底粘附。
237.如权利要求202至225中任一项所述的方法,其中所述角蛋白I型细胞骨架17多肽与SEQ ID NO:30的序列具有至少80%的序列同一性。
238.如权利要求202至225中任一项所述的方法,其中所述角蛋白I型细胞骨架17多肽是片段,其中所述片段具有SEQ ID NO:30的至少100个连续氨基酸。
239.如权利要求202至225中任一项所述的方法,其中所述角蛋白I型细胞骨架17多肽增强、增加、加强和/或强化受试者中的伤口愈合。
240.如权利要求202至239中任一项所述的方法,其中所述载体至少包含第一转基因和第二转基因。
241.如权利要求240所述的方法,其中所述第一转基因和所述第二转基因各自编码胶原α-1(VII)链多肽。
242.如权利要求240所述的方法,其中所述第一转基因编码胶原α-1(VII)链多肽,并且所述第二转基因编码赖氨酰羟化酶3多肽。
243.如权利要求240所述的方法,其中所述第一转基因编码胶原α-1(VII)链多肽,并且所述第二转基因编码角蛋白I型细胞骨架17多肽。
244.如权利要求240所述的方法,其中所述第一转基因编码赖氨酰羟化酶3多肽,并且所述第二转基因编码角蛋白I型细胞骨架17多肽。
245.如权利要求202至239中任一项所述的方法,其中所述载体至少包含第一转基因、第二转基因和第三转基因。
246.如权利要求245所述的方法,其中所述第一转基因编码胶原α-1(VII)链多肽,所述第二转基因编码赖氨酰羟化酶3多肽,并且所述第三转基因编码角蛋白I型细胞骨架17多肽。
247.如权利要求202至246中任一项所述的方法,其中所述药物组合物以局部方式或以透皮方式施用于所述受试者。
248.如权利要求202至246中任一项所述的方法,其中所述药物组合物以皮下方式或以皮内方式施用于所述受试者。
249.如权利要求202至248中任一项所述的方法,其中所述药物组合物每天施用一次、两次、三次、四次、五次或更多次。
250.如权利要求202至249中任一项所述的方法,其中所述药物组合物施用于所述受试者的一个或多个受影响的区域和/或未受影响的区域。
251.如权利要求202至250中任一项所述的方法,其中所述皮肤的所述疾病或病症是大疱性表皮松解症、皮肤癌、牛皮癣、扁平苔癣、狼疮、红斑痤疮、湿疹、皮肤念珠菌病、蜂窝织炎、脓疱疮、褥疮、丹毒、寻常型鱼鳞病、皮肌炎、肢端皮炎、淤积性皮炎、内瑟顿综合征、单纯大疱性表皮松解症(LAMB3基因)、常染色体隐性先天性鱼鳞病、着色性干皮病和类天疱疮中的一种或多种。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662320316P | 2016-04-08 | 2016-04-08 | |
US62/320,316 | 2016-04-08 | ||
PCT/US2016/068974 WO2017176336A1 (en) | 2016-04-08 | 2016-12-28 | Compositions and methods for the treatment of wounds, disorders, and diseases of the skin |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109072255A true CN109072255A (zh) | 2018-12-21 |
Family
ID=57822104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680084419.7A Pending CN109072255A (zh) | 2016-04-08 | 2016-12-28 | 用于治疗皮肤的伤口、病症和疾病的组合物和方法 |
Country Status (21)
Country | Link |
---|---|
US (7) | US9877990B2 (zh) |
EP (2) | EP3377637B1 (zh) |
JP (3) | JP6970086B2 (zh) |
KR (1) | KR20180128016A (zh) |
CN (1) | CN109072255A (zh) |
AU (3) | AU2016401692B2 (zh) |
CA (1) | CA3017487A1 (zh) |
CL (3) | CL2018002814A1 (zh) |
CY (1) | CY1123024T1 (zh) |
DK (1) | DK3377637T3 (zh) |
ES (1) | ES2796488T3 (zh) |
HR (1) | HRP20200853T1 (zh) |
HU (1) | HUE049237T2 (zh) |
LT (1) | LT3377637T (zh) |
MX (2) | MX2018012135A (zh) |
PL (1) | PL3377637T3 (zh) |
PT (1) | PT3377637T (zh) |
RS (1) | RS60410B1 (zh) |
SG (1) | SG11201808314QA (zh) |
SI (1) | SI3377637T1 (zh) |
WO (1) | WO2017176336A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110312506A (zh) * | 2016-11-14 | 2019-10-08 | 密歇根大学董事会 | 用于阻挡紫外线辐射的组合物和方法 |
CN113454105A (zh) * | 2019-02-08 | 2021-09-28 | 克里斯托生物技术股份有限公司 | 用于递送cftr多肽的组合物和方法 |
CN113646006A (zh) * | 2019-01-18 | 2021-11-12 | 国立大学法人大阪大学 | 用于营养不良型大疱性表皮松解症的治疗剂 |
CN114599673A (zh) * | 2019-10-28 | 2022-06-07 | 中国医学科学院药物研究所 | 一种角蛋白bd-6、制法和其药物组合物与用途 |
WO2024040894A1 (zh) * | 2022-08-23 | 2024-02-29 | 山西锦波生物医药股份有限公司 | 一种生物合成人体结构性材料的制备方法 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
HRP20211456T1 (hr) | 2014-12-26 | 2021-12-24 | Emory University | Protuvirusni derivati n4-hidroksicitidina |
PT3377637T (pt) | 2016-04-08 | 2020-06-17 | Krystal Biotech Inc | Composições para uso em métodos para o tratamento de ferimentos, transtornos e doenças da pele |
SG11201906213UA (en) * | 2017-01-10 | 2019-08-27 | Intrexon Corp | Modulating expression of polypeptides via new gene switch expression systems |
KR102248165B1 (ko) | 2017-12-07 | 2021-05-06 | 에모리 유니버시티 | N4-하이드록시사이티딘 및 유도체 및 이와 관련된 항-바이러스 용도 |
AU2019252658B2 (en) | 2018-04-12 | 2023-09-14 | Krystal Biotech, Inc. | Compositions and methods for the treatment of autosomal recessive congenital ichthyosis |
JP2021521894A (ja) * | 2018-04-27 | 2021-08-30 | クリスタル バイオテック インコーポレイテッド | 審美的用途のための美容用タンパク質をコードする組換え核酸 |
EP3856761A1 (en) * | 2018-09-24 | 2021-08-04 | Krystal Biotech, Inc. | Compositions and methods for the treatment of netherton syndrome |
AU2019346461A1 (en) * | 2018-09-26 | 2021-04-15 | Krystal Biotech, Inc. | Compositions and methods for the treatment of skin diseases |
JP2022527082A (ja) * | 2019-03-27 | 2022-05-30 | フェニックス ティシュー リペア インコーポレイテッド | コラーゲン7組成物を産生するための系および方法 |
US20230118087A1 (en) | 2019-09-03 | 2023-04-20 | Krystal Biotech, Inc. | Compositions and methods for the treatment of congenital ichthyoses |
US20210189427A1 (en) | 2019-12-20 | 2021-06-24 | Krystal Biotech, Inc. | Compositions and methods for gene delivery to the airways and/or lungs |
EP4314028A1 (en) | 2021-04-02 | 2024-02-07 | Krystal Biotech, Inc. | Viral vectors for cancer therapy |
CA3234797A1 (en) | 2021-10-12 | 2023-04-20 | Hal Landy | Collagen 7 protein replacement therapy |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000040734A1 (en) * | 1998-12-31 | 2000-07-13 | Arch Development Corporation | Recombinant herpes simplex virus useful for treating neoplastic disease |
WO2013121202A1 (en) * | 2012-02-15 | 2013-08-22 | University Of Dundee | Treatment of skin disorders |
US20130295076A1 (en) * | 2006-12-20 | 2013-11-07 | University Of Central Florida Research Foundation Inc. | Mcpip as wound therapy |
WO2015117021A1 (en) * | 2014-01-31 | 2015-08-06 | Factor Bioscience Inc. | Methods and products for nucleic acid production and delivery |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5672344A (en) * | 1987-12-30 | 1997-09-30 | The Regents Of The University Of Michigan | Viral-mediated gene transfer system |
US5658724A (en) | 1992-07-31 | 1997-08-19 | University Of Pittsburgh Of The Commonwealth System Of Higher Education | Herpes simplex virus strains deficient for the essential immediate early genes ICP4 and ICP27 and methods for their production, growth and use |
ES2303726T3 (es) * | 1997-04-10 | 2008-08-16 | University Of Southern California | Proteinas modificadas que se fijan a componentes de la matriz extracelular. |
US5998174A (en) | 1997-05-12 | 1999-12-07 | University Of Pittsburgh Of The Commonwealth System Of Higher Education | Multigene vectors |
GB9715085D0 (en) * | 1997-07-18 | 1997-09-24 | Jahoda Amanda J | Gene therapy vehicle |
US6106826A (en) * | 1997-12-17 | 2000-08-22 | Wisconsin Alumni Research Foundation | Replication competent, avirulent Herpes simplex virus as a vector for neural and ocular gene therapy |
GB9801930D0 (en) * | 1998-01-29 | 1998-03-25 | Univ London | Mutant herpes simplex viruses and uses thereof |
AU4680699A (en) * | 1998-06-12 | 1999-12-30 | Aradigm Corporation | Methods of delivering aerosolized polynucleotides to the respiratory tract |
US20040214783A1 (en) * | 2002-05-08 | 2004-10-28 | Terman David S. | Compositions and methods for treatment of neoplastic disease |
GB9930418D0 (en) * | 1999-12-22 | 2000-02-16 | Neurovex Ltd | Replication incompetent herpes virus vectors |
WO2001064747A1 (en) * | 2000-03-02 | 2001-09-07 | Isis Innovation Limited | Mutations in spink5 responsible for netherton's syndrome and atopic diseases |
DE60131569T2 (de) * | 2000-11-28 | 2008-10-23 | The University Of Chicago, Chicago | Genetisch veränderter herpes virus für die behandlung von herz- und gefässerkrankungen |
CA2441663C (en) * | 2001-03-27 | 2013-01-22 | Medigene, Inc. | Viral vectors and their use in therapeutic methods |
EP1487983A4 (en) * | 2002-03-01 | 2007-08-15 | Sloan Kettering Inst Cancer | PREVENTING THE REPEAT AND METASTASIS OF CANCER |
WO2004048938A2 (en) | 2002-11-26 | 2004-06-10 | Protein Design Labs, Inc. | Methods of detecting soft tissue sarcoma, compositions and methods of screening for soft tissue sarcoma modulators |
WO2006002394A2 (en) * | 2004-06-24 | 2006-01-05 | New York University | Avirulent oncolytic herpes simplex virus strains engineered to counter the innate host response |
KR20070100241A (ko) * | 2004-10-28 | 2007-10-10 | 유니버시티 오브 피츠버그 오브 더 커먼웰쓰 시스템 오브 하이어 에듀케이션 | 척수 외상 통증을 위한 말초로 전달된 글루탐산데카르복실라제 유전자 치료법 |
DK2377546T3 (en) * | 2004-12-21 | 2017-02-13 | Musc Found For Res Dev | Compositions and Methods to Promote Wound Healing and Tissue Regeneration |
WO2006079014A2 (en) * | 2005-01-21 | 2006-07-27 | Introgen Therapeutics, Inc. | Topical administration permitting prolonged exposure of target cells to therapeutic and prophylactic nucleic acids |
US20070020238A1 (en) * | 2005-06-01 | 2007-01-25 | David Baltimore | Method of targeted gene delivery using viral vectors |
WO2008106646A2 (en) * | 2007-03-01 | 2008-09-04 | Introgen Therapeutics, Inc | Methods and formulations for topical gene therapy |
WO2008143875A1 (en) * | 2007-05-14 | 2008-11-27 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | Targeted delivery of glycine receptors to excitable cells |
US20100081707A1 (en) * | 2008-02-21 | 2010-04-01 | Ali Robin R | Devices and methods for delivering polynucleotides into retinal cells of the macula and fovea |
EP3590533A1 (en) * | 2009-05-22 | 2020-01-08 | Genocea Biosciences, Inc. | Vaccines against herpes simplex virus type 2: compositions and methods for eliciting an immune response |
CN102212559B (zh) | 2011-04-14 | 2014-04-09 | 郑州威瑞生物技术有限公司 | 一种重组的hsv扩增子载体及其用途 |
ES2867054T3 (es) * | 2011-10-11 | 2021-10-20 | Inst Nat Sante Rech Med | Tratamiento de salto de exones para epidermólisis ampollosa distrófica |
AU2013263502B2 (en) * | 2012-05-18 | 2018-02-08 | Otago Innovation Limited | Combination treatments and compositions for wound healing |
ES2750550T3 (es) * | 2013-03-01 | 2020-03-26 | Univ Minnesota | Corrección de gen a base de TALEN |
AU2014236305B2 (en) * | 2013-03-14 | 2019-01-17 | Ethris Gmbh | CFTR mRNA compositions and related methods and uses |
AU2014290568B2 (en) | 2013-07-17 | 2020-10-15 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | Non-toxic hsv vectors for efficient gene delivery applications and complementing cells for their production |
AU2014342465B2 (en) * | 2013-10-28 | 2018-03-08 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | Oncolytic HSV vector |
GB2526339A (en) * | 2014-05-21 | 2015-11-25 | Imp Innovations Ltd | Lentiviral vectors |
US20160082129A1 (en) * | 2014-09-24 | 2016-03-24 | Aerpio Therapeutics, Inc. | VE-PTP Extracellular Domain Antibodies Delivered by a Gene Therapy Vector |
JP6925805B2 (ja) * | 2014-10-31 | 2021-08-25 | 京都府公立大学法人 | ラミニンによる角膜の新規治療 |
EP4406585A3 (en) * | 2015-02-13 | 2024-10-23 | Factor Bioscience Inc. | Nucleic acid products and methods of administration thereof |
EP3302575A4 (en) * | 2015-05-28 | 2019-01-16 | Coda Biotherapeutics | GENOME EDITION VECTORS |
RU2762747C2 (ru) * | 2015-12-14 | 2021-12-22 | Зе Трастис Оф Зе Юниверсити Оф Пенсильвания | Генная терапия офтальмологических нарушений |
EP4089166A1 (en) * | 2016-01-27 | 2022-11-16 | Oncorus, Inc. | Oncolytic viral vectors and uses thereof |
CN109362223B (zh) * | 2016-03-25 | 2023-08-25 | 普瑞菲根公司 | 高转导hsv载体 |
EP3432905B1 (en) * | 2016-03-25 | 2022-06-01 | PeriphaGen, Inc. | Hsv vectors for delivery of nt3 and treatment of cipn |
PT3377637T (pt) | 2016-04-08 | 2020-06-17 | Krystal Biotech Inc | Composições para uso em métodos para o tratamento de ferimentos, transtornos e doenças da pele |
AU2019252658B2 (en) | 2018-04-12 | 2023-09-14 | Krystal Biotech, Inc. | Compositions and methods for the treatment of autosomal recessive congenital ichthyosis |
JP2021521894A (ja) | 2018-04-27 | 2021-08-30 | クリスタル バイオテック インコーポレイテッド | 審美的用途のための美容用タンパク質をコードする組換え核酸 |
CA3103374A1 (en) | 2018-06-29 | 2020-01-02 | Krystal Biotech, Inc. | Compositions and methods for antibody delivery |
-
2016
- 2016-12-28 PT PT168268738T patent/PT3377637T/pt unknown
- 2016-12-28 WO PCT/US2016/068974 patent/WO2017176336A1/en active Application Filing
- 2016-12-28 CA CA3017487A patent/CA3017487A1/en active Pending
- 2016-12-28 LT LTEP16826873.8T patent/LT3377637T/lt unknown
- 2016-12-28 RS RS20200669A patent/RS60410B1/sr unknown
- 2016-12-28 HU HUE16826873A patent/HUE049237T2/hu unknown
- 2016-12-28 KR KR1020187030112A patent/KR20180128016A/ko not_active Application Discontinuation
- 2016-12-28 JP JP2018521309A patent/JP6970086B2/ja active Active
- 2016-12-28 SG SG11201808314QA patent/SG11201808314QA/en unknown
- 2016-12-28 PL PL16826873T patent/PL3377637T3/pl unknown
- 2016-12-28 DK DK16826873.8T patent/DK3377637T3/da active
- 2016-12-28 SI SI201630776T patent/SI3377637T1/sl unknown
- 2016-12-28 CN CN201680084419.7A patent/CN109072255A/zh active Pending
- 2016-12-28 US US15/393,151 patent/US9877990B2/en active Active
- 2016-12-28 EP EP16826873.8A patent/EP3377637B1/en active Active
- 2016-12-28 MX MX2018012135A patent/MX2018012135A/es unknown
- 2016-12-28 AU AU2016401692A patent/AU2016401692B2/en active Active
- 2016-12-28 ES ES16826873T patent/ES2796488T3/es active Active
- 2016-12-28 EP EP20161137.3A patent/EP3712273A1/en active Pending
-
2017
- 2017-12-21 US US15/851,488 patent/US10155016B2/en active Active
-
2018
- 2018-10-03 CL CL2018002814A patent/CL2018002814A1/es unknown
- 2018-10-04 MX MX2022006072A patent/MX2022006072A/es unknown
- 2018-10-31 US US16/177,153 patent/US10441614B2/en active Active
-
2019
- 2019-10-10 US US16/598,982 patent/US11185564B2/en active Active
- 2019-12-13 AU AU2019280069A patent/AU2019280069B2/en active Active
-
2020
- 2020-05-27 HR HRP20200853TT patent/HRP20200853T1/hr unknown
- 2020-06-05 CY CY20201100503T patent/CY1123024T1/el unknown
-
2021
- 2021-04-09 CL CL2021000881A patent/CL2021000881A1/es unknown
- 2021-10-27 JP JP2021175260A patent/JP7480105B2/ja active Active
- 2021-11-17 US US17/529,161 patent/US20220273737A1/en not_active Abandoned
-
2022
- 2022-06-30 AU AU2022204729A patent/AU2022204729A1/en active Pending
- 2022-11-30 US US18/060,515 patent/US11865148B2/en active Active
-
2023
- 2023-03-15 CL CL2023000743A patent/CL2023000743A1/es unknown
- 2023-06-27 US US18/342,284 patent/US20230414686A1/en active Pending
- 2023-07-04 JP JP2023109819A patent/JP2023118838A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000040734A1 (en) * | 1998-12-31 | 2000-07-13 | Arch Development Corporation | Recombinant herpes simplex virus useful for treating neoplastic disease |
US20130295076A1 (en) * | 2006-12-20 | 2013-11-07 | University Of Central Florida Research Foundation Inc. | Mcpip as wound therapy |
WO2013121202A1 (en) * | 2012-02-15 | 2013-08-22 | University Of Dundee | Treatment of skin disorders |
WO2015117021A1 (en) * | 2014-01-31 | 2015-08-06 | Factor Bioscience Inc. | Methods and products for nucleic acid production and delivery |
Non-Patent Citations (8)
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110312506A (zh) * | 2016-11-14 | 2019-10-08 | 密歇根大学董事会 | 用于阻挡紫外线辐射的组合物和方法 |
CN113646006A (zh) * | 2019-01-18 | 2021-11-12 | 国立大学法人大阪大学 | 用于营养不良型大疱性表皮松解症的治疗剂 |
CN113454105A (zh) * | 2019-02-08 | 2021-09-28 | 克里斯托生物技术股份有限公司 | 用于递送cftr多肽的组合物和方法 |
CN114599673A (zh) * | 2019-10-28 | 2022-06-07 | 中国医学科学院药物研究所 | 一种角蛋白bd-6、制法和其药物组合物与用途 |
CN114599673B (zh) * | 2019-10-28 | 2024-04-12 | 中国医学科学院药物研究所 | 一种角蛋白bd-6、制法和其药物组合物与用途 |
WO2024040894A1 (zh) * | 2022-08-23 | 2024-02-29 | 山西锦波生物医药股份有限公司 | 一种生物合成人体结构性材料的制备方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109072255A (zh) | 用于治疗皮肤的伤口、病症和疾病的组合物和方法 | |
JP2024056823A (ja) | 審美的用途のための美容用タンパク質をコードする組換え核酸 | |
KR20210040948A (ko) | 단핵구 및 대식세포의 염증성 표현형을 조절하기 위한 조성물 및 방법, 그리고 이의 면역요법 용도 | |
WO2013152351A2 (en) | Fusion polypeptides and methods of use thereof | |
CN101511181A (zh) | 蛋白、编码该蛋白的核酸和相关的应用方法 | |
CN100558745C (zh) | 同种排斥反应的特异性抑制 | |
KR20100017494A (ko) | 프로테오글리칸 폴리펩타이드를 암호화하는 핵산을 이용한 상처 및 피부손상의 치료 | |
US6300484B1 (en) | DNA encoding DP. 75 and a process for its use | |
Borsi et al. | Differential expression of the fibronectin isoform containing the ED-B oncofetal domain in normal human fibroblast cell lines originating from different tissues | |
KR102049987B1 (ko) | Nkx3.2 단편 및 이를 함유하는 약학 조성물 | |
JP2002525081A (ja) | 低酸素により調節される遺伝子転写に特徴的な配列 | |
CN110167564A (zh) | 调节tjp1表达以调节心脏细胞的再生 | |
JPH09502094A (ja) | 老化細胞由来dna合成阻害因子 | |
Gribaudo et al. | The antiproliferative activity of the murine interferon-inducible Ifi 200 proteins depends on the presence of two 200 amino acid domains | |
KR20190015153A (ko) | 간세포성장인자를 발현하는 중간엽줄기세포를 유효성분으로 포함하는 혈관계 질환 예방 또는 치료용 약학적 조성물 | |
CA2496891A1 (en) | Novel actin-related cytoskeletal protein lacs | |
CN105112550B (zh) | 作为骨质疏松症诊治靶标的mtus1基因 | |
Grötzinger et al. | A highly amplified mouse gene is homologous to the human interferon-responsive Sp100 gene encoding an autoantigen associated with nuclear dots | |
CN105087821B (zh) | 一种诊治骨质疏松症的分子标志物 | |
SK8882002A3 (en) | Human heparanase-related polypeptide and nucleic acid | |
WO2010053199A1 (ja) | 前立腺癌の治療用医薬組成物及び前立腺癌の治療方法 | |
CN102772782B (zh) | 一种新的肝癌分子标志物视黄酸受体应答蛋白2 | |
KR19980701695A (ko) | 미오신 중쇄 sm1 이소폼 단백질을 암호화하는 dna를 벡터 dna에 삽입시킨 재조합 dna, 전기 재조합 dna가 도입된 미생물 및 재조합 dna를 포함하는 동맥경화증 치료제 | |
WO2008118100A1 (en) | Method of enhancing migration of neural precursor cells | |
CN101237884A (zh) | 与低氧应激反应有关的Int6蛋白及其用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |