KR20140095010A - 키메라 거미 실크 및 이의 용도 - Google Patents
키메라 거미 실크 및 이의 용도 Download PDFInfo
- Publication number
- KR20140095010A KR20140095010A KR1020137010776A KR20137010776A KR20140095010A KR 20140095010 A KR20140095010 A KR 20140095010A KR 1020137010776 A KR1020137010776 A KR 1020137010776A KR 20137010776 A KR20137010776 A KR 20137010776A KR 20140095010 A KR20140095010 A KR 20140095010A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- aly
- ala
- silk
- gly aly
- Prior art date
Links
- 229920001872 Spider silk Polymers 0.000 title claims abstract description 187
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 252
- 241000255789 Bombyx mori Species 0.000 claims abstract description 230
- 239000000835 fiber Substances 0.000 claims abstract description 185
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 161
- 230000009261 transgenic effect Effects 0.000 claims abstract description 89
- 239000013598 vector Substances 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims abstract description 60
- 230000014509 gene expression Effects 0.000 claims abstract description 43
- 238000004519 manufacturing process Methods 0.000 claims abstract description 36
- 239000005090 green fluorescent protein Substances 0.000 claims description 39
- 239000002131 composite material Substances 0.000 claims description 27
- 108010043121 Green Fluorescent Proteins Proteins 0.000 claims description 25
- 102000004144 Green Fluorescent Proteins Human genes 0.000 claims description 24
- 235000013601 eggs Nutrition 0.000 claims description 13
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 10
- 230000012010 growth Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 101710197767 Fibroin heavy chain Proteins 0.000 claims description 5
- 108010022355 Fibroins Proteins 0.000 claims description 5
- 210000004898 n-terminal fragment Anatomy 0.000 claims description 5
- 210000004900 c-terminal fragment Anatomy 0.000 claims description 4
- 241000255783 Bombycidae Species 0.000 claims description 2
- 230000001737 promoting effect Effects 0.000 claims description 2
- 241000255925 Diptera Species 0.000 claims 1
- 230000004962 physiological condition Effects 0.000 claims 1
- 230000001225 therapeutic effect Effects 0.000 claims 1
- 241000239290 Araneae Species 0.000 abstract description 70
- 239000013612 plasmid Substances 0.000 abstract description 51
- 230000001747 exhibiting effect Effects 0.000 abstract description 4
- 150000001413 amino acids Chemical group 0.000 description 169
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 128
- 108010043293 glycyl-prolyl-glycyl-glycine Proteins 0.000 description 116
- PEZMQPADLFXCJJ-ZETCQYMHSA-N 2-[[2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)NCC(O)=O PEZMQPADLFXCJJ-ZETCQYMHSA-N 0.000 description 113
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 86
- 108010079364 N-glycylalanine Proteins 0.000 description 86
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 67
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 65
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 63
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 56
- 210000004907 gland Anatomy 0.000 description 49
- 108010047495 alanylglycine Proteins 0.000 description 40
- 210000004027 cell Anatomy 0.000 description 40
- 108020004414 DNA Proteins 0.000 description 37
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 35
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 31
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 28
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 28
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 28
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 25
- 239000000463 material Substances 0.000 description 25
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 24
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 23
- 239000012634 fragment Substances 0.000 description 21
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 21
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 20
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 20
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 19
- 238000000605 extraction Methods 0.000 description 18
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 17
- 210000001519 tissue Anatomy 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 16
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 14
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 14
- 238000011144 upstream manufacturing Methods 0.000 description 14
- 241000238631 Hexapoda Species 0.000 description 13
- 239000003814 drug Substances 0.000 description 13
- 108020001507 fusion proteins Proteins 0.000 description 13
- 102000037865 fusion proteins Human genes 0.000 description 13
- 108010078144 glutaminyl-glycine Proteins 0.000 description 13
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 12
- 239000000499 gel Substances 0.000 description 11
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 11
- 108010077515 glycylproline Proteins 0.000 description 11
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 10
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 10
- 241000238902 Nephila clavipes Species 0.000 description 9
- 229940124597 therapeutic agent Drugs 0.000 description 9
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 9
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 238000005286 illumination Methods 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 230000003248 secreting effect Effects 0.000 description 8
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 8
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 7
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 7
- 108010013296 Sericins Proteins 0.000 description 7
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008774 maternal effect Effects 0.000 description 7
- 230000008929 regeneration Effects 0.000 description 7
- 238000011069 regeneration method Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 6
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 6
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 230000001900 immune effect Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- QWTLUPDHBKBULE-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[[2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QWTLUPDHBKBULE-UHFFFAOYSA-N 0.000 description 5
- 241000023938 Argiope trifasciata Species 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 108010025198 decaglycine Proteins 0.000 description 5
- 210000003041 ligament Anatomy 0.000 description 5
- 210000001161 mammalian embryo Anatomy 0.000 description 5
- 239000011859 microparticle Substances 0.000 description 5
- 239000008188 pellet Substances 0.000 description 5
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 5
- 238000009987 spinning Methods 0.000 description 5
- 230000001954 sterilising effect Effects 0.000 description 5
- 238000004659 sterilization and disinfection Methods 0.000 description 5
- 210000002435 tendon Anatomy 0.000 description 5
- 238000002054 transplantation Methods 0.000 description 5
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 5
- 229910052721 tungsten Inorganic materials 0.000 description 5
- 239000010937 tungsten Substances 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 4
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 4
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 4
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 4
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 4
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 4
- 210000000988 bone and bone Anatomy 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 229940126864 fibroblast growth factor Drugs 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 238000000520 microinjection Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 4
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 3
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 3
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 3
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 241000593989 Scardinius erythrophthalmus Species 0.000 description 3
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 3
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 3
- 208000027418 Wounds and injury Diseases 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000002459 blastocyst Anatomy 0.000 description 3
- 210000001172 blastoderm Anatomy 0.000 description 3
- 238000009395 breeding Methods 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012377 drug delivery Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 210000002744 extracellular matrix Anatomy 0.000 description 3
- 238000007380 fibre production Methods 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 229920002674 hyaluronan Polymers 0.000 description 3
- 229960003160 hyaluronic acid Drugs 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 210000005036 nerve Anatomy 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 210000003101 oviduct Anatomy 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000012743 protein tagging Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 230000008961 swelling Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- 241000326710 Argiope lobata Species 0.000 description 2
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 2
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 229920001651 Cyanoacrylate Polymers 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 108091005942 ECFP Proteins 0.000 description 2
- 102000016942 Elastin Human genes 0.000 description 2
- 108010014258 Elastin Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 2
- 241000255890 Galleria Species 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 2
- 229920002683 Glycosaminoglycan Polymers 0.000 description 2
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 2
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 108050007496 Shikimate kinase 2 Proteins 0.000 description 2
- 102000013275 Somatomedins Human genes 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 239000003708 ampul Substances 0.000 description 2
- 230000000202 analgesic effect Effects 0.000 description 2
- 210000001264 anterior cruciate ligament Anatomy 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000975 bioactive effect Effects 0.000 description 2
- 229920000249 biocompatible polymer Polymers 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 229940112869 bone morphogenetic protein Drugs 0.000 description 2
- 210000000845 cartilage Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 238000002316 cosmetic surgery Methods 0.000 description 2
- 238000009402 cross-breeding Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 125000000664 diazo group Chemical group [N-]=[N+]=[*] 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 229920002549 elastin Polymers 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000000799 fluorescence microscopy Methods 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 239000001307 helium Substances 0.000 description 2
- 229910052734 helium Inorganic materials 0.000 description 2
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 238000002513 implantation Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 102000006495 integrins Human genes 0.000 description 2
- 108010044426 integrins Proteins 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000002894 multi-fate stem cell Anatomy 0.000 description 2
- 150000007523 nucleic acids Chemical group 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 108010054442 polyalanine Proteins 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000001681 protective effect Effects 0.000 description 2
- 238000000751 protein extraction Methods 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 210000002955 secretory cell Anatomy 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 239000002407 tissue scaffold Substances 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 1
- YIKZEZHFGMRQCO-CIUDSAMLSA-N 2-[[(2s)-2-[[2-[[(2s)-2-[[2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]acetyl]amino]propanoyl]amino]acetyl]amino]propanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO YIKZEZHFGMRQCO-CIUDSAMLSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- QGHDLJAZIIFENW-UHFFFAOYSA-N 4-[1,1,1,3,3,3-hexafluoro-2-(4-hydroxy-3-prop-2-enylphenyl)propan-2-yl]-2-prop-2-enylphenol Chemical group C1=C(CC=C)C(O)=CC=C1C(C(F)(F)F)(C(F)(F)F)C1=CC=C(O)C(CC=C)=C1 QGHDLJAZIIFENW-UHFFFAOYSA-N 0.000 description 1
- 101710191899 Actin-depolymerizing factor 3 Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 108700032845 Ala(2)- enkephalinamide-Met Proteins 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241001157788 Araneus Species 0.000 description 1
- 241000193935 Araneus diadematus Species 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 241001203868 Autographa californica Species 0.000 description 1
- 241000255791 Bombyx Species 0.000 description 1
- 101001052041 Bombyx mori Fibroin heavy chain Proteins 0.000 description 1
- 241000251204 Chimaeridae Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 238000011537 Coomassie blue staining Methods 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 102400001368 Epidermal growth factor Human genes 0.000 description 1
- 101800003838 Epidermal growth factor Proteins 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 101710124870 Fibroin light chain Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 101710190239 Hexamerin Proteins 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 206010060820 Joint injury Diseases 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 206010024825 Loose associations Diseases 0.000 description 1
- 241001608711 Melo Species 0.000 description 1
- MWCLLHOVUTZFKS-UHFFFAOYSA-N Methyl cyanoacrylate Chemical compound COC(=O)C(=C)C#N MWCLLHOVUTZFKS-UHFFFAOYSA-N 0.000 description 1
- 229920001410 Microfiber Polymers 0.000 description 1
- 210000004460 N cell Anatomy 0.000 description 1
- 241000238903 Nephila Species 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 229920000805 Polyaspartic acid Polymers 0.000 description 1
- 229920000954 Polyglycolide Polymers 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000382353 Pupa Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000242583 Scyphozoa Species 0.000 description 1
- 102000003800 Selectins Human genes 0.000 description 1
- 108090000184 Selectins Proteins 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- 239000004830 Super Glue Substances 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- 108010074506 Transfer Factor Proteins 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 1
- 108010009583 Transforming Growth Factors Proteins 0.000 description 1
- 102000009618 Transforming Growth Factors Human genes 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- QPMSXSBEVQLBIL-CZRHPSIPSA-N ac1mix0p Chemical compound C1=CC=C2N(C[C@H](C)CN(C)C)C3=CC(OC)=CC=C3SC2=C1.O([C@H]1[C@]2(OC)C=CC34C[C@@H]2[C@](C)(O)CCC)C2=C5[C@]41CCN(C)[C@@H]3CC5=CC=C2O QPMSXSBEVQLBIL-CZRHPSIPSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 239000002260 anti-inflammatory agent Substances 0.000 description 1
- 229940121363 anti-inflammatory agent Drugs 0.000 description 1
- 230000003409 anti-rejection Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 229960005475 antiinfective agent Drugs 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 235000021405 artificial diet Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000000560 biocompatible material Substances 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 210000003321 cartilage cell Anatomy 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000001612 chondrocyte Anatomy 0.000 description 1
- 210000001136 chorion Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229940116977 epidermal growth factor Drugs 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- DNJIEGIFACGWOD-UHFFFAOYSA-N ethyl mercaptane Natural products CCS DNJIEGIFACGWOD-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 239000002657 fibrous material Substances 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002439 hemostatic effect Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 238000011532 immunohistochemical staining Methods 0.000 description 1
- 238000012606 in vitro cell culture Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000003658 microfiber Substances 0.000 description 1
- 238000002406 microsurgery Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 210000000944 nerve tissue Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000002352 nonmutagenic effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 235000015145 nougat Nutrition 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 230000011164 ossification Effects 0.000 description 1
- 210000004409 osteocyte Anatomy 0.000 description 1
- 230000003239 periodontal effect Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 239000005014 poly(hydroxyalkanoate) Substances 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 108010064470 polyaspartate Proteins 0.000 description 1
- 229920001610 polycaprolactone Polymers 0.000 description 1
- 239000004632 polycaprolactone Substances 0.000 description 1
- 239000004633 polyglycolic acid Substances 0.000 description 1
- 229920000903 polyhydroxyalkanoate Polymers 0.000 description 1
- 239000004626 polylactic acid Substances 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- AAEVYOVXGOFMJO-UHFFFAOYSA-N prometryn Chemical compound CSC1=NC(NC(C)C)=NC(NC(C)C)=N1 AAEVYOVXGOFMJO-UHFFFAOYSA-N 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 235000019624 protein content Nutrition 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000001799 protein solubilization Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000000384 rearing effect Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000002278 reconstructive surgery Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010064995 silkworm fibroin Proteins 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108010028203 spidroin 2 Proteins 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000003356 suture material Substances 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 1
- 230000008467 tissue growth Effects 0.000 description 1
- 230000017423 tissue regeneration Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010052768 tyrosyl-isoleucyl-glycyl-seryl-arginine Proteins 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000009278 visceral effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
- C07K14/43586—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from silkworms
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New breeds of animals
- A01K67/033—Rearing or breeding invertebrates; New breeds of invertebrates
- A01K67/0333—Genetically modified invertebrates, e.g. transgenic, polyploid
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New breeds of animals
- A01K67/033—Rearing or breeding invertebrates; New breeds of invertebrates
- A01K67/04—Silkworms
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43513—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
- C07K14/43518—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K4/00—Peptides having up to 20 amino acids in an undefined or only partially defined sequence; Derivatives thereof
- C07K4/12—Peptides having up to 20 amino acids in an undefined or only partially defined sequence; Derivatives thereof from animals; from humans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1082—Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- D—TEXTILES; PAPER
- D02—YARNS; MECHANICAL FINISHING OF YARNS OR ROPES; WARPING OR BEAMING
- D02G—CRIMPING OR CURLING FIBRES, FILAMENTS, THREADS, OR YARNS; YARNS OR THREADS
- D02G3/00—Yarns or threads, e.g. fancy yarns; Processes or apparatus for the production thereof, not otherwise provided for
- D02G3/02—Yarns or threads characterised by the material or by the materials from which they are made
- D02G3/04—Blended or other yarns or threads containing components made from different materials
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
- A01K2217/052—Animals comprising random inserted nucleic acids (transgenic) inducing gain of function
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/70—Invertebrates
- A01K2227/706—Insects, e.g. Drosophila melanogaster, medfly
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/01—Animal expressing industrially exogenous proteins
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/02—Animal zootechnically ameliorated
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
Abstract
키메라 거미 실크 단백질 유전자를 보유하고 발현하도록 유전자 조작된 형질전환 누에로서, 키메라 거미 실크 단백질 유전자는 거미 실크 탄성 모티프 서열 및/또는 거미 실크 강도 모티프 서열에 대해 특이적인 거미 실크 도메인을 가지고 있는 키메라 거미 실크 단백질을 암호화하는 형질전환 누에가 개시된다. 또한, 천연 누에 실크 섬유에 비해 향상된 (인장) 강도 및 탄성 특성을 나타내는 향상된 누에 실크 섬유가 제공된다. 본원에 개시된 형질전환 누에를 이용하는, 키메라 실크 섬유를 제조하는 향상된 방법으로, 피기백 벡터 시스템과 헬퍼 플라스미드를 이용하는 방법 또한 제공된다. 유전자 발현 카세트가 제공되며, 여러 가지 합성 거미 실크 암호화 서열(거미 2, 거미 4, 거미 6, 거미 8)을 제조하는 데 이용된다. 피기백 벡터 시스템은 안정적인 형질전환체를 제공하기 위하여 헬퍼 플라스미드 존재 시, 누에 안으로 키메라 거미 실크 유전자를 도입하기 위하여, 돌연변이 누에를 형질전환하는 데 이용된다. 따라서, 이들 형질전환 누에는 실크 섬유의 상업용 생산에 적합한, 효율적으로 거미 실크를 생산하는 생물을 제공한다.
Description
본 연구는 미국 국립보건원(National Institutes of Health) 산하 국립생의학영상 및 생체공학연구소(National Institute of Biomedical Imaging and Bioengineering)(DLJ)로부터 보조금 제R21 EB007247호를 지원 받았으므로, 미국 정부는 본 출원의 기술에 관한 권한을 소유할 수 있다. 노트르담대학교 연구국(University of Notre Dame Office of Research)(MJF)과 공동 연구 계약이 있으며, 크레이크 바이오크래프트 래버러토리즈 사(Kraig BioCraft Laboratories, Inc.)(MJF)와의 연구 계약이 있다.
<기술분야>
향상된 강도와 유연성 특성이 있는 키메라 거미 실크 섬유가 제공되므로, 본 발명은 실크 섬유 분야에 관한 것이다. 또한, 특정 거미 실크 유전자 서열(거미실크의 강도 및/또는 거미 실크의 유연성 및/또는 탄성 모티프 서열)을 가지고 있는 유전자 조작된 형질전환 누에를 이용하는 향상된 실크 섬유(특히, 누에/거미 실크 키메라 섬유)를 생산하는 방법이 제공되므로, 본 발명은 키메라 실크 섬유의 생산방법 분야에 관한 것이다. 또한, 거미 실크의 유연성 및/또는 탄성 모티프와 거미 실크의 강도 모티프에 대해 특이적인 거미 실크 유전자 서열을 포함하는 키메라 누에 서열을 포함하도록 유전자 조작된 형질전환 누에 및 특이적으로 설계된 피기백(piggyBac) 벡터를 이용하는 이러한 형질전환 누에를 만드는 방법이 기술되므로, 본 발명은 형질전환 생물에 관한 것이다. 또한, 형질전환 누에를 이용하는 키메라 실크 섬유의 상업적 생산방법이 제공된다.
실크 섬유는 수년 동안 대단히 폭넓은 중요한 외과 수술을 위한 봉합선으로 이용되었다. 미세 섬유는 안과 수술, 신경 수술 및 성형 수술을 위한 봉합선으로 필요하다. 또한, 실크 섬유는 인공 인대, 인공 힘줄, 화상 환자의 피부 이식을 위한 탄력 붕대 및, 지지 및 일부 경우, 뼈 조직, 치주 조직 및 결합 조직의 재생 도중 일시적인 기능을 제공할 수 있는 비계의 재료로서 대단한 장래성을 보유하고 있다. 앞십자인대(ACL) 및 기타 관절 손상 발생률이 노령 인구에서 증가함에 따라, 인대 및 힘줄을 위한 재료로서의 실크 섬유의 개발이 점차 중요해지리라고 예상된다. 봉합선으로 현재 이용되는 섬유 가운데 적은 비율이 천연 누에 견으로부터 유래되지만, 대부분은 화학 산업에 의해 합성 고분자로서 생산된다. 이러한 접근법의 주요한 한계는 그것이 지름, 강도 및 탄성과 같은 좁은 범위의 물리적 성질을 나타내는 실크 섬유를 제공할 뿐이라는 점이다.
박테리아(Lewis, et al. 1996), 효모(Fahnestock and Bedzyk, 1997), 배큘로바이러스 감염 곤충 세포(Huemmerich, et al. 2004), 포유류 세포(Lazaris, et al. 2002) 및 형질전환 식물(Scheller, et al. 2001)을 포함한, 광범위한 재조합 시스템이 다양한 실크 단백질을 생산하는 데 이용되었다. 그러나, 이러한 시스템 중 어느 것도 자연적으로 실크를 잣도록 설계되지 않았고, 따라서 어느 것도 유용한 실크 섬유를 믿을 수 있게 생산하지 못했었다. 상업적인 견지에서 유용하다고 간주될 수 있는 실크 섬유를 위해서는, 섬유는 적당한 인장(강도) 및 유연성 및/또는 탄성 특성을 보유해야 하며, 원하는 상업적 응용 분야의 섬유 제조에 적합해야 한다. 따라서, 이러한 목적을 위해 이용될 수 있는 시스템에 대한 필요성은 계속하여 존재한다.
거미 실크 단백질은 여러 가지 이종 단백질 생산 시스템에서 생산되었다. 각 경우에서, 생산된 단백질의 양은 현실적인 상업 수준에 훨씬 못 미쳤다. 형질전환 식물 및 동물 발현 시스템은 규모를 키울 수 있으나, 이러한 시스템에서조차, 실질적으로 가격 효율적이기 위해서는 재조합 단백질 생산 수준이 증가되어야 할 것이다. 훨씬 더 어려운 문제는 이전의 생산 노력은 섬유가 아니라, 단백질을 생산했다는 점이다. 따라서, 단백질을 생산 후 방법을 이용하여 섬유로 자아야 한다. 이러한 생산 및 방적 문제 때문에, 상업적으로 관심의 대상이 되기에 충분히 긴 거미 실크 섬유, 즉, "유용한" 섬유를 생산할 수 있는 재조합 단백질 생산 시스템의 예가 전혀 없다.
이전에 보고된 섬유 생산 시도에서는 거미 아라네우스 디아데마투스(A. diadematus)로부터 MaSp1, MaSp2 및 관련된 실크 단백질을 암호화하는 유전자를 발현시키기 위해 포유류의 세포 시스템을 이용했다(Lazaris, et al. 2002). 이 작업은 60Kd의 거미 실크 단백질인 ADF-3를 생산하게 하였으며, ADF-3는 정제되어 생산 후 방적 방법으로 섬유를 생산하는 데 이용되었다. 그러나 이 시스템은 유용한 섬유를 지속적으로 산출하지 못한다. 또한, 이러한 접근법은 단백질을 가용화하고, 성공적인 방적 조건을 개발해야 하며, 유용한 성질이 있는 섬유를 얻기 위하여 포스트 스핀 드로(post-spin draw)를 수행할 필요성 때문에 문제가 있다.
본 기술은 제조에 필요한 필요조건인 인장 및 유연성 특성을 나타내는 실크 섬유를 지속적으로 제공하기 위한 상업적 방법이 여전히 결여되어 있다.
본 발명의 목적은 키메라 거미 실크 및 이의 용도를 제공하는 데에 있다.
본 발명은 본 기술에 설명된 위와 같은 어려움 및 다른 곤란함을 극복한다. 특히, 당연히 실크 섬유 방적을 위해 장비를 갖춘 것이므로, 단백질 정제, 가용화 및 인위적인 생산 후 방적과 관련된 문제들을 피할, 상업적 규모에 적응할 수 있는 형질전환 누에 생산 시스템이 제공된다.
일반적이고도 전반적인 의미에서, 본 발명은 우수한 인장 및 유연성 특성이 있는, 상업적으로 유용한 키메라 실크 섬유의 이종 실크 단백질 생산용 플랫폼으로서 형질전환 누에를 이용하는, 키메라 거미 실크 섬유 생산을 위한 생명공학적 접근법을 제공한다. 키메라 실크 섬유는 특정 범위의 바람직한 물리적 성질을 가지고 있는 섬유 또는 원하는 생의학적 응용 분야에 최적화된 소정의 성질을 갖춘 섬유를 제공하도록 맞춤 설계될 수 있다.
거미/누에 실크 단백질 및 키메라 거미 실크 단백질:
일 양상에서, 본 발명은 하나 이상의 거미 실크 유연성 및/또는 탄성 모티프/도메인 서열 및/또는 하나 이상의 거미 실크 강도 도메인 서열에 의해 암호화된 재조합 키메라 거미 실크/누에 실크 단백질을 제공한다. 일부 구현예에서, 키메라 거미/누에 실크 단백질은 거미 2, 거미 4, 거미 6 또는 거미 8 키메라 거미/누에 실크 단백질을 암호화하는 것으로 더 설명된다.
또한, 본 발명은 키메라 누에/거미 실크 단백질로부터 제조된 키메라 거미 실크 섬유를 제공한다. 특정 구현예에서, 천연 누에 실크 섬유와 비교하여 더 큰 인장 강도를 나타내는 키메라 거미 실크 섬유가 기술되며, 일부 구현예에서는 천연 누에 섬유와 비교하여 최대 2배 더 큰 인장 강도를 나타내는 키메라 거미 실크 섬유가 기술된다.
형질전환 누에:
다른 양상에서, 본 발명은 형질전환 생물, 특히 재조합 곤충 및 형질전환 동물을 제공한다. 일부 구현예에서, 형질전환 생물은 형질전환 누에나방과 같은 형질전환 누에이다. 특정 구현예에서, 형질전환 누에를 제공하고자 형질전환되는 숙주 누에는 천연 실크 섬유를 생산하는 능력이 부족한 돌연변이 누에일 것이다. 일부 구현예에서, 누에 돌연변이는 pnd-wl이다.
일부 구현예에서, 돌연변이 누에(누에나방)는 피기백(piggyBac) 시스템을 이용하여 형질전환될 것이며, 이때 피기백 벡터는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 옆에 있는 합성 거미 실크 단백질 서열을 함유하는 발현 카세트를 이용하여 제조된다. 일반적으로, 누에 형질전환은 누에씨에 미세 주사하여 전배반엽(pre-blastoderm) 배아에 피기백 벡터와 피기백 유전자전위효소를 암호화하는 헬퍼 플라스미드의 혼합물을 도입하는 단계를 수반한다. 난막(chorion) 천자를 위해 조정된 에펜도르프 로봇식 바늘 조작기가 미세 삽입 개구부를 형성하는 데 이용되는데, 미세 삽입 개구부를 통해 유리 모세관이 삽입되고, 유리 모세관을 통해 DNA 용액이 누에씨로 주사된다. 그런 다음, 주사된 누에씨는 성숙시켜, 유충으로 부화하도록 진행된다. 유충은 성숙한 누에로 성숙하도록 하여, 누에의 일상적인 생애주기에 따라 고치를 짓게 된다.
이러한 형질전환 곤충을 서로, 또는 비 형질전환 곤충/누에와 교배육종하는 것 또한 본 발명의 일부분으로 제공된다.
거미 실크 유전자 발현 카세트:
또 다른 양상에서, 본원에 개시된 바와 같은 하나 이상의 여러 가지 특정 거미 실크 유연성 및/또는 탄성 모티프 서열 및/또는 거미 실크 강도 모티프 서열에 해당하는, 하나 이상의 거미 실크 단백질 서열 모티프를 포함하는, 키메라 누에/거미 실크 발현 카세트가 제공된다. 또 다른 양상에서, 키메라 거미 실크/누에 단백질 및 섬유의 생산방법이 제공된다. 도 5에 묘사된 바와 같은 발현 카세트의 적어도 여덟 가지 버전이 제공되었으며, 이들은 NTD와 거미 실크 서열 사이에 인프레임으로 삽입된 EGFP가 있거나 없는 네 개의 서로 다른 합성 거미 실크 단백질을 암호화한다. 이러한 서열들은 본원에서 "거미 2", "거미 4", "거미 6" 및 "거미 8"로 식별된다.
형질전환 누에:
또 다른 양상에서, 형질전환 누에 및 형질전환 누에의 제조방법이 제공된다. 일부 구현예에서, 형질전환 누에의 제조방법은 누에 서열, 하나 이상의 거미 실크 강도 모티프 서열 및 하나 이상의 거미 실크 유연성 및/또는 탄성 모티프 서열을 암호화하는 키메라 거미 실크 서열을 포함하는 서열을 가지고 있는 발현 카세트를 제조하는 단계; 피기백 벡터(예를 들어, 피기백 벡터 pBac[3xP3-DsRedaf], 도 6 참조, 모체 플라스미드는 도 10 및 도 11 참조, 모체 플라스미드로부터 서브클로닝된 플라스미드는 도 12a 내지 도 12e 참조)에 상기 카세트 서열을 서브클로닝하는 단계; 피기백 벡터와 피기백 유전자전위효소를 암호화하는 헬퍼 플라스미드의 혼합물을 전배반엽 누에 배아에 (예컨대, 누에씨에 미세 주사하여) 도입하는 단계; 주사된 누에 배아를 정상적인 생육 조건(약 28℃ 및 70% 습도) 하에서 유충이 부화할 때까지 유지시키는 단계 및 형질전환 누에를 얻는 단계를 포함한다.
이러한 형질전환 누에는 S-적색 눈 표지의 발현을 기초로 한, 추정 형질전환체의 후속적인 식별을 위해 F1 세대 배아를 발생시키기 위해 더 교배될 수 있다. 그런 다음, 이 방법에 의해 식별된 추정 수컷 및 암컷 형질전환체는 더욱 상세한 유전자 분석을 위한 동형 계통의 생산을 위해 교배된다. 특히, 누에 형질전환은 투명한 큐티클의 누에 돌연변이인 pnd-wl의 누에씨에 피기백 벡터와 헬퍼 플라스미드 DNA의 혼합물을 주사하는 단계를 포함하였다. 누에 돌연변이 pnd-wl은 Tamura 등(2000)에 기술되어 있으며, 이 참조문헌은 전체로서 본원에 특히 통합되어 있다. 이 돌연변이는 형광 유전자를 이용한 스크리닝을 훨씬 더 용이하게 하는 멜라닌화 결핍증을 가지고 있다. 일단 적색 눈의 추정 F1 형질전환체가 식별되면, 견사선(silk gland) 단백질 및 채취된 고치 실크의 웨스턴 블로팅을 이용하여 동형 계통을 확인하였다.
키메라 거미 실크/누에 실크 섬유의 제조방법:
또 다른 양상에서, 본 발명은 형질전환 누에에서 키메라 거미 실크/누에 섬유를 생산하기 위한 상업적인 생산방법을 제공한다. 일 구현예에서, 방법은 본원에 기술된 형질전환 누에를 제조하는 단계, 및 형질전환 누에들이 자라서 고치를 형성하도록 허용하는 조건 하에서 그것들을 키우는 단계, 고치를 채취하는 단계, 및 고치로부터 키메라 거미 실크 섬유를 얻는 단계를 포함한다. 실크 고치로부터 실크 섬유를 푸는 및/또는 그렇지 않으면 수확하는 표준 기법이 이용될 수 있다.
제조물품 및 이의 이용방법:
또 다른 양상에서, 본 발명의 키메라 거미 실크 섬유로부터 만들어진 다양한 제조물품들이 제공된다. 예를 들어, 재조합 키메라 거미 실크/누에 섬유는 다른 물품 중에서도 의료용 봉합사 재료, 상처 드레싱 및 조직/관절 교체 및 재건 재료 및 장치, 약물 전달 패치 및/또는 기타 전달 물품, 보호복(방탄 조끼 및 기타 물품), 레크리에이션 물품(텐트, 낙하산, 캠핑장비 등)에 이용될 수 있다.
다른 양상에서, 다양한 의료 절차에서 재조합 키메라 거미 실크/누에 섬유를 이용하는 방법이 제공된다. 예를 들어, 섬유는 성장 또는 재생에서 재조합 섬유로 제조된 조직 강화 생체적합성 구조체 내의 비계로서 조직 수복을 촉진하는 데 이용될 수 있거나, 섬유로 조직된 단백질 또는 치료제의 전달을 제공하는 데 이용될 수 있다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 용어 및 과학 용어는 당해 발명이 속하는 분야에서 통상의 지식을 가진 자가 일반적으로 이해하는 것과 같은 의미를 지닌다. 본원에 기술된 것과 비슷하거나 균등한 방법과 재료가 본 발명의 실현 또는 시험에 이용될 수 있지만, 바람직한 방법 및 재료는 아래에 기술되어 있다. 본원에 언급된 모든 출판물, 특허 출원, 특허 및 기타 참조문헌은 참조로서 통합된다. 또한, 재료, 방법 및 예는 설명을 위한 것일 뿐, 제한하고자 하는 것은 아니다. 충돌하는 경우, 정의를 포함한 본 명세서가 제어한다.
첨부된 도면과 함께, 바람직한 구현예의 아래와 같은 상세한 설명을 읽으면, 본 발명의 다른 목적 및 장점은 당해 분야에 속하는 통상의 지식을 가진 자에게 명백해질 것이고, 첨부된 도면에서 비슷한 도면부호는 비슷한 요소들을 표기하는 데 이용되었다.
도 1은 발산형으로 둥글게 거미줄을 치는 거미(divergent orb weaving spider) 또는 파생형으로 둥글게 거미줄을 치는 거미(derived orb weaving spider)의 두 가지 주요 팽창 실크 단백질의 아미노산 서열을 나타낸다(Gatesy, et al. 2001). 비교 결과, 특히 위에서 설명한 서열 모티프 내에서, 높은 수준의 서열 보존을 확인할 수 있었는데, 이는 이들 종이 서로 갈라진 이래, 1억 2천5백만 년에 걸쳐 유지된 것이다. 여러 가지 둥글게 거미줄을 치는 거미의 주요 팽창 실크 단백질의 공통 반복 아미노산 서열인 (-)는 다른 서열과 비교할 때, 존재하지 않는 아미노산을 나타낸다. 거미는 다음과 같다. Nep.c는 네필라 클라비페스(Nephila clavipes), Lat.g.는 라트로덱투스 게오메트리쿠스(Lactrodectus geometricus), Arg.t.는 아르지오페 트리파스시아타(Argiope trifasciata)이다.
도 2는 둥글게 거미줄을 치는 거미의 소수 팽창 실크 단백질의 공통 아미노산 서열을 나타낸다. 초기의 주요 팽창 실크 단백질 서열이 발표되자마자, N. 클라비페스의 소수 팽창 실크(Mi) 단백질 전사물을 나타내는 cDNA가 분리되어 서열이 분석되었다(Colgin and Lewis, 1998). 이 도면에 제공된 MiSp 서열은 MaSp 단백질과 비교하여, 비슷한 서열과 두드러지게 다른 서열 모두를 가지고 있다. MiSp는 GGX와 짧은 폴리알라닌(polyAla) 서열을 포함하지만, MaSp의 긴 폴리알라닌 모티프는 (GA)n 반복단위에 의해 교체된다. 공통 반복단위는 비슷한 구성을 가지고 있지만, GGX와 GA 반복단위의 수는 크게 다르다.
도 3은 편모상 실크 단백질 cDNA 공통 서열을 나타낸다. 이러한 실크 단백질 cDNA는 N. 클라비페스 편모상 분비샘으로부터 포획을 위한 나선형 실크 단백질을 암호화한다(도 3; Hayashi and Lewis, 2000). 이러한 cDNA는 5' 비번역 부위와 분비 신호 펩티드를 암호화하는 서열, 다섯 개의 아미노산 모티프의 수 차례 반복 및 C 말단을 함유한다. 노던 블로팅 분석 결과, 거의 500Kd의 단백질을 암호화하는 -15kb의 mRNA 크기를 나타냈다. 유전자 서열로부터 예측된 아미노산 서열은 (본원에 추가로 기술된) MaSp2의 성질과도 일치하는, 거미 실크의 탄성의 물리적 기초를 설명하는 데 도움이 되는 단백질 구조 모델을 시사했다.
도 4는 베타 나선형의 컴퓨터 모델을 나타낸다. 이것은 각 오량체 서열에서 II형 B 턴(turn)의 출발 배열이 있는, 에너지 최소화 (GPGGQGPGGY)2 서열의 모델이다.
도 5는 구축된 기본 누에나방 실크 피브리온 중쇄 발현 카세트 상의 몇 가지 변이를 나타낸다. 디자인은 피브로인 중쇄(fhc)-거미 실크 키메라를 발현시키고자 설계된 구조체 어셈블리를 포함하였으며, 이때 합성 거미 실크 단백질 서열 옆에는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 있다. 각 발현 카세트의 기능 관련 유전자 요소는 좌측으로부터 우측으로 주요 프로모터, 상류 인핸서 요소(UEE), 기초 프로모터 및 누에나방 fhc 단백질의 N 말단 도메인(NTD), 이어서 NTD의 상류에 위치한 번역 개시부위와 인프레임으로 위치된 다양한 합성 거미 실크 단백질 서열, 이어서 번역 종료부위와 RNA 폴리아데닐화 부위를 포함하는 fhc C 말단 도메인(CTD)을 포함한다.
도 6은 카세트를 피기백에 서브클로닝하기 위한 설계를 나타낸다. 묘사된 발현 카세트의 여덟 가지 서로 다른 버전 각각은 AscI과 FseI을 이용하여 모체 플라스미드로부터 잘라내어 pBAC[3xP3-DSRedaf]의 상응하는 부위로 서브클로닝된 것이다. 이러한 피기백 벡터의 지도를 나타낸 것이다.
도 7은 형질전환 누에 실크의 웨스턴 블롯을 나타낸다. 누에 실크 분비샘 단백질 내용물과 형질전환 누에 고치의 실크 단백질을 거미 실크 특이 항체를 이용한 웨스턴 블로팅에 의해, 이러한 실크를 대상으로 거미 실크 키메라 단백질의 존재를 분석하였다. 두 경우에서 모두 형질전환 누에는 키메라 단백질을 생산하는 것으로 확인되었고, 차등 추출 연구 결과는 이들 단백질이 고치의 형질전환 실크 섬유의 필수 성분임을 보여주었다. 나아가, 형광 해부현미경을 이용한 실크 분비샘 또는 실크 섬유의 직접적인 조사에 의해, 키메라 녹색 형광 단백질 융합체 각각의 발현이 실크 분비샘과 섬유 모두에서 명백한 것으로 나타났다. 대부분의 경우에서, 섬유의 형광 단백질의 양은 정상적인 조명 하에서 고치를 녹색으로 가시화할 수 있을 정도로 많았다.
도 8은 17,388bp 크기의 모체 플라스미드 pSL-거미 #4를 나타낸다. 이 모체 플라스미드는 키메라 거미 실크 단백질 #4 카세트인 거미 실크 (A4S8)x42를 전달한다.
도 9는 모체 플라스미드 pSL-거미 #4 + GFP를 나타낸다. GFP는 녹색 형광 단백질이다. 이 벡터는 크기가 18,102bp이다. 이 모체 플라스미드는 표지 단백질 GFP, 카세트인 거미 실크 (A4S8)x42와 함께, 키메라 거미 실크 단백질 #4를 전달한다.
도 10은 모체 플라스미드 pSL-거미 #6를 나타낸다. 이 모체 플라스미드는 크기가 12,516bp이다. 이 모체 플라스미드는 키메라 거미 실크 단백질 #6 카세트인 거미 실크 (A2S8)x14)x42를 전달한다.
도 11은 모체 플라스미드 pSL-거미 #6 + GFP를 나타낸다. GFP는 녹색 형광 단백질이다. 이 모체 플라스미드는 크기가 13,230bp이다. 이 모체 플라스미드는 표지 단백질 GFP, 카세트인 거미 실크 (A2S8)x14와 함께, 키메라 거미 실크 단백질 #6를 전달한다.
도 12a 및 도 12b는 피기백 플라스미드를 나타낸다. 도 12a는 크기가 10,458bp인 pXLBacII-ECFP NTD CTD maspX16 구조체를 도시한다. 도 12b는 크기가 11,250bp인 pXLBacII-ECFP NTD CTD maspX24 구조체를 도시한다.
도 13은 pSL-거미 #4의 서열을 나타낸다.
도 14는 pSL-거미 #4 + GFP의 서열을 나타낸다.
도 15는 pSL-거미 #6의 서열을 나타낸다.
도 16은 pSL-거미 #6 + GFP의 서열을 나타낸다.
도 17은 피기백 벡터 설계도를 나타낸다. 도 17a는 A2S814 합성 거미 실크 유전자이다. 도 17b는 거미 6 키메라 누에/거미 실크 유전자이다. 도 17c는 거미 실크 6-GFP 키메라 누에/거미 실크 유전자이다. 도 17d는 피기백 벡터이다. 도 17e에서 부호는 다음을 나타낸다: 편모 탄성 모티프(A2; 120bp); 주요 팽창 스피드로인-2; 거미 모티프(S8; 55bp) Fhc 주요 프로모터(1,157bp), Fhc 인핸서(70bp); Fhc 기초 프로모터, Hhc 5' 비번역 부위(엑손 1/인트론/엑손 2; Fhc N 말단 cds) = 1,744bp; EGF(720bp); A2SB14. 거미 실크 서열(2,462bp), Fhc C 말단 cds (180bp), Fhc 폴리아데닐화 신호(300bp).
도 18은 거미 6-GFP 누에의 (18a) 고치, (18b, 18c) 실크 분비샘, 및 (18d) 실크 섬유에서 키메라 누에/거미 실크/EGFP 단백질의 발현을 나타낸다. 누에 실크 분비샘에서 키메라 누에/거미 실크 단백질의 발현 및 위치 측정. 방법에서 기술한 바와 같이, 실크 분비샘을 절제하여, 거미 6 또는 거미 6-GFP 피기백 벡터를 겨누어, 형광 현미경으로 관찰하였다.
도 19는 실크 섬유의 순차적인 추출을 나타낸다. 본원에 설명된 바와 같이, pnd-wl(3 ~ 6번 레인), 거미 6(8 ~ 11번 레인), 또는 거미 6-GFP(13 ~ 16번 레인) 누에가 생산한 고치를 고무질을 제거하고, 연속 추출 프로토콜의 대상으로 하였다. 각 추출단계에서 용해된 단백질을 SDSPAGE와 (19a) 쿠마시 블루 염색 또는 (19b) 거미 실크 단백질 특이적 항혈청과 면역학적 블로팅으로 분석하였다. M: 분자량 표지. +: 대장균에서 발현 및 정제된 A2S814 거미 실크 단백질. 3번, 8번 및 13번 레인: 식염수 추출. 4번, 9번 및 14번 레인: SDS 추출. 5번, 10번 및 15번 레인: 8M LiSCN/2 메르캅토에탄올 추출. 6번, 11번 및 16번 레인: 16M LiSCN/5 메르캅토에탄올 추출. 화살표는 키메라 거미 실크 단백질을 나타낸다. 겉보기 분자량은 대장균의 A2S814은 약 75kDa, 거미 6는 약 106kDa, 거미 6-GFP는 약 130kDa 및 약 110kDa이었다.
도 20은 형질전환 누에의 복합 섬유, 양친 누에의 천연 섬유, 대표적인 천연 (드래그라인) 거미 실크 섬유를 관찰하여 최고의 기계적 성능을 비교한 것을 도시한 것이다. 섬유 인성은 응력/변형 곡선 아래의 면적으로 정의된다. 고무질을 제거한 천연 및 복합 실크 섬유의 기계적 성질. 천연 누에(pnd-wl)와 대표적인 거미(N. 클라비페스 드래그라인) 실크 섬유에 대해 측정한 최고의 기계적 성능을 형질전환 누에가 생산한 복합 실크 섬유에 대해 얻은 값과 비교하였다. 모든 섬유는 동일한 조건에서 시험하였다. 최대 인성값은 천연 누에 pnd-wl(43.9MJ/m3)과 비교할 때, 거미 6, 7번 계통(86.3MJ/m3), 거미 6-GFP, 1번 계통(98.2MJ/m3), 거미 6-GFP, 4번 계통(167.2MJ/m3) 및 N. 클라비페스 드래그라인(138.7MJ/m3)이었다. 이러한 데이터는 형질전환 누에에서 얻어진 복합 실크 섬유 모두는 비 형질전환 누에에서 얻어진 천연 섬유보다 더 질기다는 점을 보여준다.
도 21은 구조체 pXLBacII-ECFP NTD CTD masplX16(10,458pb)의 핵산 서열을 도시한다.
도 22는 구조체 pXLBacII-ECFP NTD CTD maspX24(11,250bp)의 핵산 서열을 도시한다.
도 1은 발산형으로 둥글게 거미줄을 치는 거미(divergent orb weaving spider) 또는 파생형으로 둥글게 거미줄을 치는 거미(derived orb weaving spider)의 두 가지 주요 팽창 실크 단백질의 아미노산 서열을 나타낸다(Gatesy, et al. 2001). 비교 결과, 특히 위에서 설명한 서열 모티프 내에서, 높은 수준의 서열 보존을 확인할 수 있었는데, 이는 이들 종이 서로 갈라진 이래, 1억 2천5백만 년에 걸쳐 유지된 것이다. 여러 가지 둥글게 거미줄을 치는 거미의 주요 팽창 실크 단백질의 공통 반복 아미노산 서열인 (-)는 다른 서열과 비교할 때, 존재하지 않는 아미노산을 나타낸다. 거미는 다음과 같다. Nep.c는 네필라 클라비페스(Nephila clavipes), Lat.g.는 라트로덱투스 게오메트리쿠스(Lactrodectus geometricus), Arg.t.는 아르지오페 트리파스시아타(Argiope trifasciata)이다.
도 2는 둥글게 거미줄을 치는 거미의 소수 팽창 실크 단백질의 공통 아미노산 서열을 나타낸다. 초기의 주요 팽창 실크 단백질 서열이 발표되자마자, N. 클라비페스의 소수 팽창 실크(Mi) 단백질 전사물을 나타내는 cDNA가 분리되어 서열이 분석되었다(Colgin and Lewis, 1998). 이 도면에 제공된 MiSp 서열은 MaSp 단백질과 비교하여, 비슷한 서열과 두드러지게 다른 서열 모두를 가지고 있다. MiSp는 GGX와 짧은 폴리알라닌(polyAla) 서열을 포함하지만, MaSp의 긴 폴리알라닌 모티프는 (GA)n 반복단위에 의해 교체된다. 공통 반복단위는 비슷한 구성을 가지고 있지만, GGX와 GA 반복단위의 수는 크게 다르다.
도 3은 편모상 실크 단백질 cDNA 공통 서열을 나타낸다. 이러한 실크 단백질 cDNA는 N. 클라비페스 편모상 분비샘으로부터 포획을 위한 나선형 실크 단백질을 암호화한다(도 3; Hayashi and Lewis, 2000). 이러한 cDNA는 5' 비번역 부위와 분비 신호 펩티드를 암호화하는 서열, 다섯 개의 아미노산 모티프의 수 차례 반복 및 C 말단을 함유한다. 노던 블로팅 분석 결과, 거의 500Kd의 단백질을 암호화하는 -15kb의 mRNA 크기를 나타냈다. 유전자 서열로부터 예측된 아미노산 서열은 (본원에 추가로 기술된) MaSp2의 성질과도 일치하는, 거미 실크의 탄성의 물리적 기초를 설명하는 데 도움이 되는 단백질 구조 모델을 시사했다.
도 4는 베타 나선형의 컴퓨터 모델을 나타낸다. 이것은 각 오량체 서열에서 II형 B 턴(turn)의 출발 배열이 있는, 에너지 최소화 (GPGGQGPGGY)2 서열의 모델이다.
도 5는 구축된 기본 누에나방 실크 피브리온 중쇄 발현 카세트 상의 몇 가지 변이를 나타낸다. 디자인은 피브로인 중쇄(fhc)-거미 실크 키메라를 발현시키고자 설계된 구조체 어셈블리를 포함하였으며, 이때 합성 거미 실크 단백질 서열 옆에는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 있다. 각 발현 카세트의 기능 관련 유전자 요소는 좌측으로부터 우측으로 주요 프로모터, 상류 인핸서 요소(UEE), 기초 프로모터 및 누에나방 fhc 단백질의 N 말단 도메인(NTD), 이어서 NTD의 상류에 위치한 번역 개시부위와 인프레임으로 위치된 다양한 합성 거미 실크 단백질 서열, 이어서 번역 종료부위와 RNA 폴리아데닐화 부위를 포함하는 fhc C 말단 도메인(CTD)을 포함한다.
도 6은 카세트를 피기백에 서브클로닝하기 위한 설계를 나타낸다. 묘사된 발현 카세트의 여덟 가지 서로 다른 버전 각각은 AscI과 FseI을 이용하여 모체 플라스미드로부터 잘라내어 pBAC[3xP3-DSRedaf]의 상응하는 부위로 서브클로닝된 것이다. 이러한 피기백 벡터의 지도를 나타낸 것이다.
도 7은 형질전환 누에 실크의 웨스턴 블롯을 나타낸다. 누에 실크 분비샘 단백질 내용물과 형질전환 누에 고치의 실크 단백질을 거미 실크 특이 항체를 이용한 웨스턴 블로팅에 의해, 이러한 실크를 대상으로 거미 실크 키메라 단백질의 존재를 분석하였다. 두 경우에서 모두 형질전환 누에는 키메라 단백질을 생산하는 것으로 확인되었고, 차등 추출 연구 결과는 이들 단백질이 고치의 형질전환 실크 섬유의 필수 성분임을 보여주었다. 나아가, 형광 해부현미경을 이용한 실크 분비샘 또는 실크 섬유의 직접적인 조사에 의해, 키메라 녹색 형광 단백질 융합체 각각의 발현이 실크 분비샘과 섬유 모두에서 명백한 것으로 나타났다. 대부분의 경우에서, 섬유의 형광 단백질의 양은 정상적인 조명 하에서 고치를 녹색으로 가시화할 수 있을 정도로 많았다.
도 8은 17,388bp 크기의 모체 플라스미드 pSL-거미 #4를 나타낸다. 이 모체 플라스미드는 키메라 거미 실크 단백질 #4 카세트인 거미 실크 (A4S8)x42를 전달한다.
도 9는 모체 플라스미드 pSL-거미 #4 + GFP를 나타낸다. GFP는 녹색 형광 단백질이다. 이 벡터는 크기가 18,102bp이다. 이 모체 플라스미드는 표지 단백질 GFP, 카세트인 거미 실크 (A4S8)x42와 함께, 키메라 거미 실크 단백질 #4를 전달한다.
도 10은 모체 플라스미드 pSL-거미 #6를 나타낸다. 이 모체 플라스미드는 크기가 12,516bp이다. 이 모체 플라스미드는 키메라 거미 실크 단백질 #6 카세트인 거미 실크 (A2S8)x14)x42를 전달한다.
도 11은 모체 플라스미드 pSL-거미 #6 + GFP를 나타낸다. GFP는 녹색 형광 단백질이다. 이 모체 플라스미드는 크기가 13,230bp이다. 이 모체 플라스미드는 표지 단백질 GFP, 카세트인 거미 실크 (A2S8)x14와 함께, 키메라 거미 실크 단백질 #6를 전달한다.
도 12a 및 도 12b는 피기백 플라스미드를 나타낸다. 도 12a는 크기가 10,458bp인 pXLBacII-ECFP NTD CTD maspX16 구조체를 도시한다. 도 12b는 크기가 11,250bp인 pXLBacII-ECFP NTD CTD maspX24 구조체를 도시한다.
도 13은 pSL-거미 #4의 서열을 나타낸다.
도 14는 pSL-거미 #4 + GFP의 서열을 나타낸다.
도 15는 pSL-거미 #6의 서열을 나타낸다.
도 16은 pSL-거미 #6 + GFP의 서열을 나타낸다.
도 17은 피기백 벡터 설계도를 나타낸다. 도 17a는 A2S814 합성 거미 실크 유전자이다. 도 17b는 거미 6 키메라 누에/거미 실크 유전자이다. 도 17c는 거미 실크 6-GFP 키메라 누에/거미 실크 유전자이다. 도 17d는 피기백 벡터이다. 도 17e에서 부호는 다음을 나타낸다: 편모 탄성 모티프(A2; 120bp); 주요 팽창 스피드로인-2; 거미 모티프(S8; 55bp) Fhc 주요 프로모터(1,157bp), Fhc 인핸서(70bp); Fhc 기초 프로모터, Hhc 5' 비번역 부위(엑손 1/인트론/엑손 2; Fhc N 말단 cds) = 1,744bp; EGF(720bp); A2SB14. 거미 실크 서열(2,462bp), Fhc C 말단 cds (180bp), Fhc 폴리아데닐화 신호(300bp).
도 18은 거미 6-GFP 누에의 (18a) 고치, (18b, 18c) 실크 분비샘, 및 (18d) 실크 섬유에서 키메라 누에/거미 실크/EGFP 단백질의 발현을 나타낸다. 누에 실크 분비샘에서 키메라 누에/거미 실크 단백질의 발현 및 위치 측정. 방법에서 기술한 바와 같이, 실크 분비샘을 절제하여, 거미 6 또는 거미 6-GFP 피기백 벡터를 겨누어, 형광 현미경으로 관찰하였다.
도 19는 실크 섬유의 순차적인 추출을 나타낸다. 본원에 설명된 바와 같이, pnd-wl(3 ~ 6번 레인), 거미 6(8 ~ 11번 레인), 또는 거미 6-GFP(13 ~ 16번 레인) 누에가 생산한 고치를 고무질을 제거하고, 연속 추출 프로토콜의 대상으로 하였다. 각 추출단계에서 용해된 단백질을 SDSPAGE와 (19a) 쿠마시 블루 염색 또는 (19b) 거미 실크 단백질 특이적 항혈청과 면역학적 블로팅으로 분석하였다. M: 분자량 표지. +: 대장균에서 발현 및 정제된 A2S814 거미 실크 단백질. 3번, 8번 및 13번 레인: 식염수 추출. 4번, 9번 및 14번 레인: SDS 추출. 5번, 10번 및 15번 레인: 8M LiSCN/2 메르캅토에탄올 추출. 6번, 11번 및 16번 레인: 16M LiSCN/5 메르캅토에탄올 추출. 화살표는 키메라 거미 실크 단백질을 나타낸다. 겉보기 분자량은 대장균의 A2S814은 약 75kDa, 거미 6는 약 106kDa, 거미 6-GFP는 약 130kDa 및 약 110kDa이었다.
도 20은 형질전환 누에의 복합 섬유, 양친 누에의 천연 섬유, 대표적인 천연 (드래그라인) 거미 실크 섬유를 관찰하여 최고의 기계적 성능을 비교한 것을 도시한 것이다. 섬유 인성은 응력/변형 곡선 아래의 면적으로 정의된다. 고무질을 제거한 천연 및 복합 실크 섬유의 기계적 성질. 천연 누에(pnd-wl)와 대표적인 거미(N. 클라비페스 드래그라인) 실크 섬유에 대해 측정한 최고의 기계적 성능을 형질전환 누에가 생산한 복합 실크 섬유에 대해 얻은 값과 비교하였다. 모든 섬유는 동일한 조건에서 시험하였다. 최대 인성값은 천연 누에 pnd-wl(43.9MJ/m3)과 비교할 때, 거미 6, 7번 계통(86.3MJ/m3), 거미 6-GFP, 1번 계통(98.2MJ/m3), 거미 6-GFP, 4번 계통(167.2MJ/m3) 및 N. 클라비페스 드래그라인(138.7MJ/m3)이었다. 이러한 데이터는 형질전환 누에에서 얻어진 복합 실크 섬유 모두는 비 형질전환 누에에서 얻어진 천연 섬유보다 더 질기다는 점을 보여준다.
도 21은 구조체 pXLBacII-ECFP NTD CTD masplX16(10,458pb)의 핵산 서열을 도시한다.
도 22는 구조체 pXLBacII-ECFP NTD CTD maspX24(11,250bp)의 핵산 서열을 도시한다.
본 발명에 이용된, 누에 염색체로 유전자를 삽입하는 방법은 유전자가 염색체 내에 안정적으로 도입되고 발현되도록, 그리고 교배에 의해서도 자손에 안정적으로 전파되도록 해야 한다. 누에씨로의 미세 주사를 이용하는 방법 또는 유전자 총을 이용하는 방법이 이용될 수 있지만, 이용되는 방법은 바람직하게는 외래 유전자의 누에 염색체로의 삽입을 위한 벡터와 트랜스포존 유전자를 함유하는 헬퍼 플라스미드(Nature Biotechnology 18, 81-84, 2000)를 동시에 함유하는 목표 유전자로 누에씨에 미세 주사하는 것으로 이루어진다.
목표 유전자는 미세 주사된 누에씨로부터 부화되어 육성된 재조합 누에의 생식세포로 삽입된다. 이러한 방식으로 얻어진 재조합 누에의 자손은 그들의 염색체에 목표 유전자를 안정적으로 보유할 수 있다. 본 발명에서 얻어진 재조합 누에의 유전자는 일반 누에와 동일한 방식으로 유지될 수 있다. 즉, 정상적인 조건 하에서 누에씨를 배양하고, 부화된 유충을 모아 인공사료를 먹인 다음, 일반 누에와 동일한 조건에서 사육하여 오령까지의 누에를 사육할 수 있다.
본 발명에서 얻어진 재조합 누에는 일반 누에와 동일한 방식으로 사육될 수 있으며, 누에 발달과 성장을 최대화하기 위하여, 일반 조건에서 사육시켜, 외래 단백질을 생산할 수 있다.
본 발명에서 얻어진 유전자 재조합 누에는 일반 누에와 동일한 방식으로 번데기가 되어 고치를 생산할 수 있다. 수컷과 암컷은 번데기 단계에서 구분되며, 나방으로 변한 후, 수컷과 암컷이 교미하여, 그 다음 날, 누에씨가 채취된다. 누에씨는 일반 누에씨와 동일한 방식으로 보관될 수 있다. 본 발명의 유전자 재조합 누에는 위에서 설명한 바와 같이 육종을 반복하여 후속 세대에서 유지될 수 있고, 많은 수로 증가시킬 수 있다.
여기서 이용되는 프로모터에는 특별한 제한이 없고, 누에 세포 내에서 효율적으로 작용하기만 한다면 임의의 생물에서 유래하는 임의의 프로모터가 이용될 수 있지만, 누에 실크 분비샘에서 특별히 단백질을 유도하도록 설계된 프로모터가 바람직하다. 누에 실크 분비샘 단백질 프로모터의 예로는 피브로인 H 사슬 프로모터, 피브로인 L 사슬 프로모터, p25 프로모터 및 세리신 프로모터를 포함한다.
본 발명에서, "키메라 거미 실크 단백질을 발현시키기 위한 유전자 카세트"는 곤충 세포로 삽입되는 경우에 키메라 단백질의 합성에 필요한 일 세트의 DNA를 나타낸다. 키메라 거미 실크 단백질을 발현시키기 위한 이 유전자 카세트는 키메라 거미 실크 단백질을 암호화하는 유전자의 발현을 촉진하는 프로모터를 함유한다. 보통, 그것은 터미네이터와 폴리아데닌 첨가 부위도 함유하며, 바람직하게는 프로모터, 외래 단백질 구조 유전자, 터미네이터 및 폴리아데닌 첨가 부위를 함유한다. 또한, 그것은 프로모터와 외래 단백질 구조 유전자 사이에 연결된 분비 신호 유전자를 함유할 수도 있다. 임의의 유전자 서열은 폴리아데닌 첨가 서열과 외래 단백질 구조 유전자 사이에도 연결될 수 있다. 또한, 인위적으로 설계되고 합성된 유전자 서열도 연결될 수 있다.
또한, "키메라 거미 실크/누에 유전자를 삽입하기 위한 유전자 카세트"는 양쪽에 한 쌍의 피기백 트랜스포존의 도치된 반복 서열을 가지고 있으며, 피기백 트랜스포존의 작용을 통해 곤충 세포 염색체로 삽입된 일 세트의 DNA로 이루어진, 키메라 거미 실크/누에 유전자를 발현시키기 위한 유전자 카세트를 나타낸다.
본 발명의 벡터는 고리형 또는 선형 DNA 구조를 가지고 있는 벡터를 나타낸다. 대장균에서 복제할 수 있고, 고리형 DNA 구조를 가지고 있는 벡터가 특히 바람직하다. 이 벡터는 또한 형질전환체의 선별을 촉진하기 위한 목적을 위해, 항생제 저항성 유전자 또는 해파리 녹색 형광 단백질 유전자와 같은 표지 유전자를 포함할 수 있다.
본 발명에 이용되는 곤충 세포는 특별한 제한은 없지만, 바람직하게는 인시류 곤충 세포, 더욱 바람직하게는 누에나방 세포, 그리고 훨씬 더 바람직하게는 누에 실크 분비샘 세포 또는 누에나방 알에 함유된 세포이다. 실크 분비샘 세포의 경우, 오령의 누에 유충의 후측 실크 분비샘 세포에서 피브로인 단백질의 활발한 합성이 이루어지며, 그것들이 용이하게 취급되므로, 오령의 누에 유충의 후측 실크 분비샘 세포가 바람직하다.
곤충 세포에 의해, 키메라 거미 실크 단백질의 발현을 위한 유전자 카세트를 도입시키는 데 이용되는 방법에는 특별한 제한이 없다. 누에 실크 분비샘 세포로 도입시키는 경우, 유전자 총을 이용하는 방법 및 미세 주사를 이용하는 방법이 배양된 곤충 세포로의 도입을 위해 이용될 수 있으며, 예를 들어, 유전자 총을 이용하여 오령의 누에 유충의 몸으로부터 절제된 후측의 실크 분비샘 조직으로 유전자를 용이하게 도입시킬 수 있다.
유전자 총을 이용한 후측의 실크 분비샘으로의 유전자 도입은 예를 들어, 1,100 내지 1,800psi의 헬륨 기체 압력에서 입자 총(Bio-Rad, Model No. PDS-1000/He)을 이용하여, 외래 단백질 발현을 위한 유전자 카세트를 포함하는 벡터로 코팅된 금 입자를 한천 플레이트에 고정시킨 후측의 실크 분비샘에 포격하는 것 등에 의해 이루어질 수 있다.
누에나방의 알에 함유된 세포로 유전자를 도입하는 경우, 미세 주사를 이용하는 방법이 바람직하다. 여기서, 알로 미세 주사를 수행하는 경우, 알의 세포 안으로 직접 미세 주사할 필요는 없고, 오히려 간단히 미세 주사에 의해 유전자를 알 안으로 도입시킬 수 있다.
염색체 내에 본 발명의 "키메라 거미 실크 단백질 발현을 위한 유전자 카세트"를 함유하는 재조합 누에는 "키메라 거미 실크 유전자를 삽입하기 위한 카세트"를 가지고 있는 벡터를 누에나방의 알에 미세 주사하여 얻어질 수 있다. 예를 들어, 제1 세대(G1) 누에는 Tamara 등(Nature Biotechnology 18, 81-84, 2000)의 방법에 따라, 누에나방 알에 "키메라 거미 실크 유전자를 삽입하기 위한 카세트"를 가지고 있는 벡터와 피기백 유전자전위효소 유전자가 누에 액틴 프로모터의 제어 하에 배열되는 플라스미드를 동시에 미세 주사하고, 이어서 부화된 유충을 사육하고, 그 결과로 얻어지는 동일한 집단 내의 성충(G0)을 교배시켜 얻어진다. 재조합 누에는 보통 이러한 G1 세대 중에서 1 내지 2%의 빈도로 나타난다.
재조합 누에의 선별은 G1 세대 누에 조직으로부터 DNA를 분리한 후, 외래 단백질 유전자 서열을 기초로 하여 설계된 프라이머를 이용한 PCR에 의해 이루어질 수 있다. 대안적으로, 재조합 누에는, 누에 세포에서 발현될 수 있는 프로모터의 하류에 연결된 녹색 형광 단백질을 암호화하는 유전자를 미리 "유전자를 삽입하기 위한 유전자 카세트"에 삽입한 다음, 제1령 단계의 G1 세대 누에 중에서 자외선 조명 하에서 녹색 형광을 발산하는 개체들을 선별하는 것에 의해 용이하게 선별될 수 있다.
또한, 염색체 내에 "외래 단백질을 발현시키기 위한 유전자 카세트"를 함유하는 재조합 누에를 얻고자 하는 목적으로, 누에나방 알에 "유전자를 삽입하기 위한 유전자 카세트"를 가지고 있는 벡터를 미세 주사하는 경우, 피기백 유전자전위효소 단백질을 동시에 미세 주입하여, 위에서 설명한 것과 동일한 방식으로 재조합 누에가 얻어질 수 있다.
피기백 트랜스포존은 약 2.1k 염기쌍 내부의 양 말단과 ORF에 13개 염기쌍의 도치된 서열을 가지고 있는 DNA의 전달 인자를 나타낸다. 본 발명에 이용되는 피기백 트랜스포존에는 특별한 제한이 없지만, 이용될 수 있는 것들의 예로는 트리코프루시아 니(Trichoplusia ni) 세포주 TN-368, 오토그라파 칼리포니카(Autographa californica NPV, AcNPV) 및 갤러리아 멜로네아(Galleria mellonea) NPV(GmMNPV)에서 기원하는 것들을 포함한다. 유전자 및 DNA 전달 활성을 가지고 있는 피기백 트랜스포존은 바람직하게는 트리코플루시아 니 세포주 TN-368에서 기원하는 피기백의 일부분을 가지고 있는 플라스미드 pHA3PIG 및 pPIGA3GFP를 이용하여 제조될 수 있다(Nature Biotechnology 18, 81-84, 2000). 피기백에서 기원하는 DNA 서열의 구조는 TTAA 서열을 함유하는 도치된 말단 서열 한 쌍을 가지고 있어야 하고, 그러한 DNA 서열 사이에 삽입된 사이토카인 유전자와 같은 외래 유전자를 가지고 있다. 트랜스포존에서 유래하는 DNA 서열을 이용하여 누에 염색체로 외래 유전자를 삽입하기 위하여, 유전자전위효소를 이용하는 것이 더욱 바람직하다. 예를 들어, 유전자가 누에 염색체로 삽입되는 빈도는, 도치된 말단 서열 두 쌍을 인식하고, 그들 사이의 유전자 절편을 잘라내어, 그것을 누에 염색체에 전달하기 위하여, 누에 세포 내에서 유전자전위효소가 전사되고 번역될 수 있도록, 피기백 유전자전위효소를 발현할 수 있는 DNA를 동시에 삽입하여 상당히 향상시킬 수 있다.
본 발명은 다음과 같은 설명에 의해 훨씬 더 제대로 인식될 수 있다.
생의학계의 키메라 실크 단백질:
키메라 거미 실크 섬유는 극도로 얇은 섬유를 필요로 하는, 안과 수술, 신경 수복 및 성형 수술과 같은, 절차의 하위 부류를 위해 널리 이용되는 물질의 일부분으로 제공된다. 추가적인 용도로는 약물 전달을 위한 물질뿐만 아니라, 뼈, 인대 및 힘줄의 재생을 위한 비계 물질을 포함한다.
본 발명의 방법에 의해 생산되는 재조합 거미 실크 섬유는 혈관 상처 수복 장치, 지혈 드레싱, 패치 및 접착제, 봉합사를 포함하는, 상처 폐쇄 시스템, 약물 전달과 같은 다양한 의료 응용 분야에, 그리고 예를 들어, 비계, 인대 보철기기와 같은, 조직 공학 응용 분야에, 그리고 인체로의 장기간 또는 생분해성 이식을 위한 제품에 이용될 수 있다. 바람직한 조직 공학 비계는 본원에 기술된 재조합 거미 실크/누에 섬유로 제조된 섬유로 이루어진 부직포 망이다.
추가적으로, 본 발명의 재조합 키메라 실크 섬유는 척추 디스크, 두개골 조직, 경막, 신경 조직, 간, 췌장, 신장, 방광, 비장, 심장 근육, 골격 근육, 힘줄, 인대 및 유방 조직을 포함하나, 이에 한정되지 않는, 이러한 독특한 비계들로부터 이익을 볼 수 있는 기관 수복, 교체 또는 재생 전략을 위해 이용될 수 있다.
본 발명의 또 다른 구현예에서, 재조합 거미 실크 섬유 물질은 치료제를 함유할 수 있다. 이러한 물질을 형성하기 위하여, 치료제는 물질을 형성하기 전에 섬유 내부로 들어가도록 조작되거나, 물질이 형성된 후에 물질 내부로 로딩될 수 있다. 본 발명의 재조합 키메라 실크 섬유와 함께 이용될 수 있는 여러 가지 치료제의 다양성은 어마어마하다. 일반적으로, 본 발명의 제약 조성물을 통해 투여될 수 있는 치료제는 제한 없이, 항생제 및 항바이러스제와 같은 항감염제; 화학치료제(즉, 항암제); 항거부반응제; 진통제 및 진통제 화합물; 항염증제; 스테로이드와 같은 호르몬제; 성장인자(골형성 단백질(즉, BMP 1~7), 골형성 유사 단백질(즉, GFD-5, GFD-7 및 GFD-8), 표피성장인자(EGF), 섬유아세포 성장인자(즉, FGF 1~9), 혈소판 유래 성장인자(PDGF), 인슐린 유사 성장인자(IGF-I 및 IGF-II), 전환성장인자(즉, TGF-베타 I~III), 혈관 내피 성장인자(VEGF)); 및 기타 천연적으로 유래된 또는 유전자 조작된 단백질, 다당류, 당단백질 또는 지질단백질을 포함한다. 이들 성장인자는 이로써 본원에 참조로 통합된, R. G. Landes Company가 출판하고, Vicki Rosen과 R. Scott Thies이 저술한 <The Cellular and Molecular Basis of Bone Formation and Repair>에 기술되어 있다.
생체활성 물질을 함유하는 재조합 거미 실크/누에 섬유는 하나 이상의 치료제를 물질을 제조하는 데 이용한 섬유와 혼합하여 제형화될 수 있다. 대안적으로, 치료제는 바람직하게는 약학적으로 허용 가능한 담체를 이용하여 섬유에 코팅될 수 있다. 섬유를 용해시키지 않는 임의의 약학적 담체가 이용될 수 있다. 치료제는 액체, 미세하게 분리된 고체, 또는 임의의 기타 적당한 물리적 형태로 존재할 수 있다.
치료제의 양은 이용되는 특정 약물 및 치료되는 의료 상태에 따라 달라질 것이다. 전형적으로, 약물의 양은 물질의 중량을 기준으로 약 0.001퍼센트 내지 약 70퍼센트, 더욱 전형적으로는 약 0.001퍼센트 내지 약 50퍼센트, 가장 전형적으로는 약 0.001퍼센트 내지 약 20퍼센트이다. 예를 들어, 체액 또는 조직과 접촉 시, 약물은 방출될 것이다.
재조합 거미 실크/누에 섬유로 제조된 조직 공학 비계는 제작 후에 추가적으로 변경될 수 있다. 예를 들어, 비계는 원하는 세포 집단을 위한 수용체 또는 화학적 유인물로서 기능하는 생체활성 물질로 코팅될 수 있다. 코팅은 흡수 또는 화학 결합을 통해 적용될 수 있다.
본 발명에 사용하기 적합한 첨가제는 생물학적으로 또는 약학적으로 활성이 있는 화합물을 포함한다. 생물학적으로 활성이 있는 화합물의 예로는 세포 부착에 영향을 미치는 것으로 알려져 있는 "RGD" 인테그린 결합 서열의 변이형을 함유하는 펩티드와 같은, 세포 부착 매개체, 생물학적으로 활성이 있는 리간드, 그리고 특정 종류의 세포 또는 조직 내성장을 증진시키거나 차단하는 물질을 포함한다. 그러한 물질은 예를 들어, 골형성 단백질(BMP)과 같은 골유도 물질, 표피성장인자(EGF), 섬유아세포 성장인자(FGF), 혈소판 유래 성장인자(PDGF), 혈관 내피 성장인자(VEGF), 인슐린 유사 성장인자(IGF-I 및 II), TGF-, YIGSR 펩티드, 글리코사미노글리칸(GAG), 히알루론산(HA), 인테그린, 셀렉틴 및 카드헤린을 포함한다.
비계는 조직 공학 및 재건 수술을 포함한 조직 유도 재생 응용 분야를 위한 물품으로 만들어질 수 있다. 비계의 구조는 관대한 세포 내성장을 허락하여, 세포 파종 전처리 필요성을 줄인다. 외부 지지 기관 제작을 위한 세포의 시험관 내 배양을 지지하기 위한 외부 비계를 형성하기 위해, 비계는 또한 주조될 수 있다.
비계는 신체의 세포외 기질(ECM)을 모방하는 기능을 한다. 비계는 시험관 내 배양 및 후속 이식 과정에서 분리된 세포를 위하여 물리적인 지지체 및 부착성 기질로서 작용한다. 이식된 세포 집단이 성장하고, 세포들이 정상적으로 기능함에 따라, 세포들은 자신의 ECM 지지체를 분비하기 시작한다.
연골과 뼈와 같은 구조 조직의 재건에서, 조직 형태는 기능에 필수적이며, 다양한 두께와 모양의 물품으로 비계를 주조할 것이 요구된다. 3차원 구조에서 원하는 임의의 균열, 구멍 또는 개량은 매트릭스 일부분을 가위, 외과용 메스, 레이저 빔 또는 임의의 기타 절단 도구로 제거하여 만들어질 수 있다. 비계 응용 분야로는 신경, 근골격, 연골, 힘줄, 간, 췌장, 안구, 피부, 혈관, 요도 또는 임의의 기타 조직을 형성하는 속이 꽉 찬 또는 속이 빈 기관과 같은 조직의 재생을 포함한다.
또한, 비계는 3차원 조직 또는 기관을 만들기 위한, 해리 세포, 예컨대, 연골세포 또는 간세포를 위한 매트릭스로서 이식에 이용될 수 있다. 공여자로부터, 확립된 세포 배양 계통으로부터 얻었거나 또는 심지어 유전자 조작 전 또는 후에 얻은, 연골세포, 섬유아세포, 근육 세포 및 골세포와 같은 근육 및 골격계의 세포, 간세포, 췌장 세포(섬세포 포함)와 같은 실질세포, 내장 기원의 세포 및 신경세포, 골수세포, 피부세포, 다능성 세포 및 줄기세포와 같은 기타 세포, 그리고 이의 조합을 포함한 임의의 유형의 세포가 배양 및 가능성 있는 이식을 위한 비계에 첨가될 수 있다. 또한, 조직 조각들이 이용될 수 있으며, 이들은 동일한 구조에 여러 가지 서로 다른 세포 유형을 제공할 수 있다.
세포는 적절한 공여자, 또는 세포들이 이식되고, 표준 기법을 이용하여 해리되어, 지지체 위와 안에 심어지는 환자로부터 얻어진다. 시험관 내 배양은 선택적으로 이식 전에 이루어질 수 있다. 대안적으로, 비계가 이식되어 혈관을 신생하도록 한 다음, 세포가 비계 안에 주사된다. 시험관 내에서의 세포 배양 및 조직 비계의 이식을 위한 방법과 시약은 당해 분야에서 통상의 지식을 가진 자에게 알려져 있다.
본 발명의 재조합 거미/누에 섬유는 방사선을 기반으로 한 멸균(즉, 감마 레이), 화학물질을 기반으로 한 멸균(에틸렌 옥사이드) 또는 기타 적당한 절차와 같은 종래의 멸균 공정을 이용하여 멸균될 수 있다. 바람직하게는 멸균 공정은 8시간 이하의 시간 동안 52 ~ 55℃ 사이의 온도에서 에틸렌 옥사이드로 이루어질 것이다. 멸균 후, 생체적합물질은 이송과 병원 및 기타 의료시설에서의 이용을 위하여 적당히 멸균된 수분 저항성 포장 안으로 포장될 수 있다.
또한, 본 발명의 키메라 실크 섬유는 기능성 운동복 및 방탄조끼의 제조/제작과 같은, 다양한 형태의 운동용 및 보호용 의복의 제조에 이용될 수 있다. 또한, 본원에 개시된 키메라 거미 실크 섬유는 향상된 에어백 제조에서와 같이, 자동차 산업에 이용될 수 있다. 거미줄은 거미줄에 걸리는 날아다니는 곤충의 에너지를 흡수하지만, 개시된 키메라 실크 섬유를 이용하는 에어백은 자동차 충돌에서 더욱 큰 충격에너지를 제공한다.
정의
본원에 사용된 생체적합성은 제조된 실크 섬유 또는 물질이 무독성, 비 돌연변이원성이며, 최소 내지 적당한 정도의 염증 반응을 유도함을 의미한다. 본 발명에 사용하기 위한 바람직한 생체적합성 고분자는 예를 들어, 폴리에틸렌 옥사이드(PEO), 폴리에틸렌 글리콜(PEG), 콜라겐, 피브로넥틴, 케라틴, 폴리아스파르트산, 폴리라이신, 알긴산, 키토산, 키틴, 히알루론산, 펙틴, 폴리카프로락톤, 폴리락트산, 폴리글리콜산, 폴리하이드록시알카노에이트, 덱스트란 및 폴리무수물을 포함할 수 있다. 본 발명에 따르면, 둘 이상의 생체적합성 고분자가 수성 용액에 첨가될 수 있다.
본원에 사용된 유연성 및/또는 탄성 모티프 및/또는 도메인 서열은, 실크 섬유와 같은 물질에 탄성 및/또는 유연성의 특징을 주는 것과 관련된 거미 실크를 암호화하는 유전자 또는 단백질 절편의 식별 가능한 유전자 서열로 정의된다. 예로서, 유연성 및/또는 탄성 모티프 및/또는 도메인은 GPGGA이다.
본원에 사용된 강도 모티프는 실크 섬유에 인장 강도를 증가 및/또는 향상시키기 위한 것과 같이, 물질에 강도의 특징을 주는 것과 관련된 거미 실크를 암호화하는 유전자 또는 단백질 절편의 확인된 유전자 서열로 정의된다. 예로서, 이러한 거미 강도 모티프 일부는 (A가 폴리아데닌 서열일 때) GGPSGPGS(A) 8이다.
본 발명은 본 발명의 예시로서 의도된 다음과 같은 실시예에 의해 추가적으로 특징지어질 것이다.
실시예
1. 재료 및 방법
본 실시예는 형질전환 거미 실크 섬유의 인장 강도 평가에 이용된 기준 표뿐만 아니라, 형질전환 누에 생성에 이용된 재료와 방법/기법, 이용된 유전자 구조체 제조에 이용된 일반적인 절차를 기술하고자 제공된 것이다.
1. 이용된 유전자 서열. 이용된 유전자 서열은 본원에 제공된 도 13 내지 도 16에 제공되어 있다. 예를 들어, 실질적으로 동일한 키메라 거미 실크 단백질 성질을 나타내는 보존적인 치환을 가지고 있는 이들 서열의 짧은 버전 및/또는 긴 버전이 이용될 수 있으리라고 고려되므로, 이것들의 변이형 또한 본 발명의 일부분으로 예상된다.
2. 키메라 거미 실크 단백질 및 이들 키메라 실크 단백질로 얻어진 섬유를 대상으로 인장 강도를 평가할 것이다. 표 1은 키메라 거미 실크 섬유가 평가될 일반적인 기준을 제공한다. 본 발명의 키메라 거미 실크 섬유는 천연 거미 실크와 비슷한 인장 강도 및 기타 기계적 강도 특징을 보유한 것으로 확인되었다.
실시예
2. 개별적인 형질전환 누에
실크의
인장 강도 성질 분석
형질전환 누에 실크를 대상으로, 거미 실크 특이적 항체를 이용한, 누에 실크 분비샘 단백질 내용물과 형질전환 누에 고치 실크 섬유의 웨스턴 블로팅에 의해, 거미 실크 키메라 단백질의 존재를 분석하였다. 두 경우에서 모두, 형질전환 누에는 키메라 단백질을 생산하는 것으로 확인되었고, 차등 추출 연구 결과는 이들 단백질이 고치의 형질전환 실크 섬유의 필수 성분임을 보여주었다. 나아가, 형광 해부현미경을 이용한 실크 분비샘 또는 실크 섬유의 직접적인 조사에 의해, 키메라 녹색 형광 단백질 융합체 각각의 발현이 실크 분비샘과 섬유 모두에서 명백한 것으로 나타났다. 대부분의 경우에서, 섬유의 형광 단백질의 양은 정상적인 조명 하에서 고치를 녹색으로 가시화할 수 있을 정도로 많았다.
도 2는 개별적인 형질전환 누에에서 생산된 형질전환 실크의 분석 결과를 나타낸다. 이러한 분석 결과는 거미-4 또는 거미-6 구조체로 형질전환된 형질전환 계통이 비 형질전환된 누에에서 생산된 실크 섬유와 비교하여 향상된 강도를 나타내는 키메라 거미 실크/누에 섬유를 생산함을 분명히 보여준다. 중요하게도, 이들 섬유는 일부 경우에서 천연 실크 강도의 거의 두 배이다. 누에/거미 실크 키메라 섬유 강도의 두 배 향상은 거미 실크만큼 강하고 유연한 누에 실크를 제조하는 데 필수적인 것으로 생각되는 향상과 비슷하다. 따라서, 이러한 결과는 봄빅스(Bombyx)/거미 실크 키메라 단백질을 구성하기 위해, 거미 실크의 명시된 강도 및/또는 유연성 도메인을 암호화하는 피기백 벡터를 이용하여, 천연 거미 실크와 유리하게 경쟁할 수 있는 키메라 거미 실크/누에 섬유를 생산하도록 유전자 조작될 수 있음을 보여준다.
실시예
3. 누에
키메라
유전자 발현 카세트 및 형질전환 누에의
키메라
거미 실크/누에 단백질 발현을 위한
피기백
벡터
매우 광범위한 누에 키메라 거미 실크 유전자 발현 카세트를 제공하는 데 있어서 본 발명의 유용성 및 범위를 입증하기 위하여 본 실시예가 제공된다. 또한, 본 실시예는 성공적으로 누에를 형질전환하는 것으로 밝혀진 피기백 벡터의 완성을 보여주며, 그 결과, 제조 시 상업적으로 유용한 길이의 섬유 생산에 적합한, 상업적으로 유용한 키메라 거미 실크 단백질을 성공적으로 생산할 수 있다.
발현 카세트.
아래에 나타낸 기본 발현 카세트에 대한 몇 가지 변이형을 구축하였다. 이들 구조체는 피브로인 중쇄(fhc)-거미 실크 키메라를 발현시키도록 설계된 구조체의 어셈블리를 반영하는 것으로, 합성 거미 실크 단백질 서열 옆에는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 있다. 이 점과 관련하여, 도 5에 도시된 기본 누에나방 실크 피브로인 중쇄 발현 카세트 상의 몇 가지 변이형을 구축하였다. 디자인은 피브로인 중쇄(fhc)-거미 실크 키메라를 발현시키도록 설계된 구조체의 어셈블리를 포함하며, 합성 거미 실크 단백질 서열 옆에는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 있다. 각 발현 카세트의 기능 관련 유전자 요소는 좌측으로부터 우측으로, 주요 프로모터, 상류 인핸서 요소(UEE), 기초 프로모터 및 누에나방 fhc 유전자의 N 말단 도메인(NTD), 이어서 NTD의 상류에 위치한 번역 개시부위와 인프레임으로 위치된 다양한 합성 거미 실크 단백질 서열(아래 참조), 이어서 번역 종료부위와 RNA 폴리아데닐화 부위를 포함하는 fhc C 말단 도메인(CTD)을 포함한다.
도 5에 묘사된 발현 카세트는 여덟 가지 버전이 있는데, 이들은 NTD와 거미 실크 서열 사이에 인프레임으로 삽입된 EGFP가 있거나 없는, 네 개의 서로 다른 합성 거미 실크/누에 단백질을 암호화한다. 이러한 서열들은 "거미 2", "거미 4", "거미 6" 및 "거미 8"로 식별되었으며, 그것들은 다음과 같이 정의된다.
a) 거미 2: 7,104bp로, (A4S8)24로 이루어짐. A1은 추정상의 편모상 실크 탄성 모티프 (GPGGA)의 4개 카피를 나타낸다. 따라서, A4는 이러한 동일한 서열의 16개 카피를 나타낸다. S8은 추정상의 드래그라인 실크 강도 모티프 [GGPSGPGS(A)8]를 나타내며, "링커-폴리알라닌" 서열로도 기술된다. GFP(녹색 형광 단백질) 융합 단백질의 대략적인 크기는 161.9 + 50.4 = 212.3Kd이다.
b) 거미 4: 7,386bp로, (A2S8)42로 이루어짐. A2는 추정상의 편모상 실크 탄성 모티프 (GPGGA)의 8개 카피를 나타낸다. S8은 위와 같이 추정상의 드래그라인 실크 강도 모티프 [GGPSGPGS(A)8]를 나타낸다. GFP 융합 단백질의 대략적인 크기는 169.4 + 50.4 = 219.8Kd이다.
c) 거미 6: 2,462bp로, (A2S8)14로 이루어짐. A2는 탄성 모티프 (GPGGA)의 8개 카피를 나타내고, S8은 위와 같이 강도 모티프 [GGPSGPGS(A)8]을 나타낸다. GFP 융합 단백질의 대략적인 크기는 56.4 + 50.4 = 106.8Kd이다.
d) 거미 8: 4,924bp로, (A2S8)28로 이루어짐. A2는 탄성 모티프(GPGGA)의 8개 카피를 나타내고, S8은 위와 같이 강도 모티프 [GGPSGPGS(A)8]를 나타낸다. GFP 융합 단백질의 대략적인 크기는 112.8 + 50.4 = 163.2Kd이다.
NTD 엑손 I & II의 크기 (1625 + 15161); eGFP (27135); CTD (6470) = 50,391Kd.
실시예
4. 발현 카세트의
피기백으로의
서브클로닝
위에서 도 5에 묘사된 (그리고 실시예 3에 기술된) 발현 카세트의 여덟 가지 서로 다른 버전 각각을 AscI과 FseI을 이용하여 모체 플라스미드로부터 절단하여, pBAC[3xP3-DSRedaf]의 상응하는 부위로 서브클로닝하였다. 이러한 피기백 벡터의 지도를 도 6에 나타내었다.
EGFP가 있는, 그리고 EGFP가 없는, 위에 기술한 모든 피기백 벡터를 개별 구성요소에 대해 PCR로 시험하고, 예상 크기의 산물을 표시하였다.
EGFP에 융합시킨 거미 실크 단백질을 암호화하는 피기백 벡터 각각을 대상으로 누에나방 실크 분비샘에서 EGFP 발현을 유도하는 능력을 분석하여 기능적으로 평가하였다. 간단히 말하면, 실크 분비샘을 누에로부터 절개하고, 피기백 DNA(또는 대조군)로 코팅된 텅스텐 입자로 분비샘을 포격하기 위하여 입자 총을 이용하였다. 그런 다음, 폭격된 조직을 배양 배지의 그레이스 배지에서 배양하고, 이틀 내지 사흘 후, 실크 분비샘을 대상으로 EGFP 발현을 조사하는 데 동료 실험실에서 사용 가능한 EGFP 형광을 구비한 해부 현미경을 이용하였다. 각 벡터는 EGFP 형광을 유도하는 것으로 나타났다.
EGFP 삽입이 있는, 그리고 EGFP 삽입이 없는, 거미 4와 거미 6을 암호화하는 네 개의 피기백 벡터 세트를 형질전환 누에를 생산하는 데 이용하였다.
실시예
5 - 형질전환 누에의 분리
일반적으로, 누에 형질전환은 피기백 벡터와 피기백 유전자 전위효소를 암호화하는 헬퍼 플라스미드의 혼합물을 누에씨에 미세 주사하여 전배반엽 배아에 도입하는 단계를 포함한다. 전배반엽 형성은 알을 낳은 후 4시간 동안 일어나지 않는다. 따라서, 배아 수집과 주사는 상대적으로 긴 시간에 걸쳐 실온에서 이루어질 수 있다. 미세 주사의 기술적 장벽은 난막에 구멍을 뚫을 필요가 있다는 점인데, 난막은 단단한 장벽을 지닌다. Tamura와 동료들은 날카로운 텅스텐 바늘로 난막에 구멍을 뚫은 다음, 그 결과로 생겨난 구멍으로 유리 모세관 주사 바늘을 정확하게 도입함으로써, 누에를 대상으로 하는 미세 주사 기법을 완성시켰다. 이것은 이제 상대적으로 일상적인 절차가 되었으며, 조정된 에펜도르프 로봇식 바늘 조작기로 난막에 구멍을 뚫고, 텅스텐 바늘을 제거하고, 유리 모세관을 삽입하여, DNA 용액을 주사한다. 그런 다음, 누에씨를 크레이지 글루(Krazy glue) 작은 방울을 이용하여 다시 봉하고, 유충이 부화할 때까지 28℃와 70% 습도의 정상적인 사육 조건 하에서 유지시킨다. 그런 다음, 살아 남은 주사된 곤충을 교미시켜, DS-적색 눈 표지의 발현을 기초로 하여, 추정상의 형질전환체를 후속적으로 식별하기 위한 F1 세대 배아를 발생시킨다. 그런 다음, 이 방법에 의해 식별된 추정상의 수컷과 암컷 형질전환체를 교미시켜, 더욱 상세한 유전자 분석을 위한 동형 계통을 생산하였다.
구체적으로, 현재 프로젝트를 위한 누에 형질전환은 피기백 벡터와 헬퍼 플라스미드 DNA의 혼합물을 투명한 큐티클의 누에 돌연변이인 누에나방 pnd-wl의 알에 주사하는 단계를 포함하였다. 이 돌연변이 누에는 Tamura 등(2000)이 기술하였고, 이 참조는 특별히 본원에 참조로서 통합된다. 이 돌연변이는 형광 유전자를 이용한 스크리닝을 훨씬 용이하게 만드는 멜라닌화 결핍증을 가지고 있다. 일단 적색 눈의 추정상의 F1 형질전환체가 식별되면, 동형 계통이 확립되고, 진정한 형질전환체는 실크 분비샘 단백질과 채취된 고치 실크의 웨스턴 블로팅을 이용하여 확인하였다.
실시예
6. 형질전환 누에에 의한
키메라
거미
실크
/누에 생산 분석
누에 실크 분비샘 단백질 내용물과 형질전환 누에 고치의 실크 단백질을 거미 실크 특이 항체를 이용한 웨스턴 블로팅에 의해, 형질전환 누에 실크를 대상으로 거미 실크 키메라 단백질의 존재를 분석하였다. 두 경우에서 모두 형질전환 누에는 키메라 단백질을 생산하는 것으로 확인되었고, 차등 추출 실험 결과는 이들 단백질이 고치의 형질전환 실크 섬유의 필수 성분임을 보여주었다.
나아가, 형광 해부현미경을 이용한 실크 분비샘 또는 실크 섬유의 직접적인 조사에 의해, 키메라 녹색 형광 단백질 융합체 각각의 발현이 실크 분비샘과 섬유 모두에서 명백한 것으로 나타났다(도 7). 대부분의 경우에서, 섬유의 형광 단백질의 양은 정상적인 조명 하에서 고치를 녹색으로 가시화할 수 있을 정도로 많았다.
실시예
7.
피기백
벡터 설계
피기백은 누에를 효율적으로 형질전환시키는 데 이용될 수 있기 때문에4 , 11, 43, 이번 프로젝트를 위해 선택한 벡터였다. 본 프로젝트에 이용된 구체적인 피기백 벡터는 몇 가지 중요한 특질을 가지고 있는 유전자를 전달하고자 설계되었다. 도 17에서 강조된 바와 같이, 이것들은 후측 실크 분비샘으로 외래 거미 실크 단백질의 발현을 목표로 하는 누에나방 피브로인 중쇄(fhc) 프로모터91 , 92 및 발현 수준을 증가시키고 외래 실크 단백질의 섬유로의 어셈블리를 촉진하는 fhc 인핸서93를 포함하였다. 피기백 벡터는 또한 탄성 (GPGGA)8 모티프와 강도(링커-알라닌8) 모티프 모두가 있는, 상대적으로 큰, 합성 거미 실크 단백질인 A2S814 (도 17a)를 암호화하였다. 합성 거미 실크 단백질 서열은 누에나방 fhc 단백질의 N 말단 도메인과 C 말단 도메인을 암호화하는 서열 내에 포함시켰다(도 17b 내지 도 17c). 이러한 키메라 누에/거미 실크 설계는, 이전에 누에나방 실크 분비샘 내의 발생기의 내인성 실크 섬유 내에 외래 단백질을 직접적으로 통합하는 데, 그리고 복합 실크 섬유91 , 92를 생산하는 데 이용되었다.
이번 연구에서 구축된 피기백 벡터 중 하나는 키메라 누에/거미 실크 단백질 하나만 암호화했으나(도 17b), 다른 것은 N 말단 강화된 녹색 형광 단백질(EGFP) 태그가 있는 이 같은 단백질을 암호화했다(도 17c). 후자의 구조체는 형질전환된 자손에 의해 생산된 실크 섬유의 분석을 촉진하였고, 또한, 본원에 기술한 바와 같이, 실크 분비샘에서 키메라 거미 실크 단백질 발현을 조사하기 위한 예비적인 생체 외 실크 분비샘 포격 분석에 이용되었다.
방법:
누에나방 P50/다이조 계통의 실크 분비샘으로부터 분리된 게놈 DNA와 도 17에 도시된 유전자 특이적 프라이머를 이용한 중합효소 연쇄반응(PCR)에 의해 몇 가지 유전자 절편이 분리되었다. 이들 절편은 fhc 주요 프로모터 및 상류 인핸서 요소(MP-UEE), fhc 기초 프로모터(BP)의 두 가지 버전 및 서로 다른 5'- 및 3'-측면 제한부위가 있는 N 말단 도메인(NTD; 엑손 1/인트론 1/엑손 2), fhc C 말단 도메인(CTD; 3'- 코딩 서열 및 폴리아데닌 신호), 및 EGFP를 포함하였다. 각각의 경우에서, 증폭 산물은 겔 정제되었고, 예상 크기의 DNA 절편을 절단하여 회수하였다. 그 다음으로, fhc MP-UEE, fhc CTD, 및 EGFP 절편을 pSLfal l80fa (pSL)(Y. Miao)로 클로닝하고, 두 가지 서로 다른 NTD 절편을 pCR4-TOPO(Invitrogen Corporation, 미국 캘리포니아 주 칼즈배드)로 클로닝하였으며, 올바른 증폭 산물을 함유하는 대장균 형질전환체를 제한효소 지도 작성에 의해 식별하고, 서열분석으로 확인하였다.
그런 다음, 이들 절편을 다음과 같이 이번 연구에 이용된 피기백 벡터를 조립하는 데 이용하였다. 합성 A2S814 거미 실크 서열을 pBluescript SKII+ 플라스미드 전구체(F. Teule 및 R.V. Lewis)로부터 BamHI 및 BspEI로 절단하고, 겔 정제하고, 회수하여, 위에서 기술한 pSL 중간 플라스미드 내의 CTD 상류의 상응하는 부위에 서브클로닝 하였다. 이 단계로부터 pSL-spider6-CTD라는 플라스미드를 얻었다. 그런 다음, NotI/BamHI 절편을 위에서 기술한 pCR4- TOPO-NTD 중간 플라스미드 중 하나로부터 절단하고, 겔 정제하고, 회수하여, pSLspider 6-CTD 내의 거미 6-CTD 서열 상류의 상응하는 부위로 서브클로닝 하여, pSL-NTD- spider 6-CTD를 생산하였다. 동시에, 위에서 기술한 다른 pCR4-TOPO-NTD 중간 플라스미드로부터 NotI/XbaI 절편을 절단하고, 겔 정제하고, 회수하여, 위에서 기술한 pSL-EGFP 중간 플라스미드 내의 EGFP 앰플리머 상류의 상응하는 부위로 서브클로닝 하였다. 이것은 NotI 및 BamHI로 절단되어, pSL-spider 6-CTD 내의 거미 6-CTD 상류의 상응하는 부위로 서브 클로닝된 NTD-EGFP 절편을 함유하는 플라스미드를 생산하였다. 그런 다음, MP-UEE 절편을 위에서 기술한 pSL 중간 플라스미드로부터 SfiI 및 NotI로 절단하여, 겔 정제하고, 회수하여, 위에서 기술한 두 가지 서로 다른 중간 pSL 플라스미드 내의 NTD-spider 6-CTD와 NTD-EGFP-spider 6-CTD 서열의 상류에 있는 상응하는 부위로 서브클로닝 하였다. 최종적으로, 완전히 조립된 MP-UEE-NTD-A2S814-CTD 또는 MP-UEE-NTD-EGFP-A2S814-CTD 카세트를 각각의 최종 pSL 플라스미드로부터 AscI과 FseI으로 절단하고, pBAC[3XP3-DsRedaf]98의 상응하는 부위로 서브클로닝 하였다. 이러한 최종 서브클로닝 단계에서 EGFP 표지의 부재 또는 존재를 나타내기 위하여, 거미 6과 거미 6-EGFP라고 지칭한 두 가지 별도의 피기백 벡터를 얻었다. 이들 벡터를 아래에 기술한 바와 같이 생체 외 실크 분비샘 포격 분석 및 누에 형질전환에 이용하였다.
결과:
생체 외 분석 결과는 GFP 태그를 붙인 키메라 누에/거미 실크 단백질을 암호화하는 피기백 벡터는 후측의 실크 분비샘 영역에 녹색 형광을 유도하였음을 보여주었다. GFP 특이적인 항체를 이용한 면역학적 블로팅 분석은 추가적으로 포격된 실크 분비샘이 약 116kDa의 겉보기 분자량(Mr)을 나타내는 면역반응성 단백질을 함유하였음을 입증하였다. 예상(106kDa)보다 아주 약간 큰, 이러한 결과는 본 피기백 벡터의 기본 설계를 확인시켜 주었으며, 이러한 구조체를 이용하여 형질전환 누에의 분리를 유도하였다.
실시예
8. 형질전환 누에 분리
각 피기백 벡터를 피기백 유전자 전위효소를 암호화하는 플라스미드와 혼합하고, 혼합물을 누에나방 pnd-wl43으로부터 분리된 알에 독립적으로 미세 주사하였다. 이 누에 계통은 투명한 큐티클 표현형을 가져오는 멜라닌화 결핍증을 가지고 있어서, 형질전환체 내의 EGFP 태그가 부착된 키메라 누에-거미 실크 단백질의 검출을 촉진하므로, 이 누에 계통을 이용하였다. 각 피기백 벡터에 포함된 신경 특이적인 3XP3 프로모터27 제어 하에 DS-적색의 발현으로부터 비롯하는 적색 눈 표현형에 의해 추정상의 F1 형질전환체를 조기에 식별하였다(도 17d). 이러한 동물들을 방법에서 기술하는 바와 같이, 형질전환에 이용된 피기백 벡터를 표시하는 거미 6 및 거미 6-GFP라고 표시된, 몇 가지 동형 형질전환 누에 계통을 확립하는 데 이용하였다.
방법:
생체 외
실크
분비샘 포격 분석
오령 3일째에 들어가는 살아있는 누에나방 pnd-wl 계통 누에를 수 초 동안 70% 에탄올에 침지하여 멸균시키고, 0.7% w/v NaCI에 위치시켰다. 그런 다음, 전체 실크 분비샘을 각 동물로부터 무균적으로 절개하여, 항생제가 첨가된 그레이스 배지를 함유하는 페트리접시로 옮겼으며, DNA 포격 과정에 앞서 실크 분비샘을 그곳에 보유되도록 하였다. 동시에, 텅스텐 미세입자(1.7㎛ M-25 마이크로캐리어; Bio-Rad Laboratories, 미국 캘리포니아 주 허큘러스)를 다음과 같이 포격을 위한 DNA로 코팅하였다. 제조사의 지시에 따라 미세입자를 전처리하고, -20℃에서 50% 글리세롤에 3mg/50㎕의 분취량으로 보유하였다. 각 포격 실험 직전에, 3mg 미세입자 분취량을 제조사의 지시에 따라, 해당 피기백 DNA 5㎍으로 최대 부피 5㎕로 코팅하였다. 일부 미세입자 분취량은 DNA-음성 대조군으로 이용하고자 증류수로 코팅하였다. 각 포격 실험은 6회의 반복 검증을 포함하였으며, 각각의 개별적인 포격은 한 쌍의 온전한 실크 분비샘을 포함하였다. 포격을 위해, 분비샘을 유지 상태로부터 1% w/v 멸균 한천을 함유하는 90mm 페트리접시 위의 그레이스 배지에 옮겼으며, 페트리접시는 Bio-Rad Biolistic® PDS-1000/He 입자 전달 시스템 챔버 내에 위치시켰다. 챔버를 Hg에서 20 ~ 22로 비우고, 이전에 기술된 바와 같이26, 6cm의 거리에서 1,100psi의 헬륨 압력을 이용하여 입자 공급원으로부터 목표 조직까지 실크 분비샘을 미리 코팅된 텅스텐 미세입자로 포격하였다. 포격 후, 실크 분비샘을 2X 항생제가 첨가된 그레이스 배지를 함유하는 신선한 페트리 플레이트 내에 위치시키고, 28℃에서 배양하였다. 거미 6-GFP 피기백 벡터에서 EGFP 표지의 일과성 발현을 포격 후 48시간 및 72시간에서 형광 현미경에 의해 평가하였다. 4.2X의 배율, 1/120초의 상 및 1/110초의 녹색 형광(캡쳐)에서 Olympus FSX100 현미경으로 이미지를 얻었다. 또한, EGFP 태그가 부착된, 그리고 부착되지 않은 키메라 누에/거미 실크 단백질의 일과성 발현을 아래에서 기술하는 바와 같이, EGFP 특이적 항혈청 또는 거미 실크 특이적 항혈청을 이용하여 포격된 실크 분비샘 추출물을 면역학적 블로팅하여 평가하였다.
누에 형질전환
pnd-wl 나방이 알을 낳고 1시간 후에 알을 수집하여 현미경 슬라이드 위에 정렬하였다. 벡터와 헬퍼 플라스미드를 각각 0.2㎍/㎕의 최종 농도로 주사 완충액(0.1mM 인산 나트륨, 5mM KCl, pH 6.8)에 재현탁시키고, 월드 프레시젼 인스트루먼트 PV820 압력 조절기(World Precision Instruments PV820 pressure regulator, 미국), 수루가 세이키 M331 마이크로조작기(Suruga Seiki M331 micromanipulator, 일본), 및 나리시게 HD-21 더블 피펫 홀더(Narishige HD-21 double pipette holder, 일본)으로 이루어진 주사 시스템을 이용하여 1~5nl를 각 전배반엽 누에 배아에 주사하였다. 구멍 뚫린 알을 헬핑 핸드 슈퍼 글루 겔(Helping Hand Super Glue gel, The Faucet Queens, Inc., 미국)로 봉한 다음, 배아 발달을 위해 25℃와 70% 습도의 생장 챔버에 위치시켰다. 부화 후, 유충을 인공 사료(Nihon Nosan Co., 일본)로 사육하고, 동일 계통 내 형매 교배에 의해 후속 세대를 얻었다. 형질전환 자손은 550nm와 700nm 사이의 필터가 있는 올림푸스 SXZ12 현미경(일본 도쿄)을 이용하여, DsRed 형광 눈 표지의 존재에 의해 잠정적으로 식별하였다.
결과:
특수한 EGFP 자극 없이, 백색 조명 하에서의 육안 검사에 의해서도 거미 6-GFP 형질전환체에 의해 생산된 고치에서 EGFP 발현이 관찰되었다(도 18a). 이들 동물로부터 실크 분비샘(도 18b 내지 도 18c)과 고치(도 18d)를 형광 현미경으로 조사하였을 때, 강력한 EGFP 발현도 관찰되었다. 고치는 통합된 EGFP 신호가 있는 적어도 일부 실크 섬유를 포함하는 것으로 보였다. EGFP 특이적 항혈청 및 거미 실크 단백질 특이적 항혈청을 이용하여, 실크 분비샘과 고치 추출물을 면역학적 블로팅하여, 거미 6-GFP 실크 분비샘과 고치에서 EGFP 태그가 부착된 키메라 누에/거미 실크 단백질의 발현을 확인하였다(도 19). 거미 실크 단백질 특이적인 항혈청을 이용한 면역학적 블로팅에 의해, 거미 6 실크 분비샘과 고치 추출물에서 비슷한 결과가 얻어졌다(도 19). 이러한 결과는 본 발명자들이 EGFP 태그가 부착된 또는 부착되지 않은 형태의 키메라 누에/거미 실크 단백질을 암호화하는 형질전환 누에를 성공적으로 분리하였다는 것과 이들 단백질이 형질전환 동물에 의해 생산된 실크 섬유와 관련이 있다는 것을 보여주었다.
실시예
9. 복합
실크
섬유의 분석
키메라 누에/거미 실크 단백질과 형질전환 누에가 생산한 복합 실크 섬유와의 연관성을 분석하기 위하여 연속적인 단백질 추출 접근법을 이용하였다. 느슨하게 회합된 세리신 층을 제거한 후, 고무질을 제거한 실크 섬유를 방법에 기술하는 바와 같이, 점차 강해지는 일련의 추출과정의 대상으로 하였다.
방법:
누에고치 단백질의 연속 추출
양친 누에와 형질전환 누에가 생산한 고치를 채취하고, 고치를 물질:용매 비율을 1:50(w/v)으로 하여, 85℃에서 15분 동안 0.05% (w/v) Na2C03에 살살 교반시켜 세리신 층을 제거하였다40. 고무질을 제거한 실크를 욕(bath)으로부터 제거하고, 조심스럽게 교반하면서 그리고 동일한 물질 대 용매 비율로 하여 뜨거운(50~60℃) 물로 2회 세척하였다. 그런 다음, 고무질을 제거한 실크 섬유를 동결 건조하여, 세리신 층 제거 효율을 추정하고자 무게를 측정하였다. 고무질을 제거한 섬유는 다음과 같이, 반드시 꾸준히 교반되도록 혼합 휠(mixing wheel) 상에 회전시키면서 연속 단백질 추출 프로토콜에 이용하였다. 고무질을 제거한 실크 섬유 30mg을 4℃에서 16시간 동안 1ml의 인산 완충 식염수(PBS; 137mM NaCl, 2.7mM KC1, 10mM Na2P04, 1.8mM KH2P04)로 처리하였다. 물질을 원심분리에 의해 불용성 분획과 가용성 분획으로 분리하고, PBS 가용성 분획으로, 상등액을 제거하여 -20℃로 유지시키고, 펠릿은 다음 추출의 대상으로 하였다. 이 펠릿을 2% (w/v) SDS 1ml에 재현탁시키고, 실온에서 16시간 동안 배양하였다. 다시, 물질을 원심분리에 의해 불용성 분획과 가용성 분획으로 분리하고, SDS 가용성 분획으로, 상등액을 제거하여 -20℃로 유지시키고, 펠릿은 다음 추출의 대상으로 하였다. 이 펠릿을 2% (v/v) β-메르캅토에탄올을 함유하는 9M LiSCN 1ml에 재현탁시키고, 실온에서 16~48시간 동안 배양하였다. 원심분리 후, 9 M LiSCN/BME 가용성 분획으로 상등액을 -20℃로 유지시켰다. 이 단계에서 얻어진 최종 펠릿을 5% (v/v) BME를 함유하는 16M LiSCN 1ml에 재현탁시키고, 실온에서 약 1시간 동안 배양하였다. 그 결과, 완전한 용해가 이루어져 최종 추출물을 생산하였는데, 최종 추출물은 면역학적 블로팅이 수행될 때까지 16M LiSCN/BME 가용성 분획으로 -20℃에서 유지되었다.
실크
단백질 분석
생체 외 포격 분석의 실크 분비샘과 미처리 양친 누에 및 형질전환 누에의 실크 분비샘을 얼음 위에서 1% (w/v) SDS와 5M 우레아를 함유하는 인산 나트륨 완충액(30 mM Na2P04, pH 7.4)에 균질화시킨 다음, 4℃의 마이크로원심분리기에서 13,500rpm으로 5분간 정화시켰다. 상등액을 실크 분비샘 추출물로서 채취하고, 이들 추출물과 위에서 기술한 연속 고치 추출물을 10 mM Tris-HCl/2 SDS/5 BME 완충액으로 4배 희석시키고, 약 90㎍의 총 단백질을 함유하는 시료를 SDS-PAGE 로딩 완충액과 1:1로 혼합하여, 95℃에서 5분간 끓인 후, 4~20% 구배율의 겔(Pierce Protein Products; 미국 일리노이 주 록포드) 상으로 로딩하였다. 분리 후, 바이오 래드 트랜스퍼 셀(Bio-Rad transfer cell)을 이용하여 제조사의 지시에 따라 단백질을 겔로부터 PVDF 막(ImmobilonTM; Millipore, 미국 매사추세츠 주 빌러리카)으로 옮겼다. 1차 항체로서 네필라 클라비페스 편모상 실크 유사 A2 펩티드(GenScript Corporation, 미국 뉴저지 주 피스카타웨이) 또는 상업용 EGFP 특이적 마우스 단일클론항체(Living Colors® GFP, Clontech Laboratories, 미국 캘리포니아 주 마운틴뷰)에 대항하여 생산된 거미 실크 단백질 특이적인 다클론성 토끼 항혈청을 이용하여 면역검출법을 수행하였다. 2차 항체는 각각 염소 항토끼 IgG-HRP(Promega Corporation, 미국 위스콘신 주 매디슨) 또는 염소 항마우스 IgG H+L HRP 콘쥬게이트(EMD Chemicals, 미국 뉴저지 주 깁스타운)였다. 모든 항체는 표준 블로킹 완충액(lx PBST/0.05% 탈지분유)에 1:10,000의 희석배율로 이용하였고, 항체-항원 반응은 상업용 키트(ECLTM Western Blotting Detection Reagents; GE healthcare)를 이용하여 화학발광에 의해 시각화하였다.
결과:
이 과정의 각 단계 이후, 가용성 분획과 불용성 분획을 원심분리에 의해 분리하였고, 가용성 분획은 면역학적 블로팅을 위해 보유하였으며, 불용성 분획은 다음 추출에 이용하였다. 최종 추출 용매는 나머지 실크 섬유를 완전히 용해시켰다. 면역학적 블로팅 제어는 거미 실크 단백질 특이적인 항혈청은 pnd-wl 실크 섬유의 어떠한 단백질도 인식하지 못하였지만(도 19b, 3~6번 레인), 대장균에서 생산된 키메라 누에/A2S814 거미 실크 단백질은 인식하였음을 확인시켜 주었다(도 19b, 2번 레인). 형질전환 동물로부터 고무질을 제거한 고치를 식염수(도 19b, 8번과 13번 레인), SDS(도 19b, 9번과 14번 레인) 및 8M LiSCN/2 β-메르캅토에탄올(도 19b, 10번과 15번 레인)을 이용하여 연속 추출한 결과, 임의의 검출할 수 있는 면역반응성 단백질을 방출시키지 못했다. 그러나, 16M LiSCN/5% β-메르캅토에탄올로 나머지 실크 섬유를 후속 추출하자 나머지 거미 6(도 19, 11번 레인)으로부터 약 106kDa Mr의 면역반응성 단백질과 나머지 거미 6-GFP 섬유(도 19, 16번 레인)로부터 약 130 및 약 110kDa의 두 가지 면역반응성 단백질이 방출되었다. 이들 단백질 모두는 예상(거미 6는 78kDa, 거미 6-GFP는 106kDa)보다 컸다. 이러한 차이에 대한 가능성 있는 해명은 거미 실크 서열의 고반복 속성, SDS-PAGE 상에서의 단백질 산물의 이례적인 이동 및/또는 키메라 누에/거미 실크 단백질의 번역 후 변경으로 말미암은 전사/번역 '말더듬기(stuttering)'을 포함한다. 면역학적 블로팅에서 양성 대조군이었던, 대장균에서 생산된 키메라 누에/A2S814 거미 실크 단백질도 예상(60kDa)보다 큰 Mr(약 75kDa)을 나타냈다. 두 가지 형질전환 누에 계통의 고무질을 제거한 고치로부터 얻어진 16M LiSCN/5% β-메르캅토에탄올 추출물 또한 약 40 내지 약 75kDa의 Mr을 나타내는 면역반응성 자국을 포함하여, 아마도 키메라 누에/거미 실크 단백질의 분해 및/또는 미성숙 번역 종결을 반영하였다. 이식 유전자 산물의 크기 또는 그것들의 출현 이유와 상관없이, 연속 추출 결과는 본원에 기술된 바와 같이 제공된 형질전환 누에가 복합 실크 섬유로 극히 안정적으로 도입되는 키메라 누에/거미 실크 단백질을 발현하였음을 명백히 입증하였다.
실시예
10. 복합
실크
섬유의 기계적 성질
형질전환 누에가 생산한 복합 실크 섬유의 고무질이 제거된 천연 및 복합 실크 섬유의 기계적인 성질이 여기에서 기술된다.
시험을 위한 복합 실크 섬유의 제조방법 및 시험 수행방법이 아래 방법에 제시되어 있다.
방법:
기계적 시험에 이용된 고무질이 제거된 누에 실크 섬유는 19mm의 초기 길이(L0)를 나타냈다. 표준 50N 셀과 맞춤 제작된 10g 로드 셀(Transducer Techniques, 미국 캘리포니아 주 테메큘라)가 장착된 MTS 시너지 100 시스템(MTS Synergie 100 system; MTS Systems Corporation, 미국 미네소타 주 에덴 프레리)을 이용하여, 주위 조건(20~22℃와 19~22% 습도)에서 단일 섬유 시험을 수행하였다. 응력 및 변형 값의 계산을 허용하는, 5mm/min의 변형율과 250MHz의 주파수에서 TestWorks® 4.05 소프트웨어(MTS Systems Corporation, 미국 미네소타 주 에덴 프레리)로 두 개의 로드 셀로부터 기계적 데이터(로드 및 신장도)를 기록하였다. 인성(또는 파괴 에너지), 영률(초기 견고성), 최대 응력 및 최대 신장률(=최대 % 변형율)을 결정하기 위하여 MATLAB(7.1버전)을 이용하여 각 섬유에 대해 수집된 데이터 세트로부터 응력/변형 곡선을 그렸다.
결과:
결과는 EGFP 태그가 부착된 또는 부착되지 않은 키메라 누에/거미 실크 단백질을 함유하는 고무질이 제거된 복합 섬유는 pnd-wl 누에의 천연 섬유보다 상당히 큰 신장성과 약간 향상된 강도 및 견고성을 나타냈음을 입증하였다(표 3 및 도 20). 표 3: 양친 및 형질전환 누에가 생산한 12~15개 실크 섬유의 기계적 성질을 온도, 습도 및 시험 속도를 정확하게 매치시킨 조건 하에서 측정하였으며, 평균값과 표준오차를 표에 나타내었다. 비교를 위해, 정확하게 동일한 조건 하에서 동시에 결정한 거미(네필라 클라비페스) 드래그라인 실크 섬유의 평균적인 기계적 성질을 포함시켰다.
양친 누에와 형질전환 누에가 생산한 12~15개 실크 섬유의 기계적 성질을 측정하여, 평균값과 표준오차를 표에 나타내었다. 비교를 위해 동일한 조건 하에서 결정한 거미(네필라 클라비페스) 드래그라인 실크 섬유의 최적의 기계적 성질을 포함시켰다.
따라서, 이들 복합 섬유는 천연 누에 실크 섬유보다 질기다. 형질전환 누에가 생산한 복합 실크의 기계적 성질은 양친 계통이 생산한 천연 섬유의 그것들보다 훨씬 더 가변적이었다. 또한, 두 가지 서로 다른 거미 6-GFP 계통이 생산한 복합 섬유는 비슷한 신장성을 나타냈지만, 상이한 인장 강도를 나타냈다. 개별적인 형질전환 계통 내에서의 복합 실크 섬유의 기계적 성질에서 관찰된 변이와 계통별 변이는 복합 섬유 내 이질성을 반영할 수 있고, 이질성은 키메라 누에/거미 실크 단백질 비율 및/또는 섬유를 따라 이들 단백질이 위치하는 것의 차이로부터 비롯될 수 있다. 도 18d에서 복합 섬유 내 이질성의 증거를 볼 수 있다. 형질전환 누에로부터 얻어진 복합 섬유, 양친 누에로부터 얻어진 천연 섬유, 그리고 대표적인 드래그라인 거미 실크 섬유에 대해 관찰한 최고의 기계적 성능을 비교한 것을 도 20에 나타내었다. 결과는 모든 복합 섬유가 pnd-wl 누에로부터 얻어진 천연 실크 섬유보다 질기다는 점을 보여주었다. 또한, 형질전환 거미 6-GFP 4번 계통 누에로부터 얻어진 복합 섬유는 같은 조건 하에서 시험한 천연 거미 드래그라인 실크 섬유보다 훨씬 질겼다. 이러한 결과는 키메라 누에/거미 실크 단백질의 도입이 형질전환 누에 플랫폼을 이용하여 생산된 복합 실크 섬유의 기계적 성질을 상당히 향상시킬 수 있음을 보여준다.
천연 누에(pnd-wl)와 거미(N. 클라비페스 드래그라인) 실크 섬유에 대해 측정한 최고의 기계적 성능을 형질전환 누에가 생산한 복합 실크 섬유에 대해 얻은 값과 비교하였다. 모든 섬유는 동일한 조건에서 시험하였다. 최대 인성값은 누에 pnd-wl(청색선, 43.9MJ/m3), 거미 6, 7번 계통(주황색선, 86.3MJ/m3), 거미 6-GFP, 1번 계통(암록색선, 98.2MJ/m3), 거미 6-GFP, 4번 계통(밝은 녹색선, 167.2MJ/m3) 및 N. 클라비페스 드래그라인(적색선, 138.7MJ/m3)이었다(표 3 참조).
실시예
11. 안정적으로 도입된
키메라
누에/거미
실크
단백질을 함유하는 복합 섬유
거미 실크는 여러 가지 서로 다른 응용을 위한 생체적합물질로서 방대한 용도를 가지고 있다. 이전에는, 거미 농업에 대한 심각한 장애물이 예를 들어, 천연 제조 노력을 제대로 기능하지 못하게 했었다. 거미 실크 섬유 생산을 위하여 효율적인 생명공학적 접근법을 개발해야 하는 필요성은 본 발명에 제공된 플랫폼에 제시되어 있다. 다른 플랫폼이 재조합 거미 실크 단백질 제조용으로 기술되어 있었지만, 이러한 단백질을 유용한 섬유로 효율적으로 처리하는 것은 어려웠다. 단백질이 아니라 섬유를 제조해야 하는 필요성은 누에를 이러한 특정 생명공학적 응용을 위하여 자격을 갖춘 플랫폼으로 자리잡게 한다.
누에나방 세리신(Ser1) 프로모터의 전사적 제어 하에 천연 네필라 클라비페스 주요 팽창 스피드로인-1 실크 단백질을 암호화하는 피기백 벡터를 이용하여, 거미 실크 단백질을 생산하도록 유전자 조작된 형질전환 누에를 분리하였다. 스피드로인 서열을 C 말단 fhc 펩티드를 암호화하는 하류 서열에 융합시켰다. 이러한 피기백 구조체를 이용하여 분리된 형질전환 누에는 키메라 누에/거미 실크 단백질을 함유하는 고치를 생산하였지만, 이 단백질은 느슨하게 회합된 세리신 층에서만 발견되었다. 반대로, 본 발명에 의한 형질전환 누에가 생산한 키메라 누에/거미 실크 단백질은 복합 섬유의 필수 구성요소였다. 다른 것들에 의해 설계된 키메라 누에/거미 실크 단백질의 상대적으로 느슨한 회합은 다른 것들 중에서도 N 말단 누에 fhc 도메인의 부재를 반영할 수 있다. 대안적으로, Ser1 프로모터는 중간의 실크 분비샘에서 전사적으로 활성을 나타내지만, 각각 fhc, 피브로인 경쇄 및 헥사메린 단백질 발현을 제어하는 fhc 프로모터, flc 프로모터 및 fhx 프로모터는 후측의 실크 분비샘에서 활성을 나타내므로, 피기백 벡터 내에 Ser1 프로모터를 이용하는 것은 다른 것들 중에서도 적당한 섬유 어셈블리와 일관되지 않을 수 있다. 섬유 내로의 누에 실크 단백질의 조립은 어느 정도는 실크 유전자 발현의 조밀한 공간적 및 시간적 조절에 의해 제어된다. 따라서, 새롭게 조립된, 복합 실크 섬유로의 키메라 단백질의 안정적인 통합을 촉진하기 위하여, 현재 개시되는 벡터는 천연 실크 단백질과 동일한 장소에서 그리고 동시에 키메라 누에/거미 실크 단백질의 축적을 추진하는 fhc 프로모터로 유전자 조작된다. 다른 것들은 일부 형질전환 누에가 생산한 고치로부터 얻어진 섬유의 탄성 및 인장 강도에서 소량의 증가를 만들어냈다. 그러나, 기계적 시험 전에 세리신 층이 제거되지 않았고, 이러한 고무질 제거 단계는 상업용 실크 섬유 생산을 위한 고치의 처리에서 필수적이다. 따라서, 고치가 종래의 방식으로 처리되었다면, 재조합 거미 실크/누에 단백질은 제거되며, 그 결과로 얻어지는 실크 섬유는 향상된 기계적 성질을 가질 것으로 예상되지 않을 것이다.
거미 실크 단백질을 생산하는 형질전환 누에는 헥사플루오로 용매에 용해시킨 실크 단백질로부터 섬유의 재생에 초점을 둔 다른 연구에서 상대적으로 소수의 구성요소로 보고되었다. 그럼에도, 본 연구는 네필라 클라비페스 주요 팽창 스피드로인-1 또는 편모상 실크 단백질로부터 극히 짧은, 합성형의, "실크 유사" 서열을 암호화하는 피기백 벡터로 생산한 두 가지 형질전환 누에를 기술하였다. 두 가지 실크 유사 펩티드는 N 말단과 C 말단의 fhc 도메인 내에 포함시켰다. 기계적 시험 결과, 이들 형질전환 동물이 생산한 실크 섬유는 약간 큰 인장 강도(41~73MPa)를 나타냈으며, 탄성에는 아무런 변화가 없었다. 연구진은 또한 그것들의 복합 섬유의 기계적 성질에서 관찰되는 상대적으로 작은 변화가 낮은 수준의 재조합 단백질 도입을 반영하였다고 보고한다. 그러한 구조체에 사용되는 특정 거미 실크 유사 펩티드 서열 및/또는 그것들의 작은 크기가, 형질전환 누에가 생산한 복합 섬유의 기계적인 성질의 상대적으로 작은 변화를, 적어도 어느 정도는 설명할 수 있다는 것 역시 가능하다.
본 발명의 형질전환 누에 및 복합 섬유는, 기계적인 성질을 상당히 향상시키는, 안정적으로 통합된 키메라 누에/거미 실크 단백질을 함유하는, 복합 실크 섬유를 생산하는 형질전환 누에 계통을 획득할 수 있는 최초의 것이다. 본 발명의 형질전환 누에 계통이 생산한 복합 거미 실크/누에 섬유는 천연 드래그라인 거미 실크 섬유보다 훨씬 더 질겼다. 다른 요인 중에서도, 이는 적어도 어느 정도는, 반복적인 편모상 유사 (GPGGA)4 탄성 모티프 및 주요 팽창 스피드로인-2 [링커-알라닌8] 결정형 모티프를 암호화하는 2.4kbp A2S814 합성 거미 실크 서열을 이용하였기 때문일 수 있다. 이렇게 상대적으로 큰 합성 거미 실크 단백질은 대장균에서 생산된 후 압출에 의해 섬유로 직조될 수 있으며, 이는 그것이 섬유로 조립할 수 있는 자연적인 능력을 보유하였음을 나타낸다. 그러나, 이 단백질은 서로 호응하여 발현되며, 실크 섬유로 도입되기 위해서는 내인성 누에 fhc, flc 및 fhx 단백질과 상호작용해야 한다. 따라서, A2S814 거미 실크 서열을 조립 공정을 안내하기 위하여 N 말단과 C 말단의 fhc 도메인 내에 포함시켰다. 내인성 누에 실크 단백질과 공간적으로 그리고 시간적으로 가깝게 발현을 추진하는 fhc 도메인의 능력과 함께, 이러한 특질들은, 복합 실크 섬유의 조립에 참여하고, 기계적인 성질에 상당히 이바지하는, 키메라 누에/거미 실크 단백질의 능력을 적어도 부분적으로는 설명할 수 있다.
실시예
12.
피기백
벡터 구조체 및
피기백
벡터 구성요소의
PCR
증폭
누에나방 P50/다이조 계통의 실크 분비샘으로부터 분리된 게놈 DNA와 표 4에 나타낸 유전자 특이적 프라이머를 이용한 중합효소 연쇄반응에 의해 몇 가지 유전자 절편을 분리하였다. 이들 절편은 fhc 주요 프로모터 및 상류 인핸서 요소(MP-UEE), fhc 기초 프로모터(BP)의 두 가지 버전 및 서로 다른 5'- 및 3'-측면 제한부위가 있는 N 말단 도메인(NTD; 엑손 1/인트론 1/엑손 2), fhc C 말단 도메인(CTD; 3' 코딩 서열 및 폴리아데닌 신호), 및 EGFP를 포함하였다. 각각의 경우에서, 증폭 산물은 겔 정제되었고, 예상 크기의 DNA 절편을 절단하여 회수하였다. 그 다음으로, fhc MP-UEE, fhc CTD, 및 EGFP 절편을 pSLfal l80fa로 클로닝하고, 두 가지 서로 다른 NTD 절편을 pCR4-TOPO(Invitrogen Corporation, 미국 캘리포니아 주 칼즈배드)로 클로닝하였으며, 올바른 증폭 산물을 함유하는 대장균 형질전환체를 제한효소 지도 작성에 의해 식별하고, 서열분석으로 확인하였다. 그런 다음, 이들 절편을 다음과 같이 이번 연구에 이용된 피기백 벡터를 조립하는 데 이용하였다. 합성 A2S814 거미 실크 서열을 pBluescript SKII+ 플라스미드 전구체로부터 BamHI 및 BspEL로 절단하고, 겔 정제하고, 회수하여, 위에서 기술한 pSL 중간 플라스미드 내의 CTD 상류의 상응하는 부위에 서브클로닝 하였다. 이 단계로부터 pSL-spider6-CTD라는 플라스미드를 얻었다. 그런 다음, NotI/BamHI 절편을 위에서 기술한 pCR4-TOPO-NTD 중간 플라스미드 중 하나로부터 절단하고, 겔 정제하고, 회수하여, pSLspider 6-CTD 내의 거미 6-CTD 서열 상류의 상응하는 부위로 서브클로닝 하여, pSL-NTD-spider 6-CTD를 생산하였다. 동시에, 위에서 기술한 다른 pCR4-TOPO-NTD 중간 플라스미드로부터 NotI/XbaI 절편을 절단하고, 겔 정제하고, 회수하여, 위에서 기술한 pSL-EGFP 중간 플라스미드 내의 EGFP 앰플리머 상류의 상응하는 부위로 서브클로닝 하였다. 이것은 NotI 및 BamHI로 절단되어, pSL-spider 6-CTD 내의 거미 6-CTD 상류의 상응하는 부위로 서브 클로닝된 NTD-EGFP 절편을 함유하는 플라스미드를 생산하였다. 그런 다음, MP-UEE 절편을 위에서 기술한 pSL 중간 플라스미드로부터 SfiI 및 NotI로 절단하여, 겔 정제하고, 회수하여, 위에서 기술한 두 가지 서로 다른 중간 pSL 플라스미드 내의 NTD-spider 6-CTD와 NTD-EGFP-spider 6-CTD 서열의 상류에 있는 상응하는 부위로 서브클로닝 하였다. 최종적으로, 완전히 조립된 MP-UEE-NTD-A2S814-CTD 또는 MP-UEE-NTD-EGFP-A2S814-CTD 카세트를 각각의 최종 pSL 플라스미드로부터 AscI과 FseI으로 절단하고, pBAC[3XP3-DsRedaf](Horn, et al. (2002), Insect Biochem. Mol. Biol., 32: 1221-1235)의 상응하는 부위로 서브클로닝 하였다. 이러한 최종 서브클로닝 단계에서 EGFP 표지의 부재 또는 존재를 나타내기 위하여, 거미 6과 거미 6-EGFP라고 지칭한 두 가지 별도의 피기백 벡터를 얻었다. 다음과 같은 표는 이용된 피기백 벡터의 주요 구성요소 중 일부의 목록을 제공한다.
실시예
13.
masp
클로닝
본 실시예는 플라스미드 내에, 그리고 특히 pXLBacII ECFP 플라스미드 내의 NTD 영역을 함유하는 유전자 구조체를 제공하여 본 발명의 유용성을 입증한다.
pXLBacII ECFP 플라스미드와 함께 NTD 영역을 함유하는 잠재적인 양성 클론을 PCR을 이용한 콜로니 스크리닝에 의해 나타내었다.
pXLBacII-ECFP NTD CTD maspX 16(10,458bp)(도 12a) 및 pXLBacII-ECFP NTD CTD maspX24(11,250bp)(도 12b)에 대한 유전자 구조체 masp를 만들었다.
본 발명의 정신 및 범위로부터 벗어나지 않고 본 발명에 대한 다양한 수정 및 변경이 이루어질 수 있음은 본 발명이 속하는 분야에서 통상의 지식을 가진 자에게 명백할 것이다. 따라서, 본 발명의 수정 및 변경이 첨부된 청구항 및 그것들의 균등물 범위 내에 해당되는 한, 본 발명은 본 발명의 수정 및 변경을 포괄하도록 의도되어 있다.
참고문헌
본 참고문헌은 이로써 참조로 본원에 특별히 통합된다.
1. Berghammer, A., Bucher, G., Maderspacher, F., and Klingler, M. (1999), Dev. Genes Evol., 209: 382-389.
2. Birnboim, H. C, and Doly, J. (1979), Nucl. Acids Res., 7: 1513-1523.
3. Brooks, A. E., Creager, M., and Lewis, R. V. (2005), Altering the Mechanics of Spider Silk Through Methanol Post-spin Draw. In "Biomedical Sciences Instrumentation", Vol. 41, pp. 1-6.
4. Cary, L. C, et al. (1989), Virology, 172: 156-169.
5. Choudary, P. V., Kamita, S. G., and Maeda, S. (1995), Expression of foreign genes in Bombyx mori larvae using baculovirus vectors. In "Baculovirus expression protocols" (C. D. Richardson, Ed.), Vol. 39, pp. 243-264. Humana Press, Clifton, N.J.
6. Colgin, M., and Lewis, R. V. (1998), Protein Science, 7: 667-672.
7. Denny, M. W. (1980), Symp. Soc. Exp. Biol., 34: 247-272.
8. Dooling, D. (2005), Growing your own spare parts: NASA assists ligament replacement research.
9. Elick, T. A., Bauser, C. A., Principe, N. M., and Fraser, M. J., Jr. (1996), Genetica, 97: 127-139.
10. Fahnestock, S. R., and Bedzyk, L. A. (1997), Appl. Microbiol. Biotechnol., 47: 33-39.
11. Fraser, M. J. (2000), The TTAA-specific family of transposable elements. In "Insect Transgenesis: Methods and Applications." (A. A. James, and A. H. Handler, Eds.). CRC Press, Orlando.
12. Fraser, M. J., Brusca, J. S., Smith, G. E., and Summers, M. D. (1985), Virology, 145: 356-361.
13. Fraser, M. J., Cary, L., Boonvisudhi, K., and Wang, H. G. (1995), Virology, 211: 397-407.
14. Fraser, M. J., Smith, G. E., and Summers, M. D. (1983), J. Virol., 47: 287-300.
15. Gatesy, J., Hayashi, C, Motriuk, D., Woods, J., and Lewis, R. (2001), Science, 291: 2603-2605.
16. Gosline, J. M., Denny, M. W., and DeMont, M. E. (1984), Nature 309: 551-552.
17. Handler, A. M., and Gomez, S. P. (1995), Mol. Gen. Genet., 247: 399-408.
18. Handler, A. M., and Gomez, S. P. (1996), Genetics, 143: 1339-1347.
19. Handler, A. M., and Harrell, R. A., 2nd (1999), Insect Mol. Biol., 8: 449-457.
20. Handler, A. M., and Harrell, R. A., 2nd (2001), Insect Biochem. Mol. Biol., 31: 199-205.
21. Handler, A. M., McCombs, S. D., Fraser, M. J., and Saul, S. H. (1998), Proc. Natl. Acad. Sci. U. S. A., 95: 7520-7525.
22. Hayashi, C. Y., and Lewis, R. V. (2000), Science, 287: 1477-1479.
23. Hayashi, C. Y., Shipley, N. H., and Lewis, R. V. (1999), Int. J. Biol. Macromol., 24: 271-275.
24. Hinman, M. B., and Lewis, R. V. (1992), J. Biol. Chem., 267: 19320-19324.
25. Holland, C, Terry, A. E., Porter, D., and Vollrath, F. (2006), Nat. Mater., 5: 870-874.
26. Horard, B., Mange, A., Pelissier, B., and Couble, P. (1994), Insect Mol. Biol., 3: 261-265.
27. Horn, C, Jaunich, B., and Wimmer, E. A. (2000), Dev. Genes EvoL, 210: 623-629.
28. Huemmerich, D., et al. (2004), Curr., Biol. 14: 2070-2074.
29. Imamura, M., et al. (2003), Genetics, 165: 1329-1340.
30. Inoue, S., et al. (2005), Insect Biochem. Mol. Biol., 35: 51-59.
31. Inoue, S., et al. (2000), J. Biol. Chem., 275: 40517-40528.
32. Lazaris, A., et al. (2002), Science 295: 472-476.
33. Lewis, R. V., et al. (1996), Prot. Expr. Purif., 7: 400-406.
34. Lobo, N., Li, X., and Fraser, M. J., Jr. (1999), Mol. Gen. Genet., 261: 803-810.
35. Maeda, S., et al. (1985), Nature, 315: 592-594.
36. Mori, K., et al. (1995). J. Mol. Biol. 251: 217-228.
37. O'Brochta, D. A., Gomez, S. P., and Handler, A. M. (1991), Mol. Gen. Genet. 225: 387-394.
38. Peloquin, J. J., et al. (2000), Insect Mol. Biol., 9: 323-333.
39. Sambrook, J., Fritsch, E. F., and Maniatis, T. (1989), "Molecular Cloning: A Laboratory Manual." 2nd edition ed. Cold Spring Harbor Press, Cold Spring Harbor, New York.
40. Scheller, J., Guhrs, K. H., Grosse, F., and Conrad, U. (2001), Nat. BiotechnoL, 19: 573-577.
41. Southern, E. M. (1975), J. Mol. Biol., 98: 503-517.
42. Takei, F., et al. (1984), J. Cell Biol., 99: 2005-2010.
43. Tamura, T., et al. (2000), Nat. Biotechnol., 18: 81-84.
44. Thibault, S. T., Luu, H. T., Vann, N., and Miller, T. A. (1999), Insect Mol. Biol., 8: 119-123.
45. Thomas, J. L., et al. (2002), Insect Biochem. Mol. Biol., 32, 247-253.
46. Tomita, M., et al. (2003), Nat. Biotechnol., 21: 52-56.
47. Towbin, H., et al. (1979), Proc. Natl. Acad, of Sci. U.S.A., 76: 4350-4354.
48. Urry, D. W. (2002), Philosophical Transactions of the Royal Society of London B 357: 169-184.
49. Wang, H. G., and Fraser, M. J. (1993), Insect Mol. Biol., 1: 109-116.
50. Wang, H. H., Fraser, M. J., and Cary, L. C. (1989), Gene., 81: 97-108.
51. Wong Po Foo, C, et al. (2006), Appl. Phys. A., 82: 223-233.
52. Wurm, F. M. (2003), Nat. Biotechnol., 21 : 34-35.
53. Xu, M., and Lewis, R. V. (1990), Proc. Natl. Acad. Sci. U.S.A., 87: 7120-7124.
54. Yamao, M., et al. (1999), Genes. Dev., 13: 511-516.
55. Yun, et al. (2001), "Altering fibrin heavy chain gene of silkworm Bombyx mori by homologous recombination," Shengwu Huaxe yu Shengwu Wuli Xuebao 33(1): 112-116.
56. GenBank Acc. No. AF226688, Zhou, et al. "Bombyx mori fibroin heavy chain Fib-H (fib-H) gene, complete cds.," US Natl. Library of Medicine, Bethesda, MD, USA, Jun. 19, 2000.
57. Zhao, et al. (2001), Acta Biochimica et Biophysica Sinica, 33(1): 112-116.
58. Zhang, et al. (1999), Acta Biochimica et Biophysica Sinica, 31(2): 119-123.
59. Zhou, C.Z., et al. (2000), Nucleic Acids Res., 28. (12): 2413-2419.
60. Tomita, M., et al. (2003), Nat. Biotechnol., 21 (1): 52-56.
61. Yoshizato, Katsutoshi, "A Proposal for Application of Recombinant Insects (Kumikaetai Konchu Riyo Eno Teigen)", Sanshi Konchuken Shiryo, No. 28, pp. 93-95.
62. Toshiki, et al. (2000), Nature Biotechnology, 16: 81-85.
63. Okano, et al. (2000), Journal of Interferon and Cytokine Research, 20: 1015-1022.
64. Xiao-Hui, et al.(2000), Acta Pharmacol. Sin., 21 (9): 797-801.
65. Ishihara, et al. (1999), Biochimica et Biophysica Acta, 1451: 48-58.
66. T. Tamura, "Construction and utilization of transgenic silkworm using transposon", Fiber Preprints, Japan, Vol. 56, No. 2, 2001, p. 38-41.
A. Yanai, et al. (2002), Research Journal of Food and Agriculture, 25 (2): 30-33.
67. T. Tamura, et al. (2000), Agriculture and Horticulture, 75 ( 8): 17-24.
68. Yoshizato, Katsutoshi (2001), "A Proposal for Application of Recombinant Insects (Kumikaetai Konchu Riyo Eno Teigen)", Sanshi Konchuken Shiryo, 28: 93 -95.
69. United States Patent 7,674,882 - Kaplan, et al.
70. United States Patent 7,659, 112 - Hiramatsu, et al.
71. United States Patent 7,521,228 - Lewis, et al.
72. United States Patent 6,268, 169 - Fahnestock.
73. United States Patent 5,994,099 - Lewis.
74. United States Patent 5,989,894 - Lewis.
75. United States Patent 5,756,677 - Lewis
76. United States Patent 5,733,771 - Lewis.
77. Kluge, J.A., Rabotyagova, O., Leisk, G.G. & Kaplan, D.L. (2008), Trends Biotechnol, 26:244-251.
78. Scheibel, T. (2004), Microb. Cell. Fact. 3, 14.
79. Macintosh, A.C., Kearns, V.R., Crawford, A. & Hatton, P.V. (2008), /. Tiss. Engr. Reg. Med., 2:71-80.
80. Gosline, J.M., Guerette, P.A., Ortlepp, C.S. & Savage, K.N. (1999), /. Exp. Biol., 202:3295-3303.
81. Lewis, R.V. (2006), Chem. Rev., 106:3762-3774.
82. Hardy, J.G., L.M., R. & T.R. (2008), S., Polymer, 49:4309-4327.
83. Teule, F., et al. (2007), /. Mat. Set, 42:8974-8985.
84. Teule, F., et al. (2009), Nat. Protoc. 4:341-355.
85. Fahnestock, S.R. & Irwin, S.L. (1997), Appl. Microbiol. Biotechnol., 47:23-32.
86. Fahnestock, S.R. & Bedzyk, L.A. (1997), Appl. Microbiol. Biotechnol., 47:33-39.
87. Zhang, Y., et al. (2008), Mol. Biol. Rep. 35:329-335.
88. Miao, Y., et al. (2006), Appl. Microbiol. Biotechnol., 71: 192-199.
89. Kato, T., Kajikawa, M., Maenaka, K. & Park, E.Y. (2010), Appl. Microbiol. Biotechnol, 85:459-470.
90. Royer, C, et al. (2005), Transgenic Res., 14:463-472.
91. Kojima, K,. et al. (2007), Biosci. Biotechnol. Biochem. 71, 2943-2951.
92. Kurihara, H., Sezutsu, H., Tamura, T. & Yamada, K. (2007), Biochem. Biophys. Res. Commun., 355:976-980.
93. Shimizu, K., et al. (2007), Insect Biochem. Mol. Biol, 37:713-725.
94. Yanagisawa, S., et al. (2007), Biomacromolecules, 8:3487-3492.
95. Wen, H., et al. (2010), Mol. Biol. Rep., 37: 1815-1821.
96. Zhu, Z., et al. (2010), J. Biomater. Sci. olym. Ed., 21:395-411.
97. Sehnal, F. & Akai, H. (1990), Int. Insect Morph. Embryol., 19:79-132.
98. Horn, C, et al. (2002), Insect Biochem. Mol. Biol., 32: 1221-1235.
99. Yamada, H., Nakao, H., Takasu, Y. & Tsubouchi, K. (2001), Mat. Sci. Engr. C, 14:,41- 46.
100. United States Patent 5,728,810 Lewis.
SEQUENCE LISTING
<110> THE UNIVERSITY OF NOTRE DAME
<120> CHIMERIC SPIDER SILK AND USES THEREOF
<130> 343414-00063
<140> PCT/US2011/053760
<141> 2011-09-28
<150> 61/387,332
<151> 2010-09-28
<160> 35
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 1
Gly Pro Gly Gly Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gly Gln Gly
1 5 10 15
Pro Gly Gly Tyr
20
<210> 2
<211> 5
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: Putative flagelliform silk
elastic motif sequence
<400> 2
Gly Pro Gly Gly Ala
1 5
<210> 3
<211> 16
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: Putative dragline silk strength
motif sequence
<400> 3
Gly Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10 15
<210> 4
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 4
Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly
1 5 10 15
Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro
20 25 30
Gly Gly Ala Gly Pro Gly Gly Ala
35 40
<210> 5
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 5
Ala Ala Ala Ala Ala Ala Ala Ala
1 5
<210> 6
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 6
Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly
1 5 10 15
Pro Gly Gly Ala
20
<210> 7
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 7
taactcgagg ctcaaagcct catcccaatt tggag 35
<210> 8
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 8
ataccgcggt gcagaagaca agccatcgca acggtg 36
<210> 9
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 9
ataccgcgga aagatgtttt gtacggaaag tttgaa 36
<210> 10
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 10
ttagcggccg ccgaacccta aaacattgtt acgttacgtt acttg 45
<210> 11
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 11
taagcggccg cgggagaaag catgaagtaa gttctttaaa tattacaaaa a 51
<210> 12
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 12
ataggatcca cgactgcagc actagtgctg ctgaaatcgc 40
<210> 13
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 13
atatctagaa cgactgcagc actagtgctg ctgaaatcgc 40
<210> 14
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 14
caatctagac gtgagcaagg gcgaggagct gttcacc 37
<210> 15
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 15
taaggatcca gcttgtacag ctcgtccatg ccgagag 37
<210> 16
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 16
atacccggga agcgtcagtt acggagctgg cag 33
<210> 17
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 17
caagctgact atagtattct tagttgagaa ggcatac 37
<210> 18
<211> 33
<212> PRT
<213> Nephila clavipes
<400> 18
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala
1 5 10 15
Gly Arg Gly Gly Tyr Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
20 25 30
Ala
<210> 19
<211> 26
<212> PRT
<213> Lactrodectus geometricus
<400> 19
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gln Gly Gly Gln Gly Gly Ala
1 5 10 15
Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala
20 25
<210> 20
<211> 34
<212> PRT
<213> Argiope trifasciata
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (31)..(31)
<223> Any amino acid
<400> 20
Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu Gly Xaa Gln Gly
1 5 10 15
Ala Gly Gln Gly Tyr Gly Ala Gly Ser Gly Gly Gln Gly Gly Xaa Gly
20 25 30
Gln Gly
<210> 21
<211> 40
<212> PRT
<213> Nephila clavipes
<400> 21
Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly
1 5 10 15
Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser
20 25 30
Ala Ala Ala Ala Ala Ala Ala Ala
35 40
<210> 22
<211> 29
<212> PRT
<213> Lactrodectus geometricus
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Any amino acid
<400> 22
Gly Pro Gly Gly Tyr Gly Pro Gly Pro Gly Xaa Gln Gln Gly Tyr Gly
1 5 10 15
Pro Gly Gly Ser Gly Ala Ala Ala Ala Ala Ala Ala Ala
20 25
<210> 23
<211> 32
<212> PRT
<213> Argiope trifasciata
<400> 23
Gly Pro Gly Gly Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly
1 5 10 15
Pro Ser Gly Pro Gly Gly Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala
20 25 30
<210> 24
<211> 4949
<212> PRT
<213> Nephila clavipes
<400> 24
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
1 5 10 15
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln
20 25 30
Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly
35 40 45
Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly
50 55 60
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
65 70 75 80
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
85 90 95
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
100 105 110
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly
115 120 125
Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
130 135 140
Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly
145 150 155 160
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr
165 170 175
Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
180 185 190
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala
195 200 205
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
210 215 220
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala
225 230 235 240
Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly
245 250 255
Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly
260 265 270
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
275 280 285
Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg
290 295 300
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala
305 310 315 320
Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly
325 330 335
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly
340 345 350
Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
355 360 365
Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala
370 375 380
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
385 390 395 400
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
405 410 415
Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly
420 425 430
Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly
435 440 445
Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
450 455 460
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
465 470 475 480
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
485 490 495
Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
500 505 510
Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly
515 520 525
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala
530 535 540
Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly
545 550 555 560
Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
565 570 575
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly
580 585 590
Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
595 600 605
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly
610 615 620
Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly
625 630 635 640
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala
645 650 655
Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr
660 665 670
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala
675 680 685
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
690 695 700
Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly
705 710 715 720
Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly
725 730 735
Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly
740 745 750
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
755 760 765
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
770 775 780
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
785 790 795 800
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln
805 810 815
Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly
820 825 830
Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly
835 840 845
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
850 855 860
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
865 870 875 880
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
885 890 895
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly
900 905 910
Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
915 920 925
Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly
930 935 940
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr
945 950 955 960
Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
965 970 975
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala
980 985 990
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
995 1000 1005
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
1010 1015 1020
Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly
1025 1030 1035
Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
1040 1045 1050
Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
1055 1060 1065
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala
1070 1075 1080
Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
1085 1090 1095
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr
1100 1105 1110
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly
1115 1120 1125
Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
1130 1135 1140
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
1145 1150 1155
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
1160 1165 1170
Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala
1175 1180 1185
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly
1190 1195 1200
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly
1205 1210 1215
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
1220 1225 1230
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
1235 1240 1245
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly
1250 1255 1260
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly
1265 1270 1275
Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala
1280 1285 1290
Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly
1295 1300 1305
Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
1310 1315 1320
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly
1325 1330 1335
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly
1340 1345 1350
Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
1355 1360 1365
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly
1370 1375 1380
Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala
1385 1390 1395
Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala
1400 1405 1410
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly
1415 1420 1425
Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
1430 1435 1440
Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
1445 1450 1455
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly
1460 1465 1470
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
1475 1480 1485
Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
1490 1495 1500
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly
1505 1510 1515
Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
1520 1525 1530
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr
1535 1540 1545
Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala
1550 1555 1560
Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg
1565 1570 1575
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
1580 1585 1590
Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly
1595 1600 1605
Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
1610 1615 1620
Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly
1625 1630 1635
Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly
1640 1645 1650
Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala
1655 1660 1665
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly
1670 1675 1680
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln
1685 1690 1695
Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
1700 1705 1710
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly
1715 1720 1725
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
1730 1735 1740
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
1745 1750 1755
Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly
1760 1765 1770
Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
1775 1780 1785
Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
1790 1795 1800
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala
1805 1810 1815
Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
1820 1825 1830
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr
1835 1840 1845
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly
1850 1855 1860
Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
1865 1870 1875
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
1880 1885 1890
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
1895 1900 1905
Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala
1910 1915 1920
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly
1925 1930 1935
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly
1940 1945 1950
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
1955 1960 1965
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
1970 1975 1980
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly
1985 1990 1995
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly
2000 2005 2010
Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala
2015 2020 2025
Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly
2030 2035 2040
Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
2045 2050 2055
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly
2060 2065 2070
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly
2075 2080 2085
Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
2090 2095 2100
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly
2105 2110 2115
Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala
2120 2125 2130
Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala
2135 2140 2145
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly
2150 2155 2160
Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
2165 2170 2175
Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
2180 2185 2190
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly
2195 2200 2205
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
2210 2215 2220
Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
2225 2230 2235
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly
2240 2245 2250
Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
2255 2260 2265
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr
2270 2275 2280
Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala
2285 2290 2295
Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg
2300 2305 2310
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
2315 2320 2325
Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly
2330 2335 2340
Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
2345 2350 2355
Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly
2360 2365 2370
Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly
2375 2380 2385
Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala
2390 2395 2400
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly
2405 2410 2415
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln
2420 2425 2430
Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
2435 2440 2445
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly
2450 2455 2460
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
2465 2470 2475
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
2480 2485 2490
Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly
2495 2500 2505
Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
2510 2515 2520
Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
2525 2530 2535
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala
2540 2545 2550
Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
2555 2560 2565
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr
2570 2575 2580
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly
2585 2590 2595
Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
2600 2605 2610
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
2615 2620 2625
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
2630 2635 2640
Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala
2645 2650 2655
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly
2660 2665 2670
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly
2675 2680 2685
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
2690 2695 2700
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
2705 2710 2715
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly
2720 2725 2730
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly
2735 2740 2745
Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala
2750 2755 2760
Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly
2765 2770 2775
Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
2780 2785 2790
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly
2795 2800 2805
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly
2810 2815 2820
Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
2825 2830 2835
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly
2840 2845 2850
Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala
2855 2860 2865
Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala
2870 2875 2880
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly
2885 2890 2895
Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
2900 2905 2910
Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
2915 2920 2925
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly
2930 2935 2940
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
2945 2950 2955
Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
2960 2965 2970
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly
2975 2980 2985
Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
2990 2995 3000
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr
3005 3010 3015
Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala
3020 3025 3030
Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg
3035 3040 3045
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
3050 3055 3060
Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly
3065 3070 3075
Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
3080 3085 3090
Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly
3095 3100 3105
Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly
3110 3115 3120
Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala
3125 3130 3135
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly
3140 3145 3150
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln
3155 3160 3165
Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
3170 3175 3180
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly
3185 3190 3195
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
3200 3205 3210
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
3215 3220 3225
Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly
3230 3235 3240
Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
3245 3250 3255
Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
3260 3265 3270
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala
3275 3280 3285
Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
3290 3295 3300
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr
3305 3310 3315
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly
3320 3325 3330
Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
3335 3340 3345
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
3350 3355 3360
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
3365 3370 3375
Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala
3380 3385 3390
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly
3395 3400 3405
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly
3410 3415 3420
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
3425 3430 3435
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
3440 3445 3450
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly
3455 3460 3465
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly
3470 3475 3480
Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala
3485 3490 3495
Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly
3500 3505 3510
Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
3515 3520 3525
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly
3530 3535 3540
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly
3545 3550 3555
Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
3560 3565 3570
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly
3575 3580 3585
Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala
3590 3595 3600
Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala
3605 3610 3615
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly
3620 3625 3630
Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
3635 3640 3645
Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
3650 3655 3660
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly
3665 3670 3675
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
3680 3685 3690
Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
3695 3700 3705
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly
3710 3715 3720
Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
3725 3730 3735
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr
3740 3745 3750
Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala
3755 3760 3765
Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg
3770 3775 3780
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
3785 3790 3795
Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly
3800 3805 3810
Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
3815 3820 3825
Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly
3830 3835 3840
Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly
3845 3850 3855
Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala
3860 3865 3870
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly
3875 3880 3885
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln
3890 3895 3900
Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
3905 3910 3915
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly
3920 3925 3930
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
3935 3940 3945
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
3950 3955 3960
Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly
3965 3970 3975
Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
3980 3985 3990
Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
3995 4000 4005
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala
4010 4015 4020
Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
4025 4030 4035
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr
4040 4045 4050
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly
4055 4060 4065
Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
4070 4075 4080
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
4085 4090 4095
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
4100 4105 4110
Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala
4115 4120 4125
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly
4130 4135 4140
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly
4145 4150 4155
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
4160 4165 4170
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
4175 4180 4185
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly
4190 4195 4200
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly
4205 4210 4215
Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala
4220 4225 4230
Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly
4235 4240 4245
Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
4250 4255 4260
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly
4265 4270 4275
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly
4280 4285 4290
Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
4295 4300 4305
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly
4310 4315 4320
Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala
4325 4330 4335
Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala
4340 4345 4350
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly
4355 4360 4365
Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
4370 4375 4380
Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
4385 4390 4395
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly
4400 4405 4410
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
4415 4420 4425
Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
4430 4435 4440
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly
4445 4450 4455
Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
4460 4465 4470
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr
4475 4480 4485
Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala
4490 4495 4500
Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg
4505 4510 4515
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
4520 4525 4530
Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly
4535 4540 4545
Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
4550 4555 4560
Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly
4565 4570 4575
Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly
4580 4585 4590
Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala
4595 4600 4605
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly
4610 4615 4620
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln
4625 4630 4635
Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
4640 4645 4650
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly
4655 4660 4665
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
4670 4675 4680
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
4685 4690 4695
Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly
4700 4705 4710
Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
4715 4720 4725
Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
4730 4735 4740
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala
4745 4750 4755
Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
4760 4765 4770
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr
4775 4780 4785
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly
4790 4795 4800
Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
4805 4810 4815
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
4820 4825 4830
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
4835 4840 4845
Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala
4850 4855 4860
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly
4865 4870 4875
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly
4880 4885 4890
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
4895 4900 4905
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
4910 4915 4920
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly
4925 4930 4935
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
4940 4945
<210> 25
<211> 93
<212> PRT
<213> Argiope trifasciata
<400> 25
Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser
1 5 10 15
Gly Ala Gly Ala Gly Ser Gly Ser Gly Ala Gly Tyr Gly Val Gly Ala
20 25 30
Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala
35 40 45
Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser
50 55 60
Gly Ala Gly Ser Asp Gly Tyr Gly Arg Gly Phe Gly Ala Gly Ala Gly
65 70 75 80
Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Tyr Gly Ala
85 90
<210> 26
<211> 200
<212> PRT
<213> Araneus sp.
<400> 26
Gly Ala Gly Ala Ala Gly Gly Tyr Gly Gly Gly Ala Gly Ala Gly Ala
1 5 10 15
Gly Gly Ala Gly Gly Tyr Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala
20 25 30
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Gly Gly Tyr
35 40 45
Gly Gly Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Gln
50 55 60
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
65 70 75 80
Gly Ala Gly Ala Ala Gly Gly Tyr Gly Gly Gly Ala Gly Ala Gly Ala
85 90 95
Gly Gly Ala Gly Gly Tyr Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala
100 105 110
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Gly Gly Tyr
115 120 125
Gly Gly Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Gln
130 135 140
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
145 150 155 160
Gly Ala Gly Ala Ala Gly Gly Tyr Gly Gly Gly Ala Gly Ala Gly Ala
165 170 175
Gly Gly Ala Gly Gly Tyr Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala
180 185 190
Gly Ala Ala Ala Ala Ala Gly Ala
195 200
<210> 27
<211> 387
<212> PRT
<213> Nephila clavipes
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (25)..(25)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (30)..(30)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (35)..(35)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (40)..(40)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (45)..(45)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (50)..(50)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (55)..(55)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (60)..(60)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (65)..(65)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (70)..(70)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (75)..(75)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (80)..(80)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (85)..(85)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (90)..(90)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (95)..(95)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (100)..(100)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (105)..(105)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (110)..(110)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (115)..(115)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (120)..(120)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (125)..(125)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (130)..(130)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (135)..(135)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (140)..(140)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (145)..(145)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (150)..(150)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (155)..(155)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (160)..(160)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (165)..(165)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (170)..(170)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (175)..(175)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (180)..(180)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (185)..(185)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (190)..(190)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (195)..(195)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (200)..(200)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (205)..(205)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (208)..(208)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (211)..(211)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (214)..(214)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (217)..(217)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (220)..(220)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (223)..(223)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (226)..(226)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (262)..(262)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (267)..(267)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (272)..(272)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (277)..(277)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (282)..(282)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (287)..(287)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (292)..(292)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (297)..(297)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (302)..(302)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (307)..(307)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (312)..(312)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (317)..(317)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (322)..(322)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (327)..(327)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (332)..(332)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (337)..(337)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (342)..(342)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (347)..(347)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (352)..(352)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (357)..(357)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (362)..(362)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (367)..(367)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (372)..(372)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (377)..(377)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (382)..(382)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (387)..(387)
<223> Any amino acid
<400> 27
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
1 5 10 15
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
20 25 30
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly
35 40 45
Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly
50 55 60
Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
65 70 75 80
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
85 90 95
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
100 105 110
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly
115 120 125
Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly
130 135 140
Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
145 150 155 160
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
165 170 175
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
180 185 190
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Gly Xaa
195 200 205
Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly
210 215 220
Gly Xaa Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp
225 230 235 240
Gly Pro Ile Thr Ile Ser Glu Glu Leu Thr Ile Ser Gly Ala Gly Gly
245 250 255
Ser Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
260 265 270
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
275 280 285
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
290 295 300
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly
305 310 315 320
Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly
325 330 335
Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
340 345 350
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
355 360 365
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
370 375 380
Gly Gly Xaa
385
<210> 28
<211> 329
<212> PRT
<213> Nephila sp.
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (25)..(25)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (30)..(30)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (35)..(35)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (40)..(40)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (45)..(45)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (50)..(50)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (55)..(55)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (60)..(60)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (65)..(65)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (70)..(70)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (75)..(75)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (80)..(80)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (85)..(85)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (90)..(90)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (95)..(95)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (100)..(100)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (105)..(105)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (110)..(110)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (115)..(115)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (120)..(120)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (125)..(125)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (130)..(130)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (135)..(135)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (140)..(140)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (145)..(145)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (150)..(150)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (155)..(155)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (160)..(160)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (165)..(165)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (170)..(170)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (175)..(175)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (180)..(180)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (183)..(183)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (186)..(186)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (189)..(189)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (192)..(192)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (195)..(195)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (198)..(198)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (201)..(201)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (239)..(239)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (244)..(244)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (249)..(249)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (254)..(254)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (259)..(259)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (264)..(264)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (269)..(269)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (274)..(274)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (279)..(279)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (284)..(284)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (289)..(289)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (294)..(294)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (299)..(299)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (304)..(304)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (309)..(309)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (314)..(314)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (319)..(319)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (324)..(324)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (329)..(329)
<223> Any amino acid
<400> 28
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
1 5 10 15
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
20 25 30
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly
35 40 45
Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly
50 55 60
Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
65 70 75 80
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
85 90 95
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
100 105 110
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly
115 120 125
Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly
130 135 140
Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
145 150 155 160
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
165 170 175
Pro Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa
180 185 190
Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Thr Val Ile Glu Asp Leu Asp
195 200 205
Ile Thr Ile Asp Gly Ala Asp Gly Pro Ile Thr Ile Ser Glu Glu Leu
210 215 220
Thr Ile Gly Gly Ala Gly Ala Gly Gly Ser Gly Pro Gly Gly Xaa Gly
225 230 235 240
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
245 250 255
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly
260 265 270
Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly
275 280 285
Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
290 295 300
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
305 310 315 320
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
325
<210> 29
<211> 125
<212> PRT
<213> Argiope trifasciata
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (25)..(25)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (30)..(30)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (52)..(52)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (57)..(57)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (62)..(62)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (67)..(67)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (72)..(72)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (75)..(75)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (78)..(78)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (81)..(81)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (84)..(84)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (87)..(87)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (90)..(90)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (95)..(95)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (100)..(100)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (105)..(105)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (110)..(110)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (115)..(115)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (120)..(120)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (125)..(125)
<223> Any amino acid
<400> 29
Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
1 5 10 15
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
20 25 30
Val Thr Val Asp Val Asp Val Ser Val Gly Gly Ala Pro Gly Gly Gly
35 40 45
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
50 55 60
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly
65 70 75 80
Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Pro Gly Gly Xaa Gly
85 90 95
Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro
100 105 110
Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa
115 120 125
<210> 30
<211> 17388
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 30
tcgacgtccc atggccattc gaattcggcc ggcctaggcg cgccgtacgc gtatcgataa 60
gctttaagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 120
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 180
caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 240
gttttttaaa gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tctagagtcg 300
cggccgctac aggaacaggt ggtggcggcc ctcggtgcgc tcgtactgct ccacgatggt 360
gtagtcctcg ttgtgggagg tgatgtccag cttggagtcc acgtagtagt agccgggcag 420
ctgcacgggc ttcttggcca tgtagatgga cttgaactcc accaggtagt ggccgccgtc 480
cttcagcttc agggccttgt ggatctcgcc cttcagcacg ccgtcgcggg ggtacaggcg 540
ctcggtggag gcctcccagc ccatggtctt cttctgcatt acggggccgt cggaggggaa 600
gttccgccga tgaacttcac cttgtagatg aagcagccgt cctgcaggga ggagtcctgg 660
gtcacggtca ccacgccgcc gtcctcgaag ttcatcacgc gctcccactt gaagccctcg 720
gggaaggaca gcttcttgta gtcggggatg tcggcggggt gcttcacgta caccttggag 780
ccgtactgga actgggggga caggatgtcc caggcgaagg gcagggggcc gcccttggtc 840
accttcagct tcacggtgtt gtggccctcg taggggcggc cctcgcccct cgcccctcga 900
tctcgaactc gtggccgttc acggtgccct ccatgcgcac cttgaagcgc atgaactcct 960
tgatgacgtt cttggaggag cgcaccatgg tggcgaccgg tggatcccgg gcccgcggta 1020
ccgtcgactc tagcggtacc ccgattgttt agcttgttca gctgcgcttg tttatttgct 1080
tagctttcgc ttagcgacgt gttcactttg cttgtttgaa ttgaattgtc gctccgtaga 1140
cgaagcgcct ctatttatac tccggcggtc gagggttcga aatcgataag cttggatcct 1200
aattgaatta gctctaattg aattagtctt ctaattgaat tagtctctaa ttgaattaga 1260
tccccgggcg agctcgaatt aaaccattgt gggaaccgtg cgatcaaaca aacgcgagat 1320
accgggaagt actgaaaaac agtcgctcca ggccagtggg aacatcgatg ttttgttttg 1380
acggacccct tactctcgtc tcatataaac cgaagccagc taagatggta tacttattat 1440
catcttgtga tgaggatgct tctatcaacg aaagtaccgg taaaccgcaa atggttatgt 1500
attataatca aactaaaggc ggagtggaca cgctagacca aatgtgttct gtgatgacct 1560
gcagtaggaa gacgaatagg tggcctatgg cattattgta cggaatgata aacattgcct 1620
gcataaattc ttttattata tacagccata atgtcagtag caagggagaa aaggttcaaa 1680
gtcgcaaaaa atttatgaga aacctttaca tgagcctgac gtcatcgttt atgcgtaagc 1740
gtttagaagc tcctactttg aagagatatt tgcgcgataa tatctctaat attttgccaa 1800
atgaagtgcc tggtacatca gatgacagta ctgaagagcc agtaatgaaa aaacgtactt 1860
actgtactta ctgcccctct aaaataaggc gaaaggcaaa tgcatcgtgc aaaaaatgca 1920
aaaaagttat ttgtcgagag cataatattg atatgtgcca aagttgtttc tgactgacta 1980
ataagtataa tttgtttcta ttatgtataa gttaagctaa ttacttattt tataatacaa 2040
catgactgtt tttaaagtac aaaataagtt tatttttgta aaagagagaa tgtttaaaag 2100
ttttgttact ttatagaaga aattttgagt ttttgttttt ttttaataaa taaataaaca 2160
taaataaatt gtttgttgaa tttattatta gtatgtaagt gtaaatataa taaaacttaa 2220
tatctattca aattaataaa taaacctcga tatacagacc gataaaacac atgcgtcaat 2280
tttacgcatg attatcttta acgtacgtca caatatgatt atctttctag ggttaaataa 2340
tagtttctaa tttttttatt attcagcctg ctgtcgtgaa taccgtatat ctcaacgctg 2400
tctgtgagat tgtcgtattc tagccttttt agtttttcgc tcatcgactt gatattgtcc 2460
gacacatttt cgtcgatttg cgttttgatc aaagacttga gcagagacac gttaatcaac 2520
tgttcaaatt gatccatatt aacgatatca acccgatgcg tatatggtgc gtaaaatata 2580
ttttttaacc ctcttatact ttgcactctg cgttaatacg cgttcgtgta cagacgtaat 2640
catgttttct tttttggata aaactcctac tgagtttgac ctcatattag accctcacaa 2700
gttgcaaaac gtggcatttt ttaccaatga agaatttaaa gttattttaa aaaatttcat 2760
cacagattta aagaagaacc aaaaattaaa ttatttcaac agtttaatcg accagttaat 2820
caacgtgtac acagacgcgt cggcaaaaaa cacgcagccc gacgtgttgg ctaaaattat 2880
taaatcaact tgtgttatag tcacggattt gccgtccaac gtgttcctca aaaagttgaa 2940
gaccaacaag tttacggaca ctattaatta tttgattttg ccccacttca ttttgtggga 3000
tcacaatttt gttatatttt taaaacaaag ctttggcact ggccgtcgtt ttacaacgtc 3060
gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 3120
ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3180
tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 3240
accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 3300
gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 3360
acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 3420
cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3480
taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 3540
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3600
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3660
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3720
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3780
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3840
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 3900
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3960
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 4020
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 4080
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 4140
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 4200
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 4260
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4320
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4380
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 4440
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4500
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4560
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 4620
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 4680
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 4740
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 4800
caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 4860
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 4920
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 4980
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 5040
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 5100
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 5160
cctgatatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 5220
gatgctcgtc acggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5280
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5340
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5400
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 5460
cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 5520
ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 5580
cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 5640
ggaaacagct atgacatgat tacgaattcg agctcggtac ccggggatcc tctagagtcg 5700
acgctcgcgc gacttggttt gccattcttt agcgcgcgtc gcgtcacaca gcttggccac 5760
aatgtggttt ttgtcaaacg aagattctat gacgtgttta aagtttaggt cgagtaaagc 5820
gcaaatcttt tttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg cattcttgaa 5880
atattgctct ctctttctaa atagcgcgaa tccgtcgctg tgcatttagg acatctcagt 5940
cgccgcttgg agctcccgtg aggcgtgctt gtcaatgcgg taagtgtcac tgattttgaa 6000
ctataacgac cgcgtgagtc aaaatgacgc atgattatct tttacgtgac ttttaagatt 6060
taactcatac gataattata ttgttatttc atgttctact tacgtgataa cttattatat 6120
atatattttc ttgttataga tatcgtgact aatatataat aaaatgggta gttctttaga 6180
cgatgagcat atcctctctg ctcttctgca aagcgatgac gagcttgttg gtgaggattc 6240
tgacagtgaa atatcagatc acgtaagtga agatgacgtc cagagcgata cagaagaagc 6300
gtttatagat gaggtacatg aagtgcagcc aacgtcaagc ggtagtgaaa tattagacga 6360
acaaaatgtt attgaacaac caggttcttc atagattctg ttagaagcca aagaatcttg 6420
accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac ttcaaagtcc 6480
acgaggcgta gccgagtctc tgcactgaac attgtcagat ccgagatcgg ccggcctagg 6540
cgcgccaagc ttaaggtgca cggcccacgt ggccactagt acttctcgag gctcaaagcc 6600
tcatcccaat ttggagtcac tcaagacatc cttgattaag gcagctgccg atattgacat 6660
ggacctcgtt cgtgctgcga tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa 6720
tcacggaggt cattttgaat aaactttagt gtcataagaa tctatgtttt gttaagttca 6780
ttttggtata tgaatggtta cataatgaat aaacttgttt caattatttt acattaaaca 6840
tgtgacagaa tttatgacct gactaggtag gtacaaacag cctttttgat attagaaaac 6900
taagtaaaat agcctacggt cacatctctt tccgtgggtg tcgttaaagg gcgacttaga 6960
gaaccaccaa gaacgtagca gaatcctcag agtgtcatac cagcatacag ccatcgctaa 7020
ctgctattta ctggtaatag ggcacattgt aatctcactt aaccatactg tcgggccacc 7080
atctagccta tttctgccac gaatcaatcg tgagtgatgg acatagagaa actattagtt 7140
gagaagaaaa caagagcact aaaggtttga tattgacaaa aatctacttc gccgtcactc 7200
cataggttta ttgtctctca ttagtccaga acagcagtta cagacgtaag cttttacgca 7260
caaactacag ggttgctctt tattgtatcg aaaatatggg acctgaataa gggcgatttt 7320
gacgcgtcct gcccgcccat tcccgatcct acggacagaa tggcaagcag tcgacgtcgc 7380
cccaaacacg tcatttcgga tcctcacgat ccactaacgg tgctttaggt acctcaagca 7440
ccggtcatcg ttctcgtcgg acccgtcgct tgcgacgaag ggctcgacga gcaaattaac 7500
cctcagacac agcccactga gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc 7560
cggtggtaga ttctgcgaag cacggctctt gctaggattc gtgttagcaa cgtcgtcagg 7620
tttgagcccc gtgagctcac ttactagtta aggttacgct gaaatagcct ctcaaggctc 7680
tcagctaggt aggaaacaaa aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc 7740
ttctgcaccg cggaaagatg ttttgtacgg aaagtttgaa taagtgctta attgcaagta 7800
acgtaacaat gttttagggt tcggcggccg cgggagaaag catgaagtaa gttctttaaa 7860
tattacaaaa aaattgaacg atattataaa attctttaaa atattaaaag taagaacaat 7920
aagatcaatt aaatcataat taatcacatt gttcatgatc acaatttaat ttacttcata 7980
cgttgtattg ttatgttaaa taaaaagatt aatttctatg taattgtatc tgtacaatac 8040
aatgtgtaga tgtttattct atcgaaagta aatacgtcaa aactcgaaaa ttttcagtat 8100
aaaaaggttc aactttttca aatcagcatc agttcggttc caactctcaa gatgagagtc 8160
aaaacctttg tgatcttgtg ctgcgctctg caggtgagtt aattatttta ctattatttc 8220
agaaggtggc cagacgatat cacgggccac ctgataataa gtggtcgcca aaacgcacag 8280
atatcgtaaa ttgtgccatt tgatttgtca cgcccggggg ggctacggaa taaactacat 8340
ttatttattt aaaaaatgaa ccttagatta tgtaacttgt gatttatttg cgtcaaaagt 8400
aggcaagatg aatctatgta aatacctggg cagacttgca atatcctatt tcaccggtaa 8460
atcagcattg caatatgcaa tgcatattca acaatatgta aaacaattcg taaagcatca 8520
ttagaaaata gacgaaagaa attgcataaa attataaccg cattattaat ttattatgat 8580
atctattaac aattgctatt gccttttttt cgcaaattat aatcattttc ataacctcga 8640
ggtagcattc tgttacattt taatacattg gtatgtgatt ataacacgag ctgcccactg 8700
agtttctcgc cagatcttct cagtgggtcg cgttaccgat cacgtgatag attctatgaa 8760
gcactgctct tgttagggct agtgttagca aattctttca ggttgagtct gagagctcac 8820
ctacccatcg gagcgtagct ggaataggct accagctaat aggtagggaa aacaaagctc 8880
gaaacaagct caagtaataa caacataatg tgaccataaa atctcgtggt gtatgagata 8940
caattatgta ctttcccaca aatgtttaca taattagaat gttgttcaac ttgcctaacg 9000
ccccagctag aacattcaat tattactatt accactacta aggcagtatg tcctaactcg 9060
ttccagatca gcgctaactt cgattgaatg tgcgaaattt atagctcaat attttagcac 9120
ttatcgtatt gatttaagaa aaaattgtta acattttgtt tcagtatgtc gcttatacaa 9180
atgcaaacat caatgatttt gatgaggact attttgggag tgatgtcact gtccaaagta 9240
gtaatacaac agatgaaata attagagatg catctggggc agttatcgaa gaacaaatta 9300
caactaaaaa aatgcaacgg aaaaataaaa accatggaat acttggaaaa aatgaaaaaa 9360
tgatcaagac gttcgttata accacggatt ccgacggtaa cgagtccatt gtagaggaag 9420
atgtgctcat gaagacactt tccgatggta ctgttgctca aagttatgtt gctgctgatg 9480
cgggagcata ttctcagagc gggccatacg tatcaaacag tggatacagc actcatcaag 9540
gatatacgag cgatttcagc actagtgctg cagtcgttct agacctggat cccccgggtg 9600
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 9660
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 9720
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 9780
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 9840
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 9900
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 9960
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 10020
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 10080
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 10140
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 10200
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 10260
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 10320
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 10380
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 10440
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 10500
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 10560
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 10620
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 10680
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 10740
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 10800
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 10860
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 10920
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 10980
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11040
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11100
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 11160
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11220
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11280
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 11340
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11400
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11460
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 11520
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 11580
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 11640
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 11700
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 11760
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 11820
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 11880
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 11940
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 12000
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 12060
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 12120
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 12180
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 12240
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 12300
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 12360
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 12420
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 12480
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 12540
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 12600
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 12660
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 12720
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 12780
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 12840
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 12900
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 12960
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 13020
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 13080
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 13140
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 13200
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 13260
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 13320
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 13380
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 13440
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 13500
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 13560
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 13620
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 13680
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 13740
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 13800
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 13860
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 13920
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 13980
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 14040
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 14100
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 14160
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 14220
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 14280
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 14340
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 14400
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 14460
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 14520
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 14580
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 14640
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 14700
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 14760
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 14820
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 14880
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 14940
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 15000
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 15060
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 15120
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 15180
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 15240
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 15300
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 15360
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 15420
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 15480
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 15540
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 15600
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 15660
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 15720
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 15780
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 15840
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 15900
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 15960
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 16020
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 16080
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 16140
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 16200
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 16260
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 16320
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 16380
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 16440
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 16500
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 16560
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 16620
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 16680
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 16740
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 16800
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 16860
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggaagc gtcagttacg 16920
gagctggcag gggatacgga caaggtgcag gaagtgcagc ttcctctgtg tcatctgctt 16980
catctcgcag ttacgactat tctcgtcgta acgtccgcaa aaactgtgga attcctagaa 17040
gacaactagt tgttaaattc agagcactgc cttgtgtgaa ttgctaattt ttaatataaa 17100
ataacccttg tttcttactt cgtcctggat acatctatgt tttttttttc gttaataaat 17160
gagagcattt aagttattgt ttttaattac ttttttttag aaaacagatt tcggattttt 17220
tgtatgcatt ttatttgaat gtactaatat aatcaattaa tcaatgaatt catttattta 17280
agggataaca ataatccatg aattcacatg cacatttaaa acaaaactaa attacaatag 17340
gttcatataa aaacaacaag tatgccttct caactaagaa tactatag 17388
<210> 31
<211> 18102
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 31
tcgacgtccc atggccattc gaattcggcc ggcctaggcg cgccgtacgc gtatcgataa 60
gctttaagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 120
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 180
caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 240
gttttttaaa gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tctagagtcg 300
cggccgctac aggaacaggt ggtggcggcc ctcggtgcgc tcgtactgct ccacgatggt 360
gtagtcctcg ttgtgggagg tgatgtccag cttggagtcc acgtagtagt agccgggcag 420
ctgcacgggc ttcttggcca tgtagatgga cttgaactcc accaggtagt ggccgccgtc 480
cttcagcttc agggccttgt ggatctcgcc cttcagcacg ccgtcgcggg ggtacaggcg 540
ctcggtggag gcctcccagc ccatggtctt cttctgcatt acggggccgt cggaggggaa 600
gttccgccga tgaacttcac cttgtagatg aagcagccgt cctgcaggga ggagtcctgg 660
gtcacggtca ccacgccgcc gtcctcgaag ttcatcacgc gctcccactt gaagccctcg 720
gggaaggaca gcttcttgta gtcggggatg tcggcggggt gcttcacgta caccttggag 780
ccgtactgga actgggggga caggatgtcc caggcgaagg gcagggggcc gcccttggtc 840
accttcagct tcacggtgtt gtggccctcg taggggcggc cctcgcccct cgcccctcga 900
tctcgaactc gtggccgttc acggtgccct ccatgcgcac cttgaagcgc atgaactcct 960
tgatgacgtt cttggaggag cgcaccatgg tggcgaccgg tggatcccgg gcccgcggta 1020
ccgtcgactc tagcggtacc ccgattgttt agcttgttca gctgcgcttg tttatttgct 1080
tagctttcgc ttagcgacgt gttcactttg cttgtttgaa ttgaattgtc gctccgtaga 1140
cgaagcgcct ctatttatac tccggcggtc gagggttcga aatcgataag cttggatcct 1200
aattgaatta gctctaattg aattagtctt ctaattgaat tagtctctaa ttgaattaga 1260
tccccgggcg agctcgaatt aaaccattgt gggaaccgtg cgatcaaaca aacgcgagat 1320
accgggaagt actgaaaaac agtcgctcca ggccagtggg aacatcgatg ttttgttttg 1380
acggacccct tactctcgtc tcatataaac cgaagccagc taagatggta tacttattat 1440
catcttgtga tgaggatgct tctatcaacg aaagtaccgg taaaccgcaa atggttatgt 1500
attataatca aactaaaggc ggagtggaca cgctagacca aatgtgttct gtgatgacct 1560
gcagtaggaa gacgaatagg tggcctatgg cattattgta cggaatgata aacattgcct 1620
gcataaattc ttttattata tacagccata atgtcagtag caagggagaa aaggttcaaa 1680
gtcgcaaaaa atttatgaga aacctttaca tgagcctgac gtcatcgttt atgcgtaagc 1740
gtttagaagc tcctactttg aagagatatt tgcgcgataa tatctctaat attttgccaa 1800
atgaagtgcc tggtacatca gatgacagta ctgaagagcc agtaatgaaa aaacgtactt 1860
actgtactta ctgcccctct aaaataaggc gaaaggcaaa tgcatcgtgc aaaaaatgca 1920
aaaaagttat ttgtcgagag cataatattg atatgtgcca aagttgtttc tgactgacta 1980
ataagtataa tttgtttcta ttatgtataa gttaagctaa ttacttattt tataatacaa 2040
catgactgtt tttaaagtac aaaataagtt tatttttgta aaagagagaa tgtttaaaag 2100
ttttgttact ttatagaaga aattttgagt ttttgttttt ttttaataaa taaataaaca 2160
taaataaatt gtttgttgaa tttattatta gtatgtaagt gtaaatataa taaaacttaa 2220
tatctattca aattaataaa taaacctcga tatacagacc gataaaacac atgcgtcaat 2280
tttacgcatg attatcttta acgtacgtca caatatgatt atctttctag ggttaaataa 2340
tagtttctaa tttttttatt attcagcctg ctgtcgtgaa taccgtatat ctcaacgctg 2400
tctgtgagat tgtcgtattc tagccttttt agtttttcgc tcatcgactt gatattgtcc 2460
gacacatttt cgtcgatttg cgttttgatc aaagacttga gcagagacac gttaatcaac 2520
tgttcaaatt gatccatatt aacgatatca acccgatgcg tatatggtgc gtaaaatata 2580
ttttttaacc ctcttatact ttgcactctg cgttaatacg cgttcgtgta cagacgtaat 2640
catgttttct tttttggata aaactcctac tgagtttgac ctcatattag accctcacaa 2700
gttgcaaaac gtggcatttt ttaccaatga agaatttaaa gttattttaa aaaatttcat 2760
cacagattta aagaagaacc aaaaattaaa ttatttcaac agtttaatcg accagttaat 2820
caacgtgtac acagacgcgt cggcaaaaaa cacgcagccc gacgtgttgg ctaaaattat 2880
taaatcaact tgtgttatag tcacggattt gccgtccaac gtgttcctca aaaagttgaa 2940
gaccaacaag tttacggaca ctattaatta tttgattttg ccccacttca ttttgtggga 3000
tcacaatttt gttatatttt taaaacaaag ctttggcact ggccgtcgtt ttacaacgtc 3060
gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 3120
ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3180
tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 3240
accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 3300
gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 3360
acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 3420
cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3480
taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 3540
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3600
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3660
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3720
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3780
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3840
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 3900
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3960
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 4020
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 4080
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 4140
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 4200
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 4260
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4320
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4380
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 4440
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4500
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4560
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 4620
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 4680
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 4740
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 4800
caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 4860
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 4920
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 4980
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 5040
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 5100
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 5160
cctgatatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 5220
gatgctcgtc acggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5280
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5340
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5400
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 5460
cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 5520
ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 5580
cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 5640
ggaaacagct atgacatgat tacgaattcg agctcggtac ccggggatcc tctagagtcg 5700
acgctcgcgc gacttggttt gccattcttt agcgcgcgtc gcgtcacaca gcttggccac 5760
aatgtggttt ttgtcaaacg aagattctat gacgtgttta aagtttaggt cgagtaaagc 5820
gcaaatcttt tttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg cattcttgaa 5880
atattgctct ctctttctaa atagcgcgaa tccgtcgctg tgcatttagg acatctcagt 5940
cgccgcttgg agctcccgtg aggcgtgctt gtcaatgcgg taagtgtcac tgattttgaa 6000
ctataacgac cgcgtgagtc aaaatgacgc atgattatct tttacgtgac ttttaagatt 6060
taactcatac gataattata ttgttatttc atgttctact tacgtgataa cttattatat 6120
atatattttc ttgttataga tatcgtgact aatatataat aaaatgggta gttctttaga 6180
cgatgagcat atcctctctg ctcttctgca aagcgatgac gagcttgttg gtgaggattc 6240
tgacagtgaa atatcagatc acgtaagtga agatgacgtc cagagcgata cagaagaagc 6300
gtttatagat gaggtacatg aagtgcagcc aacgtcaagc ggtagtgaaa tattagacga 6360
acaaaatgtt attgaacaac caggttcttc atagattctg ttagaagcca aagaatcttg 6420
accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac ttcaaagtcc 6480
acgaggcgta gccgagtctc tgcactgaac attgtcagat ccgagatcgg ccggcctagg 6540
cgcgccaagc ttaaggtgca cggcccacgt ggccactagt acttctcgag gctcaaagcc 6600
tcatcccaat ttggagtcac tcaagacatc cttgattaag gcagctgccg atattgacat 6660
ggacctcgtt cgtgctgcga tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa 6720
tcacggaggt cattttgaat aaactttagt gtcataagaa tctatgtttt gttaagttca 6780
ttttggtata tgaatggtta cataatgaat aaacttgttt caattatttt acattaaaca 6840
tgtgacagaa tttatgacct gactaggtag gtacaaacag cctttttgat attagaaaac 6900
taagtaaaat agcctacggt cacatctctt tccgtgggtg tcgttaaagg gcgacttaga 6960
gaaccaccaa gaacgtagca gaatcctcag agtgtcatac cagcatacag ccatcgctaa 7020
ctgctattta ctggtaatag ggcacattgt aatctcactt aaccatactg tcgggccacc 7080
atctagccta tttctgccac gaatcaatcg tgagtgatgg acatagagaa actattagtt 7140
gagaagaaaa caagagcact aaaggtttga tattgacaaa aatctacttc gccgtcactc 7200
cataggttta ttgtctctca ttagtccaga acagcagtta cagacgtaag cttttacgca 7260
caaactacag ggttgctctt tattgtatcg aaaatatggg acctgaataa gggcgatttt 7320
gacgcgtcct gcccgcccat tcccgatcct acggacagaa tggcaagcag tcgacgtcgc 7380
cccaaacacg tcatttcgga tcctcacgat ccactaacgg tgctttaggt acctcaagca 7440
ccggtcatcg ttctcgtcgg acccgtcgct tgcgacgaag ggctcgacga gcaaattaac 7500
cctcagacac agcccactga gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc 7560
cggtggtaga ttctgcgaag cacggctctt gctaggattc gtgttagcaa cgtcgtcagg 7620
tttgagcccc gtgagctcac ttactagtta aggttacgct gaaatagcct ctcaaggctc 7680
tcagctaggt aggaaacaaa aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc 7740
ttctgcaccg cggaaagatg ttttgtacgg aaagtttgaa taagtgctta attgcaagta 7800
acgtaacaat gttttagggt tcggcggccg cgggagaaag catgaagtaa gttctttaaa 7860
tattacaaaa aaattgaacg atattataaa attctttaaa atattaaaag taagaacaat 7920
aagatcaatt aaatcataat taatcacatt gttcatgatc acaatttaat ttacttcata 7980
cgttgtattg ttatgttaaa taaaaagatt aatttctatg taattgtatc tgtacaatac 8040
aatgtgtaga tgtttattct atcgaaagta aatacgtcaa aactcgaaaa ttttcagtat 8100
aaaaaggttc aactttttca aatcagcatc agttcggttc caactctcaa gatgagagtc 8160
aaaacctttg tgatcttgtg ctgcgctctg caggtgagtt aattatttta ctattatttc 8220
agaaggtggc cagacgatat cacgggccac ctgataataa gtggtcgcca aaacgcacag 8280
atatcgtaaa ttgtgccatt tgatttgtca cgcccggggg ggctacggaa taaactacat 8340
ttatttattt aaaaaatgaa ccttagatta tgtaacttgt gatttatttg cgtcaaaagt 8400
aggcaagatg aatctatgta aatacctggg cagacttgca atatcctatt tcaccggtaa 8460
atcagcattg caatatgcaa tgcatattca acaatatgta aaacaattcg taaagcatca 8520
ttagaaaata gacgaaagaa attgcataaa attataaccg cattattaat ttattatgat 8580
atctattaac aattgctatt gccttttttt cgcaaattat aatcattttc ataacctcga 8640
ggtagcattc tgttacattt taatacattg gtatgtgatt ataacacgag ctgcccactg 8700
agtttctcgc cagatcttct cagtgggtcg cgttaccgat cacgtgatag attctatgaa 8760
gcactgctct tgttagggct agtgttagca aattctttca ggttgagtct gagagctcac 8820
ctacccatcg gagcgtagct ggaataggct accagctaat aggtagggaa aacaaagctc 8880
gaaacaagct caagtaataa caacataatg tgaccataaa atctcgtggt gtatgagata 8940
caattatgta ctttcccaca aatgtttaca taattagaat gttgttcaac ttgcctaacg 9000
ccccagctag aacattcaat tattactatt accactacta aggcagtatg tcctaactcg 9060
ttccagatca gcgctaactt cgattgaatg tgcgaaattt atagctcaat attttagcac 9120
ttatcgtatt gatttaagaa aaaattgtta acattttgtt tcagtatgtc gcttatacaa 9180
atgcaaacat caatgatttt gatgaggact attttgggag tgatgtcact gtccaaagta 9240
gtaatacaac agatgaaata attagagatg catctggggc agttatcgaa gaacaaatta 9300
caactaaaaa aatgcaacgg aaaaataaaa accatggaat acttggaaaa aatgaaaaaa 9360
tgatcaagac gttcgttata accacggatt ccgacggtaa cgagtccatt gtagaggaag 9420
atgtgctcat gaagacactt tccgatggta ctgttgctca aagttatgtt gctgctgatg 9480
cgggagcata ttctcagagc gggccatacg tatcaaacag tggatacagc actcatcaag 9540
gatatacgag cgatttcagc actagtgctg cagtcgttct agacgtgagc aagggcgagg 9600
agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca 9660
agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt 9720
tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct 9780
acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt 9840
ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact 9900
acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga 9960
agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca 10020
acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca 10080
agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca 10140
cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg 10200
ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg 10260
ccgccgggat cactctcggc atggacgagc tgtacaagct ggatcccccg ggtggagcag 10320
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 10380
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 10440
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 10500
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 10560
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 10620
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 10680
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 10740
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 10800
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 10860
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 10920
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 10980
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 11040
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 11100
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 11160
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 11220
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 11280
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 11340
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 11400
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 11460
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 11520
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11580
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11640
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 11700
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11760
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11820
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 11880
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11940
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 12000
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 12060
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 12120
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 12180
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 12240
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 12300
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 12360
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 12420
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 12480
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 12540
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 12600
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 12660
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 12720
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 12780
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 12840
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 12900
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 12960
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 13020
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 13080
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 13140
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 13200
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 13260
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 13320
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 13380
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 13440
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 13500
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 13560
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 13620
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 13680
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 13740
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 13800
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 13860
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 13920
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 13980
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 14040
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 14100
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 14160
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 14220
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 14280
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 14340
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 14400
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 14460
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 14520
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 14580
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 14640
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 14700
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 14760
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 14820
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 14880
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 14940
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 15000
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 15060
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 15120
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 15180
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 15240
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 15300
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 15360
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 15420
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 15480
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 15540
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 15600
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 15660
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 15720
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 15780
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 15840
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 15900
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 15960
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 16020
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 16080
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 16140
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 16200
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 16260
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 16320
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 16380
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 16440
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 16500
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 16560
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 16620
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 16680
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 16740
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 16800
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 16860
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 16920
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 16980
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 17040
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 17100
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 17160
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 17220
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 17280
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 17340
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 17400
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 17460
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 17520
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 17580
caggctccgc tgcagcggcg gctgctgcag caggtccggg aagcgtcagt tacggagctg 17640
gcaggggata cggacaaggt gcaggaagtg cagcttcctc tgtgtcatct gcttcatctc 17700
gcagttacga ctattctcgt cgtaacgtcc gcaaaaactg tggaattcct agaagacaac 17760
tagttgttaa attcagagca ctgccttgtg tgaattgcta atttttaata taaaataacc 17820
cttgtttctt acttcgtcct ggatacatct atgttttttt tttcgttaat aaatgagagc 17880
atttaagtta ttgtttttaa ttactttttt ttagaaaaca gatttcggat tttttgtatg 17940
cattttattt gaatgtacta atataatcaa ttaatcaatg aattcattta tttaagggat 18000
aacaataatc catgaattca catgcacatt taaaacaaaa ctaaattaca ataggttcat 18060
ataaaaacaa caagtatgcc ttctcaacta agaatactat ag 18102
<210> 32
<211> 12516
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 32
tcgacgtccc atggccattc gaattcggcc ggcctaggcg cgccgtacgc gtatcgataa 60
gctttaagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 120
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 180
caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 240
gttttttaaa gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tctagagtcg 300
cggccgctac aggaacaggt ggtggcggcc ctcggtgcgc tcgtactgct ccacgatggt 360
gtagtcctcg ttgtgggagg tgatgtccag cttggagtcc acgtagtagt agccgggcag 420
ctgcacgggc ttcttggcca tgtagatgga cttgaactcc accaggtagt ggccgccgtc 480
cttcagcttc agggccttgt ggatctcgcc cttcagcacg ccgtcgcggg ggtacaggcg 540
ctcggtggag gcctcccagc ccatggtctt cttctgcatt acggggccgt cggaggggaa 600
gttccgccga tgaacttcac cttgtagatg aagcagccgt cctgcaggga ggagtcctgg 660
gtcacggtca ccacgccgcc gtcctcgaag ttcatcacgc gctcccactt gaagccctcg 720
gggaaggaca gcttcttgta gtcggggatg tcggcggggt gcttcacgta caccttggag 780
ccgtactgga actgggggga caggatgtcc caggcgaagg gcagggggcc gcccttggtc 840
accttcagct tcacggtgtt gtggccctcg taggggcggc cctcgcccct cgcccctcga 900
tctcgaactc gtggccgttc acggtgccct ccatgcgcac cttgaagcgc atgaactcct 960
tgatgacgtt cttggaggag cgcaccatgg tggcgaccgg tggatcccgg gcccgcggta 1020
ccgtcgactc tagcggtacc ccgattgttt agcttgttca gctgcgcttg tttatttgct 1080
tagctttcgc ttagcgacgt gttcactttg cttgtttgaa ttgaattgtc gctccgtaga 1140
cgaagcgcct ctatttatac tccggcggtc gagggttcga aatcgataag cttggatcct 1200
aattgaatta gctctaattg aattagtctt ctaattgaat tagtctctaa ttgaattaga 1260
tccccgggcg agctcgaatt aaaccattgt gggaaccgtg cgatcaaaca aacgcgagat 1320
accgggaagt actgaaaaac agtcgctcca ggccagtggg aacatcgatg ttttgttttg 1380
acggacccct tactctcgtc tcatataaac cgaagccagc taagatggta tacttattat 1440
catcttgtga tgaggatgct tctatcaacg aaagtaccgg taaaccgcaa atggttatgt 1500
attataatca aactaaaggc ggagtggaca cgctagacca aatgtgttct gtgatgacct 1560
gcagtaggaa gacgaatagg tggcctatgg cattattgta cggaatgata aacattgcct 1620
gcataaattc ttttattata tacagccata atgtcagtag caagggagaa aaggttcaaa 1680
gtcgcaaaaa atttatgaga aacctttaca tgagcctgac gtcatcgttt atgcgtaagc 1740
gtttagaagc tcctactttg aagagatatt tgcgcgataa tatctctaat attttgccaa 1800
atgaagtgcc tggtacatca gatgacagta ctgaagagcc agtaatgaaa aaacgtactt 1860
actgtactta ctgcccctct aaaataaggc gaaaggcaaa tgcatcgtgc aaaaaatgca 1920
aaaaagttat ttgtcgagag cataatattg atatgtgcca aagttgtttc tgactgacta 1980
ataagtataa tttgtttcta ttatgtataa gttaagctaa ttacttattt tataatacaa 2040
catgactgtt tttaaagtac aaaataagtt tatttttgta aaagagagaa tgtttaaaag 2100
ttttgttact ttatagaaga aattttgagt ttttgttttt ttttaataaa taaataaaca 2160
taaataaatt gtttgttgaa tttattatta gtatgtaagt gtaaatataa taaaacttaa 2220
tatctattca aattaataaa taaacctcga tatacagacc gataaaacac atgcgtcaat 2280
tttacgcatg attatcttta acgtacgtca caatatgatt atctttctag ggttaaataa 2340
tagtttctaa tttttttatt attcagcctg ctgtcgtgaa taccgtatat ctcaacgctg 2400
tctgtgagat tgtcgtattc tagccttttt agtttttcgc tcatcgactt gatattgtcc 2460
gacacatttt cgtcgatttg cgttttgatc aaagacttga gcagagacac gttaatcaac 2520
tgttcaaatt gatccatatt aacgatatca acccgatgcg tatatggtgc gtaaaatata 2580
ttttttaacc ctcttatact ttgcactctg cgttaatacg cgttcgtgta cagacgtaat 2640
catgttttct tttttggata aaactcctac tgagtttgac ctcatattag accctcacaa 2700
gttgcaaaac gtggcatttt ttaccaatga agaatttaaa gttattttaa aaaatttcat 2760
cacagattta aagaagaacc aaaaattaaa ttatttcaac agtttaatcg accagttaat 2820
caacgtgtac acagacgcgt cggcaaaaaa cacgcagccc gacgtgttgg ctaaaattat 2880
taaatcaact tgtgttatag tcacggattt gccgtccaac gtgttcctca aaaagttgaa 2940
gaccaacaag tttacggaca ctattaatta tttgattttg ccccacttca ttttgtggga 3000
tcacaatttt gttatatttt taaaacaaag ctttggcact ggccgtcgtt ttacaacgtc 3060
gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 3120
ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3180
tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 3240
accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 3300
gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 3360
acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 3420
cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3480
taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 3540
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3600
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3660
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3720
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3780
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3840
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 3900
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3960
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 4020
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 4080
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 4140
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 4200
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 4260
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4320
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4380
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 4440
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4500
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4560
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 4620
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 4680
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 4740
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 4800
caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 4860
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 4920
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 4980
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 5040
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 5100
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 5160
cctgatatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 5220
gatgctcgtc acggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5280
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5340
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5400
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 5460
cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 5520
ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 5580
cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 5640
ggaaacagct atgacatgat tacgaattcg agctcggtac ccggggatcc tctagagtcg 5700
acgctcgcgc gacttggttt gccattcttt agcgcgcgtc gcgtcacaca gcttggccac 5760
aatgtggttt ttgtcaaacg aagattctat gacgtgttta aagtttaggt cgagtaaagc 5820
gcaaatcttt tttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg cattcttgaa 5880
atattgctct ctctttctaa atagcgcgaa tccgtcgctg tgcatttagg acatctcagt 5940
cgccgcttgg agctcccgtg aggcgtgctt gtcaatgcgg taagtgtcac tgattttgaa 6000
ctataacgac cgcgtgagtc aaaatgacgc atgattatct tttacgtgac ttttaagatt 6060
taactcatac gataattata ttgttatttc atgttctact tacgtgataa cttattatat 6120
atatattttc ttgttataga tatcgtgact aatatataat aaaatgggta gttctttaga 6180
cgatgagcat atcctctctg ctcttctgca aagcgatgac gagcttgttg gtgaggattc 6240
tgacagtgaa atatcagatc acgtaagtga agatgacgtc cagagcgata cagaagaagc 6300
gtttatagat gaggtacatg aagtgcagcc aacgtcaagc ggtagtgaaa tattagacga 6360
acaaaatgtt attgaacaac caggttcttc atagattctg ttagaagcca aagaatcttg 6420
accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac ttcaaagtcc 6480
acgaggcgta gccgagtctc tgcactgaac attgtcagat ccgagatcgg ccggcctagg 6540
cgcgccaagc ttaaggtgca cggcccacgt ggccactagt acttctcgag gctcaaagcc 6600
tcatcccaat ttggagtcac tcaagacatc cttgattaag gcagctgccg atattgacat 6660
ggacctcgtt cgtgctgcga tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa 6720
tcacggaggt cattttgaat aaactttagt gtcataagaa tctatgtttt gttaagttca 6780
ttttggtata tgaatggtta cataatgaat aaacttgttt caattatttt acattaaaca 6840
tgtgacagaa tttatgacct gactaggtag gtacaaacag cctttttgat attagaaaac 6900
taagtaaaat agcctacggt cacatctctt tccgtgggtg tcgttaaagg gcgacttaga 6960
gaaccaccaa gaacgtagca gaatcctcag agtgtcatac cagcatacag ccatcgctaa 7020
ctgctattta ctggtaatag ggcacattgt aatctcactt aaccatactg tcgggccacc 7080
atctagccta tttctgccac gaatcaatcg tgagtgatgg acatagagaa actattagtt 7140
gagaagaaaa caagagcact aaaggtttga tattgacaaa aatctacttc gccgtcactc 7200
cataggttta ttgtctctca ttagtccaga acagcagtta cagacgtaag cttttacgca 7260
caaactacag ggttgctctt tattgtatcg aaaatatggg acctgaataa gggcgatttt 7320
gacgcgtcct gcccgcccat tcccgatcct acggacagaa tggcaagcag tcgacgtcgc 7380
cccaaacacg tcatttcgga tcctcacgat ccactaacgg tgctttaggt acctcaagca 7440
ccggtcatcg ttctcgtcgg acccgtcgct tgcgacgaag ggctcgacga gcaaattaac 7500
cctcagacac agcccactga gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc 7560
cggtggtaga ttctgcgaag cacggctctt gctaggattc gtgttagcaa cgtcgtcagg 7620
tttgagcccc gtgagctcac ttactagtta aggttacgct gaaatagcct ctcaaggctc 7680
tcagctaggt aggaaacaaa aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc 7740
ttctgcaccg cggaaagatg ttttgtacgg aaagtttgaa taagtgctta attgcaagta 7800
acgtaacaat gttttagggt tcggcggccg cgggagaaag catgaagtaa gttctttaaa 7860
tattacaaaa aaattgaacg atattataaa attctttaaa atattaaaag taagaacaat 7920
aagatcaatt aaatcataat taatcacatt gttcatgatc acaatttaat ttacttcata 7980
cgttgtattg ttatgttaaa taaaaagatt aatttctatg taattgtatc tgtacaatac 8040
aatgtgtaga tgtttattct atcgaaagta aatacgtcaa aactcgaaaa ttttcagtat 8100
aaaaaggttc aactttttca aatcagcatc agttcggttc caactctcaa gatgagagtc 8160
aaaacctttg tgatcttgtg ctgcgctctg caggtgagtt aattatttta ctattatttc 8220
agaaggtggc cagacgatat cacgggccac ctgataataa gtggtcgcca aaacgcacag 8280
atatcgtaaa ttgtgccatt tgatttgtca cgcccggggg ggctacggaa taaactacat 8340
ttatttattt aaaaaatgaa ccttagatta tgtaacttgt gatttatttg cgtcaaaagt 8400
aggcaagatg aatctatgta aatacctggg cagacttgca atatcctatt tcaccggtaa 8460
atcagcattg caatatgcaa tgcatattca acaatatgta aaacaattcg taaagcatca 8520
ttagaaaata gacgaaagaa attgcataaa attataaccg cattattaat ttattatgat 8580
atctattaac aattgctatt gccttttttt cgcaaattat aatcattttc ataacctcga 8640
ggtagcattc tgttacattt taatacattg gtatgtgatt ataacacgag ctgcccactg 8700
agtttctcgc cagatcttct cagtgggtcg cgttaccgat cacgtgatag attctatgaa 8760
gcactgctct tgttagggct agtgttagca aattctttca ggttgagtct gagagctcac 8820
ctacccatcg gagcgtagct ggaataggct accagctaat aggtagggaa aacaaagctc 8880
gaaacaagct caagtaataa caacataatg tgaccataaa atctcgtggt gtatgagata 8940
caattatgta ctttcccaca aatgtttaca taattagaat gttgttcaac ttgcctaacg 9000
ccccagctag aacattcaat tattactatt accactacta aggcagtatg tcctaactcg 9060
ttccagatca gcgctaactt cgattgaatg tgcgaaattt atagctcaat attttagcac 9120
ttatcgtatt gatttaagaa aaaattgtta acattttgtt tcagtatgtc gcttatacaa 9180
atgcaaacat caatgatttt gatgaggact attttgggag tgatgtcact gtccaaagta 9240
gtaatacaac agatgaaata attagagatg catctggggc agttatcgaa gaacaaatta 9300
caactaaaaa aatgcaacgg aaaaataaaa accatggaat acttggaaaa aatgaaaaaa 9360
tgatcaagac gttcgttata accacggatt ccgacggtaa cgagtccatt gtagaggaag 9420
atgtgctcat gaagacactt tccgatggta ctgttgctca aagttatgtt gctgctgatg 9480
cgggagcata ttctcagagc gggccatacg tatcaaacag tggatacagc actcatcaag 9540
gatatacgag cgatttcagc actagtgctg cagtcgttct agacctggat cccccgggtg 9600
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 9660
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 9720
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 9780
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 9840
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 9900
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 9960
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 10020
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 10080
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 10140
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 10200
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 10260
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 10320
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 10380
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 10440
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 10500
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 10560
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 10620
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 10680
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 10740
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 10800
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 10860
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 10920
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 10980
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11040
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11100
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 11160
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11220
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11280
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 11340
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11400
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11460
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 11520
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 11580
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 11640
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 11700
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 11760
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 11820
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 11880
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 11940
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 12000
ccgctgcagc ggcggctgct gcagcaggtc cgggaagcgt cagttacgga gctggcaggg 12060
gatacggaca aggtgcagga agtgcagctt cctctgtgtc atctgcttca tctcgcagtt 12120
acgactattc tcgtcgtaac gtccgcaaaa actgtggaat tcctagaaga caactagttg 12180
ttaaattcag agcactgcct tgtgtgaatt gctaattttt aatataaaat aacccttgtt 12240
tcttacttcg tcctggatac atctatgttt tttttttcgt taataaatga gagcatttaa 12300
gttattgttt ttaattactt ttttttagaa aacagatttc ggattttttg tatgcatttt 12360
atttgaatgt actaatataa tcaattaatc aatgaattca tttatttaag ggataacaat 12420
aatccatgaa ttcacatgca catttaaaac aaaactaaat tacaataggt tcatataaaa 12480
acaacaagta tgccttctca actaagaata ctatag 12516
<210> 33
<211> 13230
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 33
tcgacgtccc atggccattc gaattcggcc ggcctaggcg cgccgtacgc gtatcgataa 60
gctttaagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 120
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 180
caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 240
gttttttaaa gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tctagagtcg 300
cggccgctac aggaacaggt ggtggcggcc ctcggtgcgc tcgtactgct ccacgatggt 360
gtagtcctcg ttgtgggagg tgatgtccag cttggagtcc acgtagtagt agccgggcag 420
ctgcacgggc ttcttggcca tgtagatgga cttgaactcc accaggtagt ggccgccgtc 480
cttcagcttc agggccttgt ggatctcgcc cttcagcacg ccgtcgcggg ggtacaggcg 540
ctcggtggag gcctcccagc ccatggtctt cttctgcatt acggggccgt cggaggggaa 600
gttccgccga tgaacttcac cttgtagatg aagcagccgt cctgcaggga ggagtcctgg 660
gtcacggtca ccacgccgcc gtcctcgaag ttcatcacgc gctcccactt gaagccctcg 720
gggaaggaca gcttcttgta gtcggggatg tcggcggggt gcttcacgta caccttggag 780
ccgtactgga actgggggga caggatgtcc caggcgaagg gcagggggcc gcccttggtc 840
accttcagct tcacggtgtt gtggccctcg taggggcggc cctcgcccct cgcccctcga 900
tctcgaactc gtggccgttc acggtgccct ccatgcgcac cttgaagcgc atgaactcct 960
tgatgacgtt cttggaggag cgcaccatgg tggcgaccgg tggatcccgg gcccgcggta 1020
ccgtcgactc tagcggtacc ccgattgttt agcttgttca gctgcgcttg tttatttgct 1080
tagctttcgc ttagcgacgt gttcactttg cttgtttgaa ttgaattgtc gctccgtaga 1140
cgaagcgcct ctatttatac tccggcggtc gagggttcga aatcgataag cttggatcct 1200
aattgaatta gctctaattg aattagtctt ctaattgaat tagtctctaa ttgaattaga 1260
tccccgggcg agctcgaatt aaaccattgt gggaaccgtg cgatcaaaca aacgcgagat 1320
accgggaagt actgaaaaac agtcgctcca ggccagtggg aacatcgatg ttttgttttg 1380
acggacccct tactctcgtc tcatataaac cgaagccagc taagatggta tacttattat 1440
catcttgtga tgaggatgct tctatcaacg aaagtaccgg taaaccgcaa atggttatgt 1500
attataatca aactaaaggc ggagtggaca cgctagacca aatgtgttct gtgatgacct 1560
gcagtaggaa gacgaatagg tggcctatgg cattattgta cggaatgata aacattgcct 1620
gcataaattc ttttattata tacagccata atgtcagtag caagggagaa aaggttcaaa 1680
gtcgcaaaaa atttatgaga aacctttaca tgagcctgac gtcatcgttt atgcgtaagc 1740
gtttagaagc tcctactttg aagagatatt tgcgcgataa tatctctaat attttgccaa 1800
atgaagtgcc tggtacatca gatgacagta ctgaagagcc agtaatgaaa aaacgtactt 1860
actgtactta ctgcccctct aaaataaggc gaaaggcaaa tgcatcgtgc aaaaaatgca 1920
aaaaagttat ttgtcgagag cataatattg atatgtgcca aagttgtttc tgactgacta 1980
ataagtataa tttgtttcta ttatgtataa gttaagctaa ttacttattt tataatacaa 2040
catgactgtt tttaaagtac aaaataagtt tatttttgta aaagagagaa tgtttaaaag 2100
ttttgttact ttatagaaga aattttgagt ttttgttttt ttttaataaa taaataaaca 2160
taaataaatt gtttgttgaa tttattatta gtatgtaagt gtaaatataa taaaacttaa 2220
tatctattca aattaataaa taaacctcga tatacagacc gataaaacac atgcgtcaat 2280
tttacgcatg attatcttta acgtacgtca caatatgatt atctttctag ggttaaataa 2340
tagtttctaa tttttttatt attcagcctg ctgtcgtgaa taccgtatat ctcaacgctg 2400
tctgtgagat tgtcgtattc tagccttttt agtttttcgc tcatcgactt gatattgtcc 2460
gacacatttt cgtcgatttg cgttttgatc aaagacttga gcagagacac gttaatcaac 2520
tgttcaaatt gatccatatt aacgatatca acccgatgcg tatatggtgc gtaaaatata 2580
ttttttaacc ctcttatact ttgcactctg cgttaatacg cgttcgtgta cagacgtaat 2640
catgttttct tttttggata aaactcctac tgagtttgac ctcatattag accctcacaa 2700
gttgcaaaac gtggcatttt ttaccaatga agaatttaaa gttattttaa aaaatttcat 2760
cacagattta aagaagaacc aaaaattaaa ttatttcaac agtttaatcg accagttaat 2820
caacgtgtac acagacgcgt cggcaaaaaa cacgcagccc gacgtgttgg ctaaaattat 2880
taaatcaact tgtgttatag tcacggattt gccgtccaac gtgttcctca aaaagttgaa 2940
gaccaacaag tttacggaca ctattaatta tttgattttg ccccacttca ttttgtggga 3000
tcacaatttt gttatatttt taaaacaaag ctttggcact ggccgtcgtt ttacaacgtc 3060
gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 3120
ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3180
tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 3240
accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 3300
gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 3360
acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 3420
cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3480
taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 3540
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3600
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3660
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3720
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3780
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3840
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 3900
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3960
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 4020
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 4080
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 4140
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 4200
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 4260
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4320
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4380
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 4440
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4500
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4560
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 4620
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 4680
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 4740
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 4800
caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 4860
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 4920
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 4980
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 5040
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 5100
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 5160
cctgatatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 5220
gatgctcgtc acggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5280
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5340
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5400
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 5460
cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 5520
ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 5580
cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 5640
ggaaacagct atgacatgat tacgaattcg agctcggtac ccggggatcc tctagagtcg 5700
acgctcgcgc gacttggttt gccattcttt agcgcgcgtc gcgtcacaca gcttggccac 5760
aatgtggttt ttgtcaaacg aagattctat gacgtgttta aagtttaggt cgagtaaagc 5820
gcaaatcttt tttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg cattcttgaa 5880
atattgctct ctctttctaa atagcgcgaa tccgtcgctg tgcatttagg acatctcagt 5940
cgccgcttgg agctcccgtg aggcgtgctt gtcaatgcgg taagtgtcac tgattttgaa 6000
ctataacgac cgcgtgagtc aaaatgacgc atgattatct tttacgtgac ttttaagatt 6060
taactcatac gataattata ttgttatttc atgttctact tacgtgataa cttattatat 6120
atatattttc ttgttataga tatcgtgact aatatataat aaaatgggta gttctttaga 6180
cgatgagcat atcctctctg ctcttctgca aagcgatgac gagcttgttg gtgaggattc 6240
tgacagtgaa atatcagatc acgtaagtga agatgacgtc cagagcgata cagaagaagc 6300
gtttatagat gaggtacatg aagtgcagcc aacgtcaagc ggtagtgaaa tattagacga 6360
acaaaatgtt attgaacaac caggttcttc atagattctg ttagaagcca aagaatcttg 6420
accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac ttcaaagtcc 6480
acgaggcgta gccgagtctc tgcactgaac attgtcagat ccgagatcgg ccggcctagg 6540
cgcgccaagc ttaaggtgca cggcccacgt ggccactagt acttctcgag gctcaaagcc 6600
tcatcccaat ttggagtcac tcaagacatc cttgattaag gcagctgccg atattgacat 6660
ggacctcgtt cgtgctgcga tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa 6720
tcacggaggt cattttgaat aaactttagt gtcataagaa tctatgtttt gttaagttca 6780
ttttggtata tgaatggtta cataatgaat aaacttgttt caattatttt acattaaaca 6840
tgtgacagaa tttatgacct gactaggtag gtacaaacag cctttttgat attagaaaac 6900
taagtaaaat agcctacggt cacatctctt tccgtgggtg tcgttaaagg gcgacttaga 6960
gaaccaccaa gaacgtagca gaatcctcag agtgtcatac cagcatacag ccatcgctaa 7020
ctgctattta ctggtaatag ggcacattgt aatctcactt aaccatactg tcgggccacc 7080
atctagccta tttctgccac gaatcaatcg tgagtgatgg acatagagaa actattagtt 7140
gagaagaaaa caagagcact aaaggtttga tattgacaaa aatctacttc gccgtcactc 7200
cataggttta ttgtctctca ttagtccaga acagcagtta cagacgtaag cttttacgca 7260
caaactacag ggttgctctt tattgtatcg aaaatatggg acctgaataa gggcgatttt 7320
gacgcgtcct gcccgcccat tcccgatcct acggacagaa tggcaagcag tcgacgtcgc 7380
cccaaacacg tcatttcgga tcctcacgat ccactaacgg tgctttaggt acctcaagca 7440
ccggtcatcg ttctcgtcgg acccgtcgct tgcgacgaag ggctcgacga gcaaattaac 7500
cctcagacac agcccactga gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc 7560
cggtggtaga ttctgcgaag cacggctctt gctaggattc gtgttagcaa cgtcgtcagg 7620
tttgagcccc gtgagctcac ttactagtta aggttacgct gaaatagcct ctcaaggctc 7680
tcagctaggt aggaaacaaa aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc 7740
ttctgcaccg cggaaagatg ttttgtacgg aaagtttgaa taagtgctta attgcaagta 7800
acgtaacaat gttttagggt tcggcggccg cgggagaaag catgaagtaa gttctttaaa 7860
tattacaaaa aaattgaacg atattataaa attctttaaa atattaaaag taagaacaat 7920
aagatcaatt aaatcataat taatcacatt gttcatgatc acaatttaat ttacttcata 7980
cgttgtattg ttatgttaaa taaaaagatt aatttctatg taattgtatc tgtacaatac 8040
aatgtgtaga tgtttattct atcgaaagta aatacgtcaa aactcgaaaa ttttcagtat 8100
aaaaaggttc aactttttca aatcagcatc agttcggttc caactctcaa gatgagagtc 8160
aaaacctttg tgatcttgtg ctgcgctctg caggtgagtt aattatttta ctattatttc 8220
agaaggtggc cagacgatat cacgggccac ctgataataa gtggtcgcca aaacgcacag 8280
atatcgtaaa ttgtgccatt tgatttgtca cgcccggggg ggctacggaa taaactacat 8340
ttatttattt aaaaaatgaa ccttagatta tgtaacttgt gatttatttg cgtcaaaagt 8400
aggcaagatg aatctatgta aatacctggg cagacttgca atatcctatt tcaccggtaa 8460
atcagcattg caatatgcaa tgcatattca acaatatgta aaacaattcg taaagcatca 8520
ttagaaaata gacgaaagaa attgcataaa attataaccg cattattaat ttattatgat 8580
atctattaac aattgctatt gccttttttt cgcaaattat aatcattttc ataacctcga 8640
ggtagcattc tgttacattt taatacattg gtatgtgatt ataacacgag ctgcccactg 8700
agtttctcgc cagatcttct cagtgggtcg cgttaccgat cacgtgatag attctatgaa 8760
gcactgctct tgttagggct agtgttagca aattctttca ggttgagtct gagagctcac 8820
ctacccatcg gagcgtagct ggaataggct accagctaat aggtagggaa aacaaagctc 8880
gaaacaagct caagtaataa caacataatg tgaccataaa atctcgtggt gtatgagata 8940
caattatgta ctttcccaca aatgtttaca taattagaat gttgttcaac ttgcctaacg 9000
ccccagctag aacattcaat tattactatt accactacta aggcagtatg tcctaactcg 9060
ttccagatca gcgctaactt cgattgaatg tgcgaaattt atagctcaat attttagcac 9120
ttatcgtatt gatttaagaa aaaattgtta acattttgtt tcagtatgtc gcttatacaa 9180
atgcaaacat caatgatttt gatgaggact attttgggag tgatgtcact gtccaaagta 9240
gtaatacaac agatgaaata attagagatg catctggggc agttatcgaa gaacaaatta 9300
caactaaaaa aatgcaacgg aaaaataaaa accatggaat acttggaaaa aatgaaaaaa 9360
tgatcaagac gttcgttata accacggatt ccgacggtaa cgagtccatt gtagaggaag 9420
atgtgctcat gaagacactt tccgatggta ctgttgctca aagttatgtt gctgctgatg 9480
cgggagcata ttctcagagc gggccatacg tatcaaacag tggatacagc actcatcaag 9540
gatatacgag cgatttcagc actagtgctg cagtcgttct agacgtgagc aagggcgagg 9600
agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca 9660
agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt 9720
tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct 9780
acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt 9840
ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact 9900
acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga 9960
agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca 10020
acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca 10080
agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca 10140
cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg 10200
ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg 10260
ccgccgggat cactctcggc atggacgagc tgtacaagct ggatcccccg ggtggagcag 10320
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 10380
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 10440
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 10500
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 10560
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 10620
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 10680
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 10740
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 10800
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 10860
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 10920
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 10980
cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 11040
gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 11100
gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 11160
cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 11220
gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 11280
gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 11340
ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 11400
gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 11460
gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 11520
caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11580
ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11640
ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 11700
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11760
cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11820
cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 11880
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11940
gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 12000
gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 12060
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 12120
gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 12180
ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 12240
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 12300
gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 12360
caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 12420
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 12480
ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 12540
ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 12600
ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 12660
ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 12720
cagcggcggc tgctgcagca ggtccgggaa gcgtcagtta cggagctggc aggggatacg 12780
gacaaggtgc aggaagtgca gcttcctctg tgtcatctgc ttcatctcgc agttacgact 12840
attctcgtcg taacgtccgc aaaaactgtg gaattcctag aagacaacta gttgttaaat 12900
tcagagcact gccttgtgtg aattgctaat ttttaatata aaataaccct tgtttcttac 12960
ttcgtcctgg atacatctat gttttttttt tcgttaataa atgagagcat ttaagttatt 13020
gtttttaatt actttttttt agaaaacaga tttcggattt tttgtatgca ttttatttga 13080
atgtactaat ataatcaatt aatcaatgaa ttcatttatt taagggataa caataatcca 13140
tgaattcaca tgcacattta aaacaaaact aaattacaat aggttcatat aaaaacaaca 13200
agtatgcctt ctcaactaag aatactatag 13230
<210> 34
<211> 10458
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 34
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 180
caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 240
ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 300
cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 360
agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 420
cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc cattcgccat tcaggctgcg 480
caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg 540
gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 600
taaaacgacg gccagtgagc gcgcctcgtt cattcacgtt tttgaacccg tggaggacgg 660
gcagactcgc ggtgcaaatg tgttttacag cgtgatggag cagatgaaga tgctcgacac 720
gctgcagaac acgcagctag attaacccta gaaagataat catattgtga cgtacgttaa 780
agataatcat gcgtaaaatt gacgcatgtg ttttatcggt ctgtatatcg aggtttattt 840
attaatttga atagatatta agttttatta tatttacact tacatactaa taataaattc 900
aacaaacaat ttatttatgt ttatttattt attaaaaaaa aacaaaaact caaaatttct 960
tctataaagt aacaaaactt ttatcgaatt gtatagtatt cttagttgag aaggcatact 1020
tgttgttttt atatgaacct attgtaattt agttttgttt taaatgtgca tgtgaattca 1080
tggattattg ttatccctta aataaatgaa ttcattgatt aattgattat attagtacat 1140
tcaaataaaa tgcatacaaa aaatccgaaa tctgttttct aaaaaaaagt aattaaaaac 1200
aataacttaa atgctctcat ttattaacga aaaaaaaaac atagatgtat ccaggacgaa 1260
gtaagaaaca agggttattt tatattaaaa attagcaatt cacacaaggc agtgctctga 1320
atttaacaac tagttgtctt ctaggaattc cacagttttt gcggacgtta cgacgagaat 1380
agtcgtaact gcgagatgaa gcagatgaca cagaggaagc tgcacttcct gcaccttgtc 1440
cgtatcccct gccagctccg taactgacgc tcttaaggct agcccaccgt agccaccttg 1500
accggcgccg cctgcagcag ccgcagcggc gccagcacct tggccaccca gaccaccacg 1560
gcctgcaccc tgagagccta gcccaccgta gccaccttga ccggcgccgc ctgcagcagc 1620
cgcagcggcg ccagcacctt ggccacccag accaccacgg cctgcaccct gagagcctag 1680
cccaccgtag ccaccttgac cggcgccgcc tgcagcagcc gcagcggcgc cagcaccttg 1740
gccacccaga ccaccacggc ctgcaccctg agagcctagc ccaccgtagc caccttgacc 1800
ggcgccgcct gcagcagccg cagcggcgcc agcaccttgg ccacccagac caccacggcc 1860
tgcaccctga gagcctagcc caccgtagcc accttgaccg gcgccgcctg cagcagccgc 1920
agcggcgcca gcaccttggc cacccagacc accacggcct gcaccctgag agcctagccc 1980
accgtagcca ccttgaccgg cgccgcctgc agcagccgca gcggcgccag caccttggcc 2040
acccagacca ccacggcctg caccctgaga gcctagccca ccgtagccac cttgaccggc 2100
gccgcctgca gcagccgcag cggcgccagc accttggcca cccagaccac cacggcctgc 2160
accctgagag cctagcccac cgtagccacc ttgaccggcg ccgcctgcag cagccgcagc 2220
ggcgccagca ccttggccac ccagaccacc acggcctgca ccctgagagc ctagcccacc 2280
gtagccacct tgaccggcgc cgcctgcagc agccgcagcg gcgccagcac cttggccacc 2340
cagaccacca cggcctgcac cctgagagcc tagcccaccg tagccacctt gaccggcgcc 2400
gcctgcagca gccgcagcgg cgccagcacc ttggccaccc agaccaccac ggcctgcacc 2460
ctgagagcct agcccaccgt agccaccttg accggcgccg cctgcagcag ccgcagcggc 2520
gccagcacct tggccaccca gaccaccacg gcctgcaccc tgagagccta gcccaccgta 2580
gccaccttga ccggcgccgc ctgcagcagc cgcagcggcg ccagcacctt ggccacccag 2640
accaccacgg cctgcaccct gagagcctag cccaccgtag ccaccttgac cggcgccgcc 2700
tgcagcagcc gcagcggcgc cagcaccttg gccacccaga ccaccacggc ctgcaccctg 2760
agagcctagc ccaccgtagc caccttgacc ggcgccgcct gcagcagccg cagcggcgcc 2820
agcaccttgg ccacccagac caccacggcc tgcaccctga gagcctagcc caccgtagcc 2880
accttgaccg gcgccgcctg cagcagccgc agcggcgcca gcaccttggc cacccagacc 2940
accacggcct gcaccctgag agcctagccc accgtagcca ccttgaccgg cgccgcctgc 3000
agcagccgca gcggcgccag caccttggcc acccagacca ccacggcctg caccctgaga 3060
gcctaggccg cccgggccac atatgacgac tgcagcacta gtgctgaaat cgctcgtata 3120
tccttgatga gtgctgtatc cactgtttga tacgtatggc ccgctctgag aatatgctcc 3180
cgcatcagca gcaacataac tttgagcaac agtaccatcg gaaagtgtct tcatgagcac 3240
atcttcctct acaatggact cgttaccgtc ggaatccgtg gttataacga acgtcttgat 3300
cattttttca ttttttccaa gtattccatg gtttttattt ttccgttgca tttttttagt 3360
tgtaatttgt tcttcgataa ctgccccaga tgcatctcta attatttcat ctgttgtatt 3420
actactttgg acagtgacat cactcccaaa atagtcctca tcaaaatcat tgatgtttgc 3480
atttgtataa gcgacatact gaaacaaaat gttaacaatt ttttcttaaa tcaatacgat 3540
aagtgctaaa atattgagct ataaatttcg cacattcaat cgaagttagc gctgatctgg 3600
aacgagttag gacatactgc cttagtagtg gtaatagtaa taattgaatg ttctagctgg 3660
ggcgttaggc aagttgaaca acattctaat tatgtaaaca tttgtgggaa agtacataat 3720
tgtatctcat acaccacgag attttatggt cacattatgt tgttattact tgagcttgtt 3780
tcgagctttg ttttccctac ctattagctg gtagcctatt ccagctacgc tccgatgggt 3840
aggtgagctc tcagactcaa cctgaaagaa tttgctaaca ctagccctaa caagagcagt 3900
gcttcataga atctatcacg tgatcggtaa cgcgacccac tgagaagatc tggcgagaaa 3960
ctcagtgggc agctcgtgtt ataatcacat accaatgtat taaaatgtaa cagaatgcta 4020
cctcgaggtt atgaaaatga ttataatttg cgaaaaaaag gcaatagcaa ttgttaatag 4080
atatcataat aaattaataa tgcggttata attttatgca atttctttcg tctattttct 4140
aatgatgctt tacgaattgt tttacatatt gttgaatatg cattgcatat tgcaatgctg 4200
atttaccggt gaaataggat attgcaagtc tgcccaggta tttacataga ttcatcttgc 4260
ctacttttga cgcaaataaa tcacaagtta cataatctaa ggttcatttt ttaaataaat 4320
aaatgtagtt tattccgtag cccccccggg cgtgacaaat caaatggcac aatttacgat 4380
atctgtgcgt tttggcgacc acttattatc aggtggcccg tgatatcgtc tggccacctt 4440
ctgaaataat agtaaaataa ttaactcacc tgcagagcgc agcacaagat cacaaaggtt 4500
ttgactctca tcttgagagt tggaaccgaa ctgatgctga tttgaaaaag ttgaaccttt 4560
ttatactgaa aattttcgag ttttgacgta tttactttcg atagaataaa catctacaca 4620
ttgtattgta cagatacaat tacatagaaa ttaatctttt tatttaacat aacaatacaa 4680
cgtatgaagt aaattaaatt gtgatcatga acaatgtgat taattatgat ttaattgatc 4740
ttattgttct tacttttaat attttaaaga attttataat atcgttcaat ttttttgtaa 4800
tatttaaaga acttacttca tgctttctcc cgcggccgcc gaaccctaaa acattgttac 4860
gttacttgca attaagcact tattcaaact ttccgtacaa aacatctttc cgcggtgcag 4920
aagacaagcc atcgcaacgg tgttaagggc aggacttttt tttttgtttc ctacctagct 4980
gagagccttg agaggctatt tcagcgtaac cttaactagt aagtgagctc acggggctca 5040
aacctgacga cgttgctaac acgaatccta gcaagagccg tgcttcgcag aatctaccac 5100
cggatcggaa acgcgacccg ctgagaagat ccggcgagaa actcagtggg ctgtgtctga 5160
gggttaattt gctcgtcgag cccttcgtcg caagcgacgg gtccgacgag aacgatgacc 5220
ggtgcttgag gtacctaaag caccgttagt ggatcgtgag gatccgaaat gacgtgtttg 5280
gggcgacgtc gactgcttgc cattctgtcc gtaggatcgg gaatgggcgg gcaggacgcg 5340
tcaaaatcgc ccttattcag gtcccatatt ttcgatacaa taaagagcaa ccctgtagtt 5400
tgtgcgtaaa agcttacgtc tgtaactgct gttctggact aatgagagac aataaaccta 5460
tggagtgacg gcgaagtaga tttttgtcaa tatcaaacct ttagtgctct tgttttcttc 5520
tcaactaata gtttctctat gtccatcact cacgattgat tcgtggcaga aataggctag 5580
atggtggccc gacagtatgg ttaagtgaga ttacaatgtg ccctattacc agtaaatagc 5640
agttagcgat ggctgtatgc tggtatgaca ctctgaggat tctgctacgt tcttggtggt 5700
tctctaagtc gccctttaac gacacccacg gaaagagatg tgaccgtagg ctattttact 5760
tagttttcta atatcaaaaa ggctgtttgt acctacctag tcaggtcata aattctgtca 5820
catgtttaat gtaaaataat tgaaacaagt ttattcatta tgtaaccatt catataccaa 5880
aatgaactta acaaaacata gattcttatg acactaaagt ttattcaaaa tgacctccgt 5940
gattttgaat acaggccttc aatctgcgcg gccagtcgtc tatcgcagca cgaacgaggt 6000
ccatgtcaat atcggcagct gccttaatca aggatgtctt gagtgactcc aaattgggat 6060
gaggctttga gcctcgacct agttctagtg ttcccacaat ggttaattcg agctcgcccg 6120
gggatctaat tcaattagag actaattcaa ttagagctaa ttcaattagg atccaagctt 6180
atcgatttcg aaccctcgac cgccggagta taaatagagg cgcttcgtct acggagcgac 6240
aattcaattc aaacaagcaa agtgaacacg tcgctaagcg aaagctaagc aaataaacaa 6300
gcgcagctga acaagctaaa caatcggggt accgctagag tcgacggtac gatccaccgg 6360
tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 6420
agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 6480
ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 6540
ggcccaccct cgtgaccacc ctgacctggg gcgtgcagtg cttcagccgc taccccgacc 6600
acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 6660
ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 6720
acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 6780
tggggcacaa gctggagtac aactacatca gccacaacgt ctatatcacc gccgacaagc 6840
agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcagcgtgc 6900
agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 6960
acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc 7020
acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 7080
acaagtaaag cggccgcgac tctagatcat aatcagccat accacatttg tagaggtttt 7140
acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 7200
tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 7260
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 7320
caatgtatct taaagcttat cgatacgcgt acggcgcgcc taggccggcc gatactagag 7380
cggccgccac cgcggtggag ctccagcttt tgttcccttt agtgagggtt aattagatct 7440
taatacgact cactataggg cgaattgggt accgggcccc ccctcgaggt cgacggtatc 7500
gataagcttg atatctataa caagaaaata tatatataat aagttatcac gtaagtagaa 7560
catgaaataa caatataatt atcgtatgag ttaaatctta aaagtcacgt aaaagataat 7620
catgcgtcat tttgactcac gcggtcgtta tagttcaaaa tcagtgacac ttaccgcatt 7680
gacaagcacg cctcacggga gctccaagcg gcgactgaga tgtcctaaat gcacagcgac 7740
ggattcgcgc tatttagaaa gagagagcaa tatttcaaga atgcatgcgt caattttacg 7800
cagactatct ttctagggtt aatctagctg catcaggatc atatcgtcgg gtcttttttc 7860
cggctcagtc atcgcccaag ctggcgctat ctgggcatcg gggaggaaga agcccgtgcc 7920
ttttcccgcg aggttgaagc ggcatggaaa gagtttgccg aggatgactg ctgctgcatt 7980
gacgttgagc gaaaacgcac gtttaccatg atgattcggg aaggtgtggc catgcacgcc 8040
tttaacggtg aactgttcgt tcaggccacc tgggatacca gttcgtcgcg gcttttccgg 8100
acacagttcc ggatggtcag cccgaagcgc atcagcaacc cgaacaatac cggcgacagc 8160
cggaactgcc gtgccggtgt gcagattaat gacagcggtg cggcgctggg atattacgtc 8220
agcgaggacg ggtatcctgg ctggatgccg cagaaatgga catggatacc ccgtgagtta 8280
cccggcgggc gcgcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 8340
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 8400
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 8460
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 8520
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 8580
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 8640
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 8700
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 8760
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 8820
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 8880
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 8940
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 9000
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 9060
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 9120
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 9180
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 9240
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 9300
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 9360
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 9420
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 9480
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 9540
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 9600
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 9660
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 9720
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 9780
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 9840
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 9900
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 9960
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 10020
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 10080
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 10140
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 10200
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 10260
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 10320
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 10380
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 10440
ttccccgaaa agtgccac 10458
<210> 35
<211> 11250
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 35
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 180
caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 240
ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 300
cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 360
agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 420
cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc cattcgccat tcaggctgcg 480
caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg 540
gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 600
taaaacgacg gccagtgagc gcgcctcgtt cattcacgtt tttgaacccg tggaggacgg 660
gcagactcgc ggtgcaaatg tgttttacag cgtgatggag cagatgaaga tgctcgacac 720
gctgcagaac acgcagctag attaacccta gaaagataat catattgtga cgtacgttaa 780
agataatcat gcgtaaaatt gacgcatgtg ttttatcggt ctgtatatcg aggtttattt 840
attaatttga atagatatta agttttatta tatttacact tacatactaa taataaattc 900
aacaaacaat ttatttatgt ttatttattt attaaaaaaa aacaaaaact caaaatttct 960
tctataaagt aacaaaactt ttatcgaatt gtatagtatt cttagttgag aaggcatact 1020
tgttgttttt atatgaacct attgtaattt agttttgttt taaatgtgca tgtgaattca 1080
tggattattg ttatccctta aataaatgaa ttcattgatt aattgattat attagtacat 1140
tcaaataaaa tgcatacaaa aaatccgaaa tctgttttct aaaaaaaagt aattaaaaac 1200
aataacttaa atgctctcat ttattaacga aaaaaaaaac atagatgtat ccaggacgaa 1260
gtaagaaaca agggttattt tatattaaaa attagcaatt cacacaaggc agtgctctga 1320
atttaacaac tagttgtctt ctaggaattc cacagttttt gcggacgtta cgacgagaat 1380
agtcgtaact gcgagatgaa gcagatgaca cagaggaagc tgcacttcct gcaccttgtc 1440
cgtatcccct gccagctccg taactgacgc tcttaaggct agcccaccgt agccaccttg 1500
accggcgccg cctgcagcag ccgcagcggc gccagcacct tggccaccca gaccaccacg 1560
gcctgcaccc tgagagccta gcccaccgta gccaccttga ccggcgccgc ctgcagcagc 1620
cgcagcggcg ccagcacctt ggccacccag accaccacgg cctgcaccct gagagcctag 1680
cccaccgtag ccaccttgac cggcgccgcc tgcagcagcc gcagcggcgc cagcaccttg 1740
gccacccaga ccaccacggc ctgcaccctg agagcctagc ccaccgtagc caccttgacc 1800
ggcgccgcct gcagcagccg cagcggcgcc agcaccttgg ccacccagac caccacggcc 1860
tgcaccctga gagcctagcc caccgtagcc accttgaccg gcgccgcctg cagcagccgc 1920
agcggcgcca gcaccttggc cacccagacc accacggcct gcaccctgag agcctagccc 1980
accgtagcca ccttgaccgg cgccgcctgc agcagccgca gcggcgccag caccttggcc 2040
acccagacca ccacggcctg caccctgaga gcctagccca ccgtagccac cttgaccggc 2100
gccgcctgca gcagccgcag cggcgccagc accttggcca cccagaccac cacggcctgc 2160
accctgagag cctagcccac cgtagccacc ttgaccggcg ccgcctgcag cagccgcagc 2220
ggcgccagca ccttggccac ccagaccacc acggcctgca ccctgagagc ctagcccacc 2280
gtagccacct tgaccggcgc cgcctgcagc agccgcagcg gcgccagcac cttggccacc 2340
cagaccacca cggcctgcac cctgagagcc tagcccaccg tagccacctt gaccggcgcc 2400
gcctgcagca gccgcagcgg cgccagcacc ttggccaccc agaccaccac ggcctgcacc 2460
ctgagagcct agcccaccgt agccaccttg accggcgccg cctgcagcag ccgcagcggc 2520
gccagcacct tggccaccca gaccaccacg gcctgcaccc tgagagccta gcccaccgta 2580
gccaccttga ccggcgccgc ctgcagcagc cgcagcggcg ccagcacctt ggccacccag 2640
accaccacgg cctgcaccct gagagcctag cccaccgtag ccaccttgac cggcgccgcc 2700
tgcagcagcc gcagcggcgc cagcaccttg gccacccaga ccaccacggc ctgcaccctg 2760
agagcctagc ccaccgtagc caccttgacc ggcgccgcct gcagcagccg cagcggcgcc 2820
agcaccttgg ccacccagac caccacggcc tgcaccctga gagcctagcc caccgtagcc 2880
accttgaccg gcgccgcctg cagcagccgc agcggcgcca gcaccttggc cacccagacc 2940
accacggcct gcaccctgag agcctagccc accgtagcca ccttgaccgg cgccgcctgc 3000
agcagccgca gcggcgccag caccttggcc acccagacca ccacggcctg caccctgaga 3060
gcctagccca ccgtagccac cttgaccggc gccgcctgca gcagccgcag cggcgccagc 3120
accttggcca cccagaccac cacggcctgc accctgagag cctagcccac cgtagccacc 3180
ttgaccggcg ccgcctgcag cagccgcagc ggcgccagca ccttggccac ccagaccacc 3240
acggcctgca ccctgagagc ctagcccacc gtagccacct tgaccggcgc cgcctgcagc 3300
agccgcagcg gcgccagcac cttggccacc cagaccacca cggcctgcac cctgagagcc 3360
tagcccaccg tagccacctt gaccggcgcc gcctgcagca gccgcagcgg cgccagcacc 3420
ttggccaccc agaccaccac ggcctgcacc ctgagagcct agcccaccgt agccaccttg 3480
accggcgccg cctgcagcag ccgcagcggc gccagcacct tggccaccca gaccaccacg 3540
gcctgcaccc tgagagccta gcccaccgta gccaccttga ccggcgccgc ctgcagcagc 3600
cgcagcggcg ccagcacctt ggccacccag accaccacgg cctgcaccct gagagcctag 3660
cccaccgtag ccaccttgac cggcgccgcc tgcagcagcc gcagcggcgc cagcaccttg 3720
gccacccaga ccaccacggc ctgcaccctg agagcctagc ccaccgtagc caccttgacc 3780
ggcgccgcct gcagcagccg cagcggcgcc agcaccttgg ccacccagac caccacggcc 3840
tgcaccctga gagcctaggc cgcccgggcc acatatgacg actgcagcac tagtgctgaa 3900
atcgctcgta tatccttgat gagtgctgta tccactgttt gatacgtatg gcccgctctg 3960
agaatatgct cccgcatcag cagcaacata actttgagca acagtaccat cggaaagtgt 4020
cttcatgagc acatcttcct ctacaatgga ctcgttaccg tcggaatccg tggttataac 4080
gaacgtcttg atcatttttt cattttttcc aagtattcca tggtttttat ttttccgttg 4140
cattttttta gttgtaattt gttcttcgat aactgcccca gatgcatctc taattatttc 4200
atctgttgta ttactacttt ggacagtgac atcactccca aaatagtcct catcaaaatc 4260
attgatgttt gcatttgtat aagcgacata ctgaaacaaa atgttaacaa ttttttctta 4320
aatcaatacg ataagtgcta aaatattgag ctataaattt cgcacattca atcgaagtta 4380
gcgctgatct ggaacgagtt aggacatact gccttagtag tggtaatagt aataattgaa 4440
tgttctagct ggggcgttag gcaagttgaa caacattcta attatgtaaa catttgtggg 4500
aaagtacata attgtatctc atacaccacg agattttatg gtcacattat gttgttatta 4560
cttgagcttg tttcgagctt tgttttccct acctattagc tggtagccta ttccagctac 4620
gctccgatgg gtaggtgagc tctcagactc aacctgaaag aatttgctaa cactagccct 4680
aacaagagca gtgcttcata gaatctatca cgtgatcggt aacgcgaccc actgagaaga 4740
tctggcgaga aactcagtgg gcagctcgtg ttataatcac ataccaatgt attaaaatgt 4800
aacagaatgc tacctcgagg ttatgaaaat gattataatt tgcgaaaaaa aggcaatagc 4860
aattgttaat agatatcata ataaattaat aatgcggtta taattttatg caatttcttt 4920
cgtctatttt ctaatgatgc tttacgaatt gttttacata ttgttgaata tgcattgcat 4980
attgcaatgc tgatttaccg gtgaaatagg atattgcaag tctgcccagg tatttacata 5040
gattcatctt gcctactttt gacgcaaata aatcacaagt tacataatct aaggttcatt 5100
ttttaaataa ataaatgtag tttattccgt agcccccccg ggcgtgacaa atcaaatggc 5160
acaatttacg atatctgtgc gttttggcga ccacttatta tcaggtggcc cgtgatatcg 5220
tctggccacc ttctgaaata atagtaaaat aattaactca cctgcagagc gcagcacaag 5280
atcacaaagg ttttgactct catcttgaga gttggaaccg aactgatgct gatttgaaaa 5340
agttgaacct ttttatactg aaaattttcg agttttgacg tatttacttt cgatagaata 5400
aacatctaca cattgtattg tacagataca attacataga aattaatctt tttatttaac 5460
ataacaatac aacgtatgaa gtaaattaaa ttgtgatcat gaacaatgtg attaattatg 5520
atttaattga tcttattgtt cttactttta atattttaaa gaattttata atatcgttca 5580
atttttttgt aatatttaaa gaacttactt catgctttct cccgcggccg ccgaacccta 5640
aaacattgtt acgttacttg caattaagca cttattcaaa ctttccgtac aaaacatctt 5700
tccgcggtgc agaagacaag ccatcgcaac ggtgttaagg gcaggacttt tttttttgtt 5760
tcctacctag ctgagagcct tgagaggcta tttcagcgta accttaacta gtaagtgagc 5820
tcacggggct caaacctgac gacgttgcta acacgaatcc tagcaagagc cgtgcttcgc 5880
agaatctacc accggatcgg aaacgcgacc cgctgagaag atccggcgag aaactcagtg 5940
ggctgtgtct gagggttaat ttgctcgtcg agcccttcgt cgcaagcgac gggtccgacg 6000
agaacgatga ccggtgcttg aggtacctaa agcaccgtta gtggatcgtg aggatccgaa 6060
atgacgtgtt tggggcgacg tcgactgctt gccattctgt ccgtaggatc gggaatgggc 6120
gggcaggacg cgtcaaaatc gcccttattc aggtcccata ttttcgatac aataaagagc 6180
aaccctgtag tttgtgcgta aaagcttacg tctgtaactg ctgttctgga ctaatgagag 6240
acaataaacc tatggagtga cggcgaagta gatttttgtc aatatcaaac ctttagtgct 6300
cttgttttct tctcaactaa tagtttctct atgtccatca ctcacgattg attcgtggca 6360
gaaataggct agatggtggc ccgacagtat ggttaagtga gattacaatg tgccctatta 6420
ccagtaaata gcagttagcg atggctgtat gctggtatga cactctgagg attctgctac 6480
gttcttggtg gttctctaag tcgcccttta acgacaccca cggaaagaga tgtgaccgta 6540
ggctatttta cttagttttc taatatcaaa aaggctgttt gtacctacct agtcaggtca 6600
taaattctgt cacatgttta atgtaaaata attgaaacaa gtttattcat tatgtaacca 6660
ttcatatacc aaaatgaact taacaaaaca tagattctta tgacactaaa gtttattcaa 6720
aatgacctcc gtgattttga atacaggcct tcaatctgcg cggccagtcg tctatcgcag 6780
cacgaacgag gtccatgtca atatcggcag ctgccttaat caaggatgtc ttgagtgact 6840
ccaaattggg atgaggcttt gagcctcgac ctagttctag tgttcccaca atggttaatt 6900
cgagctcgcc cggggatcta attcaattag agactaattc aattagagct aattcaatta 6960
ggatccaagc ttatcgattt cgaaccctcg accgccggag tataaataga ggcgcttcgt 7020
ctacggagcg acaattcaat tcaaacaagc aaagtgaaca cgtcgctaag cgaaagctaa 7080
gcaaataaac aagcgcagct gaacaagcta aacaatcggg gtaccgctag agtcgacggt 7140
acgatccacc ggtcgccacc atggtgagca agggcgagga gctgttcacc ggggtggtgc 7200
ccatcctggt cgagctggac ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg 7260
gcgagggcga tgccacctac ggcaagctga ccctgaagtt catctgcacc accggcaagc 7320
tgcccgtgcc ctggcccacc ctcgtgacca ccctgacctg gggcgtgcag tgcttcagcc 7380
gctaccccga ccacatgaag cagcacgact tcttcaagtc cgccatgccc gaaggctacg 7440
tccaggagcg caccatcttc ttcaaggacg acggcaacta caagacccgc gccgaggtga 7500
agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg 7560
acggcaacat cctggggcac aagctggagt acaactacat cagccacaac gtctatatca 7620
ccgccgacaa gcagaagaac ggcatcaagg ccaacttcaa gatccgccac aacatcgagg 7680
acggcagcgt gcagctcgcc gaccactacc agcagaacac ccccatcggc gacggccccg 7740
tgctgctgcc cgacaaccac tacctgagca cccagtccgc cctgagcaaa gaccccaacg 7800
agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc actctcggca 7860
tggacgagct gtacaagtaa agcggccgcg actctagatc ataatcagcc ataccacatt 7920
tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa 7980
aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag 8040
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 8100
gtccaaactc atcaatgtat cttaaagctt atcgatacgc gtacggcgcg cctaggccgg 8160
ccgatactag agcggccgcc accgcggtgg agctccagct tttgttccct ttagtgaggg 8220
ttaattagat cttaatacga ctcactatag ggcgaattgg gtaccgggcc ccccctcgag 8280
gtcgacggta tcgataagct tgatatctat aacaagaaaa tatatatata ataagttatc 8340
acgtaagtag aacatgaaat aacaatataa ttatcgtatg agttaaatct taaaagtcac 8400
gtaaaagata atcatgcgtc attttgactc acgcggtcgt tatagttcaa aatcagtgac 8460
acttaccgca ttgacaagca cgcctcacgg gagctccaag cggcgactga gatgtcctaa 8520
atgcacagcg acggattcgc gctatttaga aagagagagc aatatttcaa gaatgcatgc 8580
gtcaatttta cgcagactat ctttctaggg ttaatctagc tgcatcagga tcatatcgtc 8640
gggtcttttt tccggctcag tcatcgccca agctggcgct atctgggcat cggggaggaa 8700
gaagcccgtg ccttttcccg cgaggttgaa gcggcatgga aagagtttgc cgaggatgac 8760
tgctgctgca ttgacgttga gcgaaaacgc acgtttacca tgatgattcg ggaaggtgtg 8820
gccatgcacg cctttaacgg tgaactgttc gttcaggcca cctgggatac cagttcgtcg 8880
cggcttttcc ggacacagtt ccggatggtc agcccgaagc gcatcagcaa cccgaacaat 8940
accggcgaca gccggaactg ccgtgccggt gtgcagatta atgacagcgg tgcggcgctg 9000
ggatattacg tcagcgagga cgggtatcct ggctggatgc cgcagaaatg gacatggata 9060
ccccgtgagt tacccggcgg gcgcgcttgg cgtaatcatg gtcatagctg tttcctgtgt 9120
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 9180
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 9240
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 9300
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 9360
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 9420
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 9480
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 9540
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 9600
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 9660
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 9720
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 9780
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 9840
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 9900
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 9960
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 10020
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 10080
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 10140
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 10200
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 10260
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 10320
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 10380
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 10440
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 10500
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 10560
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 10620
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 10680
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 10740
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 10800
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 10860
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 10920
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 10980
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 11040
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 11100
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 11160
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 11220
ttccgcgcac atttccccga aaagtgccac 11250
Claims (23)
- 누에 서열, 하나 이상의 거미 실크 탄성 모티프 서열, 하나 이상의 거미 실크 강도 모티프 서열, 또는 이의 조합을 포함하는, 키메라 서열에 의해 암호화되는 재조합 거미 실크 단백질.
- 제1항에 있어서,
거미 실크 탄성 모티프 서열은 MaSp 유사 모티프 서열 또는 MiSp 유사 모티프 서열인, 재조합 실크 단백질. - 제2항에 있어서,
MaSp 유사 모티프는 MaSp1, MaSp2, 또는 이의 조합인, 재조합 거미 실크 단백질. - 제1항에 있어서,
성장 촉진 펩티드를 더 포함하는 재조합 거미 실크 단백질. - 제1항의 재조합 실크 단백질을 포함하는 키메라 거미 실크/누에 섬유로서, 상기 실크 섬유는 천연 누에 실크 섬유보다 큰 인장 강도를 나타내는, 키메라 거미 실크/누에 섬유.
- 하나 이상의 거미 실크 탄성 모티프 서열, 하나 이상의 거미 실크 강도 모티프 서열, 또는 이의 조합을 포함하는 서열을 가지고 있는 재조합 키메라 유전자를 가지고 있는 형질전환 누에.
- 제6항에 있어서,
누에는 천연 누에 섬유보다 2배 큰 인장 강도를 나타내는 키메라 거미 실크/누에 섬유의 생산에 적합한 키메라 누에/거미 실크 단백질을 생산할 수 있는, 형질전환 누에. - 제5항에 있어서,
형질전환 누에는 형질전환 누에나방(Bombyx mori) 누에인, 형질전환 누에. - 제6항에 있어서,
여덟 개의 거미 실크 탄성 모티프 서열을 포함하는 형질전환 누에. - 제8항에 있어서,
거미 실크 탄성 모티프 서열은 MaSp 유사 모티프 서열 또는 MiSp 유사 모티프 서열인, 형질전환 누에. - 피브로인 중쇄(fhc)-거미 실크 키메라를 발현할 수 있는 누에나방 실크 피브로인 중쇄 발현 카세트를 포함하는 유전자 구조체로서, 상기 구조체는 거미 실크 탄성 모티프 서열, 거미 실크 강도 모티프 서열, 또는 둘 다를 암호화하는 거미 실크 단백질 서열을 포함하고, 상기 구조체는 누에나방 fhc 실크 단백질 서열의 N 말단 절편과 C 말단 절편이 옆에 있는, 유전자 구조체.
- 제11항에 있어서,
거미 실크 단백질 서열은 4개 내지 8개 카피의 추정상의 편모상 실크 탄성 모티프 서열 및 1개 내지 4개 카피의 추정상의 드래그라인 실크 강도 모티프 서열을 포함하는, 유전자 구조체. - 제11항에 있어서,
탄성 모티프 서열은 GPGGA이고, 강도 모티프 서열은 GGPSGPGS(A)8인, 유전자 구조체. - 도 5에 정의된 유전자 구조체.
- 도 12a에 정의된 피기백(piggyBac) 벡터.
- 도 12b에 정의된 피기백 벡터.
- a.) 키메라 거미 실크 강도 모티프 서열, 거미 실크 유연성 모티프 서열 또는 이의 조합을 암호화하는 유전자를 가지고 있는 피기백 벡터 시스템을 이용하여 형질전환 누에를 제조하는 단계;
b.) 누에에 고유한 적합한 생리적 조건 하에서 형질전환 누에가 고치를 생산하도록 허용하는 단계;
c.) 고치를 수집하고 키메라 거미 실크 섬유를 추출하는 단계:를 포함하는 키메라 거미 실크 복합 섬유의 생산을 위한 제조방법. - 제17항에 있어서,
형질전환 누에는 형질전환 누에나방(Bomby mori) 누에인, 방법. - 거미 실크 복합 섬유 안으로 조립하기에 적합한 안정적인 키메라 거미 실크 단백질을 안정적으로 발현할 수 있는 형질전환 누에나방 누에를 제조하는 방법으로, 상기 키메라 거미 실크 단백질은 거미 실크 유연성 모티프 서열과 거미 실크 강도 모티프 서열, 또는 이의 조합을 포함하는 서열에 의해 암호화되며, 상기 방법은
a.) 주사된 누에나방 알을 제공하기 위하여, 거미 실크 유연성 모티프 서열, 거미 실크 강도 모티프 서열, 또는 이의 조합을 가지고 있는 재조합 유전자 카세트를 포함하는 피기백 벡터를 돌연변이 누에나방 알에 삽입하는 단계;
b.) 유충을 제공하기 위하여, 알이 적합한 배양 조건 하에서 부화하도록 허용하는 단계;
c.) 적합한 배양 조건 하에서 유충이 성숙하도록 허용하는 단계; 및
c.) 형질전환 누에나방 누에를 선별하는 단계:를 포함하는, 형질전환 누에나방 누에를 제조하는 방법 - 제19항에 있어서,
재조합 유전자 카세트는 형질전환 누에나방의 선별을 위한 녹색 형광 단백질(GFP)를 포함하는, 방법. - 제19항에 있어서,
피기백 벡터는 pXLBacII-ECFP NTD CTD masplX16(10,458pb) 또는 pXLBacII-ECFP NTD CTD maspX24(11,250bp)인, 방법. - 안정적으로 통합된 거미 실크 단백질을 포함하는 합성 복합 실크 섬유로서, 상기 합성 복합 섬유는 천연 누에 실크 섬유의 인장 강도와 비교하여, 그리고 천연 거미 실크 섬유와 비교하여, 더 큰 인장 강도를 나타내는, 합성 복합 실크 섬유.
- 제22항에 있어서,
안정적으로 통합된 치료 분자를 더 포함하는, 합성 복합 실크 섬유.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38733210P | 2010-09-28 | 2010-09-28 | |
US61/387,332 | 2010-09-28 | ||
PCT/US2011/053760 WO2012050919A2 (en) | 2010-09-28 | 2011-09-28 | Chimeric spider silk and uses thereof |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177005086A Division KR101926286B1 (ko) | 2010-09-28 | 2011-09-28 | 키메라 거미 실크 및 이의 용도 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140095010A true KR20140095010A (ko) | 2014-07-31 |
Family
ID=45938877
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137010776A KR20140095010A (ko) | 2010-09-28 | 2011-09-28 | 키메라 거미 실크 및 이의 용도 |
KR1020187034773A KR102063002B1 (ko) | 2010-09-28 | 2011-09-28 | 키메라 거미 실크 및 이의 용도 |
KR1020177005086A KR101926286B1 (ko) | 2010-09-28 | 2011-09-28 | 키메라 거미 실크 및 이의 용도 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187034773A KR102063002B1 (ko) | 2010-09-28 | 2011-09-28 | 키메라 거미 실크 및 이의 용도 |
KR1020177005086A KR101926286B1 (ko) | 2010-09-28 | 2011-09-28 | 키메라 거미 실크 및 이의 용도 |
Country Status (9)
Country | Link |
---|---|
US (6) | US20130212718A1 (ko) |
EP (1) | EP2621957B1 (ko) |
JP (3) | JP2014502140A (ko) |
KR (3) | KR20140095010A (ko) |
CN (3) | CN107190017A (ko) |
AU (3) | AU2011314072B2 (ko) |
BR (1) | BR112013007247A2 (ko) |
CA (1) | CA2812791C (ko) |
WO (1) | WO2012050919A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022124772A1 (ko) * | 2020-12-07 | 2022-06-16 | (주)메디코스바이오텍 | 재조합 실크 단백질 생산능이 향상된 재조합 미생물 및 이를 이용한 고분자량 재조합 실크 단백질의 생산 방법 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140095010A (ko) * | 2010-09-28 | 2014-07-31 | 더 유니버시티 오브 노트르 담 듀락 | 키메라 거미 실크 및 이의 용도 |
CN102358902B (zh) * | 2011-04-02 | 2013-01-02 | 西南大学 | 家蚕丝素重链基因突变序列及突变的方法和应用 |
WO2012165476A1 (ja) | 2011-06-01 | 2012-12-06 | スパイバー株式会社 | 人造ポリペプチド繊維及びその製造方法 |
CN102808034B (zh) * | 2012-08-29 | 2014-02-26 | 苏州大学 | 一种在蚕卵期鉴别家蚕吐丝颜色的方法 |
CN102808033B (zh) * | 2012-08-29 | 2014-07-16 | 苏州大学 | 一种在幼虫期鉴别家蚕吐丝颜色的方法 |
EP3973992A3 (en) | 2013-09-17 | 2022-08-31 | Bolt Threads, Inc. | Methods and compositions for synthesizing improved silk fibers |
US10172407B2 (en) * | 2015-06-10 | 2019-01-08 | New York University | Ecostructural bicycle/activity safety helmet |
CN105031723B (zh) * | 2015-06-23 | 2017-05-24 | 上海交通大学 | 基于蜘蛛丝蛋白的温敏性水凝胶 |
JP2018531169A (ja) | 2015-09-17 | 2018-10-25 | ロベルト ベロッツィ ヘレス | 耐力複合パネル、材料、製品、ならびに製造方法および使用方法 |
WO2017067423A1 (zh) * | 2015-10-23 | 2017-04-27 | 浙江大学 | 利用家蚕丝腺生物反应器合成分泌黑寡妇蜘蛛牵引丝蛋白的方法 |
CN105400817B (zh) * | 2015-10-23 | 2019-01-18 | 杭州超丝生物科技有限公司 | 利用家蚕同时合成分泌黑寡妇蜘蛛牵引丝蛋白1和蛋白2的方法 |
CN105400815B (zh) * | 2015-10-23 | 2019-01-25 | 杭州超丝生物科技有限公司 | 利用家蚕丝腺生物反应器合成分泌黑寡妇蜘蛛牵引丝蛋白1的方法 |
CN105463022B (zh) * | 2015-10-23 | 2019-01-25 | 杭州超丝生物科技有限公司 | 利用家蚕丝腺生物反应器合成分泌黑寡妇蜘蛛牵引丝蛋白2的方法 |
RU2769982C2 (ru) | 2016-04-28 | 2022-04-12 | Спайбер Инк. | Модифицированный фиброин |
CN109661404A (zh) * | 2016-06-23 | 2019-04-19 | 丝芭博株式会社 | 改造丝心蛋白 |
US11447532B2 (en) | 2016-09-14 | 2022-09-20 | Bolt Threads, Inc. | Long uniform recombinant protein fibers |
JP6990413B2 (ja) * | 2016-10-18 | 2022-02-03 | 国立研究開発法人農業・食品産業技術総合研究機構 | 遺伝子組換えミノムシ絹糸 |
CN110719732B (zh) * | 2017-03-30 | 2022-11-18 | 犹他州立大学 | 表达蜘蛛丝的转基因蚕 |
US11692015B2 (en) | 2017-07-26 | 2023-07-04 | Spiber Inc. | Modified fibroin |
WO2019094700A1 (en) * | 2017-11-10 | 2019-05-16 | Cocoon Biotech Inc. | Silk-based products and methods of use |
CN108392232B (zh) * | 2018-04-11 | 2023-07-25 | 苏州大学 | 以功能化蛋白丝线为载体的体内细胞捕获器 |
CN113260745A (zh) | 2019-01-09 | 2021-08-13 | 丝芭博株式会社 | 改造丝心蛋白 |
CN109821053B (zh) * | 2019-02-28 | 2021-06-01 | 李春 | 一种可吸收医用缝合线及其制备方法 |
CN109939257B (zh) * | 2019-02-28 | 2021-04-09 | 李琳 | 一种抗菌医用绷带及其制备方法 |
CN109912720B (zh) * | 2019-03-14 | 2021-12-07 | 天津大学 | 一种蛛丝蛋白的设计合成方法和纺丝 |
US20210246471A1 (en) * | 2020-02-11 | 2021-08-12 | Kraig Biocraft Laboratories, Inc. | Modification of heavy chain fibroin in bombyx mori |
JP2023515692A (ja) * | 2020-03-04 | 2023-04-13 | ポセイダ セラピューティクス,インコーポレイティド | 代謝性肝障害の治療のための組成物と方法 |
WO2021211942A1 (en) * | 2020-04-17 | 2021-10-21 | Massachusetts Institute Of Technology | Precision delivery of multi-scale payloads to tissue-specific targets in plants |
CN111500591B (zh) * | 2020-05-11 | 2023-01-06 | 浙江大学 | 蜘蛛聚状腺丝蛋白基因序列的应用及其改良家蚕丝性能的方法 |
CN111518832B (zh) * | 2020-05-11 | 2023-01-06 | 浙江大学 | 蜘蛛梨状腺丝蛋白基因序列的应用及其改良家蚕丝性能的方法 |
CN111518831B (zh) * | 2020-05-11 | 2022-12-06 | 浙江大学 | 蜘蛛葡萄状腺丝蛋白基因序列的应用及其改良家蚕丝性能的方法 |
WO2022232090A2 (en) * | 2021-04-29 | 2022-11-03 | Carnegie Mellon University | Acoustically responsive biomaterials |
CN113737521B (zh) * | 2021-09-27 | 2023-03-31 | 溧阳市天目湖农业发展有限公司 | 一种长效抗菌的天然蚕丝纤维及其加工工艺 |
CN114164509B (zh) * | 2021-12-16 | 2024-02-02 | 中国科学院电工研究所 | 一种具有紫外及近红外屏蔽性能的蚕丝纤维及其制备方法和应用 |
CN114685687B (zh) * | 2022-05-05 | 2023-11-24 | 苏州大学 | 一种含金丝织网蜘蛛大壶状腺丝蛋白复合丝的制备方法 |
CN115992181A (zh) * | 2022-05-05 | 2023-04-21 | 苏州大学 | 一种通过苜蓿银纹夜蛾核型多角体病毒用家蚕生产嵌合蚕丝的方法 |
CN114957485B (zh) * | 2022-05-05 | 2023-11-10 | 苏州大学 | 一种含多种蜘蛛腺丝蛋白的高强度蚕丝及其制备方法 |
WO2024057361A1 (ja) * | 2022-09-12 | 2024-03-21 | 興和株式会社 | 可溶化タンパク質製造方法 |
CN116178571A (zh) * | 2023-02-21 | 2023-05-30 | 南开大学 | 一种内质网靶向人工蛋白、重组酿酒酵母、内质网靶向囊泡、免疫佐剂和疫苗 |
CN116425848A (zh) * | 2023-04-11 | 2023-07-14 | 北京新诚中科技术有限公司 | 重组嵌合蛛丝蛋白、生物蛋白纤维及其制备方法和应用 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10179171A (ja) * | 1996-09-17 | 1998-07-07 | Wako Pure Chem Ind Ltd | ペプチドグリカン認識蛋白質およびその製造法 |
US5994099A (en) * | 1997-12-31 | 1999-11-30 | The University Of Wyoming | Extremely elastic spider silk protein and DNA coding therefor |
US20020082411A1 (en) * | 2001-01-23 | 2002-06-27 | Darrick Carter | Immune mediators and related methods |
US7521228B2 (en) * | 2001-08-29 | 2009-04-21 | The University Of Wyoming | Spider silk protein encoding nucleic acids, polypeptides, antibodies and methods of use thereof |
US7659112B2 (en) * | 2002-03-06 | 2010-02-09 | Toray Industries, Inc. | Process for producing physiologically active protein using genetically modified silkworm |
US8574590B2 (en) * | 2003-07-30 | 2013-11-05 | Integral Molecular, Inc. | Lipoparticles comprising proteins, methods of making, and using the same |
DE10347992A1 (de) * | 2003-10-15 | 2005-05-12 | Trw Repa Gmbh | Gurtaufroller für einen Fahrzeug-Sicherheitsgurt |
WO2005068495A1 (ja) * | 2004-01-13 | 2005-07-28 | Toray Industries, Inc. | クモ糸タンパク質を含む絹糸および該絹糸を産生するカイコ |
US20050261479A1 (en) * | 2004-04-29 | 2005-11-24 | Christian Hoffmann | Method for purifying and recovering silk proteins using magnetic affinity separation |
CA2573780C (en) * | 2004-07-22 | 2013-11-19 | Technische Universitaet Muenchen | Recombinant spider silk proteins |
BRPI0701826B1 (pt) * | 2007-03-16 | 2021-02-17 | Embrapa - Empresa Brasileira De Pesquisa Agropecuária | proteínas da teia de aranha nephilengys cruentata, avicularia juruensis e parawixia bistriata isoladas da biodiversidade brasileira |
US8825743B2 (en) * | 2007-07-12 | 2014-09-02 | Cornell University | Semantic transactions in online applications |
US9131671B2 (en) * | 2008-02-01 | 2015-09-15 | Entogenetics, Inc. | Methods, compositions and systems for production of recombinant spider silk polypeptides |
KR101698076B1 (ko) * | 2010-03-29 | 2017-01-19 | 에릭 제임스 커비 | 라이브 이벤트 개시 |
KR20140095010A (ko) * | 2010-09-28 | 2014-07-31 | 더 유니버시티 오브 노트르 담 듀락 | 키메라 거미 실크 및 이의 용도 |
-
2011
- 2011-09-28 KR KR1020137010776A patent/KR20140095010A/ko active Application Filing
- 2011-09-28 KR KR1020187034773A patent/KR102063002B1/ko active IP Right Grant
- 2011-09-28 EP EP11833071.1A patent/EP2621957B1/en active Active
- 2011-09-28 CA CA2812791A patent/CA2812791C/en active Active
- 2011-09-28 CN CN201710335250.4A patent/CN107190017A/zh active Pending
- 2011-09-28 WO PCT/US2011/053760 patent/WO2012050919A2/en active Application Filing
- 2011-09-28 CN CN201811026107.8A patent/CN109136245A/zh active Pending
- 2011-09-28 BR BR112013007247A patent/BR112013007247A2/pt not_active Application Discontinuation
- 2011-09-28 CN CN2011800571271A patent/CN103261231A/zh active Pending
- 2011-09-28 AU AU2011314072A patent/AU2011314072B2/en active Active
- 2011-09-28 JP JP2013530432A patent/JP2014502140A/ja active Pending
- 2011-09-28 KR KR1020177005086A patent/KR101926286B1/ko active IP Right Grant
-
2013
- 2013-03-28 US US13/852,379 patent/US20130212718A1/en not_active Abandoned
-
2015
- 2015-06-30 US US14/754,916 patent/US20150322121A1/en not_active Abandoned
- 2015-06-30 US US14/754,946 patent/US20150322122A1/en not_active Abandoned
-
2017
- 2017-03-01 JP JP2017038829A patent/JP2017127309A/ja active Pending
- 2017-03-03 AU AU2017201493A patent/AU2017201493A1/en not_active Abandoned
-
2018
- 2018-12-14 US US16/221,267 patent/US20190106467A1/en not_active Abandoned
-
2019
- 2019-01-11 US US16/246,318 patent/US20190153047A1/en not_active Abandoned
- 2019-02-13 US US16/275,159 patent/US20190185528A1/en not_active Abandoned
- 2019-03-05 AU AU2019201497A patent/AU2019201497A1/en not_active Abandoned
- 2019-08-02 JP JP2019142869A patent/JP2019205463A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022124772A1 (ko) * | 2020-12-07 | 2022-06-16 | (주)메디코스바이오텍 | 재조합 실크 단백질 생산능이 향상된 재조합 미생물 및 이를 이용한 고분자량 재조합 실크 단백질의 생산 방법 |
Also Published As
Publication number | Publication date |
---|---|
CA2812791A1 (en) | 2012-04-19 |
KR101926286B1 (ko) | 2018-12-10 |
BR112013007247A2 (pt) | 2016-06-14 |
EP2621957B1 (en) | 2021-06-02 |
JP2014502140A (ja) | 2014-01-30 |
AU2011314072B2 (en) | 2017-03-30 |
US20150322122A1 (en) | 2015-11-12 |
CN109136245A (zh) | 2019-01-04 |
KR20170023415A (ko) | 2017-03-03 |
US20130212718A1 (en) | 2013-08-15 |
WO2012050919A2 (en) | 2012-04-19 |
JP2019205463A (ja) | 2019-12-05 |
EP2621957A2 (en) | 2013-08-07 |
AU2019201497A1 (en) | 2019-04-11 |
US20150322121A1 (en) | 2015-11-12 |
JP2017127309A (ja) | 2017-07-27 |
US20190106467A1 (en) | 2019-04-11 |
AU2011314072A1 (en) | 2013-05-23 |
KR20180130603A (ko) | 2018-12-07 |
CN107190017A (zh) | 2017-09-22 |
CN103261231A (zh) | 2013-08-21 |
EP2621957A4 (en) | 2014-03-26 |
CA2812791C (en) | 2020-07-14 |
KR102063002B1 (ko) | 2020-01-07 |
AU2017201493A1 (en) | 2017-03-23 |
WO2012050919A3 (en) | 2012-12-27 |
US20190153047A1 (en) | 2019-05-23 |
US20190185528A1 (en) | 2019-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102063002B1 (ko) | 키메라 거미 실크 및 이의 용도 | |
KR102424721B1 (ko) | Rna-유도 엔도뉴클레아제의 세포 내로의 펩티드 매개성 전달 | |
Chang et al. | Delivery of recombinant gene products with microencapsulated cells in vivo | |
KR20220047898A (ko) | 게놈 편집 면역 효과기 세포 | |
CN110191955A (zh) | 在体外和体内对工程化的细胞中表达的化学物质诱导的信号传导复合物进行外源性药物激活的方法 | |
KR20090031936A (ko) | 프로테아제 스크리닝 방법 및 이에 의해 확인된 프로테아제 | |
AU2016343979A1 (en) | Delivery of central nervous system targeting polynucleotides | |
CN116059250A (zh) | 适用于异种移植的三重转基因猪 | |
EA030440B1 (ru) | Сопровождающая диагностика для терапии антигиалуронановым агентом и способы ее применения | |
DK2443248T3 (en) | IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES | |
CN112218882A (zh) | Foxp3在经编辑的cd34+细胞中的表达 | |
CN111733174B (zh) | 一种分离的核酸分子及其用途 | |
RO109863B1 (ro) | Gena care codifica cel putin un factor de restrictie complementar, animal transgenic si metode de transplantare a tesuturilor sau organelor animale | |
CN106659805B (zh) | 通过miRNA抑制埃博拉病毒的方法 | |
CN101517074A (zh) | 蛋白酶筛选方法及由此鉴别的蛋白酶 | |
CN110868850B (zh) | 缺乏i类和ii类mhc的nsg小鼠 | |
CN101883843A (zh) | 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量 | |
CN106456674B (zh) | 转基因猪胰岛和其用于治疗糖尿病的用途 | |
KR101658163B1 (ko) | 만능 줄기세포-유래의 테라토마 형성 억제방법 | |
EP2217622B1 (en) | Method for the separation of cells | |
CN113260704B (zh) | CYP4V2和RdCVF在制备药物中的用途 | |
US20040014158A1 (en) | Protein conjugates, methods, vectors, proteins and DNA for producing them, their use, and medicaments and vaccines containing a certain quantity of said protein conjugates | |
WO2002092791A1 (en) | Tissues or organs for use in xenotransplantation | |
KR20240021211A (ko) | Klk2-gpi 융합 단백질에 대한 핵산 코딩, 재조합 세포 및 이의 용도 | |
CN115443141A (zh) | 胰腺内巨噬细胞m2极化治疗1型糖尿病 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
A107 | Divisional application of patent |