KR102563658B1 - 유전자 재조합 도롱이벌레 견사 - Google Patents
유전자 재조합 도롱이벌레 견사 Download PDFInfo
- Publication number
- KR102563658B1 KR102563658B1 KR1020197013824A KR20197013824A KR102563658B1 KR 102563658 B1 KR102563658 B1 KR 102563658B1 KR 1020197013824 A KR1020197013824 A KR 1020197013824A KR 20197013824 A KR20197013824 A KR 20197013824A KR 102563658 B1 KR102563658 B1 KR 102563658B1
- Authority
- KR
- South Korea
- Prior art keywords
- silkworm
- modified
- gene
- fib
- fibroin
- Prior art date
Links
- 241000237858 Gastropoda Species 0.000 title claims description 25
- 241000254173 Coleoptera Species 0.000 title description 53
- 241000255789 Bombyx mori Species 0.000 claims abstract description 279
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 125
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 78
- 238000000034 method Methods 0.000 claims abstract description 52
- 230000008673 vomiting Effects 0.000 claims abstract description 20
- 210000004916 vomit Anatomy 0.000 claims abstract description 19
- 230000014509 gene expression Effects 0.000 claims description 203
- 239000013604 expression vector Substances 0.000 claims description 90
- 210000004907 gland Anatomy 0.000 claims description 67
- 108010022355 Fibroins Proteins 0.000 claims description 50
- 241001674044 Blattodea Species 0.000 claims description 37
- 150000001413 amino acids Chemical class 0.000 claims description 35
- 241000238631 Hexapoda Species 0.000 claims description 29
- 230000002103 transcriptional effect Effects 0.000 claims description 25
- 238000004519 manufacturing process Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 16
- 230000013011 mating Effects 0.000 claims description 10
- 241000255777 Lepidoptera Species 0.000 claims description 7
- 108010064995 silkworm fibroin Proteins 0.000 claims description 7
- 241000269333 Caudata Species 0.000 claims description 5
- 101150077230 GAL4 gene Proteins 0.000 claims description 5
- 206010047700 Vomiting Diseases 0.000 claims description 3
- 241001503991 Consolida Species 0.000 claims 1
- 238000009987 spinning Methods 0.000 claims 1
- 241000881711 Acipenser sturio Species 0.000 abstract description 22
- 239000012634 fragment Substances 0.000 abstract description 16
- 108090000765 processed proteins & peptides Proteins 0.000 abstract description 11
- 102000004196 processed proteins & peptides Human genes 0.000 abstract description 8
- 230000006798 recombination Effects 0.000 abstract description 7
- 229920001184 polypeptide Polymers 0.000 abstract description 6
- 238000005215 recombination Methods 0.000 abstract description 6
- 101150118163 h gene Proteins 0.000 description 113
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 54
- 102000004169 proteins and genes Human genes 0.000 description 45
- 235000018102 proteins Nutrition 0.000 description 43
- 235000001014 amino acid Nutrition 0.000 description 38
- 108020004414 DNA Proteins 0.000 description 36
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 35
- 229940024606 amino acid Drugs 0.000 description 35
- 108010079364 N-glycylalanine Proteins 0.000 description 34
- 108010076504 Protein Sorting Signals Proteins 0.000 description 30
- 239000002773 nucleotide Substances 0.000 description 27
- 125000003729 nucleotide group Chemical group 0.000 description 27
- 238000009395 breeding Methods 0.000 description 21
- 230000001488 breeding effect Effects 0.000 description 19
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 18
- 241001122767 Theaceae Species 0.000 description 18
- 210000004027 cell Anatomy 0.000 description 16
- 239000003550 marker Substances 0.000 description 16
- 210000000349 chromosome Anatomy 0.000 description 14
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 13
- 238000001514 detection method Methods 0.000 description 13
- 235000013601 eggs Nutrition 0.000 description 13
- 241001641641 Eumeta japonica Species 0.000 description 12
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 11
- 108010047495 alanylglycine Proteins 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 108010013296 Sericins Proteins 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- YIKZEZHFGMRQCO-CIUDSAMLSA-N 2-[[(2s)-2-[[2-[[(2s)-2-[[2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]acetyl]amino]propanoyl]amino]acetyl]amino]propanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO YIKZEZHFGMRQCO-CIUDSAMLSA-N 0.000 description 9
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 8
- 210000004899 c-terminal region Anatomy 0.000 description 8
- 239000000835 fiber Substances 0.000 description 8
- 239000000049 pigment Substances 0.000 description 8
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 7
- 108020005345 3' Untranslated Regions Proteins 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 230000003252 repetitive effect Effects 0.000 description 6
- DLZKEQQWXODGGZ-KCJUWKMLSA-N 2-[[(2r)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]propanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KCJUWKMLSA-N 0.000 description 5
- 108020003589 5' Untranslated Regions Proteins 0.000 description 5
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 5
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 239000000470 constituent Substances 0.000 description 5
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 5
- 210000004897 n-terminal region Anatomy 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 4
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 239000012535 impurity Substances 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 108091008023 transcriptional regulators Proteins 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 3
- 241000255978 Antheraea pernyi Species 0.000 description 3
- 241001222599 Clania variegata Species 0.000 description 3
- 102100039556 Galectin-4 Human genes 0.000 description 3
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- 108010047357 Luminescent Proteins Proteins 0.000 description 3
- 102000006830 Luminescent Proteins Human genes 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241000333692 Psychidae Species 0.000 description 3
- 108700005075 Regulator Genes Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 101710137377 Sericin-2 Proteins 0.000 description 3
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 3
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 239000012212 insulator Substances 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 239000002932 luster Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 239000013077 target material Substances 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 101100125027 Dictyostelium discoideum mhsp70 gene Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000030879 Eumeta minuscula Species 0.000 description 2
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 241001670157 Gymnura Species 0.000 description 2
- 101150031823 HSP70 gene Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 2
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- YKZVPMUGEJXEOR-JYJNAYRXSA-N Val-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N YKZVPMUGEJXEOR-JYJNAYRXSA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- -1 aromatic amino acids Chemical class 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- 101150052825 dnaK gene Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000001678 irradiating effect Effects 0.000 description 2
- 230000001418 larval effect Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 239000005445 natural material Substances 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 229940039354 sericin 1 Drugs 0.000 description 2
- 239000004753 textile Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 108010087967 type I signal peptidase Proteins 0.000 description 2
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 241000983018 Actias gnoma Species 0.000 description 1
- 108010000239 Aequorin Proteins 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- 241000255974 Antheraea Species 0.000 description 1
- 241000256019 Antheraea yamamai Species 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 1
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- 241000909872 Attacus Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000255783 Bombycidae Species 0.000 description 1
- 241000255791 Bombyx Species 0.000 description 1
- 241000255794 Bombyx mandarina Species 0.000 description 1
- 108700043204 Bombyx mori fhx Proteins 0.000 description 1
- 241000252848 Brahmaeidae Species 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 241001275954 Cortinarius caperatus Species 0.000 description 1
- HYKFOHGZGLOCAY-ZLUOBGJFSA-N Cys-Cys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O HYKFOHGZGLOCAY-ZLUOBGJFSA-N 0.000 description 1
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 108700002304 Drosophila can Proteins 0.000 description 1
- 101000928792 Drosophila melanogaster Death-associated inhibitor of apoptosis 1 Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241001641639 Eumeta Species 0.000 description 1
- 241000252809 Eupterotidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101710145505 Fiber protein Proteins 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- FAQVCWVVIYYWRR-WHFBIAKZSA-N Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- 230000005483 Hooke's law Effects 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241000255679 Lasiocampidae Species 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- 244000185238 Lophostemon confertus Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- WLCYCADOWRMSAJ-CIUDSAMLSA-N Lys-Asn-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O WLCYCADOWRMSAJ-CIUDSAMLSA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 1
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 1
- BXNZDLVLGYYFIB-FXQIFTODSA-N Met-Asn-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BXNZDLVLGYYFIB-FXQIFTODSA-N 0.000 description 1
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 1
- 241001024304 Mino Species 0.000 description 1
- 241000218213 Morus <angiosperm> Species 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 101100439689 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) chs-4 gene Proteins 0.000 description 1
- 241000256259 Noctuidae Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241001523583 Rhodinia Species 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241000256008 Samia Species 0.000 description 1
- 241000256007 Samia cynthia Species 0.000 description 1
- 241000909829 Samia ricini Species 0.000 description 1
- 244000007853 Sarothamnus scoparius Species 0.000 description 1
- 241001523594 Saturnia <genus> Species 0.000 description 1
- 241001522839 Saturnia japonica Species 0.000 description 1
- 241000255975 Saturniidae Species 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- XMQFTWRPUQYINF-UHFFFAOYSA-N bensulfuron-methyl Chemical compound COC(=O)C1=CC=CC=C1CS(=O)(=O)NC(=O)NC1=NC(OC)=CC(OC)=N1 XMQFTWRPUQYINF-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 102000038379 digestive enzymes Human genes 0.000 description 1
- 108091007734 digestive enzymes Proteins 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 230000001339 gustatory effect Effects 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 235000021190 leftovers Nutrition 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- CPNGPNLZQNNVQM-UHFFFAOYSA-N pteridine Chemical compound N1=CN=CC2=NC=CN=C21 CPNGPNLZQNNVQM-UHFFFAOYSA-N 0.000 description 1
- 230000000384 rearing effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 1
- 238000009958 sewing Methods 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/033—Rearing or breeding invertebrates; New breeds of invertebrates
- A01K67/0333—Genetically modified invertebrates, e.g. transgenic, polyploid
- A01K67/0337—Genetically modified Arthropods
- A01K67/0339—Genetically modified insects, e.g. Drosophila melanogaster, medfly
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/033—Rearing or breeding invertebrates; New breeds of invertebrates
- A01K67/04—Silkworms
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01B—SOIL WORKING IN AGRICULTURE OR FORESTRY; PARTS, DETAILS, OR ACCESSORIES OF AGRICULTURAL MACHINES OR IMPLEMENTS, IN GENERAL
- A01B7/00—Disc-like soil-working implements usable either as ploughs or as harrows, or the like
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/033—Rearing or breeding invertebrates; New breeds of invertebrates
- A01K67/0333—Genetically modified invertebrates, e.g. transgenic, polyploid
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- D—TEXTILES; PAPER
- D01—NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
- D01B—MECHANICAL TREATMENT OF NATURAL FIBROUS OR FILAMENTARY MATERIAL TO OBTAIN FIBRES OF FILAMENTS, e.g. FOR SPINNING
- D01B7/00—Obtaining silk fibres or filaments
- D01B7/06—Obtaining silk from cocoons or portions thereof not suitable for reeling
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
- A01K2217/052—Animals comprising random inserted nucleic acids (transgenic) inducing gain of function
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/20—Animal model comprising regulated expression system
- A01K2217/206—Animal model comprising tissue-specific expression system, e.g. tissue specific expression of transgene, of Cre recombinase
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/70—Invertebrates
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/70—Invertebrates
- A01K2227/706—Insects, e.g. Drosophila melanogaster, medfly
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/01—Animal expressing industrially exogenous proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- D—TEXTILES; PAPER
- D01—NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
- D01B—MECHANICAL TREATMENT OF NATURAL FIBROUS OR FILAMENTARY MATERIAL TO OBTAIN FIBRES OF FILAMENTS, e.g. FOR SPINNING
- D01B7/00—Obtaining silk fibres or filaments
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Environmental Sciences (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Animal Behavior & Ethology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Veterinary Medicine (AREA)
- Mechanical Engineering (AREA)
- Tropical Medicine & Parasitology (AREA)
- Soil Sciences (AREA)
- Insects & Arthropods (AREA)
- Textile Engineering (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
유전자 재조합 기술을 이용하여 도롱이벌레 견사를 토사하는 유전자 재조합 누에를 작출하고, 도롱이벌레 견사를 대량으로 생산하는 방법을 개발하여 제공한다. 도롱이벌레 Fib H의 일부 아미노산 서열을 포함하는 도롱이벌레 Fib H와 비슷한 폴리펩티드를 코드하는 유전자 단편을 클로닝하고, 그 유전자 단편을 누에 유래의 Fib H를 코드하는 유전자 단편과 융합시킨 개변형 도롱이벌레 Fib H를 코드하는 유전자 및 그 유전자를 도입한 유전자 재조합 누에를 제공한다.
Description
본 발명은, 유전자 재조합 기술을 이용하여 제작한 개변형 도롱이벌레 견사 및 그것을 토사(吐絲)하는 유전자 재조합 누에에 관한 것이다.
곤충의 고치를 구성하는 실이나 포유동물의 털은 옛날부터 동물 섬유로서 의류 등에 이용되어 왔다. 특히 누에나방(Bombyx mori)의 유충인 누에에 유래하는 견사(본 명세서에서는 종종 「누에 견사」라고 표기한다)는, 흡방습성이나 보습성 및 보온성이 우수하고, 또한 독특한 광택과 매끄러운 촉감을 가지므로, 현재도 고급 천연 소재로서 귀하게 여겨지고 있다.
그러나, 자연계에는 누에 견사에 필적하거나 또는 그 이상의 특성을 갖는 동물 섬유가 존재한다. 예컨대 도롱이벌레(Basket worm, 일명, "bag worm")가 토사하는 실(본 명세서에서는 종종 「도롱이벌레 견사」라고 표기한다)도 그 하나이다. 도롱이벌레는 나비목(Lepidoptera) 주머니나방과(Psychidae)에 속하는 나방의 유충의 총칭이며, 통상은 잎 조각이나 가지 조각을 실로 얽은 방추형 또는 원통형의 둥지(Bag nest)(도 1) 속에 숨어들고, 섭식 시에도 둥지마다 이동하는 등, 전체 유충기를 둥지와 함께 생활하는 것이 알려져 있다.
이 도롱이벌레 견사는 누에 견사보다도 역학적으로 우수한 특성을 갖는다. 예컨대 탄성률에 관해서, 차주머니나방(Eumeta minuscula)의 도롱이벌레 견사는 누에 견사의 3.5배에나 이르며, 매우 강한 강도를 자랑한다(비특허문헌 1, 2). 또한, 도롱이벌레 견사의 단섬유에 있어서의 단면적은, 누에 견사의 단섬유의 그것의 1/7 정도밖에 없기 때문에, 섬세하고, 매끄러운 촉감을 가지며, 얇고 가벼운 천을 제작하는 것이 가능하다. 더구나, 도롱이벌레 견사는 누에 견사와 동등하거나 그 이상의 광택과 윤기를 갖춘다. 따라서, 도롱이벌레 견사는 신규의 천연 소재로서 매우 유망한 동물 섬유가 될 수 있다.
그런데, 도롱이벌레 견사를 실용화하기 위해서는 몇 가지 문제가 있다. 그 하나가 양산이다. 도롱이벌레 견사를 이용한 제품이라고 하면, 지금까지는 자연계에서 채취한 도롱이벌레의 둥지를 맞붙여 만들어진 지갑이나 짚신과 같은, 말하자면 수제작의 단품 생산품에 불과했다. 도롱이벌레 견사를 실용화하기 위해서는, 소재가 되는 도롱이벌레의 둥지의 대량 입수가 불가결하다. 그러나, 도롱이벌레 둥지의 야외 채취량으로는 양산에는 모자라기 때문에, 도롱이벌레의 대량 사육과 도롱이벌레 견사의 효율적인 채취 방법의 확립이 불가결하게 된다. 그런데, 도롱이벌레 견사 산업은 여명기를 맞이했을 뿐이며, 사육장, 식수 재배 및 제사 공장 등의 도롱이벌레 견사를 양산하기 위한 설비 및 체제가 충분히 갖춰져 있지 않다. 양산화까지는 아직도 시간이 필요한 것이 현재 상황이다.
도롱이벌레 견사의 실용화에 있어서 또 하나의 큰 문제는, 도롱이벌레 둥지의 표면에는 반드시 잎 조각이나 가지 조각 등이 부착되어 있다고 하는 점이다. 도롱이벌레 견사를 제품화하기 위해서는 이들 협잡물을 완전히 제거해야만 한다. 그러나, 제거 작업은 방대한 시간과 비용이 필요하기 때문에, 결과적으로 생산 비용이 높아진다고 하는 새로운 문제가 발생한다. 또한, 기존의 기술로 협잡물을 완전히 제거하기는 어려우며, 최종 생산물에도 약간의 작은 잎 조각 등이 혼재하는 것 외에, 협잡물 유래의 색소로 견사가 옅은 갈색으로 물드는 등, 저품질의 것으로 되어 버린다.
단, 상기 문제는 유전자 재조합 누에 기술을 이용함으로써 전부 해결할 수 있다. 유전자 재조합 기술을 이용하면, 클로닝한 외래 유전자를 숙주에 도입함으로써, 숙주 세포 내에서 유용 단백질의 생산을 할 수 있다. 종래, 단백질 생산계의 숙주로서 대장균(Escherichia coli)이나 출아 효모(Saccharomyces cerevisiae) 등이 주로 이용되어 왔지만, 이들 숙주로는 원하는 단백질을 대량으로 생산할 수 없다고 하는 문제가 있었다. 그래서 최근에는 누에를 숙주로 한 단백질의 대량 생산계가 주목을 받고 있다. 누에(Bombyx mori)는 견사선(絹絲腺) 내에서 대량의 단백질을 짧은 기간에 합성할 수 있다. 유전자 재조합 기술에서는, 외래 유전자를 숙주 세포 내에 도입하는 형질 전환체의 제작 기술이 필수가 되지만, 누에의 경우에는, 트랜스포존 piggyBac을 이용하여 외래 유전자를 게놈 내에서 안정적으로 유지시킴으로써 유전자 재조합 누에(형질 전환 누에)를 제작하는 기술이 이미 확립되어 있다(비특허문헌 3).
누에의 견사선은, 형태학적으로는 도 2에서 도시하는 것과 같은 좌우 한 쌍의 기관으로 이루어지고, 각각은 전부(前部) 견사선, 중부(中部) 견사선 및 후부(後部) 견사선의 3개의 영역으로 구성되어 있다. 후부 견사선 세포 내에서는, 견사의 섬유 성분인 피브로인을 구성하는 3개의 주요한 단백질, 피브로인 H쇄(본 명세서에서는 종종 「Fib H」라고 약칭한다), 피브로인 L쇄(본 명세서에서는 종종 「Fib L」이라고 약칭한다) 및 p25/FHX(이하 「p25」라고 한다)가 합성되고 있다. 이들 3개의 단백질은, 복합체(실크 피브로인 기본 단위; 본 명세서에서는 이하 「SFEU 복합체」라고 표기한다)를 형성하고, 후부 견사선 내강(內腔) 중에 분비된다. 또한, 중부 견사선 세포 내에서는, 견사의 피복 성분인 수용성의 젤라틴과 비슷한 단백질 세리신이 합성되고 있다. 이들은 합성 후에 중부 견사선 내강 중에 분비된다. 후부 견사선 내강 중에 분비된 SFEU 복합체는, 중부 견사선 내강으로 이행하고, 거기서 세리신에 의해서 피복되어, 견사로서 전부 견사선으로부터 토사된다(비특허문헌 4).
도롱이벌레 견사의 기본 구조도, 누에 견사와 마찬가지로, 섬유 성분인 피브로인과 그것을 피복하는 세리신으로 구성되어 있다고 생각되고 있다. 따라서, 누에 견사선을 도롱이벌레 견사의 발현계로서 이용하여, 누에에게 도롱이벌레 견사를 토사하게 할 수 있으면, 도롱이벌레 견사를 용이하면서 또한 대량으로 얻는 것이 가능하게 된다. 또한, 누에고치로서 도롱이벌레 견사를 회수할 수 있으면, 도롱이벌레의 둥지와 같은 협잡물이 혼입되는 일도 없다. 더욱이, 사육 대상이 유전자 재조합 누에라면, 기존의 누에의 사육 설비, 제사 공장 및 사육 기술을 그대로 이용할 수 있기 때문에, 조기 실용화도 가능하게 된다.
그런데, 상기 유전자 재조합 누에를 이용한 도롱이벌레 견사의 생산법도 실현화를 저지하는 문제가 있다. 유전자 재조합 누에의 기술을 이용하기 위해서는, 도롱이벌레 견사의 구성 단백질을 코드하는 각 유전자, 적어도 도롱이벌레 견사에 있어서의 피브로인의 주성분인 Fib H를 구성하는 유전자(Fib H 유전자)의 클로닝이 필수가 된다. 그러나, 일반적으로 Fib H는, 글리신 잔기와 알라닌 잔기의 클러스터가 반복된 아미노산 서열을 갖기 때문에, 통상의 클로닝 기술로는 전체 길이의 도롱이벌레 Fib H를 코드하는 유전자(이하, 본 명세서에서는 종종 「도롱이벌레 Fib H 유전자」라고 표기한다)를 단리, 동정하기가 어렵다. 실제로 현재까지 도롱이벌레의 피브로인 H쇄 유전자는 동정되어 있지 않다.
비특허문헌 1 : 오사키 시게요시(大崎 茂芳), 2002, 일본섬유학회지(섬유와 공업), 58: 74-78
비특허문헌 2 : Gosline J. M. et al., 1999, 202, 3295-3303
비특허문헌 3 : Tamura T. et al., 2000, Nat Biotechnol, 18: 81-84.
비특허문헌 4 : Inoue S. et al., 2000, The Journal of Biological Chemistry, 275 (51): 40517-40528.
본 발명은, 유전자 재조합 기술을 이용하여 도롱이벌레 견사를 토사하는 유전자 재조합 누에를 작출하여, 도롱이벌레 견사를 대량으로 생산하는 방법을 제공하는 것을 과제로 한다.
도롱이벌레 견사를 토사하는 유전자 재조합 누에를 작출하기 위해서는, 도롱이벌레 견사의 각 구성 성분을 코드하는 유전자의 동정 및 클로닝이 필요하지만, 도롱이벌레에 있어서는, 어느 구성 성분을 코드하는 유전자도 동정되어 있지 않다. 또한, 도롱이벌레 견사의 주성분인 도롱이벌레 Fib H 유전자의 전체 길이를 클로닝하는 것은, 상술한 것과 같이 통상 기술로는 곤란하다.
그래서, 본 발명자들은, 남방차주머니나방(Eumeta japonica)를 이용하여, 차세대 DNA 시퀀서에 의한 트랜스크립톰(transcriptome) 해석을 실시함으로써, 도롱이벌레 Fib H의 일부 아미노산 서열을 포함하는 도롱이벌레 Fib H와 비슷한 폴리펩티드를 코드하는 유전자 단편을 클로닝하는 데에 성공했다. 그 유전자 단편을 누에 유래의 Fib H를 코드하는 유전자 단편과 융합시켜 전장화(全長化)한 개변형 도롱이벌레 Fib H를 코드하는 유전자(이하, 본 명세서에서는 종종 「개변형 도롱이벌레 Fib H 유전자」라고 표기한다)를 제작했다. 또한, 그 유전자를 누에에게 도입하여 유전자 재조합 누에를 작출했다. 이 유전자 재조합 누에는, 누에 Fib H에 개변형 도롱이벌레 Fib H를 일부 포함한 Fib H와, 누에 유래의 Fib L, p25 및 세리신을 포함한 개변형 도롱이벌레 견사를 토사한다. 개변형 도롱이벌레 견사는, 누에 견사에 도롱이벌레 견사의 물성을 부여한 하이브리드 견사이다. 본 발명은 상기 연구 성과에 기초한 것이며, 이하를 제공한다.
(1) 서열 번호 1로 표시되는 아미노산 서열을 복수 개 포함하는 개변형 도롱이벌레 피브로인 H쇄를 코드하는 유전자.
(2) 상기 개변형 도롱이벌레 피브로인 H쇄가 서열 번호 5로 표시되는 아미노산 서열, 서열 번호 5로 표시되는 아미노산 서열에 있어서 하나 또는 복수 개의 아미노산이 부가, 결실 또는 치환된 아미노산 서열, 또는 서열 번호 5로 표시되는 아미노산 서열과 90% 이상의 아미노산 동일성을 갖는 아미노산 서열의 어느 것을 포함하는 (1)에 기재한 유전자.
(3) 상기 개변형 도롱이벌레 피브로인 H쇄가 서열 번호 7로 표시되는 아미노산 서열, 서열 번호 7로 표시되는 아미노산 서열에 있어서 하나 또는 복수 개의 아미노산이 부가, 결실 또는 치환된 아미노산 서열, 또는 서열 번호 7로 표시되는 아미노산 서열과 90% 이상의 아미노산 동일성을 갖는 아미노산 서열의 어느 것을 포함하는 (2)에 기재한 유전자.
(4) 누에 피브로인 H쇄를 코드하는 유전자의 일부를 포함하는 (1)∼(3)의 어느 것에 기재한 유전자.
(5) 상기 개변형 도롱이벌레 피브로인 H쇄가 서열 번호 9로 표시되는 아미노산 서열, 서열 번호 9로 표시되는 아미노산 서열에 있어서 하나 또는 복수 개의 아미노산이 부가, 결실 또는 치환된 아미노산 서열, 또는 서열 번호 9로 표시되는 아미노산 서열과 90% 이상의 아미노산 동일성을 갖는 아미노산 서열의 어느 것을 코드하는 (4)에 기재한 유전자.
(6) 견사충 유래의 후부 견사선 발현 프로모터 및 (1)∼(5)의 어느 것에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자를 누에 세포 내에서 발현 가능한 상태로 포함하고, 상기 개변형 도롱이벌레 피브로인 H쇄 유전자는, 상기 후부 견사선 발현 프로모터에 의한 직접적 또는 간접적인 발현 제어를 받도록 배치되어 있는 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
(7) 견사충 유래의 후부 견사선 발현 프로모터 및 이 프로모터의 하류 제어 하에 배치된 (1)∼(5)의 어느 것에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자를 포함하는 (6)에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
(8) 견사충 유래의 후부 견사선 발현 프로모터 및 이 프로모터의 하류 제어 하에 배치된 전사 조절 인자를 코드하는 유전자를 포함하는 제1 발현 유닛, 및 상기 전사 조절 인자의 표적 프로모터 및 이 표적 프로모터의 하류 제어 하에 배치된 개변형 도롱이벌레 피브로인 H쇄 유전자를 포함하는 제2 발현 유닛으로 구성되는 (6)에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
(9) 상기 전사 조절 인자를 코드하는 유전자가 GAL4 유전자이고, 상기 전사 조절 인자의 표적 프로모터가 UAS 프로모터인 (8)에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
(10) 상기 후부 견사선 발현 프로모터가 후부 견사선 특이적 프로모터인 (6)∼(9)의 어느 것에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
(11) 상기 후부 견사선 특이적 프로모터가 피브로인 H쇄, 피브로인 L쇄 또는 p25의 어느 한 프로모터인 (10)에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
(12) 상기 견사충이 누에인 (6)∼(11)의 어느 것에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
(13) (6)∼(12)의 어느 것에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터를 포함하는 유전자 재조합 누에.
(14) (6) 또는 (7), 또는 그것에 종속하는 (10)∼(12)의 어느 것에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터를 숙주인 누에에 도입하는 공정, 상기 발현 벡터를 포함하는 유전자 재조합 누에를 선택하는 공정을 포함하는 개변형 도롱이벌레 견사를 토사하는 유전자 재조합 누에의 작출 방법.
(15) (8) 또는 (9), 또는 그것에 종속하는 (10)∼(12)의 어느 것에 기재한 제1 발현 유닛을 갖는 유전자 재조합 누에와, (8) 또는 (9), 또는 그것에 종속하는 (10)∼(12)의 어느 것에 기재한 제2 발현 유닛을 갖는 유전자 재조합 누에를 교배시키는 공정, 및 상기 교배 후의 후대로부터 상기 제1 및 제2 발현 유닛을 갖는 유전자 재조합 누에를 선택하는 공정을 포함하는 개변형 도롱이벌레 견사를 토사하는 유전자 재조합 누에의 작출 방법.
(16) (13)에 기재한 유전자 재조합 누에에게 고치짓게 시키는 공정, 고치를 회수하는 공정 및 회수한 고치로부터 개변형 도롱이벌레 견사를 조사(繰絲)하는 공정을 포함하는 개변형 도롱이벌레 견사를 생산하는 방법.
(17) (13)에 기재한 유전자 재조합 누에가 토사한 개변형 도롱이벌레 견사.
본 명세서는 본원의 우선권의 기초가 되는 일본국 특허출원번호 2016-204592호의 개시 내용을 포함한다.
본 발명의 발현 벡터에 의하면, 상기 발현 벡터를 누에에게 도입함으로써, 개변형 도롱이벌레 견사를 토사하는 유전자 재조합 누에를 작출할 수 있다.
또한, 본 발명의 유전자 재조합 누에를 이용함으로써, 누에 견사에 도롱이벌레 견사의 물성을 인공적으로 부여한 개변형 도롱이벌레 견사를 생산할 수 있다.
도 1은 A: 남방차주머니나방의 도롱이벌레(남방차주머니나방 도롱이벌레)의 둥지의 외관도이다. B: 남방차주머니나방 도롱이벌레의 둥지를 장축 방향으로 절개하여 2분했을 때의 둥지의 내부를 도시하는 도면이다.
도 2는 누에의 견사선 및 그 각 부위에서 발현되는 피브로인 구성 단백질과 견사가 토사될 때까지를 도시하는 개념도이다.
도 2는 누에의 견사선 및 그 각 부위에서 발현되는 피브로인 구성 단백질과 견사가 토사될 때까지를 도시하는 개념도이다.
1. 개변형 도롱이벌레 피브로인 H쇄 유전자
1-1. 개요
본 발명의 제1 양태는, 남방차주머니나방 유래의 도롱이벌레 견사에 있어서의 피브로인 H쇄(Fib H)의 아미노산의 일부를 갖는 개변형 도롱이벌레 Fib H를 코드하는 유전자(개변형 도롱이벌레 Fib H 유전자)이다. 본 발명의 유전자를 누에에게 도입하여, 후부 견사선 내에서 발현시킴으로써, 그 유전자 재조합 누에로부터 남방차주머니나방 유래의 도롱이벌레 견사의 물성을 갖는 하이브리드 견사, 즉 개변형 도롱이벌레 견사를 토사시킬 수 있다.
1-2. 용어의 정의
본 명세서에서 빈번히 사용하는 이하의 용어에 관해서 다음과 같이 정의한다.
「도롱이벌레」란, 상술한 것과 같이 나비목(Lepidoptera) 주머니나방과(Psychidae)에 속하는 나방의 유충의 총칭을 말한다. 본 명세서에 있어서의 도롱이벌레는, 그것이 토사하는 도롱이벌레 견사가 후술하는 서열 번호 1로 표시되는 아미노산 서열을 포함하는 한, 그 종류는 특별히 한정하지 않는다. 본 명세서에 있어서 유전자 클로닝을 행한 Fib H는, 남방차주머니나방 유래의 Fib H이므로, 도롱이벌레는 바람직하게는 남방차주머니나방이나 차주머니나방(Eumeta minuscula)과 같은 Eumeta속의 유충, 보다 바람직하게는 남방차주머니나방의 유충이다.
본 명세서에서 「견사」란, 곤충 유래의 실이며, 곤충의 유충이나 성충이 영소(營巢), 이동, 고정, 고치짓기, 먹이 포획 등의 목적으로 토사하는 단백질제의 실을 말한다. 본 명세서에서 단순히 「견사」라고 표기한 경우에는, 원칙적으로 유래 곤충명을 특정하지 않는 널리 일반적인 견사를 의미하며, 특정 곤충 유래의 견사를 나타내는 경우에는, 누에 견사나 도롱이벌레 견사와 같이, 그 유래 생물명을 견사 앞에 붙이는 것으로 한다.
「견사선」이란, 액상 실크를 산생하고, 축적하고, 또한 분비하는 기능을 갖는 타액선의 변화된 관상(管狀) 기관이다. 견사선은, 통상 견사를 토사할 수 있는 곤충의, 주로 유충의 소화관을 따라 좌우 한 쌍으로 존재하고, 각 견사선은, 전방부, 중간부 및 후부 견사선의 3 영역으로 구성되어 있다. 도 2는 누에의 견사선을 도시한 것이지만, 도롱이벌레의 견사선도 거의 같은 형태를 갖고 있다. 상술한 것과 같이, 후부 견사선은 견사의 섬유 성분인 피브로인을 산생 및 분비한다. 또한, 중부 견사선은 피복 성분인 세리신을 산생 및 분비하며, 후부 견사선으로부터 이행하여 온 피브로인과 함께 그 내강에 축적한다.
「피브로인 H쇄(Fib H)」란, 견사에 있어서의 섬유 단백질 성분의 피브로인을 구성하는 단백질의 하나이다. 도 2에서 도시하는 것과 같이, 예컨대 누에의 피브로인은, 주로 3개의 단백질, 즉 Fib H, Fib L 및 p25로 구성되어 있다. 이 중에서 Fib H는 피브로인에 있어서의 주요 구성 단백질이며, 견사의 특성은 주로 Fib H가 가져온다. 본 명세서에 있어서 단순히「Fib H」라고 표기한 경우에는, 원칙적으로 유래 곤충은 특별히 한정하고 있지 않다. 한편, 특정 곤충 유래의 Fib H를 나타내는 경우, 누에 Fib H나 도롱이벌레 Fib H와 같이, 그 유래 생물명을 Fib H의 앞에 붙이는 것으로 한다.
본 명세서에 있어서 「개변형 Fib H」란, 인위적으로 개변된 Fib H이며, 야생형 Fib H와는 다른 아미노산 서열로 구성되어 있다. 개변형 Fib H에는, 예컨대 Fib H의 아미노산 서열에 1개 또는 복수 개의 아미노산의 부가, 결실 및/또는 치환을 도입한 변이 Fib H나, 2종 이상이 다른 곤충 유래의 Fib H의 아미노산 서열을 융합한 키메라 Fib H를 들 수 있다.
본 명세서의 「개변형 도롱이벌레 Fib H」란, 도롱이벌레 유래의 Fib H에 있어서의 개변형 Fib H이며, 야생형 도롱이벌레 Fib H의 아미노산 서열에 1개 또는 복수 개의 아미노산의 부가, 결실 및/또는 치환을 도입한 변이 Fib H 및/또는 2종이상의 다른 곤충 유래의 Fib H의 아미노산 서열을 융합한 키메라 Fib H가 해당된다.
본 명세서에 있어서 「피브로인 H쇄(Fib H) 유전자」란, 상기 Fib H를 코드하는 유전자를 말한다. Fib H와 마찬가지로, 단순히 「Fib H 유전자」라고 표기한 경우, 본 명세서에서는 원칙적으로 유래 곤충은 묻지 않는다. 한편, 특정 곤충 유래의 Fib H 유전자를 나타내는 경우, 누에 Fib H 유전자나 도롱이벌레 Fib H 유전자와 같이, 그 유래 생물명을 Fib H의 앞에 붙이는 것으로 한다.
또한, 본 명세서에 있어서 「개변형 Fib H 유전자」란, 상기 개변형 Fib H를 코드하는 유전자를 말한다. 따라서, 「개변형 도롱이벌레 Fib H 유전자」란, 도롱이벌레 유래의 Fib H에 있어서의 개변형 Fib H를 코드하는 유전자이다. 본 양태에서는 이 개변형 도롱이벌레 Fib H 유전자가 대상이 된다.
본 명세서에 있어서 「개변형 도롱이벌레 견사」란, 상기 개변형 Fib H 유전자를 누에의 후부 견사선에서 발현 가능한 상태로 누에에게 도입하고, 그 결과 얻어진 유전자 재조합 누에가 토사하는 견사를 말한다. 개변형 도롱이벌레 견사는, Fib H 이외에, 전부 누에 유래의 견사 성분으로 구성되어 있다. 즉 개변형 도롱이벌레 견사에 있어서의 Fib H는, 내재성(內在性) 누에 Fib H와 개변형 도롱이벌레 Fib H가 혼재하는 하이브리드 Fib H로 되어 있다. 따라서, 개변형 도롱이벌레 견사는, 말하자면 누에 견사와 개변형 도롱이벌레 견사의 하이브리드 견사이다. 하이브리드 견사는, 누에 Fib H에 개변형 도롱이벌레 Fib H가 혼재함으로써, 도롱이벌레 견사의 물성을 갖고 있다.
1-3. 구성
일반적으로 Fib H는, 그 아미노산 서열 내에 반복 단위를 1개 또는 복수 개 포함한다. 본 명세서에 있어서 「반복 단위」란, 글리신 잔기(G) 및 알라닌 잔기(A)를 다수 포함하고, Fib H의 아미노산 서열 내에서 1회 또는 복수 회 출현하는 아미노산 서열이다. 본 발명의 개변형 도롱이벌레 Fib H 유전자가 코드하는 개변형 도롱이벌레 Fib H도, 그 아미노산 서열 내에 반복 단위를 1개 또는 복수 개 포함하고 있다.
개변형 도롱이벌레 Fib H는, 「반복 단위」로서, 서열 번호 5로 표시되는 아미노산 서열, 서열 번호 5로 표시되는 아미노산 서열에 있어서 하나 또는 복수 개의 아미노산이 부가, 결실 또는 치환된 아미노산 서열, 또는 서열 번호 5로 표시되는 아미노산 서열에 대하여 90% 이상, 93% 이상, 95% 이상, 97% 이상, 98% 이상 또는 99% 이상의 아미노산 동일성을 갖는 아미노산 서열을 포함한다. 서열 번호 5로 표시되는 아미노산 서열은, 남방차주머니나방의 야생형 도롱이벌레 Fib H의 일부를 포함하는 아미노산 서열이다. 본 명세서에 있어서 「복수 개」란, 2∼10개, 2∼8개, 2∼6개, 2∼5개, 2∼4개 또는 2∼3개를 말한다. 또한, 상기 아미노산의 치환은 보존적 아미노산 치환인 것이 바람직하다. 보존적 아미노산 치환이면, 야생형 단백질과 실질적으로 동등한 구조 또는 성질을 가질 수 있기 때문이다. 보존적 아미노산이란, 동일한 아미노산군으로 분류되는 아미노산끼리의 관계를 말한다. 상기 아미노산군에는, 비극성 아미노산군(글리신, 알라닌, 페닐알라닌, 발린, 류신, 이소류신, 메티오닌, 프롤린, 트립토판), 극성 아미노산군(비극성 아미노산 이외의 아미노산), 하전 아미노산군(산성 아미노산(아스파라긴산, 글루타민산) 및 염기성 아미노산군(아르기닌, 히스티딘, 리신)), 비하전 아미노산군(하전 아미노산 이외의 아미노산), 방향족 아미노산군(페닐알라닌, 트립토판, 티로신), 분기쇄 아미노산군(류신, 이소류신, 발린) 및 지방족 아미노산군(글리신, 알라닌, 류신, 이소류신, 발린) 등이 알려져 있다. 또한, 본 명세서에 있어서 「아미노산 동일성」이란, 2개의 폴리펩티드의 아미노산 서열을 정렬(얼라인먼트)하고, 필요에 따라서 어느 한 아미노산 서열에 갭을 도입하여, 양자의 아미노산 일치도가 가장 높아지도록 했을 때에, 한쪽의 폴리펩티드의 전체 아미노산의 수에 대한 다른 쪽 폴리펩티드의 동일 아미노산의 비율(%)을 말한다. 이 아미노산 동일성의 %는, 상동성 검색 프로그램 BLAST(기본 로컬 정렬 검색 툴; Altschul, S. F. et al, J. Mol. Biol., 215, 403-410, 1990) 검색 등의 공지된 프로그램을 이용함으로써 용이하게 결정할 수 있다.
상기 반복 단위를 코드하는 폴리뉴클레오티드의 구체적인 염기 서열로서, 예컨대 서열 번호 5로 표시되는 아미노산 서열을 코드하는 서열 번호 6으로 표시되는 염기 서열을 들 수 있다.
본 발명의 개변형 도롱이벌레 Fib H 유전자가 코드하는 개변형 도롱이벌레 Fib H는, 상기 반복 단위 내에 코어 서열을 복수 개, 예컨대 2개 이상, 바람직하게는 3개 이상 포함하고 있다. 본 명세서에 있어서 「코어 서열」이란, 반복 단위 내에 있어서, 또 복수 회 반복 출현하는 십수 아미노산으로 이루어지는 서열을 말한다.
개변형 도롱이벌레 Fib H에 있어서의 「코어 서열」이란, 예컨대 서열 번호 1로 표시되는 13개의 아미노산으로 구성되는 아미노산 서열(GAGAGAGSGAGAG)을 들 수 있다. 이 아미노산 서열은, 남방차주머니나방의 야생형 도롱이벌레 Fib H에 있어서의 부분 아미노산 서열이다. 상술한 서열 번호 5로 표시되는 아미노산 서열로 이루어지는 반복 단위는 3개의 코어 서열을 포함하고 있다.
상기 코어 서열을 코드하는 폴리뉴클레오티드의 구체적인 염기 서열로서, 예컨대 서열 번호 1로 표시되는 아미노산 서열을 코드하는 서열 번호 2, 3 및 4로 표시되는 염기 서열을 들 수 있다.
본 발명의 유전자가 코드하는 개변형 도롱이벌레 Fib H는, 또한, 서열 번호 7로 표시되는 아미노산 서열, 서열 번호 7로 표시되는 아미노산 서열에 있어서 하나 또는 복수 개의 아미노산이 부가, 결실 또는 치환된 아미노산 서열, 또는 서열 번호 7로 표시되는 아미노산 서열과 90% 이상의 아미노산 동일성을 갖는 아미노산 서열을 포함할 수 있다. 서열 번호 7로 표시되는 아미노산 서열은, 남방차주머니나방의 야생형 도롱이벌레 Fib H의 일부를 포함하는 아미노산 서열이다. 또한, 서열 번호 7로 표시되는 아미노산 서열에서는 상기 반복 단위가 1개 포함되어 있지만, 이 반복 단위는 필요에 따라서 2개 이상으로 늘릴 수도 있다. 서열 번호 7로 표시되는 아미노산 서열을 코드하는 구체적인 염기 서열로서, 예컨대 서열 번호 8로 표시되는 염기 서열을 들 수 있다.
본 발명의 유전자가 코드하는 개변형 도롱이벌레 Fib H는, 다른 곤충의 Fib H와의 키메라 Fib H라도 좋다. 예컨대, 도롱이벌레 Fib H와 누에 Fib H의 키메라 Fib H 등이다. 구체예로서는, 서열 번호 9로 표시되는 아미노산 서열로 이루어지는 남방차주머니나방의 도롱이벌레 Fib H와 누에 Fib H의 키메라 Fib H를 들 수 있다. 이 키메라 Fib H는, 1위∼153위, 466위∼524위가 누에 Fib H 유래의 아미노산 서열이고, 156위∼463위가 남방차주머니나방의 도롱이벌레 Fib H 유래의 아미노산 서열을 포함하고 있다. 또한, 서열 번호 9로 표시되는 아미노산 서열에 있어서 하나 또는 복수 개의 아미노산이 부가, 결실 또는 치환된 아미노산 서열, 또는 서열 번호 9로 표시되는 아미노산 서열과 90% 이상의 아미노산 동일성을 갖는 아미노산 서열로 이루어지는 Fib H라도 좋다. 또한, 서열 번호 9로 표시되는 아미노산 서열에서는 상기 반복 단위가 1개 포함되어 있지만, 이 반복 단위는 필요에 따라서 2개 이상으로 늘릴 수도 있다. 서열 번호 9로 표시되는 아미노산 서열을 코드하는 구체적인 염기 서열로서, 예컨대 서열 번호 10으로 표시되는 염기 서열을 들 수 있다.
또한, 본 발명의 개변형 도롱이벌레 Fib H는, 필요에 따라서 외인성(外因性)의 시그널 펩티드를 N 말단 측에 가질 수 있다. 「시그널 펩티드」란, 유전자 발현에 의해서 생합성된 단백질을 세포 밖에 분비시킬 때에 필요하게 되는 세포 밖 이행 시그널이다. 시그널 펩티드는, 번역 후, 세포 밖으로 분비되기 전에 시그널 펩티다아제에 의해서 절단 제거된다. 시그널 펩티드는, N 말단 측에 Lys나 Arg와 같은 플러스 전하를 갖는 아미노산을 두고, 그것에 이어서 Ala, Leu, Val, Ile, Val, 및 Phe와 같은 소수성이 높은 아미노산 서열을 두고 있다. 분비성 단백질의 경우, 통상 그 N 말단 측에는 내인성의 시그널 펩티드를 갖는다. 따라서, 본 양태의 외인성 유전자 발현 벡터에 있어서 개변형 도롱이벌레 Fib H가 그 N 말단 측에 내인성 시그널 펩티드를 갖는 경우에는, 이 외인성 시그널 펩티드는 불필요하다. 예컨대, 상기 서열 번호 9로 표시되는 아미노산 서열로 구성되는 도롱이벌레 Fib H와 누에 Fib H의 키메라 Fib H에서는, 1위∼21위의 아미노산이 누에 Fib H 유래의 내인성 시그널 펩티드에 상당하기 때문에, 외인성 시그널 펩티드는 필요하지 않다. 한편, 개변형 도롱이벌레 Fib H가 시그널 펩티드를 갖지 않는 경우에는, 그 N 말단에 외인성 시그널 펩티드를 배치하면 된다. 또한, 시그널 펩티드의 C 말단 측에는, 시그널 펩티드의 절단과 분비를 촉진하는 시그널 서열 후 삽입 서열 및/또는 융합 단백질로부터 시그널 펩티드를 절단하는 시그널 펩티다아제 인식 부위를 포함하는 아미노산 서열을 가질 수도 있다. 시그널 펩티드의 아미노산 서열은 특별히 한정되지는 않는다. 통상은 3∼60 아미노산의 범위 내에 있으면 된다.
시그널 펩티드를 코드하는 시그널 펩티드 DNA는, 한정되지는 않지만, 서열 번호 11로 표시되는 아미노산 서열을 포함하는 누에의 세리신 1 시그널 펩티드를 코드하는 시그널 펩티드 DNA(예컨대, 서열 번호 12로 표시되는 염기 서열을 포함하는 DNA), 서열 번호 13으로 표시되는 아미노산 서열을 포함하는 누에의 세리신 2 시그널 펩티드를 코드하는 시그널 펩티드 DNA(예컨대, 서열 번호 14로 표시되는 염기 서열을 포함하는 DNA), 서열 번호 15로 표시되는 아미노산 서열을 포함하는 누에의 세리신 3 시그널 펩티드를 코드하는 시그널 펩티드 DNA(예컨대, 서열 번호 16으로 표시되는 염기 서열을 포함하는 DNA)를 들 수 있다.
2. 개변형 도롱이벌레 Fib H 유전자 발현 벡터
2-1. 개요
본 발명의 제2 양태는, 개변형 도롱이벌레 Fib H 유전자 발현 벡터이다. 본 발명의 발현 벡터는, 제1 양태에 기재한 개변형 도롱이벌레 Fib H 유전자를 누에의 후부 견사선 내에서 발현 가능한 상태로 포함하고 있다. 본 발명의 발현 벡터를 누에에게 도입함으로써, 유전자 재조합 누에로부터 개변형 도롱이벌레 견사를 얻을 수 있다.
2-2. 구성
2-2-1. 개변형 도롱이벌레 Fib H 유전자 발현 벡터의 구성 요소
본 명세서에서 「발현 벡터」란, 목적으로 하는 단백질을 코드하는 유전자를 포함하고, 그 유전자의 발현을 제어할 수 있는 발현 단위를 말한다.
본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터는, 숙주인 누에의 후부 견사선 내에서 개변형 도롱이벌레 Fib H 유전자를 발현할 수 있도록 구성되어 있다.
개변형 도롱이벌레 Fib H 유전자 발현 벡터의 모핵 벡터에는 다양한 벡터를 이용할 수 있다. 예컨대 플라스미드 혹은 박미드(Bacmid)와 같은 자율 복제 가능한 발현 벡터, 바이러스 벡터, 또는 염색체 중에 상동 또는 비상동 재조합 가능한 발현 벡터 혹은 그것을 숙주의 염색체 중에 삽입한 염색체의 일부를 들 수 있다. 또한, 대장균, 고초균 또는 효모 내에서도 복제 가능한 셔틀 벡터를 이용할 수도 있다.
개변형 도롱이벌레 Fib H 유전자 발현 벡터는, 후부 견사선 발현 프로모터 및 개변형 도롱이벌레 Fib H 유전자를 필수 구성 요소로서 포함한다. 또한, 표지 유전자, 트랜스포존의 역위 말단 반복 서열, 5' UTR, 3' UTR, 터미네이터, 인핸서 및 인슐레이터 등을 선택 구성 요소로서 포함한다. 또한, 개변형 도롱이벌레 Fib H 유전자 발현 벡터가, 후술하는 제1 발현 유닛과 제2 발현 유닛의 2개의 유전자 발현 유닛으로 구성되는 경우에는, 전사 조절 인자의 유전자 및 이 전사 조절 인자의 표적 프로모터를 필수 구성 요소로서 포함한다. 이하, 본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서의 각 구성 요소에 관해서 구체적으로 설명한다.
(1) 후부 견사선 발현 프로모터
「후부 견사선 발현 프로모터」란, 본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 숙주인 누에에게 도입했을 때에, 누에의 후부 견사선에 있어서, 하류에 배치된 유전자의 발현을 제어할 수 있는 프로모터이다.
후부 견사선 발현 프로모터는, 누에의 후부 견사선에서 작동 가능한 프로모터라면 어느 유전자의 프로모터라도 좋다. 「작동 가능」이란, 하류에 배치된 유전자의 발현을 제어할 수 있는 것을 말한다. 후부 견사선 발현 프로모터에는, 예컨대 후부 견사선 특이적 프로모터, 유비쿼터스하게 발현 가능한 전신성 프로모터, 구성적 활성형 프로모터 혹은 시기 특이적 활성형 프로모터 또는 발현 유도형 프로모터 등을 들 수 있다. 바람직하게는 후부 견사선 특이적 프로모터이다. 그 중에서도 견사충의 후부 견사선에서 특이적이면서 또한 대량으로 발현되는 단백질을 코드하는 유전자의 프로모터는 바람직하며, 또한 종령 후기부터 전용 기간에 후부 견사선에서 특이적으로 활성화하는 종령 후기 후부 견사선 특이적 활성형 프로모터는 특히 바람직하다. 예컨대, 피브로인 구성 단백질인 Fib H, Fib L 또는 p25의 각 유전자 프로모터(본 명세서에서는 각각 「Fib H 프로모터」, 「Fib L 프로모터」 또는 「p25 프로모터」라고 부른다)는, 본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서의 후부 견사선 발현 프로모터로서 적합하다.
후부 견사선 발현 프로모터의 유래 생물종, 즉 프로모터의 도너는, 그 프로모터가 숙주인 누에의 세포 내에서 작동할 수 있는 한 특별히 한정하지는 않는다. 일반적으로, 후부 견사선 특이적으로 발현하는 Fib H, Fib L 또는 p25의 각 프로모터의 염기 서열은, 견사충 사이에서 진화적으로 매우 잘 보존되어 있다(Sezutsu H., et al., 2009, Journal of Insect Biotechnology and Sericology, 78: 1-10). 그러므로, 본원 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서의 후부 견사선 발현 프로모터의 도너가 누에가 아니었다고 해도, 그 후부 견사선 발현 프로모터는 누에의 후부 견사선에서 작동할 수 있다.
또한, 본 명세서에 있어서 「견사충」이란, 견사선을 가지고, 견사를 토사할 수 있는 곤충의 총칭을 말한다. 통상은 유충기에 영소, 고치짓기 또는 이동을 위해서 토사할 수 있는 종을 가리킨다. 구체적으로는 나비목, 벌목, 풀잠자리목, 날도래목에 속하는 종이다. 바람직하게는 다량의 견사를 토사할 수 있는 나비목에 속하는 종이다. 누에나방과(Bombycidae), 산누에나방과(Saturniidae), 왕물결나방과(Brahmaeidae), 멍키나방과(Eupterotidae), 솔나방과(Lasiocampidae), 주머니나방과(Psychidae), 불나방과(Archtiidae), 밤나방과(Noctuidae) 등에 속하는 종은 본 명세서의 견사충으로서 바람직하다. 누에나방(Bombyx)속, 가중나무고치나방(Samia)속, 참나무산누에나방(Antheraea)속, 낚시줄누에나방(Saturnia)속, 산누에나방(Attacus)속, 유리산누에나방(Rhodinia)속에 속하는 종, 구체적으로는 누에, 멧누에나방(Bombyx mandarina), 가중나무고치나방(Samia cynthia; 에리잠(Samia cynthia ricini) 및 가중나무고치나방과 에리잠의 교배종을 포함한다), 산누에나방(Antheraea yamamai), 작잠(Antheraea pernyi), 밤나무산누에나방(Saturnia japonica), 옥색긴꼬리산누에나방(Actias gnoma) 등은 특히 바람직하다. 따라서, 본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서의 후부 견사선 발현 프로모터의 유래 생물로서, 바람직하게는 숙주가 되는 누에와 분류학상 동일한 나비목에 속하는 종, 보다 바람직하게는 동일한 누에나방과에 속하는 종, 더욱 바람직하게는 멧누에나방과 같은 같은 속에 속하는 종이다. 가장 바람직한 유래 생물은 동일종, 즉 누에이다.
후부 견사선 특이적 프로모터의 구체예로서, 서열 번호 17로 표시되는 염기 서열을 포함하는 누에 Fib H 프로모터, 서열 번호 18로 표시되는 염기 서열을 포함하는 멧누에 Fib H 프로모터, 서열 번호 19로 표시되는 염기 서열을 포함하는 누에 Fib L 프로모터, 서열 번호 20으로 표시되는 염기 서열을 포함하는 멧누에 Fib L 프로모터 및 서열 번호 21로 표시되는 염기 서열을 포함하는 누에 p25 프로모터 등을 이용할 수 있다.
(2) 개변형 도롱이벌레 Fib H 유전자
개변형 도롱이벌레 Fib H 유전자는, 본 발명에 있어서의 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서, 발현해야 할 목적의 단백질을 코드하는 유전자이다. 이 유전자의 상세한 점에 관해서는 제1 양태에 기재했으므로, 여기서의 구체적인 설명은 생략한다.
본원 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서, 개변형 도롱이벌레 Fib H 유전자는, 상기 후부 견사선 발현 프로모터의 직접적 또는 간접적 제어 하에 배치되어 연결되어 있다. 여기서 말하는 「직접적 제어 하」란, 후부 견사선 발현 프로모터의 하류에 개변형 도롱이벌레 Fib H 유전자가 배치되어, 후부 견사선 발현 프로모터에 의해서 직접 그 발현이 제어되고 있음을 말한다. 또한 「간접적 제어 하」란, 후부 견사선 발현 프로모터에 의한 유전자 발현 제어가 다른 유전자 발현 활성 등을 통해 행해지는 것을 말한다. 예컨대, 개변형 도롱이벌레 Fib H 유전자 발현 벡터가 후술하는 2개의 발현 유닛으로 구성되는 경우라면, 후부 견사선 발현 프로모터에 의한 개변형 도롱이벌레 Fib H 유전자의 발현 제어는, 전사 조절 인자를 코드하는 유전자의 발현 및 그 전사 조절 인자의 표적 프로모터의 활성을 통해 이루어진다.
(3) 표지 유전자
「표지 유전자」는, 선발 마커라고도 불리는 표지 단백질을 코드하는 유전자이다. 「표지 단백질」이란, 그 활성에 기초하여 표지 유전자의 발현 유무를 판별할 수 있는 폴리펩티드를 말한다. 표지 유전자는, 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 보유하는 숙주, 즉 형질 전환체를 판별할 목적 및/또는 개변형 도롱이벌레 Fib H 유전자 발현 벡터로부터 발현된 목적의 단백질을 모니터링할 목적으로 이용된다. 어느 목적인 경우에도, 표지 단백질의 활성에 기초하여 형질 전환체의 판별이나 개변형 도롱이벌레 Fib H의 발현량을 모니터링할 수 있다. 여기서 「활성에 기초하여」란, 활성의 검출 결과에 기초하여라고 하는 의미이다. 활성의 검출은, 표지 단백질의 활성 그 자체를 직접적으로 검출하는 것이라도 좋고, 색소와 같은 표지 단백질의 활성에 의해서 발생하는 대사물을 통해 간접적으로 검출하는 것이라도 좋다. 검출은, 생물학적 검출(항체, 압타머 등의 펩티드나 핵산의 결합에 의한 검출을 포함한다), 화학적 검출(효소 반응적 검출을 포함한다), 물리적 검출(행동 분석적 검출을 포함한다), 또는 검출자의 감각적 검출(시각, 촉각, 후각, 청각, 미각에 의한 검출을 포함한다)의 어느 것이라도 좋다.
표지 유전자가 코드하는 표지 단백질의 종류는, 해당 분야에서 공지된 방법에 의해 그 활성을 검출할 수 있는 한, 특별히 한정되지는 않는다. 바람직하게는 검출에 있어서 형질 전환체에 대한 침습성(侵襲性)이 낮은 표지 단백질이다. 예컨대 태그 펩티드, 형광 단백질, 색소 합성 단백질, 발광 단백질, 외부 분비 단백질, 외부 형태를 제어하는 단백질 등을 들 수 있다. 형광 단백질, 색소 합성 단백질, 발광 단백질, 외부 분비 단백질은, 형질 전환체의 외부 형태를 변화시키는 일 없이 특정 조건 하에서 시각적으로 검출 가능하므로, 형질 전환체에 대한 침습성이 매우 낮고, 또한 형질 전환체의 판별 및 선발이 용이하기 때문에 특히 적합하다.
「태그 펩티드」는, 단백질을 표지화할 수 있는 십수 아미노산∼수십 아미노산으로 이루어지는 짧은 펩티드이며, 단백질의 검출용, 정제용으로서 이용된다. 통상은, 표지해야 할 단백질을 코드하는 유전자(본 명세서에서는 개변형 도롱이벌레 Fib H 유전자)의 5' 말단 측 또는 3' 말단 측에 태그 펩티드를 코드하는 염기 서열을 연결하여, 태그 펩티드와의 융합 단백질로서 발현시킴으로써 표지화한다. 태그 펩티드는 해당 분야에서 다양한 종류가 개발되어 있는데, 어느 태그 펩티드를 사용하여도 좋다. 태그 펩티드의 구체예로서 FLAG, HA, His 및 myc 등을 들 수 있다.
「형광 단백질」은, 특정 파장의 여기광을 조사했을 때에 특정 파장의 형광을 발하는 단백질을 말한다. 천연형 및 비천연형의 어느 것이라도 좋다. 또한, 여기 파장, 형광 파장도 특별히 한정하지는 않는다. 구체적으로는, 예컨대 CFP, RFP, DsRed(3xP3-DsRed와 같은 파생물을 포함한다), YFP, PE, PerCP, APC, GFP(EGFP, 3xP3-EGFP 등의 파생물을 포함한다) 등을 들 수 있다.
「색소 합성 단백질」은 색소의 생합성에 관여하는 단백질이며, 통상은 효소이다. 여기서 말하는 「색소」란, 형질 전환체에 색소를 부여할 수 있는 저분자 화합물 또는 펩티드이며, 그 종류는 상관없다. 바람직하게는 개체의 외부 색채로서 나타나는 색소이다. 예컨대, 멜라닌계 색소(도파민-멜라닌을 포함한다), 옴모크롬계 색소 또는 프테리딘계 색소를 들 수 있다.
본 명세서에서 「발광 단백질」이란, 여기광을 필요로 하지 않고서 발광할 수 있는 기질 단백질 또는 그 기질 단백질의 발광을 촉매하는 효소를 말한다. 예컨대, 기질 단백질로서의 루시페린 또는 에쿠오린, 효소로서의 루시페라아제를 들 수 있다.
본 명세서에서 「외부 분비 단백질」이란, 세포 밖 또는 체외에 분비되는 단백질이며, 외분비성(外分泌性) 효소 등이 해당된다. 외분비성 효소에는, 블라스티사이딘과 같은 약제의 분해 또는 불활화(不活化)에 기여하고, 숙주에게 약제 내성을 부여하는 효소 외에, 소화 효소가 해당된다.
표지 유전자는, 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서 개변형 도롱이벌레 Fib H 유전자에 연결한 상태에서, 또는 개변형 도롱이벌레 Fib H 유전자와는 독립적으로 프로모터의 하류에 발현 가능한 상태로 배치된다.
(4) 트랜스포존의 역위 말단 반복 서열
「트랜스포존의 역위 말단 반복 서열(ITRs: inverted terminal repeat sequence)」은, 본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 게놈 DNA에 상동 재조합 가능한 발현 벡터로 하는 경우에 포함될 수 있는 선택 구성 요소이다. 역위 말단 반복 서열은 통상은 2개 1조로 사용되며, 트랜스포존으로서는 piggyBac, mariner, minos 등을 이용할 수 있다(Shimizu, K. et al., 2000, Insect Mol. Biol., 9, 277-281; Wang W. et al.,2000, Insect Mol Biol 9(2): 145-55).
(5) 5' UTR 및 3' UTR
「5' UTR(5' 미번역된 영역) 및 3' UTR(3' 미번역된 영역)」는, 모두 그 자신이 단백질이나 그 단편, 또는 기능성 핵산을 코드하지 않는 비번역 영역으로 이루어지는 폴리뉴클레오티드이다. 각 UTR를 구성하는 염기 서열은, 한정되지는 않지만, Fib H 유전자에 유래하는 5' UTR 및 3' UTR인 것이 바람직하다. 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서 5' UTR는, 상기 Fib H 유전자의 개시 코돈의 상류(5' 말단 측)에 배치되고, 3' UTR는, Fib H 유전자의 종결 코돈의 하류(3' 말단 측)에 배치된다. 또한, 3' UTR는 폴리A 시그널을 포함할 수 있다.
(6) 터미네이터
「터미네이터」는, 본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서, 개변형 도롱이벌레 Fib H 유전자의 3' 말단 측, 바람직하게는 종결 코돈의 하류에 배치되는 염기 서열이며, 개변형 도롱이벌레 Fib H 유전자의 전사를 종결할 수 있는 염기 서열로 구성되어 있다. 예컨대, 서열 번호 22로 표시되는 염기 서열로 이루어지는 hsp70 터미네이터나 서열 번호 23으로 표시되는 염기 서열로 이루어지는 SV40 터미네이터를 들 수 있다.
(7) 인핸서
「인핸서」는, 본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터에 있어서, 부위 특이적 프로모터의 제어에 의한 개변형 도롱이벌레 Fib H 유전자의 발현을 더욱 증강할 수 있는 염기 서열로 이루어진다.
(8) 인슐레이터
「인슐레이터」는, 주위 염색체의 크로마틴에 의한 영향을 받지 않고서, 그 서열에 끼워진 유전자의 전사를 안정적으로 제어할 수 있는 염기 서열이다. 예컨대, 닭의 cHS4 서열이나 초파리의 gypsy 서열 등을 들 수 있다.
(9) 전사 조절 인자의 유전자
「전사 조절 인자의 유전자」는 후술하는 제1 발현 유닛의 필수 구성 요소이다. 본 명세서에서 말하는 「전사 조절 인자」란, 후술하는 표적 프로모터에 결합하여 그 표적 프로모터를 활성화할 수 있는 단백질 인자를 말한다. 예컨대, 효모의 갈락토오스 대사 활성화 단백질인 GAL4 단백질 및 테트라사이클린 제어성 트랜스 활성화 인자인 tTA 및 그 변이체 등을 들 수 있다.
(10) 전사 조절 인자의 표적 프로모터
「전사 조절 인자의 표적 프로모터」란, 후술하는 제2 발현 유닛의 필수 요소이며, 제1 발현 유닛에 코드된 전사 조절 인자가 결합함으로써, 그 제어 하에 있는 유전자 발현을 활성화할 수 있는 프로모터를 말한다. 상기 전사 조절 인자와 그 표적 프로모터는, 상기 전사 조절 인자와는 대응 관계에 있으며, 통상은 전사 조절 인자가 정해지면, 그 표적 프로모터도 필연적으로 정해진다. 예컨대 전사 조절 인자가 GAL4 단백질인 경우에는, UAS(상류 활성 서열)가 사용된다.
2-2-2. 개변형 도롱이벌레 Fib H 유전자 발현 벡터의 유닛 구성
본 발명의 개변형 도롱이벌레 Fib H 유전자 발현 벡터는, 하나의 발현 유닛으로 구성되는 경우와, 2개의 발현 유닛으로 구성되는 경우가 있다. 이하, 각각의 경우에 관해서 설명한다.
(1) 하나의 발현 유닛으로 구성되는 경우
하나의 발현 유닛으로 구성되는 경우, 개변형 도롱이벌레 Fib H 유전자 발현 벡터는, 누에 세포 내에서 개변형 도롱이벌레 Fib H 유전자를 발현시키는 데에 있어서 필요한 모든 구성 요소를 하나의 벡터 내에 포함하고 있다. 구체적으로는, 필수 구성 요소인 후부 견사선 발현 프로모터 및 그 프로모터의 제어 하에 배치된 개변형 도롱이벌레 Fib H 유전자를 포함한다.
개변형 도롱이벌레 Fib H 유전자 발현 벡터는, 하나의 프로모터 제어 하에 개변형 도롱이벌레 Fib H 유전자를 2 이상 포함하고 있어도 좋다.
개변형 도롱이벌레 Fib H 유전자 발현 벡터가 하나의 유전자 발현 유닛으로 구성되는 경우, 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 누에에게 도입하는 것만으로, 누에 후부 견사선 내에서 개변형 도롱이벌레 Fib H 유전자를 발현시킬 수 있다.
(2) 2개의 발현 유닛으로 구성되는 경우
개변형 도롱이벌레 Fib H 유전자 발현 벡터가 제1 발현 유닛 및 제2 발현 유닛의 2개의 유전자 발현 유닛으로 구성되는 경우, 개변형 도롱이벌레 Fib H 유전자의 발현에 필수적인 구성 요소는 각 유닛에 분할되어 있다. 본 구성에서는, 제1 및 제2 발현 유닛이 숙주 세포 내에 병존하여 비로소 하나의 개변형 도롱이벌레 Fib H 유전자 발현 벡터로서 기능한다.
이 기전을 구체적으로 설명하면, 제1 및 제2 발현 유닛이 숙주 세포 내에 병존할 때, 동일 세포 내에서 제1 발현 유닛에 포함되는 후부 견사선 발현 프로모터의 활성화에 의해 제1 발현 유닛으로부터 전사 조절 인자가 발현된다. 그 전사 조절 인자가 제2 발현 유닛의 표적 프로모터에 결합하여 활성화함으로써, 목적의 개변형 도롱이벌레 Fib H 유전자를 발현할 수 있다. 제1 및 제2 발현 유닛은 이하의 구성을 갖는다.
「제1 발현 유닛」은, 후부 견사선 발현 프로모터와 그 프로모터 제어 하에 배치된 전사 조절 인자의 유전자를 포함하여 이루어진다. 이 때, 하나의 프로모터 제어 하에 동일의 또는 다른 2 이상의 전사 조절 인자를 포함하고 있어도 좋다.
제1 발현 유닛은, 후부 견사선 발현 프로모터와 그 제어 하에 있는 전사 조절 인자의 유전자로 이루어지는 조를 2조 이상 가질 수도 있다. 이 경우, 각 조는 동일의 조라도 또는 다른 조라도 좋다. 예컨대, 제1 발현 유닛이 Fib H 프로모터와 GAL4 유전자로 이루어지는 조 및 Fib L 프로모터와 GAL4 유전자로 이루어지는 조를 포함하는 경우를 들 수 있다.
제1 발현 유닛이 포함하는 프로모터 및 전사 조절 인자는, 기지의 후부 견사선 발현 프로모터나 전사 조절 인자를 이용할 수 있다. 따라서, 제1 발현 유닛은, 후부 견사선 발현 프로모터와 전사 조절 인자를 포함하는 기존의 유전자 발현 벡터를 재이용할 수도 있다.
「제2 발현 유닛」은, 상기 제1 발현 유닛에 코드된 전사 조절 인자의 표적 프로모터와 그 표적 프로모터의 제어 하에 배치된 개변형 도롱이벌레 Fib H 유전자를 포함한다. 제2 발현 유닛에 포함되는 표적 프로모터는, 제1 발현 유닛에 코드되는 전사 조절 인자에 의해서 활성화되는 프로모터이다. 즉, 제1 발현 유닛에 코드된 전사 조절 인자에 의해서 제2 발현 유닛에 포함되는 표적 프로모터는, 원칙적으로 일의적으로 결정된다. 예컨대, 표적 프로모터 제1 발현 유닛에 포함되는 전사 조절 인자의 유전자가 GAL4 유전자이면, 제2 발현 유닛의 GAL4 표적 프로모터는 UAS가 된다.
제2 발현 유닛은, 하나의 표적 프로모터 제어 하에 동일의 또는 서열이 다른 개변형 도롱이벌레 Fib H 유전자를 2 이상 포함하고 있어도 좋다.
또한, 제2 발현 유닛은, 표적 프로모터와 그 제어 하에 있는 개변형 도롱이벌레 Fib H 유전자로 이루어지는 조를 2조 이상 갖고 있어도 좋다. 이 경우, 각 조는 동일의 조라도 또는 다른 조라도 좋다.
또한, 제2 발현 유닛은, 개변형 도롱이벌레 Fib H 유전자를 포함하는 동일의 또는 다른 2 이상의 유닛으로 구성되어 있어도 좋다. 이 경우, 하나의 제1 발현 유닛으로부터 발현된 전사 조절 인자는, 복수의 제2 발현 유닛의 표적 프로모터를 활성화함으로써, 각각의 제2 발현 유닛에 포함되는 개변형 도롱이벌레 Fib H 유전자를 발현할 수 있다.
본 구성의 개변형 도롱이벌레 Fib H 유전자 발현 벡터는, 제1 발현 유닛에 코드된 전사 조절 인자를 통해 제2 발현 유닛의 개변형 도롱이벌레 Fib H 유전자의 발현을 증폭시킬 수 있다. 따라서, 개변형 도롱이벌레 Fib H 유전자를 숙주 세포 내에서 과잉 발현시키는 데에 있어서 적합하다.
3. 유전자 재조합 누에
3-1. 개요
본 발명의 제3 양태는 유전자 재조합 누에이다. 본 양태의 유전자 재조합 누에는, 상기 제2 양태의 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 포함하는 형질 전환체이다. 본 발명의 유전자 재조합 누에가 토사하는 견사는, 누에 견사를 베이스로 하여 개변형 도롱이벌레 Fib H를 포함하는 개변형 도롱이벌레 견사이다. 따라서, 본 발명의 유전자 재조합 누에에게 고치짓기를 시킴으로써 개변형 도롱이벌레 견사를 양산하는 것이 가능하게 된다.
3-2. 구성
본 발명의 유전자 재조합 누에는, 상기 제2 양태에 기재한 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 세포 내에 포함한다. 개변형 도롱이벌레 Fib H 유전자 발현 벡터의 구성에 관해서는 제2 양태에서 상세히 설명했으므로, 그 설명을 생략하고, 여기서는 본 양태의 유전자 재조합 누에 특유의 구성에 관해서 설명한다.
유전자 재조합 누에에 있어서, 제2 양태에 기재한 개변형 도롱이벌레 Fib H 유전자 발현 벡터는, 누에 세포 내에 일과적(一過的)으로 존재하여도 좋고, 또한 염색체 중에 도입된 상태 등으로 안정적이면서 또한 계속적으로 존재하여도 좋다. 통상은 안정적이면서 또한 계속적으로 존재하는 것이 바람직하다.
유전자 재조합 누에는, 제2 양태에 기재한 다른 2 이상의 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 가질 수 있다. 예컨대, 상술한 하나의 유전자 발현 유닛으로 구성되는 발현 벡터와, 2개의 유전자 발현 유닛으로 구성되는 발현 벡터의 제1 및 제2 유닛을 포함하는 경우를 들 수 있다. 그 경우, 각각의 개변형 도롱이벌레 Fib H 유전자 발현 벡터는, 동일의 또는 다른 염기 서열의 개변형 도롱이벌레 Fib H 유전자를 포함할 수 있다.
개변형 도롱이벌레 Fib H 유전자 발현 벡터가 제1 발현 유닛 및 제2 발현 유닛의 2개의 발현 유닛으로 구성되고, 각각의 발현 유닛이 누에의 염색체 상에 존재하는 경우, 각 발현 유닛은 동일 염색체 상에 존재하고 있어도 좋고, 다른 염색체 상에 존재하고 있어도 좋다. 각 발현 유닛이 다른 염색체 상에 존재하는 경우, 제1 발현 유닛만을 (바람직하게는 호모접합체로) 갖는 유전자 재조합 누에의 계통과 제2 발현 유닛만을 (바람직하게는 호모접합체로) 갖는 유전자 재조합 누에의 계통을 교배함으로써, F1에서 제1 발현 유닛과 제2 발현 유닛을 갖는 본 발명의 유전자 재조합 누에를 용이하게 얻을 수 있다. 이 경우, 상기 제1 발현 유닛만을 갖는 유전자 재조합 누에의 계통은 범용성이 높으므로, 제1 발현 유닛만을 갖는 기존의 유전자 재조합 누에의 계통을 재이용하여도 좋다.
한편, 제1 발현 유닛 및 제2 발현 유닛이 동일 염색체 상에 존재하는 경우에는, 계대 과정에서 재조합에 의해서 각각이 분리되지 않도록 각 발현 유닛 사이의 거리가 가깝고, 상호 연쇄되어 있는 쪽이 바람직하다.
3-3. 작출 방법
본 양태의 유전자 재조합 누에의 작출 방법은, 공지된 어떠한 방법이나 채용할 수 있으며, 특별히 한정되지는 않는다. 재조합 누에의 작출 방법으로서, 예컨대 상기 제2 양태의 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 숙주인 누에에게 직접 도입하는 방법이나, 제2 양태에 기재한 개변형 도롱이벌레 Fib H 유전자 발현 벡터의 제1 발현 유닛과 제2 발현 유닛을 각각 다른 염색체 상에 갖는 자웅의 유전자 재조합 누에를 교배하는 방법을 들 수 있다.
(1) 직접 도입 방법
본 방법은, 주로 제2 양태의 개변형 도롱이벌레 Fib H 유전자 발현 벡터가 하나의 발현 유닛으로 구성되는 경우에 채용하는 유전자 재조합 누에의 작출 방법이다. 이 방법에서는, 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 숙주의 누에 내에 도입하고, 그 발현 벡터를 포함하는 유전자 재조합 누에를 선택함으로써 목적을 달성할 수 있다. 본 작출 방법은 도입 공정 및 선택 공정을 필수적인 공정으로서 포함한다.
(도입 공정)
「도입 공정」이란, 제2 양태에 기재한 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 숙주인 누에에게 도입하는 공정이다. 발현 벡터를 누에에게 도입하는 방법은, 해당 분야에서 공지된 방법에 의해서 행하면 된다. 예컨대 누에 알에 도입하는 경우에는, Tamura 등의 방법(Tamura T. et al., 2000, Nature Biotechnology, 18, 81-84)을 이용할 수 있다. 구체적으로는, 개변형 도롱이벌레 Fib H 유전자 발현 벡터가 적당한 농도가 되도록 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 물이나 버퍼 등의 용매에 의해서 희석하여 투여 용액을 조제한다. 여기서, 개변형 도롱이벌레 Fib H 유전자 발현 벡터가 트랜스포존의 역위 말단 반복 서열을 갖는 경우에는, 투여 용액에 트랜스포존 전이 효소를 코드하는 DNA를 포함한 핼퍼 벡터를 가하여 누에의 발생 초기 알에 공동 주입(Co-injection)하면 된다. 이때에 이용하는 숙주 누에는 특별히 한정하지는 않는다. 야생형 혹은 변이형 누에라도 좋고, 유전자 재조합 누에라도 좋다. 또한 숙주 누에가 핼퍼 벡터를 이미 포함하고 있는 경우에는, 핼퍼 벡터를 가하지 않고, 개변형 도롱이벌레 Fib H 유전자 발현 벡터만을 포함하는 투여 용액을 누에의 발생 초기 알에 주입하면 된다.
(선택 공정)
선택 공정은, 도입 공정 후의 누에로부터 개변형 도롱이벌레 Fib H 유전자 발현 벡터를 포함하는 유전자 재조합 누에를 선택하는 공정이다. 선택 방법은, 해당 분야에 공지된 방법이라면 한정하지는 않는다. 통상은, 개변형 도롱이벌레 Fib H 유전자 발현 벡터(핼퍼 벡터를 도입한 경우에는 핼퍼 벡터도 마찬가지)에 포함되는 표지 유전자의 발현에 의해서 생긴 선발 마커의 유무에 기초하여 형질 전환체를 선택함으로써, 목적으로 하는 유전자 재조합 누에를 얻을 수 있다.
또한, 핼퍼 벡터를 이용한 방법으로 얻어지는 유전자 재조합 누에는, 도입한 개변형 도롱이벌레 Fib H 유전자 발현 벡터가 트랜스포존의 역위 말단 반복 서열을 통해 염색체 중에 들어가 있다. 따라서, 필요에 따라서 그 후에 얻어진 유전자 재조합 누에를 형매 교배 또는 동계 교배하는 공정을 거쳐, 염색체에 삽입된 발현 벡터의 호모접합체를 얻더라도 좋다.
(2) 교배 선택 방법
본 방법은, 주로 제2 양태의 개변형 도롱이벌레 Fib H 유전자 발현 벡터가 2개의 발현 유닛으로 구성되는 경우에 채용하는 유전자 재조합 누에의 작출 방법이다. 이 방법에서는, 제1 발현 유닛 및 제2 발현 유닛의 각각을 다른 염색체 상에 갖는 자웅의 유전자 재조합 누에를 교배하여, F1 또는 F2에서 2개의 발현 유닛을 갖는 유전자 재조합을 선택함으로써 목적을 달성할 수 있다. 본 작출 방법은 교배 공정 및 선택 공정을 필수 공정으로서 포함한다.
(교배 공정)
「교배 공정」이란, 제1 발현 유닛을 갖는 유전자 재조합 누에(제1 유전자 재조합 누에)와 제2 발현 유닛을 갖는 유전자 재조합 누에(제2 유전자 재조합 누에)를 교배시키는 공정이다. 교배는 2개의 누에 계통을 통상의 방법에 기초하여 교배시키면 된다.
(선택 공정)
「선택 공정」이란, 상기 제1 및 제2 발현 유닛을 갖는 유전자 재조합 누에계통을 선택하는 공정이다. 본 공정에서는, 교배 공정 후에 얻어지는 F1 개체 또는 F1끼리의 교배에 의해서 얻어지는 F2 개체로부터, 제1 및 제2 발현 유닛의 각각에 코드된 선발 마커의 활성에 기초하여, 양 유전자 발현 유닛을 갖는 개체를 선택함으로써 달성할 수 있다. 또한, 제1 및 제2 유전자 재조합 누에의 작출은, 상기 직접 도입 방법을 이용하여, 누에에게 각각 제1 발현 유닛 또는 제2 발현 유닛을 도입함으로써 작출할 수 있다.
4. 개변형 도롱이벌레 견사의 생산 방법
4-1. 개요
본 발명의 제4 양태는 개변형 도롱이벌레 견사의 생산 방법이다. 본 발명의 생산 방법에서는, 단백질 대량 생산계의 유전자 재조합 누에를 이용한다. 본 양태에서 이용하는 유전자 재조합 누에는 제3 양태의 유전자 재조합 누에이다. 그 누에에게 고치짓기를 시켜, 고치로부터 개변형 도롱이벌레 견사를 얻는다. 본 발명의 생산 방법에 의하면, 누에 견사의 생산 설비 등을 이용하여, 도롱이벌레 견사의 물성을 갖는 도롱이벌레 견사와 누에 견사의 하이브리드 견사, 즉 개변형 도롱이벌레 견사를 양산할 수 있다.
4-2. 방법
본 발명의 개변형 도롱이벌레 견사의 생산 방법은, 사육 공정을 선택 공정으로서, 또한 고치짓기 공정, 수견(收繭) 공정, 조사(繰絲) 공정을 필수적인 공정으로서 포함한다.
(1) 사육 공정
「사육 공정」이란, 제3 양태의 유전자 재조합 누에를 사육하는 공정이다. 유전자 재조합 누에의 사육 방법에 관해서는, 해당 분야에서 공지된 누에의 사육 기술에 따라서 사육하면 된다. 예컨대 「잠종 총론; 다카미 다케오(高見 丈夫) 저, 일본전국잠종협회 간행」을 참조하면 된다. 사료에는, 뽕나무속(Morus)의 잎과 같은 식초수종의 천연 잎을 이용하여도 좋고, 실크메이트 L4M 혹은 원잠종 1-3륜용(닛폰노산고교)과 같은 인공 사료를 이용하여도 좋다. 병의 발생을 억제하고, 안정적인 질 및 양의 먹이를 먹일 수 있고, 또한 필요에 따라서 무균적으로 사육할 수 있다는 점에서, 인공 사료가 바람직하다. 이하, 유전자 재조합 누에의 간단한 사육 방법에 관해서 일례를 들어 설명한다.
애누에 옮기기는, 적당한 두수(예컨대 4∼10두)의 동계(同系)의 유전자 재조합 누에의 암컷이 산란한 알로 행한다. 부화한 유충은, 알 대지에서 누에 자리인 방건지(防乾紙)(파라핀 가공지)를 깐 용기 내로 옮기고, 실크메이트 등의 인공 사료를 방건지 상에 늘어놓아 먹이를 준다. 먹이의 교환은, 원칙적으로 1∼2령이면 각 1회, 3령이면 1∼3회 행한다. 오래된 먹이는 먹다 남긴 것이 많은 경우에는 부패 방지를 위해서 제거한다. 4∼5령의 큰 누에 유충일 때의 사육에는, 대형 용기로 옮겨, 용기 당 두수를 적절하게 조정한다. 습도나 용기 내의 상태에 따라, 용기에 방건지, 아크릴, 또는 메쉬제의 뚜껑을 덮어도 좋다. 사육 온도는 전령을 통틀어 25∼28℃에서 사육한다.
(2) 고치짓기 공정
「고치짓기 공정」은, 제3 양태의 유전자 재조합 누에에게 고치짓기를 시키는 공정이다. 「고치짓기(코쿠닝)」란, 종령(5령) 누에가 고치를 번데기화하기 위해서 고치를 형성하는 것을 말한다.
본 공정은, 기본적으로 누에에 있어서의 공지된 고치짓기 방법을 행하면 된다. 예컨대, 종령 6∼8일째의 익은누에(熟蠶)를 회수하고, 상족함으로써 공정을 달성할 수 있다. 「상족」이란, 누에를 섶(cocoon holder)으로 옮기는 것이다. 고치짓기는 25∼28℃ 하에서 행하면 된다. 그 후, 제3 양태의 유전자 재조합 누에는 섶 안에서 고치를 형성한다.
(3) 수견 공정
「수견(고치따기) 공정」은, 고치짓기 공정 후, 섶으로부터 고치를 긁어내어 회수하는 공정이다. 본 공정은 고치 주변에 부착된 보풀의 제거까지를 포함한다. 수견은 상족 후 6∼8일째에 행하면 된다. 수견은 수작업으로 행할 수도 있지만, 수견 전용 장치를 이용하면 편리하다. 보풀만을 제거하는 보풀 제거기 외에, 섶으로부터의 고치 긁어내기 및 보풀의 제거까지를 행하는 전자동 수견 머신을 이용할 수 있다.
(4) 조사 공정
「조사 공정」은, 수견 공정에서 회수한 고치로부터 개변형 도롱이벌레 견사를 조사하는 공정이다. 「조사」란, 고치로부터 생사를 만드는 것을 말한다. 회수된 고치는, 80∼85℃의 열탕에 수몰시켜 고치를 풀리기 쉽게 하는 「고치삶기」를 행한 후, 실머리 찾기 빗자루를 이용하여 고치의 표층부를 벗겨 떼어내는 「색서(索緖)」를 행한다. 그 후, 고치로부터 바른 실마리를 찾아내는 「초서(抄緖)」를 행하여, 실을 뽑아낸다. 이들 공정은 수작업으로 행할 수도 있지만, 조사 전용 장치인 자동조사기를 이용하는 것이 바람직하다. 이상의 공정에 의해서 개변형 도롱이벌레 견사를 생사로서 생산할 수 있다.
실시예
<실시예 1: 도롱이벌레 Fib H 유전자의 클로닝>
(목적)
미지의 도롱이벌레 Fib H 유전자를 클로닝한다.
(방법)
치바현 아비코시(일본)에서 야외 채취한 남방차주머니나방의 유충을 해부하여 견사선을 적출했다. RNA 추출 시약인 ISOGEN(닛폰진사) 중에 있어서 적출한 견사선을 뭉개고, SV Total RNA Isolation system(프로메가사)를 이용하여 총 RNA의 추출을 행했다. 추출한 총 RNA를 주형으로, TruSeq RNA Sample Preparation Kit v2(일미나사)를 이용하여 cDNA 라이브러리를 제작했다. 차세대 시퀀서 Hiseq2500를 이용하여 RNAseq 해석에 제공했다. 얻어진 101 bp×2의 페어엔드 서열 리드 데이터를 이용하여, blast 검색 및 trinity를 이용한 de novo assemble 해석을 행했다.
(결과)
de novo assemble 해석에 의해 남방차주머니나방 Fib H의 N 말단 영역을 코드하는 서열 번호 24로 표시되는 약 750 bp의 염기 서열, 중앙 영역의 반복 서열을 코드하는 서열 번호 25로 표시되는 약 1020 bp의 염기 서열 및 C 말단 영역을 코드하는 서열 번호 26으로 표시되는 약 300 bp의 염기 서열의 동정에 성공했다.
<실시예 2: 개변형 도롱이벌레 FibH 발현 벡터의 구축>
(목적)
실시예 1에서 얻어진 남방차주머니나방의 도롱이벌레 Fib H 유전자의 부분 서열 정보와 누에 Fib H 유전자 정보에 기초하여 전체 길이 키메라 Fib H 유전자의 발현 벡터를 구축한다.
(방법 및 결과)
실시예 1에서 얻어진 염기 서열 정보는, 남방차주머니나방 유래의 도롱이벌레 Fib H 유전자에 있어서의 일부 영역(N 말단 영역, 중앙 영역, C 말단 영역)이었다. 남방차주머니나방 Fib H 유전자의 전사 산물은 전체 길이가 약 10 kbp로 추정된다. 그래서, 도롱이벌레 Fib H 유전자를 유전자 재조합 콘스트럭트로서 이용 가능한 형태로 하기 위해서, 실시예 1에서 얻은 남방차주머니나방의 Fib H 유전자 단편의 염기 서열 정보와 누에 Fib H 유전자 정보에 기초하여, 이하의 조작에 의해 도롱이벌레 및 누에의 키메라 Fib H 유전자로 이루어지는 개변형 도롱이벌레 Fib H 유전자를 구축했다.
또한, 본 실시예의 개변형 도롱이벌레 Fib H 유전자를 구축함에 있어서, 실시예 1에서 얻어진 N 말단 영역 및 C 말단 영역의 염기 서열 정보는 이용하고 있지 않다. 이것은, 상기 개변형 도롱이벌레 Fib H 유전자를 누에의 후부 견사선 내에서 적절하게 발현시켜, 개변형 도롱이벌레 견사로서 정상적으로 분비시키기 위해서는, N 말단 영역 및 C 말단 영역은, 누에의 Fib H 유전자를 이용하는 쪽이 바람직하다고 생각했기 때문이다. 또한, 일반적으로 각종 견사 특유의 물성은, 반복 서열로 이루어지는 영역이 갖고 있으므로, 누에 견사에 도롱이벌레 견사의 물성을 부여하기 위해서는, 반복 서열을 코드하는 중앙 영역만을 이용하면 충분하다고 생각되었기 때문이다.
상기 유전자의 N 말단 영역과 반복 서열 부분 및 반복 부분과 C 말단 영역을 코드하는 유전자 영역을 각각 증폭하도록 설계한 2조의 프라이머 페어, 즉 서열 번호 27 및 28로 표시되는 5' 측 프라이머 페어(각각 EvHFB-F21 & -R26) 및 서열 번호 29 및 30으로 표시되는 3' 측 프라이머 페어(각각 EvHFB-F26 & -R12)를 이용하여, 개별의 PCR를 실시했다. 이어서, 각각의 PCR 후의 증폭 산물(Ev01HFB-F21/R26 및 Ev01HFB-F26/R12)을 포함하는 반응액을 1/50량 1000배 희석한 용액을 주형으로 하여, 서열 번호 31로 표시되는 N 말단 프라이머(EvHFB-F12) 및 서열 번호 30으로 표시되는 C 말단의 프라이머(EvHFB-R12)에 의한 PCR를 행하여, 증폭편(Ev01HFB-F12/R12)을 회수했다. 이어서, 이 증폭편의 반복 부분만을 서열 번호 32로 표시되는 포워드 프라이머(EvHFB-F31) 및 서열 번호 33으로 표시되는 리버스 프라이머(EvHFB-R31)를 이용하여 PCR 증폭하여, 증폭편(Ev01HFB-F31/R31)을 얻었다. 이것을 T 벡터 pCR4TOPO(Thermo Fisher Scientific사)에 클로닝한 후, BglII 및 SalI로 잘라냈다. 한편, 누에의 녹색 형광 FibH 콘스트럭트「pHChis6-EGFP」(Kuwana Y., et al., 2014, PLoS ONE 9(8): e105325)로부터, 벡터 골격과 누에 FibH의 N 말단 및 C 말단 서열이 남도록 BamHI 및 SalI로 잘라냈다. 양자의 라이게이션 반응액으로 형질 전환을 행하여, 개변형 도롱이벌레 FibH 「pHC.BmEv01HFB-F31/R31s」를 구축했다. 그 중에서 선택한 「pHC.BmEv01HFB-F31/R31.03」 클론의 AscI 및 FseI 절단편과, 피기백 벡터「pBac3xP3eGFP」의 AscI 및 FseI 절단편과의 라이게이션 반응액으로 형질 전환을 행하여, 누에 견사선에서 발현할 수 있게 하이브리드 유전자화한, 개변형 도롱이벌레 FibH 유전자 발현 벡터(pBac3xP3eGFP-BmEv01HFB-F31/R31)를 구축했다.
<실시예 3: 유전자 재조합 누에의 작출>
(목적)
실시예 2에서 구축한 발현 벡터를 도입한 유전자 재조합 누에를 작출한다.
(방법 및 결과)
실시예 2에서 구축한 개변형 도롱이벌레 FibH 유전자 발현 벡터(pBac3xP3eGFP-BmEv01HFB-F31/R31)를 정법(Tamura T. et al., 2000, Nat Biotechnol, 18: 81-84)에 따라서, 누에 w1pnd 계통의 알 288개에 주사하고, 생긴 성충의 sib 교배(G0 교배)에 의해 38 아구(蛾區)를 얻었다. 그 중 8 아구에서 92 개체의 유전자 재조합체(G1 알)이 스크리닝되었다. G1 알에서 56 개체가 부화하여, 34 개체의 개변형 도롱이벌레 Fib H 유전자 재조합 누에의 성충을 얻었다.
같은 방법으로, 재차 개변형 도롱이벌레 Fib H 유전자 재조합 누에의 작출을 행했다. pBac3xP3eGFP-BmEv01HFB-F31/R31을 상기 정법에 따라서 누에 w1pnd 계통의 알 384개에 주사했다. 부화한 120 개체를 사육한 후, 얻어진 G0 성충으로 sib 교배를 행하여, 38 아구에서 G1 알을 얻었다. 부화 후에, 배(胚)의 눈의 GFP 마커에 기초하여 스크리닝한 결과, 8 아구에 있어서 GFP 양성 개체를 얻었다. GFP 양성 개체는, 목적으로 하는 개변형 도롱이벌레 Fib H 유전자를 발현할 수 있는 유전자 재조합 누에이다. 각 아구를 양성 개체수가 많은 순으로 Y91.01∼Y91.08로 했다. 이 중 상위 3 아구(Y91.01∼Y91.03)의 유전자 재조합 누에를 이용하여, 이하의 실험을 행했다. 또한, 이 단계에서 얻어진 GFP 음성 개체는, 개변형 도롱이벌레 FibH 유전자 발현 벡터를 유지하지 않는 대조용 개체(Y90.Cont.)로서 사용했다. 상기 3 아구의 G1 개체 및 대조용 G1 개체를 각각 sib 교배하여, G2 알을 얻은 후, 그 G2 개체를 사육하고, 재차 sib 교배를 하여 G3 알을 얻었다. 이 G3 세대의 유충으로부터 얻어진 고치를, 고치 검정용 자동조사기(닛산지도샤, CT-2형)를 이용하여, 목적 섬도 27 d, 조사 속도 200 m/min로 조사했다. 얻어진 견사에 관해서, 그 물성(파단 강도, 파단 신도 및 영율)을, 목표 설정 온습도 20℃, 65% 중에 2시간 이상 방치한 후, 시료 길이 100 mm, 인장 속도 150 mm/min로 측정했다. 파단 강도란, 파단에 이르기 직전의 응력을 말한다. 일반적으로 수치가 클수록 대상 재료가 강한 응력에 견디는 것을 의미한다. 파단 신도란, 파단에 이르기까지의 신장을 말한다. 일반적으로 수치가 클수록 대상 재료가 잘 신장하는 것을 의미한다. 그리고, 영율이란, 훅의 법칙이 성립하는 탄성 범위에 있어서의, 동축 방향의 변형과 응력의 비례 상수이다. 일반적으로 수치가 클수록 대상 재료의 강성이 높다는 것을 의미한다.
결과를 표 1에 나타낸다.
유전자 재조합 누에 견사는, 개변형 도롱이벌레 Fib H 유전자 재조합 누에가 토사하는 견사이며, 개변형 도롱이벌레 견사와 w1pnd 계통 유래의 누에 견사의 혼합 견사에 상당한다. 또한, 대조용 견사는 w1pnd 계통 유래의 누에 견사에 상당한다.
표 1로부터, 유전자 재조합 누에 견사는, 대조용 견사와 비교하여, 어느 계통 유래나 신도와 영율이 현저히 증가했다. 이것은, 개변형 도롱이벌레 견사에 의해 누에 견사에 신장과 강성이 부여되었음을 보여주고 있다.
본 명세서에서 인용한 모든 간행물, 특허 및 특허출원은 그대로 인용에 의해 본 명세서에 들어가는 것으로 한다.
SEQUENCE LISTING
<110> National Agriculture and Food Research Organization
<120> Recombinant silk from bag worm
<130> PH-7039-PCT
<150> JP 2016-204592
<151> 2016-10-18
<160> 33
<170> PatentIn version 3.5
<210> 1
<211> 13
<212> PRT
<213> Eumeta japonica
<400> 1
Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly
1 5 10
<210> 2
<211> 39
<212> DNA
<213> Eumeta japonica
<400> 2
ggagccggag caggtgccgg ttcaggcgcc ggtgctgga 39
<210> 3
<211> 39
<212> DNA
<213> Eumeta japonica
<400> 3
ggtgccggag caggagctgg atcaggtgca ggagcaggt 39
<210> 4
<211> 39
<212> DNA
<213> Eumeta japonica
<400> 4
ggtgcgggcg ctggagcagg ttccggagca ggagcaggt 39
<210> 5
<211> 140
<212> PRT
<213> Eumeta japonica
<400> 5
Val Val Tyr Val Ser Ala Gly Gly Ala Gly Ala Gly Ala Gly Ser Gly
1 5 10 15
Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly
20 25 30
Ala Gly Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Ser
35 40 45
Gly Ala Gly Ser Gly Ser Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala
50 55 60
Gly Ala Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala
65 70 75 80
Ala Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
85 90 95
Ala Ala Ala Ala Glu Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
100 105 110
Ala Gly Ser Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly
115 120 125
Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala
130 135 140
<210> 6
<211> 420
<212> DNA
<213> Eumeta japonica
<400> 6
gtcgtctacg taagtgctgg aggagccgga gcaggtgccg gttcaggcgc cggtgctgga 60
tcgggtgccg gagcaggagc tggatcaggt gcaggagcag gtggagcagg agccgcagcc 120
ggagctggtg ctggtgctgg ttcaggtgca ggatccggtt caggtgcggg cgctggagca 180
ggttccggag caggagcagg ttccggtgct ggtgcaggag caggagctgg ttcaggtgca 240
gcaggtggag caggagctgg cgctggcgct ggcgctgcag ccgcagccgc agcagcagca 300
gaagcggcag ccgcagctgc cgccgccgct gccgccgcag gtagtggagc aggcgctgga 360
ggagccggag gctacggagc gggagctgga gcaggtgccg gtgcaggtgc tggcggcgca 420
<210> 7
<211> 308
<212> PRT
<213> Eumeta japonica
<400> 7
Ile Ala Ala Ser Val Gly Ala Gly Val Gly Ala Ala Ser Val Ala Gly
1 5 10 15
Ala Gly Thr Gly Ala Gly Ser Gly Ala Ala Gly Gly Ala Gly Ala Gly
20 25 30
Ala Asp Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala Gln Ala Ala
35 40 45
Ala Ala Asp Ala Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Arg Val
50 55 60
Gly Ala Tyr Gly Pro Tyr Gly Gly Leu Ala Ser Ala Gly Ala Gly Gly
65 70 75 80
Ala Gly Gly Ala Gly Gly Ala Gly Gly Tyr Ser Gly Ala Ser Val Val
85 90 95
Tyr Val Ser Ala Gly Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly
100 105 110
Ala Gly Ser Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly
115 120 125
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala
130 135 140
Gly Ser Gly Ser Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala
145 150 155 160
Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Ala Gly
165 170 175
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
180 185 190
Ala Ala Glu Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly
195 200 205
Ser Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Ala Gly
210 215 220
Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Ser Gly Gly Tyr Gly Ser
225 230 235 240
Tyr Gly Ser Gly Val Ala Ala Gly Ala Gly Ala Gly Ala Gly Val Gly
245 250 255
Gly Ser Arg Gly Ala Gly Val Gly Ala Gly Val Gly Ala Gly Tyr Gly
260 265 270
Ser Ala Leu Asn Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly
275 280 285
Ala Gly Gly Ala Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly
290 295 300
Ala Gly Ala Gly
305
<210> 8
<211> 924
<212> DNA
<213> Eumeta japonica
<400> 8
atagcagcca gtgtaggtgc gggcgttgga gcagcttccg ttgctggtgc aggaacagga 60
gctggctcag gtgcagctgg tggagcagga gcaggtgctg acgctggcgc tgcagccgcc 120
gctgcggcag cagcacaagc agcagccgca gatgctgccg ccgcaggtag tggcgctggt 180
gctggacgag tcggagctta cggaccctac ggaggtttag caagcgctgg tgctggtggt 240
gctggcggag ccggtggtgc aggtggatac agtggtgcaa gtgtcgtcta cgtaagtgct 300
ggaggagccg gagcaggtgc cggttcaggc gccggtgctg gatcgggtgc cggagcagga 360
gctggatcag gtgcaggagc aggtggagca ggagccgcag ccggagctgg tgctggtgct 420
ggttcaggtg caggatccgg ttcaggtgcg ggcgctggag caggttccgg agcaggagca 480
ggttccggtg ctggtgcagg agcaggagct ggttcaggtg cagcaggtgg agcaggagct 540
ggcgctggcg ctggcgctgc agccgcagcc gcagcagcag cagaagcggc agccgcagct 600
gctgccgccg ctgccgccgc aggtagtgga gcaggcgctg gaggagccgg aggctacgga 660
gcgggagctg gagcaggtgc cggtgcaggt gctggcggcg catctggagg ctacggttct 720
tacggatcgg gagttgcagc aggtgccggt gcaggagctg gtgttggtgg tagcagggga 780
gcaggtgttg gcgctggtgt tggtgctggt tatggctccg cattgaattc aggagccggt 840
gccggagcag gtgctggtgc tggagctggt ggtgctgcag gagctggtgc tggtgcagga 900
gcaggagctg gcgctggagc tgga 924
<210> 9
<211> 530
<212> PRT
<213> Artificial
<220>
<223> chimeric protein
<400> 9
Met Arg Val Lys Thr Phe Val Ile Leu Cys Cys Ala Leu Gln Tyr Val
1 5 10 15
Ala Tyr Thr Asn Ala Asn Ile Asn Asp Phe Asp Glu Asp Tyr Phe Gly
20 25 30
Ser Asp Val Thr Val Gln Ser Ser Asn Thr Thr Asp Glu Ile Ile Arg
35 40 45
Asp Ala Ser Gly Ala Val Ile Glu Glu Gln Ile Thr Thr Lys Lys Met
50 55 60
Gln Arg Lys Asn Lys Asn His Gly Ile Leu Gly Lys Asn Glu Lys Met
65 70 75 80
Ile Lys Thr Phe Val Ile Thr Thr Asp Ser Asp Gly Asn Glu Ser Ile
85 90 95
Val Glu Glu Asp Val Leu Met Lys Thr Leu Ser Asp Gly Thr Val Ala
100 105 110
Gln Ser Tyr Val Ala Ala Asp Ala Gly Ala Tyr Ser Gln Ser Gly Pro
115 120 125
Tyr Val Ser Asn Ser Gly Tyr Ser Thr His Gln Gly Tyr Thr Ser Asp
130 135 140
Phe Ser Thr Ser Ala Ala Val Gly Ala Gly Ser Ile Ala Ala Ser Val
145 150 155 160
Gly Ala Gly Val Gly Ala Ala Ser Val Ala Gly Ala Gly Thr Gly Ala
165 170 175
Gly Ser Gly Ala Ala Gly Gly Ala Gly Ala Gly Ala Asp Ala Gly Ala
180 185 190
Ala Ala Ala Ala Ala Ala Ala Ala Gln Ala Ala Ala Ala Asp Ala Ala
195 200 205
Ala Ala Gly Ser Gly Ala Gly Ala Gly Arg Val Gly Ala Tyr Gly Pro
210 215 220
Tyr Gly Gly Leu Ala Ser Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly
225 230 235 240
Gly Ala Gly Gly Tyr Ser Gly Ala Ser Val Val Tyr Val Ser Ala Gly
245 250 255
Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala
260 265 270
Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Gly Ala Gly Ala Ala
275 280 285
Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ser Gly Ser Gly
290 295 300
Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly
305 310 315 320
Ala Gly Ala Gly Ala Gly Ser Gly Ala Ala Gly Gly Ala Gly Ala Gly
325 330 335
Ala Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala Glu Ala Ala
340 345 350
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly Ser Gly Ala Gly Ala
355 360 365
Gly Gly Ala Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
370 375 380
Gly Ala Gly Gly Ala Ser Gly Gly Tyr Gly Ser Tyr Gly Ser Gly Val
385 390 395 400
Ala Ala Gly Ala Gly Ala Gly Ala Gly Val Gly Gly Ser Arg Gly Ala
405 410 415
Gly Val Gly Ala Gly Val Gly Ala Gly Tyr Gly Ser Ala Leu Asn Ser
420 425 430
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Ala
435 440 445
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Val
450 455 460
Asp Ser Val Ser Tyr Gly Ala Gly Arg Gly Tyr Gly Gln Gly Ala Gly
465 470 475 480
Ser Ala Ala Ser Ser Val Ser Ser Ala Ser Ser Arg Ser Tyr Asp Tyr
485 490 495
Ser Arg Arg Asn Val Arg Lys Asn Cys Gly Ile Pro Arg Arg Gln Leu
500 505 510
Val Val Lys Phe Arg Ala Leu Pro Cys Val Asn Cys His His His His
515 520 525
His His
530
<210> 10
<211> 1590
<212> DNA
<213> Artificial
<220>
<223> chimeric protein
<400> 10
atgagagtca aaacctttgt gatcttgtgc tgcgctctgc agtatgtcgc ttatacaaat 60
gcaaacatca atgattttga tgaggactat tttgggagtg atgtcactgt ccaaagtagt 120
aatacaacag atgaaataat tagagatgca tctggggcag ttatcgaaga acaaattaca 180
actaaaaaaa tgcaacggaa aaataaaaac catggaatac ttggaaaaaa tgaaaaaatg 240
atcaagacgt tcgttataac cacggattcc gacggtaacg agtccattgt agaggaagat 300
gtgctcatga agacactttc cgatggtact gttgctcaaa gttatgttgc tgctgatgcg 360
ggagcatatt ctcagagcgg gccatacgta tcaaacagtg gatacagcac tcatcaagga 420
tatacgagcg atttcagcac tagtgctgca gtcggtgcag gatctatagc agccagtgta 480
ggtgcgggcg ttggagcagc ttccgttgct ggtgcaggaa caggagctgg ctcaggtgca 540
gctggtggag caggagcagg tgctgacgct ggcgctgcag ccgccgctgc ggcagcagca 600
caagcagcag ccgcagatgc tgccgccgca ggtagtggcg ctggtgctgg acgagtcgga 660
gcttacggac cctacggagg tttagcaagc gctggtgctg gtggtgctgg cggagccggt 720
ggtgcaggtg gatacagtgg tgcaagtgtc gtctacgtaa gtgctggagg agccggagca 780
ggtgccggtt caggcgccgg tgctggatcg ggtgccggag caggagctgg atcaggtgca 840
ggagcaggtg gagcaggagc cgcagccgga gctggtgctg gtgctggttc aggtgcagga 900
tccggttcag gtgcgggcgc tggagcaggt tccggagcag gagcaggttc cggtgctggt 960
gcaggagcag gagctggttc aggtgcagca ggtggagcag gagctggcgc tggcgctggc 1020
gctgcagccg cagccgcagc agcagcagaa gcggcagccg cagctgctgc cgccgctgcc 1080
gccgcaggta gtggagcagg cgctggagga gccggaggct acggagcggg agctggagca 1140
ggtgccggtg caggtgctgg cggcgcatct ggaggctacg gttcttacgg atcgggagtt 1200
gcagcaggtg ccggtgcagg agctggtgtt ggtggtagca ggggagcagg tgttggcgct 1260
ggtgttggtg ctggttatgg ctccgcattg aattcaggag ccggtgccgg agcaggtgct 1320
ggtgctggag ctggtggtgc tgcaggagct ggtgctggtg caggagcagg agctggcgct 1380
ggagctggag tcgacagcgt cagttacgga gctggcaggg gatacggaca aggtgcagga 1440
agtgcagctt cctctgtgtc atctgcttca tctcgcagtt acgactattc tcgtcgtaac 1500
gtccgcaaaa actgtggaat tcctagaaga caactagttg ttaaattcag agcactgcct 1560
tgtgtgaatt gccatcacca ccatcaccac 1590
<210> 11
<211> 19
<212> PRT
<213> Bombyx mori
<220>
<223> signal peptide of serisin 1
<400> 11
Met Arg Phe Val Leu Cys Cys Thr Leu Ile Ala Leu Ala Ala Leu Ser
1 5 10 15
Val Lys Ala
<210> 12
<211> 57
<212> DNA
<213> Bombyx mori
<220>
<223> nucleic acid sequence coding signal peptide of sericin 1
<400> 12
atgcgtttcg ttctgtgctg cactttgatt gcgttggctg cgctcagcgt aaaagct 57
<210> 13
<211> 18
<212> PRT
<213> Bombyx mori
<220>
<223> signal peptide of sericin 2
<400> 13
Met Lys Ile Pro Tyr Val Leu Leu Phe Leu Val Gly Val Ala Val Val
1 5 10 15
Asn Ala
<210> 14
<211> 54
<212> DNA
<213> Bombyx mori
<220>
<223> nucleic acid sequence coding signal peptide of sericin 2
<400> 14
atgaagatcc catacgtctt gctgttcctt gtgggcgtgg ctgtggtcaa cgca 54
<210> 15
<211> 18
<212> PRT
<213> Bombyx mori
<220>
<223> signal peptide of sericin 3
<400> 15
Met Asn Cys Lys Val Ala Leu Phe Leu Ile Val Ala Ile Val Ala Val
1 5 10 15
Gln Ala
<210> 16
<211> 54
<212> DNA
<213> Bombyx mori
<220>
<223> nucleic acid sequence coding signal peptide of sericin 3
<400> 16
atgaattgta aagttgctct attcctgata gtggctattg tagccgtcca ggct 54
<210> 17
<211> 870
<212> DNA
<213> Bombyx mori
<220>
<223> fibroin H chain promoter
<400> 17
acaaaactgc cacacgcatt tttttctcca ctgtaggttg tagttacgcg aaaacaaaat 60
cgttctgtga aaattcaaac aaaaatattt tttcgtaaaa acacttatca atgagtaaag 120
taacaattca tgaataattt catgtaaaaa aaaaatacta gaaaaggaat ttttcattac 180
gagatgctta aaaatctgtt tcaaggtaga gatttttcga tatttcggaa aattttgtaa 240
aactgtaaat ccgtaaaatt ttgctaaaca tatattgtgt tgttttggta agtattgacc 300
caagctatca cctcctgcag tatgtcgtgc taattactgg acacattgta taacagttcc 360
actgtattga caataataaa acctcttcat tgacttgaga atgtctggac agatttggct 420
ttgtattttt gatttacaaa tgtttttttg gtgatttacc catccaaggc attctccagg 480
atggttgtgg catcacgccg attggcaaac aaaaactaaa atgaaactaa aaagaaacag 540
tttccgctgt cccgttcctc tagtgggaga aagcatgaag taagttcttt aaatattaca 600
aaaaaattga acgatattat aaaattcttt aaaatattaa aagtaagaac aataagatca 660
attaaatcat aattaatcac attgttcatg atcacaattt aatttacttc atacgttgta 720
ttgttatgtt aaataaaaag attaatttct atgtaattgt atctgtacaa tacaatgtgt 780
agatgtttat tctatcgaaa gtaaatacgt caaaactcga aaattttcag tataaaaagg 840
ttcaactttt tcaaatcagc atcagttcgg 870
<210> 18
<211> 1110
<212> DNA
<213> Antheraea pernyi
<220>
<223> fibroin H chain promoter
<400> 18
tccagcgtta ccaatgagag cgcttcaaaa ttctttacaa cttcattaga atacgtcgat 60
ttttctctac ttcatataaa tattctatag atgtgtttgc tataacataa atacttttaa 120
aaaaatgtct caacggttgt gaaaactgtc aaaatctgtt gcgtagttca gaaaaactaa 180
ggaaacatac agaaaattta ttttacaaaa gtacggagat atataaaaat atttcgatta 240
ctttagaatt acaataaaac tatttgacaa tttgattgca aatatagacc atgacaacac 300
cacatctttg ttatctaaaa cacgtagcga caacactcct tgaacgttgt tcgaggatta 360
ctacgataat tggcggtttt ttttccgcac cgcaagaaaa gagtagaaat gtaccgtatt 420
taaatccagt gcggaaattt tcacgcagaa tgcgtttcca tacaattcta taggttacat 480
atcttgcgga aataaattcg tgccaaaaag ccgaagtgcg gggactaata aagattttat 540
ttggcattcc ttctaacctt tagatataaa tttctgtacg cgcgtatgtc actgaactcc 600
ccctaaacgg ctggactaat tttgatgaaa tattgtttgt gtgttctagt ggatccgaga 660
attgtttaaa ttcgcaaatc cggtaggtga acccgcggtt gacttttaga ttttttttat 720
tatcaacaac aacgtccgcc cggcccgcta gttatgtatg tatttgtaaa tgtaatctca 780
aaccgttcct gttggatcga catttaatat gtttaagtga attaattaac gtataacagt 840
cataagaaaa tattgcaata aaatcccatc atttattctt tagagacaat ataaccaaac 900
aacaataaga atcagaatgt aattactcta cattgttcat gataggggtt taactatgat 960
attgttttaa ttctatagga ttcattactt tatcattttg tcaatattta aaattgttta 1020
tttgaaatag ttaacgacat tacaaagttt tcgtataaaa gggcgccaaa gtctggtctc 1080
attatcagtt cggttccagc tctcataacc 1110
<210> 19
<211> 634
<212> DNA
<213> Bombyx mori
<220>
<223> fibroin L chain promoter
<400> 19
ggtacggttc gtaaagttca cctgcggcta tattcagact cgccaagtta cgtcagtcgt 60
attgtaatga gcgatttagt gggcaacttc attctgttaa ttttgtgtca cggtgcgcgc 120
gcatcgtaaa atttcactct catagatttt tcataacgtg cctaaagaag tataacttca 180
ataatttaaa ttaaaaaaaa acatgcatag aataattata tgaattattt aaaatgtcat 240
ttaccgacat tgacataaca gacgacgtta acactacaaa acattttaat tccacattgc 300
tacatattca acagttaaat ttgcgttaat tctcgatgcg aacaaatata agaacaatcg 360
gatcaattag atcgctttgt ttcgagcaac acttagttta actagaggcg tacacctcaa 420
gaaatcatct tcattagaaa ctaaacctta aaatcgcatt aataaagcat agtcaatttt 480
aactgaaatg caaaatcttt tgaacgttag atgctgtcag cgttcgttgg tacagttgtt 540
tgatatttat tttaattgtc tttttatata taaatagtgg aacattaatc acggaatcct 600
gtatagtata taccgattgg tcacataaca gacc 634
<210> 20
<211> 1110
<212> DNA
<213> Antheraea pernyi
<220>
<223> fibroin L chain promoter
<400> 20
tccagcgtta ccaatgagag cgcttcaaaa ttctttacaa cttcattaga atacgtcgat 60
ttttctctac ttcatataaa tattctatag atgtgtttgc tataacataa atacttttaa 120
aaaaatgtct caacggttgt gaaaactgtc aaaatctgtt gcgtagttca gaaaaactaa 180
ggaaacatac agaaaattta ttttacaaaa gtacggagat atataaaaat atttcgatta 240
ctttagaatt acaataaaac tatttgacaa tttgattgca aatatagacc atgacaacac 300
cacatctttg ttatctaaaa cacgtagcga caacactcct tgaacgttgt tcgaggatta 360
ctacgataat tggcggtttt ttttccgcac cgcaagaaaa gagtagaaat gtaccgtatt 420
taaatccagt gcggaaattt tcacgcagaa tgcgtttcca tacaattcta taggttacat 480
atcttgcgga aataaattcg tgccaaaaag ccgaagtgcg gggactaata aagattttat 540
ttggcattcc ttctaacctt tagatataaa tttctgtacg cgcgtatgtc actgaactcc 600
ccctaaacgg ctggactaat tttgatgaaa tattgtttgt gtgttctagt ggatccgaga 660
attgtttaaa ttcgcaaatc cggtaggtga acccgcggtt gacttttaga ttttttttat 720
tatcaacaac aacgtccgcc cggcccgcta gttatgtatg tatttgtaaa tgtaatctca 780
aaccgttcct gttggatcga catttaatat gtttaagtga attaattaac gtataacagt 840
cataagaaaa tattgcaata aaatcccatc atttattctt tagagacaat ataaccaaac 900
aacaataaga atcagaatgt aattactcta cattgttcat gataggggtt taactatgat 960
attgttttaa ttctatagga ttcattactt tatcattttg tcaatattta aaattgttta 1020
tttgaaatag ttaacgacat tacaaagttt tcgtataaaa gggcgccaaa gtctggtctc 1080
attatcagtt cggttccagc tctcataacc 1110
<210> 21
<211> 1344
<212> DNA
<213> Bombyx mori
<220>
<223> p25 promoter
<400> 21
aagcttagat aattcggcat tgtgcgccac tgagtcgcat tatgctctgt aattggaaac 60
taccaaacat tgtgtaccct ttaatgatat tctaatctat atatataaaa atgaattgct 120
gttcgttagt ctcgctaaaa ctcgagaacg gccggaccga tttggctaat tttggtcttg 180
aattatttgt ggaagtccag agaagattta gaaggtttaa ataaatatga aaatgctcgg 240
aattaaataa aaataacaat tttgtttttt ctttgatgtg ttcccgtcgg acggattcct 300
ttagtctttt atttatcgac tagcgacccg ccgcttcgct tcggaaacat taaaatacac 360
atgataccaa aaaaattaaa taattttttt ttaaaaaaag tagcctatgt tcatcaggta 420
caatgtcggc ttctaatgga aaaagaattt ttcaaatcgg tccagtagtt tcggagccta 480
ttcgaaacaa acaaacaaac aaatctttcc tctttataat attagtatag atagtataga 540
ttgaggcact acgaagtctg ccgggtcagc tagtatactc ataaataagg tcgacatctg 600
ttgatgatgg tgatatcttc aaaattacct tagcgcaatg tagacttata cagtatttct 660
gttttcctaa gttaattacc gctgtagcca ataccgtctt taccataagc gcacacgggg 720
cccggtccag ggccgagtgt cgtcgagggg gcccgaaaga ccggcaagtt ctctcacacg 780
tttattccca aaacattttt gtcgggcaca ttacactttt tccacaaatc cgtaatcaga 840
aggtatttag caaggcatat actatgccta taatagaaga ttttgctcaa cagaaatccc 900
gagagaaacc gttatcgaaa tcgtaaccaa aaaaccagca gcattctaat atcattaatg 960
acatattata tcatactgta tttgattacc tataataaag ggtcatactc agtaaaaaaa 1020
tgttaatata attcgctttt tttactttcc aaaagggcct caaattcttg tgtgtccaag 1080
ggccccatct tagtttaaga cgtccctggc tgtagcccag ttactgccac acaaacatgc 1140
ttaactcgcg ccgcctacgt cgaggagaac attttgcgcc ttagaaaata aaatggcgtc 1200
gccgcggcgc aacaataaga acttaattcg tgcaattgtt tccacgacgc tatttattta 1260
acgttattcg ttgtgaggaa caatactttg tataattaat gttgatcagt gcctaacgac 1320
gcagttgttt attattcgcg caac 1344
<210> 22
<211> 244
<212> DNA
<213> Bombyx mori
<220>
<223> hsp70 terminator
<400> 22
aatgaatcgt agatactgaa aaaccccgca agttcacttc aactgtgcat cgtgcaccat 60
ctcaatttct ttcatttata catcgttttg ccttctttta tgtaactata ctcctctaag 120
tttcaatctt ggccatgtaa cctctgatct atagaatttt ttaaatgact agaattaatg 180
cccatctttt ttttggacct aaattcttca tgaaaatata ttacgagggc ttattcagaa 240
gctt 244
<210> 23
<211> 207
<212> DNA
<213> SV40 virus
<220>
<223> SV40 terminator
<400> 23
tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc 60
tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 120
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 180
attctagttg tggtttgtcc aaactca 207
<210> 24
<211> 765
<212> DNA
<213> Eumeta japonica
<400> 24
atgagagctc tgaccttcgt gatcctgtgc tgcgctttgc agcaatatgc atcagcaaag 60
gcggattggt atgaagattg gaaaaaaaac caaggttcat ttagagaaac agacttagca 120
gacactgacg aatatcaaac agatagtaat ggtacaatgt ttgaaaaaaa aacaacaaga 180
aaaaagttcg aaaaagatgg aagtactatg gtaaacagtg attccggaga agataaaatt 240
gtacgaactt tcgtcgtgga aactgacgca tcaggacatg aagttattta tgaagaagat 300
gtagtcatta aaaaagttcc aggtaaacgg aagaaagttt cacaggcaaa tgctaaagct 360
agtgctatag cagccagtgt aggtgcgggc gttggagcag cttccgttgc tggtgcagga 420
acaggagctg gctcaggtgc agctggtgga gcaggagcag gtgctgacgc tggcgctgca 480
gccgccgctg cggcagcagc acaagcagca gccgcagctg ctgccgccgc aggtagtggc 540
gctggtgctg gacgagtcgg agcttacgga ccctacggag gtttagcaag cgctggtgct 600
ggtggtgctg gcggagccgg tggtgcaggt ggatacggtg gtgcaagtgt cgtctacgta 660
ggtggcggag gagccggagc aggtgccggt tcaggcgccg gtgctggatc gggtgccgga 720
gcaggagctg gatcaggtgc aggagcaggt ggagcaggag ccgca 765
<210> 25
<211> 1023
<212> DNA
<213> Eumeta japonica
<400> 25
gcaggtgctg gcggcgctgc tggtgctggt ggtgctggcg gagccggtgg tgcaggtgga 60
tacggtggtg caggtgtcgt ctacgtaagt gctggaggag ccggagcagg tgccggttca 120
ggcgccggtg ctggatcggg tgccggagca ggagctggat caggtgcagg agcaggtgga 180
gcaggagccg cagccggagc tggtgctggt gctggttcag gtgcaggatc cggttcaggt 240
gcgggcgctg gagcaggttc cggagcagga gcaggttccg gtgctggtgc aggagcagga 300
gctggttcag gtgcagcagg tggagcagga gctggcgctg gcgctggcgc tgcagccgca 360
gccgcagcag cagcagaagc ggcagccgca gctgccgccg ccgctgccgc cgcaggtagt 420
ggagcaggcg ctggaggagc cggaggctac ggagcgggag ctggagcagg tgccggtgca 480
ggtgctggcg gcgcatctgg aggctacggt tcttacggat cgggagttgc agcaggtgcc 540
ggtgcaggag ctggtgttgg tggtagcagg ggagcaggtg ttggcgctgg tgttggtgct 600
ggttatggct ccgcattgaa ttcaggagcc ggtgccggag caggtgctgg tgctggagct 660
ggtggtgctg caggagctgg tgctggtgca ggagcaggag ctggttcagg tgcagcaggt 720
ggagcaggag ctggcgctgg cgctggcgct gcagccgcag ccgcagcagc agcagaagcg 780
gcagccgcag ctgccgccgc cgctgccgcc gctggaggag ccggaggcta cggagcggga 840
gctggagcag gtgccggtgc aggtgctggc ggcgctggtg gtgctggtgg tgctggcgga 900
gccggtggtg caggtggata cggtggtgca ggtgtcgtct acgtaagtgc tggaggagcc 960
ggagcaggtg ccggttcagg cgccggtgct ggatcgggtg ccggagcagg agctggatca 1020
ggt 1023
<210> 26
<211> 333
<212> DNA
<213> Eumeta japonica
<400> 26
ggtgctggcg gcgcatctgg aggctacggt tcttacggat cgggagttgc agcaggtgcc 60
ggtgcaggag ctggtgttgg tggtagcagg ggagcaggtg ttggcgctgg tgttggtgct 120
ggttatggct ccgcattgaa ttcaggagcc ggtgccggag caggtgctgg tgctggagct 180
ggtggtgctg caggagctgg tgctggtgca ggagcaggag ctggcgctgg agctggattc 240
gcttcttatg gaagaccagg tgttcgtgga tgtcaactgt ctcgtaaata ccttttggtt 300
aaagttggtt taagatccac atgctcagat tgt 333
<210> 27
<211> 29
<212> DNA
<213> Artificial
<220>
<223> EvHFB-F21 primer
<400> 27
catcagcaaa ggcggattgg tatgaagat 29
<210> 28
<211> 29
<212> DNA
<213> Artificial
<220>
<223> EvHFB-R26 primer
<400> 28
ggctcctcca gcacttacgt agacgacac 29
<210> 29
<211> 26
<212> DNA
<213> Artificial
<220>
<223> EvHFB-F26 primer
<400> 29
tgtcgtctac gtaggtggcg gaggag 26
<210> 30
<211> 30
<212> DNA
<213> Artificial
<220>
<223> EvHFB-R12 primer
<400> 30
atttacgaga cagttgacat ccacgaacac 30
<210> 31
<211> 25
<212> DNA
<213> Artificial
<220>
<223> EvHFB-F12 primer
<400> 31
cagcaaaggc ggattggtat gaaga 25
<210> 32
<211> 32
<212> DNA
<213> Artificial
<220>
<223> EvHFB-F31 primer
<400> 32
gctagatcta tagcagccag tgtaggtgcg gg 32
<210> 33
<211> 33
<212> DNA
<213> Artificial
<220>
<223> EvHFB-R31 primer
<400> 33
cctggtcttc cataagagtc gactccagct cca 33
Claims (17)
- 서열 번호 5로 표시되는 아미노산 서열을 포함하는 개변형 도롱이벌레 피브로인 H쇄를 코드하는 유전자.
- 삭제
- 제1항에 있어서, 상기 개변형 도롱이벌레 피브로인 H쇄가
서열 번호 7로 표시되는 아미노산 서열, 또는
서열 번호 7로 표시되는 아미노산 서열의 서열 번호 5로 표시되는 아미노산 서열 이외에 있어서 하나 또는 복수 개의 아미노산이 부가, 결실 또는 치환된 아미노산 서열을 포함하는 유전자. - 제1항에 있어서, 상기 개변형 도롱이벌레 피브로인 H쇄가 누에 피브로인 H쇄를 코드하는 유전자의 일부를 포함하는 유전자.
- 제4항에 있어서, 상기 개변형 도롱이벌레 피브로인 H쇄가
서열 번호 9로 표시되는 아미노산 서열, 또는
서열 번호 9로 표시되는 아미노산 서열의 서열 번호 5로 표시되는 아미노산 서열 이외에 있어서 하나 또는 복수 개의 아미노산이 부가, 결실 또는 치환된 아미노산 서열을 포함하는 유전자. - 나비목(Lepidoptera) 곤충 유래의 후부 견사선 발현 프로모터 및 제1항 및 제3항 내지 제5항 중 어느 한 항에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자를 누에 세포 내에서 발현 가능한 상태로 포함하고,
상기 개변형 도롱이벌레 피브로인 H쇄 유전자는, 상기 후부 견사선 발현 프로모터에 의한 직접적 또는 간접적인 발현 제어를 받도록 배치되어 있는 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터. - 제6항에 있어서, 나비목 곤충 유래의 후부 견사선 발현 프로모터 및 이 프로모터의 하류 제어 하에 배치된 상기 개변형 도롱이벌레 피브로인 H쇄 유전자를 포함하는 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
- 제6항에 있어서, 나비목 곤충 유래의 후부 견사선 발현 프로모터 및 이 프로모터의 하류 제어 하에 배치된 전사 조절 인자를 코드하는 유전자를 포함하는 제1 발현 유닛, 및
상기 전사 조절 인자의 표적 프로모터 및 이 표적 프로모터의 하류 제어 하에 배치된 개변형 도롱이벌레 피브로인 H쇄 유전자를 포함하는 제2 발현 유닛
으로 구성되는 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터. - 제8항에 있어서, 상기 전사 조절 인자를 코드하는 유전자가 GAL4 유전자이고, 상기 전사 조절 인자의 표적 프로모터가 UAS 프로모터인 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
- 제6항에 있어서, 상기 후부 견사선 발현 프로모터가 후부 견사선 특이적 프로모터인 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
- 제10항에 있어서, 상기 후부 견사선 특이적 프로모터가 피브로인 H쇄, 피브로인 L쇄 또는 p25 중 어느 한 프로모터인 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
- 제6항에 있어서, 상기 나비목 곤충이 누에인 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터.
- 제6항에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터를 포함하는 유전자 재조합 누에.
- 제6항에 기재한 개변형 도롱이벌레 피브로인 H쇄 유전자 발현 벡터를 숙주인 누에에 도입하는 공정,
상기 발현 벡터를 포함하는 유전자 재조합 누에를 선택하는 공정
을 포함하는 하이브리드 견사를 토사하는 유전자 재조합 누에의 작출 방법. - 제8항에 기재한 제1 발현 유닛을 갖는 유전자 재조합 누에와, 제8항에 기재한 제2 발현 유닛을 갖는 유전자 재조합 누에를 교배시키는 공정, 및
상기 교배 후의 후대로부터 상기 제1 및 제2 발현 유닛을 갖는 유전자 재조합 누에를 선택하는 공정
을 포함하는 하이브리드 견사를 토사하는 유전자 재조합 누에의 작출 방법. - 제13항에 기재한 유전자 재조합 누에에게 고치짓기를 시키는 공정,
고치를 회수하는 공정, 및
회수한 고치로부터 하이브리드 견사를 조사(繰絲)하는 공정
을 포함하는 개변형 도롱이벌레 견사를 생산하는 방법. - 제13항에 기재한 유전자 재조합 누에가 토사한 하이브리드 견사.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2016-204592 | 2016-10-18 | ||
JP2016204592 | 2016-10-18 | ||
PCT/JP2017/037327 WO2018074403A1 (ja) | 2016-10-18 | 2017-10-16 | 遺伝子組換えミノムシ絹糸 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190065410A KR20190065410A (ko) | 2019-06-11 |
KR102563658B1 true KR102563658B1 (ko) | 2023-08-03 |
Family
ID=62018615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197013824A KR102563658B1 (ko) | 2016-10-18 | 2017-10-16 | 유전자 재조합 도롱이벌레 견사 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11220529B2 (ko) |
EP (1) | EP3530735A4 (ko) |
JP (1) | JP6990413B2 (ko) |
KR (1) | KR102563658B1 (ko) |
CN (2) | CN116195554A (ko) |
IL (1) | IL266090A (ko) |
WO (1) | WO2018074403A1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112639180A (zh) * | 2018-08-27 | 2021-04-09 | 国立研究开发法人农业·食品产业技术综合研究机构 | 来源于被吐出在基材表面上的袋蛾幼虫绢丝的丝块生产方法 |
US20220220165A1 (en) * | 2019-05-23 | 2022-07-14 | Kowa Company, Ltd. | Mass production system of recombinant bagworm silk protein |
CN114717261B (zh) * | 2022-03-04 | 2024-02-27 | 西南大学 | 一种通过特异调控家蚕内源丝蛋白提高蚕丝机械性能的方法及其家蚕品种 |
CN114480410A (zh) * | 2022-03-04 | 2022-05-13 | 西南大学 | 一种利用袋蛾丝蛋白提高蚕丝机械性能的转基因方法及其家蚕品种 |
WO2023190453A1 (ja) | 2022-03-30 | 2023-10-05 | 国立研究開発法人農業・食品産業技術総合研究機構 | キメラ絹糸を生産するゲノム改変カイコ |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012050919A2 (en) * | 2010-09-28 | 2012-04-19 | The University Of Notre Dame | Chimeric spider silk and uses thereof |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005068495A1 (ja) * | 2004-01-13 | 2005-07-28 | Toray Industries, Inc. | クモ糸タンパク質を含む絹糸および該絹糸を産生するカイコ |
JP2012187123A (ja) * | 2004-09-27 | 2012-10-04 | National Institute Of Agrobiological Sciences | カイコ中部絹糸腺特異的遺伝子発現系を利用したタンパク質の製造方法 |
JP2007222106A (ja) * | 2006-02-24 | 2007-09-06 | Toray Ind Inc | カイコにおける組換えタンパク質生産に用いる発現カセット |
JP5691052B2 (ja) * | 2010-09-10 | 2015-04-01 | 岡本株式会社 | 組換え生物及び組換え生物により作られるタンパク質 |
CN104903445B (zh) * | 2012-12-25 | 2017-09-12 | 国立研究开发法人农业生物资源研究所 | 后部绢丝腺基因表达单元及具有其的转基因绢丝虫 |
JP6556122B2 (ja) * | 2013-09-17 | 2019-08-07 | ボルト スレッズ インコーポレイテッド | 改良シルク繊維を合成するための方法および組成物 |
JP6298421B2 (ja) | 2015-04-28 | 2018-03-20 | 大日精化工業株式会社 | ポリヒドロキシウレタン水分散体組成物、及び該水分散体組成物を用いてなるガスバリア性水性コーティング剤、ガスバリア性フィルム |
-
2017
- 2017-10-16 CN CN202310215279.4A patent/CN116195554A/zh active Pending
- 2017-10-16 CN CN201780064025.XA patent/CN109844112B/zh active Active
- 2017-10-16 JP JP2018546315A patent/JP6990413B2/ja active Active
- 2017-10-16 US US16/342,837 patent/US11220529B2/en active Active
- 2017-10-16 WO PCT/JP2017/037327 patent/WO2018074403A1/ja unknown
- 2017-10-16 KR KR1020197013824A patent/KR102563658B1/ko active IP Right Grant
- 2017-10-16 EP EP17862918.4A patent/EP3530735A4/en active Pending
-
2019
- 2019-04-17 IL IL266090A patent/IL266090A/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012050919A2 (en) * | 2010-09-28 | 2012-04-19 | The University Of Notre Dame | Chimeric spider silk and uses thereof |
Non-Patent Citations (1)
Title |
---|
Fu C. et al, Chem. commun. pp.6515~6529 (2009. 8. 7.)* |
Also Published As
Publication number | Publication date |
---|---|
EP3530735A4 (en) | 2020-03-18 |
JP6990413B2 (ja) | 2022-02-03 |
WO2018074403A1 (ja) | 2018-04-26 |
IL266090A (en) | 2019-06-30 |
US20190256565A1 (en) | 2019-08-22 |
CN109844112B (zh) | 2023-06-09 |
JPWO2018074403A1 (ja) | 2019-08-08 |
KR20190065410A (ko) | 2019-06-11 |
EP3530735A1 (en) | 2019-08-28 |
CN109844112A (zh) | 2019-06-04 |
US11220529B2 (en) | 2022-01-11 |
CN116195554A (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102563658B1 (ko) | 유전자 재조합 도롱이벌레 견사 | |
Komatsu et al. | Mutations in a cyclic nucleotide–gated channel lead to abnormal thermosensation and chemosensation in C. elegans | |
Dippel et al. | Morphological and transcriptomic analysis of a beetle chemosensory system reveals a gnathal olfactory center | |
CN101321777B (zh) | 丝蛋白 | |
CN110719732B (zh) | 表达蜘蛛丝的转基因蚕 | |
Dickson et al. | Prepattern in the developing Drosophila eye revealed by an activated torso--sevenless chimeric receptor. | |
KR20060105054A (ko) | 거미줄 단백질을 포함하는 견사 및 상기 견사를 생산하는누에 | |
KR20060054490A (ko) | 유전자 재조합 누에를 이용한 생리 활성 단백질 생산법 | |
JP2016093148A (ja) | 雌蚕致死カイコ系統 | |
Roller et al. | Molecular cloning, expression and identification of the promoter regulatory region for the neuropeptide trissin in the nervous system of the silkmoth Bombyx mori | |
Takasu et al. | Fibroin heavy chain gene replacement with a highly ordered synthetic repeat sequence in Bombyx mori | |
Carr et al. | Molecular evolution of Hox gene regulation: cloning and transgenic analysis of the lamprey HoxQ8 gene | |
JP5997772B2 (ja) | カイコフィブロイン重鎖遺伝子の突然変異配列、及び突然変異を誘発する方法と応用 | |
Walrad et al. | Distinct contributions of conserved modules to Runt transcription factor activity | |
US9828611B2 (en) | Exogenous gene expression vector, transformant discrimination marker, and transformant | |
WO2023190453A1 (ja) | キメラ絹糸を生産するゲノム改変カイコ | |
KR101634275B1 (ko) | 청색 형광 실크를 생산하는 형질전환 누에 | |
Liu et al. | Insights into regulatory characteristics of the promoters of Sericin 1 and Sericin 3 in transgenic silkworms | |
CA2413449A1 (en) | Altered wool and hair fibres | |
JP5794620B2 (ja) | アリールアルキルアミン−n−アセチルトランスフェラーゼ遺伝子とその利用 | |
WO2016125885A1 (ja) | 細胞死誘導ベクター及びそれを有する部位特異的細胞死誘導カイコ系統 | |
KR102114194B1 (ko) | 킬러레드 단백질을 발현하는 실크를 생산하는 형질전환 누에 | |
Ahn et al. | The C. elegans DAF-19M module: a shift from general ciliogenesis to ciliary and behavioral specialization | |
CN114480410A (zh) | 一种利用袋蛾丝蛋白提高蚕丝机械性能的转基因方法及其家蚕品种 | |
KR100820292B1 (ko) | 까막전복의 액틴 유전자 프로모터를 포함하는 발현벡터 및이의 용도 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |