CN113402596A - 双叉犀金龟rr-2家族表皮蛋白,编码核苷酸序列及其应用 - Google Patents
双叉犀金龟rr-2家族表皮蛋白,编码核苷酸序列及其应用 Download PDFInfo
- Publication number
- CN113402596A CN113402596A CN202110577600.4A CN202110577600A CN113402596A CN 113402596 A CN113402596 A CN 113402596A CN 202110577600 A CN202110577600 A CN 202110577600A CN 113402596 A CN113402596 A CN 113402596A
- Authority
- CN
- China
- Prior art keywords
- nucleotide sequence
- protein
- seq
- primer
- steps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 110
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 87
- 239000002773 nucleotide Substances 0.000 title claims abstract description 71
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 71
- 241000254062 Scarabaeidae Species 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 32
- 241000282806 Rhinoceros Species 0.000 claims abstract description 15
- 150000001413 amino acids Chemical class 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 19
- 230000014509 gene expression Effects 0.000 claims description 16
- 244000005700 microbiome Species 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 9
- 239000012620 biological material Substances 0.000 claims description 8
- 238000011144 upstream manufacturing Methods 0.000 claims description 8
- 241000588724 Escherichia coli Species 0.000 claims description 7
- 239000003153 chemical reaction reagent Substances 0.000 claims description 7
- 210000004027 cell Anatomy 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 5
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 2
- 241001247319 Cuora Species 0.000 claims description 2
- 241000589516 Pseudomonas Species 0.000 claims description 2
- 230000004952 protein activity Effects 0.000 claims description 2
- 210000005253 yeast cell Anatomy 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 7
- 241000277334 Oncorhynchus Species 0.000 claims 1
- 229920002101 Chitin Polymers 0.000 abstract description 26
- 241000238631 Hexapoda Species 0.000 abstract description 16
- 241000130993 Scarabaeus <genus> Species 0.000 abstract description 13
- 210000002615 epidermis Anatomy 0.000 abstract description 8
- 230000008569 process Effects 0.000 abstract description 6
- 238000011160 research Methods 0.000 abstract description 6
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 abstract description 5
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 abstract description 5
- 239000007791 liquid phase Substances 0.000 abstract description 5
- 238000005191 phase separation Methods 0.000 abstract description 5
- 238000011161 development Methods 0.000 abstract description 3
- 239000000463 material Substances 0.000 abstract description 3
- 239000011664 nicotinic acid Substances 0.000 abstract description 2
- 230000035790 physiological processes and functions Effects 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 74
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 18
- 229940024606 amino acid Drugs 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000003752 polymerase chain reaction Methods 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 239000006228 supernatant Substances 0.000 description 10
- 239000002299 complementary DNA Substances 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 239000007983 Tris buffer Substances 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 7
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 239000012460 protein solution Substances 0.000 description 6
- 238000003259 recombinant expression Methods 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical group NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 239000004570 mortar (masonry) Substances 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 229920001661 Chitosan Polymers 0.000 description 3
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 3
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 239000012154 double-distilled water Substances 0.000 description 3
- 239000012149 elution buffer Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000000227 grinding Methods 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 2
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241000254022 Locusta migratoria Species 0.000 description 2
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000012148 binding buffer Substances 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 230000009465 prokaryotic expression Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- NJWJSLCQEDMGNC-MBLNEYKQSA-N Ala-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N)O NJWJSLCQEDMGNC-MBLNEYKQSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241001674044 Blattodea Species 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 241000270617 Cheloniidae Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000220457 Crotalaria Species 0.000 description 1
- 101100532034 Drosophila melanogaster RTase gene Proteins 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 1
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 239000012880 LB liquid culture medium Substances 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- YRKFKTQRVBJYLT-CQDKDKBSSA-N Phe-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 YRKFKTQRVBJYLT-CQDKDKBSSA-N 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000253973 Schistocerca gregaria Species 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 241000270708 Testudinidae Species 0.000 description 1
- 241001052560 Thallis Species 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 150000001371 alpha-amino acids Chemical class 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 150000001576 beta-amino acids Chemical class 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 102000021178 chitin binding proteins Human genes 0.000 description 1
- 108091011157 chitin binding proteins Proteins 0.000 description 1
- YTRQFSDWAXHJCC-UHFFFAOYSA-N chloroform;phenol Chemical compound ClC(Cl)Cl.OC1=CC=CC=C1 YTRQFSDWAXHJCC-UHFFFAOYSA-N 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 238000001906 matrix-assisted laser desorption--ionisation mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000029052 metamorphosis Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 230000037125 natural defense Effects 0.000 description 1
- 229910001453 nickel ion Inorganic materials 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000019617 pupation Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000000539 two dimensional gel electrophoresis Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Toxicology (AREA)
- Plant Pathology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Microbiology (AREA)
- Insects & Arthropods (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了一种双叉犀金龟RR‑2家族表皮蛋白,编码核苷酸序列及其应用,涉及生物工程技术领域。本发明以昆虫双叉犀金龟为研究对象,发现了一种新的RR‑2亚家族蛋白基因,命名为Td14144,并成功获得该基因的重组蛋白,具有在常温下发生液液相分离的特性,能够结合不同类型的几丁质,为研究RR‑2亚家族表皮蛋白提供了新的基因资源,将有助于阐明昆虫表皮的结构、生理功能及其在昆虫发育过程中所扮演的角色,可以用于开发具有质量轻、韧性强、抗断裂性能强、疏水等优异性能的仿生材料。
Description
技术领域
本发明涉及生物工程技术领域,具体涉及一种双叉犀金龟RR-2家族表皮蛋白,编码核苷酸序列及其应用。
背景技术
昆虫作为世界上最古老的生物,其强大的适应性以及特殊的身体构造是其如今拥有庞大数量的有力保障,表皮结构就是其中保障之一。昆虫表皮的主要组成成分是几丁质和表皮蛋白。几丁质是N-乙酰葡萄糖胺聚合而成,结构明晰。不同类型表皮的几丁质分子链长和乙酰化程度的差异很小,因而表皮蛋白基因种类和数量的变化是影响表皮结构及其机械性能的重要因素,所以,一直以来表皮蛋白被认为是昆虫重要的结构蛋白。根据昆虫表皮蛋白的序列特征,将其划分为CPR(有Rebers&Riddiford保守基序)、CPF(有一段长44个氨基酸的高度保守区域)、CPFL(CPF like)、Tweedle(含有4个保守的区域)、CPAPI(有1个ChBD2几丁质结合域)、CPAP3(有3个ChtBD2几丁质结合域),CPG(有许多短的甘氨酸重复序列)、CPLC(一类含有低复杂序列的蛋白)和Apidermin等12个家族。其中,CRR家族可分成3个亚族,即RR-1,主要存在柔软表皮层,RR-2主要存在坚硬表皮层,RR-3,目前对其研究不多。
目前,对昆虫表皮蛋白的研究中,以模式昆虫的研究较为深入,如日本学者从家蚕翅原基化蛹前cDNA库中随机选出cDNA进行序列测定,鉴定了10种不同的表皮蛋白基因。韩国全南国立大学YasuyukiArakane课题组以赤拟谷盗为对象,研究鞘翅中高丰度的表皮蛋白功能。Nohr等利用双向电泳技术,发现飞蝗内外表皮蛋白组成具有明显的差异性。Andersen等利用MALDI–MS技术,从沙漠蝗中分析鉴定出8个内表皮蛋白;从飞蝗和蟑螂中鉴定出了多个蜕皮后蛋白(内表皮合成时期),这些研究为表皮蛋白在昆虫变态发育和表皮形成过程的作用机制研究奠定了基础。
然而,目前对昆虫表皮蛋白的研究主要针对内外表皮差异、表皮蛋白的鉴定、分类、提取等方面,对于其生物学功能研究较少。
发明内容
本发明第一方面提供了一种双叉犀金龟(Trypoxylus dichotomu)RR-2家族表皮蛋白,所述表皮蛋白的氨基酸序列包含或由如下序列组成:
a)SEQ ID NO.1所示的氨基酸序列;或,
b)与SEQ ID NO.1所示的氨基酸序列具有至少70%序列同一性的功能性同源序列;或
c)在SEQ ID NO.1所示的氨基酸序列中缺失、添加、替换一个或多个氨基酸且具有相同蛋白活性的氨基酸序列。
双叉犀金龟的头角是由其表皮特化而来,它是一种天然的防御攻击武器,具有显著的抗断裂韧性和抗形变刚性。本发明以双叉犀金龟为研究对象,从其头角中发现了一种新的RR-2亚家族蛋白基因,自定义命名为Td14144,并成功获得该基因的重组蛋白(即上述的双叉犀金龟表皮蛋白,本发明中也命名为Td14144)。Td14144表皮蛋白具有在常温下发生液液相分离的特性,且能够结合不同类型的几丁质。
在本发明的一种实施方式中,所述双叉犀金龟表皮蛋白Td14144的氨基酸序列为SEQ ID NO.1所示:GLIPAAPALSLGHAALAAPALSLGHAVGPALSLSHTALAAPAISLGHAVAAPALSLGHAAVAAPAYGIGHGLGLGYGLGHGAIAAPALVKAAPAIVKAAPAVDYVAYPKYEFNYGVSDAHTGDQKTQHEIRDGDVVKGSYSLHEADGTVRTVHYEADDHNGFNAVVTRSGHAAHPATPIAVAAPAKTIIAAPAIAHAAPVFAHAGPALAYGGLYGYKG,序列长度为218个氨基酸。
在本发明的一种实施方式中,所述双叉犀金龟表皮蛋白Td14144的氨基酸序列为与SEQ ID NO.1所示的氨基酸序列具有至少70%序列同一性的功能性同源序列。所述功能性同源序列包括但不限于SEQ ID NO.1所示的氨基酸具有约70%或以上、72%或以上、74%或以上、76%或以上、78%或以上、80%或以上、82%或以上、84%或以上、85%或以上、88%或以上、90%或以上、92%或以上、93%或以上、94%或以上、95%或以上、96%或以上、97%或以上、98%或以上、99%或以上、99.5%或以上、99.9%或以上同一性的氨基酸序列。
在本发明的一种实施方式中,所述双叉犀金龟表皮蛋白Td14144的氨基酸序列为在SEQ ID NO.1所示的氨基酸序列中添加、缺失、替换一个或多个(例如可以为1-10个,具体地,可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个)氨基酸且具有相同活性的氨基酸序列。例如,在SEQ ID NO.1所示的氨基酸序列的N端和/或C端连接标签得到的氨基酸序列。
在本发明的一种实施方式中,所述双叉犀金龟表皮蛋白Td14144的氨基酸序列为SEQ ID NO.2所示:MFAKVFAIATFVATAQAGLIPAAPALSLGHAALAAPALSLGHAVGPALSLSHTALAAPAISLGHAVAAPALSLGHAAVAAPAYGIGHGLGLGYGLGHGAIAAPALVKAAPAIVKAAPAVDYVAYPKYEFNYGVSDAHTGDQKTQHEIRDGDVVKGSYSLHEADGTVRTVHYEADDHNGFNAVVTRSGHAAHPATPIAVAAPAKTIIAAPAIAHAAPVFAHAGPALAYGGLYGYKG,(划线部分为信号肽区域),序列长度为235个氨基酸,其N端包含有长度为17个氨基酸的信号肽区域。
本发明第二方面提供了编码所述双叉犀金龟表皮蛋白Td14144的核苷酸序列。
进一步,编码表皮蛋白Td14144的核苷酸序列包含或由如下序列组成:
i)SEQ ID NO.3所示的核苷酸序列;或,
ii)SEQ ID NO.3所示的核苷酸序列的互补序列、简并序列或同源序列;或,
iii)在严紧条件下与SEQ ID NO.3所示的核苷酸序列杂交,且能够编码所述表皮蛋白的核苷
酸序列。
在本发明的一种实施方式中,所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列为SEQ ID NO.3所示:GGCCTAATACCAGCTGCACCAGCTCTTTCCCTTGGACATGCCGCCCTAGCAGCTCCAGCACTATCGCTTGGTCATGCTGTTGGACCGGCTCTTTCGCTTAGCCATACAGCGTTAGCCGCCCCAGCTATCTCTCTAGGTCATGCAGTTGCTGCCCCAGCTCTTTCTCTTGGTCACGCCGCTGTCGCTGCTCCAGCTTACGGAATAGGTCATGGATTGGGATTGGGGTATGGACTTGGACACGGAGCCATCGCCGCACCAGCTCTTGTTAAAGCCGCACCTGCTATCGTAAAGGCAGCTCCAGCTGTTGATTATGTGGCATATCCGAAATACGAATTCAACTACGGAGTCTCCGATGCCCACACCGGCGATCAAAAAACCCAACATGAAATCCGCGATGGTGACGTAGTAAAAGGCTCATACTCCCTCCACGAAGCCGATGGCACCGTCCGTACCGTCCACTACGAAGCCGATGATCATAACGGCTTCAACGCAGTTGTAACCAGATCAGGACACGCTGCGCATCCTGCTACACCAATTGCCGTCGCGGCTCCCGCCAAAACCATCATTGCAGCTCCAGCTATAGCGCACGCAGCCCCAGTCTTCGCGCACGCTGGTCCAGCGTTGGCGTACGGAGGATTGTACGGTTACAAGGGTTAG,序列长度为657个碱基,对应于编码具有SEQ ID NO.1所示氨基酸的双叉犀金龟表皮蛋白。
在本发明的一种实施方式中,所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列为SEQ ID NO.3所示的核苷酸序列按照碱基互补配对原则形成的互补序列,互补序列可以为具有编码表皮蛋白Td14144功能的不完全互补序列或完全互补序列。
在本发明的一种实施方式中,所述编码表皮蛋白Td14144的核苷酸序列为SEQ IDNO.3所示的核苷酸序列的简并序列。简并序列是指改变SEQ ID NO.3核苷酸某个或多个核苷酸序列后,改变的核苷酸序列位置对应编码的氨基酸种类不变,不会影响核苷酸序列的编码功能和表达水平。
在本发明的一种实施方式中,所述编码表皮蛋白Td14144的核苷酸序列为SEQ IDNO.3所示的核苷酸序列的同源序列。所述同源核苷酸序列包括在SEQ ID NO.3所示的核苷酸序列中添加和/或取代和/或缺失一个或几个核苷酸而生成的可编码具有表皮蛋白Td14144相同活性的突变基因、等位基因或衍生物。
进一步优选同源序列为与SEQ ID NO.3所示的核苷酸序列约70%或以上、71%或以上、72%或以上、73%或以上、74%或以上、75%或以上、76%或以上、77%或以上、78%或以上、79%或以上、80%或以上、81%或以上、82%或以上、83%或以上、84%或以上、85%或以上、86%或以上、87%或以上、88%或以上、89%或以上、90%或以上、91%或以上、92%或以上、93%或以上、94%或以上、95%或以上、96%或以上、97%或以上、98%或以上、99%或以上、99.1%或以上、99.2%或以上、99.3%或以上、99.4%或以上、99.5%或以上、99.6%或以上、99.7%或以上、99.8%或以上、或99.9%或以上同一性且具备编码表皮蛋白Td14144功能的多核苷酸。
在本发明的一种实施方式中,所述编码表皮蛋白Td14144的核苷酸序列为在严紧条件下与SEQ ID NO.3的核苷酸序列杂交,且能够编码表皮蛋白Td14144的核苷酸序列。示例性地,所述“严紧条件”是指探针将与其靶序列杂交至可探测程度超过与其它序列杂交(如至少2倍于背景)的条件。严紧条件具有序列依赖性,且因环境的不同而不同。通过控制杂交和/或洗涤条件的严紧性,可以鉴定与探针100%互补的靶序列。可选择地,可以调节严紧条件以允许一些序列错配,使得探测到较低程度的同一性。
进一步,所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列为SEQ ID NO.4所示:ATGTTCGCTAAGGTTTTCGCAATCGCTACATTTGTAGCCACCGCACAAGCTGGCCTAATACCAGCTGCACCAGCTCTTTCCCTTGGACATGCCGCCCTAGCAGCTCCAGCACTATCGCTTGGTCATGCTGTTGGACCGGCTCTTTCGCTTAGCCATACAGCGTTAGCCGCCCCAGCTATCTCTCTAGGTCATGCAGTTGCTGCCCCAGCTCTTTCTCTTGGTCACGCCGCTGTCGCTGCTCCAGCTTACGGAATAGGTCATGGATTGGGATTGGGGTATGGACTTGGACACGGAGCCATCGCCGCACCAGCTCTTGTTAAAGCCGCACCTGCTATCGTAAAGGCAGCTCCAGCTGTTGATTATGTGGCATATCCGAAATACGAATTCAACTACGGAGTCTCCGATGCCCACACCGGCGATCAAAAAACCCAACATGAAATCCGCGATGGTGACGTAGTAAAAGGCTCATACTCCCTCCACGAAGCCGATGGCACCGTCCGTACCGTCCACTACGAAGCCGATGATCATAACGGCTTCAACGCAGTTGTAACCAGATCAGGACACGCTGCGCATCCTGCTACACCAATTGCCGTCGCGGCTCCCGCCAAAACCATCATTGCAGCTCCAGCTATAGCGCACGCAGCCCCAGTCTTCGCGCACGCTGGTCCAGCGTTGGCGTACGGAGGATTGTACGGTTACAAGGGTTAG,序列长度为708个碱基,对应于编码具有SEQ ID NO.2所示氨基酸的双叉犀金龟表皮蛋白。
进一步,所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列为SEQ ID NO.5所示:
本发明第三方面提供了用于检测或扩增所述编码双叉犀金龟表皮蛋白Td14144的核苷酸序列的引物。
在本发明的一种优选地实施方式中,所述引物包括上游克隆引物P1和/或下游克隆引物P2;其中,所述上游克隆引物P1的核苷酸序列如SEQ ID NO.6所示:5’-ATGTTCGCTAAGGTTTTCGCAATCG-3’;所述下游克隆引物P2的核苷酸序列如SEQ ID NO.7所示:5’-CTAACCCTTGTAACCGTACAATCCTCCG-3’。
在本发明的一种优选地实施方式中,所述引物包括上游连接引物P3和/或下游连接引物P4;其中,所述上游连接引物P3的核苷酸序列如SEQ ID NO.8所示:5’-AGGAGATATACCATGGGCTTAATACCAGCTGCACCAG-3’;所述下游连接引物P4的核苷酸序列如SEQ ID NO.9所示:5’-GACGGAGCTCGAATTCCTAACCCTTGTAACCGTACAATCCTCC-3’。
本发明中,所述双叉犀金龟表皮蛋白Td14144的应用包括以下几个方面:(1)表皮蛋白Td14144氨基酸序列或至少部分氨基酸序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质;(2)涉及表皮蛋白Td14144及相关截短体、突变体、多肽的生物合成;(3)涉及表皮蛋白Td14144开发相关生物材料的应用。
所述的编码核苷酸序列的应用包括以下几个方面:(1)本发明所提供的核苷酸序列或至少部分核苷酸序列被修饰或突变,修饰或突变的途径包括插入、缺失,聚合酶链式反应(PCR),易错PCR,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化,或通过化学试剂诱变等。(2)本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因通过合适的表达体系在外源宿主中表达以得到相应的表皮蛋白或其他更高的生物活性或产量。(3)本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组质粒以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。
本发明第四方面提供了与所述双叉犀金龟表皮蛋白Td14144,或所述编码核苷酸序列,或所述引物有关的生物材料或物质,其选自:
A1):含有所述表皮蛋白Td14144的生物材料;
A2):含有所述编码核苷酸的表达盒;
A3):含有所述编码核苷酸的重组载体;
A4):含有A2)所述表达盒的重组载体;
A5):含有所述编码核苷酸的重组微生物;
A6):含有A2)所述表达盒的重组微生物;
A7):含有A3)所述重组载体的重组微生物;
A8):含有A4)所述重组载体的重组微生物;
A9):含有所述引物的试剂;
A10)含有A9)或所述引物的试剂盒。
进一步,对于重组载体的种类不作具体限定,可以根据需要选择适合的载体。例如载体包括但不限于pET28a、pcdna3.1、pUC18、pBR322、pUC19、pGEX2T或pESC-Ura,优选pET28a。
进一步,所述重组微生物包括但不限于大肠杆菌、假单孢菌、芽孢杆菌、酵母细胞中的至少一种。优选大肠杆菌BL21(DE3)。
本发明第五方面提供了制备所述表皮蛋白的方法,包括以下步骤:
将所述的编码表皮蛋白Td14144的核苷酸序列,或所述的相关生物材料或物质(例如所述的表达盒,所述的重组载体)导入宿主细胞中表达获得所述表皮蛋白。
本发明一种优选地实施方式中,制备所述表皮蛋白Td14144的方法,包括以下步骤:
步骤一:合成序列表SEQ ID NO.4所示的核苷酸序列;
步骤二:根据步骤一的核苷酸序列,构建的重组载体以及相对应的重组表达基因工程菌;
步骤三:将步骤二获得的重组基因工程菌进行原核表达,并对获得的蛋白进行纯化,得到所述的表皮蛋白Td14144。
本发明采用上述技术方案具有以下有益效果:
(1)本发明提供了一种新发现的双叉犀金龟RR-2亚族的表皮蛋白,为研究RR-2亚家族表皮蛋白提供了新的基因资源,将有助于阐明昆虫表皮的结构、生理功能及其在昆虫发育过程中所扮演的角色。
(2)本发明提供的双叉犀金龟表皮蛋白Td14144,具有液液相分离的特性,且能够结合不同类型的几丁质,可以用于开发具有质量轻、韧性强、抗断裂性能强、疏水等优异性能的仿生材料。
附图说明
图1所示为实施例1中表皮蛋白Td14144的基因克隆结果图。其中:M是标准核酸分子量MarkerDL2000,泳道1是大约708bp的Td14144表皮蛋白基因。
图2所示为实施例1中表皮蛋白Td14144的表达与纯化图。图中:M是标准蛋白质分子量Marker;泳道1是洗脱缓冲液为20mmol/L的咪唑浓度;泳道2是洗脱缓冲液为90mmol/L的咪唑浓度,泳道3是洗脱缓冲液为250mmol/L的咪唑浓度洗脱下来纯化的表皮蛋白Td14144;泳道4是表皮蛋白Td14144的western blot验证。
图3所示为实施例2中表皮蛋白Td14144与不同类型几丁质的选择性结合。其中,M是标准蛋白质分子量Marker;T表示全部的蛋白;E表示结合几丁质的蛋白;F表示未结合蛋白。
图4为实施例3中表皮蛋白Td14144的温度相变(LCST)。其中:左侧为4℃条件下表皮蛋白Td14144溶液,右侧是室温(25℃)下表皮蛋白Td14144溶液。
图5为实施例3中表皮蛋白Td14144在室温(25℃)条件下光学显微镜观察结果图。
具体实施方式
自定义“Td14144”可以表示双叉犀金龟的CPR家族RR-2亚族表皮蛋白,或表皮蛋白基因,或编码表皮蛋白的核苷酸序列,具体所指的含义可以结合上下文判断。
本发明中,术语“核苷酸”以本领域技术人员理解的一般含义。
本发明中,术语“氨基酸”是指任何氨基酸(标准和非标准氨基酸二者),包括但不限于α-氨基酸、β-氨基酸、γ-氨基酸和δ-氨基酸。适合的氨基酸的实例包括但不限于丙氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、脯氨酸、丝氨酸、酪氨酸、精氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯基丙氨酸、苏氨酸、色氨酸和缬氨酸。
本发明中,所述的“严紧条件”可为低严紧条件、中严紧条件、高严紧条件中的任一种。“低严紧条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、32℃的条件。“中严紧条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、42℃的条件。“高严紧条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、50℃的条件。在上述条件中,越提高温度,越能期待高效地获得具有高同源性的DNA。影响杂交严紧性的因素可为温度、探针浓度、探针长度、离子强度、时间、盐浓度等多种因素,本领域技术人员通过适宜选择这些因素,可实现同样的严紧条件。
除非另有定义,本发明中所使用的所有科学和技术术语具有与本发明涉及技术领域的技术人员通常理解的相同的含义。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下面结合具体实施例详细描述本发明,这些实施例用于理解而不是限制本发明。
实施例1 Td14144基因的克隆及表达纯化
一.合成编码Td14144的核苷酸序列
1.双叉犀金龟总RNA的提取
本实验使用TRIzol试剂提取双叉犀金龟中的总RNA。
实验准备工作:
(1)清洗研钵、杵以及药匙,在烘箱烘干。
(2)用铝箔纸将研钵、杵以及药匙完全包裹,在电烘箱中180℃干热灭菌4h,并使之自然冷却。
(3)实验所需试剂事先遇冷处理,确保过程中于低温状态。
(4)取刚羽化成虫的双叉犀金龟,解剖并清洗后,液氮速冻2-3min,后于-80℃冰箱保存。实验操作:
(1)在超净工作台中将一套研钵、研杵、药匙用液氮充分预冷。
(2)取事先准备的双叉犀金龟样品加入研钵中。加液氮开始研磨(研磨过程中样品应时刻处于液氮保护之下),待样品呈现出均一的粉末状,表示研磨完毕。
(3)往1.5mL离心管中加入Trizol试剂1mL,后使用预冷的药匙取一平勺样品(约100mg)于其中,震荡混匀,室温静置5min。
(4)用枪头吸取200μL酸性氯仿加入到(3)中的离心管中,在振荡器上充分震混匀,室温静置5min。再离心15min,4℃、12000rpm,用枪头吸取200μL上清,加入到新的1.5mL离心管中。
(5)用枪头吸取200μL酸性酚氯仿加入到(4)中的离心管中,在振荡器上充分震荡混匀,后室温静置5min。再离心20min,4℃、12000rpm,再用枪头吸取150μL上清,加入到新的1.5mL离心管中。
(6)用枪头吸取500μL异丙醇加入到(5)中的离心管中,反复颠倒10次。将离心管放入-20℃冰箱冷冻,促进RNA沉淀。
(7)将(6)中离心管20min,4℃、12000rpm。将上清倒掉。
(8)用RNase-free H2O和无水乙醇配置75%乙醇1ml,清洗沉淀,离心5min,4℃,12000rpm,将上清倒掉。
(9)重复上述实验一次。
(10)室温开盖静置20min,再加入50μL RNase-free H2O,使沉淀充分溶解。
(11)取上述产物5μL于PCR管中,其中2μL用于Nanoview测产物浓度,剩下3μL用1%琼脂糖凝胶电泳评价RNA质量。其余RNA放-80℃冰箱保存。
2.反转录合成cDNA(互补脱氧核糖核酸)第一链;
首先,在0.2mL离心管中加入:步骤1获得的3μL总RNA,1μLOligo(dT)引物(50μM),5μL RNase free ddH2O,混匀并短暂离心后,在65℃温浴5min后立即置于冰上10min以上,短暂离心数秒使混合好的溶液全部聚集于离心管底部,并加入4μL 5×Prime ScriptBuffer,0.5μL RNase Inhibitor(40U/μL),1μL PrimeScipt II RTase(200U/μL),4.5μLRNase-free Water。混匀后,在42℃下反应1h逆转录合成cDNA,随后95℃下5min使酶失活,得到的cDNA溶液用于PCR扩增。
3.PCR反应扩增表皮蛋白基因Td14144
(1)以上述步骤2获得的cDNA为模板,根据双叉犀金龟转录组测序基因序列设计引物,用于扩增表皮蛋白Td14144基因cDNA序列。
上游引物P1:5’-ATGTTCGCTAAGGTTTTCGCAATCG-3’(SEQ ID NO.6);
下游引物P2:5’-CTAACCCTTGTAACCGTACAATCCTCCG-3’(SEQ ID NO.7)。
PCR反应体系:1μL cDNA模板,25μL 2×Premix TaqTM,1.5μL引物P1,1.5μL引物P2,补ddH2O至总反应体系为50μL。
PCR反应程序:①94℃,10s;②55℃,30s;③72℃,1min;30个循环。4℃保存。
(2)待PCR实验终止后,取其中的5μL PCR产物用1%琼脂糖凝胶电泳验证DNA片段大小。使用凝胶成像系统照相,并观察结果筛选基因片段大小与预测值相同的条带,按照琼脂糖凝胶DNA回收试剂盒说明书进行PCR扩增产物回收,获得合成序列表SEQ ID NO.4所示的核苷酸序列。
(3)待切胶回收完毕后,将回收的DNA片段用试剂盒连接到T载上,转化大肠杆菌感受态DH5α,选取单克隆进行测序。
二、构建重组载体和重组表达基因工程菌
重组表达载体的载体为pET-28a原核表达载体;重组表达工程菌株为大肠杆菌BL21(DE3)。
(1)通过信号肽预测确定信号肽编码序列的分割点位置,以T-vector为模板,根据信号肽之后的片段设计连接引物进行第二步PCR扩增,同时在序列两端引入20bp左右的与表达载体序列一致的同源区域,并同时在两端引入限制性内切酶的酶切位点。
连接引物P3:
5’-AGGAGATATACCATGGGCTTAATACCAGCTGCACCAG-3’(SEQ ID NO.8);
连接引物P4:
5’-GACGGAGCTCGAATTCCTAACCCTTGTAACCGTACAATCCTCC-3’(SEQ ID NO.9).
PCR反应体系(50μL):T-vector模板1μL、2×Prime STAR HS 25μL、pET28a-14144F/R各1.5μL,补ddH2O至总反应体系为50μL。
反应条件:94℃10s,55℃30s,72℃1min,30个循环;4℃保存。
(2)利用限制性内切酶Ncol和EcoRI对表达载体质粒pET28a进行双酶切,通过In-Fusion同源重组的方法将携带目的基因的片段与切割好的载体连接成完整的连接产物pET28a-Td14144。
(3)将重组表达载体连接产物与大肠杆菌感受态细胞(E.coli BL21)混匀,放置在冰浴中30min,42℃水浴下45s,取出后再次冰浴2min;然后再加入900μL LB液体培养基,37℃,200rpm振荡培养1h;取200μL菌液于LB固体培养基(含卡那霉素50mg/L)上均匀的涂布,37℃过夜培养,得到克隆菌落。
(4)对克隆菌落进行检菌PCR,反应条件:94℃10s,55℃30s,72℃1min,30个循环;4℃保存。反应终止后,PCR产物用1%琼脂糖凝胶电泳检测大小,电泳结果见图1。
(5)挑选正确的基因片段大小的单克隆菌落接种于10ml LB(含卡那霉素)培养液中37℃、200rpm振荡过夜,用质粒提取试剂盒提取质粒,送样测序。获得测序正确的重组工程菌株。
三、Td14144蛋白表达与纯化
(1)将测序验证无误后的表达质粒pET28a-Td14144转化入大肠杆菌表达株BL21(DE3),菌株活化后扩大培养到对数生长期OD600为0.5-0.6,加入诱导剂IPTG使终浓度为0.1mmol/L,37℃诱导5小时后离心收集细菌。取少量菌液室温12000g离心1min,收集菌体,弃去上清液;使用破碎缓冲液(20mM Tris,500mM NaCl,pH7.4)重悬菌体进行超声破碎,离心收集上清液,进行SDS-PAGE与western blot检测。
(2)将检测后的pET28a-Td14144/BL21重组工程菌株接种于10mL的LB(含卡那霉素50mg/L)液体培养基中,37℃,200rpm振荡过夜,按1:100比例接种于1000mL的LB(含卡那霉素50mg/L)液体培养基中,37℃培养至吸光值OD600为0.5-0.6,加入IPTG诱导重组蛋白的大量表达,诱导结束后10000g离心10min收集菌体;
(3)加破碎缓冲液(20mM Tris,500mM NaCl,pH7.4)重悬后,利用高压匀浆破碎仪破碎细菌,离心去除胞片沉淀上清过镍子亲和层析柱;用AKTA蛋白纯化仪对Td14144蛋白进行洗涤(20mMTris,500mM NaCl,20mM咪唑;20mMTris,500mM NaCl,90mM咪唑,pH 7.4)和洗脱(20mM Tris,500mM NaCl,250mM咪唑,pH7.4)。并进行聚丙烯酰胺凝胶电泳(SDS-PAGE)与免疫印迹试验(western blot)检测,获得纯化的重组表皮蛋白Td14144,其氨基酸序列如SEQ ID NO.1所示。
实施例2检测Td14144蛋白与几丁质结合能力
实验目的:检测表皮蛋白Td14144与不同类型的几丁质结合能力
实验过程:选择α-几丁质(α-chitin)、β-几丁质(β-chitin)、胶体几丁质(colloidal chitin)和壳聚糖(chitosan)4种类型的几丁质与重组表达的表皮蛋白Td14144进行体外结合实验。
具体操作:将纯化后的重组表达蛋白透析到结合缓冲液(20mM Tris,pH8.0)中。构建200μL反应体系,使蛋白终浓度为0.5mg/mL,几丁质终浓度为2mg/mL。反应在室温(25℃)进行,蛋白与不同类型几丁质在2mL离心管中持续颠倒混匀4h。反应结束后,12000r/min离心10min,将上清取出记为未结合几丁质的蛋白。向沉淀中加入1mL的结合缓冲液(20mMTris,pH8.0),将沉淀重悬并颠倒混匀,而后13000g离心5min,弃上清,从而完成一次沉淀的清洗。重复3-5次。最后再沉淀中加入50μL的电泳上样缓冲液煮沸5min,13000g离心5min,弃沉淀,收集上清液记为结合几丁质蛋白。最后使用聚丙烯酰胺凝胶电泳检测各收集组分。
实验结论:重组蛋白Td14144与几丁质结合能力检测结果见图3,重组蛋白Td14144与α-几丁质、β-几丁质、壳聚糖和胶体几丁质4种类型的几丁质均能结合。
实施例3检测Td14144蛋白的液液相分离特性
实验过程:首先,用肉眼观察在不同温度下Td14144蛋白溶液产生液液相分离(Liquid-liquid phase separation,LLPS)的宏观情况。肉眼观察蛋白溶液发现Td14144蛋白在4℃条件下是清澈透明的状态,随着温度升高到室温(25℃),蛋白溶液逐渐由澄清变浑浊,结果见图4。
在室温下用光学显微镜观察其蛋白溶液,发现Td14144蛋白出现团聚体(Ccoacervate)现象,结果见图5,蛋白溶液中出现的不均一的圆球即为团聚体。
团聚体具有流动形变性,并能够相互融合形成更大的团聚体;而且团聚体形成与消失是可逆的,温度升高至室温团聚体形成,当温度降低到4℃条件时团聚体会消失,蛋白溶液恢复澄清状态。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。
序列表
<110> 中国农业科学院农业基因组研究所
<120> 双叉犀金龟RR-2家族表皮蛋白,编码核苷酸序列及其应用
<141> 2021-05-26
<160> 9
<170> SIPOSequenceListing 1.0
<210> 1
<211> 218
<212> PRT
<213> Unknown
<400> 1
Gly Leu Ile Pro Ala Ala Pro Ala Leu Ser Leu Gly His Ala Ala Leu
1 5 10 15
Ala Ala Pro Ala Leu Ser Leu Gly His Ala Val Gly Pro Ala Leu Ser
20 25 30
Leu Ser His Thr Ala Leu Ala Ala Pro Ala Ile Ser Leu Gly His Ala
35 40 45
Val Ala Ala Pro Ala Leu Ser Leu Gly His Ala Ala Val Ala Ala Pro
50 55 60
Ala Tyr Gly Ile Gly His Gly Leu Gly Leu Gly Tyr Gly Leu Gly His
65 70 75 80
Gly Ala Ile Ala Ala Pro Ala Leu Val Lys Ala Ala Pro Ala Ile Val
85 90 95
Lys Ala Ala Pro Ala Val Asp Tyr Val Ala Tyr Pro Lys Tyr Glu Phe
100 105 110
Asn Tyr Gly Val Ser Asp Ala His Thr Gly Asp Gln Lys Thr Gln His
115 120 125
Glu Ile Arg Asp Gly Asp Val Val Lys Gly Ser Tyr Ser Leu His Glu
130 135 140
Ala Asp Gly Thr Val Arg Thr Val His Tyr Glu Ala Asp Asp His Asn
145 150 155 160
Gly Phe Asn Ala Val Val Thr Arg Ser Gly His Ala Ala His Pro Ala
165 170 175
Thr Pro Ile Ala Val Ala Ala Pro Ala Lys Thr Ile Ile Ala Ala Pro
180 185 190
Ala Ile Ala His Ala Ala Pro Val Phe Ala His Ala Gly Pro Ala Leu
195 200 205
Ala Tyr Gly Gly Leu Tyr Gly Tyr Lys Gly
210 215
<210> 2
<211> 235
<212> PRT
<213> Unknown
<400> 2
Met Phe Ala Lys Val Phe Ala Ile Ala Thr Phe Val Ala Thr Ala Gln
1 5 10 15
Ala Gly Leu Ile Pro Ala Ala Pro Ala Leu Ser Leu Gly His Ala Ala
20 25 30
Leu Ala Ala Pro Ala Leu Ser Leu Gly His Ala Val Gly Pro Ala Leu
35 40 45
Ser Leu Ser His Thr Ala Leu Ala Ala Pro Ala Ile Ser Leu Gly His
50 55 60
Ala Val Ala Ala Pro Ala Leu Ser Leu Gly His Ala Ala Val Ala Ala
65 70 75 80
Pro Ala Tyr Gly Ile Gly His Gly Leu Gly Leu Gly Tyr Gly Leu Gly
85 90 95
His Gly Ala Ile Ala Ala Pro Ala Leu Val Lys Ala Ala Pro Ala Ile
100 105 110
Val Lys Ala Ala Pro Ala Val Asp Tyr Val Ala Tyr Pro Lys Tyr Glu
115 120 125
Phe Asn Tyr Gly Val Ser Asp Ala His Thr Gly Asp Gln Lys Thr Gln
130 135 140
His Glu Ile Arg Asp Gly Asp Val Val Lys Gly Ser Tyr Ser Leu His
145 150 155 160
Glu Ala Asp Gly Thr Val Arg Thr Val His Tyr Glu Ala Asp Asp His
165 170 175
Asn Gly Phe Asn Ala Val Val Thr Arg Ser Gly His Ala Ala His Pro
180 185 190
Ala Thr Pro Ile Ala Val Ala Ala Pro Ala Lys Thr Ile Ile Ala Ala
195 200 205
Pro Ala Ile Ala His Ala Ala Pro Val Phe Ala His Ala Gly Pro Ala
210 215 220
Leu Ala Tyr Gly Gly Leu Tyr Gly Tyr Lys Gly
225 230 235
<210> 3
<211> 657
<212> DNA
<213> Unknown
<400> 3
ggcctaatac cagctgcacc agctctttcc cttggacatg ccgccctagc agctccagca 60
ctatcgcttg gtcatgctgt tggaccggct ctttcgctta gccatacagc gttagccgcc 120
ccagctatct ctctaggtca tgcagttgct gccccagctc tttctcttgg tcacgccgct 180
gtcgctgctc cagcttacgg aataggtcat ggattgggat tggggtatgg acttggacac 240
ggagccatcg ccgcaccagc tcttgttaaa gccgcacctg ctatcgtaaa ggcagctcca 300
gctgttgatt atgtggcata tccgaaatac gaattcaact acggagtctc cgatgcccac 360
accggcgatc aaaaaaccca acatgaaatc cgcgatggtg acgtagtaaa aggctcatac 420
tccctccacg aagccgatgg caccgtccgt accgtccact acgaagccga tgatcataac 480
ggcttcaacg cagttgtaac cagatcagga cacgctgcgc atcctgctac accaattgcc 540
gtcgcggctc ccgccaaaac catcattgca gctccagcta tagcgcacgc agccccagtc 600
ttcgcgcacg ctggtccagc gttggcgtac ggaggattgt acggttacaa gggttag 657
<210> 4
<211> 708
<212> DNA
<213> Unknown
<400> 4
atgttcgcta aggttttcgc aatcgctaca tttgtagcca ccgcacaagc tggcctaata 60
ccagctgcac cagctctttc ccttggacat gccgccctag cagctccagc actatcgctt 120
ggtcatgctg ttggaccggc tctttcgctt agccatacag cgttagccgc cccagctatc 180
tctctaggtc atgcagttgc tgccccagct ctttctcttg gtcacgccgc tgtcgctgct 240
ccagcttacg gaataggtca tggattggga ttggggtatg gacttggaca cggagccatc 300
gccgcaccag ctcttgttaa agccgcacct gctatcgtaa aggcagctcc agctgttgat 360
tatgtggcat atccgaaata cgaattcaac tacggagtct ccgatgccca caccggcgat 420
caaaaaaccc aacatgaaat ccgcgatggt gacgtagtaa aaggctcata ctccctccac 480
gaagccgatg gcaccgtccg taccgtccac tacgaagccg atgatcataa cggcttcaac 540
gcagttgtaa ccagatcagg acacgctgcg catcctgcta caccaattgc cgtcgcggct 600
cccgccaaaa ccatcattgc agctccagct atagcgcacg cagccccagt cttcgcgcac 660
gctggtccag cgttggcgta cggaggattg tacggttaca agggttag 708
<210> 5
<211> 919
<212> DNA
<213> Unknown
<400> 5
taatacgact cactataggg gaattgtgag cggataacaa ttcccctcta gaaataattt 60
tgtttaactt taagaaggag atataccatg ggcttaatac cagctgcacc agctctttcc 120
cttggacacg ccgccctagc agctccagca ctatcgcttg ggcatgctgt tggaccggct 180
ctttcgctta gccatacagc gttagccgcc ccagctatct ctctaggtca tgcagttgct 240
gctccagctc tttctcttgg tcacgccgct gtcgctgctc cagcttacgg aataggtcat 300
ggattgggat tgggttatgg acttggacac ggagccatcg ccgcaccagc tcttgttaaa 360
gccgcacctg ctatcgtaaa ggcagctcca gctgttgatt atgtggcata tccgaaatac 420
gaattcaact acggagtctc cgatgcccac accggcgatc aaaaaaccca acatgaaatc 480
cgcgatggtg acgtagtaaa aggctcatac tccctccacg aagctgatgg caccgtccgt 540
accgtccact acgaagccga tgatcataac ggcttcaacg cagttgtaac cagatcagga 600
cacgctgcgc atcctgctac accaattgcc gtcgcggctc ccgccaaaac catcattgca 660
gctccagcta tagcgcacgc agccccagtc ttcgcgcacg ctggtccagc gttggcgtac 720
ggaggattgt acggttacaa gggttaggaa ttcgagctcc gtcgacaagc ttgcggccgc 780
actcgagcac caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc 840
tgagttggct gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg 900
ggtcttgagg ggttttttg 919
<210> 6
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 6
atgttcgcta aggttttcgc aatcg 25
<210> 7
<211> 28
<212> DNA
<213> Artificial Sequence
<400> 7
ctaacccttg taaccgtaca atcctccg 28
<210> 8
<211> 37
<212> DNA
<213> Artificial Sequence
<400> 8
aggagatata ccatgggctt aataccagct gcaccag 37
<210> 9
<211> 43
<212> DNA
<213> Artificial Sequence
<400> 9
gacggagctc gaattcctaa cccttgtaac cgtacaatcc tcc 43
Claims (10)
1.一种双叉犀金龟RR-2家族表皮蛋白,其特征在于,所述表皮蛋白的氨基酸序列包含或由如下序列组成:
a)SEQ ID NO.1所示的氨基酸序列;或,
b)与SEQ ID NO.1所示的氨基酸序列具有至少70%序列同一性的功能性同源序列;或
c)在SEQ ID NO.1所示的氨基酸序列中缺失、添加、替换一个或多个氨基酸且具有相同蛋白活性的氨基酸序列。
2.根据权利要求1所述的表皮蛋白,其特征在于,所述b)和/或c)的氨基酸序列包含SEQID NO.2所示的氨基酸序列。
3.编码权利要求1或2所述的表皮蛋白的核苷酸序列。
4.根据权利要求3所述的编码表皮蛋白的核苷酸序列,其特征在于,所述核苷酸序列包含或由如下序列组成:
i)SEQ ID NO.3所示的核苷酸序列;或,
ii)SEQ ID NO.3所示的核苷酸序列的互补序列、简并序列或同源序列(优选同源性70%以上);或,
iii)在严紧条件下与SEQ ID NO.3所示的核苷酸序列杂交,且能够编码所述表皮蛋白的核苷酸序列。
5.根据权利要求4所述的编码表皮蛋白的核苷酸序列,其特征在于,所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.4所示的核苷酸序列;
优选地,所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.5所示的核苷酸序列。
6.用于检测或扩增权利要求3-5任一项所述核苷酸序列的引物,所述引物包括上游引物和/或下游引物。
7.根据权利要求6所述的引物,其特征在于,所述上游引物P1的核苷酸序列如SEQ IDNO.6所示;和/或,所述下游引物P2的核苷酸序列如SEQ ID NO.7所示;
优选地,所述上游引物P3的核苷酸序列如SEQ ID NO.8所示;和/或,所述下游引物P4的核苷酸序列如SEQ ID NO.9所示。
8.与权利要求1或2所述表皮蛋白,或权利要求3-5任一项所述编码核苷酸序列,或权利要求6或7所述引物有关的生物材料或物质,其选自:
A1):含有所述表皮蛋白的生物材料;
A2):含有所述编码核苷酸的表达盒;
A3):含有所述编码核苷酸的重组载体;
A4):含有A2)所述表达盒的重组载体;
A5):含有所述编码核苷酸的重组微生物;
A6):含有A2)所述表达盒的重组微生物;
A7):含有A3)所述重组载体的重组微生物;
A8):含有A4)所述重组载体的重组微生物;
A9):含有所述引物的试剂;
A10)含有A9)或所述引物的试剂盒。
9.根据权利要求8所述的生物材料或物质,其特征在于,所述重组载体包括pET28a、pcdna3.1、pUC18、pBR322、pUC19、pGEX2T、pESC-Ura中的至少一种;更优选pET28a;
优选地,所述重组微生物包括大肠杆菌、假单孢菌、芽孢杆菌、酵母细胞中的至少一种;更优选大肠杆菌BL21(DE3)。
10.制备权利要求1或2所述表皮蛋白的方法,其特征在于,包括以下步骤:
将权利要求3-5任一项所述的核苷酸序列,或权利要求8中所述的相关生物材料或物质导入宿主细胞中表达获得所述表皮蛋白。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110577600.4A CN113402596B (zh) | 2021-05-26 | 2021-05-26 | 双叉犀金龟rr-2家族表皮蛋白,编码核苷酸序列及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110577600.4A CN113402596B (zh) | 2021-05-26 | 2021-05-26 | 双叉犀金龟rr-2家族表皮蛋白,编码核苷酸序列及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113402596A true CN113402596A (zh) | 2021-09-17 |
CN113402596B CN113402596B (zh) | 2022-04-15 |
Family
ID=77675235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110577600.4A Active CN113402596B (zh) | 2021-05-26 | 2021-05-26 | 双叉犀金龟rr-2家族表皮蛋白,编码核苷酸序列及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113402596B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116063746A (zh) * | 2022-08-18 | 2023-05-05 | 中国农业科学院深圳农业基因组研究所 | 提升壳聚糖材料机械性能的方法及制备的壳聚糖复合材料 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101386849A (zh) * | 2007-09-12 | 2009-03-18 | 中国农业科学院植物保护研究所 | 一种抗昆虫血细胞免疫的线虫表皮蛋白及基因序列 |
CN107988231A (zh) * | 2017-11-26 | 2018-05-04 | 山西大学 | 飞蝗节间膜表皮蛋白基因6及其在蝗虫防治中的应用 |
EP3575313A1 (en) * | 2018-05-30 | 2019-12-04 | Université de Lausanne | Insect corneal type nanocoatings |
-
2021
- 2021-05-26 CN CN202110577600.4A patent/CN113402596B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101386849A (zh) * | 2007-09-12 | 2009-03-18 | 中国农业科学院植物保护研究所 | 一种抗昆虫血细胞免疫的线虫表皮蛋白及基因序列 |
CN107988231A (zh) * | 2017-11-26 | 2018-05-04 | 山西大学 | 飞蝗节间膜表皮蛋白基因6及其在蝗虫防治中的应用 |
EP3575313A1 (en) * | 2018-05-30 | 2019-12-04 | Université de Lausanne | Insect corneal type nanocoatings |
Non-Patent Citations (4)
Title |
---|
J P CHARLES等: "cDNA cloning and deduced amino acid sequence of a major, glycine-rich cuticular protein from the coleopteran Tenebrio molitor. Temporal and spatial distribution of the transcript during metamorphosis", 《EUROPEAN JOURNAL OF BIOCHEMISTRY》 * |
叶长青等: "双叉犀金龟表皮蛋白TdCPR12611与TdCPR7854的表达纯化及特性分析", 《昆虫学报》 * |
梁欣等: "昆虫表皮蛋白基因研究进展", 《昆虫学报》 * |
段天凤等: "沙葱萤叶甲表皮蛋白基因的鉴定及表达谱分析", 《昆虫学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116063746A (zh) * | 2022-08-18 | 2023-05-05 | 中国农业科学院深圳农业基因组研究所 | 提升壳聚糖材料机械性能的方法及制备的壳聚糖复合材料 |
CN116063746B (zh) * | 2022-08-18 | 2024-04-02 | 中国农业科学院深圳农业基因组研究所 | 提升壳聚糖材料机械性能的方法及制备的壳聚糖复合材料 |
Also Published As
Publication number | Publication date |
---|---|
CN113402596B (zh) | 2022-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102481388B1 (ko) | 내열성의 역전사 효소 돌연변이체 | |
KR20190082318A (ko) | Crispr/cpf1 시스템 및 방법 | |
JP5308027B2 (ja) | 変異型pcna | |
EP0834566A2 (en) | Cotton plant gene | |
Chiarabelli et al. | Investigation of de novo totally random biosequences, Part II: On the folding frequency in a totally random library of de novo proteins obtained by phage display | |
KR101657736B1 (ko) | 개변형 비오틴 결합 단백질 | |
CN113402596B (zh) | 双叉犀金龟rr-2家族表皮蛋白,编码核苷酸序列及其应用 | |
WO2010014922A2 (en) | Protein purification tags and uses thereof | |
CN109384852B (zh) | 重组Martentoxin的制备、表征及应用 | |
CN113321718B (zh) | 昆虫cpcfc家族表皮蛋白,编码核苷酸序列及其应用 | |
CN114573673B (zh) | 双叉犀金龟表皮蛋白,编码核苷酸序列及其应用 | |
US7101694B2 (en) | Genes encoding proteins capable of regenerating luciferin, recombinant DNA and process for producing protein capable of regenerating luciferin | |
CN113717256B (zh) | 一种融合蛋白及其应用 | |
CN109022471B (zh) | 生产草酸氧化酶的大肠杆菌表达系统、草酸氧化酶的生产方法及其应用 | |
KR20220097504A (ko) | 투구게 유래 재조합 FactorG 및 이것을 이용한 β-글루칸의 측정 방법 | |
US20040098767A1 (en) | Manipulation of plant life cycles and/or growth phases | |
CN114381468B (zh) | 一种甲硫氨酸裂解酶及其编码基因和应用 | |
Hou et al. | cDNA, genomic sequence cloning and overexpression of ribosomal protein gene L9 (rpL9) of the giant panda (Ailuropoda melanoleuca) | |
Kaluzhnaya et al. | Identification of silicateins in freshwater sponge Lubomirskia baicalensis | |
US7049113B2 (en) | Gene encoding protein capable of regenerating luciferin, recombinant DNA and process for producing protein capable of regenerating luciferin | |
KR20060100370A (ko) | RnaseⅢ 활성을 가지는 폴리펩티드 | |
CN116200363A (zh) | Taq酶突变体、其制备方法和应用 | |
EP4232571A1 (en) | Novel variants of endonuclease v and uses thereof | |
WO2024138074A1 (en) | Engineered rnase inhibitor variants | |
CN110759976A (zh) | 一种诱导细菌变形的方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |