CN113321718A - 昆虫cpcfc家族表皮蛋白,编码核苷酸序列及其应用 - Google Patents
昆虫cpcfc家族表皮蛋白,编码核苷酸序列及其应用 Download PDFInfo
- Publication number
- CN113321718A CN113321718A CN202110646579.9A CN202110646579A CN113321718A CN 113321718 A CN113321718 A CN 113321718A CN 202110646579 A CN202110646579 A CN 202110646579A CN 113321718 A CN113321718 A CN 113321718A
- Authority
- CN
- China
- Prior art keywords
- protein
- nucleotide sequence
- cpcfc
- seq
- epidermal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 189
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 174
- 239000002773 nucleotide Substances 0.000 title claims abstract description 76
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 76
- 241000238631 Hexapoda Species 0.000 title claims abstract description 41
- 241000254173 Coleoptera Species 0.000 claims abstract description 13
- 238000011160 research Methods 0.000 claims abstract description 7
- 229910021645 metal ion Inorganic materials 0.000 claims abstract description 6
- 150000001413 amino acids Chemical class 0.000 claims description 46
- 210000004027 cell Anatomy 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 13
- 230000014509 gene expression Effects 0.000 claims description 10
- 238000011144 upstream manufacturing Methods 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 8
- 241000588724 Escherichia coli Species 0.000 claims description 7
- 238000000034 method Methods 0.000 claims description 6
- 239000003638 chemical reducing agent Substances 0.000 claims description 4
- 230000000813 microbial effect Effects 0.000 claims description 4
- 229920001184 polypeptide Polymers 0.000 claims description 3
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 3
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 3
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 2
- 241000589516 Pseudomonas Species 0.000 claims description 2
- 239000000853 adhesive Substances 0.000 claims description 2
- 230000001070 adhesive effect Effects 0.000 claims description 2
- 210000004102 animal cell Anatomy 0.000 claims description 2
- 230000004952 protein activity Effects 0.000 claims description 2
- 210000005253 yeast cell Anatomy 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 12
- 239000000499 gel Substances 0.000 abstract description 26
- 229920002101 Chitin Polymers 0.000 abstract description 22
- 230000006870 function Effects 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 abstract 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 151
- 229940024606 amino acid Drugs 0.000 description 22
- 235000001014 amino acid Nutrition 0.000 description 20
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 16
- 108010077245 asparaginyl-proline Proteins 0.000 description 16
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 15
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 15
- 238000003752 polymerase chain reaction Methods 0.000 description 15
- 108010079364 N-glycylalanine Proteins 0.000 description 13
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 12
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 12
- 238000004132 cross linking Methods 0.000 description 12
- 238000001962 electrophoresis Methods 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 230000001580 bacterial effect Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 229910052751 metal Inorganic materials 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 210000002615 epidermis Anatomy 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 239000000835 fiber Substances 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 239000002184 metal Substances 0.000 description 6
- 238000003259 recombinant expression Methods 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 5
- MVVPIAAVGAWJNQ-DOFZRALJSA-N Arachidonoyl dopamine Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCC1=CC=C(O)C(O)=C1 MVVPIAAVGAWJNQ-DOFZRALJSA-N 0.000 description 5
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- -1 salt ions Chemical class 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 4
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 4
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 4
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 4
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 4
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- 239000012154 double-distilled water Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 150000002739 metals Chemical class 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000010186 staining Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 3
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 3
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 229920001661 Chitosan Polymers 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 3
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 3
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 3
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 3
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 3
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000004845 protein aggregation Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- 241000238421 Arthropoda Species 0.000 description 2
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 2
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 2
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- DTCCMDYODDPHBG-ACZMJKKPSA-N Gln-Ala-Cys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O DTCCMDYODDPHBG-ACZMJKKPSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 2
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 2
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- FLYSHWAAHYNKRT-JYJNAYRXSA-N His-Gln-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLYSHWAAHYNKRT-JYJNAYRXSA-N 0.000 description 2
- 239000012880 LB liquid culture medium Substances 0.000 description 2
- 241000255777 Lepidoptera Species 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 2
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 2
- DYMPSOABVJIFBS-IHRRRGAJSA-N Pro-Phe-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CS)C(=O)O DYMPSOABVJIFBS-IHRRRGAJSA-N 0.000 description 2
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 2
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 2
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 238000005054 agglomeration Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 230000009920 chelation Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009465 prokaryotic expression Effects 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 229910052723 transition metal Inorganic materials 0.000 description 2
- 150000003624 transition metals Chemical class 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000143476 Bidens Species 0.000 description 1
- 241001674044 Blattodea Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 101710196022 Cuticle protein Proteins 0.000 description 1
- KIQKJXYVGSYDFS-ZLUOBGJFSA-N Cys-Asn-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KIQKJXYVGSYDFS-ZLUOBGJFSA-N 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- OZEQPCDLCDRCGY-SOUVJXGZSA-N Gln-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O OZEQPCDLCDRCGY-SOUVJXGZSA-N 0.000 description 1
- CMBXOSFZCFGDLE-IHRRRGAJSA-N Gln-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O CMBXOSFZCFGDLE-IHRRRGAJSA-N 0.000 description 1
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 1
- MHQXIBRPDKXDGZ-ZFWWWQNUSA-N Met-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MHQXIBRPDKXDGZ-ZFWWWQNUSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 241000277334 Oncorhynchus Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- QEPZQAPZKIPVDV-KKUMJFAQSA-N Phe-Cys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N QEPZQAPZKIPVDV-KKUMJFAQSA-N 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- WECYCNFPGZLOOU-FXQIFTODSA-N Pro-Asn-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O WECYCNFPGZLOOU-FXQIFTODSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- DTQIXTOJHKVEOH-DCAQKATOSA-N Pro-His-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O DTQIXTOJHKVEOH-DCAQKATOSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000382353 Pupa Species 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000282806 Rhinoceros Species 0.000 description 1
- 241000130993 Scarabaeus <genus> Species 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- 241001052560 Thallis Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- ZAGPDPNPWYPEIR-SRVKXCTJSA-N Tyr-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ZAGPDPNPWYPEIR-SRVKXCTJSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 150000001371 alpha-amino acids Chemical class 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 150000001576 beta-amino acids Chemical class 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000013522 chelant Substances 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000004993 emission spectroscopy Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009616 inductively coupled plasma Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000005191 phase separation Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 244000062645 predators Species 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000012266 salt solution Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 210000001944 turbinate Anatomy 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Insects & Arthropods (AREA)
- Tropical Medicine & Parasitology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了一种昆虫CPCFC家族表皮蛋白,编码核苷酸序列及其应用,涉及生物工程技术领域。本发明以鞘翅目昆虫双叉犀金龟为研究对象,从中发现了两种CPCFC家族蛋白基因,命名为TdCPCFC1和TdCPCFC2,并成功获得两种基因的重组蛋白,有助于了解CPCFC类蛋白的性质,以及了解昆虫表皮组装方式中CPCFC家族表皮蛋白发挥的作用,为研究CPCFC家族表皮蛋白提供了新的基因资源。本发明提供重组表达的昆虫CPCFC家族表皮蛋白TdCPCFC1,能够结合金属离子,具有还原性,能够与几丁质结合,能够自组装形成团聚体,凝胶等,形成的团聚体和凝胶具有粘合等性质,可以用于开发相应的生物制品。
Description
技术领域
本发明涉及生物工程技术领域,具体涉及昆虫CPCFC家族表皮蛋白,编码核苷酸序列及其应用。
背景技术
节肢动物是动物界最大且最丰富的类群,昆虫是节肢动物的最重要组成成分之一。昆虫在水生和陆生环境的生存、繁殖、发育等都具有非常优秀的适应性。他们的表皮结构对其成功的环境适应发挥了重要作用。昆虫表皮是由上皮细胞分泌沉积并组织的一种细胞外基质,其能保护昆虫,防止体内水分散失;同时作为生物毒剂,病原和捕食者捕食的一道屏障;其还可以作为昆虫外骨骼,帮助昆虫运动。昆虫表皮主要由几丁质和蛋白质构成,能够为仿生学提供非常多研究方向。例如不同的表面结构对表皮性质的影响,不同的颜色在伪装,识别,热吸收,求偶,防御等方面的作用。表皮还具有良好的机械性质,不同部位的表皮强度、刚性、弹性以及可塑性等方面都不同,这可能是由于几丁质排布,几丁质-蛋白质特异的相互作用或装配,蛋白质不同程度的修饰,硬化等因素决定的。
根据昆虫表皮中蛋白质的序列分类,已确定了13个表皮蛋白家族。每个物种的表皮蛋白在各个表皮蛋白家族中都含有许多成员,但CPCFC家族例外。大多数CPCFC家族成员在一个物种中至多存在2个,一般只存在一个。CPCFC家族最早在蜚蠊目中发现,命名为NcNCP1,它带有3个重复的基序(motif);每个基序由16个氨基酸组成,带有2个保守的Cys(位于第10位和第16位),两个Cys之间夹着5个氨基酸。在鳞翅目和鞘翅目中,只含有两个重复的CPCFC motif。但剩下的大部分生物种中含有三个重复。除CPCFC motif外,每个目的CPCFC序列都还有部分相似,每个目的序列长度也相似。
虽然CPCFC蛋白在双翅目,鳞翅目中的时空表达模式已有人研究过,但从蛋白水平进行CPCFC蛋白的研究至今未见报道。
发明内容
有鉴于此,本发明提供鞘翅目昆虫双叉犀金龟的CPCFC家族表皮蛋白及其编码核苷酸序列,有助于了解其他鞘翅目昆虫CPCFC类蛋白的性质。
本发明第一方面提供了昆虫CPCFC家族表皮蛋白,所述蛋白的氨基酸序列包含或由如下序列组成:
a)SEQ ID NO.1所示的氨基酸序列;或,
b)与SEQ ID NO.1所示的氨基酸序列具有至少50%序列同一性的功能性同源序列;或
c)在SEQ ID NO.1所示的氨基酸序列中添加、缺失、替换一个或多个氨基酸且具有相同蛋白活性的氨基酸序列。
所述昆虫选自鞘翅目,优选所述昆虫为双叉犀金龟。
双叉犀金龟是一种鞘翅目昆虫。成年的雄性甲虫具有带分支的特化的角,具有很强的机械性能。本发明以双叉犀金龟为研究对象,从中发现了两种CPCFC家族蛋白基因,命名为TdCPCFC1和TdCPCFC2,并成功获得该基因的编码蛋白(即CPCFC家族表皮蛋白,本发明中也命名为TdCPCFC1和TdCPCFC2)。
鞘翅目的CPCFC蛋白带有2个CPCFC motif的重复,并且序列较长,一般超过130个氨基酸序列,所以研究双叉犀金龟这一鞘翅目昆虫的CPCFC蛋白有助于理解CPCFC类蛋白的性质。
在本发明的一种实施方式中,所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为SEQ ID NO.1所示的氨基酸序列:GWNGPLAGGVPAHQFPAGVSPQACPNYPNCNNPAVAVSPNAAAPYPGAYNPGAYNPGAYNPGAQNPGAYNPGAYNGGNALDNGEYTGDGDYRGEGLAESGAYGNADGGHNNGGYNPGAYNPGAYNPGAYNPAGHAPGPVPAGVDPHSCPNYPFCH,序列长度为155个氨基酸。
在本发明的一种实施方式中,所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为与SEQ ID NO.1所示的氨基酸序列具有至少50%序列同一性的功能性同源序列。所述功能性同源序列包括但不限于SEQ ID NO.1所示的氨基酸具有约50%或以上、53%或以上、55%或以上、57%或以上、60%或以上、65%或以上、70%或以上、75%或以上、80%或以上、82%或以上、84%或以上、85%或以上、88%或以上、90%或以上、92%或以上、93%或以上、94%或以上、95%或以上、96%或以上、97%或以上、98%或以上、99%或以上、99.5%或以上、99.9%或以上同一性的氨基酸序列。
在本发明的一种实施方式中,所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为在SEQ ID NO.1所示的氨基酸序列中添加、缺失、替换一个或多个(例如可以为1-10个,具体地,可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个)氨基酸且具有相同活性的氨基酸序列。
在本发明的一种实施方式中,所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为SEQ ID NO.2所示的氨基酸序列:MFVKLAVLACTFAVALAGWNGPLAGGVPAHQFPAGVSPQACPNYPNCNNPAVAVSPNAAAPYPGAYNPGAYNPGAYNPGAQNPGAYNPGAYNGGNALDNGEYTGDGDYRGEGLAESGAYGNADGGHNNGGYNPGAYNPGAYNPGAYNPAGHAPGPVPAGVDPHSCPNYPFCH(下划线为信号肽区域),序列长度为172个氨基酸。
在本发明的一种实施方式中,所述昆虫CPCFC家族表皮蛋白TdCPCFC1的氨基酸序列为SEQ ID NO.3所示的氨基酸序列:MGHHHHHHMGWNGPLAGGVPAHQFPAGVSPQACPNYPNCNNPAVAVSPNAAAPYPGAYNPGAYNPGAYNPGAQNPGAYNPGAYNGGNALDNGEYTGDGDYRGEGLAESGAYGNADGGHNNGGYNPGAYNPGAYNPGAYNPAGHAPGPVPAGVDPHSCPNYPFCH,序列长度为164个氨基酸,其N端带有组氨酸标签。
在本发明的一种实施方式中,所述昆虫CPCFC家族表皮蛋白TdCPCFC2的氨基酸序列为SEQ ID NO.17所示的氨基酸序列:MLVQSDVLACALAIASAAWNGPLAGGVPASQIPAGISLQACPNYPHCNNPNVAVEPNSPAAQQAPQYQPAPQYQPAPQYQPAPQYQPAPQQSYNQNALDNGEYTGDGDYHGEGLAESGAFGSTGNSQAYNSAPAYQPAPAYQPASPQYNPAPAQPAAQLPAGVDAHACPNYPYCS(下划线为信号肽区域),序列长度为175个氨基酸,与TdCPCFC1氨基酸序列相似性为57.1%。
本发明第二方面提供了编码所述CPCFC家族表皮蛋白的核苷酸序列。
进一步,编码CPCFC家族表皮蛋白的核苷酸序列包含或由如下序列组成:
i)SEQ ID NO.4所示的核苷酸序列;或,
ii)SEQ ID NO.4所示的核苷酸序列的互补序列、简并序列或同源序列;或,
iii)在严谨条件下与SEQ ID NO.4所示的核苷酸序列杂交,且能够编码CPCFC家族表皮蛋白的核苷酸序列。
在本发明的一种实施方式中,所述编码CPCFC家族表皮蛋白TdCPCFC1的核苷酸序列为SEQ ID NO.4所示的核苷酸序列,序列长度为468个碱基,末三位为终止密码子,对应于编码具有SEQ ID NO.1所示氨基酸的表皮蛋白TdCPCFC1。
在本发明的一种实施方式中,所述编码CPCFC家族表皮蛋白TdCPCFC1的核苷酸序列为SEQ ID NO.4所示的核苷酸序列按照碱基互补配对原则形成的互补序列,互补序列可以为具有编码表皮蛋白TdCPCFC1功能的不完全互补序列或完全互补序列。
在本发明的一种实施方式中,所述编码表皮蛋白TdCPCFC1的核苷酸序列为SEQ IDNO.4所示的核苷酸序列的简并序列。简并序列是指改变SEQ ID NO.4核苷酸某个或多个核苷酸序列后,改变的核苷酸序列位置对应编码的氨基酸种类不变,不会影响核苷酸序列的编码功能和表达水平。
在本发明的一种实施方式中,所述编码表皮蛋白TdCPCFC1的核苷酸序列为SEQ IDNO.4所示的核苷酸序列的同源序列。
所述同源核苷酸序列包括在SEQ ID NO.4所示的核苷酸序列中添加和/或取代和/或缺失一个或几个核苷酸而生成的可编码具有表皮蛋白TdCPCFC1相同活性的突变基因、等位基因或衍生物。
进一步优选同源序列为与SEQ ID NO.4所示的核苷酸序列约50%或以上、53%或以上、55%或以上、57%或以上、60%或以上、65%或以上、70%或以上、75%或以上、80%或以上、81%或以上、82%或以上、83%或以上、84%或以上、85%或以上、86%或以上、87%或以上、88%或以上、89%或以上、90%或以上、91%或以上、92%或以上、93%或以上、94%或以上、95%或以上、96%或以上、97%或以上、98%或以上、99%或以上、99.1或以上、99.2或以上、99.3%或以上、99.4%或以上、99.5%或以上、99.6%或以上、99.7%或以上、99.8%或以上、或99.9%或以上同一性且具备编码CPCFC家族表皮蛋白功能的多核苷酸。
在本发明的一种实施方式中,所述编码表皮蛋白TdCPCFC1的核苷酸序列为在严谨条件下与SEQ ID NO.4的核苷酸序列杂交,且能够编码表皮蛋白Tdcpcfc1的核苷酸序列。
示例性地,所述“严谨条件”是指探针将与其靶序列杂交至可探测程度超过与其它序列杂交(如至少2倍于背景)的条件。严谨条件具有序列依赖性,且因环境的不同而不同。通过控制杂交和/或洗涤条件的严谨性,可以鉴定与探针100%互补的靶序列。可选择地,可以调节严谨条件以允许一些序列错配,使得探测到较低程度的同一性。
进一步,所述编码CPCFC家族表皮蛋白TdCPCFC1的核苷酸序列为SEQ ID NO.5所示的核苷酸序列,长度为519个碱基,对应于编码具有SEQ ID NO.2所示氨基酸的表皮蛋白TdCPCFC1。
进一步,所述编码CPCFC家族表皮蛋白TdCPCFC1的核苷酸序列为SEQ ID NO.6所示的核苷酸序列,长度为495个碱基,对应于编码具有SEQ ID NO.3所示氨基酸的表皮蛋白TdCPCFC1。
进一步,所述编码CPCFC家族表皮蛋白TdCPCFC2的核苷酸序列为SEQ ID NO.18所示的核苷酸序列,长度为528个碱基,对应于编码具有SEQ ID NO.17所示氨基酸的表皮蛋白TdCPCFC2。
本发明第三方面提供了所述的CPCFC家族表皮蛋白,或,所述的编码核苷酸序列应用于研究CPCFC家族表皮蛋白在昆虫表皮组装方式中发挥的作用。
研究表皮蛋白TdCPCFC1和TdCPCFC2有助于了解昆虫表皮组装方式中,CPCFC家族蛋白在表皮中发挥的作用,也能研究鞘翅目所独有的长序列是否对鞘翅目表皮的坚硬度做出贡献。
进一步,所述的应用包括以下几个方面:(1)本发明所提供的表皮蛋白TdCPCFC1和TdCPCFC2的氨基酸序列或至少部分序列的蛋白可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质;(2)涉及表皮蛋白TdCPCFC1和TdCPCFC2及相关截短体,突变体,多肽的生物合成;(3)涉及表皮蛋白TdCPCFC1和TdCPCFC2在昆虫表皮组装方式中的应用。
所述的编码核苷酸序列的应用包括以下几个方面:(1)本发明所提供的核苷酸序列或至少部分核苷酸序列被修饰或突变,修饰或突变的途径包括插入、缺失,聚合酶链式反应(PCR),易错PCR,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化,或通过化学试剂诱变等。(2)本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因通过合适的表达体系在外源宿主中表达以得到相应的表皮蛋白或其他更高的生物活性或产量。(3)本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组质粒以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。
本发明第四方面提供了用于检测所述核苷酸序列的引物。
此处对扩增编码表皮蛋白TdCPCFC1和TdCPCFC2核苷酸序列的PCR产物的核苷酸序列不做具体的限定,能够满足特异性扩增出或特异性检测出所述的编码表皮蛋白TdCPCFC1和TdCPCFC2核苷酸序列的引物即可。
在本发明的一种优选地实施方式中,所述引物包括上游引物和/或下游引物;其中,所述上游引物的核苷酸序列如SEQ ID NO.7所示:5’-ATGTTTGTAAAACTGGCAGTATTAGCTTG-3’;所述下游引物的核苷酸序列如SEQ ID NO.8所示:5’-TTAATGGCAGAATGGGTAATTTGGACA-3’。
本发明第五方面提供了载体,所述载体导入了所述的核苷酸序列。
对于载体的种类不作具体限定,可以根据需要选择适合的载体。例如载体包括但不限于pET28a、pBR322、pUC18、pUC19、pcdna3.1、pESC-Ura或pGEX2T,优选pET28a。
本发明第六方面提供了遗传工程化的宿主细胞,其包含所述的氨基酸序列,或包含所述的核苷酸序列,或导入了所述的载体。
进一步,所述的宿主细胞包括植物细胞、动物细胞或微生物细胞;
进一步,所述微生物细胞包括但不限于大肠杆菌、假单孢菌、芽孢杆菌、酵母细胞中的至少一种。优选大肠杆菌BL21(DE3)。
进一步,在体内和体外将编码所述表皮蛋白的核苷酸序列,或所述的重组质粒,或所述的表达载体引入宿主细胞的方法包括但不限于电穿孔、聚乙二醇(PEG)转化、脂质转染、热休克、磷酸钙沉淀、病毒介导和显微注射。
本发明第七方面提供了制备所述表皮蛋白的方法,包括以下步骤:将所述的编码CPCFC家族表皮蛋白的核苷酸序列,或所述的载体导入宿主细胞中表达获得所述表皮蛋白;和/或,采用所述的遗传工程化的宿主细胞表达获得所述表皮蛋白。
在本发明一种优选地实施方式中,制备所述表皮蛋白的方法,包括以下步骤:
步骤一、合成SEQ ID NO.6所示的核苷酸序列;
步骤二、根据步骤一的核苷酸序列,构建pET28a-cpcfc1的重组载体以及相对应的重组表达基因工程菌;
步骤三、将步骤二获得的重组基因工程菌进行原核表达,并对获得的蛋白进行纯化,得到包含有氨基酸序列如SEQ ID NO.3所示的昆虫表皮蛋白Tdcpcfc1。
本发明第八方面提供了生物制品,包括所述的CPCFC家族表皮蛋白Tdcpcfc1/Tdcpcfc2,或所述表皮蛋白的功能性截短体,突变体,多肽,以及任选地其它组分和/或辅助组分。
进一步,所述生物制品包括结合金属离子制品、还原剂、凝胶、粘合剂中的至少一种。
本发明采用上述技术方案具有以下有益效果:
(1)本发明提供了一种新发现的昆虫CPCFC家族表皮蛋白,有助于了解CPCFC类蛋白的性质,以及了解昆虫表皮组装方式中CPCFC家族表皮蛋白发挥的作用,为研究CPCFC家族表皮蛋白提供了新的基因资源。基于蛋白本身性质为生物材料提供原料,也可以帮助体外重现仿生昆虫表皮。
(2)本发明提供的昆虫CPCFC家族表皮蛋白Tdcpcfc1,能够结合金属离子,具有还原性,能够与几丁质结合,能够形成团聚体,凝胶等,可以用于开发利用相应的生物制品。
附图说明
图1所示为实施例1获得的表皮蛋白TdCPCFC1的纯化电泳图。
图2所示为实施例3中TdCPCFC1蛋白检测Cu(I)的BCS曲线,其中Native指纯化的蛋白。
图3所示为实施例4中TdCPCFC1蛋白的几丁质结合电泳图,其中T:总蛋白,F:透过蛋白,E:结合蛋白。Maker(从上到下):97.4、66.2、43、31、22、14.4(kDa)。
图4所示为实施例4中螯合金属元素后的TdCPCFC1蛋白与α-几丁质结合电泳图。Maker与图3相同。
图5所示为实施例5中加入NADA后促进TdCPCFC1蛋白交联电泳图,其中,input:未处理,S:交联后上清,P:交联后沉淀。Maker与图3相同。
图6所示为实施例5中TdCPCFC1蛋白Tyr交联电泳图。其中Native指纯化的蛋白,After chelation指螯合后蛋白。Maker与图3相同。
图7所示为实施例6中NaCl诱导的TdCPCFC1蛋白两种状态的浊度变化。
图8所示为实施例6中不同种类盐溶液诱导TdCPCFC1浊度变化。
图9所示为实施例6中螯合金属后的TdCPCFC1蛋白结合其它金属产生的浊度变化。
图10所示为实施例6中TdCPCFC1凝胶展现粘性与形成纤维的性质。
图11所示为实施例6中NaCl诱导产生凝胶的ThT染色图结果。
图12所示为实施例6中螯合金属后的TdCPCFC1蛋白与其它金属形成凝胶的ThT染色。
图13所示为实施例6中螯合金属后的TdCPCFC1蛋白再与Cu螯合产生的凝胶具有粘性并能拉出纤维。
图14所示为实施例7获得的TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13三种截短体的纯化电泳图。WT表示野生型TdCPCFC1蛋白,M3表示TdCPCFC1-M3;M2表示TdCPCFC1-M2;M13表示TdCPCFC1-M13。Maker与图3相同。
图15所示为实施例8中TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13三种截短体在盐离子条件下形成团聚体凝胶。
图16所示为实施例8中TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13三种截短体形成的凝胶具有粘性并能拉出纤维。
图17为实施例9获得的表皮蛋白TdCPCFC2的纯化电泳图。Maker与图3相同。
图18实施例9中表皮蛋白TdCPCFC2蛋白形成的凝胶,具有粘性并能拉出纤维。
具体实施方式
本发明中,自定义“Tdcpcfc1或TdCPCFC1,Tdcpcfc2或TdCPCFC2,”均可以表示CPCFC家族表皮蛋白,或CPCFC家族表皮蛋白基因,或编码CPCFC家族表皮蛋白的核苷酸序列,具体所指的含义可以结合上下文判断。
本发明中,术语“基因”被定义为在染色体中占据特定位置并包含对植株潜在的表型特征或性状作出贡献的遗传指令的遗传单位(通常用DNA序列表示)。
本发明中,术语“核苷酸”以本领域技术人员理解的一般含义。
本发明中,术语“氨基酸”是指任何氨基酸(标准和非标准氨基酸二者),包括但不限于α-氨基酸、β-氨基酸、γ-氨基酸和δ-氨基酸。适合的氨基酸的实例包括但不限于丙氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、脯氨酸、丝氨酸、酪氨酸、精氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯基丙氨酸、苏氨酸、色氨酸和缬氨酸。
本发明中,所述的“严谨条件”可为低严谨条件、中严谨条件、高严谨条件中的任一种。“低严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、32℃的条件。“中严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、42℃的条件。“高严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、50℃的条件。在上述条件中,越提高温度,越能期待高效地获得具有高同源性的DNA。影响杂交严谨性的因素可为温度、探针浓度、探针长度、离子强度、时间、盐浓度等多种因素,本领域技术人员通过适宜选择这些因素,可实现同样的严谨条件。
除非另有定义,本发明中所使用的所有科学和技术术语具有与本发明涉及技术领域的技术人员通常理解的相同的含义。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下面结合具体实施例详细描述本发明,这些实施例用于理解而不是限制本发明。
实施例1 Tdcpcfc1基因的克隆及表达纯化
一、合成SEQ
ID
NO.5所示的核苷酸序列
(1)从双叉犀金龟蛹末期的角中提取总RNA,并用反转录酶合成cDNA第一链;
(2)以cDNA为模板,利用上游引物1和下游引物2进行PCR(聚合酶链式反应)扩增;
上游引物1:5’-ATGTTTGTAAAACTGGCAGTATTAGCTTG-3’(SEQ ID NO.7),
下游引物2:5’-TTAATGGCAGAATGGGTAATTTGGACA-3’(SEQ ID NO.8)。
PCR反应体系:1μL cDNA模板,25uL 2×exTaq Premix,1.5μL上游引物1,1.5uL下游引物2,补充ddH2O(双蒸水)至总反应体系为50uL;
PCR反应条件为①98℃,10s;②55℃,30s;③72℃,1min;④重复步骤①-③30个循环;
(3)PCR产物经纯化回收后连接到T载体,测序验证,得到如SEQ ID NO.5所示核苷酸序列。
二、构建重组载体和重组表达基因工程菌
表达重组载体的载体骨架为pET28a原核表达载体;重组表达工程菌株为大肠杆菌BL21(DE3)。
(1)以上述步骤得到的SEQ ID NO.5所示核苷酸序列为模板,利用上游引物3和下游引物4进行PCR扩增;
上游引物3:5’ATCATCATCATCATATGGGATGGAACGGTCCACTCG 3’(SEQ ID NO.9),
下游引物4:5’GGTGGTGGTGCTCGAGTTAATGGCAGAATGGGTAATTTGGACAAGAG 3’(SEQ IDNO.10)。
PCR反应体系:1uL cDNA模板,25uL 2×PrimerSTAR Max Premix,1.5μL上游引物1,1.5μL下游引物2,补充ddH2O(双蒸水)至总反应体系为50uL;
PCR反应条件为①98℃,10s;②55℃,5s;③72℃,5s;④重复步骤①-③30个循环;
PCR产物经纯化回收;
(2)将pET28a载体进行改造,NcoI酶切位点后,NdeI酶切位点前添加6×His tag,之后利用NdeI与XhoI进行双酶切,双酶切产物经纯化回收后与步骤(1)的PCR产物利用In-Fusion HD Cloning Kit进行连接,得到重组表达载体连接产物;
(3)将重组表达载体连接产物与大肠杆菌感受态细胞(E.coli DH5α)混匀,冰浴30min,42℃热激60s,取出后再次冰浴2min;加入LB(Luria-Bertani)液体培养基,37℃,200rpm条件下,振荡培养1h;取菌液于含有50mg/L卡那霉素的LB固体培养基上,涂布均匀,37℃培养过夜,获得克隆菌落;
(4)挑取单克隆菌落接种于含卡那霉素的LB液体培养基中,取菌液进行菌落PCR初步鉴定,将阳性菌液抽提质粒送样测序,得到测序正确的重组工程菌株。
三、TdCPCFC1蛋白表达与纯化
(1)将获得的重组表达工程菌株单菌落接种于10mL含有浓度为50mg/L卡那霉素的LB液体培养基中,37℃过夜培养;将培养过夜的菌液接种于1L含有50mg/L卡那霉素的液体培养基中,37℃,200rpm培养至OD 600达到0.4-0.6后加入终浓度为0.1mM的异丙基-β-D-硫代半乳糖苷(IPTG)诱导培养5h;诱导后的菌液经4℃,8000rpm离心5min收集菌体;重悬于100mL Buffer A(20mM Tris-HCl,pH 7.5)中,高压匀浆破碎,~600bar,3-4个循环。4℃,17000×g,离心40min,收集上清液;
(2)将收集到的上清液用0.22μm低吸附滤膜去除杂质,利用GE 5ml Histrap FF分离纯化蛋白,并利用聚丙烯酰氨凝胶电泳(SDS-PAGE)检测(结果如图1),获得纯化的重组昆虫表皮蛋白,其为SEQ ID NO.3所示氨基酸序列。
(3)纯化后的蛋白透析到Buffer A中,4℃保存。
实施例2 检测TdCPCFC1蛋白结合金属离子性质
重组大肠杆菌培养过程中结合Cu元素
实施例1获得的重组大肠杆菌利用LB培养基诱导后收菌,大肠杆菌加入诱导剂后表达蛋白过程中,会自动吸收培养基内Cu元素,菌体呈现砖红色,将分离得到的1.9mL,2.63mg/mL纯蛋白进行ICP-AES(电感耦合等离子体发射光谱),测得TdCPCFC1蛋白结合0.023mg Cu元素,蛋白与Cu的摩尔比约为1:1。
实施例3 检测TdCPCFC1蛋白还原性
一、TdCPCFC1蛋白Cys数量测定
理论上1个TdCPCFC1蛋白含有4个Cys(不包括信号肽区),以Cys标准品制备标准曲线,利用Ellman’s Reagent反应,检测412nm的UV吸收,测得完全还原状态为4个Cys,但不处理的蛋白中含有2个Cys。结果说明纯化得到的蛋白TdCPCFC1,4个Cys有2个形成了二硫键,另外两个游离,蛋白具有还原性。
二、TdCPCFC1蛋白还原Cu(II)
利用Bcs检测Cu(I)的产生,Bcs可以特异结合Cu(I),在483nm下存在紫外吸收,分别利用纯化的蛋白与经过EDTA+TCEP(螯合剂+还原剂处理使蛋白不带Cu元素,且还原剂处理后还原全部Cys作为对照)处理的纯化蛋白检测其对Cu(II)的还原能力。结果显示两种蛋白都具有还原能力,还原曲线见图2。
实施例4 检测TdCPCFC1蛋白与几丁质结合能力
一、TdCPCFC1蛋白与不同类型几丁质结合能力
实验方法:利用3mg/mL溶于水中的不同类型几丁质浊液(α-几丁质、β-几丁质、胶体几丁质、壳聚糖),0.5mg/mL蛋白溶液(Buffer A),200μL体系,室温下旋转混合约3-4h。离心取上清,即为透过蛋白(F),利用Buffer A洗涤5-6次,BSA作为对照,8M尿素洗脱结合在几丁质上的蛋白(E)。
实验结果见图3,TdCPCFC1蛋白与α-几丁质(α-chitin)具有结合能力,但基本不结合β-几丁质(β-chitin),胶体几丁质(colloidal chitin)和壳聚糖(chitosan)。
二、TdCPCFC1蛋白螯合后与几丁质结合能力
实验方法参照Tdcpcfc1蛋白与不同类型几丁质结合的实验。
图4的实验结果显示,TdCPCFC1蛋白螯合Cu后,不影响TdCPCFC1蛋白与α-几丁质结合。
实施例5 检测TdCPCFC1蛋白交联
一、NADA促进TdCPCFC1蛋白交联
实验方法:5μg和10μg TdCPCFC1蛋白中分别加入10mM,20mM NADA(N-Arachidonyldopamine),30℃孵育1h,检测TdCPCFC1蛋白中交联情况。
实验结果见图5,交联后上清的电泳图上方条带(大约43kDa处)加粗,说明了添加NADA可以促进TdCPCFC1蛋白交联。
二、TdCPCFC1蛋白中Tyr交联
实验方法:10mg/mL TdCPCFC1,0.2mM Ru(II),2.5mM APS,100uL体系混合均匀。两次暴露于500W大灯下,持续照射3min,两次之间间隔15min。
实验结果见图6,交联后上清的电泳图上方出现新条带,说明了利用Ru(II)与APS能够促进TdCPCFC1蛋白进行Tyr交联。而且纯化蛋白中Tyr交联比螯合后的交联情况好,原因是Ru(II)与螯合后蛋白接触后会有一部分与蛋白结合,造成其催化作用减弱,故条带减弱。
实施例6 检测Tdcpcfc1蛋白团聚
一、盐离子促进Tdcpcfc1蛋白团聚
TdCPCFC1蛋白在盐离子强度变化时能够发生LLPS(液液相分离),产生团聚体。但加入EDTA螯合金属元素后,失去LLPS能力。以加入NaCl后的浊度变化说明这个过程,结果见图7。
除了NaCl外,其它盐离子也能够促进团聚体的形成,以浊度变化说明这一过程,结果见图8。
二、金属离子促进TdCPCFC1蛋白团聚
螯合掉纯化TdCPCFC1蛋白本身存在的Cu后,去除EDTA,将蛋白加入其它过渡金属溶液中(存在过渡金属条件下,盐诱导才能形成团聚),同样能形成团聚体,以浊度变化说明这一过程,结果见图9。
三、TdCPCFC1蛋白团聚体形成凝胶
TdCPCFC1蛋白团聚体适度脱水后能够形成具有黏性的凝胶,并拉出纤维,结果见图10。ThT染色说明,形成的凝胶具有β-sheet结构,结果见图11(左侧图为白光下凝胶的显微结构,右侧图出现明显的绿色荧光)。
螯合金属后的TdCPCFC1蛋白与其它金属形成凝胶经ThT染色具有荧光,说明其同样具有β-sheet结构,结果见图12(图右侧均可见明显的绿色荧光)。
重新添加Cu形成的凝胶同样具有粘性,并可以拉出纤维,结果见图13。
实施例7 制备TdCPCFC1蛋白的截短体
选取三种TdCPCFC1蛋白的截短体,分别命名为TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13,对应的氨基酸序列分别为SEQ ID NO.11、SEQ ID NO.12、SEQ ID NO.13,对应的编码核苷酸序列分别为SEQ ID NO.14、SEQ ID NO.15、SEQ ID NO.16。
截短体蛋白的基因克隆及表达纯化与实施例1的野生型TdCPCFC1蛋白相同,电泳图如图14所示。
实施例8 检测TdCPCFC1蛋白的截短体的性质
参考实施例6的实验操作,TdCPCFC1-M3、TdCPCFC1-M2、TdCPCFC1-M13截短体蛋白同样都能在盐离子条件下形成团聚体凝胶,结果如图15所示,可以看出离心管底部均有黄色团聚体凝胶(黑白图中显示为白色凝胶)。
截短体蛋白形成的凝胶具有与野生型蛋白相似的形成纤维的性质,结果如图16所示。
实施例9 Tdcpcfc2基因的克隆及表达纯化
Tdcpcfc2基因的克隆及表达纯化的具体实验操作流程参考实施例1,最后获得纯化的重组Tdcpcfc2表皮蛋白,其N端带有组氨酸标签,用聚丙烯酰氨凝胶电泳(SDS-PAGE)检测结果如图17。
实施例10 检测Tdcpcfc2蛋白团聚
参考实施例6中Tdcpcfc1蛋白在盐离子存在条件下形成团聚体的实验操作,TdCPCFC1蛋白团聚体能够形成具有黏性的凝胶,并拉出纤维,结果见图18。
图18中左侧图的离心管底部形成了凝胶,如黑色箭头所指的凝胶,胶凝成浅黄色,颜色稍深于实施例6中TdCPCFC1蛋白形成的凝胶。图18中右侧能够明显的看到两手指中的胶凝能够拉出纤维状细丝。
由上述内容中的结果可以看出,虽然同属于鞘翅目CPCFC家族表皮蛋白的TdCPCFC1与TdCPCFC2的序列相似性仅为57.1%,两个蛋白的整体序列相似性较低,但两种表皮蛋白具有相似的性质(如形成团聚体、凝胶)。同理,通过本发明的研究可以推测其它鞘翅目的CPCFC蛋白可能也具有类似性质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。
序列表
<110> 中国农业科学院农业基因组研究所
<120> 昆虫CPCFC家族表皮蛋白,编码核苷酸序列及其应用
<141> 2021-06-10
<160> 18
<170> SIPOSequenceListing 1.0
<210> 1
<211> 155
<212> PRT
<213> Unknown
<400> 1
Gly Trp Asn Gly Pro Leu Ala Gly Gly Val Pro Ala His Gln Phe Pro
1 5 10 15
Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys Asn Asn
20 25 30
Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro Gly Ala
35 40 45
Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Gln
50 55 60
Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly Asn Ala Leu
65 70 75 80
Asp Asn Gly Glu Tyr Thr Gly Asp Gly Asp Tyr Arg Gly Glu Gly Leu
85 90 95
Ala Glu Ser Gly Ala Tyr Gly Asn Ala Asp Gly Gly His Asn Asn Gly
100 105 110
Gly Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala
115 120 125
Tyr Asn Pro Ala Gly His Ala Pro Gly Pro Val Pro Ala Gly Val Asp
130 135 140
Pro His Ser Cys Pro Asn Tyr Pro Phe Cys His
145 150 155
<210> 2
<211> 172
<212> PRT
<213> Unknown
<400> 2
Met Phe Val Lys Leu Ala Val Leu Ala Cys Thr Phe Ala Val Ala Leu
1 5 10 15
Ala Gly Trp Asn Gly Pro Leu Ala Gly Gly Val Pro Ala His Gln Phe
20 25 30
Pro Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys Asn
35 40 45
Asn Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro Gly
50 55 60
Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala
65 70 75 80
Gln Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly Asn Ala
85 90 95
Leu Asp Asn Gly Glu Tyr Thr Gly Asp Gly Asp Tyr Arg Gly Glu Gly
100 105 110
Leu Ala Glu Ser Gly Ala Tyr Gly Asn Ala Asp Gly Gly His Asn Asn
115 120 125
Gly Gly Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly
130 135 140
Ala Tyr Asn Pro Ala Gly His Ala Pro Gly Pro Val Pro Ala Gly Val
145 150 155 160
Asp Pro His Ser Cys Pro Asn Tyr Pro Phe Cys His
165 170
<210> 3
<211> 164
<212> PRT
<213> Unknown
<400> 3
Met Gly His His His His His His Met Gly Trp Asn Gly Pro Leu Ala
1 5 10 15
Gly Gly Val Pro Ala His Gln Phe Pro Ala Gly Val Ser Pro Gln Ala
20 25 30
Cys Pro Asn Tyr Pro Asn Cys Asn Asn Pro Ala Val Ala Val Ser Pro
35 40 45
Asn Ala Ala Ala Pro Tyr Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn
50 55 60
Pro Gly Ala Tyr Asn Pro Gly Ala Gln Asn Pro Gly Ala Tyr Asn Pro
65 70 75 80
Gly Ala Tyr Asn Gly Gly Asn Ala Leu Asp Asn Gly Glu Tyr Thr Gly
85 90 95
Asp Gly Asp Tyr Arg Gly Glu Gly Leu Ala Glu Ser Gly Ala Tyr Gly
100 105 110
Asn Ala Asp Gly Gly His Asn Asn Gly Gly Tyr Asn Pro Gly Ala Tyr
115 120 125
Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Ala Gly His Ala
130 135 140
Pro Gly Pro Val Pro Ala Gly Val Asp Pro His Ser Cys Pro Asn Tyr
145 150 155 160
Pro Phe Cys His
<210> 4
<211> 468
<212> DNA
<213> Unknown
<400> 4
ggatggaacg gtccactcgc gggaggagtc ccagcccacc agtttccagc tggagttagc 60
ccgcaagcct gccccaacta tcccaattgc aacaaccctg ccgtagcagt ttcgccgaat 120
gcggccgctc cgtatccggg cgcttataat ccaggtgcgt acaatccggg tgcatacaac 180
ccaggcgcgc agaatccggg cgcttacaat ccaggagcct ataatggcgg aaatgctttg 240
gataacggcg agtacactgg agacggtgac tatcgcggcg aaggacttgc cgaatccgga 300
gcgtacggaa atgctgatgg tggacacaat aacggtggct acaatccagg agcttacaat 360
ccaggcgcgt acaaccctgg cgcatacaac ccagcaggac acgcccctgg tccagtacct 420
gccggtgttg atccacactc ttgtccaaat tacccattct gccattaa 468
<210> 5
<211> 519
<212> DNA
<213> Unknown
<400> 5
atgtttgtaa aactggcagt attagcttgc accttcgccg tagcattggc aggatggaac 60
ggtccactcg cgggaggagt cccagcccac cagtttccag ctggagttag cccgcaagcc 120
tgccccaact atcccaattg caacaaccct gccgtagcag tttcgccgaa tgcggccgct 180
ccgtatccgg gcgcttataa tccaggtgcg tacaatccgg gtgcatacaa cccaggcgcg 240
cagaatccgg gcgcttacaa tccaggagcc tataatggcg gaaatgcttt ggataacggc 300
gagtacactg gagacggtga ctatcgcggc gaaggacttg ccgaatccgg agcgtacgga 360
aatgctgatg gtggacacaa taacggtggc tacaatccag gagcttacaa tccaggcgcg 420
tacaaccctg gcgcatacaa cccagcagga cacgcccctg gtccagtacc tgccggtgtt 480
gatccacact cttgtccaaa ttacccattc tgccattaa 519
<210> 6
<211> 495
<212> DNA
<213> Unknown
<400> 6
atgggccatc atcatcatca tcatatggga tggaacggtc cactcgcggg aggagtccca 60
gcccaccagt ttccagctgg agttagcccg caagcctgcc ccaactatcc caattgcaac 120
aaccctgccg tagcagtttc gccgaatgcg gccgctccgt atccgggcgc ttataatcca 180
ggtgcgtaca atccgggtgc atacaaccca ggcgcgcaga atccgggcgc ttacaatcca 240
ggagcctata atggcggaaa tgctttggat aacggcgagt acactggaga cggtgactat 300
cgcggcgaag gacttgccga atccggagcg tacggaaatg ctgatggtgg acacaataac 360
ggtggctaca atccaggagc ttacaatcca ggcgcgtaca accctggcgc atacaaccca 420
gcaggacacg cccctggtcc agtacctgcc ggtgttgatc cacactcttg tccaaattac 480
ccattctgcc attaa 495
<210> 7
<211> 29
<212> DNA
<213> Artificial Sequence
<400> 7
atgtttgtaa aactggcagt attagcttg 29
<210> 8
<211> 27
<212> DNA
<213> Artificial Sequence
<400> 8
ttaatggcag aatgggtaat ttggaca 27
<210> 9
<211> 36
<212> DNA
<213> Artificial Sequence
<400> 9
atcatcatca tcatatggga tggaacggtc cactcg 36
<210> 10
<211> 47
<212> DNA
<213> Artificial Sequence
<400> 10
ggtggtggtg ctcgagttaa tggcagaatg ggtaatttgg acaagag 47
<210> 11
<211> 141
<212> PRT
<213> Unknown
<400> 11
Phe Pro Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys
1 5 10 15
Asn Asn Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro
20 25 30
Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly
35 40 45
Ala Gln Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly Asn
50 55 60
Ala Leu Asp Asn Gly Glu Tyr Thr Gly Asp Gly Asp Tyr Arg Gly Glu
65 70 75 80
Gly Leu Ala Glu Ser Gly Ala Tyr Gly Asn Ala Asp Gly Gly His Asn
85 90 95
Asn Gly Gly Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro
100 105 110
Gly Ala Tyr Asn Pro Ala Gly His Ala Pro Gly Pro Val Pro Ala Gly
115 120 125
Val Asp Pro His Ser Cys Pro Asn Tyr Pro Phe Cys His
130 135 140
<210> 12
<211> 77
<212> PRT
<213> Unknown
<400> 12
Gly Trp Asn Gly Pro Leu Ala Gly Gly Val Pro Ala His Gln Phe Pro
1 5 10 15
Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys Asn Asn
20 25 30
Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro Gly Ala
35 40 45
Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Gln
50 55 60
Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly
65 70 75
<210> 13
<211> 63
<212> PRT
<213> Unknown
<400> 13
Phe Pro Ala Gly Val Ser Pro Gln Ala Cys Pro Asn Tyr Pro Asn Cys
1 5 10 15
Asn Asn Pro Ala Val Ala Val Ser Pro Asn Ala Ala Ala Pro Tyr Pro
20 25 30
Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Pro Gly
35 40 45
Ala Gln Asn Pro Gly Ala Tyr Asn Pro Gly Ala Tyr Asn Gly Gly
50 55 60
<210> 14
<211> 426
<212> DNA
<213> Unknown
<400> 14
tttccagctg gagttagccc gcaagcctgc cccaactatc ccaattgcaa caaccctgcc 60
gtagcagttt cgccgaatgc ggccgctccg tatccgggcg cttataatcc aggtgcgtac 120
aatccgggtg catacaaccc aggcgcgcag aatccgggcg cttacaatcc aggagcctat 180
aatggcggaa atgctttgga taacggcgag tacactggag acggtgacta tcgcggcgaa 240
ggacttgccg aatccggagc gtacggaaat gctgatggtg gacacaataa cggtggctac 300
aatccaggag cttacaatcc aggcgcgtac aaccctggcg catacaaccc agcaggacac 360
gcccctggtc cagtacctgc cggtgttgat ccacactctt gtccaaatta cccattctgc 420
cattaa 426
<210> 15
<211> 234
<212> DNA
<213> Unknown
<400> 15
ggatggaacg gtccactcgc gggaggagtc ccagcccacc agtttccagc tggagttagc 60
ccgcaagcct gccccaacta tcccaattgc aacaaccctg ccgtagcagt ttcgccgaat 120
gcggccgctc cgtatccggg cgcttataat ccaggtgcgt acaatccggg tgcatacaac 180
ccaggcgcgc agaatccggg cgcttacaat ccaggagcct ataatggcgg atga 234
<210> 16
<211> 192
<212> DNA
<213> Unknown
<400> 16
tttccagctg gagttagccc gcaagcctgc cccaactatc ccaattgcaa caaccctgcc 60
gtagcagttt cgccgaatgc ggccgctccg tatccgggcg cttataatcc aggtgcgtac 120
aatccgggtg catacaaccc aggcgcgcag aatccgggcg cttacaatcc aggagcctat 180
aatggcggat ga 192
<210> 17
<211> 175
<212> PRT
<213> Unknown
<400> 17
Met Leu Val Gln Ser Asp Val Leu Ala Cys Ala Leu Ala Ile Ala Ser
1 5 10 15
Ala Ala Trp Asn Gly Pro Leu Ala Gly Gly Val Pro Ala Ser Gln Ile
20 25 30
Pro Ala Gly Ile Ser Leu Gln Ala Cys Pro Asn Tyr Pro His Cys Asn
35 40 45
Asn Pro Asn Val Ala Val Glu Pro Asn Ser Pro Ala Ala Gln Gln Ala
50 55 60
Pro Gln Tyr Gln Pro Ala Pro Gln Tyr Gln Pro Ala Pro Gln Tyr Gln
65 70 75 80
Pro Ala Pro Gln Tyr Gln Pro Ala Pro Gln Gln Ser Tyr Asn Gln Asn
85 90 95
Ala Leu Asp Asn Gly Glu Tyr Thr Gly Asp Gly Asp Tyr His Gly Glu
100 105 110
Gly Leu Ala Glu Ser Gly Ala Phe Gly Ser Thr Gly Asn Ser Gln Ala
115 120 125
Tyr Asn Ser Ala Pro Ala Tyr Gln Pro Ala Pro Ala Tyr Gln Pro Ala
130 135 140
Ser Pro Gln Tyr Asn Pro Ala Pro Ala Gln Pro Ala Ala Gln Leu Pro
145 150 155 160
Ala Gly Val Asp Ala His Ala Cys Pro Asn Tyr Pro Tyr Cys Ser
165 170 175
<210> 18
<211> 528
<212> DNA
<213> Unknown
<400> 18
atgcttgtcc aatcggacgt attagcttgc gctttggcaa tcgcttctgc cgcatggaac 60
ggtcctttgg cagggggagt accggcgtcc caaattccag ccggaattag tctgcaagct 120
tgtccaaatt atccccactg taacaatcca aacgtagcgg tcgaaccaaa ctcgccagct 180
gctcaacaag ctcctcaata ccaaccagca cctcaatatc agcctgctcc acaatatcaa 240
cctgccccgc aataccaacc tgccccacaa caatcttaca accaaaatgc tttggataat 300
ggagagtata ccggggacgg tgactatcat ggcgaaggtt tagcagaatc tggtgcattt 360
ggttcaactg gtaattcgca agcttacaac agcgcacccg cttaccaacc agcgccagcg 420
taccaaccag catcccccca atacaatcca gcaccagcac agcccgcggc tcaacttcca 480
gctggtgttg acgcacatgc atgccctaac tatccatact gcagttag 528
Claims (10)
1.昆虫CPCFC家族表皮蛋白,其特征在于,所述蛋白的氨基酸序列包含或由如下序列组成:
a)SEQ ID NO.1所示的氨基酸序列;或,
b)与SEQ ID NO.1所示的氨基酸序列具有至少50%序列同一性的功能性同源序列;或
c)在SEQ ID NO.1所示的氨基酸序列中添加、缺失、替换一个或多个氨基酸且具有相同蛋白活性的氨基酸序列。
2.如权利要求1所述的表皮蛋白,其特征在于,所述昆虫选自鞘翅目,优选双叉犀金龟;
优选地,所述b)和/或c)的氨基酸序列包含SEQ ID NO.2所示的氨基酸序列;
优选地,所述b)和/或c)的氨基酸序列包含SEQ ID NO.3所示的氨基酸序列;
优选地,所述b)和/或c)的氨基酸序列包含SEQ ID NO.17所示的氨基酸序列;
优选地,所述昆虫CPCFC家族表皮蛋白包括TdCPCFC1和TdCPCFC2表皮蛋白。
3.编码权利要求1或2所述的CPCFC家族表皮蛋白的核苷酸序列。
4.如权利要求3所述的编码CPCFC家族表皮蛋白的核苷酸序列,其特征在于,所述核苷酸序列包含或由如下序列组成:
i)SEQ ID NO.4所示的核苷酸序列;或,
ii)SEQ ID NO.4所示的核苷酸序列的互补序列、简并序列或同源序列(优选同源性50%以上);或,
iii)在严谨条件下与SEQ ID NO.4所示的核苷酸序列杂交,且能够编码CPCFC家族表皮蛋白的核苷酸序列;
优选地,所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.5所示的核苷酸序列;
优选地,所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.6所示的核苷酸序列;
优选地,所述ii)和/或iii)的核苷酸序列包含SEQ ID NO.18所示的核苷酸序列。
5.权利要求1或2所述的表皮蛋白,或,权利要求3或4所述的编码核苷酸序列应用于研究CPCFC家族表皮蛋白在昆虫表皮组装方式中发挥的作用。
6.用于检测权利要求3或4所述核苷酸序列的引物;
优选地,所述引物包括上游引物和/或下游引物;
优选地,所述上游引物的核苷酸序列如SEQ ID NO.7所示;和/或,所述下游引物的核苷酸序列如SEQ ID NO.8所示。
7.载体,其特征在于,包含权利要求3或4所述的核苷酸序列。
8.遗传工程化的宿主细胞,其特征在于,其包含权利要求1所述的氨基酸序列,或包含权利要求3或4所述的核苷酸序列,或导入了权利要求7所述的载体;
优选地,所述宿主细胞包括植物细胞、动物细胞或微生物细胞中的至少一种;
优选地,所述微生物细胞包括大肠杆菌、假单孢菌、芽孢杆菌、酵母细胞中的至少一种。
9.制备权利要求1或2所述表皮蛋白的方法,其特征在于,包括以下步骤:
将权利要求3或4所述的核苷酸序列,或权利要求6所述的载体导入宿主细胞中表达获得所述表皮蛋白;和/或,
采用权利要求7所述的遗传工程化的宿主细胞表达获得所述表皮蛋白。
10.一种生物制品,其特征在于,包括权利要求1或2所述的表皮蛋白,或所述表皮蛋白的功能性截短体,突变体,多肽;
优选地,所述生物制品包括结合金属离子制品、还原剂、凝胶、粘合剂中的至少一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110646579.9A CN113321718B (zh) | 2021-06-10 | 2021-06-10 | 昆虫cpcfc家族表皮蛋白,编码核苷酸序列及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110646579.9A CN113321718B (zh) | 2021-06-10 | 2021-06-10 | 昆虫cpcfc家族表皮蛋白,编码核苷酸序列及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113321718A true CN113321718A (zh) | 2021-08-31 |
CN113321718B CN113321718B (zh) | 2022-04-15 |
Family
ID=77420392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110646579.9A Active CN113321718B (zh) | 2021-06-10 | 2021-06-10 | 昆虫cpcfc家族表皮蛋白,编码核苷酸序列及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113321718B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116063746A (zh) * | 2022-08-18 | 2023-05-05 | 中国农业科学院深圳农业基因组研究所 | 提升壳聚糖材料机械性能的方法及制备的壳聚糖复合材料 |
CN116693596A (zh) * | 2023-05-11 | 2023-09-05 | 西安交通大学医学院第一附属医院 | 一种昆虫表皮蛋白自组装体、制备方法及应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6248329B1 (en) * | 1998-06-01 | 2001-06-19 | Ramaswamy Chandrashekar | Parasitic helminth cuticlin nucleic acid molecules and uses thereof |
CN101386849A (zh) * | 2007-09-12 | 2009-03-18 | 中国农业科学院植物保护研究所 | 一种抗昆虫血细胞免疫的线虫表皮蛋白及基因序列 |
CN105695476A (zh) * | 2016-03-29 | 2016-06-22 | 山西大学 | 飞蝗翅表皮蛋白基因及其在害虫防治中的应用 |
-
2021
- 2021-06-10 CN CN202110646579.9A patent/CN113321718B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6248329B1 (en) * | 1998-06-01 | 2001-06-19 | Ramaswamy Chandrashekar | Parasitic helminth cuticlin nucleic acid molecules and uses thereof |
CN101386849A (zh) * | 2007-09-12 | 2009-03-18 | 中国农业科学院植物保护研究所 | 一种抗昆虫血细胞免疫的线虫表皮蛋白及基因序列 |
CN105695476A (zh) * | 2016-03-29 | 2016-06-22 | 山西大学 | 飞蝗翅表皮蛋白基因及其在害虫防治中的应用 |
Non-Patent Citations (6)
Title |
---|
GENBANK: "PREDICTED: uncharacterized protein LOC109597722 [Aethina tumida]", 《GENBANK》 * |
LAURAVANNINI等: "The CPCFC cuticular protein family: Anatomical and cuticular locations in Anopheles gambiae and distribution throughout Pancrustacea", 《INSECT BIOCHEMISTRY AND MOLECULAR BIOLOGY》 * |
ZOI S IOANNIDOU等: "CutProtFam-Pred: detection and classification of putative structural cuticular proteins from sequence alone, based on profile hidden Markov models", 《INSECT BIOCHEMISTRY AND MOLECULAR BIOLOGY》 * |
叶长青等: "双叉犀金龟表皮蛋白TdCPR12611与TdCPR7854的表达纯化及特性分析", 《昆虫学报》 * |
李根层等: "基于转录组学的管纹艳虎天牛表皮蛋白基因家族的鉴定及特征分析", 《环境昆虫学报》 * |
陈二虎等: "米象表皮蛋白的全基因组注释及其系统发育分析", 《中国粮油学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116063746A (zh) * | 2022-08-18 | 2023-05-05 | 中国农业科学院深圳农业基因组研究所 | 提升壳聚糖材料机械性能的方法及制备的壳聚糖复合材料 |
CN116063746B (zh) * | 2022-08-18 | 2024-04-02 | 中国农业科学院深圳农业基因组研究所 | 提升壳聚糖材料机械性能的方法及制备的壳聚糖复合材料 |
CN116693596A (zh) * | 2023-05-11 | 2023-09-05 | 西安交通大学医学院第一附属医院 | 一种昆虫表皮蛋白自组装体、制备方法及应用 |
CN116693596B (zh) * | 2023-05-11 | 2024-04-26 | 西安交通大学医学院第一附属医院 | 一种昆虫表皮蛋白自组装体、制备方法及应用 |
Also Published As
Publication number | Publication date |
---|---|
CN113321718B (zh) | 2022-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113321718B (zh) | 昆虫cpcfc家族表皮蛋白,编码核苷酸序列及其应用 | |
CN108239633B (zh) | 一种催化活性得到提高的d-阿洛酮糖-3-差向异构酶的突变体及其应用 | |
CN113767168B (zh) | 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶 | |
CN111394333B (zh) | 一种赭曲霉毒素解毒酶及其编码基因、重组载体及应用 | |
CN109797155B (zh) | 三疣梭子蟹甘露糖结合凝集素PtMBL基因及其编码蛋白和应用 | |
AU2020242724B2 (en) | Aminoacyl-tRNA synthetase for efficiently introducing lysine derivative in protein | |
CN112961846B (zh) | 酶活力提高的玉米赤霉烯酮降解酶突变体及其编码基因和应用 | |
CN112662653B (zh) | 一种低温酶解性能提高的角蛋白酶突变体及其应用 | |
JP2020174686A (ja) | 酵素を用いた4−アミノ桂皮酸の製造方法 | |
CN107312094A (zh) | 一种杂合抗菌肽及其制备方法和应用 | |
CN107164352A (zh) | 新的赖氨酸脱羧酶突变体及其应用 | |
CN108239632B (zh) | 一种热稳定性得到改善的d-阿洛酮糖-3-差向异构酶的突变体及其应用 | |
CN114107266A (zh) | 耐热性提高的蛋白酶突变体及其编码基因和应用 | |
CN114573673B (zh) | 双叉犀金龟表皮蛋白,编码核苷酸序列及其应用 | |
CN110592084A (zh) | 一种rhtA基因启动子改造的重组菌株及其构建方法与应用 | |
CN113402596B (zh) | 双叉犀金龟rr-2家族表皮蛋白,编码核苷酸序列及其应用 | |
CN103232980B (zh) | 一种合成γ-聚谷氨酸的谷氨酰转肽酶及其编码基因 | |
CN111349585B (zh) | 一种海洋来源的胶原蛋白膨胀蛋白酶vp9及其编码基因与应用 | |
CN109517814B (zh) | 有机磷降解酶的突变体及其应用 | |
US11279642B2 (en) | Compositions and methods for treating contaminated water | |
CN110564742B (zh) | 一种yebN基因改造的重组菌株及其构建方法与应用 | |
CN111801420B (zh) | 制造4-氨基肉桂酸的方法、以及用于其的载体及宿主细胞 | |
CN101058805B (zh) | 突变羧肽酶原b及突变羧肽酶b的生产方法 | |
CN111349623A (zh) | 9°n dna聚合酶突变体 | |
CN113667675B (zh) | 利用大豆fls2/bak1基因提高植物抗病性 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |