CN113416734A - 一种提高gfap蛋白表达量的基因及其可溶性表达方法 - Google Patents
一种提高gfap蛋白表达量的基因及其可溶性表达方法 Download PDFInfo
- Publication number
- CN113416734A CN113416734A CN202110607070.3A CN202110607070A CN113416734A CN 113416734 A CN113416734 A CN 113416734A CN 202110607070 A CN202110607070 A CN 202110607070A CN 113416734 A CN113416734 A CN 113416734A
- Authority
- CN
- China
- Prior art keywords
- gfap
- protein
- pgex
- gene
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 title claims abstract description 75
- 230000014509 gene expression Effects 0.000 title claims abstract description 65
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 18
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 title claims abstract 11
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 32
- 241000588724 Escherichia coli Species 0.000 claims abstract description 29
- 239000013598 vector Substances 0.000 claims abstract description 23
- 108010079246 OMPA outer membrane proteins Proteins 0.000 claims abstract description 20
- 239000013612 plasmid Substances 0.000 claims description 28
- 108020004705 Codon Proteins 0.000 claims description 20
- 102000004169 proteins and genes Human genes 0.000 claims description 19
- 239000012634 fragment Substances 0.000 claims description 8
- 239000002773 nucleotide Substances 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 8
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 6
- 108700010070 Codon Usage Proteins 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000029087 digestion Effects 0.000 claims description 5
- 108091008146 restriction endonucleases Proteins 0.000 claims description 5
- 239000000872 buffer Substances 0.000 claims description 4
- 239000013604 expression vector Substances 0.000 claims description 4
- 238000000137 annealing Methods 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims 1
- 102000053171 Glial Fibrillary Acidic Human genes 0.000 abstract description 56
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 abstract description 37
- 210000003000 inclusion body Anatomy 0.000 abstract description 10
- 230000028327 secretion Effects 0.000 abstract description 6
- 101150057182 GFAP gene Proteins 0.000 abstract description 5
- 238000011160 research Methods 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 description 37
- 150000001413 amino acids Chemical class 0.000 description 30
- 108020004414 DNA Proteins 0.000 description 14
- 210000004027 cell Anatomy 0.000 description 10
- 238000001976 enzyme digestion Methods 0.000 description 9
- 210000001130 astrocyte Anatomy 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 5
- 206010003571 Astrocytoma Diseases 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 239000011259 mixed solution Substances 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 206010018338 Glioma Diseases 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 210000003169 central nervous system Anatomy 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 229920001971 elastomer Polymers 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 230000009465 prokaryotic expression Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 241000269331 Ambystoma Species 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 230000032683 aging Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008499 blood brain barrier function Effects 0.000 description 2
- 210000001218 blood-brain barrier Anatomy 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 208000005017 glioblastoma Diseases 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 150000007523 nucleic acids Chemical group 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- 208000017194 Affective disease Diseases 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 208000011403 Alexander disease Diseases 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- QMNFFXRFOJIOKZ-UHFFFAOYSA-N Cycloguanyl Natural products CC1(C)N=C(N)N=C(N)N1C1=CC=C(Cl)C=C1 QMNFFXRFOJIOKZ-UHFFFAOYSA-N 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 102100021238 Dynamin-2 Human genes 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 201000010915 Glioblastoma multiforme Diseases 0.000 description 1
- 101000817607 Homo sapiens Dynamin-2 Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 102000012411 Intermediate Filament Proteins Human genes 0.000 description 1
- 108010061998 Intermediate Filament Proteins Proteins 0.000 description 1
- 241000205573 Jeffersonia Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 208000019022 Mood disease Diseases 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 239000008049 TAE buffer Substances 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- HGEVZDLYZYVYHD-UHFFFAOYSA-N acetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound CC(O)=O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O HGEVZDLYZYVYHD-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 201000007455 central nervous system cancer Diseases 0.000 description 1
- 208000025997 central nervous system neoplasm Diseases 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011990 functional testing Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 229940029329 intrinsic factor Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 201000004058 mixed glioma Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 239000012487 rinsing solution Substances 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000001228 trophic effect Effects 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/101—Plasmid DNA for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及一种提高GFAP蛋白表达量的基因及其可溶性表达方法,通过对胶质纤维酸性蛋白GFAP基因碱基序列进行优化,得到优化后的GFAP‑opt基因序列SEQ ID NO.2,有效的使胶质纤维酸性蛋白在大肠杆菌中大量表达。通过进一步对pGEX‑4T‑2载体进行改造,增加了OmpA信号肽,所述信号肽序列为SEQ ID NO.3。本研究通过融合OmpA信号肽,使胶质纤维酸性蛋白在大肠杆菌中的分泌增加,有效改善了胶质纤维酸性蛋白包涵体形式的表达。
Description
技术领域
本发明涉及生物制药领域,具体涉及一种提高GFAP蛋白表达量的基因及其可溶性表达方法。
背景技术
胶质纤维酸性蛋白(GFAP)是中枢神经系统所独有的特异性细胞骨架蛋白,是星形胶质细胞唯一表达的一种标志性蛋白,星形胶质细胞广泛分布于中枢神经系统各个部位,约占正常成年人脑细胞总数的40%。GFAP则是星形胶质细胞和星形胶质细胞源性肿瘤的标志蛋白,对神经元起支撑和营养作用,参与星形胶质细胞的许多生物学功能,包括细胞的增殖与分裂、维护血脑屏障的正常生理功能、自噬、维持神经递质的平衡等。GFAP是星形胶质细胞特有的中间丝蛋白,是胶质瘤的标志蛋白。在正常情况下,细胞胞质内的GFAP循环降解,血液中GFAP水平较稳定;而病理条件下,如病人的中枢神经系统受到损伤,其星形胶质细胞遭受破伤或坏死时,GFAP从胶质细胞中流出,穿过血脑屏障进入血液中,使GFAP浓度上调,因此GFAP在恶性胶质瘤中表现出异常过度表达。GFAP表达水平异常与多种遗传病和精神病相关,如亚历山大病、唐氏综合征、精神分裂症、情感型双极性疾患和抑郁症。目前,GFAP表达水平已经作为中风、脑外损伤、星型细胞源性胶质瘤等多种疾病的诊断标志之一。另外GFAP主要用于星型胶质瘤,包括星型细胞瘤,星型母细胞瘤,混合胶质瘤,多形性胶质母细胞瘤和非星型细胞瘤,包括部分少数胶质细胞瘤,多数室管膜瘤等中枢神经系统肿瘤的诊断和鉴别诊断。
在胶质纤维酸性蛋白抗原制备过程中,采取pGEX-4T-2载体对其全长基因进行表达,发现其原序列在大肠杆菌中不好表达。此外表达的蛋白都以包涵体形式存在。一方面增加纯化成本,另一方面纯化过程可能造成蛋白失活。
为了解决上述技术难题,本发明提供了一种提高GFAP蛋白表达量的基因GFAP-opt及其表达方法。
发明内容
本发明在一个方面,提供了一种GFAP-opt基因,其序列如SEQ.ID.No.2所示。
在另一个方面,本发明提供了一种所述GFAP-opt基因在提高GFAP蛋白表达量中的作用。
在一个实施例中,本发明提供了一种pGEX-4T-2表达载体,其表达所述的GFAP-opt基因,命名为pGEX-4T-2-GFAP-opt。
在一个或多个实施例中,所述载体其进一步包括OmpA信号肽,构建得到pGEX-4T-2-OmpA-GFAP-opt重组质粒。
在一实施例中,所述OmpA信号肽的序列如SEQ.ID.No.3所示。
在一个方面,本发明提供了一种所述pGEX-4T-2-opma-GFAP-opt载体在提高GFAP蛋白可溶性表达中的作用。
在另一个方面,本发明提供了一种提高GFAP蛋白表达量的方法,其特征在于:使用pGEX-4T-2-GFAP-opt载体表达GFAP蛋白。
在本发明的一个方面,提供了一种提高GFAP蛋白可溶性表达的方法,其特征在于:使用pGEX-4T-2-OmpA-GFAP-opt重组质粒表达GFAP蛋白。
在一个实施例中,本发明提供了一种提高GFAP蛋白表达量的方法,其特征在于:用软件OptimumGeneTM分析编码GFAP蛋白的基因序列SEQ ID NO.1,找出其密码子使用偏好以及大肠杆菌使用偏好不同的位点,对于使用偏好不同的密码子位点,用大肠杆菌偏好的密码子替代,设计出密码子优化的GFAP蛋白基因序列SEQ ID NO.2.上述密码子优化的基因序列所编码的蛋白氨基酸序列与原有的氨基酸序列一致,上述密码子优化的基因序列由上海生工生物工程有限公司合成,装入载体pGEX-4T-2,构建成重组质粒pGEX-4T-2-GFAP-opt并表达。
在另一个实施例中,本发明提供了一种提高GFAP蛋白可溶性表达的方法,其特征在于,提供OmpA信号肽序列:SEQ ID NO.3
(MKKTAIAIAVALAGFVTVAQA),用引物OmpA-F
(GATCCATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCAGGTTTCGTCACCGTCGCTCAGGCTGG)和OmpA-R(AATTCCAGCCTGAGCGACGGTGACGAAACCTGCCAGTGCCACTGCAATCGCGATAGCTGTCTTTTTCTG)经过退火合成DNA片段,并将所述pGEX-4T-2-GFAP-opt用限制性内切酶BamHI和EcoR1进行双酶切,获得线性化的pGEX-4T-2-GFAP-opt线性片段作为插入载体,酶切反应体系为:10×酶切Buffer 2μl,pGEX-4T-2-GFAP-opt质粒1μg,EcoRI 1μl,BamHⅠ1μl,补水至20μl,37℃,1h,构建成重组质粒pGEX-4T-2-OmpA-GFAP-opt并表达。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为pGEX-4T-2-OmpA-GFAP-opt质粒构建流程图。
图2为pGEX-4T-2-OmpA-GFAP-opt质粒双酶切验证结果。
图3为GFAP蛋白表达鉴定的聚丙烯酰胺凝胶电泳图。pGEX-4T-2-GFAP为
GFAP原始序列;pGEX-4T-2-GFAP-opt为GFAP优化后的序列;
pGEX-4T-2-OmpA-GFAP-opt在优化了GFAP序列之后加入OmpA信号肽。
具体实施方式
本文中,“基因”又可称为遗传因子,是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。带有遗传信息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传信息的表现。组成简单生命最少要265到350个基因。
下面通过具体实施方式来进一步说明本发明的技术方案。本领域技术人员应知晓实施例仅仅是帮助理解本发明,不应视为对本发明的具体限制。
本发明基于大肠杆菌来源优化密码子的胶质纤维酸性蛋白基因在大肠杆菌中表达的平台,通过改造信号肽实现胶质纤维酸性蛋白在大肠杆菌中高效表达,以期能够提高胶质纤维酸性蛋白在大肠杆菌中的分泌能力。
因此,本发明首先提供了一种大肠杆菌密码子优化的胶质纤维酸性蛋白碱基序列,序列为SEQ ID NO.2,有效的使胶质纤维酸性蛋白在大肠杆菌中大量表达。进一步的对pGEX-4T-2载体进行改造,增加了OmpA信号肽,信号肽序列为SEQ ID NO.3。本发明通过融合OmpA信号肽,使胶质纤维酸性蛋白在大肠杆菌中的分泌增加,改善胶质纤维酸性蛋白包涵体形式的表达。
GFAP-opt基因
在一个方面,为了提高GFAP蛋白的表达量,用软件分析编码GFAP蛋白的原始基因序列SEQ ID NO.1,找出潜在的有效突变位点。所述位点影响GFAP蛋白的表达量。
在一个或多个实施例中,所述软件是OptimumGeneTM。
在一个或多个实施例中,所述位点数量可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或者更多个。
在一个或多个实施例中,所述位点是其原始密码子使用偏好与大肠杆菌使用偏好不同的位点。
在另一个方面,对潜在位点进行突变,设计出优化的GFAP蛋白基因序列SEQ IDNO.2。将上述优化的基因序列合成,装入载体,构建成重组质粒。经测序证实合成的序列正确。
在一个或多个实施例中,所述突变优化后的GFAP基因命名为GFAP-opt基因,其序列如SEQ.ID.No.2所示,其可以有效的使胶质纤维酸性蛋白在大肠杆菌中大量表达。
pGEX-4T-2-GFAP-opt重组质粒
在另一个方面,设计出优化的GFAP蛋白基因序列。将上述优化的基因序列合成,装入载体,构建成重组质粒。
在一个或多个实施例中,所述载体为原核载体、真核载体或病毒载体。
原核表达的优点在于能够短时间内获得基因表达产物,而且所需的成本相对比较低廉。方法也比较简单,可以表达的蛋白也比较多,但缺点是表达出来的蛋白没有经过修饰,不一定具有天然的活性,且表达系统无法对表达时间及表达水平进行调控,有些基因持续表达会对宿主细胞产生毒害作用,过量表达可能导致非生理反应,目前蛋白常以包涵体形式表达,也会导致产物纯化困难。可用于抗体制备或检测,但应避免做功能试验。
真核表达常用酵母、昆虫、动物和哺乳类细胞等表达系统。其优点是根据原核生物蛋白与靶DNA作用的高度特异性设计,不存在基因的非特异性激活或抑制。能诱导基因高效表达,可达105倍。能严格调控基因表达。
目前的表达系统有优点也有不足,但一般理想的表达系统符合以下几点:首先是特异性,该系统不受其他内源因素的影响,仅能被外源的非毒性药物所活化。二是非干扰性,对细胞通路无干扰。及可诱导性,诱导剂的生物利用率,可塑性和剂量依赖性。
因此选择表达系统时,必须充分考虑各种因素,如蛋白性质、实验条件、生产成本、表达水平及安全性等。权衡利弊后再选择相应的表达系统。
在一个或多个实施例中,本发明的所述载体为载体为pGEX-4T-2。
在一个或多个实施例中,所述优化后的重组质粒命名为
pGEX-4T-2-GFAP-opt。其可以有效的提高胶质纤维酸性蛋白在大肠杆菌中的表达量。
pGEX-4T-2-OmpA-GFAP-opt重组质粒
在一个方面,为了使胶质纤维酸性蛋白在大肠杆菌中的分泌增加,改善胶质纤维酸性蛋白包涵体形式的表达,在重组质粒上,融合信号肽。
信号肽是引导新合成的蛋白质向分泌通路转移的短(长度5-30个氨基酸)肽链。常指新合成多肽链中用于指导蛋白质的跨膜转移(定位)的N-末端的氨基酸序列(有时不一定在N端)。
在起始密码子后,有一段编码疏水性氨基酸序列的RNA区域,该氨基酸序列就被称为信号肽序列,它负责把蛋白质引导到细胞含不同膜结构的亚细胞器内。
外源蛋白在宿主菌,如大肠杆菌中的表达形式多为细胞内不溶性表达(包涵体),少数为细胞外分泌表达。利用信号肽来引导外源蛋白定位分泌到细胞特定区间,提高可溶性,可避免因包涵体复性带来的困难。
在一个或多个实施例中,本发明采用的信号肽来自表达系统自身的信号序列或外源信号序列,或两者兼而有之。
在一个或多个实施例中,本发明外源基因的表达系统为原核表达系统,优选的,为如大肠杆菌、L型细菌、芽孢杆菌和乳酸杆菌,进一步优选的,为大肠杆菌表达系统。
在一个或多个实施例中,本发明外援基因的表达系统为真核表达系统,优选的,为毕赤酵母和昆虫杆状病毒表达系统。
在一个或多个实施例中,所述信号肽为OmpA信号肽,优选地,所述OmpA信号肽的核苷酸序列如SEQ IN NO.3所示。
在一个或多个实施例中,融合了信号肽的重组质粒命名为pGEX-4T-2-OmpA-GFAP-opt重组质粒。
本发明的外源基因连接上信号肽后,在原核表达系统,如大肠杆菌中得到了分泌表达;本研究通过融合OmpA信号肽,使胶质纤维酸性蛋白在大肠杆菌中的分泌增加,改善胶质纤维酸性蛋白包涵体形式的表达。
在一个方面,本发明构建了带有OmpA信号肽的pGEX-4T-2的表达载体
在另一个方面,本发明提供了一种针对大肠杆菌进行密码子优化的GFAP碱基序列,具有很强的表达活性,能实现外源基因在大肠杆菌中的高表达。
在一个或多个实施例中,本发明通过融合信号肽,可以使GFAP的分泌量增加,改善GFAP抗原制备过程中包涵体的问题,为后续的纯化带来很大的便利。
实施例
实施例1.密码子优化的胶质纤维酸性蛋白基因序列的设计与合成
用软件OptimumGeneTM分析编码GFAP蛋白的基因序列SEQ ID NO.1,找出其密码子使用偏好以及大肠杆菌使用偏好不同的位点。对于使用偏好不同的密码子位点,用大肠杆菌偏好的密码子替代,设计出密码子优化的GFAP蛋白基因序列SEQ ID NO.2.上述密码子优化的基因序列所编码的蛋白氨基酸序列与原有的氨基酸序列一致。上述密码子优化的基因序列由上海生工生物工程有限公司合成,装入载体pGEX-4T-2,构建成重组质粒pGEX-4T-2-GFAP-opt。经测序证实合成的序列正确。
为了明确显示进行密码子优化的位点,现将密码子优化后的核酸序列GFAP-opt与密码子优化前的核酸序列GFAP进行对比。比较结果如下(*为终止密码子)
优化前ATG GAG AGG AGA CGC ATC ACC TCC GCT GCT CGC CGC TCC TAC GTC
优化后ATG GAA CGT CGT CGT ATC ACC TCC GCT GCG CGT CGT AGC TAC GTT
氨基酸M E R R R I T S A A R R S Y V
优化前TCC TCA GGG GAG ATG ATG GTG GGG GGC CTG GCT CCT GGC CGC CGT
优化后TCC AGC GGT GAA ATG ATG GTT GGT GGC CTG GCG CCG GGT CGT CGT
氨基酸S S G E M M V G G L A P G R R
优化前CTG GGT CCT GGC ACC CGC CTC TCC CTG GCT CGA ATG CCC CCT CCA
优化后CTG GGT CCG GGC ACC CGT CTG AGC CTG GCG CGTATG CCG CCGCCG
氨基酸L G P G T R L S L A R M P P P
优化前CTC CCG ACC CGG GTG GAT TTC TCC CTG GCT GGG GCA CTC AAT GCT
优化后CTG CCG ACC CGC GTT GAT TTC TCT CTG GCC GGC GCG CTGAAC GCT
氨基酸L P T R V D F S L A G A L N A
优化前GGC TTC AAG GAG ACC CGG GCC AGT GAG CGG GCA GAG ATG ATG GAG
优化后GGC TTC AAA GAA ACC CGT GCT TCT GAA CGT GCG GAA ATG ATG GAA
氨基酸G F K E T R A S E R A E M M E
优化前CTC AAT GAC CGC TTT GCC AGC TAC ATC GAG AAG GTT CGC TTC CTG
优化后CTGAAC GAT CGT TTC GCA AGC TATATC GAA AAA GTT CGT TTC CTG
氨基酸L N D R F A S Y I E K V R F L
优化前GAA CAG CAA AAC AAG GCG CTG GCT GCT GAG CTG AAC CAG CTGCGG
优化后GAA CAG CAG AAC AAA GCC CTG GCG GCC GAA CTG AAC CAG CTG CGT
氨基酸E Q Q N K A L A A E L N Q L R
优化前GCC AAG GAG CCC ACC AAG CTG GCA GAC GTC TAC CAG GCT GAG CTG
优化后GCA AAA GAA CCG ACC AAA CTG GCA GAC GTT TAC CAG GCG GAA CTG
氨基酸A K E P T K L A D V Y Q A E L
优化前GA GAG CTG CGG CTG CGG CTC GAT CAA CTC ACC GCC AAC AGC GCC
优化后CGC GAA CTG CGT CTG CGT CTG GAC CAG CTG ACC GCA AAC AGT GCG
氨基酸R E L R L R L D Q L T A N S A
优化前CGG CTG GAG GTT GAG AGG GAC AAT CTG GCA CAG GAC CTG GCC ACT
优化后CGC CTG GAA GTT GAA CGT GAT AAC CTG GCG CAA GAT CTG GCG ACT
氨基酸R L E V E R D N L A Q D L A T
优化前GTG AGG CAG AAG CTC CAG GAT GAA ACC AAC CTG AGG CTG GAA GCC
优化后GTT CGT CAG AAA CTG CAG GAC GAA ACT AAC CTG CGT CTG GAA GCG
氨基酸V R Q K L Q D E T N L R L E A
优化前GAG AAC AAC CTG GCT GCC TAT AGA CAG GAA GCA GAT GAA GCC ACC
优化后GAA AAC AAC CTG GCG GCG TAC CGC CAG GAA GCT GAC GAA GCCACT
氨基酸E N N L A A Y R Q E A D E A T
优化前CTG GCC CGT CTG GAT CTG GAG AGG AAG ATT GAG TCG CTG GAGGAG
优化后CTG GCG CGC CTG GAT CTG GAA CGT AAA ATC GAA AGC CTG GAA GAA
氨基酸L A R L D L E R K I E S L E E
优化前GAG ATC CGG TTC TTG AGG AAG ATC CAC GAG GAG GAG GTT CGG GAA
优化后GAA ATC CGT TTC CTG CGT AAA ATC CAC GAA GAA GAA GTG CGT GAA
氨基酸E I R F L R K I H E E E V R E
优化前CTC CAG GAG CAG CTG GCC CGA CAG CAG GTC CAT GTG GAG CTT GAC
优化后CTG CAG GAA CAG CTG GCC CGT CAG CAG GTT CAC GTT GAA CTG GAT
氨基酸L Q E Q L A R Q Q V H V E L D
优化前GTG GCC AAG CCA GAC CTC ACC GCA GCC CTG AAA GAG ATC CGC ACG
优化后GTA GCT AAA CCG GAT CTG ACC GCG GCT CTG AAA GAAATC CGT ACC
氨基酸V A K P D L T A A L K E I R T
优化前CAG TAT GAG GCA ATG GCG TCC AGC AAC ATG CAT GAA GCC GAA GAG
优化后CAG TAT GAA GCG ATG GCATCC AGC AAC ATG CAC GAA GCG GAA GAA
氨基酸Q Y E A M A S S N M H E A E E
优化前TGG TAC CGC TCC AAG TTT GCA GAC CTG ACA GAC GCT GCT GCC CGC
优化后TGG TAT CGC TCT AAA TTC GCG GAC CTG ACT GAT GCG GCT GCG CGT
氨基酸W Y R S K F A D L T D A A A R
优化前AAC GCG GAG CTG CTC CGC CAG GCC AAG CAC GAA GCC AAC GAC TAC
优化后AAC GCG GAA CTG CTG CGC CAG GCG AAA CAC GAA GCG AAC GAT TAC
氨基酸N A E L L R Q A K H E A N D Y
优化前CGG CGC CAG TTG CAG TCC TTG ACC TGC GAC CTG GAG TCT CTG CGC
优化后CGT CGT CAG CTG CAG TCT CTG ACC TGC GAT CTG GAA TCT CTG CGT
氨基酸R R Q L Q S L T C D L E S L R
优化前GGC ACG AAC GAG TCC CTG GAG AGG CAG ATG CGC GAG CAG GAG GAG
优化后GGT ACC AAC GAA TCC CTG GAA CGT CAG ATG CGT GAA CAA GAA
GAA
氨基酸G T N E S L E R Q M R E Q E E
优化前CGG CAC GTG CGG GAG GCG GCC AGT TAT CAG GAG GCG CTG GCG CGG
优化后CGT CAC GTT CGT GAA GCA GCG TCC TAC CAG GAA GCG CTG GCG CGT
氨基酸R H V R E A A S Y Q E A L A R
优化前CTG GAG GAA GAG GGG CAG AGC CTC AAG GAC GAG ATG GCC CGC CAC
优化后CTG GAA GAA GAA GGT CAG AGC CTG AAA GAT GAA ATG GCG CGT CAC
氨基酸L E E E G Q S L K D E M A R H
优化前TTG CAG GAG TAC CAG GAC CTG CTC AAT GTC AAG CTG GCC CTG GAC
优化后CTG CAG GAA TAC CAG GAT CTG CTG AAC GTT AAA CTG GCG CTG GAT
氨基酸L Q E Y Q D L L N V K L A L D
优化前ATC GAG ATC GCC ACC TAC AGG AAG CTG CTA GAG GGC GAG GAG AAC
优化后ATT GAA ATC GCG ACC TAC CGT AAA CTG CTG GAA GGT GAA GAA AAC
氨基酸I E I A T Y R K L L E G E E N
优化前CGG ATC ACC ATT CCC GTG CAG ACC TTC TCC AAC CTG CAG ATT CGA
优化后CGTATC ACC ATC CCG GTT CAG ACC TTC AGC AAC CTG CAG ATC CGC
氨基酸R I T I P V Q T F S N L Q I R
优化前GAA ACC AGC CTG GAC ACC AAG TCT GTG TCA GAA GGC CAC CTC AAG
优化后GAA ACC TCC CTG GAT ACC AAA AGC GTT TCT GAA GGC CAC CTG AAA
氨基酸E T S L D T K S V S E G H L K
优化前AGG AAC ATC GTG GTG AAG ACC GTG GAG ATG CGG GAT GGA GAGGTC
优化后CGT AAC ATC GTA GTT AAA ACC GTT GAA ATG CGT GAC GGT GAA GTT
氨基酸R N I V V K T V E M R D G E V
优化前ATT AAG GAG TCC AAG CAG GAG CAC AAG GAT GTG ATG TGA
优化后ATC AAA GAA TCT AAA CAG GAA CAC AAA GAT GTG ATG TAA
氨基酸I K E S K Q E H K D V M*
上述密码子优化的GFAP蛋白基因序列与野生型序列比较密码子偏好性发生了改变。与野生型基因序列相比,密码子优化的基因中大肠杆菌偏好的密码子出现频率增加,但是它们所编码的氨基酸序列不变,从而使GFAP蛋白更适于在大肠杆菌中的蛋白表达。
实施例2pGEX-4T-2-OmpA-GFAP-opt质粒构建
2.1OmpA信号肽片段和载体的获得
本发明提供的OmpA信号肽序列:MKKTAIAIAVALAGFVTVAQA,用引物
OmpA-FGATCCATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCAGGTTTCGTCACCGTCGCTCAGGCTGG)和OmpA-R(AATTCCAGCCTGAGCGACGGTGACGAAACCTGCCAGTGCCACTGCAATCGCGATAGCTGTCTTTTTCTG)经过退火合成DNA片段,并将pGEX-4T-2-GFAP-opt用限制性内切酶BamHI和EcoR1进行双酶切,获得线性化的pGEX-4T-2-GFAP-opt线性片段作为插入载体。酶切反应体系为:10×酶切Buffer 2μl,pGEX-4T-2-GFAP-opt质粒1μg,EcoRI 1μl,BamHⅠ1μl,补水至20μl,37℃,1h。
2.1酶切产物纯化
TAE缓冲液制作1%琼脂糖凝胶,酶切产物进行电泳,120V,1h;称重空1.5mlEp管,紫外灯下切下含目的DNA的凝胶置入Ep管;切碎胶块,分析天平称胶块的质量,按100mg=100μl进行计算胶块的体积;加入至少1倍等体积的Binding Buffer;把混合物置于60℃水浴中温浴7min至凝胶完全融化,其间每隔2-3分钟混匀一次;转移700μl冷却的DNA-琼脂糖溶液到一个Spin Columns CB2 DNA柱子,室温下,12,000×g离心1min,弃去液体;将柱子重新套回收集管中,加入600μl漂洗液PW至Spin Columns CB2 DNA柱子中,室温下,12,000×g离心1分钟,弃滤出液;重复洗涤一次,将空柱子重新套回收集管中,12,000×g离心1min以甩干柱基质残余的液体;把柱子装在一个干净的1.5ml离心管上,加入30~50μl洗脱液或灭菌水上柱子膜上,12,000×g离心1分钟,离心管中的溶液就是纯化的DNA产物,测定DNA浓度并保存于-20℃。
2.2连接反应
用T4 DNA连接酶将OmpA DNA片段与pGEX-4T-2-GFAP-opt酶切片段连接,得到pGEX-4T-2-OmpA-GFAP-opt重组表达质粒。连接反应体系为:10×T4 DNA Ligase Buffer 1μl,线性化的pGEX-4T-2-GFAP-opt 1μl,退火相关目的片段7μl,T4 DNA Ligase 1μl,混匀,4℃放置16h。连接物转化DH5α感受态细胞,提取质粒。
用限制性内切酶BamHI和XhoI酶切pGEX-4T-2-OmpA-GFAP-opt质粒,验证用酶切体系为:质粒1μL,BamHI 0.3μL,EcoR10.3μL,10×Hbuffer 1μL,加入双蒸水至10μL;回收用酶切体系为:质粒DNA 16μL,BamHI 1μL,EcoR1 1μL,10×Hbuffer 2μL。进行1%琼脂糖凝胶电泳检测酶切产物。酶切验证,酶切验证结果如图2所示,酶切成功的序列由上海生工生物工程有限公司进行测序,测序结果正确,从而得到pGEX-4T-2-OmpA-GFAP-opt重组质粒。过程如图1所示。
实施例3蛋白表达
测序正确的重组质粒转化至宿主菌Rosetta感受态细胞中转化制备pGEX-4T-2-GFAP/pGEX-4T-2-GFAP-opt/pGEX-4T-2-OmpA-GFAP-opt表达菌并保种。(具体步骤如下:1.将1μL溶解的0.2μg/μL的重组质粒加入制备好30μL的Rosetta细菌感受态细胞中,冰上放置30min;2.将此混合液于42℃水浴中热击45s;3.再放在冰上2min;4.往此混合液中加入700μL不含抗生素的LB培养基;5.将混合液置于37℃、200rpm恒温培养振荡器中培养1h;6.取培养好的混合液200μL涂布于50μg/mL卡那霉素抗性LB固体平板培养基上,37℃恒温培养箱正置培养30min后,倒置平板培养12-16h。)挑取阳性单克隆菌落,接种于5mL含50mg/L氨苄抗性的试管LB培养基中,37℃培养过夜后将此培养液接种于200ml含有50mg/L氨苄抗性的三角瓶LB培养基中扩培,37℃,200rpm/min培养至菌液OD值达到0.6-0.8,加入终浓度为0.5mM的IPTG,37℃继续培6h,离心收集菌体并进行超声破碎。图3为GFAP蛋白表达鉴定的聚丙烯酰胺凝胶电泳图.如图我们可以看到,GFAP基因序列经过密码子优化后为GPAP-opt,构建的pGEX-4T-2-GPAP-opt蛋白可以成功被诱导出来,菌体破碎后主要在包涵体中,于是在GFAP-opt序列前加入OmpA信号肽后构建的pGEX-4T-2-OmpA-GPAP-opt表达载体,GFAP可以成功被诱导表达,并且在菌体破碎后的上清中,这有利于后续的纯化。
核苷酸序列
SEQ ID NO.1(GFAP基因核苷酸序列)
ATGGAGAGGAGACGCATCACCTCCGCTGCTCGCCGCTCCTACGTCTCCTCAGGGGAGATGATGGTGGGGGGCCTGGCTCCTGGCCGCCGTCTGGGTCCTGGCACCCGCCTCTCCCTGGCTCGAATGCCCCCTCCACTCCCGACCCGGGTGGATTTCTCCCTGGCTGGGGCACTCAATGCTGGCTTCAAGGAGACCCGGGCCAGTGAGCGGGCAGAGATGATGGAGCTCAATGACCGCTTTGCCAGCTACATCGAGAAGGTTCGCTTCCTGGAACAGCAAAACAAGGCGCTGGCTGCTGAGCTGAACCAGCTGCGGGCCAAGGAGCCCACCAAGCTGGCAGACGTCTACCAGGCTGAGCTGCGAGAGCTGCGGCTGCGGCTCGATCAACTCACCGCCAACAGCGCCCGGCTGGAGGTTGAGAGGGACAATCTGGCACAGGACCTGGCCACTGTGAGGCAGAAGCTCCAGGATGAAACCAACCTGAGGCTGGAAGCCGAGAACAACCTGGCTGCCTATAGACAGGAAGCAGATGAAGCCACCCTGGCCCGTCTGGATCTGGAGAGGAAGATTGAGTCGCTGGAGGAGGAGATCCGGTTCTTGAGGAAGATCCACGAGGAGGAGGTTCGGGAACTCCAGGAGCAGCTGGCCCGACAGCAGGTCCATGTGGAGCTTGACGTGGCCAAGCCAGACCTCACCGCAGCCCTGAAAGAGATCCGCACGCAGTATGAGGCAATGGCGTCCAGCAACATGCATGAAGCCGAAGAGTGGTACCGCTCCAAGTTTGCAGACCTGACAGACGCTGCTGCCCGCAACGCGGAGCTGCTCCGCCAGGCCAAGCACGAAGCCAACGACTACCGGCGCCAGTTGCAGTCCTTGACCTGCGACCTGGAGTCTCTGCGCGGCACGAACGAGTCCCTGGAGAGGCAGATGCGCGAGCAGGAGGAGCGGCACGTGCGGGAGGCGGCCAGTTATCAGGAGGCGCTGGCGCGGCTGGAGGAAGAGGGGCAGAGCCTCAAGGACGAGATGGCCCGCCACTTGCAGGAGTACCAGGACCTGCTCAATGTCAAGCTGGCCCTGGACATCGAGATCGCCACCTACAGGAAGCTGCTAGAGGGCGAGGAGAACCGGATCACCATTCCCGTGCAGACCTTCTCCAACCTGCAGATTCGAGAAACCAGCCTGGACACCAAGTCTGTGTCAGAAGGCCACCTCAAGAGGAACATCGTGGTGAAGACCGTGGAGATGCGGGATGGAGAGGTCATTAAGGAGTCCAAGCAGGAGCACAAGGATGTGATGTGA
SEQ ID NO.2(GFAP-opt基因核苷酸序列)
ATGGAACGTCGTCGTATCACCTCCGCTGCGCGTCGTAGCTACGTTTCCAGCGGTGAAATGATGGTTGGTGGCCTGGCGCCGGGTCGTCGTCTGGGTCCGGGCACCCGTCTGAGCCTGGCGCGTATGCCGCCGCCGCTGCCGACCCGCGTTGATTTCTCTCTGGCCGGCGCGCTGAACGCTGGCTTCAAAGAAACCCGTGCTTCTGAACGTGCGGAAATGATGGAACTGAACGATCGTTTCGCAAGCTATATCGAAAAAGTTCGTTTCCTGGAACAGCAGAACAAAGCCCTGGCGGCCGAACTGAACCAGCTGCGTGCAAAAGAACCGACCAAACTGGCAGACGTTTACCAGGCGGAACTGCGCGAACTGCGTCTGCGTCTGGACCAGCTGACCGCAAACAGTGCGCGCCTGGAAGTTGAACGTGATAACCTGGCGCAAGATCTGGCGACTGTTCGTCAGAAACTGCAGGACGAAACTAACCTGCGTCTGGAAGCGGAAAACAACCTGGCGGCGTACCGCCAGGAAGCTGACGAAGCCACTCTGGCGCGCCTGGATCTGGAACGTAAAATCGAAAGCCTGGAAGAAGAAATCCGTTTCCTGCGTAAAATCCACGAAGAAGAAGTGCGTGAACTGCAGGAACAGCTGGCCCGTCAGCAGGTTCACGTTGAACTGGATGTAGCTAAACCGGATCTGACCGCGGCTCTGAAAGAAATCCGTACCCAGTATGAAGCGATGGCATCCAGCAACATGCACGAAGCGGAAGAATGGTATCGCTCTAAATTCGCGGACCTGACTGATGCGGCTGCGCGTAACGCGGAACTGCTGCGCCAGGCGAAACACGAAGCGAACGATTACCGTCGTCAGCTGCAGTCTCTGACCTGCGATCTGGAATCTCTGCGTGGTACCAACGAATCCCTGGAACGTCAGATGCGTGAACAAGAAGAACGTCACGTTCGTGAAGCAGCGTCCTACCAGGAAGCGCTGGCGCGTCTGGAAGAAGAAGGTCAGAGCCTGAAAGATGAAATGGCGCGTCACCTGCAGGAATACCAGGATCTGCTGAACGTTAAACTGGCGCTGGATATTGAAATCGCGACCTACCGTAAACTGCTGGAAGGTGAAGAAAACCGTATCACCATCCCGGTTCAGACCTTCAGCAACCTGCAGATCCGCGAAACCTCCCTGGATACCAAAAGCGTTTCTGAAGGCCACCTGAAACGTAACATCGTAGTTAAAACCGTTGAAATGCGTGACGGTGAAGTTATCAAAGAATCTAAACAGGAACACAAAGATGTGATGTAA
SEQ ID NO.3(信号肽OmpA核苷酸序列)
ATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCAGGTTTCGTCACCGTCGCTCAGGCT
以上所揭露的仅为本发明的几个较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
序列表
<110> 苏州顺友芯智能科技有限公司
<120> 一种提高GFAP蛋白表达量的基因及其可溶性表达方法
<160> 3
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1299
<212> DNA
<213> 人工序列(2 Ambystoma laterale x Ambystoma jeffersonianum)
<400> 1
atggagagga gacgcatcac ctccgctgct cgccgctcct acgtctcctc aggggagatg 60
atggtggggg gcctggctcc tggccgccgt ctgggtcctg gcacccgcct ctccctggct 120
cgaatgcccc ctccactccc gacccgggtg gatttctccc tggctggggc actcaatgct 180
ggcttcaagg agacccgggc cagtgagcgg gcagagatga tggagctcaa tgaccgcttt 240
gccagctaca tcgagaaggt tcgcttcctg gaacagcaaa acaaggcgct ggctgctgag 300
ctgaaccagc tgcgggccaa ggagcccacc aagctggcag acgtctacca ggctgagctg 360
cgagagctgc ggctgcggct cgatcaactc accgccaaca gcgcccggct ggaggttgag 420
agggacaatc tggcacagga cctggccact gtgaggcaga agctccagga tgaaaccaac 480
ctgaggctgg aagccgagaa caacctggct gcctatagac aggaagcaga tgaagccacc 540
ctggcccgtc tggatctgga gaggaagatt gagtcgctgg aggaggagat ccggttcttg 600
aggaagatcc acgaggagga ggttcgggaa ctccaggagc agctggcccg acagcaggtc 660
catgtggagc ttgacgtggc caagccagac ctcaccgcag ccctgaaaga gatccgcacg 720
cagtatgagg caatggcgtc cagcaacatg catgaagccg aagagtggta ccgctccaag 780
tttgcagacc tgacagacgc tgctgcccgc aacgcggagc tgctccgcca ggccaagcac 840
gaagccaacg actaccggcg ccagttgcag tccttgacct gcgacctgga gtctctgcgc 900
ggcacgaacg agtccctgga gaggcagatg cgcgagcagg aggagcggca cgtgcgggag 960
gcggccagtt atcaggaggc gctggcgcgg ctggaggaag aggggcagag cctcaaggac 1020
gagatggccc gccacttgca ggagtaccag gacctgctca atgtcaagct ggccctggac 1080
atcgagatcg ccacctacag gaagctgcta gagggcgagg agaaccggat caccattccc 1140
gtgcagacct tctccaacct gcagattcga gaaaccagcc tggacaccaa gtctgtgtca 1200
gaaggccacc tcaagaggaa catcgtggtg aagaccgtgg agatgcggga tggagaggtc 1260
attaaggagt ccaagcagga gcacaaggat gtgatgtga 1299
<210> 2
<211> 1299
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atggaacgtc gtcgtatcac ctccgctgcg cgtcgtagct acgtttccag cggtgaaatg 60
atggttggtg gcctggcgcc gggtcgtcgt ctgggtccgg gcacccgtct gagcctggcg 120
cgtatgccgc cgccgctgcc gacccgcgtt gatttctctc tggccggcgc gctgaacgct 180
ggcttcaaag aaacccgtgc ttctgaacgt gcggaaatga tggaactgaa cgatcgtttc 240
gcaagctata tcgaaaaagt tcgtttcctg gaacagcaga acaaagccct ggcggccgaa 300
ctgaaccagc tgcgtgcaaa agaaccgacc aaactggcag acgtttacca ggcggaactg 360
cgcgaactgc gtctgcgtct ggaccagctg accgcaaaca gtgcgcgcct ggaagttgaa 420
cgtgataacc tggcgcaaga tctggcgact gttcgtcaga aactgcagga cgaaactaac 480
ctgcgtctgg aagcggaaaa caacctggcg gcgtaccgcc aggaagctga cgaagccact 540
ctggcgcgcc tggatctgga acgtaaaatc gaaagcctgg aagaagaaat ccgtttcctg 600
cgtaaaatcc acgaagaaga agtgcgtgaa ctgcaggaac agctggcccg tcagcaggtt 660
cacgttgaac tggatgtagc taaaccggat ctgaccgcgg ctctgaaaga aatccgtacc 720
cagtatgaag cgatggcatc cagcaacatg cacgaagcgg aagaatggta tcgctctaaa 780
ttcgcggacc tgactgatgc ggctgcgcgt aacgcggaac tgctgcgcca ggcgaaacac 840
gaagcgaacg attaccgtcg tcagctgcag tctctgacct gcgatctgga atctctgcgt 900
ggtaccaacg aatccctgga acgtcagatg cgtgaacaag aagaacgtca cgttcgtgaa 960
gcagcgtcct accaggaagc gctggcgcgt ctggaagaag aaggtcagag cctgaaagat 1020
gaaatggcgc gtcacctgca ggaataccag gatctgctga acgttaaact ggcgctggat 1080
attgaaatcg cgacctaccg taaactgctg gaaggtgaag aaaaccgtat caccatcccg 1140
gttcagacct tcagcaacct gcagatccgc gaaacctccc tggataccaa aagcgtttct 1200
gaaggccacc tgaaacgtaa catcgtagtt aaaaccgttg aaatgcgtga cggtgaagtt 1260
atcaaagaat ctaaacagga acacaaagat gtgatgtaa 1299
<210> 3
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atgaaaaaga cagctatcgc gattgcagtg gcactggcag gtttcgtcac cgtcgctcag 60
gct 63
Claims (10)
1.一种GFAP-opt基因,其核苷酸序列如SEQ.ID.No.2所示。
2.权利要求1所述基因在提高GFAP蛋白表达量中的作用。
3.一种pGEX-4T-2表达载体,其表达权利要求1所述的基因。
4.权利要求3中的载体,其进一步包括OmpA信号肽。
5.权利要求4中的载体,所述OmpA信号肽的核苷酸序列如SEQ.ID.No.3所示。
6.权利要求4或5中的载体在提高GFAP蛋白可溶性表达中的作用。
7.一种提高GFAP蛋白表达量的方法,其特征在于:使用权利要求3中的载体表达GFAP蛋白。
8.一种提高GFAP蛋白可溶性表达的方法,其特征在于:使用权利要求5中的载体表达GFAP蛋白。
9.一种提高GFAP蛋白表达量的方法,其特征在于:用软件OptimumGeneTM分析编码GFAP蛋白的基因序列SEQ ID NO.1,找出其密码子使用偏好以及大肠杆菌使用偏好不同的位点,对于使用偏好不同的密码子位点,用大肠杆菌偏好的密码子替代,设计出密码子优化的GFAP蛋白基因序列SEQ ID NO.2,上述密码子优化的基因序列所编码的蛋白氨基酸序列与原有的氨基酸序列一致,上述密码子优化的基因序列由上海生工生物工程有限公司合成,装入载体pGEX-4T-2,构建成重组质粒pGEX-4T-2-GFAP-opt并表达。
10.一种提高GFAP蛋白可溶性表达的方法,其特征在于,提供OmpA信号肽序列:SEQ IDNO.3(MKKTAIAIAVALAGFVTVAQA),用引物OmpA-F(GATCCATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCAGGTTTCGTCACCGTCGCTCAGGCTGG)和OmpA-R(AATTCCAGCCTGAGCGACGGTGACGAAACCTGCCAGTGCCACTGCAATCGCGATAGCTGTCTTTTTCTG)经过退火合成DNA片段,并将所述pGEX-4T-2-GFAP-opt用限制性内切酶BamHI和EcoR1进行双酶切,获得线性化的pGEX-4T-2-GFAP-opt线性片段作为插入载体,酶切反应体系为:10×酶切Buffer 2μl,pGEX-4T-2-GFAP-opt质粒1μg,EcoRI 1μl,BamHⅠ1μl,补水至20μl,37℃,1h,构建得到重组质粒pGEX-4T-2-OmpA-GFAP-opt并表达。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110607070.3A CN113416734A (zh) | 2021-06-01 | 2021-06-01 | 一种提高gfap蛋白表达量的基因及其可溶性表达方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110607070.3A CN113416734A (zh) | 2021-06-01 | 2021-06-01 | 一种提高gfap蛋白表达量的基因及其可溶性表达方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113416734A true CN113416734A (zh) | 2021-09-21 |
Family
ID=77713539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110607070.3A Withdrawn CN113416734A (zh) | 2021-06-01 | 2021-06-01 | 一种提高gfap蛋白表达量的基因及其可溶性表达方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113416734A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111569056A (zh) * | 2020-05-26 | 2020-08-25 | 山东信得科技股份有限公司 | 一种猪轮状病毒疫苗、制备该疫苗的抗原及其编码序列 |
CN112239760A (zh) * | 2020-09-18 | 2021-01-19 | 深圳科兴药业有限公司 | 高效表达重组hGH的重组工程菌及构建方法和应用 |
CN113005134A (zh) * | 2021-03-12 | 2021-06-22 | 厦门宝太生物科技有限公司 | 一种促进胶质纤维酸性蛋白在大肠杆菌中大量表达的方法 |
-
2021
- 2021-06-01 CN CN202110607070.3A patent/CN113416734A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111569056A (zh) * | 2020-05-26 | 2020-08-25 | 山东信得科技股份有限公司 | 一种猪轮状病毒疫苗、制备该疫苗的抗原及其编码序列 |
CN112239760A (zh) * | 2020-09-18 | 2021-01-19 | 深圳科兴药业有限公司 | 高效表达重组hGH的重组工程菌及构建方法和应用 |
CN113005134A (zh) * | 2021-03-12 | 2021-06-22 | 厦门宝太生物科技有限公司 | 一种促进胶质纤维酸性蛋白在大肠杆菌中大量表达的方法 |
Non-Patent Citations (2)
Title |
---|
吕立权;曹鹏;胡国汉;骆纯;侯立军;卢亦成;: "胶质纤维酸性蛋白的原核表达、纯化及鉴定", 中国临床神经外科杂志, no. 10, pages 606 - 609 * |
曹鹏;李志清;高旭;陈君;张海峰;梁国标;: "GFAP重组蛋白表达纯化及其主动免疫对脊髓损伤的神经保护作用", 创伤外科杂志, no. 03, pages 244 - 247 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2740417B2 (ja) | ヒト神経成長因子の遺伝子組換えによる調製法 | |
EP0020147B1 (en) | A dna transfer vector for human pre-growth hormone, a microorganism transformed thereby, and a method of cloning therefor | |
CN106459222A (zh) | Mic‑1融合蛋白及其用途 | |
JPH05507411A (ja) | 哺乳動物によるbmp―2ファミリーの発現 | |
CZ284204B6 (cs) | Zvyšování sekrece polypeptidů | |
CN110950967B (zh) | 抗人血清白蛋白纳米抗体与il-2融合蛋白及制备方法 | |
CN116813749B (zh) | 一种重组人源化iii型胶原蛋白及其制备方法和应用 | |
KR870000501B1 (ko) | 사람의 프로인슐린의 아미노산 배열을 함유하는 단백질의 제조방법 | |
RU2354702C2 (ru) | РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pHINS11, КОДИРУЮЩАЯ ГИБРИДНЫЙ БЕЛОК-ПРЕДШЕСТВЕННИК ИНСУЛИНА ЧЕЛОВЕКА, КЛЕТКА Escherichia coli, ТРАНСФОРМИРОВАННАЯ РЕКОМБИНАНТНОЙ ПЛАЗМИДНОЙ ДНК pHINS11, ШТАММ БАКТЕРИЙ Escherichia coli JM109/pHINS11 - ПРОДУЦЕНТ ГИБРИДНОГО БЕЛКА-ПРЕДШЕСТВЕННИКА ИНСУЛИНА ЧЕЛОВЕКА И СПОСОБ ПОЛУЧЕНИЯ ИНСУЛИНА ЧЕЛОВЕКА | |
CN112851791B (zh) | 一种新型抗代谢紊乱的fgf类似物及其应用 | |
CN113005134B (zh) | 一种促进胶质纤维酸性蛋白在大肠杆菌中大量表达的方法 | |
CN104119445A (zh) | 含有富含亮氨酸重复序列的融合蛋白及其制法和应用 | |
CN113416734A (zh) | 一种提高gfap蛋白表达量的基因及其可溶性表达方法 | |
CN110079539B (zh) | 前列腺酸性磷酸酶/粒-巨噬细胞集落刺激因子制备方法 | |
CN113980880B (zh) | 基因工程菌及其应用和以葡萄糖为原料生产阿洛酮糖的方法 | |
CN113528415B (zh) | 一种nampt酶生产菌及其应用 | |
EP0645454A2 (en) | Chimeric somatostatin containing protein and coding DNA, immunogenic compositions and method for increasing farm animal productivity | |
CN112646044B (zh) | TFF2-Fc融合蛋白及其高效表达生产方法 | |
CN101955969A (zh) | 一种通用型原核高效可溶性融合表达载体的构建及其应用 | |
CN108840945A (zh) | 猪白蛋白-干扰素α-白介素2融合蛋白、制备方法及其编码基因、一种猪长效干扰素 | |
CN104119448A (zh) | 含有富含亮氨酸重复序列的融合蛋白及其制法和应用 | |
CN104119447A (zh) | 含有富含亮氨酸重复序列的融合蛋白及其制法和应用 | |
CN116790616B (zh) | 编码sCXCL16的基因及表达载体、制备方法和应用 | |
EP2198027A1 (en) | Short polypeptide mediated conformational changes promoting enhancement of enzymatic activity | |
CN104119446A (zh) | 含有富含亮氨酸重复序列的融合蛋白及其制法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210921 |