CN1371997A - 耐高温二氢乳清酸脱氢酶基因序列及编码的多肽和制备方法 - Google Patents
耐高温二氢乳清酸脱氢酶基因序列及编码的多肽和制备方法 Download PDFInfo
- Publication number
- CN1371997A CN1371997A CN 01145570 CN01145570A CN1371997A CN 1371997 A CN1371997 A CN 1371997A CN 01145570 CN01145570 CN 01145570 CN 01145570 A CN01145570 A CN 01145570A CN 1371997 A CN1371997 A CN 1371997A
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- refractory
- dihydroorate
- sequence
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 34
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 34
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 34
- 108010052167 Dihydroorotate Dehydrogenase Proteins 0.000 title abstract description 8
- 230000008569 process Effects 0.000 title description 6
- 230000000694 effects Effects 0.000 claims abstract description 18
- 108020004414 DNA Proteins 0.000 claims abstract description 14
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 3
- 101710088194 Dehydrogenase Proteins 0.000 claims description 31
- 210000004027 cell Anatomy 0.000 claims description 21
- 239000002773 nucleotide Substances 0.000 claims description 20
- 125000003729 nucleotide group Chemical group 0.000 claims description 20
- 239000013604 expression vector Substances 0.000 claims description 11
- 239000012634 fragment Substances 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 4
- 230000037431 insertion Effects 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 230000008034 disappearance Effects 0.000 claims description 3
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 3
- 230000035772 mutation Effects 0.000 claims description 3
- 108091033319 polynucleotide Proteins 0.000 claims description 3
- 239000002157 polynucleotide Substances 0.000 claims description 3
- 102000040430 polynucleotide Human genes 0.000 claims description 3
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 2
- 102000053602 DNA Human genes 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 abstract description 34
- 108090000790 Enzymes Proteins 0.000 abstract description 21
- 102000004190 Enzymes Human genes 0.000 abstract description 21
- 238000004458 analytical method Methods 0.000 abstract description 9
- 238000012163 sequencing technique Methods 0.000 abstract description 9
- 238000002360 preparation method Methods 0.000 abstract description 8
- 244000005700 microbiome Species 0.000 abstract description 7
- 102100032823 Dihydroorotate dehydrogenase (quinone), mitochondrial Human genes 0.000 abstract description 6
- 241001465754 Metazoa Species 0.000 abstract description 3
- 108020004511 Recombinant DNA Proteins 0.000 abstract description 2
- 230000009261 transgenic effect Effects 0.000 abstract description 2
- 102000004169 proteins and genes Human genes 0.000 description 16
- 241000894006 Bacteria Species 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 238000001962 electrophoresis Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 108091064702 1 family Proteins 0.000 description 4
- AZQWKYJCGOJGHM-UHFFFAOYSA-N 1,4-benzoquinone Chemical compound O=C1C=CC(=O)C=C1 AZQWKYJCGOJGHM-UHFFFAOYSA-N 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- PXQPEWDEAKTCGB-UHFFFAOYSA-N orotic acid Chemical compound OC(=O)C1=CC(=O)NC(=O)N1 PXQPEWDEAKTCGB-UHFFFAOYSA-N 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- FVTCRASFADXXNN-SCRDCRAPSA-N flavin mononucleotide Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-SCRDCRAPSA-N 0.000 description 3
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical class OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000186589 Faecalicatena orotica Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 244000057717 Streptococcus lactis Species 0.000 description 2
- 235000014897 Streptococcus lactis Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000004440 column chromatography Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- UFIVEPVSAGBUSI-UHFFFAOYSA-N dihydroorotic acid Chemical compound OC(=O)C1CC(=O)NC(=O)N1 UFIVEPVSAGBUSI-UHFFFAOYSA-N 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 229960005010 orotic acid Drugs 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 229950001574 riboflavin phosphate Drugs 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- -1 50 μ l Substances 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- KTVPXOYAKDPRHY-SOOFDHNKSA-N D-ribofuranose 5-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O KTVPXOYAKDPRHY-SOOFDHNKSA-N 0.000 description 1
- 108020005199 Dehydrogenases Proteins 0.000 description 1
- 108010070596 Dihydroorotate Oxidase Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 238000003794 Gram staining Methods 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 241000186339 Thermoanaerobacter Species 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000009604 anaerobic growth Effects 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 238000001818 capillary gel electrophoresis Methods 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 238000006356 dehydrogenation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000012177 large-scale sequencing Methods 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- KYOBSHFOBAOFBF-XVFCMESISA-N orotidine 5'-phosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1C(O)=O KYOBSHFOBAOFBF-XVFCMESISA-N 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000002719 pyrimidine nucleotide Substances 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 150000004053 quinones Chemical class 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 229940047431 recombinate Drugs 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035806 respiratory chain Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 229960004249 sodium acetate Drugs 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- FRGKKTITADJNOE-UHFFFAOYSA-N sulfanyloxyethane Chemical compound CCOS FRGKKTITADJNOE-UHFFFAOYSA-N 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Landscapes
- Enzymes And Modification Thereof (AREA)
Abstract
本发明公开了一种耐高温二氢乳清酸脱氢酶基因序列及编码的多肽和制备方法。它涉及编码具有活性或其功能等同变异体的分离的DNA和利用重组DNA技术以所述分离的DNA生产具有耐高温二氢乳清酸脱氢酶活性的多肽或其功能等同变异体。以腾冲嗜热厌氧菌全基因组测序与分析为基础,克隆分离了耐高温二氢乳清酸脱氢酶基因。该基因对于制备用于生产耐高温二氢乳清酸脱氢酶的转基因微生物或动植物,并回收获得该基因编码的酶有用。另外,本发明还提供了具有耐高温二氢乳清酸脱氢酶活性的多肽的氨基酸序列及功能等同体。同时,本发明还提供了制备,分离,纯化具有耐高温二氢乳清酸脱氢酶活性的多肽的方法。
Description
技术领域
本发明涉及突变或遗传工程,尤其涉及一种耐高温二氢乳清酸脱氢酶基因序列及编码的多肽和制备方法。
背景技术
二氢乳清酸脱氢酶(Dihydroorotate dehydrogenase)催化在嘧啶的从头合成中由二氢乳清酸到乳清酸的反应,是嘧啶合成途径中的限速酶。合成的乳清酸再与5-磷酸核糖焦磷酸作用生成乳清苷酸,脱羧后就生成尿嘧啶核苷酸。其他的嘧啶核苷酸则是由尿嘧啶核苷酸转变而成。
这个酶最早是由Lieberman and Kornberg于1953年在厌氧细菌Zymobacterium oroticum(现在称为Clostridium oroticum)的提取物中发现的。二氢乳清酸脱氢酶可分为两类,1族和2族。两族之间的同源性低于20%。1族酶氨基酸的同源性高于30%,具有催化活性的残基是半胱氨酸,主要分布在细胞液中;2族氨基酸的同源性超过40%,具有催化活性的残基是丝氨酸,主要分布在细胞膜附近。革兰氏阳性菌的二氢乳清酸脱氢酶属于1族,真核和革兰氏阴性菌的酶属于2族。1族的二氢乳清酸脱氢酶又可以分为两个小类,1A和1B。这个分类标准最初是根据顺序分的,每个小类的顺序的同源性在60%以上,后来发现,两个小类在四级结构上也有很大的不同。关于这个酶的结构已经作了大量的研究。
大肠杆菌的二氢乳清酸脱氢酶属于2族,是包含两个相同亚基的二聚体。每个亚基包含一个紧紧与之缚在一起的黄素单核苷酸(FMN),较多用醌和醌染料作为电子受体,蛋白质顺序与所有的线粒体起源的酶有很高的顺序相似性(>40%),但与革兰氏阳性菌及所有细胞液起源的酶序列相似性较低(<20%)。当它缚在膜上时,这个酶作为电子受体利用氧气的效率更高些因为它与呼吸链相互作用。因此有人认为这个酶应该称为二氢乳清酸氧化酶,这个名称已经有了广泛的应用,而有的科学家更喜欢二氢乳清酸脱氢这个名称,因为这个酶当从细胞膜释放出来后利用氧气极少。
FINN S.NIELSEN等人研究了Lactococcus lactis的二氢乳清酸脱氢酶。Lactococcus lactis是已知的含有A和B两种形式二氢乳清酸脱氢酶的唯一的生物。在溶液中,这个A型酶呈亮黄色。它是一个34kDa的二聚体,每个亚基包含一个黄素单核苷酸。在pH7.5-9.0的条件下,最适合酶发挥功能。他们从含30%的聚乙烯乙二醇,0.2M的醋酸钠和0.1M的Tris-HCl的pH8.5的溶液中结晶了这个酶,得到的黄色晶体在衍射试验中几乎不受辐射损害。
人的二氢乳清酸脱氢酶属于2族,可以通过醌的类似物进行抑制。由于癌细胞的生长需要合成新的核苷,因此二氢乳清酸脱氢酶可能成为核酸合成途径中的抑制突破口。如果我们能找到好的抑制剂来阻断核苷的合成,癌细胞就不能生长。
腾冲嗜热厌氧菌(Thermoanaerobacter tangcongensis),是生活在我国云南省腾冲县的热泉中的一种微生物,是一种嗜热的真细菌(eubacteria),最适生长温度为75摄氏度,厌氧生长,革兰氏染色反应呈阳性。它由中国科学院微生物所首先发现并进行了分类学上的分析。菌种保存在中国微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。该嗜热厌氧菌是我国特有的一个物种,其体内所具有的耐高温二氢乳清酸脱氢酶也具有自己特有的结构。
发明内容
本发明的目的之一是提供一种分离的,编码具有耐高温二氢乳清酸脱氢酶活性的多肽的核苷酸序列。
本发明的目的之二是提供一种分离的具有耐高温二氢乳清酸脱氢酶活性多肽。
本发明的另一目的还提供了嗜热厌氧菌的二氢乳清酸脱氢酶重组载体、含有重组载体的宿主细胞,以及制备蛋白的方法。
本发明一方面提供一种能编码具有耐高温二氢乳清酸脱氢酶活性的多肽的核苷酸序列。所说的核苷酸序列编码具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修饰形式,该修饰形式功能上相当或与二氢乳清酸脱氢酶相关。核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突变形式,突变类型包括:缺失、无义、插入、错义。
本发明另一方面提供了一种耐高温二氢乳清酸脱氢酶活性的多肽。该多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段、或其活性衍生物。
本发明提供的制备耐高温二氢乳清酸脱氢酶的方法包括以下步骤:
1)分离出编码耐高温二氢乳清酸脱氢酶的核苷酸序列SEQ ID NO.1;
2)构建含SEQ ID NO.1核苷酸序列的表达载体;
3)将步骤2)中表达载体转入宿主细胞,形成能生产耐高温二氢乳清酸脱氢酶的重组细胞;
4)培养步骤3)中的重组细胞;
5)分离、纯化得到耐高温二氢乳清酸脱氢酶。
本发明涉及嗜热厌氧菌的耐高温二氢乳清酸脱氢酶基因的分离及表达。以腾冲嗜热厌氧菌全基因组测序与分析为基础,克隆分离了耐高温二氢乳清酸脱氢酶基因。该基因对于制备用于生产耐高温二氢乳清酸脱氢酶的转基因微生物或动植物,并回收获得该基因编码的酶有用。另外,本发明还提供了具有耐高温二氢乳清酸脱氢酶活性的多肽的氨基酸序列及功能等同体。同时,本发明还提供了制备,分离,纯化具有耐高温二氢乳清酸脱氢酶活性的多肽的方法。
附图说明
图1是测序文库构建步骤流程图;
图2是测序与数据分析流程图。
具体实施方式
本发明提供了分离的,编码耐高温二氢乳清酸脱氢酶活性的多肽的多聚核苷酸分子,该核苷酸分子是通过对腾冲嗜热厌氧菌全基因组测序与分析而获得的,具有SEQ.ID NO.1的核苷酸序列,它编码具有301氨基酸的多肽,该多肽推测分子量为32401道尔顿。
本发明还提供一种重组载体,该载体包含本发明的分离的核苷酸分子,以及包含有重组载体的宿主细胞。同时,本发明包括构建该重组载体和宿主细胞的方法,以及用重组工程技术生产耐高温二氢乳清酸脱氢酶的方法。
本发明进一步地提供了一种分离的耐高温二氢乳清酸脱氢酶或多肽,它具有SEQ.ID NO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本发明中,“分离的”DNA是指该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,“耐高温二氢乳清酸脱氢酶基因”指编码具有耐高温二氢乳清酸脱氢酶活性的多肽的核苷酸序列,如SEQ.ID NO.1的核苷酸序列及其简并序列。该简并序列是指该序列中有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于公知的密码子的简并性,所以与SEQ ID NO.1核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.2所述的氨基酸序列。该术语还包括能在中度严谨条件下,更佳地在高度严谨条件下与SEQ IDNO.1的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.1核苷酸序列同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本发明中,“分离的”蛋白的多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析,PAGE或HPLC法测量多肽的纯度。分离的多肽基本上不含天然状态下的伴随其的组份。
在本发明中,“耐高温二氢乳清酸脱氢酶”指具有耐高温二氢乳清酸脱氢酶活性的SEQ ID NO.2序列的多肽。该术语还包括SEQ ID NO.2序列的变异体,这些变异体具有与天然耐高温二氢乳清酸脱氢酶相同的功能。这些变异体包括(但不限于)若干个氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一个或数个氨基酸,也可以是不影响序列的修饰形式上的差异。例如,为本领域所公知的,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末段和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括耐高温二氢乳清酸脱氢酶的活性片段和活性衍生物。
在本发明中,可选用本领域已知的各种载体,如市售的各种质粒,粘粒,噬菌体及反转录病毒等。在生产本发明的耐高温二氢乳清酸脱氢酶时,可以将耐高温二氢乳清酸脱氢酶基因序列与表达调控序列相连,从而形成耐高温二氢乳清酸脱氢酶表达载体。表达载体含有复制起始点和表达调控序列,启动子,增强子和必要的加工信息位点。表达载体还必须含有可供选择的标记基因,如a)提供对抗生素或其它毒性物质(氨苄青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白质或b)互补营养缺陷型蛋白质或c)提供复合培养基中没有的必需营养成分的蛋白质。各种不同宿主的合适标记基因是本领域中所熟知或生产厂商说明书注明的。这些表达载体可以用本领域技术人员公知的重组DNA技术制备,如可参考Sambrook等人,1989或Ausubel等人,1992。
重组表达载体可以用本领域熟知的方法引入宿主细胞,这些方法包括:电转化法,氯化钙法,基因枪法等。将外源重组载体导入宿主细胞的过程称为“转化”。通过培养宿主细胞,诱导所需蛋白的表达,并通过本领域所熟知的蛋白分离技术,如柱层析等得到所需的蛋白质。也可采用固相技术等人工合成该蛋白质。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核细胞如大肠杆菌,枯草杆菌等。常用的真核细胞如酵母细胞,或各种动植物细胞。本发明的耐高温二氢乳清酸脱氢酶基因全长序列或其片段通常可以用聚合酶链式反应(PCR)扩增法,重组法,或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列来设计引物,用本领域技术人员已知的常规方法制备的嗜热厌氧菌全基因组DNA为模板,扩增而得到有关序列。一旦获得了有关序列,就可以将其克隆入有关载体,再转入宿主细胞,然后通过常规方法从增殖后的宿主细胞中分离得到大批量的有关序列。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(NewYork:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:构建测序文库
测序文库的构建采用全基因组霰弹法(shotgun)进行。首先培养腾冲嗜热厌氧菌,培养方法按(Yanfen Xue,2000)改进的MB培养基(Balch et al.,1979),按Marmur(1961)方法收集细菌,提取总DNA。为了保证测序文库构建的随机性,最大程度地避免产生断裂热点的问题,采用多种方法、不同条件的建库原则。先采用物理剪切方法(包括超声波法及用Hydroshear Machine进行剪切),其次根据该菌基因组特征选用AluI进行随机部分酶切。物理剪切时采用不同强度处理样品,酶切时通过设置酶量梯度处理样品。处理后的样品经平末端处理后,采用电泳分部收集1.5-4kb DNA片段,与去磷酸化的经SmaI酶切的pUC18进行连接,连接产物通过电转化E.coli DH5α构建了随机测序的文库。同时,为了便于以后重叠群(contig)的搭接还构建了长插入片段(10kb左右)的测序文库(将基因组DNA以Sau3AI随机部分酶切,电泳收集10kb左右的片段,与去磷酸化的经BamHI酶切的pUC18进行连接、构建文库)。该文库经两个末端的测序在完成图(finishing)的过程中可以得到contig之间的关系,并可以解决较大的洞(gap)对补洞造成的困难。建库流程如(见图1)。
实施例2:基因组测序
在完成腾冲嗜热厌氧菌基因组的测序时,主要使用了两种全自动测序仪:ABI377和MegaBACE 1000。这两种测序仪都是利用电泳原理进行测序(见图2),每次可完成96个样品。ABI377是PE公司的产品,是ABI系列的一种。它属于平板凝胶电泳测序仪。MegaBACE 1000是法玛西亚公司的产品,属于毛细管凝胶电泳测序仪。
实施例3:Basecalling和测序质量监控
所谓Basecalling是指从测序仪上得到的原始数据文件中得到正确的碱基序列的过程。由于测序仪上得到的是A,T,G,C四种碱基对应的不同波长的光的强度变化轨迹(trace),需要用计算机采取一定的算法从中正确识别出不同的轨迹对应的碱基。我们使用的是Phred软件(Ewing B,Hillier L,1998),原因是其结果更可靠,并且其结果输出更便于同一软件包中的其他程序进行进一步的分析。
Phred进行Basecalling的算法原理,是根据轨迹中各个峰的形状,间距,以及信噪比等因素,判断碱基类型,同时对这个碱基给出可信度信息,即碱基的测序质量。在大规模测序中,测序质量的监控是十分重要的,它直接影响对测序的决策,包括文库的构建,覆盖率的大小。同时对测序实验中可能出现的失误能及时反馈。
实施例4:序列拼接
所谓序列拼接,就是把全基因组霰弹法,又称鸟枪法随机测序得到的样品序列组装成连续的重叠群(contig),主要利用它们之间的重叠序列作参考。考虑到测序中存在载体的影响,需要先对样品序列进行去载体处理。这里所用的软件cross_match和后面拼接所用的软件Phrap都是美国Washington大学的软件(Gordon D,Abajian C,1998),其基本原理为Swith-Waterman算法(Waterman MS,1990)。这是一种动态算法,在考虑了两两序列之间的比较之后,可以得到一组序列的公有序列(consensus sequence)。去除载体后的样品序列再用Phrap进行拼接。在拼接时,碱基的测序质量也被考虑了,所得到的公有序列各碱基的可信度,由组成该公有序列的样品的测序质量计算得到。
实施例5:基因注释
在大体得到基因组的大部分序列(完成工作框架图)后,就需要对基因组进行注释,包括进行开读框架(Open Reading Frame,ORF)的预测,基因功能的预测,以及特殊RNA片段的分析等。
第一步采用缺省参数的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)软件预测基因编码序列,然后所有预测的开读框和非编码区(intergenic region)都用BLAST软件(Altschul,S.F.et al.1997)与NCBI的无冗余蛋白数据库(non-redundant protein database)比较来发现可能漏掉的基因。在判断一个基因的起始点时,将参考各种相关信息,如序列同源性,核糖体结合位点,可能的信号肽序列和启动子序列等。如果在一个开读框内出现多个启动子时,一般采用第一个启动子作为基因的起始点。采用TransTerm软件(Ermolaeva,M.D.2000)在非编码区预测不依赖于Rho(ρ)因子的转录终止子。如果该终止子位于一个基因的下游区的太远处,则可能暗示一个小基因的丢失或测序错误人为地缩短了该基因,可作为进一步分析的参考。在确定移框突变和点突变时,主要根据与数据库中的蛋白质的相似性来判断。如果出现一个蛋白质对应于两个彼此相邻的编码序列的情况,则被认为是一个无活性基因(假基因pseudogenes),因为这说明这两个编码序列之间由于突变而产生异常中止现象,进而使基因失去活性。所有分析结果再用Artemis sequence viewer软件(Rutherford,K.et al.2000)进行手工分析。一些明显与其它编码序列有重叠的开读框,长度小于150碱基对并且在已有数据库中没有同源性和其中没有明显的启动子或终止区域的开读框将被去除。
蛋白质的功能片段(motif)和功能区域(domain)分别采用与Pfam、PRINTS、PROSITE、ProDom和SMART数据库进行比对分析,结果再用InterPro数据库(Apweiler,R.et al.2001)进行汇总分析。根据NCBI的COGs数据库(Tatusov,R.L.et al.2001)并且参照其他数据库的查询结果来确定蛋白质在COGs分类中的功能分类和可能的代谢途径。用TMHMM软件(Krogh,A.et al.2001)来确认膜蛋白、ABC转运蛋白和跨膜功能域。采用革兰氏阴性菌为参数,用SIGNALP2.0软件(Nielsen,H.et al.1999)分析信号肽区域。(4)补洞
在完成基因组的工作框架图之后,就要进行更加困难的补洞工作,即完成整个基因组100%的测序,得到一个环形基因组。主要工作就是把前面得到的contig连接起来。主要方法包括:
A.利用测序中的正反向测序样品信息在测序过程中,我们有意对某些样品进行了双向测序,即同时测序某个插入片段的两端,再将所得序列与其他序列一起进行拼接。由于这一对序列在基因组上的关系一定,其之间的距离大致已知,根据这一信息,一可以确认某段contig是否可靠,二是当这一对序列分别位于不同的contig上时,可以确定这两个contig的方向关系和位置关系,为进一步设计实验提供参考。
B.长插入片段及Cosmid末端测序
基于同样的原理,我们可以构建不同长度的插入片段文库,只对其两端测序,然后拼接,分析其具体位置。这些文库包括长度为9-12Kb的长插入片段库和20-40Kb左右的Cosmid文库。具体分析方法同上所述。
C.PCR和末端延伸Walking实验
根据A和B所提供的contig方向和位置关系,进一步的生物化学实验就可以进行了。如设计一对引物进行PCR扩增,或以某一contig末端序列合成引物进行末端延伸(Walking)来补洞等。
实施例6:二氢乳清酸脱氢酶的制备和提纯
根据实施例中基因注释得到的二氢乳清酸脱氢酶全长编码序列(SEQ IDNO.1),设计能扩增出完整编码阅读框的引物,并在正反引物上分别引入限制性内切酶位点,以便构建表达载体。以实施例1中获得的测序文库的质粒DNA为模板,经PCR扩增后,在保证阅读框正确的前提下重组至pGEX-2T载体(Pharmacia,Piscataway,NJ)。再将重组载体转化入大肠杆菌DH5α中(转化方法为CaCL2法或电转化法)。筛选鉴定的到含有表达载体的工程菌DH5α-pGEX-2T-PyrD。
挑取单菌落的工程菌DH5α-pGEX-2T-PyrD于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养37℃过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L,继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达所需蛋白的工程菌。
按上述方法诱导表达所需蛋白的工程菌后,将细菌离心沉淀,按每400ml菌加入20ml PBS饱和的50%谷胱苷肽Sepharose 4B,37℃振摇结合30分钟,10000rpm离心10分钟沉淀结合了所需蛋白的谷胱苷肽Sepharose 4B,弃上清。按每毫升超声液所得沉淀加入100μl还原型谷胱苷肽洗脱液,室温置10分钟,上清即为洗脱的蛋白。重复洗脱两次。洗脱的上清保存于-80℃,并进行SDS-PAGE电泳,检测纯化效果。在32401道尔顿处的蛋白质条带即为二氢乳清酸脱氢酶。
序列表1.SEQ ID NO.1(1)序列特征:a.长度:906碱基对b.类型:DNAc.链型:双链d.几何结构:线性(2)分子类型:核苷酸(3)序列描述:ttgaacctatcggttgagattggaaagataaagcttaaaaaccctgtgattactgcctcaggaacttttggttttggcagggagtacagtgaatacatcgaccttaataaattaggagcgatagttgtaaaaggacttactgtaaagccaagagaaggcaatcctccgcccaggttgtttgagaccgcttctgggattttaaacagcataggccttcaaaatccgggagtagatgcgtttattgaaagggaacttccttttttgaaaagtttcgatgttccagtgattgtaaatattgctggggaaacggttgaggaatttgtgtatatggcagaaaaacttgatattgaagggatagaagggattgaaattaacgtttcctgccccaacgtgaaaaaaggcggaatggcttttggtgtaaatccagatgatatttttgacattacaagaaaggttagaaaggctaccagtaagactgtcatagtgaagttaaccccaaatgtaacagacataaaagtttgcgcaaaggctgcggaaaaaggaggagcagatgctatatctttgattaacacggtggcagggatggctgtagacatcgataaaaggaggcctgtttttgagaatgtaattggggggctatccgggcctgctataaagcctattgctcttaaaatggtgtacgaagtagtcacagttgtgagcattcctgtgataggcatgggaggaataatgaactacaaagatgctttggaatttttaattgtaggtgcaagagctattgcagtgggaacttgtaattttgtaaatccttactgtactgttgagattattgatggaataaaaaagtacatggaagaaaacgaaattgaagacataaatgaaattattggaagtataaaaatttaa2.SEQ ID NO.2(1)序列特征:a.长度:301氨基酸b.类型:多肽c.链型:单链d.几何结构:立体(2)分子类型:蛋白质(3)序列描述LNLSVEIGKIKLKNPVITASGTFGFGREYSEYIDLNKLGAIVVKGLTVKPREGNPPPRLFETASGILNSIGLQNPGVDAFIERELPFLKSFDVPVIVNIAGETVEEFVYMAEKLDIEGIEGIEINVSCPNVKKGGMAFGVNPDDIFDITRKVRKATSKTVIVKLTPNVTDIKVCAKAAEKGGADAISLINTVAGMAVDIDKRRPVFENVIGGLSGPAIKPIALKMVYEVVTVVSIPVIGMGGIMNYKDALEFLIVGARAIAVGTCNFVNPYCTVEIIDGIKKYMEENEIEDINEIIGSIKI
Claims (8)
1.一种分离的DNA分子,其特征在于:它是编码具有耐高温二氢乳清酸脱氢酶蛋白活性的多肽的核苷酸序列。
2.如权利要求1所述的DNA分子,其特征在于:所说的核苷酸序列编码具有SEQ.ID NO.2中的氨基酸序列的多肽或所述多肽的修饰形式,该修饰形式功能上相当或与耐高温二氢乳清酸脱氢酶相关。
3.如权利要求1所述的DNA分子,其特征在于:所说的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突变形式,突变类型包括:缺失、无义、插入、错义。
4.一种分离出的多肽,其特征在于:它具有耐高温二氢乳清酸脱氢酶活性。
5.如权利要求4所述的多肽,其特征在于:它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段、或其活性衍生物。
6.一种载体,其特征在于:它含有权利要求1中之DNA。
7.一种宿主细胞,其特征在于:它是用权利要求6所述载体转化的原核细胞或真核细胞。
8.一种制备耐高温二氢乳清酸脱氢酶的方法,其特征在于该方法包括以下步骤:
1)分离出编码耐高温二氢乳清酸脱氢酶基因的核苷酸序列SEQ ID NO.1;
2)构建含SEQ ID NO.1核苷酸序列的表达载体;
3)将步骤2)中表达载体转入宿主细胞,形成能生产耐高温二氢乳清酸脱氢酶的重组细胞;
4)培养步骤3)中的重组细胞;
5)分离、纯化得到耐高温二氢乳清酸脱氢酶。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01145570 CN1371997A (zh) | 2001-12-27 | 2001-12-27 | 耐高温二氢乳清酸脱氢酶基因序列及编码的多肽和制备方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01145570 CN1371997A (zh) | 2001-12-27 | 2001-12-27 | 耐高温二氢乳清酸脱氢酶基因序列及编码的多肽和制备方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1371997A true CN1371997A (zh) | 2002-10-02 |
Family
ID=4678244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 01145570 Pending CN1371997A (zh) | 2001-12-27 | 2001-12-27 | 耐高温二氢乳清酸脱氢酶基因序列及编码的多肽和制备方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1371997A (zh) |
-
2001
- 2001-12-27 CN CN 01145570 patent/CN1371997A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1418954A (zh) | 耐高温hsp70分子伴侣基因及其编码的多肽和制备方法 | |
CN1420172A (zh) | 耐高温ctp合成酶基因及其编码的多肽和制备方法 | |
CN1198928C (zh) | 耐高温核糖体蛋白l15 基因及其编码的多肽和制备方法 | |
CN1371996A (zh) | 耐高温亚精胺合酶基因序列及编码的多肽及制备该多肽的方法 | |
CN1371997A (zh) | 耐高温二氢乳清酸脱氢酶基因序列及编码的多肽和制备方法 | |
CN1366059A (zh) | 耐高温磷酸甘露糖异构酶基因及其编码的多肽和制备方法 | |
CN1164750C (zh) | 耐高温转醛酶基因及其编码的多肽和制备方法 | |
CN1417338A (zh) | 耐高温dna聚合酶基因序列及编码的多肽和制备方法 | |
CN1367250A (zh) | 一种耐高温异柠檬酸脱氢酶基因及其编码的多肽和制备方法 | |
CN1367249A (zh) | 耐高温分支酸合酶基因及其编码的多肽和制备方法 | |
CN1379106A (zh) | 耐高温胞嘧啶脱氨酶基因及其编码的多肽和制备方法 | |
CN1366054A (zh) | 耐高温谷氨酸亚胺甲基转移酶基因及编码的多肽和制备法 | |
CN1418957A (zh) | 耐高温乙酰辅酶a羧化酶基因及其编码的多肽和制备方法 | |
CN1379094A (zh) | 耐高温酪氨酰tRNA合成酶基因及其编码的多肽和制备方法 | |
CN1420175A (zh) | 耐高温苏氨酸合成酶基因及其编码的多肽和制备方法 | |
CN1390943A (zh) | 耐高温6-磷酸葡萄糖异构酶基因及其编码的多肽和制备方法 | |
CN1371998A (zh) | 耐高温三磷酸鸟苷环式水解酶基因序列及编码的多肽和制备方法 | |
CN1366055A (zh) | 耐高温尿苷激酶基因及其编码的多肽和制备方法 | |
CN1418955A (zh) | 耐高温FtsA蛋白基因及其编码的多肽和制备方法 | |
CN1420179A (zh) | 耐高温反向旋转酶基因及其编码的多肽和制备方法 | |
CN1364908A (zh) | 耐高温烯醇化酶基因及其编码的多肽和制备方法 | |
CN1379097A (zh) | 耐高温磷酸甘油酸变位酶1基因及其编码的多肽和制备方法 | |
CN1379103A (zh) | 耐高温葡聚糖磷酸化酶基因及其编码的多肽和制备方法 | |
CN1420174A (zh) | 耐高温6-磷酸果糖激酶基因及其编码的多肽和制备方法 | |
CN1379100A (zh) | 耐高温二氢乳清酸合酶基因及其编码的多肽和制备方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |