具体实施方式:
实施例1:巨大芽孢杆菌P450基因的克隆及重组质粒pET-20b-cyp和pTrc99A-cyp的构建
1.1巨大芽孢杆菌ALA2菌株的基因组DNA的提取(精编分子生物学实验指南(第四版) 北京: 科学出版社,2005)
1.1.1巨大芽孢杆菌的培养
巨大芽孢杆菌(Bacillus megaterium)购于美国农业部,NRRL编号是B-21660。
巨大芽孢杆菌在固体培养基(LLB培养基:胰蛋白胨 10 g/L,酵母提取物 5 g/L,NaCl 5 g/L,琼脂 15 g/L)上生长,挑单菌落至液体LLB培养基。37℃摇床培养8-12 h,收集细胞。用含10%wt甘油的LLB培养基将菌种保存至-80℃。
巨大芽孢杆菌基因组DNA的提取
A.细胞制备及裂解
(1)37℃摇床培养巨大芽孢杆菌ALA2 8 h,取5mL菌液4,000 g离心10 min收集细胞。
(2)用0.5 mL TE缓冲液重悬菌体,加入30 μL 溶菌酶(50 mg/mL),混合均匀,37℃保温1h。
(3)加入50 μL 10%wt十二烷基硫酸钠(SDS)和5 μL 蛋白酶K(20 mg/mL),混合均匀,37℃保温30 min。
B.DNA的提取
(1)加入0.75 mL 5 mol/L NaCl,混匀,静止5 min。
(2)向离心管中加入等体积酚/氯仿/异戊醇(体积比=25:24:1),混匀,10,000 g离心10 min。
(3)为防止剪切力造成基因组DNA断裂,用粗口吸管将上清转入另一离心管中,向离心管中加入等体积氯仿/异戊醇(体积比=24:1)混匀,10,000 g离心10 min。
(4)将上清转移至另一离心管中,加入0.6倍体积异丙醇,轻轻晃动至白色丝状DNA沉淀清晰可见。
(5)离心收集沉淀,用70%vt酒精清洗一次。
(6)室温下风干,加 50 μL TE缓冲液溶解。
(7)稀释用核酸蛋白检测仪检测DNA浓度。
引物设计
按照已知的巨大芽孢杆菌P450酶基因(Genbank: J04832.1)设计引物,引物由中科院上海生物工程中心合成。
引物1(N端):5'-ATGACAATTAAAGAAATGCCTCAGC-3',
引物2(C端):5'-TTACCCAGCCCACACGTC-3'。
以提取的巨大芽孢杆菌ALA2的基因组DNA为模板,用合成的引物1、引物2进行PCR扩增,扩增的条件是94℃,5 min;暂停计时,加TaKaRa Ex TaqTM聚合酶,30次循环( 94℃,30 s;53℃,60 s;72℃,3 min 15 s );72℃,10 min;反应停止,4℃保温。通过PCR纯化试剂盒对 PCR 扩增产物进行纯化,得到巨大芽孢杆菌ALA2中细胞色素P450酶基因cyp。
克隆
采用TaKaRa公司的pMD-19T Vector。反应体系10 μL,其中pMD-19T Vector DNA 1μL,Insert DNA 4 μL,Solution I 5 μL,16℃反应过夜。转化大肠杆菌TOP10的感受态细胞,并涂布在含Amp的LLB固体培养基(100 μg/mL Amp)上,37℃静置培养。挑选若干白色菌落至5 mL LLB 液体培养基(含Amp)中,37℃下震荡培养8 h,提取重组质粒进行测序验证,得到含有原始基因cyp的重组质粒pMD19T-cyp。
重组质粒的构建和重组蛋白的表达
大肠杆菌表达系统是近年来发展很快的一个原核表达系统,非常适合原核蛋白的表达,表现在遗传背景清楚,技术操作简单,培养条件简单。研究表明,外源蛋白在大肠杆菌中表达的差异主要由表达系统的选择及外源基因本身的特性决定。不同表达系统的选择是影响基因在异源宿主中表达效率的主要因素。因此,为实现cyp在大肠杆菌中的高效表达,本研究首先对比了不同的表达系统对细胞色素P450酶的影响。
重组质粒的构建
A.重组质粒pET-20b-cyp的构建
按照测序结果设计相对于pET-20b载体的引物,引物3(N端):5'-CCGGATCCATGACAATTAAAGAAATGCCTCAGC-3',前端加上BamH I位点;引物4(C端):5'-GCGCTCGAGCCCAGCCCACACGTC-3',前端加上Xho I位点。以T克隆载体pMD19T-cyp为模板进行PCR扩增,使用TaKaRa公司的Prime STAR HS DNA聚合酶,反应体系50 μL,获得PCR产物。
反应体系:pMD19T-cyp 0.5 μL,引物3(10 μM)1 μL,引物4(10 μM)1 μL, dNTP Mixture (各2.5 mM) 4 μL,5×PCR Buffer 10 μL,Prime STAR HS聚合酶 0.5 μL,加ddH2O至50 μL。
反应条件: 94℃预变性5 min,94℃变性30 s,58℃退火30 s,72℃ 3 min 15 s,30个循环,72℃延伸10 min,取5 μL反应产物电泳检测。
将获得的目的基因和pET-20b用内切酶BamH I和Xho I双酶切,并割胶回收,浓缩后16℃连接过夜。宿主菌使用大肠杆菌BL21的感受态细胞,涂布在LLB平板(含100 μg/mL Amp)上,倒置平板过夜。挑选单菌落到5 mL液体LLB培养基(含100 μg/mL Amp)中,37℃,200 rpm培养8 h。提取重组质粒进行测序验证,得到含有原始基因cyp的重组质粒pET-20b-cyp。
B.重组质粒pTrc99A-cyp的构建
按照测序结果设计相对于pTrc-99A载体的引物,引物5(N端):5'-CCGccatgggcACAATTAAAGAAATGCCTCAGCc-3',前端加上Nco I位点。引物6(C端):5'-GCGCTCGAGCCCAGCCCACACGTC-3',前端加上BamH I位同时引入组氨酸标签,便于后期纯化。以T克隆载体pMD19T-cyp为模板进行PCR扩增,使用TaKaRa公司的Prime STAR HS DNA聚合酶,反应体系50 μL,获得PCR产物。
反应体系:pMD19T-cyp 0.5 μL,引物5(10 μM)1 μL,引物6(10 μM)1 μL, dNTP Mixture (各2.5 mM) 4 μL,5×PCR Buffer 10 μL,Prime STAR HS 聚合酶0.5 μL,加ddH2O至50 μL。
反应条件: 94℃预变性5 min,94℃变性30 s,58℃退火30 s,72℃ 3 min 15 s,30个循环,72℃延伸10 min,取5 μL反应产物电泳检测。
将获得的目的基因和pTrc99A用内切酶Nco I和BamH I双酶切,并割胶回收,浓缩后16℃连接过夜。宿主菌使用大肠杆菌TOP10的感受态细胞,涂布在LLB平板(含100 μg/mL Amp)上,倒置平板过夜。挑选单菌落到5 mL液体LLB培养基(含100 μg/mL Amp)中,37℃,200 rpm 培养8 h。提取重组质粒进行测序验证,得到含有原始基因cyp的重组质粒pTrc99A-cyp。
重组蛋白的表达
将阳性转化子接种到LLB平板上活化,37℃培养12 h,接单菌落到5 mL LLB液体培养基中,37℃,200 rpm摇床培养8-10 h,转摇瓶培养,当OD600达到0.6-0.8之间时,加入IPTG至终浓度为0.5 mM,于30℃,120 rpm条件下诱导6-8 h。样品于12000 rpm下离心5 min,弃上清,将大肠杆菌重悬后,超声波破壁,再次离心,取上清检测酶活。酶活采用NADPH法测定。(Budde M. , Applied Microbiology and Biotechnology (2004), 66(2), 180-186)
实施例2:P450基因的定向改造及重组质粒pTrc99A -cypI的构建
2.1巨大芽孢杆菌细胞色素P450酶基因的定向改造
酶蛋白的活性中心位点对酶的催化性能的有重要影响。酶的活性中心是一个由若干活性点组成的三维空间结构,其中T269残基位于血红素域I-helix末端,对分子氧O2的结合与激活具有重要作用。(Yeom H et al, Biochemistry 34(1995):14733)
在Swiss-pdbViewer4.03软件的辅助下(Arnold K et al, Bioinformatics, 22,195;Schwede T et al, Nucleic Acids Research 31: 3381),以原始酶的核苷酸序列cyp为基准,希望通过改变细胞色素P450酶对氧的结合能力来达到提高酶活的目的,采用一步反向PCR对细胞色素P450酶基因cyp的密码子进行突变。通过对细胞色素P450酶结构进行分析,对位于269位处苏氨酸残基进行定点随机突变。
以来源于巨大芽孢杆菌ALA2的细胞色素P450酶基因(cyp)序列为基础,为了改变269位处的苏氨酸,设计了一组寡核苷酸,引物7 :5'-GAANNNACAAGTGGTCTTTTATCATTTGCGC -3';引物8:5'-GTGTCCCGCAATTAAGAACG -3',共定点随机突变了3个碱基,将氨基酸序列中的一个苏氨酸改为其他氨酸。运用DNA合成仪经过化学合成获得这组寡核苷酸。
人工进化的巨大芽孢杆菌ALA2的细胞色素P450酶基因cypI的获得采取反向PCR扩增技术。
反应体系:以0.5 μL pTrc99A-cyp为模板,引物7(10 μM) 1 μL,引物8(10 μM) 1 μL,4 μL dNTP Mixture (各2.5 mM),10 μL 5× PCR Buffer,0.5 μL Phusion聚合酶,加水补足50 μL。
反应条件:98℃预变性30 s,98℃变性10 s,55℃退火30 s,72℃ 3 min 30 s ,30个循环,72℃延伸10 min,取5 μL反应产物电泳检测。
重组质粒pTrc99A-cyp I 的构建
通过 PCR 纯化试剂盒对 PCR 扩增产物进行纯化。因为Phusion聚合酶扩增片段是平端,可以直接用T4 Polynucleotide Kinase对5'-OH末端寡核苷酸的磷酸化。
磷酸化反应:T4 Polynucleotide Kinase 1 μL,10× Buffer 1 μL,PCR产物8 μL,总体系共10 μL(反应体系中可加入终浓度 1mM 的ATP)。37℃,反应3-4 h。
再用T4 DNA连接酶16℃连接过夜。从磷酸化体系中取8 μL液体,加1 μL T4 DNA 连接酶,1 μL相应的10× Buffer,总体系10 μL。
取1-2μL连接液电击转化,宿主菌使用大肠杆菌TOP10,涂布在LLB平板(含100 μg/mL Amp)上,倒置平板过夜,挑选单菌落到5 mL液体LLB培养基(含100 μg/mL Amp)中,37℃,200 rpm培养8 h。提取重组质粒进行测序验证,得到含有定向进化后的基因cyp I的重组质粒pTrc99A-cyp I(图-1)。
实施例3:重组质粒pTrc99A-cypI转化大肠杆菌及重组酶的制备
3.1大肠杆菌的电击转化
大肠杆菌的电击转化高压电转化是目前效率最高的质粒DNA转化大肠杆菌的方法。按照常规办法制备大肠杆菌TOP10感受态细胞,50 μL分装一管,放于-80℃保存。
电转化具体步骤:
(1)取1 μL 重组质粒pTrc99A-cyp I加入到50 μL融化的大肠杆菌感受态细胞TOP10中,混匀。
(2)调节电击仪,使电脉冲为25 μF,电压2.5 kV,电阻200 Ω。
(3)将转化混合物转移到预冷的电转化池中,吸干池的外表面,然后放入样品槽中。
(4)进行脉冲电转化,然后马上向电转池中加入1 mL SOC培养基,混匀。
(5)将混合物转移到无菌培养管中,于37℃ 180 rpm摇床培养45~60 min。
(6)取100 μL 涂布于LLB平板(含100 μg/mL Amp)上,倒置平板于37℃培养。
重组大肠杆菌工程菌株的诱导表达
从电击转化的平板上挑去含有重组质粒pTrc99A-cyp I的重组菌至挑选单菌落到5 mL液体LLB培养基(含100 μg/mL Amp)中,37℃,200 r/min培养8 h。然后按1%转接至200 mL LLB液体培养基(含100 μg/mL Amp)中,至OD600达到0.6-0.8,加入IPTG至终浓度为0.5 mM,于30℃,120 rpm条件下诱导6-8 h。离心收集菌体,用50 mM磷酸盐缓冲液(pH 8.0)洗涤一次。
重组酶的制备
由于重组质粒pTrc99A-cypI中含有His-tag标签,通过His·Bind Purification Kit(Novagen)进行纯化,得到纯化的重组酶。具体操作过程:
A.样品的处理
(1)将洗涤过的菌体,用1×Binding Buffer 8mL重悬,超声波破壁。
(2)破壁后,13,000 g离心30 min,取上清即为样品。
B.处理柱子
(1)取1 mL填料装柱。
(2)用3mL的无菌水洗柱子。
(3)用5mL的1×Charge Buffer洗柱子。
(4)用3mL的1×Binding Buffer洗柱子。
C.上样
(1)将样品加入柱子,控制流速约每分钟6滴。
(2)用3 mL 1×Binding Buffer洗柱子,除去未结合的蛋白质。
(3)用4 mL含有20 mM咪唑的洗脱液洗柱子,除去杂蛋白。
(4)用80 mM咪唑的洗脱液洗柱子,将目的蛋白洗脱下来。
(5)用4 mL 1×Strip Buffer洗柱子。
通过此过程得到纯化的细胞色素P450酶,将此酶液在50 mM磷酸缓冲液(pH 8.0)中过夜透析,除去咪唑。用NADPH法测酶活。
序列表
<110> 南京林业大学
<120> 巨大芽孢杆菌ALA2细胞色素P450酶基因及其重组质粒的构建及酶的纯化方法
<130>
<160> 9
<170> PatentIn version 3.3
<210> 1
<211> 3171
<212> DNA
<213> 人工序列
<400> 1
atgggcacaa ttaaagaaat gcctcagcca aaaacatttg gagagcttaa aaacttaccg 60
ttattaaaca cagataaacc gattcaaacg ctgatgaaaa ttgcagatga attaggggaa 120
atctttaaat ttgaagcgcc tggacgtgtg acgcgctact tatccagtca gcgtctaatt 180
aaagaagcat gcgatgaatc ccgcttcgat aaaaacttaa gtcaagcgct taaatttgtg 240
cgtgattttg caggagacgg tttatttaca agctggacgc acgaaaaaaa ctggaaaaaa 300
gcgcataata tcttacttcc aagcttcagt cagcaagcga tgaaaggcta tcacgcgatg 360
atggtcgata tcgccgtgca gcttattcaa aagtgggagc gtctaaatgc agatgagcat 420
attgaagtac cggaagatat gacgcgctta acgcttgata caatcggtct ttgcggcttt 480
aattaccgct ttaacagctt ttatcgcgat cagccgcacc cgtttattac aagtatggta 540
cgtgcactgg acgaagcgat gaacaagctg cagcgagcaa atccagatga tcctgcctac 600
gatgaaaata agcgtcagtt tcaagaagat attaaggtga tgaacgatct agtagataaa 660
attatcgcag atcgcaaggc aagcggtgaa caaagcgatg atttattaac gcatatgcta 720
aacggaaaag acccagaaac aggtgagccg cttgatgatg agaacattcg ctatcaaatt 780
attacgttct taattgcggg acacgaacgc acaagtggtc ttttatcatt tgcgctgtat 840
ttcttagtga aaaatccaca tgtattacaa aaagcagcag cagaagcagc acgagtttta 900
gtagatcctg ttccaagcta taaacaagtg aaacagctta aatacgtcgg catggtctta 960
aacgaagcgc tgcgcttatg gccgacagct cctgcatttt ctctatatgc aaaagaggat 1020
acggtgcttg gaggagaata tccgttagaa aaaggcgatg aactgatggt tctaattcct 1080
cagcttcacc gtgataaaac gatttgggga gacgatgtgg aagagttccg cccagagcgt 1140
tttgaaaatc caagcgcgat tccgcagcat gcgtttaaac cgtttggaaa cggtcagcgt 1200
gcgtgtatcg gtcagcagtt cgctcttcat gaagcaacgc ttgtacttgg tatgatgcta 1260
aaacattttg attttgaaga tcatacaaat tacgagatgg atattaaaga aactttaacg 1320
ttaaaacctg aaggttttgt tgtaaaagca aaatcaaaaa aaattccgct tggtggcatt 1380
ccttcaccta gcacggaaca gcctgctaaa aaagcacgca aaaaggtaga gaacgctcat 1440
aatacgccgc tgcttgtgtt atacggttca aatatgggaa cagctgaagg aacggcgagg 1500
gatttagcag atattgcgat gagcaaagga ttcgcacctc aggttgcaac gcttgattcc 1560
catgcaggaa atcttccgcg tgaaggagct gttttaattg taacggcttc ttataacgga 1620
catccacctg ataacgcaaa gcagtttgtc gactggttag accaagcgtc tgctgatgaa 1680
gtaaaaggcg ttcgctactc cgtatttgga tgcggcgata aaaactgggc aactacctat 1740
cagaaagtgc ctgcttttat cgatgaaacg ctagccgcta aaggggcaga aaacatcgct 1800
gaacgcggcg aagcagatgc aagcgacgac tttgaaggca catacgaaga atggcgtgaa 1860
catatgtgga gtgacgtagc agcttacttt aacctcgaca tagaaaacag tgaagataat 1920
aaatctacgc tttcacttca atttgtcgac agcgctgcgg acatgccgct tgcgaaaatg 1980
cacggtgctt tttcggcgaa cgttgtagca agcaaagaac tacaaaaacc aggcagtgaa 2040
cgaagcacgc gtcatcttga aattgagctt ccaaaagaag tttcttatca agaaggagat 2100
catttaggta ttattccgcg caactatgaa ggaatagtaa atcgtgtaac gacaaggttc 2160
ggtctagatg catcacagca aatccgtttg gaagctgaag aagaaaaatt agcgcatttg 2220
ccactcggta aaaccgtatc agtagaagag cttctgcaat atgtggagct tcaagatcct 2280
gttacgcgca cacagcttcg cgcaatggct gctaaaacgg tctgcccgcc gcataaagtg 2340
gagcttgaag ccttgcttga aaagcaagcg tataaagaaa aggtgctggc aaaacgctta 2400
acaatgcttg aactgcttga aaaatatccg gcgtgtgaaa tggaattcag cgaatttatc 2460
gctcttcttc caagcatgcg tccgcgctat tactccattt cttcatcacc tcgcgtcgat 2520
gaaaaacaag caagcatcac ggttagcgtc gtctcaggag aggcgtggag cggatatgga 2580
gaatataaag gaattgcgtc gaactatctt gctgagctgc aagaaggaga tacaattacg 2640
tgctttgttt ccacaccgca gtcaggcttt acgctgccaa aagatcctga aacaccgatt 2700
gtcatggtcg gaccaggaac aggcgtcgcg ccgtttagag gctttgtgca ggctcgcaag 2760
cagttaaaag aacaaggaca gtcgcttgga gaagcgcatt tatactttgg ctgccgttca 2820
cctcatgaag actatctgta tcaagaagag cttgaaaatg cacaaaatga aggtgtcatt 2880
acgcttcata ccgctttttc acgcgtacca aatcagccga aaacatacgt tcagcacgtt 2940
atggaacaag acggcacgaa attgattgaa cttcttgatc aaggagcgca cttctatatt 3000
tgcggagacg gaagccaaat ggcacctgac gttgaagcaa cgcttattaa aagctatgct 3060
gatgttcatg aagtaagtga agcagacgct cgcttatggc tgcaacagct agaagaaaag 3120
ggccgatacg caaaagacgt gtgggctggg caccaccacc accaccacta a 3171
<210> 2
<211> 25
<212> DNA
<213> 人工序列
<400> 2
atgacaatta aagaaatgcc tcagc 25
<210> 3
<211> 18
<212> DNA
<213> 人工序列
<400> 3
ttacccagcc cacacgtc 18
<210> 4
<211> 33
<212> DNA
<213> 人工序列
<400> 4
ccggatccat gacaattaaa gaaatgcctc agc 33
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<400> 5
gcgctcgagc ccagcccaca cgtc 24
<210> 6
<211> 34
<212> DNA
<213> 人工序列
<400> 6
ccgccatggg cacaattaaa gaaatgcctc agcc 34
<210> 7
<211> 24
<212> DNA
<213> 人工序列
<400> 7
gcgctcgagc ccagcccaca cgtc 24
<210> 8
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (4)..(6)
<223> n is a, c, g, or t
<400> 8
gaannnacaa gtggtctttt atcatttgcg c 31
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<400> 9
gtgtcccgca attaagaacg 20