CN1380415A - 用于转基因植物中生产类胡萝卜素的相关基因的合成 - Google Patents
用于转基因植物中生产类胡萝卜素的相关基因的合成 Download PDFInfo
- Publication number
- CN1380415A CN1380415A CN 01105878 CN01105878A CN1380415A CN 1380415 A CN1380415 A CN 1380415A CN 01105878 CN01105878 CN 01105878 CN 01105878 A CN01105878 A CN 01105878A CN 1380415 A CN1380415 A CN 1380415A
- Authority
- CN
- China
- Prior art keywords
- gene
- synthetic
- gac
- gtc
- astaxanthin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及用于转基因植物中生产类胡萝卜素的相关基因。利用重叠延伸PCR扩增技术以crtE、crtB、crtI、crtW、crtY、crtZ六种基因为模板合成具有植物偏爱密码的虾青素合成相关基因,并将合成的基因在植物中表达,生产虾青素等胡萝卜素物质来改良粮食作物及蔬菜的品质。
Description
本发明涉及植物基因工程领域中的植物生物反应器,更具体地说是通过化学合成的方法合成能在植物体内生产类胡萝卜素的6个相关基因。
类胡萝卜素是重要的天然色素,广泛存在动物和植物体内,自目前为止有600多种类胡萝卜素被发现,其颜色从黄色至橙红色,长期用来修饰食品的颜色。随着对类胡萝卜素化学结构的了解,类胡萝卜素的功能逐渐被挖掘。
类胡萝卜素具有抗氧化功能。在类胡萝卜素化学结构中有9-11个共轭双键,能够与自由基结合。避免细胞的氧化损害累积到一定程度后造成细胞老化甚至死亡。类胡萝卜素具有抗癌变作用。在研究虾青素等类胡萝卜素对黄曲霉毒素引发肝癌的影响中发现,类胡萝卜素可以降低肝癌病灶的数目和大小。类胡萝卜素具有增强机体免疫作用。虾青素等类胡萝卜素能够刺激抗体的产生(刘子贻,1997,中国海洋药物)。
类胡萝卜素众多功能的发现,大大增加了市场上对该类化合物的需求。仅虾青素一种,每年的需求额即超过一亿美元(梁世中,2000,食品与发酵工业)。目前大部分类胡萝卜素化合物是通过化学合成获得,需要很高的成本和资源(Johnson EA,1995,Adv Biochem Eng Biotechnol)。通过大面积培养杜氏耐盐藻生物也可获得大量的类胡萝卜素,但是这种藻类只能在干旱的地区养殖,对水质、环境及光的要求很高(郑晓东,2000,浙江大学学报)。虾青素等类胡萝卜素化合物还可以直接从甲科类动物中提取,但是含量很低,不适合大量生产(中国饲料行业信息网)。利用微生物生产虾青素等类胡萝卜素化合物成了近些年研究的重点,其中以红法夫酵母菌研究最多,该菌具有作为色素生物来源的一些必要特征:快速异氧代谢,培养时间短,能够在发酵罐中实现高密度发酵。虽然这类微生物具有很大的开发潜力,但目前普遍存在产量低的缺陷,还未能进行大规模的商业化生产(王菊芳,2000,生物工程进展)。
利用基因工程技术,将合成虾青素等类胡萝卜素的关键酶基因克隆并改造,利用合适的启动子进行调控,将这些基因同时转化到细菌、酵母以及植物中,实现虾青素等类胡萝卜素化合物的高效表达,将能满足迅速发展的市场对这些产品的巨大需求。其中以培育能大量生产β-胡萝卜素和虾青素的植物更具社会价值和市场价值。以水稻、甘蓝和油菜等作物作为材料生产的金色水稻、金色甘蓝和金色油菜,将成为人类健康的风景线。
从糖酵解产物乙酰辅酶A开始合成β-胡萝卜素需要一系列酶催化。大多数生物要经过乙酰辅酶A到法呢基焦磷酸(FPP)阶段,FPP在不同的酶作用下,合成麦角固醇或β-胡萝卜素。从FPP到β-胡萝卜素需要四种酶参与。法呢基焦磷酸(FPP)在垅牛儿基垅牛儿基焦磷酸合成酶(CrtE)催化下合成垅牛儿基垅牛儿基焦磷酸(GGPP),GGPP在八氢番茄红素合成酶(CrtB)作用下产生八氢番茄红素,之后在八氢番茄红素去饱和酶(CrtI)作用下逐渐形成番茄红素,最后在番茄红素β环化酶(CrtY)催化下,番茄红素合成β-胡萝卜素。虾青素是β-胡萝卜素合成的终止点,由β-胡萝卜素转变为虾青素需要加上两个酮基和羟基,体外合成比较困难。但是在生物体内只需在两个酶的催化下即能由β-胡萝卜素合成虾青素。β-胡萝卜素羟化酶(CrtZ)和β-胡萝卜素酮酶(CrtW)能够在β-胡萝卜素的C3\C3’和C4\C4’位置上加上羟基和酮基,形成虾青素(Claudia SD,2000,EnviromentalBiotechnology)。
至目前为止,分别从细菌、植物、藻类和真菌中克隆了近150个与类胡萝卜素合成有关的基因(Hirschberg J,1997,Purelity Applied Chemical)。这些功能相近的基因在核苷酸水平上差异很大。一方面,这些基因能够根据功能组合在一起,转化到不同的微生物或植物中,生产出各种各样的类胡萝卜素产品(Misawa N,1998,Applied and Environmental Microbiology)。另一方面,基因的差异给植物生产类胡萝卜素产品提供了保证,外源基因的转化不能改变植物中同功能基因的功能,造成基因沉默现象,相反能够加强类似基因的功能,提高产品的产量(Hirschberg J,2000,Nature Biotechnology)。
本发明以副球菌(Pracoccus marcusii)在虾青素合成中相关的6种酶的氨基酸为模板(ncbi.nlm.nih.gov:80),根据植物偏爱密码,化学合成这些基因。这6个基因分别为垅牛儿基垅牛儿基焦磷酸合成酶基因(crtE);八氢番茄红素合成酶基因(crtB);八氢番茄红素去饱和酶基因(crtI);番茄红素β环化酶基因(crtY);β-胡萝卜素羟化酶基因(crtZ)和β-胡萝卜素酮酶基因(crtW)。
大多数类胡萝卜素合成酶基因(crt)曾在大肠杆菌中克隆并表达,但是大肠杆菌中类胡萝卜素产量极低(每克细胞干重仅有10-500微克);将类胡萝卜素合成酶基因转化酵母,能获得较高的产量(每克细胞干重含有0.4毫克),相当于红法夫酵母中产生的虾青素含量(Johnson EA,1995,Adv BiochemEng Biotechnol)。然而,大多数酵母在类胡萝卜素合成过程中,很容易进行另外一条代谢途径,产生麦角固醇,从而使类胡萝卜素的产量减低(BalleyJE,1991,Science)。利用植物生产虾青素等类胡萝卜素物质具有很多优点:(1)成本低;(2)安全;(3)稳定,能够遗传,在后代表达。
正因为以植物生产类胡萝卜素具有极诱人的发展前景,国际上很多实验室在进行这方面的研究工作,并在烟草、番茄、水稻中成功地合成了β-胡萝卜素物质,使β-胡萝卜素的产量大幅度提高提高(NormileD,2000,Science)。这些研究工作有力地证明了植物在开发类胡萝卜素化合物中有巨大的发展潜力。为了提高这类化合物的产量,我们根据植物偏爱密码设计了合成虾青素的6个基因。
国内至今还没有利用基因工程方法生产虾青素的报道,国外曾在食用酵母(Candida utilis)中利用上述6个基因生产虾青素获得成功(MisawaN,1998,Applied and Environmental Microbiology),在植物中合成虾青素也有成功报道,但是合成过程中的中间产物是植物自身产生的β-胡萝卜素,由于β-胡萝卜素在植物中的含量很低,虾青素的含量也很低(BramleyPM,2000,Nature Biotechnology)。
本发明的目的是利用重叠延伸PCR扩增技术以crtE、crtB、crtI、crtY、crtZ、crtW六个基因为模板,合成具有植物偏爱密码的虾青素合成相关基因。
本发明的另一目的是将合成的基因在植物中表达,生产虾青素等类胡萝卜素物质。
本发明的再一目的为利用合成的基因来改良粮食作物以及蔬菜的品质,以制备有利于人们身体健康的保健食品。
本发明采用如下的方法实施本发明:
根据植物偏爱密码重新设计副球菌中β胡萝卜素酮酶基因(CrtW)和番茄红素β环化酶基因(crtY)的核苷酸序列,并组成联合基因CrtWcrtY。
CrtWcrtY基因的合成采用重叠延伸PCR方法,结合高保真的耐高温聚合酶进行PCR扩增。基因在大肠杆菌中克隆并测定核苷酸序列,从起始密码ATG到终止密码TAA长度为1997bp核苷酸。在基因的726~786位置处插入上一段自动切割序列:
CAACTCCTCAACTTCGACCTCCTCAAACTCGCA
GGCGACGTCGAATCCAACCCAGGCCCA。
全合成的crtWcrtY基因的核苷酸和氨基酸序列如下:
ATGTCCGCACACGCACTCCCAAAAGCAGACCTCACCGCAACCTCCCTCATCGTCTCCGGTGGTATCATCGCA-- 72
M S A H A L P K A D L T A T S L I V S G G I I A
GCATGGCTCGCACTCCACGTCCACGCACTCTGGTTCCTCGACGCAGCAGCACACCCAATCCTCGCAGTCGCA--144
A W L A L H V H A L W F L D A A A H P I L A V A
AACTTCCTCGGTCTCACCTGGCTCTCCGTCGGTCTCTTCATCATCGCACACGACGCAATGCACGGTTCCGTC--216
N F L G L T W L S V G L F I I A H D A M H G S V
GTCCCAGGTAGACCAAGAGCAAACGCAGCAATGGGTCAACTCGTCCTCTGGCTCTACGCAGGTTTCTCCTGG--288
V P G R P R A N A A M G Q L V L W L Y A G F S W
AGAAAGATGATCGTCAAGCACATGGCACACCACAGACACGCAGGTACTGACGACGACCCAGACTTCGACCAC--360
R K M I V K H M A H H R H A G T D D D P D F D H
GGTGGTCCAGTCAGATGGTACGCAAGATTCATCGGTACTTACTTCGGTTGGAGAGAAGGTCTCCTCCTCCCA--432
G G P V R W Y A R F I G T Y F G W R E G L L L P
GTCATCGTCACCGTCTACGCACTCATCCTCGGTGACAGATGGATGTACGTCGTCTTCTGGCCACTCCCATCC--504
V I V T V Y A L I L G D R W M Y V V F W P L P S
ATCCTCGCATCCATCCAACTCTTCGTCTTCGGCACCTGGCTCCCACACAGACCAGGTCACGACGCATTCCCA--576
I L A S I Q L F V F G T W L P H R P G H D A F P
GACAGACACAACGCAAGATCCTCCAGAATCTCCGACCCAGTCTCCCTCCTCACCTGCTTCCACTTCGGTGGC--648
D R H N A R S S R I S D P V S L L T C F H F G G
TACCACCACGAACACCACCTCCACCCAACCGTCCCTTGGTGGAGACTCCCATCCACCAGAACCAAAGGCGAC--720
Y H H E H H L H P T V P W W R L P S T R T K G D
ACCGCACAACTCCTCAACTTCGACCTCCTCAAACTCGCAGGCGACGTCGAATCCAACCCAGGCCCAATGACC--792
T A Q L L N F D L L K L A G D V E S N P G P M T
CACGACGTCCTCCTCGCAGGTGCAGGTCTCGCAAACGGTCTCATCGCACTCGCACTCAGAGCAGCAAGACCA--864
H D V L L A G A G L A N G L I A L A L R A A R P
GACCTCAGAGTCCTCCTCCTCGACCACGCAGCAGGTCCATCCGAAGGTCACACCTGGTCCTGCCACGACCCA--936
D L R V L L L D H A A G P S E G H T W S C H D P
GACCTCTCCCCACACTGGCTCGCAAGACTCAAGCCACTCAGAAGAGCAAACTGGCCAGACCAAGAAGTCAGA-1008
D L S P H W L A R L K P L R R A N W P D Q E V R
TTCCCAAGACACGCAAGAAGACTCGCAACCGGCTACGGCTCCCTCGACGGTGCAGCACTCGCAGACGCAGTC-1080
F P R H A R R L A T G Y G S L D G A A L A D A V
GTCAGATCCGGTGCAGAAATCAGATGGGACTCCGACATCGCACTCCTCGACGCACAAGGTGCAACCCTCTCC-1152
V R S G A E I R W D S D I A L L D A Q G A T L S
TGCGGTACTAGAATCGAAGCAGGCTCCGTCCTCGACGGCAGAGGCCCACACCCATCCAGACACCTCACCCTC-1224
C G T R I E A G S V L D G R G P H P S R H L T L
GGCTTCCACAAGTTCCTCGGTGTCGAAATCGAAACCGACAGACCACACGGTGTCCCAAGACCAGTCATCATG-1296
G F H K F L G V E I E T D R P H G V P R P V I M
GACGGCACCGTCACCCAAAGAGACGGCTACGGCTTCATCTACCTCCTCCCATTCTCCAGAACCAGAATCCTC-1368
D G T V T Q R D G Y G F I Y L L P F S R T R I L
ATCGAAGACACCAGATACTCCGACGGCGGCGACCTCGACGACGACGCACTCGCAGCAGCATCCCAAGACTAC-1440
I E D T R Y S D G G D L D D D A L A A A S Q D Y
GCAAGACAACAAGGCTGGACCGGTGCAGAAGTCAGAAGAGAAAGAGGCATCCTCCCAATCGCACTCGCACAC-1512
A R Q Q G W T G A E V R R E R G I L P I A L A H
GACGCAGCAGGTTTCTGGGCAGACCACGCAGAAGGTCCAGTCCCAGTCGGTCTCAGAGCAGGCTTCTTCCAC-1584
D A A G F W A D H A E G P V P V G L R A G F F H
CCAGTCACCGGCTACTCCCTCCCATACGCAGCACAAGTCGCAGACGTCGTCGCAGGTCTCTCCGGTCCACCA-1556
P V T G Y S L P Y A A Q V A D V V A G L S G P P
GGCACCGACGCACTCAGAGGTGCAATCAGAGACTACGCAATCGACAGAGCAAGAAGAGACAGATTCCTCAGA-1728
G T D A L R G A I R D Y A I D R A R R D R F L R
CTCCTCAACAGAATGCTCTTCAGAGGCTGCGCACCAGACAGAAGATACACCCTCCTCCAAAGACTCTACAGA-1800
L L N R M L F R G C A P D R R Y T L L Q R L Y R
ATGCCACACGGTCTCATCGAAAGATTCTACGCAGGTAGACTCTCCGTCGCAGACCAACTCAGAATCGTCACC-1872
M P H G L I E R F Y A G R L S V A D Q L R I V T
GGCAAGCCACCAATCCCACTCGGCACCGCAATCAGATGCCTCCCAGAAAGACCACTCCTCAAGGAAAACGCA-1994
G K P P I P L G T A I R C L P E R P L L K E N A
根据植物偏爱密码重新设计副球菌中八氢番茄红素去饱和酶基因(crtZ)和β胡萝卜素羟化酶基因(crtZ))的核苷酸序列,并组合成联合基因CrtIcrtZ。
CrtIcrtZ基因的合成采用重叠延伸PCR方法,结合高保真的耐高温聚合酶进行PCR扩增。基因在大肠杆菌中克隆并测定核苷酸序列,从起始密码ATG到终止密码TAA长度为2034bp核苷酸。在基因的1485~1545位置处插入上一段自动切割序列:
CAACTCCTCAACTTCGACCTCCTCAAACTCGCA
GGCGACGTCGAATCCAACCCAGGCCCA。
全合成的crtIcrtZ基因的核苷酸和氨基酸序列如下:
ATGAACGCACACTCCCCAGCAGCAAAGACCGCAATCGTCATCGGTGCAGGTTTCGGTGGTCTCGCACTCGCA-- 72
M N A H S P A A K T A I V I G A G F G G L A L A
ATCAGACTCCAATCCGCAGGCATCGCAACCACCCTCGTCGAGGCAAGAGACAAGCCAGGCGGTAGAGCATAC--144
I R L Q S A G I A T T L V E A R D K P G G R A Y
GTCTGGCACGACCAAGGCCACGTCTTCGACGCAGGTCCAACCGTCATCACCGACCCAGACGCACTCAAGGAA--216
V W H D Q G H V F D A G P T V I T D P D A L K ECTCTGGGCACTCACCGGTCAAGACATGGCAAGAGACGTCACCCTCATGCCAGTCTCCCCATTCTACAGACTC--288L W A L T G Q D M A R D V T L M P V S P F Y R LATGTGGCCAGGTGGCAAGGTCTTCGACTACGTCAACGAGGCAGACCAACTCGAAAGACAAATCGCACAATTC--360M W P G G K V F D Y V N E A D Q L E R Q I A Q FAACCCAGACGACCTCGAAGGTTACAGAAGATTCAGAGACTACGCAGAGGAGGTCTACCAGGAGGGCTACGTC--432N P D D L E G Y R R F R D Y A E E V Y Q E G Y VAAACTCGGCACCGTCCCATTCCTCAAGCTCGGTCAAATGCTCAAGGCAGCACCAGCACTCATGAAACTCGAA--504K L G T V P F L K L G Q M L K A A P A L M K L EGCATACAACTCCGTCCACGCAAAGGTCGCAACCTTCATCAAGGACCCATACCTCAGACAGGCATTCTCCTAC--576A Y N S V H A K V A T F I K D P Y L R Q A F S YCACACCCTCCTCGTCGGTGGTAATCCATTCTCCACCTCCTCCATCTACGCACTCATCCACGCACTCGAAAGA--648H T L L V G G N P F S T S S I Y A L I H A L E RAGAGGTGGTGTCTGGTTCGCAAAGGGTGGCACCAACCAGCTCGTCGCAGGTATGGTCGCACTCTTCGAGAGA--720R G G V W F A K G G T N Q L V A G M V A L F E RCCAGGTGGTCAAATGATGCTCAACGCAAAGGTCGCAAGAATCGAAACCGAGGGTGCAAGAACCACCGGTGTC--792P G G Q M M L N A K V A R I E T E G A R T T G VACCCTCGCAGACGGTAGATCCCTCAGAGCAGACATGGTCGCATCCAACGGTGACGTCATGCACAACTACAGA--864T L A D G R S L R A D M V A S N G D V M H N Y RGACCTCCTCGGTCACACCGCAAGAGGTCAATCCAGAGCAAAGTCCCTCGACAGAAAGAGATGGTCCATGTCC--936D L L G H T A R G Q S R A K S L D R K R W S M SCTCTTCGTCCTCCACTTCGGTCTCAGAGAAGCACCAAAGGACATCGCACACCACACCATCCTCTTCGGTCCA-1008L F V L H F G L R E A P K D I A H H T I L F G PAGATACAAGGAACTCGTCAACGAAATCTTCAAGGGTCCAAAACTCGCAGAGGACTTCTCCCTCTACCTCCAC-1080R Y K E L V N E I F K G P K L A E D F S L Y L HTCCCCATGCACCACCGACCCAGACATGGCACCACCAGGCATGTCCACCCACTACGTCCTCGCACCAGTCCCA-1152S P C T T D P D M A P P G M S T H Y V L A P V PCACCTCTCCAGAGCAGAAATCGACTGGGCAGTCGAAGGCCCAAGATACGCAGACAGAATCCTCGCATTCCTC-1224H L S R A E I D W A V E G P R Y A D R I L A F LGAAGAAAGACTCATCCCAAACCTCAGAGCAAACCTCACCAGAACCAGAATCTTCACCCCAGCAGACTTCGCA-1296E E R L I P N L R A N L T R T R I F T P A D F ATCCGAACTCAACGCACACCACGGCTCCGCATTCTCCGTCGAACCAATCCTCACCCAATCCGCATGGTTCAGA-1368S E L N A H H G S A F S V E P I L T Q S A W F RCCACACAACAGAGACAAGACCATCAGAAACTTCTACCTCGTCGGTGCAGGTACTCACCCAGGTGCAGGTATC-1440P H N R D K T I R N F Y L V G A G T H P G A G ICCAGGTGTCGTCGGTTCCGCAAAGGCAACCGCACAAGTCATGCTCCAACTCCTCAACTTCGACCTCCTCAAA-1512P G V V G S A K A T A Q V M L Q L L N F D L L KCTCGCAGGCGACGTCGAATCCAACCCAGGCCCAATGACCAACTTCCTCATCGTCGTCGCAACCGTCCTCGTC-1584L A G D V E S N P G P M T N F L I V V A T V L VATGGAACTCACCGCATACTCCGTCCACAGATGGATCATGCACGGTCCACTCGGCTGGGGCTGGCACAAATCC-1656M E L T A Y S V H R W I M H G P L G W G W H K SCACCACGAAGAACACGACCACGCACTCGAAAAAAACGACCTCTACGGTCTCGTCTTCGCAGTCATCGCAACC-1728H H E E H D H A L E K N D L Y G L V F A V I A TGTCCTCTTCACCGTCGGTTGGATCTGGGCACCAGTCCTCTGGTGGATCGCACTCGGTATGACCGTCTACGGT-1800V L F T V G W I W A P V L W W I A L G M T V Y GCTCATCTACTTCGTCCTCCACGACGGTGTCGTCCACCAAAGATGGCCATTCAGATACATCCCAAGAAAGGGC-1872
L I Y F V L H D G V V H Q R W P F R Y I P R K G
TACGCAAGAAGACTCTACCAAGCACACAGACTCCACCACGCAGTCGAAGGCAGAGACCACTGCGTCTCCTTC-1944
Y A R R L Y Q A H R L H H A V E G R D H C V S F
GGCTTCATCTACGCACCACCAGTCGATAAACTCAAAGAAGACCTCAAGACCTCCGGCGTCCTCAGAGCAGAA-2016
G F I Y A P P V D K L K E D L K T S G V L R A E
GCAGAAGAAAGAACCTAA-2034
A E E R T
根据植物偏爱密码重新设计副球菌中八氢番茄红素合成酶基因(crtB)和垅牛儿基垅儿基焦磷酸合成酶基因(crtE)的核苷酸序列,并组成联合基因crtBcrtE。
crtBcrtE基因的合成采用重叠延伸PCR方法,结合高保真的耐高温聚合酶进行PCR扩增。基因在大肠杆菌中克隆并测定核苷酸序列,从起始密码ATG到终止密码TAA长度为1848bp核苷酸。在基因的912~972位置处插入上一段自动切割序列:CAACTCCTCAACTTCGACCTCCTCAAACTCGCAGGCGACGTCGAATCCAACCCAGGCCCA。
全合成的crtBcrtE基因的核苷酸和氨基酸序列如下:
ATGTCCGACCTCGTCCTCACCTCCACCGAGGCCATCACCCAGGGCTCCCAATCCTTCGCCACCGCAGCCAAA-- 72
M S D L V L T S T E A I T Q G S Q S F A T A A K
CTCATGCCACCAGGCATCAGAGACGACACCGTCATGCTCTACGCCTGGTGCAGACACGCAGACGACGTCATC--144
L M P P G I R D D T V M L Y A W C R H A D D V I
GACGGTCAGGCACTCGGCTCCAGACCAGAGGCAGTCAACGACCCACAGGCCAGACTCGACGGTCTCAGAGCC--216
D G Q A L G S R P E A V N D P Q A R L D G L R A
GACACCCTCGCAGCACTCCAGGGTGACGGTCCAGTCACTCCACCATTCGCAGCACTCAGAGCAGTCGCAAGA--288
D T L A A L Q G D G P V T P P F A A L R A V A R
AGACACGACTTCCCACAGGCATGGCCAATGGACCTCATCGAGGGCTTCGCAATCGACGTTGAGGCAAGAGAC--360
R H D F P Q A W P M D L I E G F A I D V E A R D
TACAGAACCCTCGACGACGTCCTCGAATACTCCTACCACGTCGCAGGCATCCTCGGTGTCATGATGGCCAGA--432
Y R T L D D V L E Y S Y H V A G I L G V M M A R
GTCATGGGTGTCAGAGACCACCCAGTCCTCGACAGAGCCTGCGACCTCGGTCTCGCCTTCCAGCTCACCCAC--504
V M G V R D H P V L D R A C D L G L A F Q L T H
ATCGCAAGAGACGTCATCGACTACGCAAGAATCGGCAGATGCTACCTCCCAGGCGACTGGCTCGACCACGCA--576
I A R D V I D Y A R I G R C Y L P G D W L D H A
GGCGCAAGAGTCGATGGTCCAGTCCCATCCCCAGAACTCTACACCGTCATCCTCAGACTCCTCGACGCAGCA--648
G A R V D G P V P S P E L Y T V I L R L L D A A
GAGCCATACTACCCATCCGCAAGAGTCGGTCTCGCAGACCTCCCACCAAGATGCGCATGGTCCATCCCAGCA--720
E P Y Y P S A R V G L A D L P P R C A W S I P A
GCATTCAGAATCTACAGAGCAATCGGTCTCCCAATCAGAAAGGGTGGTCCAGAGGCATACAGACAAAGAATC--792
A F R I Y R A I G L P I R K G G P E A Y R Q R I
TCCACCTCCAAGGCAGCAAAGATCGGTCTCCTCGGCATCGGTGGTTGGGACGTCGCAGACCACGCTTGCAGA--864
S T S K A A K I G L L G I G G W D V A D H A C R
GGCTCCGGTGTCTCCAGACAAGACCTCTGGACCAGACCACACCACGCACAACTCCTCAACTTCGACCTCCTC--936
G S G V S R Q D L W T R P H H A Q L L N F D L L
AAACTCGCAGGCGACGTCGAATCCAACCCAGGCCCAATGAGAAGAGACGTCAACCCAATCCACGCAACCCTC--1008
K L A G D V E S N P G P M R R D V N P I H A T L
CTCCAAACCAGAATCGAAGAAATCGCACAAGGCTTCGGTGCAGTCCTCCAACCACTCGGTGCAGCAATGGCA--1080
L Q T R I E E I A Q G F G A V L Q P L G A A M A
GCACTCTCCTCCGGTAAGAGATTCAGAGGTATGCTCATGCTCCTCGCAGCAGAAGCATCCGGTGGTGTCTGC--1152
A L S S G K R F R G M L M L L A A E A S G G V C
GACACCATCGTCGATGCAGCCTGCGCAGTCGAAATGGTCCACGCAGCATCCCTCATCTTCGACGACCTCCCA--1224
D T I V D A A C A V E M V H A A S L I F D D L P
TGTATGGACGACGCAGGTCTCAGAAGAGGTCAACCAGCAACCCACGTCGCACACGGTGAATCCAGAGCAGTC--1296
C M D D A G L R R G Q P A T H V A H G E S R A V
CTCGGTGGCATCGCACTCATCACCGAAGCAATGGCACTCCTCGCAGGTGCAAGAGGTGCATCCGGTACTGTC--1368
L G G I A L I T E A M A L L A G A R G A S G T V
AGAGCACAACTCGTCAGAATCCTCTCCAGATCCCTCGGTCCACAAGGTCTCTGCGCAGGTCAAGACCTCGAC--1440
R A Q L V R I L S R S L G P Q G L C A G Q D L D
CTCCACGCAGCAAAGAACGGTGCAGGTGTCGAACAAGAACAAGACCTCAAAACCGGTGTCCTCTTCATCGCA--1512
L H A A K N G A G V E Q E Q D L K T G V L F I A
GGTCTCGAAATGCTCGCAGTCATCAAAGAGTTCGACGCAGAAGAACAAACCCAAATGATCGACTTCGGTAGA--1584
G L E M L A V I K E F D A E E Q T Q M I D F G R
CAACTCGGTAGAGTCTTCCAATCCTACGACGACCTCCTCGAAGTCGTCGGTGATCAAGCAGCACTCGGTAAA--1656
Q L G R V F Q S Y D D L L E V V G D Q A A L G K
GACACCGGTAGAGACGCAGCAGCACCAGGTCCAAGAAGAGGTCTCCTCGCAGTCTCCGACCTCCAAAAGGTC--1728
D T G R D A A A P G P R R G L L A V S D L Q K V
TCCAGACAATACGAAGCATCCAGAGCACAACTCGAAGGTATGGTCGGTTCCAAGAGACTCCAAGCACCAGAA--1800
S R Q Y E A S R A Q L E G M V G S K R L Q A P E
ATCGAAGCACTCCTCGAAAGAGTCCTCCCATACGCAGCAAGAGCATAA--1848
I E A L L E R V L P Y A A R A
本发明利用先进的基因合成方法,将合成虾青素必须的6个基因,通过体外扩增的方法进行了合成和克隆。合成的基因具有以下优点:
(1)以副球菌中虾青素合成的6个基因crtW,crtZ,crtY,crtI,crtB和crtE为基因背景,全部采用植物偏爱密码,将核苷酸进行改造,同时注意将基因内部常规的核苷酸限制性内切酶位点消除。
(2)将6个基因两两组合成一个联合基因,即crtWcrtY,crtIcrtZ,crtBcrtE,在基因与基因的连接处加上一段自动切割序列:CAACTCCTCAACTTCGACCTCCTCAAACTCGCAGGCGACGTCGAATCCAACCCAGGCCCA。联合基因在植物中表达时,一分为二,产生两个具有完整功能的蛋白质。联合基因的合成减少了表达元件的构建步骤,使多基因的植物转化变得简便易行。
(3)合成的6个基因具有很强的功能,在缺少这些基因的大肠杆菌中能产生虾青素,菌落表现红色。
附图说明
图1.crtWcrtY基因片段1(从5’ATG起始到1008位点)的引物设计
图2.crtWcrtY基因片段2(从1008位点到3’TAA终止1997)引物设计。
图3.crtIcrtZ基因片段1(从5’ATG起始到1080位点)的引物设计。
图4.crtIcrtZ基因片段2(从1080位点到3’TAA终止2034)的引物设计。
图5.crtBcrtE基因片段1(从5’ATG起始到936位点)的引物设计。
图6.crtBcrtE基因片段2(从936位点到3’TAA终止1848)的引物设计。
图7.crtWcrtY基因的合成过程。先合成1008bp(1)和990bp(3)条带,通过PCR将两片段连接成1997bp(2)。
图8.crtIcrtZ基因的合成过程。先合成1080bp(1)和954bp(4)条带,通过PCR将两片段连接成2034bp(3)。
图9.crtBcrtE基因的合成过程。先合成936bp(3)和912bp(4)条带,通过PCR将两片段连接成1848bp(1)。
图10.虾青素合成的6个基因crtIcrtZ,crtBcrtE,crtWcrtY在大肠杆菌中表达,红色菌落为已经转化这些基因的大肠杆菌。
实施例1 crtWcrtY基因的化学合成
按照图1和图2所示设计寡核苷酸合成引物,引物长度为60-90bp,两引物间重叠序列为20-30bp,Tm值为64-80℃。寡核苷酸引物合成已商业化,由上海生物工程分公司合成。
利用高保真的耐高温DNA聚合酶eXTaq(日本TAKANA公司)合成基因,将所有引物加入后进行PCR扩增,中间引物用量为5-10ng,两边引物用量为100-200ng,PCR扩增条件为94℃,30s;60-72℃,30s;72℃,1-2min。共进行25-35个循环。
crtWcrtY基因分两段合成:
第一段从基因起始密码ATG开始到1008位,共设计16个引物。引物的核苷酸顺序为:
HCE1:
GGT,CTC,CTC,CTC,CCA,GTC,ATC,GTC,ACC,GTC,TAC,GCA,CTC,ATC,CTC,
GGT,GAC,AGA,TGG,ATG,TAC,GTC,GTC,TTC,TGG,CCA,CTC,CCA,TCC,ATC
HCE3:
ACT,TCG,ACC,ACG,GTG,GTC,CAG,TCA,GAT,GGT,ACG,CAA,GAT,TCA,TCG,
GTA,CTT,ACT,TCG,GTT,GGA,GAG,AAG,GTC,TCC,TCC,TCC,CAG,TCA,TCG
HCE5:
TCT,CCT,GGA,GAA,AGA,TGA,TCG,TCA,AGC,ACA,TGG,CAC,ACC,ACA,GAC,
ACG,CAG,GTA,CTG,ACG,ACG,ACC,CAG,ACT,TCG,ACC,ACG,GTG,GTC,CAG
HCE7:
GTC,GTC,CCA,GGT,AGA,CCA,AGA,GCA,AAC,GCA,GCA,ATG,GGT,CAA,CTC,
GTC,CTC,TGG,CTC,TAC,GCA,GGT,TTC,TCC,TGG,AGA,AAG,ATG,ATC,GTC
HCE9:
ACT,TCC,TCG,GTC,TCA,CCT,GGC,TCT,CCG,TCG,GTC,TCT,TCA,TCA,TCG,
CAC,ACG,ACG,CAA,TGC,ACG,GTT,CCG,TCG,TCC,CAG,GTA,GAC,CAA,GAG
HCE11:
GTC,CAC,GCA,CTC,TGG,TTC,CTC,GAC,GCA,GCA,GCA,CAC,CCA,ATC,CTC,
GCA,GTC,GCA,AAC,TTC,CTC,GGT,CTC,ACC,TGG,CTC
HCE13:
ACC,GCA,ACC,TCC,CTC,ATC,GTC,TCC,GGT,GGT,ATC,ATC,GCA GCA,TGG,
CTC,GCA,CTC,CAC,GTC,CAC,GCA,CTC,TGG,TTC,CTC
HCE15:
AGG,ATC,CAA,CAA,TGT,CCG,CAC,ACG,CAC,TCC,CAA,AAG,CAG,ACC,TCA,
CCG,CAA,CCT,CCC,TCA,TCG,TC
HCE2:
GGG,AAT,GCG,TCG,TGA,CCT,GGT,CTG,TGT,GGG,AGC,CAG,GTG,CCG,AAG,
ACG,AAG,AGT,TGG,ATG,GAT,GCG,AGG,ATG,GTA,GGG,AGT,GGC,CAG,AAG
HCE4:
CGA,AGT,GGA,AGC,AGG,TGA,GGA,GGG,AGA,CTG,GGT,CGG,AGA,TTC,TGG,
AGG,ATC,TTG,CGT,TGT,GTC,TGT,CTG,GGA,ATG,CGT,CGT,GAC,CTG,GTC
HCE6:
GGT,TCT,GGT,GGA,TGG,GAG,TCT,CCA,CCA,AGG,GAC,GGT,TGG,GTG,GAG,
GTG,GTG,TTC,GTG,GTG,GTA,GCC,ACC,GAA,GTG,GAA,GCA,GGT,GAG,GAG
HCE8:
AT,TCG,ACG,TCG,CCT,GCG,AGT,TTG,AGG,AGG,TCG,AAG,TTG,AGG,AGT,
TGT,GCG,GTG,TCG,CCT,TTG,GTT,CTG,GTG,GAT,GGG,AGT,CTC
HCE10:
GCG,ATG,AGA,CCG,TTT,GCG,AGA,CCT,GCA,CCT,GCG,AGG,AGG,ACG,TCG,
TGG,GTC,ATT,GGG,CCT,GGG,TTG,GAT,TCG,ACG,TCG,CCT,GCG,AGT,TTG
HCE12:
CGG,ATG,GAC,CTG,CTG,CGT,GGT,CGA,GGA,GGA,GGA,CTC,TGA,GGT,CTG,
GTC,TTG,CTG,CTC,TGA,GTG,CGA,GTG,CGA,TGA,GAC,CGT,TTG,CGA,GAC
HCE14:
GAG,TGG,CTT,GAG,TCT,TGC,GAG,CCA,GTG,TGG,GGA,GAG,GTC,TGG,GTC,
GTG,GCA,GGA,CCA,GGT,GTG,ACC,TTC,GGA,TGG,ACC,TGC,TGC,GTG,GTC
HCE16:
GTT,GCG,AGT,CTT,CTT,GCG,TGT,CTT,GGG,AAT,CTG,ACT,TCT,TGG,TCT,
GGC,CAG,TTT,GCT,CTT,CTG,AGT,GGC,TTG,AGT,CTT,GCG,AGC
第二段从基因1008位ATG开始到终止密码TAA,共设计14个引物。引物的核苷酸顺序为:
HCF1:
CGA,CCT,CGA,CGA,CGA,CGC,ACT,CGC,AGC,AGC,ATC,CCA,AGA,CTA,CGC,
AAG,ACA,ACA,AGG,CTG,GAC,CGG,TGC,AGA,AGT,CAG,AAG,AGA,AAG,AGG
HCF3:
TTC,ATC,TAC,CTC,CTC,CCA,TTC,TCC,AGA,ACC,AGA,ATC,CTC,ATC,GAA,
GAC,ACC,AGA,TAC,TCC,GAC,GGC,GGC,GAC,CTC,GAC,GAC,GAC,GCA,CTC
HCF5:
AGA,CCA,CAC,GGT,GTC,CCA,AGA,CCA,GTC,ATC,ATG,GAC,GGC,ACC,GTC,
ACC,CAA,AGA,GAC,GGC,TAC,GGC,TTC,ATC,TAC,CTC,CTC,CCA,TTC,TCC
HCF7:
GCC,CAC,ACC,CAT,CCA,GAC,ACC,TCA,CCC,TCG,GCT,TCC,ACA,AGT,TCC,
TCG,GTG,TCG,AAA,TCG,AAA,CCG,ACA,GAC,CAC,ACG,GTG,TCC,CAA,GAC
HCF9:
ACG,CAC,AAG,GTG,CAA,CCC,TCT,CCT,GCG,GTA,CTA,GAA,TCG,AAG,CAG,
GCT,CCG,TCC,TCG,ACG,GCA,GAG,GCC,CAC,ACC,CAT,CCA,GAC,ACC
HCF11:
AGC,ACT,CGC,AGA,CGC,AGT,CGT,CAG,ATC,CGG,TGC,AGA,AAT,CAG,ATG,
GGA,CTC,CGA,CAT,CGC,ACT,CCT,CGA,CGC,ACA,AGG,TGC,AAC,CCT,CTC
HCF13:
CAA,GAC,ACG,CAA,GAA,GAC,TCG,CAA,CCG,GCT,ACG,GCT,CCC,TCG,ACG,
GTG,CAG,CAC,TCG,CAG,ACG,CAG,TCG,TC
HCF2:
GAC,TGG,ACC,TTC,TGC,GTG,GTC,TGC,CCA,GAA,ACC,TGC,TGC,GTC,GTG,
TGC,GAG,TGC,GAT,TGG,GAG,GAT,GCC,TCT,TTC,TCT,TCT,GAC,TTC,TGC
HCF4:
GAC,TTG,TGC,TGC,GTA,TGG,GAG,GGA,GTA,GCC,GGT,GAC,TGG,GTG,GAA,
GAA,GCC,TGC,TCT,GAG,ACC,GAC,TGG,GAC,TGG,ACC,TTC,TGC,GTG,GTC
HCF6:
TAG,TCT,CTG,ATT,GCA,CCT,CTG,AGT,GCG,TCG,GTG,CCT,GGT,GGA,CCG,
GAG,AGA,CCT,GCG,ACG,ACG,TCT,GCG,ACT,TGT,GCT,GCG,TAT,GGG,AGG
HCF8:
CA,GCC,TCT,GAA,GAG,CAT,TCT,GTT,GAG,GAG,TCT,GAG,GAA,TCT,GTC,
TCT,TCT,TGC,TCT,GTC,GAT,TGC,GTA,GTC,TCT,GAT,TGC,ACC,TCT,GAG
HCF10:
T,TCG,ATG,AGA,CCT,TGT,GGC,ATT,CTG,TAG,AGT,CTT,TGG,AGG,AGG,GTG,TAT,CTT,CTG,TCT,GGT,GCG,CAG,CCT,CTG,AAG,AGC,ATT,CTG,TTG
HCF12:
GGA,TTG,GTG,GCT,TGC,CGG,TGA,CGA,TTC,TGA,GTT,GGT,CTG,CGA,CGG,
AGA,GTC,TAC,CTG,CGT,AGA,ATC,TTT,CGA,TGA,GAC,CGT,GTG,GCA,TTC
HCF14:
TTG,AGC,TCT,TAT,GCG,TTT,TCC,TTG,AGG,AGT,GGT,CTT,TCT,GGG,AGG,
CAT,CTG,ATT,GCG,GTG,CCG,AGT,GGG,ATT,GGT,GGC,TTG,CCG,GTG,ACG
基因两段合成后,将PCR产物混合,进行新一轮PCR扩增,将两片段合并成一个联合基因。PCR扩增条件为94℃,30s;62℃,30s;72℃,2min 30s。共进行25-35个循环。合成的联合基因crtWcrtY总长度为1997bP。
实施例2 crtIcrtZ基因的化学合成
按照图3和图4所示设计寡核苷酸合成引物,引物长度为60-90bp,两引物间重叠序列为20-30bp,Tm值为64-80℃。
利用高保真的耐高温DNA聚合酶eXTaq(日本TAKANA公司)合成基因,将所有引物加入后进行PCR扩增,中间引物用量为5-10ng,两边引物用量为100-200ng,PCR扩增条件为94℃,30s;60-72℃,30s;72℃,1-2min。共进行25-35个循环。
crtIcrtZ基因分两段合成:
第一段从基因起始密码ATG开始到1080位,共设计16个引物。引物的核苷酸顺序为:
HCC1:
TTC,CTC,AAG,CTC,GGT,CAA,ATG,CTC,AAG,GCA,GCA,CCA,GCA,CTC,ATG,
AAA,CTC,GAA,GCA,TAC,AAC,TCC,GTC,CAC,GCA,AAG,GTC,GCA,ACC,TTC
HCC3:
AGA,AGA,TTC,AGA,GAC,TAC,GCA,GAG,GAG,GTC,TAC,CAG,GAG,GGC,TAC,
GTC,AAA,CTC,GGC,ACC,GTC,CCA,TTC,CTC,AAG,CTC,GGT,CAA,ATG,CTC
HCC5:
GTC,AAC,GAG,GCA,GAC,CAA,CTC,GAA,AGA,CAA,ATC,GCA,CAA,TTC,AAC,
CCA,GAC,GAC,CTC,GAA,GGT,TAC,AGA,AGA,TTC,AGA,GAC,TAC,GCA,GAG
HCC7:
ACG,TCA,CCC,TCA,TGC,CAG,TCT,CCC,CAT,TCT,ACA,GAC,TCA,TGT,GGC,
CAG,GTG,GCA,AGG,TCT,TCG,ACT,ACG,TCA,ACG,AGG,CAG,ACC,AAC,TCG
HCC9:
AAC,CGT,CAT,CAC,CGA,CCC,AGA,CGC,ACT,CAA,GGA,ACT,CTG,GGC,ACT,
CAC,CGG,TCA,AGA,CAT,GGC,AAG,AGA,CGT,CAC,CCT,CAT,GCC,AGT,CTC
HCC11:
GCA,AGA,GAC,AAG,CCA,GGC,GGT,AGA,GCA,TAC,GTC,TGG,CAC,GAC,CAA,
GGC,CAC,GTC,TTC,GAC,GCA,GGT,CCA,ACC,GTC,ATC,ACC,GAC,CCA,GAC
HCC13:
AGG,TTT,CGG,TGG,TCT,CGC,ACT,CGC,AAT,CAG,ACT,CCA,ATC,CGC,AGG,
CAT,CGC,AAC,CAC,CCT,CGT,CGA,GGC,AAG,AGA,CAA,GCC,AGG,CGG,TAG
HCC15:
AGG,ATC,CAT,GGA,CGC,ACA,CTC,CCC,AGC,AGC,AAA,GAC,CGC,AAT,CGT,
CAT,CGG,TGC,AGG,TTT,CGG,TGG,TCT,CGC,ACT,C
HCC2:
GAG,AAT,GGA,TTA,CCA,CCG,ACG,AGG,AGG,GTG,TGG,TAG,GAG,AAT,GCC,
TGT,CTG,AGG,TAT,GGG,TCC,TTG,ATG,AAG,GTT,GCG,ACC,TTT,GCG,TGG
HCC4:
ACC,CTT,TGC,GAA,CCA,GAC,ACC,ACC,TCT,TCT,TTC,GAG,TGC,GTG,GAT,
GAG,TGC,GTA,GAT,GGA,GGA,GGT,GGA,GAA,TGG,ATT,ACC,ACC,GAC,GAG
HCC6:
TGA,GCA,TCA,TTT,GAC,CAC,CTG,GTC,TCT,CGA,AGA,GTG,CGA,CCA,TAC,
CTG,CGA,CGA,GCT,GGT,TGG,TGC,CAC,CCT,TTG,CGA,ACC,AGA,CAC,CAC
HCC8:
TAC,CGT,CTG,CGA,GGG,TGA,CAC,CGG,TGG,TTC,TTG,CAC,CCT,CGG,TTT,
CGA,TTC,TTG,CGA,CCT,TTG,CGT,TGA,GCA,TCA,TTT,GAC,CAC,CTG,GTC
HCC10:
ACC,GAG,GAG,GTC,TCT,GTA,GTT,GTG,CAT,GAC,GTC,ACC,GTT,GGA,TGC,
GAC,CAT,GTC,TGC,TCT,GAG,GGA,TCT,ACC,GTC,TGC,GAG,GGT,GAC,ACC
HCC12:
ACG,AAG,AGG,GAC,ATG,GAC,CAT,CTC,TTT,CTG,TCG,AGG,GAC,TTT,GCT,
CTG,GAT,TGA,CCT,CTT,GCG,GTG,TGA,CCG,AGG,AGG,TCT,CTG,TAG,TTG
HCC14:
ATC,TTG,GAC,CGA,AGA,GGA,TGG,TGT,GGT,GTG,CGA,TGT,CCT,TTG,GTG,
CTT,CTC,TGA,GAC,CGA,AGT,GGA,GGA,CGA,AGA,GGG,ACA,TGG,ACC,ATC
HCC16:
GG,AGG,TAG,AGG,GAG,AAG,TCC,TCT,GCG,AGT,TTT,GGA,CCC,TTG,AAG,ATT,TCG,TTG,ACG,AGT,TCC,TTG,TAT,CTT,GGA,CCG,AAG,AGG,ATG,GTG
第二段从基因1080位到TAA终止密码,共设计16个引物。引物的核苷酸顺序为:
HCD1:
GCA,ACC,GCA,CAA,GTC,ATG,CTC,CAA,CTC,CTC,AAC,TTC,GAC,CTC,CTC,
AAA,CTC,GCA,GGC,GAC,GTC,GAA,TCC,AAC,CCA,GGC,CCA,ATG,ACC,AAC
HCD3:
ACT,TCT,ACC,TCG,TCG,GTG,CAG,GTA,CTC,ACC,CAG,GTG,CAG,GTA,TCC,
CAG,GTG,TCG,TCG,GTT,CCG,CAA,AGG,CAA,CCG,CAC,AAG,TCA,TGC,TCC,
HCD5:
CTC,CGT,CGA,ACC,AAT,CCT,CAC,CCA,ATC,CGC,ATG,GTT,CAG,ACC,ACA,
CAA,CAG,AGA,CAA,GAC,CAT,CAG,AAA,CTT,CTA,CCT,CGT,CGG,TGC,AGG
HCD7:
AGA,ACC,AGA,ATC,TTC,ACC,CCA,GCA,GAC,TTC,GCA,TCC,GAA,CTC,AAC,
GCA,CAC,CAC,GGC,TCC,GCA,TTC,TCC,GTC,GAA,CCA,ATC,CTC,ACC
HCD9:
TAC,GCA,GAC,AGA,ATC,CTC,GCA,TTC,CTC,GAA,GAA,AGA,CTC,ATC,CCA,
AAC,CTC,AGA,GCA,AAC,CTC,ACC,AGA,ACC,AGA,ATC,TTC,ACC,CCA,GCA
HCD11:
GCA,CCA,GTC,CCA,CAC,CTC,TCC,AGA,GCA,GAA,ATC,GAC,TGG,GCA,GTC,
GAA,GGC,CCA,AGA,TAC,GCA,GAC,AGA,ATC,CTC,GCA,TTC
HCD13:
ATG,CAC,CAC,CGA,CCC,AGA,CAT,GGC,ACC,ACC,AGG,CAT,GTC,CAC,CCA,
CTA,CGT,CCT,CGC,ACC,AGT,CCC,ACA,CCT,CTC,C
HCD15:53bp
CAG,AGG,ACT,TCT,CCC,TCT,ACC,TCC,ACT,CCC,CAT,GCA,CCA,CCG,ACC,
CAG,ACA,TG
HCD2:
ATG,ATC,CAT,CTG,TGG,ACG,GAG,TAT,GCG,GTG,AGT,TCC,ATG,ACG,AGG,
ACG,GTT,GCG,ACG,ACG,ATG,AGG,AAG,TTG,GTC,ATT,GGG,CCT,GGG,TTG
HCD4:
TTT,TTC,GAG,TGC,GTG,GTC,GTG,TTC,TTC,GTG,GTG,GGA,TTT,GTG,CCA,
GCC,CCA,GCC,GAG,TGG,ACC,GTG,CAT,GAT,CCA,TCT,GTG,GAC,GGA,GTA
HCD6:
CCA,GAT,CCA,ACC,GAC,GGT,GAA,GAG,GAC,GGT,TGC,GAT,GAC,TGC,GAA,
GAC,GAG,ACC,GTA,GAG,GTC,GTT,TTT,TTC,GAG,TGC,GTG,GTC,GTG,TTC
HCD8:
TCG,TGG,AGG,ACG,AAG,TAG,ATG,AGA,CCG,TAG,ACG,GTC,ATA,CCG,AGT,
GCG,ATC,CAC,CAG,AGG,ACT,GGT,GCC,CAG,ATC,CAA,CCG,ACG,GTG,AAG
HCD10:
GAG,TCT,TCT,TGC,GTA,GCC,CTT,TCT,TGG,GAT,GTA,TCT,GAA,TGG,CCA,
TCT,TTG,GTG,GAC,GAC,ACC,GTC,GTG,GAG,GAC,GAA,GTA,GAT,GAG
HCD12:
AGA,TGA,AGC,CGA,AGG,AGA,CGC,AGT,GGT,CTC,TGC,CTT,CGA,CTG,CGT,
GGT,GGA,GTC,TGT,GTG,CTT,GGT,AGA,GTC,TTC,TTG,CGT,AGC,CCT,TTC
HCD14:
G,ACG,CCG,GAG, GTC,TTG,AGG,TCT,TCT,TTG,AGT,TTA,TCG,ACT,GGT,GG
T,GCG,TAG,ATG, AAG,CCG,AAG,GAG,ACG,CAG
HCD16:
G,TTG,GTG,ACC,TTA,GGT,TCT,TTC,TTC,TGC,TTC,TGC,TCT,GAG,GAC,GCC,GGA,GGT,CTT,GAG,GTC
基因两段合成后,将PCR产物混合,进行新一轮PCR扩增,将两片段合并成一个联合基因。PCR扩增条件为94℃,30s;62℃,30s;72℃,2min 30s。共进行25-35个循环。合成的联合基因crtIcrtE总长度为2034bP。
实施例3 crtBcrtE基因的化学合成
按照图5和图6所示设计寡核苷酸合成引物,引物长度为60-90bp,两引物间重叠序列为20-30bp,Tm值为64-80℃。
利用高保真的耐高温DNA聚合酶eXTaq(日本TAKANA公司)合成基因,将所有引物加入后进行PCR扩增,中间引物用量为5-10ng,两边引物用量为100-200ng,PCR扩增条件为94℃,30s;60-72℃,30s;72℃,1-2min。共进行25-35个循环。
crtBcrtE基因分两段合成:
第一段从基因起始密码ATG开始到936位,共设计14个引物。引物的核苷酸顺序为:
HCA1:
TCC,TAC,CAC,GTC,GCA,GGC,ATC,CTC,GGT,GTC,ATG,ATG,GCC,AGA,GTC,
ATG,GGT,GTC,AGA,GAC,CAC,CCA,GTC,CTC,GAC,AGA,GCC,TGC,GAC,CTC
HCA3:
CTC,ATC,GAG,GGC,TTC,GCA,ATC,GAC,GTT,GAG,GCA,AGA,GAC,TAC,AGA,
ACC,CTC,GAC,GAC,GTC,CTC,GAA,TAC,TCC,TAC,CAC,GTC,GCA,GGC,ATC
HCA5:
CTC,CAC,CAT,TCG,CAG,CAC,TCA,GAG,CAG,TCG,CAA,GAA,GAC,ACG,ACT,
TCC,CAC,AGG,CAT,GGC,CAA,TGG,ACC,TCA,TCG,AGG,GCT,TCG,CAA,TCG
HCA7:
ACA,GGC,CAG,ACT,CGA,CGG,TCT,CAG,AGC,CGA,CAC,CCT,CGC,AGC,ACT,
CCA,GGG,TGA,CGG,TCC,AGT,CAC,TCC,ACC,ATT,CGC,AGC,ACT,CAG
HCA9:
TGC,AGA,CAC,GCA,GAC,GAC,GTC,ATC,GAC,GGT,CAG,GCA,CTC,GGC,TCC,
AGA,CCA,GAG,GCA,GTC,AAC,GAC,CCA,CAG,GCC,AGA,CTC,GAC,GGT,CTC
HCA11:
CCT,TCG,CCA,CCG,CAG,CCA,AAC,TCA,TGC,CAC,CAG,GCA,TCA,GAG,ACG,
ACA,CCG,TCA,TGC,TCT,ACG,CCT,GGT,GCA,GAC,ACG,CAG,ACG,ACG,TCA
HCA13:
AGG,ATC,CAA,CAA,TGT,CCG,ACC,TCG,TCC,TCA,CCT,CCA,CCG,AGG,CCA,
TCA,CCC,AGG,GCT,CCC,AAT,CCT,TCG,CCA,CCG,CAG,CCA,AAC
HCA2:
GTA,GCA,TCT,GCC,GAT,TCT,TGC,GTA,GTC,GAT,GAC,GTC,TCT,TGC,GAT,
GTG,GGT,GAG,CTG,GAA,GGC,GAG,ACC,GAG,GTC,GCA,GGC,TCT,GTC,GAG
HCA4:90bp
TAG,AGT,TCT,GGG,GAT,GGG,ACT,GGA,CCA,TCG,ACT,CTT,GCG,CCT,GCG,
TGG,TCG,AGC,CAG,TCG,CCT,GGG,AGG,TAG,CAT,CTG,CCG,ATT,CTT,GCG
HCA6:
GCG,AGA,CCG,ACT,CTT,GCG,GAT,GGG,TAG,TAT,GGC,TCT,GCT,GCG,TCG,
AGG,AGT,CTG,AGG,ATG,ACG,GTG,TAG,AGT,TCT,GGG,GAT,GGA,CTG,G
HCA8:
GGA,GAC,CGA,TTG,CTC,TGT,AGA,TTC,TGA,ATG,CTG,CTG,GGA,TGG,ACC,
ATG,CGC,ATC,TTG,GTG,GGA,GGT,CTG,CGA,GAC,CGA,CTC,TTG,CGG,ATG
HCA10:
CGA,TCT,TTG,CTG,CCT,TGG,AGG,TGG,AGA,TTC,TTT,GTC,TGT,ATG,CCT,
CTG,GAC,CAC,CCT,TTC,TGA,TTG,GGA,GAC,CGA,TTG,CTC,TGT,AGA,TTC
HCA12:
TGT,CTG,GAG,ACA,CCG,GAG,CCT,CTG,CAA,GCG,TGG,TCT,GCG,ACG,TCC,
CAA,CCA,CCG,ATG,CCG,AGG,AGA,CCG,ATC,TTT,GCT,GCC,TTG,GAG,GTG
HCA14:
GAG,GAG,GTC,GAA,GTT,GAG,GAG,TTG,TGC,GTG,GTG,TGG,TCT,GGT,CCA,
GAG,GTC,TTG,TCT,GGA,GAC,ACC,GGA,GCC,TC
第二段从基因936位到TAA终止密码,共设计14个引物。引物的核苷酸顺序为:
HCB1:
CGC,ACT,CAT,CAC,CGA,AGC,AAT,GGC,ACT,CCT,CGC,AGG,TGC,AAG,AGG,
TGC,ATC,CGG,TAC,TGT,CAG,AGC,ACA,ACT,CGT,CAG,AAT,CCT,CTC,CAG
HCB3:
GTC,TCA,GAA,GAG,GTC,AAC,CAG,CAA,CCC,ACG,TCG,CAC,ACG,GTG,AAT,
CCA,GAG,CAG,TCC,TCG,GTG,GCA,TCG,CAC,TCA,TCA,CCG,AAG,CAA,TGG
HCB5:
CGC,AGT,CGA,AAT,GGT,CCA,CGC,AGC,ATC,CCT,CAT,CTT,CGA,CGA,CCT,
CCC,ATG,TAT,GGA,CGA,CGC,AGG,TCT,CAG,AAG,AGG,TCA,ACC,AGC,AAC
HCB7:
GTA,TGC,TCA,TGC,TCC,TCG,CAG,CAG,AAG,CAT,CCG,GTG,GTG,TCT,GCG,
ACA,CCA,TCG,TCG,ATG,CAG,CCT,GCG,,CAG,TCG,AAA,TGG,TCC,ACG,CAG
HCB9:
CTT,CGG,TGC,AGT,CCT,CCA,ACC,ACT,CGG,TGC,AGC,AAT,GGC,AGC,ACT,
CTC,CTC,CGG,TAA,GAG,ATT,CAG,AGG,TAT,GCT,CAT,GCT,CCT,CGC,AGC
HCB11:
ATG,AGA,AGA,GAC,GTC,AAC,CCA,ATC,CAC,GCA,ACC,CTC,CTC,CAA,ACC,
AGA,ATC,GAA,GAA,ATC,GCA,CAA,GGC,TTC,GGT,GCA,GTC,CTC,CAA,CCA
HCB13:
CAC,AAC,TCC,TCA,ACT,TCG,ACC,TCC,TCA,AAC,TCG,CAG,GCG,ACG,TCG,
AAT,CCA,ACC,CAG,GCC,CAA,TGA,GAA,GAG,ACG,TCA,ACC,CAA,TC
HCB2:
TGC,ACC,GTT,CTT,TGC,TGC,GTG,GAG,GTC,GAG,GTC,TTG,ACC,TGC,GCA,
GAG,ACC,TTG,TGG,ACC,GAG,GGA,TCT,GGA,GAG,GAT,TCT,GAC,GAG,TTG
HCB4:
ACT,GCG,AGC,ATT,TCG,AGA,CCT,GCG,ATG,AAG,AGG,ACA,CCG,GTT,TTG,
AGG,TCT,TGT,TCT,TGT,TCG,ACA,CCT,GCA,CCG,TTC,TTT,GCT,GCG,TGG
HCB6:
A,CTC,TAC,CGA,GTT,GTC,TAC,CGA,AGT,CGA,TCA,TTT,GGG,TTT,GTT,C
TT,CTG,CGT,CGA,ACT,CTT,TGA,TGA,CTG,CGA,GCA,TTT,CGA,GAC,CTG
HCB8:
CCG,GTG,TCT,TTA,CCG,AGT,GCT,GCT,TGA,TCA,CCG,ACG,ACT,TCG,AGG,
AGG,TCG,TCG,TAG,GAT,TGG,AAG,ACT,CTA,CCG,AGT,TGT,CTA,CCG,AAG
HCB10:
GAC,CTT,TTG,GAG,GTC,GGA,GAC,TGC,GAG,GAG,ACC,TCT,TCT,TGG,ACC,
TGG,TGC,TGC,TGC,GTC,TCT,ACC,GGT,GTC,TTT,ACC,GAG,TGC,TGC,TTG
HCB12:
GTG,CTT,GGA,GTC,TCT,TGG,AAC,CGA,CCA,TAC,CTT,CGA,GTT,GTG,CTC,
TGG,ATG,CTT,CGT,ATT,GTC,TGG,AGA,CCT,TTT,GGA,GGT,CGG,AGA,CTG
HCB14:
TT,GAG,CTC,TTA,TGC,TCT,TGC,TGC,GTA,TGG,GAG,GAC,TCT,TTC,GAG,
GAG,TGC,TTC,GAT,TTC,TGG,TGC,TTG,GAG,TCT,CTT,GGA,ACC
基因两段合成后,将PCR产物混合,进行新一轮PCR扩增,将两片段合并成一个联合基因。PCR扩增条件为94℃,30s;62℃,30s;72℃,2min 30s。共进行25-35个循环。合成的联合基因crtBcrtE总长度为1848bP。
实施例4 合成基因的功能鉴定。
利用PCR方法在合成基因crtWcrtY的两端加上BamHI和SalI酶切位点,在合成基因crtIcrtZ的两端加上SalI和HindIII酶切位点,在合成基因crtBcrtE的两端加上EcoRI+SacI和KpnI酶切位点。将crtWcrtY基因插入pBluescripsMCS载体(上海农科院生物中心三室构建,1998),之后在SalI和HindIII酶切位点再插入crtIcrtZ基因,将4个串联的基因用BamHI和KpnI酶切后插入pCAMBIA1301载体(购自美国CAMBIA公司)相应酶切位点,再用EcoRI和KpnI酶切crtBcrtE基因,插入该载体的相应酶切位点,构成6基因串联的联合基因。
为了验证基因的功能,将6个基因构建在原核启动子控制下,转化大肠杆菌,让它们在大肠杆菌中表达。用BamHI和SacI酶切串联基因后,插入pYP2001(上海农科院生物中心三室构建,1998)相应的酶切位点,构建6个串联基因的表达系统,化学法转化大肠杆菌DH5α,大肠杆菌均匀涂布在含有卡那霉素培养基的平板上,37℃培养12小时后,观察菌落的颜色变化(图10),出现红色菌落的大肠杆菌表明基因已经转化到大肠杆菌中,并在其中表达出有活性蛋白,使大肠杆菌合成虾青素。
Claims (12)
1、由来自副球菌的垅牛儿基垅牛儿基焦磷酸合成酶基因(crtE);八氢番茄红素合成酶基因(crtB);八氢番茄红素去饱和酶基因(crtI);番茄红素β环化酶基因(crtY);β-胡萝卜素羟化酶基因(crtZ)和β-胡萝卜素酮酶基因(crtW),其特征在于由前述六种基因改造成主导虾青素生物合成的crtW crtY基因和crtI crtZ及crtB crtE联合基因。
2、根据权利要求1所述主导虾青素生物合成的crtWcrtY基因核苷酸和氨基酸序列如下:
ATGTCCGCACACGCACTCCCAAAAGCAGACCTCACCGCAACCTCCCTCATCGTCTCCGGTGGTATCATCGCA-- 72
M S A H A L P K A D L T A T S L I V S G G I I A
GCATGGCTCGCACTCCACGTCCACGCACTCTGGTTCCTCGACGCAGCAGCACACCCAATCCTCGCAGTCGCA--144
A W L A L H V H A L W F L D A A A H P I L A V A
AACTTCCTCGGTCTCACCTGGCTCTCCGTCGGTCTCTTCATCATCGCACACGACGCAATGCACGGTTCCGTC--216
N F L G L T W L S V G L F I I A H D A M H G S V
GTCCCAGGTAGACCAAGAGCAAACGCAGCAATGGGTCAACTCGTCCTCTGGCTCTACGCAGGTTTCTCCTGG--288
V P G R P R A N A A M G Q L V L W L Y A G F S W
AGAAAGATGATCGTCAAGCACATGGCACACCACAGACACGCAGGTACTGACGACGACCCAGACTTCGACCAC--360
R K M I V K H M A H H R H A G T D D D P D F D H
GGTGGTCCAGTCAGATGGTACGCAAGATTCATCGGTACTTACTTCGGTTGGAGAGAAGGTCTCCTCCTCCCA--432
G G P V R W Y A R F I G T Y F G W R E G L L L P
GTCATCGTCACCGTCTACGCACTCATCCTCGGTGACAGATGGATGTACGTCGTCTTCTGGCCACTCCCATCC--504
V I V T V Y A L I L G D R W M Y V V F W P L P S
ATCCTCGCATCCATCCAACTCTTCGTCTTCGGCACCTGGCTCCCACACAGACCAGGTCACGACGCATTCCCA--576
I L A S I Q L F V F G T W L P H R P G H D A F P
GACAGACACAACGCAAGATCCTCCAGAATCTCCGACCCAGTCTCCCTCCTCACCTGCTTCCACTTCGGTGGC--648
D R H N A R S S R I S D P V S L L T C F H F G G
TACCACCACGAACACCACCTCCACCCAACCGTCCCTTGGTGGAGACTCCCATCCACCAGAACCAAAGGCGAC--720
Y H H E H H L H P T V P W W R L P S T R T K G D
ACCGCACAACTCCTCAACTTCGACCTCCTCAAACTCGCAGGCGACGTCGAATCCAACCCAGGCCCAATGACC--792
T A Q L L N F D L L K L A G D V E S N P G P M T
CACGACGTCCTCCTCGCAGGTGCAGGTCTCGCAAACGGTCTCATCGCACTCGCACTCAGAGCAGCAAGACCA--864
H D V L L A G A G L A N G L I A L A L R A A R P
GACCTCAGAGTCCTCCTCCTCGACCACGCAGCAGGTCCATCCGAAGGTCACACCTGGTCCTGCCACGACCCA--936
D L R V L L L D H A A G P S E G H T W S C H D P
GACCTCTCCCCACACTGGCTCGCAAGACTCAAGCCACTCAGAAGAGCAAACTGGCCAGACCAAGAAGTCAGA-1008
D L S P H W L A R L K P L R R A N W P D Q E V R
TTCCCAAGACACGCAAGAAGACTCGCAACCGGCTACGGCTCCCTCGACGGTGCAGCACTCGCAGACGCAGTC-1080
F P R H A R R L A T G Y G S L D G A A L A D A V
GTCAGATCCGGTGCAGAAATCAGATGGGACTCCGACATCGCACTCCTCGACGCACAAGGTGCAACCCTCTCC-1152
V R S G A E I R W D S D I A L L D A Q G A T L S
TGCGGTACTAGAATCGAAGCAGGCTCCGTCCTCGACGGCAGAGGCCCACACCCATCCAGACACCTCACCCTC-1224
C G T R I E A G S V L D G R G P H P S R H L T L
GGCTTCCACAAGTTCCTCGGTGTCGAAATCGAAACCGACAGACCACACGGTGTCCCAAGACCAGTCATCATG-1296
G F H K F L G V E I E T D R P H G V P R P V I M
GACGGCACCGTCACCCAAAGAGACGGCTACGGCTTCATCTACCTCCTCCCATTCTCCAGAACCAGAATCCTC-1368
D G T V T Q R D G Y G F I Y L L P F S R T R I L
ATCGAAGACACCAGATACTCCGACGGCGGCGACCTCGACGACGACGCACTCGCAGCAGCATCCCAAGACTAC-1440
I E D T R Y S D G G D L D D D A L A A A S Q D Y
GCAAGACAACAAGGCTGGACCGGTGCAGAAGTCAGAAGAGAAAGAGGCATCCTCCCAATCGCACTCGCACAC-1512
A R Q Q G W T G A E V R R E R G I L P I A L A H
GACGCAGCAGGTTTCTGGGCAGACCACGCAGAAGGTCCAGTCCCAGTCGGTCTCAGAGCAGGCTTCTTCCAC-1584
D A A G F W A D H A E G P V P V G L R A G F F H
CCAGTCACCGGCTACTCCCTCCCATACGCAGCACAAGTCGCAGACGTCGTCGCAGGTCTCTCCGGTCCACCA-1556
P V T G Y S L P Y A A Q V A D V V A G L S G P P
GGCACCGACGCACTCAGAGGTGCAATCAGAGACTACGCAATCGACAGAGCAAGAAGAGACAGATTCCTCAGA-1728
G T D A L R G A I R D Y A I D R A R R D R F L R
CTCCTCAACAGAATGCTCTTCAGAGGCTGCGCACCAGACAGAAGATACACCCTCCTCCAAAGACTCTACAGA-1800
L L N R M L F R G C A P D R R Y T L L Q R L Y R
ATGCCACACGGTCTCATCGAAAGATTCTACGCAGGTAGACTCTCCGTCGCAGACCAACTCAGAATCGTCACC-1872
M P H G L I E R F Y A G R L S V A D Q L R I V T
GGCAAGCCACCAATCCCACTCGGCACCGCAATCAGATGCCTCCCAGAAAGACCACTCCTCAAGGAAAACGCA-1994
G K P P I P L G T A I R C L P E R P L L K E N A
3、根据权利要求1所述主导虾青素生物合成的crtIcrtZ基因核苷酸和氨基酸序列如下:
ATGAACGCACACTCCCCAGCAGCAAAGACCGCAATCGTCATCGGTGCAGGTTTCGGTGGTCTCGCACTCGCA-- 72
M N A H S P A A K T A I V I G A G F G G L A L A
ATCAGACTCCAATCCGCAGGCATCGCAACCACCCTCGTCGAGGCAAGAGACAAGCCAGGCGGTAGAGCATAC--144
I R L Q S A G I A T T L V E A R D K P G G R A Y
GTCTGGCACGACCAAGGCCACGTCTTCGACGCAGGTCCAACCGTCATCACCGACCCAGACGCACTCAAGGAA--216
V W H D Q G H V F D A G P T V I T D P D A L K E
CTCTGGGCACTCACCGGTCAAGACATGGCAAGAGACGTCACCCTCATGCCAGTCTCCCCATTCTACAGACTC--288
L W A L T G Q D M A R D V T L M P V S P F Y R L
ATGTGGCCAGGTGGCAAGGTCTTCGACTACGTCAACGAGGCAGACCAACTCGAAAGACAAATCGCACAATTC--360
M W P G G K V F D Y V N E A D Q L E R Q I A Q FAACCCAGACGACCTCGAAGGTTACAGAAGATTCAGAGACTACGCAGAGGAGGTCTACCAGGAGGGCTACGTC--432N P D D L E G Y R R F R D Y A E E V Y Q E G Y VAAACTCGGCACCGTCCCATTCCTCAAGCTCGGTCAAATGCTCAAGGCAGCACCAGCACTCATGAAACTCGAA--504K L G T V P F L K L G Q M L K A A P A L M K L EGCATACAACTCCGTCCACGCAAAGGTCGCAACCTTCATCAAGGACCCATACCTCAGACAGGCATTCTCCTAC--576A Y N S V H A K V A T F I K D P Y L R Q A F S YCACACCCTCCTCGTCGGTGGTAATCCATTCTCCACCTCCTCCATCTACGCACTCATCCACGCACTCGAAAGA--648H T L L V G G N P F S T S S I Y A L I H A L E RAGAGGTGGTGTCTGGTTCGCAAAGGGTGGCACCAACCAGCTCGTCGCAGGTATGGTCGCACTCTTCGAGAGA--720R G G V W F A K G G T N Q L V A G M V A L F E RCCAGGTGGTCAAATGATGCTCAACGCAAAGGTCGCAAGAATCGAAACCGAGGGTGCAAGAACCACCGGTGTC--792P G G Q M M L N A K V A R I E T E G A R T T G VACCCTCGCAGACGGTAGATCCCTCAGAGCAGACATGGTCGCATCCAACGGTGACGTCATGCACAACTACAGA--864T L A D G R S L R A D M V A S N G D V M H N Y RGACCTCCTCGGTCACACCGCAAGAGGTCAATCCAGAGCAAAGTCCCTCGACAGAAAGAGATGGTCCATGTCC--936D L L G H T A R G Q S R A K S L D R K R W S M SCTCTTCGTCCTCCACTTCGGTCTCAGAGAAGCACCAAAGGACATCGCACACCACACCATCCTCTTCGGTCCA-1008L F V L H F G L R E A P K D I A H H T I L F G PAGATACAAGGAACTCGTCAACGAAATCTTCAAGGGTCCAAAACTCGCAGAGGACTTCTCCCTCTACCTCCAC-1080R Y K E L V N E I F K G P K L A E D F S L Y L HTCCCCATGCACCACCGACCCAGACATGGCACCACCAGGCATGTCCACCCACTACGTCCTCGCACCAGTCCCA-1152S P C T T D P D M A P P G M S T H Y V L A P V PCACCTCTCCAGAGCAGAAATCGACTGGGCAGTCGAAGGCCCAAGATACGCAGACAGAATCCTCGCATTCCTC-1224H L S R A E I D W A V E G P R Y A D R I L A F LGAAGAAAGACTCATCCCAAACCTCAGAGCAAACCTCACCAGAACCAGAATCTTCACCCCAGCAGACTTCGCA-1296E E R L I P N L R A N L T R T R I F T P A D F ATCCGAACTCAACGCACACCACGGCTCCGCATTCTCCGTCGAACCAATCCTCACCCAATCCGCATGGTTCAGA-1368S E L N A H H G S A F S V E P I L T Q S A W F RCCACACAACAGAGACAAGACCATCAGAAACTTCTACCTCGTCGGTGCAGGTACTCACCCAGGTGCAGGTATC-1440P H N R D K T I R N F Y L V G A G T H P G A G ICCAGGTGTCGTCGGTTCCGCAAAGGCAACCGCACAAGTCATGCTCCAACTCCTCAACTTCGACCTCCTCAAA-1512P G V V G S A K A T A Q V M L Q L L N F D L L KCTCGCAGGCGACGTCGAATCCAACCCAGGCCCAATGACCAACTTCCTCATCGTCGTCGCAACCGTCCTCGTC-1584L A G D V E S N P G P M T N F L I V V A T V L VATGGAACTCACCGCATACTCCGTCCACAGATGGATCATGCACGGTCCACTCGGCTGGGGCTGGCACAAATCC-1656M E L T A Y S V H R W I M H G P L G W G W H K SCACCACGAAGAACACGACCACGCACTCGAAAAAAACGACCTCTACGGTCTCGTCTTCGCAGTCATCGCAACC-1728H H E E H D H A L E K N D L Y G L V F A V I A TGTCCTCTTCACCGTCGGTTGGATCTGGGCACCAGTCCTCTGGTGGATCGCACTCGGTATGACCGTCTACGGT-1800V L F T V G W I W A P V L W W I A L G M T V Y GCTCATCTACTTCGTCCTCCACGACGGTGTCGTCCACCAAAGATGGCCATTCAGATACATCCCAAGAAAGGGC-1872L I Y F V L H D G V V H Q R W P F R Y I P R K GTACGCAAGAAGACTCTACCAAGCACACAGACTCCACCACGCAGTCGAAGGCAGAGACCACTGCGTCTCCTTC-1944Y A R R L Y Q A H R L H H A V E G R D H C V S FGGCTTCATCTACGCACCACCAGTCGATAAACTCAAAGAAGACCTCAAGACCTCCGGCGTCCTCAGAGCAGAA-2016
G F I Y A P P V D K L K E D L K T S G V L R A E
GCAGAAGAAAGAACCTAA-2034
A E E R T
4、根据权利要求1所述主导虾青素生物合成的crtBcrtE基因核苷酸和氨基酸序列如下:
ATGTCCGACCTCGTCCTCACCTCCACCGAGGCCATCACCCAGGGCTCCCAATCCTTCGCCACCGCAGCCAAA-- 72
M S D L V L T S T E A I T Q G S Q S F A T A A K
CTCATGCCACCAGGCATCAGAGACGACACCGTCATGCTCTACGCCTGGTGCAGACACGCAGACGACGTCATC--144
L M P P G I R D D T V M L Y A W C R H A D D V I
GACGGTCAGGCACTCGGCTCCAGACCAGAGGCAGTCAACGACCCACAGGCCAGACTCGACGGTCTCAGAGCC--216
D G Q A L G S R P E A V N D P Q A R L D G L R A
GACACCCTCGCAGCACTCCAGGGTGACGGTCCAGTCACTCCACCATTCGCAGCACTCAGAGCAGTCGCAAGA--288
D T L A A L Q G D G P V T P P F A A L R A V A R
AGACACGACTTCCCACAGGCATGGCCAATGGACCTCATCGAGGGCTTCGCAATCGACGTTGAGGCAAGAGAC--360
R H D F P Q A W P M D L I E G F A I D V E A R D
TACAGAACCCTCGACGACGTCCTCGAATACTCCTACCACGTCGCAGGCATCCTCGGTGTCATGATGGCCAGA--432
Y R T L D D V L E Y S Y H V A G I L G V M M A R
GTCATGGGTGTCAGAGACCACCCAGTCCTCGACAGAGCCTGCGACCTCGGTCTCGCCTTCCAGCTCACCCAC--504
V M G V R D H P V L D R A C D L G L A F Q L T H
ATCGCAAGAGACGTCATCGACTACGCAAGAATCGGCAGATGCTACCTCCCAGGCGACTGGCTCGACCACGCA--576
I A R D V I D Y A R I G R C Y L P G D W L D H A
GGCGCAAGAGTCGATGGTCCAGTCCCATCCCCAGAACTCTACACCGTCATCCTCAGACTCCTCGACGCAGCA--648
G A R V D G P V P S P E L Y T V I L R L L D A A
GAGCCATACTACCCATCCGCAAGAGTCGGTCTCGCAGACCTCCCACCAAGATGCGCATGGTCCATCCCAGCA--720
E P Y Y P S A R V G L A D L P P R C A W S I P A
GCATTCAGAATCTACAGAGCAATCGGTCTCCCAATCAGAAAGGGTGGTCCAGAGGCATACAGACAAAGAATC--792
A F R I Y R A I G L P I R K G G P E A Y R Q R I
TCCACCTCCAAGGCAGCAAAGATCGGTCTCCTCGGCATCGGTGGTTGGGACGTCGCAGACCACGCTTGCAGA--864
S T S K A A K I G L L G I G G W D V A D H A C R
GGCTCCGGTGTCTCCAGACAAGACCTCTGGACCAGACCACACCACGCACAACTCCTCAACTTCGACCTCCTC--936
G S G V S R Q D L W T R P H H A Q L L N F D L L
AAACTCGCAGGCGACGTCGAATCCAACCCAGGCCCAATGAGAAGAGACGTCAACCCAATCCACGCAACCCTC--1008
K L A G D V E S N P G P M R R D V N P I H A T L
CTCCAAACCAGAATCGAAGAAATCGCACAAGGCTTCGGTGCAGTCCTCCAACCACTCGGTGCAGCAATGGCA--1080
L Q T R I E E I A Q G F G A V L Q P L G A A M A
GCACTCTCCTCCGGTAAGAGATTCAGAGGTATGCTCATGCTCCTCGCAGCAGAAGCATCCGGTGGTGTCTGC--1152
A L S S G K R F R G M L M L L A A E A S G G V C
GACACCATCGTCGATGCAGCCTGCGCAGTCGAAATGGTCCACGCAGCATCCCTCATCTTCGACGACCTCCCA--1224
D T I V D A A C A V E M V H A A S L I F D D L P
TGTATGGACGACGCAGGTCTCAGAAGAGGTCAACCAGCAACCCACGTCGCACACGGTGAATCCAGAGCAGTC--1296
C M D D A G L R R G Q P A T H V A H G E S R A V
CTCGGTGGCATCGCACTCATCACCGAAGCAATGGCACTCCTCGCAGGTGCAAGAGGTGCATCCGGTACTGTC--1368
L G G I A L I T E A M A L L A G A R G A S G T V
AGAGCACAACTCGTCAGAATCCTCTCCAGATCCCTCGGTCCACAAGGTCTCTGCGCAGGTCAAGACCTCGAC--1440
R A Q L V R I L S R S L G P Q G L C A G Q D L D
CTCCACGCAGCAAAGAACGGTGCAGGTGTCGAACAAGAACAAGACCTCAAAACCGGTGTCCTCTTCATCGCA--1512
L H A A K N G A G V E Q E Q D L K T G V L F I A
GGTCTCGAAATGCTCGCAGTCATCAAAGAGTTCGACGCAGAAGAACAAACCCAAATGATCGACTTCGGTAGA--1584
G L E M L A V I K E F D A E E Q T Q M I D F G R
CAACTCGGTAGAGTCTTCCAATCCTACGACGACCTCCTCGAAGTCGTCGGTGATCAAGCAGCACTCGGTAAA--1656
Q L G R V F Q S Y D D L L E V V G D Q A A L G K
GACACCGGTAGAGACGCAGCAGCACCAGGTCCAAGAAGAGGTCTCCTCGCAGTCTCCGACCTCCAAAAGGTC--1728
D T G R D A A A P G P R R G L L A V S D L Q K V
TCCAGACAATACGAAGCATCCAGAGCACAACTCGAAGGTATGGTCGGTTCCAAGAGACTCCAAGCACCAGAA--1800
S R Q Y E A S R A Q L E G M V G S K R L Q A P E
ATCGAAGCACTCCTCGAAAGAGTCCTCCCATACGCAGCAAGAGCATAA--1848
I E A L L E R V L P Y A A R A
5、主导虾青素生物合成的crtWcrtY、crtIcrtZ和crtBcrtE基因的合成方法,其特征在于采用高保真的耐高温聚合酶PCR进行扩增,基因在大肠杆菌中克隆并测核苷酸序列,在crtWcrtY、crtIcrtZ和crtBcrtE基因的连接处插入自动切割序列不同位置插入自动切割序列
CAACTCCTCAACTTCGACCTCCTCAAACTCGCAGGCGACGTCGA
ATCCAACCCAGGCCCA进行合成。
6、根据权利要求5所述主导虾青素生物合成基因的合成方法,其特征在于合成crtWcrtY基因,从起始密码ATG到终止密码TAA共1997个核苷酸碱基对,在基因的726~786位置处插入自动切割序列CAACTCCTCAACTTCGACCTCCTCAAACTCGCAGGCGACGTCGAATCCAACCCAGGCCCA。
7、根据权利要求5所述主导虾青素生物合成基因的合成方法,其特征在于合成crtIcrtZ基因,从起始密码ATG到终止密码TAA共2034个核苷酸碱基对,在基因的1485~1545位置处插入自动切割序列
CAACTCCTCAACTTCGACCTCCTCAAACTCGCA
GGCGACGTCGAATCCAACCCAGGCCCA。
8、根据权利要求5所述主导虾青素生物合成基因的合成方法,其特征在于合成crtBcrtE基因,从起始密码ATG到终止密码TAA共1848个核苷酸碱基对,在基因的912~972位置处插入一自动切割序列CAACTCCTCAACTTCGACCTCCTCAAACTCGCAGGCGACGTCGAATCCAACCCAGGCCCA。
9、根据权利要求5所述主导虾青素生物合成基因的合成方法,其特征在于对crtWcrtY,crtIcrtZ,crtBcrtE的两端分别加上BamHI和SalI酶切位点;SalI和HindIII酶切位点;EcoRI+SacI和KpnI酶切位点,将crtWcrtY基因插入pBluescripsMCS载体,将SalI和HindIII酶切位点再插入crtIcrtZ基因,再将四个串联的基因用BamHI和KpnI酶切后插入pCAMBIA1301载体相应酶切位点,再用EcoRI和KpnI酶切crtBcrtE基因,插入该载体的相应酶切位点,构成6基因串联的联合基因。
10、根据权利要求1所述主导虾青素生物合成基因功能应用采用6个基因串联,构建在原核启动子控制下,转化大肠杆菌,使它们在大肠杆菌中表达,用BamHI和SacI酶切串联基因后,插入pYP2001相应的酶切位点,构建成六个串联基因的表达系统,表达出有活性蛋白使大肠杆菌合成虾青素。
11、根据权利要求1所述主导虾青素生物合成基因,其特征在于按crtW与crtY;crtI与crtZ;crtB与crtE串联组成3个联合基因,按照植物的偏爱密码合成核苷酸。
12、如权利要求1所述主导虾青素生物合成基因,可在改造植物品质和利用植物生产虾青素中应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01105878 CN1380415A (zh) | 2001-04-06 | 2001-04-06 | 用于转基因植物中生产类胡萝卜素的相关基因的合成 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01105878 CN1380415A (zh) | 2001-04-06 | 2001-04-06 | 用于转基因植物中生产类胡萝卜素的相关基因的合成 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1380415A true CN1380415A (zh) | 2002-11-20 |
Family
ID=4654942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 01105878 Pending CN1380415A (zh) | 2001-04-06 | 2001-04-06 | 用于转基因植物中生产类胡萝卜素的相关基因的合成 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1380415A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7074604B1 (en) | 2004-12-29 | 2006-07-11 | E. I. Du Pont De Nemours And Company | Bioproduction of astaxanthin using mutant carotenoid ketolase and carotenoid hydroxylase genes |
US7091031B2 (en) | 2004-08-16 | 2006-08-15 | E. I. Du Pont De Nemours And Company | Carotenoid hydroxylase enzymes |
US7425625B2 (en) | 2004-06-08 | 2008-09-16 | E.I. Du Pont De Nemours And Company | Carotenoid ketolase genes with improved ketocarotenoid yield |
CN102061289A (zh) * | 2009-11-13 | 2011-05-18 | 韩国生命工学研究院 | 增加植物β-胡萝卜素含量的β-胡萝卜素羟化酶基因及其用途 |
CN102286504A (zh) * | 2011-07-01 | 2011-12-21 | 浙江大学 | 少动鞘氨醇单胞菌的番茄红素环化酶基因及其应用 |
CN101768593B (zh) * | 2009-01-06 | 2013-01-30 | 上海市农业科学院 | 副球菌虾青素合成操纵子及其表达载体与应用 |
CN107418968A (zh) * | 2017-06-02 | 2017-12-01 | 湖北大学 | 一种利用烟草质体高效生产虾青素的方法 |
CN109593120A (zh) * | 2019-01-15 | 2019-04-09 | 华中农业大学 | 一种橙色类胡萝卜素蛋白的制备方法 |
CN111206042A (zh) * | 2020-02-25 | 2020-05-29 | 中国科学院昆明植物研究所 | 一种表达酮式类胡萝卜素的融合基因、重组载体及其应用 |
CN113699052A (zh) * | 2020-05-20 | 2021-11-26 | 万华化学(四川)有限公司 | 一株生产虾青素的重组酿酒酵母及其应用 |
-
2001
- 2001-04-06 CN CN 01105878 patent/CN1380415A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7425625B2 (en) | 2004-06-08 | 2008-09-16 | E.I. Du Pont De Nemours And Company | Carotenoid ketolase genes with improved ketocarotenoid yield |
US7091031B2 (en) | 2004-08-16 | 2006-08-15 | E. I. Du Pont De Nemours And Company | Carotenoid hydroxylase enzymes |
US7074604B1 (en) | 2004-12-29 | 2006-07-11 | E. I. Du Pont De Nemours And Company | Bioproduction of astaxanthin using mutant carotenoid ketolase and carotenoid hydroxylase genes |
CN101768593B (zh) * | 2009-01-06 | 2013-01-30 | 上海市农业科学院 | 副球菌虾青素合成操纵子及其表达载体与应用 |
CN102061289A (zh) * | 2009-11-13 | 2011-05-18 | 韩国生命工学研究院 | 增加植物β-胡萝卜素含量的β-胡萝卜素羟化酶基因及其用途 |
CN102061289B (zh) * | 2009-11-13 | 2013-01-23 | 韩国生命工学研究院 | 增加植物β-胡萝卜素含量的β-胡萝卜素羟化酶基因及其用途 |
CN102286504A (zh) * | 2011-07-01 | 2011-12-21 | 浙江大学 | 少动鞘氨醇单胞菌的番茄红素环化酶基因及其应用 |
CN107418968A (zh) * | 2017-06-02 | 2017-12-01 | 湖北大学 | 一种利用烟草质体高效生产虾青素的方法 |
CN109593120A (zh) * | 2019-01-15 | 2019-04-09 | 华中农业大学 | 一种橙色类胡萝卜素蛋白的制备方法 |
CN111206042A (zh) * | 2020-02-25 | 2020-05-29 | 中国科学院昆明植物研究所 | 一种表达酮式类胡萝卜素的融合基因、重组载体及其应用 |
CN113699052A (zh) * | 2020-05-20 | 2021-11-26 | 万华化学(四川)有限公司 | 一株生产虾青素的重组酿酒酵母及其应用 |
CN113699052B (zh) * | 2020-05-20 | 2023-08-11 | 万华化学(四川)有限公司 | 一株生产虾青素的重组酿酒酵母及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1183256C (zh) | 在基因工程植物的贮藏器官中增加类胡萝卜素的积累 | |
CN100347291C (zh) | 用于发酵制备l-半胱氨酸、l-胱氨酸、n-乙酰丝氨酸或四氢噻唑衍生物的微生物和方法 | |
CN1117151C (zh) | 真菌中的核黄素生物合成 | |
CN101052719A (zh) | 利用编码花色苷3'位芳香族酰基转移酶的基因的花色苷色素稳定化和蓝化方法 | |
CN1968688A (zh) | 脂肪酸去饱和酶在玉米中的表达 | |
CN1818067A (zh) | 抗虫融合基因、融合蛋白及其应用 | |
CN1644696A (zh) | 编码黄酮合酶的基因 | |
CN101048507A (zh) | 一种增大种子大小的方法 | |
CN1656226A (zh) | 用于产生不饱和脂肪酸的方法 | |
CN1308457C (zh) | 发酵生产s-腺苷甲硫氨酸的方法 | |
CN1380415A (zh) | 用于转基因植物中生产类胡萝卜素的相关基因的合成 | |
CN1777681A (zh) | Sqs基因 | |
CN1592780A (zh) | 产生γ-谷氨酰半胱氨酸的酵母 | |
CN1439054A (zh) | 通过遗传改变莽草酸路径来改变生物体中精细化学品含量 | |
CN1844377A (zh) | 柱花草9-顺式环氧类胡萝卜素双加氧酶及其编码基因与应用 | |
CN1558953A (zh) | 编码番茄红素环化酶 /八氢番茄红素合酶(carRP)和八氢番茄红素脱氢酶(carB)的三孢布拉霉β-胡萝卜素的生物合成基因 | |
CN1990856A (zh) | 使用属于嗜甲基菌属的细菌产生芳香族l-氨基酸的方法 | |
CN1190492C (zh) | 棉花Na+/H+反向转运蛋白基因及其克隆方法和应用 | |
CN1495261A (zh) | 咖啡因生物合成体系基因组的联合利用 | |
CN1757735A (zh) | 编码甘薯八氢番茄红素脱氢酶的cDNA序列 | |
CN101054585A (zh) | 利用水稻蓝光受体隐花色素cry1基因改良植物的形态建成 | |
CN1566146A (zh) | 水稻茎杆伸长基因及其编码蛋白和用途 | |
CN1757734A (zh) | 编码甘薯ζ-胡萝卜素脱氢酶的cDNA序列 | |
CN1196790C (zh) | 磷酸烯醇式丙酮酸羧化酶,编码该酶的基因以及该基因的应用 | |
CN1728939A (zh) | 生产改变含油量的植物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |