CN101475947B - 丹参1-脱氧木酮糖-5-磷酸合成酶ⅱ基因及其编码的蛋白质和应用 - Google Patents
丹参1-脱氧木酮糖-5-磷酸合成酶ⅱ基因及其编码的蛋白质和应用 Download PDFInfo
- Publication number
- CN101475947B CN101475947B CN2009100454465A CN200910045446A CN101475947B CN 101475947 B CN101475947 B CN 101475947B CN 2009100454465 A CN2009100454465 A CN 2009100454465A CN 200910045446 A CN200910045446 A CN 200910045446A CN 101475947 B CN101475947 B CN 101475947B
- Authority
- CN
- China
- Prior art keywords
- leu
- ala
- gly
- deoxy
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Enzymes And Modification Thereof (AREA)
Abstract
本发明公开了一种丹参1-脱氧木酮糖-5-磷酸合成酶Ⅱ基因及其编码的蛋白质和应用,填补了从我国传统中药材丹参中分离克隆出1-脱氧木酮糖-5-磷酸合成酶Ⅱ基因的空白。本发明所提供的1-脱氧木酮糖-5-磷酸合成酶Ⅱ基因的核苷酸序列如SEQ ID No.1所述,其编码的蛋白质的氨基酸序列如SEQ ID No.2所述。本发明的丹参1-脱氧木酮糖-5-磷酸合成酶Ⅱ基因对于通过基因过量表达技术来提高丹参中丹参酮的含量具有显著作用。
Description
技术领域
本发明属于生物技术领域,具体说,是涉及在丹参中表达的1-脱氧木酮糖-5-磷酸合成酶II基因及其编码的蛋白质和应用。
背景技术
丹参(Salvia miltiorrhiza Bunge)是我国的一种传统中药材。现代药理研究表明:丹参对心血管系统和血液系统的作用十分显著。以丹参为主的多种复方制剂如复方丹参注射液、复方丹参片、复方丹参胶囊和复方丹参滴丸(1997年向美国FDA以治疗药身份申报的品种)等已被广泛用于临床治疗心血管疾病、肾病、肝病及抗感染等。但是,由于丹参生长周期较长(2年以上),在传统的栽培模式下,面临着品质严重退化、生产成本相对过高等诸多弊端;离体条件下产生的丹参组培苗,其药用活性成分的含量还远达不到商业化开发利用的要求。所以,利用现代基因工程手段将丹参药用活性成分生物合成途径中的关键酶基因导入到丹参中,获得转基因的发根、细胞系或再生植株,并进行大规模的培养,是提高丹参中丹参酮的含量和解决丹参药源问题的最佳途径之一。
1-脱氧木酮糖-5-磷酸合成酶II(Deoxyoxylulose-5-phosphate synthase,DXS)是MEP途径中的一个关键性的限速酶,能以丙酮酸和3-磷酸甘油醛为前体,在焦磷酸硫胺素存在的情况下,生成5-磷酸脱氧木酮糖(1-deoxy-D-xylulose 5-phosphate)(DXP),随后在DXP还原异构酶(DXP reductoisomerase)(DXR)的作用下通过分子内重排和还原反应生成2C-甲基4-磷酸-4D-赤藓(2C-methyl-D-erythritol-4-phosphate,MEP)。MEP再经过磷酸化和环化作用生成2-甲基赤藓糖醇2,4环化焦磷酸,再经过一系列衍变生成IPP,从而为丹参酮的合成提供前体。由于提高1-脱氧木酮糖-5-磷酸合成酶II的活性或者含量,可以直接提高丹参中丹参酮的含量,因此,这一步是利用基因工程技术来提高丹参酮合成的重要切入点。但至今尚未有从药物植物丹参中分离克隆出1-脱氧木酮糖-5-磷酸合成酶II基因的文献报道。
发明内容
本发明所要解决的技术问题是提供一种丹参1-脱氧木酮糖-5-磷酸合成酶II基因及其编码的蛋白质和应用,以填补从我国药物植物丹参中分离克隆出1-脱氧木酮糖-5-磷酸合成酶II基因的空白。
本发明所提供的丹参1-脱氧木酮糖-5-磷酸合成酶II基因,是具有SEQ ID No.1所示的核苷酸序列或者添加、取代、插入或缺失一个或多个核苷酸的同源序列或其等位基因及其衍生的核苷酸序列。
本发明所提供的丹参1-脱氧木酮糖-5-磷酸合成酶II基因编码的蛋白质,是具有SEQ IDNo.2所示的氨基酸序列或者添加、取代、插入或缺失一个或多个氨基酸的同源序列。
含有本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II基因全序列或部分片段的质粒和植物表达载体均属于本发明的保护范围。
一种宿主细胞,该细胞含有本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II基因或质粒或植物表达载体的基因序列。
所述宿主细胞为大肠杆菌细胞、农杆菌细胞、酵母细胞、烟草细胞、丹参发根细胞、丹参细胞或其它植物细胞,优选大肠杆菌细胞或农杆菌细胞或丹参发根细胞。
本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II基因的应用,包括用所述的植物表达载体转化丹参细胞或者用所述的农杆菌与丹参细胞共培养或者用所述的丹参发根细胞培育雄性不育植株或者用所述的1-脱氧木酮糖-5-磷酸合成酶II基因序列提供一种转基因丹参。
本发明技术方案中涉及的概念具体内容如下:
本发明所说的丹参1-脱氧木酮糖-5-磷酸合成酶II基因的DNA分子包括:编码具有丹参1-脱氧木酮糖-5-磷酸合成酶II活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQ IDNO.1中从核苷酸第100~2274位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40~55℃条件下与SEQ ID NO.1中从核苷酸第100~2274的核苷酸序列杂交。较佳地,所述的序列编码具有SEQ ID NO.2所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQID NO.1中从核苷酸第100~2274位的核苷酸序列。
本发明分离出的丹参1-脱氧木酮糖-5-磷酸合成酶II多肽包括:具有SEQ ID NO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.2序列的多肽。
本发明中的DNA分子包含所述的DNA分子中8~100个连续核苷酸。
在本发明中,“分离的”、“纯化的”DNA是指:该DNA或片段已从天然状态下位于其两侧的序列中分离出来,或指该DNA或片段已经与天然状态下伴随核酸的组分分开,而且已经与在细胞中伴随其的蛋白质分开。
本发明中术语“丹参1-脱氧木酮糖-5-磷酸合成酶II(或多肽)基因”是指:编码具有丹参1-脱氧木酮糖-5-磷酸合成酶II活性的多肽的核苷酸序列,如SEQ ID NO.1中第100~2274位核苷酸序列及其简并序列。该简并序列是指位于SEQ ID NO.1序列的编码框第100~2274位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.1中第100~2274位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.2所述的序列。还包括能在中度严谨条件下,更佳的在高度严谨条件下与SEQ ID NO.1中从核苷酸第100~2274位的核苷酸序列杂交的核苷酸序列。还包括与SEQ IDNO.1中从核苷酸第100~2274位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。还包括能编码具有与天然的丹参1-脱氧木酮糖-5-磷酸合成酶II相同功能的蛋白的SEQ ID NO.1中开放阅读框序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1~90个,较佳地1~60个,更佳地1~20个,最佳地1~10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
本发明中术语“丹参1-脱氧木酮糖-5-磷酸合成酶II蛋白或多肽”是指:具有丹参1-脱氧木酮糖-5-磷酸合成酶II活性的SEQ ID NO.2序列的多肽。该术语还包括具有与天然丹参1-脱氧木酮糖-5-磷酸合成酶II相同功能的SEQ ID NO.2序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1~50个,较佳地1~30个,更佳地1~20个,最佳地1~10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括丹参1-脱氧木酮糖-5-磷酸合成酶II的活性片段和活性衍生物,还包括能够可操作地连于信号肽、启动子或者核糖体结合位点序列所组成的衍生物。
本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严谨条件下能与丹参1-脱氧木酮糖-5-磷酸合成酶II DNA杂交的DNA所编码的蛋白、以及利用丹参1-脱氧木酮糖-5-磷酸合成酶II多肽的血清获得的多肽或蛋白。
本发明中丹参1-脱氧木酮糖-5-磷酸合成酶II保守性变异多肽是指:与SEQ ID NO.2的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1.保守性变异多肽中的取代残基
最初的残基 | 代表性的取代 | 优选的取代 |
Ala(A) | Val;Leu;Ile | Val |
Arg(R) | Lys;Gln;Asn | Lys |
Asn(N) | Gln;His;Lys;Arg | Gln |
Asp(D) | Glu | Glu |
Cys(C) | Ser | Ser |
Gln(Q) | Asn | Asn |
Glu(E) | Asp | Asp |
Gly(G) | Pro;Ala | Ala |
His(H) | Asn;Gln;Lys;Arg | Arg |
Ile(I) | Leu;Val;Met;Ala;Phe | Leu |
Leu(L) | Ile;Val;Met;Ala;Phe | Ile |
Lys(K) | Arg;Gln;Asn | Arg |
Met(M) | Leu;Phe;Ile | Leu |
Phe(F) | Leu;Val;Ile;Ala;Tyr | Leu |
Pro(P) | Ala | Ala |
Ser(S) | Thr | Thr |
Thr(T) | Ser | Ser |
Trp(W) | Tyr;Phe | Tyr |
Tyr(Y) | Trp;Phe;Thr;Ser | Phe |
Val(V) | Ile;Leu;Met;Phe;Ala | Leu |
本发明还包括丹参1-脱氧木酮糖-5-磷酸合成酶II或多肽的类似物。这些类似物与天然1-脱氧木酮糖-5-磷酸合成酶II多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。所述修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II多肽时,可以将丹参1-脱氧木酮糖-5-磷酸合成酶II基因的核苷酸序列可操作地连于表达调控序列,从而形成丹参1-脱氧木酮糖-5-磷酸合成酶II表达载体。所述“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
本发明中宿主细胞为原核细胞或者真核细胞。常用的原核宿主细胞包括大肠杆菌;常用的真核宿主细胞包括酵母细胞、烟草细胞和其它植物细胞。
本发明还可用Northern印迹法技术分析丹参1-脱氧木酮糖-5-磷酸合成酶II基因产物的表达,即分析丹参1-脱氧木酮糖-5-磷酸合成酶II的RNA转录物在细胞中的存在和数量。
此外,本发明中可用作探针的核酸分子通常具有丹参1-脱氧木酮糖-5-磷酸合成酶II核苷酸编码序列的8~100个连续核苷酸,较佳地具有15~50个连续核苷酸。该探针可用于检测样品中是否存在编码丹参1-脱氧木酮糖-5-磷酸合成酶II的核酸分子。
本发明涉及检测样品中是否存在丹参1-脱氧木酮糖-5-磷酸合成酶II核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于丹参1-脱氧木酮糖-5-磷酸合成酶II核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15~50个核苷酸。此外,根据本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选丹参1-脱氧木酮糖-5-磷酸合成酶II源基因或同源蛋白。
为了得到与丹参1-脱氧木酮糖-5-磷酸合成酶II相关的丹参cDNAs的点阵,可以用DNA探针筛选丹参cDNA文库,这些探针是在低严谨条件下,用32P对丹参1-脱氧木酮糖-5-磷酸合成酶II基因的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自丹参的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,Palo Alto,Cal.。这种筛选方法可以识别与丹参1-脱氧木酮糖-5-磷酸合成酶II的基因家族的核苷酸序列。
本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外,还可通过化学合成将突变引入本发明蛋白序列中。除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。利用本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II,通过各种常规筛选方法,可筛选出与丹参1-脱氧木酮糖-5-磷酸合成酶II发生相互作用的物质,或者受体、抑制剂或拮剂等。
本发明提供的1-脱氧木酮糖-5-磷酸合成酶II基因是首次从丹参中克隆制备的,可以通过基因工程技术来提高丹参等植物中丹参酮的含量,转基因结果显示,丹参1-脱氧木酮糖-5-磷酸合成酶II基因对促进丹参酮含量的提高有明显作用。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1(丹参1-脱氧木酮糖-5-磷酸合成酶II基因的克隆)
1.组织分离(isolation)
丹参植株来源于四川,采取幼嫩根后立即置于液氮中冷冻保存。
2.RNA的分离(RNA isolation)
取部分组织用研钵研碎,加入盛有裂解液的1.5mL EP管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至1.5mL EP管中,抽提总RNA(TRIzol Reagents,GIBCO BRL,USA)。用甲醛变性胶电泳鉴定总RNA质量,然后在分光光度计上测定RNA含量。
3.基因的全长克隆(Cloning of Full-length cDNA)
根据金鱼草,薄荷等DXS基因氨基酸保守序列,设计简并引物,利用同源性基因克隆原理,采用Smart-RACE方法(Clonetech试剂盒)进行cDNA全长克隆,分三个阶段进行:
(1)5′-RACE
PCR(UPM+R2)得到DXS2R2′(554bp),回收,连接8到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(Genebank+EMBL),知其核酸序列及编码蛋白与已知1-脱氧木酮糖-5-磷酸合成酶II(如薄荷1-脱氧木酮糖-5-磷酸合成酶II等)的同源性很高,故初步认为它是一个1-脱氧木酮糖-5-磷酸合成酶II基因。
(2)3′RACE
根据5′RACE结果,设计正向特异引物F2,经PCR(UPM+F2)得到DXS2F2′(2098bp)(过程同(1))。回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。
(3)将5′RACE测序结果与3′RACE测序结果比序并进行拼接,得到全长片段序列信息,并设计一对特异引物进行PCR扩增1-脱氧木酮糖-5-磷酸合成酶II编码区(DXS2KF1+DXS2KR1)得到DXS2编码区(2175bp)(过程同步骤(1))。
BLAST的结果证明:从丹参中新得到的基因确为1-脱氧木酮糖-5-磷酸合成酶II基因。
通过组合使用上述3种方法,获得了候选的丹参DXS2蛋白的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上,进一步设计引物DXS2F1:5′-AGCACACACAACTTGAAACAACT-3′(SEQ ID NO.3)为正向引物,寡核苷酸DXS2R1:5′-GGGACAAATAAATTTATTTAATA-3′(SEQ ID NO.4)为反向引物,以总RNA为模板,进行RT-PCR扩增,F1/R2的PCR条件为94℃5分钟,随之以94℃1分钟、60℃1分钟和72℃3分钟进行35个循环,最后以72℃延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为2522bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQ ID NO.1所示的序列。
实施例2(丹参1-脱氧木酮糖-5-磷酸合成酶II的序列信息与同源性分析)
本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II全长cDNA的长度为2522bp,详细序列见SEQ ID NO.1,其中开放读框位于100~2274位核苷酸。根据全长cDNA推导出1-脱氧木酮糖-5-磷酸合成酶II的氨基酸序列,共724个氨基酸残基,分子量78.2KD,pI为6.44,详细序列见SEQ ID NO.2。将丹参1-脱氧木酮糖-5-磷酸合成酶II的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundant GenBank+EMBL+DDBJ+PDB和Non-redundant GenBankCDS translations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与薄荷DXS2基因(GenBank Accession No.AF019383)具有83%的同源性(见表2);在氨基酸水平上,它与薄荷DXS2(GenBank Accession No.AAC33513)的第1~724位氨基酸残基有88%的相同性和93%的相似性(见表3)。由上可见,丹参1-脱氧木酮糖-5-磷酸合成酶II与薄荷1-脱氧木酮糖-5-磷酸合成酶II无论从核酸还是蛋白水平上都存在较高的同源性。故可认为丹参1-脱氧木酮糖-5-磷酸合成酶II在提高资源植物中丹参酮的含量上具有促进作用。
表2.本发明的丹参DXS2与薄荷(Mentha piperita)DXS2的核苷酸序列的同源比较(GAP)
Query 96 AGAGATGGCGTCGTCTTGTGGAGTTATCAACAGCAGTTTCTTGCCATTGCTCCATTCTGA 155
||||||||| || || |||||||||||||| |||||||||||||||| ||||||||||||
Sbjct 81 AGAGATGGCATCTTCCTGTGGAGTTATCAAGAGCAGTTTCTTGCCATCGCTCCATTCTGA 140
Query 156 GAATTCATCAAGCC-TCTTATCTCGCACTACTGCTACTCTTCCCC-CAAAAAAGCATAAG 213
| |||| | | || ||||||| || || || || ||||||||| | ||||| ||||||
Sbjct 141 GGATTC-T--A-CCTTCTTATCACGTGCTCCTACTTCTCTTCCCCTC-AAAAATCATAAG 195
Query 214 TTCTCCGTGGTAGCAGCTCTTCAACAGGATAACACCAACGACGTGGCTGCC-AATGGAGA 272
|| |||||||||||||| ||||| |||| | |||||||| | | | | | |||||
Sbjct 196 TTAAATGTGGTAGCAGCTCTCCAACAAGATAGTTCGAACGACGTCG-TTCCTAGCGGAGA 254
Query 273 GAGTCTGACG-AGGCAGAAAACAAGAGCTCTCAATTTCACCGGAGACAAGCCTCCAACTC 331
|| |||| | ||| |||| ||||||| || | |||||||||||| |||||||| | ||
Sbjct 255 CAGGCTGA-GCCGGCCGAAATCAAGAGCACTGAGTTTCACCGGAGAGAAGCCTCCCATTC 313
Query 332 CAATATTGGACACCATCAACTATCCAAATCACATGAAAAACCTCTCGGTCGAGGAACT-G 390
| ||| ||||||||||||||||||| ||| ||||||||||||| || ||||||||||| |
Sbjct 314 CTATACTGGACACCATCAACTACCCTAATCACATGAAAAATCTTTCCGTCGAGGAACTCG 373
Query 391 GAGGGA-TTGGCTGATGAATTGAGGGAAGAGATAGTGTACACGGTGTCGAAAACCGGCGG 449
| | | |||||||||||| |||||||||||||||||||||||||||||||||||||
Sbjct 374 CA--AACCTAGCTGATGAACTGAGGGAAGAGATAGTGTACACGGTGTCGAAAACCGGCGG 431
Query 450 CCAT-TTAAGCTCAAGCTTAGGTGTATCGGAGCTCACGGTCGCA-TTGCATCATGTGTTC 507
|||| ||| |||| ||| |||| || ||||||||||| |||||| || ||||| || |||
Sbjct 432 CCATCTTA-GCTCGAGCCTAGGCGTGTCGGAGCTCACCGTCGCACTT-CATCACGTTTTC 489
Query 508 AACACACCTGAGGATAAGATAATTTGGGACGTTGGCCATCAGGCTTATCCGCACGAAATC 567
||||| || || || || || || |||||||| ||||| |||||||| || ||| |||||
Sbjct 490 AACACGCCCGATGACAAAATCATCTGGGACGTCGGCCACCAGGCTTACCCACACAAAATC 549
Query 568 CTGACGGGGAGGAG-GTCCAGAATGCACACGATTCGGCAGAC-TTTCGGACTAGCAGGGT 625
|||| |||||| || | ||||||||||| ||| ||||||| ||| ||| ||||||||
Sbjct 550 TTGACCGGGAGAAGAG-CGAGAATGCACACAATTAGGCAGACATTT-GGATTAGCAGGTT 607
Query 626 TCCCTAA-ACGAGACGAAAGCGCCCACGACGCGTTCGGAGCCGGCCACAGCTCCACTAGT 684
||||||| | |||| ||||| || ||||| || ||||| |||||||| || || || |||
Sbjct 608 TCCCTAAGA-GAGATGAAAGTGCTCACGATGCCTTCGGCGCCGGCCATAGTTCTACCAGT 666
Query 685 ATCTCTGCTGGTCTAGGCATGGCGGTGGGGAGAGACTTATTACACAAGAACAACCATGTG 744
|| ||||||||| |||| |||||||||| |||||| ||| | || ||||||||||| ||
Sbjct 667 ATTTCTGCTGGTTTAGGGATGGCGGTGGCGAGAGATTTACTGCAGAAGAACAACCACGTC 726
Query 745 ATATCAGTGATCGGAGACGGCGCCATGACAGCAGGGCAGGCGTACGAGGCCCTCAACAAT 804
||||| |||||||| ||||||||||||||||| || || |||||||||||| | |||||
Sbjct 727 ATATCGGTGATCGGCGACGGCGCCATGACAGCTGGACAAGCGTACGAGGCCTTAAACAAC 786
Query 805 GCAGGATTCCTTGATTCCAATCTCATCATCGTGTTGAATGACAACAAGCAGGTCTCGCTG 864
|| |||||||| ||||| |||||||| ||||| || || |||||||||||||| || ||
Sbjct 787 GCCGGATTCCTCGATTCGAATCTCATAATCGTTTTAAACGACAACAAGCAGGTGTCTCTA 846
Query 865 CCCACGGCCACCATTGACGGCCCTGCTCCGCCCGTGGGAGCCCTCAGCAAAGCCCTCACG 924
||||||||||||||| ||||||||||| ||||| || ||||| || ||||||||||| ||
Sbjct 847 CCCACGGCCACCGTCGACGGCCCTGCGCCGCCGGTCGGAGCTCTGAGCAAAGCCCTGAC- 905
Query 925 C--GTCTTCAAGCCAGCAGAAAATTCCGGCAACTCCGCGAAGCAGCAAAGGGCATGACTA 982
| | || ||||||||||||||||||||||| |||||||||||||||||| | |||||||
Sbjct 906 CAAG-CTGCAAGCCAGCAGAAAATTCCGGCAGCTCCGCGAAGCAGCAAAGAGTATGACTA 964
Query 983 GGCAGATGGGAG-AGCAGGCCCATGAAATCGCATCCAAGGTTGACACC-TACATGAAGGG 1040
||||||||||| | | ||| |||||||| || || ||| ||||||| ||| |||| ||
Sbjct 965 AGCAGATGGGAGCACC-GGCACATGAAATAGCTTCGAAG-TTGACACAATACGTGAAAGG 1022
Query 1041 GATGATGGGGAAGCCCGGCGCGTCCCTCTTCGAGGAGCTCGGGATTTACTACATCGGCCC 1100
|||||||||||| || |||||||| || ||||| || || |||||||| |||||||| ||
Sbjct 1023 GATGATGGGGAAACCAGGCGCTTCACTTTTCGAAGAACTGGGGATTTATTACATCGGACC 1082
Query 1101 CGTTGACGGCCACAACGTTGAAGATCCGGTCTACATTTTCAAGAAGGTTAAAGAAATGCC 1160
|| |||||||| ||||||||||||| || || ||||||||||| ||||| ||||||||
Sbjct 1083 AGTCGACGGCCATAACGTTGAAGATCTTGTTTATATTTTCAAGAAAGTTAAGGAAATGCC 1142
Query 1161 TGCGCCTGGGCCTGTCCTTATCCACATCATCACCGAGAAGGGCAAAGGCTACTCTCCC-G 1219
||||||||||||||| ||||| || |||||||||||| || |||||||||||| | ||||
Sbjct 1143 TGCGCCTGGGCCTGTTCTTATTCATATCATCACCGAAAAAGGCAAAGGCTACCC-CCCTG 1201
Query 1220 CTGAAGTTGCTGCCGACAAGATGCATGGTGTCGTCAAGTTTGATCCTACAACCGGCAAAC 1279
| |||||||||||||||| |||||||| || || ||||||||| | | ||| || ||||
Sbjct 1202 CAGAAATTGCTGCCGACAAAATGCATGGGGTGGTGAAGTTTGATGCGAAAACTGGGAAAC 1261
Query 1280 AGCTCAAGTCCAA-AACCAATACTAAATCATACACTCAATACTTCGCCGAGTCTCTCGTG 1338
|| | ||| | || ||| || || || |||||||| || ||||||||||||||||| |||
Sbjct 1262 AGATGAAGACGAAGAAC-AAGACGAAGTCATACACCCAGTACTTCGCCGAGTCTCTGGTG 1320
Query 1339 GCCGAAGCAGAGCACGACGACAGGATCGTCGCCATCCACGCCGCCATGGGGGGCGGCAC- 1397
|| || || |||||||||||||| |||||| || ||||||||||||||||||||||||||
Sbjct 1321 GCGGAGGCGGAGCACGACGACAAGATCGTGGCGATCCACGCCGCCATGGGGGGCGGCACC 1380
Query 1398 GGGCCTCAAC-TACTTCCAGAAGC-GCTTCCCCGACCGCTGCTTCGACGTGGGGATCGCC 1455
|||| ||||| | |||||||||||| | ||||| ||||| ||||||||||| ||||||||
Sbjct 1381 GGGC-TCAACAT-CTTCCAGAAGCAG-TTCCCGGACCGGTGCTTCGACGTCGGGATCGCG 1437
Query 1456 GAGCAGCACGCCGTCACTTTCGCGGCGGGGCTCGCCACGGAGGGGCTCAAGCCCTTCTGC 1515
|||||||||| ||| || ||||| || || | || |||||||||| ||||| ||||||
Sbjct 1438 GAGCAGCACGCGGTGACGTTCGCCGCCGGTATGGCGGCGGAGGGGCTGAAGCCTTTCTGC 1497
Query 1516 ACGATCTACTCCTCGTTCCTGCAGAGGGGGTACGATCAGGTGGTCCACGACGTGGACCTT 1575
| ||||||||||| ||||| |||||||| ||||| ||||||||||||||||| |||||
Sbjct 1498 GCCATCTACTCCTCCTTCCTCCAGAGGGGCTACGACCAGGTGGTCCACGACGTCGACCTC 1557
Query 1576 CAGAAGCTCCCCGTGAGGTTCATGATGGACCGGGCTGGCGTCGTGGGCGCCGACGGCCCC 1635
||||||||||| || ||||||||||||| ||||| || ||||| |||||||||||||||
Sbjct 1558 CAGAAGCTCCCGGTCCGGTTCATGATGGATCGGGCAGGAGTCGTCGGCGCCGACGGCCCC 1617
Query 1636 ACCCACTGCGGCGCCTTCGACACCACCTACATGGCCTGCCTGCCCAACATGTTCGTCATG 1695
||||||||||||||||||||||||||||||||||||||||| ||||||||| | ||||||
Sbjct 1618 ACCCACTGCGGCGCCTTCGACACCACCTACATGGCCTGCCTCCCCAACATGGTGGTCATG 1677
Query 1696 GC-CTCTTCCGAC-AAGCTCGATCTCATGCACATGATTGCCACCGCTGCCGCCATTGACG 1753
|| | || ||||| |||| || |||||| ||||||| ||||||||| ||| ||| ||||
Sbjct 1678 GCTCCCT-CCGACGAAGCG-GAGCTCATGAACATGATCGCCACCGCCGCCATCATCGACG 1735
Query 1754 ACCG-CCTTAGCTGCGTTATATACCC-AGAGGGAACG-CGTCG-CG-CGCCTCTGCCGCC 1808
||| | ||| |||||||| ||||| |||||||||| | ||| || ||| ||| ||| |
Sbjct 1736 ACCGACCT-AGCTGCGTCCGGTACCCTAGAGGGAACGGCATCGGCGTCGC-TCTTCCGTC 1793
Query 1809 TAACAACAAAGGAACTCCTTTGGAGATTGGGAAGGGAAGGATTTTAAAAGAGGGGAGTAG 1868
||||||||||||||||| || |||||||| |||||||| || || || |||||||| |
Sbjct 1794 GAACAACAAAGGAACTCCATTAGAGATTGGTAAGGGAAGAATCTTGAAGGAGGGGAGCAA 1853
Query 1869 AGTTGCCATTCTAGGG-TTCGGAACTATAGTGCAGAACTGTTTGGCGGCGGCGCAGCTTC 1927
|||||| ||||| ||| |||||||| |||||||||||||| ||||||||||| | ||||
Sbjct 1854 AGTTGCGATTCT-GGGATTCGGAACCATAGTGCAGAACTGCATGGCGGCGGCGAATCTTC 1912
Query 1928 TTC-AGGAACACGGCATCTCCGTGACCGTAGCTGATGCGAGATTCTGCAAGCCTCTGGAT 1986
| | | ||||||| ||||| || || ||||| ||||| |||||||||||||| || |||
Sbjct 1913 T-CGAACAACACGGAATCTCAGTAACAGTAGCCGATGCAAGATTCTGCAAGCCACTCGAT 1971
Query 1987 GGAGATCTGATCAAGAAGCTGGTGCAGGAGCATGAAGTTCTCATCACTGTTGAAGAGGGA 2046
|| ||| |||| ||||| |||||||||||||||||||| ||||||||||||||||| |||
Sbjct 1972 GGGGATTTGATAAAGAAACTGGTGCAGGAGCATGAAGTACTCATCACTGTTGAAGAAGGA 2031
Query 2047 TCTATTGGTGGATTCAGCGCCCATATTTCTCATTTCTTATCCCTCAACGGACT-GCTCGA 2105
|| || ||||||||||| || || |||||||||||||| |||||||| || || ||||||
Sbjct 2032 TCCATCGGTGGATTCAGTGCTCACATTTCTCATTTCTTGTCCCTCAATGG-CTTGCTCGA 2090
Query 2106 CGGGAACCTTAAGTGGAGGCCAATGGTGCTCCCCGACAGATACATTGATCATGGAGCACA 2165
|| ||||| |||||||||||||||||| || || || || ||||||||||||||||||||
Sbjct 2091 TGGAAACCTCAAGTGGAGGCCAATGGTTCTTCCAGATAGGTACATTGATCATGGAGCACA 2150
Query 2166 GACTGATCAAATTGAAGAAGCTGGGCTGAGCCCCAAGCACATCGCAGGGACTGTTGTGTC 2225
|| ||||||||| |||||||| |||||||| || ||||| || |||||||||||||| ||
Sbjct 2151 GAGTGATCAAATAGAAGAAGCAGGGCTGAGTCCTAAGCATATTGCAGGGACTGTTGTTTC 2210
Query 2226 ACTT-ATTGGTGGGGGAAAAGACAGTCTTCATCTCATCAACAACTTGTAATCTTACTTT 2283
| || ||||| || ||| || ||||||||||| | || || || ||||||| ||| |||
Sbjct 2211 A-TTGATTGGAGGAGGAAAGGACAGTCTTCATTTGATTAATAATTTGTAATATTATTTT 2268
其中:Query表示丹参DXS2的核酸序列;Subject表示薄荷DXS2的核酸序列(GenBankAccession No.AF019383)。比较结果显示:在2522个核苷酸的比对中两者有83%的相似性。
表3.本发明的丹参1-脱氧木酮糖-5-磷酸合成酶II与薄荷1-脱氧木酮糖-5-磷酸合成酶II氨基酸序列的同源比较(FASTA)
Query 1 MASSCGVINSSFLPLLHSENSSSLLSRTTATLPPKKHKFSVVAALQQDNTNDVAANGESL 60
MASSCGVI SSFLP LHSE+S+ LSR +LP K HK +VVAALQQD++NDV +G +L
Sbjct 1 MASSCGVIKSSFLPSLHSEDST-FLSRAPTSLPLKNHKLNVVAALQQDSSNDVVPSGDRL 59
Query 61 TRQKTRALNFTGDKPPTPILDTINYPNHMKNLSVEELEGLADELREEIVYTVSKTGGHLS 120
+R K+RAL+FTG+KPP PILDTINYPNHMKNLSVEEL LADELREEIVYTVSKTGGHLS
Sbjct 60 SRPKSRALSFTGEKPPIPILDTINYPNHMKNLSVEELANLADELREEIVYTVSKTGGHLS 119
Query 121 SSLGVSELTVALHHVFNTPEDKIIWDVGHQAYPHEILTGRRSRMHTIRQTFGLAGFPKRD 180
SSLGVSELTVALHHVFNTP+DKIIWDVGHQAYPH+ILTGRR+RMHTIRQTFGLAGFPKRD
Sbjct 120 SSLGVSELTVALHHVFNTPDDKIIWDVGHQAYPHKILTGRRARMHTIRQTFGLAGFPKRD 179
Query 181 ESAHDAFGAGHSSTSISAGLGMAVGRDLLHKNNHVISVIGDGAMTAGQAYEALNNAGFLD 240
ESAHDAFGAGHSSTSISAGLGMAV RDLL KNNHVISVIGDGAMTAGQAYEALNNAGFLD
Sbjct 180 ESAHDAFGAGHSSTSISAGLGMAVARDLLQKNNHVISVIGDGAMTAGQAYEALNNAGFLD 239
Query 241 SNLIIVLNDNKQVSLPTATIDGPAPPVGALSKALTRLQASRKFRQLREAAKGMTRQMGEQ 300
SNLIIVLNDNKQVSLPTAT+DGPAPPVGALSKALT+LQASRKFRQLREAAK MT+QMG
Sbjct 240 SNLIIVLNDNKQVSLPTATVDGPAPPVGALSKALTKLQASRKFRQLREAAKSMTKQMGAP 299
Query 301 AHEIASKVDTYMKGMMGKPGASLFEELGIYYIGPVDGHNVEDPVYIFKKVKEMPAPGPVL 360
AHEIASK+ Y+KGMMGKPGASLFEELGIYYIGPVDGHNVED VYIFKKVKEMPAPGPVL
Sbjct 300 AHEIASKLTQYVKGMMGKPGASLFEELGIYYIGPVDGHNVEDLVYIFKKVKEMPAPGPVL 359
Query 361 IHIITEKGKGYSPAEVAADKMHGVVKFDPTTGKQLKSKTNTKSYTQYFAESLVAEAEHDD 420
IHIITEKGKGY PAE+AADKMHGVVKFD TGKQ+K+K TKSYTQYFAESLVAEAEHDD
Sbjct 360 IHIITEKGKGYPPAEIAADKMHGVVKFDAKTGKQMKTKNKTKSYTQYFAESLVAEAEHDD 419
Query 421 RIVAIHAAMGGGTGLNYFQKRFPDRCFDVGIAEQHAVTFAAGLATEGLKPFCTIYSSFLQ 480
+IVAIHAAMGGGTGLN FQK+FPDRCFDVGIAEQHAVTFAAG+A EGLKPFC IYSSFLQ
Sbjct 420 KIVAIHAAMGGGTGLNIFQKQFPDRCFDVGIAEQHAVTFAAGMAAEGLKPFCAIYSSFLQ 479
Query 481 RGYDQVVHDVDLQKLPVRFMMDRAGVVGADGPTHCGAFDTTYMACLPNMFVMASSDKLDL 540
RGYDQVVHDVDLQKLPVRFMMDRAGVVGADGPTHCGAFDTTYMACLPNM VMA SD+ +L
Sbjct 480 RGYDQVVHDVDLQKLPVRFMMDRAGVVGADGPTHCGAFDTTYMACLPNMVVMAPSDEAEL 539
Query 541 MHMIATAAAIDDRLSCVIYPEGTR-RAPLPPNNKGTPLEIGKGRILKEGSRVAILGFGTI 599
M+MIATAA IDDR SCV YP G LP NNKGTPLEIGKGRILKEGS+VAILGFGTI
Sbjct 540 MNMIATAAIIDDRPSCVRYPRGNGIGVALPSNNKGTPLEIGKGRILKEGSKVAILGFGTI 599
Query 600 VQNCLAAAQLLQEHGISVTVADARFCKPLDGDLIKKLVQEHEVLITVEEGSIGGFSAHIS 659
VQNC+AAA LL++HGISVTVADARFCKPLDGDLIKKLVQEHEVLITVEEGSIGGFSAHIS
Sbjct 600 VQNCMAAANLLEQHGISVTVADARFCKPLDGDLIKKLVQEHEVLITVEEGSIGGFSAHIS 659
Query 660 HFLSLNGLLDGNLKWRPMVLPDRYIDHGAQTDQIEEAGLSPKHIAGTVVSLIGGGKDSLH 719
HFLSLNGLLDGNLKWRPMVLPDRYIDHGAQ+DQIEEAGLSPKHIAGTVVSLIGGGKDSLH
Sbjct 660 HFLSLNGLLDGNLKWRPMVLPDRYIDHGAQSDQIEEAGLSPKHIAGTVVSLIGGGKDSLH 719
Query 720 LINNL 724
LINNL
Sbjct 720 LINNL 724
其中:Query表示丹参DXS2的氨基酸序列;Subject表示薄荷DXS2的氨基酸序列(GenBank Accession No.AAC33513);相同的氨基酸在两个序列之间用氨基酸单字符标出。比较结果显示:在724个氨基酸的比对中,两者分别有88%的相同性和93%的相似性。
实施例3(丹参1-脱氧木酮糖-5-磷酸合成酶II或多肽在大肠杆菌中进行原核表达及提纯)
在该实施例中,将全长的丹参1-脱氧木酮糖-5-磷酸合成酶II基因编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
1、原核表达载体的构建以及转化大肠杆菌
根据丹参DXS2的核苷酸序列,设计扩增出蛋白编码区的引物,并在正反引物上分别引入限制性内切酶位点(这根据选用的pET32a(+)载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将丹参DXS2基因在保证阅读框正确的前提下克隆至pET32a(+)载体(Novagen)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌BL21,筛选鉴定得到含有pET32a(+)-DXS2表达载体的工程菌BL21-pET32a(+)-DXS2。
2、表达Trx-DXS2重组蛋白的工程菌的分离鉴定
挑取单菌落的BL21-pET32a(+)-DXS2工程菌于3mL含100μg/mL氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/mL氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1mL菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μL,蒸馏水45μL,二巯基乙醇5μL),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达Trx-DXS2融合蛋白的工程菌。
3、Trx-DXS2融合蛋白的提取纯化
按上述方法诱导表达Trx-DXS2融合表达蛋白的工程菌BL21-pET32a(+)-DXS2,经离心沉淀收集菌体,并根据厂家(Novagen)的说明书以BugBuster试剂和Benzonase核酸酶来纯化包涵体。包涵体可用溶解缓冲液(50mM CAPS,pH 11.0,0.3%N-lauroylsarcosine)来溶解,再用透析缓冲液(200mM Tris-HCl,pH 8.5)来透析。然后用组氨酸结合(His·Bind)树脂进行亲和层析,并经洗脱缓冲液(1M imidazole,500mM NaCl,20mM Tris-HCl pH 7.9)洗脱来收集Trx-DXS2融合蛋白。融合蛋白经肠激酶20℃酶切16小时后即可分离获得DXS2的表达蛋白。所获得的表达蛋白分子量为78.2KD,pI为6.4。
实施例4(丹参1-脱氧木酮糖-5-磷酸合成酶II或多肽在丹参中进行真核细胞表达及转基因发根中丹参酮含量测定)
含目的基因(丹参1-脱氧木酮糖-5-磷酸合成酶II)的表达载体的构建,根据丹参1-脱氧木酮糖-5-磷酸合成酶II的全长序列(SEQ ID NO.1),设计扩增出完整编码阅读框的引物,并在上游和下游引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将丹参1-脱氧木酮糖-5-磷酸合成酶II cDNA反向克隆到双元表达载体(如pBI121),将其转入农杆菌中,遗传转化资源植物丹参。利用发根农杆菌Ri质粒介导的丹参的遗传转化过程为:
1)将发根农杆菌C58C1在使用前自冰箱取出,传代2次,传代所用固体培养基为YEB培养基;菌种在使用前接种于YEB液体培养基中,于28℃培养过夜。
2)取生长8周左右的丹参无菌嫩叶片。
3)经过夜培养的菌液,用转化液稀释为100个细菌/mL。取无菌丹参叶片,用无菌的解剖刀划以“+”字形伤口,放入上述转化中,于60rpm/min振荡培养8h,取出用无菌水冲洗3次,放入含250~500mg/L卡那霉素和不同浓度6-BA(0.5mg/L~3mg/L)的B5培养基中,每2周转移到新鲜培养基中1次,待长出毛状根后分离毛状根,转移至含250~500mg/L卡那霉素无激素的B5培养基中培养,转移4~5次直至无细菌为止,然后再转移至不含卡那霉素的无激素B5培养基中培养。
4)将在固体培养基中的毛状根的继代培养物,接种于装有100mL无激素B5培养基的500mL三角瓶中,培养温度、光照、转速等培养条件与愈伤组织液体悬浮培养条件相同,培养20天,将毛状根从培养基上取出放入冷冻干燥机中进行干燥,然后称重,贮存于-70℃备用。
5)含丹参1-脱氧木酮糖-5-磷酸合成酶II的转基因发根的丹参酮含量测定按Ge等(Plant Science,2005)的方法对表达丹参1-脱氧木酮糖-5-磷酸合成酶II的转基因发根进行丹参酮含量测定。测定结果表明:在表达丹参1-脱氧木酮糖-5-磷酸合成酶II的转基因发根中丹参酮含量同非转基因对照组的相比,提高1.9倍(P<0.05)。因此转基因结果证明:丹参1-脱氧木酮糖-5-磷酸合成酶II对促进丹参酮含量的提高有明显作用,可应用于丹参的品质改良。
核苷酸序列表
<110>上海师范大学
<120>丹参1-脱氧木酮糖-5-磷酸合成酶II基因及其编码的蛋白质和应用
<160>4
<170>PatentIn version 3.3
<210>1
<211>2522
<212>DNA
<213>丹参(Salvia miltiorrhiza)
<220>
<221>CDS
<222>(100)..(2274)
<400>1
agcacacaca acttgaaaca actctctagc ctctgtctct ctctcaaaca ttccctgcct 60
gcttcacttc cccttgggcc gagagagaga tacacagag atg gcg tcg tct tgt 114
Met Ala Ser Ser Cys
1 5
gga gtt atc aac agc agt ttc ttg cca ttg ctc cat tct gag aat tca 162
Gly Val Ile Asn Ser Ser Phe Leu Pro Leu Leu His Ser Glu Asn Ser
10 15 20
tca agc ctc tta tct cgc act act gct act ctt ccc cca aaa aag cat 210
Ser Ser Leu Leu Ser Arg Thr Thr Ala Thr Leu Pro Pro Lys Lys His
25 30 35
aag ttc tcc gtg gta gca gct ctt caa cag gat aac acc aac gac gtg 258
Lys Phe Ser Val Val Ala Ala Leu Gln Gln Asp Asn Thr Asn Asp Val
40 45 50
gct gcc aat gga gag agt ctg acg agg cag aaa aca aga gct ctc aat 306
Ala Ala Asn Gly Glu Ser Leu Thr Arg Gln Lys Thr Arg Ala Leu Asn
55 60 65
ttc acc gga gac aag cct cca act cca ata ttg gac acc atc aac tat 354
Phe Thr Gly Asp Lys Pro Pro Thr Pro Ile Leu Asp Thr Ile Asn Tyr
70 75 80 85
cca aat cac atg aaa aac ctc tcg gtc gag gaa ctg gag gga ttg gct 402
Pro Asn His Met Lys Asn Leu Ser Val Glu Glu Leu Glu Gly Leu Ala
90 95 100
gat gaa ttg agg gaa gag ata gtg tac acg gtg tcg aaa acc ggc ggc 450
Asp Glu Leu Arg Glu Glu Ile Val Tyr Thr Val Ser Lys Thr Gly Gly
105 110 115
cat tta agc tca agc tta ggt gta tcg gag ctc acg gtc gca ttg cat 498
His Leu Ser Ser Ser Leu Gly Val Ser Glu Leu Thr Val Ala Leu His
120 125 130
cat gtg ttc aac aca cct gag gat aag ata att tgg gac gtt ggc cat 546
His Val Phe Asn Thr Pro Glu Asp Lys Ile Ile Trp Asp Val Gly His
135 140 145
cag gct tat ccg cac gaa atc ctg acg ggg agg agg tcc aga atg cac 594
Gln Ala Tyr Pro His Glu Ile Leu Thr Gly Arg Arg Ser Arg Met His
150 155 160 165
acg att cgg cag act ttc gga cta gca ggg ttc cct aaa cga gac gaa 642
Thr Ile Arg Gln Thr Phe Gly Leu Ala Gly Phe Pro Lys Arg Asp Glu
170 175 180
agc gcc cac gac gcg ttc gga gcc ggc cac agc tcc act agt atc tct 690
Ser Ala His Asp Ala Phe Gly Ala Gly His Ser Ser Thr Ser Ile Ser
185 190 195
gct ggt cta ggc atg gcg gtg ggg aga gac tta tta cac aag aac aac 738
Ala Gly Leu Gly Met Ala Val Gly Arg Asp Leu Leu His Lys Asn Asn
200 205 210
cat gtg ata tca gtg atc gga gac ggc gcc atg aca gca ggg cag gcg 786
His Val Ile Ser Val Ile Gly Asp Gly Ala Met Thr Ala Gly Gln Ala
215 220 225
tac gag gcc ctc aac aat gca gga ttc ctt gat tcc aat ctc atc atc 834
Tyr Glu Ala Leu Asn Asn Ala Gly Phe Leu Asp Ser Asn Leu Ile Ile
230 235 240 245
gtg ttg aat gac aac aag cag gtc tcg ctg ccc acg gcc acc att gac 882
Val Leu Asn Asp Asn Lys Gln Val Ser Leu Pro Thr Ala Thr Ile Asp
250 255 260
ggc cct gct ccg ccc gtg gga gcc ctc agc aaa gcc ctc acg cgt ctt 930
Gly Pro Ala Pro Pro Val Gly Ala Leu Ser Lys Ala Leu Thr Arg Leu
265 270 275
caa gcc agc aga aaa ttc cgg caa ctc cgc gaa gca gca aag ggc atg 978
Gln Ala Ser Arg Lys Phe Arg Gln Leu Arg Glu Ala Ala Lys Gly Met
280 285 290
act agg cag atg gga gag cag gcc cat gaa atc gca tcc aag gtt gac 1026
Thr Arg Gln Met Gly Glu Gln Ala His Glu Ile Ala Ser Lys Val Asp
295 300 305
acc tac atg aag ggg atg atg ggg aag ccc ggc gcg tcc ctc ttc gag 1074
Thr Tyr Met Lys Gly Met Met Gly Lys Pro Gly Ala Ser Leu Phe Glu
310 315 320 325
gag ctc ggg att tac tac atc ggc ccc gtt gac ggc cac aac gtt gaa 1122
Glu Leu Gly Ile Tyr Tyr Ile Gly Pro Val Asp Gly His Asn Val Glu
330 335 340
gat ccg gtc tac att ttc aag aag gtt aaa gaa atg cct gcg cct ggg 1170
Asp Pro Val Tyr Ile Phe Lys Lys Val Lys Glu Met Pro Ala Pro Gly
345 350 355
cct gtc ctt atc cac atc atc acc gag aag ggc aaa ggc tac tct ccc 1218
Pro Val Leu Ile His Ile Ile Thr Glu Lys Gly Lys Gly Tyr Ser Pro
360 365 370
gct gaa gtt gct gcc gac aag atg cat ggt gtc gtc aag ttt gat cct 1266
Ala Glu Val Ala Ala Asp Lys Met His Gly Val Val Lys Phe Asp Pro
375 380 385
aca acc ggc aaa cag ctc aag tcc aaa acc aat act aaa tca tac act 1314
Thr Thr Gly Lys Gln Leu Lys Ser Lys Thr Asn Thr Lys Ser Tyr Thr
390 395 400 405
caa tac ttc gcc gag tct ctc gtg gcc gaa gca gag cac gac gac agg 1362
Gln Tyr Phe Ala Glu Ser Leu Val Ala Glu Ala Glu His Asp Asp Arg
410 415 420
atc gtc gcc atc cac gcc gcc atg ggg ggc ggc acg ggc ctc aac tac 1410
Ile Val Ala Ile His Ala Ala Met Gly Gly Gly Thr Gly Leu Asn Tyr
425 430 435
ttc cag aag cgc ttc ccc gac cgc tgc ttc gac gtg ggg atc gcc gag 1458
Phe Gln Lys Arg Phe Pro Asp Arg Cys Phe Asp Val Gly Ile Ala Glu
440 445 450
cag cac gcc gtc act ttc gcg gcg ggg ctc gcc acg gag ggg ctc aag 1506
Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Thr Glu Gly Leu Lys
455 460 465
ccc ttc tgc acg atc tac tcc tcg ttc ctg cag agg ggg tac gat cag 1554
Pro Phe Cys Thr Ile Tyr Ser Ser Phe Leu Gln Arg Gly Tyr Asp Gln
470 475 480 485
gtg gtc cac gac gtg gac ctt cag aag ctc ccc gtg agg ttc atg atg 1602
Val Val His Asp Val Asp Leu Gln Lys Leu Pro Val Arg Phe Met Met
490 495 500
gac cgg gct ggc gtc gtg ggc gcc gac ggc ccc acc cac tgc ggc gcc 1650
Asp Arg Ala Gly Val Val Gly Ala Asp Gly Pro Thr His Cys Gly Ala
505 510 515
ttc gac acc acc tac atg gcc tgc ctg ccc aac atg ttc gtc atg gcc 1698
Phe Asp Thr Thr Tyr Met Ala Cys Leu Pro Asn Met Phe Val Met Ala
520 525 530
tct tcc gac aag ctc gat ctc atg cac atg att gcc acc gct gcc gcc 1746
Ser Ser Asp Lys Leu Asp Leu Met His Met Ile Ala Thr Ala Ala Ala
535 540 545
att gac gac cgc ctt agc tgc gtt ata tac cca gag gga acg cgt cgc 1794
Ile Asp Asp Arg Leu Ser Cys Val Ile Tyr Pro Glu Gly Thr Arg Arg
550 555 560 565
gcg cct ctg ccg cct aac aac aaa gga act cct ttg gag att ggg aag 1842
Ala Pro Leu Pro Pro Asn Asn Lys Gly Thr Pro Leu Glu Ile Gly Lys
570 575 580
gga agg att tta aaa gag ggg agt aga gtt gcc att cta ggg ttc gga 1890
Gly Arg Ile Leu Lys Glu Gly Ser Arg Val Ala Ile Leu Gly Phe Gly
585 590 595
act ata gtg cag aac tgt ttg gcg gcg gcg cag ctt ctt cag gaa cac 1938
Thr Ile Val Gln Asn Cys Leu Ala Ala Ala Gln Leu Leu Gln Glu His
600 605 610
ggc atc tcc gtg acc gta gct gat gcg aga ttc tgc aag cct ctg gat 1986
Gly Ile Ser Val Thr Val Ala Asp Ala Arg Phe Cys Lys Pro Leu Asp
615 620 625
gga gat ctg atc aag aag ctg gtg cag gag cat gaa gtt ctc atc act 2034
Gly Asp Leu Ile Lys Lys Leu Val Gln Glu His Glu Val Leu Ile Thr
630 635 640 645
gtt gaa gag gga tct att ggt gga ttc agc gcc cat att tct cat ttc 2082
Val Glu Glu Gly Ser Ile Gly Gly Phe Ser Ala His Ile Ser His Phe
650 655 660
tta tcc ctc aac gga ctg ctc gac ggg aac ctt aag tgg agg cca atg 2130
Leu Ser Leu Asn Gly Leu Leu Asp Gly Asn Leu Lys Trp Arg Pro Met
665 670 675
gtg ctc ccc gac aga tac att gat cat gga gca cag act gat caa att 2178
Val Leu Pro Asp Arg Tyr Ile Asp His Gly Ala Gln Thr Asp Gln Ile
680 685 690
gaa gaa gct ggg ctg agc ccc aag cac atc gca ggg act gtt gtg tca 2226
Glu Glu Ala Gly Leu Ser Pro Lys His Ile Ala Gly Thr Val Val Ser
695 700 705
ctt att ggt ggg gga aaa gac agt ctt cat ctc atc aac aac ttg taa 2274
Leu Ile Gly Gly Gly Lys Asp Ser Leu His Leu Ile Asn Asn Leu
710 715 720
tcttactttc atccagcaaa gccagaagcg gaagcagtag cagttcatct cctcagagat 2334
taatgtttta tatgatgtaa tgaaatgtaa atatggggaa agattgcgac tggaagactc 2394
caacccacca atgtggggga gttgttctaa ataatccttc acacggcagc cttatgtttt 2454
gtacacacaa ataatcactt catactttta ttaaataaat ttatttgtcc caaaaaaaaa 2514
aaaaaaaa 2522
<210>2
<211>724
<212>PRT
<213>丹参(Salvia miltiorrhiza)
<400>2
Met Ala Ser Ser Cys Gly Val Ile Asn Ser Ser Phe Leu Pro Leu Leu
1 5 10 15
Hi s Ser Glu Asn Ser Ser Ser Leu Leu Ser Arg Thr Thr Ala Thr Leu
20 25 30
Pro Pro Lys Lys His Lys Phe Ser Val Val Ala Ala Leu Gln Gln Asp
35 40 45
Asn Thr Asn Asp Val Ala Ala Asn Gly Glu Ser Leu Thr Arg Gln Lys
50 55 60
Thr Arg Ala Leu Asn Phe Thr Gly Asp Lys Pro Pro Thr Pro Ile Leu
65 70 75 80
Asp Thr Ile Asn Tyr Pro Asn His Met Lys Asn Leu Ser Val Glu Glu
85 90 95
Leu Glu Gly Leu Ala Asp Glu Leu Arg Glu Glu Ile Val Tyr Thr Val
100 105 110
Ser Lys Thr Gly Gly His Leu Ser Ser Ser Leu Gly Val Ser Glu Leu
115 120 125
Thr Val Ala Leu His His Val Phe Asn Thr Pro Glu Asp Lys Ile Ile
130 135 140
Trp Asp Val Gly His Gln Ala Tyr Pro His Glu Ile Leu Thr Gly Arg
145 150 155 160
Arg Ser Arg Met His Thr Ile Arg Gln Thr Phe Gly Leu Ala Gly Phe
165 170 175
Pro Lys Arg Asp Glu Ser Ala His Asp Ala Phe Gly Ala Gly His Ser
180 185 190
Ser Thr Ser Ile Ser Ala Gly Leu Gly Met Ala Val Gly Arg Asp Leu
195 200 205
Leu His Lys Asn Asn His Val Ile Ser Val Ile Gly Asp Gly Ala Met
210 215 220
Thr Ala Gly Gln Ala Tyr Glu Ala Leu Asn Asn Ala Gly Phe Leu Asp
225 230 235 240
Ser Asn Leu Ile Ile Val Leu Asn Asp Asn Lys Gln Val Ser Leu Pro
245 250 255
Thr Ala Thr Ile Asp Gly Pro Ala Pro Pro Val Gly Ala Leu Ser Lys
260 265 270
Ala Leu Thr Arg Leu Gln Ala Ser Arg Lys Phe Arg Gln Leu Arg Glu
275 280 285
Ala Ala Lys Gly Met Thr Arg Gln Met Gly Glu Gln Ala His Glu Ile
290 295 300
Ala Ser Lys Val Asp Thr Tyr Met Lys Gly Met Met Gly Lys Pro Gly
305 310 315 320
Ala Ser Leu Phe Glu Glu Leu Gly Ile Tyr Tyr Ile Gly Pro Val Asp
325 330 335
Gly His Asn Val Glu Asp Pro Val Tyr Ile Phe Lys Lys Val Lys Glu
340 345 350
Met Pro Ala Pro Gly Pro Val Leu Ile His Ile Ile Thr Glu Lys Gly
355 360 365
Lys Gly Tyr Ser Pro Ala Glu Val Ala Ala Asp Lys Met His Gly Val
370 375 380
Val Lys Phe Asp Pro Thr Thr Gly Lys Gln Leu Lys Ser Lys Thr Asn
385 390 395 400
Thr Lys Ser Tyr Thr Gln Tyr Phe Ala Glu Ser Leu Val Ala Glu Ala
405 410 415
Glu His Asp Asp Arg Ile Val Ala Ile His Ala Ala Met Gly Gly Gly
420 425 430
Thr Gly Leu Asn Tyr Phe Gln Lys Arg Phe Pro Asp Arg Cys Phe Asp
435 440 445
Val Gly Ile Ala Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala
450 455 460
Thr Glu Gly Leu Lys Pro Phe Cys Thr Ile Tyr Ser Ser Phe Leu Gln
465 470 475 480
Arg Gly Tyr Asp Gln Val Val His Asp Val Asp Leu Gln Lys Leu Pro
485 490 495
Val Arg Phe Met Met Asp Arg Ala Gly Val Val Gly Ala Asp Gly Pro
500 505 510
Thr His Cys Gly Ala Phe Asp Thr Thr Tyr Met Ala Cys Leu Pro Asn
515 520 525
Met Phe Val Met Ala Ser Ser Asp Lys Leu Asp Leu Met His Met Ile
530 535 540
Ala Thr Ala Ala Ala Ile Asp Asp Arg Leu Ser Cys Val Ile Tyr Pro
545 550 555 560
Glu Gly Thr Arg Arg Ala Pro Leu Pro Pro Asn Asn Lys Gly Thr Pro
565 570 575
Leu Glu Ile Gly Lys Gly Arg Ile Leu Lys Glu Gly Ser Arg Val Ala
580 585 590
Ile Leu Gly Phe Gly Thr Ile Val Gln Asn Cys Leu Ala Ala Ala Gln
595 600 605
Leu Leu Gln Glu His Gly Ile Ser Val Thr Val Ala Asp Ala Arg Phe
610 615 620
Cys Lys Pro Leu Asp Gly Asp Leu Ile Lys Lys Leu Val Gln Glu His
625 630 635 640
Glu Val Leu Ile Thr Val Glu Glu Gly Ser Ile Gly Gly Phe Ser Ala
645 650 655
His Ile Ser His Phe Leu Ser Leu Asn Gly Leu Leu Asp Gly Asn Leu
660 665 670
Lys Trp Arg Pro Met Val Leu Pro Asp Arg Tyr Ile Asp His Gly Ala
675 680 685
Gln Thr Asp Gln Ile Glu Glu Ala Gly Leu Ser Pro Lys His Ile Ala
690 695 700
Gly Thr Val Val Ser Leu Ile Gly Gly Gly Lys Asp Ser Leu His Leu
705 710 715 720
Ile Asn Asn Leu
<210>3
<211>23
<212>DNA
<213>丹参(Salvia miltiorrhiza)
<400>3
AGCACACACAACTTGAAACAACT
<210>4
<211>23
<212>DNA
<213>丹参(Salvia miltiorrhiza)
<400>4
GGGACAAATAAATTTATTTAATA
Claims (7)
1.一种丹参1-脱氧木酮糖-5-磷酸合成酶II基因,其特征在于,其核苷酸序列如SEQ IDNo.1中所述的第100~2274位的核苷酸序列。
2.一种权利要求1所述的丹参1-脱氧木酮糖-5-磷酸合成酶II基因编码的蛋白质,其特征在于,其氨基酸序列如SEQ ID No.2所述。
3.一种质粒,其特征在于,其含有权利要求1所述的基因全序列。
4.一种植物表达载体,其特征在于,其含有权利要求1所述的基因全序列。
5.一种宿主细胞,其特征在于,其含有权利要求1所述的基因全序列。
6.一种权利要求1所述的丹参1-脱氧木酮糖-5-磷酸合成酶II基因的应用,其特征在于,用权利要求4所述的植物表达载体转化丹参细胞。
7.一种权利要求1所述的丹参1-脱氧木酮糖-5-磷酸合成酶II基因的应用,其特征在于,用权利要求1所述的1-脱氧木酮糖-5-磷酸合成酶II基因序列提供一种转基因丹参。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100454465A CN101475947B (zh) | 2009-01-16 | 2009-01-16 | 丹参1-脱氧木酮糖-5-磷酸合成酶ⅱ基因及其编码的蛋白质和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100454465A CN101475947B (zh) | 2009-01-16 | 2009-01-16 | 丹参1-脱氧木酮糖-5-磷酸合成酶ⅱ基因及其编码的蛋白质和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101475947A CN101475947A (zh) | 2009-07-08 |
CN101475947B true CN101475947B (zh) | 2011-02-09 |
Family
ID=40836726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100454465A Expired - Fee Related CN101475947B (zh) | 2009-01-16 | 2009-01-16 | 丹参1-脱氧木酮糖-5-磷酸合成酶ⅱ基因及其编码的蛋白质和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101475947B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102747048B (zh) * | 2011-04-20 | 2013-12-04 | 中国医学科学院病原生物学研究所 | 一种结核杆菌候选抗原及其应用 |
CN102337279B (zh) * | 2011-06-22 | 2013-06-05 | 上海师范大学 | SmHMGR和SmDXR双基因共转化提高丹参毛状根中丹参酮含量的方法 |
-
2009
- 2009-01-16 CN CN2009100454465A patent/CN101475947B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101475947A (zh) | 2009-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101475946B (zh) | 丹参牻牛儿基牻牛儿基焦磷酸合成酶基因及其编码的蛋白质和应用 | |
CN101928717A (zh) | 丹参鲨烯合酶(SmSQS)基因及其编码的蛋白和应用 | |
CN101250544B (zh) | 丹参3-羟基-3-甲基戊二酰辅酶a还原酶基因及其编码的蛋白质和应用 | |
CN101012462B (zh) | 萝芙木色氨酸脱羧酶蛋白编码序列 | |
CN102220353A (zh) | 甘薯肉桂酸-4-羟化酶蛋白编码序列及其应用 | |
CN101250541B (zh) | 丹参1-脱氧木酮糖-5-磷酸合成酶基因1及其编码的蛋白质和应用 | |
CN101475947B (zh) | 丹参1-脱氧木酮糖-5-磷酸合成酶ⅱ基因及其编码的蛋白质和应用 | |
CN101250543B (zh) | 日本蛇根草异胡豆苷合成酶基因及其编码的蛋白质和应用 | |
CN102604975A (zh) | 一种竹节人参角鲨烯合成酶基因及其应用 | |
CN101250545B (zh) | 三分三1,4-丁二胺-氮-甲基转移酶基因1及其编码的蛋白质和应用 | |
CN101250542B (zh) | 丹参3-羟基-3-甲基戊二酰辅酶a合成酶基因及其编码的蛋白质和应用 | |
CN102304530B (zh) | 斜生纤孔菌3-羟基-3-甲基戊二酰辅酶a还原酶基因及其编码的蛋白质和应用 | |
CN101168740B (zh) | 三分三托品酮还原酶ⅰ基因及其编码的蛋白质和应用 | |
CN100360664C (zh) | 南京椴3-羟基-3-甲基戊二酰辅酶a还原酶蛋白的核苷酸序列和氨基酸序列 | |
CN101200723B (zh) | 蝴蝶兰PhPI9基因编码序列及其应用 | |
CN104388446B (zh) | 邳半夏鲨烯合酶基因及其编码的蛋白质与应用 | |
CN101736019B (zh) | 麻疯树香叶基香叶基焦磷酸合成酶蛋白及其编码基因 | |
CN1760363B (zh) | 杜仲3-羟基-3-甲基戊二酰辅酶a还原酶蛋白编码序列 | |
CN101168739A (zh) | 三分三托品酮还原酶ⅱ基因及其编码的蛋白质和应用 | |
CN102399798B (zh) | 斜生纤孔菌鲨烯合酶基因及其编码的蛋白质和应用 | |
CN101250540B (zh) | 喜树3-羟基-3-甲基戊二酰辅酶a合成酶基因及其编码的蛋白质和应用 | |
CN100406559C (zh) | 乐昌含笑3-羟基-3-甲基戊二酰辅酶a还原酶蛋白编码序列 | |
CN1995355B (zh) | 青蒿1-羟基-2-甲基-2-(e)-丁烯基4-焦磷酸还原酶蛋白编码序列 | |
CN101538575A (zh) | 三分三莨菪碱6β-羟化酶基因及其编码的蛋白质和应用 | |
CN101798577B (zh) | 麻疯树八氢番茄红素合成酶基因序列及在植物中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110209 Termination date: 20140116 |