CN108624544B - 阿卡波糖工程菌及其制备方法和应用 - Google Patents
阿卡波糖工程菌及其制备方法和应用 Download PDFInfo
- Publication number
- CN108624544B CN108624544B CN201710165472.6A CN201710165472A CN108624544B CN 108624544 B CN108624544 B CN 108624544B CN 201710165472 A CN201710165472 A CN 201710165472A CN 108624544 B CN108624544 B CN 108624544B
- Authority
- CN
- China
- Prior art keywords
- gene
- seq
- sequence
- acarbose
- ala
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/365—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinoplanes (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明属于生物工程领域,涉及一种生产阿卡波糖的工程菌以及该菌的制备方法和应用。所述阿卡波糖工程菌是产阿卡波糖的游动放线菌或其衍生菌株,其中以下一个或两个基因失活:(i)编码序列如SEQ ID NO:2所示或与SEQ ID NO:2所示序列有至少80%、90%、95%或99%序列同一性的多肽的基因M;(ii)编码序列如SEQ ID NO:3所示或与SEQ ID NO:3所示序列有至少80%、90%、95%或99%序列同一性的多肽的基因N。利用本发明的阿卡波糖工程菌生产阿卡波糖,产品中杂质A组分和/或B组分的含量显著降低,保证了产品质量,不需后续提纯步骤或提纯步骤相对简单,减少工艺步骤,降低了成本。
Description
技术领域
本发明属于生物工程领域,涉及一种生产阿卡波糖的工程菌以及该菌的制备方法和应用。
背景技术
据统计,目前我国糖尿病患者人数已达1.1亿人,中国已成为世界糖尿病人最多的国家。此外,中国还有约1.5亿人为糖尿病前期。单单用于糖尿病管理,现在中国每年就要投入近1734亿人民币;而用于糖尿病的直接医疗支出已经占到中国医疗支出的13%。。
游动放线菌(Actinoplanes sp.)产生的降糖药阿卡波糖是II型糖尿病的首选治疗药物,国内年销售额已近20亿元。目前阿卡波糖在生产上主要存在杂质组分问题,严重影响产品质量;其中最为突出的是杂质A、B和C组分(各组分结构见图1所示)。一般情况下,产品中对A、B组分含量的要求均在0.5wt%以下(相对于阿卡波糖含量),杂质含量不达标的产品不能进入销售渠道。然而现有的由游动放线菌发酵工程生产的阿卡波糖中,A和B组分含量一般分别在10wt%和3wt%以上,即使较为优秀的菌种,其A和B组分含量也在1wt%以上。为保证产品质量,需要进行后续提纯步骤,导致工艺复杂,生产成本提高。
目前使用较多的是通过控制发酵过程来控制杂质组分的含量,但是该方法不稳定。
发明内容
本发明的目的是提供一种新的阿卡波糖工程菌,其生产的产品中杂质A组分和B组分含量降低;同时还提供该菌的生产方式和应用等,以解决现有技术的上述问题。
在第一个方面,本发明提供一种阿卡波糖工程菌,所述阿卡波糖工程菌是产阿卡波糖的游动放线菌(Actinoplanes sp.)或其衍生菌株,其中以下一个或两个基因失活:
(i)编码序列如SEQ ID NO:2所示或与SEQ ID NO:2所示序列有至少80%、90%、95%或99%序列同一性的多肽的基因M;
(ii)编码序列如SEQ ID NO:3所示或与SEQ ID NO:3所示序列有至少80%、90%、95%或99%序列同一性的多肽的基因N。
在本发明中,“至少X%序列同一性”是指要比较的两个多肽的氨基酸序列之间的百分比相同性,其是在所述两个氨基酸序列的最佳排列对比后获得的。所述最佳排列对比可以通过使用本领域已知的任何方法获得,例如Smith and Waterman,Adv.Appl.Math.2:482(1981)的局部同源算法,Needleman and Wunsch,J.Mol.Biol.48:443(1970)的同源排列算法,Pearson and Lipman,Proc.Natl.Acad.Sci.85:2444(1988)的相似性搜索方法及这些算法的计算机执行程序,如由NCBI站点上可用的BLAST P计算机软件所使用的那些。
本领域技术人员可以合理推断,在同一种属中,序列与参考多肽的氨基酸序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的多肽与参考多肽在生物体中执行相同的生物学功能。例如,在本发明所述游动放线菌中,本领域技术人员能够合理预期序列与SEQ ID NO:3所示氨基酸序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的多肽与由SEQ ID NO:3所示氨基酸序列组成的多肽在生物体中执行相同的生物学功能,因此失活序列与SEQ IDNO:3所示氨基酸序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的多肽可以获得与失活SEQ ID NO:3所示氨基酸序列的多肽相同的效果,例如降低或去除阿卡波糖A和B杂质组分含量。
利用游动放线菌生产阿卡波糖是本领域常规技术,因此,本领域技术人员可以毫无疑义地知道产阿卡波糖的游动放线菌或其衍生菌株可以是哪些具体菌株。优选地,所述游动放线菌是游动放线菌SN223/29或其衍生菌株。进一步优选地,所述产阿卡波糖的游动放线菌是保藏号为CGMCC No.7639的游动放线菌(Actinoplanes sp.)8-22或其衍生菌株。
优选地,所述基因M的序列如SEQ ID NO:4所示或为与SEQ ID NO:4所示序列有至少80%、90%、95%或99%序列同一性的序列,所述基因N的序列如SEQ ID NO:5所示或为与SEQ ID NO:5所示序列有至少80%、90%、95%或99%序列同一性的序列。本领域技术人员应该理解,与SEQ ID NO:4或SEQ ID NO:5所示序列有至少80%、90%、95%或99%序列同一性的序列的基因,编码与SEQ ID NO:4或SEQ ID NO:5所编码的多肽具有相同或相似的功能的多肽。
当基因M的序列为SEQ ID NO:4所示时,基因M实质上为bglY基因,编码bglY蛋白(SEQ ID NO:2所示蛋白),其详细信息见Genbank CP003170.1:5899370-5900680。
当基因N的序列为SEQ ID NO:5所示时,基因N实质上为mpbG基因,编码mpbG蛋白(SEQ ID NO:3所示蛋白)。
在优选的实施方式中,所述阿卡波糖工程菌中,基因M或基因N失活为基因M或基因N缺失。
进一步优选地,所述基因M缺失中,缺失的片段为SEQ ID NO:4的第67-1297位核苷酸;所述基因N缺失中,缺失的片段为SEQ ID NO:5的第108-1098位核苷酸。
本领域技术人员应该理解,基因失活指基因编码的多肽量减少或不编码多肽,或编码的多肽长度缺失从而导致多肽活性降低或无活性。基因缺失包括基因的完全缺失和部分缺失,均可以导致上述的基因失活。任何形式的基因失活以及能够使基因失活的任何形式的基因缺失,都属于本发明的范畴之内。
进一步优选地,所述阿卡波糖工程菌是游动放线菌工程菌△BY-3或△MG-4,其中,△BY-3是游动放线菌8-22与序列为SEQ ID NO:13的DNA片段发生同源重组而形成的,△MG-4是游动放线菌8-22与序列为SEQ ID NO:18的DNA片段发生同源重组而形成的。
同源重组是生物工程领域的常规技术。进行同源重组的DNA片段的5’端和3’端分别包括待失活的基因的5’端和3’端,缺少待失活基因编码序列的中间部分。所述DNA片段能够与游动放线菌中待失活基因的上下游发生同源重组,从而将DNA片段重组至游动放线菌的基因组中,因其缺少待失活基因编码序列的中间部分,使得待失活基因无法正常表达产物或不表达,因而使构建的游动放线菌中的该基因失活。在本发明的具体实施方式中,实施同源重组的方式为接合转移。
在第二个方面,本发明提供所述阿卡波糖工程菌的制备方法,所述方法包括将产阿卡波糖的游动放线菌或其衍生菌株中的以下一个或两个基因失活:
(i)编码序列如SEQ ID NO:2所示或与SEQ ID NO:2所示序列有至少80%、90%、95%或99%序列同一性的多肽的基因M;
(ii)编码序列如SEQ ID NO:3所示或与SEQ ID NO:3所示序列有至少80%、90%、95%或99%序列同一性的多肽的基因N;
所述产阿卡波糖的游动放线菌或其衍生菌株已在上文描述。优选地,所述产阿卡波糖的游动放线菌是游动放线菌SN223/29或其衍生菌株;在进一步优选的实施方式中,所述产阿卡波糖的游动放线菌是保藏号为CGMCC No.7639的游动放线菌8-22或其衍生菌株。
所述基因M和基因N的序列已在上文描述。
如上所述,基因失活指基因编码的多肽量减少或不编码多肽,或编码的多肽长度缺失从而导致多肽活性降低或无活性。本领域技术人员已知,在生物工程领域中,基因失活是常规技术手段,可以通过多种方式实现。比如,基因敲除、突变、插入失活、同源重组、RNA干扰等。本发明即使用同源重组的方式使基因M和基因N失活。凡是可以使基因如上所述失活的任何技术手段都在本发明的范围之内。
进一步优选地,所述失活是使所述游动放线菌8-22与序列为SEQ ID NO:13或SEQID NO:18的DNA片段发生同源重组。
在第三个方面,提供本发明的阿卡波糖工程菌在制备阿卡波糖中的应用。
在第四个方面,提供一种阿卡波糖产品,由培养本发明的阿卡波糖工程菌经发酵获得。
在第五个方面,提供基因M或其编码的多肽或基因N或其编码的多肽在制备杂质A组分和/或B组分含量降低的阿卡波糖工程菌中的应用。其中,基因M或其编码的多肽或基因N或其编码的多肽的信息已在上文中描述。
利用本发明提供的阿卡波糖工程菌生产的阿卡波糖产品中,杂质A组分和B组分的含量由出发菌的1.4wt%和1.31wt%分别下降至约0.5wt%和约0.2wt%,下降幅度十分显著,而阿卡波糖的发酵单位没有受到任何影响。利用本发明的阿卡波糖工程菌生产阿卡波糖,产品中杂质A组分和B组分的含量显著降低,保证了产品质量,不需后续提纯步骤或提纯步骤相对简单,减少工艺步骤,降低了成本。
附图说明
图1:阿卡波糖及杂质A、B、C组分和糖苷配基的结构;
图2:质粒pBS-BY334的物理图谱;
图3:质粒pBS-BYHS的物理图谱;
图4:质粒pBS-BYHS-AmT的物理图谱;
图5:缺失内部1231个碱基的bglY基因示意图;
图6:质粒pBS-MG334的物理图谱;
图7:载体supAmT的物理图谱;
图8:质粒SAT-MG512的物理图谱;图中XbaIM表示该XbaI酶切位点的A碱基被甲基化而不能被核酸内切酶XbaI切开;
图9:质粒SAT-MGHS的物理图谱;
图10:缺失内部991个碱基的mpbG基因示意图。
具体实施方式
根据文献报导(Appl Microbiol Biotechnol.2008,80:767-778),产生阿卡波糖杂质C组分有两条途径:一是阿卡波糖经过treY基因编码的麦芽寡糖基海藻糖合酶催化反应直接得到C组分;二是由treS基因编码的海藻糖酶合成海藻糖,再进入合成途径得到C组分。由此我们推测,产生阿卡波糖杂质A组分的途径也与产生C组分的途径相似:某个特定的酶催化蔗糖得到麦芽酮糖(maltulose),渗入到阿卡波糖的合成途径中,最终形成杂质A组分。只要失活编码这个特定的酶的基因,理论上就能阻断麦芽酮糖的合成,从而降低或去除杂质A组分。
因此,如何筛选到与麦芽酮糖合成相关的酶基因是降低或去除杂质A组分的关键所在。但是迄今为止关于麦芽酮糖的生物合成途径却鲜有文献报导,无法通过现有技术获得与麦芽酮糖合成相关的酶基因。从NCBI网站上(https://www.ncbi.nlm.nih.gov/nuccore/?term=maltulose)能检索到的与麦芽酮糖相关的基因为agl基因,编码α-葡萄糖苷酶。据文献(Appl Environ Microbiol.2009,75(4):1135-1143;Caries Res.2003,37(6):410-415;J Biol Chem.2006,281(26):17900-17908;J Biol Chem.2001,276(40):37415-37425)报导,α-葡萄糖苷酶主要与麦芽酮糖的代谢有关,而不是与合成有关。游动放线菌Actinoplanes sp.SE50/110的基因组已经测序(Genbank CP003170.1)。我们从NCBI上搜索了蔗糖异构酶aglB(Genbank AF337811.1),并以AglB的氨基酸序列(SEQ ID NO:1)为基础,与游动放线菌基因组进行比对,筛选得到bglY基因(Genbank CP003170.1:5899370-5900680)和mpbG基因(SEQ ID NO:5),其氨基酸序列与蔗糖异构酶基因的相似度分别为45%和44%,进一步试验验证失活这两个基因是否能阻断杂质A组分的产生。
基于上述的分析,发明人进行了以下实验并完成本发明。下面将结合具体实施例和附图说明本发明,但本发明的内容不限于此。如没有特殊说明,下面实施例中所使用的试剂均是常规化学试剂商店可购得的;所使用的方法及其参数都是本领域技术人员根据现有技术或公知常识可以完成的。为了便于描述,本专利中所涉及的方法列举如下:
游动放线菌基因组的分离(在实施例中以“提取基因组DNA”描述):取游动放线菌8-22冻存管菌液(申请人所有)200μl接种于30ml TSB培养基(Bacto TM Tryptic SoyBroth.BD公司,货号211825),28℃,220rpm培养48hr后,于50ml离心管中,4000rpm离心10分钟,去上清,沉淀用30ml蔗糖-Tris缓冲液(10.3%蔗糖,10mM Tris-HCl,pH8.0)洗涤2遍后,以5ml蔗糖-Tris缓冲液悬浮。加入100mg/ml溶菌酶溶液20μl,37℃水浴2hr。加入10%SDS溶液500μl,温和颠倒直至基本澄清。加酚-氯仿-异戊醇(25:24:1,pH8.0)溶液5ml,温和颠倒数次后,4000rpm离心10分钟。取上层溶液4ml,加酚-氯仿-异戊醇(25:24:1,pH8.0)溶液4ml,温和颠倒数次后4000rpm离心10分钟。取上层溶液3ml,加入3mol/L的HAc/NaAc缓冲液(pH5.3)300μl,异丙醇3ml,温和颠倒数次后,将结团的沉淀用吸头挑到1.5ml离心管中。沉淀用70%乙醇洗涤2遍后,室温干燥。加入500μl Tris-HCl(pH8.0)溶解,得到游动放线菌8-22的总DNA。
DNA的酶切(使用TaKaRa的核酸内切酶),末端补平(使用TaKaRa的BKL试剂盒,产品编号:6127A)、连接(使用TaKaRa的Solution I,产品编号6022Q)和PCR反应(PCR检验使用TaKaRa的Taq酶,产品编号R001;扩增目的基因片段使用TaKaRa的PrimeSTAR酶,产品编号R010Q)均为本领域公知的方法,具体可参见相应的产品说明书;质粒转化到大肠杆菌的方法为本领域公知的CaCl2法。
本发明使用的游动放线菌(Actinoplanes sp.)8-22是保藏在中国微生物菌种保藏管理委员会普通微生物中心(CGMCC)(北京市朝阳区北辰西路1号院3号)的编号为CGMCCNo.7639的游动放线菌,保藏日期为2013年5月24日。所述游动放线菌8-22不产孢,气生菌丝生长紧致,颜色由橙色至棕黄色,产色素。
实施例1-1:构建用于失活bglY基因的重组质粒pBS-BYHS-AMT
a)以引物BY3F53(SEQ ID NO:6)/BY3R54(SEQ ID NO:7)从游动放线菌8-22基因组DNA扩增得到3.1kb左右的片段BY334(SEQ ID NO:23),将该片段磷酸化后,插入到载体pBluKS(Genebank X52331.1)的HincII位点,得到质粒pBS-BY334(片段的插入方向见图2);
b)以HisunHF(SEQ ID NO:9)/HisunCR(SEQ ID NO:10)为引物,以单链(SEQ IDNO:8)为模板,扩增得到片段HHCPCR(SEQ ID NO:24)。将质粒pBS-BY334经转化大肠杆菌JM110后重新抽提,以去除碱基A上的甲基化,从而使其ClaI酶切位点能被核酸内切酶ClaI切开。该质粒经HindIII/ClaI酶切后,与经同样酶切的片段HHCPCR连接,得到质粒pBS-BY334HS;
c)以引物BY5F51(SEQ ID NO:11)/BY5R52(SEQ ID NO:12)从游动放线菌8-22基因组DNA扩增得到3.1kb左右的片段BY512(SEQ ID NO:25),该片段以XbaI酶切后,插入到载体pBS-BY334HS的XbaI位点,得到质粒pBS-BYHS(片段的插入方向见图3);
d)质粒pIJ773(质粒pIJ773在文献Gust B,Kieser T and Chater K,F.technology:PCR-targeting system in Streptomyces coelicolor.JohnInnes Centre.2002中有详细说明)以XbaI酶切后,回收包含氨普霉素抗性基因aac(3)IV和接合转移起始位点oriT的1.3kb的片段(SEQ ID NO:26),并以BLK试剂盒补平末端;该片段插入到质粒pBS-BYHS的DraI位点,得到重组质粒pBS-BYHS-AmT(见图4)。该质粒的bglY基因因为缺失了内部的1231个碱基而失去原有的生物活性(图5)。用于与游动放线菌8-22进行同源重组的基因序列见SEQ ID NO:13,其包含bglY基因的5’端部分序列、3’端部分序列和片段HHCPCR的部分序列。
实施例1-2:构建用于失活mpbG基因的重组质粒SAT-MGSH
a)以引物MG3F63(SEQ ID NO:14)/MG3R64(SEQ ID NO:15)从游动放线菌8-22基因组DNA扩增得到3.5kb左右的片段MG334(SEQ ID NO:27)。该片段磷酸化后,插入到载体pBluKS的HincII位点,得到质粒pBS-MG334(片段的插入方向见图6);
b)以HisunHF(SEQ ID NO:9)/HisunCR(SEQ ID NO:10)为引物,以单链(SEQ IDNO:8)为模板,扩增得到片段HHCPCR。该片段经HindIII/ClaI酶切后,与经同样酶切的质粒pBS-MG334连接,得到质粒pBS-MG334HS;
c)以HincII+DraI从柯斯质粒supcos-1(Stratagene,Inc.)上切下1229bp含pUCori的片段(SEQ ID NO:28);以BstBI+XbaI从pIJ773上切下1271bp的含aac3(IV)和oriT的片段(SEQ ID NO:26的1-1271),并以BLK试剂盒平末端化。上述两个片段连接后,得到载体supAmT(如图7)。
d)以引物MG5F61(SEQ ID NO:16)/MG5R62(SEQ ID NO:17)从游动放线菌8-22基因组DNA扩增得到3.1kb左右的片段MG512PCR(SEQ ID NO:29)。该片段以XbaI酶切后,插入到载体SupAmT(图7)的XbaI位点,得到质粒SAT-MG512(片段的插入方向见图8);
e)质粒pBS-MG334HS以XbaI酶切,回收3.6kb左右的片段;该片段插入质粒SAT-MG512的XbaI位点,得到重组质粒SAT-MGHS(片段的插入方向见图9)。该质粒的mpbG基因因为缺失了内部的991个碱基而失去原有的生物活性(图10)。用于与游动放线菌进行同源重组的序列见SEQ ID NO:18,其包含mpbG基因5’端部分序列、3’端部分序列和片段HHCPCR部分序列。
实施例2:bglY基因和mpbG基因缺失的重组质粒PBS-BYHS-AMT和SAT-MGSH转化到宿主菌游动放线菌8-22
a)将重组质粒PBS-BYHS-AmT和SAT-MGSH转化到大肠杆菌ET12567(pUZ8002)(在文献Gust B,Kieser T and Chater K,F.technology:PCR-targeting systemin Streptomyces coelicolor.John Innes Centre.2002中有详细说明):取重组质粒1μl加入到100μl大肠杆菌ET12567(pUZ8002)感受态细胞(以CaCl2法制备)中,冰上放置30分钟后,42℃热击90秒,再迅速放到冰上冷却1分钟,加入900μl LB培养,37℃水浴50分钟。取100μl涂布于含25μg/ml氯霉素(Cm)、50μg/ml卡那霉素(Km)、50μg/ml安普霉素(Am)的固体LB培养上,37℃培养过夜,长出转化子ET12567(pUZ8002,PBS-BYHS-AmT)和ET12567(pUZ8002,SAT-MGSH)。
b)大肠杆菌ET12567(pUZ8002,PBS-BYHS-AMT)和ET12567(pUZ8002,SAT-MGSH)的培养:挑一个转化子单菌落于3ml含25μg/ml Cm、50μg/ml Km和50μg/ml Am的液体LB培养基中,37℃,250rpm培养过夜,菌液300μl接种于30ml含Cm、Km、Am的液体LB培养基中,37℃,250rpm培养4-6h,至OD600为0.4-0.6之间。收集菌液,离心后,以LB培养基洗涤2遍,最后以3ml LB培养基悬浮,备用。
c)宿主菌8-22菌液的准备:从平板上刮下游动放线菌8-22的菌丝,在30ml TSB培养基中,28℃培养24-40h,至菌液变成黑色。取3ml菌液转接于30ml TSB培养基中,28℃培养6h。取500μl菌液,离心去上清后,以500μl 2×YT培养基悬浮,37℃水浴20min,自然冷却,备用。
d)接合转移:取500μl b)的菌液加入到500μl c)的菌液中,离心去掉800μl上清。以剩余的上清悬浮菌体,并涂布于2CMC培养基。28℃培养16-20h后,以含有625μg Am和500μg萘啶酮酸(Nal)的1ml无菌水覆盖,28℃培养4-8d,长出转化子。
实施例3:bglY基因或mpbG基因缺失的游动放线菌工程菌的筛选培养
a)挑一个转化子,在含有25μg/ml Am和25μg/ml Nal的YMS培养基上划线,28℃培养4-6d。将生长的菌落在不含抗生素的YMS培养基上28℃连续培养2代后,再在不含抗生素的YMS培养基上划线分离单菌落,28℃培养4-6d。
b)用牙签将a)得到的单菌落分别于含和不含25μg/ml Am的YMS培养基上点种,28℃培养4-6d。挑选在含25μg/ml Am的YMS培养基上不生长而在不含Am的YMS培养基上生长的菌落,在不含抗生素的YMS培养基上进行放大培养。
实施例4-1:bglY基因缺失的游动放线菌工程菌的鉴定
利用PCR方法对放大培养的菌株进行筛选。按以下配比配制反应液:
15μl/管分装,分别用牙签挑取实施例3-b)所筛选的菌落为模板进行PCR反应,并以0.2μl 8-22基因组DNA和重组质粒PBS-BYHS-AMT分别为负对照和正对照。PCR反应程序为:
95℃×10分钟,
(94℃×30秒、68℃×2分钟)×30个循环,
72℃×2分钟,
16℃×1秒。
PCR产物大小为1496bp的是回复突变,即其基因型与出发菌株8-22相同;PCR产物大小为437bp的是PBS-BYHS-AMT基因缺失的游动放线菌工程菌。利用该方法筛选到菌株△BY-3。对该菌株进行测序鉴定,测序结果与SEQ ID NO:13一致,说明该菌株是本发明预期的菌株。
实施例4-2:mpbG基因缺失的游动放线菌工程菌的鉴定
利用PCR方法对放大培养的菌株进行筛选。按以下配比配制反应液:
15μl/管分装,分别用牙签挑取实施例3-b)所筛选的菌落为模板进行PCR反应,并以0.2μl 8-22基因组DNA和重组质粒SAT-MGSH分别为负对照和正对照。PCR反应程序为:
95℃×10分钟,
(94℃×30秒、68℃×2分钟)×30个循环,
72℃×2分钟,
16℃×1秒。
PCR产物大小为1447bp的是回复突变,即其基因型与出发菌株8-22相同;PCR产物大小为625bp的是SAT-MGSH基因缺失的游动放线菌工程菌。利用该方法筛选到菌株△MG-4。对该菌株进行测序鉴定,测序结果与SEQ ID NO:18一致,说明该菌株是本发明预期的菌株。
实施例5:bglY基因或mpbG基因缺失的游动放线菌工程菌△BY-3和△MG-4的发酵检验
分别将bglY基因和mpbG基因缺失的游动放线菌工程菌△BY-3和△MG-4在YMS培养基上28℃培养3-4d后,将面积为1cm2左右菌落挖到30ml种子培养基(黄豆饼粉3.0%,玉米淀粉1.0%,葡萄糖1.0%,甘油2.0%,CaCO3 0.20%,pH自然)中,28℃,220rpm培养24-30h,以2ml的接种量转接到发酵培养基(葡萄糖3.0%,麦芽糖5.0%,黄豆饼粉1.2%,K2HPO40.10%,CaCl2·H2O 0.35%,FeCl3 0.05%,CaCO3 0.3%,谷氨酸钠0.1%),28℃,220rpm培养7-8d。取发酵液5ml过滤后,取1ml滤液,加入4ml无水甲醇,浸泡过夜后,过滤。取滤液以HPLC检验阿卡波糖及A、B组分杂质的含量。HPLC方法为:氨基柱,流动相为KH2PO4 0.87g、K2HPO4 0.46g、乙腈2550ml、H2O 1450ml。检测波长210nm,流速1ml/min。以同样的方法检测出发菌株8-22的发酵产物进行对比。
HPLC结果见表1~表4。结果表明,与出发菌株8-22相比,bglY基因或mpbG基因缺失的游动放线菌工程菌△BY-3和△MG-4的杂质A、B组分含量明显下降。
表1:出发菌株8-22发酵样品的HPLC结果。杂质A、杂质B和阿卡波糖的出峰时间分别为27.886min、25.031min和30.702min。
表2:菌株△BY-3发酵样品的HPLC结果。杂质A、杂质B和阿卡波糖的出峰时间分别为28.155min、25.165min和30.733min。
表3:菌株△MG-4发酵样品的HPLC结果。杂质A、杂质B和阿卡波糖的出峰时间分别为28.837min、25.767min和31.421min。
表4:出发菌株和基因工程菌发酵产物中杂质A和B的含量比较分析
菌株 | A组分含量 | B组分含量 | 阿卡波糖发酵单位 |
出发菌8-22 | 1.4wt% | 1.31wt% | 5001mg/L |
△BY-3 | 0.53wt% | 0.20wt% | 4807mg/L |
△MG-4 | 0.42wt% | 0.21wt% | 5887mg/L |
表4的数据表明通过失活基因bglY或mpbG能降低杂质A组分和杂质B组分的含量,这一方面说明杂质A组分和杂质B组分的产生可能是互相关联的,另一方面也说明这两个基因很有可能是决定杂质A组分和杂质B组分的关键基因。同时,基因的失活并没有影响阿卡波糖的发酵单位。
序列表
<110> 浙江海正药业股份有限公司
<120> 阿卡波糖工程菌及其制备方法和应用
<130> DP1F170344ZX/CNZJHZ/GL
<160> 29
<170> PatentIn version 3.5
<210> 1
<211> 440
<212> PRT
<213> 游动放线菌
<400> 1
Met Lys Lys Phe Ser Val Val Ile Ala Gly Gly Gly Ser Thr Phe Thr
1 5 10 15
Pro Gly Ile Val Leu Met Leu Leu Ala Asn Gln Asp Arg Phe Pro Leu
20 25 30
Arg Ser Leu Lys Phe Tyr Asp Asn Asp Gly Ala Arg Gln Glu Thr Ile
35 40 45
Ala Glu Ala Cys Lys Val Ile Leu Lys Glu Gln Ala Pro Glu Ile Glu
50 55 60
Phe Ser Tyr Thr Thr Asp Pro Gln Ala Ala Phe Thr Asp Val Asp Phe
65 70 75 80
Val Met Ala His Ile Arg Val Gly Lys Tyr Pro Met Arg Glu Gln Asp
85 90 95
Glu Lys Ile Pro Leu Arg His Gly Val Leu Gly Gln Glu Thr Cys Gly
100 105 110
Pro Gly Gly Ile Ala Tyr Gly Met Arg Ser Ile Gly Gly Val Leu Glu
115 120 125
Leu Val Asp Tyr Met Glu Lys Tyr Ser Pro Asn Ala Trp Met Leu Asn
130 135 140
Tyr Ser Asn Pro Ala Ala Ile Val Ala Glu Ala Thr Arg Arg Leu Arg
145 150 155 160
Pro Asn Ala Lys Ile Leu Asn Ile Cys Asp Met Pro Ile Gly Ile Glu
165 170 175
Gly Arg Met Ala Gln Ile Val Gly Leu Lys Asp Arg Lys Gln Met Arg
180 185 190
Val Arg Tyr Tyr Gly Leu Asn His Phe Gly Trp Trp Thr Ser Ile Glu
195 200 205
Asp Leu Asp Gly Asn Asp Leu Met Pro Lys Leu Arg Glu Tyr Val Ala
210 215 220
Lys Tyr Gly Tyr Val Pro Pro Ser Asn Asp Pro His Thr Glu Ala Ser
225 230 235 240
Trp Asn Asp Thr Phe Ala Lys Ala Lys Asp Val Gln Ala Leu Asp Pro
245 250 255
Gln Thr Met Pro Asn Thr Tyr Leu Lys Tyr Tyr Leu Phe Pro Asp Tyr
260 265 270
Val Val Ala His Ser Asn Pro Glu Arg Thr Arg Ala Asn Glu Val Met
275 280 285
Asp His Arg Glu Lys Asn Val Phe Ser Ala Cys Arg Ala Ile Ile Ala
290 295 300
Ala Gly Lys Ser Thr Ala Gly Asp Leu Glu Ile Asp Glu His Ala Ser
305 310 315 320
Tyr Ile Val Asp Leu Ala Thr Ala Ile Ala Phe Asn Thr Gln Glu Arg
325 330 335
Met Leu Leu Ile Val Pro Asn Asn Gly Ala Ile His Asn Phe Asp Ala
340 345 350
Asp Ala Met Val Glu Ile Pro Cys Leu Val Gly His Asn Gly Pro Glu
355 360 365
Pro Leu Thr Val Gly Asp Ile Pro His Phe Gln Lys Gly Leu Met Ser
370 375 380
Gln Gln Val Ala Val Glu Lys Leu Val Val Asp Ala Trp Glu Gln Arg
385 390 395 400
Ser Tyr His Lys Leu Trp Gln Ala Ile Thr Leu Ser Lys Thr Val Pro
405 410 415
Ser Ala Ser Val Ala Lys Ala Ile Leu Asp Asp Leu Ile Ala Ala Asn
420 425 430
Lys Asp Tyr Trp Pro Glu Leu His
435 440
<210> 2
<211> 436
<212> PRT
<213> 游动放线菌
<400> 2
Met Arg Leu Val Ile Leu Gly Gly Gly Gly Phe Arg Val Pro Leu Val
1 5 10 15
Tyr Arg Ala Leu Leu Ala Asp His Arg Gln Thr Gly Ile Thr Glu Val
20 25 30
Ala Leu His Asp Val Asp Pro Gly Arg Leu His Ala Ile Gly Arg Val
35 40 45
Leu His Ala Leu Ala Arg Asp Val Pro Asp Ala Pro Thr Val His Thr
50 55 60
Thr Thr Asp Leu Asp Thr Ala Leu Thr Gly Ala Thr Phe Val Phe Ser
65 70 75 80
Ala Ile Arg Val Gly Gly Leu His Gly Arg Val Val Asp Glu Arg Val
85 90 95
Ala Arg Ala Ala Gly Ile Leu Gly Gln Glu Thr Val Gly Ala Gly Gly
100 105 110
Ile Ala Tyr Gly Leu Arg Ser Val Pro Glu Ser Leu Arg Ile Ala Glu
115 120 125
Arg Val Ala Ala Val Ala Pro Asp Ala Trp Val Ile Asn Phe Thr Asn
130 135 140
Pro Ala Gly Leu Val Thr Glu Ala Met Ser Gly Ile Leu Gly Asp Arg
145 150 155 160
Val Ile Gly Ile Cys Asp Ser Pro Thr Gly Leu Val Asp Arg Val Leu
165 170 175
Arg Val Leu Asp Ala Pro Gly Ala Arg Val Asp Tyr Ala Gly Leu Asn
180 185 190
His Leu Gly Trp Leu Tyr Gly Val Tyr Asp Ala Ala Gly Arg Asp Leu
195 200 205
Leu Pro Gly Leu Leu Ala Asp Glu Ala Gly Leu Ala Thr Ile Glu Glu
210 215 220
Gly Arg Leu Phe Pro Gly Leu Arg Glu Leu Gly Ala Ile Pro Asn Glu
225 230 235 240
Tyr Leu His Tyr Tyr Tyr His Pro Val Ala Lys Ala Asp Gly Pro Thr
245 250 255
Arg Gly Glu Phe Leu Ala Glu Gln Gln Glu Arg Cys Tyr Arg Glu Met
260 265 270
Ser Ala Gly Glu Pro Leu Glu Ala Trp Leu Arg Ala Trp Arg Glu Arg
275 280 285
Glu Ala Thr Tyr Met Ala Asp Asn Arg Ser Gln Ser Gly Ala Gly Asp
290 295 300
Arg Asp His Asp Glu Ser Arg Pro Ala Gly Tyr Glu Gly Val Ala Leu
305 310 315 320
Ala Val Met Arg Ala Leu Ala Arg Asp Glu Pro Ala Glu Leu Ile Leu
325 330 335
Gly Val Arg Asn Arg Gly Val Leu Asp Val Leu Asp Ala Asp Ala Val
340 345 350
Val Glu Val Pro Cys Arg Val Asp Gly Thr Gly Ala Val Pro Arg Arg
355 360 365
Val Gly Ala Leu Pro Gly His Ala Val Gly Leu Val Gln Thr Val Lys
370 375 380
Ala Val Glu Arg Gly Val Leu Glu Ala Val Gln Thr Gly Ser Ala Ala
385 390 395 400
Ala Ala Val Arg Ala Met Ala Gly His Pro Leu Val Gly Asp Pro Glu
405 410 415
Leu Ala Gly Arg Leu Ile Ala Ala Tyr Arg Ala Glu Leu Pro Glu Leu
420 425 430
Ala Tyr Leu Ser
435
<210> 3
<211> 418
<212> PRT
<213> 游动放线菌
<400> 3
Leu Lys Ile Ala Val Val Gly Gly Gly Ser Thr Tyr Thr Pro Glu Leu
1 5 10 15
Val Asp Gly Phe Ala Arg Leu Gly Thr Met Val Thr Glu Leu Val Leu
20 25 30
Ile Asp Pro Ser Ala Glu Arg Leu Asp Ile Val Gly Ala Phe Ala Ala
35 40 45
Arg Ile Phe Ala Gln Tyr Gly His Pro Gly Lys Val Thr Trp Thr Thr
50 55 60
Asp Leu Asp Ala Gly Val Thr Asp Ala Asp Ala Ala Val Ile Gln Leu
65 70 75 80
Arg Val Gly Gly Gln Arg Ala Arg Ile Ser Asp Glu Ser Phe Pro Leu
85 90 95
Glu Cys Gly Cys Val Gly Gln Glu Thr Thr Gly Ala Gly Gly Leu Ala
100 105 110
Lys Ala Leu Arg Thr Val Pro Val Ile Leu Asp Val Ala Glu Arg Ile
115 120 125
Arg Ala Arg Ala Arg Pro Gly Ala Trp Ile Val Asp Phe Thr Asn Pro
130 135 140
Val Gly Ile Val Thr Arg Ala Leu Leu Asp Ala Gly His Arg Ala Val
145 150 155 160
Gly Leu Cys Asn Val Ala Ile Gly Phe Gln Arg Arg Phe Ala Ser Tyr
165 170 175
Leu Glu Val Pro Pro Gly Ser Val Val Leu Asp His Val Gly Leu Asn
180 185 190
His Leu Thr Trp Glu Arg Ala Ala Phe Val Asp Gly Val Asp Arg Leu
195 200 205
Pro Glu Leu Leu Ser Arg His Leu Ser Asp Ile Ala Gly Gln Val Asp
210 215 220
Val Pro Ala Glu Ile Ile Ser Met Leu Gly Ser Val Pro Ser Tyr Tyr
225 230 235 240
Leu Ser Tyr Phe Tyr Arg His Asp Gly His Val Arg Glu Ala Leu Gly
245 250 255
Ala Pro Thr Arg Gly Gln Arg Val Ala Glu Ile Glu Ala Thr Leu Leu
260 265 270
Asp Met Tyr Arg Asp Val Thr Leu Thr Glu Lys Pro Ala Leu Leu Ala
275 280 285
Glu Arg Gly Gly Ala Phe Tyr Ser Glu Ala Ala Val Gly Leu Leu Ala
290 295 300
Ser Leu Phe Gly Leu Asp Asp Asp Ala Val His Ser Val Asn Val Arg
305 310 315 320
Asn Leu Gly Thr Leu Pro Phe Leu Pro Ala Asp Ala Val Ile Glu Val
325 330 335
Ser Ala Arg Ala Gly Arg Thr Gly Pro Asp Pro Leu Pro Val Thr Ala
340 345 350
Leu Pro Pro Asp Leu Ala Gly Leu Ile Thr His Thr Trp Ser Tyr Glu
355 360 365
Glu Leu Ala Leu Asp Ala Ala Leu Arg Gly Gly Arg Asp Arg Val Tyr
370 375 380
Arg Ala Leu Leu Ala His Pro Leu Ile Gly Gln His Glu Arg Ala Thr
385 390 395 400
Ala Leu Thr Asp Arg Leu Ile Ala Ala Gly Arg Asp His Leu Ala Trp
405 410 415
Ala Arg
<210> 4
<211> 1311
<212> DNA
<213> 游动放线菌
<400> 4
atgcggttag tgatcctcgg tggtggcgga ttccgggtgc cgttggttta ccgggcgctg 60
ctggccgacc accggcagac cggcatcacc gaggtcgccc tgcacgacgt cgaccccggc 120
cggctgcacg ccatcggccg ggtcctgcac gccctcgccc gcgacgtgcc cgacgccccg 180
accgtgcaca ccaccaccga cctggacacc gcgctgaccg gcgccacctt cgtcttctcc 240
gccatccggg tcggcggcct gcacggccgg gtcgtcgacg aacgcgtcgc ccgcgccgcc 300
ggcatcctcg gccaggagac cgtcggcgcc ggcggcatcg cgtacggcct gcgctccgtc 360
ccggaatcgc tgcggatcgc cgagcgggtg gcggccgtcg ccccggatgc ctgggtcatc 420
aacttcacca accccgccgg cctggtcacc gaagccatgt ccggcatcct cggcgaccgg 480
gtgatcggca tctgcgactc gccgaccgga ctggtcgacc gggtgctccg ggtcctggac 540
gcccccggcg cccgggtcga ctacgccggg ctcaaccatc tgggctggct gtacggcgtg 600
tacgacgcgg ctggtcgcga cctgctgccc gggctgctcg ccgacgaggc gggactggcc 660
accatcgagg aggggcggct gtttcccggg ctgcgcgaac tcggggccat ccccaacgaa 720
tacctgcact actactacca cccggtggcg aaggcggacg ggccgaccag gggagagttc 780
ctggctgagc agcaggaacg ctgctatcgg gagatgtccg cgggggagcc gctcgaagcc 840
tggctgcgcg cgtggcggga acgggaagcg acgtacatgg cggacaaccg gtcgcagagc 900
ggggcggggg acagggacca cgacgaatcc cggccggccg gatacgaggg ggtggcgctg 960
gcggtgatgc gggcgctggc ccgggacgaa ccggcggaac tgatcctggg ggtgcgcaac 1020
cggggagtgc tcgacgtgct cgacgccgac gcggtggtgg aggtgccgtg ccgggtcgac 1080
gggacggggg cggtgccgcg ccgggtgggg gcgttgcccg ggcatgcggt gggactggtg 1140
cagacggtca aggcggtgga acgcggggtg ctggaagccg tgcagaccgg gtccgcggcg 1200
gcggcggtgc gggccatggc cgggcatccg ttggtcggcg acccggagct ggcggggcgg 1260
ttgatcgcgg cttaccgcgc tgagctgccg gagttggcct acctgtcctg a 1311
<210> 5
<211> 1257
<212> DNA
<213> 游动放线菌
<400> 5
ttgaaaatcg cggtcgtggg tggcggatcc acctataccc cggagctggt ggacgggttc 60
gcccggctcg gcaccatggt caccgaactc gttctgatcg acccgtccgc ggagcgcctg 120
gacatcgtcg gggcgttcgc ggcgcgcatc ttcgcgcagt acgggcatcc ggggaaggtg 180
acctggacga ccgacctgga cgcgggggtg accgatgccg acgccgcggt catccaactc 240
cgggtcggcg ggcagcgggc gcggatcagc gacgagtcgt tcccgctgga atgcggctgt 300
gtgggacagg agacgaccgg ggcgggtggc ctcgccaagg cgctgcggac ggtgccggtg 360
attctggacg tcgccgaacg gatccgggcg cgggccaggc ccggggcgtg gatcgtggac 420
ttcaccaacc cggtggggat cgtgacgcgg gcgctgctcg atgccgggca ccgggcggtg 480
ggactgtgca atgtggcgat cgggttccag cgacggttcg cctcctatct ggaggttccg 540
ccgggctcgg tggtcctgga ccatgtgggg ttgaaccacc tgacgtggga gcgggcggcg 600
ttcgtcgacg gcgttgatcg acttcccgaa ctgctctccc ggcacctgtc ggacatcgcg 660
ggacaggtgg atgtgccggc ggagatcatc tccatgctgg gcagcgttcc gtcttactat 720
ttgtcatact tctatcgcca tgacgggcat gtgcgcgagg cgttgggggc gcccacccgc 780
gggcagcgcg tggcggagat cgaggcgacc ctgctggaca tgtaccgcga tgtcaccctg 840
accgagaagc cggccctgct cgccgaacgc ggcggcgcct tctactccga agccgccgtc 900
ggcctgctcg cctccctgtt cggcctcgac gacgacgccg tccactcggt gaacgtccgc 960
aacctcggca ccctgccgtt cctgcccgcc gacgcggtca tcgaggtctc cgcccgcgcc 1020
ggccggaccg gccccgatcc gctgccggtc accgctctgc cgcccgacct ggccggcctc 1080
atcacgcaca cctggtcgta cgaggaactc gccctcgacg ccgccctgcg cggtggccgc 1140
gaccgtgtct accgggcgct gctggcccac ccgctgatcg gccagcacga aagggccacc 1200
gccctcaccg acaggctgat cgccgccggc cgtgaccacc tcgcgtgggc ccgatga 1257
<210> 6
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物BY3F53
<400> 6
atcgatccta cctgtcctga ccggcggatg tctcc 35
<210> 7
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物BY3R54
<400> 7
tctagacccc cgcagatcaa gccaatagga agcg 34
<210> 8
<211> 118
<212> DNA
<213> 人工序列
<220>
<223> 单链模板
<400> 8
tgcagtaaca tatctccgtt aactagcctc atgctcgcat ggcctgtgaa gtcactattt 60
gtgcgttgtg atccacacgc gccataaatt aacacgcgtg ccacgctgaa tatagtga 118
<210> 9
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物HisunHF
<400> 9
cctaagcttc gcagtaacat atctcc 26
<210> 10
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物HisunCR
<400> 10
cctatcgatt cactatattc agcgtgg 27
<210> 11
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物BY5F51
<400> 11
caatctagat cctgcccgag gtgattccgc cc 32
<210> 12
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物BY5R52的序列
<400> 12
atgtctagag gccagcagcg cccggtaaac caac 34
<210> 13
<211> 252
<212> DNA
<213> 人工序列
<220>
<223> 用于使bglY基因失活的DNA片段
<400> 13
atgcggttag tgatcctcgg tggtggcgga ttccgggtgc cgttggttta ccgggcgctg 60
ctggcctcta gaactagtgg atcccccggg ctgcaggaat tcgatatcaa gcttcgcagt 120
aacatatctc cgttaactag cctcatgctc gcatggcctg tgaagtcact atttgtgcgt 180
tgtgatccac acgcgccata aattaacacg cgtgccacgc tgaatatagt gaatcgatcc 240
tacctgtcct ga 252
<210> 14
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物MG3F63
<400> 14
atcgatacga ggaactcgcc ctcgacgccg ccctg 35
<210> 15
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物MG3R64
<400> 15
tctagaaacc cgcagatgct gactgaccgc gcccg 35
<210> 16
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物MG5F61
<400> 16
aactctagat cggacggtcg agctgtggca cttcttcacc 40
<210> 17
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物MG5R62
<400> 17
atgtctagac gggtcgatca gaacgagttc ggtgacc 37
<210> 18
<211> 435
<212> DNA
<213> 人工序列
<220>
<223> 用于使mpbG基因失活的DNA片段
<400> 18
ttgaaaatcg cggtcgtggg tggcggatcc acctataccc cggagctggt ggacgggttc 60
gcccggctcg gcaccatggt caccgaactc gttctgatcg acccgtctag aactagtgga 120
tcccccgggc tgcaggaatt cgatatcaag cttcgcagta acatatctcc gttaactagc 180
ctcatgctcg catggcctgt gaagtcacta tttgtgcgtt gtgatccaca cgcgccataa 240
attaacacgc gtgccacgct gaatatagtg aatcgatacg aggaactcgc cctcgacgcc 300
gccctgcgcg gtggccgcga ccgtgtctac cgggcgctgc tggcccaccc gctgatcggc 360
cagcacgaaa gggccaccgc cctcaccgac aggctgatcg ccgccggccg tgaccacctc 420
gcgtgggccc gatga 435
<210> 19
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物BYF55
<400> 19
cgatcctgca acagatcttc ctcggacaga cc 32
<210> 20
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物BYR56
<400> 20
gaaatcgagc ccgtcagatc gccctgtc 28
<210> 21
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物MGF65序列
<400> 21
tcttcttctt cgcccagcgc agcttcg 27
<210> 22
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物MGR66序列
<400> 22
tggtgccgtc cagcccgatg ttgtg 25
<210> 23
<211> 3109
<212> DNA
<213> 人工序列
<220>
<223> 片段BY334
<400> 23
atcgatccta cctgtcctga ccggcggatg tctccgccgc cggtgcgcag tccccgccca 60
cccaggggac cggcccccgt ccaggacagg gcgatctgac gggctcgatt tcggcctgtg 120
gacgactcgg cgggaccggg ttgtcccgag atcagccacc gctgcacgac ggcgtcgaga 180
ggcgctgtcg gggagttcgg tccggcgacc cgcacgccac ggctcccgtc acccggcccg 240
gtggcgccga cctgctggat cccgggtttt ccggtcccgc ggcacggcaa cgggagccag 300
ccgcggggcg gggtcggggc gtgggcggca tgatgctgtc gtggagcaac ggtgggccga 360
gctggcacga accctgcgag agctggggcg gtggcagcac ctgtccgggg acgccgccgc 420
cgaggcggag cgggcggtgg cggcgggtgg gtatccgttc ggggagagcg gcggggatca 480
cgacgtccgg cggttctggc tggacagcga aaccatggcc gagggcggcg tcggccgggt 540
gctgcgggag atggcgccgg cgttgcggac gcacggtgtc gacctgcggg tcgaggtggt 600
gactgtgccg ctcaccgggg ccggcgaagg tgactacatc gtgtcgatca acgggcggcg 660
gtgtgcggcc tggacccggg cggaccgggc ggctgactgc tggtgggaat cggcgacggt 720
gcggccactc gcggtcgtca acgatctgct ggccgaggcg ggcgcgaggg tacggctgtt 780
cgcgctgtac gtggggaccg aggacgcgct tgcctggctg gtcgatccgc ggatcgtcgc 840
ggcggtggcc gacagcggtc tgttccggga gtccgacgtg cccctgctcg ccgcgcacga 900
caccgtcgag caacacttcc tcaagcgtgg gtgacgaact ggaagatcct gccggttgtc 960
aggggctgcg gggtgccggt gaagcggtgc acgccgacgg agaacagcac gtcctgcggg 1020
gcggtgaagg actgctcggc gaagccggcg tgggtcagcc agccgcggat cgccggtgtc 1080
aggtccggtg ctcgtcgtga gcgggtccag atcaccgtgg cgtccggcgc gcagagccgg 1140
ggcagcgcga gaatggtgcg gtgggtgtcg gcgtcgctga tgttgcccag gacgcccgcc 1200
atgatgacca ggtccgcggg ggccgcgtcg cggtacgagg cgaggtcgcc ggcgtcggct 1260
cgcacgatgc tcacggtggc gtgggcgggc acccggctgc gggccgcggc gacgttgcgc 1320
gggtcgtact ccaggagggt ggcggtgacc cggccggcgt ccgggcgcga cgccagcacg 1380
gtgaggatgt cgtcgccctg gccggcgcac atgctgagta cggacaccgg ctcaccgggc 1440
cgctcgtcga gccacgcggc gatgtggtgc cggaccagtc tcagccgccg ggacaggggt 1500
gagcccgggt cggtgtagcg ggtgtgccag gcgtgccagt cctcaccatc gttcatggac 1560
gacagtctgc ctggccggta cgggtgatca gggcatagct ctggctggcg gccaggatgc 1620
cgaggacggc gcgggccagg ttcgccggtg cgccggtggt gggcagtccg gtggcgtcga 1680
gcagagcggt gatgccgagc cagaccacgg tcgcggagag ggccgcggtg gtcagggcac 1740
ggccgtggcg gtggtcggcg ttgctgtgca gggcgccggt cgaccagacg atcagggtga 1800
cgtcccagaa gctgatgacg gggtggccca gggcggctac caccagggag gcggcgaggg 1860
ccagccccgc accgatcgcg gcccggcgca gggttgtcca cccggacacg gaggcggcgc 1920
cggcagcgac gtgggagacc atctggagat cctgggtgtc atgagtttct ttcatatgga 1980
cgggaagtga acagcgggga tggatctcca gcaccgaggc gcgcgggtgg gcgggggtgg 2040
ctgtctcgcc acgatggcgc tgctgatcca tgtcggtcat gcggcgcggc tctcggtggc 2100
ggggcagcgg gccgaggtcg agtgggggga tactggcctc gccgaacggg gtgcacggct 2160
gtcggtctcg gtttgtccga aagcgggggc ggggatgacg gcgagtgatg tggtgcggct 2220
gctgaccggc ggggagttcg acgagctgga gcgccggttc accgcggaga tgcgcgccgt 2280
cgtgtcggcg gagaccgtcc gggtggcgtg gacggtgcag accggcggtg ttcccggcga 2340
gccgggcgaa ccggtcggcg agccgttcac cggcgacctc acccgctggc gcgtgccggt 2400
ccgccatccc gccggcgact tcgtggtggt gatgtccctc gatgcgggcg ggcggctgca 2460
cgggctgcgg ctcgccgccg atgcgggccc ggcctggcag ccgccgcgat acgtgcgccc 2520
ggagcgtttc accgagcggg cggtcggggc gcacggtgcg ctggtcaccc cgtccggcag 2580
gagggtgtcg accgcggcag tcgttctgcc gggcggcggg gagcaggacc gggacggcac 2640
ccacgggccc gacaaaccgc tcaaagacct cgcgtggggc ctggccagcc gcggcatcgc 2700
ggtctttcga ttcgacaaac ccgggcctga ccgcacgctg gtggaggagt acgtgacgcc 2760
cgcggcgcag gccgtgggcg agatccgggc cgccgtgccg tcggtggagc ggatcttcct 2820
gatcgggcac agcctgggtg gcaaagtggc gcccagggtg gccgcggccg tgccggagat 2880
cgccggtctg gtgctgctcg cggccgaggc gatcccgttg cagcggtcgg ccgagcgggt 2940
cacccggcat ctggccgcgc gtgatccggg gccggccgcc gacgcgatgc tggccgcgat 3000
gcaacggcag gtcgcgctgg tcgacgacgg gctgacggcg cagactccgg cggcggatct 3060
gccgttcgga tttcccgctt cctattggct tgatctgcgg gggtctaga 3109
<210> 24
<211> 136
<212> DNA
<213> 人工序列
<220>
<223> 片段HHCPCR
<400> 24
cctaagcttc gcagtaacat atctccgtta actagcctca tgctcgcatg gcctgtgaag 60
tcactatttg tgcgttgtga tccacacgcg ccataaatta acacgcgtgc cacgctgaat 120
atagtgaatc gatagg 136
<210> 25
<211> 3095
<212> DNA
<213> 人工序列
<220>
<223> 片段BY512
<400> 25
caatctagat cctgcccgag gtgattccgc ccggccggcg caacgccgtg catcgggcca 60
ccgccaccat cgcccggctc tccgacgcgc atgccggctg accgtcgcga caccctggcc 120
gggtgggcgt tcctcgcgcc cagcctggtc ggcgtcggcg gtttcctgct gctcccggtc 180
ctggtcgtgg tgggcatcag cctcacccgg tgggacctgg tcagcccggc ccgctgggcg 240
gcgctggaca actactcctc gatcctcacc gacccggcgt tcggccgctc actcgccgtc 300
accgcggtct tcgtgctgct ggtcatcccg ctgcagaccg ggctcgggtt ggccgccgcg 360
ctgctgctcg accagcggtt gcccggctcc accgtcttcc gggcgatcct ggtgctgccg 420
tggatcagcg cgccgctggc gctgggcgtc gtctggcgct ggctgctcga cccgtccgac 480
ggcgcggtga accagctgct cggccaccgg gtcgagtggc tgaccagccc cgccctggcg 540
ctgcccgcgg tcgccgcggt caccgtctgg accaatgtgg gctacgtggc gctgttcttc 600
ctggccggtc tcgccgggat cccggcgcag tacgccgagg cggcccggat cgacggcgcc 660
ggcccgtggc aggcgttccg ccggatcacg ctgccgctgc tgcggcccac catgttcttc 720
gtgctggcca ccggggtgat caacagcttc caggtgttcg acacggtgta cgcgatgacc 780
cagggcggcc cggccgggcg caccgaggtg gtggcgtacg cgatctaccg ggaggcgttc 840
gtcgacttcc ggatggggcg cgccgcggcc atgtcggtgc tgctgttcct gctgctgatc 900
acggtcaccg tggcccagca gtcgtatttc cgccgccgca cgacctacga ggtggggtga 960
ggatgcgccg ggccgtgctc acctatctcg cgctggccgc cggggccgtg ctgatcctcg 1020
ctccctacct gatgagcgtg cagacctcgg tgaagaccgc gcggcagttc gcccagcagc 1080
cgccgctcgc cccgcccgac ccgccgaccg gggcgaacta cgccgagctg atcgtcggcg 1140
ggcacaccct gatcccaccg ctggtgatca ccgtccaggt ggtgctgatc gtcgtgatcg 1200
gacagctgac ctgctcggtc ctcgcggcgt acgcgttcgc ccgcctcgac ttcccgggcc 1260
gtgacgcgct cttctggctc tacctcgcca ccctgatggt gccgatcgtg gccgtcctgg 1320
tgccccggtt cgtgctgctc agtcaggccg gactgaccga cacgttctgg ggcatcgtgc 1380
tgccctcgat gttcggctca ccgtatgcga tcttcctgct ccgccagttc ttccgggccg 1440
tcccgcagga gctgctggac gccgcccgga tcgacggcgc cggccacccg cgggtgctgc 1500
gccacgtcat cgtcccgctg agccgcccga tcctggccac cctgctgatc atcacggtgg 1560
tcacccactg gaacgacttc ctctggcccc tggtgatcac cagcggggtg cgctggcagg 1620
tgctcaccgt cgcggtcgcc ggcctgcaga gtcagtacca cggcaactgg accctggtga 1680
cggccgcgac cacgctcgcc accatgccgt tgctgctgat cttcgcgatc ttccagaaac 1740
acatcgtccg atcgatcacc atcaccggga tgaggtgagg ctcatgcgac ggttcctggc 1800
gttcctgatg atcctggcac tggccggctg ctcggtcgcc gacaccggcg acagcggctc 1860
cggcaggacg acggtcacct tccggctctg ggacgaccag gtggccgagg cgtaccagca 1920
gtccttcgcc accttcgaga aggcacaccc caccatccac gtcgacgtgc agctggtgcc 1980
ctgggccgac tactggacca aactgccggc cgacatcgcc gccggcaccg ccgccgacat 2040
cttctggacc aacacctcca atttcgggtt gtacgccgac aacaggcaac tgctgcccgt 2100
cgacttcacc ggggactgga cgaaatccgt cgtcgacctc tacacccggg gcggcaccct 2160
gtggggcgtg ccgcagctgt gggactcgat cgccctctac tacaacaaag acctggtcgc 2220
caaggccggc gtcgatccgg ccacgctcag ctgggacccg gccgccgccg acgacccgct 2280
gcgcgccgcc gcccgcaagc tcaccgccgc gaacgcgttc ggctacaacg ccgccttcga 2340
ccagcaggcg atcctctggg acttcgtcgg ttccaacggc gggacctggc agtccggcga 2400
caccttcgac ttcgccgacc agcccaggac ggtgcaggcc gtgcagtacg tggtggatct 2460
gatcaacaag taccacgtgg ccccgtccgc ggcggacacc aacaccaacg gcgacaagac 2520
cacccagctg ttcacccagg gcaaactggc gttgttccaa tccggaccgt acaacctgaa 2580
ggccatccag cagggcgccg gcttcccgtg ggggatcgcc ccgctgcccc agggcccggc 2640
cggacgggtc agcgtggtgc acggcgtcgc cgcggtcgcc tccgccaaga ccccgcaccg 2700
ggacgccacc gtcgaggtgc tcaagtggat cggctcggcc gacggccaga aaccgatcgc 2760
cgagggcggg tatgcgttcc ccggcgtgac cgccgcgcag cccgccttcg tcgactactg 2820
gcggaaacgg ggcgtcgacc tgaagccctt cctggacgcg gcggccggca ccaccttccc 2880
cgcaccggtc ggtccgcgcg tcggggcggg tggcaccgcg tacacgccga tcctgcaaca 2940
gatcttcctc ggacagaccg gcgtcaccga cggcctgcgc aaggcccagg acgccggcaa 3000
cgcggcgatg aaaggctgac atgcggttag tgatcctcgg tggtggcgga ttccgggtgc 3060
cgttggttta ccgggcgctg ctggcctcta gacat 3095
<210> 26
<211> 1288
<212> DNA
<213> 人工序列
<220>
<223> 以XbaI从质粒pIJ773上切下的1.3kb片段
<400> 26
ctagagaata ggaacttcgg aataggaact tatgagctca gccaatcgac tggcgagcgg 60
catcgcattc ttcgcatccc gcctctggcg gatgcaggaa gatcaacgga tctcggccca 120
gttgacccag ggctgtcgcc acaatgtcgc gggagcggat caaccgagca aaggcatgac 180
cgactggacc ttccttctga aggctcttct ccttgagcca cctgtccgcc aaggcaaagc 240
gctcacagca gtggtcattc tcgagataat cgacgcgtac caacttgcca tcctgaagaa 300
tggtgcagtg tctcggcacc ccatagggaa cctttgccat caactcggca agatgcagcg 360
tcgtgttggc atcgtgtccc acgccgagga gaagtacctg cccatcgagt tcatggacac 420
gggcgaccgg gcttgcaggc gagtgaggtg gcaggggcaa tggatcagag atgatctgct 480
ctgcctgtgg ccccgctgcc gcaaaggcaa atggatgggc gctgcgcttt acatttggca 540
ggcgccagaa tgtgtcagag acaactccaa ggtccggtgt aacgggcgac gtggcaggat 600
cgaacggctc gtcgtccaga cctgaccacg agggcatgac gagcgtccct cccggaccca 660
gcgcagcacg cagggcctcg atcagtccaa gtggcccatc ttcgaggggc cggacgctac 720
ggaaggagct gtggaccagc agcacaccgc cgggggtaac cccaaggttg agaagctgac 780
cgatgagctc ggcttttcgc cattcgtatt gcacgacatt gcactccacc gctgatgaca 840
tcagtcgatc atagcacgat caacggcact gttgcaaata gtcggtggtg ataaacttat 900
catccccttt tgctgatgga gctgcacatg aacccattca aaggccggca ttttcagcgt 960
gacatcattc tgtgggccgt acgctggtac tgcaaatacg gcatcagtta ccgtgagctg 1020
cattttccgc tgcataaccc tgcttcgggg tcattatagc gattttttcg gtatatccat 1080
cctttttcgc acgatataca ggattttgcc aaagggttcg tgtagacttt ccttggtgta 1140
tccaacggcg tcagccgggc aggataggtg aagtaggccc acccgcgagc gggtgttcct 1200
tcttcactgt cccttattcg cacctggcgg tgctcaacgg gaatcctgct ctgcgaggct 1260
ggcgggaact tcgaagttcc tatacttt 1288
<210> 27
<211> 3492
<212> DNA
<213> 人工序列
<220>
<223> 片段MG334
<400> 27
atcgatacga ggaactcgcc ctcgacgccg ccctgcgcgg tggccgcgac cgtgtctacc 60
gggcgctgct ggcccacccg ctgatcggcc agcacgaaag ggccaccgcc ctcaccgaca 120
ggctgatcgc cgccggccgt gaccacctcg cgtgggcccg atgaccgcgc tgttcctggc 180
ggccgacggc ggcaactcga agaccgacct ggtcctcggt accgcggacg gcgagatcct 240
ggcgatggtg cgcggcggca cctcgtcgcc gcacaacatc gggctggacg gcaccatcga 300
ggtgctcggc aagctgatcg ccgcggcccg ggccgaggcc ggcctggcgg cggacaccgc 360
gatcgacgcg atcggcgtct acctggccgg cgccgacctg cccgacgagg tgaccgccct 420
gcacgaggcg gtcaccgcgc agggctgggc gcggcgggtc cgggccgaca acgactgctt 480
cgccctgctc cgggccggcg ccaggctgcc ggacgcggtc accgtggtct gcggcgccgg 540
caacaactgc gtcggccggg ccgccgacgg ccggaccgcc cggttcgtcg ctctcggccc 600
ggtctccggg gactggggcg gcggccacga cctggccgac tacgccctgc gcgcggcggc 660
ccgcggggag gacggccggg gcgacccgac cgcgctgtcc gcggcggtcg ccgggcactt 720
cggcctgccc acggtcgaag cggtcagcat cgccctgcac cgcggccacc tgtcggccgc 780
ccggatcccg gaactggccc cgatcctgtt ccaggtcgcg gccgccggtg acgaggtggc 840
cgccgcgctg gtggcgcgcc aggccgaaga gatcctggcc cagcaccggg tcgccgccgg 900
ccgtctcggc ctgctgcccc ggccacactc ggtggtcctg ggcggcagcg tcctgcaggc 960
ccggcatccc ctgctgcacg accgggtgct ggccggcgtc cgggcccagg cgccgttcgc 1020
cgaggtcacc gtgctggact cgccgccggt gaccggggcg gcgttgctcg ccctggacgc 1080
gctggaggcc ggcccggccg ccgagcgggc cctgcgcggc atcttctccg ggcgggtgcc 1140
ggcgtgacga gcccgcgtgc cgccttcccc gggcggccgg agaccgcgtc gcccggctga 1200
ccgggggacg caggcggccg gctacctgtc cacctggcgg accgggggga ctcaggccgc 1260
cggggatccg gtcgcccggc ggaccggggg actcaggccg ccggggatct ggtcgcccag 1320
cggaccgcgg ggaccagggc cgcgccgctg atcgcgaaga tggcggcggg caccgcccag 1380
ccccagggcg cgtggtcgat ggcggtcacc gtgatcaggg cgggcgcgag catgatgccc 1440
gcggaactgc cggcgttgaa gacgccctgg taggcgccgg ccgcgtgctc cgccgccagg 1500
tcgtagctga gcagccagcc gccggcctgg gagagcacct cgccggccgt gccgatggtg 1560
accgccagca ccagcagcag ggtggccggg accgcgccga agccgtggct gcccgcgatc 1620
agcaggcagt agacggcgag cagccagccg gcgcggcggc aggcccgggc cgcctgggcc 1680
gggttccgcg cggcgcgggt ggcccggacc tggaagatca ccaccagcac ggtgttgagc 1740
agcaggatcg cgccgaccac cgcgtgcggg gcggtggtct cccggaccac ccagagcggg 1800
atgccgacgg tgagcaccgc gaactgcatg ctgagcagcg cgttcagggc ggtgaccagc 1860
aggtacggcc ggtcggtgag cgcgttgcgg cggctggcga cggccggacc ggcggcggtg 1920
ccccgaaccg gccgacgctt ggccgggatg gccggcagga tcgcggccac caccaggaag 1980
gtggccgcgt tgcccagaat cagggccagg taggcgcccc gggtgtcggc ctgcagggcg 2040
accgcggcca gcgcggcgcc ggcgccgatc cccacgttgg tgaccgcgcg cagataggcg 2100
cggcccggca cccgggtctc cggcgggaga gtgtcggcgt acagcgtgtt gcgtaccgtg 2160
ccggccgccc ggtccagcgc ggtctccgcg cagaccaccg cgaggaagac gatgaacccg 2220
tgcaccaggg tgtacgccgc catgcccacg gcctgcagga ggcagagcag caacagcacg 2280
cggcggctgc cccagcggtc cgcggcccgg ccggcgggga ggctcgccgc gaccccgcac 2340
gcgccggcga tggtcagacc caggccgacc cgcgcgacgc tgaggccggc gacccgggtg 2400
aagtagagcg cgctggcggt catgaacatg ccgttgccga gtgtgttgac caggaccatc 2460
ccggcgaggc ggcggaccac cggatcgcgg gggagcaggc tggtggcggt ttcggccact 2520
gtggaaccca tgccccgatc ccaccggtga ccgggatcgg cggataatga tttagcgatg 2580
ggctcaacca tgcggttccg gatcggcctg gccgacctgg cgtcggcctc gctggcgtat 2640
tcgccgttgc aggaggcggc gctgagccta cggatgtggt cgcatcccgg ctattacgtc 2700
gagcagaccg gctggttcca gcggatgcgc gcggatttcg acgcgctgcc cgaccgggat 2760
ctgctgcgcg cgctggtcgc ctccaaccgg ttcgtcccgg acttcctcac cccacgcccg 2820
gccaccaccc gcccggccct cgccgacgag ctggccctgc tccgggccac cccgcccgag 2880
ctggtcgggc cggacctgga gcggaccttc cggccgcacg accgggaggt gccacccctg 2940
ctggcggagc tggccgccga tccggaggcg atgctcgacc ggatcgcccg tgcgctggcc 3000
gggtactggg atcgctgcct cgcgccgcga tggtggccgc gggcgcggtc ggtgctggag 3060
gcggacctga tctaccgggc ccggatgctc gccgaggggg gcgccgacgc gctcttcgcc 3120
gacctgtcgc accggttgta ctgggaggac ggcgtgctga cgatccgctg ggacgggcca 3180
ctggagatcg cccgcgaccg ggtcgacgtg aacgggcgcg ggctggtgct gctgcccacc 3240
tgtttcgccc ggggcgcgat caccgcgatc gacccggacc tccggccggt gatcatctat 3300
cgggcccgcg gcctgggcac gatgaccgag agcctgcggc cgccgccggc gttcccggcg 3360
ctgcgccggc tgctcggcga gccgcgggcc cgcctgctgc tgatgctcga cgagccggcc 3420
tcgaccaccg agctggcgca ccggctcgcc gtcacgccgg gcgcggtcag tcagcatctg 3480
cgggtttcta ga 3492
<210> 28
<211> 1229
<212> DNA
<213> 人工序列
<220>
<223> 以HincII+DraI从质粒supcos-1上切下的含pUC ori的片段
<400> 28
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
tatcatgtct ggatctgacg ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta 180
ggctggcggg gttgccttac tggttagcag aatgaatcac cgatacgcga gcgaacgtga 240
agcgactgct gctgcaaaac gtctgcgacc tgagcaacaa catgaatggt cttcggtttc 300
cgtgtttcgt aaagtctgga aacgcggaag tcagcgctct tccgcttcct cgctcactga 360
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 420
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 480
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 540
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 600
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 660
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 720
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 780
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 840
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 900
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 960
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 1020
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 1080
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 1140
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1200
tcaaaaagga tcttcaccta gatcctttt 1229
<210> 29
<211> 3116
<212> DNA
<213> 人工序列
<220>
<223> 片段MG512PCR
<400> 29
aactctagat cggacggtcg agctgtggca cttcttcacc gagcgcgagg cgcaggccat 60
cgaccaggtg gtcggcgact tcacggcgag ccacccgaac atcaaggtga ccgtcaaatc 120
cggtcaggac gactcgaagg tgacccaggc gatcggcgcc gggaacgggc cggacatcgg 180
gctgtcgtac tcgaccgaca tcgtgggcaa attctgctcg tcgggcgcct gggtggatct 240
caccgcgtac atcaaccggg ataaaatcga cctcaatcag ctgaacgcga cgacccggtc 300
ctacaccgag ttccagggca agcggtgcgc catgccgttc ctggccgacg cgtacggcat 360
gttctacaac aaggacctgt tcgcgaaggc cggcatcgcc gggccgccga agacgctcga 420
cgagctgacc gaggacgcca agaaactcac cgtgcgcaat gccgacggct cgctcaagac 480
ggtgggcttt cttccgctgt acgactatta cgagaacgcc gcggcccacc tggccccgtc 540
caccggcgcg aaatggctga ccccggacgg caagagcgcg gtcggcgccg acccgaattg 600
gaagaccctg ctgaactggc agaagagcct ggtcgactgg tacgggtacg acaacctgac 660
caggttcaag gccggtctcg gcgacgagtt cagcgccgac aacgccttcc agaagggcca 720
ggtggcgatc aacatcgatg ccgaataccg cctcgccttc ctcaaggatc agagccccaa 780
gctgaagtac ggggtggccc cgctgcccac caccgacccg gcccgatacg gcggcggtta 840
cgtgaccggc aacatcatgg gcatctcgaa gaacgccaag aaccccgagg cggcgtggga 900
gctcatcaaa tatctgacca ccgatgacgc cgcggtgacc aagctggccg gtctgctcaa 960
gaacgtgccg accaccacca aggcgatcgc cgacccgggc ctgaacgccg atccggactt 1020
caagacgttc atcgacatct tccgcaaccc gaactcgatg accaccccgc cgtccgcctc 1080
cgggccggcc taccaggaga ccttcgggca gttcctgacc agctaccagt ccggcaaggg 1140
cggggacctg gaccaggggc tggccgcggc ggaccagaag atcaacagcg tcatgagcct 1200
gggcggctga gcgatgctcg gcgttcgcct gcgccggggc gcggtcaccc tctcgtttct 1260
ggcgcccgcg ctgctcggca tcgggatgtt cttcgtctac cccctgatct cggcggtcta 1320
cttctcgttc acgaaattcg acctgctgac cgtgccgcag tgggtcgggc tggacaacta 1380
ccggcggatg gccggcgatc cgttcctgct gcaggcggtg cgcaacacgc tgtggatggt 1440
ggcggtcttc gtcccggtgc ggatgctctt cacgctcggc atggccatga tgatcgcgca 1500
gttcaagcgg ggcgccggtt tctaccgcac gctgttctac ctgccgtcgt tggtcccgcc 1560
ggtggccgcc accatcgcct tcgtctacct gctcaagccg ggcaccggcc cggtcaacca 1620
cgtcctgtcg atggtcggca tcgacggccc gctctggttc aactcgccgg cctgggccaa 1680
gccgtcgctg gtcctgctcg gcctgtgggc ctgcggcgac ctgctgatca tcttcctggc 1740
ggcggtgctc ggcgtcccgg agagcctcta cgaggccgcg tcgctggacg gcgcgaacgc 1800
ctggcacaga ttccggtcga tcaccctgcc gacgatccgc ccggtgctgc tgttcgcggc 1860
ggtcaccggc gtgatctaca cactgcagta cttcgaccag gcggcggtgg ccggctcgat 1920
cgccagcggg caggccaccg tcggcgccgg aatctcccag tccttcggct acccggaggg 1980
ctccaccttc acctatccgc tgtggctgtt caccgtcggg ttccgctaca gcgcgctcgg 2040
ctacgccaac gcgctggcca tcgccctgtt cgtggtcgcg ctcgcgatca ccgtcgtcct 2100
gctgcgccgc gccaaggcgt tctccgggga ggaatcgtga gtctcgtcct ggaccgcccg 2160
atcgtgcggg ccgcggcaga acggcgccgg atccggctcg cctggatcgc ccggcacagc 2220
atcgcgatcg cgctcggcat catgttcatc accccggtcg cgtacctggt gctgctctcg 2280
ctgatgacca gcgaccaggc gctgaccagc gattactggc cgaacacctg gcacccggag 2340
aactacgtgc gggtgttcca ggcaaccccg ctgccgcact atctgttcaa cacgatgctg 2400
tacgcggtgt ccgccaccgt cttcaccctc gcctccagcg tgcccgccgc gtacgccctg 2460
gcgaagttga agttccgcgg ccgcaacgcg ctgttcctca cggtgatctg cgtgatgatg 2520
ctgcccccgc aggtggtgac cgtcccgctg tatctgatgt gggcccggta cggcctgacc 2580
ggctcgctcg ccccgctgat catcccggcc ctgttcggcg acgcgttctg catcttcctg 2640
ctgcgtcagt tcctgctcac cattccgagc gaatatctgg acgcggcccg ggtcgacggc 2700
tgcggcgagt ggcgcaccct gctgcgcgtc gtgctgccga tggcccggcc gggaatcgcg 2760
gcggccggcc tgttccagtt cttctactgc tggaacgact attacgggcc gctgctctac 2820
accagcgaga acgagaactc gtggacgctc tcgctgggcc tggcctcgtt ccggaccgtg 2880
caccacgtcg actggaacct ggtcaccgcg gccaccgtgc tcgccatggc gccgctgatc 2940
atcatcttct tcttcgccca gcgcagcttc gtgcagggca tcacgctgac aggattcaag 3000
ggttgaaaat cgcggtcgtg ggtggcggat ccacctatac cccggagctg gtggacgggt 3060
tcgcccggct cggcaccatg gtcaccgaac tcgttctgat cgacccgtct agacat 3116
Claims (16)
1.一种阿卡波糖工程菌,所述阿卡波糖工程菌是产阿卡波糖的游动放线菌(Actinoplanes sp.),其中以下一个或两个基因失活:
(i)编码序列如SEQ ID NO:2所示的多肽的基因M;
(ii)编码序列如SEQ ID NO:3所示的多肽的基因N。
2.根据权利要求1所述的阿卡波糖工程菌,其中,所述产阿卡波糖的游动放线菌是游动放线菌SN223/29。
3.根据权利要求1所述的阿卡波糖工程菌,其中,所述产阿卡波糖的游动放线菌是保藏号为CGMCC No.7639的游动放线菌8-22。
4.根据权利要求1所述的阿卡波糖工程菌,其中,所述基因M的序列如SEQ ID NO:4所示或为与SEQ ID NO:4所示序列有至少80%、90%、95%或99%序列同一性的序列,所述基因N的序列如SEQ ID NO:5所示或为与SEQ ID NO:5所示序列有至少80%、90%、95%或99%序列同一性的序列。
5.根据权利要求3或4所述的阿卡波糖工程菌,其中,所述阿卡波糖工程菌中,基因M或基因N失活为基因M或基因N缺失。
6.根据权利要求5所述的阿卡波糖工程菌,其中,所述基因M缺失中,缺失的片段为SEQID NO:4的第67-1297位核苷酸;所述基因N缺失中,缺失的片段为SEQ ID NO:5的第108-1098位核苷酸。
7.根据权利要求6所述的阿卡波糖工程菌,其中,所述阿卡波糖工程菌是游动放线菌△BY-3或△MG-4,其中,△BY-3是游动放线菌8-22与序列为SEQ ID NO:13的DNA片段发生同源重组而形成的,△MG-4是游动放线菌8-22与序列为SEQ ID NO:18的DNA片段发生同源重组而形成的。
8.一种阿卡波糖工程菌的制备方法,所述方法包括将产阿卡波糖的游动放线菌中的以下一个或两个基因失活:
(i)编码序列如SEQ ID NO:2所示的多肽的基因M;
(ii)编码序列如SEQ ID NO:3所示的多肽的基因N。
9.根据权利要求8所述的方法,其中,所述产阿卡波糖的游动放线菌是游动放线菌SN223/29。
10.根据权利要求8所述的方法,其中,所述产阿卡波糖的游动放线菌是保藏号为CGMCCNo.7639的游动放线菌8-22。
11.根据权利要求8所述的方法,其中,所述基因M的序列如SEQ ID NO:4所示或为与SEQID NO:4所示序列有至少80%、90%、95%或99%序列同一性的序列,所述基因N的序列如SEQ ID NO:5所示或为与SEQ ID NO:5所示序列有至少80%、90%、95%或99%序列同一性的序列。
12.根据权利要求10或11所述的方法,其中,将基因M或基因N失活的方法包括但不限于基因敲除、突变、插入失活、同源重组、RNA干扰。
13.根据权利要求12所述的方法,其中,所述失活是使所述游动放线菌8-22与序列为SEQ ID NO:13或SEQ ID NO:18的DNA片段发生同源重组。
14.如权利要求1-7任一项所述的阿卡波糖工程菌在制备阿卡波糖中的应用。
15.基因M或其编码的多肽或基因N或其编码的多肽在制备杂质A组分和/或B组分含量降低的阿卡波糖工程菌中的应用,其中,基因M编码序列如SEQ ID NO:2所示的多肽,基因N编码序列如SEQ ID NO:3所示的多肽。
16.根据权利要求15所述的应用,其中,所述基因M的序列如SEQ ID NO:4所示或为与SEQ ID NO:4所示序列有至少80%、90%、95%或99%序列同一性的序列,所述基因N的序列如SEQ ID NO:5所示或为与SEQ ID NO:5所示序列有至少80%、90%、95%或99%序列同一性的序列。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710165472.6A CN108624544B (zh) | 2017-03-20 | 2017-03-20 | 阿卡波糖工程菌及其制备方法和应用 |
PCT/CN2018/077732 WO2018171400A1 (zh) | 2017-03-20 | 2018-03-01 | 阿卡波糖工程菌及其制备方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710165472.6A CN108624544B (zh) | 2017-03-20 | 2017-03-20 | 阿卡波糖工程菌及其制备方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108624544A CN108624544A (zh) | 2018-10-09 |
CN108624544B true CN108624544B (zh) | 2021-08-27 |
Family
ID=63585004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710165472.6A Active CN108624544B (zh) | 2017-03-20 | 2017-03-20 | 阿卡波糖工程菌及其制备方法和应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108624544B (zh) |
WO (1) | WO2018171400A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112592878B (zh) * | 2020-12-25 | 2022-08-26 | 上海交通大学 | 增强正调控蛋白基因表达以提高阿卡波糖发酵水平的方法 |
CN118086157A (zh) * | 2022-11-28 | 2024-05-28 | 浙江海正药业股份有限公司 | 生产阿卡波糖的工程菌及其构建方法和应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104693250A (zh) * | 2015-03-06 | 2015-06-10 | 成都大学 | 从含有阿卡波糖的溶液中提纯阿卡波糖的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201217533A (en) * | 2010-08-04 | 2012-05-01 | Bayer Pharma AG | Genomics of actinoplanes utahensis |
CN103305544B (zh) * | 2013-07-05 | 2015-07-01 | 浙江海正药业股份有限公司 | 阿卡波糖工程菌及其制备方法和应用 |
-
2017
- 2017-03-20 CN CN201710165472.6A patent/CN108624544B/zh active Active
-
2018
- 2018-03-01 WO PCT/CN2018/077732 patent/WO2018171400A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104693250A (zh) * | 2015-03-06 | 2015-06-10 | 成都大学 | 从含有阿卡波糖的溶液中提纯阿卡波糖的方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2018171400A1 (zh) | 2018-09-27 |
CN108624544A (zh) | 2018-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102606680B1 (ko) | S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드 | |
KR101659101B1 (ko) | 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도 | |
KR101718594B1 (ko) | 내열성 dna 폴리머라제를 포함하는 효소 조제물 및 그 제조 방법, 및 검출 대상생물의 검출 방법 | |
Van Buuren et al. | Novel genes induced during an arbuscular mycorrhizal (AM) symbiosis formed between Medicago truncatula and Glomus versiforme | |
Rather et al. | Genetic analysis of bacterial acetyltransferases: identification of amino acids determining the specificities of the aminoglycoside 6'-N-acetyltransferase Ib and IIa proteins | |
KR20110038678A (ko) | 피리피로펜 a 생합성 유전자 | |
US12084688B2 (en) | Glucuronosyltransferase, gene encoding same and use thereof | |
JP2020501519A (ja) | 化合物の生産のための組成物および方法 | |
CN108138167A (zh) | 芳樟醇的制造方法 | |
JP6430250B2 (ja) | グリセリマイシン及びメチルグリセリマイシンの生合成のための遺伝子クラスター | |
CN108624544B (zh) | 阿卡波糖工程菌及其制备方法和应用 | |
Best et al. | Organization and nucleotide sequences of the genes encoding the biotin carboxyl carrier protein and biotin carboxylase protein of Pseudomonas aeruginosa acetyl coenzyme A carboxylase | |
Donadio et al. | Disruption of a rhodaneselike gene results in cysteine auxotrophy in Saccharopolyspora erythraea | |
Emmerich et al. | Evidence for a functional similarity between the two-component regulatory systems RegSR, ActSR, and RegBA (PrrBA) in α-Proteobacteria | |
CN106701788B (zh) | 喷司他丁和阿糖腺苷生物合成基因簇及其应用 | |
CN103215282B (zh) | 越野他汀的生物合成基因簇及其应用 | |
CN110343684B (zh) | 一种梨果实液泡酸性转化酶及其活性抑制因子的应用 | |
KR20190005872A (ko) | 화합물의 제조를 위한 조성물 및 방법 | |
Frühling et al. | Genomic organization and expression properties of the VfENOD5 gene from broad bean (Vicia faba L.) | |
CN111363711B (zh) | 一种利用重组谷氨酸棒杆菌吸附固定化发酵生产赖氨酸的方法 | |
CN112410353B (zh) | 一种fkbS基因、含其的基因工程菌及其制备方法和用途 | |
Sheng et al. | ImuA participates in SOS mutagenesis by interacting with RecA1 and ImuB in Myxococcus xanthus | |
US6210935B1 (en) | Staurosporin biosynthesis gene clusters | |
TWI735113B (zh) | 2,5-呋喃二甲酸之製備方法 | |
Fujita et al. | Functional analysis of the plastid and nuclear encoded CbbX proteins of Cyanidioschyzon merolae |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |