CN108624544B

CN108624544B - 阿卡波糖工程菌及其制备方法和应用

Info

Publication number: CN108624544B
Application number: CN201710165472.6A
Authority: CN
Inventors: 黄隽; 李美红; 周军; 余贞; 张鑫培
Original assignee: Zhejiang Hisun Pharmaceutical Co Ltd
Current assignee: Zhejiang Hisun Pharmaceutical Co Ltd
Priority date: 2017-03-20
Filing date: 2017-03-20
Publication date: 2021-08-27
Anticipated expiration: 2037-03-20
Also published as: WO2018171400A1; CN108624544A

Abstract

本发明属于生物工程领域，涉及一种生产阿卡波糖的工程菌以及该菌的制备方法和应用。所述阿卡波糖工程菌是产阿卡波糖的游动放线菌或其衍生菌株，其中以下一个或两个基因失活：(i)编码序列如SEQ ID NO:2所示或与SEQ ID NO:2所示序列有至少80％、90％、95％或99％序列同一性的多肽的基因M；(ii)编码序列如SEQ ID NO:3所示或与SEQ ID NO:3所示序列有至少80％、90％、95％或99％序列同一性的多肽的基因N。利用本发明的阿卡波糖工程菌生产阿卡波糖，产品中杂质A组分和/或B组分的含量显著降低，保证了产品质量，不需后续提纯步骤或提纯步骤相对简单，减少工艺步骤，降低了成本。

Description

阿卡波糖工程菌及其制备方法和应用

技术领域

本发明属于生物工程领域，涉及一种生产阿卡波糖的工程菌以及该菌的制备方法和应用。

背景技术

据统计，目前我国糖尿病患者人数已达1.1亿人，中国已成为世界糖尿病人最多的国家。此外，中国还有约1.5亿人为糖尿病前期。单单用于糖尿病管理，现在中国每年就要投入近1734亿人民币；而用于糖尿病的直接医疗支出已经占到中国医疗支出的13％。。

游动放线菌(Actinoplanes sp.)产生的降糖药阿卡波糖是II型糖尿病的首选治疗药物，国内年销售额已近20亿元。目前阿卡波糖在生产上主要存在杂质组分问题，严重影响产品质量；其中最为突出的是杂质A、B和C组分(各组分结构见图1所示)。一般情况下，产品中对A、B组分含量的要求均在0.5wt％以下(相对于阿卡波糖含量)，杂质含量不达标的产品不能进入销售渠道。然而现有的由游动放线菌发酵工程生产的阿卡波糖中，A和B组分含量一般分别在10wt％和3wt％以上，即使较为优秀的菌种，其A和B组分含量也在1wt％以上。为保证产品质量，需要进行后续提纯步骤，导致工艺复杂，生产成本提高。

目前使用较多的是通过控制发酵过程来控制杂质组分的含量，但是该方法不稳定。

发明内容

本发明的目的是提供一种新的阿卡波糖工程菌，其生产的产品中杂质A组分和B组分含量降低；同时还提供该菌的生产方式和应用等，以解决现有技术的上述问题。

在第一个方面，本发明提供一种阿卡波糖工程菌，所述阿卡波糖工程菌是产阿卡波糖的游动放线菌(Actinoplanes sp.)或其衍生菌株，其中以下一个或两个基因失活：

(i)编码序列如SEQ ID NO:2所示或与SEQ ID NO:2所示序列有至少80％、90％、95％或99％序列同一性的多肽的基因M；

(ii)编码序列如SEQ ID NO:3所示或与SEQ ID NO:3所示序列有至少80％、90％、95％或99％序列同一性的多肽的基因N。

在本发明中，“至少X％序列同一性”是指要比较的两个多肽的氨基酸序列之间的百分比相同性，其是在所述两个氨基酸序列的最佳排列对比后获得的。所述最佳排列对比可以通过使用本领域已知的任何方法获得，例如Smith and Waterman,Adv.Appl.Math.2:482(1981)的局部同源算法，Needleman and Wunsch,J.Mol.Biol.48:443(1970)的同源排列算法，Pearson and Lipman,Proc.Natl.Acad.Sci.85:2444(1988)的相似性搜索方法及这些算法的计算机执行程序，如由NCBI站点上可用的BLAST P计算机软件所使用的那些。

本领域技术人员可以合理推断，在同一种属中，序列与参考多肽的氨基酸序列具有至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性的多肽与参考多肽在生物体中执行相同的生物学功能。例如，在本发明所述游动放线菌中，本领域技术人员能够合理预期序列与SEQ ID NO：3所示氨基酸序列具有至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性的多肽与由SEQ ID NO：3所示氨基酸序列组成的多肽在生物体中执行相同的生物学功能，因此失活序列与SEQ IDNO：3所示氨基酸序列具有至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性的多肽可以获得与失活SEQ ID NO：3所示氨基酸序列的多肽相同的效果，例如降低或去除阿卡波糖A和B杂质组分含量。

利用游动放线菌生产阿卡波糖是本领域常规技术，因此，本领域技术人员可以毫无疑义地知道产阿卡波糖的游动放线菌或其衍生菌株可以是哪些具体菌株。优选地，所述游动放线菌是游动放线菌SN223/29或其衍生菌株。进一步优选地，所述产阿卡波糖的游动放线菌是保藏号为CGMCC No.7639的游动放线菌(Actinoplanes sp.)8-22或其衍生菌株。

优选地，所述基因M的序列如SEQ ID NO:4所示或为与SEQ ID NO:4所示序列有至少80％、90％、95％或99％序列同一性的序列，所述基因N的序列如SEQ ID NO:5所示或为与SEQ ID NO:5所示序列有至少80％、90％、95％或99％序列同一性的序列。本领域技术人员应该理解，与SEQ ID NO:4或SEQ ID NO:5所示序列有至少80％、90％、95％或99％序列同一性的序列的基因，编码与SEQ ID NO:4或SEQ ID NO:5所编码的多肽具有相同或相似的功能的多肽。

当基因M的序列为SEQ ID NO:4所示时，基因M实质上为bglY基因，编码bglY蛋白(SEQ ID NO:2所示蛋白)，其详细信息见Genbank CP003170.1:5899370-5900680。

当基因N的序列为SEQ ID NO:5所示时，基因N实质上为mpbG基因，编码mpbG蛋白(SEQ ID NO:3所示蛋白)。

在优选的实施方式中，所述阿卡波糖工程菌中，基因M或基因N失活为基因M或基因N缺失。

进一步优选地，所述基因M缺失中，缺失的片段为SEQ ID NO:4的第67-1297位核苷酸；所述基因N缺失中，缺失的片段为SEQ ID NO:5的第108-1098位核苷酸。

本领域技术人员应该理解，基因失活指基因编码的多肽量减少或不编码多肽，或编码的多肽长度缺失从而导致多肽活性降低或无活性。基因缺失包括基因的完全缺失和部分缺失，均可以导致上述的基因失活。任何形式的基因失活以及能够使基因失活的任何形式的基因缺失，都属于本发明的范畴之内。

进一步优选地，所述阿卡波糖工程菌是游动放线菌工程菌△BY-3或△MG-4，其中，△BY-3是游动放线菌8-22与序列为SEQ ID NO:13的DNA片段发生同源重组而形成的，△MG-4是游动放线菌8-22与序列为SEQ ID NO:18的DNA片段发生同源重组而形成的。

同源重组是生物工程领域的常规技术。进行同源重组的DNA片段的5’端和3’端分别包括待失活的基因的5’端和3’端，缺少待失活基因编码序列的中间部分。所述DNA片段能够与游动放线菌中待失活基因的上下游发生同源重组，从而将DNA片段重组至游动放线菌的基因组中，因其缺少待失活基因编码序列的中间部分，使得待失活基因无法正常表达产物或不表达，因而使构建的游动放线菌中的该基因失活。在本发明的具体实施方式中，实施同源重组的方式为接合转移。

在第二个方面，本发明提供所述阿卡波糖工程菌的制备方法，所述方法包括将产阿卡波糖的游动放线菌或其衍生菌株中的以下一个或两个基因失活：

(ii)编码序列如SEQ ID NO:3所示或与SEQ ID NO:3所示序列有至少80％、90％、95％或99％序列同一性的多肽的基因N；

所述产阿卡波糖的游动放线菌或其衍生菌株已在上文描述。优选地，所述产阿卡波糖的游动放线菌是游动放线菌SN223/29或其衍生菌株；在进一步优选的实施方式中，所述产阿卡波糖的游动放线菌是保藏号为CGMCC No.7639的游动放线菌8-22或其衍生菌株。

所述基因M和基因N的序列已在上文描述。

如上所述，基因失活指基因编码的多肽量减少或不编码多肽，或编码的多肽长度缺失从而导致多肽活性降低或无活性。本领域技术人员已知，在生物工程领域中，基因失活是常规技术手段，可以通过多种方式实现。比如，基因敲除、突变、插入失活、同源重组、RNA干扰等。本发明即使用同源重组的方式使基因M和基因N失活。凡是可以使基因如上所述失活的任何技术手段都在本发明的范围之内。

进一步优选地，所述失活是使所述游动放线菌8-22与序列为SEQ ID NO:13或SEQID NO:18的DNA片段发生同源重组。

在第三个方面，提供本发明的阿卡波糖工程菌在制备阿卡波糖中的应用。

在第四个方面，提供一种阿卡波糖产品，由培养本发明的阿卡波糖工程菌经发酵获得。

在第五个方面，提供基因M或其编码的多肽或基因N或其编码的多肽在制备杂质A组分和/或B组分含量降低的阿卡波糖工程菌中的应用。其中，基因M或其编码的多肽或基因N或其编码的多肽的信息已在上文中描述。

利用本发明提供的阿卡波糖工程菌生产的阿卡波糖产品中，杂质A组分和B组分的含量由出发菌的1.4wt％和1.31wt％分别下降至约0.5wt％和约0.2wt％，下降幅度十分显著，而阿卡波糖的发酵单位没有受到任何影响。利用本发明的阿卡波糖工程菌生产阿卡波糖，产品中杂质A组分和B组分的含量显著降低，保证了产品质量，不需后续提纯步骤或提纯步骤相对简单，减少工艺步骤，降低了成本。

附图说明

图1：阿卡波糖及杂质A、B、C组分和糖苷配基的结构；

图2：质粒pBS-BY334的物理图谱；

图3：质粒pBS-BYHS的物理图谱；

图4：质粒pBS-BYHS-AmT的物理图谱；

图5：缺失内部1231个碱基的bglY基因示意图；

图6：质粒pBS-MG334的物理图谱；

图7：载体supAmT的物理图谱；

图8：质粒SAT-MG512的物理图谱；图中XbaI^M表示该XbaI酶切位点的A碱基被甲基化而不能被核酸内切酶XbaI切开；

图9：质粒SAT-MGHS的物理图谱；

图10：缺失内部991个碱基的mpbG基因示意图。

具体实施方式

根据文献报导(Appl Microbiol Biotechnol.2008,80:767-778)，产生阿卡波糖杂质C组分有两条途径：一是阿卡波糖经过treY基因编码的麦芽寡糖基海藻糖合酶催化反应直接得到C组分；二是由treS基因编码的海藻糖酶合成海藻糖，再进入合成途径得到C组分。由此我们推测，产生阿卡波糖杂质A组分的途径也与产生C组分的途径相似：某个特定的酶催化蔗糖得到麦芽酮糖(maltulose)，渗入到阿卡波糖的合成途径中，最终形成杂质A组分。只要失活编码这个特定的酶的基因，理论上就能阻断麦芽酮糖的合成，从而降低或去除杂质A组分。

因此，如何筛选到与麦芽酮糖合成相关的酶基因是降低或去除杂质A组分的关键所在。但是迄今为止关于麦芽酮糖的生物合成途径却鲜有文献报导，无法通过现有技术获得与麦芽酮糖合成相关的酶基因。从NCBI网站上(https://www.ncbi.nlm.nih.gov/nuccore/？term＝maltulose)能检索到的与麦芽酮糖相关的基因为agl基因，编码α-葡萄糖苷酶。据文献(Appl Environ Microbiol.2009,75(4):1135-1143；Caries Res.2003,37(6):410-415；J Biol Chem.2006,281(26):17900-17908；J Biol Chem.2001,276(40):37415-37425)报导，α-葡萄糖苷酶主要与麦芽酮糖的代谢有关，而不是与合成有关。游动放线菌Actinoplanes sp.SE50/110的基因组已经测序(Genbank CP003170.1)。我们从NCBI上搜索了蔗糖异构酶aglB(Genbank AF337811.1)，并以AglB的氨基酸序列(SEQ ID NO:1)为基础，与游动放线菌基因组进行比对，筛选得到bglY基因(Genbank CP003170.1:5899370-5900680)和mpbG基因(SEQ ID NO:5)，其氨基酸序列与蔗糖异构酶基因的相似度分别为45％和44％，进一步试验验证失活这两个基因是否能阻断杂质A组分的产生。

基于上述的分析，发明人进行了以下实验并完成本发明。下面将结合具体实施例和附图说明本发明，但本发明的内容不限于此。如没有特殊说明，下面实施例中所使用的试剂均是常规化学试剂商店可购得的；所使用的方法及其参数都是本领域技术人员根据现有技术或公知常识可以完成的。为了便于描述，本专利中所涉及的方法列举如下：

游动放线菌基因组的分离(在实施例中以“提取基因组DNA”描述)：取游动放线菌8-22冻存管菌液(申请人所有)200μl接种于30ml TSB培养基(Bacto TM Tryptic SoyBroth.BD公司，货号211825)，28℃，220rpm培养48hr后，于50ml离心管中，4000rpm离心10分钟，去上清，沉淀用30ml蔗糖-Tris缓冲液(10.3％蔗糖，10mM Tris-HCl，pH8.0)洗涤2遍后，以5ml蔗糖-Tris缓冲液悬浮。加入100mg/ml溶菌酶溶液20μl，37℃水浴2hr。加入10％SDS溶液500μl，温和颠倒直至基本澄清。加酚-氯仿-异戊醇(25:24:1，pH8.0)溶液5ml，温和颠倒数次后，4000rpm离心10分钟。取上层溶液4ml，加酚-氯仿-异戊醇(25:24:1，pH8.0)溶液4ml，温和颠倒数次后4000rpm离心10分钟。取上层溶液3ml，加入3mol/L的HAc/NaAc缓冲液(pH5.3)300μl，异丙醇3ml，温和颠倒数次后，将结团的沉淀用吸头挑到1.5ml离心管中。沉淀用70％乙醇洗涤2遍后，室温干燥。加入500μl Tris-HCl(pH8.0)溶解，得到游动放线菌8-22的总DNA。

DNA的酶切(使用TaKaRa的核酸内切酶)，末端补平(使用TaKaRa的BKL试剂盒，产品编号：6127A)、连接(使用TaKaRa的Solution I，产品编号6022Q)和PCR反应(PCR检验使用TaKaRa的Taq酶，产品编号R001；扩增目的基因片段使用TaKaRa的PrimeSTAR酶，产品编号R010Q)均为本领域公知的方法，具体可参见相应的产品说明书；质粒转化到大肠杆菌的方法为本领域公知的CaCl₂法。

本发明使用的游动放线菌(Actinoplanes sp.)8-22是保藏在中国微生物菌种保藏管理委员会普通微生物中心(CGMCC)(北京市朝阳区北辰西路1号院3号)的编号为CGMCCNo.7639的游动放线菌，保藏日期为2013年5月24日。所述游动放线菌8-22不产孢，气生菌丝生长紧致，颜色由橙色至棕黄色，产色素。

实施例1-1：构建用于失活bglY基因的重组质粒pBS-BYHS-AMT

a)以引物BY3F53(SEQ ID NO:6)/BY3R54(SEQ ID NO:7)从游动放线菌8-22基因组DNA扩增得到3.1kb左右的片段BY334(SEQ ID NO:23)，将该片段磷酸化后，插入到载体pBluKS(Genebank X52331.1)的HincII位点，得到质粒pBS-BY334(片段的插入方向见图2)；

b)以HisunHF(SEQ ID NO:9)/HisunCR(SEQ ID NO:10)为引物，以单链(SEQ IDNO:8)为模板，扩增得到片段HHCPCR(SEQ ID NO:24)。将质粒pBS-BY334经转化大肠杆菌JM110后重新抽提，以去除碱基A上的甲基化，从而使其ClaI酶切位点能被核酸内切酶ClaI切开。该质粒经HindIII/ClaI酶切后，与经同样酶切的片段HHCPCR连接，得到质粒pBS-BY334HS；

c)以引物BY5F51(SEQ ID NO:11)/BY5R52(SEQ ID NO:12)从游动放线菌8-22基因组DNA扩增得到3.1kb左右的片段BY512(SEQ ID NO:25)，该片段以XbaI酶切后，插入到载体pBS-BY334HS的XbaI位点，得到质粒pBS-BYHS(片段的插入方向见图3)；

d)质粒pIJ773(质粒pIJ773在文献Gust B,Kieser T and Chater K,F.

technology:PCR-targeting system in Streptomyces coelicolor.JohnInnes Centre.2002中有详细说明)以XbaI酶切后，回收包含氨普霉素抗性基因aac(3)IV和接合转移起始位点oriT的1.3kb的片段(SEQ ID NO:26)，并以BLK试剂盒补平末端；该片段插入到质粒pBS-BYHS的DraI位点，得到重组质粒pBS-BYHS-AmT(见图4)。该质粒的bglY基因因为缺失了内部的1231个碱基而失去原有的生物活性(图5)。用于与游动放线菌8-22进行同源重组的基因序列见SEQ ID NO:13，其包含bglY基因的5’端部分序列、3’端部分序列和片段HHCPCR的部分序列。

实施例1-2：构建用于失活mpbG基因的重组质粒SAT-MGSH

a)以引物MG3F63(SEQ ID NO:14)/MG3R64(SEQ ID NO:15)从游动放线菌8-22基因组DNA扩增得到3.5kb左右的片段MG334(SEQ ID NO:27)。该片段磷酸化后，插入到载体pBluKS的HincII位点，得到质粒pBS-MG334(片段的插入方向见图6)；

b)以HisunHF(SEQ ID NO:9)/HisunCR(SEQ ID NO:10)为引物，以单链(SEQ IDNO:8)为模板，扩增得到片段HHCPCR。该片段经HindIII/ClaI酶切后，与经同样酶切的质粒pBS-MG334连接，得到质粒pBS-MG334HS；

c)以HincII+DraI从柯斯质粒supcos-1(Stratagene,Inc.)上切下1229bp含pUCori的片段(SEQ ID NO:28)；以BstBI+XbaI从pIJ773上切下1271bp的含aac3(IV)和oriT的片段(SEQ ID NO:26的1-1271)，并以BLK试剂盒平末端化。上述两个片段连接后，得到载体supAmT(如图7)。

d)以引物MG5F61(SEQ ID NO:16)/MG5R62(SEQ ID NO:17)从游动放线菌8-22基因组DNA扩增得到3.1kb左右的片段MG512PCR(SEQ ID NO:29)。该片段以XbaI酶切后，插入到载体SupAmT(图7)的XbaI位点，得到质粒SAT-MG512(片段的插入方向见图8)；

e)质粒pBS-MG334HS以XbaI酶切，回收3.6kb左右的片段；该片段插入质粒SAT-MG512的XbaI位点，得到重组质粒SAT-MGHS(片段的插入方向见图9)。该质粒的mpbG基因因为缺失了内部的991个碱基而失去原有的生物活性(图10)。用于与游动放线菌进行同源重组的序列见SEQ ID NO:18，其包含mpbG基因5’端部分序列、3’端部分序列和片段HHCPCR部分序列。

实施例2：bglY基因和mpbG基因缺失的重组质粒PBS-BYHS-AMT和SAT-MGSH转化到宿主菌游动放线菌8-22

a)将重组质粒PBS-BYHS-AmT和SAT-MGSH转化到大肠杆菌ET12567(pUZ8002)(在文献Gust B,Kieser T and Chater K,F.

technology:PCR-targeting systemin Streptomyces coelicolor.John Innes Centre.2002中有详细说明)：取重组质粒1μl加入到100μl大肠杆菌ET12567(pUZ8002)感受态细胞(以CaCl₂法制备)中，冰上放置30分钟后，42℃热击90秒，再迅速放到冰上冷却1分钟，加入900μl LB培养，37℃水浴50分钟。取100μl涂布于含25μg/ml氯霉素(Cm)、50μg/ml卡那霉素(Km)、50μg/ml安普霉素(Am)的固体LB培养上，37℃培养过夜，长出转化子ET12567(pUZ8002,PBS-BYHS-AmT)和ET12567(pUZ8002,SAT-MGSH)。

b)大肠杆菌ET12567(pUZ8002,PBS-BYHS-AMT)和ET12567(pUZ8002,SAT-MGSH)的培养：挑一个转化子单菌落于3ml含25μg/ml Cm、50μg/ml Km和50μg/ml Am的液体LB培养基中，37℃，250rpm培养过夜，菌液300μl接种于30ml含Cm、Km、Am的液体LB培养基中，37℃，250rpm培养4-6h，至OD600为0.4-0.6之间。收集菌液，离心后，以LB培养基洗涤2遍，最后以3ml LB培养基悬浮，备用。

c)宿主菌8-22菌液的准备：从平板上刮下游动放线菌8-22的菌丝，在30ml TSB培养基中，28℃培养24-40h，至菌液变成黑色。取3ml菌液转接于30ml TSB培养基中，28℃培养6h。取500μl菌液，离心去上清后，以500μl 2×YT培养基悬浮，37℃水浴20min，自然冷却，备用。

d)接合转移：取500μl b)的菌液加入到500μl c)的菌液中，离心去掉800μl上清。以剩余的上清悬浮菌体，并涂布于2CMC培养基。28℃培养16-20h后，以含有625μg Am和500μg萘啶酮酸(Nal)的1ml无菌水覆盖，28℃培养4-8d，长出转化子。

实施例3：bglY基因或mpbG基因缺失的游动放线菌工程菌的筛选培养

a)挑一个转化子，在含有25μg/ml Am和25μg/ml Nal的YMS培养基上划线，28℃培养4-6d。将生长的菌落在不含抗生素的YMS培养基上28℃连续培养2代后，再在不含抗生素的YMS培养基上划线分离单菌落，28℃培养4-6d。

b)用牙签将a)得到的单菌落分别于含和不含25μg/ml Am的YMS培养基上点种，28℃培养4-6d。挑选在含25μg/ml Am的YMS培养基上不生长而在不含Am的YMS培养基上生长的菌落，在不含抗生素的YMS培养基上进行放大培养。

实施例4-1：bglY基因缺失的游动放线菌工程菌的鉴定

利用PCR方法对放大培养的菌株进行筛选。按以下配比配制反应液：

15μl/管分装，分别用牙签挑取实施例3-b)所筛选的菌落为模板进行PCR反应，并以0.2μl 8-22基因组DNA和重组质粒PBS-BYHS-AMT分别为负对照和正对照。PCR反应程序为：

95℃×10分钟，

(94℃×30秒、68℃×2分钟)×30个循环，

72℃×2分钟，

16℃×1秒。

PCR产物大小为1496bp的是回复突变，即其基因型与出发菌株8-22相同；PCR产物大小为437bp的是PBS-BYHS-AMT基因缺失的游动放线菌工程菌。利用该方法筛选到菌株△BY-3。对该菌株进行测序鉴定，测序结果与SEQ ID NO:13一致，说明该菌株是本发明预期的菌株。

实施例4-2：mpbG基因缺失的游动放线菌工程菌的鉴定

15μl/管分装，分别用牙签挑取实施例3-b)所筛选的菌落为模板进行PCR反应，并以0.2μl 8-22基因组DNA和重组质粒SAT-MGSH分别为负对照和正对照。PCR反应程序为：

95℃×10分钟，

(94℃×30秒、68℃×2分钟)×30个循环，

72℃×2分钟，

16℃×1秒。

PCR产物大小为1447bp的是回复突变，即其基因型与出发菌株8-22相同；PCR产物大小为625bp的是SAT-MGSH基因缺失的游动放线菌工程菌。利用该方法筛选到菌株△MG-4。对该菌株进行测序鉴定，测序结果与SEQ ID NO:18一致，说明该菌株是本发明预期的菌株。

实施例5：bglY基因或mpbG基因缺失的游动放线菌工程菌△BY-3和△MG-4的发酵检验

分别将bglY基因和mpbG基因缺失的游动放线菌工程菌△BY-3和△MG-4在YMS培养基上28℃培养3-4d后，将面积为1cm²左右菌落挖到30ml种子培养基(黄豆饼粉3.0％，玉米淀粉1.0％，葡萄糖1.0％，甘油2.0％，CaCO₃ 0.20％，pH自然)中，28℃，220rpm培养24-30h，以2ml的接种量转接到发酵培养基(葡萄糖3.0％，麦芽糖5.0％，黄豆饼粉1.2％，K₂HPO₄0.10％，CaCl₂·H₂O 0.35％，FeCl₃ 0.05％，CaCO₃ 0.3％，谷氨酸钠0.1％)，28℃，220rpm培养7-8d。取发酵液5ml过滤后，取1ml滤液，加入4ml无水甲醇，浸泡过夜后，过滤。取滤液以HPLC检验阿卡波糖及A、B组分杂质的含量。HPLC方法为：氨基柱，流动相为KH₂PO₄ 0.87g、K₂HPO₄ 0.46g、乙腈2550ml、H₂O 1450ml。检测波长210nm，流速1ml/min。以同样的方法检测出发菌株8-22的发酵产物进行对比。

HPLC结果见表1～表4。结果表明，与出发菌株8-22相比，bglY基因或mpbG基因缺失的游动放线菌工程菌△BY-3和△MG-4的杂质A、B组分含量明显下降。

表1：出发菌株8-22发酵样品的HPLC结果。杂质A、杂质B和阿卡波糖的出峰时间分别为27.886min、25.031min和30.702min。

表2：菌株△BY-3发酵样品的HPLC结果。杂质A、杂质B和阿卡波糖的出峰时间分别为28.155min、25.165min和30.733min。

表3：菌株△MG-4发酵样品的HPLC结果。杂质A、杂质B和阿卡波糖的出峰时间分别为28.837min、25.767min和31.421min。

表4：出发菌株和基因工程菌发酵产物中杂质A和B的含量比较分析

菌株	A组分含量	B组分含量	阿卡波糖发酵单位
				出发菌8-22	1.4wt％	1.31wt％	5001mg/L
△BY-3	0.53wt％	0.20wt％	4807mg/L
				△MG-4	0.42wt％	0.21wt％	5887mg/L

表4的数据表明通过失活基因bglY或mpbG能降低杂质A组分和杂质B组分的含量，这一方面说明杂质A组分和杂质B组分的产生可能是互相关联的，另一方面也说明这两个基因很有可能是决定杂质A组分和杂质B组分的关键基因。同时，基因的失活并没有影响阿卡波糖的发酵单位。

序列表

<110> 浙江海正药业股份有限公司

<120> 阿卡波糖工程菌及其制备方法和应用

<130> DP1F170344ZX/CNZJHZ/GL

<160> 29

<170> PatentIn version 3.5

<210> 1

<211> 440

<212> PRT

<213> 游动放线菌

<400> 1

Met Lys Lys Phe Ser Val Val Ile Ala Gly Gly Gly Ser Thr Phe Thr

1 5 10 15

Pro Gly Ile Val Leu Met Leu Leu Ala Asn Gln Asp Arg Phe Pro Leu

20 25 30

Arg Ser Leu Lys Phe Tyr Asp Asn Asp Gly Ala Arg Gln Glu Thr Ile

35 40 45

Ala Glu Ala Cys Lys Val Ile Leu Lys Glu Gln Ala Pro Glu Ile Glu

50 55 60

Phe Ser Tyr Thr Thr Asp Pro Gln Ala Ala Phe Thr Asp Val Asp Phe

65 70 75 80

Val Met Ala His Ile Arg Val Gly Lys Tyr Pro Met Arg Glu Gln Asp

85 90 95

Glu Lys Ile Pro Leu Arg His Gly Val Leu Gly Gln Glu Thr Cys Gly

100 105 110

Pro Gly Gly Ile Ala Tyr Gly Met Arg Ser Ile Gly Gly Val Leu Glu

115 120 125

Leu Val Asp Tyr Met Glu Lys Tyr Ser Pro Asn Ala Trp Met Leu Asn

130 135 140

Tyr Ser Asn Pro Ala Ala Ile Val Ala Glu Ala Thr Arg Arg Leu Arg

145 150 155 160

Pro Asn Ala Lys Ile Leu Asn Ile Cys Asp Met Pro Ile Gly Ile Glu

165 170 175

Gly Arg Met Ala Gln Ile Val Gly Leu Lys Asp Arg Lys Gln Met Arg

180 185 190

Val Arg Tyr Tyr Gly Leu Asn His Phe Gly Trp Trp Thr Ser Ile Glu

195 200 205

Asp Leu Asp Gly Asn Asp Leu Met Pro Lys Leu Arg Glu Tyr Val Ala

210 215 220

Lys Tyr Gly Tyr Val Pro Pro Ser Asn Asp Pro His Thr Glu Ala Ser

225 230 235 240

Trp Asn Asp Thr Phe Ala Lys Ala Lys Asp Val Gln Ala Leu Asp Pro

245 250 255

Gln Thr Met Pro Asn Thr Tyr Leu Lys Tyr Tyr Leu Phe Pro Asp Tyr

260 265 270

Val Val Ala His Ser Asn Pro Glu Arg Thr Arg Ala Asn Glu Val Met

275 280 285

Asp His Arg Glu Lys Asn Val Phe Ser Ala Cys Arg Ala Ile Ile Ala

290 295 300

Ala Gly Lys Ser Thr Ala Gly Asp Leu Glu Ile Asp Glu His Ala Ser

305 310 315 320

Tyr Ile Val Asp Leu Ala Thr Ala Ile Ala Phe Asn Thr Gln Glu Arg

325 330 335

Met Leu Leu Ile Val Pro Asn Asn Gly Ala Ile His Asn Phe Asp Ala

340 345 350

Asp Ala Met Val Glu Ile Pro Cys Leu Val Gly His Asn Gly Pro Glu

355 360 365

Pro Leu Thr Val Gly Asp Ile Pro His Phe Gln Lys Gly Leu Met Ser

370 375 380

Gln Gln Val Ala Val Glu Lys Leu Val Val Asp Ala Trp Glu Gln Arg

385 390 395 400

Ser Tyr His Lys Leu Trp Gln Ala Ile Thr Leu Ser Lys Thr Val Pro

405 410 415

Ser Ala Ser Val Ala Lys Ala Ile Leu Asp Asp Leu Ile Ala Ala Asn

420 425 430

Lys Asp Tyr Trp Pro Glu Leu His

435 440

<210> 2

<211> 436

<212> PRT

<213> 游动放线菌

<400> 2

Met Arg Leu Val Ile Leu Gly Gly Gly Gly Phe Arg Val Pro Leu Val

1 5 10 15

Tyr Arg Ala Leu Leu Ala Asp His Arg Gln Thr Gly Ile Thr Glu Val

20 25 30

Ala Leu His Asp Val Asp Pro Gly Arg Leu His Ala Ile Gly Arg Val

35 40 45

Leu His Ala Leu Ala Arg Asp Val Pro Asp Ala Pro Thr Val His Thr

50 55 60

Thr Thr Asp Leu Asp Thr Ala Leu Thr Gly Ala Thr Phe Val Phe Ser

65 70 75 80

Ala Ile Arg Val Gly Gly Leu His Gly Arg Val Val Asp Glu Arg Val

85 90 95

Ala Arg Ala Ala Gly Ile Leu Gly Gln Glu Thr Val Gly Ala Gly Gly

100 105 110

Ile Ala Tyr Gly Leu Arg Ser Val Pro Glu Ser Leu Arg Ile Ala Glu

115 120 125

Arg Val Ala Ala Val Ala Pro Asp Ala Trp Val Ile Asn Phe Thr Asn

130 135 140

Pro Ala Gly Leu Val Thr Glu Ala Met Ser Gly Ile Leu Gly Asp Arg

145 150 155 160

Val Ile Gly Ile Cys Asp Ser Pro Thr Gly Leu Val Asp Arg Val Leu

165 170 175

Arg Val Leu Asp Ala Pro Gly Ala Arg Val Asp Tyr Ala Gly Leu Asn

180 185 190

His Leu Gly Trp Leu Tyr Gly Val Tyr Asp Ala Ala Gly Arg Asp Leu

195 200 205

Leu Pro Gly Leu Leu Ala Asp Glu Ala Gly Leu Ala Thr Ile Glu Glu

210 215 220

Gly Arg Leu Phe Pro Gly Leu Arg Glu Leu Gly Ala Ile Pro Asn Glu

225 230 235 240

Tyr Leu His Tyr Tyr Tyr His Pro Val Ala Lys Ala Asp Gly Pro Thr

245 250 255

Arg Gly Glu Phe Leu Ala Glu Gln Gln Glu Arg Cys Tyr Arg Glu Met

260 265 270

Ser Ala Gly Glu Pro Leu Glu Ala Trp Leu Arg Ala Trp Arg Glu Arg

275 280 285

Glu Ala Thr Tyr Met Ala Asp Asn Arg Ser Gln Ser Gly Ala Gly Asp

290 295 300

Arg Asp His Asp Glu Ser Arg Pro Ala Gly Tyr Glu Gly Val Ala Leu

305 310 315 320

Ala Val Met Arg Ala Leu Ala Arg Asp Glu Pro Ala Glu Leu Ile Leu

325 330 335

Gly Val Arg Asn Arg Gly Val Leu Asp Val Leu Asp Ala Asp Ala Val

340 345 350

Val Glu Val Pro Cys Arg Val Asp Gly Thr Gly Ala Val Pro Arg Arg

355 360 365

Val Gly Ala Leu Pro Gly His Ala Val Gly Leu Val Gln Thr Val Lys

370 375 380

Ala Val Glu Arg Gly Val Leu Glu Ala Val Gln Thr Gly Ser Ala Ala

385 390 395 400

Ala Ala Val Arg Ala Met Ala Gly His Pro Leu Val Gly Asp Pro Glu

405 410 415

Leu Ala Gly Arg Leu Ile Ala Ala Tyr Arg Ala Glu Leu Pro Glu Leu

420 425 430

Ala Tyr Leu Ser

435

<210> 3

<211> 418

<212> PRT

<213> 游动放线菌

<400> 3

Leu Lys Ile Ala Val Val Gly Gly Gly Ser Thr Tyr Thr Pro Glu Leu

1 5 10 15

Val Asp Gly Phe Ala Arg Leu Gly Thr Met Val Thr Glu Leu Val Leu

20 25 30

Ile Asp Pro Ser Ala Glu Arg Leu Asp Ile Val Gly Ala Phe Ala Ala

35 40 45

Arg Ile Phe Ala Gln Tyr Gly His Pro Gly Lys Val Thr Trp Thr Thr

50 55 60

Asp Leu Asp Ala Gly Val Thr Asp Ala Asp Ala Ala Val Ile Gln Leu

65 70 75 80

Arg Val Gly Gly Gln Arg Ala Arg Ile Ser Asp Glu Ser Phe Pro Leu

85 90 95

Glu Cys Gly Cys Val Gly Gln Glu Thr Thr Gly Ala Gly Gly Leu Ala

100 105 110

Lys Ala Leu Arg Thr Val Pro Val Ile Leu Asp Val Ala Glu Arg Ile

115 120 125

Arg Ala Arg Ala Arg Pro Gly Ala Trp Ile Val Asp Phe Thr Asn Pro

130 135 140

Val Gly Ile Val Thr Arg Ala Leu Leu Asp Ala Gly His Arg Ala Val

145 150 155 160

Gly Leu Cys Asn Val Ala Ile Gly Phe Gln Arg Arg Phe Ala Ser Tyr

165 170 175

Leu Glu Val Pro Pro Gly Ser Val Val Leu Asp His Val Gly Leu Asn

180 185 190

His Leu Thr Trp Glu Arg Ala Ala Phe Val Asp Gly Val Asp Arg Leu

195 200 205

Pro Glu Leu Leu Ser Arg His Leu Ser Asp Ile Ala Gly Gln Val Asp

210 215 220

Val Pro Ala Glu Ile Ile Ser Met Leu Gly Ser Val Pro Ser Tyr Tyr

225 230 235 240

Leu Ser Tyr Phe Tyr Arg His Asp Gly His Val Arg Glu Ala Leu Gly

245 250 255

Ala Pro Thr Arg Gly Gln Arg Val Ala Glu Ile Glu Ala Thr Leu Leu

260 265 270

Asp Met Tyr Arg Asp Val Thr Leu Thr Glu Lys Pro Ala Leu Leu Ala

275 280 285

Glu Arg Gly Gly Ala Phe Tyr Ser Glu Ala Ala Val Gly Leu Leu Ala

290 295 300

Ser Leu Phe Gly Leu Asp Asp Asp Ala Val His Ser Val Asn Val Arg

305 310 315 320

Asn Leu Gly Thr Leu Pro Phe Leu Pro Ala Asp Ala Val Ile Glu Val

325 330 335

Ser Ala Arg Ala Gly Arg Thr Gly Pro Asp Pro Leu Pro Val Thr Ala

340 345 350

Leu Pro Pro Asp Leu Ala Gly Leu Ile Thr His Thr Trp Ser Tyr Glu

355 360 365

Glu Leu Ala Leu Asp Ala Ala Leu Arg Gly Gly Arg Asp Arg Val Tyr

370 375 380

Arg Ala Leu Leu Ala His Pro Leu Ile Gly Gln His Glu Arg Ala Thr

385 390 395 400

Ala Leu Thr Asp Arg Leu Ile Ala Ala Gly Arg Asp His Leu Ala Trp

405 410 415

Ala Arg

<210> 4

<211> 1311

<212> DNA

<213> 游动放线菌

<400> 4

atgcggttag tgatcctcgg tggtggcgga ttccgggtgc cgttggttta ccgggcgctg 60

ctggccgacc accggcagac cggcatcacc gaggtcgccc tgcacgacgt cgaccccggc 120

cggctgcacg ccatcggccg ggtcctgcac gccctcgccc gcgacgtgcc cgacgccccg 180

accgtgcaca ccaccaccga cctggacacc gcgctgaccg gcgccacctt cgtcttctcc 240

gccatccggg tcggcggcct gcacggccgg gtcgtcgacg aacgcgtcgc ccgcgccgcc 300

ggcatcctcg gccaggagac cgtcggcgcc ggcggcatcg cgtacggcct gcgctccgtc 360

ccggaatcgc tgcggatcgc cgagcgggtg gcggccgtcg ccccggatgc ctgggtcatc 420

aacttcacca accccgccgg cctggtcacc gaagccatgt ccggcatcct cggcgaccgg 480

gtgatcggca tctgcgactc gccgaccgga ctggtcgacc gggtgctccg ggtcctggac 540

gcccccggcg cccgggtcga ctacgccggg ctcaaccatc tgggctggct gtacggcgtg 600

tacgacgcgg ctggtcgcga cctgctgccc gggctgctcg ccgacgaggc gggactggcc 660

accatcgagg aggggcggct gtttcccggg ctgcgcgaac tcggggccat ccccaacgaa 720

tacctgcact actactacca cccggtggcg aaggcggacg ggccgaccag gggagagttc 780

ctggctgagc agcaggaacg ctgctatcgg gagatgtccg cgggggagcc gctcgaagcc 840

tggctgcgcg cgtggcggga acgggaagcg acgtacatgg cggacaaccg gtcgcagagc 900

ggggcggggg acagggacca cgacgaatcc cggccggccg gatacgaggg ggtggcgctg 960

gcggtgatgc gggcgctggc ccgggacgaa ccggcggaac tgatcctggg ggtgcgcaac 1020

cggggagtgc tcgacgtgct cgacgccgac gcggtggtgg aggtgccgtg ccgggtcgac 1080

gggacggggg cggtgccgcg ccgggtgggg gcgttgcccg ggcatgcggt gggactggtg 1140

cagacggtca aggcggtgga acgcggggtg ctggaagccg tgcagaccgg gtccgcggcg 1200

gcggcggtgc gggccatggc cgggcatccg ttggtcggcg acccggagct ggcggggcgg 1260

ttgatcgcgg cttaccgcgc tgagctgccg gagttggcct acctgtcctg a 1311

<210> 5

<211> 1257

<212> DNA

<213> 游动放线菌

<400> 5

ttgaaaatcg cggtcgtggg tggcggatcc acctataccc cggagctggt ggacgggttc 60

gcccggctcg gcaccatggt caccgaactc gttctgatcg acccgtccgc ggagcgcctg 120

gacatcgtcg gggcgttcgc ggcgcgcatc ttcgcgcagt acgggcatcc ggggaaggtg 180

acctggacga ccgacctgga cgcgggggtg accgatgccg acgccgcggt catccaactc 240

cgggtcggcg ggcagcgggc gcggatcagc gacgagtcgt tcccgctgga atgcggctgt 300

gtgggacagg agacgaccgg ggcgggtggc ctcgccaagg cgctgcggac ggtgccggtg 360

attctggacg tcgccgaacg gatccgggcg cgggccaggc ccggggcgtg gatcgtggac 420

ttcaccaacc cggtggggat cgtgacgcgg gcgctgctcg atgccgggca ccgggcggtg 480

ggactgtgca atgtggcgat cgggttccag cgacggttcg cctcctatct ggaggttccg 540

ccgggctcgg tggtcctgga ccatgtgggg ttgaaccacc tgacgtggga gcgggcggcg 600

ttcgtcgacg gcgttgatcg acttcccgaa ctgctctccc ggcacctgtc ggacatcgcg 660

ggacaggtgg atgtgccggc ggagatcatc tccatgctgg gcagcgttcc gtcttactat 720

ttgtcatact tctatcgcca tgacgggcat gtgcgcgagg cgttgggggc gcccacccgc 780

gggcagcgcg tggcggagat cgaggcgacc ctgctggaca tgtaccgcga tgtcaccctg 840

accgagaagc cggccctgct cgccgaacgc ggcggcgcct tctactccga agccgccgtc 900

ggcctgctcg cctccctgtt cggcctcgac gacgacgccg tccactcggt gaacgtccgc 960

aacctcggca ccctgccgtt cctgcccgcc gacgcggtca tcgaggtctc cgcccgcgcc 1020

ggccggaccg gccccgatcc gctgccggtc accgctctgc cgcccgacct ggccggcctc 1080

atcacgcaca cctggtcgta cgaggaactc gccctcgacg ccgccctgcg cggtggccgc 1140

gaccgtgtct accgggcgct gctggcccac ccgctgatcg gccagcacga aagggccacc 1200

gccctcaccg acaggctgat cgccgccggc cgtgaccacc tcgcgtgggc ccgatga 1257

<210> 6

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物BY3F53

<400> 6

atcgatccta cctgtcctga ccggcggatg tctcc 35

<210> 7

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物BY3R54

<400> 7

tctagacccc cgcagatcaa gccaatagga agcg 34

<210> 8

<211> 118

<212> DNA

<213> 人工序列

<220>

<223> 单链模板

<400> 8

tgcagtaaca tatctccgtt aactagcctc atgctcgcat ggcctgtgaa gtcactattt 60

gtgcgttgtg atccacacgc gccataaatt aacacgcgtg ccacgctgaa tatagtga 118

<210> 9

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 引物HisunHF

<400> 9

cctaagcttc gcagtaacat atctcc 26

<210> 10

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 引物HisunCR

<400> 10

cctatcgatt cactatattc agcgtgg 27

<210> 11

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物BY5F51

<400> 11

caatctagat cctgcccgag gtgattccgc cc 32

<210> 12

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物BY5R52的序列

<400> 12

atgtctagag gccagcagcg cccggtaaac caac 34

<210> 13

<211> 252

<212> DNA

<213> 人工序列

<220>

<223> 用于使bglY基因失活的DNA片段

<400> 13

atgcggttag tgatcctcgg tggtggcgga ttccgggtgc cgttggttta ccgggcgctg 60

ctggcctcta gaactagtgg atcccccggg ctgcaggaat tcgatatcaa gcttcgcagt 120

aacatatctc cgttaactag cctcatgctc gcatggcctg tgaagtcact atttgtgcgt 180

tgtgatccac acgcgccata aattaacacg cgtgccacgc tgaatatagt gaatcgatcc 240

tacctgtcct ga 252

<210> 14

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物MG3F63

<400> 14

atcgatacga ggaactcgcc ctcgacgccg ccctg 35

<210> 15

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物MG3R64

<400> 15

tctagaaacc cgcagatgct gactgaccgc gcccg 35

<210> 16

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物MG5F61

<400> 16

aactctagat cggacggtcg agctgtggca cttcttcacc 40

<210> 17

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物MG5R62

<400> 17

atgtctagac gggtcgatca gaacgagttc ggtgacc 37

<210> 18

<211> 435

<212> DNA

<213> 人工序列

<220>

<223> 用于使mpbG基因失活的DNA片段

<400> 18

ttgaaaatcg cggtcgtggg tggcggatcc acctataccc cggagctggt ggacgggttc 60

gcccggctcg gcaccatggt caccgaactc gttctgatcg acccgtctag aactagtgga 120

tcccccgggc tgcaggaatt cgatatcaag cttcgcagta acatatctcc gttaactagc 180

ctcatgctcg catggcctgt gaagtcacta tttgtgcgtt gtgatccaca cgcgccataa 240

attaacacgc gtgccacgct gaatatagtg aatcgatacg aggaactcgc cctcgacgcc 300

gccctgcgcg gtggccgcga ccgtgtctac cgggcgctgc tggcccaccc gctgatcggc 360

cagcacgaaa gggccaccgc cctcaccgac aggctgatcg ccgccggccg tgaccacctc 420

gcgtgggccc gatga 435

<210> 19

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物BYF55

<400> 19

cgatcctgca acagatcttc ctcggacaga cc 32

<210> 20

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 引物BYR56

<400> 20

gaaatcgagc ccgtcagatc gccctgtc 28

<210> 21

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 引物MGF65序列

<400> 21

tcttcttctt cgcccagcgc agcttcg 27

<210> 22

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物MGR66序列

<400> 22

tggtgccgtc cagcccgatg ttgtg 25

<210> 23

<211> 3109

<212> DNA

<213> 人工序列

<220>

<223> 片段BY334

<400> 23

atcgatccta cctgtcctga ccggcggatg tctccgccgc cggtgcgcag tccccgccca 60

cccaggggac cggcccccgt ccaggacagg gcgatctgac gggctcgatt tcggcctgtg 120

gacgactcgg cgggaccggg ttgtcccgag atcagccacc gctgcacgac ggcgtcgaga 180

ggcgctgtcg gggagttcgg tccggcgacc cgcacgccac ggctcccgtc acccggcccg 240

gtggcgccga cctgctggat cccgggtttt ccggtcccgc ggcacggcaa cgggagccag 300

ccgcggggcg gggtcggggc gtgggcggca tgatgctgtc gtggagcaac ggtgggccga 360

gctggcacga accctgcgag agctggggcg gtggcagcac ctgtccgggg acgccgccgc 420

cgaggcggag cgggcggtgg cggcgggtgg gtatccgttc ggggagagcg gcggggatca 480

cgacgtccgg cggttctggc tggacagcga aaccatggcc gagggcggcg tcggccgggt 540

gctgcgggag atggcgccgg cgttgcggac gcacggtgtc gacctgcggg tcgaggtggt 600

gactgtgccg ctcaccgggg ccggcgaagg tgactacatc gtgtcgatca acgggcggcg 660

gtgtgcggcc tggacccggg cggaccgggc ggctgactgc tggtgggaat cggcgacggt 720

gcggccactc gcggtcgtca acgatctgct ggccgaggcg ggcgcgaggg tacggctgtt 780

cgcgctgtac gtggggaccg aggacgcgct tgcctggctg gtcgatccgc ggatcgtcgc 840

ggcggtggcc gacagcggtc tgttccggga gtccgacgtg cccctgctcg ccgcgcacga 900

caccgtcgag caacacttcc tcaagcgtgg gtgacgaact ggaagatcct gccggttgtc 960

aggggctgcg gggtgccggt gaagcggtgc acgccgacgg agaacagcac gtcctgcggg 1020

gcggtgaagg actgctcggc gaagccggcg tgggtcagcc agccgcggat cgccggtgtc 1080

aggtccggtg ctcgtcgtga gcgggtccag atcaccgtgg cgtccggcgc gcagagccgg 1140

ggcagcgcga gaatggtgcg gtgggtgtcg gcgtcgctga tgttgcccag gacgcccgcc 1200

atgatgacca ggtccgcggg ggccgcgtcg cggtacgagg cgaggtcgcc ggcgtcggct 1260

cgcacgatgc tcacggtggc gtgggcgggc acccggctgc gggccgcggc gacgttgcgc 1320

gggtcgtact ccaggagggt ggcggtgacc cggccggcgt ccgggcgcga cgccagcacg 1380

gtgaggatgt cgtcgccctg gccggcgcac atgctgagta cggacaccgg ctcaccgggc 1440

cgctcgtcga gccacgcggc gatgtggtgc cggaccagtc tcagccgccg ggacaggggt 1500

gagcccgggt cggtgtagcg ggtgtgccag gcgtgccagt cctcaccatc gttcatggac 1560

gacagtctgc ctggccggta cgggtgatca gggcatagct ctggctggcg gccaggatgc 1620

cgaggacggc gcgggccagg ttcgccggtg cgccggtggt gggcagtccg gtggcgtcga 1680

gcagagcggt gatgccgagc cagaccacgg tcgcggagag ggccgcggtg gtcagggcac 1740

ggccgtggcg gtggtcggcg ttgctgtgca gggcgccggt cgaccagacg atcagggtga 1800

cgtcccagaa gctgatgacg gggtggccca gggcggctac caccagggag gcggcgaggg 1860

ccagccccgc accgatcgcg gcccggcgca gggttgtcca cccggacacg gaggcggcgc 1920

cggcagcgac gtgggagacc atctggagat cctgggtgtc atgagtttct ttcatatgga 1980

cgggaagtga acagcgggga tggatctcca gcaccgaggc gcgcgggtgg gcgggggtgg 2040

ctgtctcgcc acgatggcgc tgctgatcca tgtcggtcat gcggcgcggc tctcggtggc 2100

ggggcagcgg gccgaggtcg agtgggggga tactggcctc gccgaacggg gtgcacggct 2160

gtcggtctcg gtttgtccga aagcgggggc ggggatgacg gcgagtgatg tggtgcggct 2220

gctgaccggc ggggagttcg acgagctgga gcgccggttc accgcggaga tgcgcgccgt 2280

cgtgtcggcg gagaccgtcc gggtggcgtg gacggtgcag accggcggtg ttcccggcga 2340

gccgggcgaa ccggtcggcg agccgttcac cggcgacctc acccgctggc gcgtgccggt 2400

ccgccatccc gccggcgact tcgtggtggt gatgtccctc gatgcgggcg ggcggctgca 2460

cgggctgcgg ctcgccgccg atgcgggccc ggcctggcag ccgccgcgat acgtgcgccc 2520

ggagcgtttc accgagcggg cggtcggggc gcacggtgcg ctggtcaccc cgtccggcag 2580

gagggtgtcg accgcggcag tcgttctgcc gggcggcggg gagcaggacc gggacggcac 2640

ccacgggccc gacaaaccgc tcaaagacct cgcgtggggc ctggccagcc gcggcatcgc 2700

ggtctttcga ttcgacaaac ccgggcctga ccgcacgctg gtggaggagt acgtgacgcc 2760

cgcggcgcag gccgtgggcg agatccgggc cgccgtgccg tcggtggagc ggatcttcct 2820

gatcgggcac agcctgggtg gcaaagtggc gcccagggtg gccgcggccg tgccggagat 2880

cgccggtctg gtgctgctcg cggccgaggc gatcccgttg cagcggtcgg ccgagcgggt 2940

cacccggcat ctggccgcgc gtgatccggg gccggccgcc gacgcgatgc tggccgcgat 3000

gcaacggcag gtcgcgctgg tcgacgacgg gctgacggcg cagactccgg cggcggatct 3060

gccgttcgga tttcccgctt cctattggct tgatctgcgg gggtctaga 3109

<210> 24

<211> 136

<212> DNA

<213> 人工序列

<220>

<223> 片段HHCPCR

<400> 24

cctaagcttc gcagtaacat atctccgtta actagcctca tgctcgcatg gcctgtgaag 60

tcactatttg tgcgttgtga tccacacgcg ccataaatta acacgcgtgc cacgctgaat 120

atagtgaatc gatagg 136

<210> 25

<211> 3095

<212> DNA

<213> 人工序列

<220>

<223> 片段BY512

<400> 25

caatctagat cctgcccgag gtgattccgc ccggccggcg caacgccgtg catcgggcca 60

ccgccaccat cgcccggctc tccgacgcgc atgccggctg accgtcgcga caccctggcc 120

gggtgggcgt tcctcgcgcc cagcctggtc ggcgtcggcg gtttcctgct gctcccggtc 180

ctggtcgtgg tgggcatcag cctcacccgg tgggacctgg tcagcccggc ccgctgggcg 240

gcgctggaca actactcctc gatcctcacc gacccggcgt tcggccgctc actcgccgtc 300

accgcggtct tcgtgctgct ggtcatcccg ctgcagaccg ggctcgggtt ggccgccgcg 360

ctgctgctcg accagcggtt gcccggctcc accgtcttcc gggcgatcct ggtgctgccg 420

tggatcagcg cgccgctggc gctgggcgtc gtctggcgct ggctgctcga cccgtccgac 480

ggcgcggtga accagctgct cggccaccgg gtcgagtggc tgaccagccc cgccctggcg 540

ctgcccgcgg tcgccgcggt caccgtctgg accaatgtgg gctacgtggc gctgttcttc 600

ctggccggtc tcgccgggat cccggcgcag tacgccgagg cggcccggat cgacggcgcc 660

ggcccgtggc aggcgttccg ccggatcacg ctgccgctgc tgcggcccac catgttcttc 720

gtgctggcca ccggggtgat caacagcttc caggtgttcg acacggtgta cgcgatgacc 780

cagggcggcc cggccgggcg caccgaggtg gtggcgtacg cgatctaccg ggaggcgttc 840

gtcgacttcc ggatggggcg cgccgcggcc atgtcggtgc tgctgttcct gctgctgatc 900

acggtcaccg tggcccagca gtcgtatttc cgccgccgca cgacctacga ggtggggtga 960

ggatgcgccg ggccgtgctc acctatctcg cgctggccgc cggggccgtg ctgatcctcg 1020

ctccctacct gatgagcgtg cagacctcgg tgaagaccgc gcggcagttc gcccagcagc 1080

cgccgctcgc cccgcccgac ccgccgaccg gggcgaacta cgccgagctg atcgtcggcg 1140

ggcacaccct gatcccaccg ctggtgatca ccgtccaggt ggtgctgatc gtcgtgatcg 1200

gacagctgac ctgctcggtc ctcgcggcgt acgcgttcgc ccgcctcgac ttcccgggcc 1260

gtgacgcgct cttctggctc tacctcgcca ccctgatggt gccgatcgtg gccgtcctgg 1320

tgccccggtt cgtgctgctc agtcaggccg gactgaccga cacgttctgg ggcatcgtgc 1380

tgccctcgat gttcggctca ccgtatgcga tcttcctgct ccgccagttc ttccgggccg 1440

tcccgcagga gctgctggac gccgcccgga tcgacggcgc cggccacccg cgggtgctgc 1500

gccacgtcat cgtcccgctg agccgcccga tcctggccac cctgctgatc atcacggtgg 1560

tcacccactg gaacgacttc ctctggcccc tggtgatcac cagcggggtg cgctggcagg 1620

tgctcaccgt cgcggtcgcc ggcctgcaga gtcagtacca cggcaactgg accctggtga 1680

cggccgcgac cacgctcgcc accatgccgt tgctgctgat cttcgcgatc ttccagaaac 1740

acatcgtccg atcgatcacc atcaccggga tgaggtgagg ctcatgcgac ggttcctggc 1800

gttcctgatg atcctggcac tggccggctg ctcggtcgcc gacaccggcg acagcggctc 1860

cggcaggacg acggtcacct tccggctctg ggacgaccag gtggccgagg cgtaccagca 1920

gtccttcgcc accttcgaga aggcacaccc caccatccac gtcgacgtgc agctggtgcc 1980

ctgggccgac tactggacca aactgccggc cgacatcgcc gccggcaccg ccgccgacat 2040

cttctggacc aacacctcca atttcgggtt gtacgccgac aacaggcaac tgctgcccgt 2100

cgacttcacc ggggactgga cgaaatccgt cgtcgacctc tacacccggg gcggcaccct 2160

gtggggcgtg ccgcagctgt gggactcgat cgccctctac tacaacaaag acctggtcgc 2220

caaggccggc gtcgatccgg ccacgctcag ctgggacccg gccgccgccg acgacccgct 2280

gcgcgccgcc gcccgcaagc tcaccgccgc gaacgcgttc ggctacaacg ccgccttcga 2340

ccagcaggcg atcctctggg acttcgtcgg ttccaacggc gggacctggc agtccggcga 2400

caccttcgac ttcgccgacc agcccaggac ggtgcaggcc gtgcagtacg tggtggatct 2460

gatcaacaag taccacgtgg ccccgtccgc ggcggacacc aacaccaacg gcgacaagac 2520

cacccagctg ttcacccagg gcaaactggc gttgttccaa tccggaccgt acaacctgaa 2580

ggccatccag cagggcgccg gcttcccgtg ggggatcgcc ccgctgcccc agggcccggc 2640

cggacgggtc agcgtggtgc acggcgtcgc cgcggtcgcc tccgccaaga ccccgcaccg 2700

ggacgccacc gtcgaggtgc tcaagtggat cggctcggcc gacggccaga aaccgatcgc 2760

cgagggcggg tatgcgttcc ccggcgtgac cgccgcgcag cccgccttcg tcgactactg 2820

gcggaaacgg ggcgtcgacc tgaagccctt cctggacgcg gcggccggca ccaccttccc 2880

cgcaccggtc ggtccgcgcg tcggggcggg tggcaccgcg tacacgccga tcctgcaaca 2940

gatcttcctc ggacagaccg gcgtcaccga cggcctgcgc aaggcccagg acgccggcaa 3000

cgcggcgatg aaaggctgac atgcggttag tgatcctcgg tggtggcgga ttccgggtgc 3060

cgttggttta ccgggcgctg ctggcctcta gacat 3095

<210> 26

<211> 1288

<212> DNA

<213> 人工序列

<220>

<223> 以XbaI从质粒pIJ773上切下的1.3kb片段

<400> 26

ctagagaata ggaacttcgg aataggaact tatgagctca gccaatcgac tggcgagcgg 60

catcgcattc ttcgcatccc gcctctggcg gatgcaggaa gatcaacgga tctcggccca 120

gttgacccag ggctgtcgcc acaatgtcgc gggagcggat caaccgagca aaggcatgac 180

cgactggacc ttccttctga aggctcttct ccttgagcca cctgtccgcc aaggcaaagc 240

gctcacagca gtggtcattc tcgagataat cgacgcgtac caacttgcca tcctgaagaa 300

tggtgcagtg tctcggcacc ccatagggaa cctttgccat caactcggca agatgcagcg 360

tcgtgttggc atcgtgtccc acgccgagga gaagtacctg cccatcgagt tcatggacac 420

gggcgaccgg gcttgcaggc gagtgaggtg gcaggggcaa tggatcagag atgatctgct 480

ctgcctgtgg ccccgctgcc gcaaaggcaa atggatgggc gctgcgcttt acatttggca 540

ggcgccagaa tgtgtcagag acaactccaa ggtccggtgt aacgggcgac gtggcaggat 600

cgaacggctc gtcgtccaga cctgaccacg agggcatgac gagcgtccct cccggaccca 660

gcgcagcacg cagggcctcg atcagtccaa gtggcccatc ttcgaggggc cggacgctac 720

ggaaggagct gtggaccagc agcacaccgc cgggggtaac cccaaggttg agaagctgac 780

cgatgagctc ggcttttcgc cattcgtatt gcacgacatt gcactccacc gctgatgaca 840

tcagtcgatc atagcacgat caacggcact gttgcaaata gtcggtggtg ataaacttat 900

catccccttt tgctgatgga gctgcacatg aacccattca aaggccggca ttttcagcgt 960

gacatcattc tgtgggccgt acgctggtac tgcaaatacg gcatcagtta ccgtgagctg 1020

cattttccgc tgcataaccc tgcttcgggg tcattatagc gattttttcg gtatatccat 1080

cctttttcgc acgatataca ggattttgcc aaagggttcg tgtagacttt ccttggtgta 1140

tccaacggcg tcagccgggc aggataggtg aagtaggccc acccgcgagc gggtgttcct 1200

tcttcactgt cccttattcg cacctggcgg tgctcaacgg gaatcctgct ctgcgaggct 1260

ggcgggaact tcgaagttcc tatacttt 1288

<210> 27

<211> 3492

<212> DNA

<213> 人工序列

<220>

<223> 片段MG334

<400> 27

atcgatacga ggaactcgcc ctcgacgccg ccctgcgcgg tggccgcgac cgtgtctacc 60

gggcgctgct ggcccacccg ctgatcggcc agcacgaaag ggccaccgcc ctcaccgaca 120

ggctgatcgc cgccggccgt gaccacctcg cgtgggcccg atgaccgcgc tgttcctggc 180

ggccgacggc ggcaactcga agaccgacct ggtcctcggt accgcggacg gcgagatcct 240

ggcgatggtg cgcggcggca cctcgtcgcc gcacaacatc gggctggacg gcaccatcga 300

ggtgctcggc aagctgatcg ccgcggcccg ggccgaggcc ggcctggcgg cggacaccgc 360

gatcgacgcg atcggcgtct acctggccgg cgccgacctg cccgacgagg tgaccgccct 420

gcacgaggcg gtcaccgcgc agggctgggc gcggcgggtc cgggccgaca acgactgctt 480

cgccctgctc cgggccggcg ccaggctgcc ggacgcggtc accgtggtct gcggcgccgg 540

caacaactgc gtcggccggg ccgccgacgg ccggaccgcc cggttcgtcg ctctcggccc 600

ggtctccggg gactggggcg gcggccacga cctggccgac tacgccctgc gcgcggcggc 660

ccgcggggag gacggccggg gcgacccgac cgcgctgtcc gcggcggtcg ccgggcactt 720

cggcctgccc acggtcgaag cggtcagcat cgccctgcac cgcggccacc tgtcggccgc 780

ccggatcccg gaactggccc cgatcctgtt ccaggtcgcg gccgccggtg acgaggtggc 840

cgccgcgctg gtggcgcgcc aggccgaaga gatcctggcc cagcaccggg tcgccgccgg 900

ccgtctcggc ctgctgcccc ggccacactc ggtggtcctg ggcggcagcg tcctgcaggc 960

ccggcatccc ctgctgcacg accgggtgct ggccggcgtc cgggcccagg cgccgttcgc 1020

cgaggtcacc gtgctggact cgccgccggt gaccggggcg gcgttgctcg ccctggacgc 1080

gctggaggcc ggcccggccg ccgagcgggc cctgcgcggc atcttctccg ggcgggtgcc 1140

ggcgtgacga gcccgcgtgc cgccttcccc gggcggccgg agaccgcgtc gcccggctga 1200

ccgggggacg caggcggccg gctacctgtc cacctggcgg accgggggga ctcaggccgc 1260

cggggatccg gtcgcccggc ggaccggggg actcaggccg ccggggatct ggtcgcccag 1320

cggaccgcgg ggaccagggc cgcgccgctg atcgcgaaga tggcggcggg caccgcccag 1380

ccccagggcg cgtggtcgat ggcggtcacc gtgatcaggg cgggcgcgag catgatgccc 1440

gcggaactgc cggcgttgaa gacgccctgg taggcgccgg ccgcgtgctc cgccgccagg 1500

tcgtagctga gcagccagcc gccggcctgg gagagcacct cgccggccgt gccgatggtg 1560

accgccagca ccagcagcag ggtggccggg accgcgccga agccgtggct gcccgcgatc 1620

agcaggcagt agacggcgag cagccagccg gcgcggcggc aggcccgggc cgcctgggcc 1680

gggttccgcg cggcgcgggt ggcccggacc tggaagatca ccaccagcac ggtgttgagc 1740

agcaggatcg cgccgaccac cgcgtgcggg gcggtggtct cccggaccac ccagagcggg 1800

atgccgacgg tgagcaccgc gaactgcatg ctgagcagcg cgttcagggc ggtgaccagc 1860

aggtacggcc ggtcggtgag cgcgttgcgg cggctggcga cggccggacc ggcggcggtg 1920

ccccgaaccg gccgacgctt ggccgggatg gccggcagga tcgcggccac caccaggaag 1980

gtggccgcgt tgcccagaat cagggccagg taggcgcccc gggtgtcggc ctgcagggcg 2040

accgcggcca gcgcggcgcc ggcgccgatc cccacgttgg tgaccgcgcg cagataggcg 2100

cggcccggca cccgggtctc cggcgggaga gtgtcggcgt acagcgtgtt gcgtaccgtg 2160

ccggccgccc ggtccagcgc ggtctccgcg cagaccaccg cgaggaagac gatgaacccg 2220

tgcaccaggg tgtacgccgc catgcccacg gcctgcagga ggcagagcag caacagcacg 2280

cggcggctgc cccagcggtc cgcggcccgg ccggcgggga ggctcgccgc gaccccgcac 2340

gcgccggcga tggtcagacc caggccgacc cgcgcgacgc tgaggccggc gacccgggtg 2400

aagtagagcg cgctggcggt catgaacatg ccgttgccga gtgtgttgac caggaccatc 2460

ccggcgaggc ggcggaccac cggatcgcgg gggagcaggc tggtggcggt ttcggccact 2520

gtggaaccca tgccccgatc ccaccggtga ccgggatcgg cggataatga tttagcgatg 2580

ggctcaacca tgcggttccg gatcggcctg gccgacctgg cgtcggcctc gctggcgtat 2640

tcgccgttgc aggaggcggc gctgagccta cggatgtggt cgcatcccgg ctattacgtc 2700

gagcagaccg gctggttcca gcggatgcgc gcggatttcg acgcgctgcc cgaccgggat 2760

ctgctgcgcg cgctggtcgc ctccaaccgg ttcgtcccgg acttcctcac cccacgcccg 2820

gccaccaccc gcccggccct cgccgacgag ctggccctgc tccgggccac cccgcccgag 2880

ctggtcgggc cggacctgga gcggaccttc cggccgcacg accgggaggt gccacccctg 2940

ctggcggagc tggccgccga tccggaggcg atgctcgacc ggatcgcccg tgcgctggcc 3000

gggtactggg atcgctgcct cgcgccgcga tggtggccgc gggcgcggtc ggtgctggag 3060

gcggacctga tctaccgggc ccggatgctc gccgaggggg gcgccgacgc gctcttcgcc 3120

gacctgtcgc accggttgta ctgggaggac ggcgtgctga cgatccgctg ggacgggcca 3180

ctggagatcg cccgcgaccg ggtcgacgtg aacgggcgcg ggctggtgct gctgcccacc 3240

tgtttcgccc ggggcgcgat caccgcgatc gacccggacc tccggccggt gatcatctat 3300

cgggcccgcg gcctgggcac gatgaccgag agcctgcggc cgccgccggc gttcccggcg 3360

ctgcgccggc tgctcggcga gccgcgggcc cgcctgctgc tgatgctcga cgagccggcc 3420

tcgaccaccg agctggcgca ccggctcgcc gtcacgccgg gcgcggtcag tcagcatctg 3480

cgggtttcta ga 3492

<210> 28

<211> 1229

<212> DNA

<213> 人工序列

<220>

<223> 以HincII+DraI从质粒supcos-1上切下的含pUC ori的片段

<400> 28

aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60

aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120

tatcatgtct ggatctgacg ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta 180

ggctggcggg gttgccttac tggttagcag aatgaatcac cgatacgcga gcgaacgtga 240

agcgactgct gctgcaaaac gtctgcgacc tgagcaacaa catgaatggt cttcggtttc 300

cgtgtttcgt aaagtctgga aacgcggaag tcagcgctct tccgcttcct cgctcactga 360

ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 420

acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 480

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 540

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 600

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 660

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 720

tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 780

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 840

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 900

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 960

tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 1020

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 1080

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 1140

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1200

tcaaaaagga tcttcaccta gatcctttt 1229

<210> 29

<211> 3116

<212> DNA

<213> 人工序列

<220>

<223> 片段MG512PCR

<400> 29

aactctagat cggacggtcg agctgtggca cttcttcacc gagcgcgagg cgcaggccat 60

cgaccaggtg gtcggcgact tcacggcgag ccacccgaac atcaaggtga ccgtcaaatc 120

cggtcaggac gactcgaagg tgacccaggc gatcggcgcc gggaacgggc cggacatcgg 180

gctgtcgtac tcgaccgaca tcgtgggcaa attctgctcg tcgggcgcct gggtggatct 240

caccgcgtac atcaaccggg ataaaatcga cctcaatcag ctgaacgcga cgacccggtc 300

ctacaccgag ttccagggca agcggtgcgc catgccgttc ctggccgacg cgtacggcat 360

gttctacaac aaggacctgt tcgcgaaggc cggcatcgcc gggccgccga agacgctcga 420

cgagctgacc gaggacgcca agaaactcac cgtgcgcaat gccgacggct cgctcaagac 480

ggtgggcttt cttccgctgt acgactatta cgagaacgcc gcggcccacc tggccccgtc 540

caccggcgcg aaatggctga ccccggacgg caagagcgcg gtcggcgccg acccgaattg 600

gaagaccctg ctgaactggc agaagagcct ggtcgactgg tacgggtacg acaacctgac 660

caggttcaag gccggtctcg gcgacgagtt cagcgccgac aacgccttcc agaagggcca 720

ggtggcgatc aacatcgatg ccgaataccg cctcgccttc ctcaaggatc agagccccaa 780

gctgaagtac ggggtggccc cgctgcccac caccgacccg gcccgatacg gcggcggtta 840

cgtgaccggc aacatcatgg gcatctcgaa gaacgccaag aaccccgagg cggcgtggga 900

gctcatcaaa tatctgacca ccgatgacgc cgcggtgacc aagctggccg gtctgctcaa 960

gaacgtgccg accaccacca aggcgatcgc cgacccgggc ctgaacgccg atccggactt 1020

caagacgttc atcgacatct tccgcaaccc gaactcgatg accaccccgc cgtccgcctc 1080

cgggccggcc taccaggaga ccttcgggca gttcctgacc agctaccagt ccggcaaggg 1140

cggggacctg gaccaggggc tggccgcggc ggaccagaag atcaacagcg tcatgagcct 1200

gggcggctga gcgatgctcg gcgttcgcct gcgccggggc gcggtcaccc tctcgtttct 1260

ggcgcccgcg ctgctcggca tcgggatgtt cttcgtctac cccctgatct cggcggtcta 1320

cttctcgttc acgaaattcg acctgctgac cgtgccgcag tgggtcgggc tggacaacta 1380

ccggcggatg gccggcgatc cgttcctgct gcaggcggtg cgcaacacgc tgtggatggt 1440

ggcggtcttc gtcccggtgc ggatgctctt cacgctcggc atggccatga tgatcgcgca 1500

gttcaagcgg ggcgccggtt tctaccgcac gctgttctac ctgccgtcgt tggtcccgcc 1560

ggtggccgcc accatcgcct tcgtctacct gctcaagccg ggcaccggcc cggtcaacca 1620

cgtcctgtcg atggtcggca tcgacggccc gctctggttc aactcgccgg cctgggccaa 1680

gccgtcgctg gtcctgctcg gcctgtgggc ctgcggcgac ctgctgatca tcttcctggc 1740

ggcggtgctc ggcgtcccgg agagcctcta cgaggccgcg tcgctggacg gcgcgaacgc 1800

ctggcacaga ttccggtcga tcaccctgcc gacgatccgc ccggtgctgc tgttcgcggc 1860

ggtcaccggc gtgatctaca cactgcagta cttcgaccag gcggcggtgg ccggctcgat 1920

cgccagcggg caggccaccg tcggcgccgg aatctcccag tccttcggct acccggaggg 1980

ctccaccttc acctatccgc tgtggctgtt caccgtcggg ttccgctaca gcgcgctcgg 2040

ctacgccaac gcgctggcca tcgccctgtt cgtggtcgcg ctcgcgatca ccgtcgtcct 2100

gctgcgccgc gccaaggcgt tctccgggga ggaatcgtga gtctcgtcct ggaccgcccg 2160

atcgtgcggg ccgcggcaga acggcgccgg atccggctcg cctggatcgc ccggcacagc 2220

atcgcgatcg cgctcggcat catgttcatc accccggtcg cgtacctggt gctgctctcg 2280

ctgatgacca gcgaccaggc gctgaccagc gattactggc cgaacacctg gcacccggag 2340

aactacgtgc gggtgttcca ggcaaccccg ctgccgcact atctgttcaa cacgatgctg 2400

tacgcggtgt ccgccaccgt cttcaccctc gcctccagcg tgcccgccgc gtacgccctg 2460

gcgaagttga agttccgcgg ccgcaacgcg ctgttcctca cggtgatctg cgtgatgatg 2520

ctgcccccgc aggtggtgac cgtcccgctg tatctgatgt gggcccggta cggcctgacc 2580

ggctcgctcg ccccgctgat catcccggcc ctgttcggcg acgcgttctg catcttcctg 2640

ctgcgtcagt tcctgctcac cattccgagc gaatatctgg acgcggcccg ggtcgacggc 2700

tgcggcgagt ggcgcaccct gctgcgcgtc gtgctgccga tggcccggcc gggaatcgcg 2760

gcggccggcc tgttccagtt cttctactgc tggaacgact attacgggcc gctgctctac 2820

accagcgaga acgagaactc gtggacgctc tcgctgggcc tggcctcgtt ccggaccgtg 2880

caccacgtcg actggaacct ggtcaccgcg gccaccgtgc tcgccatggc gccgctgatc 2940

atcatcttct tcttcgccca gcgcagcttc gtgcagggca tcacgctgac aggattcaag 3000

ggttgaaaat cgcggtcgtg ggtggcggat ccacctatac cccggagctg gtggacgggt 3060

tcgcccggct cggcaccatg gtcaccgaac tcgttctgat cgacccgtct agacat 3116

Claims

1.一种阿卡波糖工程菌，所述阿卡波糖工程菌是产阿卡波糖的游动放线菌(Actinoplanes sp.)，其中以下一个或两个基因失活：

(i)编码序列如SEQ ID NO:2所示的多肽的基因M；

(ii)编码序列如SEQ ID NO:3所示的多肽的基因N。

2.根据权利要求1所述的阿卡波糖工程菌，其中，所述产阿卡波糖的游动放线菌是游动放线菌SN223/29。

3.根据权利要求1所述的阿卡波糖工程菌，其中，所述产阿卡波糖的游动放线菌是保藏号为CGMCC No.7639的游动放线菌8-22。

4.根据权利要求1所述的阿卡波糖工程菌，其中，所述基因M的序列如SEQ ID NO:4所示或为与SEQ ID NO:4所示序列有至少80％、90％、95％或99％序列同一性的序列，所述基因N的序列如SEQ ID NO:5所示或为与SEQ ID NO:5所示序列有至少80％、90％、95％或99％序列同一性的序列。

5.根据权利要求3或4所述的阿卡波糖工程菌，其中，所述阿卡波糖工程菌中，基因M或基因N失活为基因M或基因N缺失。

6.根据权利要求5所述的阿卡波糖工程菌，其中，所述基因M缺失中，缺失的片段为SEQID NO:4的第67-1297位核苷酸；所述基因N缺失中，缺失的片段为SEQ ID NO:5的第108-1098位核苷酸。

7.根据权利要求6所述的阿卡波糖工程菌，其中，所述阿卡波糖工程菌是游动放线菌△BY-3或△MG-4，其中，△BY-3是游动放线菌8-22与序列为SEQ ID NO:13的DNA片段发生同源重组而形成的，△MG-4是游动放线菌8-22与序列为SEQ ID NO:18的DNA片段发生同源重组而形成的。

8.一种阿卡波糖工程菌的制备方法，所述方法包括将产阿卡波糖的游动放线菌中的以下一个或两个基因失活：

(i)编码序列如SEQ ID NO:2所示的多肽的基因M；

(ii)编码序列如SEQ ID NO:3所示的多肽的基因N。

9.根据权利要求8所述的方法，其中，所述产阿卡波糖的游动放线菌是游动放线菌SN223/29。

10.根据权利要求8所述的方法，其中，所述产阿卡波糖的游动放线菌是保藏号为CGMCCNo.7639的游动放线菌8-22。

11.根据权利要求8所述的方法，其中，所述基因M的序列如SEQ ID NO:4所示或为与SEQID NO:4所示序列有至少80％、90％、95％或99％序列同一性的序列，所述基因N的序列如SEQ ID NO:5所示或为与SEQ ID NO:5所示序列有至少80％、90％、95％或99％序列同一性的序列。

12.根据权利要求10或11所述的方法，其中，将基因M或基因N失活的方法包括但不限于基因敲除、突变、插入失活、同源重组、RNA干扰。

13.根据权利要求12所述的方法，其中，所述失活是使所述游动放线菌8-22与序列为SEQ ID NO:13或SEQ ID NO:18的DNA片段发生同源重组。

14.如权利要求1-7任一项所述的阿卡波糖工程菌在制备阿卡波糖中的应用。

15.基因M或其编码的多肽或基因N或其编码的多肽在制备杂质A组分和/或B组分含量降低的阿卡波糖工程菌中的应用，其中，基因M编码序列如SEQ ID NO:2所示的多肽，基因N编码序列如SEQ ID NO:3所示的多肽。

16.根据权利要求15所述的应用，其中，所述基因M的序列如SEQ ID NO:4所示或为与SEQ ID NO:4所示序列有至少80％、90％、95％或99％序列同一性的序列，所述基因N的序列如SEQ ID NO:5所示或为与SEQ ID NO:5所示序列有至少80％、90％、95％或99％序列同一性的序列。