CN107574178A - 真菌人工染色体、组成、方法和用途 - Google Patents

真菌人工染色体、组成、方法和用途 Download PDF

Info

Publication number
CN107574178A
CN107574178A CN201710302226.0A CN201710302226A CN107574178A CN 107574178 A CN107574178 A CN 107574178A CN 201710302226 A CN201710302226 A CN 201710302226A CN 107574178 A CN107574178 A CN 107574178A
Authority
CN
China
Prior art keywords
fac
dna
fungi
gene
aspergillus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710302226.0A
Other languages
English (en)
Other versions
CN107574178B (zh
Inventor
吴成仓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Complete Gene Technology Co
Original Assignee
Complete Gene Technology Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Complete Gene Technology Co filed Critical Complete Gene Technology Co
Publication of CN107574178A publication Critical patent/CN107574178A/zh
Application granted granted Critical
Publication of CN107574178B publication Critical patent/CN107574178B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • C12N15/69Increasing the copy number of the vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/20Pseudochromosomes, minichrosomosomes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/70Vectors containing special elements for cloning, e.g. topoisomerase, adaptor sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2820/00Vectors comprising a special origin of replication system
    • C12N2820/002Vectors comprising a special origin of replication system inducible or controllable
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2820/00Vectors comprising a special origin of replication system
    • C12N2820/10Vectors comprising a special origin of replication system multiple origins of replication
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2820/00Vectors comprising a special origin of replication system
    • C12N2820/55Vectors comprising a special origin of replication system from bacteria

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

公开了真菌人工染色体(FAC)载体。载体可以在细菌或真菌宿主中复制,并且可以包含长达约500kb的异源DNA插入物。载体可用于克隆和表达次生代谢物(SM)基因簇。插入序列可以通过同源重组来修饰。载体可以是包含细菌和真菌复制起点以及细菌和真菌选择标记基因的质粒。还公开了可以整合到真菌基因组中的载体和可以在细菌或真菌宿主中复制并且还可以整合到真菌基因组中的双功能载体。还公开了产生包含完整SM基因簇的载体的质粒文库的方法。

Description

真菌人工染色体、组成、方法和用途
相关专利申请的交叉引用
本申请要求2016年4月29日提交的美国非临时专利申请15/143,493的权益和优先权。
政府支持
本发明是在由国立卫生研究院提供的编号R43/44AI094885的政府支持下完成的。政府对发明有一定的权益。
参考序列表
序列表作为本发明的部分,包括text文件0749sequence_ST25.txt,一个于2016年4月29日创建的86kb的文件。该文件包含本发明的引物核苷酸和/或氨基酸序列。序列表的主题以引用方式整体纳入本文。
前言
真菌含有广泛但尚未开发的生物合成能力,可作为新型生物活性化合物的储库(Kobayashi,A.,et al.,Agric.Biol.Chem.,1988,52,3119-3123.;Kuno,F.,et al.,J.Antibiot.(Tokyo),1996,49,742-747;Kumar,C.G.,et al,Lett.Appl.Microbiol.,2011,53,350-358;Wu,M.C.,et al.,Curr.Opin.Biotechnol.,2012,23,931-940;Du,L.,etal.,Angew.Chem.Int.Ed.Engl.,2014,53,804-809;Fang,S.M.,et al.,Mar.Drugs,2014,12,1788-1814;A.L.and Enguita,F.J.,Microbiol.Res.,2014,169,652-665)。
丝状真菌可产生次生代谢物(SM),其历来是制药工业先导化合物的丰富来源。真菌可产生所有微生物来源的生物活性分子的45%(Bérdy,J.,J.Antibiot.(Tokyo),2012,65,385-395)。衍生自萜类、聚酮化合物和非核糖体肽途径(Keller,N.P.,et al.,Nat RevMicrobiol.2005,3:937-947)的这些化合物显示出广泛的有用的抗生素活性和药物活性。最近对涵盖1993年至2001年分离和鉴定的1500种化合物的真菌代谢物的文献调查显示,超过一半的分子具有抗细菌、抗真菌或抗肿瘤活性(Pelaez,F.,Handbook of IndustrialMycology(ed.An,Z.)49–92(Marcel Dekker,New York.2005)。具有治疗或经济意义的真菌天然产物的实例包括来自产黄青霉(Penicillium chrysogenum)的抗生素青霉素、来自多孔木霉(Tolypocladium inflatum)的免疫抑制剂环孢菌素(环肽)和来自土曲霉(Aspergillus terreus)的降胆固醇的维诺林(mevinolin)(也称为洛伐他汀(lovastatin),一种聚酮化合物)。
真菌基因组可包含50或更多不同的SM基因簇,其大小在从20kb到大于100kb的范围(Nordberg,H.et al.,Nucleic Acids Res.,2014,42(Database issue),D26-31)。保守估计有超过500万种真菌(Blackwell,M.,Am.J.Bot.,2011,98,426-438),其中已被描述的少于5%,可从世界培养物保藏中心(Colwell,R.R.,Microbial biodiversity andbiotechnology.Washington,D.C.:Joseph Henry Press;p.279-88,1997)获得的不足1%。此外,由于每种所述真菌基因组可包含50或更多不同的SM基因簇,其大小在从20kb到大于100kb的范围(Nordberg,H.et al.,Nucleic Acids Res.,2014,42(Database issue),D26-31),未发现的SM数量可能非常巨大。
已有数种诱导SM基因簇表达的方法是成功的。其包括超表达基因簇特异的转录因子或酶基因、缺失或超表达染色质修饰基因、超表达反式作用激活子或缺失反式作用抑制子(Palmer,J.M.and Keller,N.P.,Curr.Opin.Microbiol.2010,13:431-436;Brakhage,A.A.and Schroeckh,V.,Fungal Genet.Biol.,2011,48,15-22;Strauss,J.and Reyes-Dominguez,Y.,Fungal Genet.Biol.,2011,48,62-69;Hong,S.Y.,et al.,Toxins(Basel)2013,5,683-702)、表达异源SM基因(Itoh,T.et al.,Methods Mol Biol 2012,944,175-182;Chiang,Y.M.,et al.,J.Am.Chem.Soc.,2013,135,7720-7731;Nielsen,M.T.,et al.,PLoS ONE 2013,8:e72871;Tsunematsu,Y.,et al.,Nat Prod Rep 2013,30:1139-1149;Yin,W.B.,et al.ACS Synth Biol 2013,2:629-634)。
在真菌中表达异源簇是可鉴定SM化合物、生物合成SM蛋白和基因的一种方法。近来,已报道该方法可用于合成土曲霉(A.terreus)编码的化合物地曲霉素和构巢曲霉(A.nidulans)中的去甲呋喃酮(asperfuranone)(Chiang,Y.M.,et al.,J.Am.Chem.Soc.,2013,135,7720-7731;Nielsen,M.T.,et al.,PLoS ONE,2013,8,e72871)。构巢曲霉还可用于异源表达负责新生霉素B(neosartoricin B)合成的皮肤真菌来源基因簇(Yin,W.B.,etal.,ACS Synth.Biol.,2013,2,629-634)。这些研究利用包含ColE1复制起点、酵母着丝粒序列和自主复制序列的穿梭载体。该载体可用于在构巢曲霉中产生单链全长簇。这些技术需要大量的时间和努力以表达仅一个异源簇。并且这些技术仅适用于插入小于约20kb的片段。
大的插入DNA克隆载体已在多种体系中建立,包括:酵母人工染色体(YAC,Burke,D.,et al.,Science,1987,236,806-812)、细菌人工染色体(BAC,Shizuya,H.,et al.,Proc.Natl.Acad.Sci.USA.,1992,89,8794-8797)、P1-来源的人工染色体(PAC,Ioannou,P.A.,et al.,Nat.Genet.,1994,6,84-89)、大肠杆菌-植物穿梭BAC也称为双元BAC(BIBAC,Hamilton,C.M.,Gene,1997,200,107-116)、大肠杆菌-链霉菌人工染色体(ESAC,Sosio,M.,et al.,Nat.Biotechnol.,2000,18,343-345)。但是,这些质粒体系不适于真菌。之前报道的大肠杆菌-真菌穿梭质粒载体既不能容纳也无法保持100kb或更大的DNA片段(Yin,W.B.,et al.,ACS Synth.Biol.,2013,2,629-634)。
构巢曲霉AMA1是一种真菌复制起点,已在小质粒的大肠杆菌-真菌穿梭载体中使用(Gems,D.,et al.,Gene,1991,98,61-67;Aleksenko,A.and Clutterbuck,A.,J.FungalGenet.Biol.,1997,21,373-387;Kubodera,T.et al.Biosci.Biotechnol.Biochem.,2000,64,1416-1426)。还有真菌穿梭质粒或载体已报道可用于整合(Tiburn,J.,et al.,Gene.1983,26:205-221;Golduran,G.H.and Morris,N.R.,Methods in MolecularGenetics1995,6,48-65Microbial Gene Techniques Edited by Kenneth W.Adolph;Kubodera,T.,et al.,Biosci.Biotechnol.Biochem.,2000,64,1416-1426;Arentshorst,M.,et al.,Fungal Biology and Biotechnology,2015,2,2)、自主复制或染色体外保持(Gems,D.,et al.,Gene,1991,98,61-67;Golduran,G.H.and Morris,N.R.,Methods inMolecular Genetics1995,6,48-65Microbial Gene Techniques Edited by KennethW.Adolph;Kubodera,T.et al.Biosci.Biotechnol.Biochem.,2000,64,1416-1426)。但是,这些穿梭质粒或载体不可用于克隆和转化非常大的DNA(例如20kb或更大)。之前试图通过根癌土壤杆菌转化体系将长达75Kb的真菌DNA导入尖孢镰刀菌和泡盛曲霉(A.awamori),仅得到很少含有大DNA插入的转化子。此外,未尝试检测异源DNA的稳定性,更不用说检测表达(Takken,F.L.,et al.,Curr.Genet.,2004,45,242-248)。
细菌人工染色体(BAC)已广泛被用于基因组DNA测序、定位克隆及在原核生物和真核生物包括丝状真菌中的绘制基因组图谱(Zhu,H.,et al.,Fungal Genet.Biol.,1997,21,337-347;Nishimura,M.,et al.,Biosci.Biotechnol.Biochem.,1998,62,1515-1521;Adler,H.et al.,Rev.Med.Virol.,2003,13,111-121;Diener,S.E.,et al.,FungalGenet.Biol.,2004,41,1077-1087;Srivastava,S.K.,et al.,PLoS One 2014,9:e81832)。虽然大片段插入DNA体系也已用于异源表达微生物天然产物生物合成途径及宏基因组研究,但是少有成功的报道(Béjà,O.,Curr.Opin.Biotechnol.,2004,15,187-190;Lorenz,P.and Eck,J.,Nat.Rev.Microbiol.,2005,3,510-516;Ongley,S.E.,et al.,Nat.Prod.Rep.,2013,30,1121–1138)。这些体系的挑战包括:1)DNA克隆偏倚(bias);2)DNA插入片段小;3)缺少先进的异源表达宿主及4)缺少高分辨率化学和数据分析管道。这些挑战的一个原因是到目前为止几乎所有的BAC文库都是通过部分限制性消化产生的(Wu,C.C.,et al.,Encyclopedia of Molecular Cell Biology and Molecular MedicineVolume 3(2nd Edition),Edited by Meyers R.A.,Wiley-VCH Verlag GmbH:Weinheim,Germany2004,pp385-425 2004;Zhang,M.,et al.,Nat.Protoc.,2012,7,467-478)。部分限制性消化可能是有偏倚的,因为在任意基因组包括真菌基因组中限制性位点的产生是高度可变且非随机的。某些基因组区可包含过量的限制性位点或者整体上缺乏限制性位点,例如在含有高度重复序列的基因组DNA区域,如着丝粒和端粒(Godiska,R.,et al.,Bias-Free Cloning of‘Unclonable’DNA for Simplified Genomic Finishing.In DNASequencing III:Dealing with Difficult Templates.Sudbury,MA:Jones and BartlettPublishers:2008)。结果,某些序列很难或者不可能克隆,即使使用多重偏倚的部分消化文库并达到50×覆盖。
此外,来自稀少或频繁剪切基因组区域的DNA片段对于DNA片段分级可能太大或太小,都有可能被排除在克隆过程中。通过机械剪切如超声处理、喷雾法和水剪切(hydroshearing)可将高分子量(HMW)基因组DNA片段化,产生小的DNA片段(10kb或更小)。这些方法可能不适合制备100kb-300kb的片段。经报道,冻融循环可导致大的DNA断裂,但这些方法对于常规使用不够有效(Osoegawa,K.,et al.,Genomics.,2007,89,291-299)。
已经开发了可有效用于基于大DNA或BAC重组工程的Red/ET(Redα/β或RecE/T)工具(Copeland,NG,et al.,Nat.Rev.Genet.2001,2:769-779;Muyrers,JPP,et al.,Trendsin Bioch.Sci.,2001,26,325-331)。工程化的大DNA或BAC已经可常规用于产生转基因动物例如小鼠,以及用于哺乳动物(例如人)的大基因或途径的功能研究(Johnson,S.J.andWade-Martins,R.A.,Biochem.Soc.Trans.2011,39,862-867)。
动物模型中的基于BAC大基因的表达(Johnson,S.J.and Wade-Martins,R.A.,Biochem.Soc.Trans.2011,39,862-867)不能直接用于研究真菌SM途径或发现天然产物(NP)。
因此,对于克隆大片真菌DNA例如参与次生代谢物生物合成的整个基因簇的新方法和组合物的需要尚未满足。
概述
由于研究真菌基因新工具的需要尚未满足,本发明人已经开发了用于产生可在真菌宿主中繁殖和表达的SM基因簇文库的载体和方法。
在一些实施方案中,本发明的教导包括真菌人工染色体(FAC)。在多种方面,真菌人工染色体可以包含至少一个细菌复制起点、细菌选择标记基因、真菌选择标记基因和真菌自主复制元件。在多种方面,FAC可以是能够在细菌宿主例如但不限于大肠杆菌以及真菌宿主例如但不限于丝状真菌如曲霉菌属中复制的穿梭载体或质粒。在一些配置中,曲霉菌属可以是构巢曲霉。
在一些配置中,本发明教导的真菌人工染色体可以是双功能真菌人工染色体(FACdual)。在多种配置中,FACdual可包含至少一个细菌复制起点、细菌选择标记基因、真菌自主复制元件、用于与宿主重组的整合位点、整合酶基因和真菌选择标记基因。在一些配置中,整合位点可以是但不限于attP位点。在一些配置中,整合酶基因可以是但不限于真菌密码子优化的phi31整合酶基因。在一些配置中,FACdual还可包含真菌有效启动子例如真菌诱导型启动子。在多种配置中,真菌有效启动子可以可操作地连接到整合酶基因。在多种方面,真菌诱导型启动子可以是alcA(p)(Romero,B.,et al.,Fungal Genet.Biol.200340,103-114)。在多种方面,真菌诱导型启动子可以是glaA(p)(Smith,T.L.,et al.,Gene,1990,88,259-262)。在多种方面,真菌诱导型启动子可以是sucA启动子(Roth,A.H.,etal.,Appl Microbiol Biotechnol.,2010,86,659-670)。
在多种配置中,真菌自主复制元件可以是任何真菌自主复制元件,例如但不限于AMA1自主复制元件。
在一些实施方案中,本发明的教导包括真菌人工染色体整合载体(FACint)。在多种配置中,真菌人工染色体整合载体可以包含至少一个细菌复制起点、细菌选择标记基因、两种相同取向的真菌DNA序列和真菌选择标记基因。在多种配置中,两种真菌序列可以是与宿主真菌DNA同源的序列。在多种配置中,两种真菌同源DNA序列可以是例如但不限于曲霉属1,007bp 5'trpC和1,000bp3'trpC的同源序列。在多个方面,FACint可以在原核宿主例如但不限于大肠杆菌中复制。在多个方面,FACint可以整合到真菌宿主例如但不限于曲霉菌属真菌例如构巢曲霉基因组中。在多个方面,FACint可以作为穿梭载体或质粒。在多个方面,细菌选择标记基因可以是本领域技术人员已知的任意细菌选择标记基因,例如但不限于卡那霉素抗性基因(kanR)。
在多种配置中,本发明教导的载体即本发明教导的FAC、FACdual或FACint还可包含克隆位点,其包含可在特定序列结合并剪切DNA的多个核酸内切酶识别位点。核酸内切酶识别序列包括来自原核生物的限制性内切酶识别序列和来自真核生物的归巢核酸内切酶的识别序列(本文中称作“限制酶”)。在一些配置中,克隆位点可包含在消化FAC时产生不相容(即非互补或非回文)单链突出端的限制酶的多个识别位点。在一些方面,克隆位点可包括一种或多种限制酶例如但不限于Bsr I,I-CeuI,BstXI,I-SceI或其组合的识别序列。在一些方面,识别序列可以是限制酶例如但不限于BstXI,I-SceI或其组合的识别序列。在一些方面,克隆位点可以包括串联取向的一对限制酶识别位点。在一些方面,克隆位点可以包括相反的“头对头”取向的一对限制酶识别位点。在一些方面,克隆位点可以依次包括I-SceI、BstXI、BstXI和I-SceI的识别位点。在一些方面,I-SceI位点可以相互头对头取向。在一些方面,BstXI位点可以相互头对头取向。在一些配置中,克隆位点还可包含一种或多种其他限制酶例如Bam HI、Hind III、EcoRI或NotI的识别位点。
在多种配置中,本发明教导的载体可在原核宿主例如但不限于大肠杆菌或真核真菌宿主例如但不限于曲霉菌属例如构巢曲霉中保持并复制。
在一些配置中,本发明的载体可以包括低拷贝数细菌复制起点、诱导型高拷贝数细菌复制起点或其组合,即低拷贝数和诱导型高拷贝数细菌复制起点。在多个方面,低拷贝数细菌复制起点可以是例如但不限于oriS。在多个方面,诱导型高拷贝数细菌复制起点可以是例如但不限于oriV。在多种配置中,高拷贝数复制起点可以通过在大肠杆菌宿主基因组或质粒中编码的复制起始蛋白基因控制。在多种配置中,复制起始蛋白基因可以是TrfA。在多种配置中,诱导型启动子可以可操作地连接到复制起始蛋白基因。在多种配置中,诱导型启动子可以是任何细菌诱导型启动子,例如但不限于阿拉伯糖诱导型启动子、lac启动子、IPTG诱导型T3启动子、IPTG诱导型T5启动子或鼠李糖诱导型(rhaBAD)启动子。
在一些配置中,本发明教导的载体可包括用于细菌如大肠杆菌的选择标记的一种或多种基因,例如但不限于氯霉素抗性基因(camR或CAT)、kanR、ampR、genR、tetA、strepR、galK或其组合。在多个方面,选择标记可用于阳性筛选(例如选择存在氨苄青霉素抗性或galK(半乳糖激酶)活性)或阴性筛选(例如选择不存在galK活性(Warming,S.,et al.,Nucleic Acids Res.2005,Vol.33,No.4e36))。
在一些配置中,本发明教导的载体可以包括真菌选择标记基因,例如但不限于pyrG、ptrA、trpC或其组合。在一些方面,真菌选择标记基因可以是pyrG基因。
在一些配置中,本发明教导的载体可以包括来自外源的DNA的插入。在多种配置中,DNA插入可以是插入克隆位点。在多种配置中,DNA插入物可以来自任意来源,例如病毒、原核微生物、真核微生物、植物、动物、人或由RNA产生的cDNA。在一些配置中,DNA源可以是真核微生物例如酵母或丝状真菌的基因组。在一些配置中,DNA源可以是曲霉菌属真菌,包括任何曲霉菌属物种。在一些配置中,DNA源可以是除构巢曲霉以外的曲霉菌属真菌。在一些配置中,DNA插入源可以是曲霉菌属真菌,例如但不限于A.acidus,A.aculeatinus,棘孢曲霉(A.aculeatus),A.aeneus,A.affinis,A.alabamensis,洋葱曲霉(A.alliaceus),亚马逊曲霉(A.amazonicus),A.ambiguus,A.amoenus,阿姆斯特丹曲霉(A.amstelodami),解淀粉曲霉(A.amyloliquefaciens),A.amylovorus,阿诺玛鲁斯曲霉(A.anomalus),A.anthodesmis,A.apicalis,A.appendiculatus,A.arachidicola,A.arenarius,A.arvii,A.asperescens,A.assulatus,A.astellatus,A.aurantiobrunneus,A.aureofulgens,A.aureolatus,A.aureoterreus,A.aureus,A.auricomus,A.australensis,A.austroafricanus,A.avenaceus,A.awamori,A.baeticus,A.bahamensis,A.biplanus,A.bisporus,香素曲霉(A.bombycis),巴西曲霉(A.brasiliensis),A.brevipes,A.brevistipitatus,A.bridgeri,A.brunneo-uniseriatus,A.brunneoviolaceu,A.caelatus,A.caesiellus,A.caespitosus,A.calidoustus,A.campestris,闪白曲霉(A.candidus),A.capensis,A.carbonarius,肉色曲霉(A.carneus),A.cavernicola,A.cavernicola,A.cervinus,谢瓦氏曲霉(A.chevalieri),A.chungii,A.cibarius,A.clavatoflavus,A.clavatonanicus,棒曲霉(A.clavatus),圆锥曲霉(A.conicus),A.conjunctus,A.conversis,A.coreanus,A.coremiiformis,A.costaricensis,A.costiformis,A.creber,A.cretensis,冠突曲霉(A.cristatus),A.crustosus,A.crystallinus,A.cvjetkovicii,A.deflectus,A.delacroixii,A.delicatus,A.densus,A.dentatulus,A.depauperatus,A.dessyi,A.digitatus,A.dimorphicus,A.diplocystis,A.discophorus,A.disjunctus,A.diversus,A.dorothicus,A.dubius,A.dubius,A.duricaulis,A.dybowskii,A.eburneocremeus,A.eburneus,A.echinosporus,A.echinulatus,A.ecuadorensis,A.effusus,埃及曲霉(A.egyptiacus),A.elatior,线虫曲霉(A.elegans),A.ellipsoideus,A.ellipticus,A.elongatus,A.equitis,A.erythrocephalus,A.falconensis,A.fasciculatus,A.fennelliae,A.ferrugineus,A.ferrugineus,A.ficuum,A.fiemonthi,A.filifera,A.fimetarius,A.fimeti,费氏曲霉(A.fischeri),A.fischerianus,A.flaschentraegeri,A.flavescens,A.flavidus,A.flavipes,A.flavofurcatus,A.flavoviridescens,黄曲霉(A.flavus),A.flocculosus,A.floriformis,A.foeniculicola,臭曲霉(A.foetidus),A.fonsecaeus,A.foutoynontii,A.foveolatus,A.fresenii,A.fruticans,A.fruticulosus,A.fujiokensis,A.fuliginosus,A.fulvus,A.fumaricus,A.fumigatiaffinis,A.fumigatoides,烟曲霉(A.fumigatus),烟束曲霉(A.fumisynnematus),A.fungoides,A.funiculosus,A.fuscus,A.galeritus,巨大曲霉(A.giganteus),A.gigantosulphureus,A.gigas,平滑曲霉(A.glaber),A.glaucoaffinis,A.glauconiveus,灰绿曲霉(A.glaucus),A.globosus,A.godfrini,A.gorakhpurensis,A.gracilis,A.granulatus,A.granulosus,A.gratioti,A.greconis,A.griseus,藤黄曲霉(A.guttifer),A.gymnosardae,A.halophilicus,A.halophilus,A.helicothrix,A.hennebergii,A.herbariorum,A.heterocaryoticus,A.heteromorphus,A.heterothallicus,A.heyangensis,A.hiratsukae,A.hollandicus,A.homomorphus,A.hortae,腐质曲霉(A.humicola),腐殖质曲霉(A.humus),A.ibericus,红色曲霉(A.igneus),A.iizukae,A.implicatus,A.incrassatus,A.indicusA.,A.indohii,A.ingratus,A.insecticola,A.insuetus,A.insulicola,A.intermedius,A.inuii,衣康酸曲霉(A.itaconicus),A.ivoriensis,雅努斯曲霉(A.janus),日本曲霉(A.japonicus),A.jeanselmei,A.kambarensis,A.kanagawaensis,A.kassunensis,A.katsuobushi,A.keveii,A.koningii,A.laciniosus,A.lacticoffeatus,A.laneus,A.lanosus,A.laokiashanensis,A.lateralis,A.lentulus,A.lepidophyton,A.leporis,A.leucocarpus,A.lignieresii,A.longivesica,A.longobasidia,A.luchensi,A.luchuensis,A.lucknowensis,A.luteoniger,A.luteovirescens,土黄色曲霉(A.lutescens),黄色曲霉(A.luteus),A.macfiei,A.macrosporus,A.malignus,A.malodoratus,A.malvaceus,A.mandshuricus,A.manginii,A.mannitosus,A.maritimus,A.mattletii,A.maximus,A.medius,波状热曲霉(A.melitensis),蜂蜜曲霉(A.melleus),A.mellinus,A.mencieri,A.michelii,A.microcephalus,A.microcysticus,A.microsporus,A.microthecius,A.microviridicitrinus,A.minimus,A.minisclerotigenes,A.minor,A.minutus,A.miyajii,A.miyakoensis,A.mollis,A.montenegroi,A.montevidensis,粘液样曲霉(A.mucoroides),A.mucoroideus,A.muelleri,多色曲霉(A.multicolor),A.multiplicatus,A.muricatus,A.muscivora,A.mutabilis,A.mycetomi-villabruzzii,A.mycobanche,A.nakazawae,A.nantae,A.nanus,A.navahoensis,A.neobridgeri,A.neocarnoyi,A.neoellipticus,A.neoglaber,A.nidulellus,黑曲霉(A.niger),A.nigrescens,微黑曲霉(A.nigricans),A.nishimurae,A.niveoglaucus,霉白曲霉(A.niveus),A.noelting,A.nominus,集峰曲霉(A.nomius),A.novofumigatus,A.novus,A.ochraceopetaliformis,赭曲霉(A.ochraceoroseus),A.ochraceoruber,赭曲霉(A.ochraceus),A.okazakii,A.olivaceofuscus,A.olivaceus,A.olivascens,A.olivicola,A.omanensis,A.onikii,A.oosporus,A.ornatulus,A.ornatus,米曲霉(A.oryzae),A.ostianus,A.otanii,A.ovalispermus,A.paleaceus,A.pallidus,A.panamensis,A.paradoxus,寄生曲霉(A.parasiticus),A.parrulus,A.parvathecius,A.parvisclerotigenus,A.parviverruculosus,A.parvulu,A.paulistensi,A.penicillatus,A.penicilliformis,帚状曲霉(A.penicillioides),A.penicillioideum,A.penicillopsis,A.periconioides,A.perniciosus,A.persii,A.petrakii,A.peyronelii,A.phaeocephalus,A.phialiseptatus,海枣曲霉(A.phoenicis),A.pidoplichknovii,A.piperis,A.polychromus,A.pouchetii,A.primulinus,A.profusus,A.proliferans,A.protuberus,,A.pseudocaelatus,A.pseudocarbonarius,A.pseudocitricus,假棒曲霉(A.pseudoclavatus),A.pseudodeflectus,A.pseudoelatior,假线虫曲霉(A.pseudoelegans),A.pseudoflavus,假灰绿曲霉(A.pseudoglaucus),A.pseudoheteromorphus,A.pseudoniger,A.pseudoniger,假集峰曲霉(A.pseudonomius),假溜曲霉(A.pseudotamarii),A.pulchellus,A.pulmonum-hominis,粉状曲霉(A.pulverulentus),A.pulvinus,A.puniceus,A.purpureofuscus,紫红曲霉(A.purpureus),A.pusillus,A.pyramidus,A.pyri,A.qinqixianii,A.qizutongii,A.quadricinctus,A.quadricingens,A.quadrifidus,A.quadrilineatus,A.quercinus,A.quininae,A.quitensis,A.racemosus,A.raianus,A.rambellii,多枝曲霉(A.ramosus),A.raperi,A.recurvatus,A.rehmii,A.repandus,A.repens,A.reptans,局限曲霉(A.restrictus),A.rhizopodus,A.robustus,A.roseoglobosus,A.roseoglobulosus,A.roseovelutinus,A.roseus,A.roseus,赤曲霉(A.ruber),A.rubrobrunneus,赤曲霉(A.rubrum),A.rufescens,A.rugulosus,A.rugulovalvus,A.rutilans,A.sacchari,A.saitoi,A.salviicola,A.sartoryi,A.scheelei,A.schiemanniae,A.sclerogenus,A.sclerotiicarbonarius,A.sclerotioniger,A.sclerotiorum,A.sejunctus,分隔曲霉(A.septatus),A.sepultus,A.silvaticus,简单曲霉(A.simplex),酱油曲霉(A.sojae),A.sparsus,A.spathulatus,赤松曲霉(A.spectabilis),A.spelunceus,A.spiculosus,具刺曲霉(A.spinosus),A.spinulosus,腋索曲霉(A.spiralis),A.stella-maris,A.stellatus,A.stellifer,A.stercoreus,A.sterigmatophorus,A.steynii,A.stramenius,A.striatulus,A.striatus,A.stromatoides,A.strychni,A.subfuscus,A.subgriseus,A.sublatus,A.sublevisporus,近绿曲霉(A.subolivaceus),A.subsessilis,A.subunguis,硫色曲霉(A.sulphureus),硫色曲霉(A.sulphureus),A.sunderbanii,萨氏曲霉(A.sydowii),A.sylvaticus,集珠曲霉(A.syncephalis),A.tabacinus,A.taichungensis,A.takakii,A.taklimakanensis,溜曲霉(A.tamari),A.tapirirae,A.tardus,A.tatenoi,蒺藜曲霉(A.terrestris),土曲霉(A.terreus),栖土曲霉(A.terricola),A.testaceocolorans,A.tetrazonus,A.thermomutatus,A.thomi,A.tiraboschii,A.togoensis,A.tokelau,A.tonophilus,A.toxicarius,A.tritici,A.tsurutae,A.tuberculatus,塔宾曲霉(A.tubingensis),A.tunetanus,A.udagawae,A.umbrinus,嗜阴曲霉(A.umbrosus),波状曲霉(A.undulatus),A.unguis,A.unilateralis,宇佐美曲霉(A.usamii),黑粉菌曲霉(A.ustilago),A.ustus,A.uvarum,A.vadensis,A.vancampenhoutii,A.varanasensis,A.variabilis,A.varians,A.variecolor,A.variegatus,A.velutinus,A.venezuelensis,杂色曲霉(A.versicolor),A.vinosobubalinus,A.violaceobrunneus,A.violaceofuscus,A.violaceus,A.virens,A.viridigriseus,A.viridinutans,A.vitellinus,葡萄曲霉(A.vitis),A.vitricola,A.wangduanlii,A.warcupii,A.wehmeri,A.welwitschiae,温特曲霉(A.wentii),A.westendorpii,A.westerdijkiae,A.xerophilus,A.yezoensis,A.zhaoqingensis或环带曲霉(A.zonatus)。
在多种配置中,本发明教导的载体(即本发明教导的FAC、FACdual或FACint)可以包括的插入物长度为至少10kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少110kb、至少120kb。在多种配置中,插入物长度可达500kb、400kb、300kb、200kb或150kb。因此,在多种配置中,本发明的载体可包括范围为例如但不限于30kb至500kb、40kb至400kb、50kb至300kb或100kb至500kb的插入物。
在多种配置中,本发明教导的载体可含有包含至少一种次生代谢物(SM)基因簇,基本上由其组成,或由其组成的插入物。在多种配置中,本发明的载体可含有包含至少一种次生代谢物(SM)基因簇、基本上由其组成或由其组成的插入物,和编码真菌的代谢终产物的该基因簇的所有基因。在多个方面,SM基因簇可以来自与本发明教导载体的宿主真菌种异源的真菌种类。在多个方面,SM基因簇可以来自构巢曲霉以外的真菌物种,且宿主真菌种可以是构巢曲霉。在多种配置中,包含SM基因簇的插入物长度可达500kb、400kb、300kb、200kb或150kb。因此,在多种配置中,本发明教导的载体可以包含SM基因簇的范围例如但不限于30kb至500kb、40kb至400kb、50kb至300kb、100kb至500kb、100kb至400kb或100kb至300kb。在多种配置中,由本发明教导的载体包含的SM基因簇可以是完整的基因簇。在一些方面,在异源真菌宿主中表达SM基因簇可用于重建次生代谢物的生物合成途径。
在多种配置中,本发明的教导包括包含本发明教导载体(即FAC、FACdual或FACint)的宿主真菌。在多个方面,宿主真菌可以是丝状真菌例如但不限于曲霉菌属真菌。在多个方面,真菌可以是构巢曲霉真菌。在多种配置中,含有包含SM基因簇的本发明教导载体的宿主真菌可以表达簇的基因。因为本发明教导的载体包含的SM基因簇的基因在真菌环境中,天然存在的基因表达、转录后和翻译后调节和修饰,以及次生代谢物的合成可被复制或非常接近。在一些方面,SM基因簇的一个或多个基因可被修饰以影响表达水平的增加或降低,或改变蛋白质结构。
在多种配置中,本发明教导的载体包含的次生代谢物(SM)基因簇可通过一种或多种靶向插入、一种或多种靶向缺失或其组合来修饰。在多个方面,修饰可导致SM基因簇包含的一个或多个基因的表达增强。在多个方面,修饰可导致SM基因簇包含的一个或多个基因的表达降低。在多个方面,修饰可导致隐性基因的激活。在多个方面,修饰可以是靶向插入到SM基因簇中的具体位点。在多个方面,修饰可以是SM基因簇一部分的靶向缺失。在某些方面,载体可以是本发明教导的FAC、FACdual、FACint。
在一些实施方案中,本发明的教导包括将DNA序列插入次生代谢物(SM)基因簇中目标位置的方法。在多种配置中,这些方法可包括提供包含次生代谢物(SM)基因簇的本发明教导的载体(即本发明教导的FAC、FACdual或FACint);提供包含、基本上由以下组成或由以下组成的插入DNA:a)与目标位置第一侧侧翼序列同源的第一序列,b)待插入的序列,c)与目标位置第二侧侧翼序列同源的第二序列,和d)细菌选择标记;将载体和插入DNA转化进入表达Red/ET重组酶的大肠杆菌菌株;以及选择包含细菌选择标记的转化的大肠杆菌细胞。不受理论的限制,据信可以通过插入DNA与载体所含SM基因簇之间的同源重组来实现在目标位置插入序列。在一些配置中,插入DNA的细菌选择性标记可以是不同于转化前载体所含细菌选择标记的标记。在多种配置中,细菌选择标记可以是阳性选择标记或阴性选择标记。在某些方面,载体可以是FAC。
在一些实施方案中,本发明教导包括从次生代谢物(SM)基因簇中删除靶DNA序列的方法。在多种配置中,这些方法可以包括提供包含次生代谢物(SM)基因簇的本发明教导的载体(即本发明教导的FAC、FACdual或FACint);提供缺失DNA,其包含a)与靶DNA序列第一侧侧翼序列同源的第一序列,b)与靶DNA序列第二侧侧翼序列同源的第二序列,和c)细菌选择标记;将载体和插入DNA转化进入表达Red/ET重组酶的大肠杆菌菌株;以及选择包含细菌选择标记的转化的大肠杆菌细胞。不受理论的限制,据信可通过缺失DNA和载体所包含的SM基因簇之间的同源重组来实现靶序列的缺失。在一些配置中,缺失DNA的细菌选择标记可以是转化前载体所含的细菌选择标记以外的标记。在多种配置中,细菌选择标记可以是阳性选择标记或阴性选择标记。在一些方面,载体可以是本发明教导的FAC。
在一些实施方案中,本发明教导包括在本发明教导的载体中构建非偏倚(unbiased)文库的方法。在多种配置中,这些方法可包括从DNA来源例如真菌提供高分子量(HMW)基因组DNA;将HMW基因组DNA机械剪切成长度为100kb-300kb的片段;在DNA片段上产生平末端;将限制酶接头如BstXI接头连接到平末端,以产生接头连接的DNA片段;通过脉冲场凝胶电泳纯化接头连接的DNA片段;并将纯化的接头连接的DNA片段连接到本发明教导的限制酶酶切载体如BstXI酶切载体中。在多个方面,所述方法还可包括用连接的限制酶酶切载体转化宿主微生物。在多种配置中,宿主微生物可以是大肠杆菌或第二种真菌,例如构巢曲霉。在多种配置中,限制酶可以是BstXI。在多种配置中,载体可以是本发明教导的FAC。在多个方面,DNA的来源可以是丝状真菌,例如但不限于曲霉菌属真菌如构巢曲霉以外的曲霉菌属真菌。在一些方面,宿主微生物可以是曲霉菌属真菌例如构巢曲霉。在多个方面,高分子量基因组DNA的来源可以是宿主真菌种以外的真菌种。在多个方面,HMW基因组DNA可以是与宿主真菌种异源的真菌基因组DNA。在多个方面,HMW基因组DNA可以是包含次生代谢物基因簇的真菌基因组DNA。
附图说明
图1A-C示出了本发明教导的FAC载体图;
图2A-B示出了从温特曲霉制备HMW基因组DNA和随机剪切FAC克隆结果;
3A-C CHEF凝胶,其显示大肠杆菌-曲霉菌属穿梭BAC或FAC成功地从构巢曲霉的转化菌株转移到大肠杆菌;
图4A-B示出了成功融合PCR的一步精确FAC修饰和分子确认的示意图;
图5CHEF凝胶示出了AtFAC9J20(FAC20)的5种精确基因缺失;
图6通过FAC系统在构巢曲霉中装配合成SM基因簇的示意图。
具体实施方式
本发明的教导提供了用于生产非偏倚大片段插入基因组文库的载体和方法,可用于从真菌捕获整套大的完整的SM基因途径。载体可用于在真菌宿主和细菌宿主之间穿梭大的完整的SM基因簇。构巢曲霉可以用作异源表达SM基因簇的宿主。此外,本发明教导的载体允许使用同源重组通过插入和缺失来靶向修饰SM基因簇。
本发明人从6种测序真菌构建了平均插入物大小为100kb或更大的非偏倚真菌穿梭BAC(FAC)文库:棘孢曲霉(Aspergillus aculeatus)、温特曲霉、土曲霉、茄腐镰孢菌(Fusarium solani)、扩展青霉(Penicillium expansum)和马尔尼菲青霉菌(P.marneffei)。每个文库中的平均插入物大小使得每种载体可包含完整的SM途径或真菌次生代谢物基因簇,其大小范围在20kb至超过80kb。在一些配置中,载体可以包含SM生物合成途径的所有基因。
新的FAC文库是使用随机剪切的DNA产生的且不含限制性不完全消化,这是该领域的另一个里程碑,消除了偏倚从而可提高文库质量。使用FAC文库,本发明人已经成功地从6种测序真菌预测的271种完整SM基因簇或途径中获得263种,作为单个FAC克隆(表1)。
本发明人已经证明,大载体例如包含完整SM基因簇的载体可穿梭进入真菌宿主中用于稳定的质粒保持。此外,已经实现了在构巢曲霉宿主中异源表达至少150kb的大的SM基因簇。在一些配置中,本发明教导的载体可包含能够被真菌宿主的调控元件调节的全长SM基因簇。
在一些方面,可通过Red/ET技术修饰包含完整SM基因簇的载体(例如包含约100kb的插入片段的载体),用于真菌功能性SM研究。本发明的教导包括在任意选择的DNA序列位点精确修饰真菌完整SM基因簇的方法。可使用的方法例如但不限于激活隐性、沉默和或低表达SM基因簇、表征真菌SM基因簇内的基因或遗传元件,以及天然产物(NP)发现。表2列出了55种SM基因簇或途径的修饰实例。
在一些配置中,可以使用抗生素抗性基因(例如但不限于卡那霉素、氨苄青霉素或羧苄西林、红霉素、四环素、硫酸庆大霉素、青霉素、链霉素、大观霉素(spectromycin)或氯霉素抗性基因)来选择含有包含修饰的SM基因簇载体的细菌克隆。所述载体可以在含有适于所述载体和RED/ET选择标记的抗生素的LB培养基上的大肠杆菌中生长。在一些方面,选择的菌落可以在一天之内生长。
在一些配置中,本发明教导包括融合PCR方法,其将选择标记(例如KanR或galK基因)和启动子(例如但不限于gpdA(p)、alcA(p)、glaA(p)或pkiA(A))组合为一种PCR产物用于修饰SM基因簇(例如图4A-B和5)。
在一些配置中,本发明教导包括用于表达毒性SM化合物的方法,而不需要共同表达能够将毒性SM化合物输送出细胞的抗性基因。这些方法使用包含诱导型强启动子如alcA(p)的载体。在这些方法中,细胞最初在没有诱导剂的情况下生长。当细胞达到足够的密度时,加入诱导剂,细胞表达次生代谢途径的基因。该方法可用于生产毒性SM化合物。
在一些配置中,本发明的载体提供了通过真菌同源重组在构巢曲霉中组装合成的SM基因簇的工具(图6)。单个基因(例如Gene1、Gene2和Gene3或更多,总共约100kb)可以根据生物信息学设计完全合成,或者克隆并与诱导型强启动子(例如但不限于alcA(p))及侧翼同源序列(约1kb,H1、H2、H3、H4等)融合。这些基因和含有合成的SM基因簇的侧翼同源序列(例如H1和H4)的克隆就绪载体(pFAC或pFACdual)可以同时转化进入构巢曲霉以通过同源重组组装合成的SM基因簇。真菌选择标记如AfpyroA和AfriboB(Szewczyk,E,et al.,Nat.Protoc.,2006,1,311-3120)可用于选择具有合成的SM基因簇的载体。与本领域中先前报道的基因组整合(Szewczyk,E.,et al.,Nat.Protoc.,2006,1,311-3120;Chiang,YM,etal.,J.Am.Chem.Soc.,2013,135,7720-7731)不同,本发明教导的合成SM基因簇-FAC可以从构巢曲霉中分离,然后穿梭回大肠杆菌。在一些配置中,可以进一步修饰FAC,例如通过在大肠杆菌中或体外添加调节元件或基因。
在一些配置中,本发明的教导包括通过真菌同源重组在构巢曲霉中组装新的合成的SM基因簇的方法(图6)。
本发明的教导公开了三种类型的载体用于克隆大的插入片段。这些载体可用于复制和保持大的插入片段作为人工染色体或者用于将大插入片段整合到宿主真菌基因组中。在多种配置中,可用作真菌人工染色体的质粒可以是基于P1的载体、基于BAC的载体或穿梭BAC载体,其可用于在大肠杆菌和真菌宿主中复制大的插入片段。
在多种配置中,本发明教导的载体可以包含用于在大肠杆菌中复制和保持质粒的特征。载体可以包含大肠杆菌的复制起点例如低拷贝数起点,例如但不限于F质粒的起点。低拷贝数复制起点可以包括但不限于oriS。载体还可以包含这样的大肠杆菌复制起点,其可以是诱导型高拷贝复制起点,例如但不限于oriV。载体还可以包括大肠杆菌选择标记基因,例如赋予抗生素抗性的基因,所述抗生素例如但不限于:氯霉素、卡那霉素、氨苄青霉素或羧苄青霉素、红霉素、四环素、硫酸庆大霉素、青霉素、链霉素或大观霉素。在一些配置中,载体还可以包含至少一个克隆位点,其可以是多克隆位点。在一些方面,克隆位点可以包含一对限制性位点,其中用限制酶消化可产生非互补单链突出端,其可以连接到特定接头。适合的酶包括的酶可产生非互补单链突出端例如非回文突出端,例如用酶例如但不限于BstXI、BseYI、I-CeuI、I-SceI、PI-PspI、PI-SceI、AlwNI、BglI、BslI、BstAPI、DrdI、MwoI、PflMI或SfiI消化产生的突出端。在一些配置中,第二个克隆位点可以包含一对限制性位点,位于第一个克隆位点酶切位点的侧翼,其中用靶向这些位点的第二种酶消化可产生非互补单链突出端。适合的酶包括可产生非互补单链突出端的稀有剪切酶,例如但不限于I-SceI、PI-PspI和I-Ceul。不受理论的限制,这两个限制酶位点对的组合可促进克隆的大DNA片段的清洁切除并与其他FAC质粒如FAC整合质粒交换。在多种配置中,高拷贝数的复制起点可受到诱导型启动子上的复制起始蛋白调节,所述复制起始蛋白可整合到宿主大肠杆菌细胞基因组中,所述诱导型启动子例如但不限于阿拉伯糖诱导型启动子、T5启动子、T7启动子、rhaBAD启动子或β-半乳糖苷酶启动子。复制起始蛋白可以是例如但不限于TrfA。
在一些配置中,FAC载体可以包含其在真菌细胞中复制的特征。这些包括真菌复制起点,例如但不限于在曲霉菌属中自主保持(AMA1,SEQ ID NO:8)。FAC载体还可以含有真菌选择标记基因,例如但不限于乳清苷-5'-磷酸脱羧酶基因(pyrG,源自寄生曲霉,SEQ IDNO:9和SEQ ID NO:10)、ptrA或trpC。
在一些配置中,本发明的教导包括FAC双功能载体,其可作为真菌人工染色体保持在大肠杆菌中、可被诱导整合到真菌基因组中、并且可以用作大肠杆菌-真菌穿梭BAC载体。双功能载体具有与上文所述的常规FAC载体相同的特征,以及另外的基因盒:attP位点和整合酶基因例如但不限于phi31整合酶基因,在真菌诱导型启动子例如但不限于alcA启动子或glaA(p)的控制下。在多种配置中,整合酶基因可以进行密码子优化用于真菌表达。
在多种配置中,本发明教导的FAC系统可以用于多种真菌,例如但不限于棘孢曲霉、土曲霉、温特曲霉、茄腐镰孢菌、扩展青霉、马尔尼菲青霉菌、粗糙脉孢菌(Neurosporacrassa)及子囊菌门的真菌。
定义
本文中使用多种术语来表示本发明教导的各个方面。为了帮助澄清这些教导的组件的描述,包括以下定义。
本文所用的术语“真菌”是指包括真核生物中任意成员,其包括单细胞微生物(例如但不限于酵母和霉菌)以及产生称为蘑菇的熟知的子实体形式的多细胞真菌。更具体地,其是丝状真菌或霉菌,例如但不限于棘孢曲霉、土曲霉、温特曲霉、茄腐镰孢菌、扩展青霉和马尔尼菲青霉菌。
本文中“次生代谢物(SM)”是指不参与初级代谢的化学化合物,因此与更常见的大分子如蛋白质和核酸不同。来自多种真核生物包括真菌的数千种SM已被描述(Donadio,S.,et al.,Nat.Prod.Rep.,2007,24,1073-1109)。
本文中“SM基因簇或途径”是指一组生物合成基因,其包含编码次生代谢物合成和活性所需的蛋白质例如但不限于酶的多核苷酸序列。SM基因簇或途径可实现起始化合物(例如但不限于底物)转化为最终化合物或NP。
本文中术语“完整或全长SM基因簇或途径”是指含有一整套生物合成基因和调控元件的SM基因簇或途径。每种真菌基因组可含有50或更多种不同的完整的SM基因簇,其大小在20kb至超过100kb(Nordberg,H.et al.,Nucleic Acids Res.,2014,42(Databaseissue),D26-31)。真菌SM簇通常包含一种或多种骨架基因,例如聚酮合成酶(PKS)、非核糖体肽合成酶(NRPS)、二甲基烯丙基色氨酸合成酶(DMAT)和萜烯环化酶(TC)),其被修饰酶包括但不限于氧化还原酶、加氧酶、脱氢酶、还原酶和转移酶的基因包围(Keller,N.P.andHohn,T.M.,Fungal Genet.Biol.1997,21,17-29;Walton,J.D.,Fungal Genet.Biol.,2000,30,167-171)。
本文中“调节元件”是指控制或影响基因(例如来自基因盒、遗传构建体或FAC载体的大的多核苷酸插入片段中的基因)表达的核酸序列元件。调节元件可以是例如但不限于启动子、增强子、转录因子或控制序列、翻译调控序列、时间或组织特异性调节元件、多腺苷酸化信号序列、5'或3'UTR、抑制子或终止子。调节元件可以与本文所述由FAC构建体或载体表达的大片段多核苷酸插入物或完整的SM基因簇同源或异源。当本文所述的FAC载体存在于细胞例如异源构巢曲霉细胞中时,调节元件可以相对于细胞是天然存在、内源的、外源的和/或工程化的。
本文中与两个核酸末端相关的“相容的”表示两个末端都是平端或含有互补单链突出端,例如通过机械剪切DNA然后进行DNA末端修复、DNA接头连接或限制性内切核酸酶消化后产生的末端。至少一个末端可以含有5'磷酸基团,这可允许通过双链DNA连接酶连接末端。
本文中“BstXI接头”(Klickstein,LB和Neve,RL,Current Protocols inMolecular Biology,John Wiley&Sons,Inc.1991,5.6.1-5.6.10)是指可相互退火以产生具有与上述BstXI酶切序列的一端互补的突出端的双链DNA分子的两条部分互补的DNA链。可用于连接大DNA片段的平末端的BstXI接头的实例如下:
BstXI接头上链(TOP)5’-CTGGAAAG-3’(SEQ ID NO:5)。
BstXI接头下链(Bottom)5’-CTTTCCAGCACA-3’(SEQ ID NO:6)。
BstXI接头的平末端可以设计成与大DNA片段互补。例如,目标大DNA片段可以是机械剪切的DNA,其被DNA末端修复酶混合物(Intact Genomics,St.Louis,MO)补充并形成平末端。平末端DNA也可以通过Taq聚合酶对目标大片段DNA的每个末端非模板介导地添加单个A核苷酸来修饰。该情况下,上述接头可以通过在BstXI接头上链的3'端添加单个T核苷酸进行修饰。
“穿梭细菌人工染色体(BAC)载体”是指可用于从一种(或多种)供体细菌种类或菌株到一种或多种宿主生物或菌株或种类转移并保持遗传信息的BAC载体。
本文中“FAC载体”是指真菌人工染色体载体或大肠杆菌和构巢曲霉之间的穿梭BAC载体。
本文中“文库”是指各自包含插入序列和载体的多个克隆。
方法
本文描述的方法和组合物利用本领域技术人员熟知的实验室技术,并且可以在实验室手册中找到,例如Sambrook,J.,et al.,Molecular Cloning:A Laboratory Manual,3rd ed.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,2001;Spector,D.L.et al.,Cells:A Laboratory Manual,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1998;Nagy,A.,Manipulating the Mouse Embryo:ALaboratory Manual(Third Edition),Cold Spring Harbor,NY,2003and Harlow,E.,Using Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1999。除非上下文另有说明,本说明书和任何所附权利要求中所使用的单数形式“一”、“一个”和“该”也旨在包括复数形式。
以下材料和方法也用于本发明教导的多个方面。
本发明的教导提供了从真菌制备超高质量的高分子量(HMW)基因组DNA,并通过随机剪切生成平均插入片段大小为100kb或更大的非偏倚大插入片段FAC文库。文库的大片段DNA群不仅包括真菌基因组中具有最小偏倚的所有生物合成基因座片段,而且每个DNA分子足够大(100kb或更大)以覆盖至少一个完整的SM基因簇。
高分子量(HMW)基因组DNA可来自任何培养的、分离的、纯化的或混合的真菌,包括已公开基因组序列的真菌。HMW基因组DNA可以直接从其自然栖息地、环境或生物质制备,而不需要分离和培养真菌。
用于BAC克隆的HMW基因组DNA的制备技术已有报道(Wu,C.C.,et al,Encyclopedia of Molecular Cell Biology and Molecular Medicine Volume 3(2ndEdition),Edited by Meyers R.A.,Wiley-VCH Verlag GmbH:Weinheim,Germany 2004,pp385-425;Zhang,M.,et al.,Nat.Protoc.,2012,7:467-478)。在一些配置中,HMW基因组DNA可以包括完整的染色体,或者可以是百万碱基大小。
为制备HMW基因组DNA,可收集真菌细胞例如但不限于孢子、发芽孢子、原生质体或细胞核,并将其直接包埋在低熔点琼脂糖胶塞(plug)中。低熔点琼脂糖胶塞的浓度可以为约0.4%至约1%,并且可以具有约0.5%的终浓度。HMW基因组DNA可以通过用0.5M EDTA(pH9.0)中的月桂基肌氨酸和蛋白酶K处理进行纯化。HMW基因组DNA可以通过制备真菌原生质体(Bok,J.W.and Keller,N.P.,Methods Mol.Biol.,2012,944,163-174),然后将真菌原生质体包埋在低熔点琼脂糖胶塞中来制备。
HMW基因组DNA可用于产生非偏倚大片段插入重组DNA文库以覆盖大的完整SM基因簇,其中一个克隆含有完整的SM基因簇或途径。本发明教导提供了通过电洗脱或琼脂酶消化琼脂糖DNA胶塞来制备液体HMW基因组DNA。然后可以通过水剪切、重复移液、低速涡旋或其组合机械剪切液体HMW基因组DNA。用于给定真菌基因组的条件可以通过在CHEFF凝胶上运行剪切的HMW基因组DNA(其大小范围为约100kb到约300kb)来确定。
本文公开的大肠杆菌-真菌穿梭BAC载体或FAC(图1)载体(参见实施例1)可用于具有100kb或更大的平均插入片段的BAC/FAC文库构建。本发明人已经证明,大插入片段FAC(至少150kb)可以穿梭到异源的构巢曲霉宿主中用于稳定保持和NP发现(图3,Bok,J.W.,etal.,BMC Genomics,2015,16,343)。
用于构建非偏倚FAC文库的随机剪切BAC克隆法
HMW基因组DNA按照方法所述进行剪切。向400μl剪切的HMW基因组DNA(100~300kb)中加入5μl DNA末端修复酶混合物(Intact Genomics,St.Louis MO)、100μl 5×DNA末端修复缓冲液至总共500μl。通过用宽口吸头轻轻吹吸将样品充分混合,并将反应物在室温下孵育30分钟。将大片段DNA末端修复反应在70℃孵育15分钟以热杀死DNA末端修复酶。将100μM BstXI接头上链和下链(接头比大片段DNA分子的摩尔比率过量106~107倍)分别加入20μl、加入61μl含ATP的10×T4连接缓冲液和10μl大片段DNA T4连接酶(IntactGenomics),然后使用宽口吸头轻轻吹吸将反应物混合均匀。接头连接反应在室温放置3-8小时。将连接接头的大DNA片段分级,并且通过1%琼脂糖CHEFF凝胶在0.5×TBE、6V/cm、90s/90s电泳16小时,4V/cm、5s/5s另外电泳8小时除去过量的BstXI接头。使用λDNA梯度标记物(Intact Genomics)作为对照,回收100~150kb、150~210kb、210~300kb大DNA片段凝胶切片,然后将凝胶切片置于透析管中,将DNA电洗脱,然后将纯化的接头连接的大DNA片段用100ml冰冷和高压灭菌的超纯水透析至少3次,每次1小时。将克隆就绪的BstXI-FAC载体(20ng/μl,Intact Genomics)与凝胶纯化的连接BstXI-接头连接的DNA(2~3ng/μl)以1:3摩尔比混合,并将连接反应置于16℃过夜。例如,将200μl大片段DNA(3ng/μl)与10μl FAC载体(20ng/μl)、60μl 5×T4连接缓冲液、30μl BAC克隆T4连接酶(Intact Genomics)混合,连接反应物置于16℃过夜,优选12~18小时。
大插入片段FAC文库构建
将文库的大DNA片段克隆到FAC载体中,作为大肠杆菌中覆盖真菌SM基因簇或途径的筛选文库。优选地,大片段插入FAC文库具有100kb或更大的平均插入片段,因此每个FAC克隆中包含至少一个完整的SM基因簇是足够的。此外,大片段插入FAC文库是非偏倚的,并且只有10×甚至5×基因组覆盖的FAC文库足以从测序的真菌基因组或真菌样品中捕获整套完整的SM基因簇。使用本文所述的方法,发明人可以从研究的所有6种真菌中使用4~5个384孔板的FAC克隆(平均约100kb,4~5x基因组覆盖)捕获整套完整的SM基因簇(表1;Bok,J.W.,et al.,BMC Genomics,2015,16,343)。
因为FAC系统是穿梭BAC系统,本发明教导的载体可用于本领域已知的BAC/fosmid文库筛选技术中。为鉴定含有完整SM基因簇的FAC克隆,基于序列的方法可用于FAC文库筛选,如PCR或菌落杂交(Zhang,H.B.and Wu,C.C.,Plant Physiol.Biochem.,2001,39,1-15;Kang,H.S.and Brady,S.F.,Angew.Chem.Int.Ed.Engl.,2013,52,11063-11067)。基于序列的方法的一个应用涉及从已知基因或蛋白质家族的保守区域设计DNA探针或引物,例如但不限于使用设计用于扩增PKS或NRPS保守结构域/区域的简并引物筛选来自每种阵列文库的合并的FAC DNA(Kang,H.S.and Brady,S.F.,Angew.Chem.Int.Ed.Engl.,2013,52,11063-11067)。可通过PCR筛选相应的库(pool),然后筛选鉴定他们的板、列和行,从文库中回收阳性FAC克隆。另一种基于序列的方法是通过具有复用条形码的板-列-行高通量下一代测序合并的FAC文库。这种策略可以将整个真菌基因组的序列复杂度降低到FAC库水平(板-列-行),从而能够完整组装合并的FAC克隆(每个100kb或更大)。完整的SM基因簇将通过完全测序和组装的FAC克隆的注释来鉴定。然后,含有单个SM基因簇的FAC克隆将通过条形码和板-列-行坐标简化。这些基于序列的方法的优点是在没有预处理不可培养的真菌群落的基因组序列甚至宏基因组的情况下,可从真菌中鉴定SM基因簇及其FAC。在本发明教导中,使用另一种基于序列的方法通过传统的Sanger测序方法对FAC克隆末端测序,然后通过将FAC末端序列与真菌参考基因组序列比对来鉴定含整套完整的含SM基因簇的FAC。类似地,下一代序列方法可以用于此目的,用FAC DNA合并和条形码以降低测序成本。
微生物菌种和培养条件
通过LO4641(riboB2,pyroA4,ΔST::AfpyrG,ΔAN7909::afpyrG,Δnku70::argB,veA1)和RJW113.5(ΔveA::argB,pyrG89)之间的有性杂交获得亲本菌株RJW256(pyrG89,pyroA4,Δnku70::argB,ΔST::afpyrG,veA1)。用FAC质粒转化RJW256产生FAC重组菌株。ΔST::AfpyrG表示从构巢曲霉中去除了整个内源的杂色曲霉素基因簇。
对于抗菌活性测试,我们使用A.nidulans RDIT9.32、A.fumigatus 293、Candidaalbicans、Pseudomonas aeroginosa PAO1、Bacillus cereus U85和Micrococcus luteus菌株。所有真菌和细菌菌株以冷冻甘油储液保持在-80℃。真菌菌株在37℃在葡萄糖基本培养基(GMM,Bok,J.W.and Keller,N.P.,Eukaryot.Cell,2004,3,527-535)上生长,细菌菌株在胰蛋白酶大豆肉汤培养基上培养。构巢曲霉转化和回收含SM簇的FAC
应用改良的基于PEG-钙的转化方法以改进转化。所述方法(Bok,J.W.and Keller,N.P.,Eukaryot.Cell,2004,3,527-535)改良如下:将200μL含107A.nidulans RJW256原生质体与2μg FAC DNA混合温和放置在1.5mL离心管中200μL的30%PEG 4,000与50mM CaCl2上。将含有原生质体的离心管在冰上孵育30分钟。将孵育的混合物以250×g离心5分钟后,使用自动吹吸轻轻混合溶液。然后将该混合物在室温孵育10分钟,然后加入1mL山梨醇-Tris-HCl-CaCl2(STC:1.2M山梨醇、10mM Tris-HCl、10mM CaCl2、pH7.5)缓冲液并将其轻轻混入溶液中。将混合物转移到13mL管中后,再向管中加入5mL STC并轻轻混合。将1mL该最终溶液分配到再生培养基上以获得转化子。
构巢曲霉FAC转化子在培养板上保持三代,用于表型和化学筛选。为FAC回收,我们由构巢曲霉FAC菌株制备~0.3mL的106/mL原生质体,通过常用碱裂解法分离FAC DNA,并将其重悬于10μL TE中。将1μL回收的DNA重新转化进入大肠杆菌细胞(BAC细胞,IntactGenomics)。
真菌基因组DNA提取
使用先前描述的技术(Bok,J.W.and Keller,N.P.,Methods Mol.Biol.,2012,944,163-174)从冻干菌丝体中提取真菌DNA以进行PCR反应。
抗菌筛选
使用盘扩散法(Bauer 1966)进行抗生素活性引导的筛选。将每种构巢曲霉FAC菌株的一个板接种在固体GMM上,并在37℃孵育7天。随后,收集板的全部内容物并冻干48小时。然后将样品用研钵和研杵粉碎,然后加入10mL甲醇。将空气干燥的甲醇提取物溶于150μL甲醇中进行活性测试。如前所述(Bok,J.W.和Keller,N.P.,Eukaryot.Cell,2004,3,527-535)进行抗细菌测定的培养基制备。对于抗真菌测定,将上述部分中提到的106个孢子埋入5mL软GMM琼脂(0.75%琼脂)中并覆盖在固体GMM上。对于每个测定,将上述150μL甲醇提取物中的10μL加载到1cm直径的纸盘上。将测定板在37℃孵育24-48小时,并观察抗菌活性。
LC-HRMS测定
将五块板的构巢曲霉FAC菌株例如但不限于AtFAC6J7,接种在固体GMM上,并在37℃孵育7天。随后,将板的全部内容物收集并冻干48小时。然后将样品用研钵和研杵粉碎,然后加入10mL甲醇。然后将空气干燥的甲醇提取物用有机溶剂(氯仿:甲醇:乙酸乙酯=8:1:1)进一步提取。将有机提取物蒸发至干燥,并在-20℃储存直到测定。
将所得有机提取物重新悬浮于甲醇中至终浓度为2μg/μL。对于每个测定,将40μg样品加载到 C18柱(150mm×2mm,3μm粒径)(Phenomenex,Torrance,CA)上。使用1150LC系统(Agilent,Santa Clara,CA)以200μL/min的流速进行色谱。使用以下梯度(缓冲液A:含0.1%甲酸的水,缓冲液B:含0.1%甲酸的乙腈):时间0分钟,2%B;35分钟,70%B;54分钟,98%B。过柱后使用1:7分流,以25μL/min的流速被引导到质谱仪。使用Q-EXACTIVETM质谱仪(Thermo Fisher Scientific,Waltham,MA)进行MS测定,设置如下:毛细管温度275℃、鞘气4(任意单位)、喷射电压4.2kV。在35,000分辨率获得全部MS光谱,所有样品质量范围m/z 200至1500。在每次完整的MS扫描之后,选择前5个最强的离子进行依赖的MS2扫描。MS2使用更高能量的碰撞解离(HCD)进行,标准化的碰撞能量为30%。制备了AtFAC6J7提取物的三个生物重复,并以技术重复进行测定,然后进行以下数据处理。
数据分析、信息学和软件
SIEVE软件套件(Thermo Fisher Scientific,Waltham,MA)用于在小分子LC-HRMS期间电喷雾产生的离子的组分检测和相对定量。组分检测使用10百万分率(ppm)的质量公差和2.5分钟的保留时间窗口。选择最小强度5×106作为确定组分峰值的阈值。对于每种组分,产生选定的离子色谱图,并计算峰的积分强度。基于总离子电流对峰面积进行归一化。为了增加统计强度和最终测定的可靠度,本发明采用的程序包括多重假设检验的诱饵方法。具体地说,将重复数据AtFAC6J7进行唯一性过滤,对照从含有空载体的对照组菌株以及含有多种具有独特遗传组分的其他FAC的其它13个菌株产生的LC-HRMS数据。为了去重复,所有组分都是通过含有构巢曲霉产生的已知真菌代谢物的目标精确的质量数据库进行搜索,使用质量公差3ppm。几乎所有样品中,已有十几种已知化合物以一致的水平存在,并经监控以快速识别高度扰动的系统。还对所有成分进行了全面的精确质量数据库的搜索,该数据库含有超过13,000个已知真菌次生代谢产物。该真菌数据库是使用Antibase(2011),“天然产物词典”(2013)以及文献(Caboche et al.2008;Andersen et al.2013)中发现的其他真菌天然产物制备的。
载体综合描述
BstXI接头突出端不与自身互补,BstXI酶切载体(上述)也不与自身互补。连接接头的大DNA片段和载体连接后,优选的连接反应产物是包含一个载体与一个大DNA片段通过单一接头在每个末端连接的圆形物。可将该分子转化到宿主细胞中以产生克隆。
实施例
本发明教导包括实施例中提供的描述,其不旨在限制任何权利要求或方面的范围。除非以过去时态特别提出,否则实例可以是预测或实际的例子。提供以下非限制性实施例以进一步说明本发明的教导。鉴于本公开,本领域技术人员应理解可以在所公开的具体实施方案中进行许多改变,仍可获得相近或相似的结果,而不脱离本发明教导的精神和范围。
实施例1
本实施例描述了pFAC质粒,其是可在构巢曲霉中保持额外染色体的本发明教导的载体。
本发明教导中,FAC载体(pFAC,图1A,SEQ ID NO:7)是基于BAC的穿梭载体,其可在大肠杆菌和构巢曲霉宿主之间穿梭大片段DNA。在大肠杆菌中保持质粒需要几个特征,包括两种大肠杆菌复制起点:oriS和oriV。第一种复制起点oriS来自低拷贝F质粒,可用于基于BAC的大片段DNA克隆和文库构建。第二种复制起点oriV是诱导型高拷贝复制起点oriV,其在含有TrfA基因的大肠杆菌(当其在含阿拉伯糖培养基上生长时)中生长、在阿拉伯糖启动子控制下时,其可以产生更高产量的大插入片段。pFAC还含有氯霉素抗性基因(cat)用于质粒选择。为克隆目的,质粒含有大的DNA克隆位点,其包含彼此相邻方向相反的一对BstXI位点。当用BstXI消化时,该配置产生一对相同的BstXI突出端,其不自身互补,而是与独特的BstXI接头互补。因此,消化的载体将不会自身复连接,接头也不会轻易连接。将两种I-SceI归巢限制性位点以相反方向插入BstXI克隆位点的侧翼。这些位点利于清除克隆的大DNA片段,并与pFACint克隆载体进行交换(参见实施例2)。
pFAC还包含在构巢曲霉中使用所需的特征。其包括第三复制起点AMA1,可在曲霉菌属中自主保持(AMA1,SEQ ID NO:8)。该序列是保持大的完整SM途径作为额外染色体元件或FAC所必需的。pFAC还含有真菌选择标记基因,即乳清苷-5'-磷酸脱羧酶基因(来自寄生曲霉的pyrG,SEQ ID NO:9和10)。
实施例2
本实施例描述了pFACint,FAC整合载体。
FAC整合载体(pFACint,图1B,SEQ ID NO:11)是可以在大肠杆菌和构巢曲霉宿主之间穿梭大片段DNA的基于BAC的穿梭BAC载体。在大肠杆菌中保持质粒需要数个特征,包括两种大肠杆菌复制起点:oriS和oriV。第一种复制起点oriS来自低拷贝F质粒,可用于基于BAC的大片段DNA克隆和文库构建。第二种复制起点oriV是诱导型高拷贝复制起点oriV,其在含有TrfA基因的大肠杆菌(当其在含阿拉伯糖培养基上生长)中生长、在阿拉伯糖启动子控制下时,其可以产生更高产量的大插入片段。pFACint携带卡那霉素抗性基因(kan)作为选择标记基因。为克隆目的,质粒含有大的DNA克隆位点,其包含彼此相邻方向相反的一对BstXI位点。当用BstXI消化时,该配置产生一对相同的BstXI突出端,其不自身互补,而是与独特的BstXI接头互补。因此,消化的载体不会自身连接,接头也不会轻易连接。将两种I-SceI归巢限制性位点以相反方向插入BstXI克隆位点的侧翼。这些位点利于清除克隆的大DNA片段,并与pFAC克隆载体交换。I-Sce-I归巢限制性位点还有助于从异源宿主构巢曲霉的的基因组整合位点清除大的完整的SM基因途径。
pFACint还包含将质粒整合到构巢曲霉基因组中的特征:1,000bp的3'trpC(SEQID NO:12)和1,007bp的5'-tpC(SEQ ID NO:13)同源序列,其以相同方向插入I-Sce I限制性位点侧翼,从而使得大的pFACint克隆真菌位点特异性整合到构巢曲霉trpC基因中,其编码与聚酮化合物同源的多肽。该质粒还含有真菌选择标记基因,即乳清苷-5'-磷酸脱羧酶基因(pyrG,来自寄生曲霉)。
实施例3
本实施例描述pFACdual载体。
pFACdual质粒,其基本上与pFAC质粒相对应,除了它包括另外的基因盒:attP位点和真菌密码子优化的phi31整合酶基因,其在真菌诱导型启动子如alcA(p)的控制下。因此,大片段DNA pFACdual克隆通常保持为FAC,并且还可以在需要时整合到真菌基因组的attB位点。
pFACdual载体是真菌双功能载体(pFACdual,图1C,SEQ ID NO:14),且可作为真菌人工染色体和诱导型真菌基因组整合载体,或者可用作大肠杆菌-构巢曲霉穿梭BAC载体。pFACdual具有与pFAC相似的特征(参见实施例1),但是pFAC dual具有另外的基因盒:attP位点和真菌密码子优化的phi31整合酶基因(SEQ ID NO:16和SEQ ID NO:17),其受诱导型alcA真菌启动子(alcA(p),SEQ ID NO:15)的控制。因此,大片段DNA pFACdual克隆通常保持为FAC,但可以诱导整合入真菌基因组的attB位点。
实施例4
本实施例示出了高分子量A.wentii DNA的制备。
温特曲霉菌株DTO 134E9用于概念证明。比较不同的真菌种类/菌株起始材料,以测试高分子量(HMW)基因组DNA的质量:孢子、发芽孢子、原生质体或从原生质体获得的胞核。原生质体制备方法如前所述(Bok,J.W.and Keller,N.P.,Eukaryot.Cell,2004,3:527-535)。为了分离胞核,用HMW DNA制备缓冲液(0.5M蔗糖、80mM KCl、10mM Tris、10mM EDTA、1mM亚精胺、1mM精胺、pH9.4)中的0.5%Triton X-100裂解原生质体。原生质体在缓冲液中轻轻混合,在冰上孵育30分钟,并以1,800×g离心20分钟沉淀得到细胞核。为了制备HMWDNA的低熔点琼脂糖胶塞,将胞核的沉淀(~5×108)、原生质体、发芽孢子或孢子用HMW DNA制备缓冲液重悬至总体积为0.6mL,然后在45℃时向所述缓冲液中加入等体积1%低熔点琼脂糖至总体积为1.2mL。这在4℃固化后足以制成10个胶塞(每个胶塞约100μL)。然后将胶塞在1mL裂解缓冲液/胶塞:0.5M EDTA、pH 9.0,1%月桂基肌氨酸、1mg/mL蛋白酶K中,在50℃孵育48小时。最后,将胶塞在10-20体积的下述缓冲液中彻底洗涤,每次洗涤1小时:缓冲液1(0.5M EDTA、pH 9.0-9.3,50℃)洗涤1次,缓冲液2(0.05M EDTA、pH8.0,冰上)洗涤1次,用缓冲液3(冰冷TE加0.1mM苯甲基磺酰氟(PMSF),冰上)洗涤3次,用缓冲液4(冰冷的TE,冰上)洗涤3次,最后将所有胶塞在4℃储存于TE中。为了估计提取的DNA的大小和产量,使用脉冲场凝胶电泳(PFGE)(Bio-Rad CHEF Mapper,Hercules,CA)评估胶塞。HMW基因组DNA的最终质量检查条件为6V/cm,10秒至1分钟的切换时间,在14℃下PFGE进行12-16小时,同时使用适当的HMW尺寸标记物(Zhang,M.et al.,Nat.Protoc.,2012,7,467-478)。从原生质体制剂获得最高质量和数量的HMW基因组DNA(图2A)。图2A示出了包含大于50 kb但主要是Mb大小的DNA片段的A.wentii HMW基因组DNA的CHEF凝胶。
实施例5
本实施例示出A.goii DNA的非偏倚穿梭BAC文库的构建。
从实施例2的原生质体制剂获得的HMW基因组DNA范围为50~>1,000kb(主要是Mb大小的片段)。使用DNA末端修复酶试剂盒(Intact Genomics)对来自3个胶塞的HMW DNA进行末端修复,总体积为500μL,含10μL末端修复酶,然后将所述末端修复酶加热失活(70℃,15分钟)。将得到的DNA用BstXI接头(每个100μM,10μL),10μL连接酶(2U/μL,完整基因组)进行连接,总体积为700μL。将100至200kb的凝胶分级的DNA片段通过PFGE纯化。将纯化的大DNA片段(约100μL,1-3ng/μL)在16℃下连接进入适于克隆的BAC BstXI穿梭载体(pFAC),历时约18小时。然后,将连接的DNA混合物电穿孔到电穿孔感受态大肠杆菌细胞(BAC细胞,Intact Genomics)。使用小规模连接和转化(每20μL细胞1μL DNA)来判断克隆效率。确定大约50个BAC克隆的插入片段大小,并使用CHEF凝胶电泳和NotI消化随机选择的pFAC载体中的BAC克隆,证实其包括约100kb的插入片段。图2B显示平均插入尺寸估计为~100kb(M,λ梯度标记物)。一旦确定了连接的DNA适用,即进行大规模的连接和转化,以获得至少7680个菌落用于菌落挑选(20×384孔板)以构建非偏倚穿梭BAC文库。
实施例6
本实施例示出BAC/FAC末端测序,并选择含SM簇的候选FAC克隆。
通过Sanger BigDye测序方法完成了来自温特曲霉的非偏倚随机剪切FAC文库中1536个克隆的BAC末端测序。Phred软件用于碱基读取和序列修整。使用DNAStar SeqManPro软件包进行载体屏蔽。通过BLAST组装基因组(NCBI)将BAC末端序列与A.wentii参考基因组序列比对。基于位于SM簇一个末端的侧翼的FAC末端序列,和位于相同SM簇另一末端的侧翼的另一FAC末端序列,成功鉴定了全部47个含SM簇的候选FAC克隆。
实施例7
本实施例示出构建温特曲霉DNA的非偏倚穿梭BAC文库及在构巢曲霉中异源表达SM簇作为FAC。
温特曲霉用作穿梭BAC DNA文库构建的实例,并且其具有完整测序的、含有47个注释的SM基因簇的基因组(Cerqueira,G.C.,et al.,Nucleic Acids Res.,2013,42(Database issue),D705-D710)。高分子量基因组DNA从A.wentii制备(见实施例4),并且非偏倚FAC文库(见实施例5)的构建导致温特曲霉基因组的~20×基因组覆盖,或总共7,680个FAC克隆,平均插入片段大小为100kb(图2A-B)。将FAC文库排列到384孔板中,对1536个FAC克隆的两端进行测序。使用这些末端序列与温特曲霉参考基因组的序列比对来鉴定含有所有47个SM基因簇的SM-BAC克隆或候选FAC(表1)。此外,A.terreus中56个SM簇中的至少10个位于端粒附近,且一些端粒序列在整个基因组序列数据库中仍然不完整。这些数据表明,这些方法通过将随机剪切的基因组DNA引入FAC载体中成功地克服了常规BAC文库构建中对端粒序列的潜在偏倚。
实施例8
本实施例示出了FAC的穿梭功能的验证。
迄今为止,数百种FAC(范围从70到150kb)用于通过转化进入构巢曲霉进行异源表达和分析。为了验证FAC的穿梭功能,我们还从转化的构巢曲霉菌株中提取了15个FAC DNA中的5个,并将FAC DNA成功转化回大肠杆菌(图3)。如通过在不含尿嘧啶和尿苷的培养基上自养型回归(return of prototropy)所测定的,用不同的FAC克隆转化构巢曲霉。然后从FAC的回收评估了40或更多的大肠杆菌菌落,分别见图3A-C。结果示出了从所有3种构巢曲霉转化体的FA C回收的实例,所述转化体分别为:AtFAC9O3(~100kb)、AtFAC9A23(~80kb)和AtFAC7A10(~90kb)。凝胶左侧的第二和第三(D)泳道是用于转化构巢曲霉的对照FAC。所有回收的FAC用NotI消化,没有观察到显著的大突变。M,λ梯度标记物。这第一次证明了AMA1在支持至少150kb的大片段DNA构建体在构巢曲霉中的自主复制(FAC)的能力。本发明人及其合作者第一次证明FAC系统可在构巢曲霉中染色体外复制至少150kb(Bok,J.W.,etal.BMC Genomics,2015,16,343)。
实施例9
本实施例示出了LC-HRMS连接的FAC SM发现。
为通过FAC进行SM化合物的初始鉴别和结构鉴定,按照方法部分所述制备构巢曲霉AtFAC9D19菌株样品。已发现构巢曲霉AtFAC9D19可产生杀虫剂化合物:alantrypinone、serantrypinone、alantrypinene B、alantryleunone。构巢曲霉AtFAC6J7菌株也被选择用于初步概念验证实验,因为它含有与烟曲霉菌中最近表征的hexadehydroastechrome簇高度同源的簇(Yin,W.B.,et al.,ACS Synth.Biol.,2013,2,629-634)。AtFAC6J7包含在相应的烟曲霉菌簇中发现的8个基因中的7个。不存在于土曲霉菌簇中的基因hasG,编码FAD结合蛋白,负责将异戊烯基转化为甲基丁二烯基侧链以由astechrome产生hexadehydroastechrome。通过LC-HRMS测定构巢曲霉AtFAC6J7转化体和对照构巢曲霉的有机提取物,鉴定AtFAC6J7代谢物。数据采集后,采用Sieve软件进行组分检测和相对定量分析(见方法)。比较AtFAC6J7提取物与对照样品提取物(野生型及其他FAC菌株)时,仅存在于AtFAC6J7提取物中的化合物经精确质谱(0.3百万分率误差)和串联质谱法(MS/MS或MS2)鉴定为terezine D。terezine D是astechrome生物合成的稳定中间体(Watanabe,T.,et al.,Bioorg.Med.Chem.,2009,17,94-111;Bok,J.W.,et al.BMC Genomics,2015,16,343)。
实施例10
本实施例示出了针对FAC克隆的抗生素活性测试。
进行14个FAC克隆的抗生素活性测试。由在GMM板上37℃培养7天的FAC转化体中提取的150μl甲醇提取物中的10μl装载在小盘(直径:1cm)上,用于对曲霉属spp.、白色念珠菌(Candida albicans)、蜡样芽孢杆菌(Bacillus cereus)、滕黄微球菌(Micrococcusluteus)和绿脓假单胞菌(Pseudomonas aeruginosa)的抗菌活性测试。使用两种FAC提取物观察对蜡样芽孢杆菌的抗生素活性(Bok,J.W.,et al.BMC Genomics,2015,16,343)。
实施例11
本实施例说明FAC重组工程和活化沉默SM基因簇。
Red/ET 工具用于阐明来自土曲霉FAC AtFAC9J20的苯并锦葵色素苷(benzomalvin)的生物合成。使用NIH BAC重组工程工具和Red/ET同源重组,从FAC克隆AtFAC9J20(102.715kb)产生两个较小尺寸的构建体(33.372kb AtFAC9J20Δ#1和68.988kbAtFAC9J20Δ#2)。我们还删除了苯并锦葵色素苷簇中的5个基因(AtFAC9J20ΔMtase、AtFAC9J20ΔNRPS1、AtFAC9J20ΔNRPS2、AtFAC9J20ΔNRPS3和AtFAC9J20ΔPKS),以获得另外的5个FAC突变构建体,其有助于有效和高效地精确地阐明苯并锦葵色素苷的生物合成途径。
为激活FAC AtFAC7O19中低表达的SM基因簇,我们成功地将真菌强启动子gpdAp插入到该簇中的转录因子(TF)基因起始密码子“ATG”之前。FAC重组工程分两步进行。本发明人插入galK基因并在加氯霉素和半乳糖的基本培养基上选择Gal+菌落放,然后通过在含氯霉素、2-脱氧半乳糖和甘油的基本培养基上反向筛选galK-菌落以用gpdA启动子替换galK。8项试验中有8项产生了FAC突变构建体。
进行融合PCR(图4A)以将选择标记(例如KanR或galK基因)和启动子(gpdA(p)或任意遗传元件)组合为一个PCR产物用于FAC重组工程。将强真菌启动子gpdAp插入到具有卡那霉素抗性基因的FAC AtFAC7O19中SM簇基因中的ATG起始密码子之前。融合PCR反应示例于图4A(H1和H2,分别为同源序列1和2;cat,氯霉素乙酰转移酶基因;FAC,复制起点)。为了构建Kan基因和gpdA启动子的融合PCR产物,使用的引物是:38TF-Kan-左末端F(5’-TGGGACTTTGTCGCTCACGATTCGCCGAGTTGTATGGGCTGACCAGTGACcgacctgcagcctgttga-3’,SEQID NO:1)和Kan-左末端R(5’-GGTGCCCCAAGCCTTGGATCCGTCGAGGCTGATCAGCGAgctc-3’,SEQID NO:2);gpdA-右末端F(5’-TCGCTGATCAGCCTCGACGGATCCAAGGCTTGGGGCACCtgcgtt-3’,SEQID NO:3)和38TF-gpdA-右末端R(5’-TCCTCATGAATTAGATGGTTAGATGGACCTACCATCAGGATAGGTTCC ATtgtgatgtctgctcaagcggg-3’,SEQ ID NO:4)。一步靶向事件的结果是通过在含有卡那霉素和氯霉素的LB培养基上选择将gpdAp相邻的组成型活性Kan抗性基因插入FAC上确定的位置,用于保持工程化FAC。插入kan-gpdAp选择盒后,通过PCR确认融合PCR插入然后进行7个克隆的FAC DNA的NotI限制性分析,如图4B中凝胶所示。第一条泳道是未经修饰的FAC AtFAC7O19DNA,其作为对照纳入。所有测试的克隆显示相同的模式,具有预期的插入,但在脉冲场凝胶上没有明显的突变。M,Lambda梯度标记物。细菌现有表型为Kan+。
使用修改的RED/ET工具进行重组的实例包括用galK选择盒分别缺失AtFAC9J20的5个基因。图5显示了来自4个克隆的FAC微量制备DNA的NotI限制性分析,每个克隆经PCR验证(M,λ梯度标记物)。第二到最后一个泳道包含未经修饰的AtFAC9J20DNA,其作为对照纳入。AtFAC9J20含有2个SM基因簇。5个基因,同一簇的全部成员,是1.239-kb Mtase(二甲基烯丙基色氨酸N-甲基转移酶)基因、3.334-kb NRPS1基因、7.284-kb NRPS2基因、7.815-kbNRPS3基因和7.741-kb PKS基因。每组4个测试克隆显示相同的模式,因此具有预期的缺失。通过PCR,测序或脉冲场凝胶检测,未检测到明显的突变。
所有工程化的FAC被成功转化进入构巢曲霉宿主菌株。最初,完整FAC AtFAC9J20的异源表达鉴定了一组甲基化NRPS产物,我们成功鉴定为属于苯并锦葵色素苷(苯并锦葵色素苷A和苯并锦葵色素苷E)家族。苯并锦葵色素苷A是具有肿瘤的免疫治疗潜能的吲哚胺2,3-双加氧酶(IDO)抑制剂。通过所述FAC重组工程,我们观察到基因缺失突变体AtFAC9J20ΔNRPS1和AtFAC9J20ΔNRPS2中NRPS产物的信号平行下降10,000倍,其支持这两个NRPS直接参与生物合成。我们还观察到我们的缺失突变体中预期的生物合成前体积累。此外,在AtFAC9J20ΔMtase中非甲基化中间体的积累证实了负责NRPS定制(tailoring)的甲基转移酶的鉴定。总之,我们使用FAC技术和FAC缺失体,已经建立了已知的NRPS的生物合成,这是本领域长期的难题。这些缺失体不仅使我们看到相应的基因产物的缺失,还可积累生物合成前体。
所有引用的参考文献以引用方式全文纳入本文。申请人保留质疑任何参考作者提交的任何结论的权利。
表1
覆盖完整SM基因簇/途径的经鉴别的FAC克隆
真菌名称 簇编号 FAC名称 FAC染色体定位 FAC大小(bp)
温特曲霉 1 402 2:748867-861001 112,134
温特曲霉 2 1K8 4:96694-210549 113,855
温特曲霉 3 2F10 10:572788-655030 82,242
温特曲霉 4 4E11 1:2038648-2143968 105,320
温特曲霉 5 4L5 2:1829642-1920197 90,555
温特曲霉 6 2P3 4:186740-312513 125,773
温特曲霉 7 4120 4:3165620-3255977 90,357
温特曲霉 8 4D17 5:2466262-2562334 96,072
温特曲霉 9 1H10 7:734062-839729 105,667
温特曲霉 10 4D8 7:2270034-2350260 80,226
温特曲霉 11 3M17 10:471140-562395 91,255
温特曲霉 12 3A1 1:4161567-4254009 92,442
温特曲霉 13 3D18 7:2189142-2288310 99,168
温特曲霉 14 1C3 10:204841-294656 89,815
温特曲霉 15 4A4 10:626528-706761 80,233
温特曲霉 16 4H21 3:3886941-3984632 97,691
温特曲霉 17 4H24 4:3696431-3796611 100,180
温特曲霉 18 4F11 6:735456-839076 103,620
温特曲霉 19 1H17 4:1-87455 87,454
温特曲霉 20 2K17 1:3915914-4008958 93,044
温特曲霉 21 2K14 2:47713-169410 121,697
温特曲霉 22 3D13 4:1296201-1397275 101,074
温特曲霉 23 3K2 6:2228078-2325930 97,852
温特曲霉 24 3C22 8:121247-230196 108,949
温特曲霉 25 3E24 8:318322-407365 89,043
温特曲霉 26 3L2 9:672348-770093 97,745
温特曲霉 27 3B4 9:1507369-1620289 112,920
温特曲霉 28 3022 5:115813-232664 116,851
温特曲霉 29 4J7 2:84403-199331 114,928
温特曲霉 30 2F2 2:2776606-2876645 100,039
温特曲霉 31 3D3 3:179174-288015 108,841
温特曲霉 32 1B1 8:2015243-2105484 90,241
温特曲霉 33 2B19 9:60968-155731 94,763
温特曲霉 34 105 1:4290614-4374135 83,521
温特曲霉 35 3B20 4:1742758-1828851 86,093
温特曲霉 36 3M15 5:2345788-2464884 119,096
温特曲霉 37 3L20 7:1356289-1462621 106,332
温特曲霉 38 4H11 7:1563096-1662018 98,922
温特曲霉 39 4F15 10:118366-207802 89,436
温特曲霉 40 3H22 1:2934184-3041025 106,841
温特曲霉 41 216 2:3977696-4074392 96,696
温特曲霉 42 4D13 6:1689604-1829952 140,348
温特曲霉 43 1J2 10:1-87900 87,899
温特曲霉 44 404 2:2094226-2208140 113,914
温特曲霉 45 2Al2 1:241509-348838 107,329
温特曲霉 46 2B23 5:4926109-5034905 108,796
温特曲霉 47 4C1 4:1016467-1115739 99,272
表1-续
覆盖完整SM基因簇/途径的经鉴别的FAC克隆
真菌名称 簇编号 FAC名称 FAC染色体定位 FAC大小(bp)
棘孢曲霉 1 4H17 13:812147-930096 117,949
棘孢曲霉 2 4L4 1:1329301-1443690 114,389
棘孢曲霉 3 5G11 11:918965-992874 73,909
棘孢曲霉 4 10A5 4:1981-104478 102,497
棘孢曲霉 5 1L24 3:256945-345686 88,741
棘孢曲霉 6 4E3 3:1876432-1983658 107,226
棘孢曲霉 7 2P8 4:870643-1011680 141,037
棘孢曲霉 8 6P3 5:1830781-1950997 120,216
棘孢曲霉 9 1K8 7:483343-596987 113,644
棘孢曲霉 10 1E6 7:45-101465 101,420
棘孢曲霉 11 2P10 8:211037-336059 125,022
棘孢曲霉 12 10C21 8:1429400-1530871 101,471
棘孢曲霉 13 2B9 9:86486-187588 101,102
棘孢曲霉 14 2L14 11:315430-417137 101,707
棘孢曲霉 15 4N8 11:404232-517227 112,995
棘孢曲霉 16 2M19 15:923337-1012873 89,536
棘孢曲霉 17 1M17 16:118922-222177 103,255
棘孢曲霉 18 2K16 19:402235-497393 95,158
棘孢曲霉 19 1J4 25:37-110883 110,846
棘孢曲霉 20
棘孢曲霉 21 1D8 1:78626-186378 107,752
棘孢曲霉 22 1D8 1:78626-186378 107,752
棘孢曲霉 23 2N5 1:934347-1052021 117,674
棘孢曲霉 24 6J24
棘孢曲霉 25 2P10 8:211037-336059 125,022
棘孢曲霉 26 4123 9:285640-376987 91,347
棘孢曲霉 27 1D4 9:1254796-1358882 104,086
棘孢曲霉 28 1121 11:392581-427849 35,268
棘孢曲霉 29 3G18 13:521503-647022 125,519
棘孢曲霉 30 6A16 16:18608-112106 93,498
棘孢曲霉 31 4C19 23:290577-346496 55,919
棘孢曲霉 32 8A16 1:2370038-2483583 113,545
棘孢曲霉 33 4B9 3:31787-134936 103,149
棘孢曲霉 34 10A5 4:1981-104478 102,497
棘孢曲霉 35 10D7 5:13457-135109 121,652
棘孢曲霉 36 1N19 5:540506-653619 113,113
|棘孢曲霉 37 4N5 11:505585-601756 96,171
棘孢曲霉 38 1N17 17:406544-496393 89,849
棘孢曲霉 39 1L21 18:355848-455803 99,955
棘孢曲霉 40 3D12 22:235518-338083 102,565
棘孢曲霉 41 2P8 4:870643-1011680 141,037
棘孢曲霉 42 2H16 7:245753-358860 113,107
棘孢曲霉 43 4G24 8:825803-930042 104,239
棘孢曲霉 44 4N10 8:1046616-1187326 140,710
棘孢曲霉 45 1A6 11:815776-909693 93,917
棘孢曲霉 46 4P15 15:828019-921729 93,710
棘孢曲霉 47
表1-续
覆盖完整SM基因簇/途径的经鉴别的FAC克隆
表1-续
覆盖完整SM基因簇/途径的经鉴别的FAC克隆
表1-续
覆盖完整SM基因簇/途径的经鉴别的FAC克隆
真菌名称 簇编号 FAC名称 FAC染色体定位 FAC大小(bp)
扩展青霉 1 1C1 2:312817-450926 138,109
扩展青霉 2
扩展青霉 3
扩展青霉 4 118 4:1247013-1372677 125,664
扩展青霉 5 3F5 1:1428409-1585340 156,931
扩展青霉 6
扩展青霉 7 1E10 6:2472012-2613808 141,796
扩展青霉 8 3H13 1:91057-206469 115,412
扩展青霉 9 1M17 2:2757993-2859810 101,817
扩展青霉 10
扩展青霉 11 4J16 3:5156008-5276692 120,684
扩展青霉 12 1F14 1:2595162-2676961 81,799
扩展青霉 13 4L5 3:2479260-2593440 114,180
扩展青霉 14 1120 5:2892354-2942520 50,166
扩展青霉 15 1D1 7:1213497-1276116 62,619
扩展青霉 16 1A5 7:1772082-1843010 70,928
扩展青霉 17 3M24 1:3415171-3497903 82,732
扩展青霉 18 4K17 1:5004361-5150993 146,632
扩展青霉 19 1C22 2:439256-579636 140,380
扩展青霉 20 3L8 2:568926-619210 50,284
扩展青霉 21 1113 2:1939195-2068600 129,405
扩展青霉 22 3E9 2:2550509-2673774 123,265
扩展青霉 23 3L12 2:4051128-4199147 148,019
扩展青霉 24 1D10 2:4697659-4828152 130,493
扩展青霉 25 1C20 3:1422179-1537964 115,785
扩展青霉 26 1F1 4:2105296-2219587 114,291
扩展青霉 27 3K18 4:2396436-2517370 120,934
扩展青霉 28
扩展青霉 29 4B6 4:4151706-4258120 106,414
扩展青霉 30 1H7 5:724830-858181 133,351
扩展青霉 31 3D20 5:2516815-2595970 79,155
扩展青霉 32 1H19 5:3059991-3198248 138,257
扩展青霉 33 4F11 6:680725-789653 108,928
扩展青霉 34 4C4 6:2985678-3103152 117,474
扩展青霉 35 1J1 7:1033873-1087766 53,893
扩展青霉 36 1B3 7:1609591-1770767 161,176
扩展青霉 37 1F15 2:3978538-4117151 138,613
扩展青霉 38 2M3
扩展青霉 39 4N19 151:25308
扩展青霉 40 1D4 2:165990-301959 135,969
扩展青霉 41 1M17 2:2757993-2859810 101,817
扩展青霉 42 1L13 1:308889-439300 130,411
扩展青霉 43 307 1:5834693-5974698 140,005
扩展青霉 44 1L7 1:5930187-6058354 128,167
扩展青霉 45
扩展青霉 46 3024 232:16292
表1-续
覆盖完整SM基因簇/途径的经鉴别的FAC克隆
表2
SEQUENCE LISTING
<110> Intact Genomics
<120> 真菌人工染色体、组成、方法和用途
FUNGAL ARTIFICIAL CHROMOSOMES, COMPOSITIONS, METHODS AND USES
THERFOR
<130> 1045-0749
<150> 62/286,542
<151> 2016-01-25
<160> 17
<170> PatentIn版本3.5
<210> 1
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 扩增引物
<400> 1
tgggactttg tcgctcacga ttcgccgagt tgtatgggct gaccagtgac cgacctgcag 60
cctgttga 68
<210> 2
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 扩增引物
<400> 2
ggtgccccaa gccttggatc cgtcgaggct gatcagcgag ctc 43
<210> 3
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 扩增引物
<400> 3
tcgctgatca gcctcgacgg atccaaggct tggggcacct gcgtt 45
<210> 4
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 扩增引物
<400> 4
tcctcatgaa ttagatggtt agatggacct accatcagga taggttccat tgtgatgtct 60
gctcaagcgg g 71
<210> 5
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 接头
<400> 5
ctggaaag 8
<210> 6
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 接头
<400> 6
ctttccagca ca 12
<210> 7
<211> 15684
<212> DNA
<213> 人工序列
<220>
<223> 载体
<400> 7
ccaccacagt gggatccgaa gcttggaatt cacgtgactt gaagtcatta ccctgttatc 60
cctagcggcc gcactgaccc tatagtgagt cgtattaatt taaatcatac caacatggtc 120
aaataaaacg aaaggctcag tcgaaagact ggccgcccag cttatttttt gtatactgtt 180
ttgtgatagc acgaagtttt tccacggtat cttgttaaaa atatatattt gtggcgggct 240
tacctacatc aaattaataa gagactaatt ataaactaaa cacacaagca agctacttta 300
gggtaaaagt ttataaatgc ttttgacgta taaacgttgc ttgtatttat tattacaatt 360
aaaggtggat agaaaaccta gagactagtt agaaactaat ctcaggtttg cgttaaacta 420
aatcagagcc cgagaggtta acagaaccta gaaggggact agatatccgg gtagggaaac 480
aaaaaaaaaa aacaagacag ccacatatta gggagactag ttagaagcta gttccaggac 540
taggaaaata aaagacaatg ataccacagt ctagttgaca actagataga ttctagattg 600
aggccaaagt ctctgagatc caggttagtt gcaactaata ctagttagta tctagtctcc 660
tataactctg aagctagaat aacttactac tattatcctc accactgttc agctgcgcaa 720
acggagtgat tgcaaggtgt tcagagacta gttattgact agtcagtgac tagcaataac 780
taacaaggta ttaacctacc atgtctgcca tcaccctgca cttcctcggg ctcagcagcc 840
ttttcctcct cattttcatg ctcattttcc ttgtttaaga ctgtgactag tcaaagacta 900
gtccagaacc acaaaggaga aatgtcttac cactttcttc attgcttgtc tcttttgcat 960
tatccatgtc tgcaactagt tagagtctag ttagtgacta gtccgacgag gacttgcttg 1020
tctccggatt gttggaggaa ctctccaggg cctcaagatc cacaacagag ccttctagaa 1080
gactggtcaa taactagttg gtctttgtct gagtctgact tacgaggttg catactcgct 1140
ccctttgcct cgtcaatcga tgagaaaaag cgccaaaact cgcaatatgg ctttgaacca 1200
cacggtgctg agactagtta gaatctagtc ccaaactagc ttggatagct tacctttgcc 1260
ctttgcgttg cgacaggtct tgcagggtat ggttcctttc tcaccagctg atttagctgc 1320
cttgctaccc tcacggcgga tctgcataaa gagtggctag aggttataaa ttagcactga 1380
tcctaggtac ggggctgaat gtaacttgcc tttcctttct catcgcgcgg caagacaggc 1440
ttgctcaaat tcctaccagt cacaggggta tgcacggcgt acggaccact tgaactagtc 1500
acagattagt tagcaactag tctgcattga atggctgtac ttacgggccc tcgccattgt 1560
cctgatcatt tccagcttca ccctcgttgc tgcaaagtag ttagtgacta gtcaaggact 1620
agttgaaatg ggagaagaaa ctcacgaatt ctcgacaccc ttagtattgt ggtccttgga 1680
cttggtgctg ctatatatta gctaatacac tagttagact cacagaaact tacgcagctc 1740
gcttgcgctt cttggtagga gtcggggttg ggagaacagt gccttcaaac aagccttcat 1800
accatgctac ttgactagtc agggactagt caccaagtaa tctagatagg acttgccttt 1860
ggcctccatc agttccttca tagtgggagg tccattgtgc aatgtaaact ccatgccgtg 1920
ggagttcttg tccttcaagt gcttgaccaa tatgtttctg ttggcagagg gaacctgtca 1980
actagttaat aactagtcag aaactagtat agcagtagac tcactgtacg cttgaggcat 2040
cccttcactc ggcagtagac ttcatatgga tggatatcag gcacgccatt gtcgtcctgt 2100
ggactagtca gtaactaggc ttaaagctag tcgggtcggc ttactatctt gaaatccggc 2160
agcgtaagct ccccgtcctt aactgcctcg agatagtgac agtactctgg ggactttcgg 2220
agatcgttat cgcgaatgct cggcatacta atcgttgact agtcttggac tagtcccgag 2280
caaaaaggat tggaggagga ggaggaaggt gagagtgaga caaagagcga aataagagct 2340
tcaaaggcta tctctaagca gtatgaaggt taagtatcta gttcttgact agatttaaaa 2400
gagatttcga ctagttatgt acctggagtt tggatatagg aatgtgttgt ggtaacgaaa 2460
tgtaaggggg aggaaagaaa aagtcggtca agaggtaact ctaagtcggc cattcctttt 2520
tgggaggcgc taaccataaa cggcatggtc gacttagagt tagctcaggg aatttaggga 2580
gttatctgcg accaccgagg aacggcggaa tgccaaagaa tcccgatgga gctctagctg 2640
gcggttgaca accccacctt ttggcgtttc tgcggcgttg caggcgggac tggatacttc 2700
gtagaaccag aaaggcaagg cagaacgcgc tcagcaagag tgttggaagt gatagcatga 2760
tgtgccttgt taactaggtc aaaatctgca ggtatgcttg atgttatcca aagtgtgaga 2820
gaggaaggtc caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga 2880
acgcatgtga gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg 2940
ttagtacccc aatggaaagc ctgagagtcc agtggtcgca gataactccc taaattccct 3000
gagctaactc taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg 3060
acttagagtt acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa 3120
cacattccta tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc 3180
aagaactaga tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc 3240
tctttgtctc actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc 3300
aagactagtc aacgattagt atgccgagca ttcgcgataa cgatctccga aagtccccag 3360
agtactgtca ctatctcgag gcagttaagg acggggagct tacgctgccg gatttcaaga 3420
tagtaagccg acccgactag ctttaagcct agttactgac tagtccacag gacgacaatg 3480
gcgtgcctga tatccatcca tatgaagtct actgccgagt gaagggatgc ctcaagcgta 3540
cagtgagtct actgctatac tagtttctga ctagttatta actagttgac aggttccctc 3600
tgccaacaga aacatattgg tcaagcactt gaaggacaag aactcccacg gcatggagtt 3660
tacattgcac aatggacctc ccactatgaa ggaactgatg gaggccaaag gcaagtccta 3720
tctagattac ttggtgacta gtccctgact agtcaagtag catggtatga aggcttgttt 3780
gaaggcactg ttctcccaac cccgactcct accaagaagc gcaagcgagc tgcgtaagtt 3840
tctgtgagtc taactagtgt attagctaat atatagcagc accaagtcca aggaccacaa 3900
tactaagggt gtcgagaatt cgtgagtttc ttctcccatt tcaactagtc cttgactagt 3960
cactaactac tttgcagcaa cgagggtgaa gctggaaatg atcaggacaa tggcgagggc 4020
ccgtaagtac agccattcaa tgcagactag ttgctaacta atctgtgact agttcaagtg 4080
gtccgtacgc cgtgcatacc cctgtgactg gtaggaattt gagcaagcct gtcttgccgc 4140
gcgatgagaa aggaaaggca agttacattc agccccgtac ctaggatcag tgctaattta 4200
taacctctag ccactcttta tgcagatccg ccgtgagggt agcaaggcag ctaaatcagc 4260
tggtgagaaa ggaaccatac cctgcaagac ctgtcgcaac gcaaagggca aaggtaagct 4320
atccaagcta gtttgggact agattctaac tagtctcagc accgtgtggt tcaaagccat 4380
attgcgagtt ttggcgcttt ttctcatcga ttgacgaggc aaagggagcg agtatgcaac 4440
ctcgtaagtc agactcagac aaagaccaac tagttattga ccagtcttct agaaggctct 4500
gttgtggatc ttgaggccct ggagagttcc tccaacaatc cggagacaag caagtcctcg 4560
tcggactagt cactaactag actctaacta gttgcagaca tggataatgc aaaagagaca 4620
agcaatgaag aaagtggtaa gacatttctc ctttgtggtt ctggactagt ctttgactag 4680
tcacagtctt aaacaaggaa aatgagcatg aaaatgagga ggaaaaggct gctgagcccg 4740
aggaagtgca gggtgatggc agacatggta ggttaatacc ttgttagtta ttgctagtca 4800
ctgactagtc aataactagt ctctgaacac cttgcaatca ctccgtttgc gcagctgaac 4860
agtggtgagg ataatagtag taagttattc tagcttcaga gttataggag actagatact 4920
aactagtatt agttgcaact aacctggatc tcagagactt tggcctcaat ctagaatcta 4980
tctagttgtc aactagactg tggtatcatt gtcttttatt ttcctagtcc tggaactagc 5040
ttctaactag tctccctaat atgtggctgt cttgtttttt ttttttgttt ccctacccgg 5100
atatctagtc cccttctagg ttctgttaac ctctcgggct ctgatttagt ttaacgcaaa 5160
cctgagatta gtttctaact agtctctagg ttttctatcc acctttaatt gtaataataa 5220
atacaagcaa cgtttatacg tcaaaagcat ttataaactt ttaccctaaa gtagcttgct 5280
tgtgtgttta gtttataatt agtctcttat taatttgatg taggtaagcc cgccacaaat 5340
atatattttt aacaagatac cgtggaaaaa cttcgtgcta tcacaaaaca gtatacaaaa 5400
aataagctga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat agtggctcca 5460
agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc tccgagaacg 5520
ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata gtgactggcg 5580
atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat aaccaagcct 5640
atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt gttagatttc 5700
atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca ttaaagcttc 5760
gacatcaccc ttacccaaac tatatccaat gagcaaagaa taacgagtca aagcgggcgc 5820
atttttcatc acatacgagt atgcacagtc aggactccac gtcatacatc aaaaacttgg 5880
aacgcatgag tctagctcag ctcggctctt ttccgatttt tgcgcagctt ctgttgcgga 5940
tcttgctgct tgtggagtct atgccccggc tgatgcattg aaacacaacg cgcagatgat 6000
ccaatcatac caaccagacg catcagcgcg tgtagctggg ggaagggtag gtggtgtagc 6060
ccagaaagcg acacggctgg ctttcaagaa gtttatcaac cctagacagc tttggagcgg 6120
atacccggct cttgtggcgc atagcttgcc agtgtcggcg atacagatgc ctctgtacga 6180
gacttttcgg tatcgaattt ctgaatatag attcggagat cgagagaagg tgctagaaag 6240
atcaagagat tatggaaaag aaacaggccc attcgacaat cggagaggct gcagcgacag 6300
ccgcgataag tgctgcagcc tcgggcggta tagccagtgt cttgacagca cccatggata 6360
tagtccggac acgaatcatg ctcgatgctg cagacacaac cgcacctcag aagaaaagga 6420
tgatcaatac cgtacgggag attatacgaa cagatggccc gagaggacta ttccgagggt 6480
gtgctatcaa cacgtttatg gccgctgtcg gatcagggtt atactttggt ctctacgaaa 6540
gcaccaaatg gtggctaggc tcggactcga tggataatag tgccatgtta gagtaagggg 6600
tgatgggaaa tcttgtatat aattgtgatt gtttgtacga tagtggccga ctgtacatta 6660
gtgatacccc actcttagaa aatagaccaa tctccagctg caccttcaga caatccgggt 6720
aaaaattctc gtctatgttg gagattggtg tgattttgaa acatgaccct tgactctgat 6780
cttgaatatg tccatatctc gaggcaggca tattattcat atagagaggg tatcccttag 6840
catcggtctg tcgtagtatc cgactgctga atttatgaat cgcatcatac ttgcgacata 6900
ctgccataaa aagagtacgt atccaccact acttattgcg caccaacacg cttcaggtat 6960
gcatcccatc cctctttctg gtaccgcttc gccgcctcca cgggatcagg agcagcataa 7020
attccacgac cagcaatgat aaagtcggca ccgcgtccaa cagcagattc aggagtctgg 7080
tattgctgtc ccagcttgtc tcccttcgag gagaggttga cacctgtcgt gaacacgacg 7140
aaatcctcct cctccgaagg agagctaact tcagactgaa cctcgcccag gtgacgcgtc 7200
gagacgaatc ccatcacaaa cttcttatac ttccgagcat agtcaacaga agaagtagta 7260
tattgaccgg tagccaaaga tcccttggat gtcatctccg caaggatcaa aaggcccctc 7320
tcagagccgt agggaaagtc ctcggccgaa gcagtctggg ctagagcctc gacgataccc 7380
tcaccgggca gaatactgca gttgatgatg tgggcccact cggagatgcg cagagtgccg 7440
ccatggtact gcttttggac tgtgtttccg atatcgatga acttgcgatc ttcgaagatg 7500
aggaaattgt gcttctctgc aagggccttc agaccggtga tggtctcttc gctgaaatcg 7560
gagaggatat cgatgtgagt tttgatcacg gcaatgtacg gaccgagtcc tgttaaataa 7620
tccaccatta accattatta gatcattatg taagtggcat ccccggtgcg catacggtca 7680
gccaaatcca gcagctcttt ggtggttgtc acgtcggccg aaacggtgac attggttttc 7740
ttggcctcgg caacctcaaa gagcttcttt acgagggcat tggggtgctt gctagcgcgt 7800
gcactgtagg tcaattgcga cttggaagac atgttggcga tggaggggta gcgcggggtt 7860
ctgcaactat cgtagaaatg agcacttagt ggttgaaacc ggcttattca gtagattaat 7920
acttgaagtt tttagtaatc agacagaata atcaggatgt ccaattacta cctcttaata 7980
tgtggaatga atgatagata taaattgtac gacaattgcc gcgaaaaatt aaaatggatc 8040
tatggagggg acagtcatgc actagccaca cgttcctccg cctgtggggt gagccacatg 8100
cctcatctgg accaaacaca tcgatgcagt cacatgcaga taagattagg gcctatcctt 8160
agggtacctg tccgcgcggg gattatgcct ggctttttgc ctgcttttga tatcctttca 8220
aggacatagc gataagtcca accttatcgg ccataataat gtcaatgcca gcagcggctt 8280
gggcctagaa tattccatca gctactgaac aacttctaca tcacaatttg aaagctctaa 8340
gaattaatat agaagcactt accttcgcat tttctggtat attgttctga gatccatagg 8400
atcagcttat cgatgataag ctgtcaaaca tgagaattcg ggccgtcgac caattctcat 8460
gtttgacagc ttatcatcga atttctgcca ttcatccgct tattatcact tattcaggcg 8520
tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc 8580
cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa gccatcacaa 8640
acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat 8700
ttgcccatgg tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa 8760
ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta 8820
gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac 8880
tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg 8940
aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc 9000
atacgtaatt ccagatgtaa attcatcatc aggcgggcaa gaatgtgaat aaaggccgga 9060
taaaacttgt gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg 9120
gtctggttat aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc 9180
cattgggata tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta 9240
gctcctgaaa atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg 9300
tgaaagttgg aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag 9360
ggcttcccgg tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc 9420
acaggtattt attcgcgata agctcatgga gcggcgtaac cgtcgcacag gaaggacaga 9480
gaaagcgcgg atctgggaag tgacggacag aacggtcagg acctggattg gggaggcggt 9540
tgccgccgct gctgctgacg gtgtgacgtt ctctgttccg gtcacaccac atacgttccg 9600
ccattcctat gcgatgcaca tgctgtatgc cggtataccg ctgaaagttc tgcaaagcct 9660
gatgggacat aagtccatca gttcaacgga agtctacacg aaggtttttg cgctggatgt 9720
ggctgcccgg caccgggtgc agtttgcgat gccggagtct gatgcggttg cgatgctgaa 9780
acaattatcc tgagaataaa tgccttggcc tttatatgga aatgtggaac tgagtggata 9840
tgctgttttt gtctgttaaa cagagaagct ggctgttatc cactgagaag cgaacgaaac 9900
agtcgggaaa atctcccatt atcgtagaga tccgcattat taatctcagg agcctgtgta 9960
gcgtttatag gaagtagtgt tctgtcatga tgcctgcaag cggtaacgaa aacgatttga 10020
atatgccttc aggaacaata gaaatcttcg tgcggtgtta cgttgaagtg gagcggatta 10080
tgtcagcaat ggacagaaca acctaatgaa cacagaacca tgatgtggtc tgtcctttta 10140
cagccagtag tgctcgccgc agtcgagcga cagggcgaag cccctggttg ccctcgccgc 10200
tgggctggcg gccgtctatg gccctgcaaa cgcgccagaa acgccgtcga agccgtgtgc 10260
gagacaccgc ggccggccgc cggcgttgtg gatacctcgc ggaaaacttg gccctcactg 10320
acagatgagg ggcggacgtt gacacttgag gggccgactc acccggcgcg gcgttgacag 10380
atgaggggca ggctcgattt cggccggcga cgtggagctg gccagcctcg caaatcggcg 10440
aaaacgcctg attttacgcg agtttcccac agatgatgtg gacaagcctg gggataagtg 10500
ccctgcggta ttgacacttg aggggcgcga ctactgacag atgaggggcg cgatccttga 10560
cacttgaggg gcagagtgct gacagatgag gggcgcacct attgacattt gaggggctgt 10620
ccacaggcag aaaatccagc atttgcaagg gtttccgccc gtttttcggc caccgctaac 10680
ctgtctttta acctgctttt aaaccaatat ttataaacct tgtttttaac cagggctgcg 10740
ccctgtgcgc gtgaccgcgc acgccgaagg ggggtgcccc cccttctcga accctcccgg 10800
tcgagtgagc gaggaagcac cagggaacag cacttatata ttctgcttac acacgatgcc 10860
tgaaaaaact tcccttgggg ttatccactt atccacgggg atatttttat aattattttt 10920
tttatagttt ttagatcttc ttttttagag cgccttgtag gcctttatcc atgctggttc 10980
tagagaaggt gttgtgacaa attgcccttt cagtgtgaca aatcaccctc aaatgacagt 11040
cctgtctgtg acaaattgcc cttaaccctg tgacaaattg ccctcagaag aagctgtttt 11100
ttcacaaagt tatccctgct tattgactct tttttattta gtgtgacaat ctaaaaactt 11160
gtcacacttc acatggatct gtcatggcgg aaacagcggt tatcaatcac aagaaacgta 11220
aaaatagccc gcgaatcgtc cagtcaaacg acctcactga ggcggcatat agtctctccc 11280
gggatcaaaa acgtatgctg tatctgttcg ttgaccagat cagaaaatct gatggcaccc 11340
tacaggaaca tgacggtatc tgcgagatcc atgttgctaa atatgctgaa atattcggat 11400
tgacctctgc ggaagccagt aaggatatac ggcaggcatt gaagagtttc gcggggaagg 11460
aagtggtttt ttatcgccct gaagaggatg ccggcgatga aaaaggctat gaatcttttc 11520
cttggtttat caaacgtgcg cacagtccat ccagagggct ttacagtgta catatcaacc 11580
catatctcat tcccttcttt atcgggttac agaaccggtt tacgcagttt cggcttagtg 11640
aaacaaaaga aatcaccaat ccgtatgcca tgcgtttata cgaatccctg tgtcagtatc 11700
gtaagccgga tggctcaggc atcgtctctc tgaaaatcga ctggatcata gagcgttacc 11760
agctgcctca aagttaccag cgtatgcctg acttccgccg ccgcttcctg caggtctgtg 11820
ttaatgagat caacagcaga actccaatgc gcctctcata cattgagaaa aagaaaggcc 11880
gccagacgac tcatatcgta ttttccttcc gcgatatcac ttccatgacg acaggatagg 11940
ctagtgataa taagtgactg aggtatgtgc tcttcttatc tccttttgta gtgttgctct 12000
tattttaaac aactttgcgg ttttttgatg actttgcgat tttgttgttg ctttgcagta 12060
aattgcaaga tttaataaaa aaacgcaaag caatgattaa aggatgttca gaatgaaact 12120
catggaaaca cttaaccagt gcataaacgc tggtcatgaa atgacgaagg ctatcgccat 12180
tgcacagttt aatgatgaca gcccggaagc gaggaaaata acccggcgct ggagaatagg 12240
tgaagcagcg gatttagttg gggtttcttc tcaggctatc agagatgccg agaaagcagg 12300
gcgactaccg cacccggata tggaaattcg aggacgggtt gagcaacgtg ttggttatac 12360
aattgaacaa attaatcata tgcgtgatgt gtttggtacg cgattgcgac gtgctgaaga 12420
cgtatttcca ccggtgatcg gggttgctgc ccataaagaa aggtggcgtt tacaaaacct 12480
cagtttctgt tcatcttgct caggatctgg ctctgaaggg gctacgtgtt ttgctcgtgg 12540
aaggtaacga cccccaggga acagcctcaa tgtatcacgg atgggtacca gatcttcata 12600
ttcatgcaga agacactctc ctgcctttct atcttgggga aaaggacgat gtcacttatg 12660
caataaagcc cacttgctgg ccggggcttg acattattcc ttcctgtctg gctctgcacc 12720
gtattgaaac tgagttaatg ggcaaatttg atgaaggtaa actgcccacc gatccacacc 12780
tgatgctccg actggccatt gaaactgttg ctcatgacta tgatgtcata gttattgaca 12840
gcgcgcctaa cctgggtatc ggcacgatta atgtcgtatg tgctgctgat gtgctgattg 12900
ttcccacgcc tgctgagttg tttgactaca cctccgcact gcagtttttc gatatgcttc 12960
gtgatctgct caagaacgtt gatcttaaag ggttcgagcc tgatgtacgt attttgctta 13020
ccaaatacag caatagtaat ggctctcagt ccccgtggat ggaggagcaa attcgggatg 13080
cctggggaag catggttcta aaaaatgttg tacgtgaaac ggatgaagtt ggtaaaggtc 13140
agatccggat gagaactgtt tttgaacagg ccattgatca acgctcttca actggtgcct 13200
ggagaaatgc tctttctatt tgggaacctg tctgcaatga aattttcgat cgtctgatta 13260
aaccacgctg ggagattaga taatgaagcg tgcgcctgtt attccaaaac atacgctcaa 13320
tactcaaccg gttgaagata cttcgttatc gacaccagct gccccgatgg tggattcgtt 13380
aattgcgcgc gtaggagtaa tggctcgcgg taatgccatt actttgcctg tatgtggtcg 13440
ggatgtgaag tttactcttg aagtgctccg gggtgatagt gttgagaaga cctctcgggt 13500
atggtcaggt aatgaacgtg accaggagct gcttactgag gacgcactgg atgatctcat 13560
cccttctttt ctactgactg gtcaacagac accggcgttc ggtcgaagag tatctggtgt 13620
catagaaatt gccgatggga gtcgccgtcg taaagctgct gcacttaccg aaagtgatta 13680
tcgtgttctg gttggcgagc tggatgatga gcagatggct gcattatcca gattgggtaa 13740
cgattatcgc ccaacaagtg cttatgaacg tggtcagcgt tatgcaagcc gattgcagaa 13800
tgaatttgct ggaaatattt ctgcgctggc tgatgcggaa aatatttcac gtaagattat 13860
tacccgctgt atcaacaccg ccaaattgcc taaatcagtt gttgctcttt tttctcaccc 13920
cggtgaacta tctgcccggt caggtgatgc acttcaaaaa gcctttacag ataaagagga 13980
attacttaag cagcaggcat ctaaccttca tgagcagaaa aaagctgggg tgatatttga 14040
agctgaagaa gttatcactc ttttaacttc tgtgcttaaa acgtcatctg catcaagaac 14100
tagtttaagc tcacgacatc agtttgctcc tggagcgaca gtattgtata agggcgataa 14160
aatggtgctt aacctggaca ggtctcgtgt tccaactgag tgtatagaga aaattgaggc 14220
cattcttaag gaacttgaaa agccagcacc ctgatgcgac cacgttttag tctacgttta 14280
tctgtcttta cttaatgtcc tttgttacag gccagaaagc ataactggcc tgaatattct 14340
ctctgggccc actgttccac ttgtatcgtc ggtctgataa tcagactggg accacggtcc 14400
cactcgtatc gtcggtctga ttattagtct gggaccacgg tcccactcgt atcgtcggtc 14460
tgattattag tctgggacca cggtcccact cgtatcgtcg gtctgataat cagactggga 14520
ccacggtccc actcgtatcg tcggtctgat tattagtctg ggaccatggt cccactcgta 14580
tcgtcggtct gattattagt ctgggaccac ggtcccactc gtatcgtcgg tctgattatt 14640
agtctggaac cacggtccca ctcgtatcgt cggtctgatt attagtctgg gaccacggtc 14700
ccactcgtat cgtcggtctg attattagtc tgggaccacg atcccactcg tgttgtcggt 14760
ctgattatcg gtctgggacc acggtcccac ttgtattgtc gatcagacta tcagcgtgag 14820
actacgattc catcaatgcc tgtcaagggc aagtattgac atgtcgtcgt aacctgtaga 14880
acggagtaac ctcggtgtgc ggttgtatgc ctgctgtgga ttgctgctgt gtcctgctta 14940
tccacaacat tttgcgcacg gttatgtgga caaaatacct ggttacccag gccgtgccgg 15000
cacgttaacc gggctgcatc cgatgcaagt gtgtcgctgt cgacgagctc gcgagctcgg 15060
acatgaggtt gccccgtatt cagtgtcgct gatttgtatt gtctgaagtt gtttttacgt 15120
taagttgatg cagatcaatt aatacgatac ctgcgtcata attgattatt tgacgtggtt 15180
tgatggcctc cacgcacgtt gtgatatgta gatgataatc attatcactt tacgggtcct 15240
ttccggtgat ccgacaggtt acggggcggc gacctcgcgg gttttcgcta tttatgaaaa 15300
ttttccggtt taaggcgttt ccgttcttct tcgtcataac ttaatgtttt tatttaaaat 15360
accctctgaa aagaaaggaa acgacaggtg ctgaaagcga gctttttggc ctctgtcgtt 15420
tcctttctct gtttttgtcc gtggaatgaa caatggaagt ccgagctcat cgctaataac 15480
ttcgtatagc atacattata cgaagttata ttcgatgcgg ccaaggtgag ccagtgtgat 15540
tacatttgcg gcctaactgt ggccagtcca gttacgctgg agtcactagt atttaggtga 15600
cactatagaa gcggccgcta gggataacag ggtaatgaca acttgtccac gtggaattct 15660
aagcttagga tcccactgtg gtgg 15684
<210> 8
<211> 5250
<212> DNA
<213> 人工序列
<220>
<223> 真菌复制起点
<400> 8
agcttatttt ttgtatactg ttttgtgata gcacgaagtt tttccacggt atcttgttaa 60
aaatatatat ttgtggcggg cttacctaca tcaaattaat aagagactaa ttataaacta 120
aacacacaag caagctactt tagggtaaaa gtttataaat gcttttgacg tataaacgtt 180
gcttgtattt attattacaa ttaaaggtgg atagaaaacc tagagactag ttagaaacta 240
atctcaggtt tgcgttaaac taaatcagag cccgagaggt taacagaacc tagaagggga 300
ctagatatcc gggtagggaa acaaaaaaaa aaaacaagac agccacatat tagggagact 360
agttagaagc tagttccagg actaggaaaa taaaagacaa tgataccaca gtctagttga 420
caactagata gattctagat tgaggccaaa gtctctgaga tccaggttag ttgcaactaa 480
tactagttag tatctagtct cctataactc tgaagctaga ataacttact actattatcc 540
tcaccactgt tcagctgcgc aaacggagtg attgcaaggt gttcagagac tagttattga 600
ctagtcagtg actagcaata actaacaagg tattaaccta ccatgtctgc catcaccctg 660
cacttcctcg ggctcagcag ccttttcctc ctcattttca tgctcatttt ccttgtttaa 720
gactgtgact agtcaaagac tagtccagaa ccacaaagga gaaatgtctt accactttct 780
tcattgcttg tctcttttgc attatccatg tctgcaacta gttagagtct agttagtgac 840
tagtccgacg aggacttgct tgtctccgga ttgttggagg aactctccag ggcctcaaga 900
tccacaacag agccttctag aagactggtc aataactagt tggtctttgt ctgagtctga 960
cttacgaggt tgcatactcg ctccctttgc ctcgtcaatc gatgagaaaa agcgccaaaa 1020
ctcgcaatat ggctttgaac cacacggtgc tgagactagt tagaatctag tcccaaacta 1080
gcttggatag cttacctttg ccctttgcgt tgcgacaggt cttgcagggt atggttcctt 1140
tctcaccagc tgatttagct gccttgctac cctcacggcg gatctgcata aagagtggct 1200
agaggttata aattagcact gatcctaggt acggggctga atgtaacttg cctttccttt 1260
ctcatcgcgc ggcaagacag gcttgctcaa attcctacca gtcacagggg tatgcacggc 1320
gtacggacca cttgaactag tcacagatta gttagcaact agtctgcatt gaatggctgt 1380
acttacgggc cctcgccatt gtcctgatca tttccagctt caccctcgtt gctgcaaagt 1440
agttagtgac tagtcaagga ctagttgaaa tgggagaaga aactcacgaa ttctcgacac 1500
ccttagtatt gtggtccttg gacttggtgc tgctatatat tagctaatac actagttaga 1560
ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag gagtcggggt tgggagaaca 1620
gtgccttcaa acaagccttc ataccatgct acttgactag tcagggacta gtcaccaagt 1680
aatctagata ggacttgcct ttggcctcca tcagttcctt catagtggga ggtccattgt 1740
gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa gtgcttgacc aatatgtttc 1800
tgttggcaga gggaacctgt caactagtta ataactagtc agaaactagt atagcagtag 1860
actcactgta cgcttgaggc atcccttcac tcggcagtag acttcatatg gatggatatc 1920
aggcacgcca ttgtcgtcct gtggactagt cagtaactag gcttaaagct agtcgggtcg 1980
gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc ttaactgcct cgagatagtg 2040
acagtactct ggggactttc ggagatcgtt atcgcgaatg ctcggcatac taatcgttga 2100
ctagtcttgg actagtcccg agcaaaaagg attggaggag gaggaggaag gtgagagtga 2160
gacaaagagc gaaataagag cttcaaaggc tatctctaag cagtatgaag gttaagtatc 2220
tagttcttga ctagatttaa aagagatttc gactagttat gtacctggag tttggatata 2280
ggaatgtgtt gtggtaacga aatgtaaggg ggaggaaaga aaaagtcggt caagaggtaa 2340
ctctaagtcg gccattcctt tttgggaggc gctaaccata aacggcatgg tcgacttaga 2400
gttagctcag ggaatttagg gagttatctg cgaccaccga ggaacggcgg aatgccaaag 2460
aatcccgatg gagctctagc tggcggttga caaccccacc ttttggcgtt tctgcggcgt 2520
tgcaggcggg actggatact tcgtagaacc agaaaggcaa ggcagaacgc gctcagcaag 2580
agtgttggaa gtgatagcat gatgtgcctt gttaactagg tcaaaatctg caggtatgct 2640
tgatgttatc caaagtgtga gagaggaagg tccaaacata cacgattggg agagggccta 2700
ggtataagag tttttgagta gaacgcatgt gagcccagcc atctcgagga gattaaacac 2760
gggccggcat ttgatggcta tgttagtacc ccaatggaaa gcctgagagt ccagtggtcg 2820
cagataactc cctaaattcc ctgagctaac tctaagtcga ccatgccgtt tatggttagc 2880
gcctcccaaa aaggaatggc cgacttagag ttacctcttg accgactttt tctttcctcc 2940
cccttacatt tcgttaccac aacacattcc tatatccaaa ctccaggtac ataactagtc 3000
gaaatctctt ttaaatctag tcaagaacta gatacttaac cttcatactg cttagagata 3060
gcctttgaag ctcttatttc gctctttgtc tcactctcac cttcctcctc ctcctccaat 3120
cctttttgct cgggactagt ccaagactag tcaacgatta gtatgccgag cattcgcgat 3180
aacgatctcc gaaagtcccc agagtactgt cactatctcg aggcagttaa ggacggggag 3240
cttacgctgc cggatttcaa gatagtaagc cgacccgact agctttaagc ctagttactg 3300
actagtccac aggacgacaa tggcgtgcct gatatccatc catatgaagt ctactgccga 3360
gtgaagggat gcctcaagcg tacagtgagt ctactgctat actagtttct gactagttat 3420
taactagttg acaggttccc tctgccaaca gaaacatatt ggtcaagcac ttgaaggaca 3480
agaactccca cggcatggag tttacattgc acaatggacc tcccactatg aaggaactga 3540
tggaggccaa aggcaagtcc tatctagatt acttggtgac tagtccctga ctagtcaagt 3600
agcatggtat gaaggcttgt ttgaaggcac tgttctccca accccgactc ctaccaagaa 3660
gcgcaagcga gctgcgtaag tttctgtgag tctaactagt gtattagcta atatatagca 3720
gcaccaagtc caaggaccac aatactaagg gtgtcgagaa ttcgtgagtt tcttctccca 3780
tttcaactag tccttgacta gtcactaact actttgcagc aacgagggtg aagctggaaa 3840
tgatcaggac aatggcgagg gcccgtaagt acagccattc aatgcagact agttgctaac 3900
taatctgtga ctagttcaag tggtccgtac gccgtgcata cccctgtgac tggtaggaat 3960
ttgagcaagc ctgtcttgcc gcgcgatgag aaaggaaagg caagttacat tcagccccgt 4020
acctaggatc agtgctaatt tataacctct agccactctt tatgcagatc cgccgtgagg 4080
gtagcaaggc agctaaatca gctggtgaga aaggaaccat accctgcaag acctgtcgca 4140
acgcaaaggg caaaggtaag ctatccaagc tagtttggga ctagattcta actagtctca 4200
gcaccgtgtg gttcaaagcc atattgcgag ttttggcgct ttttctcatc gattgacgag 4260
gcaaagggag cgagtatgca acctcgtaag tcagactcag acaaagacca actagttatt 4320
gaccagtctt ctagaaggct ctgttgtgga tcttgaggcc ctggagagtt cctccaacaa 4380
tccggagaca agcaagtcct cgtcggacta gtcactaact agactctaac tagttgcaga 4440
catggataat gcaaaagaga caagcaatga agaaagtggt aagacatttc tcctttgtgg 4500
ttctggacta gtctttgact agtcacagtc ttaaacaagg aaaatgagca tgaaaatgag 4560
gaggaaaagg ctgctgagcc cgaggaagtg cagggtgatg gcagacatgg taggttaata 4620
ccttgttagt tattgctagt cactgactag tcaataacta gtctctgaac accttgcaat 4680
cactccgttt gcgcagctga acagtggtga ggataatagt agtaagttat tctagcttca 4740
gagttatagg agactagata ctaactagta ttagttgcaa ctaacctgga tctcagagac 4800
tttggcctca atctagaatc tatctagttg tcaactagac tgtggtatca ttgtctttta 4860
ttttcctagt cctggaacta gcttctaact agtctcccta atatgtggct gtcttgtttt 4920
ttttttttgt ttccctaccc ggatatctag tccccttcta ggttctgtta acctctcggg 4980
ctctgattta gtttaacgca aacctgagat tagtttctaa ctagtctcta ggttttctat 5040
ccacctttaa ttgtaataat aaatacaagc aacgtttata cgtcaaaagc atttataaac 5100
ttttacccta aagtagcttg cttgtgtgtt tagtttataa ttagtctctt attaatttga 5160
tgtaggtaag cccgccacaa atatatattt ttaacaagat accgtggaaa aacttcgtgc 5220
tatcacaaaa cagtatacaa aaaataagct 5250
<210> 9
<211> 3031
<212> DNA
<213> 人工序列
<220>
<223> 真菌选择标记
<400> 9
gatccacagg acgggtgtgg tcgccatgat cgcgtagtcg atagtggctc caagtagcga 60
agcgagcagg actgggcggc ggccaaagcg gtcggacagt gctccgagaa cgggtgcgca 120
tagaaattgc atcaacgcat atagcgctag cagcacgcca tagtgactgg cgatgctgtc 180
ggaatggacg atatcccgca agaggcccgg cagtaccggc ataaccaagc ctatgcctac 240
agcatccagg gtgacggtgc cgaggatgac gatgagcgca ttgttagatt tcatacacgg 300
tgcctgactg cgttagcaat ttaactgtga taaactaccg cattaaagct tcgacatcac 360
ccttacccaa actatatcca atgagcaaag aataacgagt caaagcgggc gcatttttca 420
tcacatacga gtatgcacag tcaggactcc acgtcataca tcaaaaactt ggaacgcatg 480
agtctagctc agctcggctc ttttccgatt tttgcgcagc ttctgttgcg gatcttgctg 540
cttgtggagt ctatgccccg gctgatgcat tgaaacacaa cgcgcagatg atccaatcat 600
accaaccaga cgcatcagcg cgtgtagctg ggggaagggt aggtggtgta gcccagaaag 660
cgacacggct ggctttcaag aagtttatca accctagaca gctttggagc ggatacccgg 720
ctcttgtggc gcatagcttg ccagtgtcgg cgatacagat gcctctgtac gagacttttc 780
ggtatcgaat ttctgaatat agattcggag atcgagagaa ggtgctagaa agatcaagag 840
attatggaaa agaaacaggc ccattcgaca atcggagagg ctgcagcgac agccgcgata 900
agtgctgcag cctcgggcgg tatagccagt gtcttgacag cacccatgga tatagtccgg 960
acacgaatca tgctcgatgc tgcagacaca accgcacctc agaagaaaag gatgatcaat 1020
accgtacggg agattatacg aacagatggc ccgagaggac tattccgagg gtgtgctatc 1080
aacacgttta tggccgctgt cggatcaggg ttatactttg gtctctacga aagcaccaaa 1140
tggtggctag gctcggactc gatggataat agtgccatgt tagagtaagg ggtgatggga 1200
aatcttgtat ataattgtga ttgtttgtac gatagtggcc gactgtacat tagtgatacc 1260
ccactcttag aaaatagacc aatctccagc tgcaccttca gacaatccgg gtaaaaattc 1320
tcgtctatgt tggagattgg tgtgattttg aaacatgacc cttgactctg atcttgaata 1380
tgtccatatc tcgaggcagg catattattc atatagagag ggtatccctt agcatcggtc 1440
tgtcgtagta tccgactgct gaatttatga atcgcatcat acttgcgaca tactgccata 1500
aaaagagtac gtatccacca ctacttattg cgcaccaaca cgcttcaggt atgcatccca 1560
tccctctttc tggtaccgct tcgccgcctc cacgggatca ggagcagcat aaattccacg 1620
accagcaatg ataaagtcgg caccgcgtcc aacagcagat tcaggagtct ggtattgctg 1680
tcccagcttg tctcccttcg aggagaggtt gacacctgtc gtgaacacga cgaaatcctc 1740
ctcctccgaa ggagagctaa cttcagactg aacctcgccc aggtgacgcg tcgagacgaa 1800
tcccatcaca aacttcttat acttccgagc atagtcaaca gaagaagtag tatattgacc 1860
ggtagccaaa gatcccttgg atgtcatctc cgcaaggatc aaaaggcccc tctcagagcc 1920
gtagggaaag tcctcggccg aagcagtctg ggctagagcc tcgacgatac cctcaccggg 1980
cagaatactg cagttgatga tgtgggccca ctcggagatg cgcagagtgc cgccatggta 2040
ctgcttttgg actgtgtttc cgatatcgat gaacttgcga tcttcgaaga tgaggaaatt 2100
gtgcttctct gcaagggcct tcagaccggt gatggtctct tcgctgaaat cggagaggat 2160
atcgatgtga gttttgatca cggcaatgta cggaccgagt cctgttaaat aatccaccat 2220
taaccattat tagatcatta tgtaagtggc atccccggtg cgcatacggt cagccaaatc 2280
cagcagctct ttggtggttg tcacgtcggc cgaaacggtg acattggttt tcttggcctc 2340
ggcaacctca aagagcttct ttacgagggc attggggtgc ttgctagcgc gtgcactgta 2400
ggtcaattgc gacttggaag acatgttggc gatggagggg tagcgcgggg ttctgcaact 2460
atcgtagaaa tgagcactta gtggttgaaa ccggcttatt cagtagatta atacttgaag 2520
tttttagtaa tcagacagaa taatcaggat gtccaattac tacctcttaa tatgtggaat 2580
gaatgataga tataaattgt acgacaattg ccgcgaaaaa ttaaaatgga tctatggagg 2640
ggacagtcat gcactagcca cacgttcctc cgcctgtggg gtgagccaca tgcctcatct 2700
ggaccaaaca catcgatgca gtcacatgca gataagatta gggcctatcc ttagggtacc 2760
tgtccgcgcg gggattatgc ctggcttttt gcctgctttt gatatccttt caaggacata 2820
gcgataagtc caaccttatc ggccataata atgtcaatgc cagcagcggc ttgggcctag 2880
aatattccat cagctactga acaacttcta catcacaatt tgaaagctct aagaattaat 2940
atagaagcac ttaccttcgc attttctggt atattgttct gagatccata ggatcagctt 3000
atcgatgata agctgtcaaa catgagaatt c 3031
<210> 10
<211> 277
<212> PRT
<213> 人工序列
<220>
<223> 真菌选择标记
<400> 10
Met Ser Ser Lys Ser Gln Leu Thr Tyr Ser Ala Arg Ala Ser Lys His
1 5 10 15
Pro Asn Ala Leu Val Lys Lys Leu Phe Glu Val Ala Glu Ala Lys Lys
20 25 30
Thr Asn Val Thr Val Ser Ala Asp Val Thr Thr Thr Lys Glu Leu Leu
35 40 45
Asp Leu Ala Asp Arg Leu Gly Pro Tyr Ile Ala Val Ile Lys Thr His
50 55 60
Ile Asp Ile Leu Ser Asp Phe Ser Glu Glu Thr Ile Thr Gly Leu Lys
65 70 75 80
Ala Leu Ala Glu Lys His Asn Phe Leu Ile Phe Glu Asp Arg Lys Phe
85 90 95
Ile Asp Ile Gly Asn Thr Val Gln Lys Gln Tyr His Gly Gly Thr Leu
100 105 110
Arg Ile Ser Glu Trp Ala His Ile Ile Asn Cys Ser Ile Leu Pro Gly
115 120 125
Glu Gly Ile Val Glu Ala Leu Ala Gln Thr Ala Ser Ala Glu Asp Phe
130 135 140
Pro Tyr Gly Ser Glu Arg Gly Leu Leu Ile Leu Ala Glu Met Thr Ser
145 150 155 160
Lys Gly Ser Leu Ala Thr Gly Gln Tyr Thr Thr Ser Ser Val Asp Tyr
165 170 175
Ala Arg Lys Tyr Lys Lys Phe Val Met Gly Phe Val Ser Thr Arg His
180 185 190
Leu Gly Glu Val Gln Ser Glu Val Ser Ser Pro Ser Glu Glu Glu Asp
195 200 205
Phe Val Val Phe Thr Thr Gly Val Asn Leu Ser Ser Lys Gly Asp Lys
210 215 220
Leu Gly Gln Gln Tyr Gln Thr Pro Glu Ser Ala Val Gly Arg Gly Ala
225 230 235 240
Asp Phe Ile Ile Ala Gly Arg Gly Ile Tyr Ala Ala Pro Asp Pro Val
245 250 255
Glu Ala Ala Lys Arg Tyr Gln Lys Glu Gly Trp Asp Ala Tyr Leu Lys
260 265 270
Arg Val Gly Ala Gln
275
<210> 11
<211> 12699
<212> DNA
<213> 人工序列
<220>
<223> 载体
<400> 11
ccaccacagt gggatccgaa gcttggaatt cacgtgactt gaagtcatta ccctgttatc 60
cctatgattt aatagctcca tgtcaacaag aataaaacgc gttttcgggt ttacctcttc 120
cagatacagc tcatctgcaa tgcattaatg cattgactgc aacctagtaa cgccttcagg 180
ctccggcgaa gagaagaata gcttagcaga gctattttca ttttcgggag acgagatcaa 240
gcagatcaac ggtcgtcaag agacctacga gactgaggaa tccgctcttg gctccacgcg 300
actatatatt tgtctctaat tgtactttga catgctcctc ttctttactc tgatagcttg 360
actatgaaaa ttccgtcacc agccctgggt tcgcaaagat aattgcatgt ttcttccttg 420
aactctcaag cctacaggac acacattcat cgtaggtata aacctcgaaa tcattcctac 480
taagatggta tacaatagta accatggttg cctagtgaat gctccgtaac acccaatacg 540
ccggccgaaa cttttttaca actctcctat gagtcgttta cccagaatgc acaggtacac 600
ttgtttagag gtaatccttc tttctagaag tcctcgtgta ctgtgtaagc gcccactcca 660
catctccact cgagcctttt tcgagcgaac ctcccctgat ctcgaataat ctcatcgtca 720
tgcgcggtcc aacttctgct agttcggcat ccttatatcc cgtcttaacg aaaacgtggt 780
gacgaacctc aatgctatcc tctttattta caaaggtgac cacgcggttt ccaacttttc 840
cagcttctcg gggagggaaa agatgcttca gaatttgaac cacgcgcttg cccagttttg 900
tcttgaaacc ctcaaagatc aagtgcgggt agctctctga cacagtcccg cgggcagcgt 960
tgggaatatc ggcacgtaga acaacattat gcagggagaa gctggctgtc gggccatgag 1020
gaagatgtga gatcgtcatc gcagtagggg taccacggtg ttcggcggcc gcactgaccc 1080
tatagtgagt cgtattaatt taaatcatac caacatggtc aaataaaacg aaaggctcag 1140
tcgaaagact ggccgcccga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 1200
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 1260
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 1320
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 1380
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 1440
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 1500
ttaaagcttc gacatcaccc ttacccaaac tatatccaat gagcaaagaa taacgagtca 1560
aagcgggcgc atttttcatc acatacgagt atgcacagtc aggactccac gtcatacatc 1620
aaaaacttgg aacgcatgag tctagctcag ctcggctctt ttccgatttt tgcgcagctt 1680
ctgttgcgga tcttgctgct tgtggagtct atgccccggc tgatgcattg aaacacaacg 1740
cgcagatgat ccaatcatac caaccagacg catcagcgcg tgtagctggg ggaagggtag 1800
gtggtgtagc ccagaaagcg acacggctgg ctttcaagaa gtttatcaac cctagacagc 1860
tttggagcgg atacccggct cttgtggcgc atagcttgcc agtgtcggcg atacagatgc 1920
ctctgtacga gacttttcgg tatcgaattt ctgaatatag attcggagat cgagagaagg 1980
tgctagaaag atcaagagat tatggaaaag aaacaggccc attcgacaat cggagaggct 2040
gcagcgacag ccgcgataag tgctgcagcc tcgggcggta tagccagtgt cttgacagca 2100
cccatggata tagtccggac acgaatcatg ctcgatgctg cagacacaac cgcacctcag 2160
aagaaaagga tgatcaatac cgtacgggag attatacgaa cagatggccc gagaggacta 2220
ttccgagggt gtgctatcaa cacgtttatg gccgctgtcg gatcagggtt atactttggt 2280
ctctacgaaa gcaccaaatg gtggctaggc tcggactcga tggataatag tgccatgtta 2340
gagtaagggg tgatgggaaa tcttgtatat aattgtgatt gtttgtacga tagtggccga 2400
ctgtacatta gtgatacccc actcttagaa aatagaccaa tctccagctg caccttcaga 2460
caatccgggt aaaaattctc gtctatgttg gagattggtg tgattttgaa acatgaccct 2520
tgactctgat cttgaatatg tccatatctc gaggcaggca tattattcat atagagaggg 2580
tatcccttag catcggtctg tcgtagtatc cgactgctga atttatgaat cgcatcatac 2640
ttgcgacata ctgccataaa aagagtacgt atccaccact acttattgcg caccaacacg 2700
cttcaggtat gcatcccatc cctctttctg gtaccgcttc gccgcctcca cgggatcagg 2760
agcagcataa attccacgac cagcaatgat aaagtcggca ccgcgtccaa cagcagattc 2820
aggagtctgg tattgctgtc ccagcttgtc tcccttcgag gagaggttga cacctgtcgt 2880
gaacacgacg aaatcctcct cctccgaagg agagctaact tcagactgaa cctcgcccag 2940
gtgacgcgtc gagacgaatc ccatcacaaa cttcttatac ttccgagcat agtcaacaga 3000
agaagtagta tattgaccgg tagccaaaga tcccttggat gtcatctccg caaggatcaa 3060
aaggcccctc tcagagccgt agggaaagtc ctcggccgaa gcagtctggg ctagagcctc 3120
gacgataccc tcaccgggca gaatactgca gttgatgatg tgggcccact cggagatgcg 3180
cagagtgccg ccatggtact gcttttggac tgtgtttccg atatcgatga acttgcgatc 3240
ttcgaagatg aggaaattgt gcttctctgc aagggccttc agaccggtga tggtctcttc 3300
gctgaaatcg gagaggatat cgatgtgagt tttgatcacg gcaatgtacg gaccgagtcc 3360
tgttaaataa tccaccatta accattatta gatcattatg taagtggcat ccccggtgcg 3420
catacggtca gccaaatcca gcagctcttt ggtggttgtc acgtcggccg aaacggtgac 3480
attggttttc ttggcctcgg caacctcaaa gagcttcttt acgagggcat tggggtgctt 3540
gctagcgcgt gcactgtagg tcaattgcga cttggaagac atgttggcga tggaggggta 3600
gcgcggggtt ctgcaactat cgtagaaatg agcacttagt ggttgaaacc ggcttattca 3660
gtagattaat acttgaagtt tttagtaatc agacagaata atcaggatgt ccaattacta 3720
cctcttaata tgtggaatga atgatagata taaattgtac gacaattgcc gcgaaaaatt 3780
aaaatggatc tatggagggg acagtcatgc actagccaca cgttcctccg cctgtggggt 3840
gagccacatg cctcatctgg accaaacaca tcgatgcagt cacatgcaga taagattagg 3900
gcctatcctt agggtacctg tccgcgcggg gattatgcct ggctttttgc ctgcttttga 3960
tatcctttca aggacatagc gataagtcca accttatcgg ccataataat gtcaatgcca 4020
gcagcggctt gggcctagaa tattccatca gctactgaac aacttctaca tcacaatttg 4080
aaagctctaa gaattaatat agaagcactt accttcgcat tttctggtat attgttctga 4140
gatccatagg atcagcttat cgatgataag ctgtcaaaca tgagaattcg ggccgtcgac 4200
caattctcat gtttgacagc ttatcatcga atttctgcca ttcatccgct tattatcact 4260
tattcaggcg tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaagtcgag 4320
gctgatcagc gagctctaga gaattgatcc cctcagaaga actcgtcaag aaggcgatag 4380
aaggcgatgc gctgcgaatc gggagcggcg ataccgtaaa gcacgaggaa gcggtcagcc 4440
cattcgccgc caagctcttc agcaatatca cgggtagcca acgctatgtc ctgatagcgg 4500
tccgccacac ccagccggcc acagtcgatg aatccagaaa agcggccatt ttccaccatg 4560
atattcggca agcaggcatc gccatgggtc acgacgagat catcgccgtc gggcatgcgc 4620
gccttgagcc tggcgaacag ttcggctggc gcgagcccct gatgctcttc gtccagatca 4680
tcctgatcga caagaccggc ttccatccga gtacgtgctc gctcgatgcg atgtttcgct 4740
tggtggtcga atgggcaggt agccggatca agcgtatgca gccgccgcat tgcatcagcc 4800
atgatggata ctttctcggc aggagcaagg tgagatgaca ggagatcctg ccccggcact 4860
tcgcccaata gcagccagtc ccttcccgct tcagtgacaa cgtcgagcac agctgcgcaa 4920
ggaacgcccg tcgtggccag ccacgatagc cgcgctgcct cgtcctgcag ttcattcagg 4980
gcaccggaca ggtcggtctt gacaaaaaga accgggcgcc cctgcgctga cagccggaac 5040
acggcggcat cagagcagcc gattgtctgt tgtgcccagt catagccgaa tagcctctcc 5100
acccaagcgg ccggagaacc tgcgtgcaat ccatcttgtt caatggccga tcccatggtt 5160
tagttcctca ccttgtcgta ttatactatg ccgatatact atgccgatga ttaattgtca 5220
acaggctgca ggtcgtttag cttccttagc tcctgaaaat ctcgataact caaaaaatac 5280
gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac 5340
gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt 5400
tatttattct gcgaagtgat cttccgtcac aggtatttat tcgcgataag ctcatggagc 5460
ggcgtaaccg tcgcacagga aggacagaga aagcgcggat ctgggaagtg acggacagaa 5520
cggtcaggac ctggattggg gaggcggttg ccgccgctgc tgctgacggt gtgacgttct 5580
ctgttccggt cacaccacat acgttccgcc attcctatgc gatgcacatg ctgtatgccg 5640
gtataccgct gaaagttctg caaagcctga tgggacataa gtccatcagt tcaacggaag 5700
tctacacgaa ggtttttgcg ctggatgtgg ctgcccggca ccgggtgcag tttgcgatgc 5760
cggagtctga tgcggttgcg atgctgaaac aattatcctg agaataaatg ccttggcctt 5820
tatatggaaa tgtggaactg agtggatatg ctgtttttgt ctgttaaaca gagaagctgg 5880
ctgttatcca ctgagaagcg aacgaaacag tcgggaaaat ctcccattat cgtagagatc 5940
cgcattatta atctcaggag cctgtgtagc gtttatagga agtagtgttc tgtcatgatg 6000
cctgcaagcg gtaacgaaaa cgatttgaat atgccttcag gaacaataga aatcttcgtg 6060
cggtgttacg ttgaagtgga gcggattatg tcagcaatgg acagaacaac ctaatgaaca 6120
cagaaccatg atgtggtctg tccttttaca gccagtagtg ctcgccgcag tcgagcgaca 6180
gggcgaagcc cctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 6240
cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccggccgccg gcgttgtgga 6300
tacctcgcgg aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg 6360
gccgactcac ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg 6420
tggagctggc cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag 6480
atgatgtgga caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact 6540
actgacagat gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg 6600
gcgcacctat tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt 6660
ttccgcccgt ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt 6720
ataaaccttg tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg 6780
ggtgcccccc cttctcgaac cctcccggtc gagtgagcga ggaagcacca gggaacagca 6840
cttatatatt ctgcttacac acgatgcctg aaaaaacttc ccttggggtt atccacttat 6900
ccacggggat atttttataa ttattttttt tatagttttt agatcttctt ttttagagcg 6960
ccttgtaggc ctttatccat gctggttcta gagaaggtgt tgtgacaaat tgccctttca 7020
gtgtgacaaa tcaccctcaa atgacagtcc tgtctgtgac aaattgccct taaccctgtg 7080
acaaattgcc ctcagaagaa gctgtttttt cacaaagtta tccctgctta ttgactcttt 7140
tttatttagt gtgacaatct aaaaacttgt cacacttcac atggatctgt catggcggaa 7200
acagcggtta tcaatcacaa gaaacgtaaa aatagcccgc gaatcgtcca gtcaaacgac 7260
ctcactgagg cggcatatag tctctcccgg gatcaaaaac gtatgctgta tctgttcgtt 7320
gaccagatca gaaaatctga tggcacccta caggaacatg acggtatctg cgagatccat 7380
gttgctaaat atgctgaaat attcggattg acctctgcgg aagccagtaa ggatatacgg 7440
caggcattga agagtttcgc ggggaaggaa gtggtttttt atcgccctga agaggatgcc 7500
ggcgatgaaa aaggctatga atcttttcct tggtttatca aacgtgcgca cagtccatcc 7560
agagggcttt acagtgtaca tatcaaccca tatctcattc ccttctttat cgggttacag 7620
aaccggttta cgcagtttcg gcttagtgaa acaaaagaaa tcaccaatcc gtatgccatg 7680
cgtttatacg aatccctgtg tcagtatcgt aagccggatg gctcaggcat cgtctctctg 7740
aaaatcgact ggatcataga gcgttaccag ctgcctcaaa gttaccagcg tatgcctgac 7800
ttccgccgcc gcttcctgca ggtctgtgtt aatgagatca acagcagaac tccaatgcgc 7860
ctctcataca ttgagaaaaa gaaaggccgc cagacgactc atatcgtatt ttccttccgc 7920
gatatcactt ccatgacgac aggataggct agtgataata agtgactgag gtatgtgctc 7980
ttcttatctc cttttgtagt gttgctctta ttttaaacaa ctttgcggtt ttttgatgac 8040
tttgcgattt tgttgttgct ttgcagtaaa ttgcaagatt taataaaaaa acgcaaagca 8100
atgattaaag gatgttcaga atgaaactca tggaaacact taaccagtgc ataaacgctg 8160
gtcatgaaat gacgaaggct atcgccattg cacagtttaa tgatgacagc ccggaagcga 8220
ggaaaataac ccggcgctgg agaataggtg aagcagcgga tttagttggg gtttcttctc 8280
aggctatcag agatgccgag aaagcagggc gactaccgca cccggatatg gaaattcgag 8340
gacgggttga gcaacgtgtt ggttatacaa ttgaacaaat taatcatatg cgtgatgtgt 8400
ttggtacgcg attgcgacgt gctgaagacg tatttccacc ggtgatcggg gttgctgccc 8460
ataaagaaag gtggcgttta caaaacctca gtttctgttc atcttgctca ggatctggct 8520
ctgaaggggc tacgtgtttt gctcgtggaa ggtaacgacc cccagggaac agcctcaatg 8580
tatcacggat gggtaccaga tcttcatatt catgcagaag acactctcct gcctttctat 8640
cttggggaaa aggacgatgt cacttatgca ataaagccca cttgctggcc ggggcttgac 8700
attattcctt cctgtctggc tctgcaccgt attgaaactg agttaatggg caaatttgat 8760
gaaggtaaac tgcccaccga tccacacctg atgctccgac tggccattga aactgttgct 8820
catgactatg atgtcatagt tattgacagc gcgcctaacc tgggtatcgg cacgattaat 8880
gtcgtatgtg ctgctgatgt gctgattgtt cccacgcctg ctgagttgtt tgactacacc 8940
tccgcactgc agtttttcga tatgcttcgt gatctgctca agaacgttga tcttaaaggg 9000
ttcgagcctg atgtacgtat tttgcttacc aaatacagca atagtaatgg ctctcagtcc 9060
ccgtggatgg aggagcaaat tcgggatgcc tggggaagca tggttctaaa aaatgttgta 9120
cgtgaaacgg atgaagttgg taaaggtcag atccggatga gaactgtttt tgaacaggcc 9180
attgatcaac gctcttcaac tggtgcctgg agaaatgctc tttctatttg ggaacctgtc 9240
tgcaatgaaa ttttcgatcg tctgattaaa ccacgctggg agattagata atgaagcgtg 9300
cgcctgttat tccaaaacat acgctcaata ctcaaccggt tgaagatact tcgttatcga 9360
caccagctgc cccgatggtg gattcgttaa ttgcgcgcgt aggagtaatg gctcgcggta 9420
atgccattac tttgcctgta tgtggtcggg atgtgaagtt tactcttgaa gtgctccggg 9480
gtgatagtgt tgagaagacc tctcgggtat ggtcaggtaa tgaacgtgac caggagctgc 9540
ttactgagga cgcactggat gatctcatcc cttcttttct actgactggt caacagacac 9600
cggcgttcgg tcgaagagta tctggtgtca tagaaattgc cgatgggagt cgccgtcgta 9660
aagctgctgc acttaccgaa agtgattatc gtgttctggt tggcgagctg gatgatgagc 9720
agatggctgc attatccaga ttgggtaacg attatcgccc aacaagtgct tatgaacgtg 9780
gtcagcgtta tgcaagccga ttgcagaatg aatttgctgg aaatatttct gcgctggctg 9840
atgcggaaaa tatttcacgt aagattatta cccgctgtat caacaccgcc aaattgccta 9900
aatcagttgt tgctcttttt tctcaccccg gtgaactatc tgcccggtca ggtgatgcac 9960
ttcaaaaagc ctttacagat aaagaggaat tacttaagca gcaggcatct aaccttcatg 10020
agcagaaaaa agctggggtg atatttgaag ctgaagaagt tatcactctt ttaacttctg 10080
tgcttaaaac gtcatctgca tcaagaacta gtttaagctc acgacatcag tttgctcctg 10140
gagcgacagt attgtataag ggcgataaaa tggtgcttaa cctggacagg tctcgtgttc 10200
caactgagtg tatagagaaa attgaggcca ttcttaagga acttgaaaag ccagcaccct 10260
gatgcgacca cgttttagtc tacgtttatc tgtctttact taatgtcctt tgttacaggc 10320
cagaaagcat aactggcctg aatattctct ctgggcccac tgttccactt gtatcgtcgg 10380
tctgataatc agactgggac cacggtccca ctcgtatcgt cggtctgatt attagtctgg 10440
gaccacggtc ccactcgtat cgtcggtctg attattagtc tgggaccacg gtcccactcg 10500
tatcgtcggt ctgataatca gactgggacc acggtcccac tcgtatcgtc ggtctgatta 10560
ttagtctggg accatggtcc cactcgtatc gtcggtctga ttattagtct gggaccacgg 10620
tcccactcgt atcgtcggtc tgattattag tctggaacca cggtcccact cgtatcgtcg 10680
gtctgattat tagtctggga ccacggtccc actcgtatcg tcggtctgat tattagtctg 10740
ggaccacgat cccactcgtg ttgtcggtct gattatcggt ctgggaccac ggtcccactt 10800
gtattgtcga tcagactatc agcgtgagac tacgattcca tcaatgcctg tcaagggcaa 10860
gtattgacat gtcgtcgtaa cctgtagaac ggagtaacct cggtgtgcgg ttgtatgcct 10920
gctgtggatt gctgctgtgt cctgcttatc cacaacattt tgcgcacggt tatgtggaca 10980
aaatacctgg ttacccaggc cgtgccggca cgttaaccgg gctgcatccg atgcaagtgt 11040
gtcgctgtcg acgagctcgc gagctcggac atgaggttgc cccgtattca gtgtcgctga 11100
tttgtattgt ctgaagttgt ttttacgtta agttgatgca gatcaattaa tacgatacct 11160
gcgtcataat tgattatttg acgtggtttg atggcctcca cgcacgttgt gatatgtaga 11220
tgataatcat tatcacttta cgggtccttt ccggtgatcc gacaggttac ggggcggcga 11280
cctcgcgggt tttcgctatt tatgaaaatt ttccggttta aggcgtttcc gttcttcttc 11340
gtcataactt aatgttttta tttaaaatac cctctgaaaa gaaaggaaac gacaggtgct 11400
gaaagcgagc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt ggaatgaaca 11460
atggaagtcc gagctcatcg ctaataactt cgtatagcat acattatacg aagttatatt 11520
cgatgcggcc aaggtgagcc agtgtgatta catttgcggc ctaactgtgg ccagtccagt 11580
tacgctggag tcactagtat ttaggtgaca ctatagaagc ggccgcgaat tcatgccagt 11640
tgttccagtg atcttcgttt cgaagatgga catccaattt gtgcaagtta ttcggcctac 11700
ctggctgtgg ccgaggcagc gttatcatga ccgtcgctgt tcaaagataa ggcgagaagt 11760
ttgcgggctg tcttgacgat atggcttcgt tcagacagat atagttcccg gagtcgcagg 11820
ctgctattct tctccgaaac aaactcggct gcactgtttc catcaccggg tctggcgttt 11880
gaggatgtca gcgaaactcg gccgcaagtg acaccgaaaa gtatcgactc cggtgcccgt 11940
ttcaagctag tggcttcctc aacagcgagt cggccaggag acgtgaagca ggacgggttg 12000
ccatccagac cgtgaccgaa cgcgttgatt tcatcaatcc cagccttttc gctcaaccaa 12060
agagcatcgg ctttgatttc cttcaggtca tacgaggctt gtgcaatggt ctccgcatgg 12120
atatcgcgtg ctgttctcct atcaactcgg aattttgtct taggggatgg cgtaggaacc 12180
tcgaatgctg atcaggatgt gacaaaaacg actcgaaaac ccgggttcat cggtgtgctt 12240
tcgggatcgc aagcgtaaag aaagattcac tcttccaaga cctagaagta tagcaaatca 12300
gcagcagacc atcaatgtat agcgaatgcg cccatacaaa acgtgaactc cccggagaag 12360
cactttgtcc agggacggga aataggcttc cggaacggga gcattggcag cacagctata 12420
tcattctaag taaacaaatg taatgagcaa gcggacgagt gctgaaacct cctatgccgt 12480
gaaggccgac gaaagcgcgt tgttggatta agtcgacaga agatgatatt gaaggagcat 12540
ttttgggctt ggctggagct agtggaggtc aacacatcaa tgctattttg gtttagtcgt 12600
ccaggcggat cacaaaattt gtgtcgtttg acatagggat aacagggtaa tgacaacttg 12660
tccacgtgga attctaagct taggatccca ctgtggtgg 12699
<210> 12
<211> 1000
<212> DNA
<213> 人工序列
<220>
<223> 3'构巢曲菌trpC基因同源区
<400> 12
tgatttaata gctccatgtc aacaagaata aaacgcgttt tcgggtttac ctcttccaga 60
tacagctcat ctgcaatgca ttaatgcatt gactgcaacc tagtaacgcc ttcaggctcc 120
ggcgaagaga agaatagctt agcagagcta ttttcatttt cgggagacga gatcaagcag 180
atcaacggtc gtcaagagac ctacgagact gaggaatccg ctcttggctc cacgcgacta 240
tatatttgtc tctaattgta ctttgacatg ctcctcttct ttactctgat agcttgacta 300
tgaaaattcc gtcaccagcc ctgggttcgc aaagataatt gcatgtttct tccttgaact 360
ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcat tcctactaag 420
atggtataca atagtaacca tggttgccta gtgaatgctc cgtaacaccc aatacgccgg 480
ccgaaacttt tttacaactc tcctatgagt cgtttaccca gaatgcacag gtacacttgt 540
ttagaggtaa tccttctttc tagaagtcct cgtgtactgt gtaagcgccc actccacatc 600
tccactcgag cctttttcga gcgaacctcc cctgatctcg aataatctca tcgtcatgcg 660
cggtccaact tctgctagtt cggcatcctt atatcccgtc ttaacgaaaa cgtggtgacg 720
aacctcaatg ctatcctctt tatttacaaa ggtgaccacg cggtttccaa cttttccagc 780
ttctcgggga gggaaaagat gcttcagaat ttgaaccacg cgcttgccca gttttgtctt 840
gaaaccctca aagatcaagt gcgggtagct ctctgacaca gtcccgcggg cagcgttggg 900
aatatcggca cgtagaacaa cattatgcag ggagaagctg gctgtcgggc catgaggaag 960
atgtgagatc gtcatcgcag taggggtacc acggtgttcg 1000
<210> 13
<211> 1007
<212> DNA
<213> 人工序列
<220>
<223> 构巢曲菌trpC基因的5'端
<400> 13
gaattcatgc cagttgttcc agtgatcttc gtttcgaaga tggacatcca atttgtgcaa 60
gttattcggc ctacctggct gtggccgagg cagcgttatc atgaccgtcg ctgttcaaag 120
ataaggcgag aagtttgcgg gctgtcttga cgatatggct tcgttcagac agatatagtt 180
cccggagtcg caggctgcta ttcttctccg aaacaaactc ggctgcactg tttccatcac 240
cgggtctggc gtttgaggat gtcagcgaaa ctcggccgca agtgacaccg aaaagtatcg 300
actccggtgc ccgtttcaag ctagtggctt cctcaacagc gagtcggcca ggagacgtga 360
agcaggacgg gttgccatcc agaccgtgac cgaacgcgtt gatttcatca atcccagcct 420
tttcgctcaa ccaaagagca tcggctttga tttccttcag gtcatacgag gcttgtgcaa 480
tggtctccgc atggatatcg cgtgctgttc tcctatcaac tcggaatttt gtcttagggg 540
atggcgtagg aacctcgaat gctgatcagg atgtgacaaa aacgactcga aaacccgggt 600
tcatcggtgt gctttcggga tcgcaagcgt aaagaaagat tcactcttcc aagacctaga 660
agtatagcaa atcagcagca gaccatcaat gtatagcgaa tgcgcccata caaaacgtga 720
actccccgga gaagcacttt gtccagggac gggaaatagg cttccggaac gggagcattg 780
gcagcacagc tatatcattc taagtaaaca aatgtaatga gcaagcggac gagtgctgaa 840
acctcctatg ccgtgaaggc cgacgaaagc gcgttgttgg attaagtcga cagaagatga 900
tattgaagga gcatttttgg gcttggctgg agctagtgga ggtcaacaca tcaatgctat 960
tttggtttag tcgtccaggc ggatcacaaa atttgtgtcg tttgaca 1007
<210> 14
<211> 17997
<212> DNA
<213> 人工序列
<220>
<223> 载体
<400> 14
ccaccacagt gggatccgaa gcttggaatt cacgtgactt gaagtcatta ccctgttatc 60
cctagcggcc gctctagaac tagtggatct caggctgcca cgtcttcagt gccgtcctgc 120
gcatcatcct catcgtcgtc tgtagggggc ttcgcccatg taatggaagc gcgcttctcg 180
atgggcgttc cctggccccg gcctgttgta gatttggtta cgacaatctt gtccacaaac 240
aagccaacga agaccctttt gtcatctaca ctcgctctac cccaccatga tttcggccca 300
gtagggtctg catccgcatc ttccgggaac cactggtcca gcggcagctt cggagcctcc 360
gcggcctcca gctcggccaa tctttcctcg gcaccctgct gacgcagggt gagcgcagct 420
tgctgtttac ggaagtgctt gcgccccact gggccgtcgt acgcgcccgc agctcgatcc 480
tcatacagct cttcaagagc attcagtgcg tcggctctct ctgcaacgag gttggctcgt 540
tcgcccgact tctcaggggc ctcggtgagt ttaccgaatc ttctagcagc ctcccacagc 600
agggccaggg tctcctcgtc gccttccgca tgccttatct tgttgaagat ccgctcagca 660
acaaacttat ccaatgcagc catagaaaca ttacaggttc cctcgtgctg tccaggagcg 720
gaggggtcaa caaccttccg gcggcggcag cgataagagt ccttgatact ttcctcccct 780
ctcttcgatg tcataacagc gccgcattca cagtacaatt tatccattgc gctgagaatc 840
gcctgaccac gactgagacc cttcccccgt cctcggccat ccagccacgc ctgcagctca 900
taccactcag ccggttctat aatggggccg caatccagtt caaccggtcg tagagtgatt 960
ggatcgcgtt gaattctgta cccctcgatc ttcgttgtcg gtgtgccatc gggcttcttc 1020
ttataaatca cctcagcggc aaagccggcg atcctaggat cccgcagaat cctcatgaca 1080
gtcgcgggat cccaggcaga cgaagcagtt ttcttcccaa tggtctcgcc gcgcgtcggt 1140
acggcatctg cgtccatgcg cttgcagagg ccggtaatgc tccccgggtg gatggcagcc 1200
tgtgagccag gcttaaaggg caagtgcttg tgagtcttga tctctcgcca ccaccatcgt 1260
attacatcag gctcaaattc gaaagggccg gtcagtggtg tggtcgaatg tgccaatttg 1320
ttaatcacta cgttcaccat gcgaccattc cttgtaatct ccttcgtttc cgaaaccagt 1380
tcgaagccat aaggggcctt cccccccaca taacctccca attccctttg aaggttcttt 1440
gtatccagga tcttagcgga tttgagggaa gattccttgt gtgatgcatc cagccgcata 1500
attagatgaa tcaagtccat cacgttgccc tggcggaaga ccccttcttg cgtcgaaacg 1560
atagtgacgc ccagggcgag caactctgag acgatcggaa tagcatccat aaccttcagc 1620
ctgctgaagc gagaaacatc atatacaata atcatattga gtcttcccgc cctgcattca 1680
ttgagaatcc gctcaaactc agggcgttcg gcggtgccaa aggcgctggt gcctggggcc 1740
tctgaaaaat ggccaacaaa tctaaatctc ccgccatccc gctccacctc gcgctgaagg 1800
tcagcggcct tgtcttcatt ggcagagcgc tgggtggctg gcgaagctgc agagctgttc 1860
tcgcgttccc tcgactgtcg gtcgtacgct ccggcatagg tatctacacc tgtgactacg 1920
ccttgtgtca ttttgaggcg aggtgatagg attggaagag ttctaattaa ctgagtagag 1980
aactgttgat tgttggttga tgatgttggt gagactgaga accttggggg tctttatata 2040
gatgttcagc tatgcgggga tgcgatcctg gggtaggaga gcacgtacgg ggccccgctc 2100
gtttgtggct ctccgtgcgg acatcccgtg cggacagtac cagaaagtgc tccgtctctg 2160
ctctatacgg ctctatacgc gtacctcttg aacggtgcgt ggagaggagt ggtgtgtcaa 2220
tttccgcccc gccctcgtgc ggttccgcat gcatccaatc ctaggtcgga actatcccga 2280
gctgcggatg ccgatgcgga cggacaagtg ggaactatca caatcagctt ttcagctggg 2340
ggttattgga tggtagctcc acacaggcgg agaaatacga agggacttac agtgttccgg 2400
ccgtgtcaaa gtgtctgtcg gcgaccctac gcccccaact gagagaactc aaaggttacc 2460
ccagttgggg cagcttattt tttgtatact gttttgtgat agcacgaagt ttttccacgg 2520
tatcttgtta aaaatatata tttgtggcgg gcttacctac atcaaattaa taagagacta 2580
attataaact aaacacacaa gcaagctact ttagggtaaa agtttataaa tgcttttgac 2640
gtataaacgt tgcttgtatt tattattaca attaaaggtg gatagaaaac ctagagacta 2700
gttagaaact aatctcaggt ttgcgttaaa ctaaatcaga gcccgagagg ttaacagaac 2760
ctagaagggg actagatatc cgggtaggga aacaaaaaaa aaaaacaaga cagccacata 2820
ttagggagac tagttagaag ctagttccag gactaggaaa ataaaagaca atgataccac 2880
agtctagttg acaactagat agattctaga ttgaggccaa agtctctgag atccaggtta 2940
gttgcaacta atactagtta gtatctagtc tcctataact ctgaagctag aataacttac 3000
tactattatc ctcaccactg ttcagctgcg caaacggagt gattgcaagg tgttcagaga 3060
ctagttattg actagtcagt gactagcaat aactaacaag gtattaacct accatgtctg 3120
ccatcaccct gcacttcctc gggctcagca gccttttcct cctcattttc atgctcattt 3180
tccttgttta agactgtgac tagtcaaaga ctagtccaga accacaaagg agaaatgtct 3240
taccactttc ttcattgctt gtctcttttg cattatccat gtctgcaact agttagagtc 3300
tagttagtga ctagtccgac gaggacttgc ttgtctccgg attgttggag gaactctcca 3360
gggcctcaag atccacaaca gagccttcta gaagactggt caataactag ttggtctttg 3420
tctgagtctg acttacgagg ttgcatactc gctccctttg cctcgtcaat cgatgagaaa 3480
aagcgccaaa actcgcaata tggctttgaa ccacacggtg ctgagactag ttagaatcta 3540
gtcccaaact agcttggata gcttaccttt gccctttgcg ttgcgacagg tcttgcaggg 3600
tatggttcct ttctcaccag ctgatttagc tgccttgcta ccctcacggc ggatctgcat 3660
aaagagtggc tagaggttat aaattagcac tgatcctagg tacggggctg aatgtaactt 3720
gcctttcctt tctcatcgcg cggcaagaca ggcttgctca aattcctacc agtcacaggg 3780
gtatgcacgg cgtacggacc acttgaacta gtcacagatt agttagcaac tagtctgcat 3840
tgaatggctg tacttacggg ccctcgccat tgtcctgatc atttccagct tcaccctcgt 3900
tgctgcaaag tagttagtga ctagtcaagg actagttgaa atgggagaag aaactcacga 3960
attctcgaca cccttagtat tgtggtcctt ggacttggtg ctgctatata ttagctaata 4020
cactagttag actcacagaa acttacgcag ctcgcttgcg cttcttggta ggagtcgggg 4080
ttgggagaac agtgccttca aacaagcctt cataccatgc tacttgacta gtcagggact 4140
agtcaccaag taatctagat aggacttgcc tttggcctcc atcagttcct tcatagtggg 4200
aggtccattg tgcaatgtaa actccatgcc gtgggagttc ttgtccttca agtgcttgac 4260
caatatgttt ctgttggcag agggaacctg tcaactagtt aataactagt cagaaactag 4320
tatagcagta gactcactgt acgcttgagg catcccttca ctcggcagta gacttcatat 4380
ggatggatat caggcacgcc attgtcgtcc tgtggactag tcagtaacta ggcttaaagc 4440
tagtcgggtc ggcttactat cttgaaatcc ggcagcgtaa gctccccgtc cttaactgcc 4500
tcgagatagt gacagtactc tggggacttt cggagatcgt tatcgcgaat gctcggcata 4560
ctaatcgttg actagtcttg gactagtccc gagcaaaaag gattggagga ggaggaggaa 4620
ggtgagagtg agacaaagag cgaaataaga gcttcaaagg ctatctctaa gcagtatgaa 4680
ggttaagtat ctagttcttg actagattta aaagagattt cgactagtta tgtacctgga 4740
gtttggatat aggaatgtgt tgtggtaacg aaatgtaagg gggaggaaag aaaaagtcgg 4800
tcaagaggta actctaagtc ggccattcct ttttgggagg cgctaaccat aaacggcatg 4860
gtcgacttag agttagctca gggaatttag ggagttatct gcgaccaccg aggaacggcg 4920
gaatgccaaa gaatcccgat ggagctctag ctggcggttg acaaccccac cttttggcgt 4980
ttctgcggcg ttgcaggcgg gactggatac ttcgtagaac cagaaaggca aggcagaacg 5040
cgctcagcaa gagtgttgga agtgatagca tgatgtgcct tgttaactag gtcaaaatct 5100
gcaggtatgc ttgatgttat ccaaagtgtg agagaggaag gtccaaacat acacgattgg 5160
gagagggcct aggtataaga gtttttgagt agaacgcatg tgagcccagc catctcgagg 5220
agattaaaca cgggccggca tttgatggct atgttagtac cccaatggaa agcctgagag 5280
tccagtggtc gcagataact ccctaaattc cctgagctaa ctctaagtcg accatgccgt 5340
ttatggttag cgcctcccaa aaaggaatgg ccgacttaga gttacctctt gaccgacttt 5400
ttctttcctc ccccttacat ttcgttacca caacacattc ctatatccaa actccaggta 5460
cataactagt cgaaatctct tttaaatcta gtcaagaact agatacttaa ccttcatact 5520
gcttagagat agcctttgaa gctcttattt cgctctttgt ctcactctca ccttcctcct 5580
cctcctccaa tcctttttgc tcgggactag tccaagacta gtcaacgatt agtatgccga 5640
gcattcgcga taacgatctc cgaaagtccc cagagtactg tcactatctc gaggcagtta 5700
aggacgggga gcttacgctg ccggatttca agatagtaag ccgacccgac tagctttaag 5760
cctagttact gactagtcca caggacgaca atggcgtgcc tgatatccat ccatatgaag 5820
tctactgccg agtgaaggga tgcctcaagc gtacagtgag tctactgcta tactagtttc 5880
tgactagtta ttaactagtt gacaggttcc ctctgccaac agaaacatat tggtcaagca 5940
cttgaaggac aagaactccc acggcatgga gtttacattg cacaatggac ctcccactat 6000
gaaggaactg atggaggcca aaggcaagtc ctatctagat tacttggtga ctagtccctg 6060
actagtcaag tagcatggta tgaaggcttg tttgaaggca ctgttctccc aaccccgact 6120
cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga gtctaactag tgtattagct 6180
aatatatagc agcaccaagt ccaaggacca caatactaag ggtgtcgaga attcgtgagt 6240
ttcttctccc atttcaacta gtccttgact agtcactaac tactttgcag caacgagggt 6300
gaagctggaa atgatcagga caatggcgag ggcccgtaag tacagccatt caatgcagac 6360
tagttgctaa ctaatctgtg actagttcaa gtggtccgta cgccgtgcat acccctgtga 6420
ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga gaaaggaaag gcaagttaca 6480
ttcagccccg tacctaggat cagtgctaat ttataacctc tagccactct ttatgcagat 6540
ccgccgtgag ggtagcaagg cagctaaatc agctggtgag aaaggaacca taccctgcaa 6600
gacctgtcgc aacgcaaagg gcaaaggtaa gctatccaag ctagtttggg actagattct 6660
aactagtctc agcaccgtgt ggttcaaagc catattgcga gttttggcgc tttttctcat 6720
cgattgacga ggcaaaggga gcgagtatgc aacctcgtaa gtcagactca gacaaagacc 6780
aactagttat tgaccagtct tctagaaggc tctgttgtgg atcttgaggc cctggagagt 6840
tcctccaaca atccggagac aagcaagtcc tcgtcggact agtcactaac tagactctaa 6900
ctagttgcag acatggataa tgcaaaagag acaagcaatg aagaaagtgg taagacattt 6960
ctcctttgtg gttctggact agtctttgac tagtcacagt cttaaacaag gaaaatgagc 7020
atgaaaatga ggaggaaaag gctgctgagc ccgaggaagt gcagggtgat ggcagacatg 7080
gtaggttaat accttgttag ttattgctag tcactgacta gtcaataact agtctctgaa 7140
caccttgcaa tcactccgtt tgcgcagctg aacagtggtg aggataatag tagtaagtta 7200
ttctagcttc agagttatag gagactagat actaactagt attagttgca actaacctgg 7260
atctcagaga ctttggcctc aatctagaat ctatctagtt gtcaactaga ctgtggtatc 7320
attgtctttt attttcctag tcctggaact agcttctaac tagtctccct aatatgtggc 7380
tgtcttgttt tttttttttg tttccctacc cggatatcta gtccccttct aggttctgtt 7440
aacctctcgg gctctgattt agtttaacgc aaacctgaga ttagtttcta actagtctct 7500
aggttttcta tccaccttta attgtaataa taaatacaag caacgtttat acgtcaaaag 7560
catttataaa cttttaccct aaagtagctt gcttgtgtgt ttagtttata attagtctct 7620
tattaatttg atgtaggtaa gcccgccaca aatatatatt tttaacaaga taccgtggaa 7680
aaacttcgtg ctatcacaaa acagtataca aaaaataagc tgatccacag gacgggtgtg 7740
gtcgccatga tcgcgtagtc gatagtggct ccaagtagcg aagcgagcag gactgggcgg 7800
cggccaaagc ggtcggacag tgctccgaga acgggtgcgc atagaaattg catcaacgca 7860
tatagcgcta gcagcacgcc atagtgactg gcgatgctgt cggaatggac gatatcccgc 7920
aagaggcccg gcagtaccgg cataaccaag cctatgccta cagcatccag ggtgacggtg 7980
ccgaggatga cgatgagcgc attgttagat ttcatacacg gtgcctgact gcgttagcaa 8040
tttaactgtg ataaactacc gcattaaagc ttcgacatca cccttaccca aactatatcc 8100
aatgagcaaa gaataacgag tcaaagcggg cgcatttttc atcacatacg agtatgcaca 8160
gtcaggactc cacgtcatac atcaaaaact tggaacgcat gagtctagct cagctcggct 8220
cttttccgat ttttgcgcag cttctgttgc ggatcttgct gcttgtggag tctatgcccc 8280
ggctgatgca ttgaaacaca acgcgcagat gatccaatca taccaaccag acgcatcagc 8340
gcgtgtagct gggggaaggg taggtggtgt agcccagaaa gcgacacggc tggctttcaa 8400
gaagtttatc aaccctagac agctttggag cggatacccg gctcttgtgg cgcatagctt 8460
gccagtgtcg gcgatacaga tgcctctgta cgagactttt cggtatcgaa tttctgaata 8520
tagattcgga gatcgagaga aggtgctaga aagatcaaga gattatggaa aagaaacagg 8580
cccattcgac aatcggagag gctgcagcga cagccgcgat aagtgctgca gcctcgggcg 8640
gtatagccag tgtcttgaca gcacccatgg atatagtccg gacacgaatc atgctcgatg 8700
ctgcagacac aaccgcacct cagaagaaaa ggatgatcaa taccgtacgg gagattatac 8760
gaacagatgg cccgagagga ctattccgag ggtgtgctat caacacgttt atggccgctg 8820
tcggatcagg gttatacttt ggtctctacg aaagcaccaa atggtggcta ggctcggact 8880
cgatggataa tagtgccatg ttagagtaag gggtgatggg aaatcttgta tataattgtg 8940
attgtttgta cgatagtggc cgactgtaca ttagtgatac cccactctta gaaaatagac 9000
caatctccag ctgcaccttc agacaatccg ggtaaaaatt ctcgtctatg ttggagattg 9060
gtgtgatttt gaaacatgac ccttgactct gatcttgaat atgtccatat ctcgaggcag 9120
gcatattatt catatagaga gggtatccct tagcatcggt ctgtcgtagt atccgactgc 9180
tgaatttatg aatcgcatca tacttgcgac atactgccat aaaaagagta cgtatccacc 9240
actacttatt gcgcaccaac acgcttcagg tatgcatccc atccctcttt ctggtaccgc 9300
ttcgccgcct ccacgggatc aggagcagca taaattccac gaccagcaat gataaagtcg 9360
gcaccgcgtc caacagcaga ttcaggagtc tggtattgct gtcccagctt gtctcccttc 9420
gaggagaggt tgacacctgt cgtgaacacg acgaaatcct cctcctccga aggagagcta 9480
acttcagact gaacctcgcc caggtgacgc gtcgagacga atcccatcac aaacttctta 9540
tacttccgag catagtcaac agaagaagta gtatattgac cggtagccaa agatcccttg 9600
gatgtcatct ccgcaaggat caaaaggccc ctctcagagc cgtagggaaa gtcctcggcc 9660
gaagcagtct gggctagagc ctcgacgata ccctcaccgg gcagaatact gcagttgatg 9720
atgtgggccc actcggagat gcgcagagtg ccgccatggt actgcttttg gactgtgttt 9780
ccgatatcga tgaacttgcg atcttcgaag atgaggaaat tgtgcttctc tgcaagggcc 9840
ttcagaccgg tgatggtctc ttcgctgaaa tcggagagga tatcgatgtg agttttgatc 9900
acggcaatgt acggaccgag tcctgttaaa taatccacca ttaaccatta ttagatcatt 9960
atgtaagtgg catccccggt gcgcatacgg tcagccaaat ccagcagctc tttggtggtt 10020
gtcacgtcgg ccgaaacggt gacattggtt ttcttggcct cggcaacctc aaagagcttc 10080
tttacgaggg cattggggtg cttgctagcg cgtgcactgt aggtcaattg cgacttggaa 10140
gacatgttgg cgatggaggg gtagcgcggg gttctgcaac tatcgtagaa atgagcactt 10200
agtggttgaa accggcttat tcagtagatt aatacttgaa gtttttagta atcagacaga 10260
ataatcagga tgtccaatta ctacctctta atatgtggaa tgaatgatag atataaattg 10320
tacgacaatt gccgcgaaaa attaaaatgg atctatggag gggacagtca tgcactagcc 10380
acacgttcct ccgcctgtgg ggtgagccac atgcctcatc tggaccaaac acatcgatgc 10440
agtcacatgc agataagatt agggcctatc cttagggtac ctgtccgcgc ggggattatg 10500
cctggctttt tgcctgcttt tgatatcctt tcaaggacat agcgataagt ccaaccttat 10560
cggccataat aatgtcaatg ccagcagcgg cttgggccta gaatattcca tcagctactg 10620
aacaacttct acatcacaat ttgaaagctc taagaattaa tatagaagca cttaccttcg 10680
cattttctgg tatattgttc tgagatccat aggatcagct tatcgatgat aagctgtcaa 10740
acatgagaat tcgggccgtc gaccaattct catgtttgac agcttatcat cgaatttctg 10800
ccattcatcc gcttattatc acttattcag gcgtagcaac caggcgttta agggcaccaa 10860
taactgcctt aaaaaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca 10920
ttaagcattc tgccgacatg gaagccatca caaacggcat gatgaacctg aatcgccagc 10980
ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaac gggggcgaag 11040
aagttgtcca tattggccac gtttaaatca aaactggtga aactcaccca gggattggct 11100
gagacgaaaa acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa 11160
cacgccacat cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc 11220
cagagcgatg aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta 11280
tcccatatca ccagctcacc gtctttcatt gccatacgta attccagatg taaattcatc 11340
atcaggcggg caagaatgtg aataaaggcc ggataaaact tgtgcttatt tttctttacg 11400
gtctttaaaa aggccgtaat atccagctga acggtctggt tataggtaca ttgagcaact 11460
gactgaaatg cctcaaaatg ttctttacga tgccattggg atatatcaac ggtggtatat 11520
ccagtgattt ttttctccat tttagcttcc ttagctcctg aaaatctcga taactcaaaa 11580
aatacgcccg gtagtgatct tatttcatta tggtgaaagt tggaacctct tacgtgccga 11640
tcaacgtctc attttcgcca aaagttggcc cagggcttcc cggtatcaac agggacacca 11700
ggatttattt attctgcgaa gtgatcttcc gtcacaggta tttattcgcg ataagctcat 11760
ggagcggcgt aaccgtcgca caggaaggac agagaaagcg cggatctggg aagtgacgga 11820
cagaacggtc aggacctgga ttggggaggc ggttgccgcc gctgctgctg acggtgtgac 11880
gttctctgtt ccggtcacac cacatacgtt ccgccattcc tatgcgatgc acatgctgta 11940
tgccggtata ccgctgaaag ttctgcaaag cctgatggga cataagtcca tcagttcaac 12000
ggaagtctac acgaaggttt ttgcgctgga tgtggctgcc cggcaccggg tgcagtttgc 12060
gatgccggag tctgatgcgg ttgcgatgct gaaacaatta tcctgagaat aaatgccttg 12120
gcctttatat ggaaatgtgg aactgagtgg atatgctgtt tttgtctgtt aaacagagaa 12180
gctggctgtt atccactgag aagcgaacga aacagtcggg aaaatctccc attatcgtag 12240
agatccgcat tattaatctc aggagcctgt gtagcgttta taggaagtag tgttctgtca 12300
tgatgcctgc aagcggtaac gaaaacgatt tgaatatgcc ttcaggaaca atagaaatct 12360
tcgtgcggtg ttacgttgaa gtggagcgga ttatgtcagc aatggacaga acaacctaat 12420
gaacacagaa ccatgatgtg gtctgtcctt ttacagccag tagtgctcgc cgcagtcgag 12480
cgacagggcg aagcccctgg ttgccctcgc cgctgggctg gcggccgtct atggccctgc 12540
aaacgcgcca gaaacgccgt cgaagccgtg tgcgagacac cgcggccggc cgccggcgtt 12600
gtggatacct cgcggaaaac ttggccctca ctgacagatg aggggcggac gttgacactt 12660
gaggggccga ctcacccggc gcggcgttga cagatgaggg gcaggctcga tttcggccgg 12720
cgacgtggag ctggccagcc tcgcaaatcg gcgaaaacgc ctgattttac gcgagtttcc 12780
cacagatgat gtggacaagc ctggggataa gtgccctgcg gtattgacac ttgaggggcg 12840
cgactactga cagatgaggg gcgcgatcct tgacacttga ggggcagagt gctgacagat 12900
gaggggcgca cctattgaca tttgaggggc tgtccacagg cagaaaatcc agcatttgca 12960
agggtttccg cccgtttttc ggccaccgct aacctgtctt ttaacctgct tttaaaccaa 13020
tatttataaa ccttgttttt aaccagggct gcgccctgtg cgcgtgaccg cgcacgccga 13080
aggggggtgc ccccccttct cgaaccctcc cggtcgagtg agcgaggaag caccagggaa 13140
cagcacttat atattctgct tacacacgat gcctgaaaaa acttcccttg gggttatcca 13200
cttatccacg gggatatttt tataattatt ttttttatag tttttagatc ttctttttta 13260
gagcgccttg taggccttta tccatgctgg ttctagagaa ggtgttgtga caaattgccc 13320
tttcagtgtg acaaatcacc ctcaaatgac agtcctgtct gtgacaaatt gcccttaacc 13380
ctgtgacaaa ttgccctcag aagaagctgt tttttcacaa agttatccct gcttattgac 13440
tcttttttat ttagtgtgac aatctaaaaa cttgtcacac ttcacatgga tctgtcatgg 13500
cggaaacagc ggttatcaat cacaagaaac gtaaaaatag cccgcgaatc gtccagtcaa 13560
acgacctcac tgaggcggca tatagtctct cccgggatca aaaacgtatg ctgtatctgt 13620
tcgttgacca gatcagaaaa tctgatggca ccctacagga acatgacggt atctgcgaga 13680
tccatgttgc taaatatgct gaaatattcg gattgacctc tgcggaagcc agtaaggata 13740
tacggcaggc attgaagagt ttcgcgggga aggaagtggt tttttatcgc cctgaagagg 13800
atgccggcga tgaaaaaggc tatgaatctt ttccttggtt tatcaaacgt gcgcacagtc 13860
catccagagg gctttacagt gtacatatca acccatatct cattcccttc tttatcgggt 13920
tacagaaccg gtttacgcag tttcggctta gtgaaacaaa agaaatcacc aatccgtatg 13980
ccatgcgttt atacgaatcc ctgtgtcagt atcgtaagcc ggatggctca ggcatcgtct 14040
ctctgaaaat cgactggatc atagagcgtt accagctgcc tcaaagttac cagcgtatgc 14100
ctgacttccg ccgccgcttc ctgcaggtct gtgttaatga gatcaacagc agaactccaa 14160
tgcgcctctc atacattgag aaaaagaaag gccgccagac gactcatatc gtattttcct 14220
tccgcgatat cacttccatg acgacaggat aggctagtga taataagtga ctgaggtatg 14280
tgctcttctt atctcctttt gtagtgttgc tcttatttta aacaactttg cggttttttg 14340
atgactttgc gattttgttg ttgctttgca gtaaattgca agatttaata aaaaaacgca 14400
aagcaatgat taaaggatgt tcagaatgaa actcatggaa acacttaacc agtgcataaa 14460
cgctggtcat gaaatgacga aggctatcgc cattgcacag tttaatgatg acagcccgga 14520
agcgaggaaa ataacccggc gctggagaat aggtgaagca gcggatttag ttggggtttc 14580
ttctcaggct atcagagatg ccgagaaagc agggcgacta ccgcacccgg atatggaaat 14640
tcgaggacgg gttgagcaac gtgttggtta tacaattgaa caaattaatc atatgcgtga 14700
tgtgtttggt acgcgattgc gacgtgctga agacgtattt ccaccggtga tcggggttgc 14760
tgcccataaa gaaaggtggc gtttacaaaa cctcagtttc tgttcatctt gctcaggatc 14820
tggctctgaa ggggctacgt gttttgctcg tggaaggtaa cgacccccag ggaacagcct 14880
caatgtatca cggatgggta ccagatcttc atattcatgc agaagacact ctcctgcctt 14940
tctatcttgg ggaaaaggac gatgtcactt atgcaataaa gcccacttgc tggccggggc 15000
ttgacattat tccttcctgt ctggctctgc accgtattga aactgagtta atgggcaaat 15060
ttgatgaagg taaactgccc accgatccac acctgatgct ccgactggcc attgaaactg 15120
ttgctcatga ctatgatgtc atagttattg acagcgcgcc taacctgggt atcggcacga 15180
ttaatgtcgt atgtgctgct gatgtgctga ttgttcccac gcctgctgag ttgtttgact 15240
acacctccgc actgcagttt ttcgatatgc ttcgtgatct gctcaagaac gttgatctta 15300
aagggttcga gcctgatgta cgtattttgc ttaccaaata cagcaatagt aatggctctc 15360
agtccccgtg gatggaggag caaattcggg atgcctgggg aagcatggtt ctaaaaaatg 15420
ttgtacgtga aacggatgaa gttggtaaag gtcagatccg gatgagaact gtttttgaac 15480
aggccattga tcaacgctct tcaactggtg cctggagaaa tgctctttct atttgggaac 15540
ctgtctgcaa tgaaattttc gatcgtctga ttaaaccacg ctgggagatt agataatgaa 15600
gcgtgcgcct gttattccaa aacatacgct caatactcaa ccggttgaag atacttcgtt 15660
atcgacacca gctgccccga tggtggattc gttaattgcg cgcgtaggag taatggctcg 15720
cggtaatgcc attactttgc ctgtatgtgg tcgggatgtg aagtttactc ttgaagtgct 15780
ccggggtgat agtgttgaga agacctctcg ggtatggtca ggtaatgaac gtgaccagga 15840
gctgcttact gaggacgcac tggatgatct catcccttct tttctactga ctggtcaaca 15900
gacaccggcg ttcggtcgaa gagtatctgg tgtcatagaa attgccgatg ggagtcgccg 15960
tcgtaaagct gctgcactta ccgaaagtga ttatcgtgtt ctggttggcg agctggatga 16020
tgagcagatg gctgcattat ccagattggg taacgattat cgcccaacaa gtgcttatga 16080
acgtggtcag cgttatgcaa gccgattgca gaatgaattt gctggaaata tttctgcgct 16140
ggctgatgcg gaaaatattt cacgtaagat tattacccgc tgtatcaaca ccgccaaatt 16200
gcctaaatca gttgttgctc ttttttctca ccccggtgaa ctatctgccc ggtcaggtga 16260
tgcacttcaa aaagccttta cagataaaga ggaattactt aagcagcagg catctaacct 16320
tcatgagcag aaaaaagctg gggtgatatt tgaagctgaa gaagttatca ctcttttaac 16380
ttctgtgctt aaaacgtcat ctgcatcaag aactagttta agctcacgac atcagtttgc 16440
tcctggagcg acagtattgt ataagggcga taaaatggtg cttaacctgg acaggtctcg 16500
tgttccaact gagtgtatag agaaaattga ggccattctt aaggaacttg aaaagccagc 16560
accctgatgc gaccacgttt tagtctacgt ttatctgtct ttacttaatg tcctttgtta 16620
caggccagaa agcataactg gcctgaatat tctctctggg cccactgttc cacttgtatc 16680
gtcggtctga taatcagact gggaccacgg tcccactcgt atcgtcggtc tgattattag 16740
tctgggacca cggtcccact cgtatcgtcg gtctgattat tagtctggga ccacggtccc 16800
actcgtatcg tcggtctgat aatcagactg ggaccacggt cccactcgta tcgtcggtct 16860
gattattagt ctgggaccat ggtcccactc gtatcgtcgg tctgattatt agtctgggac 16920
cacggtccca ctcgtatcgt cggtctgatt attagtctgg aaccacggtc ccactcgtat 16980
cgtcggtctg attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta 17040
gtctgggacc acgatcccac tcgtgttgtc ggtctgatta tcggtctggg accacggtcc 17100
cacttgtatt gtcgatcaga ctatcagcgt gagactacga ttccatcaat gcctgtcaag 17160
ggcaagtatt gacatgtcgt cgtaacctgt agaacggagt aacctcggtg tgcggttgta 17220
tgcctgctgt ggattgctgc tgtgtcctgc ttatccacaa cattttgcgc acggttatgt 17280
ggacaaaata cctggttacc caggccgtgc cggcacgtta accgggctgc atccgatgca 17340
agtgtgtcgc tgtcgacgag ctcgcgagct cggacatgag gttgccccgt attcagtgtc 17400
gctgatttgt attgtctgaa gttgttttta cgttaagttg atgcagatca attaatacga 17460
tacctgcgtc ataattgatt atttgacgtg gtttgatggc ctccacgcac gttgtgatat 17520
gtagatgata atcattatca ctttacgggt cctttccggt gatccgacag gttacggggc 17580
ggcgacctcg cgggttttcg ctatttatga aaattttccg gtttaaggcg tttccgttct 17640
tcttcgtcat aacttaatgt ttttatttaa aataccctct gaaaagaaag gaaacgacag 17700
gtgctgaaag cgagcttttt ggcctctgtc gtttcctttc tctgtttttg tccgtggaat 17760
gaacaatgga agtccgagct catcgctaat aacttcgtat agcatacatt atacgaagtt 17820
atattcgatg cggccaaggt gagccagtgt gattacattt gcggcctaac tgtggccagt 17880
ccagttacgc tggagtcact agtatttagg tgacactata gaagcggccg ctagggataa 17940
cagggtaatg acaacttgtc cacgtggaat tctaagctta ggatcccact gtggtgg 17997
<210> 15
<211> 485
<212> DNA
<213> 人工序列
<220>
<223> 真菌诱导型启动子
<400> 15
tttgaggcga ggtgatagga ttggaagagt tctaattaac tgagtagaga actgttgatt 60
gttggttgat gatgttggtg agactgagaa ccttgggggt ctttatatag atgttcagct 120
atgcggggat gcgatcctgg ggtaggagag cacgtacggg gccccgctcg tttgtggctc 180
tccgtgcgga catcccgtgc ggacagtacc agaaagtgct ccgtctctgc tctatacggc 240
tctatacgcg tacctcttga acggtgcgtg gagaggagtg gtgtgtcaat ttccgccccg 300
ccctcgtgcg gttccgcatg catccaatcc taggtcggaa ctatcccgag ctgcggatgc 360
cgatgcggac ggacaagtgg gaactatcac aatcagcttt tcagctgggg gttattggat 420
ggtagctcca cacaggcgga gaaatacgaa gggacttaca gtgttccggc cgtgtcaaag 480
tgtct 485
<210> 16
<211> 1842
<212> DNA
<213> 人工序列
<220>
<223> 真菌密码子优化的整合酶基因
<400> 16
tcaggctgcc acgtcttcag tgccgtcctg cgcatcatcc tcatcgtcgt ctgtaggggg 60
cttcgcccat gtaatggaag cgcgcttctc gatgggcgtt ccctggcccc ggcctgttgt 120
agatttggtt acgacaatct tgtccacaaa caagccaacg aagacccttt tgtcatctac 180
actcgctcta ccccaccatg atttcggccc agtagggtct gcatccgcat cttccgggaa 240
ccactggtcc agcggcagct tcggagcctc cgcggcctcc agctcggcca atctttcctc 300
ggcaccctgc tgacgcaggg tgagcgcagc ttgctgttta cggaagtgct tgcgccccac 360
tgggccgtcg tacgcgcccg cagctcgatc ctcatacagc tcttcaagag cattcagtgc 420
gtcggctctc tctgcaacga ggttggctcg ttcgcccgac ttctcagggg cctcggtgag 480
tttaccgaat cttctagcag cctcccacag cagggccagg gtctcctcgt cgccttccgc 540
atgccttatc ttgttgaaga tccgctcagc aacaaactta tccaatgcag ccatagaaac 600
attacaggtt ccctcgtgct gtccaggagc ggaggggtca acaaccttcc ggcggcggca 660
gcgataagag tccttgatac tttcctcccc tctcttcgat gtcataacag cgccgcattc 720
acagtacaat ttatccattg cgctgagaat cgcctgacca cgactgagac ccttcccccg 780
tcctcggcca tccagccacg cctgcagctc ataccactca gccggttcta taatggggcc 840
gcaatccagt tcaaccggtc gtagagtgat tggatcgcgt tgaattctgt acccctcgat 900
cttcgttgtc ggtgtgccat cgggcttctt cttataaatc acctcagcgg caaagccggc 960
gatcctagga tcccgcagaa tcctcatgac agtcgcggga tcccaggcag acgaagcagt 1020
tttcttccca atggtctcgc cgcgcgtcgg tacggcatct gcgtccatgc gcttgcagag 1080
gccggtaatg ctccccgggt ggatggcagc ctgtgagcca ggcttaaagg gcaagtgctt 1140
gtgagtcttg atctctcgcc accaccatcg tattacatca ggctcaaatt cgaaagggcc 1200
ggtcagtggt gtggtcgaat gtgccaattt gttaatcact acgttcacca tgcgaccatt 1260
ccttgtaatc tccttcgttt ccgaaaccag ttcgaagcca taaggggcct tcccccccac 1320
ataacctccc aattcccttt gaaggttctt tgtatccagg atcttagcgg atttgaggga 1380
agattccttg tgtgatgcat ccagccgcat aattagatga atcaagtcca tcacgttgcc 1440
ctggcggaag accccttctt gcgtcgaaac gatagtgacg cccagggcga gcaactctga 1500
gacgatcgga atagcatcca taaccttcag cctgctgaag cgagaaacat catatacaat 1560
aatcatattg agtcttcccg ccctgcattc attgagaatc cgctcaaact cagggcgttc 1620
ggcggtgcca aaggcgctgg tgcctggggc ctctgaaaaa tggccaacaa atctaaatct 1680
cccgccatcc cgctccacct cgcgctgaag gtcagcggcc ttgtcttcat tggcagagcg 1740
ctgggtggct ggcgaagctg cagagctgtt ctcgcgttcc ctcgactgtc ggtcgtacgc 1800
tccggcatag gtatctacac ctgtgactac gccttgtgtc at 1842
<210> 17
<211> 613
<212> PRT
<213> 人工序列
<220>
<223> 真菌密码子优化的整合酶
<400> 17
Met Thr Gln Gly Val Val Thr Gly Val Asp Thr Tyr Ala Gly Ala Tyr
1 5 10 15
Asp Arg Gln Ser Arg Glu Arg Glu Asn Ser Ser Ala Ala Ser Pro Ala
20 25 30
Thr Gln Arg Ser Ala Asn Glu Asp Lys Ala Ala Asp Leu Gln Arg Glu
35 40 45
Val Glu Arg Asp Gly Gly Arg Phe Arg Phe Val Gly His Phe Ser Glu
50 55 60
Ala Pro Gly Thr Ser Ala Phe Gly Thr Ala Glu Arg Pro Glu Phe Glu
65 70 75 80
Arg Ile Leu Asn Glu Cys Arg Ala Gly Arg Leu Asn Met Ile Ile Val
85 90 95
Tyr Asp Val Ser Arg Phe Ser Arg Leu Lys Val Met Asp Ala Ile Pro
100 105 110
Ile Val Ser Glu Leu Leu Ala Leu Gly Val Thr Ile Val Ser Thr Gln
115 120 125
Glu Gly Val Phe Arg Gln Gly Asn Val Met Asp Leu Ile His Leu Ile
130 135 140
Met Arg Leu Asp Ala Ser His Lys Glu Ser Ser Leu Lys Ser Ala Lys
145 150 155 160
Ile Leu Asp Thr Lys Asn Leu Gln Arg Glu Leu Gly Gly Tyr Val Gly
165 170 175
Gly Lys Ala Pro Tyr Gly Phe Glu Leu Val Ser Glu Thr Lys Glu Ile
180 185 190
Thr Arg Asn Gly Arg Met Val Asn Val Val Ile Asn Lys Leu Ala His
195 200 205
Ser Thr Thr Pro Leu Thr Gly Pro Phe Glu Phe Glu Pro Asp Val Ile
210 215 220
Arg Trp Trp Trp Arg Glu Ile Lys Thr His Lys His Leu Pro Phe Lys
225 230 235 240
Pro Gly Ser Gln Ala Ala Ile His Pro Gly Ser Ile Thr Gly Leu Cys
245 250 255
Lys Arg Met Asp Ala Asp Ala Val Pro Thr Arg Gly Glu Thr Ile Gly
260 265 270
Lys Lys Thr Ala Ser Ser Ala Trp Asp Pro Ala Thr Val Met Arg Ile
275 280 285
Leu Arg Asp Pro Arg Ile Ala Gly Phe Ala Ala Glu Val Ile Tyr Lys
290 295 300
Lys Lys Pro Asp Gly Thr Pro Thr Thr Lys Ile Glu Gly Tyr Arg Ile
305 310 315 320
Gln Arg Asp Pro Ile Thr Leu Arg Pro Val Glu Leu Asp Cys Gly Pro
325 330 335
Ile Ile Glu Pro Ala Glu Trp Tyr Glu Leu Gln Ala Trp Leu Asp Gly
340 345 350
Arg Gly Arg Gly Lys Gly Leu Ser Arg Gly Gln Ala Ile Leu Ser Ala
355 360 365
Met Asp Lys Leu Tyr Cys Glu Cys Gly Ala Val Met Thr Ser Lys Arg
370 375 380
Gly Glu Glu Ser Ile Lys Asp Ser Tyr Arg Cys Arg Arg Arg Lys Val
385 390 395 400
Val Asp Pro Ser Ala Pro Gly Gln His Glu Gly Thr Cys Asn Val Ser
405 410 415
Met Ala Ala Leu Asp Lys Phe Val Ala Glu Arg Ile Phe Asn Lys Ile
420 425 430
Arg His Ala Glu Gly Asp Glu Glu Thr Leu Ala Leu Leu Trp Glu Ala
435 440 445
Ala Arg Arg Phe Gly Lys Leu Thr Glu Ala Pro Glu Lys Ser Gly Glu
450 455 460
Arg Ala Asn Leu Val Ala Glu Arg Ala Asp Ala Leu Asn Ala Leu Glu
465 470 475 480
Glu Leu Tyr Glu Asp Arg Ala Ala Gly Ala Tyr Asp Gly Pro Val Gly
485 490 495
Arg Lys His Phe Arg Lys Gln Gln Ala Ala Leu Thr Leu Arg Gln Gln
500 505 510
Gly Ala Glu Glu Arg Leu Ala Glu Leu Glu Ala Ala Glu Ala Pro Lys
515 520 525
Leu Pro Leu Asp Gln Trp Phe Pro Glu Asp Ala Asp Ala Asp Pro Thr
530 535 540
Gly Pro Lys Ser Trp Trp Gly Arg Ala Ser Val Asp Asp Lys Arg Val
545 550 555 560
Phe Val Gly Leu Phe Val Asp Lys Ile Val Val Thr Lys Ser Thr Thr
565 570 575
Gly Arg Gly Gln Gly Thr Pro Ile Glu Lys Arg Ala Ser Ile Thr Trp
580 585 590
Ala Lys Pro Pro Thr Asp Asp Asp Glu Asp Asp Ala Gln Asp Gly Thr
595 600 605
Glu Asp Val Ala Ala
610

Claims (20)

1.一种真菌人工染色体(FAC),其包含:
至少一个细菌复制起点;
细菌选择标记基因;
真菌选择标记基因;
真菌自主复制元件;和
克隆位点,其包含一种或多种限制性酶的多个识别位点,所述限制性酶消化后产生非互补单链突出端。
2.根据权利要求1所述的真菌人工染色体(FAC),其中消化FAC后产生非互补单链突出端的限制性酶选自Bsr I、I-CeuI、BstXI、I-SceI及其组合。
3.根据权利要求1所述的真菌人工染色体(FAC),其中消化FAC后产生非互补单链突出端的限制性酶选自BstXI、I-SceI及其组合。
4.一种真菌人工染色体(FAC),其包含:
至少一个细菌复制起点;
细菌选择标记基因;
真菌选择标记基因;
真菌自主复制元件;和
整合位点,用于与宿主重组。
5.据权利要求4所述的真菌人工染色体(FAC),其中所述整合位点是attP位点。
6.据权利要求4所述的真菌人工染色体(FAC),其还包含整合酶基因。
7.据权利要求6所述的真菌人工染色体(FAC),其中所述整合酶基因是真菌密码子优化的phi31整合酶基因。
8.据权利要求6所述的真菌人工染色体(FAC),其还包含可操作地连接到整合酶基因的真菌诱导型启动子。
9.据权利要求8所述的真菌人工染色体(FAC),其中所述真菌诱导型启动子选自alcA(p)、glaA(p)启动子和sucA启动子。
10.一种真菌人工染色体(FAC),其包含:
至少一个细菌复制起点;
细菌选择标记基因;
真菌选择标记基因;和
相同方向的两种真菌DNA序列,其中所述两种真菌DNA序列各自与宿主真菌DNA序列同源。
11.根据权利要求1-10任一项所述的真菌人工染色体,其中所述细菌选择标记基因选自氯霉素抗性基因(camR)、kanR、ampR、genR、tetA、strepR、galK及其组合。
12.根据权利要求1-10任一项所述的真菌人工染色体,其中所述至少一个细菌复制起点选自低拷贝数细菌复制起点、诱导型高拷贝数细菌复制起点及其组合。
13.根据权利要求12所述的真菌人工染色体,其中所述低拷贝数细菌复制起点是oriS并且所述诱导型高拷贝数细菌复制起点是oriV。
14.根据权利要求1-10任一项所述的真菌人工染色体,其中所述真菌选择标记基因选自pyrG、ptrA、trpC及其组合。
15.根据权利要求1-10任一项所述的真菌人工染色体,其还包含至少20kb插入物。
16.根据权利要求1-10任一项所述的真菌人工染色体,其还包含至少100kb插入物。
17.根据权利要求1-10任一项所述的真菌人工染色体,其还包含至少一种次生代谢物(SM)基因簇。
18.一种非偏倚FAC文库构建方法,其包括:
提供来自真菌的高分子量(HMW)基因组DNA;
将所述HMW基因组DNA机械剪切成100kb-300kb长度的片段;
在所述DNA片段上产生平末端;
将BstXI接头连接到所述平末端,以此产生接头连接的DNA片段;
通过脉冲场凝胶电泳纯化所述接头连接的DNA片段;以及
将所述纯化的接头连接的DNA片段连接进入BstXI-酶切的、权利要求1-14任一项的真菌人工染色体(FAC)。
19.一种在次生代谢物(SM)基因簇中的靶位点处缺失DNA序列的方法,其包括:
提供权利要求17所述的真菌人工染色体(FAC);
提供缺失DNA,其包括a)与靶DNA序列第一侧的侧翼序列同源的第一序列,b)与靶DNA序列第二侧的侧翼序列同源的第二序列,和c)细菌选择标记;
转化真菌人工染色体并将DNA插入表达Red/ET重组酶的大肠杆菌菌株;和
选择包含细菌选择标记的转化的大肠杆菌细胞。
20.一种将DNA序列插入次生代谢物(SM)基因簇中的靶位点的方法,其包括:
提供权利要求17所述的真菌人工染色体(FAC);
提供插入DNA,其包括a)与靶位点第一侧的侧翼序列同源的第一序列,b)待插入序列,c)与靶位点第二侧的侧翼序列同源的第二序列,和d)细菌选择标记;
转化FAC并将DNA插入表达Red/ET重组酶的大肠杆菌菌株;和
选择包含细菌选择标记的转化的大肠杆菌细胞。
CN201710302226.0A 2016-01-25 2017-05-02 真菌人工染色体、组成、方法和用途 Active CN107574178B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662286542P 2016-01-25 2016-01-25
US15/143,493 2016-04-29
US15/143,493 US10337019B2 (en) 2016-01-25 2016-04-29 Fungal artificial chromosomes, compositions, methods and uses therefor

Publications (2)

Publication Number Publication Date
CN107574178A true CN107574178A (zh) 2018-01-12
CN107574178B CN107574178B (zh) 2022-05-27

Family

ID=59358906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710302226.0A Active CN107574178B (zh) 2016-01-25 2017-05-02 真菌人工染色体、组成、方法和用途

Country Status (2)

Country Link
US (2) US10337019B2 (zh)
CN (1) CN107574178B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109385417A (zh) * 2017-08-03 2019-02-26 华东理工大学 体内dna无缝组装方法
CN114075515A (zh) * 2020-08-12 2022-02-22 北京化工大学 一种产虫草素基因工程菌及其应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102633074B1 (ko) * 2021-08-27 2024-02-05 한국화학연구원 아스퍼질러스 몬테네그로이 sfc20200425-m27 균주를 이용한 식물병 방제용 조성물 및 이의 제조방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5928867A (en) * 1995-05-10 1999-07-27 Rijksuniversiteit Leiden Method of isolating exonic gene segments of eukaryotic genes, exon trapping vectors for use therein
CN101506366A (zh) * 2006-06-09 2009-08-12 森温特股份有限公司 可用于将宏基因组文库转移至多种细菌物种中的基于rk2的广宿主范围克隆载体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110185456A1 (en) * 1999-05-06 2011-07-28 Nordine Cheikh Annotatd plant genes
DE60331644D1 (de) * 2002-04-22 2010-04-22 Novozymes Inc Verfahren zur herstellung von varianten einer dna-sequenz in filamentösen pilzen

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5928867A (en) * 1995-05-10 1999-07-27 Rijksuniversiteit Leiden Method of isolating exonic gene segments of eukaryotic genes, exon trapping vectors for use therein
CN101506366A (zh) * 2006-06-09 2009-08-12 森温特股份有限公司 可用于将宏基因组文库转移至多种细菌物种中的基于rk2的广宿主范围克隆载体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIN WOO BOK ET AL.: "Fungal artificial chromosomes for mining of the fungal secondary metabolome", 《BMC GENOMICS》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109385417A (zh) * 2017-08-03 2019-02-26 华东理工大学 体内dna无缝组装方法
CN114075515A (zh) * 2020-08-12 2022-02-22 北京化工大学 一种产虫草素基因工程菌及其应用
CN114075515B (zh) * 2020-08-12 2023-12-15 北京化工大学 一种产虫草素基因工程菌及其应用

Also Published As

Publication number Publication date
US10337019B2 (en) 2019-07-02
US20190264216A1 (en) 2019-08-29
US20170211077A1 (en) 2017-07-27
CN107574178B (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
JP7291114B2 (ja) 変更PAM特異性を有する遺伝子操作CRISPR-Cas9ヌクレアーゼ
Wang et al. Efficient genome editing in Fusarium oxysporum based on CRISPR/Cas9 ribonucleoprotein complexes
JP7423520B2 (ja) Cas9ベースノックイン方針の効力を改善するための組成物及び方法
KR102647766B1 (ko) 클래스 ii, 타입 v crispr 시스템
CA2913865C (en) A method for producing precise dna cleavage using cas9 nickase activity
US10913941B2 (en) Enzymes with RuvC domains
CN110520528A (zh) 高保真性cas9变体及其应用
CN107012164A (zh) CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用
CN104245938B (zh) 用于柄锈菌亚门和黑粉菌亚门的基因操作和表达系统
KR102210700B1 (ko) 아데노신 디아미나아제를 이용한 염기 교정 확인 방법
US20190144852A1 (en) Combinatorial Metabolic Engineering Using a CRISPR System
CN107574178A (zh) 真菌人工染色体、组成、方法和用途
CN113166798A (zh) 通过核酸内切酶保护的靶向富集
CN106589134A (zh) 嵌合蛋白pAgoE及构建方法、应用以及使用向导的嵌合蛋白pAgoE及构建方法、应用
CN110691850A (zh) 生产折叶苔醇和/或补身醇的方法
CN104212787A (zh) 一种竹节参β-香树素合酶基因及其应用
CN113728097A (zh) 具有ruvc结构域的酶
AU681650B2 (en) Dinucleotide restriction endonuclease preparations and methods of use
CA3225082A1 (en) Enzymes with ruvc domains
US20220220460A1 (en) Enzymes with ruvc domains
CN104293758B (zh) 一种珠子参β‑香树素合酶基因及其应用
Arazoe et al. Targeted genome editing using CRISPR/Cas9 system in fungi
WO2023039377A1 (en) Class ii, type v crispr systems
GB2617659A (en) Enzymes with RUVC domains
JP5813073B2 (ja) シクロピアゾン酸非生産形質転換体及びその作製方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant