CN101679993A - 适于选择产生目标多肽的文库克隆的表达克隆方法 - Google Patents

适于选择产生目标多肽的文库克隆的表达克隆方法 Download PDF

Info

Publication number
CN101679993A
CN101679993A CN200880015244A CN200880015244A CN101679993A CN 101679993 A CN101679993 A CN 101679993A CN 200880015244 A CN200880015244 A CN 200880015244A CN 200880015244 A CN200880015244 A CN 200880015244A CN 101679993 A CN101679993 A CN 101679993A
Authority
CN
China
Prior art keywords
sequence
enzyme
gene
aspergillus
host cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880015244A
Other languages
English (en)
Inventor
杰斯珀·文德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN101679993A publication Critical patent/CN101679993A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及用于产生目标重组多肽的方法,所述方法包括步骤:a)提供编码一种或多种目标多肽的多核苷酸文库,其中在包含至少下述元件的表达克隆载体中制备文库:i)编码选择性标记的多核苷酸;ii)真菌复制起始序列,优选自主复制序列(ARS);和iii)以连续顺序包含下述的多核苷酸:源自真菌细胞的启动子、可将文库克隆入其中的克隆位点,和转录终止子;b)用文库转化亲本丝状真菌宿主细胞的突变体,其中与亲本相比,降低了在突变体中非同源重组的频率;c)在适合表达多核苷酸文库的条件下培养(b)中获得的转化宿主细胞;和d)选择可产生目标多肽的转化宿主细胞。

Description

适于选择产生目标多肽的文库克隆的表达克隆方法
序列列表与保藏的微生物
序列列表
本发明包含序列列表。
发明领域
本发明涉及适于筛选可产生目标多肽的文库克隆的表达克隆方法。
发明背景
已经公开了几种在酵母中构建目标多核苷酸序列文库的方法,其中在用选择的多核苷酸转化工业相关的丝状真菌宿主细胞之前,在酵母中筛选文库。
但是通常地,当转化进入与生产相关的丝状真菌细胞中时,通过在酵母或细菌中筛选而鉴定的多核苷酸序列不能表达或者在低水平表达。这可以归于多个原因,包括密码子用途的差别、mRNA水平的调控、转位装置、翻译后修饰机制(例如,半胱氨酸桥、糖基化和酰化模式)等。
A.Aleksenko和A.J.Clutterbuck(1997.Fungal Genetics and Biology21:373-387)公开了自主复制载体或自主复制序列(ARS)用于基因克隆和表达研究的用途。AMA1(在曲霉属中自主维持)是所述质粒复制元件之一。它由基因组重复指定的MATE1(活动的曲霉属转化增强子)的两个反向拷贝组成,两个拷贝由0.3kb中心间隔序列分隔。AMA1促进质粒复制,同时很少进行重排、多聚化或染色体整合。基于AMA1的质粒为在丝状真菌中进行基因克隆和文库生成提供两个优势。第一个是转化的高效率,其可增加潜在的文库大小。第二,通过为基因表达提供相当稳定而标准的环境,转化体的性质将是一致的(WO 00/24883;Novozymes A/S)。
WO 94/11523和WO 01/51646公开了包含完全受损的共有Kozak或“残缺”的共有Kozak序列的表达载体。
WO 03/070956公开了用于表达克隆的克隆载体,其包含AMA-1序列和残缺的翻译启动序列。
如在丝状真菌中的表达克隆目前是本领域标准方法的一部分,然而这种方法的使用是工业相关的,效率、性能或经济上即使微小的增加也是非常令人感兴趣的。
发明概述
理想的是在丝状真菌宿主细胞中筛选多核苷酸文库,获得具有目标性质的多肽,筛选方式可以快速而简单地表征获得的多肽。目前通过在转化入表达宿主细胞后减少表达载体拷贝数的变化来进一步改进WO 03/070956中描述的方法。这已经根据本发明,通过降低表达质粒进入宿主细胞基因组的非同源重组的频率而实现。
本发明的一个方面涉及用于产生目标重组多肽的方法,所述方法包括如下步骤:
a)提供编码一种或多种目标多肽的多核苷酸文库,其中所述文库在包含至少下述元件的表达克隆载体中制备:
i)编码选择性标记的多核苷酸;
ii)真菌复制起始序列,优选自主复制序列(ARS);和
iii)以连续顺序包含下述的多核苷酸:源自真菌细胞的启动子、可将所述文库克隆入其中的克隆位点,和转录终止子;
b)用所述文库转化亲本丝状真菌宿主细胞的突变体,其中与亲本相比,突变体中非同源重组的频率降低;
c)在适合表达所述多核苷酸文库的条件下培养(b)中获得的经转化的宿主细胞;和
d)选择可产生目标多肽的经转化的宿主细胞。
发明详述
根据本发明,已经发现使用表达克隆方法时的一个潜在问题,即在将文库转入表达载体后不均匀的表达水平使我们更难比较个体克隆的结果,并因此使筛选过程更加困难。几个因素可能产生这种观察到的不均匀表达水平。以前已经通过如上所述改进组成表达载体的元件而解决了这个问题,例如通过将AMA1-序列并入载体或通过使用残缺的“共有”Kozak序列。根据本发明,现在已经发现,通过降低表达宿主细胞中非同源重组的频率可获得显著改善。
在一个方面,本发明因此涉及用于产生目标重组多肽的方法,所述方法包括步骤:
a)提供编码一种或多种目标多肽的多核苷酸文库,其中在包含至少下述元件的表达克隆载体中制备文库:
i)编码选择性标记的多核苷酸;
ii)真菌复制起始序列,优选自主复制序列(ARS);和
iii)以连续顺序包含下述的多核苷酸:源自真菌细胞的启动子、可将文库克隆入其中的克隆位点,和转录终止子;
b)用所述文库转化亲本丝状真菌宿主细胞的突变体,其中与亲本相比,突变体中非同源重组的频率降低;
c)在适合表达所述多核苷酸文库的条件下培养(b)中获得的经转化的宿主细胞;和
d)选择可产生目标多肽的经转化的宿主细胞。
在筛选转化宿主细胞后,编码目标多肽的多核苷酸可以可选地分离自步骤(d)的宿主细胞,以鉴定突变,然后重新将突变基因转化进干净的宿主细胞中,确保没有发生来自其他变体的交叉污染。
在本发明的产生方法中,在适于产生多肽的营养培养基中,并在筛选多拷贝选择性标记的条件下,使用本领域已知的方法培养细胞。例如,可以在24、96、384或1536孔微孔板中,通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的成分制备(例如,在美国典型培养物保藏中心的目录中)。
如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzyme assay)可用于测定如本文所述的多肽的活性。所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989)。
非同源重组
在真核生物中,由重组而整合进基因组可以通过两种不同的途径发生:一个是通过同源重组(HR),一个是通过非同源重组(NHR)。在酵母中,优选的条件是HR,而在丝状真菌中大多数整合事件通过NHR发生。WO 02/052026公开了将DNA序列整合进基因组的靶向效率提高的酿酒酵母(Saccharomycescerevisiae)突变体。这些突变体缺乏参与NHR的KU70。已经分离了缺乏KU70的哺乳动物细胞(Pierce等,Genes and Development,2001,15:3237-3242),然而,这种突变体未表现出与增加同源定向靶标整合相同的性状。在丝状真菌黑曲霉中,KU70中的突变导致向基因组中靶向整合的效率提高(WO 2005/095624)。根据酵母研究,已经揭示了NHR途径中的几个基因:KU70、KU80、RAD50、MRE11、XRS2、LIG4和SIR4(van den Bosch等,2002,Biol.Chem.383:873-892和Allen等,2003,Mol.Cancer Res.1:913-920)。也可参见WO 02/052026中23页的表2。还已经在丝状真菌中鉴定了这些基因的功能等同物,WO2005/095624,其描述了来自黑曲霉的KU70和KU80同源物hdfA和hdfB,和Ishibashi,K.,Suzuki,K.,Ando,Y,Takakura,C.和Inoue,H.,2006,PNAS,USA.103(40):14871-14876,其公开了脉孢菌中的MUS-53(LIG4同源物)。
特别地,根据本发明的丝状真菌宿主细胞是导致非同源重组的频率降低的突变体。与NHR有关的组件包含酵母KU70、KU80、RAD50、MREII、XRS2、LIG4或SIR4的丝状真菌功能等同物,或相关组件。
因为基因的命名法在生物体之间不同,所以本文定义的功能等同物或功能和/或其功能性片段,能执行(功能,不是数量)至少酵母基因KU70、KU80、RAD50、MREII、XRS2、LIG4或SIR4的至少一种功能。这些基因中一些基因的功能等同物已经在丝状真菌中鉴定,特别是在曲霉属(hdfA和hdfB)和脉孢菌(MUS-53),如上所述。因此在一个实施方案中,突变体丝状真菌宿主减少或不表达或者缺乏至少一个内源基因,所述基因是参与NHR途径的酵母基因之一的功能等同物,所述酵母基因选自下组:KU70、KU80、RAD50、MREII、XRS2、LIG4和SIR4。这还包括相同基因的变体,其产生无活性或活性降低的蛋白质。更特别地,基因选自下组:KU70和KU80,和特别是来自米曲霉或黑曲霉的功能等同物。在一个实施方案中,基因是hdfA和hdfB或其同源物。
在一个优选的方面,KU70等同物包含与SEQ ID NO:14具有至少70%,优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,和甚至最优选至少95%同一性的核苷酸序列。在最优选的方面,KU70等同物包含SEQ ID NO:14的核苷酸序列。在另一个最优选的方面,KU70等同物由SEQ ID NO:14的核苷酸序列组成。
在另一个优选的方面,KU80等同物包含与SEQ ID NO:15具有至少70%,优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,和甚至最优选至少95%同一性的核苷酸序列。在最优选的方面,KU70等同物包含SEQ ID NO:15的核苷酸序列。在另一个最优选的方面,KU70等同物由SEQ ID NO:15的核苷酸序列组成。
在一个优选的方面,KU70等同物包含与SEQ ID NO:16具有至少70%,优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,和甚至最优选至少95%同一性的核苷酸序列。在最优选的方面,KU70等同物包含SEQ ID NO:16的核苷酸序列。在另一个最优选的方面,KU70等同物由SEQ ID NO:16的核苷酸序列组成。
在一个优选的方面,KU80等同物包含与SEQ ID NO:17具有至少70%,优选至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,和甚至最优选至少95%同一性的核苷酸序列。在最优选的方面,KU70等同物包含SEQ ID NO:17的核苷酸序列。在另一个最优选的方面,KU70等同物由SEQ ID NO:17的核苷酸序列组成。
根据本发明,将文库克隆进表达克隆载体,然后转化进突变体丝状真菌中,所述突变体在至少一个参与NHR途径的内源基因中进行修饰,与亲本丝状真菌相比,降低突变体中非同源重组的频率。现在已经表明,NHR频率的降低显著改善了表达克隆的稳定性,并产生更均匀的表达水平,确保更稳定地筛选目标克隆。术语“修饰”在本文中定义为基因或其转录或翻译所需的调控元件中一个或多个核苷酸的导入、取代或去除,以及参与NHR途径的至少一个内源基因的基因破坏、基因转化、基因缺失,或随机或特异性突变。这些基因的缺失可以是部分或全部缺失。修饰导致参与NHR途径的至少一个内源基因的表达降低或消除。
在一个优选的方面,修饰导致选自下组的至少一个基因的表达的降低或消除:KU70、KU80、RAD50、MREII、XRS2、LIG4或SIR4,或它们的功能等同物。这种修饰导致缺陷型丝状真菌宿主细胞。
术语“缺陷型”在本文中定义为丝状真菌突变体菌株,当在相同条件下培养时,与亲本丝状真菌菌株相比,产生的参与NHR途径的基因产物的量不可检测,或者,当在相同条件下培养时,与亲本丝状真菌菌株相比,产生量优选至少减少25%,更优选至少减少50%,甚至更优选减少至少75%,和最优选减少至少95%。由本发明的丝状真菌突变体菌株产生的基因产物的水平可以使用本文所述或本领域已知的方法确定。
可以使用本领域熟知的方法通过减少或消除参与NHR途径的基因,例如,插入、破坏、取代或缺失来构建“缺陷型”丝状真菌突变体菌株。在一个优选的方面,所述核苷酸序列是失活的。待修饰或失活的核苷酸序列可以是,例如,编码区或表达编码区必需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响所述基因表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、前肽序列、信号肽序列、转录终止子和转录激活子。
可以通过基因缺失技术构建丝状真菌突变体菌株,消除或降低参与NHR途径的至少一个基因的表达。基因缺失技术能部分或全部去除基因,从而消除它们的表达。在这种方法中,基因的缺失可以使用质粒通过同源重组而完成,所述质粒经过构建,连续地包含基因侧翼的5’和3’区域。用于下调指定DNA序列表达的优选策略包含缺失野生型DNA序列和/或由修饰的DNA序列置换,所述修饰序列的表达产物没有功能。缺失和置换优选通过EP 0357127B1中所述基因置换技术进行。
也可以通过在基因或其转录或翻译所需的调控元件中导入、取代和/或去除一个或多个核苷酸而构建丝状真菌突变体菌株。例如,核苷酸可以插入或去除,从而导致终止密码子的导入、起始密码子的去除,或开放阅读框的移码。可依照本领域已知的方法通过定点诱变或PCR-产生的诱变来实现这样的修饰。参见,例如Botstein和Shortle,1985,Science 229:4719;Lo等,1985,Proceedings of the National Academy of Sciences USA 81:2285;Higuchi等,1988,Nucleic Acids Research 16:7351;Shimada,1996,Meth.Mol.Biol.57:157;Ho等,1989,Gene 77:61;Horton等,1989,Gene 77:61;及Sarkar和Sommer,1990,BioTechniques 8:404。
也可通过基因破坏技术通过在目的基因中插入含有与所述基因同源的核酸片段的整合质粒(这会产生同源性区域的重复(duplication)并将载体DNA并入重复的区域之间)来构建丝状真菌突变体菌株。如果插入的载体将基因的启动子与编码区域分割,或者阻断编码序列而产生无功能的基因产物,则这种基因破坏能消除基因表达。破坏构建体可以仅仅是伴有与基因同源的5’和3’区域的选择性标记基因。选择性标记可以鉴别包含已破坏基因的转化体。
也可以通过基因转化过程(参见,例如,Iglesias和Trautner,1983,MolecularGeneral Genetics 189:73-76)构建丝状真菌突变体菌株。例如,在基因转化方法中,将对应于基因的核苷酸序列在体外突变,产生缺陷型核苷酸序列,然后将所述缺陷型序列转化进亲本丝状真菌菌株,产生缺陷型基因。通过同源重组,缺陷型核苷酸序列替换内源基因。理想的是,缺陷型基因或基因片段还包含标记,其可用于筛选包含缺陷型基因的转化体。
还可以使用与基因的核苷酸序列互补的核苷酸序列,通过已建立的反义技术构建丝状真菌突变体菌株(Parish和Stoker,1997,FEMS MicrobiologyLetters 154:151-157)。更特定地,由丝状真菌菌株进行的基因的表达可以通过导入与基因的核苷酸序列互补的核苷酸序列而降低或消除,所述导入的序列可以在菌株中转录,并且能与菌株中产生的mRNA杂交。在允许互补反义核苷酸与mRNA杂交的条件下,因此翻译的蛋白质的量降低或消除。
可以使用本领域公知的方法,包括,但不限于,化学突变(参见,例如,Hopwood,The Isolation of Mutants in Methods in Microbiology(J.R.Norris和D.W.Ribbons编)363-433页,Academic Press,New York,1970)和转座(参见,例如,Youngman等,1983,Proc.Natl.Acad.Sci.USA 80:2305-2309),通过向亲本细胞施以诱变,并且选择其中已将所述基因的表达减少或消除的突变体菌株来进行基因修饰。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,可以通过使用这些诱变剂的任何组合来进行诱变。
适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、N-甲基-N’-亚硝基胍(NTG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethyl methane sulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行所述诱变:在合适条件下存在优选的诱变剂时孵育待诱变的亲本菌株,并筛选和/或选择显示基因表达减少的或无基因表达的突变体。
重组频率的确定
可以确定重组频率,以确定与野生型相比,突变体中的NHR/HR的比例是否发生了改变。可以基本如实施例4中所述或者如WO 2005/095624第6-7页所述确定NHR效率。
文库
文库根据本发明编码目标多肽,其对于丝状真菌宿主细胞可能是天然或异源的。编码目标多肽的多核苷酸可能源自能产生目标多肽的任何生物体,包括多细胞生物体和微生物例如细菌和真菌。多核苷酸的起源还可能是合成的,意味着文库可以由例如编码相同多肽的密码子优化的变体组成,或者文库可以包含通过本领域已知的改组技术获得的变体。
真菌复制起始序列
如本文所使用的,术语“真菌复制起始序列”定义为核酸序列,其能支持染色体外分子,例如,DNA载体如质粒,在丝状真菌宿主细胞中的自主复制,通常DNA-载体不发生结构重排,或者不整合进入宿主细胞基因组。复制起始序列可能是任何来源,只要它能介导真菌细胞中的复制启动活性。例如复制起始序列可能是人类起源的调聚物,其赋予质粒在曲霉中复制的能力(Aleksenko和Ivanova,Mol.Gen.Genet.260(1998)159-164)。优选地,复制起始序列获得自丝状真菌细胞,更优选曲霉属、镰孢属或链格孢属(Alternaria)的菌株,并且甚至更优选地,构巢曲霉、米曲霉、黑曲霉、尖镰孢或Alternariaaltenata的菌株。
可以通过本领域熟知的方法鉴定真菌复制起始序列。例如,可以在源自所述生物体的基因组片段中将能支持酵母中的自主复制的序列鉴定为所述序列(Balance和Turner,Gene,36(1985),321-331),这是在丝状真菌细胞中自主复制能力的表征。还可以通过用期望的质粒复制基因转化真菌并筛选具有不规则形状的菌落,确定指定序列在真菌中的复制启动活性,其中不规则形状说明出现扇形质粒丢失,从而筛选在质粒上发现的基因时,能导致在选择性培养基上不能生长(Gems等,Gene,98(1991)61-67)。以这种方法分离了AMA1。分离复制起始序列的另一种方法是分离天然产生的质粒(例如,如Tsuge等,Genetics 146(1997)111-120针对Alternaria aternata所公开的)。
真菌复制起始序列的实例包括,但不限于,构巢曲霉的ANS1和AMA1序列,例如,分别如Cullen,D.等(1987,Nucleic Acids Res.15:9163-9175)和Gems,D.等,(1991,Gene 98:61-67)所述。
优选的实施方案涉及本发明的第一方面的方法,其中步骤(ii)的真菌复制起始序列包含SEQ ID NO:1或SEQ ID NO:2中所列的核酸序列(要了解与这些序列有关的更详细的内容,请参阅WO 00/24883SEQ ID NO:1和2),或者是其功能性衍生物,优选地,功能性衍生物与SEQ ID NO:1或SEQ ID NO:2至少80%相同。
术语“复制启动活性”在本文中以其常规含义使用,即表示序列能支持染色体外分子如质粒或DNA载体,在真菌细胞中的自主复制。
术语“没有质粒的结构重排”在本文中用于表示不缺失质粒的任何部分,或者将其插入质粒的另一部分,也不向质粒插入任何宿主基因组DNA。在本发明的方法中要使用的复制起始序列是与SEQ ID NO:1或SEQ ID NO:2的核酸序列至少50%相同的核苷酸序列,并且能启动真菌细胞中的复制,或(a)或(b)的亚序列,其中取代能启动真菌细胞中的复制。
在优选的实施方案中,核苷酸序列与SEQ ID NO:1或SEQ ID NO:2中的核苷酸序列具有的同一性程度应该不变,优选至少50%,更优选至少60%,甚至更优选至少70%,甚至更优选至少80%,甚至更优选至少90%,并且最优选至少97%(下文称作“同源多核苷酸”)。同源多核苷酸还包含SEQ ID NO:1或SEQ ID NO:2的亚序列,其在真菌细胞中具有复制启动活性。
同一性:参数“同一性”描述两个氨基酸序列的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度通过使用来自EMBOSS软件包(http://emboss.org)2.8.0版的Needle程序而确定。Needle程序执行Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453中所述的全局比对算法。使用的取代矩阵为BLOSUM62,缺口开放罚分为10,和缺口延伸罚分为0.5。
如下计算氨基酸序列(“发明序列”)和不同的氨基酸序列(“外源序列”)之间的同一性程度:两个序列比对中完全匹配的数目,除以“发明序列”的长度或“外源序列”的程度中最短的。结果用百分比同一性表示。
当“发明序列”和“外源序列”在重叠的相同位置具有相同的氨基酸残基时,即发生了完全匹配。序列的长度是序列中氨基酸残基的数目。
就本发明而言,两个核苷酸序列之间的同一性程度通过Wilbur-Lipman方法(Wilbur和Lipman,1983,Proceedings of the National Academy of ScienceUSA 80:726-730),使用LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)确定,使用同一性表和下述多重比对参数:缺口罚分10和缺口长度罚分10。成对比对参数为K元组=3,缺口罚分=3,和窗口=20。
用于分离或克隆核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用基于聚合酶链式反应(PCR)的方法来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA进行克隆(参见,例如,Innis et al.,1990,PCR:A Guide to Methods andApplication,Academic Press,New York)。可以使用其它核酸扩增方法,比如连接酶链式反应(LCR)。
在优选的实施方案中,复制起始序列具有SEQ ID NO:1或SEQ ID NO:2中所列的核酸序列,或其各自的功能性亚序列。例如,SEQ ID NO:1的功能性亚序列是由SEQ ID NO:1或SEQ ID NO:2包含的核酸序列,除了从5’和/或3’末端缺失了一个或多个核苷酸。优选地,亚序列包含至少100个核苷酸,更优选至少1000个核苷酸,和最优选至少2000个核苷酸。在更优选的实施方案中,SEQ ID NO:1的亚序列包含至少SEQ ID NO:2中所示的核苷酸序列。
残缺的翻译启动基因序列
术语“翻译启动基因序列”在本文中定义为多肽编码合适序列的开放阅读框的启动基因或起始密码子紧接着(next to)上游的十个核苷酸。启动基因密码子编码氨基酸甲硫氨酸,所谓的“起始”密码子。启动基因密码子通常为ATG,但是也可能是任何功能性起始密码子如GTG。本领域公知的是,在RNA中,尿嘧啶(尿苷),U,取代脱氧核苷酸胸腺嘧啶(胸苷),T。
在根据本发明的特定实施方案中,如上所述的方法能通过使用下述序列作为表达载体上包含的标记基因的翻译启动起始位点而改善。
N YNN ATG YNN  (SEQ ID NO:3)
其中位置-3中的“Y”是嘧啶(胞啶或胸苷/尿苷),“N”是任何核苷酸,并且相对于标记的起始密码子“ATG”(用粗体表示)的第一个核苷酸而指定数字编号。
术语“翻译启动基因序列”在本文中定义为多肽编码核酸序列的开放阅读框的启动基因密码子紧接着上游的十个核苷酸,其中启动基因序列在-3位置包含T,并且在-1、-2和-4位置中的一个或多个包含T。
因此,在本发明的优选实施方案中,序列SEQ ID NO:3在-3位置包含胸苷(尿苷),甚至更优选地,序列SEQ ID NO:3进一步在位置-1、-2和-4中的一个或多个位置包含胸苷(尿苷)。
术语“可操作地连接”在本文表示这样的构型,其中将调控序列,例如,残缺的翻译启动基因序列,置于相对于编码序列的合适位置,使得调控序列指导由编码序列编码的多肽的表达。
术语“编码序列”在本文中定义为当置于合适的调控序列的控制之下时转录为可翻译成多肽的mRNA。编码序列的边界通常由下述密码子确定:位于mRNA的5’末端的开读框起始处的起始密码子,和位于mRNA开读框的3’末端的终止密码子。编码序列可以包括,但不限于,基因组DNA、cDNA、半合成、合成和重组核酸序列。
残缺的翻译序列导致编码选择性标记的基因的翻译不充分。当在筛选多拷贝的选择性标记的条件下培养携带表达载体(包含编码目标多肽的多核苷酸,其与第二个多核苷酸实际相连接,第二个多核苷酸包含与编码选择性标记的基因可操作连接的残缺的翻译启动基因序列)的真菌宿主细胞时,多肽编码多核苷酸克隆进载体的拷贝数也增加。
术语“选择性标记”在本文中定义为基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等,其允许简单筛选转化的细胞。用于丝状真菌宿主细胞中的选择性标记包括,但不限于,amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。这些选择性标记的功能性衍生物也是本发明的目标,特别是那些活性降低或稳定性降低从而在不增加选择性物质浓度的情况下筛选更高拷贝数表达载体的功能性衍生物。
因此,优选的实施方案是第一方面的方法,其中步骤(i)的选择性标记选自下组标记:amdS、argB、bar、hygB、niaD、pyrG、sC和trpC;优选地,步骤(i)的选择性标记是pyrG或其功能性衍生物,更优选地,步骤(i)的选择性标记是pyrG的功能性衍生物,其包含一个或多个氨基酸的取代,和最优选地,衍生物包含氨基酸取代T102N。
术语“拷贝数”在本文中定义为细胞中包含的每个基因组上基因分子的数目。确定基因拷贝数的方法在本领域中已知,并且包括Southern分析、定量PCR或实时PCR。
真菌宿主细胞优选包含至少两个拷贝,更优选至少十个拷贝,甚至更优选至少一百个拷贝,最优选至少五百个拷贝,和甚至最优选至少一千个拷贝的表达克隆载体。
编码多核苷酸的多肽
目标多肽对于目标丝状真菌宿主细胞可以是天然的或异源的。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然多肽,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然多肽。编码目标多肽的多核苷酸可以源自能产生目标多肽的任何生物体,包括多细胞生物体和微生物,例如细菌和真菌。或者多核苷酸可以是合成产生的多核苷酸,例如密码子经过优化的多核苷酸或改组的多核苷酸。
本发明的优选实施方案涉及第一方面的方法,其中步骤(a)的能产生一种或多种目标多肽的生物体是真核生物,优选地,真核生物是真菌,和最优选为丝状真菌。
术语“多肽”在本文的意思不是指特定长度的编码产物,并且因此包含肽、寡肽和蛋白质。优选地,目标多肽是酶、酶变体或其功能性衍生物,更优选地,酶或酶变体是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶;和最优选地,酶或酶变体是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
优选蛋白质是激素或激素变体或其功能性衍生物,受体或受体变体或其功能性衍生物,抗体或抗体变体或其功能性衍生物,或报道蛋白(reporter)。
在优选的实施方案中,所述多肽向胞外分泌。在更优选的实施方案中,多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶。在甚至更优选的实施方案中,多肽是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
编码目标多肽的核酸序列可以获得自任何原核、真核或其他来源。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是多肽由所述来源产生,或由其中插入了来自所述来源的基因的细胞产生。
用于合成、分离或克隆编码目的多肽的核酸序列的技术是本领域内已知的,且包括从基因组DNA分离,从cDNA制备,或它们的组合。可通过例如使用熟知的聚合酶链式反应(PCR)实现从这种基因组DNA克隆目的多核苷酸。参见,例如,Innis等,1990,PCR Protocols:A Guide to Methods andApplication,Academic Press,New York。克隆步骤可以涉及包含编码多肽的核酸序列的期望核酸片段的切除与分离,向载体分子中插入片段,和将重组载体并入突变芽孢杆菌属细胞,其中将复制多个拷贝或克隆的核酸序列。DNA可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任意组合。
在本发明的方法中,多肽也可以包括融合或杂合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码一种多肽的核苷酸序列(或其部分)与编码另一种多肽的核苷酸序列(或其部分)融合而产生融合多肽。产生融合多肽的技术是本领域已知的,且包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。杂合多肽可以包含获得自至少两个不同多肽的部分或完整多肽序列的组合,其中一个或多个多肽对于突变体真菌细胞可以是异源的。
一旦已经筛选到可以更加本发明的方法产生目标多肽的已转化的宿主细胞,则可以从筛选到的已转化宿主细胞分离编码多核苷酸,并且可以设计经过进一步优化的表达系统。
因此,优选的实施方案涉及第一方面的方法,其中在步骤(d)后,从步骤(d)筛选到的已转化宿主细胞中分离编码目标多肽的多核苷酸。
核酸构建体
本发明还涉及包含编码目标多肽的多核苷酸的核酸构建体。多核苷酸与一个或多个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。表达应理解为包括涉及多肽产生的任何步骤,包括,但不限于,转录、转录后修饰、翻译、翻译后修饰,和分泌。
“核酸构建体”在本文中定义为单链或双链的核酸分子,其分离自天然存在的基因,或将其修饰以本来不存在于(not otherwise exist)自然界中的方式含有核酸的区段。当所述核酸构建体含有编码目标多肽的第二个多核苷酸和其表达所需的全部调控序列时,术语核酸构建体与术语表达载体同义。
可以用各种可提供多肽表达的方式进一步操作编码多肽的分离的多核苷酸。依赖于表达载体,在插入载体之前对核苷酸序列的操作可以是期望的或必需的。使用重组DNA方法用于修饰核苷酸序列的技术在本领域中公知。
在本发明的方法中,核苷酸序列可以包含一个或多个天然的调控序列,或者一个或多个天然的调控序列可以用对于核苷酸序列是异源的一个或多个调控序列取代,用于改善宿主细胞中编码序列的表达。
术语“调控序列”在本文定义为包括利于表达目标多肽或表达所必需的所有组分。各种调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各种调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、本发明的残缺的翻译启动序列、信号肽序列和转录终止子。最少的情况,调控序列包括翻译启动序列,和转录和翻译的终止信号。调控序列可提供有用于导入特异性限制位点或克隆位点的接头,所述特异性限制位点或克隆位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
调控序列可以是合适的启动子序列,其是由用于表达核苷酸序列的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽表达的转录调控序列。启动子区可以是在所选宿主细胞中显示转录活性的任何核苷酸序列,其包括突变的、截短的和杂合的启动子,并可获得自编码与宿主细胞同源或异源的胞外或胞内多肽的基因。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。
在第一方面的特定实施方案中,步骤(iii)的启动子是来自编码来自公开与WO 89/01969中的黑曲霉的基因(NA2)的中性淀粉酶的启动子。在另一个特定的实施方案中,启动子是NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶(tpi)启动子的未翻译前导序列的杂合体)。
调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
优选的实施方案涉及第一方面的方法,其中步骤(iii)的转录终止子是来自黑曲霉的葡糖淀粉酶(AMG)编码基因的终止子(Boel,E.;Hjort,I.;Svensson,B.;Norris,F.;Norris,K.E.;Fiil,N.P.,Glucoamylases G1 and G2 from Aspergillus nigerare synthesized from two different but closely related mRNAs.EMBO J.3:1097(1984))。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
优选的实施方案涉及第一方面的方法,其中启动子,位于步骤(iii)的克隆位点上游,与编码来自构巢曲霉的丙糖磷酸异构酶的前导肽的多核苷酸可操作地连接(Mcknight G.L.,O′Hara P.J.,Parker M.L.,″Nucleotide sequence of thetriosephosphate isomerase gene from Aspergillus nidulans:Implications for adifferential loss of introns″,Cell 46:143-147(1986))。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相联的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列异源的信号肽编码区。异源信号肽编码区在编码序列不天然地含有信号肽编码区时可能是必需的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码区可在本发明中使用。
对于丝状真菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和疏棉状腐质霉(Humicola lanuginosa)脂肪酶。
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化成成熟活性多肽。可以从枯草芽孢杆菌(Bacillus subtilis)碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)漆酶(WO95/33836)的基因获得前肽编码区。
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。
表达载体
本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在合适的用于表达的载体中插入包含残缺的翻译启动基因序列和/或所述序列的核苷酸序列或核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与本发明的残缺的翻译启动基因序列和一个或多个用于表达的合适的调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。
本发明的载体还含有一个或多个选择性标记,其进一步包含使质粒在宿主细胞中自主复制的来源。在特定的实施方案中容易筛选,如早前所述。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。在特定的实施方案中,ARS是如上所述的AMA-1序列。
用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook et al.,1989,见上文)。
宿主细胞
宿主细胞可以是在本发明的方法中有用的任何真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,In,Ainsworthand Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,UniversityPress,Cambridge,UK所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等,1995,见上)。
在一个优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在一个优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、鬼伞属、镰孢属、腐质霉属、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属、脉孢菌属、青霉属、梭孢壳属、弯颈霉属或木霉属细胞。
在更优选的方面,丝状真菌宿主细胞是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉、黑曲霉或米曲霉细胞。在特定的实施方案中,曲霉属宿主细胞是米曲霉或黑曲霉。在另一个最优选的实施方案中,丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusariumcrookwellens)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)或镶片镰孢细胞。在特定的实施方案中,镰孢属宿主细胞是尖镰孢。在另外最优选的方面,特异腐质霉、疏棉状腐质霉、米赫毛霉(Mucor miehei)、嗜热毁丝霉、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、Thielavia terrestris、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉或绿色木霉(Trichoderma viride)细胞。在特定的实施方案中,宿主细胞是里氏木霉。
在甚至最优选的实施方案中,镶片镰孢细胞是镶片镰孢A3/5,其起初作为禾谷镰孢ATCC 20334保藏,近来由Yoder和Christianson,1998,FungalGenetics and Biology 23:62-80和O′Donnell等,1998,Fungal Genetics andBiology 23:57-67重新分类为镶片镰孢;以及镶片镰孢的分类等同物(不管当前已知为哪个种)。在另一个优选的实施方案中,镶片镰孢细胞是镶片镰孢A3/5或镶片镰孢ATCC 20334的形态突变体,如WO 97/26330中所公开的。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属宿主细胞的合适方法在EP 238023和Yelton等,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。
通过以下实施例进一步对本发明进行描述。
实施例
材料与方法
菌株
米曲霉NBRC4177:可由Institute for fermentation,Osaka;17-25 JusoHammachi 2-Chome Yodogawa-Ku,Osaka,Japan得到。
米曲霉Ja1355(amy-,alp-,NpI-,CPA-,KA-,pyrG)是米曲霉A1560的衍生物,其中如WO 98/01470所述将pyrG基因失活,转化规程如WO 00/24883所述。
米曲霉PFjo218(amy-,alp-,NpI-,CPA-,KA-,pyrG-,ku70-)在实施例1中描述。
米曲霉PFjo220(amy-,alp-,NpI-,CPA-,KA-,pyrG-,ku70::PyrG)在实施例1中描述。
质粒
pENI2344在WO 2003/070956中描述。
pENI2155在WO 2003/070956中描述。
pIC19H在Marsh等,1984,Gene 32:481-485中描述。
pJaL554在专利WO2001068864的实施例8中描述。
pJaL925在实施例4中描述。
pJaL575在实施例1中描述。
pDV8在专利WO0168864的实施例8中描述。
基因
pyrG:这个基因编码5’-磷酸-乳清酸核苷脱羧酶,这是参与尿苷生物合成的酶。
wA:这个基因编码聚酮合酶,这是参与孢子(分生孢子)颜色形成的酶。破坏wA基因会产生白色孢子。
转化米曲霉JaL355和PFjo218
将16-20小时的培养物收获于Mira滤布中并用0.6M MgSO4洗涤。将菌丝体转移至包含10ml MgSO4、10mM NaH2PO4,pH 5.8、50-100mg Glucanex的100ml塑料管中。加入十二毫克BSA,并在轻微震荡下在37℃温育溶液2小时。通过Mira滤布收获原生质体,并在原生质体上加一层5ml ST(0.6M山梨醇,100mM Tris-Cl,pH 7.0)。在2500rpm离心15分钟后,收获界面处的原生质体,并转移至新管中。加入两倍体积的STC(1.2M山梨醇、10mMTris-Cl,pH 7.5、10mM CaCl2),然后在2500rpm离心5分钟。在5ml STC中洗涤原生质体两次并最终重悬于STC中。
向100μl原生质体中加入约1-4μg DNA,然后加入300μl 60%PEG 4000。在室温温育原生质体20分钟,然后在1.2ml山梨醇中稀释,并在2500rpm离心10分钟。将转化体重悬于100μl山梨醇中并涂布在选择性培养基(WO00/24883)上。
PCR扩增
所有的PCR扩增以50微升的体积进行,其在Expand高保真缓冲液中包含1.75单位的Expand高保真PCR系统(Roche)、约1微克DNA、250微摩尔每升每种dNTP和10皮摩尔每种上述底物,以及1.5mM MgCl2
在MJ Research PCT-220 DNA Engine DyadTM Peltier热循环仪中进行扩增,并由下述组成:94℃2分钟的一个循环,然后是94℃30秒钟、55℃1分钟和72℃1.5分钟的25个循环,然后是72℃5分钟的额外延伸。
脂肪酶实验:
将待进行脂肪酶活性实验的转化体接种于包含1*Vogel培养基和2%麦芽糖的96孔微量滴定板中(参见Enzymology,vol.17,p.84中的方法)。在34℃生长4天后,使用pnp-戊酸酯作为脂肪酶底物,测试培养液的脂肪酶活性。
向微量滴定板的孔中加入来自每个孔的培养基的10微升等分试样,所述微量滴定板的孔中包含200微升0.018%对硝基苯基戊酸酯的脂肪酶底物、0.1%Triton XTM-100、10mM CaCl2、50mM Tris pH 7.5。历时五分钟,每隔15秒钟,用分光光度法,使用动力学微量滴定板读板仪(Molecular Device Corp.,Sunnyvale CA),采用标准的酶学规程(例如,Enzyme Kinetics,Paul C.Engel编,1981,Chapman and Hall Ltd.)测定脂肪酶活性。简而言之,在底物周转(turnover)的初始速率阶段测量产物的形成,并将产物形成定义为每隔15秒钟,在5分钟之内根据405nm处的吸光度计算的曲线斜率。对于每组转化体,计算平均值和相对标准偏差。
基因组DNA制备:
将真菌菌丝体(在10ml YPD中生长2天后收获)在真空离心仪(speedy vac)中干燥并将菌丝体破碎。加入1ml裂解缓冲液(裂解缓冲液:100mM EDTA、10mM Tris-pH 8.0、1%Triton X 100、500mM Guanidinium-HCl、200mMNaCl),混合,加入2微升(10mg/ml)RNAseA,在37℃温育30分钟。加入5微升蛋白酶K(20mg/ml)。混合并在50℃温育2小时。在20000g旋转10分钟。将上清液加入质粒旋转杯(来自
Figure A20088001524400251
Miniprep kit,Qiagen)中并按照试剂盒规程操作。洗脱基因组DNA于100微升。
实施例1
KU70缺失的米曲霉菌株的构建
引物:
  引物
  #313/KU-5′-rev-deltakons.   TGATTACGCCAAGCTTGCGGCCGCGACCAAAGCGTGCGAATAGCG(SEQ ID NO:4)
  #314/KU-5′-forw-deltakons   TGCAGCTGATAAGCTTGGTGACTATAAACAATCGCCG(SEQ ID NO:5)
  #315/KU-3′-forw-deltakons   GACGGCCAGTGAATTCGCGGCCGCCGAGGAACTCTGCTACTGCC(SEQ IDNO:6)
  #316/KU-3′-rev-deltakons   TACCGAGCTCGAATTCGGGCCGACGAGTTGGAAAAGC(SEQ ID N0:7)
  #340/A.flav KU70rev2   GGAGTCCGTATAGTAAGCATC(SEQ ID NO:8)
  #105/niaDp-forw#1   TGTACAGCACTGTATTGGTATGTGAACG(SEQ ID NO:9)
  #126/pyrG-tjek-rev1   CATGTAGATAAGATTAGGGC(SEQ ID NO:10)
  #172450   GACGAATTCTCTAGAAGATCTCTCGAGGAGCTCAAGCTTCTGTACAGTGACCGGTGACTC(SEQ ID NO:11)
  #172449   GACGAATTCCGATGAATGTGTGTCCTG(SEQ ID NO:12)
通过连续的两轮剪切,各自使用限制性内切酶去除pDV8中单一的限制性位点BamHI和BgIII,并通过用Klenow聚合酶和四种脱氧核糖核苷酸处理而填平游离的悬突末端,并连接产生质粒pJaL504。
由pJaL504,通过PCR,使用172450和172449(SEQ ID NO:11和12)扩增2514bp片段,并克隆入载体4Blunt-TOPO,产生质粒pJaL575。
pPFJo118由pUC19(GenBank/EMBL登录号L09137)组成,其中包含侧翼为额外拷贝的启动子的米曲霉pyrG基因的1185bp HindIII-Asp718片段克隆入相同的位点(参见下面的pyrG+重复的序列)。用引物#315和#316PCR扩增1kb的KU70的3’侧翼区,并通过BD In-FusionTM克隆试剂盒(BDBiosciences Clontech)克隆入用EcoRI切开的(opened)pPFJo118,产生pPFJo209。用引物#313和#314PCR扩增1kb的KU70的5’侧翼区域,插入
Figure A20088001524400262
载体(使用来自Invitrogen的用于测序的
Figure A20088001524400263
PCR克隆试剂盒)中。由此用EcoRI切去KU705’末端,使用Klenow片段填平末端(室温30分钟),最后克隆入用HindIII切开、并如针对KU705’末端片段所述填平末端的pPFJo209。这产生pPFJo210质粒。用NdeI切开pPFJo210,填平末端并连接至来自pJaL575的EcoRI-EcoRI片段,pJaL575中包含HSV-tk反选择盒,也填平末端--这产生最终的KU70缺失构建体pPFJo247。
用由BstXI线性化的pPFJo247转化约40份(40×100微升)JaL355。在包含核苷酸类似物5-氟-2’-脱氧尿苷(FDU)的蔗糖培养基上选择转化体,这使得不选择其中只发生单交换的转化体--因为在存在FDU的情况下,由HSV-tk盒的表达对于细胞是致命的。转化后出现19个转化体,并在37℃培养10天后在新的蔗糖+FDU平板上再分离。由这些转化体分离基因组DNA,并使用基因组区域中用于缺失的侧翼以外的一个引物(#3340)和侧翼之间pyrG标记中的一个引物(#126),进行初步的PCR筛选。由这次PCR筛选,10个转化体产生正确的1114bp的PCR条带,通过Southern印迹分析对这10个转化体进行控制。为进行Southern印迹,如材料和方法中所述制备基因组DNA。用XhoI-PvuI和XhoI-BgIII消化基因组DNA,对于正确缺失KU70的菌株,当使用KU703’末端作为探针时(使用引物#315和#316进行PCR扩增,产生1002bp的产物),得到的条带在Southern印迹上分别与5417bp和3448bp的条带杂交。野生型基因组DNA分别产生4659bp和2142bp的条带。测试的全部10个转化体都证明被正确地破坏。选择转化体#JaL355/pPFJo247-19并命名为PFJo220。将这个转化体在斜面上划线,并由斜面洗下孢子液,将浓稠的孢子悬浮液涂布在5-FOA平板上(包含5-氟乳清酸),从而选择其中pyrG基因出环(loop out)的菌株--留下缺失ku70和pyrG-的菌株。分离一个这样的菌株并命名为PFJo218。
实施例2
JaL355和PFjo218中脂肪酶的表达
如上所述用pENI2344转化曲霉属菌株Jal355和Pfjo218。pENI2344在WO2003/070956中(实施例2)详细描述,并包含脂肪酶基因作为报道基因和pyrG作为选择标记。pENI2344上的pyrG基因包含点突变T102N,使拷贝数增加。
将来自每个菌株的11个转化体接种于200μl培养基(1*vogel,2%麦芽糖)中。在34℃生长4天后,将接种物转移至平板并在37℃生长3天,将每个菌株的11个转化体接种于200μl酵母蛋白胨+2%麦芽糖中并在34℃生长4天。
如上文和WO2003070956中所述,使用脂肪酶底物pnp-戊酸酯测定10μl培养基。结果显示,在11个独立的JaL355曲霉属转化体的脂肪酶表达水平之间有34%的相对标准偏差。在11个独立的PFjo218转化体中脂肪酶表达水平的相对标准偏差仅为18%。这表明ku70基因的缺失/失活产生更均一的表达水平,这是筛选基因变体文库时所期望的。
实施例3
脂肪酶在JaL355h和PFjo218中的表达
用包含脂肪酶报道基因的质粒pENI2155转化米曲霉菌株Jal355和Pfjo218。
质粒pENI2155包含pyrG基因的残缺kozak区上游,并如WO2003/070956(实施例1)所述构建。质粒基本上与pENI2344相同,除了pyrG基因是野生型。构建的详细过程可以在WO2003/070956(实施例1)中找到。
来自每个菌株的约10个转化体接种于200μl培养基(2%麦芽糖+YP)中。在34℃生长4天后,使用pnp-戊酸酯测定培养基的脂肪酶活性。将接种物转移至平板并在37℃生长3天。
在总共生长14天后第二次重复脂肪酶实验。将每个菌株的约10个转化体接种于200μl酵母蛋白胨+2%麦芽糖中并在34℃生长3天。在34℃生长4天后,使用pnp-戊酸酯测定培养基的脂肪酶活性(WO2003070956)。将接种物转移至平板并在37℃生长3天。
最后,在总共生长21天后第三次重复脂肪酶实验。将每个菌株的约10个转化体接种于200μl酵母蛋白胨+2%麦芽糖中并在34℃生长4天。在34℃生长4天后,使用pnp-戊酸酯测定培养基的脂肪酶活性(WO2003070956)。
结果:
脂肪酶实验中的表达数据示于下表中。很明显,当使用ku70缺失菌株时相对标准偏差较低。在筛选突变体文库时,表达水平的相对标准偏差较低是理想的。
Figure A20088001524400281
实施例4
KU70缺失菌株中NHR/HR频率的确定
为了测试KU70菌株背景对于同源重组的行为,可以选择不同的容易选择的靶标作为测试例。靶标可以为:wA-其被破坏时会产生雪白的孢子,adeB-其被破坏时产生红色菌丝,和niaD-以硝酸盐作为唯一氮源时不能在平板上生长,而所有菌株都能在作为唯一氮源的亚硝酸盐上生长。wA的结果示于下表中。
A.米曲霉wA缺失质粒pJaL925的构建
质粒pJaL901包含来自米曲霉NBRC4177的4658bp BglII片段,其编码pIC19H中的wA基因(SEQ ID NO:13)。用Asp718和SnaBI消化质粒pJaL901,并纯化5501bp片段。将来自pJaL554的侧翼重复的pyrG选择标记纯化为2027bp的Asp718-SmaI片段。连接这两个片段,得到质粒pJaL925。由此用pyrG基因替换wA基因的1861bp Asp718-SnaBI编码部分,而且pyrG基因的侧翼为wA的5’末端的685bp片段和wA的3’末端的2105bp片段。
B.用pJaL925转化JaL355和PFJo218
如前所述用pJaL925转化JaL355和PFJo218。下表所示的结果清楚地表明,KU70缺失菌株中NHR降低。
  发生转化的菌株   pJaL925-wA(白色/绿色孢子)   HRF10
  JaL355(pyrG-)   10/500   ~2%
  PFJo218(ku70Δ,pyrG-)   80/20   ~80%
序列表
<110>诺维信公司(Novozymes A/S)
<120>适于选择产生目标多肽的文库克隆的表达克隆方法
<130>11121.204-WO
<160>17
<170>PatentIn version 3.5
<210>1
<211>5259
<212>DNA
<213>构巢曲霉(Aspergillus nidulans)
<400>1
aagcttattt tttgtatact gttttgtgat agcacgaagt ttttccacgg tatcttgtaa    60
aaatatatat ttgtggcggg cttacctaca tcaaattaat aagagactaa ttataaacta    120
aacacacaag caagctactt tagggtaaaa gtttataaat gcttttgacg tataaacgtt    180
gcttgtattt attattacaa ttaaaggtgg atagaaaacc tagagactag ttagaaacta    240
atctcaggtt tgcgttaaac taaatcagag cccgagaggt taacagaacc tagaagggga    300
ctagatatcc gggtagggaa acaaaaaaaa aaaacaagac agccacatat tagggagact    360
agttagaagc tagttccagg actaggaaaa taaaagacaa tgataccaca gtctagttga    420
caactagata gattctagat tgaggccaaa gtctctgaga tccaggttag ttgcaactaa    480
tactagttag tatctagtct cctataactc tgaagctaga ataacttact actattatcc    540
tcaccactgt tcagctgcgc aaacggagtg attgcaaggt gttcagagac tagttattga    600
ctagtcagtg actagcaata actaacaagg tattaaccta ccatgtctgc catcaccctg    660
cacttcctcg ggctcagcag ccttttcctc ctcattttca tgctcatttt ccttgtttaa    720
gactgtgact agtcaaagac tagtccagaa ccacaaagga gaaatgtctt accactttct    780
tcattgcttg tctcttttgc attatccatg tctgcaacta gttagagtct agttagtgac    840
tagtccgacg aggacttgct tgtctccgga ttgttggagg aactctccag ggcctcaaga    900
tccacaacag agccttctag aagactggtc aataactagt tggtctttgt ctgagtctga    960
cttacgaggt tgcatactcg ctccctttgc ctcgtcaatc gatgagaaaa agcgccaaaa    1020
ctcgcaatat ggctttgaac cacacggtgc tgagactagt tagaatctag tcccaaacta    1080
gcttggatag cttacctttg ccctttgcgt tgcgacaggt cttgcagggt atggttcctt    1140
tctcaccagc tgatttagct gccttgctac cctcacggcg gatctgccat aaagagtggc    1200
tagaggttat aaattagcac tgatcctagg tacggggctg aatgtaactt gcctttcctt    1260
tctcatcgcg cggcaagaca ggcttgctca aattcctacc agtcacaggg gtatgcacgg    1320
cgtacggacc acttgaacta gtcacagatt agttagcaac tagtctgcat tgaatggctg    1380
tacttacggg ccctcgccat tgtcctgatc atttccagct tcaccctcgt tgctgcaaag    1440
tagttagtga ctagtcaagg actagttgaa atgggagaag aaactcacga attctcgact    1500
cccttagtat tgtggtcctt ggacttggtg ctgctatata ttagctaata cactagttag    1560
actcacagaa acttacgcag ctcgcttgcg cttcttggta ggagtcgggg ttgggagaac    1620
agtgccttca aacaagcctt cataccatgc tacttgacta gtcagggact agtcaccaag    1680
taatctagat aggacttgcc tttggcctcc atcagttcct tcatagtggg aggaccattg    1740
tgcaatgtaa actccatgcc gtgggagttc ttgtccttca agtgcttgac caatatgttt    1800
ctgttggcag agggaacctg tcaactagtt aataactagt cagaaactat gatagcagta    1860
gactcactgt acgcttgagg catcccttca ctcggcagta gacttcatat ggatggatat    1920
caggcacgcc attgtcgtcc tgtggactag tcagtaacta ggcttaaagc tagtcgggtc    1980
ggcttactat cttgaaatcc ggcagcgtaa gctccccgtc cttaactgcc tcgagatagt    2040
gacagtactc tggggacttt cggagatcgt tatcgttatc gcgaatgctc ggcatactaa    2100
ctgttgacta gtcttggact agtcccgagc aaaaaggatt ggaggaggag gaggaaggtg    2160
agagtgagac aaagagcgaa ataagagctt caaaggctat ctctaagcag tatgaaggtt    2220
aagtatctag ttcttgacta gatttaaaga gatttcgact agttatgtac ctggagtttg    2280
gatataggaa tgtgttgtgg taacgaaatg taagggggag gaaagaaaaa gtcgtcaaga    2340
ggtaactcta agtcggccat tcctttttgg gaggcgctaa ccataaacgg catggtcgac    2400
ttagagttag ctcagggaat ttagggagtt atctgcgacc accgaggaac ggcggaatgc    2460
caaagaatcc cgatggagct ctagctggcg gttgacaacc ccaccttttg gcgtttctgc    2520
ggcgttgcag gcgggactgg atacttcgta gaaccagaaa ggcaaggcag aacgcgctca    2580
gcaagagtgt tggaagtgat agcatgatgt gccttgttaa ctaggtacca atctgcagta    2640
tgcttgatgt tatccaaagt gtgagagagg aaggtccaaa catacacgat tgggagaggg    2700
cctaggtata agagtttttg agtagaacgc atgtgagccc agccatctcg aggagattaa    2760
acacgggccg gcatttgatg gctatgttag taccccaatg gaaacggtga gagtccagtg    2820
gtcgcagata actccctaaa ttccctgagc taactctaag tcgaccatgc cgtttatggt    2880
tagcgcctcc caaaaaggaa tggccgactt agagttacct cttgacgact ttttctttcc    2940
tcccccttac atttcgttac cacaacacat tcctatatcc aaactccagg tacataacta    3000
gtcgaaatct ctttaaatct agtcaagaac tagatactta accttcatac tgcttagaga    3060
tagcctttga agctcttatt tcgctctttg tctcactctc accttcctcc tcctcctcca    3120
atcctttttg ctcgggacta gtccaagact agtcaacagt tagtatgccg agcattcgcg    3180
ataacgataa cgatctccga aagtccccag agtactgtca ctatctcgag gcagttaagg    3240
acggggagct tacgctgccg gatttcaaga tagtaagccg acccgactag ctttaagcct    3300
agttactgac tagtccacag gacgacaatg gcgtgcctga tatccatcca tatgaagtct    3360
actgccgagt gaagggatgc ctcaagcgta cagtgagtct actgctatca tagtttctga    3420
ctagttatta actagttgac aggttccctc tgccaacaga aacatattgg tcaagcactt    3480
gaaggacaag aactcccacg gcatggagtt tacattgcac aatggtcctc ccactatgaa    3540
ggaactgatg gaggccaaag gcaagtccta tctagattac ttggtgacta gtccctgact    3600
agtcaagtag catggtatga aggcttgttt gaaggcactg ttctcccaac cccgactcct    3660
accaagaagc gcaagcgagc tgcgtaagtt tctgtgagtc taactagtgt attagctaat    3720
atatagcagc accaagtcca aggaccacaa tactaaggga gtcgagaatt cgtgagtttc    3780
ttctcccatt tcaactagtc cttgactagt cactaactac tttgcagcaa cgagggtgaa    3840
gctggaaatg atcaggacaa tggcgagggc ccgtaagtac agccattcaa tgcagactag 3900
ttgctaacta atctgtgact agttcaagtg gtccgtacgc cgtgcatacc cctgtgactg 3960
gtaggaattt gagcaagcct gtcttgccgc gcgatgagaa aggaaaggca agttacattc 4020
agccccgtac ctaggatcag tgctaattta taacctctag ccactcttta tggcagatcc 4080
gccgtgaggg tagcaaggca gctaaatcag ctggtgagaa aggaaccata ccctgcaaga 4140
cctgtcgcaa cgcaaagggc aaaggtaagc tatccaagct agtttgggac tagattctaa 4200
ctagtctcag caccgtgtgg ttcaaagcca tattgcgagt tttggcgctt tttctcatcg 4260
attgacgagg caaagggagc gagtatgcaa cctcgtaagt cagactcaga caaagaccaa 4320
ctagttattg accagtcttc tagaaggctc tgttgtggat cttgaggccc tggagagttc 4380
ctccaacaat ccggagacaa gcaagtcctc gtcggactag tcactaacta gactctaact 4440
agttgcagac atggataatg caaaagagac aagcaatgaa gaaagtggta agacatttct 4500
cctttgtggt tctggactag tctttgacta gtcacagtct taaacaagga aaatgagcat 4560
gaaaatgagg aggaaaaggc tgctgagccc gaggaagtgc agggtgatgg cagacatggt 4620
aggttaatac cttgttagtt attgctagtc actgactagt caataactag tctctgaaca 4680
ccttgcaatc actccgtttg cgcagctgaa cagtggtgag gataatagta gtaagttatt 4740
ctagcttcag agttatagga gactagatac taactagtat tagttgcaac taacctggat 4800
ctcagagact ttggcctcaa tctagaatct atctagttgt caactagact gtggtatcat 4860
tgtcttttat tttcctagtc ctggaactag cttctaacta gtctccctaa tatgtggctg 4920
tcttgttttt tttttttgtt tccctacccg gatatctagt ccccttctag gttctgttaa 4980
cctctcgggc tctgatttag tttaacgcaa acctgagatt agtttctaac tagtctctag 5040
gttttctatc cacctttaat tgtaataata aatacaagca acgtttatac gtcaaaagca 5100
tttataaact tttaccctaa agtagcttgc ttgtgtgttt agtttataat tagtctctta 5160
ttaatttgat gtaggtaagc ccgccacaaa tatatatttt tacaagatac cgtggaaaaa 5220
cttcgtgcta tcacaaaaca gtatacaaaa aataagctt                        5259
<210>2
<211>2400
<212>DNA
<213>构巢曲霉(Aspergillus nidulans)
<400>2
aagcttattt tttgtatact gttttgtgat agcacgaagt ttttccacgg tatcttgtaa    60
aaatatatat ttgtggcggg cttacctaca tcaaattaat aagagactaa ttataaacta    120
aacacacaag caagctactt tagggtaaaa gtttataaat gcttttgacg tataaacgtt    180
gcttgtattt attattacaa ttaaaggtgg atagaaaacc tagagactag ttagaaacta    240
atctcaggtt tgcgttaaac taaatcagag cccgagaggt taacagaacc tagaagggga    300
ctagatatcc gggtagggaa acaaaaaaaa aaaacaagac agccacatat tagggagact    360
agttagaagc tagttccagg actaggaaaa taaaagacaa tgataccaca gtctagttga    420
caactagata gattctagat tgaggccaaa gtctctgaga tccaggttag ttgcaactaa    480
tactagttag tatctagtct cctataactc tgaagctaga ataacttact actattatcc    540
tcaccactgt tcagctgcgc aaacggagtg attgcaaggt gttcagagac tagttattga    600
ctagtcagtg actagcaata actaacaagg tattaaccta ccatgtctgc catcaccctg    660
cacttcctcg ggctcagcag ccttttcctc ctcattttca tgctcatttt ccttgtttaa    720
gactgtgact agtcaaagac tagtccagaa ccacaaagga gaaatgtctt accactttct    780
tcattgcttg tctcttttgc attatccatg tctgcaacta gttagagtct agttagtgac    840
tagtccgacg aggacttgct tgtctccgga ttgttggagg aactctccag ggcctcaaga    900
tccacaacag agccttctag aagactggtc aataactagt tggtctttgt ctgagtctga    960
cttacgaggt tgcatactcg ctccctttgc ctcgtcaatc gatgagaaaa agcgccaaaa    1020
ctcgcaatat ggctttgaac cacacggtgc tgagactagt tagaatctag tcccaaacta    1080
gcttggatag cttacctttg ccctttgcgt tgcgacaggt cttgcagggt atggttcctt    1140
tctcaccagc tgatttagct gccttgctac cctcacggcg gatctgccat aaagagtggc    1200
tagaggttat aaattagcac tgatcctagg tacggggctg aatgtaactt gcctttcctt    1260
tctcatcgcg cggcaagaca ggcttgctca aattcctacc agtcacaggg gtatgcacgg    1320
cgtacggacc acttgaacta gtcacagatt agttagcaac tagtctgcat tgaatggctg    1380
tacttacggg ccctcgccat tgtcctgatc atttccagct tcaccctcgt tgctgcaaag    1440
tagttagtga ctagtcaagg actagttgaa atgggagaag aaactcacga attctcgact    1500
cccttagtat tgtggtcctt ggacttggtg ctgctatata ttagctaata cactagttag    1560
actcacagaa acttacgcag ctcgcttgcg cttcttggta ggagtcgggg ttgggagaac    1620
agtgccttca aacaagcctt cataccatgc tacttgacta gtcagggact agtcaccaag    1680
taatctagat aggacttgcc tttggcctcc atcagttcct tcatagtggg aggaccattg    1740
tgcaatgtaa actccatgcc gtgggagttc ttgtccttca agtgcttgac caatatgttt    1800
ctgttggcag agggaacctg tcaactagtt aataactagt cagaaactat gatagcagta    1860
gactcactgt acgcttgagg catcccttca ctcggcagta gacttcatat ggatggatat    1920
caggcacgcc attgtcgtcc tgtggactag tcagtaacta ggcttaaagc tagtcgggtc    1980
ggcttactat cttgaaatcc ggcagcgtaa gctccccgtc cttaactgcc tcgagatagt    2040
gacagtactc tggggacttt cggagatcgt tatcgttatc gcgaatgctc ggcatactaa    2100
ctgttgacta gtcttggact agtcccgagc aaaaaggatt ggaggaggag gaggaaggtg    2160
agagtgagac aaagagcgaa ataagagctt caaaggctat ctctaagcag tatgaaggtt    2220
aagtatctag ttcttgacta gatttaaaga gatttcgact agttatgtac ctggagtttg    2280
gatataggaa tgtgttgtgg taacgaaatg taagggggag gaaagaaaaa gtcgtcaaga    2340
ggtaactcta agtcggccat tcctttttgg gaggcgctaa ccataaacgg catggtcgac    2400
<210>3
<211>10
<212>DNA
<213>人工的
<220>
<223>残缺的Kozak序列
<220>
<221>misc_feature
<222>(1)..(1)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(3)..(4)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(9)..(10)
<223>n是a、c、g或t
<400>3
nynnatgynn                                          10
<210>4
<211>45
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>4
tgattacgcc aagcttgcgg ccgcgaccaa agcgtgcgaa tagcg   45
<210>5
<211>37
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>5
tgcagctgat aagcttggtg actataaaca atcgccg            37
<210>6
<211>44
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>6
gacggccagt gaattcgcgg ccgccgagga actctgctac tgcc    44
<210>7
<211>37
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>7
taccgagctc gaattcgggc cgacgagttg gaaaagc            37
<210>8
<211>21
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>8
ggagtccgta tagtaagcat c                                              21
<210>9
<211>28
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>9
tgtacagcac tgtattggta tgtgaacg                                       28
<210>10
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>10
catgtagata agattagggc                                                20
<210>11
<211>60
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>11
gacgaattct ctagaagatc tctcgaggag ctcaagcttc tgtacagtga ccggtgactc    60
<210>12
<211>27
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>12
gacgaattcc gatgaatgtg tgtcctg                                        27
<210>13
<211>4664
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>13
agatctagga aaggaggcag cttgggctga gtattccagc gcaaaattct tattcttagg    60
ctaccttgtg gaaattgcaa gtaaccggga tatccatttg gtgattatgg tacagggaga    120
gaaaacgcaa aaagtggttg agcgatacct gataggcaaa ggtctcatat atactcgacc    180
tcgtgaggaa atggggtctg gcaccaatct ggaggtttct ctggtaaaag gttccttgag    240
tttggggatc caatctacac tcagtgaggg gatcactgag acatacaaat cgccctctgc    300
aatcattgcc ctggactcgt ctttaaatgt gaagagccct tcagttgaac atatgcgaac    360
cacatttgct cgtcatggta acctacttcc catcattcga ctcattgtct caaactccag    420
tgagcacatc gaactctgtt tcccggatcc tccagagctc caacgtcttc agttgatcgt    480
ccaatacact gtccgtctcc gcaatatagt aggtgatctg caggacgatg cccttggtgt    540
gcgtgaagac gtggaagaga tattgccttg gctttattca gatcacttca gcattagctg    600
gcctctgact cccattgaac ctttacacgt cgtgagctcc gataagctgt tatctgttca    660
acttgaagct caaccccaaa caactgttgc tggtacacca aaccacaaca cacaagctca    720
aaagcgtcta tttgtggaag attcaagcga gcatacgtct aaaagactac gggtggaatc    780
gtcacaggat aacactcaac ttacagagtc aacaaaattt ccaagtcaaa ccttggatag    840
cggtctgcat gccttagaga agaatctcgt gcagatgaga actacgcatg ccgctgagct    900
tgagaagttc cagaatgcat taactgacat gcaaacccgc ttacaggaga gagagaaact    960
actcgaatcg ctccagcatc gctatgaaac tcgaactaaa gacctccaca agatccggcg    1020
ggagcgggat cgcttggctg agtataaagc cacgtcagag cagaaaattg aaaaacaaag    1080
agaagatatt agcaagctaa aggatgagcg cacccagcta aggcaggatc tcgagcaggc    1140
aagggcggag atcaaaactg gaggaggtgc tgtagcagag ctggagacgg ctcgggaaga    1200
tattcgacgc ctgacacaag aaaatgctgg cctggaacgg aaggcagaat acgaggccaa    1260
gcaagccgag tacactcgcg agcagtacca aactgcgtct aatatggcgg ctcaaactgg    1320
gaacgaggtc cgccaacttc gagaagagaa cgagttatta aagcgtaagg ttgctgggaa    1380
tgctagtcgt ctacgagaga tcaataaaga gaacgacggg gcacgacatc tatctcgtat    1440
ctctgaactg gaagcttctc ttgcatcccg cgaagacctg ttacgccgaa aagaggatga    1500
gctgcgggaa attcgcaaga accgaccctc cacccgctcg accagtactc aacctcgcag    1560
cccgagactg accgctggaa gtcgtccaac gagcccagga atcaataatc ataacggacg    1620
tggcagcgcg ttaaggttca gctctgagat gcccagttaa gggtcttacc tgttttgcat    1680
aacttcacca gtttaagtgg aatttctatc atgttgcagc gactccaccg atttcattct    1740
tgcgactatg acgtttacat agaggagggc gtgcatttga tgtttttttt ttcatatcaa    1800
tgactttgca ttgtctgggc gttttgtatg cctgcaccct ttttctcatt ttattatctc    1860
attttgtgtg tggatcctgc gccccttctc aagttttcta cgttagattt tgaattggat    1920
gccataacca gtgtacgtca tccttatgac tacattgctc aatctgtttg caaatttttc    1980
tactgttcta ctgcccgagg acttcgtttt ccacatccaa tattagcgat gtttcaatat    2040
gtaggctgtt ttcgtattga ttatgctacg tgacaatatc tccttgttca aatgtataat    2100
tgattaatta cgtacaatta gtgcaagccg ttacttactg aatgatagtg ctgtaatccc    2160
tggttattca aaacatgaga tcaacgacat gaacaagcca tatgaacgat agggaaaata    2220
agtgcaatat aatgatagaa aataacataa taagcttcat cagtctttaa gccatggcgt    2280
tagccataaa tgtagacaac tctttcgctt tttcgccctt cgtcatcgta aaatgattag    2340
catcttccat tactgtgatt ccaccaatat tctcaggtcc aaccaatgta tcccacttgt    2400
taggtcccag atcggtccgg tcattaagaa gccagaccat ctccttggga tccttggaac    2460
cgtctgtcgg gggatcaggc cggggatctc ccggcttacc gcaaacaccg tccttggccc    2520
agatgatata agtcttgggc agtttcttgg cccatttctc gtctttgaat ggaaggggcg    2580
cggccttgta tgcgtcgaga gcgtcgataa aggctaggaa gtggggtagg agccaggagg    2640
gtggtgccgt tttaccttca ccgaagagac cgatagagtt gaagaagccg tacaatctct    2700
gcggcagctt ctcgaggccg atggggaagg gggtatcaag gagaagcaag cggtcgactt    2760
gttcaccttc ctcaaacatt agatggcgtg ccgcatcata tgcacagatc cctcctgctg    2820
accagccacc gaagctgtaa ggacccttgg gttgccgacg acgaatctct gctacatagg    2880
gcgcagtgag ttcatctagg ctgcatttga gcttctcagg tgtcttcata tatgggcaat    2940
tcaacccgta aacgcagacg tcaggagaga gtccggggat ggtagcgtaa gatgtagctg    3000
agccagagcc gtcaggaaac aagaataacg tctttgttgc tgtcctgggg tttccttgta    3060
acaggatgga tgtggccttg ggatgttgag caagctttgg ctggaggtcg tggatagctt    3120
cagggaattt cactggctct ggcataggaa ttggagcaga ggtagtcttg ggttttaggt    3180
ccaaagccac ctctatatca ttgagggtct ggttttcgat gaagaactct cctggcaggt    3240
ccatgtccaa agtctcccgt attcttccaa gaacagtaag ggagagaagc gagtccatac    3300
ccatctctcc caagttctcg tcagggtcga tctcttctgc gggtacaccg atctcctccg    3360
ccatgatgtt acggatttcc ttcatggtgc cgttttgctc gacttgagct accttctcat    3420
tcggcggtga cgttatgtca ggtgtgcttg cgcttgagga ctcgccaccg ttgaaagaga    3480
aattcgactc ttgttcactg gaggaaccat catggctctc tgaaggactc acttgggcga    3540
tgagccgctt gaagtcgttg acagttggat gatcggtaaa cacagaggag tccaaatcga    3600
ggttcaactc ttcacgatac ctgccagtaa ctgtaaggga gaggagtgag tctacaccgt    3660
agtccgcaaa caccatgtcg tctgagattt cagactctgc caggccaact tctgaggcca    3720
gaatgctgag tgcgcgtacg acaacactcg gcccagaaga tttggtgaac gacttggaag    3780
gaacaggtgc tttaggacgg gtcttggcgc cggtgttggc cttctgagtg cgagctggag    3840
gtggtgattt cgctgtaatt ggtgcctttg aaccgccaac agggggaaga acagtgtcaa    3900
gtatcttgcg tgccagtgct tggaactaat tatcatgtca gtaagcagga accaaaatca    3960
gtagtgaggt acccaccttc acacctccga agacagcaat aatatcgtcg ccctcaaaga    4020
tataaacatc tccagcccaa atgttgtttt gccatggctg catcctcaca taagtgcgat    4080
aagtgacatc aggcgagaac ttcttcaggc aacgcatcga atcccatcca tggttaacaa    4140
atacttggtt cttagagtcg gtcgcgtcgc tcgcattcat aatgaatccg gacaagtgac    4200
cgaaactgtc aatccagaat gggtttcggt ggaaatttcc tggcggtgct tggaatttga    4260
cacgagcggt ggcctcatta ttgtcgctgt ccaggataac ctcgcgaatc gacttgaaat    4320
tttcatcata atcgaccaac gcgctgaaaa gtttatagac cattcctcgc tggatacggt    4380
gagcctcccc tgtctccgca ttctggtgaa gactgtcgat gcttctcttg accaggtacg    4440
agattctctt ccactcgagc tcggaggcat tggtatcaaa gaacttcacc gtacaatacg    4500
catgatccac ggtctttttg ccgtcagcat taacggcgta tacttgaact gaagccttct    4560
tctcagccca attagcaata gcagagactc taaagagctg ctctcctccc ttcgcgatga    4620
gtggcttcgg tacgaccatg tcacacacat cgagaccaag atct                     4664
<210>14
<211>2249
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>14
atggctgacg aggatcaata tcgtggagac gaccagatcg atgaggaaga ggaggagacc    60
gacgagagtg tacacacttt caaacacacc tgaaagcttc ggaggctaac atgttatcaa    120
ccaaaatagg gatacaaaac agtgaaagat gccgttcttt ttgctatcga agtcagcgat    180
tcgatgctca cgcctcgtcc atcttccgat tcaaagaaac ctgcggagga gtcccccaca    240
acggccgcac taaaatgcgc atattatctc atgcaacaac gcattatctc taatccccgt    300
gacatgatcg gtgtgctatt atatgggacg caggcgtcca aattttatga cgaggatgaa    360
aatagtcgag gagatctttc atacccacac tgctaccttt tcacagacct tgatgtcccc    420
tctgcgcaag aagtcaagaa tcttcgggca ctagcacaag acggcgatga atcaaaggat    480
gtacttaagg cgtcaggcga gcgggtctca atggcgaacg tactcttttg cgccaatcaa    540
atattcacgt cgaaagcccc taacttcttg tctcggcgat tgtttatagt caccgataat    600
gatgaccctc atggcgataa taaaagcttg agatccgctt caactgtacg cgcgaaggac    660
ttatatgacc tcggtgtcac tattgagctg tttccgattt ctcggccagg ccatgagttc    720
gataccgcca gattctatga cgtaagatta tattgactca atgtgaagta tcgctgctaa    780
cagcaattag gatatcatct acaaggcctc tccttcggat ccagatgccc cggcatacct    840
gcaaaccgat tccaaggctt ctccagccac cggggatggg atatcactgc tcaataccct    900
cctgtccaat atcaattcaa gatctgtccc acggcgtgca cagttctcca atataccatt    960
ggagcttgga ccaaacttaa aaatatctgt ctcaggatat cttttgttca agcgtcaagc    1020
acccgccaga aactccttca tctggctcgg cggtgaacag ccccagattg tcaaaggagt    1080
gaccactcaa atcgctgacg acacggctcg cacgattgaa aagtgggaaa ttaagaaagc    1140
ttataagttt ggcggtgatc aggttgcttt cacgcccgaa gagatgaagt cactgaggaa    1200
cttcggtgat cctgtcatcc gtataatagg gttcaagccc ctctctgcac ttccgttctg    1260
ggccaatatc aaacacccct cctttatata cccatcggaa gaagattttg tgggctccac    1320
gcgggttttt tctgctttgc atcagacact cctccgggat aaaaaggccg cacttgtctg    1380
gttcattgct cgtaaaaatg caagtcctgt tctgggggct atggtcgccg gagaagagaa    1440
actagacgag agtggcgtcc agaagtttcc tccaggaatg tggataatac ctctcccgtt    1500
cgctgatgac gtccgtcaaa accctgaaac cacactccat gttgcacctg agccattgat    1560
cgatcaaatg cggtatattg tccagcaatt gcaacttcca aaggcgtctt acgacccctt    1620
taagtaccct aatccatgta agcttctgcc aacttcctgc acagaaactc tggcattaac    1680
ctattgctct gttagccctc caatggcatt atcgcattct acaagccttg gcgttggatg    1740
aggacctccc ggagaagcca gaagacaaaa cgttgcccag atatcggcag atcgataaag    1800
tatatcacac attcctattc tttccacgga tcttgctgac cttcgcttag cgcactggcg    1860
actatgtatt gtcttgggcc gacgagttgg aaaagcaata cgcgaaaata tcggcacatg    1920
gcccgaagag cacactcgtc aaacgaagcg ccaaagaccg aacatctgaa gtcgaggatg    1980
cagcccagaa gccatacaag aaagtgaagg tggagacaga cgagcaaggc gttgaagatg    2040
tagtgcgagc ccattaccag aagggatcgc tatcgaaggt gactattacc tgccccctag    2100
gctttaattt ggactaacta acgcgcgtga cttgtgtgta gcttacggta cctgtcctca    2160
aagactttct gaatgcccat ggacgctccg ctgctgggaa gaaagctgat ctcgttgagc    2220
gtgtggagga gtatttggag cagaaatga                                      2249
<210>15
<211>2662
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>15
atggcggaca aggaagcaac tgtgtatatt gtggacgttg ggaggtccat gggagaatgt    60
cgcaatggcc gatcagtgac tgatcttgaa tgggccatgc agtatgtctg ggatcgcatt    120
acaggaacag tgagtggcag tcgtcacaat tggaccgtat tcgttaaata ccttgctcaa    180
tttcaaacca ggtggccact ggccgcaaaa ctgccatgat gggtgtgatt ggactcagga    240
cagatggtat gtatacttct gaatactgta tgcggttcat acgctgatcc aaaaattaga    300
aacgtccaac gaacttgaag atgacgtaca tttctctcac attgcagttc tgtcgaacct    360
caaacagtat gctttccact ctatgataat ttggtttgtg cgccaaactg acgaggacgt    420
caaggtttct tatgccggac attcggaaac tggaagatga actgaaaccg agcaaaacgg    480
acaaaggaga cggtaagctt tttgagagcc actaggacct actgtccaat ttactaaact    540
ttgttctcta gctatttccg ctattatctt ggctattcag atgattatca cgcattgcaa    600
gaagttgaag tacaggcgca agatcgtcct cgtcactaac ggacaggggc gcatgagcga    660
tgaagacctg ggcgagattg tgaagaaggt caaggaagat aacatcgagc ttgttgttat    720
gtcagtgatt tgctaccaga tagcaacgaa acaaaagcta acttcaagca ggggaattga    780
tttcgatgac cctgagtacg gttacaaaga agaagacaaa gaccctcaca aggtagcgat    840
atctctcgcg cagctttgtt cttttctaac aactaaaaca ggccgaaaat gaaactctct    900
tgcgtaccct tgtggaagat tgtgatggag tctatggaac attcgagcag gctgtggctg    960
aactagacat cccccgtgtc aagtctgtca ggtcagtggc aagcttcaaa ggatatctcc    1020
aactaggcaa cccagaggag tatgactctg ctctccgcat tcctgttgaa aggtactatc    1080
ggacttaccc ggccaaaccc ccgaccgcaa gttctttcgt cctgcgctca gagcctgaag    1140
ctggacaaga agaggcagag tcatctgagg ctgctgctgc tacgcaaaaa gggagccaat    1200
ctggagatgc cggattgacc actgtgagaa ccatgagaac atatcaagtt gaggacaaaa    1260
gtgcaccggg tgggaaaatc gacatcgaac gagatgagct cgccaaagga tatgagtatg    1320
gacggacagc agttcacatt agtgaaactg acgagaacat cacgattctc gatacattcg    1380
cagggctgga gttgatgggc ttcatccaga ctgaccaggt atgtcttgct gaagtcgcct    1440
cggtgcatgc tctgacacac gattatagta tcaacgttat atgcacatgt ccaacacaaa    1500
catcataatt gcacaacgtg ccaacgacaa agcagctctt gccctttcat cctttataca    1560
cgcccttttt gagctagaat gctatgctgt tgctcgccta gttgtgaaag agaacaagcc    1620
accagttata gtcttgctcg cgccctcgat cgagcctgag tatgaatgcc ttctcgaagt    1680
ccagttacca tttgcggaag atgtccgaac ctatcggttc cctcctctgg ataaagtgat    1740
tactgtttcc ggaaaggttg tgacacaaca ccggaatctt cccagtgatg atttactcga    1800
tgtgatgggc aagtacgtga atagtatgga gcttgtcgac gcagatgagg atgggtaggt    1860
ttatgcctaa aagattccga atatcttctc attgacataa ccagggatcc agtggagact    1920
ttccctatcg acgactcgta ttccccagtt ttgcaccgga ttgacgccgc catccgtgct    1980
cgggctatac atcctgacca gcccatacct cctccatcag agagactgac aaaattctca    2040
cacccacgag aggatctcat cgagaaatca cagaaacacc tagagaagtt gatcgagata    2100
gccgatgtta agaagggttg gacatcaccc cacaatcaag tctgtcagac tgctaattca    2160
gttaccagtt cctcccaaag cgaagggtcg caagcgcact cgtgaaaccg aaaagccact    2220
ttccggactc gacgtcgatg ccctgcttca tcatgaaaag cgcgtcaaga tatctcccaa    2280
caatgccatt cctgagttca agcagactct cgcacaggcc gagaatatcg aggccatcaa    2340
agacgctaca aagcagatga tggtcatcgt tgaagatcaa atcaaacaca gtctcggtaa    2400
tgctaactac gaccgggtca ttgaagcgct gggcacgatg cgtgacgagt tggtatctta    2460
cgaagagcct gcctcctaca atgacttcct gggccagctc aaggataagt tactgcagga    2520
gaagcttgga ggagaccgac aagagctgtg gtggcttgtt cgacgaaaca agctgggact    2580
tgtcactcag cgcgagtcgg atcaatctag ggttaccgat acggaagcca aagaagtaag    2640
tctcactaag atgaaggagt ga                                             2662
<210>16
<211>2284
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>16
atggcggacg gcaacccaca tcgggaagat gaggcggccg aggaagaaga ggagattgat    60
gagactgtac gcaaatttac ccatgaactt ggactggaac tctggaactg acaataagat    120
cagagctaca aaccagtcaa agatgcggtc ctcttcgcaa tcgatgtcag cgattccatg    180
ttgacgcctc gcccctcagc agatcctaag aaacacaccc aagaatcacc caccacggca    240
gcgctcaaat gcgcctatca cttcatgcaa caacgaatca tatcaaatcc acaagacatg    300
atgggtgttt tgctgttcgg gacccaggcg tccaagttct ttgaagaaga tgaagacagt    360
cggggagacc tgtcctaccc caactgctac ctcttcactg atctggatgt tccttcggct    420
catgaggtca aaggacttcg agcactggta gatgatgaag gagactcaag ggaggttcta    480
tctccagcga aagagcaggt ctctatggca aacgtcctat tttgcgccaa ccagatattc    540
acatccagag cgccaaattt cctctcccgg cgtttgttca tcataaccga caatgacaac    600
ccccatggtg atgataaaac cctgcggtca gcggcgactg tacgtgctaa ggatctttac    660
gatcttggtg tcacaattga gctgtttccg atctcacgcc ctgagcatga gttcaagaac    720
agcaagttct atgacgtaag ctatcatact ctatagcaaa gtggcagggg tcgatactca    780
ctacagatac aaaggatatt atctacaagt cattgcccag cgatccagag gcgcctgcat    840
atctacaatc tgattcaaaa gcggcgactg cgaccgggga cgggatttca ctcctcaaca    900
cgcttctgtc cagtattaat tcgagaacgg ttccgcgtcg cactcatttt tcgaacatgc    960
ctttagaact tggcccagac ttcagaattt cggtatcggg ctatatactc ttacgaaggc    1020
aagcgcccgc tagaaactcc ttcatctggc tgaacggcga gaagcctgtg gtcgcgaaag    1080
gagtgacttc ccactccgca gatgatactg gccggactgt cgagaaatgg gagatcagaa    1140
aggcatataa gttcggtggc gaccaagtaa ccttttcgcc tgatgagcag aaggcgctta    1200
gggatttcgg tgagccagta atccgggtta ttgggttcaa gcctatcact gcgcttccat    1260
tctgggcaaa cgtcaagcac ccatatttta tctatccatc cgaggaagac tatgtaggct    1320
cctcgcgagt attttccgca ttgcatcaga ctcttttgcg ttccaagaag atggcactcg    1380
tctggttcat tgcacgcaag ggtgctggcc ccgttctcgc cgctatgatc gcaggcgaag    1440
aaaagcttga tgagaatggc gtacaaaaat accctcctgg catgtggatt cttcccctcc    1500
ccttcgcaga cgatatccgg cagaaccccg aaacaacgtt gaatgtcgcc ccggagtcat    1560
tgattgatca gatgcgcgtg atcgtccagc aactgcagct gccgaaggga gtgtacgagc    1620
ctctcaaata ccccaatcca tgtaagtcac ttctgtcttg cattgctcgt atacgatgaa    1680
cgagaagctg acagcccgtg atcagccctt caatggcatt accgcatcct acaagctctc    1740
gcattagacg aagatctccc cgaaaaacca gaagacaaaa ccattccgaa ataccgccaa    1800
atcgacaagg taaatccacc acacccaaca cgagaaataa ccctccaggc gtccaactta    1860
ctgacaattg caccacagcg cgccggtgac tacgtattat cctgggccga cgaactcgaa    1920
aagcaatacg ccaaaacctc agcagcggcc cctcgcccaa ccagcaccct cgtgaaacga    1980
ggatcaaaag accgagcaag cgaaaccgag gactccaagc catcgaaaaa gatcaaggtt    2040
gaggaagact ctggaagcct agaggaggaa gtccgcaggc atcacaagaa gggaacgcta    2100
tccaaggtaa gccaccacag gctttctaca cgtcctcgtg atggcaaata tgacatcgta    2160
ttaaccggcg gttttctagc ttacggtcgc tatcctcaag gacttcttga cttccaatgg    2220
acgctcaaat gccggtaaga aggcggatct tattgagcgg gtagaggagt tcttggagca    2280
gtga                                                                 2284
<210>17
<211>2651
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>17
atggccgata aagaggcaac tgtctacatc gtggactgcg gcaagtccat gggggagcgg    60
cgtcatggtc gcgaagtgac ggatctcgac tgggcgatgc aatatgtttg ggatcgtatt    120
acagggacgg tgagatcctt attcttgaga atcatatcat acatgaaagc ttatgttttg    180
gataggtggc cactggacga aaaatggctt tgatcggtgt tcttgggctc aggacagatg    240
gtgagtgact agcctcccgg gtacagttgg tagttgtagt ttgctggtcg gggctaatgc    300
aggaacgtcc agaaaccgct aatgagttgg aggatgatcc tgattattcg catatctcgg    360
ttttgtctgg gattaaacag tatgattcat ttttgtctgc tgatcctctg gttattcgct    420
gatgaactat aggtttctta tgccggatat ccggggtttg agcgaccgaa taaagcctag    480
caagactaat aagggagatg gtgagttact cttcttgtat ggaattggag tgattggggc    540
tgagccgatg aatatagcta tctctgcact tgtgctcgcg attcagatga ttatcactca    600
gtgcaagaaa ctgaagtaca agcgcaggat tgtcctggtt actaatgggc agggcccgat    660
gaacccggat aatcttagtg aaataacgaa gaagattaag gaggataaca ttgaacttat    720
tattctgtta gtgtcaattg atacactgag agaaccgggg tactaacatg ctgcagggga    780
ccagactttg atgatcctga atatggggtg aaagaggaag ataaagatcc gcgaaaggta    840
tttaacttcg ttccatatgc tctagactaa taataacaat ggctacaggc cgaaaatgaa    900
acactcctgc gtagtcttgc cgaagactgc gaaggagcct atggaaccct agaacaagct    960
gttgcggagc tggaaactcc tcgtgtgaaa accacaagga taacagcaag cttcaagggc    1020
catttgcaac taggaaaccc cgcagaatat gatactgcag ttcggatccc tgtggagcgc    1080
tactacagga catacgttgc aaaagctccg tcggctagtc agttcacagt acgtaacgaa    1140
gaggagatgg gaatggccgc ggccgcagcc ggctcgcagg aaggtagttc ccttgtgggt    1200
gttcgaaaca acaggtccta ccaaattgac gatgggacta ctgaagaagg ggtgagggac    1260
gtggatcgag agcaacttgc caagggttat gagtacgggc ggacattggt ccctattagc    1320
gagacggatg agaatatcac caccctagag acatttgcgg ctatcgagct tcttgggttt    1380
atacagagcg atcgggtgag ttctaccctc caataactgt tattatgctg ctaagtgggt    1440
tttgccatta gtatgatcga tacatgcaca tgtcgacgac aaacatcatc atcgcgcagc    1500
gcgcgaatga caaggcagca ctcgctcttt cctctttcat acatgcgctg ttcgagctgg    1560
aatcgtacgc tgtcgcccgt atggtgctaa aggagaacaa accccctgtc atagtcgtgc    1620
ttgcgccatc aatcgaaccc gactacgagt gtctcctcga agcgcagttg ccattcgcag    1680
aagacgtacg aacgtaccgc ttccctccac tcgacagagt cattacagtg tctggtaaag    1740
tggtgacaca gcatcgaaac ctacccaacg acgatctgtt gaatgcgatg gacaaatacg    1800
tgaaaagcat ggagcttacc gatatggacg agaacgggtg agaagaattg gaagtgatct    1860
caacttcact gctgactttg tacaaagtga cccgacggaa tctctcccaa tagacgactc    1920
tttctctcca gtcctgcacc ggatcgactc cgcaatccgt caccgtgcca ttcatcccaa    1980
cgaccctatc ccgcccccag cctcagtcct aacgaagttc tcccaccctc cggatgacct    2040
cgtcgagaag tccaagaaat acctagacaa gctagtagca gtgtcggacg tcaagaaagg    2100
tcagtccatc tcggccttga gcctcttagg cccccatcat actcacagtg atgaatctag    2160
tcccaccaaa aaccaaaggc accaaacgga cccgcgaaac cgagaagcca ctatccggtc    2220
tcgacgtcga tgcccttctc caccaagaga agcgcacgaa gatctcaccc aacaacgcaa    2280
ttcccgagtt taagcagacg ctctcgcagg cagagaacat cgagatcatc aaggatgcag    2340
tgaagcagat gagcactatc attgaagacc aaatcaggca tagtcttggc gatgttaatt    2400
atcatcgggt cactgagggg ctaggtgtga tgcgggagga actgatcgat tatgaggaac    2460
ctgctctgta taacgatttc ttgaagcagc tgaaggagaa gttgttgaaa gaggagctcg    2520
gtggggatcg acgggagctg tggtggctgc taagaaggag taagttgggg ttgattgaac    2580
agagggagtc ggaacactct gaggtgagag aagaggaagc gaaggcgttt atgtctatgg    2640
ctgctaagtg a                                                         2651

Claims (22)

1.用于产生目标重组多肽的方法,所述方法包括步骤:
a)提供编码一种或多种目标多肽的多核苷酸文库,其中在包含至少下述元件的表达克隆载体中制备所述文库:
i)编码选择性标记的多核苷酸;
ii)真菌复制起始序列,优选自主复制序列(ARS);和
iii)以连续顺序(in sequential order)包含下述的多核苷酸:源自真菌细胞的启动子、可将文库克隆入其中的克隆位点,和转录终止子;
b)用所述文库转化亲本丝状真菌宿主细胞的突变体,其中与亲本相比,突变体中非同源重组的频率降低;
c)在适合表达所述多核苷酸文库的条件下培养(b)中获得的经转化的宿主细胞;和
d)选择产生目标多肽的经转化的宿主细胞。
2.根据权利要求1的方法,其中所述突变丝状真菌宿主细胞在选自下组的基因座中被修饰:ku70、ku80、rad50、mre11、xrs2、lig4、sir4或它们的功能等同物。
3.根据权利要求2的方法,其中基因座是ku70或ku80或它们的功能等同物。
4.根据权利要求1的方法,其中ARS是AMA1-序列或其功能性衍生物。
5.根据前述任一项权利要求的方法,其中所述编码标记的序列的翻译启动起始位点包含下述序列:
N YNN ATG
其中位置-3中的“Y”是胸腺嘧啶(尿嘧啶),“N”是任何核苷酸,并且相对于所述标记的起始密码子“ATG”(以粗体表示)的第一个核苷酸指定数字编号;
6.根据权利要求5的方法,其中序列在位置-1、-2和-4中的一个或多个进一步包含胸腺嘧啶(尿嘧啶)。
7.根据权利要求1-6中任一项的方法,其中步骤(i)的选择性标记选自下组:amdS、argB、bar、hygB、niaD、pyrG、sC和trpC。
8.根据权利要求7的方法,其中步骤(i)的选择性标记是pyrG或其功能性衍生物。
9.根据权利要求8的方法,其中步骤(i)的选择性标记是pyrG的功能性衍生物,其包含一个或多个氨基酸的取代,优选地,该衍生物包含氨基酸取代T102N。
10.根据权利要求1-9中任一项的方法,其中步骤(ii)的真菌复制起始序列包含SEQ ID NO:1或SEQ ID NO:2中所列的核苷酸序列,或是其功能性衍生物,优选地,该功能性衍生物与SEQ ID NO:1或SEQ ID NO:2至少80%相同。
11.根据权利要求1-10中任一项的方法,其中步骤(iii)的启动子是来自黑曲霉(Aspergillus niger)的中性淀粉酶编码基因(NA2)的启动子。
12.根据权利要求1-10中任一项的方法,其中启动子是NA2tpi启动子。
13.根据权利要求1的方法,其中步骤(iii)的转录终止子是来自黑曲霉的葡糖淀粉酶编码基因(AMG)的终止子。
14.根据权利要求1-13中任一项的方法,其中所述丝状真菌宿主细胞是枝顶孢属(Acremonium)、曲霉属(Aspergillus)、鬼伞属(Coprinus)、镰孢属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliopthora)、脉孢菌属(Neurospora)、青霉属(Penicillium)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霉属(Trichoderma)的丝状真菌宿主细胞。
15.根据权利要求14的方法,其中所述细胞是米曲霉(Aspergillus oryzae)、黑曲霉、构巢曲霉(Aspergillus nidulans)、灰盖鬼伞(Coprinus cinereus)、尖镰孢(Fusarium oxysporum)或里氏木霉(Trichoderma reesei)的细胞。
16.根据权利要求1-15中任一项的方法,其中目标多肽是酶、酶变体或它们的功能性衍生物。
17.根据权利要求16的方法,其中酶或酶变体是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶。
18.根据权利要求16或17的方法,其中酶或酶变体是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
19.根据权利要求1-16中任一项的方法,其中目标多肽是激素或激素变体或它们的功能性衍生物,受体或受体变体或它们的功能性衍生物,抗体或抗体变体或它们的功能性衍生物,或者报道蛋白。
20.根据前述任一项权利要求的方法,其中所述目标多肽是异源多肽。
21.根据权利要求14的方法,其中所述丝状真菌宿主细胞选自米曲霉或黑曲霉。
22.根据权利要求1-21中任一项的方法,其中在步骤(d)后将编码目标多肽的多核苷酸从由步骤(d)的选择的经转化的宿主细胞中分离。
CN200880015244A 2007-05-09 2008-05-07 适于选择产生目标多肽的文库克隆的表达克隆方法 Pending CN101679993A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA200700694 2007-05-09
DKPA200700694 2007-05-09
PCT/EP2008/055638 WO2008138835A1 (en) 2007-05-09 2008-05-07 Expression cloning method suitable for selecting library clones producing a polypeptide of interest

Publications (1)

Publication Number Publication Date
CN101679993A true CN101679993A (zh) 2010-03-24

Family

ID=38226473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880015244A Pending CN101679993A (zh) 2007-05-09 2008-05-07 适于选择产生目标多肽的文库克隆的表达克隆方法

Country Status (7)

Country Link
US (1) US20100221783A1 (zh)
EP (1) EP2147107B1 (zh)
JP (1) JP5497632B2 (zh)
CN (1) CN101679993A (zh)
AT (1) ATE517188T1 (zh)
DK (1) DK2147107T3 (zh)
WO (1) WO2008138835A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104894115A (zh) * 2015-05-26 2015-09-09 中国科学院青岛生物能源与过程研究所 一种具有高效同源重组能力的土曲霉及其构建方法与应用
CN104894165A (zh) * 2015-05-26 2015-09-09 中国科学院青岛生物能源与过程研究所 一种提高基因打靶技术在土曲霉中应用效率的方法与应用
WO2019227363A1 (zh) * 2018-05-31 2019-12-05 大连民族大学 一种地生弯颈霉发酵生产脂肪酶的培养基及其培养方法
CN112301047A (zh) * 2020-11-02 2021-02-02 江苏东玄基因科技有限公司 一种精确调控重组蛋白表达的方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102597241B (zh) 2009-07-22 2015-09-02 帝斯曼知识产权资产管理有限公司 用于生产感兴趣的化合物的经改进的宿主细胞
DK2683732T3 (en) * 2011-03-11 2016-12-12 Dsm Ip Assets Bv Vector-host-system
CA2855451A1 (en) 2011-11-21 2013-08-15 Novozymes, Inc. Gh61 polypeptide variants and polynucleotides encoding same
CN104245926B (zh) 2012-04-27 2021-05-07 诺维信股份有限公司 Gh61多肽变体以及编码其的多核苷酸
EP2929028A1 (en) * 2012-12-07 2015-10-14 Novozymes A/S Method for generating site-specific mutations in filamentous fungi
WO2015059133A1 (en) 2013-10-22 2015-04-30 Novozymes A/S Cellobiose dehydrogenase variants and polynucleotides encoding same
WO2015082535A1 (en) * 2013-12-03 2015-06-11 Novozymes A/S Fungal gene library by double split-marker integration
EP3114276B1 (en) 2014-03-05 2019-01-16 Novozymes A/S Compositions and methods for functionalizing and linking materials
EP3114272A1 (en) 2014-03-05 2017-01-11 Novozymes A/S Compositions and methods for improving properties of cellulosic textile materials with xyloglucan endotransglycosylase
AR099683A1 (es) 2014-03-05 2016-08-10 Novozymes Bioag As Composiciones que comprenden polímeros de xiloglucano como portador para agentes agrícolamente benéficos
WO2015134729A1 (en) 2014-03-05 2015-09-11 Novozymes A/S Compositions and methods for improving properties of non-cellulosic textile materials with xyloglucan endotransglycosylase
EP3113609B1 (en) 2014-03-05 2019-07-31 Novozymes A/S Methods for improving post-harvest properties of agricultural crops
CN107223157B (zh) * 2014-12-16 2021-01-08 丹尼斯科美国公司 用于辅助菌株介导的真菌基因组修饰的组合物和方法
WO2017070219A1 (en) 2015-10-20 2017-04-27 Novozymes A/S Lytic polysaccharide monooxygenase (lpmo) variants and polynucleotides encoding same
US20190225988A1 (en) 2016-09-15 2019-07-25 Novozymes A/S Genomic integration of DNA fragments in fungal host cells
JP7181865B2 (ja) * 2017-06-23 2022-12-01 株式会社カネカ メタノール資化性酵母内において高効率にベクターをアセンブルする方法
WO2020173817A1 (en) 2019-02-28 2020-09-03 Novozymes A/S Calcite binding proteins

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000024883A1 (en) * 1998-10-26 2000-05-04 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
WO2005095624A2 (en) * 2004-04-02 2005-10-13 Dsm Ip Assets B.V. Filamentous fungal mutants with improved homologous recombination efficiency

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
JP2703598B2 (ja) 1987-09-04 1998-01-26 ノボ―ノルディスク アクティーゼルスカブ アスペルギルス菌中でのタンパク質生産物の生産方法およびアスペルギルス菌中で使用するためのプロモーター
CA1341226C (en) 1988-08-16 2001-05-01 Wim Van Hartingsveldt Gene replacement as a tool for the construction of aspergillus strains
US5648267A (en) 1992-11-13 1997-07-15 Idec Pharmaceuticals Corporation Impaired dominant selectable marker sequence and intronic insertion strategies for enhancement of expression of gene product and expression vector systems comprising same
MX9606013A (es) 1994-06-03 1997-12-31 Novo Nordisk Biotech Inc Lacasas purificadas de myceliophthora y acidos nucleicos que codifican para las mismas.
EP0777737B1 (en) 1994-06-30 2005-05-04 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
EP0877801B1 (en) 1996-01-19 2005-04-27 Novozymes Biotech, Inc. Morphological mutants of filamentous fungi
AU3336597A (en) * 1996-07-05 1998-02-02 Novo Nordisk A/S A transcription factor
AU2001234443A1 (en) 2000-01-13 2001-07-24 Novozymes Biotech, Inc. Methods for producing a polypeptide using a crippled translational initiator sequence
US6569681B1 (en) * 2000-03-14 2003-05-27 Transkaryotic Therapies, Inc. Methods of improving homologous recombination
DK1266011T3 (da) 2000-03-14 2010-07-26 Novozymes As Svampetranskriptionsaktivator, der er anvendelig i fremgangsmåder til fremstilling af polypeptider
EP1217074A1 (en) 2000-12-22 2002-06-26 Universiteit Leiden Nucleic acid integration in eukaryotes
US7063962B2 (en) * 2001-07-20 2006-06-20 Novozymes A/S DNA sequences for regulating transcription
AU2003206683A1 (en) 2002-02-19 2003-09-09 Novozymes A/S Expression cloning methods in filamentous fungi

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000024883A1 (en) * 1998-10-26 2000-05-04 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
WO2005095624A2 (en) * 2004-04-02 2005-10-13 Dsm Ip Assets B.V. Filamentous fungal mutants with improved homologous recombination efficiency

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104894115A (zh) * 2015-05-26 2015-09-09 中国科学院青岛生物能源与过程研究所 一种具有高效同源重组能力的土曲霉及其构建方法与应用
CN104894165A (zh) * 2015-05-26 2015-09-09 中国科学院青岛生物能源与过程研究所 一种提高基因打靶技术在土曲霉中应用效率的方法与应用
CN104894165B (zh) * 2015-05-26 2019-01-25 中国科学院青岛生物能源与过程研究所 一种提高基因打靶技术在土曲霉中应用效率的方法与应用
WO2019227363A1 (zh) * 2018-05-31 2019-12-05 大连民族大学 一种地生弯颈霉发酵生产脂肪酶的培养基及其培养方法
CN112301047A (zh) * 2020-11-02 2021-02-02 江苏东玄基因科技有限公司 一种精确调控重组蛋白表达的方法

Also Published As

Publication number Publication date
US20100221783A1 (en) 2010-09-02
ATE517188T1 (de) 2011-08-15
DK2147107T3 (da) 2011-10-24
JP5497632B2 (ja) 2014-05-21
EP2147107B1 (en) 2011-07-20
EP2147107A1 (en) 2010-01-27
JP2010525830A (ja) 2010-07-29
WO2008138835A1 (en) 2008-11-20

Similar Documents

Publication Publication Date Title
CN101679993A (zh) 适于选择产生目标多肽的文库克隆的表达克隆方法
EP2456872B1 (en) Improved host cell for the production of a compound of interest
US9873881B2 (en) Promoter variants for expressing genes in a fungal cell
AU2008214663B2 (en) A recombinant host cell for the production of a compound of interest
CN102224245B (zh) 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
US7794962B2 (en) High-throughput screening of expressed DNA libraries in filamentous fungi
JP3792725B2 (ja) 糸状菌の形態変異体
CN105586355B (zh) 在镶片镰孢的酶缺陷突变体中产生多肽的方法
EP2683732B1 (en) Vector-host system
EP1954812A2 (en) Dna binding site of a transcriptional activator useful in gene expression
EP1478755B1 (en) Expression cloning methods in filamentous fungi
WO2001079558A1 (en) High-throughput screening of expressed dna libraries in filamentous fungi
EP2646558B1 (en) Promoters for expressing genes in a fungal cell
CN113056552A (zh) 经修饰的丝状真菌宿主细胞
CN112585267A (zh) 使用内含子制备dna构建体的组合文库
CN114555777A (zh) 经修饰的丝状真菌宿主细胞

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100324