CN110331146B - 一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系统和应用 - Google Patents

一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系统和应用 Download PDF

Info

Publication number
CN110331146B
CN110331146B CN201910834799.7A CN201910834799A CN110331146B CN 110331146 B CN110331146 B CN 110331146B CN 201910834799 A CN201910834799 A CN 201910834799A CN 110331146 B CN110331146 B CN 110331146B
Authority
CN
China
Prior art keywords
dna
leu
sgrna
lys
transcription
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910834799.7A
Other languages
English (en)
Other versions
CN110331146A (zh
Inventor
田朝光
李金根
顾淑莹
赵祯
刘倩
孙文良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Institute of Industrial Biotechnology of CAS
Original Assignee
Tianjin Institute of Industrial Biotechnology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Institute of Industrial Biotechnology of CAS filed Critical Tianjin Institute of Industrial Biotechnology of CAS
Priority to CN201910834799.7A priority Critical patent/CN110331146B/zh
Publication of CN110331146A publication Critical patent/CN110331146A/zh
Application granted granted Critical
Publication of CN110331146B publication Critical patent/CN110331146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/38Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Aspergillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/44Polycarboxylic acids
    • C12P7/46Dicarboxylic acids having four or less carbon atoms, e.g. fumaric acid, maleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01023Orotidine-5'-phosphate decarboxylase (4.1.1.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种调控sgRNA编码DNA转录的启动子、表达载体,及其基因组编辑系统和应用。本发明提供的具有调控sgRNA编码DNA转录的启动子含有如SEQ ID NO.1所示核苷酸序列,可利用该启动子构建调控sgRNA编码DNA转录的表达载体,并用于CRISPR/Cas9的基因组编辑系统中,进而应用所述基因组编辑系统能够显著提高真菌基因组编辑效率。利用本发明能够更有效的改造真菌尤其是丝状真菌菌种,如显著提高黑曲霉生产苹果酸的水平,具有较大的推广应用价值。

Description

一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系 统和应用
技术领域
本发明涉及生物技术和基因工程领域。具体而言,本发明涉及具有调控sgRNA编码DNA转录的启动子功能的DNA片段、及含有该DNA片段的sgRNA表达载体,其组成的基于CRISPR/Cas9的基因组编辑系统及其应用。
背景技术
CRISPR(clustered regularly interspaced short palindromic repeats)是在进化进程中形成的一种获得性自我免疫防御系统,由高度保守的重复序列和完全不同的间隔序列交替排列组成,广泛存在于细菌和古细菌中,主要依赖本身基因组整合的外来片段对抗该外源DNA的再次入侵。2013年张峰等首次将CRISPR/Cas9技术应用于哺乳动物细胞的基因编辑(Le Cong et al. Multiplex genome engineering using CRISPR/Cassyetems. Science, 2013,339(6121): 819–823),自此CRISPR/Cas9开始被作为一种基因编辑技术而被广泛使用,该技术与前期基因编辑所用的核酸内切酶,如锌指核酸酶和类转录激活因子效应物核酸酶等相比具有技术操作简单、特异性强等特点。
CRISPR系统只需要核酸酶Cas9蛋白、成熟的crRNA (CRISPR associate RNA)、tracrRNA (trans-activating crRNA)及RNase III 4种组分,即可对具有特异序列的外源DNA进行识别以及剪切。Jinek等将crRNA和tracrRNA连接成一条单链引导RNA(single-guide RNA,sgRNA),在sgRNA的引导下可高效介导Cas9蛋白对靶标序列进行定点切割(Jinek M, et al. A programmable dual-RNA-guided DNA endonuclease in adaptivebacterial immunity[J]. Science, 2012, 337(6096):816-821)。当构建的外源CRISPR/Cas9 系统被导入受体细胞后,由sgRNA识别靶标位点,Cas9负责对DNA 双链进行切割,DNA损伤会触发细胞自身的DNA修复机制,同源修复(homology-directed repair,HDR)以外源供体DNA(donor DNA)为模板,修复后会导致目标基因的失活或外源片段的插入,而非同源末端连接(non-homologous end joining,NHEJ),无需修复模板,在双链断裂(double-strandebreak,DSB)位置随机插入或删除部分碱基对,导致目标基因移码突变或关键区域被破坏。目前CRISPR/Cas9系统已广泛用于人体细胞、鼠类、斑马鱼、植物、细菌、真菌等生物中的靶向基因的编辑。
CRISPR/Cas9系统的两个必备元件为Cas9蛋白和sgRNA,其中sgRNA的转录水平对Cas9的定位与切割效率都有决定作用,如何提高sgRNA的转录水平是丝状真菌CRISPR技术开发应用的关键。例如在曲霉中的CRISPR-Cas9系统已经被成功运用,但需要采用“hammerhead”的技术来启动sgRNA的正确转录,而“hammerhead”技术构建成本高,技术难度大。由于RNA聚合酶III型启动子调控sgRNA编码DNA转录具有操作简单,转录丰度高等优势。因此,该启动子的挖掘和鉴定是实现丝状真菌CRISPR/Cas9系统高效编辑基因组的关键因素。有功能活性的RNA需要特殊的真核III型启动子来启动其转录,而可以用来启动sgRNA的编码DNA转录的这类启动子非常缺乏。而中国专利201611083079.4针对此截取黑曲霉2个U6编码区附近501bp的序列作为U6启动子,以期用于黑曲霉来源的sgRNA启动子用来正确指导sgRNA在体内的合成,但实际效果却有待验证。而曲霉尤其是黑曲霉,被广泛的应用在蛋白、化学品的工业化生产过程中,在其快速生长期时,可以分泌大量有机酸,使得发酵培养基的pH低于2,这种发酵特性,可以大大降低发酵过程中染菌的风险,还可以省去生产有机酸过程中所使用的大量碳酸盐,对环境友好(中国专利文献CN09797111A)。在实际中有必要进一步提高曲霉尤其是黑曲霉的产酸性能,尤其是用于苹果酸的生产。基于上述,仍然非常需要研发更高效率的全新RNA聚合酶III型启动子,将进一步促进CRISPR/Cas9系统在丝状真菌基因组编辑中应用,比如有效提高黑曲霉的产酸(如苹果酸)的能力。
发明内容
本发明提供了具有调控sgRNA编码DNA转录的启动子功能的DNA片段、及含有该DNA片段的sgRNA表达载体,其组成的基于CRISPR/Cas9的基因组编辑系统及其应用。经验证,本发明编辑系统能够显著提高黑曲霉基因组的编辑效率,进而获得遗传性状稳定的基因编辑突变株,显著提高菌株有机酸产量。
为达此目的,本发明采用以下技术方案:
第一方面,本发明人经过广泛而深入的研究,在黑曲霉中发现RNA聚合酶III型启动子(命名为Anp),在后续研究发现该启动子具有转录sgRNA的功能,因而本发明提供一种具有调控sgRNA编码DNA转录的启动子功能的DNA片段,其特征在于,含有如SEQ ID NO.1所示序列。该DNA片段可以作为普通启动子使用,但尤其可用于调控sgRNA编码DNA转录的表达载体,以进一步促进CRISPR/Cas9系统在丝状真菌基因组编辑中应用。
进一步地,所述的启动子功能的DNA片段还包括对SEQ ID NO.1所示的核苷酸序列进行一个或多个,优选为1至10个中的任何个数的核苷酸取代、缺失或添加所获得的,具有与SEQ ID NO.1所示的核苷酸序列相同的具有sgRNA编码DNA的启动子功能的核苷酸序列或其互补序列或者所述的启动子功能的DNA片段还包括核苷酸序列与SEQ ID NO.1所示序列的同源性≥95%(较佳地≥98%)的具有作为sgRNA编码DNA的启动子功能的多核苷酸,或5’端截短或添加1-50个(较佳地1-30,更佳地1-10个)的具有作为sgRNA编码DNA的启动子功能的核苷酸。
第二方面,本发明还提供一种调控sgRNA编码DNA转录的表达载体,其包括上述的启动子功能的DNA片段。进一步地,其包括上述的启动子功能的DNA片段调控的sgRNA编码DNA转录的表达框。
在一个实施方式中,采用融合PCR 的方法将序列Anp启动子、靶标位点(protospacer)及sgRNA骨架连接在一起,采用基因重叠延伸(SOE)方法构建sgRNA表达框。
在一优选方式中,所述sgRNA编码DNA转录的表达框包括对基因pyrGmoc,和laeA的靶标位点中的任意一种或至少两种的组合。在另一优选例中,所述对基因pyrGmoc,和laeA的靶向位点的sgRNA编码DNA转录的表达框的序列分别如SEQ ID NO.2(Anp-pyrG-sgRNA的核苷酸序列)所示、SEQ ID NO.3 (Anp-moc-sgRNA的核苷酸序列) 所示和SEQ IDNO.4 (Anp-laeA-sgRNA的核苷酸序列) 所示。
本发明中,更具体地,所述的基因pyrG为乳清酸核苷-5′-磷酸脱羧酶基因(Aspni_1103580),所述的基因moc为苹果酸-α酮戊二酸转运蛋白编码基因(Aspni_1113466),所述的基因laeA为甲基转移酶编码基因(Aspni_170198)。
第三方面,本发明还提供上述的具有启动子功能的DNA片段,或者上述的调控sgRNA编码DNA转录的表达载体在CRISPR/Cas系统中的应用,更优选在CRISPR/Cas9系统中的应用。
更进一步地,本发明提供一种真核基因组编辑系统,其特征在于,所述系统包括Cas9蛋白的表达载体和上述的调控sgRNA编码DNA转录的表达载体,优选地,还包括同源供体DNA序列。
在一个实施方式中,所述的蛋白的表达载体包括Cas9蛋白的表达框,其包括Ptef1启动子、PgpdA启动子或Pgal启动子中的一种启动子,以及启动子调控的Cas9的编码序列和TtrpC终止子。其中,更优选的是采用Ptef1启动子。
在一个优选实施方式中,所述同源供体DNA序列选自针对黑曲霉基因pyrGmoc,和laeA设计的同源供体DNA序列中的任一种,或两种的组合,或三种的组合。
更具体的实施方式中,所述的Ptef1启动子为黑曲霉翻译延伸因子TEF1的启动子,如SEQ ID NO.5所示的核苷酸序列;所述的PgpdA启动子为黑曲霉磷酸甘油醛脱氢酶GpdA的启动子,如SEQ ID NO.6所示的核苷酸序列;所述的Pgal启动子为黑曲霉糖苷水解酶GalA的启动子,如SEQ ID NO.7所示的核苷酸序列。
在一优选实施方式中,所述的Cas9蛋白的编码序列,还包含纯化标签和核定位蛋白编码序列,具体如SEQ ID NO.8所示的核苷酸序列。其中,所述的Cas9蛋白的氨基酸残基序列(包含纯化标签短肽和核定位多肽)如SEQ ID NO.9所示。
在另一优选方式中,所述的终止子TtrpC的核苷酸序列如SEQ ID NO.10所示。
根据本发明优选实施方式,所述的同源供体DNA序列选自针对黑曲霉基因pyrGmoc,和laeA设计的同源供体DNA序列中的任一种,或两种的组合,或三种的组合。
在更具体的实施方式中,针对黑曲霉基因pyrGmoc,和laeA设计的同源供体DNA序列分别如SEQ ID NO.11(donor-pyrG的核苷酸序列)、SEQ ID NO.12(donor-moc的核苷酸序列)和SEQ ID NO.13(donor-laeA的核苷酸序列)所示。
在一个具体实施方式,本发明所述的同源供体DNA序列是由基因pyrGmoc、或laeA上/下游两条同源片段与抗性基因通过Gibson Assembly的方法连接而成,通过将所述同源供体DNA序列一起导入丝状真菌细胞,可实现高效率同源重组,若不导入同源供体DNA序列也能通过非同源端连接(NHEJ)实现所述基因位点的编辑。
在一个具体实施例中,将Cas9蛋白的表达框和调控Anp-pyrG-sgRNA编码DNA转录的表达框共转化进入黑曲霉ATCC1015菌株的原生质体细胞后,通过非同源端连接(NHEJ)对pyrG位点特异性DSB的不精确修复,进而得到pyrG突变株。而将Cas9蛋白的表达框和Anp-pyrG-sgRNA编码DNA转录的表达框及donor-pyrG共转化进入黑曲霉ATCC1015菌株的原生质体细胞后,通过同源重组获得基因编辑突变株,其同源重组效率高达97.2%。
本发明中,在一个具体实施例中,将Cas9蛋白的表达框,Anp-moc-sgRNA或/和Anp-laeA-sgRNA以及供体DNA donor-moc或/和donor-laeA共转化进入黑曲霉菌株的原生质体细胞后,通过同源重组均能获得基因编辑突变株。
第四方面,本发明提供一种重组宿主细胞,包含有上述启动子功能的DNA片段,或如上述的调控sgRNA编码DNA转录的表达载体。
在另一优选方式中,所述宿主细胞为真菌细胞,优选为丝状真菌细胞,进一步优选为曲霉。更具体的实施方式中,所述宿主细胞选自但不限于毁丝霉属、梭孢壳霉属、木霉、脉孢菌、青霉、镰刀霉、曲霉属或根霉属中的任意一种,优选为黑曲霉。
第五方面,本发明提供一种基因组编辑的方法,采用上述的真核基因组编辑系统对目标丝状真菌基因组进行基因编辑。具体包括将本发明的基因组编辑的系统导入到上述列举的宿主细胞中,在所述宿主细胞中的待编辑的基因组位点进行基因组编辑,利用筛选标记挑选转化子并获得具有稳定遗传性状的基因编辑突变株。
而将基因编辑系统的载体和同源供体DNA序列共转化进入宿主细胞中的方法没有限定,本领域技术人员可以根据实际需要采用本领域公知的技术进行。通常使用原生质体共转化的方法将所述的基因组编辑的系统导入到相应宿主细胞中。在一个具体实施方式中,将所述的调控sgRNA编码DNA转录的表达载体、Cas9蛋白的表达载体、以及同源供体DNA序列共转化进入丝状真菌的原生质体细胞。
第六方面,本发明提供一种产苹果酸能力增强的黑曲霉重组菌,其是通过本发明的基因编辑方法对黑曲霉基因moc进行基因编辑获得基因moc突变的黑曲霉重组菌,或者进一步还对黑曲霉基因laeA进行基因编辑,获得基因moclaeA双突变的黑曲霉重组菌。这是基于利用本发明基因编辑系统对黑曲霉合成苹果酸过程中有负调控作用的基因(moclaeA)进行编辑,获得了单/双基因缺失的突变体工程菌株,突变体工程菌株的苹果酸合成能力得到了显著提高,从而提高黑曲霉苹果酸合成能力。为了更显著提高黑曲霉苹果酸合成能力,还可以通过基因重组方法过表达黑曲霉基因mae
进一步地,本发明还提供一种提高黑曲霉生产苹果酸的方法,其利用上述构建的黑曲霉重组菌来生产获得苹果酸。具体而言,所述方法包括以下步骤:(a)培养上述的黑曲霉重组菌;(b)收集苹果酸。
在更具体的实施方式中,本发明的产苹果酸的黑曲霉重组菌构建的方法,是将Cas9蛋白的表达载体、含有上述具有启动子功能的DNA片段调控的含有黑曲霉基因moc靶向位点的sgRNA编码DNA,以及针对黑曲霉基因moc设计的同源供体DNA序列导入黑曲霉中,获得基因moc突变的黑曲霉突变株。即将Cas9蛋白的表达框和Anp-moc-sgRNA编码DNA转录的表达框及donor-moc共转化进入黑曲霉菌株的原生质体细胞后,通过同源重组获得基因编辑单基因突变株,其苹果酸产量得到显著提高。
进一步的实施方式中,同时还导入含有上述的具有启动子功能的DNA片段调控的含有黑曲霉基因laeA靶向位点的sgRNA编码DNA,以及针对黑曲霉基因laeA设计的同源供体DNA序列,获得基因moclaeA双突变的黑曲霉突变株。即将Cas9蛋白的表达框和Anp-moc-sgRNA和Anp-laeA-sgRNA编码DNA转录的表达框及donor-moc和donor-laeA共转化进入黑曲霉菌株的原生质体细胞后,通过同源重组获得基因编辑双基因突变株,其苹果酸产量得到显著提高。
本发明人经过广泛而深入的研究,在黑曲霉中发现了一个RNA聚合酶III型启动子,并在后续研究中成功验证该启动子具有转录sgRNA编码DNA的功能。基于此,设计和开发了特异性识别和切割黑曲霉基因组指定位点序列的CRISPR/Cas9基因编辑系统,该系统能够显著提高黑曲霉(Aspergillus niger)基因组编辑效率,单基因突变效率由8%提高至97.2%。利用本发明中的基因编辑系统对黑曲霉合成苹果酸过程中有负调控作用的基因(moclaeA)进行编辑,获得了单/双基因缺失的突变体工程菌株,突变体工程菌株的苹果酸合成能力得到了显著提高,从而不仅验证了本发明的RNA聚合酶III型启动子的上述功能,同时更是提供了一种能有效提高黑曲霉苹果酸合成能力的菌种改造方法。
在本发明中,对下述术语的含义作一说明。
启动子:是指能够控制另一核酸片段转录的核酸片段。
基因组编辑:是指对生物的基因组DNA 进行删除、插入或者替换,从而达到对目的序列修改的目的。
靶标位点:或者“protospacer”是限定核酸的一部分的核酸序列,是指sgRNA 5′端的20碱基的序列,这段序列与目的DNA序列相同,在存在足以结合的条件下,sgRNA需要这段序列与目的DNA结合,Cas9与sgRNA的复合体对目的DNA进行剪切。
非同源端连接(NHEJ):是指细胞内普遍存在的DNA双链断裂(DSB)后的一种修复方式,NHEJ可在整个细胞周期发生,因为修复不需要模板,只基于断裂末端的结构而容易产生错误,包括缺失、插入和点突变。
同源重组:“重组”是指两个多核苷酸之间交换遗传信息的过程。就本发明而言,“同源重组(HR)”是指在通过同源定向修复机制修复细胞内双链断裂期间所发生的此类交换的特殊形式。这一过程需要核苷酸序列同源,使用“供体”分子为模板来修复“靶标位点”分子(即发生双链断裂的分子),因为其导致遗传信息从供体转移到靶上。
供体DNA序列: “序列”是指任意合适长度的核苷酸序列,其可以是DNA或RNA,可以是线状、环状或分支状,而且可以是单链或者双链。术语“供体DNA序列”是指被插入基因组中的核苷酸序列。供体序列可以为任意长度,例如,优选长度在约500个与3000个核苷酸之间(或它们之间的任意整数值)。
附图说明
图1为Cas9表达载体(上)和sgRNA表达载体(下)示意图。
图2为Cas9蛋白在不同启动子调控下对靶基因pyrG编辑的效率。
图3为无供体DNA条件下靶基因pyrG的编缉后的测序结果。
图4为添加同源供体DNA条件下靶基因pyrG突变菌株的PCR鉴定核酸电泳图。
图5为突变体AnM1Δmoc以及AnM1ΔmocΔlaeA苹果酸产量图。
具体实施方式
为更进一步阐述本发明所采取的技术手段及其效果,以下结合本发明的优选实施例来进一步说明本发明的技术方案,应理解,本发明并不局限于实施例的详细方法,即不意味着本发明必须依赖上述详细方法才能实施。对本发明产品或方法的等效替换或具体方式的选择等,均落在本发明的范围之内。
下述实施例中所用方法如无特别说明均为常规方法,例如Sambrook 等人所著的《分子克隆:实验室手册》(New York: Cold SpringHarbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
实施例中描述到的各种生物材料的取得途径仅是提供一种实验获取的途径以达到具体公开的目的,不应成为对本发明生物材料来源的限制。事实上,所用到的生物材料的来源是广泛的,任何不违反法律和道德伦理能够获取的生物材料都可以按照实施例中的提示替换使用。其中,实施例中所用引物和核酸测序均由金唯智生物科技有限公司合成;实施例中所出现的百分比浓度如无特别说明均为质量百分比浓度。
实施例1:Anp启动子的克隆
在自然进化中,不同的物种之间U6 small nuclear RNA的启动子序列差异性较大,但U6 small nuclear RNA本身的核酸序列存在一定的保守性,因此以嗜热毁丝霉U6small nuclear RNA序列为参照,在黑曲霉ATCC1015的基因组中进行核酸序列分析比对,其中Identities大于90%,E-value小于1e-10,经过比对发现了2个RNA polymerase III型核小RNA(snRNA)候选基因。U6 small nuclear RNA启动子的特点为起始转录位点为“G”,该核苷酸与上游第二“G”之间间隔一定数量的核苷酸(>30bp)。经本发明分析和研究,发现了其中一条RNA polymerase III型核snRNA的上游启动子序列满足其特点,作为进一步研究的候选启动子。
为了研究该候选启动子是否能调控sgRNA编码DNA的转录,进而应用于基因组编辑,利用引物(如表1所示)从黑曲霉ATCC1015基因组中扩增出该RNA polymerase III型snRNA候选基因上游523bp的DNA片段(如SEQ ID NO.1所示),作为sgRNA表达框的候选启动子(命名为Anp)。
其中,PCR反应体系为:5×phusion HF buffer 10 μL,10mM dNTPs 1μL,上游/下游引物各2.5μL,模板DNA 1μL,Phusion DNA polymerase 0.5μL,ddH2O 32.5μL。
PCR反应条件为:先98℃ 30s;然后98℃ 10s,65℃ 30s,72℃ 0.5min,34个循环;最后72℃ 10min,4℃ 10min。
而后于金唯智测序公司进行测序,并与原始序列比对,确保克隆序列正确后用于后续的研究。
实施例2:构建CRISPR/Cas9介导的黑曲霉基因组编辑载体
(1) Cas9蛋白表达载体构建
将来自酿脓链球菌的Cas9蛋白编码基因进行密码子优化并人工合成,在其N-端添加3个纯化标签以及嗜热毁丝霉转录因子HacI的核定位信号序列(PPRKRAKTEDE),在C-端添加2个并排的SV40核定位信号序列(DPKKKRKVDPKKKRKV)和1个上述HacI的核定位信号序列(PPRKRAKTEDE)。
Cas9蛋白的编码核苷酸序列如SEQ ID No.8所示,Cas9蛋白的氨基酸序列如SEQID No.9所示。
从黑曲霉ATCC1015基因组分别扩增翻译延伸因子TEF1的启动子(如SEQ ID NO.5所示),磷酸甘油醛脱氢酶GpdA的启动子(如SEQ ID NO.6所示),糖苷水解酶GalA的启动子(如SEQ ID NO.7所示),分别作为Cas9蛋白编码基因的转录启动子,以构巢曲霉TtrpC为终止子。
载体构建所需的PCR引物序列如表1所示,PCR反应体系为:5×phusion HF buffer10 μL,10mM dNTPs 1μL,上游/下游引物各2.5μL,模板DNA 1μL,Phusion DNA polymerase0.5μL,ddH2O 32.5μL。
PCR反应条件为:先98℃ 30s;然后98℃ 10s,65℃ 30s,72℃ 2.5min,34个循环;最后72℃ 10min,4℃ 10min。
而后,将上述PCR片段用Gibson Assembly技术体系连接至已线性化的p0380-bar上SpeI和EcoRI之间,从而构建了在不同启动子调控下的3个Cas9表达框质粒p0380-Ptef1-Cas9,p0380-PgpdA-Cas9和p0380-PglaA-Cas9(如图1所示)。
(2)sgRNA表达框载体的构建
通过软件sgRNACas9 tool设计目标基因的靶标位点。采用融合PCR方法将实施例1获得的序列Anp启动子、靶标位点及sgRNA骨架连接在一起,采用基因重叠延伸(SOE)方法构建sgRNA表达框载体。sgRNA表达框载体所需引物序列如表1中所示。
PCR反应体系为:5×phusion HF 缓冲液 10μL,10mM dNTPs 1μL,上游/下游引物2.5μL,模板DNA 1μL,Phusion DNA聚合酶 0.5μL,ddH2O 32.5μL。
PCR反应条件为:先98℃ 30s;然后98℃ 10s,65℃ 30s,72℃ 1min,34个循环;最后72℃ 10min,4℃ 10min。
通过SOE-PCR的扩增形成sgRNA表达质粒Anp-pyrG-sgRNA、Anp-moc-sgRNA和Anp-laeA-sgRNA,其序列分别为SEQ ID No.2,SEQ ID No.3,和SEQ ID No.4所示。
(3)同源供体DNA载体构建
本实施例中同源供体DNA片段分别由目标基因上/下游约1000bp同源片段,潮霉素或遗传霉素(G418)抗性基因表达框PtrpC-hph或PtrpC-neo片段,通过Gibson Assembly的方法连接到由限制性内切酶XbaI和EcoRV线性化的质粒PPk2BarGFP中,最终构建供体DNA片段donor-pyrG、donor-moc、和donor-laeA,其核酸序列分别如SEQ ID No.11,SEQ ID No.12和SEQ ID No.13所示。
构建供体DNA片段其所需的PCR引物序列如表1所示。
表1: 实施例1和实施例2所用的引物
SEQ ID NO. 引物 序列(5’-3’)
18 Ptef1-F GGCCCGGCGCGCCGAATTCGTTTAAACTTAATTAATTCTGGTACGGTACCAAATC
19 Ptef1-R TGGTCCTTGTAATCGCCATCATGGTCCTTGTAGTCCATGATGACGGTTGTGAATGAACTC
20 PgpdA-F CCACCATGTTGGGCCCGGCGCGCCGAATTCTTCGACACTGAAATACGTC
21 PgpdA -R GTCCTTGTAATCGCCATCATGGTCCTTGTAGTCCATGGTGATGTCTGCTCAAGCGGG
22 PglaA-F CCCGGCGCGCCGAATTCGTTTAAACTTAATTAAAAGGGACAGCAAGTATATGATG
23 PglaA-R TCGTGGTCCTTGTAATCGCCATCATGGTCCTTGTAGTCCATTGCTGAGGTGTAATGATGCTG
24 Cas9-F ATGGACTACAAGGACCATGATG
25 Cas9-R TCATCACTCATCTTCTGTTTTG
26 TtrpC-F ACGTGCCAAAACAGAAGATGAGTGATGAGGATCCACTTAACGTTACTGAAATCATCA
27 TtrpC-R GTCCGGTCCTGCCCGTCACCGAGATTTGACCATGGGAGCTCCCTCTAAACAAGTGTACCTG
28 AnP-F CAGTTACTTATAAGCTTGGAG
29 gRNA-R AAAAAGCACCGACTCGGTGC
30 AnpyrG-R CTATTTCTAGCTCTAAAACAAGGAGAGCTGACTTCCGACTTTGAATTATATAGGAATAA
31 gpyrG-F GTCGGAAGTCAGCTCTCCTTGTTTTAGAGCTAGAAATAG
32 Anpmoc-R TCTAGCTCTAAAACAACAGGTTGCGGTAGAAGGCTTTGAATTATATAGGAATAAT
33 gmoc-F CCTATATAATTCAAAGCCTTCTACCGCAACCTGTTGTTTTAGAGCTAGAAATAGC
34 AnpLaeA-R AGCTCTAAAACTTGGTAGCTGTAGTTATTGCTTTGAATTATATAGGAATAATG
35 gLaeA-F TATAATTCAAAGCAATAACTACAGCTACCAAGTTTTAGAGCTAGAAATAGCA
36 AnpyrG_UP-F TGTGGAGTGGGCGCTTACACAGTACACGAGGACTTTGCAGCAGGGAATACGAGCTC
37 AnpyrG_UP-R AAGCCCAAAAATGCTCCTTCAATATCATCTTCTGCCTCACCCAACGCGCGCGTC
38 AnpyrG_DN-F ACGCCCCAGCACTCGTCCGAGGGCAAAGGAATAGTGTCGAGCACGGGTAGTCAG
39 AnHph-F CAGAAGATGATATTGAAGGAG
40 AnHph-R CTATTCCTTTGCCCTCGGACGA
41 AnNeo-F CGACGTTAACTGATATTGAAG
42 AnNeo-R TCAGAAGAACTCGTCAAGAAG
43 AnMOC_UP-F ATGTGGAGTGGGCGCTTACACAGTACACGAGGACTTAAGGAGCAGGCCACGAGTGG
44 AnMOC_UP-R CAAAAAATGCTCCTTCAATATCAGTTAACGTCGTCAGTCGTTGGCGGCGAATTTGGT
45 AnMOC_DN-F ATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGACGTCGGAACTGTCATGAAGGA
46 AnMOC_DN-R ATGTACAGACTCGGTCGTAGCCGCGCATTGGCGTCGGCCTTCGCCGCGCCCAAGGTTTCT
47 AnLaeA_UP-F ATGTGGAGTGGGCGCTTACACAGTACACGAGGACTTGCGGCTGCAACAACCTTAAAG
48 AnLaeA_UP-R CAAAAAATGCTCCTTCAATATCAGTTAACGTCGACTCGAAGCCATAGTAATTGGCTG
49 AnLaeA_DN-F ATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAGGAACAGGACCGTCTCGATAT
50 AnLaeA_DN-R TCATGTGATTGTAATCGACCGACGGAATTGAGGATCAGTGTTGGTACGAGTTCAAG
PCR反应体系与PCR反应条件均与上述Cas9蛋白表达载体构建中所述条件相同。
实施例3:不添加同源供体DNA条件下CRISPR/Cas9系统对黑曲霉pyrG基因位点的编辑
(1)黑曲霉原生质体
A、菌丝体准备
将成熟的黑曲霉ATCC1015孢子,用0.05%吐温-80灭菌水收集,经擦镜纸过滤除去菌丝后,接种于MM液体培养基中,30℃,200rpm培养16h。
B、原生质体制备
将菌丝过滤收集后置于30mL裂解液(配方:0.15g裂解酶,30mL溶液A,过滤除菌;溶液A:磷酸二氢钾1.0361g,山梨醇21.864g,溶于90mL去离子水,pH调至5.6,定量至100mL,高温灭菌)中,30℃裂解2h,每隔30min轻轻摇动。而后用擦镜纸过滤后,4℃ 2000rpm离心10min,弃上清,加入4mL溶液B(配方:氯化钙0.735g,山梨醇18.22g,Tris-HCl(1M,pH 7.5)1mL,溶于90mL去离子水,pH调至7.6,定量至100mL,高温灭菌),2000rpm 4℃ 离心10min;弃上清,按200μL原生质体/质粒加入一定体积溶液B。
C、原生质体转化
在预冷的15mL离心管中,依次加入50μL预冷PEG(12.5g PEG6000,0.368g氯化钙,500μL Tris HCl(1M pH 7.5)),将待转化的DNA片段混合好后加至200μL原生质体中。置于冰上20min后加入2mL预冷PEG液体,置于室温5min,而后加入4mL溶液B,轻轻混匀。取3mL上述溶液加入12mL融化的含1.5mg/mL FOA的MM培养基中,平铺于平板中,35℃培养,3d后于挑取单个菌丝体于相应抗性平板生长。
(2)CRISPR/Cas9系统对黑曲霉pyrG基因位点的编辑
A、将Cas9蛋白表达质粒p0380-Ptef1-Cas9,p0380-PgpdA-Cas9及p0380-PglaA-Cas9分别与Anp-pyrG-sgRNA表达质粒以等分子摩尔比例共转化进入黑曲霉ATCC1015菌株的原生质体细胞后,Cas9在sgRNA介导下,通过靶向位点与宿主细胞基因组上的目标基因pyrG的DNA配对来识别靶标位点进而精确切割双链DNA,通过非同源端连接(NHEJ)对位点特异性DSB的不精确修复,从而达到编辑基因组目的,通过在平板中加入5-氟乳清酸(5-Fluoroorotic acid,FOA)筛选出转化子,如图2显示当Cas9蛋白的启动子为Ptef1时转化子最多,其次为PgpdA与PglaA,下面将主要针对p0380-Ptef1-Cas9和Anp-pyrG-sgRNA的转化子进行PCR验证。
B、黑曲霉ATCC1015转化子验证
黑曲霉基因组提取方法如下:
采用酚氯仿法从上述转化过程中挑选的转化子提取基因组DNA,具体包括以下操作:
1)2.0mL的无菌的DNA提取管中加入200mg的锆珠及1mL的裂解液(配方:0.2MTris·HCl (pH 7.5),0.5M NaCl,10mM EDTA,1% SDS(w/v)),挑取平板中生长的黑曲霉菌丝于DNA提取管中;
2)将所有DNA提取管置于助磨器上,最大转速振荡30s,重复两次;
3)65℃水浴30min,在水浴过程中每隔几分钟漩涡振荡;
4)水浴结束后取出,每管加入80μL Tris·HCl(1M,pH 7.5)中和;
5)加入400μL的酚:氯仿(1:1),13000rpm离心5分钟;
6)取300μL上清液于新的1.5mL EP管中,加入600μL 95%的乙醇(DNA级);
7)冰上孵育一小时,随后4℃、13000rpm离心,可看到白色的DNA沉淀于EP管底部;
8)用75%的酒精(DNA级)400μL清洗,4℃ 13000rpm离心,轻轻取出上清液;
9)将EP管置于真空浓缩仪中,除去残留的酒精;
10)加入50μL ddH2O溶解DNA,用NanoDrop测DNA浓度,测完浓度后将提取的DNA置于-20℃冰箱保存,以备下一步进行PCR验证。
C、PCR验证转化子
以上述提取的基因组DNA为模版,用引物pyrG-seq-F和pyrG-seq-R对转化子进行基因PCR验证。PCR反应试剂购于南京诺唯赞生物科技有限公司。
引物序列如下:
pyrG-seq-F: ATGTCCTCCAAGTCGCAATTGA(SEQ ID NO.51)
pyrG-seq-R: TTAGTTTCCGCCGACACGGGCCA(SEQ ID NO.52)
PCR反应体系为:10×Taq Buffer 2μL,10mM dNTP Mix 0.2μL,上游/下游引物各0.4μL,DNA模板1μL,Taq DNA Polymerase 0.2μL,水15.8μL。
PCR反应条件为:先94℃ 5min;然后94℃ 30s,55℃ 30s,72℃ 1.2min,30个循环;最后72℃ 7min,4℃ 10min.
实验结果:对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下可观察到明显基因扩增条带,PCR条带的大小为~0.9kb。随后对目的片段进行测序验证,测序结果如图3所示,表明Cas9在sgRNA介导下对目标靶点的第三个核酸碱基进行了切割,并通过非同源端连接(NHEJ)对位点特异性DSB的不精确修复,得到基因组编辑突变株,说明如SEQ ID NO.1所示的DNA片段(Anp)具有调控sgRNA编码DNA的转录的启动子功能。
实施例4 添加同源供体DNA条件下CRISPR-Cas9系统对黑曲霉pyrG基因的编辑
如实施例3中的操作方法,将Cas9蛋白表达质粒p0380-Ptef1-Cas9、Anp-pyrG-sgRNA表达质粒和同源供体DNA donor-pyrG以等比例混合后共转化进入黑曲霉ATCC1015原生质体细胞后,Cas9在sgRNA介导下,通过靶标序列与宿主细胞基因组上的目标基因的DNA配对来识别靶标位点进行切割,随后供体DNA片段与靶标位点两侧序列发生同源重组,从而达到编辑基因组的目的,通过在平板中加入潮霉素筛选转化子。
黑曲霉转化子验证:
(1)基因组提取方法与上述一致。
(2)PCR验证转化子
以上述提取的基因组DNA为模版,用下述引物pyrG-yz-F和pyrG-yz-R对转化子进行基因PCR验证。PCR扩增所用引物为:
pyrG-yz-F: CCACATCATCAACTGCAGCAT(SEQ ID NO.53)
pyrG-yz-R: TCCTTGTGCCACACCATAGTA(SEQ ID NO.54)
PCR反应试剂购于南京诺唯赞生物科技有限公司。
PCR反应体系为:10×Taq Buffer 2μL,10mM dNTP Mix 0.2μL,上游/下游引物各0.4μL,DNA模板1μL,Taq DNA Polymerase 0.2μL,水15.8μL。
PCR反应条件为:先94℃ 5min;然后94℃ 30s,55℃ 30s,72℃ 1.2min,30个循环;最后72℃ 7min,4℃ 10min.
(3)对PCR 扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下显示出明显的基因扩增条带,突变体的PCR扩增条带为1.70kb,野生型菌株目的条带为0.65kb,结果如图4所示,表明供体DNA片段与靶标位点两侧序列发生同源重组,进而得到基因编辑突变株。在获得的36个转化中,有35个转化子发生同源重组,其同源重组效率高达97.2%。
实施例5 CRISPR/Cas9系统对黑曲霉苹果酸合成负调控基因moc进行编辑
为构建黑曲霉苹果酸合成菌株,首先将苹果酸转运蛋白编码基因在黑曲霉中进行过表达,具体如下:
1. 黑曲霉苹果酸合成菌株的构建
A、表达载体构建
苹果酸转运蛋白基因mae(核酸序列及其对应的蛋白质氨基酸序列分别如SEQ IDNO.59和SEQ ID NO.60所示)表达载体构建以pV2质粒(GenBank: KJ569568.1)为骨架,以Ptef为启动子(如SEQ ID NO.1所示),以来源于嗜热毁丝霉的Tpgk为启动子(如SEQ IDNO.61所示)。PCR扩增后将上述片段连接入被HindIII/EcoRV线性化的pV2质粒中,获得mae表达载体pV2-mae。
PCR的反应体系和反应条件如实施2所述。
PCR所用引物如下:
AnTef_mae-F: GGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTTCGAATAACCACTGTCGGGGT(SEQ ID NO.62)
AnTef_mae-R: ACTCTCATCTTCACTCTCTCTCTCTCTCGAGACCTAATCAGATACATCCTCATC(SEQ ID NO.63)
Tpgk_Mae-F: CATGTACCCGGGTAAAGATGAGGATGTATCTGATTAGGTCTCGAGAGAGAGAGAGAG(SEQ ID NO.64)
Tpgk_Mae-R: CTAGTGGATCCCCCGGGCTGCAGGAATTCGATATCAAACACCAATCCCAACTCGTC(SEQ ID NO.65)
Mae-F:ATGCTGACACCTCCCAAGTTTG(SEQ ID NO.66)
Mae-R: CTAATCAGATACATCCTCATCTTTA(SEQ ID NO.67)
B、转化子验证及表型分析
如实施例3中的操作方法,将苹果酸转运蛋白基因mae表达载体pV2-mae导入黑曲霉ATCC1015原生质体中,通过在平板中加入潮霉素筛选转化子。
用如实施例3中所述基因组提取方法,获得转化子的基因组DNA,而后用引物AnTef_mae-F和Tpgk_Mae-R对转化子进行PCR验证,将获得的阳性突变株命名为AnM1菌株。
PCR反应体系为:10×Taq Buffer 2μL,10mM dNTP Mix 0.2μL,上游/下游引物各0.4μL,DNA模板1μL,Taq DNA Polymerase 0.2μL,ddH2O 15.8 μL。
PCR反应条件为:先94℃ 5min;然后94℃ 30s,55℃ 30s,72℃ 1.2min,30个循环;最后72℃ 7min,4℃ 10min.
将上述验证的转化子接种至250mL三角瓶中的50mL培养基中(配方:葡萄糖75g/L,蛋白胨6.0g/L,KH2PO4 0.15g/L,K2HPO4 0.15g/L,CaCl2·2H2O 0.10g/L,MgSO4·7H2O0.10g/L,碳酸钙80.0g/L,生物素(0.5g/L)1mL/L,微量元素液1mL/L;微量元素配方:C6H8O·7H2 0.5g/L,ZnSO4·7H2O 0.5g/L,Fe(NH4)2(SO4)·6H2O 0.1g/L,CuSO4·5H2O 0.025g/L,MnSO4·H2O 0.005g/L,H3BO3 0.005g/L,NaMoO4·2H2O 0.005g/L),接种量为2.5*105个/mL,30℃,200rpm培养,第5天取样测定苹果酸含量。
(1)样品处理:
取1mL发酵液于15mL离心管中,并添加1mL 1M H2SO4,而后80℃下放置30min,每个隔10min进行充分震荡。之后将2mL双蒸水添加至离心管中,充分震荡后,取1mL液体于1.5mL离心管中,12000rpm离心10min,取上清液测定苹果酸含量。
(2)苹果酸含量测定
处理后的样品用高效液相色谱测定苹果酸含量,其中检测器为紫外检测器,5mMH2SO4为流动相,流速为0.5mL/min。结果显示过表达苹果酸转运蛋白基因mae,能显著促进苹果酸的生产,第5天时转化子AnM1的苹果酸产量为36.4g/L,与出发菌种(野生型黑曲霉ATCC1015)相比提高了25%(如图5)。
2. 利用CRISPR/Cas9系统敲除moc基因
如实施例3中的操作方法,将Cas9蛋白表达质粒p0380-Ptef1-Cas9、Anp-moc-sgRNA表达质粒和同源供体DNA donor-moc以等比例混合后共转化进入黑曲霉AnM1原生质体细胞后,Cas9在sgRNA介导下,通过靶标序列与宿主细胞基因组上的moc的DNA配对来识别靶标位点进行切割,随后供体DNA片段与靶标位点两侧序列发生同源重组,从而达到编辑基因组的目的,通过在平板中加入G418筛选转化子。
A、黑曲霉转化子验证
(1)基因组提取方法与上述一致。
(2)PCR验证转化子
以上述提取的基因组DNA为模版,用下述引物moc-yz-F和moc-yz-R对转化子进行基因PCR验证。
PCR扩增所用引物为:
moc-yz-F: ACCTCCCACTCACAACAAACTA(SEQ ID NO.55)
moc-yz-R: ACAACAACCTCTTCCAACCCTA(SEQ ID NO.56)
PCR反应试剂购于南京诺唯赞生物科技有限公司。
PCR反应体系为:10×Taq Buffer 2μL,10mM dNTP Mix 0.2μL,上游/下游引物各0.4μL,DNA模板1μL,Taq DNA Polymerase 0.2μL,ddH2O 15.8 μL。
PCR反应条件为:先94℃ 5min;然后94℃ 30s,55℃ 30s,72℃ 1.2min,30个循环;最后72℃ 7min,4℃ 10min.
(3)对PCR 扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下显示出明显的基因扩增条带,突变体的PCR扩增条带为1.7kb,野生型菌株目的条带为0.9kb,表明供体DNA片段与靶标位点两侧序列发生同源重组,最终得到基因编辑突变株AnM1Δmoc菌株。
B、转化子表型分析
将上述验证的转化子接种至250mL三角瓶中的50mL培养基中(配方同上),接种量为2.5*105个/mL,30℃,200rpm培养,第5天取样测定苹果酸含量。
(1)样品处理处理方式与上述一致
(2)苹果酸含量测定
处理后的样品用高效液相色谱测定苹果酸含量,其中检测器为紫外检测器,5mMH2SO4为流动相,流速为0.5mL/min。结果通过本发明的CRISPR/Cas9系统对黑曲霉苹果酸合成负调控基因moc进行编辑后,能显著促进苹果酸的生产,第5天时苹果酸产量为61.2g/L,与对照菌株AnM1相比提高了68%(如图5)。实验说明本发明的CRISPR/Cas9能显著提高黑曲霉遗传改造效率,促进宿主细胞目标产量的提高。
实施例6 CRISPR/Cas9系统对黑曲霉苹果酸合成负调控基因moclaeA同时进行编辑
如实施例3中的操作方法,将Cas9蛋白表达质粒p0380-Ptef1-Cas9、sgRNA表达框(Anp-moc-sgRNA和Anp-laeA-sgRNA)以及同源供体DNA(donor-moc和donor-laeA)以等比例混合后共转化进入黑曲霉AnM1原生质体细胞后,Cas9在相应sgRNA介导下,通过靶标序列与宿主细胞基因组上的moclaeA的DNA链配对来识别靶标位点进行切割,随后供体DNA片段分别与靶标位点两侧序列发生同源重组,从而达到编辑基因组的目的,通过在平板中加入G418筛选转化子。
A、黑曲霉转化子验证
(1)基因组提取方法与上述一致。
(2)PCR验证转化子
以上述提取的基因组DNA为模版,用下述引物moc-yz-F/R和laeA-yz-F/R分别对转化子基因组moclaeA位点进行基因PCR验证。
PCR扩增所用引物为:
laeA-yz-F: GCAGCCTGCATACACCCTGTT(SEQ ID NO.57)
laeA-yz-R: GGACATCCGTGCTACTGTGAA(SEQ ID NO.58)
PCR反应试剂购于南京诺唯赞生物科技有限公司。
PCR反应体系为:10×Taq Buffer 2μL,10mM dNTP Mix 0.2μL,上游/下游引物各0.4μL,DNA模板1μL,Taq DNA Polymerase 0.2μL,ddH2O 15.8μL。
PCR反应条件为:先94℃ 5min;然后94℃ 30s,55℃ 30s,72℃ 1.2min,30个循环;最后72℃ 7min,4℃ 10min.
(3)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下显示出明显的基因扩增条带,突变体的PCR扩增条带为~1.7kb,野生型菌株目的条带为~0.9kb,表明供体DNA片段与两个靶标位点两侧序列分别发生了同源重组,进而得到基因编辑突变株AnM1ΔmocΔlaeA菌株,说明本发明中CRISPR/Cas9系统能够同时对黑曲霉基因组上的至少两个基因位点进行编辑。
B、转化子表型分析
将验证的转化子全部接种至250mL三角瓶中的50mL以葡萄糖为碳源培养基中(配方同实施例5),接种量为2.5*105个/mL,30℃,200rpm培养,第5天取样。样品经实施例5所述方法进行处理后,测定发酵液中苹果酸含量。
结果显示通过本发明中的CRISPR/Cas9系统对黑曲霉苹果酸合成负调控基因moclaeA同时进行编辑后,能显著促进苹果酸的生产,第5天时AnM1ΔmocΔlaeA菌株苹果酸产量为67.1g/L,与对照菌株AnM1以及AnMΔmoc相比分别提高了86.4%和10%(如图5)。实验说明本发明中的CRISPR/Cas9能同时编辑黑曲霉基因组的两个位点,显著提高黑曲霉遗传改造效率,促进宿主细胞目标产量的提高。
序列表
<110> 中国科学院天津工业生物技术研究所
<120> 一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系统和应用
<160> 67
<170> PatentIn Version 3.1
<210> 1
<211> 523
<212> DNA
<213> Aspergillus niger
<400> 1
cagttactta taagcttgga gcttggatct ctttgcggtg gaccttcctt gaagggtttc 60
ttctctgtac tatcatgcga atgctaaagc agaactttaa cagaaccacc agtgtctaat 120
aaattcgatc cgtatattgt gcaccattac tcatctgtgt ttcccccaaa catgcagtct 180
cctgcgcaga tagactgtca actatagtaa ttcccgtccg cgaagccgcc ctatccaaaa 240
gtgtattacc ctctcttgta tgcaacaaga gtcgttcttt ctcgcgctaa tacccatccg 300
tctatcgcac aattaaacct tctgatccct acaatttgcc tgacaaaata aatgaagttc 360
aacgtgcaaa caagctagag ccagtgtaca ttgagtatca tctgcagctc tactcaaggt 420
actatagtac ctcagccaat ttgatgttcc tgccttcccg cccctcgctt agccgaccaa 480
ttagagttcg ttaattctaa ccattattcc tatataattc aaa 523
<210> 2
<211> 624
<212> DNA
<213> Aspergillus niger
<400> 2
cagttactta taagcttgga gcttggatct ctttgcggtg gaccttcctt gaagggtttc 60
ttctctgtac tatcatgcga atgctaaagc agaactttaa cagaaccacc agtgtctaat 120
aaattcgatc cgtatattgt gcaccattac tcatctgtgt ttcccccaaa catgcagtct 180
cctgcgcaga tagactgtca actatagtaa ttcccgtccg cgaagccgcc ctatccaaaa 240
gtgtattacc ctctcttgta tgcaacaaga gtcgttcttt ctcgcgctaa tacccatccg 300
tctatcgcac aattaaacct tctgatccct acaatttgcc tgacaaaata aatgaagttc 360
aacgtgcaaa caagctagag ccagtgtaca ttgagtatca tctgcagctc tactcaaggt 420
actatagtac ctcagccaat ttgatgttcc tgccttcccg cccctcgctt agccgaccaa 480
ttagagttcg ttaattctaa ccattattcc tatataattc aaagtcggaa gtcagctctc 540
cttgttttag agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 600
agtggcaccg agtcggtgct tttt 624
<210> 3
<211> 624
<212> DNA
<213> Aspergillus niger
<400> 3
cagttactta taagcttgga gcttggatct ctttgcggtg gaccttcctt gaagggtttc 60
ttctctgtac tatcatgcga atgctaaagc agaactttaa cagaaccacc agtgtctaat 120
aaattcgatc cgtatattgt gcaccattac tcatctgtgt ttcccccaaa catgcagtct 180
cctgcgcaga tagactgtca actatagtaa ttcccgtccg cgaagccgcc ctatccaaaa 240
gtgtattacc ctctcttgta tgcaacaaga gtcgttcttt ctcgcgctaa tacccatccg 300
tctatcgcac aattaaacct tctgatccct acaatttgcc tgacaaaata aatgaagttc 360
aacgtgcaaa caagctagag ccagtgtaca ttgagtatca tctgcagctc tactcaaggt 420
actatagtac ctcagccaat ttgatgttcc tgccttcccg cccctcgctt agccgaccaa 480
ttagagttcg ttaattctaa ccattattcc tatataattc aaagccttct accgcaacct 540
gttgttttag agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 600
agtggcaccg agtcggtgct tttt 624
<210> 4
<211> 624
<212> DNA
<213> Aspergillus niger
<400> 4
cagttactta taagcttgga gcttggatct ctttgcggtg gaccttcctt gaagggtttc 60
ttctctgtac tatcatgcga atgctaaagc agaactttaa cagaaccacc agtgtctaat 120
aaattcgatc cgtatattgt gcaccattac tcatctgtgt ttcccccaaa catgcagtct 180
cctgcgcaga tagactgtca actatagtaa ttcccgtccg cgaagccgcc ctatccaaaa 240
gtgtattacc ctctcttgta tgcaacaaga gtcgttcttt ctcgcgctaa tacccatccg 300
tctatcgcac aattaaacct tctgatccct acaatttgcc tgacaaaata aatgaagttc 360
aacgtgcaaa caagctagag ccagtgtaca ttgagtatca tctgcagctc tactcaaggt 420
actatagtac ctcagccaat ttgatgttcc tgccttcccg cccctcgctt agccgaccaa 480
ttagagttcg ttaattctaa ccattattcc tatataattc aaagcaataa ctacagctac 540
caagttttag agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 600
agtggcaccg agtcggtgct tttt 624
<210> 5
<211> 1233
<212> DNA
<213> Aspergillus niger
<400> 5
ttctggtacg gtaccaaatc ttgagtcatt ttttttctcc tctcttctct tatcctcgaa 60
taaccactgt cggggtccca aagaggaagg ggttggtcaa gggtgggaaa agaaaaaaag 120
acaaaaaaag aaagaaaaga gaaaggctag atacctaacc gtactgtcag gtcaagacac 180
taagtgaggg gcagtgttga tggcaaaaaa agacgtgggc aagaaaaaaa agattttccc 240
tcacatgttt tgccgcacca gccatcccac tatcaaaaag cgatgatgtt tgagattgtc 300
gggtgtccac atcttttagt gtgaatcgct agtagaattt gggatattat cgagcatcat 360
cccatgatag cgagtacaag ccccgagtaa ataccaacat tgctatgctg ctgtgctgct 420
atctagtttg ctacgttggt cgttgacctc acagggattt ccaccaaaaa gtggaccggg 480
cgggcgccac tcggccgtgc cacagcagcc tgagagcgga caaataacaa cagccgcctg 540
ccgcggggtt cggttgcaaa catgaccaac aggccaggcc atcatcaacc caccgctgcg 600
ttgatgccca ggatttcagt ccaataatcc acaatttacc aacggataga gctaggtgaa 660
ctagatagac aggagggcca gagggagggg accgagatga aaaattttcg atgaaagagt 720
ggtcaaggtg gggtcgtagt tcggcgctcc gagggcgagg aaccaaggaa aggcgagaaa 780
aggacaggct gatcgcgctg cgttgctggg ctgcaagcgt gtccagttga gtctggaaaa 840
ggctccgccg tgaagattct gcgttggtcc cgcacctgcg cggtgggggc attacccctc 900
catgtccaat gatttcaagt caaagccaag ggttgaagcc cgcccgctta gtcgccttct 960
cgcttgaccc ctccatataa gtatttcccc tcctccccct cccacaaatt tttcctttcc 1020
ctttcctccc tcgtccgctt cagtacgtat atcttccccc cctctctctt ccttctcact 1080
cttctctcct tctttcttga ttcatcctct ctctaactga cttctttgct cagcacctct 1140
acgcgttctg gccgtagtat ctgagcaatt tttctacaga ctttttctat ctaattccaa 1200
aaaagaactt cgagttcatt cacaaccgtc atc 1233
<210> 6
<211> 2160
<212> DNA
<213> Aspergillus niger
<400> 6
ttcgacactg aaatacgtcg agcctgctcc gcttggaagc ggcgaggagc ctcgtcctgt 60
cacaactacc aacatggagt acgataaggg ccagttccgc cagctcatta agagccagtt 120
catgggcgtt ggcatgatgg ccgtcatgca tctgtacttc aagtacacca acgctcttct 180
gatccagtcg atcatccgct gaaggcgctt tcgaatctgg ttaagatcca cgtcttcggg 240
aagccagcga ctggtgacct ccagcgtccc tttaaggctg ccaacagctt tctcagccag 300
ggccagccca agaccgacaa ggcctccctc cagaacgccg agaagaactg gaggggtggt 360
gtcaaggagg agtaagctcc ttattgaagt cggaggacgg agcggtgtca agaggatatt 420
cttcgactct gtattataga taagatgatg aggaattgga ggtagcatag cttcatttgg 480
atttgctttc caggctgaga ctctagcttg gagcatagag ggtcctttgg ctttcaatat 540
tctcaagtat ctcgagtttg aacttattcc ctgtgaacct tttattcacc aatgagcatt 600
ggaatgaaca tgaatctgag gactgcaatc gccatgaggt tttcgaaata catccggatg 660
tcgaaggctt ggggcacctg cgttggttga atttagaacg tggcactatt gatcatccga 720
tagctctgca aagggcgttg cacaatgcaa gtcaaacgtt gctagcagtt ccaggtggaa 780
tgttatgatg agcattgtat taaatcagga gatatagcat gatctctagt tagctcacca 840
caaaagtcag acggcgtaac caaaagtcac acaacacaag ctgtaaggat ttcggcacgg 900
ctacggaaga cggagaagcc accttcagtg gactcgagta ccatttaatt ctattaatgt 960
ttgatcgaga cctaatacag cccctacaac gaccatcaaa gtcgtatagc taccagtgag 1020
gaagtggact caaatcgact tcagcaacat ctcctggata aactttaagc ctaaactata 1080
cagaataaga tggtggagag cttataccga gctcccaaat ctgtccagat catggttgac 1140
cggtgcctgg atcttcctat agaatcatcc ttattcgttg acctagctga ttctggagtg 1200
acccagaggg tcatgacttg agcctaaaat ccgccgcctc caccatttgt agaaaaatgt 1260
gacgaactcg tgagctctgt acagtgaccg gtgactcttt ctggcatgcg gagagacgga 1320
cggacgcaga gagaagggct gagtaataag cgccactgcg ccagacagct ctggcggctc 1380
tgaggtgcag tggatgatta ttaatccggg accggccgcc cctccgcccc gaagtggaaa 1440
ggctggtgtg cccctcgttg accaagaatc tattgcatca tcggagaata tggagcttca 1500
tcgaatcacc ggcagtaagc gaaggagaat gtgaagccag gggtgtatag ccgtcggcga 1560
aatagcatgc cattaaccta ggtacagaag tccaattgct tccgatctgg taaaagattc 1620
acgagatagt accttctccg aagtaggtag agcgagtacc cggcgcgtaa gctccctaat 1680
tggcccatcc ggcatctgta gggcgtccaa atatcgtgcc tctcctgctt tgcccggtgt 1740
atgaaaccgg aaaggccgct caggagctgg ccagcggcgc agaccgggaa cacaagctgg 1800
cagtcgaccc atccggtgct ctgcactcga cctgctgagg tccctcagtc cctggtaggc 1860
agctttgccc cgtctgtccg cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt 1920
ccaacatttg ttgccatatt ttcctgctct ccccaccagc tgctcttttc ttttctcttt 1980
cttttcccat cttcagtata ttcatcttcc catccaagaa cctttatttc ccctaagtaa 2040
gtactttgct acatccatac tccatccttc ccatccctta ttcctttgaa cctttcagtt 2100
cgagctttcc cacttcatcg cagcttgact aacagctacc ccgcttgagc agacatcacc 2160
<210> 7
<211> 1509
<212> DNA
<213> Aspergillus niger
<400> 7
aagggacagc aagtatatga tgcggtagtg gaatctgcag gctgttcctc ttctaacgac 60
accctagctt gtctgcgtga actagactac accgacttcc tcaatgcggc aaactccgtg 120
ccaggcattt taagctacca ttctgtggcg ttatcatatg tgcctcgacc ggacgggacg 180
gcgttgtcgg catcaccgga cgttttgggc aaagcaggga aatatgctcg ggtcccgttc 240
atcgtgggcg accaagagga tgaggggacc ttattcgcct tgtttcagtc caacattacg 300
acgatcgacg aggtggtcga ctacctggcc tcatacttct tctatgacgc tagccgagag 360
cagcttgaag aactagtggc cctgtaccca gacaccacca cgtacgggtc tccgttcagg 420
acaggcgcgg ccaacaactg gtatccgcaa tttaagcgat tggccgccat tctcggcgac 480
ttggtcttca ccattacccg gcgggcattc ctctcgtatg cagaggaaat ctcccctgat 540
cttccgaact ggtcgtacct ggcgacctat gactatggca ccccagttct ggggaccttc 600
cacggaagtg acctgctgca ggtgttctat gggatcaagc caaactatgc agctagttct 660
agccacacgt actatctgag ctttgtgtat acgctggatc cgaactccaa ccggggggag 720
tacattgagt ggccgcagtg gaaggaatcg cggcagttga tgaatttcgg agcgaacgac 780
gccagtctcc ttacggatga tttccgcaac gggacatatg agttcatcct gcagaatacc 840
gcggcgttcc acatctgatg ccattggcgg aggggtccgg acggtcagga acttagcctt 900
atgagatgaa tgatggacgt gtctggcctc ggaaaaggat atatggggat cataatagta 960
ctagccatat taatgaaggg catataccac gcgttggacc tgcgttatag cttcccgtta 1020
gttatagtac catcgttata ccagccaatc aagtcaccac gcacgaccgg ggacggcgaa 1080
tccccgggaa ttgaaagaaa ttgcatccca ggccagtgag gccagcgatt ggccacctct 1140
ccaaggcaca gggccattct gcagcgctgg tggattcatc gcaatttccc ccggcccggc 1200
ccgacaccgc tataggctgg ttctcccaca ccatcggaga ttcgtcgcct aatgtctcgt 1260
ccgttcacaa gctgaagagc ttgaagtggc gagatgtctc tgcaggaatt caagctagat 1320
gctaagcgat attgcatggc aatatgtgtt gatgcatgtg cttcttcctt cagcttcccc 1380
tcgtgcagat gaggtttggc tataaattga agtggttggt cggggttccg tgaggggctg 1440
aagtgcttcc tcccttttag acgcaactga gagcctgagc ttcatcccca gcatcattac 1500
acctcagca 1509
<210> 8
<211> 4299
<212> DNA
<213> 人工合成序列
<400> 8
atggactaca aggaccatga tggcgattac aaggaccacg acatcgatta taaggatgat 60
gatgacaagc ctccgaggaa acgtgccaaa acagaagatg agatggataa gaagtactcc 120
atcggcctcg acatcggcac caactccgtc ggctgggccg tcatcaccga tgagtacaag 180
gtcccttcca agaagttcaa ggtcctcggc aacaccgatc gccattccat caagaagaac 240
ctgatcggcg ccctcctgtt cgattccggc gaaaccgccg aggccacccg ccttaaacgc 300
accgcccgtc gccgctacac ccgccgcaag aaccgcatct gctacctcca agaaatcttc 360
tccaacgaga tggccaaggt cgatgatagc ttcttccacc gcctcgaaga gtccttcctg 420
gtcgaagagg ataagaagca cgagcgccat cctatcttcg gcaacatcgt cgatgaggtc 480
gcctaccatg agaagtaccc taccatctac catctccgca agaagctcgt cgattccacc 540
gataaggccg atctccgcct catctacctc gccctcgccc atatgatcaa gttccgcggc 600
catttcctca tcgagggcga tctcaaccct gataactccg atgtcgataa gctgttcatc 660
cagctcgtcc agacctacaa ccagctgttc gaggaaaacc ctatcaacgc ctccggcgtc 720
gatgccaagg ccatcctctc cgctcgcctc tccaagtctc gccgccttga gaaccttatc 780
gcccagctcc ctggcgagaa gaagaacggc ctcttcggca acctgatcgc cctctccctc 840
ggcctcaccc ctaacttcaa gtccaacttc gatctcgccg aggatgccaa gctccagctc 900
tccaaggata cctacgatga tgatctcgat aacctcctcg cccagatcgg cgatcagtac 960
gccgatctgt tcctcgccgc caagaacctc tccgatgcca tcctcctctc cgacatcctc 1020
cgcgtcaaca ccgagatcac caaggcccct ctgtccgcct ccatgatcaa gcgctacgat 1080
gagcatcatc aggacctcac cctgctcaag gccctcgtcc gccagcagct ccctgagaag 1140
tacaaagaga ttttcttcga tcagtccaag aacggctacg ccggctacat cgatggcggc 1200
gcttcccaag aagagttcta caagttcatc aagcctatcc ttgagaagat ggatggcacc 1260
gaggaactcc tcgtcaagct caaccgcgag gacctcctcc gcaagcagcg caccttcgat 1320
aacggctcca tccctcatca aatccatctc ggcgagctgc atgccatctt gcgccgccaa 1380
gaggatttct acccattcct caaggataac cgcgagaaga tcgaaaagat tctcaccttc 1440
cgcatccctt actacgtcgg ccctctcgct cgcggcaact cccgcttcgc ctggatgacc 1500
cgcaagtccg aggaaaccat caccccttgg aacttcgagg aagtcgtcga taagggcgcc 1560
tccgcccagt ccttcatcga gcgcatgacc aacttcgata agaacctccc taacgagaag 1620
gtcctcccta agcactccct gctctacgag tacttcaccg tctacaacga gctgaccaag 1680
gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tgtccggcga gcagaagaag 1740
gccatcgtcg atctgctgtt caagaccaac cgcaaggtca ccgtcaagca gctcaaagag 1800
gattacttca agaaaatcga gtgcttcgat tccgtcgaga tcagcggcgt cgaggaccgc 1860
ttcaacgcct ccctcggaac ctaccatgat ctcctcaaga ttatcaagga taaggatttc 1920
ctcgacaacg aggaaaacga ggacatcctt gaggacatcg tcctcaccct caccctcttc 1980
gaggaccgcg aaatgatcga ggaacgcctc aagacctacg cccatctctt cgatgataag 2040
gtcatgaagc agctcaagcg ccgtcgctac accggctggg gtcgcctctc ccgcaagctc 2100
atcaacggca tccgcgataa gcagtccggc aagactatcc tcgatttcct caagtccgat 2160
ggcttcgcca accgcaactt catgcagctc atccatgatg attccctcac cttcaaagag 2220
gacatccaga aggcccaggt cagcggccag ggcgattccc tccatgagca tatcgccaac 2280
ctcgccggct cccctgccat caagaagggc atcctccaga ccgtcaaggt cgtcgatgag 2340
ctggtcaagg tcatgggccg ccataagcct gagaacatcg tcatcgagat ggcccgcgag 2400
aaccagacca cccagaaggg ccagaagaac tcccgcgagc gcatgaagcg catcgaggaa 2460
ggcatcaaag agctgggcag ccaaatcctc aaagagcatc ctgtcgagaa cacccagctc 2520
cagaacgaga agctctacct ctactacctc cagaacggcc gcgatatgta cgtcgatcaa 2580
gagctggaca tcaaccgcct ctccgattac gatgtcgatc atatcgtccc tcagtccttc 2640
ctgaaggatg attccatcga taacaaggtc ctcacccgct ccgataagaa ccgcggcaag 2700
tccgataacg tcccttccga agaggtcgtc aagaagatga agaactactg gcgccagctc 2760
ctcaacgcca agctcatcac ccagcgcaag ttcgataacc tcaccaaggc cgagcgcggt 2820
ggcctctccg agctggataa ggccggcttc atcaagcgcc agctcgtcga aacccgccag 2880
atcaccaagc acgtcgccca aatcctcgat tcccgcatga acaccaagta cgatgagaac 2940
gataagctca tccgcgaagt caaggtcatc accctcaagt ccaagctcgt cagcgatttc 3000
cgcaaggatt tccagttcta caaggtccgc gagatcaaca actaccatca tgcccatgat 3060
gcctacctca acgccgtcgt cggcaccgcc ctcatcaaga agtaccccaa gctcgaatcc 3120
gagttcgtct acggtgatta caaggtctac gatgtccgca agatgatcgc caagtccgag 3180
caagagatcg gcaaggctac cgccaagtac ttcttctact ccaacatcat gaatttcttc 3240
aagaccgaaa tcaccctcgc caacggcgaa atccgcaagc gccctctcat cgagactaac 3300
ggcgagactg gcgagatcgt ctgggataag ggccgcgatt tcgccaccgt ccgcaaggtc 3360
ctctccatgc ctcaggtcaa catcgtcaag aaaaccgagg tccagaccgg cggcttctcc 3420
aaagagtcca tcctccccaa gcgcaactcc gataagctga tcgcccgcaa gaaggattgg 3480
gaccctaaga agtacggcgg cttcgattcc cctaccgtcg cctactccgt cctcgtcgtc 3540
gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaagagct gctcggcatc 3600
actattatgg aacgctccag cttcgagaag aaccctatcg atttccttga ggccaagggc 3660
tacaaagagg tcaagaagga cctcatcatc aagctcccca agtactccct gttcgagctt 3720
gagaacggcc gcaagcgcat gctcgcctcc gccggtgagc ttcagaaggg caacgagctg 3780
gccctgcctt ccaagtacgt caacttcctc tacctcgcct cccattacga gaagctcaag 3840
ggctcccctg aggataacga gcagaagcag ctgttcgtcg agcagcataa gcactacctc 3900
gatgagatca tcgagcagat cagcgagttc tccaagcgcg tcatcctcgc cgatgccaac 3960
ctcgataagg tcctgtccgc ctacaacaag caccgcgata agcctatccg cgagcaggcc 4020
gagaacatca tccatctctt caccctcacc aacctcggtg cccctgccgc cttcaagtac 4080
ttcgatacca ccatcgatcg caagcgctac acctccacca aagaggtcct ggacgccacc 4140
ctcatccatc agtccatcac cggcctctac gaaacccgca tcgatctctc ccagctcggc 4200
ggcgacgacc ccaagaagaa acgcaaggtt gatccgaaga agaagcggaa ggttcctccg 4260
aggaaacgtg ccaaaacaga agatgagtga tgaggatcc 4299
<210> 9
<211> 1429
<212> PRT
<213> 脓链球菌
<400> 9
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Pro Pro Arg Lys Arg Ala Lys Thr Glu
20 25 30
Asp Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn
35 40 45
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
50 55 60
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
65 70 75 80
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
85 90 95
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
100 105 110
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
115 120 125
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
130 135 140
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
145 150 155 160
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
165 170 175
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
180 185 190
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
195 200 205
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
210 215 220
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
225 230 235 240
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
245 250 255
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
260 265 270
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
275 280 285
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
290 295 300
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
305 310 315 320
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
325 330 335
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
340 345 350
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
355 360 365
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
370 375 380
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
385 390 395 400
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
405 410 415
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
420 425 430
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
435 440 445
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
450 455 460
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
465 470 475 480
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
485 490 495
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
500 505 510
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
515 520 525
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
530 535 540
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
545 550 555 560
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
565 570 575
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
580 585 590
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
595 600 605
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
610 615 620
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
625 630 635 640
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
645 650 655
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
660 665 670
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
675 680 685
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
690 695 700
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
705 710 715 720
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
725 730 735
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
740 745 750
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
755 760 765
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
770 775 780
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
785 790 795 800
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
805 810 815
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
820 825 830
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
835 840 845
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
850 855 860
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe
865 870 875 880
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
885 890 895
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
900 905 910
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
915 920 925
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
930 935 940
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
945 950 955 960
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
965 970 975
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
980 985 990
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
995 1000 1005
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1010 1015 1020
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1025 1030 1035
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1040 1045 1050
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1055 1060 1065
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1070 1075 1080
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1085 1090 1095
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1100 1105 1110
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1115 1120 1125
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1130 1135 1140
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1145 1150 1155
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1160 1165 1170
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1175 1180 1185
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1190 1195 1200
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1205 1210 1215
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1220 1225 1230
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1235 1240 1245
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1250 1255 1260
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1265 1270 1275
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1280 1285 1290
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1295 1300 1305
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1310 1315 1320
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1325 1330 1335
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1340 1345 1350
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1355 1360 1365
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1370 1375 1380
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1385 1390 1395
Leu Gly Gly Asp Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys
1400 1405 1410
Lys Lys Arg Lys Val Pro Pro Arg Lys Arg Ala Lys Thr Glu Asp
1415 1420 1425
Glu
<210> 10
<211> 713
<212> DNA
<213> Aspergillus niger
<400> 10
acttaacgtt actgaaatca tcaaacagct tgacgaatct ggatataaga tcgttggtgt 60
cgatgtcagc tccggagttg agacaaatgg tgttcaggat ctcgataaga tacgttcatt 120
tgtccaagca gcaaagagtg ccttctagtg atttaatagc tccatgtcaa caagaataaa 180
acgcgttttc gggtttacct cttccagata cagctcatct gcaatgcatt aatgcattga 240
ctgcaaccta gtaacgcctt ncaggctccg gcgaagagaa gaatagctta gcagagctat 300
tttcattttc gggagacgag atcaagcaga tcaacggtcg tcaagagacc tacgagactg 360
aggaatccgc tcttggctcc acgcgactat atatttgtct ctaattgtac tttgacatgc 420
tcctcttctt tactctgata gcttgactat gaaaattccg tcaccagcnc ctgggttcgc 480
aaagataatt gcatgtttct tccttgaact ctcaagccta caggacacac attcatcgta 540
ggtataaacc tcgaaatcan ttcctactaa gatggtatac aatagtaacc atgcatggtt 600
gcctagtgaa tgctccgtaa cacccaatac gccggccgaa acttttttac aactctccta 660
tgagtcgttt acccagaatg cacaggtaca cttgtttaga ggtaatcctt ctt 713
<210> 11
<211> 3371
<212> DNA
<213> Aspergillus niger
<400> 11
tgcagcaggg aatacgagct ccaatggacc tcgggagtgg cacagtcaat ggcaaggaaa 60
ctccgccttt gcaggtgtgg ctgaacccca cgggtcggag gcggagcaat ccacccccga 120
tgtggctggt gcgtggaggg gctcgcgatg attttactga gcttgctttt cttgtcgaca 180
ttgaacattg tccttggtct tccttcagat ttaagggtca gtcactgcta catttctcag 240
tagtatccgc gcacgtctct ggatttacga atcagggtcc accagtcgaa acttcgaact 300
actctcatta tacaatcctc tttccattcc cgcattaacc cctccatcaa caccatgtcc 360
tccaagtcgc aattgaccta cactgcccgt gccagcaagc atcccaatgc tctggcgaag 420
aggctgttcg agattgccga ggccaagaag accaatgtga ctgtctcggc tgacgttacc 480
accactaagg agctactaga tcttgctgac cgtaggccga cccgctactc tgcctgatta 540
tgctgcatgc aaacttatta acggtgatac cggactgcag gtctcggtcc ctacattgcc 600
gtgatcaaaa cccacatcga tatcctctct gatttcagca acgagaccat tgagggactt 660
aaggctctcg cgcagaagca caactttctc atcttcgagg accgcaagtt cattgacatc 720
ggcaacacgg tccagaagca ataccacggc ggtaccctcc gtatctcgga atgggcccac 780
atcatcaact gcagcattct ccctggtgag ggtatcgtcg aggctctcgc tcagacggcg 840
tctgcaccgg acttcgccta cggccccgaa cgcggtctgt tgatcttggc agagatgacc 900
tctaagggct ccttggctac cggccagtac actacttcct cggtcgatta tgcccggaaa 960
tacaagaact tcgttatggg attcgtgtcg acgcgcgcgt tgggtgaggc agaagatgat 1020
attgaaggag catttttggg cttggctgga gctagtggag gtcaacacat caatgctatt 1080
ttggtttagt cgtccaggcg gatcacaaaa tttgtgtcgt ttgacaagat ggttcattta 1140
ggcaactggt cagatcagcc cacttgtaag cagtagcggc ggcgctcgaa gtgtgactct 1200
tattagcaga caggaacgag gacattatta tcatctgctg cttggtgcac gataacttgt 1260
gcgtttgtca agcaaggtaa gtgaacgacc cggtcatacc ttcttaagtt cgcccttcct 1320
ccctttattt cagattcaat ctgacttacc tattctaccc aagcatcgat atgaaaaagc 1380
ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac agcgtctccg 1440
acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat gtaggagggc 1500
gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat cgttatgttt 1560
atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt ggggaattca 1620
gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg caagacctgc 1680
ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat gcgatcgctg 1740
cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga atcggtcaat 1800
acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat cactggcaaa 1860
ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag ctgatgcttt 1920
gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc tccaacaatg 1980
tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg atgttcgggg 2040
attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct tgtatggagc 2100
agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg cggctccggg 2160
cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac ggcaatttcg 2220
atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga gccgggactg 2280
tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc tgtgtagaag 2340
tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag gaatagtgtc 2400
gagcacgggt agtcagactg cggcatcgga tgtccaaacg gtattgatcc tgcaggctac 2460
tatggtgtgg cacaaggatc aatgcggtac gacgatttga tgcagataag caggctgcga 2520
agtagtaact cttgcgtaga gaaaatggcg acgggtggct gataagggcg gtgataagct 2580
taattgtcat cgcagataag cactgctgtc ttgcatccaa gtcagcgtca gcagaaatac 2640
gggacttccg aaagtatatg gcaaaattaa agaacttgac tctccagcaa tgttttgccc 2700
tgaccgtcgc taaaacgtta ctacccctat acccgtctgt ttgtcccagc ccgaggcatt 2760
aggtctgact gacagcacgg cgccatgcgg gcttgggacg ccatgtccgt cgcgtgataa 2820
gggttgatcc atgcagctac tatccttcca tcgttccatt cccatccttg tcctatctcc 2880
atccttgaaa ctttactagt ttagttggat gctcgagctt gctctcggct actccgtcca 2940
atggataaga ccccgatgcc ggtcctcatt ggtctccagc tggtatcgcc ccaaccttcg 3000
tgtgatcgcc tctctgcttc ccctcatcat cattactaac tagtacatcc aaaagccatc 3060
ccagtgcttc ccctcaccct tgcccaagac attccaagtg ggccttcggc tggaaaacat 3120
ggacccattg gttccatcga taagctagct cctcgtccgt taccccagat tgataccaga 3180
taacattgac cagcggctta tcaccgaggt ctgcgggtga gaccccccct gcgacaagtt 3240
agataaaaga aactcgcctc attgtgcttc cgatggggtc ggatgacgag ccttcggaaa 3300
gagctggcgc ctctttaaag gggacagctg tcgccaagtt gtgaaattct ccgataacta 3360
ctaacaatct c 3371
<210> 12
<211> 3028
<212> DNA
<213> Aspergillus niger
<400> 12
aaggagcagg ccacgagtgg gagtgatcaa ttgcggcagc agtgggggat ggtgagcatg 60
ggtatgggta tgctgatagc cctggcgtta tgatataaat gaattgatac gtagatcatg 120
agagcatgca tagcgaaatg ttaatgggca atgataatgg caatgataat gaagcgatga 180
atgcggtggc aggtataagt aagcgtcaaa agccccgtgg ggcggcacgt ggggcggtgt 240
tttacccgat cgggcgacgt cccggtgagt ccccgaccct ctccgactgc ggcctcctcc 300
ctcgataatc tcattctcca tcacttcttc cctctttctt cttctctttt cccctcccga 360
ctcgtcttcc ccgtctgttg tttcgtctgc acgcctgctt tttggccaat tcttcatcat 420
gtcgaacaac aacacccaga agcctttgcc cttcggctac caattcattg ccggtgccgt 480
cgccggtgtg tccgaggtac gtatggtgtg atcccgttgc cagtttaccg gagcacgcga 540
ctaactctgc aatagattct ggttatgtgc gcaattccta ccctcaatcg acgcattccg 600
accagccaac actaaccctt taccccccag gtaccccttg gacgtggtca agacccgagt 660
gtaagctcta cctctcttat ctcttcccaa ttgcaatcga tcaatccccg cccactaacc 720
cattccaccc tcacagtcaa ctccagaagg gcaccgcggt cgccggtgag gaatactaca 780
atggcatgtt cgactgcctg cgcaagatcg tcaagaacga ggggtacgcc aattgctttt 840
ccccccacct cccactcaca acaaactaac ccaccctctt cccccataac agcttctccc 900
gcctgtaccg cggtatctcc gcccccatcc taatggaagc gcccaagcgt gcgaccaaat 960
tcgccgccaa cgactgacga cgttaactga tattgaagga gcattttttg ggcttggctg 1020
gagctagtgg aggtcaacaa tgaatgccta ttttggttta gtcgtccagg cggtgagcac 1080
aaaatttgtg tcgtttgaca agatggttca tttaggcaac tggtcagatc agccccactt 1140
gtagcagtag cggcggcgct cgaagtgtga ctcttattag cagacaggaa cgaggacatt 1200
attatcatct gctgcttggt gcacgataac ttggtgcgtt tgtcaagcaa ggtaagtgga 1260
cgacccggtc ataccttctt aagttcgccc ttcctccctt tatttcagat tcaatctgac 1320
ttacctattc tacccaagca tccaaatgat tgaacaagat ggattgcacg caggttctcc 1380
ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 1440
tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 1500
cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 1560
gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 1620
gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 1680
agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 1740
attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 1800
tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 1860
caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 1920
cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 1980
gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 2040
tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 2100
gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga cgtcggaact gtcatgaagg 2160
aggaaggatt cgccgctttg tataagggat tcttgcccaa ggtgctgaga ttgggtcctg 2220
gtggtggtat ccttctggtt gtgtttacgg gagtcatgga cttctttagg aatatgaggg 2280
gcgagtaagg gtccttcttc attctatttc ttgttccctt ttttggaatc aatctttctt 2340
gtttatttcc tatatttcta ctagagataa ggatagaaat agacgggaca aagaaaaaga 2400
gagagagaga gagagagaga gagagagata gggttggaag aggttgttgt tcgtttcatg 2460
atgaatttga aagtagtatt cccccttttt ttcacttcga tttttgcttg ttccatagtg 2520
gatactggca tgtattgaat gctactagat tcgcactatc catgtactat atatgcatgc 2580
agggtggata gctgtatgca ccataggaat aagcaagtag aaatgaaggg gaaaaaaatg 2640
catgtgacgt gtctgtctat gtatgtatgg acccatccaa tggatccagc ccgatctcac 2700
caggattcat ggtacctaca gtagttgggc aatcatggtc cggagacagt gcatgatggc 2760
gggcgctacg acagacatca gacatccttg ggctatcatt tgctggtccg gctcttagga 2820
aatggggtct agaacacttc atgtgcctgt tcgatagcgt gcaggacacg tgttgatcca 2880
tctactactt catccttagt tttttattgt ttgtggcagg gccaatggtt gcagagactt 2940
ccgttgtaac ttatagaaaa atgagcaatg agtagagttc aaaattgcat gcaccgaatg 3000
caccattgta tcaatgaatc aggctatg 3028
<210> 13
<211> 3219
<212> DNA
<213> Aspergillus niger
<400> 13
gcggctgcaa caaccttaaa ggcagggttg ctttgctttt tgccttcttt cctctgccct 60
ctattccacc ccccctctct cttcccccct ctccgctgtc cgaatggact tgcacttccg 120
ggatcggatt ttccctttct gatccgatga tccagtccaa ttgacctaac tctcgatcgt 180
cctcccccga tccatggttg ttctttagtc gcctctctcc tcgtaacgcc tgacacctgc 240
tgctgttatc gataccctat ttattattta ttatttattt tttttcccta ttttcctatg 300
ccgctgccgt gaccgctact tttctctttt gttctctccc ccccgacggg ttcctgtcct 360
tgcggggagg agactttttt ccccctacct atttagtatc ctcattcctc cttgtgcctc 420
ggccgagatt tggagatact cttctccacc gtgtgtgact gtgggtgtgc gcatgcacgg 480
gtgtgcgtgc ctctttgctc tcatacaact ctcctgggtt ggggcaaatt tacaccattg 540
tggactttgg atcattctta cttactatcc ttggcttttt gctctccggc tttccactct 600
cctccttctt ccaatccttt taccccttct cggccactga ttcattccgc ggaggatacc 660
cccagttagt agttttgtgg ttgccgtctt ttcgtctgat cagcttttca atccaatcat 720
tggctcaatt tgcggcgccg aactccaact tcctctatgt gccacctgac ttacgattcc 780
ccgatatcac ctgcagcctg catacaccct gttggctaac attggcgttt tacgttaccg 840
tcacgaagaa cgccggtctc tttgattgaa cgaacccctg tatctctacc ataccttgag 900
caggaaaagt cgaatctctt cccagcgaac cgatccttgg acttcagggt tccatgtttg 960
aaatcagccg acttttgcat cagccaatta ctatggcttc gagtcgacgt taactgatat 1020
tgaaggagca ttttttgggc ttggctggag ctagtggagg tcaacaatga atgcctattt 1080
tggtttagtc gtccaggcgg tgagcacaaa atttgtgtcg tttgacaaga tggttcattt 1140
aggcaactgg tcagatcagc cccacttgta gcagtagcgg cggcgctcga agtgtgactc 1200
ttattagcag acaggaacga ggacattatt atcatctgct gcttggtgca cgataacttg 1260
gtgcgtttgt caagcaaggt aagtggacga cccggtcata ccttcttaag ttcgcccttc 1320
ctccctttat ttcagattca atctgactta cctattctac ccaagcatcc aaatgattga 1380
acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat tcggctatga 1440
ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt cagcgcaggg 1500
gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac tgcaagacga 1560
ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg tgctcgacgt 1620
tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc aggatctcct 1680
gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa tgcggcggct 1740
gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg 1800
agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg aagagcatca 1860
ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg agcatgcccg acggcgagga 1920
tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa atggccgctt 1980
ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg acatagcgtt 2040
ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct 2100
ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc ttgacgagtt 2160
cttctgagga acaggaccgt ctcgatatct tccataaact gttcacagta gcacggatgt 2220
ccgagagctt aatctacgca cctcaccccc caaatggtcg attcctagat ctggggtgcg 2280
gcactgggat ctgggccatt gatgtagccc acaagtatcc caatgctttc gttgctggag 2340
tagatctagc acctatacag cctcccaacc accccgataa ctgcgagttc tatgcacctt 2400
ttgactttga ggcgccatgg acgcttgggg aaaattcttg ggatctcatt catctacaga 2460
tgggttgcgg cagtgttctg ggctggcaga atctctacaa gcgaatctta aggcatcttc 2520
agcctggggc atggtttgaa caggtggaaa tagatttcga accccgctgc gatgatcgct 2580
ccctgaatgg actggcactc cgggagtggt accagtacct gaagcaggcg acacaagata 2640
caatgcgacc catagcgcac agctcgcggg ataccatcag acaccttgag gaggcaggct 2700
ttacccagat cgaccatcag atggtggggc tgcctctcaa cccttggcac cgtgatgaac 2760
atgagcagaa ggtagcccgt tggtataacc tcgcaatctc tgagagtatc gagacgctca 2820
gcctcgcccc tttcagtcgc atctttcact gggatctgga taggatcaga cagatcacag 2880
cggaggtcaa gtcacaagcc ttcaacaagg aaatccacgc ttacaatatc ttacatatat 2940
accaggcacg gaagccgggc ggcccatcac tttgaaagta cagagaaaat tacggcagtg 3000
ccggctgtaa tgcagatttc attccggata cccatatgca gccttttgtg ggagggccat 3060
cctacctgtt ctcttctttt tgttcattcc atttttttct cgatgaggat tagtgacgac 3120
caattccatc tccttgacgg gatcatactg aaatgcttat acaccaaagc gagcaaagcc 3180
cacaaaacca tcactggact tgaactcgta ccaacactg 3219
<210> 14
<211> 305
<212> PRT
<213> Aspergillus niger
<400> 14
Met Ser Asn Asn Asn Thr Gln Lys Pro Leu Pro Phe Gly Tyr Gln Phe
1 5 10 15
Ile Ala Gly Ala Val Ala Gly Val Ser Glu Ile Leu Val Met Tyr Pro
20 25 30
Leu Asp Val Val Lys Thr Arg Val Gln Leu Gln Lys Gly Thr Ala Val
35 40 45
Ala Gly Glu Glu Tyr Tyr Asn Gly Met Phe Asp Cys Leu Arg Lys Ile
50 55 60
Val Lys Asn Glu Gly Phe Ser Arg Leu Tyr Arg Gly Ile Ser Ala Pro
65 70 75 80
Ile Leu Met Glu Ala Pro Lys Arg Ala Thr Lys Phe Ala Ala Asn Asp
85 90 95
Ser Trp Gly Ala Phe Tyr Arg Asn Leu Phe Gly Ala Glu Lys Gln Thr
100 105 110
Gln Ser Leu Ala Ile Leu Thr Gly Ala Thr Ala Gly Ala Thr Glu Ser
115 120 125
Phe Val Val Val Pro Phe Glu Leu Val Lys Ile Arg Leu Gln Asp Arg
130 135 140
Ala Ser Ala Gly Lys Tyr Asn Gly Met Leu Asp Val Val Lys Lys Ile
145 150 155 160
Val Ala Ala Glu Gly Pro Leu Ala Met Tyr Asn Gly Leu Glu Ser Thr
165 170 175
Leu Trp Arg His Ile Leu Trp Asn Ser Gly Tyr Phe Gly Cys Ile Phe
180 185 190
Gln Val Arg Ala Gln Leu Pro Ala Ala Glu Pro Gly Asn Lys Ser Gln
195 200 205
Gln Thr Arg Asn Asp Leu Ile Ala Gly Thr Ile Gly Gly Thr Ala Gly
210 215 220
Thr Ile Leu Asn Thr Pro Met Asp Val Val Lys Ser Arg Ile Gln Asn
225 230 235 240
Thr Ser Lys Val Pro Gly Gln Val Pro Lys Tyr Asn Trp Ala Trp Pro
245 250 255
Ala Val Gly Thr Val Met Lys Glu Glu Gly Phe Ala Ala Leu Tyr Lys
260 265 270
Gly Phe Leu Pro Lys Val Leu Arg Leu Gly Pro Gly Gly Gly Ile Leu
275 280 285
Leu Val Val Phe Thr Gly Val Met Asp Phe Phe Arg Asn Met Arg Gly
290 295 300
Glu
305
<210> 15
<211> 918
<212> DNA
<213> Aspergillus niger
<400> 15
atgtcgaaca acaacaccca gaagcctttg cccttcggct accaattcat tgccggtgcc 60
gtcgccggtg tgtccgagat tctggttatg taccccttgg acgtggtcaa gacccgagtt 120
caactccaga agggcaccgc ggtcgccggt gaggaatact acaatggcat gttcgactgc 180
ctgcgcaaga tcgtcaagaa cgagggcttc tcccgcctgt accgcggtat ctccgccccc 240
atcctaatgg aagcgcccaa gcgtgcgacc aaattcgccg ccaacgacag ctggggcgcc 300
ttctaccgca acctgttcgg cgccgagaag cagacgcaat cgctggcgat cctgaccggt 360
gcgacggccg gagcgaccga gtcgttcgtc gtcgtcccct tcgagctggt caagatccgt 420
ctgcaggacc gcgcctcggc cggcaaatac aacggcatgc tggacgtcgt gaagaagatt 480
gtcgccgcgg agggtcccct cgctatgtac aacggtctgg aatccaccct gtggcgccac 540
atcctctgga actcgggtta cttcggctgt atcttccagg tgcgggcgca gctccctgcc 600
gcggagccgg gcaacaagag ccagcagaca cgcaatgatc tgatcgcggg tacgattggt 660
ggtacggctg gtacgatcct caacacgccc atggatgtcg tcaagtcccg cattcagaac 720
acctcaaagg tccccggtca agtgcccaag tataactggg cttggccggc cgtcggaact 780
gtcatgaagg aggaaggatt cgccgctttg tataagggat tcttgcccaa ggtgctgaga 840
ttgggtcctg gtggtggtat ccttctggtt gtgtttacgg gagtcatgga cttctttagg 900
aatatgaggg gcgagtaa 918
<210> 16
<211> 375
<212> PRT
<213> Aspergillus niger
<400> 16
Met Phe Glu Ile Ser Arg Leu Leu His Gln Pro Ile Thr Met Ala Ser
1 5 10 15
Pro Asn Arg Asn Asn Tyr Ser Tyr Gln Gly Ile Glu Ser Tyr Asp Ser
20 25 30
Gly Arg Ser Arg Gln Asn Ser Asp Ala Met Asp Ile His Val Ile Thr
35 40 45
Ala Gln Glu Pro Pro Arg Glu Pro Pro Asp Asn Asn Asp Pro Tyr Asp
50 55 60
Gly His Gly Gly Pro Ala Gly Thr Ser His Tyr Ser Lys Pro Pro Asn
65 70 75 80
Arg Trp Leu Phe Tyr Glu Glu Asn Gly Arg Thr Tyr His Gly Tyr Arg
85 90 95
Arg Gly Val Tyr Pro Leu Pro Cys Asp Glu Gln Glu Gln Asp Arg Leu
100 105 110
Asp Ile Phe His Lys Leu Phe Thr Val Ala Arg Met Ser Glu Ser Leu
115 120 125
Ile Tyr Ala Pro His Pro Pro Asn Gly Arg Phe Leu Asp Leu Gly Cys
130 135 140
Gly Thr Gly Ile Trp Ala Ile Asp Val Ala His Lys Tyr Pro Asn Ala
145 150 155 160
Phe Val Ala Gly Val Asp Leu Ala Pro Ile Gln Pro Pro Asn His Pro
165 170 175
Asp Asn Cys Glu Phe Tyr Ala Pro Phe Asp Phe Glu Ala Pro Trp Thr
180 185 190
Leu Gly Glu Asn Ser Trp Asp Leu Ile His Leu Gln Met Gly Cys Gly
195 200 205
Ser Val Leu Gly Trp Gln Asn Leu Tyr Lys Arg Ile Leu Arg His Leu
210 215 220
Gln Pro Gly Ala Trp Phe Glu Gln Val Glu Ile Asp Phe Glu Pro Arg
225 230 235 240
Cys Asp Asp Arg Ser Leu Asn Gly Leu Ala Leu Arg Glu Trp Tyr Gln
245 250 255
Tyr Leu Lys Gln Ala Thr Gln Asp Thr Met Arg Pro Ile Ala His Ser
260 265 270
Ser Arg Asp Thr Ile Arg His Leu Glu Glu Ala Gly Phe Thr Gln Ile
275 280 285
Asp His Gln Met Val Gly Leu Pro Leu Asn Pro Trp His Arg Asp Glu
290 295 300
His Glu Gln Lys Val Ala Arg Trp Tyr Asn Leu Ala Ile Ser Glu Ser
305 310 315 320
Ile Glu Thr Leu Ser Leu Ala Pro Phe Ser Arg Ile Phe His Trp Asp
325 330 335
Leu Asp Arg Ile Arg Gln Ile Thr Ala Glu Val Lys Ser Gln Ala Phe
340 345 350
Asn Lys Glu Ile His Ala Tyr Asn Ile Leu His Ile Tyr Gln Ala Arg
355 360 365
Lys Pro Gly Gly Pro Ser Leu
370 375
<210> 17
<211> 1128
<212> DNA
<213> Aspergillus niger
<400> 17
atgtttgaaa tcagccgact tttgcatcag ccaattacta tggcttcgcc gaatcgcaat 60
aactacagct accaagggat agaatcctat gattccggcc gttccaggca aaactcggat 120
gctatggaca ttcacgtcat tacggcccaa gaacctcctc gagaaccccc ggacaacaac 180
gatccttatg atggccatgg gggtccagct gggactagcc attatagcaa gcctccaaac 240
agatggctct tctatgaaga aaatgggcga acatatcatg gatatcgcag aggagtttac 300
ccgctgccat gcgatgaaca ggaacaggac cgtctcgata tcttccataa actgttcaca 360
gtagcacgga tgtccgagag cttaatctac gcacctcacc ccccaaatgg tcgattccta 420
gatctggggt gcggcactgg gatctgggcc attgatgtag cccacaagta tcccaatgct 480
ttcgttgctg gagtagatct agcacctata cagcctccca accaccccga taactgcgag 540
ttctatgcac cttttgactt tgaggcgcca tggacgcttg gggaaaattc ttgggatctc 600
attcatctac agatgggttg cggcagtgtt ctgggctggc agaatctcta caagcgaatc 660
ttaaggcatc ttcagcctgg ggcatggttt gaacaggtgg aaatagattt cgaaccccgc 720
tgcgatgatc gctccctgaa tggactggca ctccgggagt ggtaccagta cctgaagcag 780
gcgacacaag atacaatgcg acccatagcg cacagctcgc gggataccat cagacacctt 840
gaggaggcag gctttaccca gatcgaccat cagatggtgg ggctgcctct caacccttgg 900
caccgtgatg aacatgagca gaaggtagcc cgttggtata acctcgcaat ctctgagagt 960
atcgagacgc tcagcctcgc ccctttcagt cgcatctttc actgggatct ggataggatc 1020
agacagatca cagcggaggt caagtcacaa gccttcaaca aggaaatcca cgcttacaat 1080
atcttacata tataccaggc acggaagccg ggcggcccat cactttga 1128
<210> 18
<211> 55
<212> DNA
<213> 引物
<400> 18
ggcccggcgc gccgaattcg tttaaacttaattaattctggtacggtaccaaatc 55
<210> 19
<211> 60
<212> DNA
<213> 引物
<400> 19
tggtccttgt aatcgccatc atggtccttg tagtccatga tgacggttgt gaatgaactc 60
<210> 20
<211> 49
<212> DNA
<213> 引物
<400> 20
ccaccatgtt gggcccggcg cgccgaattc ttcgacactg aaatacgtc 49
<210> 21
<211> 57
<212> DNA
<213> 引物
<400> 21
gtccttgtaa tcgccatcat ggtccttgta gtccatggtg atgtctgctc aagcggg 57
<210> 22
<211> 55
<212> DNA
<213> 引物
<400> 22
cccggcgcgc cgaattcgtt taaacttaat taaaagggac agcaagtata tgatg 55
<210> 23
<211> 62
<212> DNA
<213> 引物
<400> 23
tcgtggtcct tgtaatcgcc atcatggtcc ttgtagtcca ttgctgaggt gtaatgatgc tg 62
<210> 24
<211> 22
<212> DNA
<213> 引物
<400> 24
atggactaca aggaccatga tg 22
<210> 25
<211> 22
<212> DNA
<213> 引物
<400> 25
tcatcactca tcttctgttt tg 22
<210> 26
<211> 57
<212> DNA
<213> 引物
<400> 26
acgtgccaaa acagaagatg agtgatgagg atccacttaa cgttactgaa atcatca 57
<210> 27
<211> 61
<212> DNA
<213> 引物
<400> 27
gtccggtcct gcccgtcacc gagatttgac catgggagct ccctctaaac aagtgtacct g 61
<210> 28
<211> 21
<212> DNA
<213> 引物
<400> 28
cagttactta taagcttgga g 21
<210> 29
<211> 20
<212> DNA
<213> 引物
<400> 29
aaaaagcacc gactcggtgc 20
<210> 30
<211> 59
<212> DNA
<213> 引物
<400> 30
ctatttctag ctctaaaaca aggagagctg acttccgact ttgaattata taggaataa 59
<210> 31
<211> 39
<212> DNA
<213> 引物
<400> 31
gtcggaagtc agctctcctt gttttagagc tagaaatag 39
<210> 32
<211> 55
<212> DNA
<213> 引物
<400> 32
tctagctcta aaacaacagg ttgcggtaga aggctttgaa ttatatagga ataat 55
<210> 33
<211> 55
<212> DNA
<213> 引物
<400> 33
cctatataat tcaaagcctt ctaccgcaac ctgttgtttt agagctagaa atagc 55
<210> 34
<211> 53
<212> DNA
<213> 引物
<400> 34
agctctaaaa cttggtagct gtagttattg ctttgaatta tataggaata atg 53
<210> 35
<211> 52
<212> DNA
<213> 引物
<400> 35
tataattcaa agcaataact acagctacca agttttagag ctagaaatag ca 52
<210> 36
<211> 56
<212> DNA
<213> 引物
<400> 36
tgtggagtgg gcgcttacac agtacacgag gactttgcag cagggaatac gagctc 56
<210> 37
<211> 54
<212> DNA
<213> 引物
<400> 37
aagcccaaaa atgctccttc aatatcatct tctgcctcac ccaacgcgcg cgtc 54
<210> 38
<211> 54
<212> DNA
<213> 引物
<400> 38
acgccccagc actcgtccga gggcaaagga atagtgtcga gcacgggtag tcag 54
<210> 39
<211> 21
<212> DNA
<213> 引物
<400> 39
cagaagatga tattgaagga g 21
<210> 40
<211> 22
<212> DNA
<213> 引物
<400> 40
ctattccttt gccctcggac ga 22
<210> 41
<211> 21
<212> DNA
<213> 引物
<400> 41
cgacgttaac tgatattgaa g 21
<210> 42
<211> 21
<212> DNA
<213> 引物
<400> 42
tcagaagaac tcgtcaagaa g 21
<210> 43
<211> 56
<212> DNA
<213> 引物
<400> 43
atgtggagtg ggcgcttaca cagtacacga ggacttaagg agcaggccac gagtgg 56
<210> 44
<211> 57
<212> DNA
<213> 引物
<400> 44
caaaaaatgc tccttcaata tcagttaacg tcgtcagtcg ttggcggcga atttggt 57
<210> 45
<211> 57
<212> DNA
<213> 引物
<400> 45
atcgccttct atcgccttct tgacgagttc ttctgacgtc ggaactgtca tgaagga 57
<210> 46
<211> 60
<212> DNA
<213> 引物
<400> 46
atgtacagac tcggtcgtag ccgcgcattg gcgtcggcct tcgccgcgcc caaggtttct 60
<210> 47
<211> 57
<212> DNA
<213> 引物
<400> 47
atgtggagtg ggcgcttaca cagtacacga ggacttgcgg ctgcaacaac cttaaag 57
<210> 48
<211> 57
<212> DNA
<213> 引物
<400> 48
caaaaaatgc tccttcaata tcagttaacg tcgactcgaa gccatagtaa ttggctg 57
<210> 49
<211> 57
<212> DNA
<213> 引物
<400> 49
atcgccttct atcgccttct tgacgagttc ttctgaggaa caggaccgtc tcgatat 57
<210> 50
<211> 56
<212> DNA
<213> 引物
<400> 50
tcatgtgatt gtaatcgacc gacggaattg aggatcagtg ttggtacgag ttcaag 56
<210> 51
<211> 22
<212> DNA
<213> 引物
<400> 51
atgtcctcca agtcgcaatt ga 22
<210> 52
<211> 23
<212> DNA
<213> 引物
<400> 52
ttagtttccg ccgacacggg cca 23
<210> 53
<211> 21
<212> DNA
<213> 引物
<400> 53
ccacatcatc aactgcagca t 21
<210> 54
<211> 21
<212> DNA
<213> 引物
<400> 54
tccttgtgcc acaccatagt a 21
<210> 55
<211> 22
<212> DNA
<213> 引物
<400> 55
acctcccact cacaacaaac ta 22
<210> 56
<211> 22
<212> DNA
<213> 引物
<400> 56
acaacaacct cttccaaccc ta 22
<210> 57
<211> 21
<212> DNA
<213> 引物
<400> 57
gcagcctgca tacaccctgt t 21
<210> 58
<211> 21
<212> DNA
<213> 引物
<400> 58
ggacatccgt gctactgtga a 21
<210> 59
<211> 1143
<212> DNA
<213> 米曲霉(Aspergillus oryzae)
<400> 59
atgctgacac ctcccaagtt tgaggatgag aagcagctgg gccccgtggg tatccgggag 60
aggcttcgcc atttcacttg ggcctggtac acattaacga tgagtggagg agggctggcc 120
gtcctcatca tcagccagcc ctttgggttc cgcggattga gagagatcgg catcgctgtc 180
tatatcctca acctgatcct cttcgccctt gtctgctcta ccatggctat aaggttcatc 240
ctgcacggca accttctgga gtccctccgt catgaccgcg agggtctctt cttcccgacc 300
ttctggctct ccgtcgcaac catcatctgc ggcttgtctc gctacttcgg tgaagaatcg 360
aatgagtcct tccaactagc cctcgaagcc ctcttctgga tctactgcgt ctgcacctta 420
ctcgtcgcaa tcatccaata ctcgttcgtc ttctcatccc acaagtacgg ccttcaaacc 480
atgatgcctt catggatcct tccagccttc cccatcatgc tcagcggcac catcgcctcc 540
gtcatcggtg aacaacaacc cgctcgcgca gccctcccca tcatcggcgc cggcgtcacc 600
ttccagggcc tcggcttctc catcagcttc atgatgtacg cccactacat cggccgactg 660
atggagtccg gcctccccca cagcgaccac agaccaggca tgttcatctg cgtcggaccc 720
cccgccttca cagccctcgc cctcgtcggc atgagcaaag gcctccccga agacttcaag 780
ctgctccacg acgcccacgc cctggaagat ggccgcatca tcgagctgct ggccatctcc 840
gccggcgtct tcctctgggc cctgagtctc tggttcttct gcatcgccat tgtcgccgtc 900
atccgctcgc cccccgaggc cttccacctc aactggtggg ccatggtctt ccccaacacc 960
ggcttcaccc tggccaccat caccctgggc aaggctctca acagtaacgg tgtgaagggc 1020
gtcggttccg ccatgtctat ctgcatcgtg tgcatgtata tcttcgtctt cgtcaacaat 1080
gtccgcgccg ttatccggaa ggatatcatg tacccgggta aagatgagga tgtatctgat 1140
tag 1143
<210> 60
<211> 380
<212> PRT
<213> 米曲霉(Aspergillus oryzae)
<400> 60
Met Leu Thr Pro Pro Lys Phe Glu Asp Glu Lys Gln Leu Gly Pro Val
1 5 10 15
Gly Ile Arg Glu Arg Leu Arg His Phe Thr Trp Ala Trp Tyr Thr Leu
20 25 30
Thr Met Ser Gly Gly Gly Leu Ala Val Leu Ile Ile Ser Gln Pro Phe
35 40 45
Gly Phe Arg Gly Leu Arg Glu Ile Gly Ile Ala Val Tyr Ile Leu Asn
50 55 60
Leu Ile Leu Phe Ala Leu Val Cys Ser Thr Met Ala Ile Arg Phe Ile
65 70 75 80
Leu His Gly Asn Leu Leu Glu Ser Leu Arg His Asp Arg Glu Gly Leu
85 90 95
Phe Phe Pro Thr Phe Trp Leu Ser Val Ala Thr Ile Ile Cys Gly Leu
100 105 110
Ser Arg Tyr Phe Gly Glu Glu Ser Asn Glu Ser Phe Gln Leu Ala Leu
115 120 125
Glu Ala Leu Phe Trp Ile Tyr Cys Val Cys Thr Leu Leu Val Ala Ile
130 135 140
Ile Gln Tyr Ser Phe Val Phe Ser Ser His Lys Tyr Gly Leu Gln Thr
145 150 155 160
Met Met Pro Ser Trp Ile Leu Pro Ala Phe Pro Ile Met Leu Ser Gly
165 170 175
Thr Ile Ala Ser Val Ile Gly Glu Gln Gln Pro Ala Arg Ala Ala Leu
180 185 190
Pro Ile Ile Gly Ala Gly Val Thr Phe Gln Gly Leu Gly Phe Ser Ile
195 200 205
Ser Phe Met Met Tyr Ala His Tyr Ile Gly Arg Leu Met Glu Ser Gly
210 215 220
Leu Pro His Ser Asp His Arg Pro Gly Met Phe Ile Cys Val Gly Pro
225 230 235 240
Pro Ala Phe Thr Ala Leu Ala Leu Val Gly Met Ser Lys Gly Leu Pro
245 250 255
Glu Asp Phe Lys Leu Leu His Asp Ala His Ala Leu Glu Asp Gly Arg
260 265 270
Ile Ile Glu Leu Leu Ala Ile Ser Ala Gly Val Phe Leu Trp Ala Leu
275 280 285
Ser Leu Trp Phe Phe Cys Ile Ala Ile Val Ala Val Ile Arg Ser Pro
290 295 300
Pro Glu Ala Phe His Leu Asn Trp Trp Ala Met Val Phe Pro Asn Thr
305 310 315 320
Gly Phe Thr Leu Ala Thr Ile Thr Leu Gly Lys Ala Leu Asn Ser Asn
325 330 335
Gly Val Lys Gly Val Gly Ser Ala Met Ser Ile Cys Ile Val Cys Met
340 345 350
Tyr Ile Phe Val Phe Val Asn Asn Val Arg Ala Val Ile Arg Lys Asp
355 360 365
Ile Met Tyr Pro Gly Lys Asp Glu Asp Val Ser Asp
370 375 380
<210> 61
<211> 1100
<212> DNA
<213> Myceliophthora thermophila
<400> 61
gtctcgagag agagagagag tgaagatgag agttagggga tcttagtaac gaaactagga 60
aggcaatgct ttgaatgaca gattccccct cggttgtaat tagcccttcc ttgcgagcaa 120
ttctacagag ttcctttgca ccgtccatga ccatcccccc gaagggaacc atccgttgtt 180
attcttgttg gttgtgcaac gaacgaggcc ccagtacgcc caatccactc gtctccagct 240
agatacgtca tcatgaagac tctgggcttt catgcgtgga atccgaattc gattcctcga 300
tattgacgct gtaacctggt ccttttagcc acactatgct acagcggact gccctgatgg 360
tacaataaga actgccgccg agtcgcaata gagccacgta tgtagtatca aaatcatcgc 420
ttcttcgccg cctcgacctt ctttagctcc tccctgttgt aatttgtcag catgactgct 480
ttctgcggga agtaccagag gcaatgatgg accgcttgtg aaagggacta aggaaaatga 540
acctacttga gctgcgccga gaagtcgtcg gttgtgtcgt catcgtccca cgactcctcc 600
cataggtgtt gtctcgcgcc ggcgccgctc gcggcctctg tgtcctccgc tgcccagtct 660
gtgttgtgtc cgagttagcg tccgtatccg cacttcagca gcatcgtcct ccgttcgacg 720
tgtcctcccc cctttttttc tcccccctcc ccttgcctga cgtaccgtcg accgggaaat 780
cctcgaactc gtcgtcctcc tctagcgcgg ccggcttttg ttccgcaacc ggctgctgct 840
ctgtcttggc gtcggcgacc ttgtcgtctt tcttcgtagt agattgtgag gacgccattg 900
ggaatcacgg cgatggcgtt tacggaagga agggcgttgg gcagatcgtt gcacagccga 960
gcgtttaggg accttgtcgg atggcaaccg agatgacgag gagaaatcgg ggtgctcagc 1020
ggcagttctg ggtagtatcg ggaaacacag atcaaaagac gcttatcggc ttctggggcg 1080
acgagttggg attggtgttt 1100
<210> 62
<211> 57
<212> DNA
<213> 引物
<400> 62
gggccccccc tcgaggtcga cggtatcgat aagctttcga ataaccactg tcggggt 57
<210> 63
<211> 54
<212> DNA
<213> 引物
<400> 63
actctcatct tcactctctc tctctctcga gacctaatca gatacatcct catc 54
<210> 64
<211> 57
<212> DNA
<213> 引物
<400> 64
catgtacccg ggtaaagatg aggatgtatc tgattaggtc tcgagagaga gagagag 57
<210> 65
<211> 56
<212> DNA
<213> 引物
<400> 65
ctagtggatc ccccgggctg caggaattcg atatcaaaca ccaatcccaa ctcgtc 56
<210> 66
<211> 22
<212> DNA
<213> 引物
<400> 66
atgctgacac ctcccaagtt tg 22
<210> 67
<211> 25
<212> DNA
<213> 引物
<400> 67
ctaatcagat acatcctcat cttta 25

Claims (17)

1.一种具有调控sgRNA编码DNA转录的启动子功能的DNA片段,其特征在于,其是如SEQID NO.1所示核苷酸序列。
2.一种调控sgRNA编码DNA转录的表达载体,其特征在于,其包括如权利要求1所述的具有调控sgRNA编码DNA转录的启动子功能的DNA片段。
3.根据权利要求2所述的调控sgRNA编码DNA转录的表达载体,其特征在于,还包括所述的具有调控sgRNA编码DNA转录的启动子功能的DNA片段调控的sgRNA编码DNA转录的表达框。
4.如权利要求3所述的调控sgRNA编码DNA转录的表达载体,其特征在于,其包括由如权利要求1所述的具有调控sgRNA编码DNA转录的启动子功能的DNA片段、及其所调控的靶标位点和sgRNA骨架连接在一起形成的表达框。
5.如权利要求3所述调控sgRNA编码DNA转录的表达载体,其特征在于,所述sgRNA编码DNA转录表达框包括选自对黑曲霉基因pyrG,moc,和laeA的靶标位点中的一种,或两种的组合、或三种的组合。
6.权利要求1所述的具有调控sgRNA编码DNA转录的启动子功能的DNA片段,或权利要求2至5任一项所述的调控sgRNA编码DNA转录的表达载体在CRISPR/Cas系统中的应用。
7.一种真核基因组编辑系统,其特征在于,所述系统包括Cas9蛋白的表达载体和如权利要求2至5任一项所述的调控sgRNA编码DNA转录的表达载体。
8.如权利要求7所述的真核基因组编辑系统,其特征在于,进一步包括同源供体DNA序列。
9.如权利要求7或8所述的真核基因组编辑系统,其特征在于,所述的Cas9蛋白的表达载体含有的表达框包括Ptef1启动子、PgpdA启动子或Pgal启动子,以及所述启动子调控的Cas9蛋白的编码序列和TtrpC终止子。
10.根据权利要求8所述的真核基因组编辑系统,其特征在于,所述同源供体DNA序列选自针对黑曲霉基因pyrG,moc,和laeA设计的同源供体DNA序列中的任一种,或两种的组合,或三种的组合。
11.一种重组宿主细胞,包含有如权利要求1所述的具有调控sgRNA编码DNA转录的启动子功能的DNA片段,或如权利要求2至5任一项所述的调控sgRNA编码DNA转录的表达载体。
12.如权利要求11所述的重组宿主细胞,其为丝状真菌细胞。
13.如权利要求12所述的重组宿主细胞,其为黑曲霉细胞。
14.一种基于CRISPR/Cas系统对丝状真菌基因组的基因编辑方法,其特征在于,采用如权利要求7至10任一项所述的真核基因组编辑系统对目标丝状真菌基因组进行基因编辑。
15.如权利要求14所述的基因编辑方法,其特征在于,将所述的调控sgRNA编码DNA转录的表达载体、Cas9蛋白的表达载体、以及同源供体DNA序列共转化进入丝状真菌的原生质体细胞。
16.一种产苹果酸的黑曲霉重组菌,其特征在于,其是通过如权利要求7至10任一项所述的真核基因组编辑系统或如权利要求14或15所述的基因编辑方法敲除黑曲霉的moc基因,或者敲除黑曲霉的moc基因和laeA基因,其中所述调控sgRNA编码DNA转录的表达载体中的所述sgRNA编码DNA转录表达框包括选自对黑曲霉基因moc的靶标位点,或者基因moc和laeA的靶标位点的组合。
17.一种苹果酸的生产方法,其特征在于,所述方法包括以下步骤:
(a)培养如权利要求16所述的黑曲霉重组菌;
(b)收集苹果酸。
CN201910834799.7A 2019-09-05 2019-09-05 一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系统和应用 Active CN110331146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910834799.7A CN110331146B (zh) 2019-09-05 2019-09-05 一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系统和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910834799.7A CN110331146B (zh) 2019-09-05 2019-09-05 一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系统和应用

Publications (2)

Publication Number Publication Date
CN110331146A CN110331146A (zh) 2019-10-15
CN110331146B true CN110331146B (zh) 2019-12-10

Family

ID=68150186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910834799.7A Active CN110331146B (zh) 2019-09-05 2019-09-05 一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系统和应用

Country Status (1)

Country Link
CN (1) CN110331146B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110791439B (zh) * 2019-10-10 2022-04-19 天津科技大学 一株基因工程构建发酵生产苹果酸的重组黑曲霉菌株及应用
CN110714030A (zh) * 2019-12-03 2020-01-21 中国农业大学 一种长喙壳菌外源基因转化的方法
CN111088256B (zh) * 2019-12-30 2021-03-16 云舟生物科技(广州)有限公司 食蟹猴u6启动子高效表达小rna及多个小rna表达的载体构建方法
CN111926030B (zh) * 2020-07-13 2021-10-15 华中农业大学 一种基于CRISPR-Cas12a系统的噬菌体基因组编辑载体及其应用
CN111808760B (zh) * 2020-08-31 2021-01-01 中国科学院天津工业生物技术研究所 一种促进宿主细胞生长速率及其底物利用的方法及应用
CN113151264A (zh) * 2021-03-11 2021-07-23 上海中溶科技有限公司 一种利用正向调控基因构建高产纤维素酶菌株的方法及应用
CN113717873B (zh) * 2021-09-27 2023-04-14 四川大学 一种多重耐受性酿酒酵母菌株及其构建方法和应用
CN113913483B (zh) * 2021-11-23 2023-06-23 常州大学 一种海藻糖和葡萄糖酸联产的方法
CN114480469B (zh) * 2022-02-16 2023-10-31 湖南省中医药研究院 装载茯苓内源序列的基因编辑载体、编辑系统及应用
CN115820746B (zh) * 2022-11-08 2023-08-18 华南理工大学 激酶基因在调控丝状真菌菌丝形态中的应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014186686A2 (en) * 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
CN106148209B (zh) * 2015-03-23 2020-11-20 中国科学院天津工业生物技术研究所 新的二元有机酸生产菌株及其制备和应用
KR101922989B1 (ko) * 2016-05-13 2018-11-28 연세대학교 산학협력단 CRISPR/Retron 시스템을 이용한 유전체상의 치환 변이 생성과 추적 방법
CN109797111B (zh) * 2019-01-31 2023-08-29 上海东庚化工技术有限公司 一种产苹果酸基因工程菌及其生产苹果酸的方法

Also Published As

Publication number Publication date
CN110331146A (zh) 2019-10-15

Similar Documents

Publication Publication Date Title
CN110331146B (zh) 一种调控sgRNA转录的启动子、表达载体,及其基因组编辑系统和应用
US20210017507A1 (en) Methods and compositions for sequences guiding cas9 targeting
CA2936646C (en) Methods and compositions for sequences guiding cas9 targeting
CN106715694B (zh) 核酸酶介导的dna组装
CN108546716A (zh) 一种基因组编辑方法
KR20180031765A (ko) 부위-특이적인 뉴클레오티드 치환을 통해 글리포세이트-내성 벼를 수득하는 방법
CN111705365A (zh) Crispr支持的多路基因组工程化
CN113667682B (zh) Yh66-rs11190基因突变体及其在制备l-缬氨酸中的应用
CN108603160B (zh) 突变丝状菌的制造方法
JP6856639B2 (ja) ドリメノールシンターゼiii
KR102026067B1 (ko) 목적 유전자 발현 조절을 위한 대장균 및 코리네박테리움 글루타미쿰 셔틀 벡터
CN113736806B (zh) 提高海洋微拟球藻油脂合成的基因及其用途
CN110468091B (zh) 微生物及其用途
CN113265417A (zh) 有机酸产量提高的菌株及其构建方法和应用
KR102302827B1 (ko) 크리스퍼 간섭을 이용한 유전자 발현 억제용 조성물
CN112501171B (zh) 两条特异性靶向猪Pax7基因的sgRNA导向序列及应用
CN113929757B (zh) 通过突变钙离子结合蛋白OsCIP1/2增强水稻耐冷性的方法
KR102551064B1 (ko) 포도에서 분리된 신규 u6 프로모터 및 이의 용도
CN112226453B (zh) 一种裂殖壶菌CRISPR/Cas9基因编辑系统及其应用
CN113136397B (zh) 一种提高草原龙胆基因编辑效率的重组载体及其制备方法与应用
WO2020234215A1 (en) Biotin prototrophy
KR102043363B1 (ko) 마크로포미나 파세올리나로부터의 펙틴 분해 효소 및 이의 용도
CN112996916A (zh) 避免藻类中的外源核酸的表观遗传沉默
CN112522269A (zh) 特异性靶向鸡TYR基因的sgRNA导向序列及应用
TW201336992A (zh) 源自游動放線菌se50/110並作為用於相關放線菌基因轉型之質體的新穎放線菌嵌合及接合單元

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant