CN107250163A - 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株 - Google Patents

修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株 Download PDF

Info

Publication number
CN107250163A
CN107250163A CN201680009146.XA CN201680009146A CN107250163A CN 107250163 A CN107250163 A CN 107250163A CN 201680009146 A CN201680009146 A CN 201680009146A CN 107250163 A CN107250163 A CN 107250163A
Authority
CN
China
Prior art keywords
glucoamylase
seq
polypeptide
bigger
fermentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680009146.XA
Other languages
English (en)
Inventor
C·K·米勒
A·内格雷特-雷蒙德
J·维尔多豪斯
A·瓦什
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cargill Inc
Original Assignee
Cargill Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cargill Inc filed Critical Cargill Inc
Publication of CN107250163A publication Critical patent/CN107250163A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K10/00Animal feeding-stuffs
    • A23K10/10Animal feeding-stuffs obtained by microbiological or biochemical processes
    • A23K10/12Animal feeding-stuffs obtained by microbiological or biochemical processes by fermentation of natural products, e.g. of vegetable material, animal waste material or biomass
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2428Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/03Phosphoric monoester hydrolases (3.1.3)
    • C12Y301/03002Acid phosphatase (3.1.3.2)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Polymers & Plastics (AREA)
  • Sustainable Development (AREA)
  • Physiology (AREA)
  • Animal Husbandry (AREA)
  • Food Science & Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及能够将显著量的葡糖淀粉酶分泌至发酵培养基中的非天然酵母。所述葡糖淀粉酶可以促进生成葡萄糖的淀粉材料的降解,用于发酵成期望的生物产物,诸如乙醇。所述葡糖淀粉酶可以以具有酿酒酵母交配因子α2(Sc MFα2)或抑制性酸性磷酸酶(Sc PHO5)分泌信号的葡糖淀粉酶融合蛋白的形式提供。

Description

修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株
相关申请的交叉引用
本申请要求在2015年2月6日提交的题为Modified Glucoamylase Enzymes andYeast Strains Having Enhanced Ethanol Production的具有系列号62/112,807的共同拥有的美国临时申请的权益,所述申请以其整体通过引用并入本文。此外,在2015年2月6日创建的具有78千字节大小的题为“CAR0178P1_Sequence_Listing_ST25.txt”的ASCII文本文件的全部内容通过引用并入本文。
技术领域
本发明涉及修饰的葡糖淀粉酶、表达这些酶的微生物和用于产生乙醇的发酵方法。
背景技术
通过发酵生产乙醇是众所周知的工业过程。然而,增加乙醇产量在技术上可能是困难的。存在各种因素,其使得微生物在设计用于增加的乙醇生产的发酵条件下生长具有挑战性。例如,发酵培养基可以具有较高的底物浓度以促进乙醇生产,但这些条件可以对细胞生长具有负面影响。此外,增加的乙醇浓度和不期望的副产物的积累也可以对细胞健康有害。已经针对对这些条件的耐受性选择酵母菌株,其可导致改善的乙醇产量。具体而言,酵母酿酒(Saccharomyces cerevisiae)酵母的乙醇耐受菌株已经作为用于生产乙醇的主要微生物用于工业环境中。
分子技术已经导致与乙醇耐受性相关的基因的鉴定。例如,Kajiwara(ApplMicrobiol Biotechnol.2000;53:568-74.)报道,参与不饱和脂肪酸(UFA)合成的OLE1基因的过表达导致细胞中的较高不饱和脂肪酸水平和较高乙醇产量。其它研究已经发现,通过破坏海藻糖水解酶、酸性海藻糖酶(ATH)来积累海藻糖(Kim等人,Appl EnvironMicrobiol.1996;62:1563-1569)或通过携带PRO1γ-谷氨酰激酶突变的菌株积累脯氨酸L-脯氨酸(Takagi,等人,Appl Environ Microbiol.2005;71:8656-8662.)改善酵母中的乙醇耐受性。麦角固醇与酿酒酵母的乙醇耐受性密切相关(Inoue,等人,Biosci BiotechnolBiochem.2000;64:229-236)。尽管在这方面已经取得进步,但使用表明乙醇耐受性的遗传修饰菌株可能单独不足以在发酵过程期间提供期望水平的乙醇。
除了发酵微生物的遗传概况以外,发酵培养基的组分可以对乙醇产量具有显著影响。在发酵过程中,培养基中存在碳水化合物或碳水化合物混合物。淀粉是广泛可用和廉价的碳水化合物来源。其可得自各种各样的植物来源,诸如玉米、小麦、大米、大麦等。许多生物体不能直接代谢淀粉,也不能缓慢且低效地代谢淀粉。
因此,通常在将淀粉加入发酵过程之前处理淀粉,以便将其分解成生物体容易发酵的单糖。通常,淀粉被水解以形成主要含葡萄糖(即右旋糖)的混合物。然而,用于发酵的制备物中的淀粉组合物的预处理可以是昂贵且费力的,因为其通常涉及向淀粉材料中添加纯化的淀粉降解酶,并且在实施发酵之前需要额外的步骤。此外,完全水解成葡萄糖增加显著的成本,所以大多数市售的葡萄糖产品倾向于含有少量各种寡聚多糖。
生产基于淀粉的乙醇的成本的很大部分是将淀粉分解成可发酵糖的酶。已经在酿酒酵母中尝试了各种分子技术以减少或消除将淀粉分解酶添加至发酵培养基的需求,但这些方法已经产生不同程度的成功。影响工程改造的菌株的商业可行性的潜在限制因素是酿酒酵母分泌大量外来蛋白的能力。
发明内容
本发明涉及包括非天然酵母的发酵方法,其在发酵培养基中提供高水平的葡糖淀粉酶活性。本发明还涉及葡糖淀粉酶(E.C.3.2.1.3),其被修饰以便用异源分泌序列部分或完全替代其天然分泌序列。本发明还涉及编码这些分泌序列修饰的葡糖淀粉酶的基因以及表达这些基因的微生物。本发明还涉及用于产生由生物体制造的生物衍生产物(发酵产物)诸如乙醇的方法。本发明还涉及可用于其它类型的组合物如动物饲料组合物的发酵副产物。
在与本申请相关的实验研究中,已经发现酿酒酵母交配因子α2(ScMFα2)分泌信号和酿酒酵母抑制性酸性磷酸酶(ScPHO5)分泌信号,当连接至葡糖淀粉酶并表达于微生物细胞中时,可以在发酵期间促进高水平的乙醇生产。令人惊讶的是,发现向天然分泌的酵母葡糖淀粉酶中添加ScMFα2分泌信号或ScPHO5分泌信号允许表达此类修饰酶的细胞在发酵培养基中产生显著更多的乙醇。本发明的一些方面使用扣囊复膜酵母(Saccharomycopsisfibuligera)葡糖淀粉酶(本文中为“Sf GA”),或其淀粉分解活性部分,诸如与SEQ ID NO:1的氨基酸27-515具有90%或更高序列相同性的Sf GA,用于制备Sc MFα2或Sc PHO5分泌信号-葡糖淀粉酶。
因此,本发明的方面提供了多肽,其包含(a)与SEQ ID NO:3(Sc MFα2分泌信号)或SEQ ID NO:5(Sc PHO5分泌信号)具有90%或更高相同性的分泌信号氨基酸序列和(b)来自酵母、真菌或细菌葡糖淀粉酶多肽的葡糖淀粉酶氨基酸序列,其中所述多肽具有葡糖淀粉酶活性。在一些方面,葡糖淀粉酶氨基酸序列基于来自扣囊复膜酵母的葡糖淀粉酶序列。在一些方面,葡糖淀粉酶氨基酸序列与SEQ ID NO:1的氨基酸27-515具有90%或更高序列相同性,其包括称为“Sf GA-1”的Sf GA葡糖淀粉酶的淀粉分解活性部分。在一些方面,多肽与SEQ ID NO:7(Sc MFα2 SS-Sf GA-1)具有95%或更高序列相同性或与SEQ ID NO:9(ScPHO5 SS-Sf GA-1)具有95%或更高序列相同性。
本发明的方面还提供了编码Sc MFα2分泌信号-葡糖淀粉酶或Sc PHO5分泌信号-葡糖淀粉酶的核酸序列。方面包括与SEQ ID NO:8(编码Sc MFα2 SS-Sf GA-1)具有75%或更高相同性或与SEQ ID NO:10(编码Sc PHO5 SS-Sf GA-1)具有75%或更高相同性的核酸。这些方面包括其中核酸存在于载体构建体上的构建体,其可以包括以下序列中的一种或多种:启动子序列、终止子序列、选择性标记序列、基因组整合序列和/或复制起点序列。核酸可以整合至宿主基因组DNA的一个或多个位置中,或者可以存在于细胞内而不是整合的,诸如在质粒或附加体构建体上。本发明还提供可用于检测细胞中的具有Sc MFα2或Sc PHO5分泌序列的葡糖淀粉酶基因的核酸,诸如DNA寡聚体(例如,单链DNA PCR引物或更长的线性DNA片段)。
本发明的方面还提供了表达Sc MFα2分泌信号-葡糖淀粉酶或Sc PHO5分泌信号-葡糖淀粉酶的宿主细胞。在一些方面,宿主细胞能够将酶分泌至存在细胞的培养基中。宿主细胞还可以耐受衍生自由酶的淀粉分解活性导致的前体的细胞的生物衍生产物,诸如乙醇或另一种产物。例如,宿主细胞可以是商购的菌株或具有一种或多种特定遗传修饰的菌株,所述遗传修饰提供对生物衍生产物的耐受性增加,例如增加的乙醇耐受性。示例性宿主细胞包括真菌细胞诸如酿酒酵母。
本发明的方面还提供了用于产生生物衍生产物的方法。所述方法包括提供发酵培养基,其包含表达Sc MFα2分泌信号-葡糖淀粉酶或Sc PHO5分泌信号-葡糖淀粉酶的宿主细胞,其中生物衍生产物由发酵方法产生。生物衍生产物可以是衍生自葡萄糖聚合物诸如淀粉、直链淀粉或支链淀粉的产物的酶促降解的产物。在一种示例性方法中,醇(即乙醇)由发酵方法产生。在另一种示例性方法中,有机酸(即乳酸)由发酵方法产生。
本发明的方面还提供了用于处理包含葡萄糖聚合物诸如淀粉、直链淀粉或支链淀粉的培养基的方法。所述方法包括提供培养基,其包含葡萄糖聚合物和表达Sc MFα2分泌信号-葡糖淀粉酶或Sc PHO5分泌信号-葡糖淀粉酶的宿主细胞。在所述方法中,葡萄糖聚合物与由细胞分泌的葡糖淀粉酶接触,并且葡萄糖聚合物降解成葡萄糖。处理的培养基可用于使用不同细胞的发酵过程,或可用于非发酵过程。
本发明的另一个方面是用于产生发酵产物的发酵方法。所述方法包括发酵包含淀粉材料和非天然酵母的液体培养基的步骤,所述非天然酵母包含编码包含葡糖淀粉酶的多肽的外源核酸。非天然酵母为培养基提供2.25U或更大/克生物量的量的葡糖淀粉酶活性。
本发明的方面还提供了用于通过发酵产生乙醇的方法,其中乙醇以90g/L或更高的浓度存在于发酵培养基中。在所述方法中,发酵包含淀粉材料和非天然酵母的液体培养基,所述非天然酵母包含编码多肽的外源核酸,所述多肽包含葡糖淀粉酶部分和与葡糖淀粉酶异源的信号序列。发酵可以提供液体培养基中约90g/L或更高的乙醇浓度,诸如约90g/L至约170g/L的范围内。
在另一个方面,本发明提供了可用于制备饲料组合物的方法和组合物。饲料组合物包括获得自发酵培养基的发酵培养基副产物,所述发酵培养基衍生自本公开的非天然酵母。例如,在已经完成发酵过程之后,可以从发酵培养基除去生物产物中的一些或全部,以提供包含非生物产物固体的精制组合物。非生物产物固体可以包括非天然酵母、培养基中未被酵母利用的原料以及发酵副产物。精制组合物可用于形成饲料组合物,诸如家畜饲料组合物。包含非生物产物固体的精制组合物可以提供碳水化合物和蛋白补充剂以改善饲料组合物的营养含量。
附图说明
图1是比较来自本公开的菌株的浓缩提取物的蛋白凝胶的图片。
具体实施方式
下面描述的本发明的方面并不意欲是穷举的,或者将本发明限于以下详述中公开的精确形式。相反,所选择和描述的方面的目的使得可以便于本领域技术人员对本发明的原理和实践的欣赏和理解。
本发明的方面涉及被修饰成用异源分泌序列替代其天然分泌序列的葡糖淀粉酶基因,所述异源分泌序列是酿酒酵母交配因子α2(Sc MFα2)分泌信号或酿酒酵母抑制性酸性磷酸酶(Sc PHO5)分泌信号。能够充当这些酶表达的模板的核酸也是本发明的方面。
本发明的方面还涉及作为表达这些酶的微生物,特别是真菌生物诸如酵母(例如酿酒酵母)。此类生物体可以表达具有Sc MFα2或Sc PHO5分泌信号的葡糖淀粉酶。葡糖淀粉酶可以从细胞分泌至发酵培养基中,其中所述酶可以对存在于发酵培养基中的葡萄糖聚合酶具有淀粉分解活性。进而,所述酶可以引起葡萄糖聚合物降解成葡萄糖,其可以进入细胞并用作用于产生靶化合物诸如乙醇的碳源。
如本文所用的术语“外源”意味着分子,诸如核酸,或活性,诸如酶活性,被引入宿主生物体。外源核酸可以通过众所周知的技术引入宿主生物体中,并且可以在宿主染色体材料外部维持(例如,维持在非整合载体上),或可以整合至宿主的染色体中,诸如通过重组事件。外源核酸可以编码与宿主生物体同源或异源的酶或其部分。
术语“异源”是指来自不同于参考的分子或生物体的来源的分子或活性。例如,在本公开的上下文中,“异源信号序列”是指不同于参考的多肽或酶的信号序列。因此,当从葡糖淀粉酶除去天然信号序列并用来自不同多肽的信号序列替换时,修饰的葡糖淀粉酶具有“异源信号序列”。因此,与参考的生物体异源的基因或蛋白是在该生物体中未发现的基因或蛋白。例如,在第一真菌物种中发现且外源引入作为宿主生物体的第二真菌物种的特定葡糖淀粉酶基因是第二真菌生物体“异源的”。
葡糖淀粉酶(E.C.3.2.1.3)是淀粉分解酶,其从寡糖链和多糖链的非还原末端依次水解1,4-连接的a-D-葡萄糖基残基,且释放D-葡萄糖。
葡糖淀粉酶还可以在支链淀粉分支点上切割α-1,6键。如本文所用,关于Sc MFα2或Sc PHO5分泌信号-葡糖淀粉酶的术语“淀粉分解活性”涉及这些酶促机制。葡糖淀粉酶多肽可以是天然存在的葡糖淀粉酶的变体,或天然存在的葡糖淀粉酶的部分(例如在其N-端、其C-端或两者被截短的葡糖淀粉酶),而葡糖淀粉酶多肽保留淀粉分解活性。
葡糖淀粉酶的替代名称包括淀粉葡糖苷酶;γ-淀粉酶;溶酶体α-葡萄糖苷酶;酸性麦芽糖酶;外-1,4-α-葡萄糖苷酶;葡糖淀粉酶;γ-1,4-葡聚糖葡糖水解酶;酸性麦芽糖酶;1,4-α-D-葡聚糖葡糖水解酶。
大多数葡糖淀粉酶是多结构域酶。许多葡糖淀粉酶包括经由O-糖基化连接区连接至催化结构域的淀粉结合结构域。淀粉结合结构域可以折叠为反平行β-桶,并且可以具有淀粉或β-环糊精的两个结合位点。然而,一些葡糖淀粉酶不包括淀粉结合结构域(例如参见Hostinova等人,Archives of Biochemistry and Biophysics,411:189–195,2003),或包括非规范淀粉结合结构域。例如,米根霉(Rhizopus oryzae)葡糖淀粉酶具有C-端生淀粉结合结构域,并且扣囊复膜酵母IFO 0111葡糖淀粉酶缺乏明确的淀粉结合结构域(Hostinova等人,同上)。因此,本发明的一些方面涉及不包括淀粉结合结构域且具有用Sc MFα2或ScPHO5分泌信号修饰的N-端的葡糖淀粉酶,并且其它方面涉及包括淀粉结合结构域且具有用Sc MFα2或Sc PHO5分泌信号修饰的N-端的葡糖淀粉酶。
葡糖淀粉酶还可以具有催化结构域,其具有含有中心漏斗形活性位点的配置的扭曲(α/α)(6)-桶的构型。葡糖淀粉酶可以具有大约450个残基的结构保守的催化结构域。在一些葡糖淀粉酶中,催化结构域通常随后为接头区域,由连接至大约100个残基的淀粉结合结构域的30至80个残基组成。
葡糖淀粉酶特性可以与其结构特征相关。使用来自催化和淀粉结合结构域模型的信息构建基于结构的多重序列比对(参见例如,Coutinho,P.M.,和Reilly,P.J.,1994.Protein Eng.7:393–400和749–760)。已经显示,基于结构-功能关系研究,催化和淀粉结合结构域在功能上是独立的,并且在微生物葡糖淀粉酶中存在结构相似性。从其它研究来看,已经显示特定葡糖淀粉酶残基参与指导蛋白构象变化、底物结合、热稳定性和催化活性(参见例如,Sierks,M.R.,等人1993.Protein Eng.6:75–79;和Sierks,M.R.,和Svensson,B.1993.Biochemistry 32:1113–1117)。因此,本领域理解葡糖淀粉酶序列与蛋白功能之间的相关性,并且本领域技术人员可以设计和表达具有一个或多个氨基酸缺失、取代和/或添加的淀粉分解活性葡糖淀粉酶的变体。例如,在一些方面,Sc MFα2或Sc PHO5分泌信号-葡糖淀粉酶的葡糖淀粉酶部分可以含有天然存在的葡糖淀粉酶的截短形式,具有如本文所述的淀粉分解活性的至少具有催化和任选淀粉结合结构域的截短版本。
Hostinova等人(Archives of Biochemistry and Biophysics,411:189–195,2003)描述了酵母菌株扣囊复膜酵母IFO 0111(本文中称为“Sf GA-1”)中葡糖淀粉酶基因Glm的核苷酸序列。根据Hostinova等人,扣囊复膜酵母Glm基因被转录成1.7kb RNA转录物,其编码515氨基酸蛋白,并且由SEQ ID NO:1表示。在515氨基酸长多肽链中,26个N-端氨基酸残基构成信号肽,且随后489个氨基酸残基构成成熟蛋白。缺乏信号序列且489个氨基酸长的成熟的Glm具有呈去糖基化形式的54,590Da的预测分子量。与其它葡糖淀粉酶一致,显示Glm在催化结构域中具有同源性。
Itoh等人(J.Bacteriol.169:4171-4176)描述了酵母扣囊复膜酵母中另一种葡糖淀粉酶基因GLU1(本文中称为“Sf GA-2”)的核苷酸序列。扣囊复膜酵母GLU1基因被转录成2.1kb RNA转录物,其编码519氨基酸蛋白,且具有57,000Da的分子量。GLU1具有四个潜在的糖基化位点(对于具有2000Da的分子量的天冬酰胺连接的糖苷)。GLU1具有四个潜在的糖基化位点(对于具有2000Da的分子量的天冬酰胺连接的糖苷)。GLU1具有可能在蛋白输出期间被切除的天然分泌信号序列。切割位点之前是碱性氨基酸Lys-Arg,其被认为是产生成熟蛋白的蛋白水解加工信号。
Itoh等人(同上)还描述了来自酵母和真菌的葡糖淀粉酶的氨基酸序列的比对。比对扣囊复膜酵母、黑曲霉(A.niger)、米根霉和糖化酵母(Saccharomyces diastaticus)和酿酒酵母,其显示出五个高度同源的区段(S1-S5)。各保守区段的这些部分被显示为彼此构象相似。通常位于羧基端的S5区段似乎对淀粉分解活性是不必要的,因为来自酵母属菌种的葡糖淀粉酶缺乏该区域。
在这方面,本发明还考虑具有葡糖淀粉酶活性的Sf GA的变体和部分。表1和2呈现各种真菌和细菌葡糖淀粉酶基因的列表,其包括葡糖淀粉酶的天然信号序列和一些序列中前肽的氨基酸位置。
表1:真菌葡糖淀粉酶
表2:细菌葡糖淀粉酶
如本文和表1和2中所示,来自各种真菌和细菌物种的葡糖淀粉酶通常也包括天然的“信号序列”。各种其它术语可用于指示如本领域已知的“信号序列”,诸如其中词语“信号”被“分泌”或“靶向”或“定位”或“转化”或“前导(leader)”替换,且词语“序列”被“肽”或“信号”替换。通常,信号序列是位于新合成的蛋白的氨基端的短氨基酸区段(通常在5-30个氨基酸的范围内)。大多数信号肽包括碱性N-端区域(n-区域)、中央疏水区域(h-区域)和极性C-端区域(c-区域)(例如,参见von Heijne,G.(1986)Nucleic Acids Res.14,4683-4690)。信号序列可以将蛋白靶向至细胞的特定部分,或者可以靶向蛋白用于从细胞分泌。例如,已经显示,糖化酵母葡糖淀粉酶STAI基因的天然N-端信号序列可以将其靶向至分泌装置的内质网(例如,参见Yamashita,I.等人,(1985)J.Bacteriol.161,567-573)。
在一个方面,本发明提供了用Sc MFα2或Sc PHO5分泌信号部分或完全替换葡糖淀粉酶的天然信号序列。在另一个方面,本发明除了其天然分泌信号之外还提供了将Sc MFα2或Sc PHO5分泌信号添加至葡糖淀粉酶。鉴于异源分泌信号的添加,蛋白可以被称为“融合蛋白”,并且如下注释:[Sc MFα2-SS]-[GA]和[Sc PHO5-SS]-[GA]。
酿酒酵母交配因子α2(Sc MFα2)分泌信号描述于美国专利号4,546,082(Kurjan等人)。Sc MFα2 SS序列如下:MKFISTFLTFILAAVSVTA(SEQ ID NO.10)。Sc MFα2序列来自基因YGL089C(YGL089C),而MFα1由基因YPL187W MFα1编码,且MFα2是由MATa细胞分泌的信息素。在一个方面,葡糖淀粉酶融合蛋白包含与SEQ ID NO:10具有90%或更高相同性的分泌信号序列。例如,SEQ ID NO:10的一个氨基酸可以被氨基酸、诸如保守氨基酸取代。
酿酒酵母抑制性酸性磷酸酶(Sc PHO5)分泌信号描述于美国专利号5,521,086(Scott等人)和Meyhack等人(EMBO J.6:675-680,1982)。Sc PHO5 SS序列如下:MFKSVVYSILAASLANA(SEQ ID NO.11)。Sc PHO5序列来自PHO5,其是编码酿酒酵母酸性磷酸酶的结构基因,其由培养基中的浓度或无机磷酸盐(Pi)调节。在一个方面,葡糖淀粉酶融合蛋白包含与SEQ ID NO.11具有90%或更高相同性的分泌信号序列。例如,SEQ ID NO.11的一个氨基酸可以被氨基酸、诸如保守氨基酸取代。
可以进行分子技术以产生核酸序列,其是表达Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的模板(如果葡糖淀粉酶蛋白/核苷酸序列是本领域已知的)。作为一般情况,制备核酸以编码包含Sc PHO5 SS-或Sc MFα2 SS序列和葡糖淀粉酶序列的蛋白。
可以使用编码功能性葡糖淀粉酶多肽的任何序列。在一些方面,葡糖淀粉酶序列可以是葡糖淀粉酶基因的天然(“野生型”)序列,其中Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的葡糖淀粉酶部分的序列在任何氨基酸位置都不同于天然序列。在其它方面,Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的葡糖淀粉酶部分的序列在一个或多个氨基酸位置不同于天然序列。差异可以是例如(a)从野生型序列去除一个或多个氨基酸,(b)向野生型序列中添加一个或多个氨基酸,(c)野生型序列的取代,(a)和(c)的组合,或(b)和(c)的组合。
例如,在一个方面,在添加Sc MFα2 SS或Sc PHO5 SS序列之前,葡糖淀粉酶的天然序列可以在其N-端改变。在一些方面,在连接Sc MFα2 SS或Sc PHO5 SS序列之前,除去天然葡糖淀粉酶信号序列的全部或部分。例如,葡糖淀粉酶的天然前导序列的一部分可以通过缺失天然分泌信号的一个或多个、但不是全部氨基酸(例如,缺失最高达50%、60%、70%、80%、90%或95%的天然前导序列)来改变。此类天然前导序列的一部分的缺失可引起天然葡糖淀粉酶前导序列失去其天然功能性,其被由Sc MFα2或Sc PHO5分泌信号提供的功能性所替换。在其它方面,所有天然分泌信号都可以从葡糖淀粉酶除去,并用Sc MFα2 SS或ScPHO5 SS序列替换。
例如,且参考表1,在制备融合蛋白构建体中,去除扣囊复膜酵母IFO 0111葡糖淀粉酶(Sf GA-1)的前18个氨基酸,其对应于使用CBS预测服务器预测的前导序列(即,SEQ IDNO:12的氨基酸1-18)。因此,扣囊复膜酵母葡糖淀粉酶天然分泌信号的一部分用Sc MFα2SS序列(SEQ ID NO:10;19个氨基酸)或用Sc PHO5 SS序列(SEQ ID NO:11;17个氨基酸)替换,其然后可以直接或间接地连接至扣囊复膜酵母葡糖淀粉酶多肽的剩余部分(例如,SEQID NO:1的氨基酸19-515)。这提供了516个氨基酸的Sc MFα2 SS-Sf GA(SEQ ID NO:13)或514个氨基酸的Sc PHO5 SS-Sf GA(SEQ ID NO:14)。
作为另一个实例,葡糖淀粉酶的天然前导序列的一个或多个氨基酸可以通过取代来改变,所述取代是天然葡糖淀粉酶前导序列中的特定位置处的天然氨基酸用不同于天然氨基酸的氨基酸来替换。例如,葡糖淀粉酶的天然前导序列的一部分可以通过取代天然分泌信号的一个或多个(例如,最高达50%、60%、70%、80%、90%或95%的天然前导序列可被取代)来改变。一个或多个氨基酸的取代可引起天然葡糖淀粉酶前导序列失去其天然功能性,其被由Sc MFα2或Sc PHO5分泌信号提供的功能性所替换。
在其它方面,包含Sc PHO5 SS-或Sc MFα2 SS序列和葡糖淀粉酶序列的融合多肽任选地包含天然葡糖淀粉酶多肽或Sc PHO5 SS-或Sc MFα2 SS序列中不存在的额外序列。额外序列可以为天然多肽中不存在的分泌信号修饰的葡糖淀粉酶提供功能性。额外功能性包括,例如,蛋白酶位点或其它蛋白或材料的结合位点。
天然葡糖淀粉酶多肽或Sc PHO5 SS-或Sc MFα2 SS序列中可能不存在、但可添加的额外序列的实例是接头或间隔区序列。接头序列可以位于Sc PHO5 SS-或Sc MFα2 SS序列和葡糖淀粉酶序列之间。此类融合多肽[分泌信号修饰的多肽]可以如下注释:[Sc MFα2-SS]-[L]-[GA]和[Sc PHO5-SS]-[L]-[GA],其中“L”表示将信号序列与葡糖淀粉酶连接的一个或多个氨基酸。示例性接头包括最多达5、10、15、20、25、30、35或40个氨基酸。接头可以包括引起接头刚性且防止葡糖淀粉酶的分泌信号和其它部分之间的相互作用的氨基酸。刚性接头可以包括残基诸如Pro、Arg、Phe、Thr、Glu和Gln。或者,融合多肽可以包括柔性接头。柔性接头可以包括甘氨酸残基并将信号序列连接至融合蛋白的葡糖淀粉酶部分,而不会干扰它们各自的功能。在一些方面,多肽包括具有蛋白酶切割序列的接头。示例性蛋白酶切割序列包括凝血酶、因子Xa、鼻病毒3C、TEV蛋白酶、Ssp DnaB、内含肽、Sce VMA1内含肽、肠激酶和KEX2的蛋白酶切割序列(参见例如,Waugh,D.S.,Protein Expr Purif.80(2):283–293,2011;Zhou等人,Microbial Cell Factories 13:44,2014;和Bourbonnais等人,J.Bio.Chem.263(30):15342,1988)。
天然葡糖淀粉酶多肽或Sc PHO5 SS-或Sc MFα2 SS序列中可能不存在、但可添加的额外序列的另一实例是标签序列。标签序列可以位于葡糖淀粉酶序列的C-端,并且此类蛋白可以如下注释:[Sc MFα2-SS]-[GA]-[T]和[Sc PHO5-SS]-[GA]-[T],其中“T”表示提供标签序列的一个或多个氨基酸。示例性肽标签包括最多达5、10、15或20个氨基酸。肽标签可用于各种目的中的任何一种或多种。例如,标签可以允许通过标签-结合成员与标签特异性相互作用的能力来从培养基纯化酶。标签还可以允许使用具有可检测标记的标签-结合成员来检测或鉴定蛋白。示例性短肽标签是多-Arg、FLAG、多-His、c-myc、S和Strep II。
本公开的分泌信号修饰的多肽也可以具有除了天然分泌序列之外的天然葡糖淀粉酶多肽的一个或多个区域的缺失,其中所述缺失不影响多肽的淀粉分解活性。缺失可以基于关于天然葡糖淀粉酶的结构和功能的已知信息,包括突变研究和序列比对(例如,参见Coutinho,同上,和Sierks,同上)。在一些方面,分泌信号修饰的多肽具有葡糖淀粉酶多肽的序列的最多达1%、最多达2%、最多达4%、最多达6%、最多达8%、最多达10%、最多达12%、最多达14%、最多达16%、最多达18%、最多达20%或最多达25%的缺失。在一些方面,本公开的分泌信号修饰的多肽具有对应于天然葡糖淀粉酶多肽的C-端的部分的缺失。
已经生成了葡糖淀粉酶的截短形式,并且其已显示具有酶促活性。例如,Evans等人(Gene,91:131;1990)生成了一系列的葡糖淀粉酶的截短形式,以研究多少O-糖基化区域是GAII(酶的缺乏生淀粉-结合结构域的完全活性形式)的活性或稳定性所必要的。已发现,C-端的大部分可以从GAII缺失,对酶的活性、热稳定性或分泌具有不显著的影响。
与引起葡糖淀粉酶活性变化相关的各种氨基酸取代也是本领域已知的。已显示葡糖淀粉酶序列中各个位置处的氨基酸取代影响特性诸如热稳定性、淀粉水解活性、底物使用和蛋白酶抗性。因此,本公开考虑使用Sc MF 2或Sc PHO5分泌信号与在多肽的葡糖淀粉酶部分中包括一个或多个氨基酸取代的葡糖淀粉酶序列,其中所述取代不同于葡糖淀粉酶的野生型序列。
例如,美国专利号8,809,023描述了在淀粉水解期间降低异麦芽糖合成和淀粉水解活性的比率(IS/SH比率)的方法。具体而言,描述了里氏木霉葡糖淀粉酶(Tr GA)(具有携带信号肽的N-端的632个氨基酸的总长度),其在如下氨基酸位置被修饰:D44R和A539R;或D44R、N61I和A539R。据报道,该葡糖淀粉酶变体在淀粉水解期间与所述亲本葡糖淀粉酶相比表现出降低的IS/SH比率。作为实例,本公开考虑替换期望的葡糖淀粉酶(例如,具有ScMFα2或Sc PHO5分泌信号的Sf GA)的天然前导序列,其中期望的葡糖淀粉酶还具有对应于修饰的Tr GA的D44R和A539R;或D44R、N61I和A539R取代的氨基酸取代。在更广泛的意义上,Sc MFα2或Sc PHO5分泌信号可以与具有以下氨基酸取代的葡糖淀粉酶变体一起使用:D44R和A539R;或D44R、N61I和A539R,所述位置对应于TrGA序列中的相应位置,其中所述葡糖淀粉酶变体与TrGA序列的整个长度具有至少90%氨基酸序列相同性,模板葡糖淀粉酶序列与TrGA序列相应的“各自位置”可以通过例如已知葡糖淀粉酶多肽序列(构建Sc PHO5 SS-或Sc MFα2 SS葡糖淀粉酶融合体的模板)与TrGA序列的序列比对来理解。
作为另一个实例,与野生型葡糖淀粉酶变体相比,美国专利号8,592,194描述了具有增加的热稳定性的葡糖淀粉酶变体。在本公开中还描述了里氏木霉葡糖淀粉酶,但对天然Tr GA序列在以下位置处具有一个或多个氨基酸取代:10、14、15、23、42、45、46、59、60、61、67、68、72、73、97、98、99、102、108、110、113、114、122、124、125、133、140、144、145、147、152、153、164、175、182、204、205、214、216、219、228、229、230、231、236、239、240、241、242、244、263、264、265、268、269、276、284、291、300、301、303、310、311、313、316、338、342、344、346、349、359、361、364、379、382、390、391、393、394、408、410、415、417和418。作为实例,本公开考虑用Sc MFα2或Sc PHO5分泌信号替换Sf GA的天然前导序列,其中Sf GA还具有在提供增加的热稳定性中表现的氨基酸取代中的任何一种或多种。在更广泛的意义上,Sc MFα2或Sc PHO5分泌信号可以与具有提供增加的热稳定性的氨基酸取代的葡糖淀粉酶变体一起使用,所述位置对应于TrGA序列中的相应位置。
来自两种或更多种葡糖淀粉酶的“相应”氨基酸的测定可以通过其氨基酸序列的全部或部分的比对来确定。序列比对和序列相同性的生成包括全局比对和局部比对,其通常使用计算方法。为了提供全局比对,使用跨越所有查询序列的整个长度的全局优化迫使序列比对。相比之下,在局部比对中,鉴定长序列内较短的相似性区域。
如本文所用,“等同位置”意指基于一种葡糖淀粉酶的氨基酸序列的比对或作为三维结构的比对的两个序列(例如,具有期望的取代的Sf GA序列和GA序列)共有的位置。因此,序列比对或结构比对或两者可用于确定等同性。
在一些实践模式中,BLAST算法用于比较和确定序列相似性或相同性。此外,可以确定可以分配权重或评分的序列中的缺口的存在或显著性。这些算法也可用于确定核苷酸序列相似性或相同性。用于确定相关性的参数基于本领域已知用于计算确定的匹配的统计学相似性和显著性的方法来计算。预期相关的基因产物具有高相似性,诸如大于50%序列相同性。用于使用BLAST算法确定两个或更多个序列相关性的示例性参数可以如下。
在一些实践模式下,使用具有默认参数的BLAST(National Center forBiological Information(NCBI)Basic Local Alignment Search Tool)版本2.2.29软件进行比对。使用具有默认参数的BLAST版本2.2.29算法的相对于参考序列具有XX%(例如,80%)的相同性评分的序列被认为与参考序列具有至少XX%相同性或者等效地具有XX%序列相同性。全局比对可以将与例如扣囊复膜酵母葡糖淀粉酶具有显著相同性的序列进行比对,以确定如果使用葡糖淀粉酶变体,靶序列(例如,葡糖淀粉酶直向同源物)中何种相应的氨基酸位置可以被一个或多个氨基酸取代。
编码Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶多肽的核酸序列,以及任何调节序列(例如终止子、启动子等)和载体序列(例如,包括选择标记物、整合标记物、复制序列等)可以在一些实践模式中使用已知的分子技术来制备。用于制备DNA构建体(例如,对于包括ScMFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的DNA构建体)的方法的一般指导可见于Sambrook等人Molecular Cloning,A Laboratory Manual,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1989;和Ausubel等人Current Protocols inMolecular Biology,Greene Publishing and Wiley-Interscience,New York,N.Y.,1993。
当在PCR中使用少量葡糖淀粉酶模板DNA作为起始材料时,可以使用包括MFα2 SS或Sc PHO5 SS序列和葡糖淀粉酶序列在其天然信号序列3'的部分的引物以生成相对大量的特异性DNA片段,其包括MFα2 SS或Sc PHO5 SS序列和葡糖淀粉酶基因。
PCR技术可以用于修饰天然葡糖淀粉酶核酸序列以添加Sc MFα2 SS或Sc PHO5 SS序列,或者在葡糖淀粉酶核酸序列中引入一个或多个突变以提供变体。PCR技术描述于例如Higuchi,(1990)于PCR Protocols,pp.177-183,Academic Press;Ito等人(1991)Gene102:67-70;Bernhard等人(1994)Bioconjugate Chem.5:126-132;和Vallette等人(1989)Nuc.Acids Res.17:723-733。所述技术可以任选地包括先前制备的编码葡糖淀粉酶多肽的DNA的位点定向的(或寡核苷酸介导的)诱变、PCR诱变和盒式诱变。
或者,核酸分子可以由定制的基因合成提供者诸如DNA2.0(Menlo Park,CA)或GeneArt(Life Technologies,Thermo Fisher Scientific)生成。
可以构建表达载体以包括可操作连接至在宿主生物体中有功能的表达控制序列的Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶核酸序列。适用于宿主生物体的表达载体包括例如质粒、附加体和人造染色体。载体可以包括可操作以稳定整合入宿主染色体的选择序列或标记物。另外,载体可以包括一种或多种选择标记基因和适当的表达控制序列。也可以包括选择性标记基因,例如,提供对抗生素或毒素的抗性,补充营养缺陷型缺陷,或提供不在培养基中的关键营养物。表达控制序列可以包括本领域众所周知的组成型和诱导型启动子、转录增强子、转录终止子等。
在一些方面,核酸可以进行密码子优化。用于Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶的葡糖淀粉酶部分的核酸模板可以是编码葡糖淀粉酶的天然DNA序列,或者模板可以是优化用于在期望的宿主细胞中表达的密码子优化的版本。提供关于特定宿主生物体中期望的密码子使用的信息的数据库是本领域已知的。
根据本公开的一个方面,包含Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶的DNA构建体可操作连接至启动子序列,其中启动子序列在选择的宿主细胞中有功能。在一些方面,启动子在真菌宿主细胞中显示转录活性,并且可以衍生自与宿主细胞同源或异源的编码蛋白的基因。在一些方面,启动子可用于在酿酒酵母中表达。众所周知的组成型启动子的实例包括但不限于细胞色素c启动子(pCYC)、翻译延长因子启动子(pTEF)、甘油醛-3-磷酸脱氢酶启动子(pGPD)、磷酸甘油酸激酶启动子(PGK)和醇脱氢酶启动子(pADH)。任选地,还可以在载体上包括控制表达的额外因子,如增强子等。
包括Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的表达载体还可以包括在宿主细胞中有功能的任何终止序列。例如,终止序列和启动子序列可以来自相同的细胞,或终止序列与宿主细胞同源。终止序列可以对应于使用的任何启动子。
可以使用载体将DNA构建体引入宿主细胞。载体可以是当引入宿主细胞时稳定引入的任何载体。在一些方面,载体被整合至宿主细胞基因组中并复制。载体包括克隆载体、表达载体、穿梭载体、质粒、噬菌体颗粒、盒等。在一些方面,载体是包含与葡糖淀粉酶编码序列可操作连接的调节序列的表达载体。
包含Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的DNA构建体可以进一步包括选择性标记物,从而便于宿主细胞中的选择。例如,可选择标记物可用于转化的酵母。酵母选择性标记物的实例包括通常用于选择转化的酵母细胞的标记物。可以使用控制营养缺陷型的基因使用营养缺陷型标记物,这意味着该基因使得酵母产生酵母生长所需的营养物。控制营养缺陷型的实例基因包括亮氨酸营养缺陷型(LEU2)、组氨酸营养缺陷型(HIS3)、尿嘧啶营养缺陷型(URA3、URA5)和色氨酸营养缺陷型(TRP1)。
DNA构建体可以是整合至基因组中并与其已被整合至其中的染色体一起复制的构建体。例如,可以用编码葡糖淀粉酶并将DNA构建体以一个或多个拷贝整合至宿主染色体中的DNA构建体转化真菌细胞。该整合通常被认为是有利的,因为DNA序列更可能被稳定地维持。可以根据常规方法,诸如通过同源或异源重组,进行DNA构建体整合至宿主染色体中。
非天然酵母还可以包括不同于用异源信号序列修饰葡糖淀粉酶的一种或其它遗传修饰。例如,一种或多种额外修饰可以包括提供不同的多糖降解酶,诸如外源或修饰的α-淀粉酶、β-淀粉酶、支链淀粉酶、异淀粉酶或环糊精糖基转移酶;外源或修饰的糖转运蛋白基因(诸如异麦芽糖转运蛋白);和/或异源或修饰的将低分子量非葡萄糖糖转化为葡萄糖的基因,诸如异麦芽糖酶的那些。
可以用包括Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的核酸转化各种宿主细胞。在一些方面,包括Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的核酸存在于细菌细胞中。细菌细胞可用于例如繁殖核酸序列或用于产生一些量的多肽。
在其它方面,宿主细胞是真核细胞,诸如真菌细胞。
在一些方面,宿主细胞在发酵培养基中具有对较高量的生物衍生的产物(诸如乙醇)的耐受性。在一些方面,宿主细胞是“工业酵母”,其是指常规用于乙醇发酵中的任何酵母。实例包括清酒酵母、烧酒酵母、葡萄酒酵母、啤酒酵母、面包酵母等。清酒酵母表现出高乙醇发酵能力和高乙醇抗性和遗传稳定性。通常,工业酵母具有高乙醇抗性,并且优选在10%或更高的乙醇浓度下存活。
在示例性方面,宿主细胞是酿酒酵母。一些酿酒酵母具有对乙醇的高耐受性。乙醇耐受酵母的各种菌株是市售的,诸如RED和ETHANOL酵母(Fermentis/Lesaffre,USA)、FALI(Fleischmann's Yeast,USA)、SUPERSTART和酵母(Ethanol Technology,Wis.,USA)、BIOFERM AFT和XR(NABC--North AmericanBioproducts Corporation,GA,USA)、GERT STRAND(Gert Strand AB,Sweden)和FERMIOL(DSM Specialties)。
工业酵母通常是原养型的,因此没有适于选择转化体的营养缺陷型标记物。如果宿主细胞没有否则将有助于在转化后在细胞内保留Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的遗传背景,则宿主细胞可被工程改造以引入一种或多种遗传突变以建立与细胞中的Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因相关的标记基因的使用并在细胞内维持Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因。例如,市售的乙醇耐受性酵母细胞可以在细胞内引入Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因之前进行遗传修饰。
可以通过破坏控制营养缺陷型的基因来提供不同营养缺陷型的标记物。在一种实践模式中,将酵母的乙醇耐受性菌株工程改造为破坏控制营养缺陷型的一种或多种基因的拷贝,诸如LEU2、HIS3、URA3、URA5和TRP1。在提供尿嘧啶营养缺陷型的情况下,例如,乙醇耐受性酵母的正常ura3基因可以用获得自尿嘧啶营养缺陷突变体(例如,酿酒酵母MT-8菌株)的ura3-片段替代以破坏正常ura3基因。在ura3基因破坏的菌株的情况下,可以通过利用以下事实来容易地鉴定或选择标记物的存在/不存在:ura3基因破坏的菌株能够在含有5-氟乳清酸(5-FOA)的培养基中生长,而正常ura3菌株(野生型酵母或常规工业酵母)不能生长。在lys2基因破坏的菌株的情况下,可以通过利用以下事实来容易地鉴定或选择标记物的存在/不存在:lys2基因破坏的菌株能够在含有α-氨基己二酸的培养基中生长,而正常lys2菌株(野生型酵母或常规工业酵母)不能生长。根据所采用的营养缺陷型,可以使用用于破坏营养缺陷型控制基因和用于选择性分离营养缺陷型控制基因突变体的方法。或者,可以采用显性选择标记物,诸如来自构巢曲霉(Aspergillus nidulans)的amdS(US5876988),其允许在作为唯一氮源的乙酰胺上生长;或ARO4-OFP,其允许在氟-苯丙氨酸存在的情况下生长(Fukuda等人)。这些标记物可以通过重复使用可循环的cre-loxP系统来使用,或者可以用于产生允许利用额外标记物的营养缺陷型菌株。
在宿主细胞已被工程改造为提供期望的遗传背景用于引入Sc MFα2 SS或Sc PHO5SS-葡糖淀粉酶基因之后,将基因构建体引入细胞以允许表达。用于将基因构建体引入宿主细胞的方法包括转化、转导、转染、共转染、电穿孔。具体而言,可以使用乙酸锂方法、原生质体法等实施酵母转化。待引入的基因构建体可以以质粒的形式或通过插入宿主的基因或通过与宿主的基因的同源重组而并入染色体中。可以用选择性标记物(例如,如上所提及的营养缺陷型标记)选择其中已引入基因构建体的转化的酵母。可以通过测量表达的蛋白的活性来进行进一步证实。
可以使用本领域众所周知的方法来证实包括Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因的外源核酸序列的转化。此类方法包括例如核酸分析,诸如mRNA的Northern印迹或聚合酶链式反应(PCR)扩增,或基因产物表达的免疫印迹,或测试引入的核酸序列或其相应的基因产物的表达的其它合适的分析方法。本领域技术人员应理解,外源核酸以足够的量表达以产生期望的产物,并且还应理解,可以使用本领域众所周知和如本文公开的方法优化表达水平以获得足够的表达。
本公开的非天然酵母可以以任何合适的形式提供。在一些方面,将非天然酵母脱水以形成干酵母组合物。干酵母组合物可以具有比湿组合物更高的保质期。
可以在含有淀粉和/或糖的植物材料(是指可衍生自任何植物和植物部分,诸如块茎、根、茎、叶和种子的含有淀粉和/或糖的植物材料)存在的情况下进行使用表达Sc MFα2SS或Sc PHO5 SS-葡糖淀粉酶基因的宿主细胞的发酵。包含淀粉和/或糖的植物材料可以获得自谷物,诸如大麦、小麦、玉米、黑麦、高粱、小米、大麦、马铃薯、木薯或稻米及其任何组合。可以加工包含淀粉和/或糖的植物材料,诸如通过方法诸如研磨、麦粒发芽或部分麦粒发芽来实现。在一些方面,淀粉材料来自玉米粉、碾磨的玉米胚乳、高粱粉、大豆粉、小麦粉、生物量衍生的淀粉、大麦粉及其组合。
在一些方面,发酵培养基包括处理的淀粉。例如,发酵培养基可以包括部分水解的淀粉。部分水解的淀粉可以包括高分子量糊精和高分子量麦芽糖糊精。在一些实践模式中,在发酵培养基中使用具有约5至约95或更优选约45至约65范围内的右旋糖当量(“DE”)的部分水解的淀粉产物。部分水解的淀粉及其制备是本领域众所周知的。可以通过在高温下用酸诸如盐酸或硫酸加热淀粉,然后用合适的碱诸如碳酸钠中和水解混合物来制备部分水解的淀粉。或者,可以通过酶促方法,诸如通过向淀粉制备物中添加α-淀粉酶来制备部分水解的淀粉。α淀粉酶可以引起含有三个或更多个(1→4)-α-连接的D-葡萄糖单元的多糖中(1→4)-α-D-糖苷键的内水解。可以使用具有期望范围内的量的淀粉和淀粉降解产物的部分水解的淀粉产物。
在本公开的方面,鉴于葡糖淀粉酶从工程改造的酵母产生和分泌至发酵培养基中,发酵方法可以省略向培养基中添加纯化或富集的商业葡糖淀粉酶,或至少允许在发酵方法中使用显著较少的商业葡糖淀粉酶。例如,本公开的工程改造的酵母可以允许消除商业葡糖淀粉酶的添加或至少减少约50%、60%、70%、80%、90%或95%。在不使用葡糖淀粉酶分泌工程改造的酵母的发酵方法中,通常将使用约7单位至约50单位/升范围内的量的葡糖淀粉酶。
发酵液体培养基包括水,优选包括营养物,诸如氮源(诸如蛋白)、维生素和盐。缓冲剂也可以存在于发酵培养基中。其它组分也可以在发酵期后存在于发酵液体培养基中,诸如随着发酵过程可积累的发酵产物和其它代谢产物。任选地,发酵液体培养基可以用碱诸如氢氧化钙或碳酸钙、氨或氢氧化铵、氢氧化钠或氢氧化钾缓冲,以保持生物体功能发挥良好的pH。
也可以在工程改造的酵母的比生长速率的方面来描述本发明的工程改造的酵母。以使用本领域已知的技术测量的单位/小时来测量比生长速率。
在使得可以发生发酵的条件下实施发酵。尽管条件可以根据具体生物体和期望的发酵产物而变化,但典型的条件包括约20℃或更高的温度,更通常在约30℃至约50℃的范围内。在发酵期间,可以混合或搅拌反应混合物。在一些实践模式中,混合或搅拌可以通过向发酵液体培养基喷射气体的机械作用来发生。或者可以在发酵期间使用直接机械搅拌,诸如通过叶轮或通过其它方式。
非天然酵母可以对于在比酵母(例如酿酒酵母)通常生长的温度更高的温度下的生长具有增加的耐受性。例如,酿酒酵母通常在30℃-33℃的温度范围内具有最佳生长。在一些方面,本公开的非天然酵母对于在34℃-40℃的温度下的生长表现出改善的耐受性。
例如,与没有遗传修饰的参考酵母相比,本公开的非天然酵母在34℃-40℃的范围内的温度下可以具有以下比生长速率,即比没有遗传修饰的参考酵母的生长速率大10%、20%、30%、40%或50%。
在一些情况下,在工业容量发酵罐中实施发酵,以实现商业规模的经济效益和控制。在一个方面,发酵在具有约10,000升或更高的容量的发酵罐中实施。
可以调节发酵培养基的pH以提供葡糖淀粉酶活性、细胞生长和发酵活性的最佳条件,以提供期望的产物,诸如乙醇。例如,可以将溶液的pH调节至3至5.5的范围。在一种实践模式中,发酵培养基的pH在4至4.5的范围内。
如上所示,本发酵方法使用表达Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶基因且能够将产生的酶分泌至发酵培养基中的遗传修饰的微生物。因此,这些酶直接暴露于液体培养条件且影响发酵培养基中的碳水化合物组成。在发酵培养基中,葡糖淀粉酶可以通过切割α-(1,4)和α-(1,6)糖苷键来引起从淀粉或相关寡糖和多糖分子的非还原性末端的D-葡萄糖的水解和释放。
也可以通过发酵培养基中存在的一种或多种其它淀粉酶(例如α-淀粉酶)来对淀粉起作用。例如,如果α-淀粉酶存在于发酵培养基中,则其可以通过水解内部α-(1,4)-键来引起前体淀粉的部分水解并引起淀粉分子的部分分解。
在一些实践模式中,发酵作为单一批次实施,直至完成。
在其它实践模式中,发酵作为补料分批发酵方法实施。在该实践模式中,将待发酵的淀粉材料的总量的第一部分添加至发酵培养基,其中葡糖淀粉酶对淀粉起作用以引起待用作发酵底物的葡萄糖的形成。以一份或多份添加额外淀粉材料以便在培养基中提供更多葡糖淀粉酶的底物。可以调节淀粉的添加,且可以监测葡萄糖的形成以提供有效的发酵。
优选地,发酵以连续的操作模式实施。在该模式中,多个发酵罐串联操作,其中在第一发酵罐中供应淀粉水解产物,将其供应至第二发酵罐等,直到淀粉水解产物转化成乙醇。连续操作可以使用2-7个发酵罐操作。
在一些实践模式中,使用可变速率添加系统将淀粉材料的总量的一部分添加至发酵液体培养基。此类系统的实例包括可操作连接至泵的可变速度泵或计量阀(诸如节流阀),所述泵或阀可用于随着时间改变引入发酵液体培养基的淀粉材料的量。在一些实践模式中,在添加淀粉材料的一部分期间,通过实时监测系统监测葡萄糖浓度。
实时监测系统包括直接监测葡萄糖浓度的系统和间接监测葡萄糖浓度的系统。通常直接监测葡萄糖浓度的实时监测系统的实例包括基于红外(IR)光谱的系统、近红外(NIR)光谱系统、傅立叶变换红外(FTIR)系统、基于折射率的系统、基于自动化酶的测量系统诸如由YSI Life Sciences系统销售的YSI 2950 Biochemistry Analyzer、基于高效液相色谱(HPLC)的系统、基于气相色谱(GC)的系统以及本领域技术人员已知的其它实时监测系统。此外,间接监测/测量发酵过程的葡萄糖浓度的实时监测系统可以通过如下开发:确定特定发酵过程中典型的碳分布并将发酵液体培养基中存在的葡萄糖浓度与发酵表现出的另一参数相关联,诸如例如,将发酵液体培养基中存在的葡萄糖水平与二氧化碳排放速度的测量值以及来自发酵容器的废气流中存在的二氧化碳的量相关联。可以通过使用质谱仪或用于测量废气流的组分的其它合适的仪器技术容易地测量二氧化碳。在优选的方面,通过使用红外光谱的实时监测系统监测葡萄糖浓度。在另一个方面,通过使用近红外光谱的实时监测系统监测葡萄糖浓度。实时监测系统干扰这样的设备,其控制淀粉材料引入发酵液体培养基,以便将发酵液体培养基中的葡萄糖的形成调节至期望的浓度。
在发酵过程期间,可以取发酵培养基的样品来测定培养基中葡糖淀粉酶活性的量。培养基中的葡糖淀粉酶活性的量可以被称为细胞外葡糖淀粉酶活性,因为其对应于从工程改造的酵母分泌的葡糖淀粉酶。在一些测量模式中,培养基中的葡糖淀粉酶活性的量可以通过葡糖淀粉酶活性的量/生物量/培养基体积来确定。
如本文所用,“生物量”是指工程改造的酵母的重量,其可以以干燥细胞重量的克数/升培养基(DCW/L)来测量。
GA活性的单位(U)可以定义为催化从淀粉释放1mg葡萄糖/分钟的酶量。通过在两步终点测定中将淀粉水解与HXK/G6PDH反应混合物(Sigma G3293)偶联,在浓缩的液体培养物中测量葡糖淀粉酶活性。液体培养物可以从使用非葡萄糖碳源(即棉子糖)生长的预定量的细胞中浓缩,以避免干扰测定。
比活性等于给定体积的液体培养物中的活性除以相同体积的液体培养物中细胞的湿重。比活性具有以下单位:GA活性的U/克生物量(U/g生物量)。可以通过在通过过滤或离心除去液体培养基后测定湿细胞重量来测量测定中使用的生物量的量。
通过将1.1g玉米淀粉(S4126,Sigma)溶解于50mL接近沸水中,然后添加1mL 3M乙酸钠(pH5.2)来制备淀粉溶液。将通常在1-20ul范围内的体积的浓缩液体培养基(Vb)(通过使用10Kb Kd截止柱,Millipore#UFC901008制备)添加至200ul的总体积中的淀粉浆(Vs)中,并使其在37℃下孵育通常在5-60分钟之间的特定时间段(T)。选择参数,使得葡萄糖形成在所需时间内是线性的。将20μL每种样品添加至2μL 0.6N NaOH并充分混合。然后添加200μL HXK/G6PDH混合物,并在30℃下孵育30分钟。使用分光光度计(SpectraMax TM M2)测量340nm处的吸光度。使用已知葡萄糖标准品的回归分析用于计算每种样品中释放的葡萄糖的量。可以通过获得浓缩前使用的样品的重量(以克计)来计算比酶活性/克生物量(U/g生物量)。活性单位=(mg葡萄糖/T)*((Vb+Vs)/(Vb))*(222/20)。比活度=活性单位/g生物量。
在一些方面,在发酵方法中,所述培养基具有2.25U或更大/克生物量的量的葡糖淀粉酶活性。在一些方面,所述培养基具有约2.3U或更大、约2.35U或更大、约2.4U或更大、约2.45U或更大、约2.5U或更大、约2.6U或更大、约2.7U或更大、约2.8U或更大、约2.9U或更大、约3U或更大、约3.5U或更大、约4U或更大、约4.5U或更大、约5U或更大、约5.5U或更大、约6U或更大、约6.5U或更大、约7U或更大、约7.5U或更大或约8U或更大/克生物量的量的葡糖淀粉酶活性。在一些方面,所述培养基具有约2.3U至约15U、约2.4U至约15U、约2.5U至约15U、约3U至约15U、约3.5U至约15U、约4U至约15U、约4.5U至约15U、约5U至约15U、约5.5U至约15U、约6U至约15U、约6.5U至约15U、约7U至约15U、约7.5U至约15U或约8U至约15U/克生物量的量的葡糖淀粉酶活性。
在其它方面,可以相对于参考酵母描述由本公开的非天然酵母提供的发酵培养基中的葡糖淀粉酶活性的量。例如,可以将表达具有异源信号序列(例如,与SEQ ID NO:10或SEQ ID NO:11具有90%或更高相同性)的外源葡糖淀粉酶的非天然酵母的葡糖淀粉酶活性的量与表达具有其天然信号序列的外源葡糖淀粉酶的在其它方面相同的酵母进行比较。
在一些方面,表达具有异源信号序列的外源葡糖淀粉酶的非天然酵母在发酵培养基中提供为参考酵母的至少1.125倍(高12.5%)的量的葡糖淀粉酶活性。在一些方面,非天然酵母中的葡糖淀粉酶活性的量是参考酵母中的至少1.15倍、至少1.175倍、至少1.225倍、至少1.25倍、至少1.3倍、至少1.35倍、至少1.4倍、至少1.45倍、至少1.5倍、至少1.75倍、至少2倍、至少2.25倍、至少2.5倍、至少2.75倍、至少3倍、至少3.25倍、至少3.5倍、至少3.75倍。在一些方面,由非天然酵母提供的葡糖淀粉酶活性的量是参考酵母的约1.15至约7.5倍、约1.175至约7.5倍、约1.225至约7.5倍、约1.25至约7.5倍、约1.3至约7.5倍、约1.35至约7.5倍、约1.4至约7.5倍、约1.45至约7.5倍、约1.5至约7.5倍、约1.75至约7.5倍、约2至约7.5倍、约2.25至约7.5倍、约2.5至约7.5倍、约2.75至约7.5倍、约3至约7.5倍、约3.25至约7.5倍、约3.5至约7.5倍、约3.75至约7.5倍或约4至约7.5倍。
发酵培养基中葡糖淀粉酶活性的测量可以在发酵期间的期望时间点进行。例如,可以在发酵过程的进程的第约1/10、约2/10、约3/10、约4/10、约5/10、约6/10、约7/10、约8/10、约9/10,或在发酵过程结束时,从发酵培养基取样品,并且可以测试样品的葡糖淀粉酶活性。
在一些实践模式中,发酵时段为约30小时或更长、约40小时或更长、约50小时或更长或约60小时或更长,诸如约40至约120小时或50至约110小时范围内的时间段。
发酵产物(本文中也称为“生物衍生产物”或“生物产物”)可以是可以通过葡糖淀粉酶酶促降解淀粉材料、葡萄糖形成和葡萄糖发酵来制备的任何产物。在一个实施方案中,所述发酵产物选自:氨基酸、有机酸、醇、二醇、多元醇、脂肪酸、脂肪酸烷基酯(诸如脂肪酸甲酯或乙酯(例如C6至C12脂肪酸甲酯(优选C8至C10脂肪酸甲酯)))、单酰基甘油酯、二酰基甘油酯、三酰基甘油酯及其混合物。优选的发酵产物是有机酸、氨基酸、脂肪酸烷基酯(诸如脂肪酸甲酯(例如C8至C12脂肪酸甲酯(优选C8至C10脂肪酸甲酯)))及其盐,以及特别是其中所述有机酸选自羟基羧酸(包括单羟基和二羟基单羧酸、二羧酸和三羧酸)、单羧酸、二羧酸和三羧酸及其混合物。通过本方法制备的发酵产物的实例是有机酸或氨基酸诸如乳酸、柠檬酸、丙二酸、羟基丁酸、己二酸、赖氨酸、酮-戊二酸、戊二酸、3-羟基-丙酸、琥珀酸、苹果酸、富马酸、衣康酸、粘康酸、甲基丙烯酸、乙酸、己酸甲酯、辛酸甲酯、壬酸甲酯、癸酸甲酯、十二烷酸甲酯、己酸乙酯、辛酸乙酯、壬酸乙酯、癸酸乙酯、十二烷酸乙酯及其混合物及其衍生物及其盐。在一个优选方面,本公开的发酵方法产生乙醇作为生物产物。
从发酵液体培养基回收发酵产物。完成其的方式将取决于具体产物。然而,在一些实践模式中,通常经由过滤步骤或离心步骤将生物体与液相分离,并且经由例如蒸馏、萃取、结晶、膜分离、渗透、反渗透或其它合适的技术回收产物。
本方法提供以优异的产率和纯度以生产规模水平制备发酵产物的能力。在一个方面,该方法以至少25,000加仑的发酵液体培养基量实施。在一个方面,实施分批工艺以产生至少25,000加仑的最终发酵液体培养基的批次。添加至少200,000加仑的连续工艺容器。
包含Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶的组合物可以任选地与不同于葡糖淀粉酶的以下酶中的任何一种或任何组合使用。示例性的其它酶包括α淀粉酶、β-淀粉酶、肽酶(蛋白酶(proteases)、蛋白酶(proteinases)、内肽酶、外肽酶)、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、内切葡聚糖酶和相关β-葡聚糖水解辅助酶、木聚糖酶和木聚糖酶辅助酶、乙酰乳酸脱羧酶、环糊精糖基转移酶、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶、颗粒淀粉水解酶和其它葡糖淀粉酶。
在一些方面,Sc MFα2 SS或Sc PHO5 SS-葡糖淀粉酶可用于淀粉转化过程,诸如用于生产右旋糖用于果糖糖浆、特殊糖以及醇和其它最终产物(例如有机酸、抗坏血酸和氨基酸)。使用本公开的葡糖淀粉酶从淀粉基质的发酵生产醇可以包括生产燃料醇或饮用醇。
与亲本或野生型葡糖淀粉酶相比,当在相同条件下使用Sc MFα2 SS或Sc PHO5SS-葡糖淀粉酶时,醇的产量可以更大。例如,使用本公开的葡糖淀粉酶的醇产量的增加可以是野生型菌株中的醇产量的1.1X或更大、1.2X或更大、1.3X或更大、1.4X或更大、1.5X或更大、1.6X或更大、1.7X或更大、1.7X或更大、1.8X或更大、1.9X或更大、2.0X或更大、2.1X或更大、2.2X或更大、2.3X或更大、2.4X或更大或2.5X或更大。
在一些方面,本发明提供了用于通过发酵产生乙醇的方法,其中乙醇以90g/L或更高的浓度存在于发酵培养基中。在所述方法中,发酵包含淀粉材料和非天然酵母的液体培养基,所述非天然酵母包含编码多肽的外源核酸,所述多肽包含葡糖淀粉酶部分和与葡糖淀粉酶异源的信号序列。发酵可以在液体培养基中提供约90g/L或更大、诸如约90g/L至约170g/L的范围内、约110g/L至约170g/L的范围内、约125g/L至约170g/L的范围内或约140g/L至约170g/L的范围内的乙醇浓度。
所述方法包括发酵包含淀粉材料和非天然酵母的液体培养基,所述非天然酵母包含编码多肽的外源核酸,所述多肽包含葡糖淀粉酶部分和与葡糖淀粉酶异源的信号序列,其中所述发酵在液体培养基中提供90g/L或更大的乙醇浓度。
本公开的非天然酵母的使用还可以提供关于增加的滴度、减少的挥发性有机酸(VOC)和减少的杂醇油化合物(挥发性有机酸、高级醇、醛、酮、脂肪酸和酯)的益处。
发酵产物可以首先用一种或多种试剂(处理系统)处理。然后将处理的发酵产物送至蒸馏系统。在蒸馏系统中,发酵产物可以蒸馏且脱水成乙醇。在一些方面,从发酵培养基中除去的组分包括水、可溶性组分、油和未发酵的固体。这些组分中的一些可以用于其它目的,诸如用于动物饲料产品。可以从釜馏物回收其它副产物,例如糖浆。
本公开还提供了用于生产食品、饲料或饮料产品,诸如酒精或非酒精饮料,诸如基于谷物或麦芽的饮料如啤酒或威士忌,诸如葡萄酒、苹果酒、醋、米酒、酱油或果汁的方法,所述方法包括用本文所述的组合物处理含有淀粉和/或糖的植物材料的步骤。在另一个方面,本发明还涉及试剂盒,其包含本公开的葡糖淀粉酶或如本文所考虑的组合物;以及使用所述葡糖淀粉酶或组合物的说明书。本发明还涉及通过使用葡糖淀粉酶的方法生产的发酵饮料。
发酵过程完全之后,可以使用发酵培养基中存在的材料。在一些方面,在发酵过程已经完成之后,或者在发酵过程正在进行的同时,可以从发酵培养基除去生物产物中的一些或全部,以提供包含非生物产物固体的精制组合物。非生物产物固体包括非天然酵母、培养基中未被酵母利用的原料以及发酵副产物。这些材料可以提供碳水化合物和蛋白的来源,其可用作补充剂以改善饲料组合物的营养含量。饲料材料可以是来自发酵过程的副产物,诸如釜馏物(完整釜馏物、稀釜馏物等)或由其制备的组合物,包括干燥蒸馏谷物(DDG)、具有可溶物的蒸馏干燥谷物(DDGS)、蒸馏湿谷物(DWG)和蒸馏可溶物(DS)。
可以进一步处理任选地除去部分或全部靶标生物产物的发酵培养基,诸如以除去水,或引起非生物产物固体的沉淀或其与培养基的分离。在一些情况下,培养基通过冷冻干燥或烘箱干燥处理。处理之后,精制组合物可以是例如液体浓缩物、半湿滤饼或干燥固体的形式。精制组合物可以用作饲料组合物本身,或者饲料组合物的制备物中的成分。在优选的制备物中,饲料组合物是家畜饲料组合物,诸如绵羊、牛、猪等饲料组合物。
发酵培养基中的固体可以提供一种或多种氨基酸的来源。引入动物饲料中,发酵副产物可以提供关于一种或多种必需氨基酸的提高的氨基酸含量。必需氨基酸可以包括组氨酸、异亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、苏氨酸和色氨酸。这些氨基酸可以作为游离氨基酸存在于饲料组合物中,或可以衍生自富含氨基酸的蛋白或肽。发酵培养基中的固体可以提供一种益生元的来源,其是不易消化的食物,诸如不易消化的寡糖,其选择性刺激肠中有利的细菌菌种的生长,从而有益于宿主。发酵培养基中的固体可以提供植酸酶、β-葡聚糖酶、蛋白酶和木聚糖酶的来源。
饲料组合物可用于水产养殖(水生生物体诸如鱼、贝类或植物的养殖)中。水产养殖包括海洋和淡水物种的养殖,可以范围为陆基至公海生产。
除了从发酵培养基获得的材料之外,饲料组合物可以包括一种或多种饲料添加剂。可以使用饲料添加剂,例如以帮助提供平衡的饮食(例如维生素和/或痕量矿物质),保护动物免受疾病和/或应激(例如抗生素、益生菌)和/或刺激或控制生长和行为(例如激素)。添加剂产品成分可以包括例如:生长促进剂、药用物质、缓冲剂、抗氧化剂、酶、防腐剂、沉淀结合剂、直接饲用的微生物等。添加剂产品成分还可以包括例如离子载体(例如莫能菌素、拉沙里菌素、莱特洛霉素等)、β-激动剂(齐帕特罗、莱克多巴胺等)、抗生素(例如金霉素(CTC)、氧四环素、杆菌肽(bacitrain)、泰乐菌素、金霉素)、益生菌和酵母培养物、抗球虫药(例如amprollium、地考喹酯、拉沙里菌素、莫能菌素)和激素(例如生长激素或抑制发情和/或排卵的激素,例如乙酸美仑孕酮)、信息素、营养药物、药物、类黄酮、营养和非营养补充剂、解毒剂等。一些市售添加剂以商品名 销售。
实施例1
淀粉分解酿酒酵母菌株的生成
菌株1-3:ura3Δ酿酒酵母基础菌株
菌株1用SEQ ID NO 1(pAV18)转化。SEQ ID NO 1含有以下元件:i)对应于核苷酸479-2647的来自酿酒酵母(ARO4-OFP)的3-脱氧-D-阿拉伯糖基-庚酮糖酸酯-7-磷酸酯(DAHP)合酶基因的突变体版本的表达盒;ii)对应于核苷酸445-478和2648-2681的loxP序列,和iii)用于靶向染色体整合入整合基因座A(URA3)的侧接DNA,其中核苷酸1-436对应于URA3 5’侧接区域,且核苷酸2691-3182对应于URA3 3’侧接区域。在含有3.5g/L对氟苯丙氨酸和1g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得转化体划线,用于在ScD-PFP上进行单菌落分离。选择单菌落。在单菌落中通过PCR验证SEQ ID NO:1正确整合至基因座A的一个等位基因中。将PCR验证的分离株命名为菌株1-1。
菌株1-1用SEQ ID NO 2(pCM520a)转化。SEQ ID NO 2含有以下元件:i)对应于核苷酸638-2284的来自构巢曲霉的乙酰胺酶(amdS)基因的密码子优化的表达盒,其中TEF1启动子对应于核苷酸2285-2740,且TEF1终止子对应于核苷酸478-637;ii)对应于核苷酸444-477和2741-2774的loxP序列,和iii)用于靶向染色体整合入整合基因座A(URA3)的侧接DNA,其中核苷酸1-435对应于URA3 5’侧接区域,且核苷酸2783-3275对应于URA3 3’侧接区域。在含有80mg/L尿嘧啶和1g/L乙酰胺作为唯一氮源的酵母氮碱(不含硫酸铵或氨基酸)上选择转化体。将所得转化体划线,用于在含有80mg/L尿嘧啶和1g/L乙酰胺作为唯一氮源的酵母氮碱(不含硫酸铵或氨基酸)上分离单菌落。选择单菌落。在单菌落中通过PCR验证SEQID NO 2正确整合至基因座A的第二等位基因中。将PCR验证的分离株命名为菌株1-2。
菌株1-2与SEQ ID NO 3和SEQ ID NO 4共转化。SEQ ID NO 3含有以下元件:i)对应于核苷酸53-1084的来自P1噬菌体的cre重组酶的开放阅读框,和ii)与SEQ ID NO 4同源的对应于核苷酸1-47和1086-1132的侧接DNA。SEQ ID NO 4含有以下元件:i)对应于核苷酸2195-3350的2μ复制起点;ii)对应于核苷酸3785-4901的来自酿酒酵母的URA3选择标记物;和iii)含有对应于核苷酸5791-6376的PGK启动子和来自酿酒酵母的对应于核苷酸10-199的CYC1终止子的侧接DNA。对于SEQ ID NO 4的剩余部分,pUC复制起点对应于核苷酸386-1053;且氨苄青霉素抗性基因对应于核苷酸1204-2061。在缺乏尿嘧啶的合成退出培养基(ScD-Ura)上选择转化体。ScD-Ura琼脂平板含有:20g/L琼脂、6.7g/L酵母氮碱、2g缺乏尿嘧啶的合成完全退出混合物和20g/L右旋糖。将所得转化体划线,用于在ScD-Ura上进行单菌落分离。选择单菌落。筛选分离的菌落,用于在含有80mg/L尿嘧啶和1g/L乙酰胺作为唯一氮源的ScD-PFP和酵母氮碱(不含硫酸铵或氨基酸)上生长。通过PCR验证ARO4-OFP和amdS基因的损失。将PCR验证的分离株划线至含有5-FOA的YNB以选择2μ质粒的损失。将PCR验证的分离株命名为菌株1-3。
菌株1-4:表达扣囊复膜酵母葡糖淀粉酶的酿酒酵母
菌株1-3用SEQ ID NO 5转化。SEQ ID NO 5含有以下元件:1)对应于核苷酸2769-4316的来自扣囊复膜酵母的葡糖淀粉酶基因的表达盒,其包括对应于核苷酸2022-2768的ADH1启动子和对应于核苷酸4318-4540的CYC1终止子,2)对应于核苷酸6798-7316的允许稳定复制的着丝粒,和3)对应于核苷酸195-1292的乳清苷-5'-磷酸脱羧酶(URA3)的表达盒。在ScD-Ura上选择转化体。将所得转化体划线,用于在ScD-Ura上进行单菌落分离。选择单菌落。通过PCR验证质粒的存在。将PCR验证的分离株命名为菌株1-4a、b、c。
菌株1-5:表达含有来自α交配因子1(MFα1)的N-端分泌前导的修饰的扣囊复膜酵母葡糖淀粉酶的酿酒酵母
菌株1-3用SEQ ID NO 6转化。SEQ ID NO 6含有以下元件:1)对应于核苷酸2769-4319的含有来自α交配因子1(MFα1)的N-端分泌前导的来自扣囊复膜酵母的修饰的葡糖淀粉酶基因的表达盒,其包括对应于核苷酸2023-2768的ADH1启动子和对应于核苷酸4320-4543的CYC1终止子,2)对应于核苷酸6801-7319的允许稳定复制的着丝粒(CEN6),和3)对应于核苷酸195-1292的乳清苷-5'-磷酸脱羧酶(URA3)的表达盒。SEQ ID NO 6还包括对应于核苷酸5809-6669的氨苄青霉素抗性基因。在ScD-Ura上选择转化体。将所得转化体划线,用于在ScD-Ura上进行单菌落分离。选择单菌落。通过PCR验证质粒的存在。将PCR验证的分离株命名为菌株1-5a、b、c。
菌株1-6:表达含有来自α交配因子2(MFα2)的N-端分泌前导的修饰的扣囊复膜酵母葡糖淀粉酶的酿酒酵母
菌株1-3用SEQ ID NO 7转化。SEQ ID NO 7含有以下元件:1)对应于核苷酸2769-4319的含有来自α交配因子2(MFα2)的N-端分泌前导的来自扣囊复膜酵母的修饰的葡糖淀粉酶基因的表达盒,其包括对应于核苷酸2022-2768的ADH1启动子和对应于核苷酸4320-4543的CYC1终止子,2)对应于核苷酸6801-7319的允许稳定复制的着丝粒(CEN6),和3)对应于核苷酸195-1229的乳清苷-5'-磷酸脱羧酶(URA3)的表达盒。SEQ ID NO 7还包括对应于核苷酸5809-6669的氨苄青霉素抗性基因。在ScD-Ura上选择转化体。将所得转化体划线,用于在ScD-Ura上进行单菌落分离。选择单菌落。通过PCR验证质粒的存在。将PCR验证的分离株命名为菌株1-6a、b、c。
菌株1-7:表达含有来自酸性磷酸酶(PHO5)的N-端分泌前导的修饰的扣囊复膜酵母葡糖淀粉酶的酿酒酵母
菌株1-3用SEQ ID NO 8转化。SEQ ID NO 8含有以下元件:1)对应于核苷酸2769-4313的含有来自酿酒酵母酸性磷酸酶(PHO5)的N-端分泌前导的来自扣囊复膜酵母的修饰的葡糖淀粉酶基因的表达盒,其包括对应于核苷酸2023-2768的ADH1启动子和对应于核苷酸4314-4537的CYC1终止子,2)对应于核苷酸6795-7313的允许稳定复制的着丝粒(CEN6),和3)对应于核苷酸195-1292的乳清苷-5'-磷酸脱羧酶(URA3)的表达盒。SEQ ID NO 8还包括对应于核苷酸5803-6663的氨苄青霉素抗性基因。在ScD-Ura上选择转化体。将所得转化体划线,用于在ScD-Ura上进行单菌落分离。选择单菌落。通过PCR验证质粒的存在。将PCR验证的分离株命名为菌株1-7a、b、c。
菌株1-8:酿酒酵母质粒对照
菌株1-3用SEQ ID NO 9转化。SEQ ID NO 9含有与SEQ ID NO 5-8相同的元件,除了其缺乏葡糖淀粉酶的表达盒。在ScD-Ura上选择转化体。将所得转化体划线,用于在ScD-Ura上进行单菌落分离。选择单菌落。通过PCR验证质粒的存在。将PCR验证的分离株命名为菌株1-8a、b、c。
菌株1-9:表达含有来自交配因子1(MFa1)的N-端分泌前导的修饰的扣囊复膜酵母葡糖淀粉酶的酿酒酵母
菌株1-3用SEQ ID NO 15转化。SEQ ID NO 15含有以下元件:1)对应于核苷酸2769-4337的含有来自交配因子1(MFα1)的N-端分泌前导的来自扣囊复膜酵母的修饰的葡糖淀粉酶基因的表达盒,其包括对应于核苷酸2023-2768的ADH1启动子和对应于核苷酸4338-4561的CYC1终止子,2)对应于核苷酸6819-7337的允许稳定复制的着丝粒(CEN6),和3)对应于核苷酸195-1292的乳清苷-5'-磷酸脱羧酶(URA3)的表达盒。SEQ ID NO 15还包括对应于核苷酸5827-6687的氨苄青霉素抗性基因。将所得转化体划线,用于在ScD-Ura上进行单菌落分离。选择单菌落。通过PCR验证质粒的存在。将PCR验证的分离株命名为菌株1-9a、b、c。
表3工程改造的酵母的描述
菌株 描述 亲本
菌株1 酿酒酵母(Lasaffre,乙醇红) N/A
菌株1-1 ura3Δ/URA3,ARO4-OFP+ 菌株1
菌株1-2 ura3Δ,ARO4-OFP+,amdS+ 菌株1-1
菌株1-3 ura3Δ 菌株1-2
菌株1-4a、b、c 扣囊复膜酵母GLA1+ 菌株1-3
菌株1-5a、b、c 扣囊复膜酵母GLA1+(w/MFα1前导) 菌株1-3
菌株1-6a、b、c 扣囊复膜酵母GLA1+(w/MFα2前导) 菌株1-3
菌株1-7a、b、c 扣囊复膜酵母GLA1+(w/PHO5前导) 菌株1-3
菌株1-8a、b、c 载体对照 菌株1-3
菌株1-9a、b、c 扣囊复膜酵母GLA+(w/MFa1前导) 菌株1-3
实施例2
在同时糖化和发酵摇瓶测定中评估淀粉分解酿酒酵母菌株
使用部分水解的玉米淀粉(AV_2014-08-20,改变Sf GA的分泌信号)评估摇瓶。
将表3中列出的菌株子集在ScD-Ura平板上划线,并且在30℃下孵育,直到单菌落可见(1-2天)。将来自ScD-Ura平板的细胞刮至无菌摇瓶培养基中,并测量光密度(OD600)。使用Genesys20型分光光度计(Thermo Scientific),用1cm路径长度在600nm的波长处测量光密度。
用细胞浆料接种摇瓶以达到0.1-0.3的初始OD600。在接种之前,将50mL摇瓶培养基立即添加至配合有含有透气密封物的螺旋盖(corning 1395-45LTMC)的250mL无挡板摇瓶(Corning 4995-250)。摇瓶培养基由850g部分水解的玉米淀粉(%DS 30-37,DE 5-15)、150g过滤的淡浸泡水(light steep water)、25g葡萄糖和1g尿素(Sigma U6504)组成。
将接种的烧瓶在30℃下在100rpm的振荡下在定轨振荡器中孵育72小时。取样并在发酵期间通过具有折射率检测器的高效液相色谱仪分析液体培养基中的乙醇浓度。
表4中显示的摇瓶的结果表明,相对于表达天然的扣囊复膜酵母葡糖淀粉酶的菌株,表达扣囊复膜酵母葡糖淀粉酶上的MFα2或PHO5前导序列的菌株中的乙醇滴度的改善。
表4.表达具有和不具有改变的前导序列的扣囊复膜酵母葡糖淀粉酶的菌株的乙醇滴度。
菌株 描述 在72小时的乙醇滴度(g/L)
菌株1-4a、b、c 扣囊复膜酵母GLA1+ 83.6、89.2、81.6
菌株1-5a 扣囊复膜酵母GLA1+(w/MFα1前导) 25.6、25.5、25.1
菌株1-6a、b、c 扣囊复膜酵母GLA1+(w/MFα2前导) 156.3、158.7、158.5
菌株1-7a、b、c 扣囊复膜酵母GLA1+(w/PHO5前导) 156.7、156.8、157.1
菌株1-8a、b、c 载体对照 25.6、25.8、25.6
菌株1-9a、b、c 扣囊复膜酵母GLA1+(w/MFa1前导) 26.4、26.5、26.3
实施例3
淀粉分解酿酒酵母菌株的酶产生
使用棉子糖生长细胞的摇瓶评估来评估酶产生。
将表3中列出的菌株子集在ScD-Ura平板上划线,并且在30℃下孵育,直到单菌落可见(1-2天)。将来自ScD-Ura平板的细胞刮至无菌摇瓶培养基中,并测量光密度(OD600)。使用Genesys20型分光光度计(Thermo Scientific),用1cm路径长度在600nm的波长处测量光密度。
用细胞浆料接种摇瓶以达到0.1-0.3的初始OD600。临接种之前,将100mL摇瓶培养基添加至500mL带挡板的摇瓶中。摇瓶培养基由5%棉子糖(Sigma R0250)、6.7g酵母氮碱(Difco 291940)和1.9g合成完全氨基酸退出混合物(MP Biomedicals 4410-622)组成。
将接种的烧瓶在30℃下在250rpm的振荡下在定轨振荡器中孵育24小时。取样并分析OD600和细胞干重。通过离心除去细胞,并使用10K MWCO柱(Millipore UFC901024)将90ml液体培养基浓缩至1.0ml,并在分析前冷冻。
通过在两步终点测定(Sigma G3293)中将淀粉水解与HXK/G6PDH反应偶联,在浓缩的液体培养基中测量葡糖淀粉酶活性。GA活性的单位(U)可以定义为催化从淀粉释放1mg葡萄糖/分钟的酶量。通过在两步终点测定中将淀粉水解与HXK/G6PDH反应混合物(SigmaG3293)偶联,在浓缩的液体培养基中测量葡糖淀粉酶活性。液体培养基可以从使用非葡萄糖碳源(即棉子糖)生长的预定量的细胞中浓缩,以避免干扰测定。
比活性等于给定体积的液体培养基中的活性除以相同体积的液体培养基中细胞的湿重。比活性具有以下单位:每克生物量的GA活性的U(U/g生物量)。可以通过在通过过滤或离心除去液体培养基后测定湿细胞重量来测量测定中使用的生物量的量。
通过将1.1g玉米淀粉(S4126,Sigma)溶解于50mL接近沸水中、然后添加1mL 3M乙酸钠(pH5.2)来制备淀粉溶液。将通常在1-20ul范围内的体积的浓缩液体培养基(Vb)(通过使用10Kb Kd截止柱,Millipore#UFC901008制备)添加至200ul的总体积中的淀粉浆(Vs)中,并使其在37℃下孵育通常在5-60分钟之间的特定时间段(T)。选择参数,使得葡萄糖形成在所需时间内是线性的。将20μL每种样品添加至2μL 0.6N NaOH并充分混合。然后添加200μL HXK/G6PDH混合物,并在30℃下孵育30分钟。使用分光光度计(SpectraMax TM M2)测量340nm处的吸光度。使用已知葡萄糖标准品的回归分析用于计算每种样品中释放的葡萄糖的量。可以通过获得浓缩前使用的样品的重量(以克计)来计算每克生物量的比酶活性(U/g生物量)。活性单位=(mg葡萄糖/T)*((Vb+Vs)/(Vb))*(222/20)。比活度=活性单位/g生物量。
使用Advanced Protein Assay Reagent(Cytoskeleton ADV01)测定蛋白浓度。使用来自菌株1-4a、1-4b、1-6a、1-6b、1-7a、1-7b、1-8a和1-8b的16μl浓缩的液体培养基以及4μl上样缓冲液运行标准变性SDS-PAGE蛋白凝胶。
表5和图1中显示的摇瓶的结果表明MFα2和PHO5前导序列对扣囊复膜酵母葡糖淀粉酶分泌和活性的有益效果。
表5.表达具有和不具有改变的前导序列的扣囊复膜酵母葡糖淀粉酶的菌株的酶产生。
序列表
<110> 嘉吉公司
C·K·米勒
A·瓦什
J·维尔多豪斯
A·内格雷特-雷蒙德
<120> 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株
<130> CAR0178/P1
<160> 15
<170> PatentIn version 3.5
<210> 1
<211> 3182
<212> DNA
<213> 人工序列
<220>
<223> pAV18转化片段
<400> 1
cctactgcgc caattgatga caatacagac gatgataaca aaccgaagtt atctgatgta 60
gaaaaggatt aaagatgcta agagatagtg atgatatttc ataaataatg taattctata 120
tatgttaatt accttttttg cgaggcatat ttatggtgaa ggataagttt tgaccatcaa 180
agaaggttaa tgtggctgtg gtttcagggt ccataaagct tttcaattca tctttttttt 240
ttttgttctt ttttttgatt ccggtttctt tgaaattttt ttgattcggt aatctccgag 300
cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtggt 360
gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc 420
aggaaacgaa gataaagcgg ccgcataact tcgtataatg tatgctatac gaagttatct 480
gccagtatac agctagcctt gaaagtgatg gaaaacattg tcatcggcac ataaataaaa 540
aaattatgaa tcacgtgatc aacagcaaat tatgtactcg tatatatgca agcgcattcc 600
ttatattgac actctttcat tgggcatgag gctgtgtaaa cataagctgt aacggtctca 660
cggaacactg tgtagttgca ttactgtcag gcagttatgt tgcttaatat aaaggcaaag 720
gcatggcaga atcactttaa aacgtggccc cacccgctgc accctgtgca ttttgtacgt 780
tactgcgaaa tgactcaacg atgaaatgaa aaaattttgc ttgaaatttt gaaaaaaaga 840
tgtgcgggac gcattgttag ctcattgaat acatcgtgat cgaatccaat caatgtttaa 900
tttcatatta atacagaaac tttttctcat actttcttct tcttttcatt ggtatattat 960
ctatatatcg tgttaattcc tctttcgtca tttttagcat cgttataaga gtaattaaga 1020
ataactagaa gagtctctct ttatattcgt ttattttata tatttaaccg ctaaatttag 1080
taaacaaaag aatctatcag aaatgagtga atctccaatg ttcgctgcca acggcatgcc 1140
aaaggtaaat caaggtgctg aagaagatgt cagaatttta ggttacgacc cattagcttc 1200
tccagctctc cttcaagtgc aaatcccagc cacaccaact tctttggaaa ctgccaagag 1260
aggtagaaga gaagctatag atattattac cggtaaagac gacagagttc ttgtcattgt 1320
cggtccttgt tccatccatg atctagaagc cgctcaagaa tacgctttga gattaaagaa 1380
attgtcagat gaattaaaag gtgatttatc catcattatg agagcatact tggagaagcc 1440
aagaacaacc gtcggctgga aaggtctaat taatgaccct gatgttaaca acactttcaa 1500
catcaacaag ggtttgcaat ccgctagaca attgtttgtc aacttgacaa atatcggttt 1560
gccaattggt tctgaaatgc ttgataccat ttctcctaaa tacttggctg atttggtctc 1620
cttcggtgcc attggtgcca gaaccaccga atctcaactg cacagagaat tggcctccgg 1680
tttgtctttc ccagttggtt tcaagaacgg taccgatggt accttaaatg ttgctgtgga 1740
tgcttgtcaa gccgctgctc attctcacca tttcatgggt gttactaagc atggtgttgc 1800
tgctatcacc actactaagg gtaacgaaca ctgcttcgtt attctaagag gtggtaaaaa 1860
gggtaccaac tacgacgcta agtccgttgc agaagctaag gctcaattgc ctgccggttc 1920
caacggtcta atgattgact actctcacgg taactccaat aaggatttca gaaaccaacc 1980
aaaggtcaat gacgttgttt gtgagcaaat cgctaacggt gaaaacgcca ttaccggtgt 2040
catgattgaa tcaaacatca acgaaggtaa ccaaggcatc ccagccgaag gtaaagccgg 2100
cttgaaatat ggtgtttcca tcactgatgc ttgtataggt tgggaaacta ctgaagacgt 2160
cttgaggaaa ttggctgctg ctgtcagaca aagaagagaa gttaacaaga aatagatgtt 2220
tttttaatga tatatgtaac gtacattctt tcctctacca ctgccaattc ggtattattt 2280
aattgtgttt agcgctattt actaattaac tagaaactca atttttaaag gcaaagctcg 2340
ctgacctttc actgatttcg tggatgttat actatcagtt actcttctgc aaaaaaaaat 2400
tgagtcatat cgtagctttg ggattatttt tctctctctc cacggctaat taggtgatca 2460
tgaaaaaatg aaaaattcat gagaaaagag tcagacatcg aaacatacat aagttgatat 2520
tcctttgata tcgacgacta ctcaatcagg ttttaaaaga aaagaggcag ctattgaagt 2580
agcagtatcc agtttaggtt ttttaattat ttacaagtaa agaaaaagag aatgccggtc 2640
gttcacgata acttcgtata atgtatgcta tacgaagtta tgcggccgcg agaagatgcg 2700
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 2760
gagcttcaat ttaattatat cagttattac ccgggaatct cggtcgtaat gatttctata 2820
atgacgaaaa aaaaaaaatt ggaaagaaaa agcttcatgg cctttataaa aaggaactat 2880
ccaatacctc gccagaacca agtaacagta ttttacgggg cacaaatcaa gaacaataag 2940
acaggactgt aaagatggac gcattgaact ccaaagaaca acaagagttc caaaaagtag 3000
tggaacaaaa gcaaatgaag gatttcatgc gtttgtactc taatctggta gaaagatgtt 3060
tcacagactg tgtcaatgac ttcacaacat caaagctaac caataaggaa caaacatgca 3120
tcatgaagtg ctcagaaaag ttcttgaagc atagcgaacg tgtagggcag cgtttccaag 3180
ag 3182
<210> 2
<211> 3310
<212> DNA
<213> 人工序列
<220>
<223> pCM520转化片段
<400> 2
cctactgcgc caattgatga caatacagac gatgataaca aaccgaagtt atctgatgta 60
gaaaaggatt aaagatgcta agagatagtg atgatatttc ataaataatg taattctata 120
tatgttaatt accttttttg cgaggcatat ttatggtgaa gaataagttt tgaccatcaa 180
agaaggttaa tgtggctgtg gtttcagggt ccataaagct tttcaattca tcattttttt 240
tttattcttt tttttgattc cggtttcctt gaaatttttt tgattcggta atctccgaac 300
agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc atatgtagtg 360
ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca aaaatctgca 420
ggaaacgaag ataaagcggc cgcataactt cgtatagcat acattatacg aagttatcgc 480
ctgttaagat ataactgaaa aaagagggga atttttagat actgaaatga tattttagaa 540
taaccagact atatataagg ataaattaca aaaaattaac taatagataa gatttaaata 600
taaaagatat gcaactagaa aagtcttatc aatctcctta tggagtgacg acgttaccca 660
acaatttacc gacttcttcg gcgatagcca aagttctctc ttcggacaat cttctaccaa 720
taacttgaac agcaacagga gcaccgtgat aagcctctgg gtcgtattct tcttgaacca 780
aagcatccaa ttcggaaaca gctttaaaag attcgttctt cttatcaata ttcttatcag 840
cgaaagtgac tgggacgaca acagaggtga aatccaataa gttaataacg gaggcgtaac 900
cgtagtatct gaattgatcg tgtctgacag cggcggtagg agtaattgga gcgataatag 960
cgtccaattc cttaccagct ttttcttcag cttcacgcca cttttccaag tattccattt 1020
gatagttcca cttttgtaaa tgagtgtccc acaattcgtt catgttaaca gccttaatat 1080
ttgggttcaa caagtcctta atgttaggga tggctggctc accagaggca gaaatgtctc 1140
tcatgacgtc ggcagaacca tcagcagcat agatgtggga aatcaagtca tgaccgaaat 1200
catgcttgta tggagtccat ggagtaacgg tgtgaccagc cttggccaaa gcggcaacgg 1260
tagtttcgac accacgtaaa attggtgggt gtggcaagac gttaccgtcg aaattgtaat 1320
aaccaatgtt caaaccacca ttcttaatct tagaggcaat gatgtcagat tcagattgtc 1380
tccatggcat tgggatgacc ttagagtcgt acttccaagg ttcttgaccc aagacagatt 1440
tggtgaacaa tctcaagtct tcgacggagt gagtgatagg accaacgacg gagtgaacgg 1500
tttcttgacc ttccatagag ttagccattt tagcatatgg caatctaccg tgagatggtc 1560
tcaaaccgta taaaaagttg aaagcagctg ggactctaat ggaaccacca atgtcagtac 1620
cgacaccaat aacaccacct ctaataccaa caatagcacc ttcaccacca gaagaaccac 1680
cacaggacca atttttgttt cttggattga cagttctacc aatgatgttg ttgacggttt 1740
cacagaccat caaggtttgt gggacagagg tcttaacgta gaaaacagca ccagcttttc 1800
tcaacatggt ggttaagacg gaatcacctt catcgtattt gtttaaccag gaaatgtaac 1860
ccatggaggt ttcgtaaccc ttaacacgca attggtcctt taaagagatt ggtaaaccgt 1920
gtaatggacc aactggtctc ttatgcttag cgtagtattc atctaattct ctagcttgag 1980
ctaaagcagc atctgggaag aattcgtgag cacagttggt taattgttga gcaatagcag 2040
ctctcttaca aaaagccaaa gtgacttcaa cagaagtcaa ctcaccagcg gccaacttgg 2100
agaccaaatc agcagcagag gcttcggtaa tcttcaattc agcctcagac aaaataccgg 2160
acttctttgg gaaatcaata acggaatctt cggcaggcaa agtttgaacc ttccattcgt 2220
caggaatggt tttagccaaa cgggcacgtt tgtcggcggc caattcttcc caggattgtg 2280
gcattttgta attaaaactt agattagatt gctatgcttt ctttctaatg agcaagaagt 2340
aaaaaaagtt gtaatagaac aagaaaaacg aaactgaaac ttgagaaatt gaagaccatt 2400
tattaactta aatatcaatg ggaggtcatc gaaagagaaa aaaatcaaaa aaaaaatttt 2460
tcaagaaaaa gaaacgtgat aaaaattttt attgcctttt tcgacgaaga aaaagaaacg 2520
aggcggtctc ttttttcttt tccaaacctt tagtacgggt aattaacgcc accctagagg 2580
aagaaagagg ggaaatttag tatgctgtgc ttgggtgttt tgaagtggta cggcgatgcg 2640
cggagtccga gaaaatctgg aagagtaaaa aaggagtaga aacattttga agctatggtg 2700
tgtgggggat cacttgtggg ggattgggtg tgatgtaagg ataacttcgt atagcataca 2760
ttatacgaag ttatgcggcc gcgagaagat gcggccagca aaactaaaaa actgtattat 2820
aagtaaatgc atgtatacta aactcacaaa ttagagcttc aatttaatta tatcagttat 2880
tacccgggaa tctcggtcgt aatgattttt ataatgacga aaaaaaaaaa attggaaaga 2940
aaaagcttca tggcctttat aaaaaggaac catccaatac ctcgccagaa ccaagtaaca 3000
gtattttacg gggcacaaat caagaacaat aagacaggac tgtaaagatg gacgcattga 3060
actccaaaga acaacaagag ttccaaaaag tagtggaaca aaagcaaatg aaggatttca 3120
tgcgtttgta ctctaatctg gtagaaagat gttttacaga ctgtgtcaat gacttcacaa 3180
catcaaagct aaccaataag gaacaaacat gcatcatgaa gtgctcagaa aagttcttga 3240
agcatagcga acgtgtaggg cagcgtttcc aagagagcat agcgaacgtg tagggcagcg 3300
tttccaagag 3310
<210> 3
<211> 1132
<212> DNA
<213> 人工序列
<220>
<223> cre PCR片段
<400> 3
ctctttttta cagatcatca aggaagtaat tatctacttt ttacaagaat tcatgtctaa 60
tttacttact gttcaccaaa acttgcctgc attaccagtt gacgcaacct ccgatgaagt 120
cagaaagaac cttatggata tgtttagaga tagacaagct ttctccgaac atacttggaa 180
aatgttatta tccgtttgta gatcctgggc cgcttggtgt aaacttaaca atagaaaatg 240
gtttcctgct gaaccagaag acgtcagaga ttacttactt tacttacaag ctagaggttt 300
ggctgttaaa actatccaac aacacttagg tcaattgaat atgttacaca gaagatccgg 360
tttaccaaga ccatccgatt ccaacgcagt ttcccttgtt atgagaagaa ttagaaaaga 420
aaatgttgac gctggtgaaa gagctaaaca agcattagca tttgaaagaa ccgatttcga 480
tcaagttaga tccttaatgg aaaattccga tagatgtcaa gatattagaa acttagcttt 540
cttaggtatt gcttacaaca cattattaag aatcgctgaa attgctagaa ttagagttaa 600
agatatttca agaaccgatg gcggtagaat gttaatccac attggcagaa caaaaacctt 660
agtctccaca gcaggcgtcg aaaaagcatt atcattaggt gttactaaat tagttgaacg 720
ttggatttcc gtttccggtg ttgcagatga cccaaacaac tacttattct gtcgtgttag 780
aaaaaatggt gttgccgctc cttccgctac ctcacaatta tccacaagag cattagaagg 840
catttttgaa gctacccaca gacttattta tggtgcaaaa gacgattccg gtcaaagata 900
tttagcttgg tctggtcatt ccgctagagt tggtgccgca agagacatgg caagagctgg 960
tgtttctatt cctgaaatta tgcaagccgg tggttggact aatgttaaca ttgttatgaa 1020
ctatatcaga aacttagatt ccgaaacagg tgctatggtt agattacttg aagacggtga 1080
ttaagctagc taagatccgc tctaaccgaa aaggaaggag ttagacaacc tg 1132
<210> 4
<211> 6376
<212> DNA
<213> 人工序列
<220>
<223> pGP52片段
<400> 4
ctagctaaga tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc 60
tatttatttt tttatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct 120
tttttttctg tacagacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa 180
ggttttggga cgctcgaaga tccagctgca ttaatgaatc ggccaacgcg cggggagagg 240
cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 300
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 360
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 420
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 480
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 540
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 600
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 660
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 720
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 780
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 840
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 900
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 960
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1020
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 1080
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 1140
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 1200
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 1260
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 1320
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 1380
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 1440
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 1500
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 1560
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 1620
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 1680
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 1740
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 1800
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 1860
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 1920
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 1980
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 2040
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 2100
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 2160
tccgcgcaca tttccccgaa aagtgccacc tgaacgaagc atctgtgctt cattttgtag 2220
aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa gaatctgagc tgcattttta 2280
cagaacagaa atgcaacgcg aaagcgctat tttaccaacg aagaatctgt gcttcatttt 2340
tgtaaaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc tgagctgcat 2400
ttttacagaa cagaaatgca acgcgagagc gctattttac caacaaagaa tctatacttc 2460
ttttttgttc tacaaaaatg catcccgaga gcgctatttt tctaacaaag catcttagat 2520
tacttttttt ctcctttgtg cgctctataa tgcagtctct tgataacttt ttgcactgta 2580
ggtccgttaa ggttagaaga aggctacttt ggtgtctatt ttctcttcca taaaaaaagc 2640
ctgactccac ttcccgcgtt tactgattac tagcgaagct gcgggtgcat tttttcaaga 2700
taaaggcatc cccgattata ttctataccg atgtggattg cgcatacttt gtgaacagaa 2760
agtgatagcg ttgatgattc ttcattggtc agaaaattat gaacggtttc ttctattttg 2820
tctctatata ctacgtatag gaaatgttta cattttcgta ttgttttcga ttcactctat 2880
gaatagttct tactacaatt tttttgtcta aagagtaata ctagagataa acataaaaaa 2940
tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag gtggatgggt aggttatata 3000
gggatatagc acagagatat atagcaaaga gatacttttg agcaatgttt gtggaagcgg 3060
tattcgcaat attttagtag ctcgttacag tccggtgcgt ttttggtttt ttgaaagtgc 3120
gtcttcagag cgcttttggt tttcaaaagc gctctgaagt tcctatactt tctagagaat 3180
aggaacttcg gaataggaac ttcaaagcgt ttccgaaaac gagcgcttcc gaaaatgcaa 3240
cgcgagctgc gcacatacag ctcactgttc acgtcgcacc tatatctgcg tgttgcctgt 3300
atatatatat acatgagaag aacggcatag tgcgtgttta tgcttaaatg cgtacttata 3360
tgcgtctatt tatgtaggat gaaaggtagt ctagtacctc ctgtgatatt atcccattcc 3420
atgcggggta tcgtatgctt ccttcagcac taccctttag ctgttctata tgctgccact 3480
cctcaattgg attagtctca tccttcaatg ctatcatttc ctttgatatt ggatcatact 3540
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 3600
gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 3660
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 3720
gtgttggcgg gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag 3780
tgcaccatac cacagctttt caattcaatt catcattttt tttttattct tttttttgat 3840
ttcggtttct ttgaaatttt tttgattcgg taatctccga acagaaggaa gaacgaagga 3900
aggagcacag acttagattg gtatatatac gcatatgtag tgttgaagaa acatgaaatt 3960
gcccagtatt cttaacccaa ctgcacagaa caaaaacctg caggaaacga agataaatca 4020
tgtcgaaagc tacatataag gaacgtgctg ctactcatcc tagtcctgtt gctgccaagc 4080
tatttaatat catgcacgaa aagcaaacaa acttgtgtgc ttcattggat gttcgtacca 4140
ccaaggaatt actggagtta gttgaagcat taggtcccaa aatttgttta ctaaaaacac 4200
atgtggatat cttgactgat ttttccatgg agggcacagt taagccgcta aaggcattat 4260
ccgccaagta caatttttta ctcttcgaag acagaaaatt tgctgacatt ggtaatacag 4320
tcaaattgca gtactctgcg ggtgtataca gaatagcaga atgggcagac attacgaatg 4380
cacacggtgt ggtgggccca ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa 4440
caaaggaacc tagaggcctt ttgatgttag cagaattgtc atgcaagggc tccctatcta 4500
ctggagaata tactaagggt actgttgaca ttgcgaagag cgacaaagat tttgttatcg 4560
gctttattgc tcaaagagac atgggtggaa gagatgaagg ttacgattgg ttgattatga 4620
cacccggtgt gggtttagat gacaagggag acgcattggg tcaacagtat agaaccgtgg 4680
atgatgtggt ctctacagga tctgacatta ttattgttgg aagaggacta tttgcaaagg 4740
gaagggatgc taaggtagag ggtgaacgtt acagaaaagc aggctgggaa gcatatttga 4800
gaagatgcgg ccagcaaaac taaaaaactg tattataagt aaatgcatgt atactaaact 4860
cacaaattag agcttcaatt taattatatc agttattacc ctatgcggtg tgaaataccg 4920
cacagatgcg taaggagaaa ataccgcatc aggaaattgt aaacgttaat attttgttaa 4980
aattcgcgtt aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca 5040
aaatccctta taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga 5100
acaagagtcc actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc 5160
agggcgatgg cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc 5220
gtaaagcact aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc 5280
cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg 5340
caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac 5400
agggcgcgtc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 5460
ctcttcgcta ttacgccagc tgaattggag cgacctcatg ctatacctga gaaagcaacc 5520
tgacctacag gaaagagtta ctcaagaata agaattttcg ttttaaaacc taagagtcac 5580
tttaaaattt gtatacactt atttttttta taacttattt aataataaaa atcataaatc 5640
ataagaaatt cgcttattta gaagtgtcaa caacgtatct accaacgatt tgaccctttt 5700
ccatcttttc gtaaatttct ggcaaggtag acaagccgac aaccttgatt ggagacttga 5760
ccaaacctct ggcgaagaat tgttaattaa gccagaaaaa ggaagtgttt ccctccttct 5820
tgaattgatg ttaccctcat aaagcacgtg gcctcttatc gagaaagaaa ttaccgtcgc 5880
tcgtgatttg tttgcaaaaa gaacaaaact gaaaaaaccc agacacgctc gacttcctgt 5940
cttcctattg attgcagctt ccaatttcgt cacacaacaa ggtcctagcg acggctcaca 6000
ggttttgtaa caagcaatcg aaggttctgg aatggcggga aagggtttag taccacatgc 6060
tatgatgccc actgtgatct ccagagcaaa gttcgttcga tcgtactgtt actctctctc 6120
tttcaaacag aattgtccga atcgtgtgac aacaacagcc tgttctcaca cactcttttc 6180
ttctaaccaa gggggtggtt tagtttagta gaacctcgtg aaacttacat ttacatatat 6240
ataaacttgc ataaattggt caatgcaaga aatacatatt tggtcttttc taattcgtag 6300
tttttcaagt tcttagatgc tttctttttc tcttttttac agatcatcaa ggaagtaatt 6360
atctactttt tacaag 6376
<210> 5
<211> 7380
<212> DNA
<213> 人工序列
<220>
<223> pTAN06
<400> 5
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accacgcttt tcaattcaat tcatcatttt ttttttattc ttttttttga tttcggtttc 240
tttgaaattt ttttgattcg gtaatctccg aacagaagga agaacgaagg aaggagcaca 300
gacttagatt ggtatatata cgcatatgta gtgttgaaga aacatgaaat tgcccagtat 360
tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 420
ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 480
tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 540
tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 600
tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 660
acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 720
agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 780
tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac 840
ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat 900
atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg 960
ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg 1020
tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg 1080
tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg 1140
ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg 1200
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 1260
gagcttcaat ttaattatat cagttattac cctgcggtgt gaaataccgc acagatgcgt 1320
aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 1380
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1440
aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1500
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1560
ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta 1620
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 1680
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg 1740
gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg 1800
cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg 1860
ctattacgcc agctggcgaa ggggggatgt gctgcaaggc gattaagttg ggtaacgcca 1920
gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta 1980
tagggcgaat tggagctcca ccgcggtggc ggccgcctcg agatctcccc taaaccgtgg 2040
aatatttcgg atatcctttt gttgtttccg ggtgtacaat atggacttcc tcttttctgg 2100
caaccaaacc catacatcgg gattcctata ataccttcgt tggtctccct aacatgtagg 2160
tggcggaggg gagatataca atagaacaga taccagacaa gacataatgg gctaaacaag 2220
actacaccaa ttacactgcc tcattgatgg tggtacataa cgaactaata ctgtagccct 2280
agacttgata gccatcatca tatcgaagtt tcactaccct ttttccattt gccatctatt 2340
gaagtaataa taggcgcatg caacttcttt tctttttttt tcttttctct ctcccccgtt 2400
gttgtctcac catatccgca atgacaaaaa aatgatggaa gacactaaag gaaaaaatta 2460
acgacaaaga cagcaccaac agatgtcgtt gttccagagc tgatgggggg tatctcgaag 2520
cacacgaaac tttttccttc cttcattcac gcacactact ctctaatgag caacggtata 2580
cggccttcct tccagttact tgaatttgaa ataaaaaaag tttgctgtct tgctatcaag 2640
tataaataga cctgcaatta ttaatctttt gtttcctcgt cattgttctc gttccctttc 2700
ttccttgttt ctttttctgc acaatatttc aagctatacc aagcatacaa tcaactatct 2760
catatacaat gatcagattg accgttttct tgaccgctgt ttttgctgct gttgcttctt 2820
gtgttccagt tgaattggat aagagaaaca ccggtcattt ccaagcttat tctggttata 2880
ccgttgctag atctaacttc acccaatgga ttcatgaaca accagctgtt tcttggtact 2940
acttgttgca aaacatcgat tacccagaag gtcaattcaa atctgctaaa ccaggtgttg 3000
ttgttgcttc tccatctaca tctgaaccag attacttcta ccaatggact agagataccg 3060
ctattacctt cttgtccttg attgctgaag ttgaagatca ttctttctcc aacactacct 3120
tggctaaggt tgtcgaatat tacatttcca acacctacac cttgcaaaga gtttctaatc 3180
catccggtaa cttcgattct ccaaatcatg atggtttggg tgaacctaag ttcaacgttg 3240
atgatactgc ttatacagct tcttggggta gaccacaaaa tgatggtcca gctttgagag 3300
cttacgctat ttctagatac ttgaacgctg ttgctaagca caacaacggt aaattattat 3360
tggccggtca aaacggtatt ccttattctt ctgcttccga tatctactgg aagattatta 3420
agccagactt gcaacatgtt tctactcatt ggtctacctc tggttttgat ttgtgggaag 3480
aaaatcaagg tactcatttc ttcaccgctt tggttcaatt gaaggctttg tcttacggta 3540
ttccattgtc taagacctac aatgatccag gtttcacttc ttggttggaa aaacaaaagg 3600
atgccttgaa ctcctacatt aactcttccg gtttcgttaa ctctggtaaa aagcacatcg 3660
ttgaatctcc acaattgtca tctagaggtg gtttggattc tgctacttat attgctgcct 3720
tgatcaccca tgatatcggt gatgatgata cttacacccc attcaatgtt gataactcct 3780
acgttttgaa ctccttgtat tacctattgg tcgacaacaa gaacagatac aagatcaacg 3840
gtaactacaa agctggtgct gctgttggta gatatcctga agatgtttac aacggtgttg 3900
gtacttctga aggtaatcca tggcaattgg ctactgctta tgctggtcaa actttttaca 3960
ccttggccta caattccttg aagaacaaga agaacttggt catcgaaaag ttgaactacg 4020
acttgtacaa ctccttcatt gctgatttgt ccaagattga ttcttcctac gcttctaagg 4080
attctttgac tttgacctac ggttccgata actacaagaa cgttatcaag tccttgttgc 4140
aattcggtga ctcattcttg aaggttttgt tggatcacat cgatgacaac ggtcaattga 4200
ctgaagaaat caacagatac accggttttc aagctggtgc agtttctttg acttggtcat 4260
ctggttcttt gttgtctgct aatagagcca gaaacaagtt gatcgaatta ttgtaaacag 4320
gccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc 4380
ctcccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta 4440
tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa atttttcttt 4500
tttttctgta caaacgcgtg tacgcatgta acgggcagac gaattcgata tcaagcttat 4560
cgataccgtc gacctcgagg gggggcccgg taccagcttt tgttcccttt agtgagggtt 4620
aattccgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct 4680
cacaattcca cacaacatag gagccggaag cataaagtgt aaagcctggg gtgcctaatg 4740
agtgaggtaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 4800
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 4860
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 4920
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 4980
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 5040
ggcgtttttc cataggctcg gcccccctga cgagcatcac aaaaatcgac gctcaagtca 5100
gaggtggcga aacccgacag gactataaag ataccaggcg ttcccccctg gaagctccct 5160
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 5220
gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 5280
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 5340
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 5400
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 5460
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 5520
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 5580
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 5640
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 5700
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 5760
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 5820
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactgcc 5880
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 5940
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 6000
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 6060
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 6120
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 6180
acgatcaagg cgagttacat gatcccccat gttgtgaaaa aaagcggtta gctccttcgg 6240
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 6300
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 6360
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 6420
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 6480
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 6540
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 6600
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 6660
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 6720
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 6780
ccgaaaagtg ccacctgggt ccttttcatc acgtgctata aaaataatta taatttaaat 6840
tttttaatat aaatatataa attaaaaata gaaagtaaaa aaagaaatta aagaaaaaat 6900
agtttttgtt ttccgaagat gtaaaagact ctagggggat cgccaacaaa tactaccttt 6960
tatcttgctc ttcctgctct caggtattaa tgccgaattg tttcatcttg tctgtgtaga 7020
agaccacaca cgaaaatcct gtgattttac attttactta tcgttaatcg aatgtatatc 7080
tatttaatct gcttttcttg tctaataaat atatatgtaa agtacgcttt ttgttgaaat 7140
tttttaaacc tttgtttatt tttttttctt cattccgtaa ctcttctacc ttctttattt 7200
actttctaaa atccaaatac aaaacataaa aataaataaa cacagagtaa attcccaaat 7260
tattccatca ttaaaagata cgaggcgcgt gtaagttaca ggcaagcgat ccgtcctaag 7320
aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 7380
<210> 6
<211> 7383
<212> DNA
<213> 人工序列
<220>
<223> pAV33
<400> 6
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accacgcttt tcaattcaat tcatcatttt ttttttattc ttttttttga tttcggtttc 240
tttgaaattt ttttgattcg gtaatctccg aacagaagga agaacgaagg aaggagcaca 300
gacttagatt ggtatatata cgcatatgta gtgttgaaga aacatgaaat tgcccagtat 360
tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 420
ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 480
tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 540
tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 600
tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 660
acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 720
agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 780
tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac 840
ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat 900
atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg 960
ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg 1020
tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg 1080
tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg 1140
ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg 1200
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 1260
gagcttcaat ttaattatat cagttattac cctgcggtgt gaaataccgc acagatgcgt 1320
aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 1380
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1440
aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1500
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1560
ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta 1620
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 1680
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg 1740
gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg 1800
cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg 1860
ctattacgcc agctggcgaa ggggggatgt gctgcaaggc gattaagttg ggtaacgcca 1920
gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta 1980
tagggcgaat tggagctcca ccgcggtggc ggccgcctcg agatctcccc taaaccgtgg 2040
aatatttcgg atatcctttt gttgtttccg ggtgtacaat atggacttcc tcttttctgg 2100
caaccaaacc catacatcgg gattcctata ataccttcgt tggtctccct aacatgtagg 2160
tggcggaggg gagatataca atagaacaga taccagacaa gacataatgg gctaaacaag 2220
actacaccaa ttacactgcc tcattgatgg tggtacataa cgaactaata ctgtagccct 2280
agacttgata gccatcatca tatcgaagtt tcactaccct ttttccattt gccatctatt 2340
gaagtaataa taggcgcatg caacttcttt tctttttttt tcttttctct ctcccccgtt 2400
gttgtctcac catatccgca atgacaaaaa aatgatggaa gacactaaag gaaaaaatta 2460
acgacaaaga cagcaccaac agatgtcgtt gttccagagc tgatgggggg tatctcgaag 2520
cacacgaaac tttttccttc cttcattcac gcacactact ctctaatgag caacggtata 2580
cggccttcct tccagttact tgaatttgaa ataaaaaaag tttgctgtct tgctatcaag 2640
tataaataga cctgcaatta ttaatctttt gtttcctcgt cattgttctc gttccctttc 2700
ttccttgttt ctttttctgc acaatatttc aagctatacc aagcatacaa tcaactatct 2760
catatacaat gagattccca tctatcttca ctgccgtctt gttcgctgct tcttctgctt 2820
tagctgttcc agttgaattg gataagagaa acaccggtca tttccaagct tattctggtt 2880
ataccgttgc tagatctaac ttcacccaat ggattcatga acaaccagct gtttcttggt 2940
actacttgtt gcaaaacatc gattacccag aaggtcaatt caaatctgct aaaccaggtg 3000
ttgttgttgc ttctccatct acatctgaac cagattactt ctaccaatgg actagagata 3060
ccgctattac cttcttgtcc ttgattgctg aagttgaaga tcattctttc tccaacacta 3120
ccttggctaa ggttgtcgaa tattacattt ccaacaccta caccttgcaa agagtttcta 3180
atccatccgg taacttcgat tctccaaatc atgatggttt gggtgaacct aagttcaacg 3240
ttgatgatac tgcttataca gcttcttggg gtagaccaca aaatgatggt ccagctttga 3300
gagcttacgc tatttctaga tacttgaacg ctgttgctaa gcacaacaac ggtaaattat 3360
tattggccgg tcaaaacggt attccttatt cttctgcttc cgatatctac tggaagatta 3420
ttaagccaga cttgcaacat gtttctactc attggtctac ctctggtttt gatttgtggg 3480
aagaaaatca aggtactcat ttcttcaccg ctttggttca attgaaggct ttgtcttacg 3540
gtattccatt gtctaagacc tacaatgatc caggtttcac ttcttggttg gaaaaacaaa 3600
aggatgcctt gaactcctac attaactctt ccggtttcgt taactctggt aaaaagcaca 3660
tcgttgaatc tccacaattg tcatctagag gtggtttgga ttctgctact tatattgctg 3720
ccttgatcac ccatgatatc ggtgatgatg atacttacac cccattcaat gttgataact 3780
cctacgtttt gaactccttg tattacctat tggtcgacaa caagaacaga tacaagatca 3840
acggtaacta caaagctggt gctgctgttg gtagatatcc tgaagatgtt tacaacggtg 3900
ttggtacttc tgaaggtaat ccatggcaat tggctactgc ttatgctggt caaacttttt 3960
acaccttggc ctacaattcc ttgaagaaca agaagaactt ggtcatcgaa aagttgaact 4020
acgacttgta caactccttc attgctgatt tgtccaagat tgattcttcc tacgcttcta 4080
aggattcttt gactttgacc tacggttccg ataactacaa gaacgttatc aagtccttgt 4140
tgcaattcgg tgactcattc ttgaaggttt tgttggatca catcgatgac aacggtcaat 4200
tgactgaaga aatcaacaga tacaccggtt ttcaagctgg tgcagtttct ttgacttggt 4260
catctggttc tttgttgtct gctaatagag ccagaaacaa gttgatcgaa ttattgtaaa 4320
caggcccctt ttcctttgtc gatatcatgt aattagttat gtcacgctta cattcacgcc 4380
ctcctcccac atccgctcta accgaaaagg aaggagttag acaacctgaa gtctaggtcc 4440
ctatttattt ttttatagtt atgttagtat taagaacgtt atttatattt caaatttttc 4500
ttttttttct gtacaaacgc gtgtacgcat gtaacgggca gacgaattcg atatcaagct 4560
tatcgatacc gtcgacctcg agggggggcc cggtaccagc ttttgttccc tttagtgagg 4620
gttaattccg agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 4680
gctcacaatt ccacacaaca taggagccgg aagcataaag tgtaaagcct ggggtgccta 4740
atgagtgagg taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 4800
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 4860
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 4920
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 4980
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5040
gctggcgttt ttccataggc tcggcccccc tgacgagcat cacaaaaatc gacgctcaag 5100
tcagaggtgg cgaaacccga caggactata aagataccag gcgttccccc ctggaagctc 5160
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5220
ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt 5280
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5340
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5400
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5460
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 5520
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5580
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5640
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5700
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5760
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 5820
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 5880
gcccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 5940
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6000
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6060
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6120
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6180
ccaacgatca aggcgagtta catgatcccc catgttgtga aaaaaagcgg ttagctcctt 6240
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6300
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6360
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6420
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6480
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6540
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6600
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6660
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 6720
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6780
tccccgaaaa gtgccacctg ggtccttttc atcacgtgct ataaaaataa ttataattta 6840
aattttttaa tataaatata taaattaaaa atagaaagta aaaaaagaaa ttaaagaaaa 6900
aatagttttt gttttccgaa gatgtaaaag actctagggg gatcgccaac aaatactacc 6960
ttttatcttg ctcttcctgc tctcaggtat taatgccgaa ttgtttcatc ttgtctgtgt 7020
agaagaccac acacgaaaat cctgtgattt tacattttac ttatcgttaa tcgaatgtat 7080
atctatttaa tctgcttttc ttgtctaata aatatatatg taaagtacgc tttttgttga 7140
aattttttaa acctttgttt attttttttt cttcattccg taactcttct accttcttta 7200
tttactttct aaaatccaaa tacaaaacat aaaaataaat aaacacagag taaattccca 7260
aattattcca tcattaaaag atacgaggcg cgtgtaagtt acaggcaagc gatccgtcct 7320
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 7380
gtc 7383
<210> 7
<211> 7383
<212> DNA
<213> 人工序列
<220>
<223> pAV34
<400> 7
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accacgcttt tcaattcaat tcatcatttt ttttttattc ttttttttga tttcggtttc 240
tttgaaattt ttttgattcg gtaatctccg aacagaagga agaacgaagg aaggagcaca 300
gacttagatt ggtatatata cgcatatgta gtgttgaaga aacatgaaat tgcccagtat 360
tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 420
ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 480
tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 540
tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 600
tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 660
acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 720
agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 780
tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac 840
ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat 900
atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg 960
ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg 1020
tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg 1080
tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg 1140
ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg 1200
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 1260
gagcttcaat ttaattatat cagttattac cctgcggtgt gaaataccgc acagatgcgt 1320
aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 1380
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1440
aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1500
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1560
ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta 1620
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 1680
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg 1740
gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg 1800
cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg 1860
ctattacgcc agctggcgaa ggggggatgt gctgcaaggc gattaagttg ggtaacgcca 1920
gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta 1980
tagggcgaat tggagctcca ccgcggtggc ggccgcctcg agatctcccc taaaccgtgg 2040
aatatttcgg atatcctttt gttgtttccg ggtgtacaat atggacttcc tcttttctgg 2100
caaccaaacc catacatcgg gattcctata ataccttcgt tggtctccct aacatgtagg 2160
tggcggaggg gagatataca atagaacaga taccagacaa gacataatgg gctaaacaag 2220
actacaccaa ttacactgcc tcattgatgg tggtacataa cgaactaata ctgtagccct 2280
agacttgata gccatcatca tatcgaagtt tcactaccct ttttccattt gccatctatt 2340
gaagtaataa taggcgcatg caacttcttt tctttttttt tcttttctct ctcccccgtt 2400
gttgtctcac catatccgca atgacaaaaa aatgatggaa gacactaaag gaaaaaatta 2460
acgacaaaga cagcaccaac agatgtcgtt gttccagagc tgatgggggg tatctcgaag 2520
cacacgaaac tttttccttc cttcattcac gcacactact ctctaatgag caacggtata 2580
cggccttcct tccagttact tgaatttgaa ataaaaaaag tttgctgtct tgctatcaag 2640
tataaataga cctgcaatta ttaatctttt gtttcctcgt cattgttctc gttccctttc 2700
ttccttgttt ctttttctgc acaatatttc aagctatacc aagcatacaa tcaactatct 2760
catatacaat gaagttcatt tccactttct tgaccttcat tttggctgct gtctctgtca 2820
ccgctgttcc agttgaattg gataagagaa acaccggtca tttccaagct tattctggtt 2880
ataccgttgc tagatctaac ttcacccaat ggattcatga acaaccagct gtttcttggt 2940
actacttgtt gcaaaacatc gattacccag aaggtcaatt caaatctgct aaaccaggtg 3000
ttgttgttgc ttctccatct acatctgaac cagattactt ctaccaatgg actagagata 3060
ccgctattac cttcttgtcc ttgattgctg aagttgaaga tcattctttc tccaacacta 3120
ccttggctaa ggttgtcgaa tattacattt ccaacaccta caccttgcaa agagtttcta 3180
atccatccgg taacttcgat tctccaaatc atgatggttt gggtgaacct aagttcaacg 3240
ttgatgatac tgcttataca gcttcttggg gtagaccaca aaatgatggt ccagctttga 3300
gagcttacgc tatttctaga tacttgaacg ctgttgctaa gcacaacaac ggtaaattat 3360
tattggccgg tcaaaacggt attccttatt cttctgcttc cgatatctac tggaagatta 3420
ttaagccaga cttgcaacat gtttctactc attggtctac ctctggtttt gatttgtggg 3480
aagaaaatca aggtactcat ttcttcaccg ctttggttca attgaaggct ttgtcttacg 3540
gtattccatt gtctaagacc tacaatgatc caggtttcac ttcttggttg gaaaaacaaa 3600
aggatgcctt gaactcctac attaactctt ccggtttcgt taactctggt aaaaagcaca 3660
tcgttgaatc tccacaattg tcatctagag gtggtttgga ttctgctact tatattgctg 3720
ccttgatcac ccatgatatc ggtgatgatg atacttacac cccattcaat gttgataact 3780
cctacgtttt gaactccttg tattacctat tggtcgacaa caagaacaga tacaagatca 3840
acggtaacta caaagctggt gctgctgttg gtagatatcc tgaagatgtt tacaacggtg 3900
ttggtacttc tgaaggtaat ccatggcaat tggctactgc ttatgctggt caaacttttt 3960
acaccttggc ctacaattcc ttgaagaaca agaagaactt ggtcatcgaa aagttgaact 4020
acgacttgta caactccttc attgctgatt tgtccaagat tgattcttcc tacgcttcta 4080
aggattcttt gactttgacc tacggttccg ataactacaa gaacgttatc aagtccttgt 4140
tgcaattcgg tgactcattc ttgaaggttt tgttggatca catcgatgac aacggtcaat 4200
tgactgaaga aatcaacaga tacaccggtt ttcaagctgg tgcagtttct ttgacttggt 4260
catctggttc tttgttgtct gctaatagag ccagaaacaa gttgatcgaa ttattgtaaa 4320
caggcccctt ttcctttgtc gatatcatgt aattagttat gtcacgctta cattcacgcc 4380
ctcctcccac atccgctcta accgaaaagg aaggagttag acaacctgaa gtctaggtcc 4440
ctatttattt ttttatagtt atgttagtat taagaacgtt atttatattt caaatttttc 4500
ttttttttct gtacaaacgc gtgtacgcat gtaacgggca gacgaattcg atatcaagct 4560
tatcgatacc gtcgacctcg agggggggcc cggtaccagc ttttgttccc tttagtgagg 4620
gttaattccg agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 4680
gctcacaatt ccacacaaca taggagccgg aagcataaag tgtaaagcct ggggtgccta 4740
atgagtgagg taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 4800
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 4860
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 4920
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 4980
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5040
gctggcgttt ttccataggc tcggcccccc tgacgagcat cacaaaaatc gacgctcaag 5100
tcagaggtgg cgaaacccga caggactata aagataccag gcgttccccc ctggaagctc 5160
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5220
ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt 5280
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5340
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5400
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5460
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 5520
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5580
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5640
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5700
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5760
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 5820
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 5880
gcccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 5940
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6000
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6060
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6120
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6180
ccaacgatca aggcgagtta catgatcccc catgttgtga aaaaaagcgg ttagctcctt 6240
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6300
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6360
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6420
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6480
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6540
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6600
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6660
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 6720
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6780
tccccgaaaa gtgccacctg ggtccttttc atcacgtgct ataaaaataa ttataattta 6840
aattttttaa tataaatata taaattaaaa atagaaagta aaaaaagaaa ttaaagaaaa 6900
aatagttttt gttttccgaa gatgtaaaag actctagggg gatcgccaac aaatactacc 6960
ttttatcttg ctcttcctgc tctcaggtat taatgccgaa ttgtttcatc ttgtctgtgt 7020
agaagaccac acacgaaaat cctgtgattt tacattttac ttatcgttaa tcgaatgtat 7080
atctatttaa tctgcttttc ttgtctaata aatatatatg taaagtacgc tttttgttga 7140
aattttttaa acctttgttt attttttttt cttcattccg taactcttct accttcttta 7200
tttactttct aaaatccaaa tacaaaacat aaaaataaat aaacacagag taaattccca 7260
aattattcca tcattaaaag atacgaggcg cgtgtaagtt acaggcaagc gatccgtcct 7320
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 7380
gtc 7383
<210> 8
<211> 7377
<212> DNA
<213> 人工序列
<220>
<223> pTAN35
<400> 8
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accacgcttt tcaattcaat tcatcatttt ttttttattc ttttttttga tttcggtttc 240
tttgaaattt ttttgattcg gtaatctccg aacagaagga agaacgaagg aaggagcaca 300
gacttagatt ggtatatata cgcatatgta gtgttgaaga aacatgaaat tgcccagtat 360
tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 420
ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 480
tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 540
tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 600
tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 660
acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 720
agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 780
tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac 840
ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat 900
atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg 960
ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg 1020
tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg 1080
tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg 1140
ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg 1200
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 1260
gagcttcaat ttaattatat cagttattac cctgcggtgt gaaataccgc acagatgcgt 1320
aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 1380
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1440
aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1500
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1560
ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta 1620
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 1680
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg 1740
gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg 1800
cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg 1860
ctattacgcc agctggcgaa ggggggatgt gctgcaaggc gattaagttg ggtaacgcca 1920
gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta 1980
tagggcgaat tggagctcca ccgcggtggc ggccgcctcg agatctcccc taaaccgtgg 2040
aatatttcgg atatcctttt gttgtttccg ggtgtacaat atggacttcc tcttttctgg 2100
caaccaaacc catacatcgg gattcctata ataccttcgt tggtctccct aacatgtagg 2160
tggcggaggg gagatataca atagaacaga taccagacaa gacataatgg gctaaacaag 2220
actacaccaa ttacactgcc tcattgatgg tggtacataa cgaactaata ctgtagccct 2280
agacttgata gccatcatca tatcgaagtt tcactaccct ttttccattt gccatctatt 2340
gaagtaataa taggcgcatg caacttcttt tctttttttt tcttttctct ctcccccgtt 2400
gttgtctcac catatccgca atgacaaaaa aatgatggaa gacactaaag gaaaaaatta 2460
acgacaaaga cagcaccaac agatgtcgtt gttccagagc tgatgggggg tatctcgaag 2520
cacacgaaac tttttccttc cttcattcac gcacactact ctctaatgag caacggtata 2580
cggccttcct tccagttact tgaatttgaa ataaaaaaag tttgctgtct tgctatcaag 2640
tataaataga cctgcaatta ttaatctttt gtttcctcgt cattgttctc gttccctttc 2700
ttccttgttt ctttttctgc acaatatttc aagctatacc aagcatacaa tcaactatct 2760
catatacaat gttcaagtct gttgtttact ctattttggc tgcctctttg gctaacgctg 2820
ttccagttga attggataag agaaacaccg gtcatttcca agcttattct ggttataccg 2880
ttgctagatc taacttcacc caatggattc atgaacaacc agctgtttct tggtactact 2940
tgttgcaaaa catcgattac ccagaaggtc aattcaaatc tgctaaacca ggtgttgttg 3000
ttgcttctcc atctacatct gaaccagatt acttctacca atggactaga gataccgcta 3060
ttaccttctt gtccttgatt gctgaagttg aagatcattc tttctccaac actaccttgg 3120
ctaaggttgt cgaatattac atttccaaca cctacacctt gcaaagagtt tctaatccat 3180
ccggtaactt cgattctcca aatcatgatg gtttgggtga acctaagttc aacgttgatg 3240
atactgctta tacagcttct tggggtagac cacaaaatga tggtccagct ttgagagctt 3300
acgctatttc tagatacttg aacgctgttg ctaagcacaa caacggtaaa ttattattgg 3360
ccggtcaaaa cggtattcct tattcttctg cttccgatat ctactggaag attattaagc 3420
cagacttgca acatgtttct actcattggt ctacctctgg ttttgatttg tgggaagaaa 3480
atcaaggtac tcatttcttc accgctttgg ttcaattgaa ggctttgtct tacggtattc 3540
cattgtctaa gacctacaat gatccaggtt tcacttcttg gttggaaaaa caaaaggatg 3600
ccttgaactc ctacattaac tcttccggtt tcgttaactc tggtaaaaag cacatcgttg 3660
aatctccaca attgtcatct agaggtggtt tggattctgc tacttatatt gctgccttga 3720
tcacccatga tatcggtgat gatgatactt acaccccatt caatgttgat aactcctacg 3780
ttttgaactc cttgtattac ctattggtcg acaacaagaa cagatacaag atcaacggta 3840
actacaaagc tggtgctgct gttggtagat atcctgaaga tgtttacaac ggtgttggta 3900
cttctgaagg taatccatgg caattggcta ctgcttatgc tggtcaaact ttttacacct 3960
tggcctacaa ttccttgaag aacaagaaga acttggtcat cgaaaagttg aactacgact 4020
tgtacaactc cttcattgct gatttgtcca agattgattc ttcctacgct tctaaggatt 4080
ctttgacttt gacctacggt tccgataact acaagaacgt tatcaagtcc ttgttgcaat 4140
tcggtgactc attcttgaag gttttgttgg atcacatcga tgacaacggt caattgactg 4200
aagaaatcaa cagatacacc ggttttcaag ctggtgcagt ttctttgact tggtcatctg 4260
gttctttgtt gtctgctaat agagccagaa acaagttgat cgaattattg taaacaggcc 4320
ccttttcctt tgtcgatatc atgtaattag ttatgtcacg cttacattca cgccctcctc 4380
ccacatccgc tctaaccgaa aaggaaggag ttagacaacc tgaagtctag gtccctattt 4440
atttttttat agttatgtta gtattaagaa cgttatttat atttcaaatt tttctttttt 4500
ttctgtacaa acgcgtgtac gcatgtaacg ggcagacgaa ttcgatatca agcttatcga 4560
taccgtcgac ctcgaggggg ggcccggtac cagcttttgt tccctttagt gagggttaat 4620
tccgagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 4680
aattccacac aacataggag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 4740
gaggtaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 4800
gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 4860
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 4920
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 4980
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 5040
gtttttccat aggctcggcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 5100
gtggcgaaac ccgacaggac tataaagata ccaggcgttc ccccctggaa gctccctcgt 5160
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 5220
aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg 5280
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 5340
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 5400
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 5460
gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 5520
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 5580
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 5640
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 5700
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 5760
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 5820
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactgcccgt 5880
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 5940
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 6000
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 6060
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 6120
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 6180
atcaaggcga gttacatgat cccccatgtt gtgaaaaaaa gcggttagct ccttcggtcc 6240
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 6300
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 6360
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 6420
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 6480
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 6540
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 6600
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 6660
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 6720
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 6780
aaaagtgcca cctgggtcct tttcatcacg tgctataaaa ataattataa tttaaatttt 6840
ttaatataaa tatataaatt aaaaatagaa agtaaaaaaa gaaattaaag aaaaaatagt 6900
ttttgttttc cgaagatgta aaagactcta gggggatcgc caacaaatac taccttttat 6960
cttgctcttc ctgctctcag gtattaatgc cgaattgttt catcttgtct gtgtagaaga 7020
ccacacacga aaatcctgtg attttacatt ttacttatcg ttaatcgaat gtatatctat 7080
ttaatctgct tttcttgtct aataaatata tatgtaaagt acgctttttg ttgaaatttt 7140
ttaaaccttt gtttattttt ttttcttcat tccgtaactc ttctaccttc tttatttact 7200
ttctaaaatc caaatacaaa acataaaaat aaataaacac agagtaaatt cccaaattat 7260
tccatcatta aaagatacga ggcgcgtgta agttacaggc aagcgatccg tcctaagaaa 7320
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtc 7377
<210> 9
<211> 4887
<212> DNA
<213> 人工序列
<220>
<223> pRS316
<400> 9
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accacgcttt tcaattcaat tcatcatttt ttttttattc ttttttttga tttcggtttc 240
tttgaaattt ttttgattcg gtaatctccg aacagaagga agaacgaagg aaggagcaca 300
gacttagatt ggtatatata cgcatatgta gtgttgaaga aacatgaaat tgcccagtat 360
tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 420
ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 480
tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 540
tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 600
tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 660
acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 720
agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 780
tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac 840
ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat 900
atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg 960
ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg 1020
tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg 1080
tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg 1140
ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg 1200
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 1260
gagcttcaat ttaattatat cagttattac cctgcggtgt gaaataccgc acagatgcgt 1320
aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 1380
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1440
aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1500
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1560
ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta 1620
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 1680
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg 1740
gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg 1800
cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg 1860
ctattacgcc agctggcgaa ggggggatgt gctgcaaggc gattaagttg ggtaacgcca 1920
gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta 1980
tagggcgaat tggagctcca ccgcggtggc ggccgctcta gaactagtgg atcccccggg 2040
ctgcaggaat tcgatatcaa gcttatcgat accgtcgacc tcgagggggg gcccggtacc 2100
cagcttttgt tccctttagt gagggttaat tccgagcttg gcgtaatcat ggtcatagct 2160
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag ccggaagcat 2220
aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg cgttgcgctc 2280
actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 2340
cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 2400
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2460
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2520
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctcggcc cccctgacga 2580
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2640
ccaggcgttc ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2700
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg 2760
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 2820
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 2880
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 2940
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 3000
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3060
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3120
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3180
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 3240
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 3300
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 3360
tcgttcatcc atagttgcct gactgcccgt cgtgtagata actacgatac gggagggctt 3420
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 3480
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 3540
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 3600
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 3660
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 3720
gtgaaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 3780
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 3840
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 3900
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 3960
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 4020
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 4080
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 4140
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 4200
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 4260
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgggtcct tttcatcacg 4320
tgctataaaa ataattataa tttaaatttt ttaatataaa tatataaatt aaaaatagaa 4380
agtaaaaaaa gaaattaaag aaaaaatagt ttttgttttc cgaagatgta aaagactcta 4440
gggggatcgc caacaaatac taccttttat cttgctcttc ctgctctcag gtattaatgc 4500
cgaattgttt catcttgtct gtgtagaaga ccacacacga aaatcctgtg attttacatt 4560
ttacttatcg ttaatcgaat gtatatctat ttaatctgct tttcttgtct aataaatata 4620
tatgtaaagt acgctttttg ttgaaatttt ttaaaccttt gtttattttt ttttcttcat 4680
tccgtaactc ttctaccttc tttatttact ttctaaaatc caaatacaaa acataaaaat 4740
aaataaacac agagtaaatt cccaaattat tccatcatta aaagatacga ggcgcgtgta 4800
agttacaggc aagcgatccg tcctaagaaa ccattattat catgacatta acctataaaa 4860
ataggcgtat cacgaggccc tttcgtc 4887
<210> 10
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> MFalpha2 signal sequence
<400> 10
Met Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser
1 5 10 15
Val Thr Ala
<210> 11
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> PHO5信号序列
<400> 11
Met Phe Lys Ser Val Val Tyr Ser Ile Leu Ala Ala Ser Leu Ala Asn
1 5 10 15
<210> 12
<211> 515
<212> PRT
<213> 扣囊复膜酵母
<400> 12
Met Ile Arg Leu Thr Val Phe Leu Thr Ala Val Phe Ala Ala Val Ala
1 5 10 15
Ser Cys Val Pro Val Glu Leu Asp Lys Arg Asn Thr Gly His Phe Gln
20 25 30
Ala Tyr Ser Gly Tyr Thr Val Ala Arg Ser Asn Phe Thr Gln Trp Ile
35 40 45
His Glu Gln Pro Ala Val Ser Trp Tyr Tyr Leu Leu Gln Asn Ile Asp
50 55 60
Tyr Pro Glu Gly Gln Phe Lys Ser Ala Lys Pro Gly Val Val Val Ala
65 70 75 80
Ser Pro Ser Thr Ser Glu Pro Asp Tyr Phe Tyr Gln Trp Thr Arg Asp
85 90 95
Thr Ala Ile Thr Phe Leu Ser Leu Ile Ala Glu Val Glu Asp His Ser
100 105 110
Phe Ser Asn Thr Thr Leu Ala Lys Val Val Glu Tyr Tyr Ile Ser Asn
115 120 125
Thr Tyr Thr Leu Gln Arg Val Ser Asn Pro Ser Gly Asn Phe Asp Ser
130 135 140
Pro Asn His Asp Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Asp Thr
145 150 155 160
Ala Tyr Thr Ala Ser Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala Leu
165 170 175
Arg Ala Tyr Ala Ile Ser Arg Tyr Leu Asn Ala Val Ala Lys His Asn
180 185 190
Asn Gly Lys Leu Leu Leu Ala Gly Gln Asn Gly Ile Pro Tyr Ser Ser
195 200 205
Ala Ser Asp Ile Tyr Trp Lys Ile Ile Lys Pro Asp Leu Gln His Val
210 215 220
Ser Thr His Trp Ser Thr Ser Gly Phe Asp Leu Trp Glu Glu Asn Gln
225 230 235 240
Gly Thr His Phe Phe Thr Ala Leu Val Gln Leu Lys Ala Leu Ser Tyr
245 250 255
Gly Ile Pro Leu Ser Lys Thr Tyr Asn Asp Pro Gly Phe Thr Ser Trp
260 265 270
Leu Glu Lys Gln Lys Asp Ala Leu Asn Ser Tyr Ile Asn Ser Ser Gly
275 280 285
Phe Val Asn Ser Gly Lys Lys His Ile Val Glu Ser Pro Gln Leu Ser
290 295 300
Ser Arg Gly Gly Leu Asp Ser Ala Thr Tyr Ile Ala Ala Leu Ile Thr
305 310 315 320
His Asp Ile Gly Asp Asp Asp Thr Tyr Thr Pro Phe Asn Val Asp Asn
325 330 335
Ser Tyr Val Leu Asn Ser Leu Tyr Tyr Leu Leu Val Asp Asn Lys Asn
340 345 350
Arg Tyr Lys Ile Asn Gly Asn Tyr Lys Ala Gly Ala Ala Val Gly Arg
355 360 365
Tyr Pro Glu Asp Val Tyr Asn Gly Val Gly Thr Ser Glu Gly Asn Pro
370 375 380
Trp Gln Leu Ala Thr Ala Tyr Ala Gly Gln Thr Phe Tyr Thr Leu Ala
385 390 395 400
Tyr Asn Ser Leu Lys Asn Lys Lys Asn Leu Val Ile Glu Lys Leu Asn
405 410 415
Tyr Asp Leu Tyr Asn Ser Phe Ile Ala Asp Leu Ser Lys Ile Asp Ser
420 425 430
Ser Tyr Ala Ser Lys Asp Ser Leu Thr Leu Thr Tyr Gly Ser Asp Asn
435 440 445
Tyr Lys Asn Val Ile Lys Ser Leu Leu Gln Phe Gly Asp Ser Phe Leu
450 455 460
Lys Val Leu Leu Asp His Ile Asp Asp Asn Gly Gln Leu Thr Glu Glu
465 470 475 480
Ile Asn Arg Tyr Thr Gly Phe Gln Ala Gly Ala Val Ser Leu Thr Trp
485 490 495
Ser Ser Gly Ser Leu Leu Ser Ala Asn Arg Ala Arg Asn Lys Leu Ile
500 505 510
Glu Leu Leu
515
<210> 13
<211> 516
<212> PRT
<213> 人工序列
<220>
<223> MFalpha2- Sf GA蛋白
<400> 13
Met Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser
1 5 10 15
Val Thr Ala Val Pro Val Glu Leu Asp Lys Arg Asn Thr Gly His Phe
20 25 30
Gln Ala Tyr Ser Gly Tyr Thr Val Ala Arg Ser Asn Phe Thr Gln Trp
35 40 45
Ile His Glu Gln Pro Ala Val Ser Trp Tyr Tyr Leu Leu Gln Asn Ile
50 55 60
Asp Tyr Pro Glu Gly Gln Phe Lys Ser Ala Lys Pro Gly Val Val Val
65 70 75 80
Ala Ser Pro Ser Thr Ser Glu Pro Asp Tyr Phe Tyr Gln Trp Thr Arg
85 90 95
Asp Thr Ala Ile Thr Phe Leu Ser Leu Ile Ala Glu Val Glu Asp His
100 105 110
Ser Phe Ser Asn Thr Thr Leu Ala Lys Val Val Glu Tyr Tyr Ile Ser
115 120 125
Asn Thr Tyr Thr Leu Gln Arg Val Ser Asn Pro Ser Gly Asn Phe Asp
130 135 140
Ser Pro Asn His Asp Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Asp
145 150 155 160
Thr Ala Tyr Thr Ala Ser Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala
165 170 175
Leu Arg Ala Tyr Ala Ile Ser Arg Tyr Leu Asn Ala Val Ala Lys His
180 185 190
Asn Asn Gly Lys Leu Leu Leu Ala Gly Gln Asn Gly Ile Pro Tyr Ser
195 200 205
Ser Ala Ser Asp Ile Tyr Trp Lys Ile Ile Lys Pro Asp Leu Gln His
210 215 220
Val Ser Thr His Trp Ser Thr Ser Gly Phe Asp Leu Trp Glu Glu Asn
225 230 235 240
Gln Gly Thr His Phe Phe Thr Ala Leu Val Gln Leu Lys Ala Leu Ser
245 250 255
Tyr Gly Ile Pro Leu Ser Lys Thr Tyr Asn Asp Pro Gly Phe Thr Ser
260 265 270
Trp Leu Glu Lys Gln Lys Asp Ala Leu Asn Ser Tyr Ile Asn Ser Ser
275 280 285
Gly Phe Val Asn Ser Gly Lys Lys His Ile Val Glu Ser Pro Gln Leu
290 295 300
Ser Ser Arg Gly Gly Leu Asp Ser Ala Thr Tyr Ile Ala Ala Leu Ile
305 310 315 320
Thr His Asp Ile Gly Asp Asp Asp Thr Tyr Thr Pro Phe Asn Val Asp
325 330 335
Asn Ser Tyr Val Leu Asn Ser Leu Tyr Tyr Leu Leu Val Asp Asn Lys
340 345 350
Asn Arg Tyr Lys Ile Asn Gly Asn Tyr Lys Ala Gly Ala Ala Val Gly
355 360 365
Arg Tyr Pro Glu Asp Val Tyr Asn Gly Val Gly Thr Ser Glu Gly Asn
370 375 380
Pro Trp Gln Leu Ala Thr Ala Tyr Ala Gly Gln Thr Phe Tyr Thr Leu
385 390 395 400
Ala Tyr Asn Ser Leu Lys Asn Lys Lys Asn Leu Val Ile Glu Lys Leu
405 410 415
Asn Tyr Asp Leu Tyr Asn Ser Phe Ile Ala Asp Leu Ser Lys Ile Asp
420 425 430
Ser Ser Tyr Ala Ser Lys Asp Ser Leu Thr Leu Thr Tyr Gly Ser Asp
435 440 445
Asn Tyr Lys Asn Val Ile Lys Ser Leu Leu Gln Phe Gly Asp Ser Phe
450 455 460
Leu Lys Val Leu Leu Asp His Ile Asp Asp Asn Gly Gln Leu Thr Glu
465 470 475 480
Glu Ile Asn Arg Tyr Thr Gly Phe Gln Ala Gly Ala Val Ser Leu Thr
485 490 495
Trp Ser Ser Gly Ser Leu Leu Ser Ala Asn Arg Ala Arg Asn Lys Leu
500 505 510
Ile Glu Leu Leu
515
<210> 14
<211> 514
<212> PRT
<213> 人工序列
<220>
<223> MFa1-Sf GA蛋白序列
<400> 14
Met Phe Lys Ser Val Val Tyr Ser Ile Leu Ala Ala Ser Leu Ala Asn
1 5 10 15
Ala Val Pro Val Glu Leu Asp Lys Arg Asn Thr Gly His Phe Gln Ala
20 25 30
Tyr Ser Gly Tyr Thr Val Ala Arg Ser Asn Phe Thr Gln Trp Ile His
35 40 45
Glu Gln Pro Ala Val Ser Trp Tyr Tyr Leu Leu Gln Asn Ile Asp Tyr
50 55 60
Pro Glu Gly Gln Phe Lys Ser Ala Lys Pro Gly Val Val Val Ala Ser
65 70 75 80
Pro Ser Thr Ser Glu Pro Asp Tyr Phe Tyr Gln Trp Thr Arg Asp Thr
85 90 95
Ala Ile Thr Phe Leu Ser Leu Ile Ala Glu Val Glu Asp His Ser Phe
100 105 110
Ser Asn Thr Thr Leu Ala Lys Val Val Glu Tyr Tyr Ile Ser Asn Thr
115 120 125
Tyr Thr Leu Gln Arg Val Ser Asn Pro Ser Gly Asn Phe Asp Ser Pro
130 135 140
Asn His Asp Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Asp Thr Ala
145 150 155 160
Tyr Thr Ala Ser Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala Leu Arg
165 170 175
Ala Tyr Ala Ile Ser Arg Tyr Leu Asn Ala Val Ala Lys His Asn Asn
180 185 190
Gly Lys Leu Leu Leu Ala Gly Gln Asn Gly Ile Pro Tyr Ser Ser Ala
195 200 205
Ser Asp Ile Tyr Trp Lys Ile Ile Lys Pro Asp Leu Gln His Val Ser
210 215 220
Thr His Trp Ser Thr Ser Gly Phe Asp Leu Trp Glu Glu Asn Gln Gly
225 230 235 240
Thr His Phe Phe Thr Ala Leu Val Gln Leu Lys Ala Leu Ser Tyr Gly
245 250 255
Ile Pro Leu Ser Lys Thr Tyr Asn Asp Pro Gly Phe Thr Ser Trp Leu
260 265 270
Glu Lys Gln Lys Asp Ala Leu Asn Ser Tyr Ile Asn Ser Ser Gly Phe
275 280 285
Val Asn Ser Gly Lys Lys His Ile Val Glu Ser Pro Gln Leu Ser Ser
290 295 300
Arg Gly Gly Leu Asp Ser Ala Thr Tyr Ile Ala Ala Leu Ile Thr His
305 310 315 320
Asp Ile Gly Asp Asp Asp Thr Tyr Thr Pro Phe Asn Val Asp Asn Ser
325 330 335
Tyr Val Leu Asn Ser Leu Tyr Tyr Leu Leu Val Asp Asn Lys Asn Arg
340 345 350
Tyr Lys Ile Asn Gly Asn Tyr Lys Ala Gly Ala Ala Val Gly Arg Tyr
355 360 365
Pro Glu Asp Val Tyr Asn Gly Val Gly Thr Ser Glu Gly Asn Pro Trp
370 375 380
Gln Leu Ala Thr Ala Tyr Ala Gly Gln Thr Phe Tyr Thr Leu Ala Tyr
385 390 395 400
Asn Ser Leu Lys Asn Lys Lys Asn Leu Val Ile Glu Lys Leu Asn Tyr
405 410 415
Asp Leu Tyr Asn Ser Phe Ile Ala Asp Leu Ser Lys Ile Asp Ser Ser
420 425 430
Tyr Ala Ser Lys Asp Ser Leu Thr Leu Thr Tyr Gly Ser Asp Asn Tyr
435 440 445
Lys Asn Val Ile Lys Ser Leu Leu Gln Phe Gly Asp Ser Phe Leu Lys
450 455 460
Val Leu Leu Asp His Ile Asp Asp Asn Gly Gln Leu Thr Glu Glu Ile
465 470 475 480
Asn Arg Tyr Thr Gly Phe Gln Ala Gly Ala Val Ser Leu Thr Trp Ser
485 490 495
Ser Gly Ser Leu Leu Ser Ala Asn Arg Ala Arg Asn Lys Leu Ile Glu
500 505 510
Leu Leu
<210> 15
<211> 7401
<212> DNA
<213> 人工序列
<220>
<223> MFa1-Sf GA
<400> 15
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accacgcttt tcaattcaat tcatcatttt ttttttattc ttttttttga tttcggtttc 240
tttgaaattt ttttgattcg gtaatctccg aacagaagga agaacgaagg aaggagcaca 300
gacttagatt ggtatatata cgcatatgta gtgttgaaga aacatgaaat tgcccagtat 360
tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 420
ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 480
tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 540
tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 600
tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 660
acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 720
agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 780
tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac 840
ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat 900
atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg 960
ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg 1020
tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg 1080
tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg 1140
ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg 1200
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 1260
gagcttcaat ttaattatat cagttattac cctgcggtgt gaaataccgc acagatgcgt 1320
aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 1380
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1440
aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1500
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1560
ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta 1620
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 1680
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg 1740
gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg 1800
cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg 1860
ctattacgcc agctggcgaa ggggggatgt gctgcaaggc gattaagttg ggtaacgcca 1920
gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta 1980
tagggcgaat tggagctcca ccgcggtggc ggccgcctcg agatctcccc taaaccgtgg 2040
aatatttcgg atatcctttt gttgtttccg ggtgtacaat atggacttcc tcttttctgg 2100
caaccaaacc catacatcgg gattcctata ataccttcgt tggtctccct aacatgtagg 2160
tggcggaggg gagatataca atagaacaga taccagacaa gacataatgg gctaaacaag 2220
actacaccaa ttacactgcc tcattgatgg tggtacataa cgaactaata ctgtagccct 2280
agacttgata gccatcatca tatcgaagtt tcactaccct ttttccattt gccatctatt 2340
gaagtaataa taggcgcatg caacttcttt tctttttttt tcttttctct ctcccccgtt 2400
gttgtctcac catatccgca atgacaaaaa aatgatggaa gacactaaag gaaaaaatta 2460
acgacaaaga cagcaccaac agatgtcgtt gttccagagc tgatgggggg tatctcgaag 2520
cacacgaaac tttttccttc cttcattcac gcacactact ctctaatgag caacggtata 2580
cggccttcct tccagttact tgaatttgaa ataaaaaaag tttgctgtct tgctatcaag 2640
tataaataga cctgcaatta ttaatctttt gtttcctcgt cattgttctc gttccctttc 2700
ttccttgttt ctttttctgc acaatatttc aagctatacc aagcatacaa tcaactatct 2760
catatacaat gcaaccatcc actgctactg ctgccccaaa ggaaaaaacc tcctctgaaa 2820
agaaagacaa tgttccagtt gaattggata agagaaacac cggtcatttc caagcttatt 2880
ctggttatac cgttgctaga tctaacttca cccaatggat tcatgaacaa ccagctgttt 2940
cttggtacta cttgttgcaa aacatcgatt acccagaagg tcaattcaaa tctgctaaac 3000
caggtgttgt tgttgcttct ccatctacat ctgaaccaga ttacttctac caatggacta 3060
gagataccgc tattaccttc ttgtccttga ttgctgaagt tgaagatcat tctttctcca 3120
acactacctt ggctaaggtt gtcgaatatt acatttccaa cacctacacc ttgcaaagag 3180
tttctaatcc atccggtaac ttcgattctc caaatcatga tggtttgggt gaacctaagt 3240
tcaacgttga tgatactgct tatacagctt cttggggtag accacaaaat gatggtccag 3300
ctttgagagc ttacgctatt tctagatact tgaacgctgt tgctaagcac aacaacggta 3360
aattattatt ggccggtcaa aacggtattc cttattcttc tgcttccgat atctactgga 3420
agattattaa gccagacttg caacatgttt ctactcattg gtctacctct ggttttgatt 3480
tgtgggaaga aaatcaaggt actcatttct tcaccgcttt ggttcaattg aaggctttgt 3540
cttacggtat tccattgtct aagacctaca atgatccagg tttcacttct tggttggaaa 3600
aacaaaagga tgccttgaac tcctacatta actcttccgg tttcgttaac tctggtaaaa 3660
agcacatcgt tgaatctcca caattgtcat ctagaggtgg tttggattct gctacttata 3720
ttgctgcctt gatcacccat gatatcggtg atgatgatac ttacacccca ttcaatgttg 3780
ataactccta cgttttgaac tccttgtatt acctattggt cgacaacaag aacagataca 3840
agatcaacgg taactacaaa gctggtgctg ctgttggtag atatcctgaa gatgtttaca 3900
acggtgttgg tacttctgaa ggtaatccat ggcaattggc tactgcttat gctggtcaaa 3960
ctttttacac cttggcctac aattccttga agaacaagaa gaacttggtc atcgaaaagt 4020
tgaactacga cttgtacaac tccttcattg ctgatttgtc caagattgat tcttcctacg 4080
cttctaagga ttctttgact ttgacctacg gttccgataa ctacaagaac gttatcaagt 4140
ccttgttgca attcggtgac tcattcttga aggttttgtt ggatcacatc gatgacaacg 4200
gtcaattgac tgaagaaatc aacagataca ccggttttca agctggtgca gtttctttga 4260
cttggtcatc tggttctttg ttgtctgcta atagagccag aaacaagttg atcgaattat 4320
tgtgtgttat tgcctaaaca ggcccctttt cctttgtcga tatcatgtaa ttagttatgt 4380
cacgcttaca ttcacgccct cctcccacat ccgctctaac cgaaaaggaa ggagttagac 4440
aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta agaacgttat 4500
ttatatttca aatttttctt ttttttctgt acaaacgcgt gtacgcatgt aacgggcaga 4560
cgaattcgat atcaagctta tcgataccgt cgacctcgag ggggggcccg gtaccagctt 4620
ttgttccctt tagtgagggt taattccgag cttggcgtaa tcatggtcat agctgtttcc 4680
tgtgtgaaat tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg 4740
taaagcctgg ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc 4800
cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 4860
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 4920
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 4980
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 5040
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc ggcccccctg acgagcatca 5100
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 5160
gttcccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 5220
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta 5280
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 5340
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 5400
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 5460
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 5520
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 5580
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 5640
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 5700
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 5760
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 5820
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 5880
atccatagtt gcctgactgc ccgtcgtgta gataactacg atacgggagg gcttaccatc 5940
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 6000
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 6060
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 6120
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 6180
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgaaa 6240
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 6300
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 6360
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 6420
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 6480
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 6540
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 6600
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 6660
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 6720
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 6780
aggggttccg cgcacatttc cccgaaaagt gccacctggg tccttttcat cacgtgctat 6840
aaaaataatt ataatttaaa ttttttaata taaatatata aattaaaaat agaaagtaaa 6900
aaaagaaatt aaagaaaaaa tagtttttgt tttccgaaga tgtaaaagac tctaggggga 6960
tcgccaacaa atactacctt ttatcttgct cttcctgctc tcaggtatta atgccgaatt 7020
gtttcatctt gtctgtgtag aagaccacac acgaaaatcc tgtgatttta cattttactt 7080
atcgttaatc gaatgtatat ctatttaatc tgcttttctt gtctaataaa tatatatgta 7140
aagtacgctt tttgttgaaa ttttttaaac ctttgtttat ttttttttct tcattccgta 7200
actcttctac cttctttatt tactttctaa aatccaaata caaaacataa aaataaataa 7260
acacagagta aattcccaaa ttattccatc attaaaagat acgaggcgcg tgtaagttac 7320
aggcaagcga tccgtcctaa gaaaccatta ttatcatgac attaacctat aaaaataggc 7380
gtatcacgag gccctttcgt c 7401

Claims (43)

1.多肽,其包含(a)与SEQ ID NO:10或SEQ ID NO:11具有90%或更高相同性的分泌信号氨基酸序列,和(b)来自酵母、真菌或细菌葡糖淀粉酶多肽的葡糖淀粉酶氨基酸序列,其中所述多肽具有葡糖淀粉酶活性。
2.多肽,其包含(a)与SEQ ID NO:10或SEQ ID NO:11具有90%或更高相同性的分泌信号氨基酸序列,和(b)与SEQ ID NO:12的氨基酸19-515具有90%或更高序列相同性的葡糖淀粉酶氨基酸序列。
3.权利要求1或2的多肽,其与SEQ ID NO:13具有95%或更高序列相同性。
4.权利要求3的多肽,其包含SEQ ID NO:13。
5.权利要求1或2的多肽,其与SEQ ID NO:14具有95%或更高序列相同性。
6.权利要求5的多肽,其包含SEQ ID NO:14。
7.前述权利要求中任一项的多肽,其还包含不同于SEQ ID NO:10、SEQ ID NO:11或所述葡糖淀粉酶氨基酸序列的第三序列,其中所述第三序列位于SEQ ID NO:10和所述葡糖淀粉酶氨基酸序列之间,或SEQ ID NO:11和所述葡糖淀粉酶氨基酸序列之间。
8.权利要求1的多肽,其中所述葡糖淀粉酶氨基酸序列来自酵母或真菌葡糖淀粉酶。
9.权利要求8的多肽,其中所述葡糖淀粉酶氨基酸序列来自选自Amorphothecaresinae、黑曲霉(Aspergillus niger)、泡盛曲霉(Aspergillus awamori)、米曲霉(Aspergillus oryzae)、川地曲霉(Aspergillus kawachii)、Aspergillus shirousami、Blastobotrys adeninivorans、白色念珠菌(Candida albicans)、米根霉(Rhizopusoryzae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、酿酒酵母(Saccharomycescerevisiae)、扣囊复膜酵母(Saccharomycopsis fibuligera)、Brettanomycesbruxellensis和Cyberlindnera jadinii的酵母或真菌生物体。
10.权利要求1或9的多肽,其中所述葡糖淀粉酶氨基酸序列是酵母或真菌葡糖淀粉酶多肽的酶促活性部分。
11.权利要求2的多肽,其中所述葡糖淀粉酶氨基酸序列与SEQ ID NO:12的氨基酸19-515具有95%或更高、96%或更高、97%或更高、98%或更高或99%或更高序列相同性。
12.权利要求11的多肽,其中所述葡糖淀粉酶氨基酸序列与SEQ ID NO:12的氨基酸19-515具有100%相同性。
13.核酸,其包含编码权利要求1-12中任一项的多肽的核酸序列。
14.权利要求13的核酸,其与对应于SEQ ID NO:7的位置2769-4319的核苷酸序列具有75%或更高、或80%或更高、85%或更高、90%或更高、95%或更高或99%或更高序列相同性。
15.权利要求13的核酸,其与对应于SEQ ID NO:8的位置2769-4313的核苷酸序列具有75%或更高、或80%或更高、85%或更高、90%或更高、95%或更高或99%或更高序列相同性。
16.权利要求15-17中任一项的核酸,其还包含转录调节序列。
17.权利要求16的核酸,其中所述转录调节序列包含ADH启动子。
18.载体,其包含权利要求13-17中任一项的核酸。
19.权利要求18的载体,其包含用于在酵母中选择的营养缺陷型基因标记物。
20.宿主细胞,其表达权利要求1-12中任一项的多肽。
21.宿主细胞,其包含权利要求13-19中任一项的核酸或载体。
22.权利要求20或21的宿主细胞,其是酵母属(Saccharomyces)的物种。
23.权利要求22的宿主细胞,其为酿酒酵母(Saccharomyces cerevisiae)。
24.权利要求21-23中任一项的宿主细胞,其(a)对于在具有大于90g/L的乙醇浓度的发酵培养基中的生长耐受,(b)对于在高于33℃、诸如在34℃-40℃的范围内的温度下的生长耐受,或(a)和(b)两者。
25.发酵培养基,其包含权利要求1-12中任一项的多肽或权利要求20-24中任一项的宿主细胞。
26.权利要求1-12中任一项的多肽、权利要求20-24中任一项的宿主细胞或权利要求25的发酵培养基用于制备生物产物或饲料组合物的用途。
27.权利要求25的发酵培养基,其包含浓度为约90g/L或更高的乙醇。
28.权利要求27的发酵培养基,其包含浓度在90g/L至170g/L的范围内的乙醇。
29.从权利要求25、27或28中任一项的发酵培养基制备的饲料组合物。
30.权利要求29的饲料组合物,其通过包括以下步骤的方法制备:(a)从所述发酵培养基中除去生物产物的一些或全部以提供包含非生物产物固体的精制组合物,和(b)使用所述精制组合物用于形成饲料组合物。
31.用于生产发酵产物的发酵方法,其包括以下步骤:
发酵包含淀粉材料和非天然酵母的液体培养基,所述非天然酵母包含编码包含葡糖淀粉酶的多肽的外源核酸,
其中所述培养基具有2.25U或更大/克生物量的量的比葡糖淀粉酶活性,其中所述葡糖淀粉酶由非天然酵母提供。
32.权利要求31的发酵方法,其中所述培养基具有2.3U或更大、约2.35U或更大、约2.4U或更大、约2.45U或更大、约2.5U或更大、约2.6U或更大、约2.7U或更大、约2.8U或更大、约2.9U或更大、约3U或更大、约3.5U或更大、约4U或更大、约4.5U或更大、约5U或更大、约5.5U或更大、约6U或更大、约6.5U或更大、约7U或更大、约7.5U或更大或约8U或更大/克生物量的量的葡糖淀粉酶活性。
33.权利要求31的发酵方法,其中所述培养基具有约2.3U至约15U、约2.4U至约15U、约2.5U至约15U、约3U至约15U、约3.5U至约15U、约4U至约15U、约4.5U至约15U、约5U至约15U、约5.5U至约15U、约6U至约15U、约6.5U至约15U、约7U至约15U、约7.5U至约15U或约8U至约15U/克生物量的量的葡糖淀粉酶活性。
34.权利要求31-33中任一项的发酵方法,其中所述多肽包含葡糖淀粉酶部分和与所述葡糖淀粉酶部分异源的信号序列。
35.权利要求34的发酵方法,其中(a)所述信号序列与SEQ ID NO:10或SEQ ID NO:11具有90%或更高相同性,(b)所述葡糖淀粉酶氨基酸序列与SEQ ID NO:12的氨基酸19-515具有90%或更高序列相同性;或(a)和(b)两者。
36.权利要求31-35中任一项的发酵方法,其中所述发酵产物是乙醇。
37.权利要求36的发酵方法,其中在培养基中产生浓度为90g/L或更高的乙醇。
38.用于在培养基中产生浓度为90g/L或更高的乙醇的发酵方法,其包括以下步骤:
发酵包含淀粉材料和非天然酵母的液体培养基,所述非天然酵母包含编码多肽的外源核酸,所述多肽包含葡糖淀粉酶部分和与所述葡糖淀粉酶异源的信号序列,其中所述发酵在液体培养基中提供90g/L或更高的乙醇浓度。
39.权利要求38的方法,其中所述发酵提供90g/L至170g/L范围内的乙醇。
40.权利要求39的方法,其中所述发酵提供110g/L至170g/L范围内的乙醇。
41.权利要求40的方法,其中所述发酵提供125g/L至170g/L范围内的乙醇。
42.权利要求41的方法,其中所述发酵提供140g/L至170g/L范围内的乙醇。
43.权利要求38-42中任一项的方法,其中所述信号序列包含SEQ IDNO:13或SEQ IDNO:14。
CN201680009146.XA 2015-02-06 2016-02-05 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株 Pending CN107250163A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562112807P 2015-02-06 2015-02-06
US62/112,807 2015-02-06
PCT/US2016/016822 WO2016127083A1 (en) 2015-02-06 2016-02-05 Modified glucoamylase enzymes and yeast strains having enhanced bioproduct production

Publications (1)

Publication Number Publication Date
CN107250163A true CN107250163A (zh) 2017-10-13

Family

ID=55442872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680009146.XA Pending CN107250163A (zh) 2015-02-06 2016-02-05 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株

Country Status (6)

Country Link
US (2) US10364421B2 (zh)
EP (1) EP3253779A1 (zh)
CN (1) CN107250163A (zh)
BR (1) BR112017016821A2 (zh)
CA (1) CA2974539A1 (zh)
WO (1) WO2016127083A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114302952A (zh) * 2019-06-28 2022-04-08 丹尼斯科美国公司 过表达选择的内源蛋白的经修饰的酵母细胞

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2974539A1 (en) 2015-02-06 2016-08-11 Cargill, Incorporated Modified glucoamylase enzymes and yeast strains having enhanced bioproduct production
WO2016160584A1 (en) 2015-03-27 2016-10-06 Cargill, Incorporated Glucoamylase-modified yeast strains and methods for bioproduct production
MX2018002705A (es) 2015-09-04 2018-12-19 Lallemand Hungary Liquidity Man Llc Cepas de levadura para la expresion y secrecion de proteinas heterologas a altas temperaturas.
BR112019002238A2 (pt) 2016-08-05 2019-05-14 Cargill, Incorporated polipeptídeo e célula manipulados, e, método de fermentação.
CA3036837A1 (en) 2016-09-16 2018-03-22 Cargill, Incorporated Genetically modified lactate-consuming yeasts and fermentation processes using such genetically modified yeasts
CN110582567B (zh) 2017-05-04 2024-03-08 嘉吉公司 经遗传修饰的表达海藻糖酶的酵母及使用此类经遗传修饰的酵母的发酵方法
US11274310B2 (en) 2017-09-29 2022-03-15 Dsm Ip Assets B.V. Yeast cells for glycerol free ethanol production
CN111971379A (zh) 2018-02-28 2020-11-20 嘉吉公司 葡糖淀粉酶工程化酵母和发酵方法
CA3093378A1 (en) * 2018-03-09 2019-09-12 Danisco Us Inc Glucoamylases and methods of use thereof
MX2021015818A (es) * 2019-08-06 2022-02-03 Novozymes As Proteinas de fusion para mejorar la expresion de enzimas.
CN110592143A (zh) * 2019-09-06 2019-12-20 安徽省环境科学研究院 一种微生物絮凝剂的制备方法及其在红薯淀粉废水上的应用
CA3163108A1 (en) 2019-11-29 2021-06-03 Lallemand Hungary Liquidity Management Llc Yeast expressing heterologous glucoamylase
US20240026392A1 (en) * 2020-07-08 2024-01-25 Ginkgo Bioworks, Inc. Biosynthesis of cannabinoids and cannabinoid precursors
WO2023288234A1 (en) * 2021-07-12 2023-01-19 Xylogenics, Inc. Strains of saccharomyces cerevisiae that exhibit an increased ability to ferment oligosaccharides into ethanol without supplemental glucoamylase and methods of making and using the same
WO2024040001A1 (en) 2022-08-17 2024-02-22 Cargill, Incorporated Genetically modified yeast and fermentation processes for the production of ethanol
CN116769611A (zh) * 2023-05-30 2023-09-19 四川大学 一种产糖化酶的曲霉属菌株、糟醅发酵方法及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0228254A2 (en) * 1985-12-18 1987-07-08 Biotechnica International, Inc. Yeast secretion vectors
CN1478097A (zh) * 2000-12-01 2004-02-25 Wyeth 用于检测rgs蛋白质调节物的方法和细胞
US20070117186A1 (en) * 2005-11-24 2007-05-24 National Institute Of Advanced Industrial Science And Technology Highly efficient secretory signal peptide and a protein expression system using the peptide thereof
US8697412B2 (en) * 2011-11-28 2014-04-15 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4546082A (en) 1982-06-17 1985-10-08 Regents Of The Univ. Of California E. coli/Saccharomyces cerevisiae plasmid cloning vector containing the alpha-factor gene for secretion and processing of hybrid proteins
NZ207926A (en) 1983-04-25 1988-04-29 Genentech Inc Use of yeast #a#-factor to assist in expression of proteins heterologus to yeast
US4870008A (en) 1983-08-12 1989-09-26 Chiron Corporation Secretory expression in eukaryotes
US5422267A (en) 1984-05-22 1995-06-06 Robert R. Yocum Industrial yeast comprising an integrated glucoamylase gene
US6214577B1 (en) 1984-05-22 2001-04-10 Robert Rogers Yocum Yeast vectors conferring antibiotic resistance
ATE238425T1 (de) 1993-07-23 2003-05-15 Dsm Nv Selektionmarker-genfreie rekombinante stämme: verfahren zur ihrer herstellung und die verwendung dieser stämme
US5521086A (en) 1993-09-16 1996-05-28 Cephalon, Inc. Secretion sequence for the production of a heterologous protein in yeast
US5587290A (en) 1995-06-26 1996-12-24 The Regents Of The University Of California Stress tolerant yeast mutants
US8735544B1 (en) 1999-01-13 2014-05-27 Little Sioux Corn Processors, Llc Value added whole stillage by-products from an ethanol production process
US20040023349A1 (en) 2002-06-13 2004-02-05 Novozymes A/S Processes for making ethanol
DE10252245A1 (de) 2002-11-07 2004-05-27 Prof. Dr. Danilo Porro Università degli Studi di Milano-Bicocca Dipartimento die Biotechnologie e Bioscienze Verfahren zur Expression und Sekretion von Proteinen mittels der nicht-konventionellen Hefe Zygosaccharomyces bailii
US7314033B2 (en) 2004-11-18 2008-01-01 Massachusetts Institute Of Technology Fuel management system for variable ethanol octane enhancement of gasoline engines
US7785872B2 (en) 2004-12-08 2010-08-31 Simpson Biotech Co., Ltd. Nucleic acids for enhancing gene expression and use thereof
EP1945662A2 (en) 2005-11-10 2008-07-23 Receptor Biologix, Inc. Methods for production of receptor and ligand isoforms
WO2009029644A1 (en) 2007-08-27 2009-03-05 Cornell Research Foundation, Inc. Methods to improve alcohol tolerance of microorganisms
CN103695459A (zh) 2007-09-18 2014-04-02 巴斯夫植物科学有限公司 产量提高的植物
US8592194B2 (en) 2007-10-09 2013-11-26 Danisco Us Inc. Glucoamylase variants with altered properties
KR101178205B1 (ko) 2008-12-04 2012-08-29 게란티제약 주식회사 원형질융합에 의한 에탄올 저항성 균주, 이의 제조방법, 소디움메타게르마네이트를 이용한 고함량 바이오유기게르마늄을 함유한 효모의 제조방법 및 이에 의해 생산된 효모
US8394622B2 (en) 2009-08-10 2013-03-12 Pioneer Hi Bred International Inc Yeast strains for improved ethanol production
PE20121504A1 (es) 2009-08-19 2012-11-05 Dupont Nutrition Biosci Aps Variantes de glucoamilasa
US8733149B2 (en) 2010-01-20 2014-05-27 Arizona Board Of Regents, A Body Corporate Of The State Of Arizona, Acting For And On Behalf Of Arizona State University Film bulk acoustic wave resonator-based ethanol and acetone sensors and methods using the same
US8809060B2 (en) 2010-04-23 2014-08-19 Ewha University-Industry Collaboration Foundation Ethanol-resistant yeast gene, and use thereof
CA2801577A1 (en) 2010-06-03 2011-12-08 Mascoma Corporation Yeast expressing saccharolytic enzymes for consolidated bioprocessing using starch and cellulose
WO2012037215A2 (en) 2010-09-15 2012-03-22 Wisconsin Alumni Research Foundation Recombinant yeast with improved ethanol tolerance and related methods of use
FR2978146B1 (fr) 2011-07-21 2013-08-30 IFP Energies Nouvelles Procede de deshydratation de l'ethanol en ethylene a basse consommation energetique
DK2794641T3 (en) 2011-12-22 2017-03-13 Dupont Nutrition Biosci Aps POLYPEPTIDES WITH GLUCOAMYLASE ACTIVITY AND PROCEDURES FOR PREPARING IT
MX2015002099A (es) 2012-08-22 2015-05-11 Dupont Nutrition Biosci Aps Variantes que tienen actividad glucoamilasa.
BR112015011544B1 (pt) 2012-11-20 2022-08-16 Lallemand Hungary Liquidity Management Llc Microrganismo recombinante, composição compreendendo o mesmo, método de produção de etanol e co-cultura
DE102012221460A1 (de) 2012-11-23 2014-06-12 Beiersdorf Ag Verwendung von Triethylcitrat als Vergällungsmittel für Ethanol
BR102012029839A8 (pt) 2012-11-23 2018-05-22 Mendes De Oliveira Jadyr utilização de biocida natural no processo de produção de etanol de diversas fontes
MX2016001881A (es) 2013-08-15 2016-08-03 Lallemand Hungary Liquidity Man Llc Metodos para la mejora de rendimiento y produccion de producto en un microorganismo a traves del reciclaje de glicerol.
CA2974539A1 (en) * 2015-02-06 2016-08-11 Cargill, Incorporated Modified glucoamylase enzymes and yeast strains having enhanced bioproduct production
WO2016160584A1 (en) 2015-03-27 2016-10-06 Cargill, Incorporated Glucoamylase-modified yeast strains and methods for bioproduct production

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0228254A2 (en) * 1985-12-18 1987-07-08 Biotechnica International, Inc. Yeast secretion vectors
JPS62228284A (ja) * 1985-12-18 1987-10-07 バイオテクニカ・インタ−ナシヨナル・インコ−ポレ−テツド 酵母分泌ベクタ−
CN1478097A (zh) * 2000-12-01 2004-02-25 Wyeth 用于检测rgs蛋白质调节物的方法和细胞
US20070117186A1 (en) * 2005-11-24 2007-05-24 National Institute Of Advanced Industrial Science And Technology Highly efficient secretory signal peptide and a protein expression system using the peptide thereof
US8697412B2 (en) * 2011-11-28 2014-04-15 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GENEBANK: "glucoamylase [Saccharomycopsis fibuligera] GeneBank: CAC83969.1", 《GENEBANK》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114302952A (zh) * 2019-06-28 2022-04-08 丹尼斯科美国公司 过表达选择的内源蛋白的经修饰的酵母细胞

Also Published As

Publication number Publication date
US10724023B2 (en) 2020-07-28
BR112017016821A2 (pt) 2018-04-03
US10364421B2 (en) 2019-07-30
CA2974539A1 (en) 2016-08-11
EP3253779A1 (en) 2017-12-13
US20200048623A1 (en) 2020-02-13
US20180080014A1 (en) 2018-03-22
WO2016127083A1 (en) 2016-08-11

Similar Documents

Publication Publication Date Title
CN107250163A (zh) 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株
AU609783B2 (en) Novel fusion proteins and their purification
CA2683497C (en) .delta.8 desaturases and their use in making polyunsaturated fatty acids
RU2763170C2 (ru) Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом
KR102609858B1 (ko) 점액다당류증의 치료를 위한 아데노-관련 바이러스 벡터
KR102147005B1 (ko) Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN108026523B (zh) 向导rna组装载体
CA2774975C (en) Production of fatty acid derivatives in recombinant bacterial cells expressing an ester synthase variant
CN101437953B (zh) 用于改变含油生物的多不饱和脂肪酸和油含量的二酰基甘油酰基转移酶
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
KR20190025910A (ko) 조류 숙주 세포에 대한 crispr-cas 시스템
IL236992A (en) Genetically modified cyanobacteria that produce ethanol
CN101297042A (zh) 四碳醇的发酵生产
CN101617040A (zh) △17去饱和酶及其在制备多不饱和脂肪酸中的用途
KR20080071190A (ko) 델타-9 일롱가제, 및 다중불포화 지방산 생성에 있어서의이들의 용도
CN108431229A (zh) 糖转运蛋白修饰的酵母菌株和用于生物制品生产的方法
KR20200022486A (ko) 조작되고 완전-기능 맞춤 당단백질
KR20150042856A (ko) 클라빈-유형 알칼로이드의 생산을 위한 유전자 및 방법
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
KR20110039258A (ko) 개선된 단백질 발현계
CN115927299A (zh) 增加双链rna产生的方法和组合物
CN101802183A (zh) 高保真度限制性内切核酸酶
CN112430622A (zh) 一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法
DK2475679T3 (da) Forbedrede, optimerede stammer af yarrowia lipolytica til fremstilling af højkoncentreret eicosapentaensyre
KR20140000711A (ko) 수크로스 이용에 있어서의 야로위아 리포라이티카에서의 사카로마이세스 세레비지애 suc2 유전자의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171013

WD01 Invention patent application deemed withdrawn after publication