CN108473968A - 生产植物鞘氨醇或二氢神经鞘氨醇的方法 - Google Patents

生产植物鞘氨醇或二氢神经鞘氨醇的方法 Download PDF

Info

Publication number
CN108473968A
CN108473968A CN201680048756.0A CN201680048756A CN108473968A CN 108473968 A CN108473968 A CN 108473968A CN 201680048756 A CN201680048756 A CN 201680048756A CN 108473968 A CN108473968 A CN 108473968A
Authority
CN
China
Prior art keywords
leu
protein
ser
gene
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680048756.0A
Other languages
English (en)
Inventor
M.施瓦布
M.巴鲍
D.费希尔
A.哈奇
S.D.A.P.塔瓦雷斯
C.A.F.尼尔森
J.克莱恩
C.D.沃德南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iwar Ltd By Share Ltd
Ajinomoto Co Inc
Original Assignee
Iwar Ltd By Share Ltd
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iwar Ltd By Share Ltd, Ajinomoto Co Inc filed Critical Iwar Ltd By Share Ltd
Publication of CN108473968A publication Critical patent/CN108473968A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • C12P1/02Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/01091Sphinganine kinase (2.7.1.91)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/11Protein-serine/threonine kinases (2.7.11)
    • C12Y207/11001Non-specific serine/threonine protein kinase (2.7.11.1), i.e. casein kinase or checkpoint kinase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C215/00Compounds containing amino and hydroxy groups bound to the same carbon skeleton
    • C07C215/02Compounds containing amino and hydroxy groups bound to the same carbon skeleton having hydroxy groups and amino groups bound to acyclic carbon atoms of the same carbon skeleton
    • C07C215/04Compounds containing amino and hydroxy groups bound to the same carbon skeleton having hydroxy groups and amino groups bound to acyclic carbon atoms of the same carbon skeleton the carbon skeleton being saturated
    • C07C215/06Compounds containing amino and hydroxy groups bound to the same carbon skeleton having hydroxy groups and amino groups bound to acyclic carbon atoms of the same carbon skeleton the carbon skeleton being saturated and acyclic
    • C07C215/10Compounds containing amino and hydroxy groups bound to the same carbon skeleton having hydroxy groups and amino groups bound to acyclic carbon atoms of the same carbon skeleton the carbon skeleton being saturated and acyclic with one amino group and at least two hydroxy groups bound to the carbon skeleton
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07FACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
    • C07F9/00Compounds containing elements of Groups 5 or 15 of the Periodic Table
    • C07F9/02Phosphorus compounds
    • C07F9/06Phosphorus compounds without P—C bonds
    • C07F9/08Esters of oxyacids of phosphorus
    • C07F9/09Esters of phosphoric acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Botany (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Oil, Petroleum & Natural Gas (AREA)

Abstract

提供了使用酵母生产目标物质例如植物鞘氨醇和二氢神经鞘氨醇的方法。通过在培养基中培养具有生产目标物质的能力并以使由LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式进行了修饰的酵母,和从酵母的细胞和/或培养基收集目标物质来生产目标物质。

Description

生产植物鞘氨醇或二氢神经鞘氨醇的方法
技术领域
本发明涉及使用酵母生产目标物质例如植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)的方法。PHS和DHS作为药物、化妆品等的成分在工业上有用。
背景技术
已经尝试使用生物工程技术生产鞘氨醇碱和鞘脂类。作为使用生物工程技术生产鞘氨醇碱和鞘脂类的方法,已经报道了使用酵母的方法(JP2014-529400)。
LCB4基因编码主要鞘氨醇碱激酶。报道了LCB4基因是从鞘氨醇碱合成神经酰胺的关键调节分子(J Biol Chem.2003Feb 28;278(9):7325-34.)。CKA2基因编码酪蛋白激酶2的α’亚基。报道了CKA2基因对于神经酰胺合酶的完全活化是必需的(EukaryotCell.2003Apr;2(2):284-94.)
发明简述
本发明实现的目标
本发明的目标是开发新的技术,其用于改善酵母的目标物质例如植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)的生产,并从而提供高效地生产目标物质的方法。
实现目标的手段
为了实现上述目标,本发明的发明人进行了研究。结果,本发明人发现通过以使LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式对酵母进行修饰,能够改善酵母生产目标物质例如植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)的能力,从而完成了本发明。
也就是说,本发明可以例如如下实施:
[1]生产目标物质的方法,所述方法包括:
在培养基中培养具有生产所述目标物质的能力的酵母;和
从所述酵母的细胞和/或所述培养基收集所述目标物质,
其中以使由LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式对所述酵母进行了修饰,且
其中所述目标物质选自植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)。
[2]上述方法,其中通过弱化所述LCB4和/或CKA2基因的表达,或通过破坏所述LCB4和/或CKA2基因来降低所述蛋白质的活性。
[3]上述方法,其中通过使所述LCB4和/或CKA2基因缺失来降低所述蛋白质的活性。
[4]上述方法,其中由所述LCB4基因编码的蛋白质是下述(A)、(B)或(C)中定义的蛋白质:
(A)包含SEQ ID NO:10的氨基酸序列的蛋白质;
(B)包含SEQ ID NO:10的氨基酸序列但包括1至10个氨基酸残基的取代、缺失、插入和/或添加,并具有鞘氨醇碱激酶活性的蛋白质;
(C)包含与SEQ ID NO:10的氨基酸序列显示90%或更高的同一性的氨基酸序列,并具有鞘氨醇碱激酶活性的蛋白质。
[5]上述方法,其中由所述CKA2基因编码的蛋白质是下述(A)、(B)或(C)中定义的蛋白质:
(A)包含SEQ ID NO:16的氨基酸序列的蛋白质;
(B)包含SEQ ID NO:16的氨基酸序列但包括1至10个氨基酸残基的取代、缺失、插入和/或添加,并具有酪蛋白激酶2活性的蛋白质;
(C)包含与SEQ ID NO:16的氨基酸序列显示90%或更高的同一性的氨基酸序列,并具有酪蛋白激酶2活性的蛋白质。
[6]上述方法,其中以使一种或多种蛋白质的表达和/或活性降低的方式对所述酵母进行了进一步的修饰,所述一种或多种蛋白质选自由LCB5、ELO3、ORM2和CHA1基因编码的蛋白质。
[7]上述方法,其中通过弱化编码所述一种或多种蛋白质的相应基因的表达或通过破坏编码所述一种或多种蛋白质的相应基因来降低所述一种或多种蛋白质的活性。
[8]上述方法,其中通过使编码所述一种或多种蛋白质的相应基因缺失来降低所述一种或多种蛋白质的活性。
[9]上述方法,其中以使一种或多种蛋白质的表达和/或活性增加的方式对所述酵母进行了进一步的修饰,所述一种或多种蛋白质选自由LCB1、LCB2、TSC10和SUR2基因编码的蛋白质。
[10]上述方法,其中通过增加编码所述一种或多种蛋白质的相应基因的表达来增加所述一种或多种蛋白质的活性。
[11]上述方法,其中通过以增加所述基因的拷贝数的方式进行修饰和/或通过修饰所述基因的表达控制序列来增加所述基因的表达。
[12]上述方法,其中所述植物鞘氨醇选自C16PHS、C18PHS,C20PHS、C18:1PHS、C20:1PHS、4-(羟甲基)-2-甲基-6-十四酰-1,3-恶嗪烷-5-醇和4-(羟甲基)-2-甲基-6-十六酰-1,3-恶嗪烷-5-醇。
[13]上述方法,其中所述培养基含有能够联合、结合、增溶和/或捕获所述目标物质的添加剂。
[14]上述方法,其中所述添加剂选自环糊精和沸石。
[15]上述方法,其中所述酵母属于酵母属。
[16]上述方法,其中所述酵母是酿酒酵母。
[17]上述方法,其中所述酵母能够在培养基或所述酵母的细胞中以比未修饰的菌株可获得的量更大的量生产和积累所述目标物质。
附图简述
[图1]该图显示了关于小规模培养中的PHS生产的数据。PHS:鞘脂类途径基因LCB1、LCB2、TSC10和SUR2。
[图2]该图显示了使用菌株EVST20240的生物反应器发酵的数据。
发明详述
以下将对本发明进行详细描述。
本发明的方法是用于生产目标物质的方法,其包括在培养基中培养具有生产目标物质的能力的酵母,和从酵母的细胞和/或培养基收集目标物质,其中以使由LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式对所述酵母进行了修饰。用于本发明的方法的酵母也称为“本发明的酵母”。
<1>本发明的酵母
本发明的酵母是具有生产目标物质的能力的酵母,其以使由LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式的方式进行了修饰。“生产目标物质的能力”也可以称为“目标物质生产能力”。
<1-1>具有目标物质生产能力的酵母
在本发明中,术语“具有目标物质生产能力的酵母”是指当在培养基中培养酵母时,能够在培养基或酵母的细胞中以能够收集目标物质的程度生产并积累目标物质的酵母。培养基可以是能够在本发明的方法中使用的培养基,且特别可以是含有能够联合、结合、增溶和/或捕获目标物质的添加剂的培养基。具有目标物质生产能力的酵母也可以是能够在培养基或酵母的细胞中以比未修饰的菌株可获得的量更大的量生产和积累目标物质的酵母。术语“未修饰的菌株”可以指没有以赋予或增强目标物质生产能力的方式进行修饰的参照菌株,且特别是可以指没有以使由LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式的方式进行了修饰的参照菌株。未修饰的菌株的实例包括野生型菌株和亲本菌株,例如酿酒酵母菌株BY4742(ATCC201389;EUROSCARF Y10000),S288C(ATCC 26108)和NCYC3608。具有目标物质生产能力的酵母还可以是能够在培养基中以下述量生产和积累目标物质的酵母,所述量优选为5mg/L或更多,更优选为10mg/L或更多。
在本发明中,目标物质选自植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)。
植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)各自包含具有C2处的氨基和羟基的长烷基链。构成目标物质的烷基链的长度和不饱和度可以变化。烷基链可以具有例如C16,C18或C20的长度。烷基链可以具有一个或多个不饱和双键。也就是说,目标物质的实例还包括植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)的变体种类,该变体种类具有不同的长度和/或不同的不饱和度。术语“植物鞘氨醇(PHS)”可以指C18PHS,其是PHS的典型种类,或者可以共同指PHS的变体种类,例如具有饱和C16烷基链的C16PHS;具有饱和C18烷基链的C18PHS;和具有饱和C20烷基链的C20PHS;具有含有一个不饱和双键的C18烷基链的C18:1PHS;和具有含有一个不饱和双键的C20烷基链的C20:1PHS。术语“植物鞘氨醇(PHS)”还可以包括PSH的加合物,例如4-(羟甲基)-2-甲基-6-十四酰-1,3-恶嗪烷-5-醇和4-(羟甲基)-2-甲基-6-十六酰-1,3-恶嗪烷-5-醇,其可以分别经由C18PHS和C20PHS与乙醛的反应生成。相似的,术语“二氢神经鞘氨醇(DHS)”可以指C18DHS,其是DHS的典型种类并且具有饱和的C18烷基链,或者可以总的指DHS的此类变体种类。
要生产的目标物质可以是游离化合物,其盐或其混合物。也就是说,在本发明中,术语“目标物质”可以指游离形式的目标物质,其盐或其混合物。盐的实例包括例如无机酸盐如硫酸盐,盐酸盐和碳酸盐,以及有机酸盐如乳酸盐和乙醇酸盐(Acta DermVenereol.2002;82(3):170-3)。作为目标物质的盐,可以使用一种盐,或者可以使用两种或更多种盐。
酵母没有特别的限制,只要其能够用于本发明的方法即可。酵母可以是出芽酵母,或者可以是裂殖酵母。酵母可以是单倍体酵母,或者可以是二倍体或多倍体酵母。
酵母的实例包括属于酵母属(Saccharomyces)的酵母,如酿酒酵母(Saccharomyces cerevisiae),毕赤酵母属(也称为Wickerhamomyces属),如Pichiaciferrii,Pichia sydowiorum和巴斯德毕赤酵母(Pichia pastoris),假丝酵母属如产朊假丝酵母属(Candida utilis),汉逊酵母如多形汉逊酵母(Hansenula polymorpha),裂殖酵母属(Schizosaccharomyces)如粟酒裂殖酵母(Schizosaccharomyces pombe)。毕赤酵母属的一些物种已被重新分类到Wickerhamomyces属(Int J Syst EvolMicrobiol.2014Mar;64(Pt 3):1057-61)。因此,例如,Pichia ciferrii和Pichiasydowiorum也分别称为Wickerhamomyces ciferrii和Wickerhamomyces sydowiorum。在本发明中,术语“毕赤酵母”应该包括已经分类到毕赤酵母属中但已经重新分类到另一属例如Wickerhamomyces中的物种。
酿酒酵母的具体实例包括菌株BY4742(ATCC 201389;EUROSCARF Y10000),S288C(ATCC 26108),Y006(FERM BP-11299),NCYC 3608,及其衍生菌株。Pichia ciferrii(Wickerhamomyces ciferrii)的具体实例包括菌株NRRL Y-1031(ATCC 14091),菌株CS.PCΔPro2(Schorsch et al.,2009,Curr Genet.55,381-9.),WO 95/12683中公开的菌株,及其衍生菌株。Pichia sydowiorum(Wickerhamomyces sydowiorum)的具体实例包括菌株NRRL Y-7130(ATCC 58369)及其衍生菌株。
这些菌株可以从例如美国典型培养物保藏中心(ATCC,地址:12301 ParklawnDrive,Rockville,Maryland 20852,PO Box 1549,Manassas,VA 20108,United States ofAmerica),欧洲酿酒酵母功能分析档案馆(EUROpean Saccharomyces Cerevisiae ARchivefor Functional Analysis)(EUROSCARF,地址:Institute for Molecular Biosciences,Johann Wolfgang Goethe-University Frankfurt,Max-von-Laue Str.9;Building N250,D-60438Frankfurt,Germany),国家酵母菌保藏中心(NCYC,地址:Institute of FoodResearch,Norwich Research Park,Norwich,NR4 7UA,UK),或对应保藏菌株的保藏机构获得。也就是说,例如在ATCC菌株的情况下,将登录号分配给相应菌株,并且可以通过使用这些登录号来购买菌株(参见http://www.atcc.org/)。美国典型培养物保藏中心(ATCC)的目录中列出了菌株的登录号。
本发明的酵母可以是固有具有目标物质生产能力的酵母,或者可以是修饰成具有目标物质生产能力的酵母。可以通过赋予如上所述的酵母以目标物质生产能力,或者通过提高如上所述的酵母的目标物质生产能力来获得具有目标物质生产能力的酵母。
以下,具体例示赋予或提高目标物质生产能力的方法。用于赋予或增强目标物质生产能力的所有修饰可以独立使用或以任何适当的组合使用。用于构建本发明的酵母的修饰可以以任意顺序进行
可以以使参与目标物质生产的一种或多种蛋白质的表达和/或活性增加或降低的方式对酵母进行修饰来赋予或增强目标物质生产能力。也就是说,可以以使参与目标物质生产的一种或多种蛋白质的表达和/或活性增加或降低的方式对本发明的酵母进行修饰。术语“蛋白质”也包括所谓的肽例如多肽。参与目标物质生产的蛋白质的实例包括催化目标物质合成的酶(也称为“目标物质的生物合成酶”),催化从目标物质的生物合成途径分支的反应以生成除目标物质之外的化合物的酶(也称为“副产物的生物合成酶”),催化目标物质的降解的酶(也称为“目标物质的降解酶”),以及影响例如增加或降低酶例如上述那些酶的活性的蛋白质。
可以适当地选择要增加或降低表达和/或活性的蛋白质,其取决于目标物质的类型以及参与目标物质生产且本发明的酵母固有保持的蛋白质的类型和活性。例如,可以优选增加选自目标物质的生物合成酶的一种或多种蛋白质的表达和/或活性。另外,例如,可以优选降低选自副产品的生物合成酶和目标物质的降解酶的一种或多种蛋白质的表达和/或活性。
将在下文中描述用于增加或降低蛋白质的表达和/或活性的方法。可以通过例如增加编码蛋白质的基因的表达来增加蛋白质的活性。可以通过例如弱化编码蛋白质的基因的表达或破坏编码蛋白质的基因来降低蛋白质的活性。基因的表达也称为“蛋白质的表达(即由基因编码的蛋白质)”。此类增加或降低蛋白质的表达和/或活性的方法是本领域中公知的。
参与目标物质生产的蛋白质的具体实例包括由以下基因编码的蛋白质:LCB1,LCB2,TSC10,SUR2,LCB4,LCB5,ELO3,CKA2,ORM2和CHA1基因。这些基因可以总地称为“靶基因”,而由其编码的蛋白质可以总地称为“靶蛋白质”。
本发明的酵母至少以使由LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式进行了修饰。表述“由LCB4和CKA2基因编码的蛋白质的活性降低”可以特别是表示LCB4基因和/或CKA2基因的表达弱化,或LCB4基因和/或CKA2基因被破坏。由LCB4和CKA2基因编码的蛋白质的表达和/或活性降低导致目标物质生产能力的增加,并从而导致目标物质的生产增加。可以以使LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式对具有目标物质生产能力的酵母进行修饰获得本发明的酵母。也可以以使LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式对酵母进行修饰,然后赋予或提高目标物质生产能力来获得本发明的酵母。本发明的酵母也可以是通过使LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式进行修饰获得了目标物质生产能力的酵母。
可以以使选自由LCB1、LCB2、TSC10和SUR2基因编码的蛋白质的一种或多种蛋白质的表达和/或活性增加的方式,和/或使选自由LCB5、ELO3、ORM2和CHA1基因编码的蛋白质的一种或多种蛋白质的表达和/或活性降低的方式修饰本发明的酵母。表述“选自由LCB1、LCB2、TSC10和SUR2基因编码的蛋白质的一种或多种蛋白质的表达和/或活性增加”可以特别是表示选自LCB1、LCB2、TSC10和SUR2基因的一种或多种基因的表达增加。表述“选自由LCB5、ELO3、ORM2和CHA1基因编码的蛋白质的一种或多种蛋白质的表达和/或活性降低”可以特别是表示选自LCB5、ELO3、ORM2和CHA1基因的一种或多种基因的表达弱化,或选自LCB5、ELO3、ORM2和CHA1基因的一种或多种基因被破坏。
LCB1和LCB2基因编码丝氨酸棕榈酰基转移酶。术语“丝氨酸棕榈酰基转移酶”指具有催化从丝氨酸和棕榈酰基-CoA合成3-酮二氢神经鞘氨醇的活性(EC 2.3.1.50)的蛋白质。该活性可以称为“丝氨酸棕榈酰基转移酶活性”。由LCB1和LCB2基因编码的蛋白质分别可以称为“Lcb1p”和“Lcb2p”。LCB1和LCB2基因的实例包括酵母例如酿酒酵母和Pichiaciferrii的那些。酿酒酵母S288C的LCB1和LCB2基因的核苷酸序列如SEQ ID NO:1和3所示,且由其编码的Lcb1p和Lcb2p的氨基酸序列如SEQ ID NO:2和4所示。Lcb1p和Lcb2p可以形成异二聚体以作为丝氨酸棕榈酰基转移酶发挥功能(Plant Cell.2006 Dec;18(12):3576-93.)。可以增加Lcb1p和Lcb2p之一或两者的活性。Lcb1p和Lcb2p之一或两者的活性增加可以特别是表示丝氨酸棕榈酰基转移酶活性增加。可以通过例如已知方法测量棕榈酰基转移酶活性(J Biol Chem.2000Mar 17;275(11):7597-603.)。
TSC10基因编码3-脱氢二氢神经鞘氨醇还原酶。术语“3-脱氢二氢神经鞘氨醇还原酶”指在存在电子供体例如NADPH的情况下具有催化3-酮二氢神经鞘氨醇转化为二氢鞘氨醇(二氢神经鞘氨醇)的活性(EC 1.1.1.102)的蛋白质。该活性可以称为“3-脱氢二氢神经鞘氨醇还原酶活性”。由TSC10基因编码的蛋白质可以称为“Tsc10p”。TSC10基因的实例包括酵母例如酿酒酵母和Pichia ciferrii的那些。酿酒酵母S288C的TSC10基因的核苷酸序列如SEQ ID NO:5所示,且由其编码的Tsc10p的氨基酸序列如SEQ ID NO:6所示。可以增加Tsc10p的活性。Tsc10p的活性增加可以特别是表示3-脱氢二氢神经鞘氨醇还原酶活性增加。可以通过例如已知方法测量3-脱氢二氢神经鞘氨醇还原酶活性(Biochim BiophysActa.2006Jan;1761(1):52-63.)。
SUR2(SYR2)基因编码鞘氨醇羟化酶。术语“鞘氨醇羟化酶”是指具有催化鞘氨醇碱的羟基化或神经酰胺的鞘氨醇碱部分的羟基化的活性(EC1.-.-.-)的蛋白质。该活性可以称为“鞘氨醇羟化酶活性”。鞘氨醇羟化酶可以催化例如二氢鞘氨醇(DHS;二氢神经鞘氨醇)羟基化以形成植物鞘氨醇(PHS),或含有DHS的神经酰胺(二氢神经酰胺)的羟基化以形成含有PHS的神经酰胺(植物神经酰胺)。由SUR2基因编码的蛋白质可以称为“Sur2p”。SUR2基因的实例包括酵母例如酿酒酵母和Pichia ciferrii的那些。酿酒酵母S288C的SUR2基因的核苷酸序列如SEQ ID NO:7所示,且由其编码的Sur2p的氨基酸序列如SEQ ID NO:8所示。Pichia ciferrii的SUR2基因的核苷酸序列如SEQ ID NO:21所示,且由其编码的Sur2p的氨基酸序列如SEQ ID NO:22所示。在例如生产PHS的情况下可以增加Sur2p的活性。Sur2p的活性增加可以特别是表示鞘氨醇羟化酶的活性增加。可以通过例如将酶与DHS或二氢神经酰胺孵育并测定PHS或植物神经酰胺的酶依赖生产来测量鞘氨醇羟化酶活性。
LCB4和LCB5基因编码鞘氨醇碱激酶。术语“鞘氨醇碱激酶”指具有催化鞘氨醇碱的磷酸化以形成鞘氨醇碱磷酸的活性(EC 2.7.1.91)的蛋白质。该活性可以称为“鞘氨醇碱激酶活性”。由LCB4和LCB5基因编码的蛋白质可以分别称为“Lcb4p”和“Lcb5p”。酿酒酵母S288C的LCB4和LCB5基因的核苷酸序列如SEQ ID NO:9和11所示,且由其编码的Lcb4p和Lcb5p的氨基酸序列如SEQ ID NO:10和12所示。在这些中,Lcb4p是酿酒酵母中的主要鞘氨醇碱激酶(J Biol Chem.2003Feb 28;278(9):7325-34.)。可以降低至少Lcb4p的活性。也可以降低Lcb5p的活性。Lcb4p和Lcb5p之一或两者的活性降低可以特别是表示鞘氨醇碱激酶活性降低。可以通过例如已知的方法测量鞘氨醇碱激酶活性(Plant Physiol.2005Feb;137(2):724-37.)。
ELO3基因编码脂肪酸延长酶III。术语“脂肪酸延长酶III”是指具有催化C18-CoA的延长以形成C20-C26-CoA的活性(EC 2.3.1.199)的蛋白质。该活性可以称为“脂肪酸延长酶III活性”。C26-CoA可以优选用于由神经酰胺合酶催化的神经酰胺的合成。由ELO3基因编码的蛋白质可以称为“Elo3p”。酿酒酵母S288C的ELO3基因的核苷酸序列如SEQ ID NO:13所示,且由其编码的Elo3p的氨基酸序列如SEQ ID NO:14所示。可以降低Elo3p的活性。Elo3p的活性降低可以特别是表示脂肪酸延长酶III活性降低。可以通过例如已知的方法测量脂肪酸延长酶III活性(J Biol Chem.1997Jul 11;272(28):17376-84.)。
CKA2基因编码酪蛋白激酶2的α’亚基。术语“酪蛋白激酶2”是指具有催化蛋白质的丝氨酸/苏氨酸选择性磷酸化的活性(EC 2.7.11.1)的蛋白质。该活性可以称为“酪蛋白激酶2活性”。由CKA2基因编码的蛋白质可以称为“Cka2p”。酿酒酵母S288C的CKA2基因的核苷酸序列如SEQ ID NO:15所示,且由其编码的Cka2p的氨基酸序列如SEQ ID NO:16所示。Cka2p可以与CKA1、CKB1和CKB2基因产物即Cka1p、Ckb1p和Ckb2p组合形成异四聚体,以作为酪蛋白激酶2发挥功能。Cka2p对于神经酰胺合酶的完全活化可以是需要的(EukaryotCell.2003Apr;2(2):284-94.)。可以降低Cka2p的活性。Cka2p的活性降低可以特别是表示酪蛋白激酶2的活性降低。另外,Cka2p的活性降低可以特别是表示神经酰胺合酶活性降低。可以通过例如已知的方法测量酪蛋白激酶2活性(Gene.1997Jun 19;192(2):245-50.)。
ORM2基因编码调节丝氨酸棕榈酰基转移酶活性的膜蛋白。由ORM2基因编码的蛋白质可以称为“Orm2p”。酿酒酵母S288C的ORM2基因的核苷酸序列如SEQ ID NO:17所示,且由其编码的Orm2p的氨基酸序列如SEQ ID NO:18所示。可以降低Orm2p的活性。Orm2p的活性降低可以特别是表示丝氨酸棕榈酰基转移酶活性增加。
CHA1基因编码L-丝氨酸/L-苏氨酸脱氨酶。术语“L-丝氨酸/L-苏氨酸脱氨酶”是指具有催化L-丝氨酸和L-苏氨酸的降解反应的活性(EC 4.3.1.17和EC 4.3.1.19)的蛋白质。该活性可以称为“L-丝氨酸/L-苏氨酸脱氨酶活性”。由CHA1基因编码的蛋白质可以称为“Cha1p”。酿酒酵母S288C的CHA1基因的核苷酸序列如SEQ ID NO:19所示,且由其编码的Cha1p的氨基酸序列如SEQ ID NO:20所示。可以降低Cha1p的活性。Cha1p的活性降低可以特别是表示L-丝氨酸/L-苏氨酸脱氨酶活性降低。可以通过例如已知的方法测量L-丝氨酸/L-苏氨酸脱氨酶活性(Eur J Biochem.1982Apr;123(3):571-6.)。
靶基因和蛋白质即LCB1、LCB2、TSC10、SUR2、LCB4,LCB5,ELO3,CKA2,ORM2,和CHA1基因以及由其编码的蛋白质可以具有上述核苷酸和氨基酸序列。表述“基因或蛋白质具有核苷酸或氨基酸序列”包含了其中基因或蛋白质包含核苷酸或氨基酸序列的情况以及其中基因或蛋白质由核苷酸或氨基酸序列组成的情况。
靶基因可以是上述例示的相应基因的变体,只要保持其原始功能。相似的,靶蛋白质可以是上述例示的相应蛋白质的变体,只要保持其原始功能。此类保持其原始功能的变体也可以称为“保守变体”。除上述例示的相应基因外,术语“LCB1”,“LCB2”,“TSC10”,“SUR2”,“LCB4”,“LCB5”,“ELO3”,“CKA2”,“ORM2”,和“CHA1”基因包括其保守变体。相似的,除上述例示的相应蛋白质外,术语“Lcb1p”,“Lcb2p”,“Tsc10p”,“Sur2p”,“Lcb4p”,“Lcb5p”,“Elo3p”,“Cka2p”,“Orm2p”,和“Cha1p”包括其保守变体。也就是说,例如术语“LCB1基因”包括上述例示的LCB1基因例如酿酒酵母的LCB1基因,且还包括其变体。相似的,例如术语“Lcb1蛋白”包括上述例示的Lcb1蛋白例如由酿酒酵母的LCB1基因编码的蛋白质,且还包括其变体。保守变体的实例包括例如对上述例示的靶基因和蛋白质的同系物和人工修饰形式。生成基因或蛋白质的变体的方法是本领域中公知的。
表述“保持原始功能”表示基因或蛋白质的变体具有对应于原始基因或蛋白质的功能(例如活性或性质)的功能(例如活性或性质)。关于基因的表述“保持原始功能”表示基因的变体编码维持原始功能的蛋白质。关于蛋白质的表述“维持原始功能”表示蛋白质的变体具有对应的功能例如以上例示的活性或性质。也就是说,关于靶蛋白质的表述“维持原始功能”可以表示对于Lcb1p和Lcb2p变体蛋白质具有丝氨酸棕榈酰基转移酶活性;对于Tsc10变体蛋白质具有3-脱氢二氢神经鞘氨醇还原酶活性;对于Sur2p变体蛋白质具有鞘氨醇羟化酶活性;对于Lcb4p和Lcb5p变体蛋白质具有鞘氨醇碱激酶活性;对于Elo3p变体蛋白质具有脂肪酸延长酶III活性;对于Cka2p变体蛋白质具有酪蛋白激酶2活性;对于Orm2p变体蛋白质具有调节丝氨酸棕榈酰基转移酶活性的性质;和对于Cha1p变体蛋白质具有L-丝氨酸/L-苏氨酸脱氨酶活性。另外,关于Cka2p的表述“保持原始功能”也可以表示蛋白质的变体具有以下性质,即其活性降低导致神经酰胺合酶活性降低。另外,关于Orm2p的表述“保持原始功能”也可以表示蛋白质的变体具有以下性质,即其活性降低导致丝氨酸棕榈酰转移酶活性增加。在靶蛋白质作为由多个亚基组成的复合物发挥功能的情况下,关于靶蛋白质的表述“维持原始功能”也可以表示蛋白质变体与其它适合的亚组组合展现出对应的功能例如以上例示的活性和性质。也就是说,例如关于Lcb1p的表述“维持原始功能”也可以表示变体蛋白质与适合的Lcb2p组合具有丝氨酸棕榈酰基转移酶活性,而关于Lcb2p的表述“维持原始功能”也可以表示变体蛋白质与适合的Lcb1p组合具有丝氨酸棕榈酰基转移酶活性。
此后,将例示保守变体。
可以从公共数据库容易地获得以上例示的基因的同系物或以上例示的蛋白质的同系物,其例如通过使用以上例示的任何基因的核苷酸序列或以上例示的任何蛋白质的氨基酸序列作为查询序列的BLAST搜索或FASTA搜索。此外,以上例示的基因的同系物例如可以通过以下获得:使用生物体例如酵母的染色体作为模板,和基于以上例示的任何基因的核苷酸序列制备的寡核苷酸作为引物的PCR。
靶基因可以各自是编码蛋白质的基因,所述蛋白质具有任何上述氨基酸序列但包括一个或几个位置处的一个或几个氨基酸残基的取代、缺失、插入和/或添加,只要保持初始功能即可。例如,可以延长或缩短编码的蛋白质的N端和/或C末端。尽管上文使用的术语“一个或几个”所指的数字可以根据蛋白质的三维结构中的氨基酸残基的位置或氨基酸残基的类型而不同,具体地,例如其是1至50、1至40或1至30,优选1至20、更优选1至10、还更优选1至5、特别优选1至3。
一个或几个氨基酸残基的上述取代,缺失,插入或添加是保持蛋白质正常功能的保守突变。保守突变的典型例子是保守取代。保守取代是以下突变,其中如果取代位点是芳香族氨基酸,取代在Phe,Trp,和Tyr之间相互发生;如果其是疏水性氨基酸,取代发生在Leu,Ile,和Val之间;如果其是极性氨基酸,取代发生在Gln和Asn之间;如果其是碱性氨基酸,发生在Lys,Arg,和His之间;如果其是酸性氨基酸,发生在Asp和Glu之间;以及如果其是具有羟基的氨基酸,取代发生在Ser和Thr之间。认为是保守取代的取代的实例特别包括用Ser或Thr取代Ala、用Gln,His或Lys取代Arg、用Glu,Gln,Lys,His或Asp取代Asn、用Asn,Glu或Gln取代Asp、用Ser或Ala取代Cys、用Asn,Glu,Lys,His,Asp或Arg取代Gln、用Gly,Asn,Gln,Lys或Asp取代Glu、用Pro取代Gly、用Asn,Lys,Gln,Arg或Tyr取代His、用Leu,Met,Val或Phe取代Ile、用Ile,Met,Val或Phe取代Leu、用Asn,Glu,Gln,His或Arg取代Lys、用Ile,Leu,Val或Phe取代Met、用Trp,Tyr,Met,Ile或Leu取代Phe、用Thr或Ala取代Ser、用Ser或Ala取代Thr、用Phe或Tyr取代Trp、用His,Phe或Trp取代Tyr,以及用Met,Ile,或Leu取代Val。此外,上述此类氨基酸残基取代,缺失,插入或添加包括由于个体差异,或基因来源于的细菌的物种差异所带来的天然存在的突变(突变体或变体)。
此外,靶基因各自可以是编码蛋白质的基因,所述蛋白质与上述任何总氨基酸序列显示80%或更高,优选90%或更高,更优选95%或更高,还更优选97%或更高,特别优选99%或更高的同源性,只要维持原始功能即可。另外在本说明书中,“同源性”表示“同一性”。
此外,靶基因各自可以是在严格条件下与可由任何前述核苷酸序列制备的探针,例如与任何上述核苷酸序列的整个序列或部分序列互补的序列杂交的DNA,只要保持初始功能。术语“严格条件”指形成所谓的特异性杂交物,并且不形成非特异性杂交物的条件。严格条件的例子包括那些在该条件下高度同源的DNA彼此杂交,例如不低于80%同源,优选不低于90%同源,更优选不低于95%同源,进一步更优选不低于97%同源,特别优选不低于99%同源的DNA,彼此杂交,并且低于上述同源的DNA彼此不杂交的条件,或者典型的Southern杂交的洗涤条件,即,在对应于1x SSC,0.1%SDS在60℃,优选0.1x SSC,0.1%SDS在60℃,更优选0.1x SSC,0.1%SDS在68℃的盐浓度和温度下洗涤一次,优选两次或三次的条件。
用于上述杂交的探针可以是与上述基因互补的序列的一部分。此类探针可以通过使用基于已知基因的序列制备的寡核苷酸作为引物,和含有核苷酸序列的DNA片段作为模板的PCR来制备。作为探针,例如可以使用具有约300bp的长度的DNA片段。当具有约300bp的长度的DNA片段用作探针时,具体的杂交的洗涤条件例如可以是50℃,2x SSC和0.1%SDS。
此外,靶基因各自可以是具有任意上述核苷酸序列的基因,其中任意密码子被替换为等同密码子。例如,靶基因各自可以是根据要使用的宿主中的密码子频率,修饰成具有最优密码子的基因。
两个序列之间的序列同一性的百分比例如可以通过使用数学算法来确定。此类数学算法的非限制性例子包括Myers and Miller(1988)CABIOS 4:11-17的算法,Smith etal(1981)Adv.Appl.Math.2:482的局部同源性算法,Needleman和Wunsch(1970)J.Mol.Biol.48:443-453的同源性比对算法,Pearson和Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的搜索同源性方法,以及Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA87:2264的修改版本的算法,如描述于Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877。
通过使用基于此类数学算法的程序,可以进行用于确定序列同一性的序列比较(即比对)。该程序可以由计算机适当执行。此类程序的例子包括但不限于PC/Gene程序的CLUSTAL(可从Intelligenetics获得,Mountain View,Calif.),ALIGN程序(版本2.0),以及Wisconsin遗传学软件包版本8的GAP,BESTFIT,BLAST,FASTA和TFASTA(可从GeneticsComputer Group获得(GCG),575Science Drive,Madison,Wis.,USA)。可以例如通过使用初始参数进行使用这些程序的比对。CLUSTAL程序很好地描述于Higgins et al.(1988)Gene73:237-244(1988),Higgins et al.(1989)CABIOS 5:151-153,Corpet et al.(1988)Nucleic Acids Res.16:10881-90,Huang et al.(1992)CABIOS 8:155-65,和Pearson etal.(1994)Meth.Mol.Biol.24:307-331。
为了获得与目标核苷酸序列同源的核苷酸序列,特别地,例如,可以通过使用得分为100且字长为12的BLASTN程序来执行BLAST核苷酸搜索。为了获得与目标蛋白同源的氨基酸序列,特别地,例如,可以通过使用得分为50且字长为3的BLASTX程序来执行BLAST蛋白搜索。参见对于BLAST核苷酸搜索和BLAST蛋白质搜索的http://www.ncbi.nlm.nih.gov。此外,可以使用缺口BLAST(Gapped BLAST)(BLAST 2.0)以获得包括缺口的比对用于比较的目的。此外,可以使用PSI-BLAST以进行对检测量序列间远端关系的重复搜索。对于缺口BLAST和PSI-BLAST,参见Altschul et al.(1997)Nucleic Acids Res.25:3389。当使用BLAST,缺口BLAST,或PSI-BLAST时,可以使用每个程序(例如用于核苷酸序列的BLASTN,和用于氨基酸序列的BLSATX)的初始参数。也可以手工进行比对。
当比对两个序列以便最大地彼此符合时,两个序列之间的序列同一性计算为两个序列中匹配的残基比例。
<1-2>增加蛋白质活性的方法
以下,说明增加蛋白质的活性的方法。
表述“蛋白质的活性增加”表示与未修饰的菌株相比,每细胞的蛋白质的活性增加。术语“未修饰的菌株”可以指没有以增加目标蛋白的活性的方式进行修饰的参照菌株。未修饰的菌株的实例包括野生型菌株和亲本菌株。“蛋白质的活性增加”的状态也可以表示为“蛋白质的活性升高”。特别地,表述“蛋白质的活性增加”表示相比于未修饰的菌株,每细胞的蛋白质的数量增加,和/或蛋白质的每个分子的功能增加。也就是说,表述“蛋白质的活性增加”中的术语“活性”不限于蛋白质的催化活性,而是也可以指编码蛋白质的基因的转录量(即,mRNA的量),或蛋白质的翻译量(即蛋白质的量)。尽管蛋白质的活性增加的程度没有特别限制,只要与未修饰的菌株相比蛋白质的活性增加即可,与未修饰的菌株相比蛋白质的活性可以增加1.5或更多、2倍或更多、或3倍或更多。此外,“蛋白质的活性增加”的状态不仅包括目标蛋白质的活性在固有具有目标蛋白质的活性的菌株中增加的状态,而且还包括在对不固有地具有目标蛋白质活性的菌株赋予目标蛋白质的活性的状态。此外,只要蛋白质的活性最终增加,可以减弱和/或消除宿主中固有地含有的目标蛋白质的活性,然后可以对宿主引入适当类型的目标蛋白质。
用于增加蛋白质活性的修饰通过例如增加编码蛋白质的基因的表达来实现。表述“基因表达增加”是指与未修饰的菌株如野生型菌株和亲本菌株相比,每细胞的基因的表达量增加。表述“基因表达增加”特别可以表示基因的转录量(即mRNA的量)增加,和/或基因的翻译量(即从基因表达的蛋白质的量)增加。“基因的表达增加”的状态也可以称为“基因的表达增强”。与未修饰的菌株中观察到的基因表达相比,基因的表达可以增加1.5倍或更多、2倍或更多、或3倍或更多。此外,“基因表达增加”的状态不仅包括在固有地表达目标基因的菌株中目标基因的表达量增加的状态,而且还包括将基因导入到不固有地表达目标基因的菌株中并且在其中表达的状态。也就是说,措辞“基因的表达增加”也可以意味着例如将目标基因导入不具有该基因的菌株中,并且在其中表达。
可以通过例如增加基因的拷贝数来增加基因的表达。
可以通过将基因导入宿主的染色体增加基因的拷贝数。可以通过例如使用同源重组(Miller,J.H.,Experiments in Molecular Genetics,1972,Cold Spring HarborLaboratory)将基因导入染色体中。可以导入仅一个拷贝,或两个或更多个拷贝的基因。例如通过使用在染色体上以多个拷贝存在的序列作为靶标进行同源重组,可以将基因的多个拷贝引入染色体中。此类在染色体上以多个拷贝存在的序列的实例包括由特定的短重复序列组成的自主复制序列(APS),和在染色体上以约150个拷贝存在的rDNA序列。WO 95/32289公开了其中通过使用同源重组在酵母中进行基因重组的实例。另外,可以通过例如将基因整合到转座子中并将转座子转移到染色体上来将基因引入染色体。
可以使用具有与基因的全部或一部分互补的序列的探针通过Southern杂交,使用基于该基因序列制备的引物进行PCR等确认目标基因整合到染色体中。
此外,还可以通过将包括基因的载体引入宿主中来增加目标基因的拷贝数。例如,可以通过将含有目标基因的DNA片段与在宿主中发挥功能的载体连接来构建基因的表达载体,并用表达载体转化宿主来增加目标基因的拷贝数。包括目标基因的DNA片段可以通过例如使用具有目标基因的微生物的基因组DNA作为模板的PCR获得。作为载体,可以使用在宿主细胞中自主复制的载体。载体可以是单拷贝载体或者可以是多拷贝载体。此外,载体优选包括用于选择转化体的标志物。标志物的实例包括生物素抗性基因例如KanMX,NatMX(nat1),和HygMX(hph)基因,和补充营养缺陷型的基因例如LEU2,HIS3,和URA3基因。在酵母中自主复制的载体的实例包括具有CEN4复制起点的质粒和具有2μm DNA复制起点的质粒。在酵母中自主复制的载体的具体实例包括pAUR123(TAKARA BIO)和pYES2(Invitrogen)。
当引入基因时,该基因被本发明的酵母以可表达方式保持是足够的。具体地说,引入基因使得它在本发明的酵母中发挥功能的启动子序列的控制之下表达是足够的。启动子序列可以是源自宿主的启动子,或异源启动子。启动子可以是待引入的基因的天然启动子或另一基因的启动子。作为启动子,例如还可以使用如下文所述的更强的启动子。
终止子可以位于基因的下游。终止子没有特别限制,只要选择在本发明的酵母中发挥功能的终止子即可。终止子可以是源自宿主的终止子,或异源终止子。终止子可以是待引入的基因的天然终止子,或另一基因的终止子。在本发明的酵母中发挥功能的终止子的具体实例包括CYC1,ADH1,ADH2,ENO2,PGI1,和TDH1终止子。
可用于各种微生物的载体、启动子和终止子详细公开于"FundamentalMicrobiology Vol.8,Genetic Engineering,KYORITSU SHUPPAN CO.,LTD,1987"中,并且可以使用那些。
此外,当引入两个或更多个基因时,基因各自被本发明的酵母以可表达方式保持是足够的。例如,所有基因可以由单个表达载体或染色体携带。或者,基因可以由两个或更多个表达载体分开携带,或者由单个或两个或更多个表达载体和染色体分开携带。还可以引入由两个或更多个基因构成的操纵子。
要引入的基因没有特别限制,只要其编码在宿主中发挥功能的蛋白质即可。要引入的基因可以是源自宿主的基因,或者可以是异源基因。可以通过例如使用基于该基因的核苷酸序列设计的引物,并且使用具有该基因的生物体的基因组DNA,或携带该基因的质粒作为模板的PCR来获得要引入的基因。要引入的基因也可以例如基于该基因的核苷酸序列而完全合成(Gene,60(1),115-127(1987))。所获得的基因可以原样使用,或根据需要进行修饰后使用。
此外,通过改善基因的转录效率可以增加基因的表达。另外,还可以通过改善基因的翻译效率来增加基因的表达。基因的转录效率和基因的翻译效率可以通过例如修饰基因的表达调控序列来改善。术语“表达控制序列”总地指影响基因表达的位点,例如启动子。可以通过使用启动子搜索载体或基因分析软件如GENETYX鉴定表达控制序列。
可以通过用更强的启动子置换染色体上的基因的启动子来改善基因的转录效率。“更强的启动子”表示与固有存在的基因的野生型启动子相比提供基因的转录改善的启动子。在酵母中可用的更强的启动子的实例包括PGK1,PGK2,PDC1,TDH3,TEF1,TEF2,TPI1,HXT7,ADH1,GPD1,和KEX2启动子。此外,作为更强的启动子,可以通过使用各种报告基因获得现有启动子的高活性类型。
基因的翻译效率也可以通过例如修饰密码子来改善。例如,在基因的异源表达等情况下,通过用更经常使用的同义密码子替换基因中存在的稀有密码子,可以提高基因的翻译效率。也就是说,可以修饰要引入的基因,例如,以便根据在待使用的宿主中观察到的密码子的频率包括最优密码子。可以通过例如位点特异性突变方法将目标突变引入DNA的目标位点来替换密码子。或者,可以完全合成其中目标密码子被替换的基因片段。“密码子选择数据库(Codon Usage Database)”(http://www.kazusa.or.jp/codon;Nakamura,Y.etal,Nucl.Acids Res.,28,292(2000))中公开了各种生物体中的密码子的频率。
此外,还可以通过扩增增加基因表达的调节子,或者缺失或弱化降低基因表达的调节子来增加基因的表达。
如上文提及的用于增加基因表达的此类方法可以独立使用或以任意组合使用。
此外,增加酶活性的修饰也可以通过例如提高酶的比活性来实现。可以通过例如搜索多种生物体来获得显示出提高的比活性的酶。此外,可以通过在现有的酶中引入突变来获得高活性型的现有酶。可以独立地使用比活性的增强,或者可以与如上文所述的用于增强基因表达的此类方法以任意组合使用。
转化的方法没有特别限定,并且可以使用常规用于酵母的转化的方法。此类方法的实例包括原生质体方法,KU方法(H.Ito et al.,J.Bateriol.,153-163(1983)),KUR方法(Fermentation and industry,vol.43,p.630-637(1985)),电穿孔方法(Luis et al.,FEMS Micro biology Letters 165(1998)335-340),和使用载体DNA的方法(GietzR.D.and Schiestl R.H.,Methods Mol.Cell.Biol.5:255-269(1995))。用于操纵酵母的方法例如用于孢子形成的方法和用于分离单倍体酵母的方法公开于Chemistry andBiology,Experimental Line 31,Experimental Techniques for Yeast,1st Edition,Hirokawa-Shoten;Bio-Manual Series 10,Genetic Experimental Methods for Yeast,1st Edition,Yodosha;等等。
可以通过测量蛋白质的活性来确认蛋白质的活性的增加。
也可以通过确认编码蛋白质的基因的表达增加来确认蛋白质的活性的增加。可以通过确认基因的转录量的增加或通过确认从该基因表达的蛋白质的量的增加来确认基因表达的增加。
可以通过比较从基因转录的mRNA的量与未修饰的菌株如野生型菌株或亲本菌株中观察到的量来确认基因的转录量增加。用于评估mRNA量的方法的实例包括Northern杂交、RT-PCR等(Sambrook,J.,et al.,Molecular Cloning A Laboratory Manual/ThirdEdition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以增加到例如未修饰的菌株的mRNA量的1.5倍或更多、2倍或更多、或3倍或更多。
通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA),2001)可以确认蛋白质量的增加。蛋白质的量可以增加到例如未修饰的菌株的蛋白质量的1.5倍或更多、2倍或更多、或3倍或更多。
<1-3>降低蛋白质活性的方法
以下,将说明降低蛋白质活性的方法。
表述“蛋白质的活性降低”是指与未修饰的菌株相比,每细胞的蛋白质的活性降低。术语“未修饰的菌株”可以指未被修饰以使得目标蛋白的活性降低的参照菌株。未修饰的菌株的实例包括野生型菌株和亲本菌株。“蛋白质的活性降低”的状态也包括蛋白质的活性完全消失的状态。具体地,表述“蛋白质的活性降低”意味着与未修饰的菌株相比,每细胞的蛋白质的分子数目减少,和/或蛋白质的每个分子的功能降低。也就是说,表述“蛋白质的活性降低”中的术语“活性”不限于蛋白质的催化活性,而是也可以指编码蛋白质的基因的转录量(即mRNA的量)或蛋白质的翻译量(即蛋白质的量)。“每细胞的蛋白质分子的数目减少”的状态也包括蛋白质完全不存在的状态。“蛋白质的每个分子的功能降低”的状态也包括每个蛋白质分子的功能完全消失的状态。尽管蛋白质活性降低的程度没有特别限制,只要与未修饰的菌株相比活性降低即可,其可以降低至未修饰的菌株的活性的例如50%或更少,20%或更少,10%或更少,5%或更少或0%。
用于降低蛋白质活性的修饰可以通过例如降低编码蛋白质的基因的表达来实现。表述“基因表达降低”是指与未修饰的菌株如野生型菌株和亲本菌株相比,每细胞的基因的表达降低。表述“基因表达降低”可以特别是表示基因的转录量(即mRNA的量)降低,和/或基因的翻译量(即从基因表达的蛋白质的量)降低。“基因表达降低”的状态也包括基因完全不表达的状态。“基因表达降低”的状态也称为“基因的表达减弱”。基因的表达可以降低至未修饰的菌株的50%或更少,20%或更少,10%或更少,5%或更少或0%。
基因表达的降低可以是由于例如转录效率的降低、翻译效率的降低或它们的组合。通过修饰基因的表达控制序列例如启动子可以减少基因的表达。当修饰表达控制序列时,优选修饰表达控制序列的一个或多个核苷酸,更优选两个或更多个核苷酸,特别优选三个或更多个核苷酸。此外,可以缺失表达控制序列的部分或全部。基因的表达也可以通过例如操纵负责表达控制的因子来降低。负责表达控制的因子的实例包括负责转录或翻译控制的低分子(诱导物、抑制物等)、负责转录或翻译控制的蛋白质(转录因子等)、负责转录或翻译控制的核酸(siRNA等等),等等。此外,还可以通过例如将降低基因表达的突变引入基因的编码区中来降低基因的表达。例如,可以通过用宿主中较不常使用的同义密码子替换基因的编码区中的密码子来减少基因的表达。此外,例如,如下所述基因表达可以由于基因的破坏而降低。
用于降低蛋白质活性的修饰也可以通过例如破坏编码蛋白质的基因来实现。表述“基因被破坏”意味着基因被修饰而不产生能够正常发挥功能的蛋白质。表述“不产生能够正常发挥功能的蛋白质”包括其中蛋白质完全不从基因表达的情况,以及其中从基因表达其功能(如活性或性质)降低或完全消除的蛋白质的情况。
可以通过例如缺失染色体上的基因的编码区的一部分或全部来实现基因的破坏。此外,可以缺失整个基因,包括染色体上的基因上游和下游的序列。要缺失的区域可以是任何区域,诸如N端区域、内部区域或C端区域,只要能降低蛋白质的活性即可。较长的区域的缺失通常可以更可靠地使基因失活。此外,优选的是要缺失的区域的上游和下游的序列的阅读框是不同的。
也可以通过例如对染色体上基因的编码区引入氨基酸取代(错义突变)、终止密码子(无义突变)、一个或两个核苷酸残基的添加或缺失的移码突变等等的突变获得基因的破坏(Journal of Biological Chemistry,272:8611-8617(1997);Proceedings of theNational Academy of Sciences,USA,95 5511-5515(1998);Journal of BiologicalChemistry,26 116,20833-20839(1991))。
也可以通过例如将另一个序列插入到染色体上的基因的编码区中来实现基因的破坏。插入位点可以位于该基因的任何区域中,并且较长区域的插入通常可以更可靠地使基因失活。优选的是插入位点上游和下游的序列的阅读框是不同的。另一序列没有特别限定,只要选择减少或消除编码蛋白质的活性的序列即可,并且其实例包括例如标志物基因,如抗生素抗性基因,以及对于目标物质的生产有用的基因。
如上所述的染色体上基因的此类修饰可以通过例如使用重组DNA获得。用于同源重组的重组DNA的结构没有特别限定,只要其以想要的方式引起同源重组即可。例如,可以使用包含任意序列例如缺陷型基因或任意适合的插入序列的线性DNA转化宿主,所述任意序列侧翼有染色体上的同源重组靶区的上游和下游序列,使得可以在靶区的上游和下游侧发生同源重组,从而用所述任意序列置换靶区。特别地,如上文所述的对染色体上的基因的此列修饰可以通过如下获得,例如制备缺陷型基因,该缺陷型基因修饰为使得其不能产生能够正常发挥功能的蛋白质,并使用包括缺陷性基因的重组DNA转化宿主以引起所述缺陷型基因和染色体上的野生型基因之间的同源重组,从而用缺陷型基因取代染色体上的野生型基因。在该方法中,如果根据宿主的特征如营养缺陷型选择的标志物基因被包括在重组DNA中,则操作变得容易。缺陷型基因的实例包括缺失了基因的部分或全部的基因、引入错义突变的基因、引入了插入序列如转座子或标志物基因的基因、引入无义突变的基因,和引入移码突变的基因。由缺陷型基因编码的蛋白质即便产生也具有与野生型蛋白质不同的构象,从而其功能降低或消除。
降低蛋白质活性的修饰也可以通过例如诱变处理来实现。诱变处理的实例包括常规诱变处理例如X射线或紫外线的照射和用N-甲基-N'-硝基-N-亚硝基胍(MNNG)、甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)等突变剂进行处理。
可以通过测量蛋白质的活性来确认蛋白质活性的降低。
可以通过确认基因的转录量降低或从基因表达的蛋白质的量的降低来确认基因的表达降低。
可以通过比较从基因转录的mRNA量与未修饰的菌株中观察到的mRNA量来确认基因的转录量的降低。用于评估mRNA量的方法的实例包括Northern杂交、RT-PCR等(Molecular Cloning,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量优选降低至未修饰的菌株中观察到的量的例如50%或更少,20%或更少,10%或更少,5%或更少或0%。
可以通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA)2001)来确认蛋白质量的降低。蛋白质的量优选降低至未修饰的菌株的例如50%或更少,20%或更少,10%或更少,5%或更少,或0%。
根据用于破坏的方式,可以通过确定基因的部分或全部的核苷酸序列、基因的限制酶图谱、全长等来确认基因的破坏。
<2>本发明的生产目标物质的方法
本发明的方法是用于生产目标物质的方法,包括在培养基中培养本发明的酵母,和从酵母的细胞和/或培养基收集目标物质。在本发明的方法中,可以生产单一种类的目标物质,或者可以生产两种或多种目标物质。
使用的培养基没有特别限制,只要本发明的酵母在其中能够增殖,且能够生产目标物质即可。作为培养基,例如可以使用用于培养酵母的常规培养基。此类培养基的实例包括SD培养基,SG培养基,SDTE培养基,和YPD培养基。培养基可以含有碳源、氮源、磷源和硫源,以及根据需要选自其它各种有机成分和无机成分的成分。培养基成分的类型和浓度可以根据各种条件例如使用的酵母的类型和待生产的目标物质的类型适当确定。
培养基可以含有能够联合、结合、增溶和/或捕获目标物质的添加剂。添加剂的使用可以导致目标物质的生产增加。也就是说,相比于不存在添加剂的情况,在添加剂的存在的情况下由本发明的酵母生产的目标物质的量可以增加。添加剂的使用可以特别是导致培养基中的目标物质生产增加。培养基中的目标物质生产也可以称为“目标物质的分泌”。表述“联合、结合、增溶和/或捕获目标物质”可以特别是表示增加目标物质在培养基中的溶解度。添加剂的实例包括环糊精和沸石。构成环糊精的葡萄糖残基的数量没有特别限制,且可以是例如5、6、7或8。也就是说,环糊精的实例包括由5个葡萄糖残基组成的环糊精,α-环糊精,β-环糊精,γ-环糊精及其衍生物。环糊精衍生物的实例包括其中引入了一个或多个官能团的环糊精。官能团的种类,数量和量以及引入官能团的位置没有特别限制,只要衍生物能够结合,联合,增溶和/或捕获目标物质即可。可以将官能团引入例如C2、C3、C6的羟基或其组合,其可以导致环糊精本身的溶解度增加。官能团的实例包括烷基和羟烷基。烷基和羟烷基各自可以具有直链烷基链或可以具有支链烷基链。烷基和羟烷基各自可以具有例如1、2、3、4或5的碳数量。烷基的具体实例包括甲基、乙基、丙基、丁基、戊基、异丙基和异丁基。羟烷基的具体实例包括羟甲基、羟乙基、羟丙基、羟丁基、羟戊基、羟基异丙基和羟基异丁基。环糊精衍生物的具体实例包括甲基-α-环糊精,甲基-β-环糊精,羟丙基-α-环糊精如2-羟丙基-α-环糊精,和羟丙基-β-环糊精如2-羟丙基-β-环糊精。沸石的类型没有特别的限制。作为添加剂,可以使用单一种类的添加剂,或者可以组合使用两种或更多种添加剂。
在整个培养周期期间培养基中可以包含添加剂,或者仅在培养周期的一部分期间培养基含有添加剂。例如,从培养开始时,培养基可以含有或不含有添加剂。当在培养开始的时候培养基中不含有添加剂时,在培养开始后将添加剂供应至培养基。可以根据各种条件例如培养周期的长度来适当确定供应的时间。例如,可以在本发明的酵母完全生长之后将添加剂供应至培养基。此外,在任何情况下,可以根据需要将添加剂另外供应至培养基。用于将添加剂供应至培养基的方式没有特别限制。例如,可以通过将含有添加剂的补料培养基补料至培养基来供给添加剂。培养基中的添加剂浓度没有特别限制,只要目标物质能够生产。例如,培养基中的添加剂的浓度可以是0.1g/L或更高,1g/L或更高,2g/L或更高,5g/L或更高,10g/L或更高,可以是200g/L或更低,100g/L或更低,50g/L或更低,或20g/L或更低,或者可以在由其组合限定的范围内。培养基中的添加剂的浓度可以为例如0.1g/L至200g/L,1g/L至100g/L或5g/L至50g/L。在培养的整个周期期间,添加剂可以或不可以以上文例示的范围内的浓度包含在培养基中。例如,添加剂可以在培养开始时以上文例示的范围内的浓度包含在培养基中,或者其可以向培养基供应,使得在开始培养之后达到上文例示的范围内的浓度。
碳源的具体实例包括糖,如葡萄糖、果糖、蔗糖、乳糖、半乳糖、木糖、阿拉伯糖、赤糖糊(blackstrap molasses)、淀粉水解物和生物质的水解物,有机酸,如乙酸、延胡索酸、柠檬酸和琥珀酸,醇如甘油、粗甘油和乙醇,以及脂族酸。作为碳源,可以使用单一种类的碳源,或者可以组合使用两种或更多种的碳源。
氮源的具体实例包括例如铵盐如硫酸铵、氯化铵和磷酸铵,有机氮源如蛋白胨、酵母提取物、肉提取物、和大豆蛋白分解产物,氨和脲。用于调节pH的氨气或氨水也可以用作氮源。作为氮源,可以使用单一种类的氮源,也可以组合使用两种或更多种的氮源。
磷酸源的具体实例包括例如磷酸盐如磷酸二氢钾和磷酸氢二钾,和磷酸聚合物如焦磷酸。作为磷酸源,可以使用单一种类的磷酸源,也可以组合使用两种或更多种的磷酸源。
硫源的具体实例包括例如无机硫化合物如硫酸盐、硫代硫酸盐、亚硫酸盐,和含硫氨基酸如半胱氨酸、胱氨酸和谷胱甘肽。作为硫源,可以使用单一种类的硫源,也可以组合使用两种或更多种的硫源。
其它的各种有机成分及无机成分的实例包括例如无机盐如氯化钠和氯化钾;微量金属如铁、锰、镁和钙;维生素如维生素B1、维生素B2、维生素B6、烟酸、烟酸酰胺和维生素B12;氨基酸;核酸;含有这些的有机成分如蛋白胨、酪蛋白氨基酸、酵母提取物和大豆蛋白分解产物。作为其它的各种有机成分及无机成分,可以使用单一种类的成分,也可以组合使用两种或更多种的成分。
此外,当使用需要氨基酸、核酸等用于其生长的营养缺陷型突变体时,优选向培养基提供需要的营养物。
培养条件没有特别限制,只要本发明的酵母可以增殖,并且可以生产目标物质。培养可以例如在用于培养酵母的常规条件下进行。培养条件可以根据多种条件例如使用的酵母类型和生产的目标物质的类型适当确定。
可以通过使用液体培养基,在需氧、微氧或厌氧条件下进行培养。优选在需氧条件下进行培养。术语“需氧条件”可以指其中液体培养基中的溶解氧浓度为0.33ppm或更高,或者优选1.5ppm或更高的条件。在需氧条件的情况下,氧浓度可以控制为例如饱和氧浓度的5至50%,优选约10-20%。具体而言,需氧培养可以通过使用通气或振荡进行。术语“微氧条件”可以指将氧供应至培养系统,但是液体培养基中的溶解氧浓度低于0.33ppm的条件。术语“厌氧条件”可以指其中不将氧供应至培养系统的条件。培养温度可以是例如25至35℃,优选27至33℃,更优选28至32℃。培养基的pH可以是例如3至10或4至8。培养期间可以根据需要调节培养基的pH。对于调节pH,可以使用无机或有机酸性或碱性物质,例如氨气等。培养周期可以是例如10至200小时,或15至120小时。培养条件可以在整个培养周期期间恒定,或者可以在培养期间改变。培养可以以分批培养,补料-分批培养,连续培养,或这些的组合进行。此外,培养可以作为种子培养和主要培养的两步进行。在此类情况下,种子培养和主要培养的培养条件可以相同或不相同。例如,种子培养和主要培养可以作为分批培养进行。或者,例如,种子培养可以作为分批培养进行,而主要培养可以作为补料-分批培养或连续培养进行。
通过在此类条件下培养本发明的酵母,目标物质在培养基和/或酵母的细胞中积累。
可以通过用于检测或鉴定化合物的已知方法确认目标物质的生产。此类方法的实例包括例如HPLC、UPLC、LC/MS、GC/MS和NMR。这些方法可以独立使用或以任何适合的组合使用。
可以通过用于分离和纯化化合物的已知方法收集生成的目标物质。此类方法的实例包括例如离子交换树脂方法,膜处理,沉淀和结晶。这些方法可以独立使用或以任何适当的组合使用。当目标物质在细胞中积累时,可以用例如超声波处理等破碎细胞,然后可以从通过离心从细胞破碎的悬浮液中除去细胞获得的上清液中收集目标物质。要收集的目标物质可以是游离化合物,其盐或其混合物。
此外,当目标物质在培养基中沉积时,可以通过离心,过滤等来收集目标物质。沉积在培养基中的目标物质也可以在溶解在培养基中的目标物质结晶之后与溶解在培养基中的目标物质一起分离。
收集的目标物质除目标物质外可以含有酵母细胞,培养基组分,水分和酵母的副产物代谢物。收集的目标物质的纯度可以是例如50%(w/w)或更高,优选85%(w/w)或更高,特别优选95%(w/w)或更高。
目标物质例如植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)可以通过鞘氨醇碱(PHS/DHS)和脂肪酸的混合物的化学反应转化为鞘脂类例如植物神经酰胺(PHC)和二氢神经酰胺(DHC)(J.Biol.Chem.July 2002 277(29):25847-5)。
实施例
将参照以下实施例将更具体地解释本发明。然而,这些实例不应被解释为以任何方式限制本发明。
实施例1:菌株的构建
最成熟的PHS生产菌株酿酒酵母菌株EVST20240来源于国家酵母菌保藏中心的菌株NCYC 3608。菌株NCYC 3608(基因型MATalpha gal2 ho::HygMX ura3::KanMX)是S288C的Matα衍生物。菌株EVST20240含有以下修饰,即缺失his3Δ0leu2Δ0ura3Δ0Δcha1::LoxPΔcka2::LoxPΔlcb4::LoxP Δlcb5::LoxPΔorm2::LoxP CAT5-91Met gal2ho YNRCΔ9::ScLCB1/ScSUR2 YPRCΔ15::ScLCB2/ScTSC10[ARS/CEN/URA/ScTSC10/ScSUR2][ARS/CEN/HIS/ScLCB1/ScLCB2][ARS/CEN/LEU]。可以使用标准遗传方法操纵菌株EVST20240,且可以用作常规单倍体或二倍体酵母菌株。在下文中详细描述菌株EVST20240的构建。
从菌株NCYC 3608生成酿酒酵母菌株EYS4769。第一步包括去除从HO基因的缺失中留下的HygMX选择标志物。为了该目的,构建了含有以下模块的质粒pEVE3195,所述模块由与紧邻HygMX起始密码子上游的HygMX启动子同源的区域,随后是侧翼有loxP位点的乳酸克鲁维酵母URA3基因,和与终止密码子紧邻下游的HygMX终止子同源的区域组成。该模块侧翼有两个AscI限制性位点,并通过AscI消化释放,然后释放的片段用于转化菌株S288C。结果,HygMX标志物被包括乳酸克鲁维酵母URA3选择标志物的该模块置换。最后,经由loxP序列的自发重组去除URA3标志物。首先在SC液体培养基上然后在含有1g/L的5’-氟乳清酸(5-FOA)培养基(1.926g/L不含尿嘧啶的SC混合物(SC-mix),30mg/L尿嘧啶,6.7g/L酵母含氮碱基,20g/L葡萄糖,pH5.8)(对于完全SC混合物,参见表15)的平板上选择没有URA3的克隆,5’-氟乳清酸被具有活性URA3基因的酵母转化为毒性化合物。
如下使用PCR介导的无缝基因缺失策略实现KanMX选择标志物的去除,HygMX标志物去除留下的loxP疤痕的去除,以及LEU2和HIS3基因的缺失。
对于KanMX选择标志物的缺失,构建了含有以下模块的质粒pEVE3622,所述模块由与KanMX起始密码子紧邻上游的KanMX启动子同源的区域,和与终止密码子紧邻下游的KanMX终止子同源的区域,然后是乳酸克鲁维酵母URA3基因组成。在第一步中,通过经由限制性位点AscI向载体pEVE1915引入DNA片段A生成质粒pEVE3191。DNA片段A通过重叠PCR制备。也就是说,使用菌株NCYC 3608的基因组DNA作为模板和引物对EV3964/EV3965和EV3966/EV3967通过PCR扩增两个DNA片段。然后通过使用引物对EV3964/EV3967的PCR将这两个DNA片段连接以获得DNA片段A。在下一步中,使用引物对EVPR11045/EVPR11046从pEVE3195用PCR扩增乳酸克鲁维酵母URA3基因,并通过In-Fusion克隆将其克隆到EcoRV线性化质粒pEVE3191中。下游同源区域中的NdeI限制性位点用于质粒的限制性消化,然后是基因组整合和在没有尿嘧啶的SC培养基(1.926g/L不含尿嘧啶的SC混合物,6.7g/L酵母含氮碱基,20g/L葡萄糖,pH5.8)(对于完全SC混合物,参见表15)中选择。接着,在含有1g/L的5’-氟乳清酸(5-FOA)琼脂平板的平板上选择没有URA3标志物的克隆。获得具有野生型基因型和期望缺失的混合克隆群体,并通过PCR进行缺失突变体的鉴定。
对于LoxP疤痕的去除和LEU2和HIS3基因的缺失,使用相同的方法。引物对EV3970/EV3971,EV3972/EV3973,和EV3970/EV3973用于生成用于HIS3基因的开放读码框的缺失的靶向片段。引物对EV3976/EV3977,EV3978/EV3979,和EV3976/EV3979用于生成用于LEU2基因的开放读码框的缺失的靶向片段。靶向loxP疤痕的质粒(pEVE3621)用下游整合标签中的Pml1线性化;靶向LEU2标志物的质粒(pEVE3624)用下游整合标签中的BseRI线性化;对于靶向HIS3标志物的质粒(pEVE3623),通过定点诱变向上游整合标签中引入独特限制性位点HindIII生成pEVE3763,并用HindIII消化。基因组整合和在没有尿嘧啶的SC培养基中选择后,在含有1g/L 5-FOA的琼脂平板上选择没有URA3标志物的克隆。获得具有野生型基因型和期望缺失的混合克隆群体,并通过PCR进行缺失突变体的鉴定。
通过缺失LCB4基因从先前描述的菌株EYS4769生成酿酒酵母菌株EYS4789。这通过基于PCR的基因缺失策略完成,其产生开放读码框的起始到终止密码子缺失。LCB4基因被缺失构建体置换,所述缺失构建体由侧翼有loxP位点的诺尔斯菌素抗性基因NatMX(nat1),和与LCB4基因的天然启动子和终止子同源的序列构成,所述序列通过使用引物EV4024和EV4025(表9)的PCR添加。在含有100mg/L诺尔斯菌素的SC-琼脂平板上选择转化体。克隆通过PCR测试缺失构建体的正确插入。
从先前描述的菌株EYS4789生成酿酒酵母菌株EYS4839,EYS4840,和EYS4845,其通过首先如下去除先前插入的NatMX选择标志物:使用含有Cre重组酶的表达盒的URA3可选择质粒pEVE0078转化菌株EYS4789。Cre重组酶催化在NatMX标志物侧翼的两个loxP位点之间的位点特异性重组,伴随NatMX标志物的去除。在没有尿嘧啶的SC-琼脂平板上选择表达Cre重组酶的克隆。挑取一些克隆并通过在相应选择性平板上铺板测试选择标志物的丢失。通过在1g/L 5’-氟乳清酸的存在下培养菌株去除含有Cre重组酶的质粒pEVE0078,5’-氟乳清酸由URA3基因编码的酶活性转化为毒性化合物。仅丢失了该质粒的克隆能够在含有5-FOA的培养基上生长。一个阳性克隆产生了菌株EYS4964。
酿酒酵母菌株EYS4946用于ORM2,LCB5和ELO3基因的缺失以构建EYS4839,EYS4840和EYS4845。EYS4839菌株缺少ORM2基因,菌株EYS4840缺少LCB5基因,而菌株EYS4845缺少ELO3基因。这是通过基于PCR的基因缺失策略完成,产生开放读码框的起始到终止密码子缺失。ORM2,LCB5和ELO3基因被相应的缺失构建体置换,所述缺失构建体由侧翼有loxP位点的诺尔斯菌素抗性基因NatMX(nat1)和与ORM2,LCB5和ELO3基因的天然启动子和终止子同源的序列构成,所述序列通过使用引物对EV4215/EV4216,EV4030/EV4031和EV5103/EV5104的PCR添加。在含有100mg/L诺尔斯菌素的SC-琼脂平板上选择转化体。克隆通过PCR测试确认缺失构建体的正确插入。
酿酒酵母菌株EYS5009通过CKA2基因的缺失从先前描述的菌株EYS4789衍生。这是通过基于PCR的基因缺失策略来完成的,产生开放读码框的起始到终止密码子缺失。CKA2基因被缺失构建体置换,所述缺失构建体由侧翼有loxP位点的潮霉素抗性基因HygMX(hph),和与CKA2基因的天然启动子和终止子同源的序列构成,所述序列通过使用引物对EV4740和EV4741(表9)的PCR添加。在含有300mg/L潮霉素的SC-琼脂平板上选择转化体。克隆通过PCR测试确认缺失构建体的正确插入。在第二步中,通过使用含有Cre重组酶的表达盒的URA3可选择质粒pEVE0078转化去除先前插入的选择标志物。Cre重组酶催化在HygMX(hph)标志物侧翼的两个loxP位点之间的位点特异性重组,伴随HygMX(hph)标志物的去除。在没有尿嘧啶的SC-琼脂平板上选择表达Cre重组酶的克隆。挑取一些克隆并通过在相应选择性平板上铺板测试选择标志物的丢失。通过在1g/L 5’-氟乳清酸的存在下培养菌株去除含有Cre重组酶的质粒pEVE0078,5’-氟乳清酸由URA3基因编码的酶活性转化为毒性化合物。仅丢失了该质粒的克隆能够在含有5-FOA的SC培养基上生长。
酿酒酵母菌株EYS5066通过LCB5基因的缺失从先前描述的菌株EYS5009衍生。这是通过基于PCR的基因缺失策略来完成的,产生开放读码框的起始到终止密码子缺失。LCB5基因被缺失构建体置换,所述缺失构建体由侧翼有loxP位点的诺尔斯菌素抗性基因NatMX(nat1),和与LCB5基因的天然启动子和终止子同源的序列构成,所述序列通过使用引物对EV4030和EV4031(表9)的PCR添加。在含有100mg/L诺尔斯菌素的SC-琼脂平板上选择转化体。克隆通过PCR测试确认缺失构建体的正确插入。
酿酒酵母菌株EYS5175通过ORM2基因的缺失从先前描述的菌株EYS5066衍生。这是通过基于PCR的基因缺失策略来完成的,产生开放读码框的起始到终止密码子缺失。ORM2基因被缺失构建体置换,所述缺失构建体由侧翼有loxP位点的潮霉素抗性基因HygMX(hph),和与ORM2基因的天然启动子和终止子同源的序列构成,所述序列通过使用引物对EV4215和EV4216(表9)的PCR添加。在含有100mg/L潮霉素的SC-琼脂平板上选择转化体。克隆通过PCR测试确认缺失构建体的正确插入。
酿酒酵母菌株EVST20057通过CHA1基因的缺失从先前描述的菌株EYS5175生成,所述缺失是通过基于PCR的基因缺失策略来完成的,产生开放读码框的起始到终止密码子缺失。CHA1基因被缺失构建体置换,所述缺失构建体由侧翼有loxP位点的赋予对氨基糖苷类抗生素G418的抗性的KanMX基因,和与CHA1基因的天然启动子和终止子同源的序列构成,所述序列通过使用引物对EV3782和EV3783(表9)的PCR添加。在含有100mg/L G418的SC-琼脂平板上选择转化体。克隆通过PCR测试确认缺失构建体的正确插入。另外,先前分别用于缺失LCB5,ORM2和CHA1基因的抗性标志物NatMX,HygMX(Hph)和KanMX通过用pEVE0078转化从EYS5175去除,pEVE0078是含有Cre重组酶的表达盒的URA3可选择质粒。Cre重组酶催化上述标志物侧翼的两个loxP位点之间的位点特异性重组,伴随标志物的去除。在没有尿嘧啶的SC-琼脂平板上选择表达Cre重组酶的克隆。挑取一些克隆并通过在相应选择性平板上铺板测试选择标志物的丢失。通过在1g/L 5’-氟乳清酸的存在下培养菌株去除含有Cre重组酶的质粒pEVE0078,5’-氟乳清酸由URA3基因编码的酶活性转化为毒性化合物。仅丢失了该质粒的克隆能够在含有尿嘧啶的培养基上生长。
通过将表达模块整合到基因组Ty1长末端重复YNRCΔ9(染色体XIV 727363-727661)中,从先前描述的菌株EVST20057生成酿酒酵母菌株EVST20160,所述表达模块由两个天然酿酒酵母LCB1和SUR2基因和可选择标志物NatMX组成。LCB1和SUR2基因分别从天然酿酒酵母GPD1和TEF2启动子(表13)表达,然后是天然酿酒酵母CYC1和PGI1终止子(表14)。另外,将表达两种天然酿酒酵母LCB2和TSC10基因和可选择标志物HygMX(Hph)的第二整合模块整合到基因组Ty1长末端重复YPRCΔ15中(染色体XVI 776667..776796)。LCB2和TSC10基因分别从天然酿酒酵母PGK1和TPI1启动子(表13)表达,随后是天然酿酒酵母ADH2和TDH1终止子(表14)。
通过用三种质粒转化从先前描述的菌株EVST20160生成酿酒酵母菌株EVST20240。质粒1(pEVE4932)含有双表达盒,其具有侧翼有天然酿酒酵母TEF1启动子和天然酿酒酵母ADH1终止子的酿酒酵母LCB1基因的开放读码框,和侧翼有天然酿酒酵母PGK1启动子和天然酿酒酵母CYC1终止子的酿酒酵母LCB2基因的开放读码框。质粒2(pEV22325)含有双表达盒,其具有侧翼有天然酿酒酵母TEF1启动子(表13)和天然酿酒酵母ADH1终止子(表14)的酿酒酵母TSC10基因的开放读码框,和侧翼有天然酿酒酵母PGK1启动子和天然酿酒酵母CYC1终止子的酿酒酵母SUR2基因的开放读码框。质粒3(pEVE2159)含有空表达盒,其仅具有天然酿酒酵母PKG2启动子和天然酿酒酵母ADH2终止子,而没有开放读码框。该质粒仅用于使得菌株对于亮氨酸为原养型。在不含氨基酸组氨酸和亮氨酸以及嘧啶碱基尿嘧啶的琼脂糖平板上选择含有全部三种质粒的转化体,其通过分别存在于质粒1,2或3上的选择标志物HIS3,URA3和LEU2进行选择。
实施例2:在小规模分批培养中培养菌株并分析PHS生产
酵母菌株(图1)在缺乏亮氨酸,组氨酸和尿嘧啶的选择性SC-琼脂平板上划线出斑块。过夜生长之后,通过接种缺乏亮氨酸,组氨酸和尿嘧啶的SC培养基(1.546g/L没有亮氨酸、组氨酸、尿嘧啶的SC-混合物,6.7g/L酵母含氮碱基,20g/L葡萄糖,pH5.8)(对于完全SC混合物,参见表15))设置在14ml圆底管中的1ml预培养物。将预培养物在30℃振荡培养24小时,然后用于接种96孔深孔板中的主要培养物,其在OD600为0.1时接种于缺少亮氨酸,组氨酸和尿嘧啶,并含有20g/L葡萄糖和10g/Lα-环糊精的SC培养基中。在30℃振荡孵育48小时后,通过离心(5分钟,4000rpm)收获培养物,取上清液的等分试样用于鞘脂类分析。样品在甲醇中稀释,使得分析物的浓度在校准范围内。储液如表1所示制备。
[表1]
表1:标准品的储液
在甲醇中从储液制备4mg/L,2mg/L,1mg/L,0.5mg/L,0.25mg/L,0.125mg/L,62.5μg/L和31.25μg/L的系列校准溶液,并注射到UPLC-TOF中。LC-MS/MS方法如下:流动相A:溶于水的2mM甲酸铵+0.2%甲酸;流动相B:溶于乙腈/甲醇1:1的1mM甲酸铵+0.2%甲酸;柱:Acquity BEH UPLC C8,2.1 x 100mm,1.7μm。洗脱梯度如表2中所示,且LC-MS/MS条件在表3中给出。表4显示了质谱源和检测器参数。标准化合物的质量和保留时间可以在表5中找到。3-酮二氢神经鞘氨醇,C18-植物鞘氨醇和二氢神经鞘氨醇的浓度根据它们各自的校准曲线计算,而C20-植物鞘氨醇,C18:1-植物鞘氨醇和C20:1植物鞘氨醇的浓度使用C18-植物鞘氨醇校准曲线评估,且C18-植物鞘氨醇加合物和C20-植物鞘氨醇加合物根据C18-植物鞘氨醇计算并应用0.59的相关因子。
[表2]
表2:鞘脂类的分离梯度
[表3]
表3:LC-MS/MS条件
注射体积 5μl
柱温度 50℃±5℃
注射方法 部分循环
自动取样温度 30℃±5℃
弱清洗 溶于水/甲醇1:1的800μl 1mM甲酸铵
强清洗 300μl 2-丙醇
密封清洗 5分钟使用水/乙腈9:1
[表4]
表4:质谱源和检测器参数
[表5]
表5:标准化合物的质量和保留时间
化合物 m/z 离子 保留时间(min)
3-酮二氢神经鞘氨醇 300.29 [M-H]+ 1.80
二氢神经鞘氨醇 302.31 [M-H]+ 1.79
C18-植物鞘氨醇 318.30 [M-H]+ 1.71
C20-植物鞘氨醇 346.30 [M-H]+ 2.04
C18-植物鞘氨醇-加合物 344.30 [M-H]+ 2.03
C20-植物鞘氨醇-加合物 372.30 [M-H]+ 2.28
在小规模酵母培养物的上清液中测量了双缺失菌株EYS4839,EYS4840,EYS4845和EYS5009的植物鞘氨醇和二氢神经鞘氨醇生产。如表6所示,在所有双缺失菌株中,菌株中的植物鞘氨醇和二氢神经鞘氨醇生产增加,并且在具有LCB4/ELO3或LCB4/CKA2基因缺失的菌株中显著更高。
[表6]
表6:小规模培养中的植物鞘氨醇和二氢神经鞘氨醇滴度
通过进一步的遗传修饰,观察到植物鞘氨醇生产的进一步改善(图1)。在LCB4/CKA2双缺失背景中,具有LCB5和ORM2基因组合或LCB5,ORM2和CHA1基因组合的缺失观察到20-30%增加。通过整合到酵母基因组(菌株EVST20160)中过表达鞘脂类途径基因LCB1,LCB2,TSC10和SUR2,相对于起源菌株EVST20057,植物鞘氨醇生产改善了约2.5倍。通过从质粒过表达鞘脂类途径基因的额外拷贝(菌株EVST20240),植物鞘氨醇的生产进一步增加超过30%。
实施例3:在生物反应器中培养菌株EVST20240
使用以下参数进行补料-分批发酵:温度30℃,pH控制在5.85(通过0.5M HCl和5MNH4OH调节),并且通过搅拌器和通气的级联将pO2保持较高,在最大氧溶解的20%。使用的培养基对于分批阶段为选择性SC培养基,且对于补料-分批阶段为30倍浓缩的选择性SC培养基(46.38g/L无亮氨酸、组氨酸、尿嘧啶的SC-混合物,201g/L酵母含氮碱基,600g/L葡萄糖,pH 5.8)(对于完全SC混合物,参见表15)。两种培养基均补充有50g/L甲基-α-环糊精。分批阶段进行11小时,随后按照指数补料图表开始补料(表7)。在约100小时的周期内,采集样品并分析生物质和植物鞘氨醇的生产。通过LC-MS定量植物鞘氨醇。
[表7]
表7:生物反应器发酵期间的补料图表
结果显示在图2和表8中。除植物鞘氨醇外,在发酵培养液中鉴定了几种植物鞘氨醇衍生物(图2,表8)。碳链长度为18的植物鞘氨醇(PHS18)是主要种类,其次是碳链长度为20的植物鞘氨醇(PHS20)和碳链长度为16的植物鞘氨醇(PHS16)。另外,具有一个去饱和的PHS18和PHS20也以显著量存在。令人惊讶的是,还存在两种对应于4-(羟甲基)-2-甲基-6-十四酰-1,3-恶嗪烷-5-醇和4-(羟甲基)-2-甲基-6-十六酰-1,3-恶嗪烷-5-醇的植物鞘氨醇衍生物。这两种物质最有可能是PHS18或PHS20与乙醛的反应产物。通过NMR分析确认了结构1所示的4-(羟甲基)-2-甲基-6-十四酰-1,3-恶嗪烷-5-醇的结构。
[表8]
表8:生物反应器中多种植物鞘氨醇的滴度
Chem 1
结构1:4-(羟甲基)-2-甲基-6-十四酰-1,3-恶嗪烷-5-醇的结构
材料
实施例中使用的材料示于表9-15中。
[表9]
表9:用于基因缺失的引物对
[表10]
表10:另外的引物序列
[表11]
表11:质粒序列
质粒 SEQ ID
pEVE1915 49
pEVE3191 50
pEVE3195 51
pEVE4932 52
pEV22325 53
pEVE2159 54
pEVE0078 55
pEVE3621 62
pEVE3623 63
pEVE3624 64
[表12]
表12:缺失构建体
缺失构建体 SEQ ID
CHA1 56
LCB4 57
LCB5 58
ORM2 59
CKA2 60
ELO3 61
[表13]
表13:启动子序列
[表14]
表14:终止子序列
终止子 SEQ ID
CYC1 70
PGI1 71
ADH2 72
TDH1 73
ADH1 74
[表15]
表15:完全SC混合物
[工业实用性]
根据本发明,可以改善酵母生产目标物质例如植物鞘氨醇和二氢神经鞘氨醇的能力,并可以高效生产目标物质。
<序列表的说明>
SEQ ID NO:1,酿酒酵母的LCB1基因核苷酸序列
SEQ ID NO:2,酿酒酵母的Lcb1蛋白的氨基酸序列
SEQ ID NO:3,酿酒酵母的LCB2基因核苷酸序列
SEQ ID NO:4,酿酒酵母的Lcb2蛋白的氨基酸序列
SEQ ID NO:5,酿酒酵母的TSC10基因核苷酸序列
SEQ ID NO:6,酿酒酵母的Tsc10蛋白的氨基酸序列
SEQ ID NO:7,酿酒酵母的SUR2基因核苷酸序列
SEQ ID NO:8,酿酒酵母的Sur2蛋白的氨基酸序列
SEQ ID NO:9,酿酒酵母的LCB4基因核苷酸序列
SEQ ID NO:10,酿酒酵母的Lcb4蛋白的氨基酸序列
SEQ ID NO:11,酿酒酵母的LCB5基因核苷酸序列
SEQ ID NO:12,酿酒酵母的Lcb5蛋白的氨基酸序列
SEQ ID NO:13,酿酒酵母的ELO3基因核苷酸序列
SEQ ID NO:14,酿酒酵母的Elo3蛋白的氨基酸序列
SEQ ID NO:15,酿酒酵母的CKA2基因核苷酸序列
SEQ ID NO:16,酿酒酵母的Cka2蛋白的氨基酸序列
SEQ ID NO:17,酿酒酵母的ORM2基因核苷酸序列
SEQ ID NO:18,酿酒酵母的Orm2蛋白的氨基酸序列
SEQ ID NO:19,酿酒酵母的CHA1基因核苷酸序列
SEQ ID NO:20,酿酒酵母的Cha1蛋白的氨基酸序列
SEQ ID NO:21,Pichia ciferrii的SUR2基因的核苷酸序列
SEQ ID NO:22,Pichia ciferrii的Sur2蛋白的氨基酸序列
SEQ ID NOS:23-48,引物
SEQ ID NOS:49-55,质粒
SEQ ID NOS:56-61,基因缺失构建体
SEQ ID NOS:62-64,质粒
SEQ ID NOS:65-69,启动子
SEQ ID NOS:70-74,终止子
序列表
<110> 味之素株式会社
伊沃瓦股份有限公司
<120> 生产植物鞘氨醇或二氢神经鞘氨醇的方法
<130> D731-15327
<150> US62/208,934
<151> 2015-08-24
<150> JP2015-164693
<151> 2015-08-24
<160> 74
<170> PatentIn version 3.5
<210> 1
<211> 1677
<212> DNA
<213> 酿酒酵母
<400> 1
atggcacaca tcccagaggt tttacccaaa tcaataccga ttccggcatt tattgttacc 60
acctcatcgt acctatggta ctacttcaat ctggtgttga ctcaaatccc gggaggccaa 120
ttcatcgttt cgtacatcaa gaaatcgcat catgacgatc catacaggac cacggttgag 180
atagggctta ttttatacgg gatcatctat tacttgtcca agccacaaca gaaaaagagt 240
cttcaagcac agaagcccaa cctatcgccc caggagattg acgcgctaat tgaggactgg 300
gagcccgagc ctctagtcga cccttctgcc accgatgagc aatcgtggag ggtggccaaa 360
acacccgtca ccatggaaat gcccattcag aaccatatta ctatcaccag aaacaacctg 420
caggagaagt ataccaatgt tttcaatttg gcctcgaaca actttttgca attgtccgct 480
acggagcccg tgaaagaagt ggtcaagacc actatcaaga attacggtgt gggcgcctgt 540
ggtcccgccg ggttctacgg taaccaggac gttcattaca cgttggaata tgatttagca 600
cagttctttg gcacccaagg ttccgttctg tacgggcaag acttttgtgc cgcaccctct 660
gttctgcctg ctttcacaaa gcgtggtgat gttatcgtgg cagacgacca ggtgtcatta 720
ccagtgcaaa atgctctgca actaagcaga tccacagtct actacttcaa ccacaacgat 780
atgaattcgc tagaatgttt attaaacgag ttgaccgaac aggagaaact tgagaaactg 840
cccgccattc caagaaaatt tatcgtcact gagggtattt tccacaactc gggcgattta 900
gctccgttgc ctgagttgac taagctgaag aacaagtaca agttcagact atttgttgac 960
gaaaccttct ccattggtgt tcttggcgct acgggccgtg ggttgtcaga gcacttcaac 1020
atggatcgcg caactgccat tgacattacc gttgggtcca tggccaccgc gttggggtcc 1080
accggtggtt ttgtcctggg tgacagtgtt atgtgtttgc accagcgtat tggttccaat 1140
gcatattgtt tttctgcctg tttgccggct tacaccgtca catccgtctc caaagtcttg 1200
aaattgatgg actccaacaa cgacgccgtc cagacgctgc aaaaactatc caaatctttg 1260
catgattcct ttgcatctga cgactccttg cgttcatacg taatcgtcac gtcctctcca 1320
gtgtctgctg tcctacatct gcaactgact cccgcatata ggtctcgcaa gttcggatac 1380
acctgcgaac agctattcga aaccatgtca gctttgcaaa agaagtccca gacaaacaaa 1440
ttcattgagc catacgaaga ggaggaaaaa tttctgcagt ccatagtaga tcatgctctt 1500
attaactaca acgttctcat cacaagaaac actattgttt taaaacagga gacgctacca 1560
attgtcccta gcttgaaaat ctgctgtaac gccgccatgt ccccagagga actcaaaaat 1620
gcttgcgaaa gtgtcaagca gtccatcctt gcctgttgcc aagaatctaa taaataa 1677
<210> 2
<211> 558
<212> PRT
<213> 酿酒酵母
<400> 2
Met Ala His Ile Pro Glu Val Leu Pro Lys Ser Ile Pro Ile Pro Ala
1 5 10 15
Phe Ile Val Thr Thr Ser Ser Tyr Leu Trp Tyr Tyr Phe Asn Leu Val
20 25 30
Leu Thr Gln Ile Pro Gly Gly Gln Phe Ile Val Ser Tyr Ile Lys Lys
35 40 45
Ser His His Asp Asp Pro Tyr Arg Thr Thr Val Glu Ile Gly Leu Ile
50 55 60
Leu Tyr Gly Ile Ile Tyr Tyr Leu Ser Lys Pro Gln Gln Lys Lys Ser
65 70 75 80
Leu Gln Ala Gln Lys Pro Asn Leu Ser Pro Gln Glu Ile Asp Ala Leu
85 90 95
Ile Glu Asp Trp Glu Pro Glu Pro Leu Val Asp Pro Ser Ala Thr Asp
100 105 110
Glu Gln Ser Trp Arg Val Ala Lys Thr Pro Val Thr Met Glu Met Pro
115 120 125
Ile Gln Asn His Ile Thr Ile Thr Arg Asn Asn Leu Gln Glu Lys Tyr
130 135 140
Thr Asn Val Phe Asn Leu Ala Ser Asn Asn Phe Leu Gln Leu Ser Ala
145 150 155 160
Thr Glu Pro Val Lys Glu Val Val Lys Thr Thr Ile Lys Asn Tyr Gly
165 170 175
Val Gly Ala Cys Gly Pro Ala Gly Phe Tyr Gly Asn Gln Asp Val His
180 185 190
Tyr Thr Leu Glu Tyr Asp Leu Ala Gln Phe Phe Gly Thr Gln Gly Ser
195 200 205
Val Leu Tyr Gly Gln Asp Phe Cys Ala Ala Pro Ser Val Leu Pro Ala
210 215 220
Phe Thr Lys Arg Gly Asp Val Ile Val Ala Asp Asp Gln Val Ser Leu
225 230 235 240
Pro Val Gln Asn Ala Leu Gln Leu Ser Arg Ser Thr Val Tyr Tyr Phe
245 250 255
Asn His Asn Asp Met Asn Ser Leu Glu Cys Leu Leu Asn Glu Leu Thr
260 265 270
Glu Gln Glu Lys Leu Glu Lys Leu Pro Ala Ile Pro Arg Lys Phe Ile
275 280 285
Val Thr Glu Gly Ile Phe His Asn Ser Gly Asp Leu Ala Pro Leu Pro
290 295 300
Glu Leu Thr Lys Leu Lys Asn Lys Tyr Lys Phe Arg Leu Phe Val Asp
305 310 315 320
Glu Thr Phe Ser Ile Gly Val Leu Gly Ala Thr Gly Arg Gly Leu Ser
325 330 335
Glu His Phe Asn Met Asp Arg Ala Thr Ala Ile Asp Ile Thr Val Gly
340 345 350
Ser Met Ala Thr Ala Leu Gly Ser Thr Gly Gly Phe Val Leu Gly Asp
355 360 365
Ser Val Met Cys Leu His Gln Arg Ile Gly Ser Asn Ala Tyr Cys Phe
370 375 380
Ser Ala Cys Leu Pro Ala Tyr Thr Val Thr Ser Val Ser Lys Val Leu
385 390 395 400
Lys Leu Met Asp Ser Asn Asn Asp Ala Val Gln Thr Leu Gln Lys Leu
405 410 415
Ser Lys Ser Leu His Asp Ser Phe Ala Ser Asp Asp Ser Leu Arg Ser
420 425 430
Tyr Val Ile Val Thr Ser Ser Pro Val Ser Ala Val Leu His Leu Gln
435 440 445
Leu Thr Pro Ala Tyr Arg Ser Arg Lys Phe Gly Tyr Thr Cys Glu Gln
450 455 460
Leu Phe Glu Thr Met Ser Ala Leu Gln Lys Lys Ser Gln Thr Asn Lys
465 470 475 480
Phe Ile Glu Pro Tyr Glu Glu Glu Glu Lys Phe Leu Gln Ser Ile Val
485 490 495
Asp His Ala Leu Ile Asn Tyr Asn Val Leu Ile Thr Arg Asn Thr Ile
500 505 510
Val Leu Lys Gln Glu Thr Leu Pro Ile Val Pro Ser Leu Lys Ile Cys
515 520 525
Cys Asn Ala Ala Met Ser Pro Glu Glu Leu Lys Asn Ala Cys Glu Ser
530 535 540
Val Lys Gln Ser Ile Leu Ala Cys Cys Gln Glu Ser Asn Lys
545 550 555
<210> 3
<211> 1686
<212> DNA
<213> 酿酒酵母
<400> 3
atgagtactc ctgcaaacta tacccgtgtg cccctgtgcg aaccagagga gctgccagac 60
gacatacaaa aagaaaatga atatggtaca ctagattctc cggggcattt gtatcaagtc 120
aagtcacgtc atgggaagcc actacctgag cccgttgtcg acacccctcc ttattacatt 180
tctttgttaa catatctaaa ttatttgatt ctgattatat taggtcatgt tcacgacttc 240
ttaggtatga ccttccaaaa aaacaaacat ctggatcttt tagagcatga tgggttagca 300
ccttggtttt caaatttcga gagtttttat gtcaggagaa ttaaaatgag aattgatgat 360
tgcttttcta gaccaactac tggtgttcct ggtagattta ttcgttgtat tgatagaatt 420
tctcataata taaatgagta ttttacctac tcaggcgcag tgtatccatg catgaactta 480
tcatcatata actatttagg cttcgcacaa agtaagggtc aatgtaccga tgccgccttg 540
gaatctgtcg ataaatattc tattcaatct ggtggtccaa gagctcaaat cggtaccaca 600
gatttgcaca ttaaagcaga gaaattagtt gctagattta tcggtaagga ggatgccctc 660
gttttttcga tgggttatgg tacaaatgca aacttgttca acgctttcct cgataaaaag 720
tgtttagtta tctctgacga attgaaccac acctctatta gaacaggtgt taggctttct 780
ggtgctgctg tgcgaacttt caagcatggt gatatggtgg gtttagaaaa gcttatcaga 840
gaacagatag tacttggtca accaaaaaca aatcgtccat ggaagaaaat tttaatttgc 900
gcagaagggt tgttttccat ggaaggtact ttgtgtaact tgccaaaatt ggttgaattg 960
aagaagaaat ataaatgtta cttgtttatc gatgaagccc attctatagg cgctatgggc 1020
ccaactggtc gcggtgtttg tgaaatattt ggcgttgatc ccaaggacgt cgacattcta 1080
atgggtactt tcactaagtc gtttggtgct gctggtggtt acattgctgc tgatcaatgg 1140
attatcgata gactgaggtt ggatttaacc actgtgagtt atagtgagtc aatgccggct 1200
cctgttttag ctcaaactat ttcctcatta caaaccatta gtggtgaaat atgtcccgga 1260
caaggtactg aaagattgca acgtatagcc tttaattccc gttatctacg tttagctttg 1320
caaaggttag gatttattgt ctacggtgtg gctgactcac cagttattcc cttactactg 1380
tattgtccct caaagatgcc cgcattttcg agaatgatgt tacaaagacg gattgctgtt 1440
gttgttgttg cttatcctgc tactccgctg atcgaatcaa gagtaagatt ctgtatgtct 1500
gcatctttaa caaaggaaga tatcgattat ttactgcgtc atgttagtga agttggtgac 1560
aaattgaatt tgaaatcaaa ttccggcaaa tccagttacg acggtaaacg tcaaagatgg 1620
gacatcgagg aagttatcag gagaacacct gaagattgta aggacgacaa gtattttgtt 1680
aattga 1686
<210> 4
<211> 561
<212> PRT
<213> 酿酒酵母
<400> 4
Met Ser Thr Pro Ala Asn Tyr Thr Arg Val Pro Leu Cys Glu Pro Glu
1 5 10 15
Glu Leu Pro Asp Asp Ile Gln Lys Glu Asn Glu Tyr Gly Thr Leu Asp
20 25 30
Ser Pro Gly His Leu Tyr Gln Val Lys Ser Arg His Gly Lys Pro Leu
35 40 45
Pro Glu Pro Val Val Asp Thr Pro Pro Tyr Tyr Ile Ser Leu Leu Thr
50 55 60
Tyr Leu Asn Tyr Leu Ile Leu Ile Ile Leu Gly His Val His Asp Phe
65 70 75 80
Leu Gly Met Thr Phe Gln Lys Asn Lys His Leu Asp Leu Leu Glu His
85 90 95
Asp Gly Leu Ala Pro Trp Phe Ser Asn Phe Glu Ser Phe Tyr Val Arg
100 105 110
Arg Ile Lys Met Arg Ile Asp Asp Cys Phe Ser Arg Pro Thr Thr Gly
115 120 125
Val Pro Gly Arg Phe Ile Arg Cys Ile Asp Arg Ile Ser His Asn Ile
130 135 140
Asn Glu Tyr Phe Thr Tyr Ser Gly Ala Val Tyr Pro Cys Met Asn Leu
145 150 155 160
Ser Ser Tyr Asn Tyr Leu Gly Phe Ala Gln Ser Lys Gly Gln Cys Thr
165 170 175
Asp Ala Ala Leu Glu Ser Val Asp Lys Tyr Ser Ile Gln Ser Gly Gly
180 185 190
Pro Arg Ala Gln Ile Gly Thr Thr Asp Leu His Ile Lys Ala Glu Lys
195 200 205
Leu Val Ala Arg Phe Ile Gly Lys Glu Asp Ala Leu Val Phe Ser Met
210 215 220
Gly Tyr Gly Thr Asn Ala Asn Leu Phe Asn Ala Phe Leu Asp Lys Lys
225 230 235 240
Cys Leu Val Ile Ser Asp Glu Leu Asn His Thr Ser Ile Arg Thr Gly
245 250 255
Val Arg Leu Ser Gly Ala Ala Val Arg Thr Phe Lys His Gly Asp Met
260 265 270
Val Gly Leu Glu Lys Leu Ile Arg Glu Gln Ile Val Leu Gly Gln Pro
275 280 285
Lys Thr Asn Arg Pro Trp Lys Lys Ile Leu Ile Cys Ala Glu Gly Leu
290 295 300
Phe Ser Met Glu Gly Thr Leu Cys Asn Leu Pro Lys Leu Val Glu Leu
305 310 315 320
Lys Lys Lys Tyr Lys Cys Tyr Leu Phe Ile Asp Glu Ala His Ser Ile
325 330 335
Gly Ala Met Gly Pro Thr Gly Arg Gly Val Cys Glu Ile Phe Gly Val
340 345 350
Asp Pro Lys Asp Val Asp Ile Leu Met Gly Thr Phe Thr Lys Ser Phe
355 360 365
Gly Ala Ala Gly Gly Tyr Ile Ala Ala Asp Gln Trp Ile Ile Asp Arg
370 375 380
Leu Arg Leu Asp Leu Thr Thr Val Ser Tyr Ser Glu Ser Met Pro Ala
385 390 395 400
Pro Val Leu Ala Gln Thr Ile Ser Ser Leu Gln Thr Ile Ser Gly Glu
405 410 415
Ile Cys Pro Gly Gln Gly Thr Glu Arg Leu Gln Arg Ile Ala Phe Asn
420 425 430
Ser Arg Tyr Leu Arg Leu Ala Leu Gln Arg Leu Gly Phe Ile Val Tyr
435 440 445
Gly Val Ala Asp Ser Pro Val Ile Pro Leu Leu Leu Tyr Cys Pro Ser
450 455 460
Lys Met Pro Ala Phe Ser Arg Met Met Leu Gln Arg Arg Ile Ala Val
465 470 475 480
Val Val Val Ala Tyr Pro Ala Thr Pro Leu Ile Glu Ser Arg Val Arg
485 490 495
Phe Cys Met Ser Ala Ser Leu Thr Lys Glu Asp Ile Asp Tyr Leu Leu
500 505 510
Arg His Val Ser Glu Val Gly Asp Lys Leu Asn Leu Lys Ser Asn Ser
515 520 525
Gly Lys Ser Ser Tyr Asp Gly Lys Arg Gln Arg Trp Asp Ile Glu Glu
530 535 540
Val Ile Arg Arg Thr Pro Glu Asp Cys Lys Asp Asp Lys Tyr Phe Val
545 550 555 560
Asn
<210> 5
<211> 963
<212> DNA
<213> 酿酒酵母
<400> 5
atgaagttta cgttagaaga ccaagttgtg ttgatcactg gtggttcaca aggtcttgga 60
aaggaattcg ccaaaaaata ttataatgag gctgaaaaca caaagattat tatcgtcagt 120
aggtcagagg ctagactgct ggacacatgc aacgaaatta ggattgaagc tcacctgaga 180
agggaaacca ctgacgaggg ccaagtgcaa cataagttgg ctgcgccctt ggaccttgag 240
caacggttat tttactaccc atgcgacttg tcctgctacg aatccgtgga atgtttgttc 300
aatgccctga gagacttgga tttactccct acacaaacgt tatgctgtgc agggggggct 360
gttcctaagt tatttcgtgg gctaagcgga catgagttga acttgggtat ggacatcaac 420
tataaaacaa ctttgaacgt ggcacatcag attgcccttg cagagcaaac caaggaacac 480
cacctcatca tcttttctag tgccaccgcg ctttacccat ttgtgggcta ttcccagtat 540
gcgcctgcaa aagctgcaat caaatcactg gtagcaatct taagacaaga actgacgaac 600
ttccgtatca gttgtgttta tcctggtaat tttgaaagcg aaggtttcac tgtagagcag 660
ctaacgaaac ccgaaattac aaagttgatc gaaggcccct cagacgctat cccatgcaaa 720
caagcatgtg atatcattgc caagtcgctg gccagaggtg atgatgacgt ttttacagat 780
tttgtcggat ggatgataat ggggatggac cttgggctca ccgcaaagaa aagccgcttt 840
gttccgttgc aatggatttt tggtgtccta tcaaacattc tggtcgtgcc attctacatg 900
gttggctgtt cctggtatat caggaaatgg tttcgtgaaa atgacggcaa gaaggccaac 960
tga 963
<210> 6
<211> 320
<212> PRT
<213> 酿酒酵母
<400> 6
Met Lys Phe Thr Leu Glu Asp Gln Val Val Leu Ile Thr Gly Gly Ser
1 5 10 15
Gln Gly Leu Gly Lys Glu Phe Ala Lys Lys Tyr Tyr Asn Glu Ala Glu
20 25 30
Asn Thr Lys Ile Ile Ile Val Ser Arg Ser Glu Ala Arg Leu Leu Asp
35 40 45
Thr Cys Asn Glu Ile Arg Ile Glu Ala His Leu Arg Arg Glu Thr Thr
50 55 60
Asp Glu Gly Gln Val Gln His Lys Leu Ala Ala Pro Leu Asp Leu Glu
65 70 75 80
Gln Arg Leu Phe Tyr Tyr Pro Cys Asp Leu Ser Cys Tyr Glu Ser Val
85 90 95
Glu Cys Leu Phe Asn Ala Leu Arg Asp Leu Asp Leu Leu Pro Thr Gln
100 105 110
Thr Leu Cys Cys Ala Gly Gly Ala Val Pro Lys Leu Phe Arg Gly Leu
115 120 125
Ser Gly His Glu Leu Asn Leu Gly Met Asp Ile Asn Tyr Lys Thr Thr
130 135 140
Leu Asn Val Ala His Gln Ile Ala Leu Ala Glu Gln Thr Lys Glu His
145 150 155 160
His Leu Ile Ile Phe Ser Ser Ala Thr Ala Leu Tyr Pro Phe Val Gly
165 170 175
Tyr Ser Gln Tyr Ala Pro Ala Lys Ala Ala Ile Lys Ser Leu Val Ala
180 185 190
Ile Leu Arg Gln Glu Leu Thr Asn Phe Arg Ile Ser Cys Val Tyr Pro
195 200 205
Gly Asn Phe Glu Ser Glu Gly Phe Thr Val Glu Gln Leu Thr Lys Pro
210 215 220
Glu Ile Thr Lys Leu Ile Glu Gly Pro Ser Asp Ala Ile Pro Cys Lys
225 230 235 240
Gln Ala Cys Asp Ile Ile Ala Lys Ser Leu Ala Arg Gly Asp Asp Asp
245 250 255
Val Phe Thr Asp Phe Val Gly Trp Met Ile Met Gly Met Asp Leu Gly
260 265 270
Leu Thr Ala Lys Lys Ser Arg Phe Val Pro Leu Gln Trp Ile Phe Gly
275 280 285
Val Leu Ser Asn Ile Leu Val Val Pro Phe Tyr Met Val Gly Cys Ser
290 295 300
Trp Tyr Ile Arg Lys Trp Phe Arg Glu Asn Asp Gly Lys Lys Ala Asn
305 310 315 320
<210> 7
<211> 1050
<212> DNA
<213> 酿酒酵母
<400> 7
atgaacgtaa catcgaatgc aactgcagcc ggttcctttc cactagcatt tggtctcaag 60
acctcatttg ggtttatgca ctatgccaag gcccctgcca ttaatttacg ccccaaggaa 120
tccttgctgc cggaaatgag tgatggtgtg ctggccttgg ttgcgccggt tgttgcctac 180
tgggcgttgt ctggtatatt ccatgtaata gacactttcc atctggctga gaagtacaga 240
attcatccga gcgaagaggt tgccaagagg aacaaggcgt cgagaatgca tgttttcctt 300
gaagtgattc tacaacatat catacagacc attgttggcc ttatctttat gcacttcgag 360
ccgatctaca tgactgggtt tgaagaaaat gccatgtgga agcttcgtgc agaccttcct 420
cggattattc cagatgccgc tatttattac ggctatatgt acggaatgtc cgctttgaag 480
atctttgcag gctttttatt cgttgataca tggcaatact ttttgcatag attgatgcat 540
atgaataaga ccttatacaa atggttccac tctgttcatc atgaactata cgtgccatat 600
gcttacggtg ctcttttcaa caatcctgtt gagggcttct tgttagatac tttgggaacc 660
ggtattgcca tgacgttaac tcatttgact cacagagagc aaatcattct ttttaccttt 720
gccaccatga agactgtcga tgaccactgt gggtatgctt tgccacttga cccattccaa 780
tggcttttcc ctaataacgc tgtctatcac gatatccacc accagcaatt tggtatcaag 840
acgaactttg ctcaaccatt tttcactttc tgggacaatt tgttccaaac taactttaaa 900
gggtttgaag aatatcaaaa gaagcaaaga cgtgtcacca tcgacaagta caaagagttt 960
ttgcaagaga gagaattgga aaagaaggag aaactcaaaa acttcaaagc tatgaatgct 1020
gctgaaaatg aagtaaagaa agagaaataa 1050
<210> 8
<211> 349
<212> PRT
<213> 酿酒酵母
<400> 8
Met Asn Val Thr Ser Asn Ala Thr Ala Ala Gly Ser Phe Pro Leu Ala
1 5 10 15
Phe Gly Leu Lys Thr Ser Phe Gly Phe Met His Tyr Ala Lys Ala Pro
20 25 30
Ala Ile Asn Leu Arg Pro Lys Glu Ser Leu Leu Pro Glu Met Ser Asp
35 40 45
Gly Val Leu Ala Leu Val Ala Pro Val Val Ala Tyr Trp Ala Leu Ser
50 55 60
Gly Ile Phe His Val Ile Asp Thr Phe His Leu Ala Glu Lys Tyr Arg
65 70 75 80
Ile His Pro Ser Glu Glu Val Ala Lys Arg Asn Lys Ala Ser Arg Met
85 90 95
His Val Phe Leu Glu Val Ile Leu Gln His Ile Ile Gln Thr Ile Val
100 105 110
Gly Leu Ile Phe Met His Phe Glu Pro Ile Tyr Met Thr Gly Phe Glu
115 120 125
Glu Asn Ala Met Trp Lys Leu Arg Ala Asp Leu Pro Arg Ile Ile Pro
130 135 140
Asp Ala Ala Ile Tyr Tyr Gly Tyr Met Tyr Gly Met Ser Ala Leu Lys
145 150 155 160
Ile Phe Ala Gly Phe Leu Phe Val Asp Thr Trp Gln Tyr Phe Leu His
165 170 175
Arg Leu Met His Met Asn Lys Thr Leu Tyr Lys Trp Phe His Ser Val
180 185 190
His His Glu Leu Tyr Val Pro Tyr Ala Tyr Gly Ala Leu Phe Asn Asn
195 200 205
Pro Val Glu Gly Phe Leu Leu Asp Thr Leu Gly Thr Gly Ile Ala Met
210 215 220
Thr Leu Thr His Leu Thr His Arg Glu Gln Ile Ile Leu Phe Thr Phe
225 230 235 240
Ala Thr Met Lys Thr Val Asp Asp His Cys Gly Tyr Ala Leu Pro Leu
245 250 255
Asp Pro Phe Gln Trp Leu Phe Pro Asn Asn Ala Val Tyr His Asp Ile
260 265 270
His His Gln Gln Phe Gly Ile Lys Thr Asn Phe Ala Gln Pro Phe Phe
275 280 285
Thr Phe Trp Asp Asn Leu Phe Gln Thr Asn Phe Lys Gly Phe Glu Glu
290 295 300
Tyr Gln Lys Lys Gln Arg Arg Val Thr Ile Asp Lys Tyr Lys Glu Phe
305 310 315 320
Leu Gln Glu Arg Glu Leu Glu Lys Lys Glu Lys Leu Lys Asn Phe Lys
325 330 335
Ala Met Asn Ala Ala Glu Asn Glu Val Lys Lys Glu Lys
340 345
<210> 9
<211> 1875
<212> DNA
<213> 酿酒酵母
<400> 9
atggtggtgc agaaaaaact tagggctatc ttgaccgatg aaggtgtatt gatcaaatcg 60
caatcacacc atatgttcaa taagcatggt caactcagaa gcggagattc tttatccttg 120
ttgagctgct tgtcctgtct ggatgatgga actttgagct ctgatggagg ttcttttgat 180
gaggatgatt ccctggaact gttgcctctt aatactacca ttccgttcaa cagaattttg 240
aacgcaaaat atgtgaatgt cggtcagaaa ggcttcaata atggcaaaat ttcttcgaat 300
ccttttcaaa cggaaaatct gagttcttcg tctgaaaatg acgacgttga gaatcatagt 360
ttgagcaatg ataaggctcc tgtaagcgaa tcacagtcat ttcccaaaaa agacaagtgg 420
gatacaaaaa cgaacactgt gaaggtgtct cccgatgatt cacaggataa ctcaccatct 480
ttagggataa aagataatca acagttaatt gagttaactt ttgctgtacc caagggccat 540
gatgttatac cacaaaaatt aaccttgtta atagatcacg tttctaggaa atcgagagca 600
aataccggag aggagaacat ttcttctggt actgtggaag aaatcctgga aaaaagttat 660
gaaaattcca agagaaacag atcgatatta gtcattatta atccccacgg tggtaaaggt 720
actgctaaaa atttattcct gacaaaagca aggccaatac tagtggaaag tggctgcaaa 780
atagaaattg catacacaaa atatgcccgt cacgccatcg atattgccaa agatttagat 840
atcagcaaat acgataccat tgcatgtgcc tcgggtgatg gtattccata cgaagtaatt 900
aatgggcttt atagaagacc cgacagagtg gatgcgttca ataaactagc cgtaactcag 960
ctaccttgcg gttcaggaaa tgctatgagc atttcatgtc attggacaaa taacccatcg 1020
tacgccgctc tgtgccttgt caaatccatt gaaacaagaa tagacttaat gtgttgttcc 1080
caaccttctt atatgaacga atggccaaga ttatcctttt tgagtcagac gtacggcgtt 1140
attgcagaat ctgatattaa cactgaattc atcagatgga tgggtcccgt taggtttaat 1200
ttgggtgtag cattcaacat tatccaaggt aagaaatatc cctgcgaagt tttcgtcaaa 1260
tatgctgcca aatctaaaaa ggaattaaaa gttcatttct tagaaaataa agataaaaac 1320
aaaggatgtt taaccttcga accaaatcct agcccaaact cttcgccgga tttactatct 1380
aaaaacaata tcaacaacag tacaaaagat gaactttcac cgaattttct caacgaggac 1440
aactttaaat taaagtatcc gatgacggaa ccagtaccta gagactggga gaaaatggat 1500
tcagagctaa ctgataactt aacaatcttt tacacaggga aaatgccgta tattgctaag 1560
gacaccaaat tttttcccgc tgctttacca gcggatggta ccattgattt agtcataacg 1620
gatgcaagaa tcccagtgac aagaatgaca ccaattttat tatccttgga taaaggttct 1680
catgtattag agccagaagt tattcactca aaaatattgg cttataagat tataccaaaa 1740
gtggagtcag gtttattttc agtggatggt gaaaagtttc ctttggaacc cttgcaagtg 1800
gaaataatgc ccatgttatg caagacgttg ctaaggaatg gtagatatat cgatacagag 1860
tttgaatcca tgtag 1875
<210> 10
<211> 624
<212> PRT
<213> 酿酒酵母
<400> 10
Met Val Val Gln Lys Lys Leu Arg Ala Ile Leu Thr Asp Glu Gly Val
1 5 10 15
Leu Ile Lys Ser Gln Ser His His Met Phe Asn Lys His Gly Gln Leu
20 25 30
Arg Ser Gly Asp Ser Leu Ser Leu Leu Ser Cys Leu Ser Cys Leu Asp
35 40 45
Asp Gly Thr Leu Ser Ser Asp Gly Gly Ser Phe Asp Glu Asp Asp Ser
50 55 60
Leu Glu Leu Leu Pro Leu Asn Thr Thr Ile Pro Phe Asn Arg Ile Leu
65 70 75 80
Asn Ala Lys Tyr Val Asn Val Gly Gln Lys Gly Phe Asn Asn Gly Lys
85 90 95
Ile Ser Ser Asn Pro Phe Gln Thr Glu Asn Leu Ser Ser Ser Ser Glu
100 105 110
Asn Asp Asp Val Glu Asn His Ser Leu Ser Asn Asp Lys Ala Pro Val
115 120 125
Ser Glu Ser Gln Ser Phe Pro Lys Lys Asp Lys Trp Asp Thr Lys Thr
130 135 140
Asn Thr Val Lys Val Ser Pro Asp Asp Ser Gln Asp Asn Ser Pro Ser
145 150 155 160
Leu Gly Ile Lys Asp Asn Gln Gln Leu Ile Glu Leu Thr Phe Ala Val
165 170 175
Pro Lys Gly His Asp Val Ile Pro Gln Lys Leu Thr Leu Leu Ile Asp
180 185 190
His Val Ser Arg Lys Ser Arg Ala Asn Thr Gly Glu Glu Asn Ile Ser
195 200 205
Ser Gly Thr Val Glu Glu Ile Leu Glu Lys Ser Tyr Glu Asn Ser Lys
210 215 220
Arg Asn Arg Ser Ile Leu Val Ile Ile Asn Pro His Gly Gly Lys Gly
225 230 235 240
Thr Ala Lys Asn Leu Phe Leu Thr Lys Ala Arg Pro Ile Leu Val Glu
245 250 255
Ser Gly Cys Lys Ile Glu Ile Ala Tyr Thr Lys Tyr Ala Arg His Ala
260 265 270
Ile Asp Ile Ala Lys Asp Leu Asp Ile Ser Lys Tyr Asp Thr Ile Ala
275 280 285
Cys Ala Ser Gly Asp Gly Ile Pro Tyr Glu Val Ile Asn Gly Leu Tyr
290 295 300
Arg Arg Pro Asp Arg Val Asp Ala Phe Asn Lys Leu Ala Val Thr Gln
305 310 315 320
Leu Pro Cys Gly Ser Gly Asn Ala Met Ser Ile Ser Cys His Trp Thr
325 330 335
Asn Asn Pro Ser Tyr Ala Ala Leu Cys Leu Val Lys Ser Ile Glu Thr
340 345 350
Arg Ile Asp Leu Met Cys Cys Ser Gln Pro Ser Tyr Met Asn Glu Trp
355 360 365
Pro Arg Leu Ser Phe Leu Ser Gln Thr Tyr Gly Val Ile Ala Glu Ser
370 375 380
Asp Ile Asn Thr Glu Phe Ile Arg Trp Met Gly Pro Val Arg Phe Asn
385 390 395 400
Leu Gly Val Ala Phe Asn Ile Ile Gln Gly Lys Lys Tyr Pro Cys Glu
405 410 415
Val Phe Val Lys Tyr Ala Ala Lys Ser Lys Lys Glu Leu Lys Val His
420 425 430
Phe Leu Glu Asn Lys Asp Lys Asn Lys Gly Cys Leu Thr Phe Glu Pro
435 440 445
Asn Pro Ser Pro Asn Ser Ser Pro Asp Leu Leu Ser Lys Asn Asn Ile
450 455 460
Asn Asn Ser Thr Lys Asp Glu Leu Ser Pro Asn Phe Leu Asn Glu Asp
465 470 475 480
Asn Phe Lys Leu Lys Tyr Pro Met Thr Glu Pro Val Pro Arg Asp Trp
485 490 495
Glu Lys Met Asp Ser Glu Leu Thr Asp Asn Leu Thr Ile Phe Tyr Thr
500 505 510
Gly Lys Met Pro Tyr Ile Ala Lys Asp Thr Lys Phe Phe Pro Ala Ala
515 520 525
Leu Pro Ala Asp Gly Thr Ile Asp Leu Val Ile Thr Asp Ala Arg Ile
530 535 540
Pro Val Thr Arg Met Thr Pro Ile Leu Leu Ser Leu Asp Lys Gly Ser
545 550 555 560
His Val Leu Glu Pro Glu Val Ile His Ser Lys Ile Leu Ala Tyr Lys
565 570 575
Ile Ile Pro Lys Val Glu Ser Gly Leu Phe Ser Val Asp Gly Glu Lys
580 585 590
Phe Pro Leu Glu Pro Leu Gln Val Glu Ile Met Pro Met Leu Cys Lys
595 600 605
Thr Leu Leu Arg Asn Gly Arg Tyr Ile Asp Thr Glu Phe Glu Ser Met
610 615 620
<210> 11
<211> 2064
<212> DNA
<213> 酿酒酵母
<400> 11
atgactttga aaccttcaaa gagacgtaag ggcaggtctc gccattccag gaagaagcaa 60
ataacgtcag cgatactgac tgaggaagga ataatgatca aggcaaaacc atcaagtcct 120
tacacatacg caaatagaat ggcagataaa cgaagtcgca gcagcattga caacatcagt 180
agaactagct ttcaaagcaa catcagtaga actagctttc aaagcaacag tgataacaac 240
agtatatttg aaacggcttc actaattagc tgtgttacct gtttaagcga tactgataca 300
atagacagat cggaaacatc gacaacggat acaagtaaag atgatctttc tgctaatcca 360
aaacttcatt atccttcggt gaatggtcaa ttgccagcaa acaccgttat cccctatgga 420
cgaattctgg atgccagata cattgaaaag gaacctctgc attattatga tgccaattca 480
tcacccagtt cacctttaag cagctcaatg agtaacatta gtgaaaagtg tgatcttgat 540
gaattagagt cttcccaaaa aaaagaaagg aagggcaact cgctatcgcg aggaagtaac 600
agtagtagta gcctcctgac ttccagatct ccttttacga aactagtaga ggttatattt 660
gctaggccaa gacggcatga cgttgtaccc aaaagggttt cattgtatat tgactataaa 720
ccccattcat cttctcactt aaaagaagaa gatgacttgg ttgaggagat tttaaagaga 780
agctacaaaa acactagaag gaacaaatcc atatttgtga tcattaatcc gtttggtggt 840
aaaggtaagg cgaaaaaact gtttatgaca aaggcaaagc cgttactatt agcaagtcgg 900
tgttccatag aagtggttta tacaaaatac cctggtcatg ctatagagat cgcgcgggaa 960
atggatattg acaaatatga cactattgct tgcgcttcgg gagatggcat tcctcatgag 1020
gtgatcaatg ggttatacca aaggcctgat catgtcaaag cattcaacaa tatcgccatt 1080
acagaaattc catgcggatc aggtaacgca atgagcgtat cctgccactg gacaaacaat 1140
ccttcgtact caactttatg cttaattaaa tcgatagaga ctagaattga tttgatgtgt 1200
tgttcgcagc cttcttatgc aagagagcac ccaaagttat catttttaag tcaaacatat 1260
ggtctcattg cagaaactga cataaacact gaatttatta gatggatggg acctgcaagg 1320
tttgaattgg gtgtagcctt caatatcata caaaaaaaaa aatatccttg tgagatatat 1380
gtaaagtatg ctgccaaatc aaaaaacgag ttaaaaaatc attacctgga acacaaaaat 1440
aaagggtcgt tagaattcca gcatattact atgaacaaag ataacgagga ttgtgataat 1500
tacaattacg aaaatgaata cgaaaccgaa aacgaagatg aagatgaaga tgcggatgcg 1560
gatgacgaag actcccactt gatatctcgt gatctggcag attctagtgc tgatcaaatt 1620
aaagaggaag atttcaaaat aaaatatcca ttagatgaag gtatccctag tgactgggaa 1680
agattggatc ctaatatttc gaacaaccta ggtatcttct atacgggtaa aatgccatat 1740
gtggctgctg acactaaatt ctttccggca gcgcttcctt cagatggtac aatggatatg 1800
gttatcaccg atgcaagaac ctcgttgacg aggatggcac caatcctgct gggactagat 1860
aagggttccc atgttttaca accggaagtc ttacactcta aaattttggc atacaagata 1920
ataccaaagc tagggaacgg cttgttctct gtcgatggcg agaaatttcc tctagagccc 1980
cttcaagtcg aaattatgcc acgcttatgc aagacgttac tgagaaatgg ccgttatgtg 2040
gacacagatt tcgattctat gtga 2064
<210> 12
<211> 687
<212> PRT
<213> 酿酒酵母
<400> 12
Met Thr Leu Lys Pro Ser Lys Arg Arg Lys Gly Arg Ser Arg His Ser
1 5 10 15
Arg Lys Lys Gln Ile Thr Ser Ala Ile Leu Thr Glu Glu Gly Ile Met
20 25 30
Ile Lys Ala Lys Pro Ser Ser Pro Tyr Thr Tyr Ala Asn Arg Met Ala
35 40 45
Asp Lys Arg Ser Arg Ser Ser Ile Asp Asn Ile Ser Arg Thr Ser Phe
50 55 60
Gln Ser Asn Ile Ser Arg Thr Ser Phe Gln Ser Asn Ser Asp Asn Asn
65 70 75 80
Ser Ile Phe Glu Thr Ala Ser Leu Ile Ser Cys Val Thr Cys Leu Ser
85 90 95
Asp Thr Asp Thr Ile Asp Arg Ser Glu Thr Ser Thr Thr Asp Thr Ser
100 105 110
Lys Asp Asp Leu Ser Ala Asn Pro Lys Leu His Tyr Pro Ser Val Asn
115 120 125
Gly Gln Leu Pro Ala Asn Thr Val Ile Pro Tyr Gly Arg Ile Leu Asp
130 135 140
Ala Arg Tyr Ile Glu Lys Glu Pro Leu His Tyr Tyr Asp Ala Asn Ser
145 150 155 160
Ser Pro Ser Ser Pro Leu Ser Ser Ser Met Ser Asn Ile Ser Glu Lys
165 170 175
Cys Asp Leu Asp Glu Leu Glu Ser Ser Gln Lys Lys Glu Arg Lys Gly
180 185 190
Asn Ser Leu Ser Arg Gly Ser Asn Ser Ser Ser Ser Leu Leu Thr Ser
195 200 205
Arg Ser Pro Phe Thr Lys Leu Val Glu Val Ile Phe Ala Arg Pro Arg
210 215 220
Arg His Asp Val Val Pro Lys Arg Val Ser Leu Tyr Ile Asp Tyr Lys
225 230 235 240
Pro His Ser Ser Ser His Leu Lys Glu Glu Asp Asp Leu Val Glu Glu
245 250 255
Ile Leu Lys Arg Ser Tyr Lys Asn Thr Arg Arg Asn Lys Ser Ile Phe
260 265 270
Val Ile Ile Asn Pro Phe Gly Gly Lys Gly Lys Ala Lys Lys Leu Phe
275 280 285
Met Thr Lys Ala Lys Pro Leu Leu Leu Ala Ser Arg Cys Ser Ile Glu
290 295 300
Val Val Tyr Thr Lys Tyr Pro Gly His Ala Ile Glu Ile Ala Arg Glu
305 310 315 320
Met Asp Ile Asp Lys Tyr Asp Thr Ile Ala Cys Ala Ser Gly Asp Gly
325 330 335
Ile Pro His Glu Val Ile Asn Gly Leu Tyr Gln Arg Pro Asp His Val
340 345 350
Lys Ala Phe Asn Asn Ile Ala Ile Thr Glu Ile Pro Cys Gly Ser Gly
355 360 365
Asn Ala Met Ser Val Ser Cys His Trp Thr Asn Asn Pro Ser Tyr Ser
370 375 380
Thr Leu Cys Leu Ile Lys Ser Ile Glu Thr Arg Ile Asp Leu Met Cys
385 390 395 400
Cys Ser Gln Pro Ser Tyr Ala Arg Glu His Pro Lys Leu Ser Phe Leu
405 410 415
Ser Gln Thr Tyr Gly Leu Ile Ala Glu Thr Asp Ile Asn Thr Glu Phe
420 425 430
Ile Arg Trp Met Gly Pro Ala Arg Phe Glu Leu Gly Val Ala Phe Asn
435 440 445
Ile Ile Gln Lys Lys Lys Tyr Pro Cys Glu Ile Tyr Val Lys Tyr Ala
450 455 460
Ala Lys Ser Lys Asn Glu Leu Lys Asn His Tyr Leu Glu His Lys Asn
465 470 475 480
Lys Gly Ser Leu Glu Phe Gln His Ile Thr Met Asn Lys Asp Asn Glu
485 490 495
Asp Cys Asp Asn Tyr Asn Tyr Glu Asn Glu Tyr Glu Thr Glu Asn Glu
500 505 510
Asp Glu Asp Glu Asp Ala Asp Ala Asp Asp Glu Asp Ser His Leu Ile
515 520 525
Ser Arg Asp Leu Ala Asp Ser Ser Ala Asp Gln Ile Lys Glu Glu Asp
530 535 540
Phe Lys Ile Lys Tyr Pro Leu Asp Glu Gly Ile Pro Ser Asp Trp Glu
545 550 555 560
Arg Leu Asp Pro Asn Ile Ser Asn Asn Leu Gly Ile Phe Tyr Thr Gly
565 570 575
Lys Met Pro Tyr Val Ala Ala Asp Thr Lys Phe Phe Pro Ala Ala Leu
580 585 590
Pro Ser Asp Gly Thr Met Asp Met Val Ile Thr Asp Ala Arg Thr Ser
595 600 605
Leu Thr Arg Met Ala Pro Ile Leu Leu Gly Leu Asp Lys Gly Ser His
610 615 620
Val Leu Gln Pro Glu Val Leu His Ser Lys Ile Leu Ala Tyr Lys Ile
625 630 635 640
Ile Pro Lys Leu Gly Asn Gly Leu Phe Ser Val Asp Gly Glu Lys Phe
645 650 655
Pro Leu Glu Pro Leu Gln Val Glu Ile Met Pro Arg Leu Cys Lys Thr
660 665 670
Leu Leu Arg Asn Gly Arg Tyr Val Asp Thr Asp Phe Asp Ser Met
675 680 685
<210> 13
<211> 1038
<212> DNA
<213> 酿酒酵母
<400> 13
atgaacacta ccacatctac tgttatagca gcagttgccg accagttcca gtctttgaac 60
tcttcttctt catgtttctt gaaggttcat gttccttcca ttgagaaccc attcggtatt 120
gaattatggc caattttctc caaagtgttt gaatacttta gtggctatcc agctgagcaa 180
ttcgagttta ttcacaataa gactttcttg gctaacgggt atcatgctgt tagtattatt 240
atcgtttatt acattattat ctttggtggc caagctatct tacgcgcctt gaacgcctct 300
ccattaaagt ttaaattgct tttcgagata cacaacttgt ttttgacttc tatttctcta 360
gttttatggt tgctgatgtt agaacagttg gttcctatgg tttatcacaa cggtctattc 420
tggtctatct gctctaagga agccttcgca ccaaaattag ttactcttta ctatttgaac 480
tatttgacca aattcgtaga attgattgac actgtgtttt tagttttgag aagaaagaag 540
ttattgtttt tgcacactta ccatcacggt gccaccgctt tgttgtgcta cactcaatta 600
attggtcgta cttctgttga atgggtagtt atcctactaa acttgggtgt tcacgttatc 660
atgtactggt actacttctt gagttcatgt ggtattagag tttggtggaa gcaatgggtc 720
actagattcc aaattattca atttttgatt gacttggtat ttgtttactt tgctacctat 780
acattctatg ctcacaaata cttggacggt attttaccaa acaagggtac ttgttatggt 840
actcaggctg ctgctgctta tgggtatttg attctaacat cttatttgct tttgtttatt 900
tccttctaca tccaatctta caagaaaggt ggtaaaaaga cagtcaagaa ggaatctgaa 960
gtttccggct ccgttgcatc cggttcttct actggtgtca agacctctaa caccaaggtc 1020
tcttccagga aagcttaa 1038
<210> 14
<211> 345
<212> PRT
<213> 酿酒酵母
<400> 14
Met Asn Thr Thr Thr Ser Thr Val Ile Ala Ala Val Ala Asp Gln Phe
1 5 10 15
Gln Ser Leu Asn Ser Ser Ser Ser Cys Phe Leu Lys Val His Val Pro
20 25 30
Ser Ile Glu Asn Pro Phe Gly Ile Glu Leu Trp Pro Ile Phe Ser Lys
35 40 45
Val Phe Glu Tyr Phe Ser Gly Tyr Pro Ala Glu Gln Phe Glu Phe Ile
50 55 60
His Asn Lys Thr Phe Leu Ala Asn Gly Tyr His Ala Val Ser Ile Ile
65 70 75 80
Ile Val Tyr Tyr Ile Ile Ile Phe Gly Gly Gln Ala Ile Leu Arg Ala
85 90 95
Leu Asn Ala Ser Pro Leu Lys Phe Lys Leu Leu Phe Glu Ile His Asn
100 105 110
Leu Phe Leu Thr Ser Ile Ser Leu Val Leu Trp Leu Leu Met Leu Glu
115 120 125
Gln Leu Val Pro Met Val Tyr His Asn Gly Leu Phe Trp Ser Ile Cys
130 135 140
Ser Lys Glu Ala Phe Ala Pro Lys Leu Val Thr Leu Tyr Tyr Leu Asn
145 150 155 160
Tyr Leu Thr Lys Phe Val Glu Leu Ile Asp Thr Val Phe Leu Val Leu
165 170 175
Arg Arg Lys Lys Leu Leu Phe Leu His Thr Tyr His His Gly Ala Thr
180 185 190
Ala Leu Leu Cys Tyr Thr Gln Leu Ile Gly Arg Thr Ser Val Glu Trp
195 200 205
Val Val Ile Leu Leu Asn Leu Gly Val His Val Ile Met Tyr Trp Tyr
210 215 220
Tyr Phe Leu Ser Ser Cys Gly Ile Arg Val Trp Trp Lys Gln Trp Val
225 230 235 240
Thr Arg Phe Gln Ile Ile Gln Phe Leu Ile Asp Leu Val Phe Val Tyr
245 250 255
Phe Ala Thr Tyr Thr Phe Tyr Ala His Lys Tyr Leu Asp Gly Ile Leu
260 265 270
Pro Asn Lys Gly Thr Cys Tyr Gly Thr Gln Ala Ala Ala Ala Tyr Gly
275 280 285
Tyr Leu Ile Leu Thr Ser Tyr Leu Leu Leu Phe Ile Ser Phe Tyr Ile
290 295 300
Gln Ser Tyr Lys Lys Gly Gly Lys Lys Thr Val Lys Lys Glu Ser Glu
305 310 315 320
Val Ser Gly Ser Val Ala Ser Gly Ser Ser Thr Gly Val Lys Thr Ser
325 330 335
Asn Thr Lys Val Ser Ser Arg Lys Ala
340 345
<210> 15
<211> 1020
<212> DNA
<213> 酿酒酵母
<400> 15
atgccattac ctccgtcaac attgaaccag aaatctaata gagtctactc tgtagctagg 60
gtgtacaaga atgcctgcga ggagagacca caagaatact gggactacga acaaggggtg 120
accatcgatt ggggaaagat ttccaattac gaaattatca acaaaattgg aagagggaaa 180
tattccgaag tgttcagcgg tagatgtatt gtaaacaacc agaagtgtgt tattaaagtt 240
ttaaaaccag ttaaaatgaa aaaaatttat agagagttga aaattctgac caatctaaca 300
ggcggcccca atgttgttgg cctttatgat atagtacaag acgctgactc caaaatacct 360
gctttgatct ttgaggaaat caaaaatgtt gatttcagaa ctttatatcc tacattcaaa 420
cttcctgaca tccagtatta tttcacgcaa ttattgattg cgttagacta ctgtcactcc 480
atgggcataa tgcacagaga cgtaaagcct cagaatgtca tgattgatcc tacggaacgt 540
aaactaaggc tgatcgattg gggcctggcg gagttctacc atccaggtgt agattacaac 600
gttcgtgtcg cttcgcgtta ccacaaggga ccagaacttt tagtaaactt gaaccaatat 660
gactactccc tagacttatg gtcagtagga tgcatgctag cagctattgt cttcaaaaaa 720
gaaccttttt tcaaagggtc gtctaatcca gatcaactgg taaagattgc cacagtacta 780
ggaaccaagg aactgttagg ctatttgggt aagtacgggt tgcacttacc atctgaatac 840
gacaacatta tgagagactt tacaaaaaaa tcgtggacac actttataac ctccgagacc 900
aaattagctg ttcctgaagt ggttgattta atcgacaatt tattaaggta tgaccatcaa 960
gaaagattaa cagcaaagga ggctatggat cataagtttt tcaaaacgaa gtttgaataa 1020
<210> 16
<211> 339
<212> PRT
<213> 酿酒酵母
<400> 16
Met Pro Leu Pro Pro Ser Thr Leu Asn Gln Lys Ser Asn Arg Val Tyr
1 5 10 15
Ser Val Ala Arg Val Tyr Lys Asn Ala Cys Glu Glu Arg Pro Gln Glu
20 25 30
Tyr Trp Asp Tyr Glu Gln Gly Val Thr Ile Asp Trp Gly Lys Ile Ser
35 40 45
Asn Tyr Glu Ile Ile Asn Lys Ile Gly Arg Gly Lys Tyr Ser Glu Val
50 55 60
Phe Ser Gly Arg Cys Ile Val Asn Asn Gln Lys Cys Val Ile Lys Val
65 70 75 80
Leu Lys Pro Val Lys Met Lys Lys Ile Tyr Arg Glu Leu Lys Ile Leu
85 90 95
Thr Asn Leu Thr Gly Gly Pro Asn Val Val Gly Leu Tyr Asp Ile Val
100 105 110
Gln Asp Ala Asp Ser Lys Ile Pro Ala Leu Ile Phe Glu Glu Ile Lys
115 120 125
Asn Val Asp Phe Arg Thr Leu Tyr Pro Thr Phe Lys Leu Pro Asp Ile
130 135 140
Gln Tyr Tyr Phe Thr Gln Leu Leu Ile Ala Leu Asp Tyr Cys His Ser
145 150 155 160
Met Gly Ile Met His Arg Asp Val Lys Pro Gln Asn Val Met Ile Asp
165 170 175
Pro Thr Glu Arg Lys Leu Arg Leu Ile Asp Trp Gly Leu Ala Glu Phe
180 185 190
Tyr His Pro Gly Val Asp Tyr Asn Val Arg Val Ala Ser Arg Tyr His
195 200 205
Lys Gly Pro Glu Leu Leu Val Asn Leu Asn Gln Tyr Asp Tyr Ser Leu
210 215 220
Asp Leu Trp Ser Val Gly Cys Met Leu Ala Ala Ile Val Phe Lys Lys
225 230 235 240
Glu Pro Phe Phe Lys Gly Ser Ser Asn Pro Asp Gln Leu Val Lys Ile
245 250 255
Ala Thr Val Leu Gly Thr Lys Glu Leu Leu Gly Tyr Leu Gly Lys Tyr
260 265 270
Gly Leu His Leu Pro Ser Glu Tyr Asp Asn Ile Met Arg Asp Phe Thr
275 280 285
Lys Lys Ser Trp Thr His Phe Ile Thr Ser Glu Thr Lys Leu Ala Val
290 295 300
Pro Glu Val Val Asp Leu Ile Asp Asn Leu Leu Arg Tyr Asp His Gln
305 310 315 320
Glu Arg Leu Thr Ala Lys Glu Ala Met Asp His Lys Phe Phe Lys Thr
325 330 335
Lys Phe Glu
<210> 17
<211> 651
<212> DNA
<213> 酿酒酵母
<400> 17
atgattgacc gcactaaaaa cgaatctcca gcttttgaag agtctccgct tacccccaat 60
gtgtctaacc tgaaaccatt cccttctcaa agcaacaaaa tatccactcc agtgaccgac 120
cataggagaa gacggtcatc cagcgtaata tcacatgtgg aacaggaaac cttcgaagac 180
gaaaatgacc agcagatgct tcccaacatg aacgctacgt gggtcgacca gcgaggcgcg 240
tggttgattc atatcgtcgt aatagtactc ttgaggctct tctactcctt gttcgggtcg 300
acgcccaaat ggacgtggac tttaacaaac atgacctaca tcatcggatt ctatatcatg 360
ttccaccttg tcaaaggtac gcccttcgac tttaacggtg gtgcgtacga caacctgacc 420
atgtgggagc agattaacga tgagactttg tacacaccca ctagaaaatt tctgctgatt 480
gtacccattg tgttgttcct gattagcaac cagtactacc gcaacgacat gacactattc 540
ctctccaacc tcgccgtgac ggtgcttatt ggtgtcgttc ctaagctggg aattacgcat 600
agactaagaa tatccatccc tggtattacg ggccgtgctc aaattagtta g 651
<210> 18
<211> 216
<212> PRT
<213> 酿酒酵母
<400> 18
Met Ile Asp Arg Thr Lys Asn Glu Ser Pro Ala Phe Glu Glu Ser Pro
1 5 10 15
Leu Thr Pro Asn Val Ser Asn Leu Lys Pro Phe Pro Ser Gln Ser Asn
20 25 30
Lys Ile Ser Thr Pro Val Thr Asp His Arg Arg Arg Arg Ser Ser Ser
35 40 45
Val Ile Ser His Val Glu Gln Glu Thr Phe Glu Asp Glu Asn Asp Gln
50 55 60
Gln Met Leu Pro Asn Met Asn Ala Thr Trp Val Asp Gln Arg Gly Ala
65 70 75 80
Trp Leu Ile His Ile Val Val Ile Val Leu Leu Arg Leu Phe Tyr Ser
85 90 95
Leu Phe Gly Ser Thr Pro Lys Trp Thr Trp Thr Leu Thr Asn Met Thr
100 105 110
Tyr Ile Ile Gly Phe Tyr Ile Met Phe His Leu Val Lys Gly Thr Pro
115 120 125
Phe Asp Phe Asn Gly Gly Ala Tyr Asp Asn Leu Thr Met Trp Glu Gln
130 135 140
Ile Asn Asp Glu Thr Leu Tyr Thr Pro Thr Arg Lys Phe Leu Leu Ile
145 150 155 160
Val Pro Ile Val Leu Phe Leu Ile Ser Asn Gln Tyr Tyr Arg Asn Asp
165 170 175
Met Thr Leu Phe Leu Ser Asn Leu Ala Val Thr Val Leu Ile Gly Val
180 185 190
Val Pro Lys Leu Gly Ile Thr His Arg Leu Arg Ile Ser Ile Pro Gly
195 200 205
Ile Thr Gly Arg Ala Gln Ile Ser
210 215
<210> 19
<211> 1083
<212> DNA
<213> 酿酒酵母
<400> 19
atgtcgatag tctacaataa aacaccatta ttacgtcaat tcttccccgg aaaggcttct 60
gcacaatttt tcttgaaata tgaatgcctt caaccaagtg gctccttcaa aagtagagga 120
atcggtaatc tcatcatgaa aagtgccatt cgaattcaaa aggacggtaa aagatctcct 180
caggttttcg ctagttctgg cggtaatgcc ggttttgctg ctgcaacagc atgtcaaaga 240
ctgtctctac catgtacagt cgtggttcct acagcgacaa agaagagaat ggtagataaa 300
atcaggaaca ccggtgccca ggttatcgtg agtggtgcct actggaaaga agcagatact 360
tttttaaaaa caaatgtcat gaataaaata gactctcagg tcattgagcc catttatgtt 420
catcccttcg ataatccgga tatttgggaa ggacattcat ctatgataga tgaaatagta 480
caagatttga aatcgcaaca tatttccgtg aataaggtta aaggcatagt atgcagcgtt 540
ggtggaggtg gtttatacaa tggtattatt caaggtttgg aaaggtatgg tttagctgat 600
aggatcccta ttgtgggggt ggaaacgaat ggatgtcatg ttttcaatac ttctttgaaa 660
ataggccaac cagttcaatt caagaagata acaagtattg ctacttctct aggaacggcc 720
gtgatctcta atcaaacttt cgaatacgct cgcaaataca acaccagatc cgttgtaata 780
gaggacaaag atgttattga aacctgtctt aaatatacac atcaattcaa tatggtgatt 840
gaaccggcat gtggcgccgc attgcatttg ggttacaaca ctaagatcct agaaaatgca 900
ctgggctcaa aattagctgc ggatgacatt gtgataatta ttgcttgtgg cggctcctct 960
aatactataa aggacttgga agaagcgttg gatagcatga gaaaaaaaga cactcctgta 1020
atagaagtcg ctgacaattt catatttcca gaaaaaaata ttgtgaattt aaaaagtgct 1080
tga 1083
<210> 20
<211> 360
<212> PRT
<213> 酿酒酵母
<400> 20
Met Ser Ile Val Tyr Asn Lys Thr Pro Leu Leu Arg Gln Phe Phe Pro
1 5 10 15
Gly Lys Ala Ser Ala Gln Phe Phe Leu Lys Tyr Glu Cys Leu Gln Pro
20 25 30
Ser Gly Ser Phe Lys Ser Arg Gly Ile Gly Asn Leu Ile Met Lys Ser
35 40 45
Ala Ile Arg Ile Gln Lys Asp Gly Lys Arg Ser Pro Gln Val Phe Ala
50 55 60
Ser Ser Gly Gly Asn Ala Gly Phe Ala Ala Ala Thr Ala Cys Gln Arg
65 70 75 80
Leu Ser Leu Pro Cys Thr Val Val Val Pro Thr Ala Thr Lys Lys Arg
85 90 95
Met Val Asp Lys Ile Arg Asn Thr Gly Ala Gln Val Ile Val Ser Gly
100 105 110
Ala Tyr Trp Lys Glu Ala Asp Thr Phe Leu Lys Thr Asn Val Met Asn
115 120 125
Lys Ile Asp Ser Gln Val Ile Glu Pro Ile Tyr Val His Pro Phe Asp
130 135 140
Asn Pro Asp Ile Trp Glu Gly His Ser Ser Met Ile Asp Glu Ile Val
145 150 155 160
Gln Asp Leu Lys Ser Gln His Ile Ser Val Asn Lys Val Lys Gly Ile
165 170 175
Val Cys Ser Val Gly Gly Gly Gly Leu Tyr Asn Gly Ile Ile Gln Gly
180 185 190
Leu Glu Arg Tyr Gly Leu Ala Asp Arg Ile Pro Ile Val Gly Val Glu
195 200 205
Thr Asn Gly Cys His Val Phe Asn Thr Ser Leu Lys Ile Gly Gln Pro
210 215 220
Val Gln Phe Lys Lys Ile Thr Ser Ile Ala Thr Ser Leu Gly Thr Ala
225 230 235 240
Val Ile Ser Asn Gln Thr Phe Glu Tyr Ala Arg Lys Tyr Asn Thr Arg
245 250 255
Ser Val Val Ile Glu Asp Lys Asp Val Ile Glu Thr Cys Leu Lys Tyr
260 265 270
Thr His Gln Phe Asn Met Val Ile Glu Pro Ala Cys Gly Ala Ala Leu
275 280 285
His Leu Gly Tyr Asn Thr Lys Ile Leu Glu Asn Ala Leu Gly Ser Lys
290 295 300
Leu Ala Ala Asp Asp Ile Val Ile Ile Ile Ala Cys Gly Gly Ser Ser
305 310 315 320
Asn Thr Ile Lys Asp Leu Glu Glu Ala Leu Asp Ser Met Arg Lys Lys
325 330 335
Asp Thr Pro Val Ile Glu Val Ala Asp Asn Phe Ile Phe Pro Glu Lys
340 345 350
Asn Ile Val Asn Leu Lys Ser Ala
355 360
<210> 21
<211> 978
<212> DNA
<213> Pichia ciferrii
<400> 21
atgtcctccc atcaattctt gatcaatcaa actactttgg ctgctccacc agttcatttg 60
gttgaaaaac catctttgat caacggtatc ccagataaca ttttggcttt gattgctcca 120
gttatcgcct actattctta ctctggtttc ttctacgtta tcgacacctt ggaaattgcc 180
gaattataca gaattcaccc accagaagaa gtctccagta gaaacaaagc tactaagttc 240
gatgttttga aggacgttgt cttgcaacac ttcatccaat ctgttgttgg ttacatcttc 300
acctacttcg acccaattca atacactggt gatgaagaat atcaagcctg gaagttgcaa 360
caaactttgc catttttgcc tttcgatgtt gcttactact ggaatatgta tggttggtcc 420
tgtttgaaga ttggtttggc cttcttgatt atcgactctt ggcaatattg gttgcacaga 480
atcatgcatt tgaacaagac cttgtacaaa agattccact ccagacacca cagattatat 540
gttccatatg cttttggtgc cttgtataac gatccattcg aaggtttttt gttggatact 600
ttgggtactg gtattgctgc tatcgttact caattgactc caagagaatc cattgtcttg 660
tacactttct ctaccttgaa aaccgttgat gatcattgcg gttattcctt gccatatgat 720
ccattccaaa tcttgttccc aaacaactcc atctaccatg atatccatca tcaacaattc 780
ggtatcaaga ccaacttctc tcaaccattt ttcacccatt gggacgtttt ctctaacacc 840
agatacaaag aaatcgacga atacagagaa aagcaaaagg ctattaccat tgccaagtac 900
aaagaatttt tacacgacag agaaatcgcc aagcaaaaga agaaagctga aatctacaag 960
gacaaaaaga ctgattaa 978
<210> 22
<211> 325
<212> PRT
<213> Pichia ciferrii
<400> 22
Met Ser Ser His Gln Phe Leu Ile Asn Gln Thr Thr Leu Ala Ala Pro
1 5 10 15
Pro Val His Leu Val Glu Lys Pro Ser Leu Ile Asn Gly Ile Pro Asp
20 25 30
Asn Ile Leu Ala Leu Ile Ala Pro Val Ile Ala Tyr Tyr Ser Tyr Ser
35 40 45
Gly Phe Phe Tyr Val Ile Asp Thr Leu Glu Ile Ala Glu Leu Tyr Arg
50 55 60
Ile His Pro Pro Glu Glu Val Ser Ser Arg Asn Lys Ala Thr Lys Phe
65 70 75 80
Asp Val Leu Lys Asp Val Val Leu Gln His Phe Ile Gln Ser Val Val
85 90 95
Gly Tyr Ile Phe Thr Tyr Phe Asp Pro Ile Gln Tyr Thr Gly Asp Glu
100 105 110
Glu Tyr Gln Ala Trp Lys Leu Gln Gln Thr Leu Pro Phe Leu Pro Phe
115 120 125
Asp Val Ala Tyr Tyr Trp Asn Met Tyr Gly Trp Ser Cys Leu Lys Ile
130 135 140
Gly Leu Ala Phe Leu Ile Ile Asp Ser Trp Gln Tyr Trp Leu His Arg
145 150 155 160
Ile Met His Leu Asn Lys Thr Leu Tyr Lys Arg Phe His Ser Arg His
165 170 175
His Arg Leu Tyr Val Pro Tyr Ala Phe Gly Ala Leu Tyr Asn Asp Pro
180 185 190
Phe Glu Gly Phe Leu Leu Asp Thr Leu Gly Thr Gly Ile Ala Ala Ile
195 200 205
Val Thr Gln Leu Thr Pro Arg Glu Ser Ile Val Leu Tyr Thr Phe Ser
210 215 220
Thr Leu Lys Thr Val Asp Asp His Cys Gly Tyr Ser Leu Pro Tyr Asp
225 230 235 240
Pro Phe Gln Ile Leu Phe Pro Asn Asn Ser Ile Tyr His Asp Ile His
245 250 255
His Gln Gln Phe Gly Ile Lys Thr Asn Phe Ser Gln Pro Phe Phe Thr
260 265 270
His Trp Asp Val Phe Ser Asn Thr Arg Tyr Lys Glu Ile Asp Glu Tyr
275 280 285
Arg Glu Lys Gln Lys Ala Ile Thr Ile Ala Lys Tyr Lys Glu Phe Leu
290 295 300
His Asp Arg Glu Ile Ala Lys Gln Lys Lys Lys Ala Glu Ile Tyr Lys
305 310 315 320
Asp Lys Lys Thr Asp
325
<210> 23
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
taagtgctgg atagacaaga gacaggaaaa ttaaccagcg agatgccagc tgaagcttcg 60
tacgc 65
<210> 24
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 24
tcaagggcaa attgatgctt caacgaaaaa gttattggat tttcagcata ggccactagt 60
ggatctg 67
<210> 25
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
aagactatac cattataaaa acgcataaga aacagtttca tcatgccagc tgaagcttcg 60
tacgc 65
<210> 26
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
atatatatat atatatacat atatgcgtat aggcagagcc aactagcata ggccactagt 60
ggatctg 67
<210> 27
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 27
aaatagaagg aacaataaac ctaaaagaat agaagaaaca gaatgccagc tgaagcttcg 60
tacgctgc 68
<210> 28
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 28
tggtggaaaa agaattgcct tgctaagagt attgttgtcc aattaccgca taggccacta 60
gtggatctg 69
<210> 29
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 29
aagtctagca gcgaaaagta cgcgaagaat ctactataga taatgccagc tgaagcttcg 60
tacgc 65
<210> 30
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 30
ttttacaaaa aaatcatttt tgaaggaaaa tataacgtta atctagcata ggccactagt 60
ggatctg 67
<210> 31
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 31
aaaccacaaa tagtgtaaga tttaaacagt aagccaaaag agatgccagc tgaagcttcg 60
tacgc 65
<210> 32
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 32
ttgattaatt gttcagtacg aaggaaaaga ttaagtaaag tgtcagcata ggccactagt 60
ggatctg 67
<210> 33
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 33
ttattcggct tttttccgtt tgtttacgaa acataaacag tcatgccagc tgaagcttcg 60
tacgct 66
<210> 34
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
ttttttcttt ttcattcgct gtcaaaaatt ctcgcttcct atttagcata ggccactagt 60
ggatctg 67
<210> 35
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 35
gatggcgcgc caacaaaccg aagttatctg atgtag 36
<210> 36
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 36
gaagcttcag ctggcggccg ccatgattta tcttcgtttc ctgcag 46
<210> 37
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 37
ctagtggcct atgcggccgc taaaaaactg tattataagt aaatgcatg 49
<210> 38
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 38
gatggcgcgc ccccaagcct tgtcccaagg ca 32
<210> 39
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 39
gatggcgcgc cccacgacgc tttgtcttca ttc 33
<210> 40
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 40
tcactagcgg ccgccatctt tgccttcgtt tatcttgc 38
<210> 41
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 41
aagatggcgg ccgctagtga caccgattat ttaaagctg 39
<210> 42
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 42
aagatggcgg ccgctagtga caccgattat ttaaagctg 39
<210> 43
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 43
gatggcgcgc cctcaggtat cgtaagatgc aagag 35
<210> 44
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 44
tttttagcgg ccgccattag aatggtatat ccttgaaa 38
<210> 45
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 45
ctaatggcgg ccgctaaaaa gattctcttt ttttatgata tttg 44
<210> 46
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 46
gatggcgcgc cctacgtcgt taaggccgtt tctg 34
<210> 47
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 47
agatcttaag gggatatctt aatggggagc gctgattctc ttttggt 47
<210> 48
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 48
gggaacctcg aggatatcat gtccacaaaa tcatatacca gtagagctg 49
<210> 49
<211> 3638
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 49
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat 120
tgtaatacga ctcactatag ggcgaccctt aggatctaag cattggcgcg ccccggctgt 180
ctgccatgct gcccggtgta ccgacataac cgccggtggc atagccgcgc atacgcgtct 240
ccagcgtgtt ttatctctgc gagcataatg cctgcgtcat ccgccagcag gagctggact 300
ttactgatgc ccgttatatc tgcgaaaaga ccgggatctg gacccgtgat ggcattctct 360
ggttttcgtc atccggtgaa gagattgagc cacctgacag tgtgaccttt cacatctgga 420
cagcgtacag cccgttcacc acctgggtgc agattgtcaa agactggatg aaaacgaaag 480
gggatacggg aaaacgtaaa accttcgtaa acaccacgct cggtgagacg tgggaggcga 540
aaattggcga acgtccggat gctgaagtga tggcagagcg gaaagagcat tattcagcgc 600
ccgttcctga ccgtgtggct tacctgaccg ccggtatcga ctcccagctg gaccgctacg 660
aaatgcgcgt atggggatgg gggccgggtg aggaaagctg gctgattgac cggcagatta 720
ttatgggccg ccacgacgat gaacagacgc tgctgcgtgt ggatgaggcc atcaataaaa 780
cctatacccg ccggaatggt gcagaaatgt cgatatcccg tatctgctgg gatactggac 840
gcgttttccc gtctttcagt gccttgttca gttcttcctg acgggcggta tatttctcca 900
gcttggcgcg cctaagactt agatcttaag gggatatcct cgaggttccc tttagtgagg 960
gttaattgcg agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 1020
gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 1080
atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 1140
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 1200
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 1260
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 1320
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 1380
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 1440
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 1500
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 1560
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 1620
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 1680
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 1740
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 1800
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 1860
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 1920
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 1980
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 2040
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 2100
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 2160
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 2220
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 2280
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 2340
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 2400
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 2460
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 2520
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 2580
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 2640
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 2700
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 2760
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 2820
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 2880
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 2940
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 3000
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 3060
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 3120
tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 3180
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 3240
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 3300
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 3360
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 3420
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 3480
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 3540
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca 3600
ttcgccattc aggctgcgca actgttggga agggcgat 3638
<210> 50
<211> 3819
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 50
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat 120
tgtaatacga ctcactatag ggcgaccctt aggatctaag cattggcgcg cccccaagcc 180
ttgtcccaag gcagcgtttt gttcttggaa acgctgccct acacgttcgc tatgcttcaa 240
gaacttttct gagcacttca tgatgcatgt ttgttcctta ttggttagct ttgatgttgt 300
gaagtcattg acacagtctg tgaaacatct ttctaccaga ttagagtaca aacgcatgaa 360
atccttcatt tgcttttgtt ccactacttt ttggaactct tgttgttctt tggagttcaa 420
tgcgtccatc tttacagtcc tgtcttattg ttcttgattt gtgccccgta aaatactgtt 480
acttggttct ggcgaggtat tggatagttc ctttttataa aggccatgaa gctttttctt 540
tccaattttt tttttttcgt cattatagaa atcattacga ccgagattcc cgggtaataa 600
ctgatataat taaattgaag ctctaatttg tgagtttagt atacatgcat ttacttataa 660
tacagttttt tagcggccgc catgatttat cttcgtttcc tgcaggtttt tgttctgtgc 720
agttgggtta agaatactgg gcaatttcat gtttcttcaa caccacatat gcgtatatat 780
accaatctaa gtctgtgctc cttccttcgt tcttccttct gctcggagat taccgaatca 840
aaaaaatttc aaagaaaccg gaatcaaaaa aaagaacaaa aaaaaaaaag atgaattgaa 900
aagctttatg gaccctgaaa ccacagccac attaaccttc tttgatggtc aaaacttatc 960
cttcaccata aatatgcctc gcaaaaaagg taattaacat atatagaatt acattattta 1020
tgaaatatca tcactatctc ttagcatctt taatcctttt ctacatcaga taacttcggt 1080
ttgttggcgc gcctaagact tagatcttaa ggggatatcc tcgaggttcc ctttagtgag 1140
ggttaattgc gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 1200
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 1260
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 1320
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 1380
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 1440
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 1500
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 1560
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 1620
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 1680
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 1740
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 1800
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 1860
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 1920
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 1980
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 2040
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2100
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2160
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2220
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 2280
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 2340
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 2400
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 2460
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 2520
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 2580
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 2640
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 2700
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 2760
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 2820
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 2880
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 2940
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 3360
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 3420
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 3480
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 3540
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 3600
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 3660
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 3720
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttgcc 3780
attcgccatt caggctgcgc aactgttggg aagggcgat 3819
<210> 51
<211> 5389
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 51
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat 120
tgtaatacga ctcactatag ggcgaccctt aggatctaag cattggcgcg ccgcgcacct 180
gcgttgttac cacaactctt atgaggcccg cggacagcat caaactgtaa gattccgcca 240
cattttatac actctggtcc tttaactggc aaaccttcgg gcgtaatgcc caatttttcg 300
cctttgtctt ttgccttttt cacttcacgt gcttctggta catacttgca atttatacag 360
tgatgaccgc tgaatttgta tcttccatag catctagcac atactcgatt tttaccactc 420
caatctttat aaaaatactt gattcccttt ctgggacaag caacacagtg ttttagattc 480
tttttttgtg atattttaag ctgttctccc acacagcagc ctcgacatga tttcacttct 540
attttgttgc caagcaagaa atttttatgg ccgcggccgc ataggccact agtggatctg 600
atatcaccta ataacttcgt atagcataca ttatacgaag ttatattaag ggttctcgag 660
agctcgtttt atttaggttc tatcgaggag aaaaagcgac aagaagagat agaccatgga 720
taaatgatta tgttctaaac actcctcaga agctcatcga actgtcatcc tgcgtgaaga 780
ttaaaatcca acttagaaat ttcgagctta cggagacaat catatgggag aagcaattgg 840
aagatagaaa aaaggtactc ggtacataaa tatatgtgat tctgggtaga agatcggtct 900
gcattggatg gtggtaacgc atttttttac acacattact tgcctcgagc atcaaatggt 960
ggttattcgt ggatctatat cacgtgattt gcttaagaat tgtcgttcat ggtgacactt 1020
ttagctttga catgattaag ctcatctcaa ttgatgttat ctaaagtcat ttcaactatc 1080
taagatgtgg ttgtgattgg gccattttgt gaaagccagt acgccagcgt caatacactc 1140
ccgtcaatta gttgcaccat gtccacaaaa tcatatacca gtagagctga gactcatgca 1200
agtccggttg catcgaaact tttacgttta atggatgaaa agaagaccaa tttgtgtgct 1260
tctcttgacg ttcgttcgac tgatgagcta ttgaaacttg ttgaaacgtt gggtccatac 1320
atttgccttt tgaaaacaca cgttgatatc ttggatgatt tcagttatga gggtactgtc 1380
gttccattga aagcattggc agagaaatac aagttcttga tatttgagga cagaaaattc 1440
gccgatatcg gtaacacagt caaattacaa tatacatcgg gcgtttaccg tatcgcagaa 1500
tggtctgata tcaccaacgc ccacggggtt actggtgctg gtattgttgc tggcttgaaa 1560
caaggtgcgc aagaggtcac caaagaacca aggggattat tgatgcttgc tgaattgtct 1620
tccaagggtt ctctagcaca cggtgaatat actaagggta ccgttgatat tgcaaagagt 1680
gataaagatt tcgttattgg gttcattgct cagaacgata tgggaggaag agaagaaggg 1740
tttgattggc taatcatgac cccaggtgta ggtttagacg acaaaggcga tgcattgggt 1800
cagcagtaca gaaccgtcga cgaagttgta agtggtggat cagatatcat cattgttggc 1860
agaggacttt tcgccaaggg tagagatcct aaggttgaag gtgaaagata cagaaatgct 1920
ggatgggaag cgtaccaaaa gagaatcagc gctccccatt aattatacag gaaacttaat 1980
agaacaaatc acatatttaa tctaatagcc acctgcattg gcacggtgca acactacttc 2040
aacttcatct tacaaaaaga tcacgtgatc tgttgtattg ggatctctag acctaataac 2100
ttcgtatagc atacattata cgaagttata ttaagggttg tcgacctgca gcgtacgaag 2160
cttcagctgg cggccgcgaa atattctcct ttagagcgct ccatttcttc tatgaagcgt 2220
tttgcggcaa actcaccttc aactgtcatt gggaatgtct tatgatggtt ttttggaatt 2280
attattatcc taccatcaag cgtctgacat tgctgcagat ttctccatct cactttatat 2340
ttggtggcat ttctaccact tttttccaac agtggtttgg tagggaccct gactgacaat 2400
ttatgacctg cagtacattg taatgcaaga cgctgataaa ctgttctacg cctgggatct 2460
aacctaccag gttcaccttc aaaagctctg tgtttggttt tttgctgtat attatagatt 2520
ttctgatagc cctgtgtgac atttatgacg cgggcagcgg agccatctgc gcacataacg 2580
taagagttag ccgtgacgtt tgcgatgtct ttaatttcac cgttagccat cagaatagtc 2640
gtgttttcag aaagcggcgc gcctaagact tagatcttaa ggggatatcc tcgaggttcc 2700
ctttagtgag ggttaattgc gagcttggcg taatcatggt catagctgtt tcctgtgtga 2760
aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc 2820
tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc 2880
cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc 2940
ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 3000
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 3060
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 3120
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 3180
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 3240
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 3300
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 3360
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 3420
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 3480
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 3540
gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc 3600
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 3660
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 3720
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 3780
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 3840
aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 3900
taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 3960
gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc 4020
agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac 4080
cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag 4140
tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac 4200
gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc 4260
agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg 4320
gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc 4380
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 4440
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 4500
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 4560
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 4620
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 4680
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 4740
cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt 4800
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt 4860
ccgcgcacat ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg 4920
gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 4980
cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 5040
aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 5100
cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 5160
ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 5220
aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 5280
ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt 5340
acaatttgcc attcgccatt caggctgcgc aactgttggg aagggcgat 5389
<210> 52
<211> 9675
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 52
cgcgcctgat gagcctgaac tgcccgggca aatcagctgg cgtaatagcg aagaggcccg 60
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcgcg acgcgccctg 120
tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc 180
cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg 240
ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg 300
gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg 360
atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt 420
ccaaactgga acaacactca accctatctc ggtctattct tttgatttat aagggatttt 480
gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt 540
taacaaaata ttaacgttta caatttcctg atgcggtatt ttctccttac gcatctgtgc 600
ggtatttcac accgcataga tccgtcgagt tcaagagaaa aaaaaagaaa aagcaaaaag 660
aaaaaaggaa agcgcgcctc gttcagaatg acacgtatag aatgatgcat taccttgtca 720
tcttcagtat catactgttc gtatacatac ttactgacat tcataggtat acatatatac 780
acatgtatat atatcgtatg ctgcagcttt aaataatcgg tgtcactaca taagaacacc 840
tttggtggag ggaacatcgt tggtaccatt gggcgaggtg gcttctctta tggcaaccgc 900
aagagccttg aacgcactct cactacggtg atgatcattc ttgcctcgca gacaatcaac 960
gtggagggta attctgctag cctctgcaaa actttcaaga aaatgcggga tcatctcgca 1020
agagagatct cctactttct ccctttgcaa accaagttcg acaactgcgt acggcctgtt 1080
cgaaagatct accaccgctc tggaaagtgc ctcatccaaa ggcgcaaatc ctgatccaaa 1140
cctttttact ccacgcacgg cccctagggc ctctttaaag gcttgaccga gagcaatccc 1200
gcagtcttca gtggtgtgat ggtcgtctat gtgtaagtca ccaatgcact caacgattag 1260
cgaccagccg gaatgcttgg ccagagcatg tatcatatgg tccagaaacc ctatacctgt 1320
gtggacgtta atcacttgcg attgtgtggc ctgttctgct actgcttctg cctctttttc 1380
tgggaagatc gagtgctcta tcgctagggg accacccttt aaagagatcg caatctgaat 1440
cttggtttca tttgtaatac gctttactag ggctttctgc tctgtcatct ttgccttcgt 1500
ttatcttgcc tgctcatttt ttagtatatt cttcgaagaa atcacattac tttatataat 1560
gtataattca ttatgtgata atgccaatcg ctaagaaaaa aaaagagtca tccgctaggg 1620
gaaaaaaaaa aatgaaaatc attaccgagg cataaaaaaa tatagagtgt actagaggag 1680
gccaagagta atagaaaaag aaaattgcgg gaaaggactg tgttatgact tccctgacta 1740
atgccgtgtt caaacgatac ctggcagtga ctcctagcgc tcaccaagct cttaaaacgg 1800
gaatttatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagccccg 1860
acacccgcca acacgcgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta 1920
cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc 1980
gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt ttataggtta atgtcatgat 2040
aataatggtt tcttaggacg gatcgcttgc ctgtaactta cacgcgcctc gtatctttta 2100
atgatggaat aatttgggaa tttactctgt gtttatttat ttttatgttt tgtatttgga 2160
ttttagaaag taaataaaga aggtagaaga gttacggaat gaagaaaaaa aaataaacaa 2220
aggtttaaaa aatttcaaca aaaagcgtac tttacatata tatttattag acaagaaaag 2280
cagattaaat agatatacat tcgattaacg ataagtaaaa tgtaaaatca caggattttc 2340
gtgtgtggtc ttctacacag acaagatgaa acaattcggc attaatacct gagagcagga 2400
agagcaagat aaaaggtagt atttgttggc gatcccccta gagtctttta catcttcgga 2460
aaacaaaaac tattttttct ttaatttctt tttttacttt ctatttttaa tttatatatt 2520
tatattaaaa aatttaaatt ataattattt ttatagcacg tgatgaaaag gacccaggtg 2580
gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 2640
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 2700
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 2760
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 2820
gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 2880
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 2940
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 3000
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 3060
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 3120
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 3180
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 3240
cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 3300
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 3360
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 3420
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 3480
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 3540
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 3600
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 3660
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 3720
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 3780
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 3840
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 3900
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 3960
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4020
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4080
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4140
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4200
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4260
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4320
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 4380
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 4440
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 4500
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 4560
gctgatttgc ccgggcagtt caggctcatc aggcgcgccg agcgacctca tgctatacct 4620
gagaaagcaa cctgacctac aggaaagagt tactcaagaa taagaatttt cgttttaaaa 4680
cctaagagtc actttaaaat ttgtatacac ttattttttt tataacttat ttaataataa 4740
aaatcataaa tcataagaaa ttcgcttatt tagaagtgtc aacaacgtat ctaccaacga 4800
tttgaccctt ttccatcttt tcgtaaattt ctggcaaggt agacaagccg acaaccttga 4860
ttggagactt gaccaaacct ctggcgaaga attgttaatt aagagctcgt ttgcggttat 4920
ttattagatt cttggcaaca ggcaaggatg gactgcttga cactttcgca agcatttttg 4980
agttcctctg gggacatggc ggcgttacag cagattttca agctagggac aattggtagc 5040
gtctcctgtt ttaaaacaat agtgtttctt gtgatgagaa cgttgtagtt aataagagca 5100
tgatctacta tggactgcag aaatttttcc tcctcttcgt atggctcaat gaatttgttt 5160
gtctgggact tcttttgcaa agctgacatg gtttcgaata gctgttcgca ggtgtatccg 5220
aacttgcgag acctatatgc gggagtcagt tgcagatgta ggacagcaga cactggagag 5280
gacgtgacga ttacgtatga acgcaaggag tcgtcagatg caaaggaatc atgcaaagat 5340
ttggatagtt tttgcagcgt ctggacggcg tcgttgttgg agtccatcaa tttcaagact 5400
ttggagacgg atgtgacggt gtaagccggc aaacaggcag aaaaacaata tgcattggaa 5460
ccaatacgct ggtgcaaaca cataacactg tcacccagga caaaaccacc ggtggacccc 5520
aacgcggtgg ccatggaccc aacggtaatg tcaatggcag ttgcgcgatc catgttgaag 5580
tgctctgaca acccacggcc cgtagcgcca agaacaccaa tggagaaggt ttcgtcaaca 5640
aatagtctga acttgtactt gttcttcagc ttagtcaact caggcaacgg agctaaatcg 5700
cccgagttgt ggaaaatacc ctcagtgacg ataaattttc ttggaatggc gggcagtttc 5760
tcaagtttct cctgttcggt caactcgttt aataaacatt ctagcgaatt catatcgttg 5820
tggttgaagt agtagactgt ggatctgctt agttgcagag cattttgcac tggtaatgac 5880
acctggtcgt ctgccacgat aacatcacca cgctttgtga aagcaggcag aacagagggt 5940
gcggcacaaa agtcttgccc gtacagaacg gaaccttggg tgccaaagaa ctgtgctaaa 6000
tcatattcca acgtgtaatg aacgtcctgg ttaccgtaga acccggcggg accacaggcg 6060
cccacaccgt aattcttgat agtggtcttg accacttctt tcacgggctc cgtagcggac 6120
aattgcaaaa agttgttcga ggccaaattg aaaacattgg tatacttctc ctgcagattg 6180
tttctggtga tagtaatatg gttctgaatg ggcatttcca tggtgacggg tgttttggcc 6240
accctccacg attgctcatc ggtggcagaa gggtcgacta gaggctcggg ctcccagtcc 6300
tcaattagcg cgtcaatctc ctggggcgat aggttgggct tctgtgcttg aagactcttt 6360
ttctgttgtg gcttggacaa gtaatagatg atcccgtata aaataagccc tatctcaacc 6420
gtggtcctgt atggatcgtc atgatgcgat ttcttgatgt acgaaacgat gaattggcct 6480
cccgggattt gagtcaacac cagattgaag tagtaccata ggtacgatga ggtggtaaca 6540
ataaatgccg gaatcggtat tgatttgggt aaaacctctg ggatgtgtgc cattttaagc 6600
tagctatttt gtaattaaaa cttagattag attgctatgc tttctttcta atgagcaaga 6660
agtaaaaaaa gttgtaatag aacaagaaaa atgaaactga aacttgagaa attgaagacc 6720
gtttattaac ttaaatatca atgggaggtc atcgaaagag aaaaaaatca aaaaaaaaaa 6780
ttttcaagaa aaagaaacgt gataaaaatt tttattgcct ttttcgacga agaaaaagaa 6840
acgaggcggt ctcttttttc ttttccaaac ctttagtacg ggtaattaac gacaccctag 6900
aggaagaaag aggggaaatt tagtatgctg tgcttgggtg ttttgaagtg gtacggcgat 6960
gcgcggagtc cgagaaaatc tggaagagta aaaaaggagt agaaacattt tgaagctaag 7020
atctacgcac agatattata acatctgcat aataggcatt tgcaagaatt actcgtgagt 7080
aaggaaagag tgaggaacta tcgcatacct gcatttaaag atgccgattt gggcgcgaat 7140
cctttatttt ggcttcaccc tcatactatt atcagggcca gaaaaaggaa gtgtttccct 7200
ccttcttgaa ttgatgttac cctcataaag cacgtggcct cttatcgaga aagaaattac 7260
cgtcgctcgt gatttgtttg caaaaagaac aaaactgaaa aaacccagac acgctcgact 7320
tcctgtcttc ctattgattg cagcttccaa tttcgtcaca caacaaggtc ctagcgacgg 7380
ctcacaggtt ttgtaacaag caatcgaagg ttctggaatg gcgggaaagg gtttagtacc 7440
acatgctatg atgcccactg tgatctccag agcaaagttc gttcgatcgt actgttactc 7500
tctctctttc aaacagaatt gtccgaatcg tgtgacaaca acagcctgtt ctcacacact 7560
cttttcttct aaccaagggg gtggtttagt ttagtagaac ctcgtgaaac ttacatttac 7620
atatatataa acttgcataa attggtcaat gcaagaaata catatttggt cttttctaat 7680
tcgtagtttt tcaagttctt agatgctttc tttttctctt ttttacagat catcaaggaa 7740
gtaattatct actttttaca acaaatataa aacaaagctt aaaatgagta ctcctgcaaa 7800
ctatacccgt gtgcccctgt gcgaaccaga ggagctgcca gacgacatac aaaaagaaaa 7860
tgaatatggt acactagatt ctccggggca tttgtatcaa gtcaagtcac gtcatgggaa 7920
gccactacct gagcccgttg tcgacacccc tccttattac atttctttgt taacatatct 7980
aaattatttg attctgatta tattaggtca tgttcacgac ttcttaggta tgaccttcca 8040
aaaaaacaaa catctggatc ttttagagca tgatgggtta gcaccttggt tttcaaattt 8100
cgagagtttt tatgtcagga gaattaaaat gagaattgat gattgctttt ctagaccaac 8160
tactggtgtt cctggtagat ttattcgttg tattgataga atttctcata atataaatga 8220
gtattttacc tactcaggcg cagtgtatcc atgcatgaac ttatcatcat ataactattt 8280
aggcttcgca caaagtaagg gtcaatgtac cgatgccgcc ttggaatctg tcgataaata 8340
ttctattcaa tctggtggtc caagagctca aatcggtacc acagatttgc acattaaagc 8400
agagaaatta gttgctagat ttatcggtaa ggaggatgcc ctcgtttttt cgatgggtta 8460
tggtacaaat gcaaacttgt tcaacgcttt cctcgataaa aagtgtttag ttatctctga 8520
cgaattgaac cacacctcta ttagaacagg tgttaggctt tctggtgctg ctgtgcgaac 8580
tttcaagcat ggtgatatgg tgggtttaga aaagctcatc agagaacaga tagtacttgg 8640
tcaaccaaaa acaaatcgtc catggaagaa aattttaatt tgcgcagaag ggttgttttc 8700
catggaaggt actttgtgta acttgccaaa attggttgaa ttgaagaaga aatataaatg 8760
ttacttgttt atcgatgaag cccattctat aggcgctatg ggcccaactg gtcgcggtgt 8820
ttgtgaaata tttggcgttg atcccaagga cgtcgacatt ctaatgggta ctttcactaa 8880
gtcgtttggt gctgctggtg gttacattgc tgctgatcaa tggattatcg atagactgag 8940
gttggattta accactgtga gttatagtga gtcaatgccg gctcctgttt tagctcaaac 9000
tatttcctca ttacaaacca ttagtggtga aatatgtccc ggacaaggta ctgaaagatt 9060
gcaacgtata gcctttaatt cccgttatct acgtttagct ttgcaaaggt taggatttat 9120
tgtctacggt gtggctgact caccagttat tcccttacta ctgtattgtc cctcaaagat 9180
gcccgcattt tcgagaatga tgttacaaag acggattgct gttgttgttg ttgcttatcc 9240
tgctactccg ctgatcgaat caagagtaag attctgtatg tctgcatctt taacaaagga 9300
agatatcgat tatttactgc gtcatgttag tgaagttggt gacaaattga atttgaaatc 9360
aaattccggc aaatccagtt acgacggtaa acgtcaaaga tgggacatcg aggaagttat 9420
caggagaaca cctgaagatt gtaaggacga caagtatttt gttaattgac cgcggctagc 9480
taagatccgc tctaaccgaa aaggaaggag ttagacaacc tgaagtctag gtccctattt 9540
atttttttat agttatgtta gtattaagaa cgttatttat atttcaaatt tttctttttt 9600
ttctgtacag acgcgtgtac gcatgtaaca ttatactgaa aaccttgctt gagaaggttt 9660
tgggacgctc gaagg 9675
<210> 53
<211> 8241
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 53
cgcgcctgat gagcctgaac tgcccgggca aatcagctgg cgtaatagcg aagaggcccg 60
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcgcg acgcgccctg 120
tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc 180
cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg 240
ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg 300
gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg 360
atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt 420
ccaaactgga acaacactca accctatctc ggtctattct tttgatttat aagggatttt 480
gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt 540
taacaaaata ttaacgttta caatttcctg atgcggtatt ttctccttac gcatctgtgc 600
ggtatttcac accgcatagg gtaataactg atataattaa attgaagctc taatttgtga 660
gtttagtata catgcattta cttataatac agttttttag ttttgctggc cgcatcttct 720
caaatatgct tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc 780
ctttgcaaat agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc 840
cacggttcta tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt 900
cataatcaac caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc 960
gataacaaaa tctttgtcgc tcttcgcaat gtcaacagta cccttagtat attctccagt 1020
agatagggag cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt 1080
tacttcttct gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc 1140
attcgtaatg tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac 1200
tgtattacca atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga 1260
taatgccttt agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg 1320
tgtttttagt aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt 1380
ggtacgaaca tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag 1440
cttggcagca acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat 1500
gatttatctt cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca 1560
atttcatgtt tcttcaacac tacatatgcg tatatatacc aatctaagtc tgtgctcctt 1620
ccttcgttct tccttctgtt cggagattac cgaatcaaaa aaatttcaaa gaaaccgaaa 1680
tcaaaaaaaa gaataaaaaa aaaatgatga attgaattga aaagctgtgg tatggtgcac 1740
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 1800
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1860
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1920
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1980
ggacggatcg cttgcctgta acttacacgc gcctcgtatc ttttaatgat ggaataattt 2040
gggaatttac tctgtgttta tttattttta tgttttgtat ttggatttta gaaagtaaat 2100
aaagaaggta gaagagttac ggaatgaaga aaaaaaaata aacaaaggtt taaaaaattt 2160
caacaaaaag cgtactttac atatatattt attagacaag aaaagcagat taaatagata 2220
tacattcgat taacgataag taaaatgtaa aatcacagga ttttcgtgtg tggtcttcta 2280
cacagacaag atgaaacaat tcggcattaa tacctgagag caggaagagc aagataaaag 2340
gtagtatttg ttggcgatcc ccctagagtc ttttacatct tcggaaaaca aaaactattt 2400
tttctttaat ttcttttttt actttctatt tttaatttat atatttatat taaaaaattt 2460
aaattataat tatttttata gcacgtgatg aaaaggaccc aggtggcact tttcggggaa 2520
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 2580
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 2640
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 2700
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 2760
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 2820
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 2880
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 2940
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 3000
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 3060
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 3120
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 3180
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 3240
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 3300
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 3360
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 3420
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 3480
agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc 3540
atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc 3600
cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 3660
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 3720
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 3780
tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 3840
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 3900
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 3960
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 4020
cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 4080
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 4140
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 4200
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 4260
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 4320
cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 4380
gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcccaa 4440
tacgcaaacc gcctctcccc gcgcgttggc cgattcatta atgcagctga tttgcccggg 4500
cagttcaggc tcatcaggcg cgccgagcga cctcatgcta tacctgagaa agcaacctga 4560
cctacaggaa agagttactc aagaataaga attttcgttt taaaacctaa gagtcacttt 4620
aaaatttgta tacacttatt ttttttataa cttatttaat aataaaaatc ataaatcata 4680
agaaattcgc ttatttagaa gtgtcaacaa cgtatctacc aacgatttga cccttttcca 4740
tcttttcgta aatttctggc aaggtagaca agccgacaac cttgattgga gacttgacca 4800
aacctctggc gaagaattgt taattaagag ctcgtttggt cagttggcct tcttgccgtc 4860
attttcacga aaccatttcc tgatatacca ggaacagcca accatgtaga atggcacgac 4920
cagaatgttt gataggacac caaaaatcca ttgcaacgga acaaagcggc ttttctttgc 4980
ggtgagccca aggtccatcc ccattatcat ccatccgaca aaatctgtaa aaacgtcatc 5040
atcacctctg gccagcgact tggcaatgat atcacatgct tgtttgcatg ggatagcgtc 5100
tgaggggcct tcgatcaact ttgtaatttc gggtttcgtt agctgctcta cagtgaaacc 5160
ttcgctttca aaattaccag gataaacaca actgatacgg aagttcgtca gttcttgtct 5220
taagattgct accagtgatt tgattgcagc ttttgcaggc gcatactggg aatagcccac 5280
aaatgggtaa agcgcggtgg cactagaaaa gatgatgagg tggtgttcct tggtttgctc 5340
tgcaagggca atctgatgtg ccacgttcaa agttgtttta tagttgatgt ccatacccaa 5400
gttcaactca tgtccgctta gcccacgaaa taacttagga acagcccccc ctgcacagca 5460
taacgtttgt gtagggagta aatccaagtc tctcagggca ttgaacaaac attccacgga 5520
ttcgtagcag gacaagtcgc atgggtagta aaataaccgt tgctcaaggt ccaagggcgc 5580
agccaactta tgttgcactt ggccctcgtc agtggtttcc cttctcaggt gagcttcaat 5640
cctaatttcg ttgcatgtgt ccagcagtct agcctctgac ctactgacga taataatctt 5700
tgtgttttca gcctcattat aatatttttt ggcgaattcc tttccaagac cttgtgaacc 5760
accagtgatc aacacaactt ggtcttctaa cgtaaacttc attttaagct attttgtaat 5820
taaaacttag attagattgc tatgctttct ttctaatgag caagaagtaa aaaaagttgt 5880
aatagaacaa gaaaaatgaa actgaaactt gagaaattga agaccgttta ttaacttaaa 5940
tatcaatggg aggtcatcga aagagaaaaa aatcaaaaaa aaaaattttc aagaaaaaga 6000
aacgtgataa aaatttttat tgcctttttc gacgaagaaa aagaaacgag gcggtctctt 6060
ttttcttttc caaaccttta gtacgggtaa ttaacgacac cctagaggaa gaaagagggg 6120
aaatttagta tgctgtgctt gggtgttttg aagtggtacg gcgatgcgcg gagtccgaga 6180
aaatctggaa gagtaaaaaa ggagtagaaa cattttgaag ctaagatcta cgcacagata 6240
ttataacatc tgcataatag gcatttgcaa gaattactcg tgagtaagga aagagtgagg 6300
aactatcgca tacctgcatt taaagatgcc gatttgggcg cgaatccttt attttggctt 6360
caccctcata ctattatcag ggccagaaaa aggaagtgtt tccctccttc ttgaattgat 6420
gttaccctca taaagcacgt ggcctcttat cgagaaagaa attaccgtcg ctcgtgattt 6480
gtttgcaaaa agaacaaaac tgaaaaaacc cagacacgct cgacttcctg tcttcctatt 6540
gattgcagct tccaatttcg tcacacaaca aggtcctagc gacggctcac aggttttgta 6600
acaagcaatc gaaggttctg gaatggcggg aaagggttta gtaccacatg ctatgatgcc 6660
cactgtgatc tccagagcaa agttcgttcg atcgtactgt tactctctct ctttcaaaca 6720
gaattgtccg aatcgtgtga caacaacagc ctgttctcac acactctttt cttctaacca 6780
agggggtggt ttagtttagt agaacctcgt gaaacttaca tttacatata tataaacttg 6840
cataaattgg tcaatgcaag aaatacatat ttggtctttt ctaattcgta gtttttcaag 6900
ttcttagatg ctttcttttt ctctttttta cagatcatca aggaagtaat tatctacttt 6960
ttacaacaaa tataaaacaa agcttatgaa cgtaacatcg aatgcaactg cagccggttc 7020
ctttccacta gcatttggtc tcaagacctc atttgggttt atgcactatg ccaaggcccc 7080
tgccattaat ttacgcccca aggaatcctt gctgccggaa atgagtgatg gtgtgctggc 7140
cttggttgcg ccggttgttg cctactgggc gttgtctggt atattccatg taatagacac 7200
tttccatctg gctgagaagt acagaattca tccgagcgaa gaggttgcca agaggaacaa 7260
ggcgtcgaga atgcatgttt tccttgaagt gattctacaa catatcatac agaccattgt 7320
tggccttatc tttatgcact tcgagccgat ctacatgact gggtttgaag aaaatgccat 7380
gtggaagcta cgtgcagacc ttcctcggat tattccagat gccgctattt attacggcta 7440
tatgtacgga atgtccgctt tgaagatctt tgcaggcttt ttattcgttg atacatggca 7500
atactttttg catagattga tgcatatgaa taagacctta tacaaatggt tccactctgt 7560
tcatcatgaa ctatacgtgc catatgctta cggtgctctt ttcaacaatc ctgttgaggg 7620
cttcttgtta gatactttgg gaaccggtat tgccatgacg ttaactcatt tgactcacag 7680
agagcaaatc attcttttta cctttgccac catgaagact gtcgatgacc actgtgggta 7740
tgctttgcca cttgacccat tccaatggct tttccctaat aacgctgtct atcacgatat 7800
ccaccaccag caatttggta tcaagacgaa ctttgctcaa ccatttttca ctttctggga 7860
caatttgttc caaactaact ttaaagggtt tgaagaatat caaaagaagc aaagacgtgt 7920
caccatcgac aagtacaaag agtttttgca agagagagaa ttggaaaaga aggagaaact 7980
caaaaacttc aaagctatga atgctgctga aaatgaagta aagaaagaga aataaccgcg 8040
gctagctaag atccgctcta accgaaaagg aaggagttag acaacctgaa gtctaggtcc 8100
ctatttattt ttttatagtt atgttagtat taagaacgtt atttatattt caaatttttc 8160
ttttttttct gtacagacgc gtgtacgcat gtaacattat actgaaaacc ttgcttgaga 8220
aggttttggg acgctcgaag g 8241
<210> 54
<211> 7434
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 54
tcgctattac gccagctgat ttgcccgggc agttcaggct catcaggcgc gccatgcagg 60
atgcattgat cagttaaccc atgggcatgc gaaggaaaat gagaaatatc gagggagacg 120
attcagagga gcaggacaaa ctataaccga ctgtttgttg gaggatgccg tacataacga 180
acactgctga agctaccatg tctacagttt agaggaatgg gtacaactca caggcgaggg 240
atggtgttca ctcgtgctag caaacgcggt gggagcaaaa agtagaatat tatcttttat 300
tcgtgaaact tcgaacactg tcatctaaag atgctatata ctaatatagg catacttgat 360
aatgaaaact ataaatcgta aagacataag agatccgcgg atccccgggt cgagcctgaa 420
cggcctcgag gcctgaacgg cctcgacgaa ttcattattt gtagagctca tccatgccat 480
gtgtaatccc agcagcagtt acaaactcaa gaaggaccat gtggtcacgc ttttcgttgg 540
gatctttcga aagggcagat tgtgtcgaca ggtaatggtt gtctggtaaa aggacagggc 600
catcgccaat tggagtattt tgttgataat ggtctgctag ttgaacggat ccatcttcaa 660
tgttgtggcg aattttgaag ttagctttga ttccattctt ttgtttgtct gccgtgatgt 720
atacattgtg tgagttatag ttgtactcga gtttgtgtcc gagaatgttt ccatcttctt 780
taaaatcaat accttttaac tcgatacgat taacaagggt atcaccttca aacttgactt 840
cagcacgcgt cttgtagttc ccgtcatctt tgaaagatat agtgcgttcc tgtacataac 900
cttcgggcat ggcactcttg aaaaagtcat gccgtttcat atgatccgga taacgggaaa 960
agcattgaac accataagag aaagtagtga caagtgttgg ccatggaaca ggtagttttc 1020
cagtagtgca aataaattta agggtaagct ggccctgcag gccaagcttt gttttatatt 1080
tgttgtaaaa agtagataat tacttccttg atgatctgta aaaaagagaa aaagaaagca 1140
tctaagaact tgaaaaacta cgaattagaa aagaccaaat atgtatttct tgcattgacc 1200
aatttatgca agtttatata tatgtaaatg taagtttcac gaggttctac taaactaaac 1260
cacccccttg gttagaagaa aagagtgtgt gagaacaggc tgttgttgtc acacgattcg 1320
gacaattctg tttgaaagag agagagtaac agtacgatcg aacgaacttt gctctggaga 1380
tcacagtggg catcatagca tgtggtacta aaccctttcc cgccattcca gaaccttcga 1440
ttgcttgtta caaaacctgt gagccgtcgc taggaccttg ttgtgtgacg aaattggaag 1500
ctgcaatcaa taggaagaca ggaagtcgag cgtgtctggg ttttttcagt tttgttcttt 1560
ttgcaaacaa atcacgagcg acggtaattt ctttctcgat aagaggccac gtgctttatg 1620
agggtaacat caattcaaga aggagggaaa cacttccttt ttctggccct gataatagta 1680
tgagggtgaa gccaaaataa aggattcgcg cccaaatcgg catctttaaa tgcaggtatg 1740
cgatagttcc tcactctttc cttactcacg agtaattctt gcaaatgcct attatgcaga 1800
tgttataata tctgtgcgta gatctgatat ccctgcatgg cgcgcctgat gagcctgaac 1860
tgcccgggca aatcagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 1920
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 1980
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 2040
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 2100
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 2160
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 2220
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 2280
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 2340
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 2400
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 2460
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 2520
gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 2580
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 2640
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 2700
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 2760
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 2820
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 2880
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 2940
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 3000
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 3060
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 3120
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 3180
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 3240
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 3300
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 3360
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 3420
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 3480
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 3540
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 3600
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 3660
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 3720
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 3780
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 3840
atttccccga aaagtgccac ctgggtcctt ttcatcacgt gctataaaaa taattataat 3900
ttaaattttt taatataaat atataaatta aaaatagaaa gtaaaaaaag aaattaaaga 3960
aaaaatagtt tttgttttcc gaagatgtaa aagactctag ggggatcgcc aacaaatact 4020
accttttatc ttgctcttcc tgctctcagg tattaatgcc gaattgtttc atcttgtctg 4080
tgtagaagac cacacacgaa aatcctgtga ttttacattt tacttatcgt taatcgaatg 4140
tatatctatt taatctgctt ttcttgtcta ataaatatat atgtaaagta cgctttttgt 4200
tgaaattttt taaacctttg tttatttttt tttcttcatt ccgtaactct tctaccttct 4260
ttatttactt tctaaaatcc aaatacaaaa cataaaaata aataaacaca gagtaaattc 4320
ccaaattatt ccatcattaa aagatacgag gcgcgtgtaa gttacaggca agcgatccgt 4380
cctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct 4440
ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga 4500
cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag 4560
cgggtgttgg cgggtgtcgg ggctggctta actatgcggc atcagagcag attgtactga 4620
gagtgcacca tatcgactac gtcgtaaggc cgtttctgac agagtaaaat tcttgaggga 4680
actttcacca ttatgggaaa tggttcaaga aggtattgac ttaaactcca tcaaatggtc 4740
aggtcattga gtgtttttta tttgttgtat tttttttttt ttagagaaaa tcctccaata 4800
tcaaattagg aatcgtagtt tcatgatttt ctgttacacc taactttttg tgtggtgccc 4860
tcctccttgt caatattaat gttaaagtgc aattcttttt ccttatcacg ttgagccatt 4920
agtatcaatt tgcttacctg tattccttta ctatcctcct ttttctcctt cttgataaat 4980
gtatgtagat tgcgtatata gtttcgtcta ccctatgaac atattccatt ttgtaatttc 5040
gtgtcgtttc tattatgaat ttcatttata aagtttatgt acaaatatca taaaaaaaga 5100
gaatcttttt aagcaaggat tttcttaact tcttcggcga cagcatcacc gacttcggtg 5160
gtactgttgg aaccacctaa atcaccagtt ctgatacctg catccaaaac ctttttaact 5220
gcatcttcaa tggccttacc ttcttcaggc aagttcaatg acaatttcaa catcattgca 5280
gcagacaaga tagtggcgat agggtcaacc ttattctttg gcaaatctgg agcagaaccg 5340
tggcatggtt cgtacaaacc aaatgcggtg ttcttgtctg gcaaagaggc caaggacgca 5400
gatggcaaca aacccaagga acctgggata acggaggctt catcggagat gatatcacca 5460
aacatgttgc tggtgattat aataccattt aggtgggttg ggttcttaac taggatcatg 5520
gcggcagaat caatcaattg atgttgaacc ttcaatgtag ggaattcgtt cttgatggtt 5580
tcctccacag tttttctcca taatcttgaa gaggccaaaa gattagcttt atccaaggac 5640
caaataggca atggtggctc atgttgtagg gccatgaaag cggccattct tgtgattctt 5700
tgcacttctg gaacggtgta ttgttcacta tcccaagcga caccatcacc atcgtcttcc 5760
tttctcttac caaagtaaat acctcccact aattctctga caacaacgaa gtcagtacct 5820
ttagcaaatt gtggcttgat tggagataag tctaaaagag agtcggatgc aaagttacat 5880
ggtcttaagt tggcgtacaa ttgaagttct ttacggattt ttagtaaacc ttgttcaggt 5940
ctaacactac cggtacccca tttaggacca gccacagcac ctaacaaaac ggcatcaacc 6000
ttcttggagg cttccagcgc ctcatctgga agtgggacac ctgtagcatc gatagcagca 6060
ccaccaatta aatgattttc gaaatcgaac ttgacattgg aacgaacatc agaaatagct 6120
ttaagaacct taatggcttc ggctgtgatt tcttgaccaa cgtggtcacc tggcaaaacg 6180
acgatcttct taggggcaga cataggggca gacattagaa tggtatatcc ttgaaatata 6240
tatatatatt gctgaaatgt aaaaggtaag aaaagttaga aagtaagacg attgctaacc 6300
acctattgga aaaaacaata ggtccttaaa taatattgtc aacttcaagt attgtgatgc 6360
aagcatttag tcatgaacgc ttctctattc tatatgaaaa gccggttccg gcctctcacc 6420
tttccttttt ctcccaattt ttcagttgaa aaaggtatat gcgtcaggcg acctctgaaa 6480
ttaacaaaaa atttccagtc atcgaatttg attctgtgcg atagcgcccc tgtgtgttct 6540
cgttatgttg aggaaaaaaa taatggttgc taagagattc gaactcttgc atcttacgat 6600
acctgagtat tcccacagtt aactgcggtc aagatatttc ttgaatcagg cgccttagac 6660
cgctcggcca aacaaccaat tacttgttga gaaatagagt ataattatcc tataaatata 6720
acgtttttga acacacatga acaaggaagt acaggacaat tgattttgaa gagaatgtgg 6780
attttgatgt aattgttggg attccatttt taataaggca ataatattag gtatgtggat 6840
atactagaag ttctcctcga ccgtcgatat gcggtgtgaa ataccgcaca gatgcgtaag 6900
gagaaaatac cgcatcagga aattgtaaac gttaatattt tgttaaaatt cgcgttaaat 6960
ttttgttaaa tcagctcatt ttttaaccaa taggccgaaa tcggcaaaat cccttataaa 7020
tcaaaagaat agaccgagat agggttgagt gttgttccag tttggaacaa gagtccacta 7080
ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca 7140
ctacgtgaac catcacccta atcaagtttt ttggggtcga ggtgccgtaa agcactaaat 7200
cggaacccta aagggagccc ccgatttaga gcttgacggg gaaagccggc gaacgtggcg 7260
agaaaggaag ggaagaaagc gaaaggagcg ggcgctaggg cgctggcaag tgtagcggtc 7320
acgctgcgcg taaccaccac acccgccgcg cttaatgcgc cgctacaggg cgcgtcgcgc 7380
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctct 7434
<210> 55
<211> 6979
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<220>
<221> misc_feature
<222> (2382)..(2382)
<223> n是a, c, g, 或t
<400> 55
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 60
tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt 120
cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg 180
tgttggcggg tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt 240
gcaccatacc acagcttttc aattcaattc atcatttttt ttttattctt ttttttgatt 300
tcggtttctt tgaaattttt ttgattcggt aatctccgaa cagaaggaag aacgaaggaa 360
ggagcacaga cttagattgg tatatatacg catatgtagt gttgaagaaa catgaaattg 420
cccagtattc ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa gataaatcat 480
gtcgaaagct acatataagg aacgtgctgc tactcatcct agtcctgttg ctgccaagct 540
atttaatatc atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac 600
caaggaatta ctggagttag ttgaagcatt aggtcccaaa atttgtttac taaaaacaca 660
tgtggatatc ttgactgatt tttccatgga gggcacagtt aagccgctaa aggcattatc 720
cgccaagtac aattttttac tcttcgaaga cagaaaattt gctgacattg gtaatacagt 780
caaattgcag tactctgcgg gtgtatacag aatagcagaa tgggcagaca ttacgaatgc 840
acacggtgtg gtgggcccag gtattgttag cggtttgaag caggcggcag aagaagtaac 900
aaaggaacct agaggccttt tgatgttagc agaattgtca tgcaagggct ccctatctac 960
tggagaatat actaagggta ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg 1020
ctttattgct caaagagaca tgggtggaag agatgaaggt tacgattggt tgattatgac 1080
acccggtgtg ggtttagatg acaagggaga cgcattgggt caacagtata gaaccgtgga 1140
tgatgtggtc tctacaggat ctgacattat tattgttgga agaggactat ttgcaaaggg 1200
aagggatgct aaggtagagg gtgaacgtta cagaaaagca ggctgggaag catatttgag 1260
aagatgcggc cagcaaaact aaaaaactgt attataagta aatgcatgta tactaaactc 1320
acaaattaga gcttcaattt aattatatca gttattaccc tatgcggtgt gaaataccgc 1380
acagatgcgt aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa 1440
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 1500
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 1560
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 1620
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 1680
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 1740
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 1800
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 1860
gggcgcgtcg cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg 1920
ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg 1980
ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg agcgcgcgta 2040
atacgactca ctatagggcg aattgggtac cggccgcaaa ttaaagcctt cgagcgtccc 2100
aaaaccttct caagcaaggt tttcagtata atgttacatg cgtacacgcg tctgtacaga 2160
aaaaaaagaa aaatttgaaa tataaataac gttcttaata ctaacataac tataaaaaaa 2220
taaataggga cctagacttc aggttgtcta actccttcct tttcggttag agcggatgtg 2280
gggggagggc gtgaatgtaa gcgtgacata actaattaca tgactcgagg tcgacaattc 2340
caaccttacc caagagttcg ccaaactcag acatcacttt angcaaaacc gcgccgtgct 2400
tcttcctcgg tggcattcat cacgaaatgt tcagcactac gcatactttt gacaggaaac 2460
gcaacggata ttgagtcaat atcaggcatt ctatcgctca gctttacagt gacaatgacg 2520
gctggcgact gaatattagt gcttacagac agcactacat attttccgtc gatgttgaaa 2580
tcctttctca tatgtcacca taaatatcaa ataattatag caatcattta cgcgttaatg 2640
gctaatcgcc atcttccagc aggcgcacca ttgcccctgt ttcactatcc agggtacgga 2700
tatagttcat gacaatattt acattggtcc agccaccagc ttgcatgatc tccggtattg 2760
aaactccagc gcgggccata tctcgcgcgg ctccgacacg ggcactgtgt ccagaccagg 2820
ccaggtatct ctgaccagag tcatccttag cgccgtaaat caatcgatga gttgcttcaa 2880
aaatcccttc cagggcgcga gttgatagct ggctggtggc agatggcgcg gcaacaccat 2940
tttttctgac ccggcaaaac aggtagttat tcggatcatc agctacacca gagacggaaa 3000
tccatcgctc gaccagttta gttaccccca ggctaagtgc cttctctaca cctgcggtgc 3060
taaccagcgt tttcgttctg ccaatatgga ttaacattct cccaccgtca gtacgtgaga 3120
tatctttaac cctgatcctg gcaatttcgg ctatacgtaa cagggtgtta taagcaatcc 3180
ccagaaatgc cagattacgt atatcctggc agcgatcgct attttccatg agtgaacgaa 3240
cctggtcgaa atcagtgcgt tcgaacgcta gagcctgttt tgcacgttca ccggcatcaa 3300
cgttttcttt tcggatccgc cgcataacca gtgaaacagc attgctgtca cttggtcgtg 3360
gcagcccgga ccgacgatga agcatgttta gctggcccaa atgttgctgg atagttttta 3420
ctgccagacc gcgcgcctga agatatagaa gataatcgcg aacatcttca ggttctgcgg 3480
gaaaccattt ccggttattc aacttgcacc atgccgccca cgaccggcaa acggacagaa 3540
gcattttcca ggtatgctca gaaaacgcct ggcgatccct gaacatgtcc atcaggttct 3600
tgcgaacctc atcactcgtt gcatcgaccg gtaatgcagg caaattttgg tgtacggtca 3660
gtaaattgga catttaacac tcagataatg gttttaagta aagtgtacag gatcggctct 3720
gcccctcgac ggtatcgata agcttgatat cgaattcctg cagcccgggg gatccactag 3780
ttctagaatc cggggttttt tctccttgac gttaaagtat agaggtatat taacaatttt 3840
ttgttgatac ttttattaca tttgaataag aagtaataca aaccgaaaat gttgaaagta 3900
ttagttaaag tggttatgca gtttttgcat ttatatatct gttaatagat caaaaatcat 3960
cgcttcgctg attaattacc ccagaaataa ggctaaaaaa ctaatcgcat tatcatccta 4020
tggttgttaa tttgattcgt tcatttgaag gtttgtgggg ccaggttact gccaattttt 4080
cctcttcata accataaaag ctagtattgt agaatcttta ttgttcggag cagtgcggcg 4140
cgaggcacat ctgcgtttca ggaacgcgac cggtgaagac gaggacgcac ggaggagagt 4200
cttccttcgg agggctgtca cccgctcggc ggcttctaat ccgtactaga gctccagctt 4260
ttgttccctt tagtgagggt taattgcgcg cttggcgtaa tcatggtcat agctgtttcc 4320
tgtgtgaaat tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg 4380
taaagcctgg ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc 4440
cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 4500
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 4560
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 4620
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 4680
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 4740
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 4800
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 4860
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 4920
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 4980
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 5040
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 5100
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 5160
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 5220
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 5280
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 5340
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 5400
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 5460
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 5520
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 5580
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 5640
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 5700
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 5760
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 5820
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 5880
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 5940
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 6000
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 6060
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 6120
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 6180
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 6240
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 6300
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 6360
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 6420
aggggttccg cgcacatttc cccgaaaagt gccacctggg tccttttcat cacgtgctat 6480
aaaaataatt ataatttaaa ttttttaata taaatatata aattaaaaat agaaagtaaa 6540
aaaagaaatt aaagaaaaaa tagtttttgt tttccgaaga tgtaaaagac tctaggggga 6600
tcgccaacaa atactacctt ttatcttgct cttcctgctc tcaggtatta atgccgaatt 6660
gtttcatctt gtctgtgtag aagaccacac acgaaaatcc tgtgatttta cattttactt 6720
atcgttaatc gaatgtatat ctatttaatc tgcttttctt gtctaataaa tatatatgta 6780
aagtacgctt tttgttgaaa ttttttaaac ctttgtttat ttttttttct tcattccgta 6840
actcttctac cttctttatt tactttctaa aatccaaata caaaacataa aaataaataa 6900
acacagagta aattcccaaa ttattccatc attaaaagat acgaggcgcg tgtaagttac 6960
aggcaagcga tccgtccta 6979
<210> 56
<211> 1704
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 56
tcaagggcaa attgatgctt caacgaaaaa gttattggat tttcagcata ggccactagt 60
ggatctgata tcacctaata acttcgtata gcatacatta tacgaagtta tattaagggt 120
tctcgagagc tcgttttcga cactggatgg cggcgttagt atcgaatcga cagcagtata 180
gcgaccagca ttcacatacg attgacgcat gatattactt tctgcgcact taacttcgca 240
tctgggcaga tgatgtcgag gcgaaaaaaa atataaatca cgctaacatt tgattaaaat 300
agaacaacta caatataaaa aaactataca aatgacaagt tcttgaaaac aagaatcttt 360
ttattgtcag tactgattag aaaaactcat cgagcatcaa atgaaactgc aatttattca 420
tatcaggatt atcaatacca tatttttgaa aaagccgttt ctgtaatgaa ggagaaaact 480
caccgaggca gttccatagg atggcaagat cctggtatcg gtctgcgatt ccgactcgtc 540
caacatcaat acaacctatt aatttcccct cgtcaaaaat aaggttatca agtgagaaat 600
caccatgagt gacgactgaa tccggtgaga atggcaaaag cttatgcatt tctttccaga 660
cttgttcaac aggccagcca ttacgctcgt catcaaaatc actcgcatca accaaaccgt 720
tattcattcg tgattgcgcc tgagcgagac gaaatacgcg atcgctgtta aaaggacaat 780
tacaaacagg aatcgaatgc aaccggcgca ggaacactgc cagcgcatca acaatatttt 840
cacctgaatc aggatattct tctaatacct ggaatgctgt tttgccgggg atcgcagtgg 900
tgagtaacca tgcatcatca ggagtacgga taaaatgctt gatggtcgga agaggcataa 960
attccgtcag ccagtttagt ctgaccatct catctgtaac atcattggca acgctacctt 1020
tgccatgttt cagaaacaac tctggcgcat cgggcttccc atacaatcga tagattgtcg 1080
cacctgattg cccgacatta tcgcgagccc atttataccc atataaatca gcatccatgt 1140
tggaatttaa tcgcggcctc gaaacgtgag tcttttcctt acccatggtt gtttatgttc 1200
ggatgtgatg tgagaactgt atcctagcaa gattttaaaa ggaagtatat gaaagaagaa 1260
cctcagtggc aaatcctaac cttttatatt tctctacagg ggcgcggcgt ggggacaatt 1320
caacgcgtct gtgaggggag cgtttccctg ctcgcaggtc tgcagcgagg agccgtaatt 1380
tttgcttcgc gccgtgcggc catcaaaatg tatggatgca aatgattata catggggatg 1440
tatgggctaa atgtacgggc gacagtcaca tcatgcccct gagctgcgca cgtcaagact 1500
gtcaaggagg gtattctggg cctccatgtc gctggccggg tgacccggcg gggacgaggc 1560
aagctaaaca gatctctaga cctaataact tcgtatagca tacattatac gaagttatat 1620
taagggttgt cgacctgcag cgtacgaagc ttcagctggc atctcgctgg ttaattttcc 1680
tgtctcttgt ctatccagca ctta 1704
<210> 57
<211> 1467
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 57
aagtctagca gcgaaaagta cgcgaagaat ctactataga taatgccagc tgaagcttcg 60
tacgctgcag gtcgacaacc cttaatataa cttcgtataa tgtatgctat acgaagttat 120
taggtctaga gatctgttta gcttgccttg tccccgccgg gtcacccggc cagcgacatg 180
gaggcccaga ataccctcct tgacagtctt gacgtgcgca gctcaggggc atgatgtgac 240
tgtcgcccgt acatttagcc catacatccc catgtataat catttgcatc catacatttt 300
gatggccgca cggcgcgaag caaaaattac ggctcctcgc tgcagacctg cgagcaggga 360
aacgctcccc tcacagacgc gttgaattgt ccccacgccg cgcccctgta gagaaatata 420
aaaggttagg atttgccact gaggttcttc tttcatatac ttccttttaa aatcttgcta 480
ggatacagtt ctcacatcac atccgaacat aaacaaccat gggtaccact cttgacgaca 540
cggcttaccg gtaccgcacc agtgtcccgg gggacgccga ggccatcgag gcactggatg 600
ggtccttcac caccgacacc gtcttccgcg tcaccgccac cggggacggc ttcaccctgc 660
gggaggtgcc ggtggacccg cccctgacca aggtgttccc cgacgacgaa tcggacgacg 720
aatcggacga cggggaggac ggcgacccgg actcccggac gttcgtcgcg tacggggacg 780
acggcgacct ggcgggcttc gtggtcgtct cgtactccgg ctggaaccgc cggctgaccg 840
tcgaggacat cgaggtcgcc ccggagcacc gggggcacgg ggtcgggcgc gcgttgatgg 900
ggctcgcgac ggagttcgcc cgcgagcggg gcgccgggca cctctggctg gaggtcacca 960
acgtcaacgc accggcgatc cacgcgtacc ggcggatggg gttcaccctc tgcggcctgg 1020
acaccgccct gtacgacggc accgcctcgg acggcgagca ggcgctctac atgagcatgc 1080
cctgccccta atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt 1140
atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt 1200
ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg 1260
cgtcaatcgt atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca 1320
tccagtgtcg aaaacgagct ctcgagaacc cttaatataa cttcgtataa tgtatgctat 1380
acgaagttat taggtgatat cagatccact agtggcctat gctagattaa cgttatattt 1440
tccttcaaaa atgatttttt tgtaaaa 1467
<210> 58
<211> 1467
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 58
aaaccacaaa tagtgtaaga tttaaacagt aagccaaaag agatgccagc tgaagcttcg 60
tacgctgcag gtcgacaacc cttaatataa cttcgtataa tgtatgctat acgaagttat 120
taggtctaga gatctgttta gcttgccttg tccccgccgg gtcacccggc cagcgacatg 180
gaggcccaga ataccctcct tgacagtctt gacgtgcgca gctcaggggc atgatgtgac 240
tgtcgcccgt acatttagcc catacatccc catgtataat catttgcatc catacatttt 300
gatggccgca cggcgcgaag caaaaattac ggctcctcgc tgcagacctg cgagcaggga 360
aacgctcccc tcacagacgc gttgaattgt ccccacgccg cgcccctgta gagaaatata 420
aaaggttagg atttgccact gaggttcttc tttcatatac ttccttttaa aatcttgcta 480
ggatacagtt ctcacatcac atccgaacat aaacaaccat gggtaccact cttgacgaca 540
cggcttaccg gtaccgcacc agtgtcccgg gggacgccga ggccatcgag gcactggatg 600
ggtccttcac caccgacacc gtcttccgcg tcaccgccac cggggacggc ttcaccctgc 660
gggaggtgcc ggtggacccg cccctgacca aggtgttccc cgacgacgaa tcggacgacg 720
aatcggacga cggggaggac ggcgacccgg actcccggac gttcgtcgcg tacggggacg 780
acggcgacct ggcgggcttc gtggtcgtct cgtactccgg ctggaaccgc cggctgaccg 840
tcgaggacat cgaggtcgcc ccggagcacc gggggcacgg ggtcgggcgc gcgttgatgg 900
ggctcgcgac ggagttcgcc cgcgagcggg gcgccgggca cctctggctg gaggtcacca 960
acgtcaacgc accggcgatc cacgcgtacc ggcggatggg gttcaccctc tgcggcctgg 1020
acaccgccct gtacgacggc accgcctcgg acggcgagca ggcgctctac atgagcatgc 1080
cctgccccta atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt 1140
atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt 1200
ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg 1260
cgtcaatcgt atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca 1320
tccagtgtcg aaaacgagct ctcgagaacc cttaatataa cttcgtataa tgtatgctat 1380
acgaagttat taggtgatat cagatccact agtggcctat gctgacactt tacttaatct 1440
tttccttcgt actgaacaat taatcaa 1467
<210> 59
<211> 1467
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 59
aagactatac cattataaaa acgcataaga aacagtttca tcatgccagc tgaagcttcg 60
tacgctgcag gtcgacaacc cttaatataa cttcgtataa tgtatgctat acgaagttat 120
taggtctaga gatctgttta gcttgccttg tccccgccgg gtcacccggc cagcgacatg 180
gaggcccaga ataccctcct tgacagtctt gacgtgcgca gctcaggggc atgatgtgac 240
tgtcgcccgt acatttagcc catacatccc catgtataat catttgcatc catacatttt 300
gatggccgca cggcgcgaag caaaaattac ggctcctcgc tgcagacctg cgagcaggga 360
aacgctcccc tcacagacgc gttgaattgt ccccacgccg cgcccctgta gagaaatata 420
aaaggttagg atttgccact gaggttcttc tttcatatac ttccttttaa aatcttgcta 480
ggatacagtt ctcacatcac atccgaacat aaacaaccat gggtaccact cttgacgaca 540
cggcttaccg gtaccgcacc agtgtcccgg gggacgccga ggccatcgag gcactggatg 600
ggtccttcac caccgacacc gtcttccgcg tcaccgccac cggggacggc ttcaccctgc 660
gggaggtgcc ggtggacccg cccctgacca aggtgttccc cgacgacgaa tcggacgacg 720
aatcggacga cggggaggac ggcgacccgg actcccggac gttcgtcgcg tacggggacg 780
acggcgacct ggcgggcttc gtggtcgtct cgtactccgg ctggaaccgc cggctgaccg 840
tcgaggacat cgaggtcgcc ccggagcacc gggggcacgg ggtcgggcgc gcgttgatgg 900
ggctcgcgac ggagttcgcc cgcgagcggg gcgccgggca cctctggctg gaggtcacca 960
acgtcaacgc accggcgatc cacgcgtacc ggcggatggg gttcaccctc tgcggcctgg 1020
acaccgccct gtacgacggc accgcctcgg acggcgagca ggcgctctac atgagcatgc 1080
cctgccccta atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt 1140
atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt 1200
ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg 1260
cgtcaatcgt atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca 1320
tccagtgtcg aaaacgagct ctcgagaacc cttaatataa cttcgtataa tgtatgctat 1380
acgaagttat taggtgatat cagatccact agtggcctat gctagttggc tctgcctata 1440
cgcatatatg tatatatata tatatat 1467
<210> 60
<211> 1706
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 60
tggtggaaaa agaattgcct tgctaagagt attgttgtcc aattaccgca taggccacta 60
gtggatctga tatcacctaa taacttcgta tagcatacat tatacgaagt tatattaagg 120
gttctcgaga gctcgttttc gacactggat ggcggcgtta gtatcgaatc gacagcagta 180
tagcgaccag cattcacata cgattgacgc atgatattac tttctgcgca cttaacttcg 240
catctgggca gatgatgtcg aggcgaaaaa aaatataaat cacgctaaca tttgattaaa 300
atagaacaac tacaatataa aaaaactata caaatgacaa gttcttgaaa acaagaatct 360
ttttattgtc agtactgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 420
catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 480
ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 540
tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 600
atcaccatga gtgacgactg aatccggtga gaatggcaaa agcttatgca tttctttcca 660
gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 720
gttattcatt cgtgattgcg cctgagcgag acgaaatacg cgatcgctgt taaaaggaca 780
attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 840
ttcacctgaa tcaggatatt cttctaatac ctggaatgct gttttgccgg ggatcgcagt 900
ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 960
aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 1020
tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaatc gatagattgt 1080
cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 1140
gttggaattt aatcgcggcc tcgaaacgtg agtcttttcc ttacccatgg ttgtttatgt 1200
tcggatgtga tgtgagaact gtatcctagc aagattttaa aaggaagtat atgaaagaag 1260
aacctcagtg gcaaatccta accttttata tttctctaca ggggcgcggc gtggggacaa 1320
ttcaacgcgt ctgtgagggg agcgtttccc tgctcgcagg tctgcagcga ggagccgtaa 1380
tttttgcttc gcgccgtgcg gccatcaaaa tgtatggatg caaatgatta tacatgggga 1440
tgtatgggct aaatgtacgg gcgacagtca catcatgccc ctgagctgcg cacgtcaaga 1500
ctgtcaagga gggtattctg ggcctccatg tcgctggccg ggtgacccgg cggggacgag 1560
gcaagctaaa cagatctcta gacctaataa cttcgtatag catacattat acgaagttat 1620
attaagggtt gtcgacctgc agcgtacgaa gcttcagctg gcattctgtt tcttctattc 1680
ttttaggttt attgttcctt ctattt 1706
<210> 61
<211> 1467
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 61
ttattcggct tttttccgtt tgtttacgaa acataaacag tcatgccagc tgaagcttcg 60
tacgctgcag gtcgacaacc cttaatataa cttcgtataa tgtatgctat acgaagttat 120
taggtctaga gatctgttta gcttgccttg tccccgccgg gtcacccggc cagcgacatg 180
gaggcccaga ataccctcct tgacagtctt gacgtgcgca gctcaggggc atgatgtgac 240
tgtcgcccgt acatttagcc catacatccc catgtataat catttgcatc catacatttt 300
gatggccgca cggcgcgaag caaaaattac ggctcctcgc tgcagacctg cgagcaggga 360
aacgctcccc tcacagacgc gttgaattgt ccccacgccg cgcccctgta gagaaatata 420
aaaggttagg atttgccact gaggttcttc tttcatatac ttccttttaa aatcttgcta 480
ggatacagtt ctcacatcac atccgaacat aaacaaccat gggtaccact cttgacgaca 540
cggcttaccg gtaccgcacc agtgtcccgg gggacgccga ggccatcgag gcactggatg 600
ggtccttcac caccgacacc gtcttccgcg tcaccgccac cggggacggc ttcaccctgc 660
gggaggtgcc ggtggacccg cccctgacca aggtgttccc cgacgacgaa tcggacgacg 720
aatcggacga cggggaggac ggcgacccgg actcccggac gttcgtcgcg tacggggacg 780
acggcgacct ggcgggcttc gtggtcgtct cgtactccgg ctggaaccgc cggctgaccg 840
tcgaggacat cgaggtcgcc ccggagcacc gggggcacgg ggtcgggcgc gcgttgatgg 900
ggctcgcgac ggagttcgcc cgcgagcggg gcgccgggca cctctggctg gaggtcacca 960
acgtcaacgc accggcgatc cacgcgtacc ggcggatggg gttcaccctc tgcggcctgg 1020
acaccgccct gtacgacggc accgcctcgg acggcgagca ggcgctctac atgagcatgc 1080
cctgccccta atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt 1140
atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt 1200
ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg 1260
cgtcaatcgt atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca 1320
tccagtgtcg aaaacgagct ctcgagaacc cttaatataa cttcgtataa tgtatgctat 1380
acgaagttat taggtgatat cagatccact agtggcctat gctaaatagg aagcgagaat 1440
ttttgacagc gaatgaaaaa gaaaaaa 1467
<210> 62
<211> 4602
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 62
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat 120
tgtaatacga ctcactatag ggcgaccctt aggatctaag cattggcgcg ccgcgcacct 180
gcgttgttac cacaactctt atgaggcccg cggacagcat caaactgtaa gattccgcca 240
cattttatac actctggtcc tttaactggc aaaccttcgg gcgtaatgcc caatttttcg 300
cctttgtctt ttgccttttt cacttcacgt gcttctggta catacttgca atttatacag 360
tgatgaccgc tgaatttgta tcttccatag catctagcac atactcgatt tttaccactc 420
caatctttat aaaaatactt gattcccttt ctgggacaag caacacagtg ttttagattc 480
tttttttgtg atattttaag ctgttctccc acacagcagc ctcgacatga tttcacttct 540
attttgttgc caagcaagaa atttttatgg ccgcggccgc gaaatattct cctttagagc 600
gctccatttc ttctatgaag cgttttgcgg caaactcacc ttcaactgtc attgggaatg 660
tcttatgatg gttttttgga attattatta tcctaccatc aagcgtctga cattgctgca 720
gatttctcca tctcacttta tatttggtgg catttctacc acttttttcc aacagtggtt 780
tggtagggac cctgactgac aatttatgac ctgcagtaca ttgtaatgca agacgctgat 840
aaactgttct acgcctggga tctaacctac caggttcacc ttcaaaagct ctgtgtttgg 900
ttttttgctg tatattatag attttctgat agccctgtgt gacatttatg acgcgggcag 960
cggagccatc tgcgcacata acgtaagagt tagccgtgac gtttgcgatg tctttaattt 1020
caccgttagc catcagaata gtcgtgtttt cagaaagcgg cgcgcctaag acttagatct 1080
taaggggata tcttaatggg gagcgctgat tctcttttgg tacgcttccc atccagcatt 1140
tctgtatctt tcaccttcaa ccttaggatc tctacccttg gcgaaaagtc ctctgccaac 1200
aatgatgata tctgatccac cacttacaac ttcgtcgacg gttctgtact gctgacccaa 1260
tgcatcgcct ttgtcgtcta aacctacacc tggggtcatg attagccaat caaacccttc 1320
ttctcttcct cccatatcgt tctgagcaat gaacccaata acgaaatctt tatcactctt 1380
tgcaatatca acggtaccct tagtatattc accgtgtgct agagaaccct tggaagacaa 1440
ttcagcaagc atcaataatc cccttggttc tttggtgacc tcttgcgcac cttgtttcaa 1500
gccagcaaca ataccagcac cagtaacccc gtgggcgttg gtgatatcag accattctgc 1560
gatacggtaa acgcccgatg tatattgtaa tttgactgtg ttaccgatat cggcgaattt 1620
tctgtcctca aatatcaaga acttgtattt ctctgccaat gctttcaatg gaacgacagt 1680
accctcataa ctgaaatcat ccaagatatc aacgtgtgtt ttcaaaaggc aaatgtatgg 1740
acccaacgtt tcaacaagtt tcaatagctc atcagtcgaa cgaacgtcaa gagaagcaca 1800
caaattggtc ttcttttcat ccattaaacg taaaagtttc gatgcaaccg gacttgcatg 1860
agtctcagct ctactggtat atgattttgt ggacatgata tcctcgaggt tccctttagt 1920
gagggttaat tgcgagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 1980
atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 2040
cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 2100
gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 2160
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 2220
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 2280
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 2340
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 2400
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 2460
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 2520
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 2580
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 2640
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 2700
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 2760
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 2820
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 2880
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 2940
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 3000
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 3060
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 3120
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 3180
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 3240
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 3300
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 3360
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 3420
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 3480
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 3540
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 3600
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 3660
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 3720
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 3780
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 3840
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 3900
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 3960
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 4020
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 4080
catttccccg aaaagtgcca cctgacgcgc cctgtagcgg cgcattaagc gcggcgggtg 4140
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 4200
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 4260
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 4320
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 4380
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 4440
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 4500
atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt 4560
gccattcgcc attcaggctg cgcaactgtt gggaagggcg at 4602
<210> 63
<211> 4583
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 63
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat 120
tgtaatacga ctcactatag ggcgaccctt aggatctaag cattggcgcg ccccacgacg 180
ctttgtcttc attcaacgtt tcccattgtt tttttctact attgctttgc tgtgggaaaa 240
acttatcgaa agatgacgac tttttcttaa ttctcgtttt aagagcttgg tgagcgctag 300
gagtcactgc caggtatcgt ttgaacacgg cattagtcag ggaagtcata acacagtcct 360
ttcccgcaat tttctttttc tattactctt ggcctcctct agtacactct atattttttt 420
atgcctcggt aatgattttc attttttttt tccacctagc ggatgactct ttttttttct 480
tagcgattgg cattatcaca taatgaatta tacattatat aaagtaatgt gatttcttcg 540
aagaatatac taaaaaatga gcaggcaaga taaacgaagg caaagatggc ggccgctagt 600
gacaccgatt atttaaagct gcagcatacg atatatatac atgtgtatat atgtatacct 660
atgaatgtca gtaagtatgt atacgaacag tatgatactg aagatgacaa ggtaatgcat 720
cattctatac gtgtcattct gaacgaggcg cgctttcctt ttttcttttt gctttttctt 780
tttttttctc ttgaactcga gaaaaaaaat ataaaagaga tggaggaacg ggaaaaagtt 840
agttgtggtg ataggtggca agtggtattc cgtaagaaca acaagaaaag catttcatat 900
tatggctgaa ctgagcgaac aagtgcaaaa tttaagcatc aacgacaaca acgagaatgg 960
ttatgttcct cctcacttaa gaggaaaacc aagaagtgcc agaaataaca gtagcaacta 1020
caataacaac aacggcggcg gcgcgcctaa gacttagatc ttaaggggat atcttaatgg 1080
ggagcgctga ttctcttttg gtacgcttcc catccagcat ttctgtatct ttcaccttca 1140
accttaggat ctctaccctt ggcgaaaagt cctctgccaa caatgatgat atctgatcca 1200
ccacttacaa cttcgtcgac ggttctgtac tgctgaccca atgcatcgcc tttgtcgtct 1260
aaacctacac ctggggtcat gattagccaa tcaaaccctt cttctcttcc tcccatatcg 1320
ttctgagcaa tgaacccaat aacgaaatct ttatcactct ttgcaatatc aacggtaccc 1380
ttagtatatt caccgtgtgc tagagaaccc ttggaagaca attcagcaag catcaataat 1440
ccccttggtt ctttggtgac ctcttgcgca ccttgtttca agccagcaac aataccagca 1500
ccagtaaccc cgtgggcgtt ggtgatatca gaccattctg cgatacggta aacgcccgat 1560
gtatattgta atttgactgt gttaccgata tcggcgaatt ttctgtcctc aaatatcaag 1620
aacttgtatt tctctgccaa tgctttcaat ggaacgacag taccctcata actgaaatca 1680
tccaagatat caacgtgtgt tttcaaaagg caaatgtatg gacccaacgt ttcaacaagt 1740
ttcaatagct catcagtcga acgaacgtca agagaagcac acaaattggt cttcttttca 1800
tccattaaac gtaaaagttt cgatgcaacc ggacttgcat gagtctcagc tctactggta 1860
tatgattttg tggacatgat atcctcgagg ttccctttag tgagggttaa ttgcgagctt 1920
ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 1980
caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 2040
cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 2100
gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 2160
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 2220
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 2280
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 2340
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 2400
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 2460
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 2520
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 2580
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 2640
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 2700
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 2760
cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 2820
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 2880
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 2940
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 3000
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 3060
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 3120
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 3180
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 3240
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 3300
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 3360
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 3420
ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 3480
agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 3540
tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 3600
tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 3660
attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 3720
taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 3780
aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 3840
caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 3900
gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 3960
cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 4020
tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 4080
acctgacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 4140
gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 4200
cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 4260
atttagtgct ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag 4320
tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 4380
tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga 4440
tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 4500
atttaacgcg aattttaaca aaatattaac gcttacaatt tgccattcgc cattcaggct 4560
gcgcaactgt tgggaagggc gat 4583
<210> 64
<211> 4598
<212> DNA
<213> 人工序列
<220>
<223> 基因缺失构建体
<400> 64
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 60
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat 120
tgtaatacga ctcactatag ggcgaccctt aggatctaag cattggcgcg ccctcaggta 180
tcgtaagatg caagagttcg aatctcttag caaccattat ttttttcctc aacataacga 240
gaacacacag gggcgctatc gcacagaatc aaattcgatg actggaaatt ttttgttaat 300
ttcagaggtc gcctgacgca tatacctttt tcaactgaaa aattgggaga aaaaggaaag 360
gtgagagcgc cggaaccggc ttttcatata gaatagagaa gcgttcatga ctaaatgctt 420
gcatcacaat acttgaagtt gacaatatta tttaaggacc tattgttttt tccaataggt 480
ggttagcaat cgtcttactt tctaactttt cttacctttt acatttcagc aatatatata 540
tatatatttc aaggatatac cattctaatg gcggccgcta aaaagattct ctttttttat 600
gatatttgta cataaacttt ataaatgaaa ttcataatag aaacgacacg aaattacaaa 660
atggaatatg ttcatagggt agacgaaact atatacgcaa tctacataca tttatcaaga 720
aggagaaaaa ggaggatgta aaggaataca ggtaagcaaa ttgatactaa tggctcaacg 780
tgataaggaa aaagaattgc actttaacat taatattgac aaggaggagg gcaccacaca 840
aaaagttagg tgtaacagaa aatcatgaaa ctatgattcc taatttatat attggaggat 900
tttctctaaa aaaaaaaaaa tacaacaaat aaaaaacact caatgacctg accatttgat 960
ggagtttaag tcaatacctt cttgaaccat ttcccataat ggtgaaagtt ccctcaagaa 1020
ttttactctg tcagaaacgg ccttaacgac gtagggcgcg cctaagactt agatcttaag 1080
gggatatctt aatggggagc gctgattctc ttttggtacg cttcccatcc agcatttctg 1140
tatctttcac cttcaacctt aggatctcta cccttggcga aaagtcctct gccaacaatg 1200
atgatatctg atccaccact tacaacttcg tcgacggttc tgtactgctg acccaatgca 1260
tcgcctttgt cgtctaaacc tacacctggg gtcatgatta gccaatcaaa cccttcttct 1320
cttcctccca tatcgttctg agcaatgaac ccaataacga aatctttatc actctttgca 1380
atatcaacgg tacccttagt atattcaccg tgtgctagag aacccttgga agacaattca 1440
gcaagcatca ataatcccct tggttctttg gtgacctctt gcgcaccttg tttcaagcca 1500
gcaacaatac cagcaccagt aaccccgtgg gcgttggtga tatcagacca ttctgcgata 1560
cggtaaacgc ccgatgtata ttgtaatttg actgtgttac cgatatcggc gaattttctg 1620
tcctcaaata tcaagaactt gtatttctct gccaatgctt tcaatggaac gacagtaccc 1680
tcataactga aatcatccaa gatatcaacg tgtgttttca aaaggcaaat gtatggaccc 1740
aacgtttcaa caagtttcaa tagctcatca gtcgaacgaa cgtcaagaga agcacacaaa 1800
ttggtcttct tttcatccat taaacgtaaa agtttcgatg caaccggact tgcatgagtc 1860
tcagctctac tggtatatga ttttgtggac atgatatcct cgaggttccc tttagtgagg 1920
gttaattgcg agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 1980
gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 2040
atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 2100
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 2160
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 2220
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 2280
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 2340
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 2400
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 2460
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 2520
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 2580
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 2640
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 2700
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 2760
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 2820
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 2880
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 2940
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 3000
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 3060
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 3120
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 3180
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 3240
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 3300
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 3360
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 3420
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 3480
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 3540
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 3600
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 3660
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 3720
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 3780
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 3840
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 3900
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 3960
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 4020
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 4080
tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 4140
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 4200
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 4260
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 4320
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 4380
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 4440
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 4500
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca 4560
ttcgccattc aggctgcgca actgttggga agggcgat 4598
<210> 65
<211> 686
<212> DNA
<213> 酿酒酵母
<400> 65
gatctcagtt cgagtttatc attatcaata ctgccatttc aaagaatacg taaataatta 60
atagtagtga ttttcctaac tttatttagt caaaaaatta gccttttaat tctgctgtaa 120
cccgtacatg cccaaaatag ggggcgggtt acacagaata tataacatcg taggtgtctg 180
ggtgaacagt ttattcctgg catccactaa atataatgga gcccgctttt taagctggca 240
tccagaaaaa aaaagaatcc cagcaccaaa atattgtttt cttcaccaac catcagttca 300
taggtccatt ctcttagcgc aactacagag aacaggggca caaacaggca aaaaacggac 360
acaacctcaa tggagtgatg caacctgcct ggagtaaatg atgacacaag gcaattgacc 420
cacgcatgta tctatctcat tttcttacac cttctattac cttctgctct ctctgatttg 480
gaaaaagctg aaaaaaaagg ttgaaaccag ttccctgaaa ttattcccct acttgactaa 540
taagtatata aagacggtag gtattgattg taattctgta aatctatttc ttaaacttct 600
taaattctac ttttatagtt agtctttttt ttagttttaa aacaccaaga acttagtttc 660
gaataaacac acataaacaa acaaaa 686
<210> 66
<211> 559
<212> DNA
<213> 酿酒酵母
<400> 66
gtttagttaa ttatagttcg ttgaccgtat attctaaaaa caagtactcc ttaaaaaaaa 60
accttgaagg gaataaacaa gtagaataga tagagagaaa aatagaaaat gcaagagaat 120
ttatatatta gaaagagaga aagaaaaatg gaaaaaaaaa aataggaaaa gccagaaata 180
gcactagaag gagcgacacc agaaaagaag gtgatggaac caatttagct atatatagtt 240
aactaccggc tcgatcatct ctgcctccag catagtcgaa gaagaatttt ttttttcttg 300
aggcttctgt cagcaactcg tattttttct ttcttttttg gtgagcctaa aaagttccca 360
cgttctcttg tacgacgccg tcacaaacaa ccttatgggt aatttgtcgc ggtctgggtg 420
tataaatgtg tgggtgcaac atgaatgtac ggaggtagtt tgctgattgg cggtctatag 480
ataccttggt tatggcgccc tcacagccgg caggggaagc gcctacgctt gacatctact 540
atatgtaagt atacggccc 559
<210> 67
<211> 750
<212> DNA
<213> 酿酒酵母
<400> 67
acgcacagat attataacat ctgcataata ggcatttgca agaattactc gtgagtaagg 60
aaagagtgag gaactatcgc atacctgcat ttaaagatgc cgatttgggc gcgaatcctt 120
tattttggct tcaccctcat actattatca gggccagaaa aaggaagtgt ttccctcctt 180
cttgaattga tgttaccctc ataaagcacg tggcctctta tcgagaaaga aattaccgtc 240
gctcgtgatt tgtttgcaaa aagaacaaaa ctgaaaaaac ccagacacgc tcgacttcct 300
gtcttcctat tgattgcagc ttccaatttc gtcacacaac aaggtcctag cgacggctca 360
caggttttgt aacaagcaat cgaaggttct ggaatggcgg gaaagggttt agtaccacat 420
gctatgatgc ccactgtgat ctccagagca aagttcgttc gatcgtactg ttactctctc 480
tctttcaaac agaattgtcc gaatcgtgtg acaacaacag cctgttctca cacactcttt 540
tcttctaacc aagggggtgg tttagtttag tagaacctcg tgaaacttac atttacatat 600
atataaactt gcataaattg gtcaatgcaa gaaatacata tttggtcttt tctaattcgt 660
agtttttcaa gttcttagat gctttctttt tctctttttt acagatcatc aaggaagtaa 720
ttatctactt tttacaacaa atataaaaca 750
<210> 68
<211> 532
<212> DNA
<213> 酿酒酵母
<400> 68
agttataata atcctacgtt agtgtgagcg ggatttaaac tgtgaggacc ttaatacatt 60
cagacacttc tgcggtatca ccctacttat tcccttcgag attatatcta ggaacccatc 120
aggttggtgg aagattaccc gttctaagac ttttcagctt cctctattga tgttacacct 180
ggacacccct tttctggcat ccagttttta atcttcagtg gcatgtgaga ttctccgaaa 240
ttaattaaag caatcacaca attctctcgg ataccacctc ggttgaaact gacaggtggt 300
ttgttacaca tgctaatgca aaggagccta tatacctttg gctcggctgc tgtaacaggg 360
aatataaagg gcagcataat ttaggagttt agtgaacttg caacatttac tattttccct 420
tcttacgtaa atatttttct ttttaattct aaatcaatct ttttcaattt tttgtttgta 480
ttcttttctt gcttaaatct ataactacaa aaaacacata cataaactaa aa 532
<210> 69
<211> 413
<212> DNA
<213> 酿酒酵母
<400> 69
ttagcttcaa aatgtttcta ctcctttttt actcttccag attttctcgg actccgcgca 60
tcgccgtacc acttcaaaac acccaagcac agcatactaa atttcccctc tttcttcctc 120
tagggtgtcg ttaattaccc gtactaaagg tttggaaaag aaaaaagaga ccgcctcgtt 180
tctttttctt cgtcgaaaaa ggcaataaaa atttttatca cgtttctttt tcttgaaaat 240
tttttttttt gatttttttc tctttcgatg acctcccatt gatatttaag ttaataaacg 300
gtcttcaatt tctcaagttt cagtttcatt tttcttgttc tattacaact ttttttactt 360
cttgctcatt agaaagaaag catagcaatc taatctaagt tttaattaca aaa 413
<210> 70
<211> 326
<212> DNA
<213> 酿酒酵母
<400> 70
ggcacgtccg acggcggccc gacgggtccg aggcctcgga gatccgtccc ccttttcctt 60
tgtcgatatc atgtaattag ttatgtcacg cttacattca cgccctcccc ccacatccgc 120
tctaaccgaa aaggaaggag ttagacaacc tgaagtctag gtccctattt atttttttat 180
agttatgtta gtattaagaa cgttatttat atttcaaatt tttctttttt ttctgtacag 240
acgcgtgtac gcatgtaaca ttatactgaa aaccttgctt gagaaggttt tgggacgctc 300
gaaggcttta atttgcaagc tgcatg 326
<210> 71
<211> 352
<212> DNA
<213> 酿酒酵母
<400> 71
acaaatcgct cttaaatata tacctaaaga acattaaagc tatattataa gcaaagatac 60
gtaaattttg cttatattat tatacacata tcatatttct atatttttaa gatttggtta 120
tataatgtac gtaatgcaaa ggaaataaat tttatacatt attgaacagc gtccaagtaa 180
ctacattatg tgcactaata gtttagcgtc gtgaagactt tattgtgtcg cgaaaagtaa 240
aaattttaaa aattagagca ccttgaactt gcgaaaaagg ttctcatcaa ctgtttaaaa 300
ggaggatatc aggtcctatt tctgacaaac aatatacaaa tttagtttca aa 352
<210> 72
<211> 311
<212> DNA
<213> 酿酒酵母
<400> 72
ggatctctta tgtctttacg atttatagtt ttcattatca agtatgccta tattagtata 60
tagcatcttt agatgacagt gttcgaagtt tcacgaataa aagataatat tctacttttt 120
gctcccaccg cgtttgctag cacgagtgaa caccatccct cgcctgtgag ttgtacccat 180
tcctctaaac tgtagacatg gtagcttcag cagtgttcgt tatgtacggc atcctccaac 240
aaacagtcgg ttatagtttg tcctgctcct ctgaatcgtc tccctcgata tttctcattt 300
tccttcgcat g 311
<210> 73
<211> 352
<212> DNA
<213> 酿酒酵母
<400> 73
ataaagcact cttgatgagg ataatgattt ttttttgaat atacataaat actaccgttt 60
ttctgctaga ttttgtgaag acgtaaataa gtacatatta ctttttaagc caagacaaga 120
ttaagcatta actttaccct tttctcttct aagtttcaat actagttatc actgtttaaa 180
agttatggcg agaacgtcgg cggttaaaat atattaccct gaacgtggtg aattgaagtt 240
ctaggatggt ttaaagattt ttcctttttg ggaaataagt aaacaatata ttgctgcctt 300
tgcaaaacgc acatacccac aatatgtgac tattggcaaa gaacgcaacg cg 352
<210> 74
<211> 292
<212> DNA
<213> 酿酒酵母
<400> 74
ttcttcgcca gaggtttggt caagtctcca atcaaggttg tcggcttgtc taccttgcca 60
gaaatttacg aaaagatgga aaagggtcaa atcgttggta gatacgttgt tgacacttct 120
aaataagcga atttcttatg atttatgatt tttattatta aataagttat aaaaaaaata 180
agtgtataca aattttaaag tgactcttag gttttaaaac gaaaattctt attcttgagt 240
aactctttcc tgtaggtcag gttgctttct caggtatagc atgaggtcgc tc 292

Claims (17)

1.生产目标物质的方法,所述方法包括:
在培养基中培养具有生产所述目标物质的能力的酵母;和
从所述酵母的细胞和/或所述培养基收集所述目标物质,
其中以使由LCB4和CKA2基因编码的蛋白质的表达和/或活性降低的方式对所述酵母进行了修饰,且
其中所述目标物质选自植物鞘氨醇(PHS)和二氢神经鞘氨醇(DHS)。
2.根据权利要求1的方法,其中通过弱化所述LCB4和/或CKA2基因的表达,或通过破坏所述LCB4和/或CKA2基因来降低所述蛋白质的活性。
3.根据权利要求1或2的方法,其中通过使所述LCB4和/或CKA2基因缺失来降低所述蛋白质的活性。
4.根据权利要求1至3中任一项的方法,其中由所述LCB4基因编码的蛋白质是下述(A)、(B)或(C)中定义的蛋白质:
(A)包含SEQ ID NO:10的氨基酸序列的蛋白质;
(B)包含SEQ ID NO:10的氨基酸序列但包括1至10个氨基酸残基的取代、缺失、插入和/或添加,并具有鞘氨醇碱激酶活性的蛋白质;
(C)包含与SEQ ID NO:10的氨基酸序列显示90%或更高的同一性的氨基酸序列,并具有鞘氨醇碱激酶活性的蛋白质。
5.根据权利要求1至4中任一项的方法,其中由所述CKA2基因编码的蛋白质是下述(A)、(B)或(C)中定义的蛋白质:
(A)包含SEQ ID NO:16的氨基酸序列的蛋白质;
(B)包含SEQ ID NO:16的氨基酸序列但包括1至10个氨基酸残基的取代、缺失、插入和/或添加,并具有酪蛋白激酶2活性的蛋白质;
(C)包含与SEQ ID NO:16的氨基酸序列显示90%或更高的同一性的氨基酸序列,并具有酪蛋白激酶2活性的蛋白质。
6.根据权利要求1至5中任一项的方法,其中以使一种或多种蛋白质的表达和/或活性降低的方式对所述酵母进行了进一步的修饰,所述一种或多种蛋白质选自由LCB5、ELO3、ORM2和CHA1基因编码的蛋白质。
7.根据权利要求6的方法,其中通过弱化编码所述一种或多种蛋白质的相应基因的表达或通过破坏编码所述一种或多种蛋白质的相应基因来降低所述一种或多种蛋白质的活性。
8.根据权利要求6或7的方法,其中通过使编码所述一种或多种蛋白质的相应基因缺失来降低所述一种或多种蛋白质的活性。
9.根据权利要求1至8中任一项的方法,其中以使一种或多种蛋白质的表达和/或活性增加的方式对所述酵母进行了进一步的修饰,所述一种或多种蛋白质选自由LCB1、LCB2、TSC10和SUR2基因编码的蛋白质。
10.根据权利要求9的方法,其中通过增加编码所述一种或多种蛋白质的相应基因的表达来增加所述一种或多种蛋白质的活性。
11.根据权利要求9或10的方法,其中通过以增加所述基因的拷贝数的方式进行修饰和/或通过修饰所述基因的表达控制序列来增加所述基因的表达。
12.根据权利要求1至11中任一项的方法,其中所述植物鞘氨醇选自C16PHS、C18PHS,C20PHS、C18:1PHS、C20:1PHS、4-(羟甲基)-2-甲基-6-十四酰-1,3-恶嗪烷-5-醇和4-(羟甲基)-2-甲基-6-十六酰-1,3-恶嗪烷-5-醇。
13.根据权利要求1至12中任一项的方法,其中所述培养基含有能够联合、结合、增溶和/或捕获所述目标物质的添加剂。
14.根据权利要求13的方法,其中所述添加剂选自环糊精和沸石。
15.根据权利要求1至14中任一项的方法,其中所述酵母属于酵母属。
16.根据权利要求1至15中任一项的方法,其中所述酵母是酿酒酵母。
17.根据权利要求1至16中任一项的方法,其中所述酵母能够在培养基或所述酵母的细胞中以比未修饰的菌株可获得的量更大的量生产和积累所述目标物质。
CN201680048756.0A 2015-08-24 2016-08-24 生产植物鞘氨醇或二氢神经鞘氨醇的方法 Pending CN108473968A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562208934P 2015-08-24 2015-08-24
JP2015-164693 2015-08-24
US62/208,934 2015-08-24
JP2015164693 2015-08-24
PCT/JP2016/003866 WO2017033464A1 (en) 2015-08-24 2016-08-24 Method for producing phytosphingosine or sphinganine

Publications (1)

Publication Number Publication Date
CN108473968A true CN108473968A (zh) 2018-08-31

Family

ID=58099716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680048756.0A Pending CN108473968A (zh) 2015-08-24 2016-08-24 生产植物鞘氨醇或二氢神经鞘氨醇的方法

Country Status (6)

Country Link
US (1) US11111511B2 (zh)
EP (1) EP3341476B1 (zh)
JP (1) JP6973702B2 (zh)
CN (1) CN108473968A (zh)
CA (1) CA2996028A1 (zh)
WO (1) WO2017033464A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3341476B1 (en) * 2015-08-24 2019-08-07 Ajinomoto Co., Inc. Method for producing phytosphingosine or sphinganine
WO2020054934A1 (ko) * 2018-09-14 2020-03-19 이화여자대학교 산학협력단 세라마이드 전구물질 생산용 효모, 사카로마이세스 세레비지에 변이 균주 및 이의 제조방법
EP3960870A4 (en) 2019-03-29 2023-06-07 Ajinomoto Co., Inc. PROCESS FOR PRODUCTION OF ALLOLACTOSE
CN111004807A (zh) * 2019-11-29 2020-04-14 西南大学 一种棉花纤维特异表达基因GhFSE1及其应用
WO2022158535A1 (en) 2021-01-20 2022-07-28 Ajinomoto Co., Inc. Method for producing phytosphingosine or phytoceramide
EP4281574A1 (en) 2021-01-20 2023-11-29 Ajinomoto Co., Inc. Method for producing phytosphingosine or phytoceramide
KR20240032256A (ko) * 2022-09-01 2024-03-12 고려대학교 산학협력단 TAPS 생산능이 증진된 위커해모아이시스 시페라이(Wickerhammyces ciferrii) 돌연변이 균주 및 이를 이용한 TAPS 생산방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102317466A (zh) * 2007-06-05 2012-01-11 三得利控股株式会社 使用转化酵母的人神经酰胺的制造方法
CN103748218A (zh) * 2011-08-18 2014-04-23 赢创德固赛有限公司 毕赤酵母细胞及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0726960T3 (da) 1993-11-03 2003-04-22 Cosmoferm Bv Mikrobestammer, som danne sphingolipidbaser
JPH08173170A (ja) 1994-05-25 1996-07-09 Kirin Brewery Co Ltd キャンディダ・ユティリス酵母の形質転換系、およびそれによる異種遺伝子の発現
CN101098968B (zh) * 2004-11-05 2013-09-18 科斯莫费尔姆有限公司 生产类鞘氨醇碱或其衍生物的微生物菌株
CA2996025A1 (en) * 2015-08-24 2017-03-02 Ajinomoto Co., Inc. Method for producing sphingoid base or sphingolipid
EP3341476B1 (en) * 2015-08-24 2019-08-07 Ajinomoto Co., Inc. Method for producing phytosphingosine or sphinganine

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102317466A (zh) * 2007-06-05 2012-01-11 三得利控股株式会社 使用转化酵母的人神经酰胺的制造方法
CN103748218A (zh) * 2011-08-18 2014-04-23 赢创德固赛有限公司 毕赤酵母细胞及其应用

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ALFRED H 等编著: "《Methods in Enzymology》", 31 December 2000 *
COWART LA 等: "Yeast sphingolipids: recent developments in understanding biosynthesis, regulation, and function", 《BIOCHIM BIOPHYS ACTA》 *
KOBAYASHI SD等: "Ceramide/long-chain base phosphate rheostat in Saccharomyces cerevisiae: regulation of ceramide synthesis by Elo3p and Cka2p", 《EUKARYOT CELL》 *
UNIPROT: "UniProtKB-P19454(CSK22_YEAST)", 《UNIPROT》 *
UNIPROT: "UniprotKB-Q12246(LCB4_YEAST)", 《UNIPROT》 *
高培培 等: "酵母固定化技术在燃料乙醇生产中的应用", 《食品与发酵工业》 *

Also Published As

Publication number Publication date
JP6973702B2 (ja) 2021-12-01
JP2018525018A (ja) 2018-09-06
US11111511B2 (en) 2021-09-07
US20180179562A1 (en) 2018-06-28
WO2017033464A1 (en) 2017-03-02
EP3341476B1 (en) 2019-08-07
CA2996028A1 (en) 2017-03-02
EP3341476A1 (en) 2018-07-04

Similar Documents

Publication Publication Date Title
AU2018220469B2 (en) Method and cell line for production of phytocannabinoids and phytocannabinoid analogues in yeast
RU2763170C2 (ru) Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом
CN108473968A (zh) 生产植物鞘氨醇或二氢神经鞘氨醇的方法
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
DK2324119T3 (en) Mutant DELTA5 Desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
CN108138121B (zh) 用微生物高水平生产长链二羧酸
KR20100037031A (ko) 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20130032897A (ko) 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거
KR20070085669A (ko) 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR20130105649A (ko) 피루베이트로부터 아세토락테이트로의 전환을 촉매작용시키는 폴리펩티드를 암호화하는 폴리뉴클레오티드의 통합
KR20180053684A (ko) Fdca의 진균 제조
KR20180084135A (ko) 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법
CN101646766A (zh) Δ17去饱和酶及其用于制备多不饱和脂肪酸的用途
CN114729387A (zh) 遗传修饰真菌和与其相关方法和用途
DK2935601T3 (en) RECOMBINANT MICROBELL CELLS PRODUCING AT LEAST 28% EICOSAPENTAIC ACID AS DRY WEIGHT
KR20180081817A (ko) 감소된 clr1 활성을 갖는 사상 진균에서 단백질을 생산하는 방법
DK3004146T3 (en) POLYPEPTIDES WITH PERMEASE ACTIVITY
KR20140043890A (ko) 조절된 유전자 발현 시스템 및 그의 작제물
KR20240054960A (ko) 미생물에서의 포화 지방의 제조

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination