CN113549560B - 一种用于糖蛋白制备的工程化酵母构建方法及其菌株 - Google Patents

一种用于糖蛋白制备的工程化酵母构建方法及其菌株 Download PDF

Info

Publication number
CN113549560B
CN113549560B CN202010331661.8A CN202010331661A CN113549560B CN 113549560 B CN113549560 B CN 113549560B CN 202010331661 A CN202010331661 A CN 202010331661A CN 113549560 B CN113549560 B CN 113549560B
Authority
CN
China
Prior art keywords
leu
ser
val
glu
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010331661.8A
Other languages
English (en)
Other versions
CN113549560A (zh
Inventor
吴军
刘波
孙鹏
巩新
王甜甜
侯旭宸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Academy of Military Medical Sciences AMMS of PLA
Original Assignee
Academy of Military Medical Sciences AMMS of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Academy of Military Medical Sciences AMMS of PLA filed Critical Academy of Military Medical Sciences AMMS of PLA
Priority to CN202010331661.8A priority Critical patent/CN113549560B/zh
Priority to US17/996,710 priority patent/US20230279337A1/en
Priority to PCT/CN2021/089158 priority patent/WO2021213489A1/zh
Publication of CN113549560A publication Critical patent/CN113549560A/zh
Application granted granted Critical
Publication of CN113549560B publication Critical patent/CN113549560B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/165Yeast isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/84Pichia

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Botany (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了一种用于糖蛋白制备的工程化酵母构建方法及其菌株。本发明提供了一种具有特定哺乳动物细胞糖型修饰能力的酵母工程菌的构建方法,包括:失活受体酵母内源的α‑1,6‑甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶I‑IV、O甘露糖转移酶I;表达外源甘露糖苷酶I、N‑乙酰葡萄糖胺转移酶I、甘露糖苷酶II、N‑乙酰葡萄糖胺转移酶II、半乳糖异构酶和外源半乳糖转移酶。本发明所得酵母工程菌构建周期短、生长快、易于大规模生产、安全性高等特点,使其不仅可用于制备普通糖蛋白疫苗,而且非常适合在突发新型传染病等应急条件下,进行疫苗高效研发和大规模生产。这在医药用途方面具有重要意义。

Description

一种用于糖蛋白制备的工程化酵母构建方法及其菌株
技术领域
本发明涉及生物工程领域,具体涉及一种用于糖蛋白制备的工程化酵母构建方法及其菌 株。
背景技术
酵母作为重要的重组蛋白表达系统,已广泛用于各种重组蛋白表达。它具有像原核细胞 系统生长快、便于基因操作和可大规模培养等优点,同时又具有真核细胞翻译后加工、能产 生具有生物活性的重组蛋白等特点。巴斯德毕赤酵母(Pichia pastoris)(也称为毕赤酵母)是 近年来发展较快的外源蛋白表达宿主菌。除一般酵母所具有的特点外,毕赤酵母还具有很多优点,如毕赤酵母具有甲醇诱导启动子,可严格调控外源蛋白的表达;外源基因的表达产物 既可存在于胞内,也可分泌至胞外,能高效获取外源基因的产物;表达载体能稳定遗传;可 进行高密度高产量的发酵培养,便于工业化生产等,除此之外,还可进行很多典型的高等真 核生物的蛋白翻译后修饰,如糖基化修饰。
糖基化对蛋白质的正确折叠、稳定性和,至关重要。在人体内,糖基化是影响蛋白质的 药物动力学特性(如组织分布和在血液中的清除)的原因之一(郭振楚,《糖类化学》,化学 工业出版社,2005)。糖蛋白的糖基分为N-糖基和O-糖基两种类型。N-糖链连接在Asn-X-Thr/Ser保守序列中的Asn上(其中的X为除脯氨酸以外的任意氨基酸残基)。O-糖链的结构比N-糖链简单,连接位点比N-糖链多,常出现在丝氨酸(Ser)、苏氨酸(Thr)上。 糖基化对蛋白质的正确折叠、稳定性和生物活性至关重要。但酵母表达蛋白的糖基化修饰, 常产生过度甘露糖基化,正常的N-糖基修饰,一般每个糖基含10-20个单糖,分子量为 1500-4000。而过度糖基化修饰时,每个糖基可以含数十至上百个甘露糖,分子量为5000至数万,表现为糖蛋白分子量明显增大,而且由于过度糖基化修饰往往不均一,因而糖蛋白分 子量也不均一,SDS-PAGE分析时可出现明显“拖尾”。N-糖基化修饰会发生在其保守的N- 糖基化修饰位点上(N-X-S/T),但由于O-糖基化修饰没有保守的糖基化位点,一般认为会发 生在富集丝氨酸或苏氨酸的氨基酸上,不同的蛋白是否发生O-糖基化修饰,以及发生在哪一 个氨基酸上,O-糖基化修饰的程度是有所不同的。蛋白的丝氨酸或苏氨酸都可能是O-糖基化的潜在位点,但并不是每一个丝氨酸或苏氨酸都会发生O-糖基化修饰,也并非每一个含有丝 氨酸或苏氨酸的蛋白会发生O-糖基化修饰,不同的蛋白在不同的表达系统中的糖基化修饰也有所不同。而过度甘露糖基化的糖蛋白,在人体中半衰期短、免疫原性高、易被清除。由于 该缺陷,限制了毕赤酵母在大部分糖蛋白类药物生产方面的应用。
发明内容
本发明旨在提供一种具有特定哺乳动物细胞糖型修饰能力的工程化巴斯德毕赤酵母菌 株及其构建方法,要解决的第一个技术问题是构建酵母底盘细胞,需要灭活一系列酵母自身 相关糖基化修饰酶,但因糖基化修饰酶种类繁多,很多糖基修饰的灭活会使酵母死亡,因此这涉及到修饰酶的选择不确定性。要解决的第二个技术问题是在酵母底盘细胞上构建具有特 定哺乳动物细胞糖型修饰能力的工程化毕赤酵母菌株,因真核生物具有糖基化修饰现象(近 年来在原核生物中也发现具有糖基化修饰现象),因此将糖基化修饰酶引入酵母底盘细胞就存 在多种选择,不同的物种、不同的细胞器定位方式,不同的温度和pH调控方式(因有些生物耐寒、耐热、耐酸、耐碱等等)、不同的生物活性高低,这些因素都需要考虑其中,需要进 行大量的组合实验和分析,通过多年的探索和尝试。本发明提供了一种具有特定哺乳动物细 胞糖型修饰能力的工程化巴斯德毕赤酵母,利用该工程化酵母表达的宿主蛋白的糖型为特定 哺乳动物细胞糖型:GalaGlcNAcbMancGlcNAc2,其中a:0-2个;b:0-2个;c:3-5个(Gal: 半乳糖,GlcNAc:N-乙酰葡萄糖胺;Man:甘露糖);同时酵母O糖基化修饰现象进一步降 低。
第一方面,本发明要求保护一种具有特定哺乳动物细胞糖型修饰能力的巴斯德毕赤酵母 工程菌的构建方法。
本发明所要求保护的具有特定哺乳动物细胞糖型修饰能力的巴斯德毕赤酵母工程菌的 构建方法,可包括如下步骤:
(A1)失活受体巴斯德毕赤酵母内源的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶、磷酸 甘露糖合成酶、β甘露糖转移酶I、β甘露糖转移酶II、β甘露糖转移酶III和β甘露糖转移酶 IV,得到重组酵母1;
(A2)在所述重组酵母1中表达如下外源蛋白中的至少一种:外源甘露糖苷酶I、外源 N-乙酰葡萄糖胺转移酶I、外源甘露糖苷酶II、外源N-乙酰葡萄糖胺转移酶II、外源半乳糖 异构酶和外源半乳糖转移酶,得到重组酵母2;所述重组酵母2即为具有所述特定哺乳动物细胞糖型修饰能力的酵母工程菌;
所述特定哺乳动物细胞糖型为GalaGlcNAcbMancGlcNAc2,其中a:0-2个;b:0-2个;c: 3-5个(Gal:半乳糖,GlcNAc:N-乙酰葡萄糖胺;Man:甘露糖)。
当灭活α-1,6-甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶 I-IV后,N糖基化修饰明显降低、糖基内环境更趋向于相对“干净”,带来的新问题是:如何降低O糖基化修饰?O糖基化家族成员众多,哪一种酶的灭活可以适用于本发明,并且达到预期效果?我们都知道,N-糖基化修饰会发生在其保守的N-糖基化修饰位点上(N-X-S/T), 但由于O-糖基化修饰没有保守的糖基化位点,一般认为会发生在富集丝氨酸或苏氨酸的氨基 酸上,不同的蛋白是否发生O-糖基化修饰,以及发生在哪一个氨基酸上,O-糖基化修饰的程度是有所不同的。蛋白的丝氨酸或苏氨酸都可能是O-糖基化的潜在位点,但并不是每一个丝 氨酸或苏氨酸都会发生O-糖基化修饰,也并非每一个含有丝氨酸或苏氨酸的蛋白会发生O- 糖基化修饰,不同的蛋白在不同的表达系统中的糖基化修饰也有所不同。如果发生O-糖基化 修饰,糖链上的糖基则多是甘露糖,虽然糖链比较短,但由于其糖链数量较多,酵母表达蛋 白的表面可能会有大量裸露的甘露糖。这种具有甘露糖化的糖蛋白,在人体中半衰期短、免 疫原性高、易被清除。由于该缺陷,限制了毕赤酵母在大部分蛋白类药物生产方面的应用。
根据O糖基转移酶家族成员的同源性将其分为三个亚科:PMT1亚科、PMT2亚科和PMT4亚科。不同的物种中PMT1亚科、PMT2亚科的成员数目或许不同,共有7个家庭成 员:PMT1\PMT2\PMT3\PMT4\PMT5\PMT6\PMT7。酿酒酵母的PMT1亚科包括 PMT1\PMT5\PMT7,PMT2亚科包括PMT2\PMT3\PMT638。Pmt1p亚科(Pmt1p,Pmt5p)和Pmt2p 亚科(Pmt2p,Pmt3p)成员互相形成异聚双体,Pmt4p会形成同聚双体,而Pmt6p既不能与Pmtp 家族其他成员形成异源双体,也不能和它本身形成同源双体。在野生型酵母中,Pmt1p亚科和Pmt2p亚科成员形成的复合体主要是Pmt1p–Pmt2p和Pmt5p–Pmt3p复合体,也有很少量的 Pmt1p–Pmt3p和Pmt2p–Pmt5p复合体。然而在本发明中,我们发现在α-1,6-甘露糖转移酶灭 活、磷酸甘露糖转移酶灭活、磷酸甘露糖合成酶灭活和β甘露糖转移酶I-IV灭活基础上,进 一步灭活O甘露糖转移酶I,同时表达特定来源的某一型外源甘露糖苷酶I、外源N-乙酰葡 萄糖胺转移酶I、外源甘露糖苷酶II、外源N-乙酰葡萄糖胺转移酶II、外源半乳糖异构酶GalE 和外源半乳糖转移酶GalT,这种组合方式可以显著地降低工程酵母表达的蛋白的O糖基化修 饰,并且获得具有特定哺乳动物细胞糖型。
相应的,所述方法还可包括如下步骤(A3):
(A3)失活所述重组酵母2内源的O甘露糖转移酶I,得到重组酵母3;所述重组酵母3也为具有所述特定哺乳动物细胞糖型修饰能力的酵母工程菌。
步骤(A3)使得酵母O糖基化修饰现象进一步降低。
当所述特定哺乳动物细胞糖型为Man5GlcNAc2时,步骤(A2)中在所述重组酵母1中表达的外源蛋白为外源甘露糖苷酶I。
当所述特定哺乳动物细胞糖型为GlcNAcMan5GlcNAc2时,步骤(A2)中在所述重组酵母1中表达的外源蛋白为外源甘露糖苷酶I和外源N-乙酰葡萄糖胺转移酶I。
当所述特定哺乳动物细胞糖型为GalGlcNAcMan5GlcNAc2时,步骤(A2)中在所述重组 酵母1中表达的外源蛋白为外源甘露糖苷酶I、外源N-乙酰葡萄糖胺转移酶I,以及外源半乳 糖异构酶和外源半乳糖转移酶。
当所述特定哺乳动物细胞糖型为GalGlcNAcMan3GlcNAc2时,步骤(A2)中在所述重组 酵母1中表达的外源蛋白为外源甘露糖苷酶I、外源N-乙酰葡萄糖胺转移酶I、外源半乳糖异 构酶和外源半乳糖转移酶,以及外源甘露糖苷酶II。
当所述特定哺乳动物细胞糖型为Gal2GlcNAc2Man3GlcNAc2时,步骤(A2)中在所述重 组酵母1中表达的外源蛋白为外源甘露糖苷酶I、外源N-乙酰葡萄糖胺转移酶I、外源半乳糖 异构酶和外源半乳糖转移酶、外源甘露糖苷酶II,以及外源N-乙酰葡萄糖胺转移酶II。
步骤(A1)和(A3)中,失活上述糖基修饰酶,可以通过突变基因一个或者多个核苷酸序列、或者通过缺失部分或完整基因序列来实现、也可以利用插入核苷酸破坏原有阅读框、 提前终止蛋白质合成等方式来实现失活该基因或该基因编码的蛋白质活性。上述突变、缺失 和插入失活等可以用常规的诱变、敲除等方法获得。这些方法已有许多文献报道,如J.萨姆 布鲁克等,《分子克隆实验指南》第二版,科学出版社,1995。也可用本领域已知的其它方法来构建基因失活的酵母菌株。其中较优的菌株是通过敲除甘露糖转移酶基因的部分序列获得 的。该序列至少大于三个碱基,较优的是大于100碱基,更优的是包括50%以上的编码序列。 这种通过敲除糖基修饰酶基因的部分序列获得的菌株不易产生回复突变,菌株的稳定性比利 用点突变等方法构建的稳定性更高,更有利于应用于医疗和工业范围内。
敲除糖基化修饰酶基因的部分序列的方法可以包括:首先构建敲除该基因的质粒:质粒 上包括待敲除基因两侧的同源臂序列,两个同源臂应选择在目标基因两侧,所述同源臂的长 度至少大于200bp,最优的大小在500bp-2000bp。也可以利用插入灭活的方式,获得一个氨 基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加,致使没有功能活性的核苷酸 序列,并构建到质粒。质粒上还带有URA3(orotidine-5′-phosphatedecarboxylase)基因、或博莱霉素、或潮霉素B、或Blasticidin或G418等作为筛选标记。编码侧翼区同源臂片段的核 酸多聚核苷酸序列、欲被破坏功能的蛋白的核苷酸序列,可以从公开的美国国立生物技术信 息中心(NCBI)获得。利用PCR方法,以毕赤酵母宿主基因组为模板,获得灭活基因所需的一定长度的侧翼同源区,分别包括目的基因(其序列在NCBI中已经公开)基因编码区上游和 下游侧翼同源区,并在引物部分添加合适的酶切位点。根据序列获得多聚核苷酸可以用本领 域周知的方法,如PCR(J.萨姆布鲁克等,《分子克隆实验指南》第二版,科学出版社,1995.)、RT-PCR方法、人工合成的方法、基因组DNA和构建筛选cDNA文库的方法等获得。若需要 可用本领域公知的方法对多聚核苷酸进行突变、缺失、插入、和与其它多聚核苷酸连接等。 将分别得到的上游(5′)和下游(3′)侧翼区同源臂片段进行融合,在保持各自片段大小不变 的前提下,可以用本领域周知的各种方法,如通过重叠PCR的方法,所用标准的分子克隆过 程见J.萨姆布鲁克等(J.萨姆布鲁克等,《分子克隆实验指南》第二版,科学出版社,1995.) 的叙述。可用本领域公知的方法分别将含欲灭活基因同源臂序列融合片段的核酸克隆到各种 适用于酵母的载体中去。或者利用各自同源臂上酶切位点分别插入载体特定区域。所用标准 的分子克隆过程见J.萨姆布鲁克等(J.萨姆布鲁克等,《分子克隆实验指南》第二版,科学出 版社,1995.)的叙述。构建重组敲除质粒。原始质粒可以选用适于酵母的表达载体、穿梭载体,可以带有复制位点,筛选标记,营养缺陷型标记(URA3,HIS,ADE1,LEU2,ARG4)等, 这些载体的构建方法已在许多文献公开(如J.萨姆布鲁克等,《分子克隆实验指南》第二版, 科学出版社,1995),也可以从各种公司购得(如Invitrogen life technologies,Carlsbad, California 92008,USA),优先的载体有pPICZαA、pYES2酵母表达载体。灭活载体都是穿梭 质粒,先在大肠杆菌中复制扩增,然后被导入宿主酵母细胞,载体应该带有抗性标记基因,或者营养缺陷型标记基因,以利于后期转化子的筛选。
将欲灭活基因两侧同源区(上游称之为5′臂,下游称之为3′臂)分别构建至酵母载体, 形成重组敲除载体。进一步利用同源臂的线性化位点线性化敲除载体,通过电转化方法,转 化至毕赤酵母或其改构体中的一种,进行培养。转化所需核酸至宿主细胞中去可用通常方法得到,如制备感受态细胞、电穿孔、醋酸锂法等(A.亚当斯等,《酵母遗传学方法实验指南》, 科学出版社,2000)。成功转化的细胞,即含有欲敲除基因的同源区的细胞,可以通过人们熟 知的技术加以鉴定,如细胞经收集并裂解,提取DNA,然后PCR方法鉴定基因型;而之前 选择正确的表型可以通过营养缺陷型或者抗性标记的筛选而得以实现。一次重组正确的转化 子,经过在酵母基本培养基培养后,涂布在含尿嘧啶的5-氟乳清酸平板等二次重组筛选平板, 长出的克隆,再进一步进行基因型的PCR鉴定。分别筛选到正确的缺失了预期的基因编码区 的转化子。
在本发明的具体实施方式中,步骤(A1)中,所述失活受体巴斯德毕赤酵母内源的α-1,6- 甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶I、β甘露糖转移酶 II、β甘露糖转移酶III和β甘露糖转移酶IV均是采用同源重组的方式进行基因敲除。
在本发明的具体实施方式中,步骤(A2)中,在所述重组酵母1中表达所述外源蛋白是 通过向所述重组酵母1中导入所述外源蛋白的编码基因实现的。
进一步地,所述外源蛋白的编码基因是以重组载体的形式导入所述重组酵母1中的。
进一步地,所述外源甘露糖苷酶I的编码基因和所述外源甘露糖苷酶II的编码基因均向 所述重组酵母1中导入两次。
在本发明的具体实施方式中,步骤(A3)中,失活所述重组酵母2内源的O甘露糖转移酶I,本发明没有按照传统敲除基因的方式,而是巧妙的通过对所述重组酵母2的基因组DNA中的O甘露糖转移酶I编码基因进行插入失活(通过插入灭活的方式破坏其相应的核苷酸序列)实现的。
在本发明中,具体是在所述重组酵母2的基因组DNA中的O甘露糖转移酶I编码基因的靶标片段的前端和末端各装上不同组合的终止密码子,并且在末端的终止密码子之后装上 终止子(如CYC1TT终止子)。前端和末端各装上不同组合的终止密码子后的所述靶标片段具体为以毕赤酵母JC308的基因组DNA为模板,利用引物PMT1-IN-5和PMT1-IN-3进行PCR扩增所得的片段。
PMT1-IN-5:5’-tctatgcattaatgatagttaatgactaatagagtaaaacaagtcctcaagaggt-3’;
PMT1-IN-3:5’-tgacataactaattacatgatctattagtcattaactatcattagatcagagtggggacgactaagaaa gc-3’。
接下来的技术问题是在酵母底盘细胞中构建具有哺乳动物细胞糖型修饰能力的工程化 毕赤酵母菌株,参与哺乳动物细胞糖基修饰的糖基修饰酶繁多复杂,什么样的酶修饰会获得什么样的糖型?以及获得糖型的比例组合在未研究之前都不得而知。本发明通过以下技术方法来实现:
所述外源甘露糖苷酶I来源于绿色木霉,且C端融合内质网保留信号HDEL。
所述外源N-乙酰葡萄糖胺转移酶I可以是来源于哺乳动物等的N-乙酰葡萄糖胺转移酶 I,如人N-乙酰葡萄糖胺转移酶I(GenBank NO NM 002406)、白色念珠菌N-乙酰葡萄糖胺转 移酶I(GenBank NO NW_139513.1)、盘基网柄菌N-乙酰葡萄糖胺转移酶I(GenBank NONC_007088.5)等等,可以在N-端或C-端融合内质网或内侧高尔基体定位信号,如ScGLS、ScMNS1、PpSEC12、ScMNN9等等;优选的为来源于人,且含有mnn9定位信号;
所述外源甘露糖苷酶II可以是来源于丝状真菌、植物、昆虫、爪哇、哺乳动物等的甘露 糖苷酶II,如果蝇甘露糖苷酶II(GenBank NOX77652)、线虫甘露糖苷酶II(GenBankNO NM 0735941)、人甘露糖苷酶II(GenBank NO U31520)等等;表达的甘露糖苷酶II可以在N- 端或C-端融合内质网或内侧高尔基体定位信号,如ScGLS、ScMNS1、PpSEC12、ScMNN9 等等,优选的为来源于线虫,含有mnn2定位信号;
外源N-乙酰葡萄糖胺转移酶II,可以是来源于哺乳动物等的N-乙酰葡萄糖胺转移酶II, 如人N-乙酰葡萄糖胺转移酶II(GenBank NO Q10469)、鼠N-乙酰葡萄糖胺转移酶II(GenBank NO Q09326)等等;表达的N-乙酰葡萄糖胺转移酶II可以在N-端或C-端融合内质网或内侧 高尔基体定位信号,如ScGLS、ScMNS1、PpSEC12、ScMNN9等等,优选的为来源于人,含有mnn2定位信号;
所述甘露糖苷酶II和所述N-乙酰葡萄糖胺转移酶II均含有mnn2定位信号;
所述半乳糖异构酶和所述半乳糖转移酶为融合蛋白,选择均来源于人,且共用一个kre2 定位信号。
半乳糖转移酶可以是来源于哺乳动物等的半乳糖转移酶,如人β-1,4-半乳糖转移酶 (GenBank NO gi:13929461)、鼠β-1,4-半乳糖转移酶GenBank NO NC_000081.6)等等。表达的 半乳糖转移酶可以在N-端或C-端融合内质网或内侧高尔基体定位信号,如ScKRE2、ScGLS、 ScMNS1、PpSEC12、ScMNN9等等,本发明实施例半乳糖转移酶来源于人,且共有一个kre2 定位信号;
所述α-1,6-甘露糖转移酶可为如下B1)或B2):
B1)氨基酸序列是SEQ ID No.1的蛋白质;
B2)将SEQ ID No.1所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.1所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述磷酸甘露糖转移酶可为如下B3)或B4):
B3)氨基酸序列是SEQ ID No.2的蛋白质;
B4)将SEQ ID No.2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.2所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述磷酸甘露糖合成酶可为如下B5)或B6):
B5)氨基酸序列是SEQ ID No.3的蛋白质;
B6)将SEQ ID No.3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.3所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述β甘露糖转移酶I可为如下B7)或B8):
B7)氨基酸序列是SEQ ID No.4的蛋白质;
B8)将SEQ ID No.4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.4所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述β甘露糖转移酶II可为如下B9)或B10):
B9)氨基酸序列是SEQ ID No.5的蛋白质;
B10)将SEQ ID No.5所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.5所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述β甘露糖转移酶III可为如下B11)或B12):
B11)氨基酸序列是SEQ ID No.6的蛋白质;
B12)将SEQ ID No.6所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.6所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述β甘露糖转移酶IV可为如下B13)或B14):
B13)氨基酸序列是SEQ ID No.7的蛋白质;
B14)将SEQ ID No.7所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.7所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述O甘露糖转移酶I可为如下B15)或B16):
B15)氨基酸序列是SEQ ID No.8的蛋白质;
B16)将SEQ ID No.8所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.8所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述外源甘露糖苷酶I可为如下B17)或B18):
B17)氨基酸序列是SEQ ID No.9的蛋白质;
B18)将SEQ ID No.9所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/ 或添加且具有相同功能的蛋白质,或与SEQ ID No.9所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述外源N-乙酰葡萄糖胺转移酶I可为如下B19)或B20):
B19)氨基酸序列是SEQ ID No.10的蛋白质;
B20)将SEQ ID No.10所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质,或与SEQ ID No.10所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
由所述半乳糖异构酶和所述半乳糖转移酶组成的所述融合蛋白可为如下B21)或B22):
B21)氨基酸序列是SEQ ID No.11的蛋白质;
B22)将SEQ ID No.11所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和 /或添加且具有相同功能的蛋白质,或与SEQ ID No.11所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述甘露糖苷酶II可为如下B23)或B24):
B23)氨基酸序列是SEQ ID No.12的蛋白质;
B24)将SEQ ID No.12所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和 /或添加且具有相同功能的蛋白质,或与SEQ ID No.12所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述N-乙酰葡萄糖胺转移酶II可为如下B25)或B26):
B25)氨基酸序列是SEQ ID No.13的蛋白质;
B26)将SEQ ID No.13所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和 /或添加且具有相同功能的蛋白质,或与SEQ ID No.13所示的氨基酸序列具有99%以上、95% 以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
所述外源甘露糖苷酶I的编码基因可为如下C1)或C2):
C1)核苷酸序列是SEQ ID No.14的DNA分子;
C2)与SEQ ID No.14所示的核苷酸序列具有99%以上、95%以上、90%以上、85%以上 或者80%以上同源性且编码所述外源甘露糖苷酶I的DNA分子,或在严格条件下与C1)限 定的DNA分子杂交且编码所述外源甘露糖苷酶I的DNA分子。
所述外源N-乙酰葡萄糖胺转移酶I的编码基因可为如下C3)或C4):
C3)核苷酸序列是SEQ ID No.15的DNA分子;
C4)与SEQ ID No.15所示的核苷酸序列具有99%以上、95%以上、90%以上、85%以上 或者80%以上同源性且编码所述外源N-乙酰葡萄糖胺转移酶I的DNA分子,或在严格条件 下与C3)限定的DNA分子杂交且编码所述外源N-乙酰葡萄糖胺转移酶I的DNA分子。
由所述半乳糖异构酶和所述半乳糖转移酶组成的所述融合蛋白的编码基因可为如下C5) 或C6):
C5)核苷酸序列是SEQ ID No.16的DNA分子;
C6)与SEQ ID No.16所示的核苷酸序列具有99%以上、95%以上、90%以上、85%以上 或者80%以上同源性且编码所述融合蛋白的DNA分子,或在严格条件下与C5)限定的DNA 分子杂交且编码所述融合蛋白的DNA分子。
所述甘露糖苷酶II的编码基因可为如下C7)或C8):
C7)核苷酸序列是SEQ ID No.17的DNA分子;
C8)与SEQ ID No.17所示的核苷酸序列具有99%以上、95%以上、90%以上、85%以上 或者80%以上同源性且编码所述甘露糖苷酶II的DNA分子,或在严格条件下与C7)限定的DNA分子杂交且编码所述甘露糖苷酶II的DNA分子。
所述N-乙酰葡萄糖胺转移酶II的编码基因可为如下C9)或C10):
C9)核苷酸序列是SEQ ID No.18的DNA分子;
C10)与SEQ ID No.18所示的核苷酸序列具有99%以上、95%以上、90%以上、85%以 上或者80%以上同源性且编码所述N-乙酰葡萄糖胺转移酶II的DNA分子,或在严格条件下 与C9)限定的DNA分子杂交且编码所述N-乙酰葡萄糖胺转移酶II的DNA分子。
上述蛋白质中,同源性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站 点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1 中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用 BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambdaratio分别设置 为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述基因中,同源性是指核苷酸序列的同一性。可使用国际互联网上的同源性检索站点 测定核苷酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中, 通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62 作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和 0.85(缺省值)并进行检索一对核苷酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述蛋白质和基因中,所述95%以上的同源性可为至少96%、97%、98%的同一性。 所述90%以上的同源性可为至少91%、92%、93%、94%的同一性。所述85%以上的同源性 可为至少86%、87%、88%、89%的同一性。所述80%以上的同源性可为至少81%、82%、 83%、84%的同一性。
上述基因中,所述严格条件可为如下:50℃,在7%十二烷基硫酸钠(SDS)、0.5MNaPO4和1mM EDTA的混合溶液中杂交,在50℃,2×SSC,0.1%SDS中漂洗;还可为:50℃,在7%SDS、0.5M NaPO4和1mM EDTA的混合溶液中杂交,在50℃,1×SSC,0.1%SDS中漂 洗;还可为:50℃,在7%SDS、0.5M NaPO4和1mM EDTA的混合溶液中杂交,在50℃, 0.5×SSC,0.1%SDS中漂洗;还可为:50℃,在7%SDS、0.5M NaPO4和1mM EDTA的 混合溶液中杂交,在50℃,0.1×SSC,0.1%SDS中漂洗;还可为:50℃,在7%SDS、0.5M NaPO4和1mM EDTA的混合溶液中杂交,在65℃,0.1×SSC,0.1%SDS中漂洗;也可为: 在6×SSC,0.5%SDS的溶液中,在65℃下杂交,然后用2×SSC,0.1%SDS和1×SSC, 0.1%SDS各洗膜一次。
本发明所有糖基修饰酶相关信息都可以在美国国立生物技术信息中心(NCBI)或者公开 的文献中获得,相关酶的功能、定义也可以在文献中获得。即使是同一种菌或物种,由于来 源不同等,各种酶的氨基酸会略有差别,但其功能基本相同,因此,本发明所述酶也可包括 这些变异体。
第二方面,本发明要求保护利用前文第一方面所述方法构建得到的巴斯德毕赤酵母工程 菌。
进一步地,所述巴斯德毕赤酵母工程菌为在中国微生物菌种保藏管理委员会普通微生物 中心保藏的保藏编号为CGMCCNo.19488的菌株。
第三方面,本发明要求保护前文第二方面所述的巴斯德毕赤酵母工程菌在制备修饰有所 述特定哺乳动物细胞糖型的目的蛋白中的应用。
第四方面,本发明要求保护一种制备修饰有所述特定哺乳动物细胞糖型的目的蛋白的方 法。
本发明所要求保护的制备修饰有所述特定哺乳动物细胞糖型的目的蛋白的方法,可包括 如下步骤:在前文第二方面所述的巴斯德毕赤酵母工程菌中表达所述目的蛋白,得到重组酵 母工程菌;培养所述重组酵母工程菌,制备具有所述特定哺乳动物细胞糖型的目的蛋白。
在本发明的具体实施方式中,所述目的蛋白具体为抗Her2抗体。
本发明的实验证明,本发明获得的巴斯德毕赤酵母工程菌株,其自身N-糖基和O-糖基 降低,且其具有动物细胞糖型修饰能力,这个工程酵母菌株制备的糖蛋白避免了真菌型糖基 化修饰可能引起过敏等问题,工程化巴斯德毕赤酵母菌株构建周期短、生长快、易于大规模 生产、安全性高等特点,使其不仅可用于制备普通糖蛋白疫苗,而且非常适合在突发新型传染病等应急条件下,进行疫苗高效研发和大规模生产。这在医药用途方面具有重要意义。
保藏说明
菌株拉丁名:Pichia pastoris
参椐的生物材料:GJK30
建议的分类命名:巴斯德毕赤酵母
保藏机构:中国微生物菌种保藏管理委员会普通微生物中心
保藏机构简称:CGMCC
地址:北京市朝阳区北辰西路1号院3号
保藏日期:2020年03月18日
保藏中心登记入册编号:CGMCC No.19488
附图说明
图1为GJK01菌中och1基因的鉴定以及糖型分析结果。A为och1基因鉴定结果。M代表Marker;1:GJK01菌(已敲除och1);2:X33菌(未敲除och1)。B为GJK01菌(敲除 och1)表达的抗体的DSA-FACE糖型分析结果。
图2为pno1基因鉴定结果。M代表Marker;1:GJK02菌(已敲除pno1);2:X33菌 (未敲除pno1)。
图3为mnn4b基因鉴定结果。M代表Marker;1:GJK03菌(已敲除mnn4b);2:X33 菌(未敲除mnn4b)。
图4为GJK01、GJK02、GJK03菌(已敲除och1、pno1、mnn4b)的DSA-FACE糖型分 析结果。
图5为ARM2基因鉴定结果。M代表Marker;1:GJK04菌(已敲除ARM2);2:X33 菌(未敲除ARM2)。
图6为ARM1基因鉴定结果。M代表Marker;1:GJK05菌(已敲除ARM1);2:X33 菌(未敲除ARM1)。
图7为ARM3基因鉴定结果。M代表Marker;1:GJK07菌(已敲除ARM3);2:X33 菌(未敲除ARM3)。
图8为ARM4基因鉴定结果。M代表Marker;1:GJK18菌(已敲除ARM4);2:X33 菌(未敲除ARM4)。
图9为GJK18菌的DSA-FACE糖型分析结果。
图10为W10菌的TrmdsI基因鉴定结果和DSA-FACE糖型分析结果。A为TrmdsI基因鉴定结果。M代表Marker;1:W10菌中导入TrmdsI;X33菌中无TrmdsI。B为W10菌的 DSA-FACE糖型分析结果。
图11为1-8菌的GnTI基因鉴定结果和DSA-FACE糖型分析结果。A为GnTI基因鉴定结果。M代表Marker;1:1-8菌中导入GnTI;2:X33菌中无GnTI。B为1-8菌的DSA-FACE 糖型分析结果。
图12为1-8-4菌的GalE-GalT基因鉴定结果和DSA-FACE糖型分析结果。A为GalE-GalT 基因鉴定结果。M代表Marker;1:1-8-4菌中导入GalE-GalT;2:X33菌中无GalE-GalT。B为1-8-4菌的DSA-FACE糖型分析结果。
图13为52-60和150L2菌的mdsII基因、GnTII基因鉴定结果和DSA-FACE糖型分析结果。A为MdsII基因鉴定结果。M代表Marker;1:52-60菌中导入MdsII;2:X33菌中无 MdsII。B为GnTII基因鉴定结果。M代表Marker;1:150L2菌中导入GnTII;2:X33菌中 无GnTII。C为52-60菌的DSA-FACE糖型分析结果。
图14为PMT1插入失活基因鉴定结果。M代表Marker;1:X33菌PMT1未失活;2: GJK30(PMT1失活)。
图15为GJK30工程菌的糖型结构分析结果。A为前期Gal2GlcNAc2Man3GlcNAc2结构低于50%;B为GJK30工程菌获得的Gal2GlcNAc2Man3GlcNAc2结构所占糖型比例大于60%;C为通过糖苷酶(New England Biolabs,Beijing)对该糖型进行酶切分析。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
除非另外说明,本文所用的所有技术和科学术语具有与本发明所属领域的普通技术人通 常理解的相同的意思。示例性的方法和材料描述如下,虽然与本文描述的类似或等同的方法 和材料也可以用于实施本发明,这对本领域技术人员来说是显而易见的。本文提及的所有出版物和其它参考文献都以引用的方式引入其全文.在不一致的情况下,以本说明书,包括定义, 为准。材料,方法和实施例仅是举例说明而不是进行限制。
pPICZαA、pYES2载体、X33、GS115毕赤酵母为Invitrogen公司产品。
毕赤酵母GJK01 CGMCC No.1853(记载发明专利ZL200610164912.8中,公开号为CN101195809,为失活了α-1,6-甘露糖转移酶的毕赤酵母。
实验中所使用的Pyrobest酶、LA Taq酶、dNTPs、限制性内切酶、T4连接酶等购自大连 宝生物工程有限公司,pfu酶、试剂盒、DH5α感受态细胞为北京全式金有限公司产品。全基 因合成、核苷酸合成、引物合成、测序等由上海生工生物工程技术服务有限公司提供。
下述实施例中所涉及的相关修饰酶的序列信息如表1所示。
表1本发明所涉及的相关修饰酶
实施例1、构建具有特定哺乳动物细胞糖型修饰能力的工程化巴斯德毕赤酵母
一、磷酸甘露糖转移酶基因灭活的酵母菌株构建
本发明采用的基础菌株为我们前期构建的GJK01菌株,保藏号为CGMCC No.1853,菌 株授权专利号:ZL200610164912.8。该菌株为α-1,6-甘露糖转移酶灭活的毕赤酵母菌株。α-1,6- 甘露糖转移酶(OCH1)的氨基酸序列如SEQ ID No.1所示。
磷酸甘露糖转移酶基因灭活的酵母菌株GJK02为将毕赤酵母GJK01中编码SEQ IDNo.2 所示磷酸甘露糖转移酶的DNA分子部分敲除而获得,即敲除GJK01酵母基因组中的磷酸甘 露糖转移酶基因,得到的重组酵母。
1、构建磷酸甘露糖转移酶基因灭活载体
用于敲除甘露糖转移酶(PNO1)基因的敲除质粒pYES2-pno1为将甘露糖转移酶(PNO1) 对应的基因片段(SEQ ID No.20)插入载体pYES2的KpnI和XbaI酶切位点间得到的载体。 其中SEQ ID No.20自5’末端第7-1006位核苷酸为敲除甘露糖转移酶(PNO1)基因片段的上 游同源臂;SEQ ID No.20自5’末端第1015-2017位核苷酸为敲除甘露糖转移酶(PNO1)基因 片段的下游同源臂。
具体如下:
用玻璃珠制备法(A.亚当斯等,《酵母遗传学方法实验指南》,科学出版社,2000)提取 毕赤酵母X33的基因组DNA,以该基因组DNA为模板扩增甘露糖转移酶(PNO1)基因两 侧的同源臂,PNO1两侧的同源臂分别约为1kb,中间缺失约1.4kb的编码基因。
扩增pno1上游侧翼区同源臂(PNO1 5′同源臂)所用的引物为PNO-5-5和PNO-5-3,引 物序列分别为:
5′-AGTGGTACCGCAGTTTAATCATAGCCCACTGC-3′(划线部分为Kpn I识别位点);
5′-ATTCCAATACCAAGAAAGTAAAGTgcggccgcAAGTGGAACTGGCGCACCGGT-3′ (划线部分为Not I识别位点)。
扩增PNO1下游侧翼区同源臂(PNO13′同源臂)所用的引物为PNO-3-5和PNO-3-3,引物序列分别为:
5′-ACCGGTGCGCCAGTTCCACTTgcggccgcACTTTACTTTCTTGGTATTGGAAT-3′(划线 部分为Not I识别位点);
5′-TGTTCTAGATCCGAGATTTTGCGCTATGGAGC-3′(划线部分为Xba I识别位点)。
两个同源臂的PCR扩增条件如下:94℃变性5min后,按照94℃变性30sec、55℃复性30sec、72℃延伸1min30sec进行30次循环,最后72℃延伸10min;目的片段大小在1kb左 右。将PCR产物用PCR产物回收纯化试剂盒纯化回收(购自鼎国生物技术有限公司,北京)。 利用重叠延伸PCR的方法融合PNO1 5′同源臂和3′同源臂(参见J.萨姆布鲁克等,《分子克隆实验指南》第二版,科学出版社,1995),以PNO1 5′同源臂和3′同源臂PCR产物为模 板,以PNO-5-5/PNO-3-3为引物,PCR扩增条件如下:94℃变性5min后,按照94℃变性1min、 55℃复性1min、72℃延伸3min30sec进行30次循环,最后72℃延伸10min;目的片段大小 在2kb左右。PCR产物用PCR产物回收纯化试剂盒纯化回收。
Kpn I/Xba I双酶切(本试验所用的限制性内切酶均来自宝生物工程有限公司,大连)PCR 产物,酶切后产物插入同样双酶切处理的载体pYES2(Invitrogen Corp.USA)中,T4连接酶 16℃连接过夜,转化大肠杆菌DH5α,在含氨苄青霉素(100μg/ml)的LB平板上筛选阳性克 隆。用Kpn I/Xba I双酶切鉴定阳性克隆的质粒,得到4200bp左右和2000bp左右片段的重组 载体命名为pYES2-pno1,即为用于敲除甘露糖转移酶(PNO1)基因的敲除质粒,pno1基因 上下游同源臂并经最终测序验证正确。
2、敲除质粒对毕赤酵母的转化
采用电转化法将敲除质粒pYES2-pno1转化入毕赤酵母GJK01(记载发明专利ZL200610164912.8中,公开号为CN101195809)中,电转化的方法为本领域所共知的(如 A.亚当斯等,《酵母遗传学方法实验指南》,科学出版社,2000)。电转化前,先将敲除质粒用 5’同源臂上游BamH I酶切位点线性化,然后电转入制备好的感受态细胞中,涂布于含有精氨酸和组氨酸的MD培养基(YNB 1.34g/100mL,生物素4×10-5g/100mL,葡萄糖2g/100mL, 琼脂1.5g/100mL,精氨酸100mg/ml,组氨酸100mg/ml)上。待培养基上长出克隆后,随机 挑取几个克隆提取基因组,通过PCR的方法鉴定敲除质粒是否正确整合到了染色体上的目标 位点,PCR反应所用的两对引物分别是:PNO1基因5’同源臂外的引物序列PNO-5-5OUT: 5′-GCAGTTTAATCATAGCCCACTGCTA-3′和载体上的引物序列inner01: 5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′。PCR反应所用的酶为rTaq(宝生物工程有限公 司),PCR扩增条件如下:94℃变性5min后,按照94℃变性30sec、55℃复性30sec、72℃延 伸3min进行30次循环,最后72延伸10min。通过凝胶电泳分析PCR产物条带的大小,引物所扩增的条带在2.3kb左右为阳性克隆。
3、PCR鉴定阳性工程菌株
将其中一个阳性克隆接种于YPD培养基(10g/L酵母提取物,20g/L蛋白胨,20g/L葡萄糖)中,25℃摇床培养12小时后,将菌液涂布于腺嘌呤缺陷的5-FOA培养基(YNB 1.34g/100mL,生物素4×10-5g/100mL,葡萄糖2g/100mL,琼脂1.5g/100mL,精氨酸100mg/ml, 组氨酸100mg/ml,尿嘧啶100mg/ml,5-FOA 0.1%)(其中,YNB,为无氨基酸酵母氮源, 为北京欣经科生物技术有限公司产品,5-FOA为5-氟尿嘧啶,来自Sigma-aldrich P.O.BOX14508,St.Louis,MO 63178 USA),置于25℃培养。
待5-FOA培养基上长出克隆后,提取这些克隆的基因组,进行PCR鉴定:以基因组为模板,鉴定引物为染色体上pno1基因同源臂外的序列PNO1-ORF01和PNO1-ORF02,引物 序列分别为:
PNO1-ORF01:5′-GGGAAAGAAAACCTTCAATTT-3′;
PNO1-ORF02:5′-TACAAGCCAGTTTCGCAATAA-3′。
同时将以野生型X33菌株(Invitrogen公司)的基因组为模板的PCR反应体系设为对照。 PCR反应所用的酶为LA Taq(宝生物工程有限公司),PCR扩增条件如下:94℃变性5min 后,按照94℃变性30sec、55℃复性30sec、72℃延伸3min进行30次循环,最后72延伸10min。
为了鉴定α-1,6-甘露糖转移酶是否敲除,本发明在获得GJK01工程菌后引入了一个报告 蛋白,本发明以抗Her2抗体为报告蛋白,抗Her2抗体的表达载体的构建方法、载体转化方 法已经在申请专利中公开(公开号:CN101748145A)。利用该方法将抗Her2抗体表达载体转 入至GJK01宿主菌中,获得了表达抗Her2抗体的GJK01-HL工程菌株。DSA-FACE糖型分 析方法已经公开报道“刘波,等.一种利用DSA-FACE分析寡糖链的方法.生物技术通讯.2008.19(6).885-888”
将产物进行琼脂糖凝胶电泳。图1中A为GJK01宿主菌的鉴定结果;图1中B为GJK01-HL 菌(敲除och1)的DSA-FACE糖型分析结果所示。图2中泳道1为PON1缺陷型,泳道2为 野生型;以野生型X33菌株基因组为模板的PCR产物大小在490bp左右,PON1缺陷型工程 菌无扩增条带,也证明了PNO1基因的丢失,磷酸甘露糖转移酶敲除的菌株构建正确,命名 为GJK02,为磷酸甘露糖转移酶敲除的重组毕赤酵母菌。
二、磷酸甘露糖合成酶基因灭活的酵母菌株构建
磷酸甘露糖合成酶基因灭活的酵母菌株GJK03为将毕赤酵母GJK02中编码SEQ IDNo.3 所示磷酸甘露糖合成酶的DNA分子部分敲除而获得,即敲除GJK02酵母基因组中的磷酸甘 露糖合成酶基因,得到的重组酵母;即该酵母的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶和 磷酸甘露糖合成酶灭活。
构建载体的方法与步骤一相同。
1、构建磷酸甘露糖合成酶基因灭活载体
用于敲除磷酸甘露糖合成酶基因的敲除质粒pYES2-MNN4B为将磷酸甘露糖合成酶对应 的欲敲除除基因片段的上下游同源臂插入载体pYES2的Stu I和Spe I酶切位点间得到的载体。
利用同上述一的方法,用玻璃珠制备法提取毕赤酵母X33的基因组DNA,以该基因组 DNA为模板扩增敲除甘露糖合成酶(MNN4B)基因片段,MNN4B两侧的同源臂分别约为1kb,中间缺失约1kb的编码基因。
扩增MNN4B上游侧翼区同源臂(ARM25′同源臂)所用的引物为MNN4B-5-5和 MNN4B-5-3,引物序列分别为:
5′-AGTAGGCCTTTCAACGAGTGACCAATGTAGA-3′(划线部分为Stu I识别位点);
5′-TATCTCCATAGTTTCTAAGCAGGGCGGCCGCAATATGTGCGGTGTAGGGAGAAA-3 ′(划线部分为Not I识别位点)。
扩增MNN4B下游侧翼区同源臂(MNN4B 3′同源臂)所用的引物为MNN4B-3-5和MNN4B-3-3,引物序列分别为:
5′-TTTCTCCCTACACCGCACATATTGCGGCCGCCCTGCTTAGAAACTATGGAGATA-3′ (划线部分为Not I识别位点);
5′-TGTACTAGTTGAAGACGTCCCCTTTGAACA-3′(划线部分为Spe I识别位点)。
两个同源臂的PCR扩增条件、回收方法、以及酶切方法都同步骤1,最终构建获得pYES2-MNN4B敲除载体,并经最终测序验证正确。
2、敲除质粒对毕赤酵母的转化
敲除质粒采用电转化法将敲除质粒转化入上述一构建的毕赤酵母工程菌株GJK02中,电 转化的方法、鉴定方法同步骤一。
PCR反应所用的两对引物分别是:mnn4b基因5’同源臂外的引物序列MNN4B-5-5OUT: 5′-TAGTCCAAGTACGAAACGACACTA-3′和载体上的引物序列inner01: 5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′,引物所扩增的条带在2kb左右为阳性克隆。
3、PCR鉴定阳性工程菌株
将其中一个阳性克隆接种于5-FOA培养基(配方同前)上长出克隆后,提取这些克隆的 基因组,进行PCR鉴定:以基因组为模板,鉴定引物为染色体上mnn4b基因同源臂外的序 列MNN4B-ORF01和MNN4B-ORF02,引物序列:
MNN4B-ORF01:5'-AAAACTATCCAATGAGGGTCTC-3';
MNN4B-ORF02:5'-TCTTCAATGTCTTTAACGGTGT-3'。
以阳性克隆基因组DNA为模板,利用引物MNN4B-ORF01和MNN4B-ORF02进行PCR 扩增。结果如图3所示,泳道1为MNN4B缺陷型,泳道2为野生型;以野生型X33菌株基 因组为模板的PCR产物大小在912bp左右,MNN4缺陷型工程菌无扩增条带,也证明了磷酸 甘露糖合成酶敲除的,命名为GJK03,为磷酸甘露糖转移酶和磷酸甘露糖合成酶敲除的重组 毕赤酵母菌。
GJK02、GJK03菌(已敲除och1、pno1、mnn4b)的DSA-FACE糖型分析结果(方法同 实施例一中所述)如图4所示,可见pno1、mnn4b敲除后糖型中的磷酸甘露糖部分被去除了。
三、β甘露糖转移酶基因ARM2灭活的酵母菌株构建
磷酸甘露糖转移酶、磷酸甘露糖合成酶和β甘露糖转移酶ARM2(即β甘露糖转移酶II) 基因灭活的酵母菌株GJK04为毕赤酵母GJK03中编码SEQ ID No.5所示β甘露糖转移酶ARM2的DNA分子部分敲除而获得,即敲除GJK03酵母基因组中的β甘露糖转移酶ARM2 基因,得到的重组酵母;即酵母基因组中的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶基因、 磷酸甘露糖合成酶基因和β甘露糖转移酶ARM2已被灭活。
1、构建β甘露糖转移酶ARM2基因灭活载体
载体构建方法同步骤一,具体如下:
利用同上述一的方法,用玻璃珠制备法提取毕赤酵母X33的基因组DNA,以该基因组 DNA为模板扩增β甘露糖转移酶(ARM2)基因两侧的同源臂,ARM2两侧的同源臂分别约 为0.6kb,中间缺失约0.6kb的编码基因。
扩增ARM2上游侧翼区同源臂(ARM2 5′同源臂)所用的引物为ARM2-5-5和ARM2-5-3, 引物序列分别为:
5′-ActTGGTACCACACGACTCAACTTCCTGCTGCTC-3′(划线部分为Kpn I识别位点);
5′-actGCGGCCGCCACGAAACTTCTTACCTTTGACAA-3′(划线部分为Not I识别位 点)。
扩增ARM2下游侧翼区同源臂(ARM23′同源臂)所用的引物为ARM2-3-5和ARM2-3-3,引物序列分别为:
5′-TTGTCAAAGGTAAGAAGTTTCGTGGCGGCCGCTATCTTGACATTGTCATTCAGTG A-3′(划线部分为Not I识别位点);
5′-caaTCTAGAGCCTCCTTCTTTTCCGCCT-3′(划线部分为Xba I识别位点)。
2、敲除质粒对毕赤酵母的转化
敲除质粒采用电转化法将敲除质粒转化入上述一构建的毕赤酵母工程菌株GJK03中,电 转化的方法、鉴定方法同上述一。
PCR反应所用的两对引物分别是:ARM2基因5’同源臂外的引物序列ARM2-5-5OUT:5′-TTTTCCTCAAGCCTTCAAAGACAG-3′和载体上的引物序列inner01: 5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′,引物所扩增的条带在0.8kb左右为阳性克隆。
3、PCR鉴定阳性工程菌株
将其中一个阳性克隆接种于5-FOA培养基(配方同前)上长出克隆后,提取这些克隆的 基因组,进行PCR鉴定:以基因组为模板,鉴定引物为染色体上ARM2基因同源臂外的序列Arm-ORF01和Arm-ORF02,引物序列:
Arm2-ORF-09:5'-gggcagaagatcctagag-3';
Arm2-ORF-10:5'-tcgtctccattgctatctacgact-3'。
以阳性克隆基因组DNA为模板,用引物Arm2-ORF-09和Arm2-ORF-10进行PCR扩增,结果如图5所示,泳道1为ARM2缺陷型,泳道2为野生型;结果以野生型X33菌株基因组 为模板的PCR产物大小在600bp左右,ARM2缺陷型工程菌无扩增条带,也证明了β甘露糖 转移酶(ARM2)敲除的,命名为GJK04,为磷酸甘露糖转移酶、磷酸甘露糖合成酶和β甘 露糖转移酶II(ARM2)基因敲除的重组毕赤酵母菌。
四、β甘露糖转移酶ARM1、ARM3、ARM4基因灭活的酵母菌株构建
根据上述步骤一至三,同β甘露糖转移酶基因ARM2灭活的酵母菌株构建的设计方法和 构建过程,在GJK04工程菌的基础上先后敲除β甘露糖转移酶ARM1、ARM3、ARM4(即 β甘露糖转移酶I、III和IV,氨基酸序列分别为SEQ ID No.4、SEQ ID No.6和SEQ ID No.7), 分别构建获得GJK05、GJK07、GJK18工程菌株。
1、构建β甘露糖转移酶ARM1、ARM3、ARM4基因灭活载体
载体构建方法同步骤三,差别之处在于:
扩增ARM1上游侧翼区同源臂(ARM1 5′同源臂)所用的引物为ARM1-5-5和ARM1-5-3, 引物序列分别为:
ARM1-5-5:5'-TCAACGCGTTGGCTCTGGATCGTTCTAATA-3'(划线部分为MluI识别 位点);
ARM1-5-3:5'-ttctccgttctcctttctccgtGCGGCCGCcagcagcaaggaagataccaa-3'(划线部分为NotI 识别位点)。
扩增ARM1下游侧翼区同源臂(ARM1 3′同源臂)所用的引物为ARM1-3-5和ARM1-3-3, 引物序列分别为:
ARM1-3-5:5'-ttggtatcttccttgctgctgGCGGCCGCacggagaaaggagaacggagaa-3'(划线部分为 NotI识别位点);
ARM1-3-3:5'-TCAACGCGTTGGCTGGAGGTGACAGAGGAA-3'(划线部分为MluI识 别位点)。
扩增ARM3上游侧翼区同源臂(ARM3 5′同源臂)所用的引物为ARM3-5-5和ARM3-5-3, 引物序列分别为:
ARM3-5-5:5'-TCAACGCGTTAGTAGTGCCGTGCCAAGTAGCG-3'(划线部分为MluI 识别位点);
ARM3-5-3:5'-tcctactttgcttatcatctgccGCGGCCGCggtcaggccctcttatggttgtg-3'(划线部分为 NotI识别位点)。
扩增ARM3下游侧翼区同源臂(ARM3 3′同源臂)所用的引物为ARM3-3-5和ARM3-3-3, 引物序列分别为:
ARM3-3-5:5'-_cacaaccataagagggcctgaccGCGGCCGCggcagatgataagcaaagtagga-3'(划线部分 为NotI识别位点);
ARM3-3-3:5'-TCAACGCGTCATAGGTAATGGCACAGGGATAG-3'(划线部分为MluI 识别位点)。
扩增ARM4上游侧翼区同源臂(ARM4 5′同源臂)所用的引物为ARM4-5-5和ARM4-5-3, 引物序列分别为:
ARM4-5-5:5'-TCAACGCGTGCAGCGTTTACGAATAGTGTCC-3'(划线部分为MluI识 别位点);
ARM4-5-3:5'-gcatagggctgaagcatactgtGCGGCCGCaatgatatgtacgttcccaaga-3'(划线部分为 NotI识别位点)。
扩增ARM4下游侧翼区同源臂(ARM4 3′同源臂)所用的引物为ARM4-3-5和ARM4-3-3, 引物序列分别为:
ARM4-3-5:5'-tcttgggaacgtacatatcattGCGGCCGCacagtatgcttcagccctatgc-3'(划线部分为NotI 识别位点);
ARM4-3-3:5'-TCAACGCGTGAGGTGGACAAGAGTTCAACAAAG-3'(划线部分为MluI 识别位点)。
2、敲除质粒对毕赤酵母的转化
同步骤三,差别之处在于,PCR反应所用的两对引物分别是:
ARM1基因5’同源臂外的引物序列ARM1-5-5OUT:5′-GTTCTGGTATGCGTTCTA TTCTTC-3′和载体上的引物序列inner01:5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′,引物 所扩增的条带在3.5kb左右为阳性克隆。
ARM3基因5’同源臂外的引物序列ARM3-5-5OUT:5′-TATTTGCCTTCTTCACCGT TAT-3′和载体上的引物序列inner01:5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′,引物所扩增的条 带在3.7kb左右为阳性克隆。
ARM4基因5’同源臂外的引物序列ARM4-5-5OUT:5′-TCCGTTGAGGGTGCTAAT GGTA-3′和载体上的引物序列inner01:5′-AGCGTCGATTTTTGTGATGCTCGTCA-3′,引物所 扩增的条带在3.7kb左右为阳性克隆。
3、PCR鉴定阳性工程菌株
同步骤三,差别之处在于,利用下面引物对工程菌进行鉴定,可以发现基因已被敲除(图 6、图7和图8):
Arm1-ORF-09:5'-TAGTCTGGTTTGCGGTAGTGT-3';
Arm1-ORF-10:5'-AGATTGAGCATAGGAGTGGC-3'。
Arm3-ORF-09:5'-AAACGGAGTCCAGTTCTTCT-3';
Arm3-ORF-10:5'-CAACTTTGCCTGTCATTTCC-3'。
Arm4-ORF-09:5'-CGCTTCAGTTCACGGACATA-3';
Arm4-ORF-10:5'-GCAACCCAGACCTCCTTACC-3'。
GJK18菌的DSA-FACE糖型分析结果如图9所示。因β甘露糖的修饰仅仅添加在甘露糖 的个别末端,尽管糖型分析结果并没有实质性的变化,但β甘露糖是潜在的引起免疫原性的 糖,因此对于用于人体的药物来源,存在潜在的风险,本发明将所有的β甘露糖均灭活,因 此从根本上解决了存在β甘露糖的问题,且糖型结构没有被改变。
五、具有哺乳动物Man5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株构建
首先,为了鉴定外源甘露糖苷酶I(MDSI)是否正确地发挥了作用,本发明提前在GJK18 工程菌中引入了一个报告蛋白,本发明以抗Her2抗体为报告蛋白,因此构建了抗Her2抗体 的表达载体。该载体的构建方法、载体转化方法已经在申请专利中公开(公开号:CN101748145A)。利用该方法将抗Her2抗体表达载体转入至GJK18宿主菌中,获得了表达 抗Her2抗体的W2工程菌株。
其次,具有哺乳动物Man5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株W10为 C端融合HDEL序列的MDSI(TrmdsI,核苷酸序列如SEQ ID No.14所示,编码SEQ ID No.9所示MDSI蛋白)插入宿主菌W2的基因组中,得到的工程菌。
1、外源甘露糖苷酶I(MDSI)表达载体的构建
表达外源甘露糖苷酶I重组载体pPIC9-TrmdsI为将SEQ ID No.14所示的DNA分子插入 pPIC9载体的Xho I和EcoR I酶切位点间得到的重组载体。
其中,SEQ ID No.14自5’末端第1-1524位核苷酸为优化后的甘露糖苷酶I编码基因,自 5’末端第1525-1536位核苷酸为内质网保留信号——HDEL编码基因。
(1)甘露糖苷酶I(MDSI)基因
外源甘露糖苷酶I可以是来源于丝状真菌、植物、昆虫、爪哇、哺乳动物等的甘露糖苷 酶I,本实施例选取绿色木霉的甘露糖苷酶I(詹洁.绿色木霉α-1,2-甘露糖苷酶在毕赤酵母 中的克隆表达与活性鉴定[学位论硕士文].),并在甘露糖苷酶I的C-端融合了内质网保留信号 ——HDEL。
根据詹洁.绿色木霉α-1,2-甘露糖苷酶在毕赤酵母中的克隆表达与活性鉴定[学位论硕士 文].公布的绿色木霉的甘露糖苷酶I序列,根据酵母偏爱密码子和基因高表达原则优化编码基因,并在C端融合HDEL序列,得到基因片段(SEQ ID No.14)。
(2)设计并合成如下引物:
TrmdsI-5:5’-TCTCTCGAGAAAAGAGAGGCTGAAGCTTATCCAAAGCCGGGC GCCAC-3’;下划线所示序列为Xho I酶切识别位点。
TrmdsI-3:5’-AGGGAATTCTTACAACTCGTCGTGAGCAAGGTGGCCGCCCCGT CGTGATG-3’;下划线所示序列为EcoR I酶切识别位点。
(3)以上述(1)得到的基因片段为模板,以TrmdsI-5和TrmdsI-3为引物,进行PCR扩增,得到PCR扩增产物,命名为TrmdsI,该产物含有SEQ ID No.14。
(4)Xho I和EcoR I双酶切上述(3)获得的PCR产物,得到基因片段;Xho I和EcoR I双酶切pPIC9载体得到载体大片段;将基因片段与载体大片段连接,得到重组质粒,将其命名为pPIC9-TrmdsI。将pPIC9-TrmdsI测序,结果正确。
2、表达外源甘露糖苷酶I的重组酵母的构建
将约10μg pPIC9-TrmdsI质粒,用Sal I线性化,用1/10体积的3M醋酸钠和3倍体积的 无水酒精沉淀线性化的质粒。用体积百分含量为70%的乙醇水溶液洗两次以除去其中的盐, 晾干,加入约30μL水重悬沉淀,获得用于转化的pPIC9-TrmdsI线性化质粒。
以下步骤中制备酵母电转化感受态细胞的方法参照Invitrogen公司的相关手册和 “Molecular Cloning,A laboratory Manual(Fourth Edition)”,2012Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New YorK。选用的宿主菌是上述构建的W2工程菌。
具体如下:
将毕赤酵母W2在YPD平板(酵母提取物10g/L,胰蛋白胨20g/L,葡萄糖20g/L,琼脂15g/L)上用划线法分离单克隆,28℃温箱培养2天。接种一个单克隆至一个装有10mL YPD液体培养基(酵母提取物10g/L,胰蛋白胨20g/L,葡萄糖20g/L)的50mL三角瓶中,28℃ 过夜培养至OD600约为2,得到菌液。再将0.1-0.5mL菌液接种到含有500mL YPD液体培养 基的3.5L摇瓶中,培养过夜至OD600至1.3-1.5之间。将菌液转移至无菌的离心瓶中,4℃, 1500g离心10分钟。用500mL预冷的无菌水重悬菌体,4℃,1500g离心10分钟收获细胞, 用250mL预冷的无菌水再洗一次。用20mL预冷的无菌1M山梨醇重悬菌体,4℃,1500g离 心10分钟收获细胞,用预冷的1M山梨醇重悬菌体至终体积为1.5mL,得到菌悬液。
取80μL菌悬液与10μL用于转化的pPIC9-TrmdsI线性化质粒,在微量离心管中混匀, 得到混合物,将其置冰上5min,将混合物转移到一个冰冷的0.2cm电转杯中,电穿孔细胞 (Bio-Rad Gene Pulser,2000V,25μF,200Ω),再立即向电转杯中加入1mL冰冷的1M山梨醇,并小心地将混合物(转化细胞)转移至15mL培养管中。
将培养管放在28℃温箱孵育1h,不要摇动。然后加入1mL YPD液体培养基后在28℃, 250rpm的摇床中孵育3h。取200μL转化细胞涂布到含MD平板上(1.34g/100ml的YNB, 4×10-5g/100ml Biotin,2g/100ml的葡萄糖)。28℃温箱培养2-5天,至形成单克隆,即W2-Tr,命名为W10。
用玻璃珠制备法提取W10的基因组DNA,以基因组DNA为模板,以TrMDSI-1.3kb-01和TrMDSI-1.3kb-02为引物,进行PCR扩增,得到PCR扩增产物约1.3kb,证明MDSI已插入到基因组中,即为阳性工程菌(图10中A)。
TrMDSI-1.3kb-01:5’-GAACACGATCCTTCAGTATGTA-3’;
TrMDSI-1.3kb-02:5’-TGATGATGAACGGATGCTAAAG-3’。
W10菌的DSA-FACE糖型分析结果(方法同实施例一中所述方法)如图10中B所示,可见转入TrmdsI后,W10菌表达蛋白的糖型结构为Man5GlcNAc2、Man6GlcNAc2,其中以Man5GlcNAc2为主。
六、具有哺乳动物GlcNAcMan5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株构 建
具有哺乳动物GlcNAcMan5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株1-8为 将含mnn9定位信号的N-乙酰葡萄糖胺转移酶I(GnTI)(核苷酸序列如SEQ ID No.15所示, 编码SEQ ID No.10所示蛋白)的DNA片段插入宿主菌W10基因组中,得到的工程菌。
其中,SEQ ID No.15自5’末端第1-114位核苷酸为mnn9定位信号,自5’末端第115-1335 位核苷酸为N-乙酰葡萄糖胺转移酶I编码基因。
1、含mnn9定位信号的N-乙酰葡萄糖胺转移酶I(GnTI)表达载体的构建
(1)调取人gnt1基因
用人gnt1基因上游引物(mnn9-GnTI-01:5’-tcagtcagcgctctcgatggcgaccccg-3’)和下游引 物GnTI-02:5’-GCGAATTCTTAGTGCTAATTCCAGCTAGGATCATAG-3’(下划线为EcoR I酶切位点),用PCR的方法从人肝胎cDNA文库(购自Clontech Laboratories Inc.1290TerraBella Ave.Mountain View,CA94043,USA)获得人gnt1基因全长片段,PCR反应条件:94℃预变性5分钟,94℃变性30秒,52℃退火30秒,72℃延伸1分钟30秒,循环30次;最后 72℃延伸10分钟。PCR扩增产物用0.8%的琼脂糖凝胶电泳分离,用DNA回收试剂盒进行回 收。
(2)含定位信号mnn9的GnTI DNA片段
S.cere MNN9高尔基体定位信号:ScMNN9-03:tatAATattATGTCACTTTCTCTTGTATCGTACCGCCTAAGAAAGAACCCGTGGGTTAACATT TTTCTACCTGTTTTGGCCATATTTCTAATATATATAATTTTTTTCCAGAGAGATCAATCTtcagtcagcgctctcgatggcgaccccg
以含有S.cere MNN9高尔基体定位信号编码序列的上游引物ScMNN9-03 (tatAATattATGTCACTTTCTCTTGTATCGTACCGCCTAAGAAAGAACCCGTGGGTTAACA TTTTTCTACCTGTTTTGGCCATATTTCTAATATATATAATTTTTTTCCAGAGAGATCAATCTtcagtcagcgctctcgatggcgaccccg,下划线为SspI酶切位点)和GnTI催化结构域编码区下游引物 GnTI-02,通过PCR反应将回收纯化的1.2kb GnTI片段和S.cere MNN9高尔基体定位信号编 码序列相连接,使用Pyrobest DNA聚合酶扩增mnn9-gnt1基因片段(SEQ ID No.15)。
PCR反应条件:94℃变性2分钟,52℃退火30秒、72℃延伸5分钟,之后94℃变性30秒,52℃退火30秒,72℃延伸1分钟30秒,循环30次;最后72℃延伸10分钟。
PCR扩增产物经0.8%的琼脂糖凝胶电泳(8V/cm,15分钟)分离,紫外灯下用洁净的刀 片切下1.3kb的目的条带,用DNA回收试剂盒进行回收,方法同上。
(3)PGE-URA3-GAP1-mnn9-GnTI表达载体的构建
Ssp I和EcoR I双酶切上述(2)获得的mnn9-gnt1基因片段PCR产物,得到基因片段; Ssp I和EcoR I双酶切PGE-URA3-GAP1(杨晓鹏,刘波,宋淼,巩新,唱韶红,薛奎晶,吴军. Man5GlcNAc2哺乳动物甘露糖型糖蛋白的毕赤酵母表达系统构建.生物工程学报.2011;27:108-17.)载体得到载体大片段;将基因片段与载体大片段连接,得到重组质粒,将其 命名为PGE-URA3-GAP1-mnn9-GnTI。测序,结果正确。
PGE-URA3-GAP1-mnn9-GnTI为将SEQ ID No.15所示的DNA分子插入 PGE-URA3-GAP1载体的酶切位点Ssp I和EcoR I之间后得到的重组载体。
2、表达外源甘露糖苷酶I的重组酵母的构建
将约10μg PGE-URA3-GAP1-mnn9-GnTI质粒,用Nhe I线性化,获得用于转化的PGE-URA3-GAP1-mnn9-GnTI线性化质粒,制备酵母电转化感受态细胞的方法上述步骤五。
选用的宿主菌是上述步骤五构建的的W10工程菌。转化后在MD平板上形成的单克隆, 命名为1-8。
用玻璃珠制备法提取1-8的基因组DNA,以基因组DNA为模板,以HuGnTI-0.9k-01和HuGnTI-0.9k-02为引物,进行PCR扩增,得到PCR扩增产物约0.9kb,证明GnTI已插入到 基因组中,即为阳性工程菌(如图11中A)。
HuGnTI-0.9k-01:5’-TGGACAAGCTGCTGCATTATC-3’;
HuGnTI-0.9k-02:5’-CGGAACTGGAAGGTGACAATA-3’。
1-8菌的DSA-FACE糖型分析结果(方法同实施例一中所述方法)如图11中B所示,可见转入GnTI后,宿主菌表达蛋白的主要糖型结构为GlcNAcMan5GlcNAc2。
七、具有哺乳动物GalGlcNAcMan5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌构 建
具有哺乳动物GalGlcNAcMan5GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株 1-8-4为将kre2-GalE-GalT基因片段(核苷酸序列如SEQ ID No.16所示,编码SEQ IDNo.11 所示蛋白)插入宿主菌1-8基因组中,得到的工程菌1-8-4。
其中,SEQ ID No.16自5’末端第1-294位核苷酸为kre2定位信号,自5’末端第295-1317 位核苷酸为半乳糖异构酶GalE编码基因、自5’末端第1325-2394位核苷酸为半乳糖转移酶GalT编码基因。
1、含kre2定位信号的半乳糖转移酶(GalE+T)表达载体的构建
(1)调取人GalE、GalT基因
用人GalE基因上游引物GalE5’和下游引物GalE3’,用人GalT基因上游引物GalT5’和下 游引物GalT3’,用PCR的方法分别从人肝胎cDNA文库(购自Clontech LaboratoriesInc.1290Terra Bella Ave.Mountain View,CA94043,USA)获得人GalE、GalT基因全长片段,PCR反 应条件:94℃预变性5分钟,94℃变性30秒,52℃退火30秒,72℃延伸1分钟30秒,循环 30次;最后72℃延伸10分钟。PCR扩增产物分别用0.8%的琼脂糖凝胶电泳分离,用DNA回收试剂盒分别进行回收。
GalE5’:5’-ATGAGAGTTCTGGTTACCGGTGGTA-3’;
GalE3’:5’-AGGGTACCATCGGGATATCCCTGTGGATGGC-3’(KpnI);
GalT5’:5’-ATGGTACCGGTGGTGGACGTGACCTTTCTCGTCTGCCA-3’(KpnI)。
GalT3’:5’-GCatttaaatttaGCTCGGTGTCCCGATGTCCACTGTGAT-3’(SwaI)。
(2)含定位信号kre2的GalE-GalT DNA片段
Kre2 5’:5’-ATAATattAAACGATGGCCCTCTTTCTCAGTAAGAG-3’(下划线SspI I位点);
Kre2 3’+GalE5’:5’-CACCGGtAACCAGaACTctCatGATCGGGGCAtctgccttttcagcggcagctttcagagccttggattc-3’。
用PCR的方法从酿酒酵母S.cere基因组DNA中调取kre2定位信号片段。PCR条件同上。
以含有S.cere kre2高尔基体定位信号编码序列的上游引物Kre2和GalE+GalT催化结构域 编码区下游引物GalT3’,通过PCR反应将回收纯化的GalE、GalT片段和S.cerekre2高尔基 体定位信号编码序列相连接,使用Pyrobest DNA聚合酶扩增kre2-GalE-GalT基因片段。
PCR反应条件:94℃变性2分钟,52℃退火30秒、72℃延伸5分钟,之后94℃变性30秒,52℃退火30秒,72℃延伸4分钟30秒,循环30次;最后72℃延伸10分钟。
PCR扩增产物经0.8%的琼脂糖凝胶电泳(8V/cm,15分钟)分离,紫外灯下用洁净的刀 片切下2.4kb的目的条带,用DNA回收试剂盒进行回收,方法同上。
(3)PGE-URA3-GAP1-kre2-GalE-GalT载体的构建
先用SwaI酶切上述kre2-GalE-GalT的DNA分子,再用T4 PNK酶(大连宝生物有限公司)磷酸化该基因片段;Ssp I和SwaI双酶切PGE-URA3-GAP1载体得到载体大片段;将基 因片段与载体大片段连接,得到重组质粒,将其命名为PGE-URA3-GAP1-kre2-GalE-GalT。 测序,结果正确。
PGE-URA3-GAP1-kre2-GalE-GalT为将SEQ ID No.16所示的kre2-GalE-GalT的DNA分 子插入PGE-URA3-GAP1载体的Ssp I和SwaI酶切位点得到的重组载体。
2、表达外源UDP-Gal和乳糖转移酶的重组酵母的构建
将约10μg PGE-URA3-GAP1-kre2-GalE-GalT质粒,用Nhe I线性化,获得用于转化的 PGE-URA3-GAP1-kre2-GalE-GalT线性化质粒,制备酵母电转化感受态细胞的方法同上述步 骤五。
选用的宿主菌是步骤六构建的1-8工程菌。转化后在MD平板上形成的单克隆,命名为 1-8-4。
用玻璃珠制备法提取1-8-4的基因组DNA,以基因组DNA为模板,分别以GalE-T(1.5k)-01 (5’-TGATAACCTCTGTAACAGTAAGCGC-3’)和GalE-T(1.5k)-02 (5’-GGAGCTTAGCACGATTGAATATAGT-3’)为引物,进行PCR扩增,得到PCR扩增产物 分别为1.5kb,证明GalE-T已插入到基因组中,即为阳性工程菌(如图12中A)。
1-8-4菌的DSA-FACE糖型分析结果(方法同实施例一中所述方法)如图12中B所示,可见转入半乳糖异构酶和半乳糖转移酶后,宿主菌表达蛋白的主要糖型结构为GalGlcNAcMan5GlcNAc2。
八、具有哺乳动物GalGlcNAcMan3GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株 构建
具有哺乳动物GalGlcNAcMan3GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株 52-60为将MDSII DNA分子(核苷酸序列如SEQ ID No.17所示,编码SEQ ID No.12所示蛋白)插入宿主菌1-8-4的基因组中,得到的工程菌52-60。
其中,SEQ ID No.17自5’末端第1-108位核苷酸为甘露糖苷酶II编码基因的mnn2定位 信号,自5’末端第109-3303位核苷酸为甘露糖苷酶II编码基因。
1、含mnn2定位信号的甘露糖苷酶II(MDSII)表达载体的构建
(1)全基因合成方式合成含mnn2定位信号的MDSII基因
根据序列利用全基因合成方式合成含mnn2的MDSII基因(SEQ ID No.17),由南京金瑞 斯公司合成并克隆至pUC57克隆载体中,获得pUC57-MDSII。
设计MDSII基因上游引物(mnn2-MDSII-01: 5’-ATAATattAAACCatgctgcttaccaaaaggttttcaaagctgttc-3’)(下划线为SspI酶切位点)和下游引 物(MDSII-02:5’-GCTATTTA AATctattaCCTCAACTGGATTCGGAATGTGC TG ATTTCCATTG-3’)(下划线为SwaI酶切位点),用PCR的方法从pUC57-MDSII获得人MDSII 基因全长片段PCR产物,PCR反应条件:94℃预变性5分钟,94℃变性30秒,52℃退火30 秒,72℃延伸4分钟30秒,循环30次;最后72℃延伸10分钟。PCR扩增产物(序列17) 用0.8%的琼脂糖凝胶电泳分离,用DNA回收试剂盒进行回收。
(2)PGE-URA3-arm3-GAP-mnn2-MDSII表达载体的构建
先用SwaI酶切上述PCR产物,再用T4 PNK酶(大连宝生物有限公司)磷酸化该基因片段;Ssp I和SwaI双酶切PGE-URA3-GAP1载体得到载体大片段;将基因片段与载体大片 段连接,得到重组质粒,将其命名为PGE-URA3-arm3-GAP-mnn2-MDSII。测序,结果正确。
PGE-URA3-arm3-GAP-mnn2-MDSII为将SEQ ID No.17所示DNA分子插入 PGE-URA3-GAP1载体的Ssp I和Swa I酶切位点得到的重组载体。
2、表达外源甘露糖苷酶II的重组酵母的构建
将约10μg PGE-URA3-arm3--GAP-mnn2-MDSII质粒,用Msc I线性化,获得用于转化的 PGE-URA3-arm3-GAP-mnn2-MDSII线性化质粒,制备酵母电转化感受态细胞的方法同上述步 骤五。
选用的宿主菌是步骤七构建的1-8-4工程菌。转化后在MD平板上形成的单克隆,命名 为52-60。
用玻璃珠制备法提取52-60的基因组DNA,以基因组DNA为模板,分别以 CeMNSII-1.2k-01和CeMNSII-1.2k-02为引物,进行PCR扩增,得到PCR扩增产物分别为1.2kb,证明MDSII已插入到基因组中,即为阳性工程菌(图13中A)。
CeMNSII-1.2k-01:5’-CAGATGGATGAGCATAGAGTTA-3’;
CeMNSII-1.2k-02:5’-GACAAGAGGATAATGAAGAGAC-3’。
52-60菌的DSA-FACE糖型分析结果如图13中C所示。可见,转入后外源甘露糖苷酶II, 宿主菌表达蛋白的主要糖型结构为GalGlcNAcMan3GlcNAc2。
九、具有哺乳动物Gal2GlcNAc2Man3GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌 株构建
具有哺乳动物Gal2GlcNAc2Man3GlcNAc2且无岩藻糖糖基化结构的糖基工程酵母菌株 150L2为将GnT II DNA分子(核苷酸序列如SEQ ID No.18所示,编码SEQ ID No.13所示蛋 白)插入宿主菌52-60的基因组中,得到的工程菌150L2。
其中,SEQ ID No.18自5’末端第1-108位核苷酸为N-乙酰葡萄糖胺转移酶II编码基因的 mnn2定位信号,自5’末端第109-1185位核苷酸为N-乙酰葡萄糖胺转移酶II。
1、mnn2定位信号的N-乙酰葡萄糖胺转移酶II(GnTII)表达载体的构建
(1)全基因合成方式合成GnTII基因
根据序列利用全基因合成方式合成含mnn2的GnTII基因(SEQ ID No.18),由南京金瑞 斯公司合成并克隆至pUC57克隆载体中,获得pUC57-GnTII。
设计GnTII基因上游引物(mnn2-GnTII-01:5’-ATAATattAAACCatgctgcttaccaaaaggttttcaaagctgttc-3’)(下划线为SspI酶切位点)和下游引物(GnTII-02:5’-GCTatttaaa tTTAtcactgcagtcttctataacttttac-3’)(下划线为SwaI酶切位点),用PCR的方法从pUC57-GnTII 获得含mnn2定位信号的N-乙酰葡萄糖胺转移酶II(GnTII)DNA分子,PCR反应条件:94℃ 预变性5分钟,94℃变性30秒,52℃退火30秒,72℃延伸2分钟30秒,循环30次;最后 72℃延伸10分钟。PCR扩增产物用0.8%的琼脂糖凝胶电泳分离,用DNA回收试剂盒进行回 收。
(2)PGE-URA3-arm3-GAP-mnn2-GnTII表达载体的构建
酶切及构建方法与PGE-URA3-arm3-GAP-mnn2-MDSII构建方法一致,得到重组质粒, 将其命名为PGE-URA3-arm3-GAP-mnn2-GnTII。测序,结果正确。
PGE-URA3-arm3-GAP-mnn2-GnTII为将SEQ ID No.18所示DNA分子插入 PGE-URA3-GAP1载体的Ssp I和Swa I酶切位点得到的重组载体。
2、表达外源N-乙酰葡萄糖胺转移酶II的重组酵母的构建
将约10μg PGE-URA3-arm3-GAP-mnn2-GnTII质粒,用Msc I线性化,获得用于转化的 PGE-URA3-arm3-GAP-mnn2-GnTII线性化质粒,制备酵母电转化感受态细胞的方法同上述步 骤五。
选用的宿主菌是步骤八构建的52-60工程菌。转化后在MD平板上形成的单克隆,命名 为150L2。
用玻璃珠制备法提取150L2的基因组DNA,以基因组DNA为模板,分别RnGnTII-0.8k-01 和RnGnTII-0.8k-02为引物,进行PCR扩增,得到PCR扩增产物为0.8kb,证明GnTII已插入到基因组中,即为阳性工程菌(图13中B)。
RnGnTII-0.8k-01:5’-ATCAACAGTCTGATCTCTAGTG-3’;
RnGnTII-0.8k-02:5’-AGTTCATGGTCCCTAATATCTC-3’。
十、工程化菌株中抗her2抗体基因的敲除
抗her2抗体基因灭活的酵母菌株3-5-11为将SEQ ID No.19所示的DNA分子(抗her2 抗体轻重链基因敲除序列)导入毕赤酵母150L2中,与150L2基因组中的同源序列发生同源 重组,敲除酵母基因组中的抗her2抗体轻重链基因,得到的重组酵母。
构建抗her2抗体轻重链基因灭活载体、敲除质粒对毕赤酵母的转化、PCR鉴定阳性工程 菌株与前述步骤方法相同,抗her2抗体基因灭活的酵母菌株命名为3-5-11。
十一、工程化菌株中灭活O-甘露糖转移酶I基因
因发现宿主菌存在不稳定性,容易丢失MDSI和MDSII基因,因此在O-甘露糖转移酶I 基因灭活之前,按照本实施例步骤八和步骤五的同样技术方法,在3-5-11中宿主菌先后转入 SEQ ID No.17(MDSII)和SEQ ID No.14(MDSI),保证了工程菌内这两个基因的双拷贝,构建获得了670宿主菌。
O-甘露糖转移酶I基因灭活的酵母菌株7b为将编码SEQ ID No.8所示的O-甘露糖转移酶 I的DNA分子在毕赤酵母670中进行插入灭活,得到的酵母,命名为7b,即GJK30。GJK30 已经于2020年03月18日保藏于中国普通微生物菌种保藏管理中心,其保藏编号为CGMCC No.19488。
1、O-甘露糖转移酶基因灭活载体的构建
以质粒pPIC9(invitrogen公司)为模板,通过PCR方法获取终止子AOXTT序列。所用PCR钓取终止子引物AOXTT-5和AOXTT-3(5’-AOX1TT-5tctacgcgtccttagacatgactgttcctcagt-3’; AOX1TT-3:5’-tctacgcgtaagcttgcacaaacgaacttc-3’)。将得到的PCR产物用PCR产物回收纯化 试剂盒纯化回收(鼎国生物技术有限公司,北京),得到AOX1TT终止子片段。
本发明所用的载体pYES2(invitrogen公司)具有酵母的URA3筛选标记,可用于后续筛 选工作。为了防止载体上的URA3基因的启动子对载体上其他基因的影响,本发明在URA3 基因末端添加AOX1TT终止子。具体构建方法为:将上述获得的AOX1TT终止子片段回收后用MluI酶切,得到酶切片段;将该酶切片段与用同样用Mlu1处理过的载体pYES2连接, 将连接产物转化大肠杆菌感受态细胞Trans5α(北京全式金生物技术有限公司,目录号CD201)扩增,将序列正确的克隆命名为Trans5α-pYES2-URA3-AOX1TT,提取质粒,得到URA3基 因末端添加AOX1TT终止子的重组载体,记为pYES2-URA3-AOX1TT。
为了使构建的载体能够定点整合到毕赤酵母PMT1基因中,本发明利用PCR钓取PMT1 基因中ORF区的一个片段作为同源重组片段。为了确保失活载体整合到PMT1基因上能够引 起PMT1基因的失活,本研究在引物两端加上不同组合的终止密码子,在钓取的PMT1基因 片段3末端加上CYCTT终止子。
以毕赤酵母JC308(Invitrogen公司)基因组为模板,用玻璃珠制备法(A.亚当斯等,《酵 母遗传学方法实验指南》,科学出版社,2000)提取毕赤酵母JC308的基因组DNA,以该基 因组DNA为模板,利用引物PMT1-IN-5和PMT1-IN-3进行PCR扩增钓取PMT1基因片段。
PMT1-IN-5:5’-tctatgcattaatgatagttaatgactaatagagtaaaacaagtcctcaagaggt-3’;
PMT1-IN-3:5’-tgacataactaattacatgatctattagtcattaactatcattagatcagagtggggacgactaagaaa gc-3’。
钓取的PMT1基因片段两端加入具有不同组合的终止密码子,命名为PMT1-IN。
PCR钓取PMT1基因片段反应条件为94℃预变性5min;94℃变性30s,55℃退火30s,72℃延伸1min40s。共进行25个循环,最后72℃延伸10min。回收PCR产物即为钓取的PMT1 基因片段。
以含有CYCTT终止子的质粒pYES2为模板,利用引物CYC1TT-5和CYC1TT-3(CYC1TT-5:5’-gctttcttagtcgtccccactctgatctaatgatagttaatgactaatagatcatgtaattagttatgtca-3’; CYC1TT-3:5’-gcaaattaaagccttcgagcgtc-3’)进行PCR扩增钓取CYC1TT终止子片段。PCR反 应条件为94℃预变性5min;94℃变性30s,55℃退火30s,72℃延伸1min。共进行25个循环, 最后72℃延伸10min。回收PCR产物,即为CYC1TT终止子片段。
再以回收的PCR产物CYC1TT终止子片段和PMT1-IN片段(钓取的PMT1基因片段) 为模板,利用引物PMT1-IN-5和CYC1TT-3进行PCR扩增,连接PMT1-IN和CYC1TT片段, 构建PMT1-IN-CYC1TT融合片段。PCR反应条件为94℃预变性5min;94℃变性30s,55℃ 退火30s,72℃延伸2.4min。共进行25个循环,最后72℃延伸10min。回收PCR产物,即为 PMT1-IN和CYC1TT终止子的连接片段——PMT1-IN-CYC1TT融合片段。回收后的产物用 Nsi1酶切后磷酸化,然后与pYES2-URA3-AOX1TT经Nsi1和Stu1酶切得到的载体骨架连接, 得到的序列正确的重组载体为PMT1插入失活载体PMT1-IN-pYES2。
在钓取的PMT1基因片段的前端和末端各装上不同组合的终止密码子,并且在末端的终 止密码子之后又装了CYC1TT终止子,即保证如果基因组整合正确PMT1基因便不会表达。 pYES2载体上含有毕赤酵母的URA3基因,为防止URA3基因启动子对PMT1基因的启动,在URA3基因后插入AOX1TT终止子。根据设计的引物,获得CYC1TT终止子(272bp)片 段和PMT1(907bp)片段,与理论大小一致。PMT1-IN片段与CYC1TT融合片段大小是1135bp, 通过以上PCR鉴定和测序等证明载体PMT1-IN-pYES2构建成功。
2、PMT1基因灭活菌株的构建
制备酵母670感受态细胞,制备方法为:
挑取670单菌落接种于2mL YPD+U培养基(该培养基为向YPD培养基中添加尿嘧啶得 到的尿嘧啶浓度为100μg/mL的培养基)中,在25℃摇床以170r/min培养48h;然后取500μL 培养物,接种于100mL YPD+U培养基中,25℃下以170r/min培养24h,OD600到达1.0;然 后在4℃以6000r/min离心6min,用15mL的冷无菌水重悬菌体;相同条件下再次离心,用 15mL的冷无菌水重悬菌体;4℃下以6000r/min离心6min,用15mL冷的1mol/L山梨醇重 悬菌体;相同条件下再次离心;倒掉上清,用1mL冷的1mol/L山梨醇重悬菌体,体积约1.5mL, 即酵母670感受态细胞,置于冰上备用。
PMT1插入失活载体PMT1-IN-pYES2的电击转化:将PMT1插入失活载体 PMT1-IN-pYES2利用EcoRV酶切线性化后回收,终产物溶于20μL ddH2O,即为线性化质粒; 将85μL的670感受态细胞与线性化质粒混合于电转杯中,冰上放置5min,按毕赤酵母电转 化手册上的条件进行电转化(2kV),电击后立即加入700μL的1M的山梨醇,转移至1.5mL 离心管中,25℃下放置1h,涂布于MD+RH平板(该平板为向MD培养基中添加组氨酸和 精氨酸得到的组氨酸和精氨酸浓度分别为100μg/mL和100μg/mL的固体培养基),置于25℃ 下培养,待平板上长出的克隆提取基因组DNA,利用PMT1基因组外围引物 PMT1-ORF-OUT-5和PMT1-ORF-OUT-3做PCR鉴定,基因组鉴定正确的克隆命名为7b,即 GJK30。
PMT1-ORF-OUT-5:5’-aagacccatgccgaacacgac-3’;
PMT1-ORF-OUT-3:5’-gctctgaggcaccttgggtaa-3’。
利用插入失活载体插入整合的方式整合到毕赤酵母染色体中,由于载体中含有PMT1基 因同源片段,理论上载体的整合属于定点整合,即插入在PMT1基因上,可以通过设计的特 定引物进行鉴定和筛选。利用毕赤酵母的URA3筛选标记,通过压力筛选,鉴定MD+RH平板上长出的克隆。通过PMT1基因外围引物PMT1-ORF-OUT-5和PMT1-ORF-OUT-3做PCR 鉴定。如果PMT1-IN-pYES2载体正确整合到PMT1基因中,利用上面的引物可以得到8.6kb 大小的片段;对照(即酵母X33)为3kb大小的片段(图14);由可知,此PMT1-IN-pYES2 载体正确整合到PMT1基因中,命名为7b,即GJK30。由于插入载体上设计了不同的终止密 码子和终止子,因此,基因整合正确,PMT1基因便不会表达。
十二、GJK30工程菌的糖型结构分析
为了观察最终获得的GJK30的糖型结构是否正确,本发明在获得GJK30工程菌后引入 了一个报告蛋白,同实施例一的方法,以抗Her2抗体为报告蛋白,抗Her2抗体的表达载体 的构建方法、载体转化方法已经在申请专利中公开(见实施例一)。利用该方法将抗Her2抗 体表达载体转入至GJK30宿主菌中,获得了表达抗Her2抗体的GJK30-HL工程菌株。糖型与前期获得的糖型(将Her2抗体表达载体转入至中国专利申请201410668305.X的实施例1构建的GJK08菌株中获得的对照重组工程菌,即与本发明GJK30-HL工程菌株相比,差别之处有三:本发明敲除的β甘露糖转移酶是I-IV,对照重组工程菌仅敲除了β甘露糖转移酶II;本发明还失活了O甘露糖转移酶I,对照重组工程菌没有;本发明导入外源MDSI和MDSII 是导入两次,对照重组工程菌是导入一次)尽管均含有Gal2GlcNAc2Man3GlcNAc2结构,但 两者的比例明显不同,前期Gal2GlcNAc2Man3GlcNAc2结构低于50%(图15中A),而GJK30 工程菌获得的Gal2GlcNAc2Man3GlcNAc2结构所占糖型比例大于60%,且整体糖型更为简单 且均一(图15中B)。据众多文献报道,这种Gal2GlcNAc2Man3GlcNAc2糖型结构会影响蛋 白的生物活性,如抗体的ADCC、CDC活性,因此它所占的比重就直接影响到蛋白的很多特性。通过商业化购买的糖苷酶(New England Biolabs,Beijing)对该糖型进行酶切分析,如 图15中C示,由于Gal2GlcNAc2Man3GlcNAc2(G2)末端没有N-乙酰葡萄糖胺,所以在β-N- 乙酰氨基葡糖苷酶的作用下,Gal2GlcNAc2Man3GlcNAc2结构不会发生改变,而可以在外切 酶β1,4-半乳糖苷酶的作用,剪切去除两个半乳糖,而形成GlcNAc2Man3GlcNAc2(G0)的 结构;而同时在这两个外切酶的作用下,即先后剪切去除了半乳糖Gal和N-乙酰葡萄糖胺 GlcNAc,因而糖基结构变为Man3GlcNAc2结构,证明表达的糖型正确。
<110> 中国人民解放军军事科学院军事医学研究院
<120> 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
<130> GNCLN200956
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 404
<212> PRT
<213> Artificial sequence
<400> 1
Met Ala Lys Ala Asp Gly Ser Leu Leu Tyr Tyr Asn Pro His Asn Pro
1 5 10 15
Pro Arg Arg Tyr Tyr Phe Tyr Met Ala Ile Phe Ala Val Ser Val Ile
20 25 30
Cys Val Leu Tyr Gly Pro Ser Gln Gln Leu Ser Ser Pro Lys Ile Asp
35 40 45
Tyr Asp Pro Leu Thr Leu Arg Ser Leu Asp Leu Lys Thr Leu Glu Ala
50 55 60
Pro Ser Gln Leu Ser Pro Gly Thr Val Glu Asp Asn Leu Arg Arg Gln
65 70 75 80
Leu Glu Phe His Phe Pro Tyr Arg Ser Tyr Glu Pro Phe Pro Gln His
85 90 95
Ile Trp Gln Thr Trp Lys Val Ser Pro Ser Asp Ser Ser Phe Pro Lys
100 105 110
Asn Phe Lys Asp Leu Gly Glu Ser Trp Leu Gln Arg Ser Pro Asn Tyr
115 120 125
Asp His Phe Val Ile Pro Asp Asp Ala Ala Trp Glu Leu Ile His His
130 135 140
Glu Tyr Glu Arg Val Pro Glu Val Leu Glu Ala Phe His Leu Leu Pro
145 150 155 160
Glu Pro Ile Leu Lys Ala Asp Phe Phe Arg Tyr Leu Ile Leu Phe Ala
165 170 175
Arg Gly Gly Leu Tyr Ala Asp Met Asp Thr Met Leu Leu Lys Pro Ile
180 185 190
Glu Ser Trp Leu Thr Phe Asn Glu Thr Ile Gly Gly Val Lys Asn Asn
195 200 205
Ala Gly Leu Val Ile Gly Ile Glu Ala Asp Pro Asp Arg Pro Asp Trp
210 215 220
His Asp Trp Tyr Ala Arg Arg Ile Gln Phe Cys Gln Trp Ala Ile Gln
225 230 235 240
Ser Lys Arg Gly His Pro Ala Leu Arg Glu Leu Ile Val Arg Val Val
245 250 255
Ser Thr Thr Leu Arg Lys Glu Lys Ser Gly Tyr Leu Asn Met Val Glu
260 265 270
Gly Lys Asp Arg Gly Ser Asp Val Met Asp Trp Thr Gly Pro Gly Ile
275 280 285
Phe Thr Asp Thr Leu Phe Asp Tyr Met Thr Asn Val Asn Thr Thr Gly
290 295 300
His Ser Gly Gln Gly Ile Gly Ala Gly Ser Ala Tyr Tyr Asn Ala Leu
305 310 315 320
Ser Leu Glu Glu Arg Asp Ala Leu Ser Ala Arg Pro Asn Gly Glu Met
325 330 335
Leu Lys Glu Lys Val Pro Gly Lys Tyr Ala Gln Gln Val Val Leu Trp
340 345 350
Glu Gln Phe Thr Asn Leu Arg Ser Pro Lys Leu Ile Asp Asp Ile Leu
355 360 365
Ile Leu Pro Ile Thr Ser Phe Ser Pro Gly Ile Gly His Ser Gly Ala
370 375 380
Gly Asp Leu Asn His His Leu Ala Tyr Ile Arg His Thr Phe Glu Gly
385 390 395 400
Ser Trp Lys Asp
<210> 2
<211> 462
<212> PRT
<213> Artificial sequence
<400> 2
Met Ser Thr Asp Ser Asn Leu Gly Tyr Gly Ile Ser Ile Ser Gly Gly
1 5 10 15
Ser Arg Ser Thr Gln Ser Leu Gly Thr Ser Arg Val Thr Pro Ser Arg
20 25 30
Ser Ala Asn His Glu Gly Lys Glu Asn Lys Ala Phe Ser Met Ile Ser
35 40 45
Pro Lys Lys Leu Ile Asn Lys Leu Ser Lys Ser Ser Val Ser Ser Asn
50 55 60
Asn Thr Ser Ser Ser Asn His Asp Ser Phe Val Asp Arg Lys Tyr Lys
65 70 75 80
Ile Glu Ile Glu Asn Ser Phe Ser Asp Arg Ser Val Ser Glu Val Asp
85 90 95
Leu Leu Glu Asp Ser Leu Asp Thr Thr Glu Gly Asp Ser Gly Glu Asn
100 105 110
Leu Val Ser Thr Pro Thr Gln Val Thr Leu Arg Pro Lys Arg Gly Asn
115 120 125
Ser Gln Asp Arg Asn Glu Asn Arg Val Leu Lys Glu Lys Glu Thr Ala
130 135 140
Val Arg Glu Ser Gln Arg His Thr Gly Phe Phe Thr Glu Ser Met Leu
145 150 155 160
Ser Pro Ser Asp Gly Ser Arg Gln Asp Thr Ser Asp Ser Pro Gly Ser
165 170 175
Ile Ser Ile Pro Thr Ala Glu Leu Ser Lys Lys Asn Leu Ser Asp Val
180 185 190
Ser Lys Ser Thr Ser Glu Asn Ser His Asn Arg Lys Trp Glu Ala Arg
195 200 205
Ser Ser Leu Leu Pro Glu Asn Leu Ser Ser Ile His Leu Asp Asp Ser
210 215 220
Pro Ile Glu Ile Tyr Glu Asp Ala Glu Glu Ile Ile Asp Glu Thr Val
225 230 235 240
Glu Glu Pro Arg Ser Ser Ile Pro Leu Gln Asn Glu Trp Glu Met Glu
245 250 255
Asp Thr Ile Leu Glu Gly Arg Leu Val Gln Ser Ala Ser Asp Pro Val
260 265 270
Ile Thr Ser Asn Asp Ile Ser Lys Glu Leu Arg Lys Ser Ile Ser Thr
275 280 285
Pro Ala Leu Thr His Ser Asp Leu Val Asp Phe Arg Lys Val Ile Pro
290 295 300
Gly Ser Ser His Tyr His Val Phe Thr Asp Pro Lys Ser Pro Phe Thr
305 310 315 320
Glu Asp Pro Ser Gln Leu Ala Tyr His Lys Ile Arg Asp Arg Asn Phe
325 330 335
Asp Ala His Tyr Ser Thr Asp Pro Ile Arg Leu Ser Ser Gly Ser Ser
340 345 350
Ser Glu Gly Ser Asp Glu Lys Asn Leu Leu Leu Gly Ser Arg Lys Pro
355 360 365
Ser Asp Pro Tyr Arg Leu Pro Tyr Glu Asp Glu Asp Gly Tyr Arg Phe
370 375 380
Trp Thr Lys Thr Pro Leu Asn Arg Glu Cys Pro Lys Arg Val Ala Leu
385 390 395 400
Trp Leu Leu Val Gly Ala Ile Leu Ala Pro Pro Val Trp Ile Met Met
405 410 415
Tyr Val Gly Phe Leu Asp Ser Ser Val Gly Arg Leu Pro Pro Lys Tyr
420 425 430
Arg Val Ile Ser Gly Val Leu Ala Leu Ser Met Ile Ile Leu Thr Ala
435 440 445
Met Gly Ile Ala Val Gly Phe Ala Tyr Gly Leu Asn Asn Arg
450 455 460
<210> 3
<211> 652
<212> PRT
<213> Artificial sequence
<400> 3
Met Phe Lys Glu Thr Ser Lys Asn Leu Phe Gly Ser Ile Asn Thr Phe
1 5 10 15
Asn Thr Val Glu Tyr Val Met Tyr Met Met Leu Leu Leu Thr Ala Tyr
20 25 30
Phe Leu Asn His Leu Leu His Ser Leu Asp Asn Ile Asn His Leu Val
35 40 45
Glu Ser Asp Val Asn Tyr Gln Leu Leu Gln Arg Val Thr Asn Lys Val
50 55 60
Lys Leu Phe Asp Glu Glu Ala Val Leu Pro Phe Ala Lys Asn Leu Asn
65 70 75 80
Arg Arg Thr Glu Arg Phe Asp Pro Arg Leu Pro Val Ala Ala Tyr Leu
85 90 95
Arg Ser Leu Gln Asp Gln Tyr Ser Glu Leu Pro Gln Gly Thr Asp Leu
100 105 110
Asn Asp Ile Pro Pro Leu Glu Val Ser Phe His Trp Asp Asp Trp Leu
115 120 125
Ser Leu Gly Ile Ala Ser Thr Phe Trp Asp Ala Phe Asp Asn Tyr Asn
130 135 140
Lys Arg Gln Gly Glu Asn Ala Ile Ser Tyr Glu Gln Leu Gln Ala Ile
145 150 155 160
Leu Val Asn Asp Leu Glu Asp Phe Ser Pro Tyr Thr Ala His Ile Leu
165 170 175
His Ser Asn Val Glu Val Tyr Lys Tyr Arg Thr Ile Pro Gln Lys Ile
180 185 190
Val Tyr Met Ser Asn Lys Gly Tyr Phe Glu Leu Leu Val Thr Glu Lys
195 200 205
Glu Lys Leu Ser Asn Glu Gly Leu Trp Ser Ile Phe His Gln Lys Gln
210 215 220
Gly Gly Leu Asn Glu Phe Ser Ser Leu Asn Leu Ile Glu Glu Val Asp
225 230 235 240
Ala Leu Asp Glu Ile Tyr Asp Ser Lys Gly Leu Pro Ala Trp Asp Pro
245 250 255
Pro Phe Pro Glu Glu Leu Asp Ala Ser Asp Glu Asp Leu Pro Phe Asn
260 265 270
Ala Thr Glu Glu Leu Ala Lys Val Glu Gln Ile Lys Glu Pro Lys Leu
275 280 285
Glu Asp Ile Phe Tyr Gln Glu Gly Leu Gln His Gly Ile Gln Thr Leu
290 295 300
Pro Ser Asp Ala Ser Val Tyr Phe Pro Val Asn Tyr Val Glu Asn Asp
305 310 315 320
Pro Gly Leu Gln Ser His His Leu His Phe Pro Phe Phe Ser Gly Met
325 330 335
Val Leu Pro Arg Glu Ile His Ser Ser Val His His Met Asn Lys Ala
340 345 350
Phe Phe Leu Phe Ala Arg Gln His Gly Tyr Val Val Trp Phe Phe Tyr
355 360 365
Gly Asn Leu Ile Gly Trp Tyr Tyr Asn Gly Asn Asn His Pro Trp Asp
370 375 380
Ser Asp Ile Asp Ala Ile Met Pro Met Ala Glu Met Ala Arg Met Ala
385 390 395 400
His His His Asn Asn Thr Leu Ile Ile Glu Asn Pro His Asp Gly Tyr
405 410 415
Gly Thr Tyr Leu Leu Thr Ile Ser Pro Trp Phe Thr Lys Lys Thr Arg
420 425 430
Gly Gly Asn His Ile Asp Gly Arg Phe Val Asp Val Lys Arg Gly Thr
435 440 445
Tyr Ile Asp Leu Ser Ala Ile Ser Ala Met His Gly Ile Tyr Pro Asp
450 455 460
Trp Val Arg Asp Gly Val Lys Glu Asn Pro Lys Asn Leu Ala Leu Ala
465 470 475 480
Asp Lys Asn Gly Asn Trp Tyr Leu Thr Arg Asp Ile Leu Pro Leu Arg
485 490 495
Arg Thr Ile Phe Glu Gly Ser Arg Ser Tyr Thr Val Lys Asp Ile Glu
500 505 510
Asp Thr Leu Leu Arg Asn Tyr Gly Asp Lys Val Leu Ile Asn Thr Glu
515 520 525
Leu Ala Asp His Glu Trp His Asp Asp Trp Lys Met Trp Val Gln Lys
530 535 540
Lys Lys Tyr Cys Thr Tyr Glu Glu Phe Glu Asp Tyr Leu Ser Ala His
545 550 555 560
Gly Gly Val Glu Tyr Asp Glu Asp Gly Val Leu Thr Leu Glu Gly Ala
565 570 575
Cys Gly Phe Glu Glu Val Arg Gln Asp Trp Ile Ile Thr Arg Glu Ser
580 585 590
Val Asn Leu His Met Lys Glu Trp Glu Ala Ile Gln Arg Asn Glu Ser
595 600 605
Thr Thr Glu Tyr Thr Ala Lys Asp Leu Pro Arg Tyr Arg Pro Asp Ser
610 615 620
Phe Lys Asn Leu Leu Asp Gly Val Ser Asn His Gly Asn Gly Asn Val
625 630 635 640
Gly Lys Ile Glu His Val Lys Leu Glu His Asn Asp
645 650
<210> 4
<211> 594
<212> PRT
<213> Artificial sequence
<400> 4
Met Arg Ile Arg Ser Asn Val Leu Leu Leu Ser Thr Ala Gly Ala Leu
1 5 10 15
Ala Leu Val Trp Phe Ala Val Val Phe Ser Trp Asp Asp Lys Ser Ile
20 25 30
Phe Gly Ile Pro Thr Pro Gly His Ala Val Ala Ser Ala Tyr Asp Ser
35 40 45
Ser Val Thr Leu Gly Thr Phe Asn Asp Met Glu Val Asp Ser Tyr Val
50 55 60
Thr Asn Ile Tyr Asp Asn Ala Pro Val Leu Gly Cys Tyr Asp Leu Ser
65 70 75 80
Tyr His Gly Leu Leu Lys Val Ser Pro Lys His Glu Ile Leu Cys Asp
85 90 95
Met Lys Phe Ile Arg Ala Arg Val Leu Glu Thr Glu Ala Tyr Ala Ala
100 105 110
Leu Lys Asp Leu Glu His Lys Lys Leu Thr Glu Glu Glu Lys Ile Glu
115 120 125
Lys His Trp Phe Thr Phe Tyr Gly Ser Ser Val Phe Leu Pro Asp His
130 135 140
Asp Val His Tyr Leu Val Arg Arg Val Val Phe Ser Gly Glu Gly Lys
145 150 155 160
Ala Asn Arg Pro Ile Thr Ser Ile Leu Val Ala Gln Ile Tyr Asp Lys
165 170 175
Asn Trp Asn Glu Leu Asn Gly His Phe Leu Asn Val Leu Asn Pro Asn
180 185 190
Thr Gly Lys Leu Gln His His Ala Phe Pro Gln Val Leu Pro Ile Ala
195 200 205
Val Asn Trp Asp Arg Asn Ser Lys Tyr Arg Gly Gln Glu Asp Pro Arg
210 215 220
Val Val Leu Arg Arg Gly Arg Phe Gly Pro Asp Pro Leu Val Met Phe
225 230 235 240
Asn Thr Leu Thr Gln Asn Asn Lys Leu Arg Arg Leu Phe Thr Ile Ser
245 250 255
Pro Phe Asp Gln Tyr Lys Thr Val Met Tyr Arg Thr Asn Ala Phe Lys
260 265 270
Met Gln Thr Thr Glu Lys Asn Trp Val Pro Phe Phe Leu Lys Asp Asp
275 280 285
Gln Glu Ser Val His Phe Val Tyr Ser Phe Asn Pro Leu Arg Val Leu
290 295 300
Asn Cys Ser Leu Asp Asn Gly Ala Cys Asp Val Leu Phe Glu Leu Pro
305 310 315 320
His Asp Phe Gly Met Ser Ser Glu Leu Arg Gly Ala Thr Pro Met Leu
325 330 335
Asn Leu Pro Gln Ala Ile Pro Met Ala Asp Asp Lys Glu Ile Trp Val
340 345 350
Ser Phe Pro Arg Thr Arg Ile Ser Asp Cys Gly Cys Ser Glu Thr Met
355 360 365
Tyr Arg Pro Met Leu Met Leu Phe Val Arg Glu Gly Thr Asn Phe Phe
370 375 380
Ala Glu Leu Leu Ser Ser Ser Ile Asp Phe Gly Leu Glu Val Ile Pro
385 390 395 400
Tyr Thr Gly Asp Gly Leu Pro Cys Ser Ser Gly Gln Ser Val Leu Ile
405 410 415
Pro Asn Ser Ile Asp Asn Trp Glu Val Thr Gly Ser Asn Gly Glu Asp
420 425 430
Ile Leu Ser Leu Thr Phe Ser Glu Ala Asp Lys Ser Thr Ser Val Val
435 440 445
His Ile Arg Gly Leu Tyr Lys Tyr Leu Ser Glu Leu Asp Gly Tyr Gly
450 455 460
Gly Pro Glu Ala Glu Asp Glu His Asn Phe Gln Arg Ile Leu Ser Asp
465 470 475 480
Leu His Phe Asp Gly Lys Lys Thr Ile Glu Asn Phe Lys Lys Val Gln
485 490 495
Ser Cys Ala Leu Asp Ala Ala Lys Ala Tyr Cys Lys Glu Tyr Gly Val
500 505 510
Thr Arg Gly Glu Glu Asp Arg Leu Lys Asn Lys Glu Lys Glu Arg Lys
515 520 525
Ile Glu Glu Lys Arg Lys Lys Glu Glu Glu Arg Lys Lys Lys Glu Glu
530 535 540
Glu Lys Lys Lys Lys Glu Glu Glu Glu Lys Lys Lys Lys Glu Glu Glu
545 550 555 560
Glu Glu Glu Glu Lys Arg Leu Lys Glu Leu Lys Lys Lys Leu Lys Glu
565 570 575
Leu Gln Glu Glu Leu Glu Lys Gln Lys Asp Glu Val Lys Asp Thr Lys
580 585 590
Ala Lys
<210> 5
<211> 644
<212> PRT
<213> Artificial sequence
<400> 5
Met Arg Thr Arg Leu Asn Phe Leu Leu Leu Cys Ile Ala Ser Val Leu
1 5 10 15
Ser Val Ile Trp Ile Gly Val Leu Leu Thr Trp Asn Asp Asn Asn Leu
20 25 30
Gly Gly Ile Ser Leu Asn Gly Gly Lys Asp Ser Ala Tyr Asp Asp Leu
35 40 45
Leu Ser Leu Gly Ser Phe Asn Asp Met Glu Val Asp Ser Tyr Val Thr
50 55 60
Asn Ile Tyr Asp Asn Ala Pro Val Leu Gly Cys Thr Asp Leu Ser Tyr
65 70 75 80
His Gly Leu Leu Lys Val Thr Pro Lys His Asp Leu Ala Cys Asp Leu
85 90 95
Glu Phe Ile Arg Ala Gln Ile Leu Asp Ile Asp Val Tyr Ser Ala Ile
100 105 110
Lys Asp Leu Glu Asp Lys Ala Leu Thr Val Lys Gln Lys Val Glu Lys
115 120 125
His Trp Phe Thr Phe Tyr Gly Ser Ser Val Phe Leu Pro Glu His Asp
130 135 140
Val His Tyr Leu Val Arg Arg Val Ile Phe Ser Ala Glu Gly Lys Ala
145 150 155 160
Asn Ser Pro Val Thr Ser Ile Ile Val Ala Gln Ile Tyr Asp Lys Asn
165 170 175
Trp Asn Glu Leu Asn Gly His Phe Leu Asp Ile Leu Asn Pro Asn Thr
180 185 190
Gly Lys Val Gln His Asn Thr Phe Pro Gln Val Leu Pro Ile Ala Thr
195 200 205
Asn Phe Val Lys Gly Lys Lys Phe Arg Gly Ala Glu Asp Pro Arg Val
210 215 220
Val Leu Arg Lys Gly Arg Phe Gly Pro Asp Pro Leu Val Met Phe Asn
225 230 235 240
Ser Leu Thr Gln Asp Asn Lys Arg Arg Arg Ile Phe Thr Ile Ser Pro
245 250 255
Phe Asp Gln Phe Lys Thr Val Met Tyr Asp Ile Lys Asp Tyr Glu Met
260 265 270
Pro Arg Tyr Glu Lys Asn Trp Val Pro Phe Phe Leu Lys Asp Asn Gln
275 280 285
Glu Ala Val His Phe Val Tyr Ser Phe Asn Pro Leu Arg Val Leu Lys
290 295 300
Cys Ser Leu Asp Asp Gly Ser Cys Asp Ile Val Phe Glu Ile Pro Lys
305 310 315 320
Val Asp Ser Met Ser Ser Glu Leu Arg Gly Ala Thr Pro Met Ile Asn
325 330 335
Leu Pro Gln Ala Ile Pro Met Ala Lys Asp Lys Glu Ile Trp Val Ser
340 345 350
Phe Pro Arg Thr Arg Ile Ala Asn Cys Gly Cys Ser Arg Thr Thr Tyr
355 360 365
Arg Pro Met Leu Met Leu Phe Val Arg Glu Gly Ser Asn Phe Phe Val
370 375 380
Glu Leu Leu Ser Thr Ser Leu Asp Phe Gly Leu Glu Val Leu Pro Tyr
385 390 395 400
Ser Gly Asn Gly Leu Pro Cys Ser Ala Asp His Ser Val Leu Ile Pro
405 410 415
Asn Ser Ile Asp Asn Trp Glu Val Val Asp Ser Asn Gly Asp Asp Ile
420 425 430
Leu Thr Leu Ser Phe Ser Glu Ala Asp Lys Ser Thr Ser Val Ile His
435 440 445
Ile Arg Gly Leu Tyr Asn Tyr Leu Ser Glu Leu Asp Gly Tyr Gln Gly
450 455 460
Pro Glu Ala Glu Asp Glu His Asn Phe Gln Arg Ile Leu Ser Asp Leu
465 470 475 480
His Phe Asp Asn Lys Thr Thr Val Asn Asn Phe Ile Lys Val Gln Ser
485 490 495
Cys Ala Leu Asp Ala Ala Lys Gly Tyr Cys Lys Glu Tyr Gly Leu Thr
500 505 510
Arg Gly Glu Ala Glu Arg Arg Arg Arg Val Ala Glu Glu Arg Lys Lys
515 520 525
Lys Glu Lys Glu Glu Glu Glu Lys Lys Lys Lys Lys Glu Lys Glu Glu
530 535 540
Glu Glu Lys Lys Arg Ile Glu Glu Glu Lys Lys Lys Ile Glu Glu Lys
545 550 555 560
Glu Arg Lys Glu Lys Glu Lys Glu Glu Ala Glu Arg Lys Lys Leu Gln
565 570 575
Glu Met Lys Lys Lys Leu Glu Glu Ile Thr Glu Lys Leu Glu Lys Gly
580 585 590
Gln Arg Asn Lys Glu Ile Asp Pro Lys Glu Lys Gln Arg Glu Glu Glu
595 600 605
Glu Arg Lys Glu Arg Val Arg Lys Ile Ala Glu Lys Gln Arg Lys Glu
610 615 620
Ala Glu Lys Lys Glu Ala Glu Lys Lys Ala Asn Asp Lys Lys Asp Leu
625 630 635 640
Lys Ile Arg Gln
<210> 6
<211> 488
<212> PRT
<213> Artificial sequence
<400> 6
Met Tyr His Leu Ala Pro Arg Lys Lys Leu Leu Ile Trp Gly Gly Ser
1 5 10 15
Leu Gly Phe Val Leu Leu Leu Leu Ile Val Ala Ser Ser His Gln Arg
20 25 30
Ile Arg Ser Thr Ile Leu His Arg Thr Pro Ile Ser Thr Leu Pro Val
35 40 45
Ile Ser Gln Glu Val Ile Thr Ala Asp Tyr His Pro Thr Leu Leu Thr
50 55 60
Gly Phe Ile Pro Thr Asp Ser Asp Asp Ser Asp Cys Ala Asp Phe Ser
65 70 75 80
Pro Ser Gly Val Ile Tyr Ser Thr Asp Lys Leu Val Leu His Asp Ser
85 90 95
Leu Lys Asp Ile Arg Asp Ser Leu Leu Lys Thr Gln Tyr Lys Asp Leu
100 105 110
Val Thr Leu Glu Asp Glu Glu Lys Met Asn Ile Asp Asp Ile Leu Lys
115 120 125
Arg Trp Tyr Thr Leu Ser Gly Ser Ser Val Trp Ile Pro Gly Met Lys
130 135 140
Ala His Leu Val Val Ser Arg Val Met Tyr Leu Gly Thr Asn Gly Arg
145 150 155 160
Ser Asp Pro Leu Val Ser Phe Val Arg Val Gln Leu Phe Asp Pro Asp
165 170 175
Phe Asn Glu Leu Lys Asp Ile Ala Leu Lys Phe Ser Asp Lys Pro Asp
180 185 190
Gly Thr Val Ile Phe Pro Tyr Ile Leu Pro Val Asp Ile Pro Arg Glu
195 200 205
Gly Ser Arg Trp Leu Gly Pro Glu Asp Ala Lys Ile Ala Val Asn Pro
210 215 220
Glu Thr Pro Asp Asp Pro Ile Val Ile Phe Asn Met Gln Asn Ser Val
225 230 235 240
Asn Arg Ala Met Tyr Gly Phe Tyr Pro Phe Arg Pro Glu Asn Lys Gln
245 250 255
Val Leu Phe Ser Ile Lys Asp Glu Glu Pro Arg Lys Lys Glu Lys Asn
260 265 270
Trp Thr Pro Phe Phe Val Pro Gly Ser Pro Thr Thr Val Asn Phe Val
275 280 285
Tyr Asp Leu Gln Lys Leu Thr Ile Leu Lys Cys Ser Ile Ile Thr Gly
290 295 300
Ile Cys Glu Lys Glu Phe Val Ser Gly Asp Asp Gly Gln Asn His Gly
305 310 315 320
Ile Gly Ile Phe Arg Gly Gly Ser Asn Leu Val Pro Phe Pro Thr Ser
325 330 335
Phe Thr Asp Lys Asp Val Trp Val Gly Phe Pro Lys Thr His Met Glu
340 345 350
Ser Cys Gly Cys Ser Ser His Ile Tyr Arg Pro Tyr Leu Met Val Leu
355 360 365
Val Arg Lys Gly Asp Phe Tyr Tyr Lys Ala Phe Val Ser Thr Pro Leu
370 375 380
Asp Phe Gly Ile Asp Val Arg Ser Trp Glu Ser Ala Glu Ser Thr Ser
385 390 395 400
Cys Gln Thr Ala Lys Asn Val Leu Ala Val Asn Ser Ile Ser Asn Trp
405 410 415
Asp Leu Leu Asp Asp Gly Leu Asp Lys Asp Tyr Met Thr Ile Thr Leu
420 425 430
Ser Glu Ala Asp Val Val Asn Ser Val Leu Arg Val Arg Gly Ile Ala
435 440 445
Lys Phe Val Asp Asn Leu Thr Met Asp Asp Gly Ser Thr Thr Leu Ser
450 455 460
Thr Ser Asn Lys Ile Asp Glu Cys Ala Thr Thr Gly Ser Lys Gln Tyr
465 470 475 480
Cys Gln Arg Tyr Gly Glu Leu His
485
<210> 7
<211> 652
<212> PRT
<213> Artificial sequence
<400> 7
Met Val Asp Leu Phe Gln Trp Leu Lys Phe Tyr Ser Met Arg Arg Leu
1 5 10 15
Gly Gln Val Ala Ile Thr Leu Val Leu Leu Asn Leu Phe Val Phe Leu
20 25 30
Gly Tyr Lys Phe Thr Pro Ser Thr Val Ile Gly Ser Pro Ser Trp Glu
35 40 45
Pro Ala Val Val Pro Thr Val Phe Asn Glu Ser Tyr Leu Asp Ser Leu
50 55 60
Gln Phe Thr Asp Ile Asn Val Asp Ser Phe Leu Ser Asp Thr Asn Gly
65 70 75 80
Arg Ile Ser Val Thr Cys Asp Ser Leu Ala Tyr Lys Gly Leu Val Lys
85 90 95
Thr Ser Lys Lys Lys Glu Leu Asp Cys Asp Met Ala Tyr Ile Arg Arg
100 105 110
Lys Ile Phe Ser Ser Glu Glu Tyr Gly Val Leu Ala Asp Leu Glu Ala
115 120 125
Gln Asp Ile Thr Glu Glu Gln Arg Ile Lys Lys His Trp Phe Thr Phe
130 135 140
Tyr Gly Ser Ser Val Tyr Leu Pro Glu His Glu Val His Tyr Leu Val
145 150 155 160
Arg Arg Val Leu Phe Ser Lys Val Gly Arg Ala Asp Thr Pro Val Ile
165 170 175
Ser Leu Leu Val Ala Gln Leu Tyr Asp Lys Asp Trp Asn Glu Leu Thr
180 185 190
Pro His Thr Leu Glu Ile Val Asn Pro Ala Thr Gly Asn Val Thr Pro
195 200 205
Gln Thr Phe Pro Gln Leu Ile His Val Pro Ile Glu Trp Ser Val Asp
210 215 220
Asp Lys Trp Lys Gly Thr Glu Asp Pro Arg Val Phe Leu Lys Pro Ser
225 230 235 240
Lys Thr Gly Val Ser Glu Pro Ile Val Leu Phe Asn Leu Gln Ser Ser
245 250 255
Leu Cys Asp Gly Lys Arg Gly Met Phe Val Thr Ser Pro Phe Arg Ser
260 265 270
Asp Lys Val Asn Leu Leu Asp Ile Glu Asp Lys Glu Arg Pro Asn Ser
275 280 285
Glu Lys Asn Trp Ser Pro Phe Phe Leu Asp Asp Val Glu Val Ser Lys
290 295 300
Tyr Ser Thr Gly Tyr Val His Phe Val Tyr Ser Phe Asn Pro Leu Lys
305 310 315 320
Val Ile Lys Cys Ser Leu Asp Thr Gly Ala Cys Arg Met Ile Tyr Glu
325 330 335
Ser Pro Glu Glu Gly Arg Phe Gly Ser Glu Leu Arg Gly Ala Thr Pro
340 345 350
Met Val Lys Leu Pro Val His Leu Ser Leu Pro Lys Gly Lys Glu Val
355 360 365
Trp Val Ala Phe Pro Arg Thr Arg Leu Arg Asp Cys Gly Cys Ser Arg
370 375 380
Thr Thr Tyr Arg Pro Val Leu Thr Leu Phe Val Lys Glu Gly Asn Lys
385 390 395 400
Phe Tyr Thr Glu Leu Ile Ser Ser Ser Ile Asp Phe His Ile Asp Val
405 410 415
Leu Ser Tyr Asp Ala Lys Gly Glu Ser Cys Ser Gly Ser Ile Ser Val
420 425 430
Leu Ile Pro Asn Gly Ile Asp Ser Trp Asp Val Ser Lys Lys Gln Gly
435 440 445
Gly Lys Ser Asp Ile Leu Thr Leu Thr Leu Ser Glu Ala Asp Arg Asn
450 455 460
Thr Val Val Val His Val Lys Gly Leu Leu Asp Tyr Leu Leu Val Leu
465 470 475 480
Asn Gly Glu Gly Pro Ile His Asp Ser His Ser Phe Lys Asn Val Leu
485 490 495
Ser Thr Asn His Phe Lys Ser Asp Thr Thr Leu Leu Asn Ser Val Lys
500 505 510
Ala Ala Glu Cys Ala Ile Phe Ser Ser Arg Asp Tyr Cys Lys Lys Tyr
515 520 525
Gly Glu Thr Arg Gly Glu Pro Ala Arg Tyr Ala Lys Gln Met Glu Asn
530 535 540
Glu Arg Lys Glu Lys Glu Lys Lys Glu Lys Glu Ala Lys Glu Lys Leu
545 550 555 560
Glu Ala Glu Lys Ala Glu Met Glu Glu Ala Val Arg Lys Ala Gln Glu
565 570 575
Ala Ile Ala Gln Lys Glu Arg Glu Lys Glu Glu Ala Glu Gln Glu Lys
580 585 590
Lys Ala Gln Gln Glu Ala Lys Glu Lys Glu Ala Glu Glu Lys Ala Ala
595 600 605
Lys Glu Lys Glu Ala Lys Glu Asn Glu Ala Lys Lys Lys Ile Ile Val
610 615 620
Glu Lys Leu Ala Lys Glu Gln Glu Glu Ala Glu Lys Leu Glu Ala Lys
625 630 635 640
Lys Lys Leu Tyr Gln Leu Gln Glu Glu Glu Arg Ser
645 650
<210> 8
<211> 789
<212> PRT
<213> Artificial sequence
<400> 8
Met Cys Gln Ile Phe Leu Pro Gln Asn Val Thr Arg Cys Ser Val Ser
1 5 10 15
Leu Leu Thr Met Ser Lys Thr Ser Pro Gln Glu Val Pro Glu Asn Thr
20 25 30
Thr Glu Leu Lys Ile Ser Lys Gly Glu Leu Arg Pro Phe Ile Val Thr
35 40 45
Ser Pro Ser Pro Gln Leu Ser Lys Ser Arg Ser Val Thr Ser Thr Lys
50 55 60
Glu Lys Leu Ile Leu Ala Ser Leu Phe Ile Phe Ala Met Val Ile Arg
65 70 75 80
Phe His Asn Val Ala His Pro Asp Ser Val Val Phe Asp Glu Val His
85 90 95
Phe Gly Gly Phe Ala Arg Lys Tyr Ile Leu Gly Thr Phe Phe Met Asp
100 105 110
Val His Pro Pro Leu Ala Lys Leu Leu Phe Ala Gly Val Gly Ser Leu
115 120 125
Gly Gly Tyr Asp Gly Glu Phe Glu Phe Lys Lys Ile Gly Asp Glu Phe
130 135 140
Pro Glu Asn Val Pro Tyr Val Leu Met Arg Tyr Leu Pro Ser Gly Met
145 150 155 160
Gly Val Gly Thr Cys Ile Met Leu Tyr Leu Thr Leu Arg Ala Ser Gly
165 170 175
Cys Gln Pro Ile Val Cys Cys Ser Asp Asn Arg Ser Leu Ile Ile Glu
180 185 190
Asn Ala Asn Val Thr Ile Ser Arg Phe Ile Leu Leu Asp Ser Pro Met
195 200 205
Leu Phe Phe Ile Ala Ser Thr Val Tyr Ser Phe Lys Lys Phe Gln Ile
210 215 220
Gln Glu Pro Phe Thr Phe Gln Trp Tyr Lys Thr Leu Ile Ala Thr Gly
225 230 235 240
Val Ser Leu Gly Leu Ala Ala Ser Ser Lys Trp Val Gly Leu Phe Thr
245 250 255
Val Ala Trp Ile Gly Leu Ile Thr Ile Trp Asp Leu Trp Phe Ile Ile
260 265 270
Gly Asp Leu Thr Val Ser Val Lys Lys Ile Phe Gly His Phe Ile Thr
275 280 285
Arg Ala Val Ala Phe Leu Val Val Pro Thr Leu Ile Tyr Leu Thr Phe
290 295 300
Phe Ala Ile His Leu Gln Val Leu Thr Lys Glu Gly Asp Gly Gly Ala
305 310 315 320
Phe Met Ser Ser Val Phe Arg Ser Thr Leu Glu Gly Asn Ala Val Pro
325 330 335
Lys Gln Ser Leu Ala Asn Val Gly Leu Gly Ser Leu Val Thr Ile Arg
340 345 350
His Leu Asn Thr Arg Gly Gly Tyr Leu His Ser His Asn His Leu Tyr
355 360 365
Glu Gly Gly Ser Gly Gln Gln Gln Val Thr Leu Tyr Pro His Ile Asp
370 375 380
Ser Asn Asn Gln Trp Ile Val Gln Asp Tyr Asn Ala Thr Glu Glu Pro
385 390 395 400
Thr Glu Phe Val Pro Leu Lys Asp Gly Val Lys Ile Arg Leu Asn His
405 410 415
Lys Leu Thr Ser Arg Arg Leu His Ser His Asn Leu Arg Pro Pro Val
420 425 430
Thr Glu Gln Asp Trp Gln Asn Glu Val Ser Ala Tyr Gly His Glu Gly
435 440 445
Phe Gly Gly Asp Ala Asn Asp Asp Phe Val Val Glu Ile Ala Lys Asp
450 455 460
Leu Ser Thr Thr Glu Glu Ala Lys Glu Asn Val Arg Ala Ile Gln Thr
465 470 475 480
Val Phe Arg Leu Arg His Ala Met Thr Gly Cys Tyr Leu Phe Ser His
485 490 495
Glu Val Lys Leu Pro Lys Trp Ala Tyr Glu Gln Gln Glu Val Thr Cys
500 505 510
Ala Thr Gln Gly Ile Lys Pro Leu Ser Tyr Trp Tyr Val Glu Thr Asn
515 520 525
Glu Asn Pro Phe Leu Asp Lys Glu Val Asp Glu Ile Val Ser Tyr Pro
530 535 540
Val Pro Thr Phe Phe Gln Lys Val Ala Glu Leu His Ala Arg Met Trp
545 550 555 560
Lys Ile Asn Lys Gly Leu Thr Asp His His Val Tyr Glu Ser Ser Pro
565 570 575
Asp Ser Trp Pro Phe Leu Leu Arg Gly Ile Ser Tyr Trp Ser Lys Asn
580 585 590
His Ser Gln Ile Tyr Phe Ile Gly Asn Ala Val Thr Trp Trp Thr Val
595 600 605
Thr Ala Ser Ile Ala Leu Phe Ser Val Phe Leu Val Phe Ser Ile Leu
610 615 620
Arg Trp Gln Arg Gly Phe Gly Phe Ser Val Asp Pro Thr Val Phe Asn
625 630 635 640
Phe Asn Val Gln Met Leu His Tyr Ile Leu Gly Trp Val Leu His Tyr
645 650 655
Leu Pro Ser Phe Leu Met Ala Arg Gln Leu Phe Leu His His Tyr Leu
660 665 670
Pro Ser Leu Tyr Phe Gly Ile Leu Ala Leu Gly His Val Phe Glu Ile
675 680 685
Ile His Ser Tyr Val Phe Lys Asn Lys Gln Val Val Ser Tyr Ser Ile
690 695 700
Phe Val Leu Phe Phe Ala Val Ala Leu Ser Phe Phe Gln Arg Tyr Ser
705 710 715 720
Pro Leu Ile Tyr Ala Gly Arg Trp Thr Lys Asp Gln Cys Asn Glu Ser
725 730 735
Lys Ile Leu Lys Trp Asp Phe Asp Cys Asn Thr Phe Pro Ser His Thr
740 745 750
Ser Gln Tyr Glu Ile Trp Ala Ser Pro Val Gln Thr Ser Thr Pro Lys
755 760 765
Glu Gly Thr His Ser Glu Ser Thr Val Gly Glu Pro Asp Val Glu Lys
770 775 780
Leu Gly Glu Thr Val
785
<210> 9
<211> 512
<212> PRT
<213> Artificial sequence
<400> 9
Glu Ala Glu Ala Tyr Pro Lys Pro Gly Ala Thr Lys Arg Gly Ser Pro
1 5 10 15
Asn Pro Thr Arg Ala Ala Ala Val Lys Ala Ala Phe Gln Thr Ser Trp
20 25 30
Asn Ala Tyr His His Phe Ala Phe Pro His Asp Asp Leu His Pro Val
35 40 45
Ser Asn Ser Phe Asp Asp Glu Arg Asn Gly Trp Gly Ser Ser Ala Ile
50 55 60
Asp Gly Leu Asp Thr Ala Ile Leu Met Gly Asp Ala Asp Ile Val Asn
65 70 75 80
Thr Ile Leu Gln Tyr Val Pro Gln Ile Asn Phe Thr Thr Thr Ala Val
85 90 95
Ala Asn Gln Gly Ile Ser Val Phe Glu Thr Asn Ile Arg Tyr Leu Gly
100 105 110
Gly Leu Leu Ser Ala Tyr Asp Leu Leu Arg Gly Pro Phe Ser Ser Leu
115 120 125
Ala Thr Asn Gln Thr Leu Val Asn Ser Leu Leu Arg Gln Ala Gln Thr
130 135 140
Leu Ala Asn Gly Leu Lys Val Ala Phe Thr Thr Pro Ser Gly Val Pro
145 150 155 160
Asp Pro Thr Val Phe Phe Asn Pro Thr Val Arg Arg Ser Gly Ala Ser
165 170 175
Ser Asn Asn Val Ala Glu Ile Gly Ser Leu Val Leu Glu Trp Thr Arg
180 185 190
Leu Ser Asp Leu Thr Gly Asn Pro Gln Tyr Ala Gln Leu Ala Gln Lys
195 200 205
Gly Glu Ser Tyr Leu Leu Asn Pro Lys Gly Ser Pro Glu Ala Trp Pro
210 215 220
Gly Leu Ile Gly Thr Phe Val Ser Thr Ser Asn Gly Thr Phe Gln Asp
225 230 235 240
Ser Ser Gly Ser Trp Ser Gly Leu Met Asp Ser Phe Tyr Glu Tyr Leu
245 250 255
Ile Lys Met Tyr Leu Tyr Asp Pro Val Ala Phe Ala His Tyr Lys Asp
260 265 270
Arg Trp Val Leu Ala Ala Asp Ser Thr Ile Ala His Leu Ala Ser His
275 280 285
Pro Ser Thr Arg Lys Asp Leu Thr Phe Leu Ser Ser Tyr Asn Gly Gln
290 295 300
Ser Thr Ser Pro Asn Ser Gly His Leu Ala Ser Phe Ala Gly Gly Asn
305 310 315 320
Phe Ile Leu Gly Gly Ile Leu Leu Asn Glu Gln Lys Tyr Ile Asp Phe
325 330 335
Gly Ile Lys Leu Ala Ser Ser Tyr Phe Ala Thr Tyr Asn Gln Thr Ala
340 345 350
Ser Gly Ile Gly Pro Glu Gly Phe Ala Trp Val Asp Ser Val Thr Gly
355 360 365
Ala Gly Gly Ser Pro Pro Ser Ser Gln Ser Gly Phe Tyr Ser Ser Ala
370 375 380
Gly Phe Trp Val Thr Ala Pro Tyr Tyr Ile Leu Arg Pro Glu Thr Leu
385 390 395 400
Glu Ser Leu Tyr Tyr Ala Tyr Arg Val Thr Gly Asp Ser Lys Trp Gln
405 410 415
Asp Leu Ala Trp Glu Ala Phe Ser Ala Ile Glu Asp Ala Cys Arg Ala
420 425 430
Gly Ser Ala Tyr Ser Ser Ile Asn Asp Val Thr Gln Ala Asn Gly Gly
435 440 445
Gly Ala Ser Asp Asp Met Glu Ser Phe Trp Phe Ala Glu Ala Leu Lys
450 455 460
Tyr Ala Tyr Leu Ile Phe Ala Glu Glu Ser Asp Val Gln Val Gln Ala
465 470 475 480
Asn Gly Gly Asn Lys Phe Val Phe Asn Thr Glu Ala His Pro Phe Ser
485 490 495
Ile Arg Ser Ser Ser Arg Arg Gly Gly His Leu Ala His Asp Glu Leu
500 505 510
<210> 10
<211> 445
<212> PRT
<213> Artificial sequence
<400> 10
Met Ser Leu Ser Leu Val Ser Tyr Arg Leu Arg Lys Asn Pro Trp Val
1 5 10 15
Asn Ile Phe Leu Pro Val Leu Ala Ile Phe Leu Ile Tyr Ile Ile Phe
20 25 30
Phe Gln Arg Asp Gln Ser Ser Val Ser Ala Leu Asp Gly Asp Pro Ala
35 40 45
Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu
50 55 60
Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser
65 70 75 80
Ser Gln Arg Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg
85 90 95
Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala
100 105 110
Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr
115 120 125
Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly
130 135 140
His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr
145 150 155 160
His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His
165 170 175
Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala
180 185 190
Leu Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val Val Val
195 200 205
Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala
210 215 220
Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala
225 230 235 240
Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu
245 250 255
Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu
260 265 270
Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp
275 280 285
Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile
290 295 300
Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser
305 310 315 320
His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln
325 330 335
Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu
340 345 350
Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu
355 360 365
Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val
370 375 380
Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala
385 390 395 400
Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr
405 410 415
Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala
420 425 430
Pro Pro Leu Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn
435 440 445
<210> 11
<211> 804
<212> PRT
<213> Artificial sequence
<400> 11
Met Ala Leu Phe Leu Ser Lys Arg Leu Leu Arg Phe Thr Val Ile Ala
1 5 10 15
Gly Ala Val Ile Val Leu Leu Leu Thr Leu Asn Ser Asn Ser Arg Thr
20 25 30
Gln Gln Tyr Ile Pro Ser Ser Ile Ser Ala Ala Phe Asp Phe Thr Ser
35 40 45
Gly Ser Ile Ser Pro Glu Gln Gln Val Ile Ser Glu Glu Asn Asp Ala
50 55 60
Lys Lys Leu Glu Gln Ser Ala Leu Asn Ser Glu Ala Ser Glu Asp Ser
65 70 75 80
Glu Ala Met Asp Glu Glu Ser Lys Ala Leu Lys Ala Ala Ala Glu Lys
85 90 95
Ala Asp Ala Pro Ile Gly Gly Gly Pro Ala Gly Met Arg Val Leu Val
100 105 110
Thr Gly Gly Ser Gly Tyr Ile Gly Ser His Thr Cys Val Gln Leu Leu
115 120 125
Gln Asn Gly His Asp Val Ile Ile Leu Asp Asn Leu Cys Asn Ser Lys
130 135 140
Arg Ser Val Leu Pro Val Ile Glu Arg Leu Gly Gly Lys His Pro Thr
145 150 155 160
Phe Val Glu Gly Asp Ile Arg Asn Glu Ala Leu Met Thr Glu Ile Leu
165 170 175
His Asp His Ala Ile Asp Thr Val Ile His Phe Ala Gly Leu Lys Ala
180 185 190
Val Gly Glu Ser Val Gln Lys Pro Leu Glu Tyr Tyr Asp Asn Asn Val
195 200 205
Asn Gly Thr Leu Arg Leu Ile Ser Ala Met Arg Ala Ala Asn Val Lys
210 215 220
Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr Gly Asp Gln Pro Lys
225 230 235 240
Ile Pro Tyr Val Glu Ser Phe Pro Thr Gly Thr Pro Gln Ser Pro Tyr
245 250 255
Gly Lys Ser Lys Leu Met Val Glu Gln Ile Leu Thr Asp Leu Gln Lys
260 265 270
Ala Gln Pro Asp Trp Ser Ile Ala Leu Leu Arg Tyr Phe Asn Pro Val
275 280 285
Gly Ala His Pro Ser Gly Asp Met Gly Glu Asp Pro Gln Gly Ile Pro
290 295 300
Asn Asn Leu Met Pro Tyr Ile Ala Gln Val Ala Val Gly Arg Arg Asp
305 310 315 320
Ser Leu Ala Ile Phe Gly Asn Asp Tyr Pro Thr Glu Asp Gly Thr Gly
325 330 335
Val Arg Asp Tyr Ile His Val Met Asp Leu Ala Asp Gly His Val Val
340 345 350
Ala Met Glu Lys Leu Ala Asn Lys Pro Gly Val His Ile Tyr Asn Leu
355 360 365
Gly Ala Gly Val Gly Asn Ser Val Leu Asp Val Val Asn Ala Phe Ser
370 375 380
Lys Ala Cys Gly Lys Pro Val Asn Tyr His Phe Ala Pro Arg Arg Glu
385 390 395 400
Gly Asp Leu Pro Ala Tyr Trp Ala Asp Ala Ser Lys Ala Asp Arg Glu
405 410 415
Leu Asn Trp Arg Val Thr Arg Thr Leu Asp Glu Met Ala Gln Asp Thr
420 425 430
Trp His Trp Gln Ser Arg His Pro Gln Gly Tyr Pro Asp Gly Thr Gly
435 440 445
Gly Gly Arg Asp Leu Ser Arg Leu Pro Gln Leu Val Gly Val Ser Thr
450 455 460
Pro Leu Gln Gly Gly Ser Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser
465 470 475 480
Gly Glu Leu Arg Thr Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala
485 490 495
Ser Ser Gln Pro Arg Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser
500 505 510
Gly Pro Gly Pro Ala Ser Asn Leu Thr Ser Val Pro Val Pro His Thr
515 520 525
Thr Ala Leu Ser Leu Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val
530 535 540
Gly Pro Met Leu Ile Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val
545 550 555 560
Ala Lys Gln Asn Pro Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg
565 570 575
Asp Cys Val Ser Pro His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn
580 585 590
Arg Gln Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu
595 600 605
Gln Arg Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly
610 615 620
Asp Thr Ile Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu
625 630 635 640
Ala Leu Lys Asp Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp
645 650 655
Leu Ile Pro Met Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro
660 665 670
Arg His Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr
675 680 685
Val Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu
690 695 700
Thr Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp
705 710 715 720
Asp Asp Ile Phe Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg
725 730 735
Pro Asn Ala Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp
740 745 750
Lys Lys Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr
755 760 765
Lys Glu Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val
770 775 780
Leu Asp Val Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile
785 790 795 800
Gly Thr Pro Ser
<210> 12
<211> 1101
<212> PRT
<213> Artificial sequence
<400> 12
Met Leu Leu Thr Lys Arg Phe Ser Lys Leu Phe Lys Leu Thr Phe Ile
1 5 10 15
Val Leu Ile Leu Cys Gly Leu Phe Val Ile Thr Asn Lys Tyr Met Asp
20 25 30
Glu Asn Thr Ser Pro Ala Gly Val Glu Asp Gly Pro Lys Ser Ser Gln
35 40 45
Ser Asn Phe Ser Gln Gly Ala Gly Ser His Leu Leu Pro Ser Gln Leu
50 55 60
Ser Leu Ser Val Asp Thr Ala Asp Cys Leu Phe Ala Ser Gln Ser Gly
65 70 75 80
Ser His Asn Ser Asp Val Gln Met Leu Asp Val Tyr Ser Leu Ile Ser
85 90 95
Phe Asp Asn Pro Asp Gly Gly Val Trp Lys Gln Gly Phe Asp Ile Thr
100 105 110
Tyr Glu Ser Asn Glu Trp Asp Thr Glu Pro Leu Gln Val Phe Val Val
115 120 125
Pro His Ser His Asn Asp Pro Gly Trp Leu Lys Thr Phe Asn Asp Tyr
130 135 140
Phe Arg Asp Lys Thr Gln Tyr Ile Phe Asn Asn Met Val Leu Lys Leu
145 150 155 160
Lys Glu Asp Ser Arg Arg Lys Phe Ile Trp Ser Glu Ile Ser Tyr Leu
165 170 175
Ser Lys Trp Trp Asp Ile Ile Asp Ile Gln Lys Lys Asp Ala Val Lys
180 185 190
Ser Leu Ile Glu Asn Gly Gln Leu Glu Ile Val Thr Gly Gly Trp Val
195 200 205
Met Pro Asp Glu Ala Thr Pro His Tyr Phe Ala Leu Ile Asp Gln Leu
210 215 220
Ile Glu Gly His Gln Trp Leu Glu Asn Asn Ile Gly Val Lys Pro Arg
225 230 235 240
Ser Gly Trp Ala Ile Asp Pro Phe Gly His Ser Pro Thr Met Ala Tyr
245 250 255
Leu Leu Asn Arg Ala Gly Leu Ser His Met Leu Ile Gln Arg Val His
260 265 270
Tyr Ala Val Lys Lys His Phe Ala Leu His Lys Thr Leu Glu Phe Phe
275 280 285
Trp Arg Gln Asn Trp Asp Leu Gly Ser Val Thr Asp Ile Leu Cys His
290 295 300
Met Met Pro Phe Tyr Ser Tyr Asp Ile Pro His Thr Cys Gly Pro Asp
305 310 315 320
Pro Lys Ile Cys Cys Gln Phe Asp Phe Lys Arg Leu Pro Gly Gly Arg
325 330 335
Phe Gly Cys Pro Trp Gly Val Pro Pro Glu Thr Ile His Pro Gly Asn
340 345 350
Val Gln Ser Arg Ala Arg Met Leu Leu Asp Gln Tyr Arg Lys Lys Ser
355 360 365
Lys Leu Phe Arg Thr Lys Val Leu Leu Ala Pro Leu Gly Asp Asp Phe
370 375 380
Arg Tyr Cys Glu Tyr Thr Glu Trp Asp Leu Gln Phe Lys Asn Tyr Gln
385 390 395 400
Gln Leu Phe Asp Tyr Met Asn Ser Gln Ser Lys Phe Lys Val Lys Ile
405 410 415
Gln Phe Gly Thr Leu Ser Asp Phe Phe Asp Ala Leu Asp Lys Ala Asp
420 425 430
Glu Thr Gln Arg Asp Lys Gly Gln Ser Met Phe Pro Val Leu Ser Gly
435 440 445
Asp Phe Phe Thr Tyr Ala Asp Arg Asp Asp His Tyr Trp Ser Gly Tyr
450 455 460
Phe Thr Ser Arg Pro Phe Tyr Lys Arg Met Asp Arg Ile Met Glu Ser
465 470 475 480
His Leu Arg Ala Ala Glu Ile Leu Tyr Tyr Phe Ala Leu Arg Gln Ala
485 490 495
His Lys Tyr Lys Ile Asn Lys Phe Leu Ser Ser Ser Leu Tyr Thr Ala
500 505 510
Leu Thr Glu Ala Arg Arg Asn Leu Gly Leu Phe Gln His His Asp Ala
515 520 525
Ile Thr Gly Thr Ala Lys Asp Trp Val Val Val Asp Tyr Gly Thr Arg
530 535 540
Leu Phe His Ser Leu Met Val Leu Glu Lys Ile Ile Gly Asn Ser Ala
545 550 555 560
Phe Leu Leu Ile Gly Lys Asp Lys Leu Thr Tyr Asp Ser Tyr Ser Pro
565 570 575
Asp Thr Phe Leu Glu Met Asp Leu Lys Gln Lys Ser Gln Asp Ser Leu
580 585 590
Pro Gln Lys Asn Ile Ile Arg Leu Ser Ala Glu Pro Arg Tyr Leu Val
595 600 605
Val Tyr Asn Pro Leu Glu Gln Asp Arg Ile Ser Leu Val Ser Val Tyr
610 615 620
Val Ser Ser Pro Thr Val Gln Val Phe Ser Ala Ser Gly Lys Pro Val
625 630 635 640
Glu Val Gln Val Ser Ala Val Trp Asp Thr Ala Asn Thr Ile Ser Glu
645 650 655
Thr Ala Tyr Glu Ile Ser Phe Arg Ala His Ile Pro Pro Leu Gly Leu
660 665 670
Lys Val Tyr Lys Ile Leu Glu Ser Ala Ser Ser Asn Ser His Leu Ala
675 680 685
Asp Tyr Val Leu Tyr Lys Asn Lys Val Glu Asp Ser Gly Ile Phe Thr
690 695 700
Ile Lys Asn Met Ile Asn Thr Glu Glu Gly Ile Thr Leu Glu Asn Ser
705 710 715 720
Phe Val Leu Leu Arg Phe Asp Gln Thr Gly Leu Met Lys Gln Met Met
725 730 735
Thr Lys Glu Asp Gly Lys His His Glu Val Asn Val Gln Phe Ser Trp
740 745 750
Tyr Gly Thr Thr Ile Lys Arg Asp Lys Ser Gly Ala Tyr Leu Phe Leu
755 760 765
Pro Asp Gly Asn Ala Lys Pro Tyr Val Tyr Thr Thr Pro Pro Phe Val
770 775 780
Arg Val Thr His Gly Arg Ile Tyr Ser Glu Val Thr Cys Phe Phe Asp
785 790 795 800
His Val Thr His Arg Val Arg Leu Tyr His Ile Gln Gly Ile Glu Gly
805 810 815
Gln Ser Val Glu Val Ser Asn Ile Val Asp Ile Arg Lys Val Tyr Asn
820 825 830
Arg Glu Ile Ala Met Lys Ile Ser Ser Asp Ile Lys Ser Gln Asn Arg
835 840 845
Phe Tyr Thr Asp Leu Asn Gly Tyr Gln Ile Gln Pro Arg Met Thr Leu
850 855 860
Ser Lys Leu Pro Leu Gln Ala Asn Val Tyr Pro Met Thr Thr Met Ala
865 870 875 880
Tyr Ile Gln Asp Ala Lys His Arg Leu Thr Leu Leu Ser Ala Gln Ser
885 890 895
Leu Gly Val Ser Ser Leu Asn Ser Gly Gln Ile Glu Val Ile Met Asp
900 905 910
Arg Arg Leu Met Gln Asp Asp Asn Arg Gly Leu Glu Gln Gly Ile Gln
915 920 925
Asp Asn Lys Ile Thr Ala Asn Leu Phe Arg Ile Leu Leu Glu Lys Arg
930 935 940
Ser Ala Val Asn Thr Glu Glu Glu Lys Lys Ser Val Ser Tyr Pro Ser
945 950 955 960
Leu Leu Ser His Ile Thr Ser Ser Leu Met Asn His Pro Val Ile Pro
965 970 975
Met Ala Asn Lys Phe Ser Ser Pro Thr Leu Glu Leu Gln Gly Glu Phe
980 985 990
Ser Pro Leu Gln Ser Ser Leu Pro Cys Asp Ile His Leu Val Asn Leu
995 1000 1005
Arg Thr Ile Gln Ser Lys Val Gly Asn Gly His Ser Asn Glu Ala
1010 1015 1020
Ala Leu Ile Leu His Arg Lys Gly Phe Asp Cys Arg Phe Ser Ser
1025 1030 1035
Lys Gly Thr Gly Leu Phe Cys Ser Thr Thr Gln Gly Lys Ile Leu
1040 1045 1050
Val Gln Lys Leu Leu Asn Lys Phe Ile Val Glu Ser Leu Thr Pro
1055 1060 1065
Ser Ser Leu Ser Leu Met His Ser Pro Pro Gly Thr Gln Asn Ile
1070 1075 1080
Ser Glu Ile Asn Leu Ser Pro Met Glu Ile Ser Thr Phe Arg Ile
1085 1090 1095
Gln Leu Arg
1100
<210> 13
<211> 394
<212> PRT
<213> Artificial sequence
<400> 13
Met Leu Leu Thr Lys Arg Phe Ser Lys Leu Phe Lys Leu Thr Phe Ile
1 5 10 15
Val Leu Ile Leu Cys Gly Leu Phe Val Ile Thr Asn Lys Tyr Met Asp
20 25 30
Glu Asn Thr Ser Pro Ala Gly Ser Leu Val Tyr Gln Leu Asn Phe Asp
35 40 45
Gln Thr Leu Arg Asn Val Asp Lys Ala Gly Thr Trp Ala Pro Arg Glu
50 55 60
Leu Val Leu Val Val Gln Val His Asn Arg Pro Glu Tyr Leu Arg Leu
65 70 75 80
Leu Leu Asp Ser Leu Arg Lys Ala Gln Gly Ile Asp Asn Val Leu Val
85 90 95
Ile Phe Ser His Asp Phe Trp Ser Thr Glu Ile Asn Gln Leu Ile Ala
100 105 110
Gly Val Asn Phe Cys Pro Val Leu Gln Val Phe Phe Pro Phe Ser Ile
115 120 125
Gln Leu Tyr Pro Asn Glu Phe Pro Gly Ser Asp Pro Arg Asp Cys Pro
130 135 140
Arg Asp Leu Pro Lys Asn Ala Ala Leu Lys Leu Gly Cys Ile Asn Ala
145 150 155 160
Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu Ala Lys Phe Ser Gln
165 170 175
Thr Lys His His Trp Trp Trp Lys Leu His Phe Val Trp Glu Arg Val
180 185 190
Lys Ile Leu Arg Asp Tyr Ala Gly Leu Ile Leu Phe Leu Glu Glu Asp
195 200 205
His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe Lys Lys Met Trp Lys
210 215 220
Leu Lys Gln Gln Glu Cys Pro Glu Cys Asp Val Leu Ser Leu Gly Thr
225 230 235 240
Tyr Ser Ala Ser Arg Ser Phe Tyr Gly Met Ala Asp Lys Val Asp Val
245 250 255
Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly Leu Ala Leu Thr Arg
260 265 270
Asn Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp Thr Phe Cys Thr Tyr
275 280 285
Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr Leu Thr Val Ser Cys
290 295 300
Leu Pro Lys Phe Trp Lys Val Leu Val Pro Gln Ile Pro Arg Ile Phe
305 310 315 320
His Ala Gly Asp Cys Gly Met His His Lys Lys Thr Cys Arg Pro Ser
325 330 335
Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn Asn Asn Lys Gln Tyr
340 345 350
Met Phe Pro Glu Thr Leu Thr Ile Ser Glu Lys Phe Thr Val Val Ala
355 360 365
Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp Ile Arg Asp His
370 375 380
Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln
385 390
<210> 14
<211> 1539
<212> DNA
<213> Artificial sequence
<400> 14
gaggctgaag cttatccaaa gccgggcgcc acaaaacgtg gatctcccaa ccctacgagg 60
gcggcagcag tcaaggccgc attccagacg tcgtggaacg cttaccacca ttttgccttt 120
ccccatgacg acctccaccc ggtcagcaac agctttgatg atgagagaaa cggctggggc 180
tcgtcggcaa tcgatggctt ggacacggct atcctcatgg gggatgccga cattgtgaac 240
acgatccttc agtatgtacc gcagatcaac ttcaccacga ctgcggttgc caaccaaggc 300
atctccgtgt tcgagaccaa cattcggtac ctcggtggcc tgctttctgc ctatgacctg 360
ttgcgaggtc ctttcagctc cttggcgaca aaccagaccc tggtaaacag ccttctgagg 420
caggctcaaa cactggccaa cggcctcaag gttgcgttca ccactcccag cggtgtcccg 480
gaccctaccg tcttcttcaa ccctaccgtc cggagaagtg gtgcatctag caacaacgtc 540
gctgaaattg gaagcctggt gctcgaatgg acacggttga gcgacctgac gggaaacccg 600
cagtatgccc agcttgcgca gaagggcgag tcgtatctcc tgaatccaaa gggaagcccg 660
gaggcatggc ctggcctgat tggaacgttt gtcagcacga gcaacggtac ctttcaggat 720
agcagcggca gctggtccgg cctcatggac agcttctacg agtacctgat caagatgtac 780
ctgtacgacc cggttgcgtt tgcacactac aaggatcgct gggtccttgc tgccgactcg 840
accattgcgc atctcgcctc tcacccgtcg acgcgcaagg acttgacctt tttgtcttcg 900
tacaacggac agtctacgtc gccaaactca ggacatttgg ccagttttgc cggtggcaac 960
ttcatcttgg gaggcattct cctgaacgag caaaagtaca ttgactttgg aatcaagctt 1020
gccagctcgt actttgccac gtacaaccag acggcttctg gaatcggccc cgaaggcttc 1080
gcgtgggtgg acagcgtgac gggcgccggc ggctcgccgc cctcgtccca gtccgggttc 1140
tactcgtcgg caggattctg ggtgacggca ccgtattaca tcctgcggcc ggagacgctg 1200
gagagcttgt actacgcata ccgcgtcacg ggcgactcca agtggcagga cctggcgtgg 1260
gaagcgttca gtgccattga ggacgcatgc cgcgccggca gcgcgtactc gtccatcaac 1320
gacgtgacgc aggccaacgg cgggggtgcc tctgacgata tggagagctt ctggtttgcc 1380
gaggcgctca agtatgcgta cctgatcttt gcggaggagt cggatgtgca ggtgcaggcc 1440
aacggcggga acaaatttgt ctttaacacg gaggcgcacc cctttagcat ccgttcatca 1500
tcacgacggg gcggccacct tgctcacgac gagttgtaa 1539
<210> 15
<211> 1338
<212> DNA
<213> Artificial sequence
<400> 15
atgtcacttt ctcttgtatc gtaccgccta agaaagaacc cgtgggttaa catttttcta 60
cctgttttgg ccatatttct aatatatata atttttttcc agagagatca atcttcagtc 120
agcgctctcg atggcgaccc cgccagcctc acccgggaag tgattcgcct ggcccaagac 180
gccgaggtgg agctggagcg gcagcgtggg ctgctgcagc agatcgggga tgccctgtcg 240
agccagcggg ggagggtgcc caccgcggcc cctcccgccc agccgcgtgt gcctgtgacc 300
cccgcgccgg cggtgattcc catcctggtc atcgcctgtg accgcagcac tgttcggcgc 360
tgcctggaca agctgctgca ttatcggccc tcggctgagc tcttccccat catcgttagc 420
caggactgcg ggcacgagga gacggcccag gccatcgcct cctacggcag cgcggtcacg 480
cacatccggc agcccgacct gagcagcatt gcggtgccgc cggaccaccg caagttccag 540
ggctactaca agatcgcgcg ccactaccgc tgggcgctgg gccaggtctt ccggcagttt 600
cgcttccccg cggccgtggt ggtggaggat gacctggagg tggccccgga cttcttcgag 660
tactttcggg ccacctatcc gctgctgaag gccgacccct ccctgtggtg cgtctcggcc 720
tggaatgaca acggcaagga gcagatggtg gacgccagca ggcctgagct gctctaccgc 780
accgactttt tccctggcct gggctggctg ctgttggccg agctctgggc tgagctggag 840
cccaagtggc caaaggcctt ctgggacgac tggatgcggc ggccggagca gcggcagggg 900
cgggcctgca tacgccctga gatctcaaga acgatgacct ttggccgcaa gggtgtgagc 960
cacgggcagt tctttgacca gcacctcaag tttatcaagc tgaaccagca gtttgtgcac 1020
ttcacccagc tggacctgtc ttacctgcag cgggaggcct atgaccgaga tttcctcgcc 1080
cgcgtctacg gtgctcccca gctgcaggtg gagaaagtga ggaccaatga ccggaaggag 1140
ctgggggagg tgcgggtgca gtatacgggc agggacagct tcaaggcttt cgccaaggct 1200
ctgggtgtca tggatgacct taagtcgggg gttccgagag ctggctaccg gggtattgtc 1260
accttccagt tccggggccg ccgtgtccac ctggcgcccc cactgacgtg ggagggctat 1320
gatcctagct ggaattag 1338
<210> 16
<211> 2397
<212> DNA
<213> Artificial sequence
<400> 16
atggccctct ttctcagtaa gagactgttg agatttaccg tcattgcagg tgcggttatt 60
gttctcctcc taacattgaa ttccaacagt agaactcagc aatatattcc gagttccatc 120
tccgctgcat ttgattttac ctcaggatct atatcccctg aacaacaagt catctctgag 180
gaaaatgatg ctaaaaaatt agagcaaagt gctctgaatt cagaggcaag cgaagactcc 240
gaagccatgg atgaagaatc caaggctctg aaagctgccg ctgaaaaggc agatgccccg 300
atcatgagag ttctggttac cggtggtagc ggttacattg gaagtcatac ctgtgtgcaa 360
ttactgcaaa acggtcatga tgtcatcatt cttgataacc tctgtaacag taagcgcagc 420
gtactgcctg ttatcgagcg tttaggcggc aaacatccaa cgtttgttga aggcgatatt 480
cgtaacgaag cgttgatgac cgagatcctg cacgatcacg ctatcgacac cgtgatccac 540
ttcgccgggc tgaaagccgt gggcgaatcg gtacaaaaac cgctggaata ttacgacaac 600
aatgtcaacg gcactctgcg cctgattagc gccatgcgcg ccgctaacgt caaaaacttt 660
atttttagct cctccgccac cgtttatggc gatcagccca aaattccata cgttgaaagc 720
ttcccgaccg gcacaccgca aagcccttac ggcaaaagca agctgatggt ggaacagatc 780
ctcaccgatc tgcaaaaagc ccagccggac tggagcattg ccctgctgcg ctacttcaac 840
ccggttggcg cgcatccgtc gggcgatatg ggcgaagatc cgcaaggcat tccgaataac 900
ctgatgccat acatcgccca ggttgctgta ggccgtcgcg actcgctggc gatttttggt 960
aacgattatc cgaccgaaga tggtactggc gtacgcgatt acatccacgt aatggatctg 1020
gcggacggtc acgtcgtggc gatggaaaaa ctggcgaaca agccaggcgt acacatctac 1080
aacctcggcg ctggcgtagg caacagcgtg ctggacgtgg ttaatgcctt cagcaaagcc 1140
tgcggcaaac cggttaatta tcattttgca ccgcgtcgcg agggcgacct tccggcctac 1200
tgggcggacg ccagcaaagc cgaccgtgaa ctgaactggc gcgtaacgcg cacactcgat 1260
gaaatggcgc aggacacctg gcactggcag tcacgccatc cacagggata tcccgatggt 1320
accggtggtg gacgtgacct ttctcgtctg ccacaactgg ttggagtttc tactccactg 1380
caaggtggat ctaactctgc tgctgcaatt ggtcaatcat ctggtgagct tcgtactgga 1440
ggtgctcgtc cccctccacc acttggtgct tcttcccagc cccgtccagg tggcgactcc 1500
agcccagtcg tggattctgg ccctggcccc gctagcaact tgacctcggt cccagtgccc 1560
cacaccaccg cactgtcgct gcccgcctgc cctgaggagt ccccgctgct tgtgggcccc 1620
atgctgattg agtttaacat gcctgtggac ctggagctcg tggcaaagca gaacccaaat 1680
gtgaagatgg gcggccgcta tgcccccagg gactgcgtct ctcctcacaa ggtggccatc 1740
atcattccat tccgcaaccg gcaggagcac ctcaagtact ggctatatta tttgcaccca 1800
gtcctgcagc gccagcagct ggactatggc atctatgtta tcaaccaggc gggagacact 1860
atattcaatc gtgctaagct cctcaatgtt ggctttcaag aagccttgaa ggactatgac 1920
tacacctgct ttgtgtttag tgacgtggac ctcattccaa tgaatgacca taatgcgtac 1980
aggtgttttt cacagccacg gcacatttcc gttgcaatgg ataagtttgg attcagccta 2040
ccttatgttc agtattttgg aggtgtctct gctctaagta aacaacagtt tctaaccatc 2100
aatggatttc ctaataatta ttggggttgg ggaggagaag atgacgacat ttttaacaga 2160
ttagttttta gaggcatgtc tatatctcgc ccaaatgctg tggtcgggag gtgtcgcatg 2220
atccgccact caagagacaa gaaaaatgaa cccaatcctc agaggtttga ccgaattgca 2280
cacacaaagg agacaatgct ctctgatggt ttgaactcac tcacctacca ggtgctggat 2340
gtacagagat acccattgta tacccaaatc acagtggaca tcgggacacc gagctaa 2397
<210> 17
<211> 3306
<212> DNA
<213> Artificial sequence
<400> 17
atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60
tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcgcc tgcaggcgtg 120
gaggatggtc cgaaaagttc acaaagcaat ttcagccaag gtgctggctc acatcttctg 180
ccctcacaat tatccctctc agttgacact gcagactgtc tgtttgcttc acaaagtgga 240
agtcacaatt cagatgtgca gatgttggat gtttacagtc taatttcttt tgacaatcca 300
gatggtggag tttggaagca aggatttgac attacttatg aatctaatga atgggacact 360
gaaccccttc aagtctttgt ggtgcctcat tcccataacg acccaggttg gttgaagact 420
ttcaatgact actttagaga caagactcag tatattttta ataacatggt cctaaagctg 480
aaagaagact cacggaggaa gtttatttgg tctgagatct cttacctttc aaagtggtgg 540
gatattatag atattcagaa gaaggatgct gttaaaagtt taatagaaaa tggtcagctt 600
gaaattgtga caggtggctg ggttatgcct gatgaagcta ctccacatta ttttgcctta 660
attgatcaac taattgaagg acatcagtgg ctggaaaata atataggagt gaaacctcgg 720
tccggctggg ctattgatcc ctttggacac tcaccaacaa tggcttatct tctaaaccgt 780
gctggacttt ctcacatgct tatccagaga gttcattatg cagttaaaaa acactttgca 840
ctgcataaaa cattggagtt tttttggaga cagaattggg atctgggatc tgtcacagat 900
attttatgcc acatgatgcc cttctacagc tatgacatcc ctcacacttg tggacctgat 960
cctaaaatat gctgccagtt tgattttaaa cgtcttcctg gaggcagatt tggttgtccc 1020
tggggagtcc ccccagaaac aatacatcct ggaaatgtcc aaagcagggc tcggatgcta 1080
ctagatcagt accgaaagaa gtcaaagctt tttcgaacca aagttctcct ggctccacta 1140
ggagatgatt tccgctactg tgaatacacg gaatgggatt tacagtttaa gaattatcag 1200
cagctttttg attatatgaa ttctcagtcc aagtttaaag ttaagataca gtttggaact 1260
ttatcagatt tttttgatgc gctggataaa gcagatgaaa ctcagagaga caagggccaa 1320
tcgatgttcc ctgttttaag tggagatttt ttcacttatg ccgatcgaga tgatcattac 1380
tggagtggct attttacatc cagacccttt tacaaacgaa tggacagaat catggaatct 1440
catttaaggg ctgctgaaat tctttactat ttcgccctga gacaagctca caaatacaag 1500
ataaataaat ttctctcatc atcactttac acggcactga cagaagccag aaggaatttg 1560
ggactgtttc aacatcatga tgctatcaca ggaactgcaa aagactgggt ggttgtggat 1620
tatggtacca gactttttca ttcgttaatg gttttggaga agataattgg aaattctgca 1680
tttcttctta ttgggaagga caaactcaca tacgactctt actctcctga taccttcctg 1740
gagatggatt tgaaacaaaa atcacaagat tctctgccac aaaaaaatat aataaggctg 1800
agtgcggagc caaggtacct tgtggtctat aatcctttag aacaagaccg aatctcgttg 1860
gtctcagtct atgtgagttc cccgacagtg caagtgttct ctgcttcagg aaaacctgtg 1920
gaagttcaag tcagcgcagt ttgggataca gcaaatacta tttcagaaac agcctatgag 1980
atctcttttc gagcacatat accgccattg ggactgaaag tgtataagat tttggaatca 2040
gcaagttcaa attcacattt agctgattat gtcttgtata agaataaagt agaagatagc 2100
ggaattttca ccataaagaa tatgataaat actgaagaag gtataacact agagaactcc 2160
tttgttttac ttcggtttga tcaaactgga cttatgaagc aaatgatgac taaagaagat 2220
ggtaaacacc atgaagtaaa tgtgcaattt tcatggtatg gaaccacaat taaaagagac 2280
aaaagtggtg cctacctctt cttacctgat ggtaatgcca agccttatgt ttacacaaca 2340
ccgccctttg tcagagtgac acatggaagg atttattcgg aagtgacttg cttttttgac 2400
catgttactc atagagtccg actataccac atacagggaa tagaaggaca gtctgtggaa 2460
gtttccaata ttgtggacat ccgaaaagta tataaccgtg agattgcaat gaaaatttct 2520
tctgatataa aaagccaaaa tagattttat actgacctaa atgggtacca gattcaacct 2580
agaatgacac tgagcaaatt gcctcttcaa gcaaatgtct atcccatgac cacaatggcc 2640
tatatccagg atgccaaaca tcgtttgaca ctgctctctg ctcagtcatt aggggtttcg 2700
agtttgaata gtggtcagat tgaagttatc atggatcgaa gactcatgca agatgataat 2760
cgtggccttg agcaaggtat ccaggataac aagattacag ctaatctatt tcgaatacta 2820
ctagaaaaaa gaagtgctgt taatacggaa gaagaaaaga agtcggtcag ttatccttct 2880
ctccttagcc acataacttc ttctctcatg aatcatccag tcattccaat ggcaaataag 2940
ttctcctcac ctacccttga gctgcaaggt gaattctctc cattacagtc atctttgcct 3000
tgtgacattc atctggttaa tttgagaaca atacagtcaa aggtgggcaa tgggcactcc 3060
aatgaggcag ccttgatcct ccacagaaaa gggtttgatt gtcggttctc tagcaaaggc 3120
acagggctgt tttgttctac tactcaggga aagatattgg tacagaaact tttaaacaag 3180
tttattgtcg aaagtctcac accttcatca ctatccttga tgcattcacc tcccggcact 3240
cagaatataa gtgagatcaa cttgagtcca atggaaatca gcacattccg aatccagttg 3300
aggtga 3306
<210> 18
<211> 1188
<212> DNA
<213> Artificial sequence
<400> 18
atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60
tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcgcc tgcaggctcc 120
ctggtgtacc agctgaactt tgatcagacc ctgaggaatg tagataaggc tggcacctgg 180
gccccccggg agctggtgct ggtggtccag gtgcataacc ggcccgaata cctcagactg 240
ctgctggact cacttcgaaa agcccaggga attgacaacg tcctcgtcat ctttagccat 300
gacttctggt cgaccgagat caatcagctg atcgccgggg tgaatttctg tccggttctg 360
caggtgttct ttcctttcag cattcagttg taccctaacg agtttccagg tagtgaccct 420
agagattgtc ccagagacct gccgaagaat gccgctttga aattggggtg catcaatgct 480
gagtatcccg actccttcgg ccattataga gaggccaaat tctcccagac caaacatcac 540
tggtggtgga agctgcattt tgtgtgggaa agagtgaaaa ttcttcgaga ttatgctggc 600
cttatacttt tcctagaaga ggatcactac ttagccccag acttttacca tgtcttcaaa 660
aagatgtgga aactgaagca gcaagagtgc cctgaatgtg atgttctctc cctggggacc 720
tatagtgcca gtcgcagttt ctatggcatg gctgacaagg tagatgtgaa aacttggaaa 780
tccacagagc acaatatggg tctagccttg acccggaatg cctatcagaa gctgatcgag 840
tgcacagaca ctttctgtac ttatgatgat tataactggg actggactct tcaatacttg 900
actgtatctt gtcttccaaa attctggaaa gtgctggttc ctcaaattcc taggatcttt 960
catgctggag actgtggtat gcatcacaag aaaacctgta gaccatccac tcagagtgcc 1020
caaattgagt cactcttaaa taataacaaa caatacatgt ttccagaaac tctaactatc 1080
agtgaaaagt ttactgtggt agccatttcc ccacctagaa aaaatggagg gtggggagat 1140
attagggacc atgaactctg taaaagttat agaagactgc agtgataa 1188
<210> 19
<211> 4921
<212> DNA
<213> Artificial sequence
<400> 19
ggcatacact attatcttat ctatattagt cgtcgccgtt gcttttggat cctcgtgtat 60
ctctggagca ttattcactg tggaagataa ttataatgtt tcattggaag ttgccatttt 120
gacagtttca ttgatggtct tgggtttctc cttgggtcca ttgttgtggt ctcctttatc 180
tgagcagatt ggaaggagat gggtttattt tatatccttg ggtctctaca caatttttaa 240
cattccttgc gctctatccc ctaatatcgg tggtctctta gtttgtcgat ttttgtgtgg 300
tgtttttagt tccagcgcac tttgtctggt tggtggttct atagctgaca tgcatccttc 360
tgaaacaaga ggtaaagcaa tcgcctattt tgcagcagct ccttatggtg gaccagttat 420
tggaccttta gtatgtggtt ggatcggtgt taaaaccaac agaatggatc ttatcttttg 480
ggtaaatatg ggatttgcag gatttatgtg gttactagtt gcctgcattc cagaaaccta 540
tcaaccagta attttaaaga accgagcaaa gaaattaaga atggagttga acaatcctaa 600
catcatgaca gagcaagaag ctaatccact aactttcaag gaattagtag ttacctgcct 660
ttataggcct cttatgtttg ttttcactga gcctgttttg gacatgatgt gtgtttacgt 720
ttgtcttatt tactcattgc tttatgcatt tttctttgca tacccagtta tatttaatga 780
gctttatggc tatgaagatg atttcatcgg cctgatgttg attccaatat tgataggagc 840
ctttttggcc ttagttacaa ctccaatttt ggaatccatg tacgtgaaaa tgtgtcaacg 900
aagaaaacca actcctgaag acagattggt aggagccatg attgggtctc ctttccctgc 960
aattgcccta tttattttgg gagcaacgtc ctacaagcat atcatttggg tcggtccagc 1020
atcttccggt atcgccttcg gttatggaat ggtactaatt tactactctt tgaataatta 1080
catcatcgac acctacgcca agtatgcagc tagtgctctg gcaacaaagg ttttcctgag 1140
gagtgctgga ggtgctgctt tcccactatt tactacacag atgtaccata aactagggct 1200
acagtgggcc agttggttgt tggcattcat ttcattagca atgattctca tcccattcgt 1260
tttctacatt tatggtgctc gtttgagggc caaaatgtgt aaagagaact acagtgagat 1320
gtgatgcatt aagaacaatc attcattaat ccttttcagc atatattatt tctaattaat 1380
tcatacttaa taacgaaaat atggtacctg ccctcacggt ggttacggtc taggaacgga 1440
acgtatctta gcatggttgt gcgacagatt cactgtgaaa gactgttcat tatacccacg 1500
tttcactggg agatgtaagc cttaggtgtt ttaccctgat tagataatac aataaccaac 1560
agaaatacga gaatctagac taatttcgat gattcatttt tctttttacc gcgctgcctc 1620
ttttggcaat tctttcacct atattctacc ttctctttcc ttttgttcta aacttattac 1680
cagctatcta tgtcgaatca agaagaaaga cttaaactgt ggggtggcag gtttactggg 1740
gctactgacc ccttgatgga tttgtataac gcttccttac cttacgacaa gaaaatgtac 1800
aaggtggatt tagaaggaac aaaagtttac actgagggcc tggagaaaat taatttgcta 1860
actaaagacg aactaagtga gattcatcgt ggtctcaaat tgattgaagc agagtgggca 1920
gaagggaagt ttgttgagaa gccaggggat gaggatattc acactgctaa tgaacgtcgc 1980
ttgggtgagt tgattggtcg tggaatctct ggtaaggttc ataccggaag gtctagaaat 2040
gatcaagttg ccactgatat gcggttgtat gtcagagaca atctaactca gttggctgac 2100
tatctgaagc agttcattca agtaatcatc aagagagctg aacaggaaat agacgtcttg 2160
atgcccggtt atactcactt gcaaagagct caaccaatca gatggtctca ctggttgagc 2220
atgtatgcta cctatttcac tgaagattat gagagactga atcaaatcgt taaaaggttg 2280
aacaaatccc cattgggagc tggagctttg gctggtcatc cttatggaat tgatcgtgaa 2340
tacattgctg agagattagg gtttgattct gttattggta attctttggc cgctgtttca 2400
gacagagatt ttgtagtcga aaccatgttc tggtcttcgt tgtttatgaa tcatatttct 2460
cgattctcag aagatttgat catttactcc actggagagt ttggatttat caagttggca 2520
gatgcttatt ctactggatc ttctctgatg cctcaaaaaa aaaacccaga ctctttggag 2580
ttattgaggg gtaaatctgg tagatgtttt ggggccttgg ctggtttcct catgtctatt 2640
aagtccattc cgtcaaccta taacaaagat atgcaagagg ataaggagcc tttatttgat 2700
actctaatca ctgtagagca ctcgattttg atagcatccg gtgtagtttc taccttgaac 2760
attgatgccg aacgaatgaa gaatgctcta actatggata tgctggctac agatcttgcc 2820
gactatttag ttagaagggg agttccattc agagaaactc accacatttc tggtgaatgt 2880
gtcagacaag ccgaggagtt gaacctttct ggtattgatc agttgtccct cgaacaattg 2940
aaatccattg actcccgttt tgaggctgat gtggcttcaa cgtttgactt tgaagccagt 3000
gttgaaaaaa gaactgccac cggaggaact tctaagactg ctgttttaaa gcaattggat 3060
gcactgaatg aaaagctaga gtcttgaagg ttttatactg agtttgttaa tgatacaata 3120
aactgttata gtacatacaa ttgaaactct cttatctata ctgggggacc ttctcgcaga 3180
atggtataaa tatctactaa ctgactgtcg tacggcctag gggtctcttc ttcgattatt 3240
tgcaggtcgg aacatccttc gtctgatgcg gatctcctga gacaaagttc acgggtatct 3300
agtattctat cagcataaat ggaggacctt tctaaactaa actttgaatc gtctccagca 3360
gcatcctcgc ataatccttt tgtcatttcc tctatgtcta ttgtcactgt ggttggcgca 3420
tcaagagtcg tccttctgta aaccggtaca gaattcctac cactagaagc ttgaaatggg 3480
gagggtttca gctttgtatc ccgatactgt gctttaaaaa gggagtccaa actgaaatct 3540
ttttcggaat cattggatga tacctctgta ttagatctcc tatgtatcgg tttcctcggg 3600
tagatagaac ttcactcatc aacattatga tctttgtcga aaagtatcaa ttgaaacatt 3660
gccgctctgg ctctttcctt ggtgtccgtg ttgtcgcttt caaaactcaa tttcttgata 3720
acatcataaa atccatcttt aattagcttc aacgctcttg atctaggtgc tcgcatcttc 3780
ttgaaatgtt catcggaagt tagctcattc aagtacccaa catttatttc ttcttcaata 3840
gtttccatat ccatttcaac atctgaatct tccagatctg aagatgtatc gtccttccat 3900
gttaagttgg taactatcca aatacatgat atcatcagat ctttatggaa agcggcccat 3960
tcggaggaga ccccttctat ttcttgtact aaaggagtct ccaataacat ataaatgaag 4020
tcgagcaatt cttgattaca aataatcatt gatctgttat cttcattaga ggccgcaaaa 4080
tggaccagga tataagtgat agcaagaata acctcataag tttctgattc ctttctttta 4140
ctaatgtcat cctcctttaa tgtggatgat aaactcttca aattttttaa tagaaaattc 4200
aaaaaatctt tatcatcgtg agcttttgct gtcgggtcgg aacagaatga ttgaatgatt 4260
ttgttcgaat agttaagagg accacaggac aagtttcgga taatattgaa tgctttttct 4320
tgaatttgca gatttgaaga ataacaaagt tcaaaaattc ttgataaagg aactttgtcc 4380
aaaaataatt ttttatcaat gatatcatcc ccgtaaaggt aatttctaag aattgataag 4440
gcattgttct ttaagaattc aaactcgttc tcttccgaaa caaaataaga caataccttc 4500
aggaagtctt cattgaaaac attttttttc aaagaactat attccaccac acaattggaa 4560
atgattccca aaactagcgc cttgagtgta atttcgtcat ccaataagga cgcacaagat 4620
tcattgtctc ttgaaaccaa aggcagtttc accagatccg tcaacgagtt tacaatgttt 4680
aaatctacta ggtaggttcg tagcaatggc gctgatcgtg acagtgagcg gaccaagtac 4740
agagcagacg tcgtgattat gtttgaaagc ttcaatatag taatgacatg atccaactga 4800
gcagcgtctc cgtgaaactc tttgtaaata ttaatatgac gagagacaag atccaccaca 4860
cattctgaaa caatgtcatg cttgataatt tcatctctgt attcctcgtt gttggacgtt 4920
a 4921
<210> 20
<211> 2023
<212> DNA
<213> Artificial sequence
<400> 20
ggtaccgcag tttaatcata gcccactgct aagccagaat tctaatatgt aactacgtac 60
ctttcctttt aataaatgat ctgtattttc cacctagtag cagatcaaat tgttcaactt 120
taagtctttg gtccctcaag cgagagaact tgcgatgaca ctcaggagtg ccataaaagc 180
cagaacctca aaaggactga tcggagctgt tattatagcc tcaataatat ttttcaccac 240
agtaaccttc tacgatgaaa gcaaaattgt cggcataata agagtttctg atacttatac 300
aggccatagc gctgtatctt caactttcaa tgcttcttcc gttgttagtg acaacaagat 360
caacggatat ggacttcctt tgattgacac ggaatcaaat agccgttatg aggatccaga 420
cgatatttcc attgaaaacg aattgcgcta tagaattgcc caatctacca aagaggaaga 480
aaacatgtgg aaactcgata ccactctcac ggaagcaagc ttgaaaatcc ccaacataca 540
gtcgtttgag ctgcagccgt tcaaagaaag acttgataat tcactttaca attctaagaa 600
cataggaaac ttttacttct atgacccaag gcttacattc tcagtttact tgaagtatat 660
caaggataaa ttggcctctg gaagcacaac aaatcttaca atacccttca actgggcaca 720
ttttagagat ttatcgtcac tgaatcctta tttggacata aaacaagaag ataaggtcgc 780
atgtgattac ttttatgaat caagtaataa agacaaacga aaacccacgg gtaactgtat 840
tgagtttaaa gatgttcgtg atgagcacct gatacagtat gggatttcat caaaagacca 900
tctacctggt ccttttattt taaagtcact tggaattccc atgcagcata cagccaagcg 960
actggaatca aatctttatc tattaaccgg tgcgccagtt ccacttgcgg ccgcacttta 1020
ctttcttggt attggaattc attgatgttc ccttgggatt atgatattga tgtgcaaatg 1080
ccaatcaaga gtttgaacaa tctatgtgct aacttcaacc aatcattaat aattgaggat 1140
cttactgaag gatattcttc ttttttcttg gattgcggat caagtatcac gcatagaaca 1200
aaaggcaaag gattaaactt cattgatgca agattcataa atgttgaaac aggcctttat 1260
atcgatatca ctggattaag taccagtcag tcagctcgac cgccaaggtt tagtaacgct 1320
tcgaagaaag atcctattta caattgcagg aataatcatt tctactctca taacaatata 1380
gcacctctca aatacacgtt gatggagggg gttcccagtt tcattcctca acagtatgaa 1440
gaaatattga gagaggagta tacaactggt ttgacttcga aacactacaa cggcaacttt 1500
tttatgactc aattgaattt gtggcttgaa agagatccaa tgctagcact tgtgccttca 1560
tccaaatacg aaattgaagg tggaggggtg gaccataaca agattatcaa gtctattctt 1620
gaactttcca acatcaaaaa attggaattg ttggatgata atcccgatat attagaggag 1680
gtgatcagga catacgaact gacttccatt caccataaag agatgcagta tctttccagt 1740
gtcaaaccag atggggacag gtccatgcag tcaaatgaca taaccagttc ttaccaggag 1800
tttctagcaa gtctgaagaa attccagcct ttacgcaaag atttgttcca atttgagcgg 1860
atagaccttt ctaagcatag aaaacagtga gcagccgttt tgcctaaaat gttccagaaa 1920
ctataggata aatatataca gtaatgaatt aggtgatgtt agcatttagt ccccaaaaat 1980
acctcgaatc tccagctcca tagcgcaaaa tctcggatct aga 2023

Claims (25)

1.一种具有特定哺乳动物细胞糖型修饰能力的巴斯德毕赤酵母工程菌的构建方法,所述特定哺乳动物细胞糖型为Gal2GlcNAc2Man3GlcNAc2,其特征在于:所述方法包括如下步骤:
(A1)失活受体巴斯德毕赤酵母内源的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶I、β甘露糖转移酶II、β甘露糖转移酶III和β甘露糖转移酶IV,得到重组酵母1;
(A2)在所述重组酵母1中表达如下外源蛋白:外源甘露糖苷酶I、外源N-乙酰葡萄糖胺转移酶I、外源甘露糖苷酶II、外源N-乙酰葡萄糖胺转移酶II、外源半乳糖异构酶和外源半乳糖转移酶,得到重组酵母2;
(A3)失活所述重组酵母2内源的O甘露糖转移酶I,得到重组酵母3;所述重组酵母3为具有所述特定哺乳动物细胞糖型修饰能力的酵母工程菌;
步骤(A2)中,在所述重组酵母1中表达所述外源蛋白是通过向所述重组酵母1中导入所述外源蛋白的编码基因实现的;
所述外源蛋白的编码基因是以重组载体的形式导入所述重组酵母1中的;
所述外源甘露糖苷酶I的编码基因和所述外源甘露糖苷酶II的编码基因均向所述重组酵母1中导入两次;
所述外源甘露糖苷酶I来源于绿色木霉,且C端融合内质网保留信号HDEL;
所述外源N-乙酰葡萄糖胺转移酶I来源于人,且含有mnn9定位信号;
所述外源甘露糖苷酶II来源于线虫;
所述N-乙酰葡萄糖胺转移酶II来源于人,且均含有mnn2定位信号;
所述外源半乳糖异构酶和所述外源半乳糖转移酶为融合蛋白,均来源于人,且共用一个kre2定位信号。
2.根据权利要求1所述的方法,其特征在于:步骤(A1)中,所述失活受体巴斯德毕赤酵母内源的α-1,6-甘露糖转移酶、磷酸甘露糖转移酶、磷酸甘露糖合成酶、β甘露糖转移酶I、β甘露糖转移酶II、β甘露糖转移酶III和β甘露糖转移酶IV均是采用同源重组的方式进行基因敲除。
3.根据权利要求1所述的方法,其特征在于:步骤(A3)中,失活所述重组酵母2内源的O甘露糖转移酶I,是通过对所述重组酵母2的基因组DNA中的O甘露糖转移酶I编码基因进行插入失活实现的。
4. 根据权利要求1所述的方法,其特征在于:所述α-1,6-甘露糖转移酶为氨基酸序列是SEQ ID No.1的蛋白质。
5. 根据权利要求1所述的方法,其特征在于:所述磷酸甘露糖转移酶为氨基酸序列是SEQ ID No.2的蛋白质。
6. 根据权利要求1所述的方法,其特征在于:所述磷酸甘露糖合成酶为氨基酸序列是SEQ ID No.3的蛋白质。
7. 根据权利要求1所述的方法,其特征在于:所述β甘露糖转移酶I为氨基酸序列是SEQID No.4的蛋白质。
8. 根据权利要求1所述的方法,其特征在于:所述β甘露糖转移酶II为氨基酸序列是SEQ ID No.5的蛋白质。
9. 根据权利要求1所述的方法,其特征在于:所述β甘露糖转移酶III为氨基酸序列是SEQ ID No.6的蛋白质。
10. 根据权利要求1所述的方法,其特征在于:所述β甘露糖转移酶IV为氨基酸序列是SEQ ID No.7的蛋白质。
11. 根据权利要求1所述的方法,其特征在于:所述O甘露糖转移酶I为氨基酸序列是SEQ ID No.8的蛋白质。
12. 根据权利要求1所述的方法,其特征在于:所述外源甘露糖苷酶I为氨基酸序列是SEQ ID No.9的蛋白质。
13. 根据权利要求1所述的方法,其特征在于:所述外源N-乙酰葡萄糖胺转移酶I为氨基酸序列是SEQ ID No.10的蛋白质。
14. 根据权利要求1所述的方法,其特征在于:由所述半乳糖异构酶和所述半乳糖转移酶组成的所述融合蛋白为氨基酸序列是SEQ ID No.11的蛋白质。
15. 根据权利要求1所述的方法,其特征在于:所述甘露糖苷酶II为氨基酸序列是SEQID No.12的蛋白质。
16. 根据权利要求1所述的方法,其特征在于:所述N-乙酰葡萄糖胺转移酶II为氨基酸序列是SEQ ID No.13的蛋白质。
17. 根据权利要求1所述的方法,其特征在于:所述外源甘露糖苷酶I的编码基因为核苷酸序列是SEQ ID No.14的DNA分子。
18. 根据权利要求1所述的方法,其特征在于:所述外源N-乙酰葡萄糖胺转移酶I的编码基因为核苷酸序列是SEQ ID No.15的DNA分子。
19. 根据权利要求1所述的方法,其特征在于:由所述半乳糖异构酶和所述半乳糖转移酶组成的所述融合蛋白的编码基因为核苷酸序列是SEQ ID No.16的DNA分子。
20. 根据权利要求1所述的方法,其特征在于:所述甘露糖苷酶II的编码基因为核苷酸序列是SEQ ID No.17的DNA分子。
21. 根据权利要求1所述的方法,其特征在于:所述N-乙酰葡萄糖胺转移酶II的编码基因为核苷酸序列是SEQ ID No.18的DNA分子。
22.利用权利要求1-21中任一所述方法构建得到的巴斯德毕赤酵母工程菌。
23.根据权利要求22所述的巴斯德毕赤酵母工程菌,其特征在于:所述巴斯德毕赤酵母工程菌为在中国微生物菌种保藏管理委员会普通微生物中心保藏的保藏编号为CGMCCNo.19488的菌株。
24.权利要求22或23所述的巴斯德毕赤酵母工程菌在制备修饰有所述特定哺乳动物细胞糖型的目的蛋白中的应用。
25.一种制备修饰有特定哺乳动物细胞糖型的目的蛋白的方法,所述特定哺乳动物细胞糖型为Gal2GlcNAc2Man3GlcNAc2,其特征在于:所述方法包括如下步骤:在权利要求22或23所述的巴斯德毕赤酵母工程菌中表达所述目的蛋白,得到重组酵母工程菌;培养所述重组酵母工程菌,制备具有所述特定哺乳动物细胞糖型的目的蛋白。
CN202010331661.8A 2020-04-24 2020-04-24 一种用于糖蛋白制备的工程化酵母构建方法及其菌株 Active CN113549560B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010331661.8A CN113549560B (zh) 2020-04-24 2020-04-24 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
US17/996,710 US20230279337A1 (en) 2020-04-24 2021-04-23 Method for constructing engineered yeast for glycoprotein preparation and strain thereof
PCT/CN2021/089158 WO2021213489A1 (zh) 2020-04-24 2021-04-23 一种用于糖蛋白制备的工程化酵母构建方法及其菌株

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010331661.8A CN113549560B (zh) 2020-04-24 2020-04-24 一种用于糖蛋白制备的工程化酵母构建方法及其菌株

Publications (2)

Publication Number Publication Date
CN113549560A CN113549560A (zh) 2021-10-26
CN113549560B true CN113549560B (zh) 2024-02-13

Family

ID=78101217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010331661.8A Active CN113549560B (zh) 2020-04-24 2020-04-24 一种用于糖蛋白制备的工程化酵母构建方法及其菌株

Country Status (3)

Country Link
US (1) US20230279337A1 (zh)
CN (1) CN113549560B (zh)
WO (1) WO2021213489A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113549560B (zh) * 2020-04-24 2024-02-13 中国人民解放军军事科学院军事医学研究院 一种用于糖蛋白制备的工程化酵母构建方法及其菌株

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011106389A1 (en) * 2010-02-24 2011-09-01 Merck Sharp & Dohme Corp. Method for increasing n-glycosylation site occupancy on therapeutic glycoproteins produced in pichia pastoris
CN102648286A (zh) * 2009-10-16 2012-08-22 默沙东公司 在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性的蛋白质的方法
CA2827732A1 (en) * 2011-02-25 2012-08-30 Merck Sharp & Dohme Corp. Yeast strain for the production of proteins with modified o-glycosylation
WO2013062886A1 (en) * 2011-10-27 2013-05-02 Merck Sharp & Dohme Corp. Controlling o-glycosylation in lower eukaryotes
CN105671109A (zh) * 2014-11-20 2016-06-15 中国人民解放军军事医学科学院生物工程研究所 用糖基工程酵母制备具有动物细胞糖基化修饰流感血凝素糖蛋白的方法
CN109749949A (zh) * 2019-03-08 2019-05-14 中国人民解放军军事科学院军事医学研究院 一种重组酵母细胞的构建方法及其在制备低糖基化抗体中的应用
WO2021213489A1 (zh) * 2020-04-24 2021-10-28 中国人民解放军军事科学院军事医学研究院 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
CN113754739A (zh) * 2020-06-03 2021-12-07 中国人民解放军军事科学院军事医学研究院 一种冠状病毒s蛋白rbd糖蛋白的制备方法及其应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003091431A1 (fr) * 2002-04-26 2003-11-06 Kirin Beer Kabushiki Kaisha Methylotrophe produisant une chaine de sucre de type mammifere
US20110092374A1 (en) * 2009-10-16 2011-04-21 Vib, Vzw Methods for producing substantially homogeneous hybrid or complex n-glycans in methylotrophic yeasts
JP2013509181A (ja) * 2009-10-30 2013-03-14 メルク・シャープ・エンド・ドーム・コーポレイション ジペプチジルアミノペプチダーゼ活性を欠くピチア・パストリスにおける治療用タンパク質の製造方法
JP5885191B2 (ja) * 2011-01-04 2016-03-15 国立研究開発法人産業技術総合研究所 糖鎖改変酵母及びそれを用いた糖タンパク質の製造方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102648286A (zh) * 2009-10-16 2012-08-22 默沙东公司 在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性的蛋白质的方法
WO2011106389A1 (en) * 2010-02-24 2011-09-01 Merck Sharp & Dohme Corp. Method for increasing n-glycosylation site occupancy on therapeutic glycoproteins produced in pichia pastoris
CA2827732A1 (en) * 2011-02-25 2012-08-30 Merck Sharp & Dohme Corp. Yeast strain for the production of proteins with modified o-glycosylation
CN103764837A (zh) * 2011-02-25 2014-04-30 默沙东公司 用于生产具有修饰的o-糖基化的蛋白的酵母菌株
WO2013062886A1 (en) * 2011-10-27 2013-05-02 Merck Sharp & Dohme Corp. Controlling o-glycosylation in lower eukaryotes
CN105671109A (zh) * 2014-11-20 2016-06-15 中国人民解放军军事医学科学院生物工程研究所 用糖基工程酵母制备具有动物细胞糖基化修饰流感血凝素糖蛋白的方法
CN109749949A (zh) * 2019-03-08 2019-05-14 中国人民解放军军事科学院军事医学研究院 一种重组酵母细胞的构建方法及其在制备低糖基化抗体中的应用
WO2021213489A1 (zh) * 2020-04-24 2021-10-28 中国人民解放军军事科学院军事医学研究院 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
CN113754739A (zh) * 2020-06-03 2021-12-07 中国人民解放军军事科学院军事医学研究院 一种冠状病毒s蛋白rbd糖蛋白的制备方法及其应用

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Elimination of β-mannose glycan structures in Pichia pastoris;Daniel Hopkins等;《Glycobiology》;第21卷(第12期);1616-1626 *
Engineering complex-type N-glycosylation in Pichia pastoris using GlycoSwitch technology;Pieter PJ等;《Nat Protoc》;第4卷(第1期);第58-70页 *
Optimization of erythropoietin production with controlled glycosylation-PEGylated erythropoietin produced in glycoengineered Pichia pastoris;Juergen H等;《Journal of Biotechnology》;第157卷(第1期);第205页左列第1段 *
PMT1 gene plays a major role in O-mannosylation of insulin precursor in Pichia pastoris;Nagaraj G等;《Protein Expression and Purification》;第88卷(第1期);摘要,第167页左列第2段 *
毕赤酵母N-糖基化改造的研究进展;张倩等;《中国新药杂志》;全文 *
酵母糖基化改造工程研究进展;刘思阳等;《基因组学与应用生物学》;第38卷(第8期);全文 *

Also Published As

Publication number Publication date
CN113549560A (zh) 2021-10-26
US20230279337A1 (en) 2023-09-07
WO2021213489A1 (zh) 2021-10-28

Similar Documents

Publication Publication Date Title
JP5562647B2 (ja) 均質な糖タンパク質の生産のための遺伝的に修飾された酵母
AU2015293949B2 (en) Production of glycoproteins with mammalian-like N-glycans in filamentous fungi
JP6407872B2 (ja) 主に均一なグリカン構造を生成するためのピキア・パストリス(Pichiapastoris)株
CN102648286A (zh) 在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性的蛋白质的方法
KR20140015137A (ko) 분비 효율이 개선된 재조합 단백질의 생산 방법
CN102203123A (zh) 在宿主细胞中制造糖基化蛋白的新方法
CN104471053A (zh) 用于在缺少alg3表达的巴斯德毕赤酵母株中提高n-聚糖占据并减少杂合n-聚糖的产生的方法
CN111471605B (zh) 一株高产岩藻糖基乳糖的酿酒酵母工程菌株及其应用
JP2013509181A (ja) ジペプチジルアミノペプチダーゼ活性を欠くピチア・パストリスにおける治療用タンパク質の製造方法
MXPA03004853A (es) Metodos y composiciones para produccion sumamente eficiente de proteinas heterologas en levadura.
WO2013066765A1 (en) Mutation of tup1 in glycoengineered yeast
JP2014532406A (ja) 組換えタンパク質発現のための操作された下等真核宿主株
WO2021254054A1 (zh) 一种预防冠状病毒引起疾病的疫苗
CN113549560B (zh) 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
CN101343635A (zh) 构建表达预定糖链修饰糖蛋白工程菌株的方法
EP2678440B1 (en) Yeast strain for the production of proteins with modified o-glycosylation
WO2021244255A1 (zh) 一种冠状病毒s蛋白rbd糖蛋白的制备方法及其应用
KR20070045571A (ko) 돌리칠 포스페이트 만노스 의존알파-1,3-만노실트랜스퍼라제를 코딩하는 한세눌라폴리모르파 기원의 신규 유전자와 상기 유전자가 결손된한세눌라 폴리모르파 변이주를 이용한 재조합 당단백질생산 방법
WO2019213095A1 (en) Recombinant organisms and methods for producing glycomolecules with high glycan occupancy
KR100915670B1 (ko) 야로위아 리폴리티카 유래의 신규 YlMPO1 유전자 및이의 파쇄 균주를 이용한 만노스 인산이 제거된 당단백질생산 방법
KR20140134272A (ko) 효모에서 만노실트랜스퍼라제 활성을 감소시키는 방법
CN113754739B (zh) 一种冠状病毒s蛋白rbd糖蛋白的制备方法及其应用
JP2770010B2 (ja) 酵母のマンノース−1−リン酸転移を正に制御する遺伝子ならびにこの遺伝子の欠損変異株を利用する高マンノース型中性糖鎖の製造方法
CN108342400B (zh) 重组表达草酸氧化酶的基因工程菌及其构建方法和应用
KR101419266B1 (ko) 한세눌라 폴리모르파 유래의 단백질 o-만노실 전이효소의 신규 유전자 및 이 유전자가 결손된 한세눌라 폴리모르파 변이주

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant