CN104031961A - 生产成熟的人促红细胞生成素的方法以及包含获自该方法的人促红细胞生成素的组合物 - Google Patents
生产成熟的人促红细胞生成素的方法以及包含获自该方法的人促红细胞生成素的组合物 Download PDFInfo
- Publication number
- CN104031961A CN104031961A CN201410094457.3A CN201410094457A CN104031961A CN 104031961 A CN104031961 A CN 104031961A CN 201410094457 A CN201410094457 A CN 201410094457A CN 104031961 A CN104031961 A CN 104031961A
- Authority
- CN
- China
- Prior art keywords
- host cell
- glycan
- activity
- gene
- leu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
- C07K14/505—Erythropoietin [EPO]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/06—Antianaemics
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4715—Pregnancy proteins, e.g. placenta proteins, alpha-feto-protein, pregnancy specific beta glycoprotein
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4721—Lipocortins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4743—Insulin-like growth factor binding protein
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
- C07K14/485—Epidermal growth factor [EGF] (urogastrone)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/521—Chemokines
- C07K14/523—Beta-chemokines, e.g. RANTES, I-309/TCA-3, MIP-1alpha, MIP-1beta/ACT-2/LD78/SCIF, MCP-1/MCAF, MCP-2, MCP-3, LDCF-1, LDCF-2
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/53—Colony-stimulating factor [CSF]
- C07K14/535—Granulocyte CSF; Granulocyte-macrophage CSF
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/54—Interleukins [IL]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/555—Interferons [IFN]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/59—Follicle-stimulating hormone [FSH]; Chorionic gonadotropins, e.g. HCG; Luteinising hormone [LH]; Thyroid-stimulating hormone [TSH]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/605—Glucagons
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70546—Integrin superfamily
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70578—NGF-receptor/TNF-receptor superfamily, e.g. CD27, CD30, CD40, CD95
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/715—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
- C07K14/7151—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for tumor necrosis factor [TNF], for lymphotoxin [LT]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/745—Blood coagulation or fibrinolysis factors
- C07K14/755—Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/81—Protease inhibitors
- C07K14/8107—Endopeptidase (E.C. 3.4.21-99) inhibitors
- C07K14/811—Serine protease (E.C. 3.4.21) inhibitors
- C07K14/8114—Kunitz type inhibitors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/81—Protease inhibitors
- C07K14/8107—Endopeptidase (E.C. 3.4.21-99) inhibitors
- C07K14/811—Serine protease (E.C. 3.4.21) inhibitors
- C07K14/8121—Serpins
- C07K14/8125—Alpha-1-antitrypsin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/81—Protease inhibitors
- C07K14/8107—Endopeptidase (E.C. 3.4.21-99) inhibitors
- C07K14/811—Serine protease (E.C. 3.4.21) inhibitors
- C07K14/8121—Serpins
- C07K14/8128—Antithrombin III
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/22—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against growth factors ; against growth regulators
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/005—Glycopeptides, glycoproteins
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/30—Immunoglobulins specific features characterized by aspects of specificity or valency
- C07K2317/33—Crossreactivity, e.g. for species or epitope, or lack of said crossreactivity
Abstract
本发明涉及在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性的蛋白质的方法。描述了在巴斯德毕赤氏酵母中生产重组糖蛋白的方法,所述重组糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述方法包括提供重组巴斯德毕赤氏酵母宿主细胞,其不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,不展现对于N-聚糖或O-聚糖的选自β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的至少一种活性,并且其包括编码所述重组糖蛋白的核酸分子;在培养基中生长所述宿主细胞;和从所述培养基中回收所述重组糖蛋白。
Description
本申请是申请日为2010年10月11日的中国专利申请201080057790.7“在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性的蛋白质的方法”的分案申请。
技术领域
本发明涉及在巴斯德毕赤氏酵母(Pichia pastoris)中生产蛋白质和糖蛋白的方法,所述蛋白质和糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。特别地,本发明涉及使用重组的巴斯德毕赤氏酵母菌株,其不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,并且不展现选自由对于N-聚糖或O-聚糖的β-甘露糖基转移酶1、3和4的活性构成的组的至少一种活性。这些重组巴斯德毕赤氏酵母菌株可以产生蛋白质和糖蛋白,在其上缺乏可检测的α-甘露糖苷酶抗性的β-甘露糖残基。本发明进一步涉及在巴斯德毕赤氏酵母(Pichia pastoris)中生产双唾液酸化的人促红细胞生成素的方法,所述双唾液酸化的人促红细胞生成素缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性。
背景技术
生产重组的人蛋白质的能力引起了人体健康护理领域的很大发展,仍然是药物开发的活跃领域。许多治疗蛋白质需要向蛋白质的特定天冬酰胺残基翻译后添加聚糖(N-糖基化)以确保适当的结构-功能活性和随后在人血清中的稳定性。对于在人类中的治疗用途,糖蛋白需要人类样的N-糖基化。可以模拟人类样糖蛋白加工的哺乳动物细胞系(例如,CHO细胞、人类视网膜细胞)具有几个缺点,包括低的蛋白质滴度、长发酵时间、异源产物、以及持续的病毒防范。因而希望的是使用不仅在短发酵时间中产生高的蛋白质滴度、而且还产生人类样糖蛋白的表达系统。真菌宿主例如甲基营养型酵母巴斯德毕赤氏酵母具有用于治疗蛋白质表达的独特优点,例如,它们不分泌高量的内源蛋白质,生产异源蛋白质的可诱导的强启动子是可用的,它们可以在化学成分已知的培养基中生长并且不使用动物血清,它们可以生产高滴度的重组蛋白质 (Cregg et al., FEMS Microbiol.
Rev. 24: 45-66(2000))。然而,在巴斯德毕赤氏酵母中表达的糖基化蛋白质一般含有额外的甘露糖糖类,产生“高甘露糖”的聚糖,以及在糖蛋白上赋予负电荷的甘露糖基磷酸基团。具有高甘露糖聚糖或具有带电甘露聚糖的糖蛋白存在着在人类中引起不希望的免疫反应的风险(Takeuchi, Trends in
Glycosci. Glycotechnol. 9:S29-S35(1997);Rosenfeld and Ballou, J. Biol. Chem.
249: 2319-2321(1974))。因而,希望的是在真菌宿主细胞中生产治疗性糖蛋白,在所述宿主细胞中糖蛋白上的糖基化模式相同于、或类似于在人类中产生的糖蛋白上发生的模式,并且不具有可检测的β-甘露糖基化。
如在未感染的个体中保护性抗体的存在所证明的,β-连接的甘露聚糖可能是免疫原性的,或不利地影响施用包含β-连接的甘露聚糖的治疗蛋白质或糖蛋白的个体。另外,在治疗蛋白质上暴露的甘露糖基团被巨噬细胞上的甘露糖受体快速地清除,导致低药物效力。因而,在真菌宿主例如巴斯德毕赤氏酵母中表达的异源治疗蛋白质的N-或O-连接的聚糖上β-连接的甘露糖残基的存在不是期望的,考虑到它们的免疫原性可能性以及它们与清除因子结合的能力。
在巴斯德毕赤氏酵母中制造的糖蛋白已经被报道含有β-连接的甘露糖残基。在2003年,Trimble等(Glycobiol. 14: 265-274, Epub Dec 23)报道了在巴斯德毕赤氏酵母中表达的重组的人胆汁盐刺激脂肪酶(hBSSL)中β-1,2-连接的甘露糖残基的存在。已经在巴斯德毕赤氏酵母和白色念珠菌(Candida albicans)中鉴定了编码几种β-甘露糖基转移酶的基因(参见美国专利No. 7,465,577 和Mille et al., J.
Biol. Chem. 283: 9724-9736(2008))。
根据上文,需要提供在甲基营养型酵母例如巴斯德毕赤氏酵母中制造重组治疗蛋白质或糖蛋白的方法,所述重组治疗蛋白质或糖蛋白缺乏在施用所述重组治疗蛋白质或糖蛋白的个体中可能引发不良反应的表位。确定重组治疗蛋白质或糖蛋白在施用给个体时是否提供了引发不良反应的风险的方法,是将重组治疗蛋白质或糖蛋白与针对总宿主细胞抗原制备的抗体接触。对于预期长期施用的蛋白质或糖蛋白这是特别关注的。缺乏与抗体的交叉结合表明所述重组治疗蛋白质或糖蛋白缺乏与所述抗体的可检测的交叉结合活性,并且当施用给个体时不太可能引发不良反应。因而,需要生产重组治疗蛋白质或糖蛋白的方法,所述重组治疗蛋白质或糖蛋白缺乏与所述抗体的可检测的交叉结合活性,并且当施用给个体时不太可能引发不良反应。
发明内容
本发明提供了在甲基营养型酵母例如巴斯德毕赤氏酵母中生产蛋白质和糖蛋白的方法,所述蛋白质和糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。特别地,本发明提供了利用重组的甲基营养型酵母例如巴斯德毕赤氏酵母菌株来生产重组蛋白质和糖蛋白的方法,所述酵母不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,并且不展现选自β-甘露糖基转移酶1、β-甘露糖基转移酶3和β-甘露糖基转移酶4的对于N-聚糖或O-聚糖的至少一种活性。在一个方面,所述宿主细胞是巴斯德毕赤氏酵母菌株,其中编码β-甘露糖基转移酶2的BMT2基因,以及编码选自β-甘露糖基转移酶1、3和4的β-甘露糖基转移酶的至少一种基因(分别为基因BMT1、BMT3、BMT4)被删除或破坏或突变以产生无活性的β-甘露糖基转移酶,来生产重组蛋白质和糖蛋白。在其他方面β-甘露糖基转移酶1、β-甘露糖基转移酶3和β-甘露糖基转移酶4的一种或更多种的活性利用β-甘露糖基转移酶抑制物来取消,所述抑制物包括但不限于化合物、针对编码β-甘露糖基转移酶的一种或更多种mRNA的反义DNA,针对编码β-甘露糖基转移酶的一种或更多种mRNA的siRNA。
这些重组巴斯德毕赤氏酵母菌株可以生产蛋白质和糖蛋白,在其上缺乏可检测的α-甘露糖苷酶抗性的β-甘露糖残基。本发明进一步提供了在巴斯德毕赤氏酵母中生产双唾液酸化的人促红细胞生成素的方法,所述双唾液酸化的人促红细胞生成素缺乏与针对宿主细胞抗原的抗体的可检测的交叉结合活性。所述方法和宿主细胞允许产生重组治疗蛋白质和糖蛋白,与此处公开的未修饰的菌株中生产的相比,其在施用所述重组治疗蛋白质和糖蛋白的个体中具有引发不良反应的降低的风险。所述方法和宿主细胞对于生产具有结合清除因子的更低可能性的重组蛋白质或糖蛋白也是有用的。
在一个方面,本发明提供了重组甲基营养型酵母例如巴斯德毕赤氏酵母宿主细胞,其不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,并且不展现选自β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的、对N-聚糖或O-聚糖的至少一种活性,并且其包括编码所述重组糖蛋白的核酸分子。在进一步的实施方式中,所述宿主细胞不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性。在进一步的实施方式中,所述宿主细胞进一步不展现对N-聚糖或O-聚糖的β-甘露糖基转移酶4活性。在另一个方面,本发明提供了重组甲基营养型酵母例如巴斯德毕赤氏酵母宿主细胞,其具有编码β-甘露糖基转移酶2活性的基因的删除或破坏,以及选自编码β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的基因的至少一种基因的删除或破坏,并且其包括编码所述重组糖蛋白的核酸分子。在进一步的实施方式中,所述宿主细胞具有编码β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的基因的删除或破坏。在进一步的实施方式中,所述宿主细胞具有编码β-甘露糖基转移酶4活性的基因的删除或破坏。
在另一个方面,本发明提供了重组巴斯德毕赤氏酵母宿主细胞,其中β-甘露糖基转移酶2(BMT2)基因和选自β-甘露糖基转移酶1(BMT1)和β-甘露糖基转移酶3(BMT3)的至少一种基因被删除或破坏,并且其包括编码所述重组蛋白质或糖蛋白的核酸分子。在进一步的实施方式中,β-甘露糖基转移酶2(BMT2)、β-甘露糖基转移酶1(BMT1)和β-甘露糖基转移酶3(BMT3)基因被删除。在进一步的实施方式中,所述宿主细胞进一步包括β-甘露糖基转移酶4(BMT4)基因的删除或破坏。
在另一个方面,本发明提供了在甲基营养型酵母例如巴斯德毕赤氏酵母中生产重组糖蛋白的方法,所述重组糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述方法包括提供重组宿主细胞,所述重组宿主细胞不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,不展现选自β-甘露糖基转移酶1和β-甘露糖基转移酶3的对于N-聚糖或O-聚糖的至少一种活性,以及其包括编码所述重组蛋白质或糖蛋白的核酸分子;在对表达所述重组糖蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基中回收所述重组糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的重组糖蛋白。在进一步的实施方式中,所述宿主细胞不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性。在进一步的实施方式中,所述宿主细胞进一步不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶4活性。
在另一个方面,本发明提供了在甲基营养型酵母例如巴斯德毕赤氏酵母中生产重组糖蛋白的方法,所述重组糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述方法包括提供重组宿主细胞,所述重组宿主细胞具有编码β-甘露糖基转移酶2活性的基因的删除或破坏,以及编码选自β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的活性的至少一种基因的删除或破坏,以及其包括编码所述重组蛋白质或糖蛋白的核酸分子;在对表达所述重组糖蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基中回收所述重组糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的重组糖蛋白。在进一步的实施方式中,所述宿主细胞具有编码β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的基因的删除或破坏。在进一步的实施方式中,所述宿主细胞具有编码β-甘露糖基转移酶4活性的基因的删除或破坏。
在另一个方面,本发明提供了在巴斯德毕赤氏酵母中生产重组糖蛋白的方法,所述重组糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述方法包括提供重组巴斯德毕赤氏酵母宿主细胞,其中β-甘露糖基转移酶2(BMT2)基因和选自β-甘露糖基转移酶1(BMT1)和β-甘露糖基转移酶3(BMT3)的至少一种基因被删除或破坏,并且其包括编码所述重组蛋白质或糖蛋白的核酸分子; 在对表达所述重组糖蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基中回收所述重组糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的重组糖蛋白。在进一步的实施方式中,所述β-甘露糖基转移酶2(BMT2)、β-甘露糖基转移酶1(BMT1)和β-甘露糖基转移酶3(BMT3)基因被删除或破坏。在进一步的实施方式中,所述宿主细胞进一步包括β-甘露糖基转移酶(BMT4)基因的删除或破坏。一般地,与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性在例如夹心ELISA或Western印迹的分析中测定。所述方法对于生产治疗蛋白质或糖蛋白是特别有用的。治疗蛋白质或糖蛋白的实例包括但不限于促红细胞生成素(EPO);细胞因子例如干扰素α、干扰素β、干扰素γ和干扰素ω;以及粒细胞-集落刺激因子(GCSF);GM-CSF;凝血因子例如因子VIII、因子IX和人类蛋白质C;抗凝血酶III;凝血酶;可溶的IgE受体α链;免疫球蛋白例如IgG、IgG片段、IgG融合物和IgM;免疫粘附素和其他Fc融合蛋白,例如可溶的TNF受体-Fc融合蛋白;RAGE-Fc融合蛋白;白细胞介素;尿激酶;胃促胰酶;和脲胰蛋白酶抑制物;IGF-结合蛋白;表皮生长因子;生长激素释放因子;annexin V融合蛋白;血管抑素;血管内皮生长因子-2;骨髓祖代抑制因子-1;护骨素(osteoprotegerin);α-1-抗胰蛋白酶;α-feto蛋白;DNase II;人类血纤蛋白溶解酶原的kringle 3;葡糖脑苷脂酶;TNF结合蛋白1;促滤泡激素;细胞毒T淋巴细胞相关抗原4– Ig;跨膜激活物和钙调节物和亲环蛋白(cyclophilin)配体;高血糖素样蛋白质1;和IL-2受体激动剂。
在宿主细胞或方法的特定实施方式中,编码所述重组蛋白质或糖蛋白的核酸分子的核酸序列的密码子为了在巴斯德毕赤氏酵母表达而被优化。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞被遗传工程化来产生具有人类样N-聚糖的糖蛋白。
在宿主细胞或方法的进一步的实施方式中,宿主细胞进一步不展现对于糖蛋白上的N-聚糖的α1,6-甘露糖基转移酶活性,并且包括与细胞靶向信号肽融合的α1,2-甘露糖苷酶催化结构域,所述细胞靶向信号肽通常不与所述催化结构域相连,并且被选择以将α1,2-甘露糖苷酶活性靶向宿主细胞的ER或高尔基体。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞进一步包括与细胞靶向信号肽融合的GlcNAc转移酶I催化结构域,所述细胞靶向信号肽通常不与所述催化结构域相连,并且被选择以将GlcNAc转移酶I活性靶向宿主细胞的ER或高尔基体。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞进一步包括与细胞靶向信号肽融合的甘露糖苷酶II催化结构域,所述细胞靶向信号肽通常不与所述催化结构域相连,并且被选择以将甘露糖苷酶II活性靶向宿主细胞的ER或高尔基体。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞进一步包括与细胞靶向信号肽融合的GlcNAc转移酶II催化结构域,所述细胞靶向信号肽通常不与所述催化结构域相连,并且被选择以将GlcNAc转移酶II活性靶向宿主细胞的ER或高尔基体。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞进一步包括与细胞靶向信号肽融合的半乳糖基转移酶催化结构域,所述细胞靶向信号肽通常不与所述催化结构域相连,并且被选择以将半乳糖基转移酶活性靶向宿主细胞的ER或高尔基体。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞进一步包括与细胞靶向信号肽融合的唾液酸转移酶催化结构域,所述细胞靶向信号肽通常不与所述催化结构域相连,并且被选择以将唾液酸转移酶活性靶向宿主细胞的ER或高尔基体。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞进一步包括与细胞靶向信号肽融合的岩藻糖基转移酶催化结构域,所述细胞靶向信号肽通常不与所述催化结构域相连,并且被选择以将岩藻糖基转移酶活性靶向宿主细胞的ER或高尔基体。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞进一步包括选自由GnTIII、GnTIV、GnTV、GnTVI和GnTIX构成的组的一种或更多种GlcNAc转移酶。
在宿主细胞或方法的再进一步的实施方式中,所述宿主细胞被遗传工程化以产生糖蛋白,所述糖蛋白主要具有选自Man5GlcNAc2、GlcNAcMan5GlcNAc2、GalGlcNAcMan5GlcNAc2、NANAGalGlcNAcMan5GlcNAc2、GlcNAcMan3GlcNAc2、GlcNAc( 1-4 )Man3GlcNAc2、Gal( 1-4 )GlcNAc( 1-4 )Man3GlcNAc2、和NANA( 1-4 )Gal( 1-4 )GlcNAc( 1-4 )Man3GlcNAc2的N-聚糖,其中下标表示N-聚糖结构上特定糖残基的数目。N-聚糖结构的实例包括但不限于 Man5GlcNAc2、GlcNAcMan5GlcNAc2、GlcNAcMan3GlcNAc2、GlcNAc2Man3GlcNAc2、GlcNAc3Man3GlcNAc2、GlcNAc4Man3GlcNAc2、GalGlcNAc2Man3GlcNAc2、Gal2GlcNAc2Man3GlcNAc2、Gal2GlcNAc3Man3GlcNAc2、Gal2GlcNAc4Man3GlcNAc2、Gal3GlcNAc3Man3GlcNAc2、Gal3GlcNAc4Man3GlcNAc2、Gal4GlcNAc4Man3GlcNAc2、NANAGal2GlcNAc2Man3GlcNAc2、NANA2Gal2GlcNAc2Man3GlcNAc2、NANA3Gal3GlcNAc3Man3GlcNAc2和 NANA4Gal4GlcNAc4Man3GlcNAc2。
进一步的提供的是组合物,其包含使用上述宿主细胞的任一种通过上述方法获得的一种或更多种重组糖蛋白。
在进一步的方面中,本发明提供了重组甲基营养型酵母例如巴斯德毕赤氏酵母宿主细胞,其不展现β-甘露糖基转移酶2活性和选自β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的至少一种活性,以及其包括两种或更多种核酸分子,各自编码融合蛋白,所述融合蛋白包含融合到信号肽的成熟的人促红细胞生成素,所述信号肽靶向ER,并且当所述融合蛋白处于ER中时被除去。在特定的实施方式中,所述宿主细胞进一步不展现β-甘露糖基转移酶4活性。
在进一步的方面中,本发明提供了重组甲基营养型酵母例如巴斯德毕赤氏酵母宿主细胞,其具有编码β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的基因的删除或破坏,并且其包括两种或更多种核酸分子,各自编码融合蛋白,所述融合蛋白包含融合到信号肽的成熟的人促红细胞生成素,所述信号肽靶向ER,并且当所述融合蛋白处于ER中时被除去。在特定的实施方式中,所述宿主细胞进一步包括编码β-甘露糖基转移酶4活性的基因的删除或破坏。
在进一步的方面中,本发明提供了重组巴斯德毕赤氏酵母宿主细胞,其具有β-甘露糖基转移酶2(BMT2)基因和选自β-甘露糖基转移酶1(BMT1)和β-甘露糖基转移酶3(BMT3)基因的至少一种基因的删除或破坏,并且其包括两种或更多种核酸分子,各自编码融合蛋白,所述融合蛋白包含融合到信号肽的成熟的人促红细胞生成素,所述信号肽靶向ER,并且当所述融合蛋白处于ER中时被除去。在特定的实施方式中,所述宿主细胞进一步包括编码β-甘露糖基转移酶4(BMT4)基因的基因的删除或破坏。
在再进一步的方面中,本发明提供了在甲基营养型酵母例如巴斯德毕赤氏酵母中生产成熟的人促红细胞生成素的方法,所述酵母主要包含唾液酸封端的双分枝N-聚糖,并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述方法包括: 提供重组宿主细胞,其不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,不展现选自β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的对于N-聚糖或O-聚糖的至少一种活性,被遗传工程化以产生唾液酸封端的双分枝N-聚糖,并且其包括两种或更多种核酸分子,各自编码融合蛋白,所述融合蛋白包含融合到信号肽的成熟的人促红细胞生成素,所述信号肽靶向ER,并且当所述融合蛋白处于ER中时被除去;在对表达和加工所述第一和第二融合蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基回收所述成熟的人促红细胞生成素,来产生所述成熟的人促红细胞生成素,其主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。在进一步的实施方式中,所述宿主细胞不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性。在进一步的实施方式中,所述宿主细胞进一步不展现β-甘露糖基转移酶4活性。
在再进一步的方面中,本发明提供了在甲基营养型酵母例如巴斯德毕赤氏酵母中生产成熟的人促红细胞生成素的方法,所述酵母主要包含唾液酸封端的双分枝N-聚糖,并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述方法包括: 提供重组宿主细胞,其被遗传工程化以产生唾液酸封端的双分枝N-聚糖,其中编码β-甘露糖基转移酶2活性的基因以及编码选自β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的活性的至少一种基因被删除或破坏,并且其包括两种或更多种核酸分子,各自编码融合蛋白,所述融合蛋白包含融合到信号肽的成熟的人促红细胞生成素,所述信号肽靶向ER,并且当所述融合蛋白处于ER中时被除去;在对表达和加工所述第一和第二融合蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基回收所述成熟的人促红细胞生成素,来产生所述成熟的人促红细胞生成素,其主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。在进一步的实施方式中,所述宿主包含编码β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的基因的删除或破坏。在进一步的实施方式中,所述宿主细胞进一步包括编码β-甘露糖基转移酶3活性的基因的删除或破坏。
在再进一步的方面中,本发明提供了在巴斯德毕赤氏酵母中生产成熟的人促红细胞生成素的方法,所述巴斯德毕赤氏酵母主要包含唾液酸封端的双分枝N-聚糖,并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,包括: 提供重组巴斯德毕赤氏酵母宿主细胞,其被遗传工程化以产生唾液酸封端的双分枝N-聚糖,其中β-甘露糖基转移酶2(BMT2)基因和选自β-甘露糖基转移酶1(BMT1)和β-甘露糖基转移酶3(BMT3)基因的至少一种基因被删除或破坏,并且其包括两种或更多种核酸分子,各自编码融合蛋白,所述融合蛋白包含融合到信号肽的成熟的人促红细胞生成素,所述信号肽靶向ER,并且当所述融合蛋白处于ER中时被除去;在对表达和加工所述第一和第二融合蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基回收所述成熟的人促红细胞生成素,来产生所述成熟的人促红细胞生成素,其主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。在进一步的实施方式中,所述宿主包含β-甘露糖基转移酶2(BMT2)基因、β-甘露糖基转移酶1(BMT1)基因和β-甘露糖基转移酶3(BMT3)基因的删除或破坏。在进一步的实施方式中,所述宿主细胞进一步包括β-甘露糖基转移酶3基因(BMT4)的删除或破坏。
在宿主细胞或方法的特定的实施方式中,融合到促红细胞生成素的N-末端的信号肽是酿酒酵母(S. cerevisiae)αMATpre信号肽或鸡溶菌酶信号肽。
在宿主细胞或方法的进一步的实施方式中,至少一种核酸分子编码融合蛋白,其中促红细胞生成素融合到酿酒酵母αMATpre信号肽,以及至少一种核酸分子编码融合蛋白,其中促红细胞生成素融合到酿酒酵母αMATpre信号肽、鸡溶菌酶信号肽。
在宿主细胞或方法的进一步的实施方式中,编码促红细胞生成素的核酸分子的核酸序列的密码子为了在巴斯德毕赤氏酵母中表达而被优化。
在方法的进一步的实施方式中,从所述培养基回收所述成熟的人促红细胞生成素包括阳离子交换层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
在方法的进一步的实施方式中,从所述培养基回收所述成熟的人促红细胞生成素包括羟磷灰石层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
在方法的进一步的实施方式中,从所述培养基回收所述成熟的人促红细胞生成素包括阴离子交换层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
在方法的进一步的实施方式中,从所述培养基回收所述成熟的人促红细胞生成素包括阳离子交换层析步骤,随后是羟磷灰石层析步骤,其任选地跟随着阴离子交换层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
本发明进一步提供了组合物,其包含利用上述宿主细胞从上述方法获得的成熟的人促红细胞生成素以及药学上可接受的盐,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。在特定的实施方式中,约50到60%的N-聚糖包含位于两个分枝上的唾液酸残基;在进一步的实施方式中,大于70%的N-聚糖包含位于两个分枝上的唾液酸残基;在进一步的实施方式中,大于80%的N-聚糖包含位于两个分枝上的唾液酸残基。在进一步的方面中,小于30%的N-聚糖是中性的N-聚糖(即,在N-聚糖的非还原末端处的至少一个末端上不是唾液酸化的)。在再进一步的方面中,小于20%的N-聚糖是中性的N-聚糖。在特定的方面中,约99%的N-聚糖含有一个或更多个唾液酸残基,以及小于1%的N-聚糖是中性的N-聚糖。在进一步的方面中,提供了组合物,其中存在每摩尔rhEPO 4.5摩尔或更多的唾液酸。在进一步的方面中,提供了组合物,其中存在每摩尔rhEPO 至少5.0摩尔的唾液酸。
在组合物的进一步的实施方式中,所述成熟的人促红细胞生成素共轭到亲水性聚合物,在特定的方面中所述亲水性聚合物是聚乙二醇聚合物,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。在特定的实施方式中,所述聚乙二醇聚合物共轭到所述成熟的人促红细胞生成素的N-末端,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
定义
如在此使用的,术语“N-聚糖”和“糖形式”可互换地使用,是指N-连接的低聚糖,例如,通过天冬酰胺-N-乙酰葡萄糖胺连键与多肽的天冬酰胺残基连接的低聚糖。N-连接的糖蛋白含有与蛋白质中的天冬酰胺残基的酰胺氮连接的N-乙酰葡萄糖胺残基。糖蛋白中存在的主要糖类是葡萄糖、半乳糖、甘露糖、岩藻糖、N-乙酰半乳糖胺(GalNAc)、N-乙酰葡萄糖胺(GlcNAc)和唾液酸(例如,N-乙酰-神经氨酸(NANA))。对于N-连接的糖蛋白,糖基团的加工与翻译共同地发生于ER的腔中,并在翻译后在高尔基体中继续。
N-聚糖具有共同的Man3GlcNAc2 的五糖核心(“Man”是指甘露糖;“Glc”是指葡萄糖;“NAc”是指N-乙酰基;GlcNAc是指N-乙酰葡萄糖胺)。N-聚糖根据包含外周糖类(例如,GlcNAc、半乳糖、岩藻糖和唾液酸)的分枝(触角)的数目而不同,所述外周糖类被添加到Man3GlcNAc2(“Man3”)核心结构,所述核心结构也称作“三甘露糖核心”、“五糖核心”或“少甘露糖核心”。N-聚糖根据它们的分枝成分来分类(例如,高甘露糖、复合的或杂合的)。“高甘露糖”型N-聚糖具有五个或更多个甘露糖残基。“复合”型N-聚糖一般具有连接到1,3甘露糖臂的至少一个GlcNAc,和连接于“三甘露糖”核心的1,6甘露糖臂的至少一个GlcNAc。复合N-聚糖也可以具有半乳糖(“Gal”)或N-乙酰半乳糖胺(“GalNAc”)残基,其任选地用唾液酸或衍生物修饰(例如,“NANA”或“NeuAc”,其中“Neu”是指神经氨酸,“Ac”是指乙酰基)。复合N-聚糖还可以具有链内的取代,其包含“二分的(bisecting)”GlcNAc和核心岩藻糖(“Fuc”)。复合N-聚糖还可以具有“三甘露糖核心”上的多分枝,常称为“多分枝聚糖”。“杂合”N-聚糖具有在三甘露糖核心的1,3甘露糖臂的末端上的至少一个GlcNAc,以及三甘露糖核心的1,6甘露糖臂上的零个或更多个甘露糖。各种N-聚糖也被称为“糖形式”。
在此使用的缩写具有本领域通用的用途,参见,例如,上述的糖类缩写。其他常见的缩写包括“PNGase”或“聚糖酶”或“糖苷酶”,其都是指肽N-糖苷酶F(EC 3.2.2.18)。
如在此使用的,术语“重组宿主细胞(“表达宿主细胞”、“表达宿主系统”、“表达系统”或简称“宿主细胞”)意图指已经导入重组载体的细胞。要理解的是,这种术语不仅仅意图指特定的主题细胞,还指这种细胞的子代。由于突变或环境影响在继承的代中可能出现某些改变,实际上,这种子代可能不与母细胞相同,但仍然包括在此处使用的术语“宿主细胞”的范围内。重组宿主细胞可以是在培养物中生长的分离的细胞或细胞系,或可以是存在于活组织或生物体中的细胞。优选的宿主细胞是酵母和真菌。
“不展现”酶活性的宿主细胞是指一种宿主细胞,其中所述酶活性已经被取消或破坏。例如,通过删除或破坏编码酶活性的基因(包括删除或破坏控制基因表达的上游或下游调节序列)可以取消或破坏酶活性;通过突变编码酶活性的基因使得编码酶活性的基因无功能来取消或破坏酶活性;通过使用酶活性化学、肽或蛋白质抑制物来取消或破坏酶活性;通过使用基于核酸的表达抑制物,例如反义DNA和siRNA来取消或破坏酶活性;以及,通过使用转录抑制物或调节因子的表达或活性的抑制物来取消或破坏酶活性,所述调节因子控制或调节编码酶活性的基因的表达。
当涉及糖蛋白制品中存在的聚糖的“摩尔百分比”时,该术语是指当蛋白质制品用PNG'ase处理、然后通过不受糖形式组成影响的方法来定量时,所释放的N-连接的寡聚糖的库中存在的特定聚糖的摩尔百分比(例如,用荧光标签例如2- 氨基苯甲酰胺标记PNG'ase释放的聚糖库,然后通过高效液相层析法或毛细管电泳分离,然后通过荧光强度定量聚糖)。例如,50摩尔百分比的NANA2Gal2GlcNAc2Man3GlcNAc2是指,释放的聚糖的百分之50是NANA2Gal2GlcNAc2Man3GlcNAc2,其余百分之50包含其他N-连接的寡聚糖。在实施方式中,糖蛋白的制品中特定聚糖的摩尔百分比将在20%到100%之间,优选的高于25%、30%、35%、40%或45%,更优选的高于50%、55%、60%、65%或70%,以及最优选的高于75%、80%、85%、90%或95%。
如在此使用的,术语“主要地”或变体如“主要”或“主要的是”将被理解为意思是,在糖蛋白用PNGase处理、通过质谱法例如MALDI-TOF MS分析释放的聚糖之后,在总的N-聚糖中具有最高摩尔百分比(%)的聚糖种类。换句话说,用语“主要地”被定义为单个实体,例如特定的糖形式,其以比任何其他的单独实体更高的摩尔百分比存在。例如,如果组合物由40摩尔百分比的A种类、35摩尔百分比的B种类和25摩尔百分比的C种类组成,该组合物主要地包含A种类。
术语“治疗有效量”是指本发明的重组促红细胞生成素的量,其给予了为患者提供益处的血细胞比容的提高。所述量将在一个个体与另一个之间不同,将取决于许多因素,包括患者的总体身体状态以及贫血的基础病因。例如,对于患有慢性肾衰竭的患者,本发明的促红细胞生成素的治疗有效量可以基于治疗的适应症在20到300单位/kg或0.5μg/kg到500μg/kg的范围内。术语“单位”是指用于评估促红细胞生成素组合物的活性的领域公知的单位。一毫克纯的促红细胞生成素大约相当于150,000单位。给药日程表可以是每周约三次到每四周或六周约一次。实际的日程表将取决于许多因素,包括向患者施用的促红细胞生成素的类型(EPO或聚乙二醇化的-EPO)以及各个患者的响应。更高的剂量范围一般不在贫血应用中使用,但是对于其他治疗应用是有用的。对于患者实现和建立合适的促红细胞生成素剂量的手段是本领域公知的和常规实践的。
患者与患者之间给予的量和给药日程表的变化,通过与量或日程表一起地提及术语“约”来包括。用于治疗的促红细胞生成素的量给出了可接受的血细胞比容提高速率,并且将血细胞比容维持在有益的水平(例如,通常至少约30%,一般在30%到36%的范围内)。当前组合物的治疗有效量可以由本领域技术人员使用公众可获得的材料和操作来容易地确定。另外,在治疗期间可以给予患者铁来维持提高的红细胞生成。给予的量可以通过本领域技术人员通常使用的方法来容易地确定。
附图说明
附图1A-J显示了从野生型菌株NRRL-Y11430(附图1A)开始的、巴斯德毕赤氏酵母菌株YGLY3159(附图1E)和菌株YGLY7113到YGLY7122(附图1I)的家系。
附图2显示了质粒pGLY6的图谱。质粒pGLY6是靶向URA5座位的整合载体,含有包含酿酒酵母转化酶基因或转录单元(ScSUC2)的核酸分子,其一侧是包含来自巴斯德毕赤氏酵母URA5基因的5'区域(PpURA5-5')的核苷酸序列的核酸分子,另一侧是包含来自巴斯德毕赤氏酵母URA5基因的3'区域(PpURA5-3')的核苷酸序列的核酸分子。
附图3显示了质粒pGLY40的图谱。质粒pGLY40是靶向OCH1座位的整合载体,含有包含巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5)的核酸分子,其侧翼是包含lacZ重复的核酸分子(lacZ重复),随后在一侧是包含来自OCH1基因的5'区域(PpOCH1-5')的核苷酸序列的核酸分子,在另一侧是来自OCH1基因的3'区域(PpOCH1-3')的核苷酸序列的核酸分子。
附图4显示了质粒pGLY43a的图谱。质粒pGLY43a是靶向BMT2座位的整合载体,含有包含乳酸克鲁维酵母 UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)转运蛋白基因或转录单元(KlGlcNAc Transp.)的核酸分子,其邻近于侧翼是包含lacZ重复的核酸分子(lacZ重复)的、包含巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5)的核酸分子,所述邻近的基因一侧是包含来自BMT2基因的5'区域(PpPBS2-5')的核苷酸序列的核酸分子,另一侧是包含来自BMT2基因的3'区域(PpPBS2-3')的核苷酸序列的核酸分子。
附图5显示了质粒pGLY48的图谱。质粒pGLY48是靶向MNN4L1座位的整合载体,含有表达盒,所述表达盒包含编码UDP-GlcNAc转运蛋白的小鼠同源物(MmGlcNAc Transp.)开放阅读框(ORF)的核酸分子,其在5'末端可操作地连接到包含酿酒酵母GAPDH启动子(PpGAPDH Prom)的核酸分子,和在3’末端可操作地连接到包含酿酒酵母CYC终止序列(ScCYC TT)的核酸分子,邻近于侧翼是lacZ重复(lacZ重复)的、包含巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5)的核酸分子,其中所述表达盒整体上在一侧是包含来自巴斯德毕赤氏酵母MNN4L1基因的5'区域(PpMNN4L1-5 ')的核苷酸序列的核酸分子,并且在另一侧包含来自MNN4L1基因的3’区域(PpMNN4L1-3’)的核苷酸序列的核酸分子。
附图6显示了质粒pGLY45的图谱。质粒pGLY45是靶向PNO1/MNN4座位的整合载体,含有包含巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5)的核酸分子,其侧翼是包含lacZ重复的核酸分子(lacZ重复),随后在一侧是包含来自PNO1基因的5'区域(PpPNO1-5')的核苷酸序列的核酸分子,在另一侧是来自MNN4基因的3'区域(PpMNN4-3')的核苷酸序列的核酸分子。
附图7显示了质粒pGLY247的图谱。质粒pGLY247是靶向MET16座位的整合载体,含有包含巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5)的核酸分子,其侧翼是包含lacZ重复的核酸分子(lacZ重复),随后在一侧是包含来自MET16基因的5'区域(PpMET16-5')的核苷酸序列的核酸分子,在另一侧是来自MET16基因的3'区域(PpMET16-3')的核苷酸序列的核酸分子。
附图8显示了质粒pGLY248的图谱。质粒pGLY248是靶向URA5座位的整合载体,含有包含巴斯德毕赤氏酵母MET16基因或转录单元(PpMET16)的核酸分子,其一侧是包含来自URA5基因的5'区域(PpURA5-5')的核苷酸序列的核酸分子,另一侧是包含来自URA5基因的3'区域(PpURA5-3')的核苷酸序列的核酸分子。
附图9显示了质粒pGLY582的图谱。质粒pGLY582是靶向HIS1座位的整合载体,含有串联的四个表达盒,它们编码(1)酿酒酵母UDP-葡萄糖差向异构酶(ScGAL10),(2)在N-末端与酿酒酵母KRE2-s前导区肽(33)融合的人半乳糖基转移酶I(hGalT)催化结构域,(3)侧翼是lacZ重复(lacZ重复)的巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5),和(4)黑腹果蝇(D. melanogaster)UDP-半乳糖转运蛋白(DmUGT)。所有的表达盒侧面都是HIS1基因的5'区域(PpHIS1-5')和HIS1基因的3'区域(PpHIS1-3')。PMA1是巴斯德毕赤氏酵母PMA1启动子;PpPMA1 TT是巴斯德毕赤氏酵母PMA1终止序列;GAPDH是巴斯德毕赤氏酵母GADPH启动子,ScCYC TT是酿酒酵母CYC终止序列;PpOCH1 Prom是巴斯德毕赤氏酵母OCH1启动子,PpALG12 TT是巴斯德毕赤氏酵母ALG12终止序列。
附图10显示了质粒pGLY167b的图谱。质粒pGLY167b是靶向ARG1座位的整合载体,含有串联的三个表达盒,它们编码(1)在N-末端与酿酒酵母MNN2前导区肽融合的黑腹果蝇甘露糖苷酶II催化结构域(密码子优化的)(CO-KD53),(2)巴斯德毕赤氏酵母HIS1基因或转录单元,以及(3)在N-末端与酿酒酵母MNN2前导区肽融合的大鼠N-乙酰葡萄糖胺(GlcNAc)转移酶II催化结构域(密码子优化的)(CO-TC54)。所有的表达盒侧面都是ARG1基因的5'区域(PpARG1-5')和ARG1基因的3'区域(PpARG1-3')。PpPMA1 Prom是巴斯德毕赤氏酵母PMA1启动子;PpPMA1 TT是巴斯德毕赤氏酵母PMA1终止序列;PpGAPDH是巴斯德毕赤氏酵母GADPH启动子,ScCYC TT是酿酒酵母CYC终止序列;PpOCH1 Prom是巴斯德毕赤氏酵母OCH1启动子;PpALG12 TT是巴斯德毕赤氏酵母ALG12终止序列。
附图11显示了质粒pGLY1430的图谱。质粒pGLY1430是靶向ADE1座位、不破坏该座位表达的KINKO整合载体,含有串联的四个表达盒,它们编码(1)在N-末端与巴斯德毕赤氏酵母SEC12前导区肽融合的人GlcNAc转移酶I催化结构域(密码子优化的)(CO-NA10),(2)UDP-GlcNAc转运蛋白的小鼠同源物(MmTr),(3)在N-末端与酿酒酵母SEC12前导区肽融合的小鼠甘露糖苷酶IA催化结构域(FB)(FB8),以及(4)侧翼是lacZ重复(lacZ)的巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5)。所有的表达盒侧面都是ADE1基因的5'区域和ORF(ADE1 5'和ORF)和ADE1基因的3'区域(PpADE1-3')。PpPMA1 prom是巴斯德毕赤氏酵母PMA1启动子;PpPMA1 TT是巴斯德毕赤氏酵母PMA1终止序列;SEC4是巴斯德毕赤氏酵母SEC4启动子;OCH1 TT是巴斯德毕赤氏酵母OCH1终止序列;ScCYC TT是酿酒酵母CYC终止序列;PpOCH1 Prom是巴斯德毕赤氏酵母OCH1启动子;PpALG3 TT是巴斯德毕赤氏酵母ALG3终止序列;以及PpGAPDH是巴斯德毕赤氏酵母GADPH启动子。
附图12显示了质粒pGFI165的图谱。质粒pGFI165是靶向PRO1座位、不破坏该座位的表达的KINKO整合载体,含有表达盒,它们编码(1)在N-末端与酿酒酵母αMATpre信号肽融合的李氏木霉α-1,2-甘露糖苷酶催化结构域(aMATTrMan),以将嵌合蛋白靶向分泌途径并从细胞分泌;以及(2)侧翼是lacZ重复(lacZ重复)的巴斯德毕赤氏酵母URA5基因或转录单元。所有的表达盒侧面都是PRO1基因的5'区域和ORF(5' PRO1orf)以及PRO1基因的3'区域(3' PRO)。ScCYC TT是酿酒酵母CYC终止序列;PpALG3 TT是巴斯德毕赤氏酵母ALG3终止序列;以及PpGAPDH是巴斯德毕赤氏酵母GADPH启动子。
附图13显示了质粒pGLY2088的图谱。质粒pGLY2088是靶向TRP2或AOX1座位的整合载体,含有编码以下的表达盒(1)在N-末端与酿酒酵母αMATpre信号肽(alpha MF-pre)融合以将嵌合蛋白靶向分泌途径并从细胞分泌的、密码子优化的成熟人促红细胞生成素(co-hEPO),和(2)zeocin抗性蛋白(ZeocinR)。表达盒在一端侧面是巴斯德毕赤氏酵母AOX1启动子(PpAOX1 Prom),在另一端是巴斯德毕赤氏酵母TRP2基因或转录单元(PpTRP2)。ScCYC TT是酿酒酵母CYC终止序列,ScTEF Prom是酿酒酵母TEF1启动子。
附图14显示了质粒pGLY2456的图谱。质粒pGLY2456是靶向TRP2座位而不破坏座位表达的KINKO整合载体,含有编码以下的六个表达盒(1)密码子优化的小鼠CMP唾液酸转运蛋白(CO mCMP-Sia Transp),(2)密码子优化的人UDP-GlcNAc 2-差向异构酶/N-乙酰甘露糖胺激酶(CO hGNE),(3)巴斯德毕赤氏酵母ARG1基因或转录单元,(4)密码子优化的人CMP-唾液酸合酶(CO hCMP-NANA S),(5)密码子优化的人N-乙酰神经氨酸-9-磷酸合酶(CO hSIAP S),和 (6)在N-末端与酿酒酵母KRE2前导肽融合的密码子优化的小鼠a-2,6-唾液酸转移酶催化结构域(comST6-33)。所有的表达盒侧面都是TRP2基因的5'区域和ORF(PpTRP2 5')和TRP2基因的3'区域(PpTRP2-3')。PpPMA1 prom是巴斯德毕赤氏酵母PMA1启动子;PpPMA1 TT是巴斯德毕赤氏酵母PMA1终止序列;CYC TT是酿酒酵母CYC终止序列;PpTEF Prom是巴斯德毕赤氏酵母TEF1启动子;PpTEF TT是巴斯德毕赤氏酵母TEF1终止序列;PpALG3 TT是巴斯德毕赤氏酵母ALG3终止序列;以及pGAP是巴斯德毕赤氏酵母GAPDH启动子。
附图15显示了质粒pGLY3411(pSH1092)的图谱。质粒pGLY3411(pSH1092)是含有表达盒的整合载体,所述表达盒包含侧翼是lacZ重复(lacZ重复)的巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5),其一侧是巴斯德毕赤氏酵母BMT4基因的5'核苷酸序列(PpPBS4 5'),另一侧是巴斯德毕赤氏酵母BMT4基因的3'核苷酸序列(PpPBS4 3')。
附图16显示了质粒pGLY3430(pSH1115)的图谱。质粒pGLY3430(pSH1115)是包含表达盒的整合载体,所述表达盒包含核酸分子,其编码与棉阿舒囊霉(Ashbya gossypii ) TEF1启动子(PTEF)和棉阿舒囊霉TEF1终止序列(TTEF)可操作连接的诺尔丝菌素抗性ORF(NAT),在一侧是巴斯德毕赤氏酵母BMT1基因的5'核苷酸序列(PBS1 5'),在另一侧是巴斯德毕赤氏酵母BMT1基因的3'核苷酸序列(PBS1 3')。
附图17显示了质粒pGLY4472(pSH1186)的图谱。质粒pGLY4472(pSH1186)含有表达盒,所述表达盒包含核酸分子,其编码与棉阿舒囊霉TEF1启动子(pTEF)和棉阿舒囊霉TEF1终止序列(TRFtt)可操作连接的E.coli潮霉素B磷酸转移酶基因ORF(Hyg),在一侧是巴斯德毕赤氏酵母BMT3基因的5'核苷酸序列(PpPBS3 5'),另一侧是巴斯德毕赤氏酵母BMT3基因的3'核苷酸序列(PpPBS3 3')。
附图18显示了质粒pGLY2057的图谱。质粒pGLY2057是靶向ADE2座位的整合质粒,含有编码侧翼是lacZ重复(lacZ重复)的巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5)的表达盒。所述表达盒一侧是包含来自ADE2基因的5'区域的核苷酸序列的核酸分子(PpADE2-5'),另一侧是包含来自ADE2基因的3'区域的核苷酸序列的核酸分子(PpADE2-3')。
附图19显示了质粒pGLY2680的图谱。质粒pGLY2680是可以靶向TRP2或AOX1座位的整合载体,含有编码以下的表达盒(1)在N-末端与鸡溶菌酶信号肽(鸡溶菌酶ss)融合的、密码子优化的人成熟促红细胞生成素(co-hEPO),和(2)没有启动子的巴斯德毕赤氏酵母ADE2基因(PpADE2)。表达盒在一端侧面是巴斯德毕赤氏酵母AOX1启动子(PpAOX1 Prom),在另一端是巴斯德毕赤氏酵母TRP2基因或转录单元(PpTRP2)。ScCYC TT是酿酒酵母CYC终止序列。
附图20显示了质粒pGLY2713的图谱。质粒pGLY2713是含有邻近于表达盒的巴斯德毕赤氏酵母PNO1 ORF(PpPNO1 ORF)的整合载体,所述表达盒包含侧翼是lacZ重复(lacZ重复)的巴斯德毕赤氏酵母URA5基因或转录单元(PpURA5),其一侧是巴斯德毕赤氏酵母PEP4基因的5'核苷酸序列(PpPEP4 5'),另一侧是巴斯德毕赤氏酵母PEP4基因的3'核苷酸序列(PpPEP4 3')。
附图21显示了说明发酵过程流程的示意图。
附图22是HCA抗体Western印迹,是大约在rhEPO的大小处的蛋白质的检测,显示了在菌株YGLY3159中产生的rhEPO具有与抗HCA抗体的交叉结合活性。左侧画面显示了Commassie Blue染色的4-20% SDS-PAGE凝胶,显示了rhEPO的位置,右侧画面显示了用1:3,000稀释度的兔抗-HCA抗体(SL rProA纯化的兔:9161)探测的类似凝胶的Western印迹。结合抗-HCA抗体使用PBS中1:5,000稀释度的、与辣根过氧化酶(HRP)缀合的山羊抗兔抗体来检测。结合的二级抗体的检测使用底物3'3二氨基联苯胺(DAB)。
附图23是抗-HCA抗体Western印迹,显示了当rhEPO使用PNAGase F脱糖基化时,在菌株YGLY3159中生产的rhEPO对抗-HCA抗体的交叉结合活性不被检测出。左侧画面显示了Commassie Blue染色的4-20% SDS-PAGE凝胶,显示了糖基化的和脱糖基化形式的rhEPO的位置,右侧画面显示了如附图22中用抗-HCA抗体探测的类似凝胶的Western印迹。
附图24显示了野生型巴斯德毕赤氏酵母中以及糖工程化的巴斯德毕赤氏酵母GS2.0菌株中生产的重组抗体(rhIgG)显示了与抗-HCA抗体的交叉结合活性,在所述巴斯德毕赤氏酵母GS2.0菌株中BMT2基因被破坏或删除。左侧画面显示了Commassie Blue染色的4-20% SDS-PAGE凝胶,右侧画面显示了如附图22中用抗-HCA抗体探测的类似凝胶的Western印迹。GS 2.0是产生主要具有Man5GlcNAc2N-聚糖的糖蛋白的巴斯德毕赤氏酵母菌株。显示的GS 2.0菌株产生具有约5% Man9GlcNAc2N-聚糖的rhIgG。WT是野生型巴斯德毕赤氏酵母。
附图25是在巴斯德毕赤氏酵母中产生的rhEPO和其他蛋白质制品中的HCA检测,比较了菌株YGLY3159中生产的rhEPO与其他含有复杂糖基化模式、但不是在巴斯德毕赤氏酵母中生产的糖基化蛋白质与抗-HCA抗体的交叉结合活性。上部画面显示了Commassie Blue染色的4-20% SDS-PAGE凝胶,显示了在巴斯德毕赤氏酵母中产生的糖基化以及脱糖基化形式的rhEPO的位置,以及在酿酒酵母中产生的重组人胎球蛋白、去唾液酸胎球蛋白(asialofetuin)(除去了末端唾液酸残基的人胎球蛋白)、人血清白蛋白(HSA)和重组LEUKINE的位置,下部画面显示了如附图22中用抗-HCA抗体探测的类似凝胶的Western印迹。S30S库是通过阳离子交换层析纯化的rhEPO。
附图26显示了在菌株YGLY3159中生产、以及通过羟磷灰石层析纯化(F071401-Mix-羟磷灰石I型 40μm纯化)的的rhEPO仍然具有与抗-HCA抗体的交叉结合活性。左侧画面显示了层析洗脱库1、2和3的Commassie Blue染色的4-20% SDS-PAGE凝胶,显示了rhEPO(还原的或非还原的,左边是还原的,右边是非还原的)的位置,右侧画面显示了如附图22中用抗-HCA抗体探测的类似凝胶的Western印迹(还原的或非还原的,左边是还原的,右边是非还原的)。在画面下方显示了库1、2和3中N-聚糖的HPLC分析的结果。
附图27A显示了来自羟磷灰石库1的在菌株YGLY3159中产生的rhEPO的Q SEPHAROSE FF阴离子层析纯化的层析谱。
附图27B显示了夹心ELISA,显示了含有来自Q SEPHAROSE FF阴离子层析的rhEPO的Q SEPHAROSE FF库没有与抗-HCA抗体的可检测的交叉结合活性,而流通物含有与抗-HCA抗体的交叉结合活性。捕获抗体是抗-hEPO抗体,用在PBS中1:800起始稀释度下的兔抗-HCA抗体检测交叉结合活性,所述稀释物然后在PBS中1:1连续稀释一排结束于第11个反应孔1:819,200稀释度(反应孔12:阴性对照)。结合的抗-HCA抗体使用PBS中1:10,000稀释度的、与碱性磷酸酶(AP)缀合的山羊抗兔抗体来检测。结合的二级抗体的检测使用底物4-甲基伞形酮酰磷酸(4-MUPS)。下部的表格显示抗血清平板稀释度。
附图28显示了在菌株YGLY6661(Δ bmt2、Δ bmt4和Δ bmt1)和YGLY7013(Δ bmt2和Δ bmt4)中产生、通过BlueSEPHAROSE 6 FF层析(Blue库)捕获的的rhEPO仍然具有与抗-HCA抗体的交叉结合活性(第44周-rhEPO-Blue Sepharose 6 FF ,Blue Blue
库+/-PNGase F)。左侧画面显示了有(+)和没有(-)PNGase F处理的Blue库的Commassie蓝染色的4-20% SDS-PAGE凝胶。中央画面显示了用1:1,000稀释度与HRP缀合的抗-hEPO抗体探测的、DAB作为底物的相似凝胶的Western印迹。右侧画面显示了如附图22中用抗-HCA抗体探测的类似凝胶的Western印迹。
附图29在检测与抗-HCA抗体交叉结合活性的夹心ELISA中显示了在菌株YGLY6661(Δ bmt2、Δ bmt4和Δ bmt1)和YGLY7013(Δ bmt2和Δ bmt4)中产生、通过Blue SEPHAROSE 6 FF层析捕获的(Blue库)rhEPO仍然具有与抗-HCA抗体的交叉结合活性。ELISA如附图27B中的进行。右侧的表格显示抗血清平板稀释度。。
附图30显示了夹心ELISA,用于检测在菌株YGLY6661(Δ bmt2、Δ bmt4和Δ bmt1)以及YGLY7013(Δ bmt2和Δ bmt4)中产生的、通过Blue SEPHAROSE 6 FF层析捕获的、通过羟磷灰石层析纯化的(HA库1)的rhEPO与抗-HCA抗体的交叉结合活性。来自菌株YGLY6661的HA库1中的rhEPO没有与抗-HCA抗体的可检测的交叉结合活性。ELISA如附图27B中的进行。右侧的表格显示抗血清平板稀释度。。
附图31显示了在菌株YGLY6661(Δ bmt2、Δ bmt4和Δ bmt1)中产生的、通过Blue SEPHAROSE 6 FF层析捕获的(Blue库)rhEPO仍然具有与抗-HCA抗体的交叉结合活性(第45周-rhEPO-Blue Sepharose 6 FF ,Blue 库+/-PNGase F)。左侧画面显示了有(+)和没有(-)PNGase F处理的Blue库的Commassie Blue染色的4-20% SDS-PAGE凝胶。中间画面显示了用1:1,000稀释度下与HRP缀合的抗-hEPO抗体探测的、DAB作为底物的类似凝胶的Western印迹。右侧画面显示了如附图22中用抗-HCA抗体探测的类似凝胶的Western印迹。
附图32A显示了从菌株YGLY7361-7366(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)制备的、有(+)和没有(-)PNGase F处理的Blue Sepaharose 6 FF捕获库(Blue库)的Commassie Blue染色的4-20% SDS-PAGE凝胶(第46a周-SixFors-四重BMT敲除-Blue库+/-PNGase F处理)。菌株在500 mL SixFors发酵器中生长。
附图32B显示了从菌株YGLY7393-7398(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)制备的、有(+)和没有(-)PNGase F处理的Blue Sepaharose 6 FF捕获库(Blue库)的Commassie Blue染色的4-20% SDS-PAGE凝胶(第46b周-SixFors-四重BMT敲除-Blue库+/-PNGase F处理)。菌株在500 mL SixFors发酵器中生长。
附图33显示了夹心ELISA的结果,其用于检测在菌株YGLY7361-7366(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)以及YGLY7393-7398(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)中产生的、通过Blue SEPHAROSE 6 FF层析捕获的(Blue库)rhEPO与抗-HCA抗体的交叉结合活性(46周-SixFors-四重BMT敲除 -Blue库)。仅来自菌株YGLY7363和YGLY7365的 Blue库中的rhEPO具有与抗-HCA抗体的可检测的交叉结合活性。ELISA如附图27B中的进行。左侧画面是46a周,右侧画面是46b周。最下部的表格显示抗血清平板稀释度。
附图34以图表形式显示了在从菌株YGLY7361-7366和YGLY7393-7398(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)制备的Blue库中rhEPO上N-聚糖的HPLC分析的结果(第46a & b周-SixFors-四重BMT敲除 -Blue库)。“双”是指在双分枝N-聚糖的两个臂上都被唾液酸化的N-聚糖。“单”是指在双分枝N-聚糖的仅一条臂上被唾液酸化的N-聚糖。“中性的”是指不被唾液酸化的N-聚糖。
附图35A显示了从菌株YGLY7362、YGLY7366、YGLY7396和YGLY7398(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)以及YGLY3159(Δ bmt2)制备的Blue SEPHAROSE 6 FF层析(Blue库)和羟磷灰石纯化库(HA库1)的Commassie Blue染色的4-20% SDS-PAGE凝胶(第50周-四重BMT敲除菌株筛选rhEPO Blue库和HA库1s)。
附图35B显示了从菌株YGLY7362、YGLY7366、YGLY7396和YGLY7398(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)以及YGLY3159(Δ bmt2)制备的并如附图22中用抗-HCA抗体探测的、Blue SEPHAROSE 6 FF层析(Blue库)和羟磷灰石纯化库(HA库1)的4-20% SDS-PAGE凝胶的Western印迹(第50周-四重BMT敲除菌株筛选rhEPO Blue库和HA库1s)。与HCP的交叉反应仅在YGLY 3159中。
附图36是SDS-PAGE凝胶-Coomassie Blue染色的四重 BMT敲除菌株筛选(F080240-YGLY 7398-Blue库/HA库1),显示了在菌株YGLY7398(Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)中生产的、用Blue SEPHAROSE 6 FF层析捕获的(Blue库)和通过羟磷灰石层析纯化的(HA库1)rhEPO没有与抗-HCA抗体的可检测的交叉结合活性。左侧画面显示了与从菌株YGLY3159制备的rhEPO相比,从菌株YGLY7398制备的Blue库和HA库1的Commassie Blue染色的4-20% SDS-PAGE凝胶。中间画面显示了如附图22中用抗-HCA抗体(1:3000)探测的类似凝胶的Western印迹。中间画面显示了如附图22中用抗-HCA抗体探测的类似凝胶的Western印迹,只是抗-HCA抗体来自另一种抗体制品(1:2,000的GiF多克隆兔::6316)。
附图37显示了夹心ELISA的结果,用于检测菌株YGLY7113-7122(Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)中生产的以及通过Blue SEPHAROSE 6 FF层析捕获的(Blue库)rhEPO与抗-HCA抗体的交叉结合活性(SixFors-四重BMT敲除-Blue库)。菌株YGLY7118显示了与抗-HCA抗体的非常低的可检测的交叉结合活性。其他菌株都没有显示任何与抗-HCA抗体的可检测的交叉结合活性。ELISA如附图27B中的进行。最下部的表格显示抗血清平板稀释度。
附图38以图表形式显示了在从菌株YGLY7113-7122(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)制备的Blue库中的rhEPO上N-聚糖的HPLC分析结果(第48周-SixFors-四重 BMT敲除-Blue库)。“双”是指在双分枝N-聚糖的两个臂上都被唾液酸化的N-聚糖。“单”是指在双分枝N-聚糖的仅一条臂上被唾液酸化的N-聚糖。“中性的”是指不被唾液酸化的N-聚糖。
附图39A显示了从菌株YGLY7115、YGLY7117、YGLY7394、YGLY7395和YGLY7120(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)和 YGLY3159(Δ bmt2)制备的Blue SEPHAROSE 6 FF层析(Blue库)和羟磷灰石纯化库(HA库1)的Commassie Blue染色的4-20% SDS-PAGE凝胶(第51周-四重 BMT敲除菌株筛选rhEPO Blue库和HA库1s)。
附图39B显示了从菌株YGLY7115、YGLY7117、YGLY7394、YGLY7395和YGLY7120(全为Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)以及YGLY3159(Δ bmt2)制备的并如附图22中用抗-HCA抗体探测的、Blue SEPHAROSE 6 FF层析(Blue库)和羟磷灰石纯化库(HA库1)的4-20% SDS-PAGE凝胶的Western印迹(第51周-四重 BMT敲除菌株筛选rhEPO Blue库和HA库1s)。
附图40A显示了YGLY3159(Δ bmt2)产生的以及通过羟磷灰石柱层析纯化的rhEPO的N-聚糖的HPLC痕迹(即,HA库1的分析)。
附图40B显示了YGLY7117(Δ bmt2、Δ bmt4、Δ bmt1和Δ bmt3)中产生的已经通过羟磷灰石柱层析纯化的rhEPO的N-聚糖的HPLC痕迹(即,HA库1的分析)。
具体实施方式
本发明提供了在甲基营养型酵母例如巴斯德毕赤氏酵母中生产蛋白质和糖蛋白的方法,所述蛋白质和糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。宿主细胞抗原还可以包括可能被重组蛋白质组合物带出的残余的宿主细胞蛋白质和细胞壁污染物,它们可能是免疫原性的,可以改变治疗蛋白质的治疗效力或安全性。与针对宿主细胞抗原制得的抗体具有交叉反应性的组合物是指该组合物含有某些污染的宿主细胞材料,通常是具有磷酸甘露糖残基或β-甘露糖残基等等的N-聚糖。巴斯德毕赤氏酵母的野生型菌株将产生具有这些N-聚糖结构的糖蛋白。针对总宿主细胞蛋白质制得的抗体制品预计将包括针对这些结构的抗体。然而,不含有N-聚糖的蛋白质可能同时包括与针对宿主细胞制得的抗体交叉反应的污染物质(蛋白质等)。
所述方法和宿主细胞允许产生重组治疗蛋白质和糖蛋白,与此处公开的未修饰的菌株中生产的相比,其在施用所述重组治疗蛋白质和糖蛋白的个体中具有引发不良反应的降低的风险。不良反应包括在个体中引发不希望的免疫反应,或与个体中的位点不希望的或不适当的结合、在其中聚集、或与之相互作用,其一般不利地影响个体的健康。在施用所述治疗蛋白质或糖蛋白的个体中引发不良反应的风险,对于要长期施用给个体的蛋白质或糖蛋白是特别关注的(例如,意图在延长的时间期上进行的治疗)。根据此处的方法生产的重组治疗蛋白质或糖蛋白没有与针对宿主细胞抗原的抗体的可检测的交叉结合活性,因而,具有在施用所述重组蛋白质或糖蛋白的个体中引发不良反应的降低的风险。所述方法和宿主细胞对于生产具有结合清除因子的更低可能性的重组蛋白质或糖蛋白也是有用的。
发明人发现,在巴斯德毕赤氏酵母的某些菌株中生产的特定糖蛋白可能具有在其上的N-或O-聚糖,其中上面的一个或更多个甘露糖残基是处于β1,2-连键中。用于治疗用途的并且上面具有一个或更多个β1,2-连接的甘露糖残基的糖蛋白提供了在施用该糖蛋白的个体中引发不希望的免疫反应的风险。这些β-连接的甘露糖残基可以使用针对总宿主细胞抗原制得的抗体来检测。由于不能预测哪些治疗糖蛋白将具有包含一个或更多个β1,2-连接的甘露糖残基的N-或O-聚糖,以及确实具有上面包含β1,2-连接的甘露糖残基的N-或O-聚糖的治疗糖蛋白是否将在接受该糖蛋白的个体中产生不希望的免疫原性反应,期望的是在巴斯德毕赤氏酵母菌株中产生治疗性糖蛋白,所述菌株已经被遗传工程化以缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合。这样的菌株可以通过删除或破坏巴斯德毕赤氏酵母β-甘露糖基转移酶(BMT)基因家族中的四种已知的β-甘露糖基转移酶(Bmtp)中的至少三种的活性来产生。如在此显示的,包括至少三种这些BMT基因的删除或破坏的巴斯德毕赤氏酵母菌株提供了可以产生蛋白质或糖蛋白的巴斯德毕赤氏酵母菌株,所述蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合。这些菌株在生产治疗蛋白质和糖蛋白中是有用的。已经展现了N-和/或O-聚糖上β-甘露糖结构的存在引发免疫反应。
巴斯德毕赤氏酵母和白色念珠菌中β-甘露糖基转移酶基因的鉴定已经在美国专利No. 7,465,577和Mille et al., J. Biol. Chem. 283
:9724-9736(2008)中报道了,其公开了β-甘露糖基化受到被称为AMR2或 BMT2的β-甘露糖基转移酶的影响,巴斯德毕赤氏酵母中该基因的破坏或删除产生了能够生产具有降低的β-甘露糖基化的糖蛋白的重组宿主。该专利还公开了基因的三种同源物,BMT1、BMT3和BMT4。然而,当研究某些糖蛋白制品与针对宿主细胞抗原制得的抗体的交叉结合活性的来源时,发明人发现,交叉结合活性是已经破坏或删除了BMT2基因的重组巴斯德毕赤氏酵母宿主细胞的某些菌株中存留的残余β-甘露糖基化的结果。因而,这些重组宿主细胞中产生的异源糖蛋白具有仍然含β-甘露糖残基的N-聚糖。这些β-甘露糖残基在获自这些重组宿主细胞的培养物的异源糖蛋白的ELISA和Western印迹中用针对宿主细胞抗原(HCA)制得的抗体是可检测的。抗-HCA抗体是针对野生型巴斯德毕赤氏酵母菌株或NORF菌株产生的多克隆抗体,NORF菌株是以与生产异源糖蛋白的重组宿主细胞相同方式构建的重组宿主细胞,只是编码异源蛋白质的开放阅读框(ORF)被省略了。对于在巴斯德毕赤氏酵母中产生的治疗性糖蛋白,这些残余的β-甘露糖残基代表了在疾病或病症的治疗中接受该治疗蛋白质的某些个体中引发免疫反应的风险。本发明提供了在巴斯德毕赤氏酵母中生产糖蛋白的方法,所述糖蛋白不含有任何可检测的β-甘露糖基化并且因而不与针对宿主细胞抗原制得的抗体交叉结合。
BMT1 、 BMT2和BMT3展现了高度的序列同源性,而BMT4是较低程度上同源的,被认为是帽化α-甘露糖基转移酶。然而,BMT家族的所有四个成员看起来涉及具有β-连接的甘露糖结构的N-和/或O-聚糖的合成。虽然来自删除BMT2基因的巴斯德毕赤氏酵母菌株中产生的测试蛋白质的N-聚糖的MALDI-TOF可能未能检测出β-甘露糖基化,在此基于敏感抗体的分析能够检出Δ bmt2菌株中的β-甘露糖基化。因而,在此教导的基于抗-HCA抗体的检测方法显示了,BMT1和BMT3基因以及任选的BMT4基因的同时的删除或破坏是除去所有可检测的β-甘露糖结构所需的。编码三种β-甘露糖基转移酶的基因的删除或破坏可以通过以下实现(1)基因(包括启动子序列、开放阅读框(ORF)和/或转录终止序列)的完全或部分敲除;(2)ORF中阅读框移位的引入;(3)启动子的失活或调节;(4)通过siRNA或反义RNA的信息敲低;(5)或使用化学抑制物。结果是产生能够生产缺乏与抗-HCA抗体的可检测的交叉结合活性的糖蛋白的宿主细胞。
为了例示生产缺乏与抗-HCA抗体的可检测的交叉结合活性的糖蛋白的方法,已经被遗传地工程化以缺乏BMT2表达或活性、并能够产生具有唾液酸封端的双分枝N-聚糖的重组成熟的人促红细胞生成素(EPO)的巴斯德毕赤氏酵母的菌株,被进一步遗传工程化来缺乏BMT1和/或BMT3和/或BMT4基因的表达。其中仅BMT2基因的表达被破坏的菌株产生了具有与抗-HCA抗体的一定可检测的交叉结合活性的重组成熟人EPO。由于EPO分子上β-连接的甘露糖残基的存在发现了可检测的交叉结合活性(参见附图22-27B,实施例6)。当编码BMT1和BMT4的基因在菌株中被破坏或删除时,产生的EPO仍然具有与抗-HCA抗体的可检测的交叉结合活性(参见附图28-31)。然而,当BMT1、BMT2、BMT3和BMT4基因被破坏或删除时,大部分菌株产生了糖基化的重组人EPO,其缺乏与抗-HCA抗体的可检测的交叉结合活性,因而缺乏可检测的β-甘露糖残基(例如参见附图33和35B)。
因而,本发明进一步提供了生产重组蛋白质或糖蛋白的方法,所述重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述方法涉及构建预期用于生产所述重组蛋白质的宿主细胞以进一步不与显示各种组合的β-甘露糖基转移酶活性。例如,宿主细胞被构建,其不显示对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性。缺乏显示β-甘露糖基转移酶2活性的宿主细胞用于生产所述重组蛋白质或糖蛋白,其然后利用针对菌株的NORF版本制备的抗体、通过Western印迹或ELISA来评估。NORF菌株是与宿主菌株相同的菌株,只是它缺乏编码重组糖蛋白的开放阅读框。如果通过所述宿主细胞产生的重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体可检测的结合,则宿主细胞对于生产缺乏与针对宿主细胞抗原的抗体的交叉结合活性的重组蛋白质或糖蛋白是有用的。然而,如果检测到可检测的交叉结合活性,则宿主细胞被进一步操纵以不显示对于N-聚糖或O-聚糖的β-甘露糖基转移酶1、β-甘露糖基转移酶3或β-甘露糖基转移酶4活性。例如,缺乏β-甘露糖基转移酶2活性的宿主细胞被进一步操纵以缺乏β-甘露糖基转移酶1活性。所述宿主细胞被用于生产重组蛋白质或糖蛋白,其然后使用针对菌株的NORF版本制得的抗体通过Western印迹或ELISA来评估。如果通过所述宿主细胞产生的重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体可检测的结合,则宿主细胞对于生产缺乏与针对宿主细胞抗原的抗体的交叉结合活性的重组蛋白质或糖蛋白是有用的。
然而,如果检测到可检测的交叉结合活性,则宿主细胞被进一步操纵以不展示β-甘露糖基转移酶3活性或β-甘露糖基转移酶4活性。例如,缺乏β-甘露糖基转移酶2活性和β-甘露糖基转移酶1活性的宿主细胞被进一步操纵以缺乏对于N-聚糖或O-聚糖的β-甘露糖基转移酶3活性。所述宿主细胞被用于生产蛋白质或重组糖蛋白,其然后使用针对菌株的NORF版本制得的抗体通过Western印迹或ELISA来评估。如果通过所述宿主细胞产生的重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体可检测的结合,则宿主细胞对于生产缺乏与针对宿主细胞抗原的抗体缺乏交叉结合活性的重组蛋白质或糖蛋白是有用的。
然而,如果检测到可检测的交叉结合活性,则菌株被进一步操纵以不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶4活性。宿主细胞被用于生产重组蛋白质或糖蛋白,其然后使用针对菌株的NORF版本制得的抗体通过Western印迹或ELISA来评估,以确认重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测结合。通过进一步的实例,构建了巴斯德毕赤氏酵母宿主细胞,其中不同组合的BMT基因被删除或破坏。例如,构建巴斯德毕赤氏酵母宿主细胞,其具有BMT2基因的破坏或删除。Δ bmt2宿主细胞被用于生产重组蛋白质或糖蛋白,其然后使用针对菌株的NORF版本制得的抗体通过Western印迹或ELISA来评估。NORF菌株是与宿主菌株相同的菌株,只是它缺乏编码重组糖蛋白的开放阅读框。如果通过所述Δ bmt2宿主细胞产生的重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体可检测的结合,则BMT2删除或破坏足以允许宿主细胞生产缺乏与针对宿主细胞抗原的抗体的交叉结合活性的重组蛋白质或糖蛋白。然而,如果检测到可检测的交叉结合活性,则宿主细胞被进一步操纵以具有BMT1、BMT3或BMT4基因的删除。例如,具有BMT2基因的破坏或删除的宿主细胞被进一步操纵以具有BMT1基因的删除或破坏。Δ bmt2 Δ bmt1宿主细胞被用于生产重组蛋白质或糖蛋白,其然后通过使用针对菌株的NORF版本制得的抗体通过Western印迹或ELISA来评估。如果Δ bmt2 Δ bmt1宿主细胞产生的重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的结合,则BMT1和 BMT2删除或破坏足以允许宿主细胞产生缺乏与针对宿主细胞抗原的抗体的交叉结合活性的重组蛋白质或糖蛋白。
然而,如果检测到可检测的交叉结合活性,则宿主细胞被进一步操纵以具有BMT3或BMT4基因的删除。例如,具有BMT1和BMT2基因的破坏或删除的宿主细胞被进一步操纵以具有BMT3基因的删除或破坏。Δ bmt2 Δ bmt1 Δ bmt3宿主细胞被用于生产蛋白质或重组糖蛋白,其然后通过使用针对菌株的NORF版本制得的抗体通过Western印迹或ELISA来评估。如果Δ bmt2 Δ bmt1 Δ bmt3宿主细胞产生的重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测的结合,则BMT1、BMT2和BMT3删除或破坏足以允许宿主细胞产生缺乏与针对宿主细胞抗原的抗体的交叉结合活性的重组蛋白质或糖蛋白。
然而,如果检测到可检测的交叉结合活性,则宿主细胞被进一步操纵以具有BMT4基因的删除。Δ bmt2 Δ bmt1 Δ bmt3 Δ bmt4宿主细胞被用于生产重组蛋白质或糖蛋白,其然后使用针对菌株的NORF版本制得的抗体通过Western印迹或ELISA来评估,以确认重组蛋白质或糖蛋白缺乏与针对宿主细胞抗原制得的抗体的可检测结合。本发明进一步提供了重组甲基营养型酵母宿主细胞例如巴斯德毕赤氏酵母宿主细胞,其中所述宿主细胞不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶1活性或β-甘露糖基转移酶3活性的至少一种,并且其包括编码重组蛋白质或糖蛋白的核酸分子。在进一步的实施方式中,所述宿主细胞不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性。在进一步的方面中,本发明提供了重组宿主细胞,其不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性、β-甘露糖基转移酶3活性和β-甘露糖基转移酶4活性,并且其包括编码重组蛋白质或糖蛋白的核酸分子。
本发明进一步提供了生产重组蛋白质或糖蛋白的一般方法,所述重组蛋白质或糖蛋白缺乏与抗宿主细胞抗原抗体的可检测的交叉结合活性,包括提供重组甲基营养型酵母例如巴斯德毕赤氏酵母宿主细胞,其不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,不展现对于N-聚糖或O-聚糖的选自β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的至少一种活性,并且其包括编码重组蛋白质或糖蛋白的核酸分子;在对表达所述重组蛋白质或糖蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基中回收所述重组蛋白质或糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的所述重组蛋白质或糖蛋白。在进一步的实施方式中,所述宿主细胞缺乏对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性。
在进一步的方面中,本发明提供了生产重组蛋白质或糖蛋白的一般方法,所述重组蛋白质或糖蛋白缺乏与抗宿主细胞抗原抗体的可检测的交叉结合活性,所述方法包括提供重组甲基营养型酵母例如巴斯德毕赤氏酵母宿主细胞,其不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性、β-甘露糖基转移酶3活性和β-甘露糖基转移酶4活性,并且其包括编码重组蛋白质或糖蛋白的核酸分子;在对表达所述重组蛋白质或糖蛋白有效的条件下在培养基中生长所述宿主细胞; 以及从所述培养基中回收所述重组蛋白质或糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的所述重组蛋白质或糖蛋白。
本发明进一步提供了重组甲基营养型酵母宿主细胞例如巴斯德毕赤氏酵母宿主细胞,其中编码对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性的基因已经被删除或破坏,编码对于N-聚糖或O-聚糖的β-甘露糖基转移酶1活性或β-甘露糖基转移酶3活性的至少一种基因已经被删除或破坏,以及其包括编码重组蛋白质或糖蛋白的核酸分子。在进一步的实施方式中,编码对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的基因已经被删除或破坏。在进一步的方面中,本发明提供了重组宿主细胞,编码对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性、β-甘露糖基转移酶3活性和β-甘露糖基转移酶4活性的基因被删除或破坏,并且其包括编码重组蛋白质或糖蛋白的核酸分子。
本发明进一步提供了生产重组蛋白质或糖蛋白的一般方法,所述重组蛋白质或糖蛋白缺乏与抗宿主细胞抗原抗体的可检测的交叉结合活性,所述方法包括提供重组甲基营养型酵母例如巴斯德毕赤氏酵母宿主细胞,其中编码对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性的基因被删除或破坏,以及编码选自对于N-聚糖或O-聚糖的β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的活性的至少一种基因被删除或破坏,以及其包括编码重组蛋白质或糖蛋白的核酸分子;在对表达所述重组蛋白质或糖蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基中回收所述重组蛋白质或糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的所述重组蛋白质或糖蛋白。在进一步的实施方式中,编码对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的基因被删除或破坏。
在进一步的方面中,本发明提供了生产重组蛋白质或糖蛋白的一般方法,所述重组蛋白质或糖蛋白缺乏与抗宿主细胞抗原抗体的可检测的交叉结合活性,所述方法包括提供重组甲基营养型酵母例如巴斯德毕赤氏酵母宿主细胞,其中编码对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性、β-甘露糖基转移酶3活性和β-甘露糖基转移酶4活性的基因被删除或破坏,以及其包括编码重组蛋白质或糖蛋白的核酸分子;在对表达所述重组蛋白质或糖蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基中回收所述重组蛋白质或糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的所述重组蛋白质或糖蛋白。
本发明进一步提供了重组巴斯德毕赤氏酵母宿主细胞,其中BMT2基因与BMT1基因和BMT3基因的至少一个被删除或破坏,并且其包括编码重组蛋白质或糖蛋白的核酸分子。在进一步的实施方式中,BMT2基因、BMT1基因和BMT3基因被删除或破坏。在进一步的方面中,本发明提供了重组巴斯德毕赤氏酵母宿主细胞,其中BMT1基因、BMT2基因、BMT3基因和BMT4基因被删除或破坏,以及其包括编码重组蛋白质或糖蛋白的核酸分子。
本发明进一步提供了生产重组蛋白质或糖蛋白的一般方法,所述重组蛋白质或糖蛋白缺乏与抗宿主细胞抗原抗体的可检测的交叉结合活性,所述方法包括提供重组巴斯德毕赤氏酵母宿主细胞,其中BMT2基因与BMT1基因和BMT3基因的至少一个被删除或破坏,并且其包括编码重组蛋白质或糖蛋白的核酸分子;在对表达所述重组蛋白质或糖蛋白有效的条件下在培养基中生长所述宿主细胞; 以及从所述培养基中回收所述重组蛋白质或糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的所述重组蛋白质或糖蛋白。在进一步的实施方式中,BMT2基因、BMT1基因和BMT3基因被删除或破坏。
在进一步的方面中,本发明提供了生产重组蛋白质或糖蛋白的一般方法,所述重组蛋白质或糖蛋白缺乏与抗宿主细胞抗原抗体的可检测的交叉结合活性,所述方法包括提供重组巴斯德毕赤氏酵母宿主细胞,其中BMT1基因、BMT2基因、BMT3基因和BMT4基因被删除或破坏,以及其包括编码重组蛋白质或糖蛋白的核酸分子;在对表达所述重组蛋白质或糖蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基中回收所述重组蛋白质或糖蛋白,以产生缺乏与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的所述重组蛋白质或糖蛋白。
本发明进一步提供了重组巴斯德毕赤氏酵母宿主细胞,其中BMT2基因与BMT1基因和BMT3基因的至少一个被删除或破坏,并且其包括编码重组蛋白质或糖蛋白的核酸分子。在进一步的实施方式中,BMT2基因、BMT1基因和BMT3基因被删除或破坏。在进一步的方面中,本发明提供了重组巴斯德毕赤氏酵母宿主细胞,其中BMT1基因、BMT2基因、BMT3基因和BMT4基因被删除或破坏,以及其包括编码重组蛋白质或糖蛋白的核酸分子。
一般地所述重组蛋白质或糖蛋白是治疗性糖蛋白。期待的治疗性糖蛋白的实例包括但不限于促红细胞生成素(EPO);细胞因子,例如干扰素α、干扰素β、干扰素γ和干扰素ω;以及粒细胞-集落刺激因子(GCSF);GM-CSF;凝血因子,例如因子VIII、因子IX和人蛋白质C;抗凝血酶III;凝血酶;可溶的IgE受体α-链;免疫球蛋白,例如IgG、IgG片段、IgG融合物和IgM;免疫粘附素和其他Fc融合蛋白,例如可溶的TNF受体-Fc融合蛋白;RAGE-Fc融合蛋白;白细胞介素;尿激酶;胃促胰酶;和脲胰蛋白酶抑制物;IGF-结合蛋白;表皮生长因子;生长激素释放因子;annexin V融合蛋白;血管抑素;血管内皮生长因子-2;骨髓祖代抑制因子-1;护骨素(osteoprotegerin);α-1-抗胰蛋白酶;α-feto蛋白质;DNase II;人血纤蛋白溶解酶原的kringle 3;葡糖脑苷脂酶;TNF结合蛋白1;促滤泡激素;细胞毒T淋巴细胞相关抗原4–Ig;跨膜激活物和钙调节物和亲环蛋白(cyclophilin)配体;胰高血糖素样蛋白1;和IL-2受体激动剂。
在本发明的特定的方面中,编码重组蛋白质或糖蛋白的核酸分子是密码子优化的,以增强宿主细胞中所述重组蛋白质或糖蛋白的表达。例如,如实施例中所示,编码人促红细胞生成素的成熟形式的核酸分子被密码子优化,为了在甲基营养型酵母例如巴斯德毕赤氏酵母菌株中增强的表达,所述酵母已经被遗传工程化以产生包含双分枝N-聚糖的促红细胞生成素变体,其中主要的糖形式包含两个都被末端唾液酸化的分枝。
本发明进一步提供了包含一种或更多种蛋白质或糖蛋白的组合物,所述蛋白质或糖蛋白缺乏与针对宿主细胞抗原的抗体的可检测的交叉结合活性,所述宿主细胞抗原是使用此处的方法以及在此处描述的宿主细胞中产生的。所述组合物可以进一步包括药学上可接受的载体和盐。适合的宿主细胞包括任何下述宿主细胞,其包含巴斯德毕赤氏酵母BMT1、BMT2、BMT3和/或BMT4基因的同源物。当前,这样的宿主细胞的实例包括白色念珠菌和甲基营养型酵母巴斯德毕赤氏酵母。因而,在本发明的特别的方面中,宿主细胞是甲基营养型酵母,例如巴斯德毕赤氏酵母,以及其突变体和其遗传工程化的变体。期待用于本发明的甲基营养型酵母例如巴斯德毕赤氏酵母可以被遗传地修饰,从而它们表达糖蛋白,在所述糖蛋白中糖基化模式是人类样的或人源化的。照这样,可以生产糖蛋白组合物,其中特定的期望糖形式在组合物中是主要的。如US2004/0018590中描述的,这可以通过消除选定的内源糖基化酶、和/或遗传工程化宿主细胞、和/或提供外源的酶以模拟全部或部分哺乳动物糖基化途径来实现。如果希望,可以进行糖基化的其他遗传工程化,从而可以有或者没有核心岩藻糖基化地产生糖蛋白。低等真核宿主细胞的使用是进一步有益的,在于这些细胞能够产生高度同质的糖蛋白组合物,从而糖蛋白的主要糖形式可以在组合物的糖蛋白中以大于三十摩尔百分比存在。在特别的方面中,主要糖形式可以以组合物中存在的糖蛋白的大于四十摩尔百分比、五十摩尔百分比、六十摩尔百分比、七十摩尔百分比,以及最优选的大于八十摩尔百分比存在。这可以如Gerngross等,美国专利No. 7,029,872和美国专利No. 7,449,308所描述的通过消除选定的内源糖基化酶和/或提供外源的酶来实现。例如,可以选择或工程化宿主细胞来耗尽1,6-甘露糖基转移酶活性,不然其将在糖蛋白的N-聚糖上添加甘露糖残基。在一个实施方式中,宿主细胞进一步包括与细胞靶向信号肽融合的α1,2-甘露糖苷酶催化结构域,所述细胞靶向信号肽通常不与所述催化结构域相连,并且被选择以将α1,2-甘露糖苷酶活性靶向宿主细胞的ER或高尔基体。重组糖蛋白穿过宿主细胞的ER或高尔基体产生了包含Man5GlcNAc2糖形式的重组糖蛋白,例如,主要包含Man5GlcNAc2糖形式的重组糖蛋白组合物。例如,美国专利No. 7,029,872、美国专利No. 7,449,308和美国公开的专利申请No. 2005/0170452公开了能够生产包含Man5GlcNAc2糖形式的糖蛋白的低等真核生物宿主细胞。
在进一步的实施方式中,紧接地前述的宿主细胞进一步包括与细胞靶向信号肽融合的N-乙酰葡糖氨基转移酶I(GlcNAc转移酶I或GnT I)催化结构域,所述信号肽通常不与该催化结构域相连,并且被选择以将GlcNAc转移酶I活性靶向宿主细胞的ER或高尔基体。重组糖蛋白穿过宿主细胞的ER或高尔基体产生了包含GlcNAcMan5GlcNAc2糖形式的重组糖蛋白,例如,主要包含GlcNAcMan5GlcNAc2糖形式的重组糖蛋白组合物。例如,美国专利No. 7,029,872、美国专利No. 7,449,308和美国公开的专利申请No. 2005/0170452公开了能够生产包含GlcNAcMan5GlcNAc2糖形式的糖蛋白的低等真核生物宿主细胞。上述细胞中生产的糖蛋白可以用氨基己糖苷酶体外处理,来产生包含Man5GlcNAc2糖形式的重组糖蛋白。
在进一步的实施方式中,紧接地前述的宿主细胞进一步包括与细胞靶向信号肽融合的甘露糖苷酶II催化结构域,所述信号肽通常不与该催化结构域相连,并且被选择以将甘露糖苷酶II活性靶向宿主细胞的ER或高尔基体。重组糖蛋白穿过宿主细胞的ER或高尔基体产生了包含GlcNAcMan3GlcNAc2糖形式的重组糖蛋白,例如,主要包含GlcNAcMan3GlcNAc2糖形式的重组糖蛋白组合物。美国专利No. 7,029,872和美国公开的专利申请No. 2004/0230042公开了表达甘露糖苷酶II酶、并且能够生产主要具有GlcNAc2Man3GlcNAc2糖形式的糖蛋白的低等真核生物宿主细胞。上述细胞中生产的糖蛋白可以用氨基己糖苷酶体外处理,来产生包含Man3GlcNAc2糖形式的重组糖蛋白。
在进一步的实施方式中,紧接地前述的宿主细胞进一步包括与细胞靶向信号肽融合的N-乙酰葡糖氨基转移酶II(GlcNAc转移酶II或GnT II)催化结构域,所述信号肽通常不与该催化结构域相连,并且被选择以将GlcNAc转移酶II活性靶向宿主细胞的ER或高尔基体。重组糖蛋白穿过宿主细胞的ER或高尔基体产生了包含GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白,例如,主要包含GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白组合物。例如,美国专利No. 7,029,872和美国公开的专利申请No. 2004/0018590和2005/0170452公开了能够生产包含GlcNAc2Man3GlcNAc2糖形式的糖蛋白的低等真核生物宿主细胞。上述细胞中生产的糖蛋白可以用氨基己糖苷酶体外处理,来产生包含Man3GlcNAc2糖形式的重组糖蛋白。
在进一步的实施方式中,紧接地前述的宿主细胞进一步包括与细胞靶向信号肽融合的半乳糖基转移酶催化结构域,所述信号肽通常不与该催化结构域相连,并且被选择以将半乳糖基转移酶活性靶向宿主细胞的ER或高尔基体。重组糖蛋白穿过宿主细胞的ER或高尔基体产生了包含GalGlcNAc2Man3GlcNAc2 或Gal2GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白,或其混合物,例如,主要包含GalGlcNAc2Man3GlcNAc2糖形式或Gal2GlcNAc2Man3GlcNAc2糖形式或其混合物的重组糖蛋白组合物。美国专利No. 7,029,872和美国公开的专利申请No. 2006/0040353公开了能够生产包含Gal2GlcNAc2Man3GlcNAc2糖形式的糖蛋白的低等真核生物宿主细胞。上述细胞中生产的糖蛋白可以用半乳糖苷酶体外处理,来产生包含GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白,例如主要包含GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白组合物。
在进一步的实施方式中,紧接地前述的宿主细胞进一步包括与细胞靶向信号肽融合的唾液酸转移酶催化结构域,所述信号肽通常不与该催化结构域相连,并且被选择以将唾液酸转移酶活性靶向宿主细胞的ER或高尔基体。重组糖蛋白穿过宿主细胞的ER或高尔基体产生了主要包含NANA2Gal2GlcNAc2Man3GlcNAc2糖形式或NANAGal2GlcNAc2Man3GlcNAc2糖形式或其混合物的重组糖蛋白。对于低等真核生物宿主细胞例如酵母和丝状真菌,有用的是所述宿主细胞进一步包括提供CMP-唾液酸用于向N-聚糖转移的手段。美国公开的专利申请No. 2005/0260729公开了遗传工程化低等真核生物以具有CMP-唾液酸合成途径的方法,美国公开的专利申请No.2006/0286637公开了遗传工程化低等真核生物来生产唾液酸化的糖蛋白的方法。上述细胞中生产的糖蛋白可以用神经氨酸酶体外处理,来产生主要包含Gal2GlcNAc2Man3GlcNAc2糖形式或GalGlcNAc2Man3GlcNAc2糖形式或其混合物的重组糖蛋白。
前述宿主细胞的任一种可以进一步包括选自由GnT III、GnT IV、GnT V、GnT VI和GnT IX构成的组的一种或更多种GlcNAc转移酶,以生产具有二分的(GnT III)和/或多触角的(GnT IV、V、VI和IX)的N-聚糖结构的糖蛋白,例如在美国公开的专利申请No. 2004/074458和2007/0037248中公开的。
在进一步的实施方式中,产生主要具有GlcNAcMan5GlcNAc2N-聚糖的糖蛋白的宿主细胞进一步包括与细胞靶向信号肽融合的半乳糖基转移酶催化结构域,所述信号肽通常不与该催化结构域相连,并且被选择以将半乳糖基转移酶活性靶向宿主细胞的ER或高尔基体。重组糖蛋白穿过宿主细胞的ER或高尔基体产生了主要包含GalGlcNAcMan5GlcNAc2糖形式的重组糖蛋白。
在进一步的实施方式中,产生主要具有GalGlcNAcMan5GlcNAc2N-聚糖的糖蛋白的直接地前述的宿主细胞进一步包括与细胞靶向信号肽融合的唾液酸转移酶催化结构域,所述信号肽通常不与该催化结构域相连,并且被选择以将唾液酸转移酶活性靶向宿主细胞的ER或高尔基体。重组糖蛋白穿过宿主细胞的ER或高尔基体产生了包含NANAGalGlcNAcMan5GlcNAc2糖形式的重组糖蛋白。
在进一步的方面中,前述宿主细胞的任一项,所述宿主细胞进一步被修饰以包括岩藻糖基转移酶,以及产生岩藻糖并转运岩藻糖进入ER或高尔基体的途径。修饰巴斯德毕赤氏酵母以使得它能够生产其中一个或更多个N-聚糖被岩藻糖基化的糖蛋白的方法的实例在PCT国际申请NO. PCT/US2008/002787中公开了。在本发明的特别的方面中,巴斯德毕赤氏酵母宿主细胞被进一步修饰以包括岩藻糖基化途径,其包含GDP-甘露糖-4,6-脱水酶、GDP-酮基-脱氧-甘露糖-差向异构酶/GDP-酮基-脱氧-半乳糖-还原酶、GDP-岩藻糖转运蛋白和岩藻糖基转移酶。在特定的方面中,所述岩藻糖基转移酶选自由岩藻糖基转移酶构成的组,所述岩藻糖基转移酶选自由α1,2-岩藻糖基转移酶、α1,3-岩藻糖基转移酶、α1,4-岩藻糖基转移酶和α1,6-岩藻糖基转移酶构成的组。
各种前述宿主细胞进一步包括一种或更多种糖类转运蛋白,例如UDP-GlcNAc转运蛋白(例如,乳酸克鲁维酵母和小家鼠(Mus musculus)UDP-转运蛋白)、UDP-半乳糖转运蛋白(例如,果蝇(Drosophila melanogaster)UDP-半乳糖转运蛋白)和CPM-唾液酸转运蛋白(例如,人类唾液酸转运蛋白)。由于低等真核生物宿主细胞例如酵母和丝状真菌缺乏上述转运蛋白,优选的是低等真核生物宿主细胞例如酵母和丝状真菌被遗传工程化以包括上述转运蛋白。
宿主细胞进一步包括巴斯德毕赤氏酵母,其被遗传工程化以消除具有磷酸甘露糖残基的糖蛋白,通过删除或破坏磷酸甘露糖基转移酶基因PNO1和MNN4B(参见,例如,美国专利No. 7,198,921和7,259,007)之一或两者,其在进一步的方面中还可以包括删除或破坏MNN4A基因。破坏包括破坏编码特定酶的开放阅读框,或破坏开放阅读框的表达,或利用干扰RNA、反义RNA等取消编码一种或更多种β-甘露糖基转移酶和/或磷酸甘露糖基转移酶的RNA的翻译。宿主细胞可以进一步包括被修饰以产生特定N-聚糖结构的前述宿主细胞的任一种。
宿主细胞进一步包括低等真核生物细胞(例如,酵母,例如巴斯德毕赤氏酵母),其被遗传修饰以控制糖蛋白的O-糖基化,通过删除或破坏一种或更多种蛋白质O-甘露糖基转移酶(Dol-P-Man:Protein(Ser/Thr)甘露糖基转移酶基因)(PMTs)(参见美国专利No. 5,714,377),或在存在Pmtp抑制物和/或α-甘露糖苷酶的情况下生长,如在公开的国际申请No. WO 2007061631中公开的,或这两者。破坏包括破坏编码Pmtp的开放阅读框,或破坏开放阅读框的表达,或利用干扰RNA、反义RNA等取消编码一种或更多种Pmtps的RNA的翻译。宿主细胞可以进一步包括被修饰以产生特定N-聚糖结构的前述宿主细胞的任一种。Pmtp抑制物包括但不限于苯亚甲基噻唑烷二酮。可以使用的苯亚甲基噻唑烷二酮的实例有5-[ [ 3,4-二(苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸;5-[ [ 3-(1-苯基乙氧基)-4-(2-苯基乙氧基)]苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸;和5-[ [ 3-(1-苯基-2-羟基)乙氧基)-4-(2-苯基乙氧基)]苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸。
在特定的实施方式中,至少一种内源的PMT基因的功能或表达被降低、破坏或删除。例如,在特定的实施方式中,选自由PMT1、PMT2、PMT3和PMT4基因构成的组的至少一种内源的PMT基因的功能或表达被降低、破坏或删除;或宿主细胞在存在一种或更多种PMT抑制物的情况下培养。在进一步的实施方式中,所述宿主细胞包括一种或更多种PMT基因删除或破坏,以及所述宿主细胞在存在一种或更多种Pmtp抑制物的情况下培养。在这些实施方式的特定方面中,所述宿主细胞还表达分泌的α-1,2-甘露糖苷酶。
PMT删除或破坏和/或Pmtp抑制物通过降低O-糖基化占用来控制O-糖基化;也就是通过降低被糖基化的糖蛋白上O-糖基化位点的总数量。细胞分泌的α-1,2-甘露糖酶的进一步添加通过降低糖蛋白上O-聚糖的甘露糖链长度来控制O-糖基化。因而,与分泌的α- 1,2-甘露糖苷酶的表达组合PMT删除或破坏和/或Pmtp抑制物通过降低占用和链长度控制O-糖基化。在特别的情况下,PMT删除或破坏、Pmtp抑制物以及α-1,2-甘露糖苷酶的特定组合经验性地确定,因为特定的异源糖蛋白(例如抗体)可能以不同的效率程度表达和通过高尔基体转运,因而可能需要PMT删除或破坏、Pmtp抑制物以及α-1,2-甘露糖苷酶的特定组合。在另一个方面,编码一种或更多种内源的甘露糖基转移酶的基因被删除。这种删除可以与提高分泌的α-1,2-甘露糖苷酶和/或PMT抑制物组合,或可以代替提供分泌的α-1,2-甘露糖苷酶和/或PMT抑制物。
因而,O-糖基化的控制对于在此处公开的宿主细胞中以更好的总产量生产特定糖蛋白,以及在正确组装的糖蛋白的产率方面是有用的。O-糖基化的降低或消除看起来对于糖蛋白例如完整抗体的组装和转运具有有益的效果,因为它们穿越分泌途径,并被转运到细胞表面。因而,在O-糖基化被控制的细胞中,相对于在O-糖基化不被控制的宿主细胞中获得的产量,正确组装的糖蛋白例如抗体片段的产量被提高了。糖蛋白的产量在某些情况下可以通过过量表达编码哺乳动物或人侣伴蛋白的核酸分子,或用编码一种或更多种哺乳动物或人侣伴蛋白的核酸分子替换编码一种或更多种内源侣伴蛋白的基因来改善。此外,哺乳动物或人侣伴蛋白在宿主细胞中的表达看起来也控制细胞中的O-糖基化。因而,进一步包括的是此处的宿主细胞,其中编码侣伴蛋白的至少一种内源基因的功能被降低或消除,编码至少一种侣伴蛋白的哺乳动物或人同源物的载体在所述宿主细胞中表达。还包括的是宿主细胞,其中表达内源的宿主细胞侣伴蛋白以及哺乳动物或人侣伴蛋白。在进一步的方面中,低等真核宿主细胞是酵母或丝状真菌宿主细胞。在PTC国际申请NO. PCT/US2009/033507中已经公开了宿主细胞的侣伴蛋白的运用的实例,其中人侣伴蛋白被导入以改善产量以及降低或控制重组蛋白质的O-糖基化。如同上述的,进一步包括的是低等真核宿主细胞,其中,除了如上所述用编码一种或更多种哺乳动物或人侣伴蛋白的核酸分子替换编码一种或更多种内源侣伴蛋白的基因、或过量表达一种或更多种哺乳动物或人侣伴蛋白之外,编码蛋白质O-甘露糖基转移酶(PMT)蛋白的至少一种内源基因的功能或表达被降低、破坏或删除。在特定的实施方式中,选自由PMT1、PMT2、PMT3和PMT4基因构成的组的至少一种内源PMT基因的功能被降低、破坏或删除。
因此,在此公开的方法可以使用被遗传修饰以产生糖蛋白的任何宿主细胞,在所述糖蛋白中主要N-聚糖选自由复合N-聚糖、杂合N-聚糖和高甘露糖N-聚糖构成的组,其中复合N-聚糖选自由Man3GlcNAc2, GlcNAC(1-4)Man3GlcNAc2, Gal(1-4)GlcNAc(1-4)Man3GlcNAc2和NANA(1-4)Gal(1-4)Man3GlcNAc2构成的组;杂合N-聚糖选自由Man5GlcNAc2,
GlcNAcMan5GlcNAc2, GalGlcNAcMan5GlcNAc2和NANAGalGlcNAcMan5GlcNAc2构成的组; 以及高甘露糖N-聚糖选自由Man6GlcNAc2, Man7GlcNAc2, Man8GlcNAc2和Man9GlcNAc2构成的组。N-聚糖结构的实例包括但不限于 Man5GlcNAc2、GlcNAcMan5GlcNAc2、GlcNAcMan3GlcNAc2、GlcNAc2Man3GlcNAc2、GlcNAc3Man3GlcNAc2、GlcNAc4Man3GlcNAc2、GalGlcNAc2Man3GlcNAc2、Gal2GlcNAc2Man3GlcNAc2、Gal2GlcNAc3Man3GlcNAc2、Gal2GlcNAc4Man3GlcNAc2、Gal3GlcNAc3Man3GlcNAc2、Gal3GlcNAc4Man3GlcNAc2、Gal4GlcNAc4Man3GlcNAc2、NANAGal2GlcNAc2Man3GlcNAc2、NANA2Gal2GlcNAc2Man3GlcNAc2、NANA3Gal3GlcNAc3Man3GlcNAc2和NANA4Gal4GlcNAc4Man3GlcNAc2。
可以用于构建重组宿主细胞的酵母选择性标记包括药物抗性标志物和遗传学功能,其容许酵母宿主细胞合成关键的细胞营养物,例如,氨基酸。通常在酵母中使用的药物抗性标志物包括氯霉素、卡那霉素、甲氨蝶呤、G418(geneticin)、Zeocin,等等。容许酵母宿主细胞合成关键细胞营养物的遗传功能与在相应的基因组功能方面具有营养缺陷突变的可获得的酵母菌株一起使用。常见的酵母可选择标记物提供了合成亮氨酸(LEU2)、色氨酸(TRP1和TRP2)、脯氨酸(PRO1)、尿嘧啶(URA3、URA5、URA6)、组氨酸(HIS3)、赖氨酸(LYS2)、腺嘌呤(ADE1或ADE2)等的遗传功能。其他酵母选择性标记包括来自酿酒酵母的ARR3基因,其赋予了在存在亚砷酸盐的情况下生长的酵母细胞的亚砷酸盐抗性(Bobrowicz et al.,
Yeast, 13:819-828(1997);Wysocki et al., J.
Biol. Chem. 272:30061-30066(1997))。许多适合的整合位点包括在美国专利No. 7,479,389中例举的那些,包括酿酒酵母和其他酵母或真菌已知座位的同源物。将载体整合到酵母中的方法是公知的(参见,例如美国专利No. 7,479,389美国专利No. 7,514,253、美国公开的申请No. 2009012400和WO2009/085135)。插入位点的实例包括但不限于毕赤氏酵母ADE基因;毕赤氏酵母TRP(包括TRP1到TRP2)基因;毕赤氏酵母MCA基因;毕赤氏酵母CYM基因;毕赤氏酵母PEP基因;毕赤氏酵母PRB基因;和毕赤氏酵母LEU基因。毕赤氏酵母ADE1和ARG4基因已经在Lin Cereghino et al.,
Gene 263:159-169(2001)和美国专利No. 4,818,700中描述,HIS3和TRP1基因已经在Cosano et al.,
Yeast 14:861-867(1998)中描述,HIS4已经在GenBank Accession No.
X56180中描述。
本发明进一步提供了在甲基营养型酵母例如巴斯德毕赤氏酵母中生产成熟的人促红细胞生成素的方法,所述酵母主要包含唾液酸封端的双分枝N-聚糖,并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。所述方法包括提供重组巴斯德毕赤氏酵母宿主细胞,其被遗传工程化以生产唾液酸封端的双分枝N-聚糖,其中至少BMT1、BMT2和BMT3基因被删除或破坏,并且其包括两种或更多种核酸分子,各自编码包含与信号肽融合的成熟的人促红细胞生成素EPO的融合蛋白,所述信号肽靶向ER或高尔基体,并且当所述融合蛋白处于ER或高尔基体中时被除去;在对表达和加工所述第一和第二融合蛋白有效的条件下在培养基中生长所述宿主细胞;以及从所述培养基回收所述成熟的人促红细胞生成素,来产生所述成熟的人促红细胞生成素,其主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
在特定的方面中,编码成熟的人促红细胞生成素的核酸分子是密码子优化的,为了在甲基营养型酵母例如巴斯德毕赤氏酵母中最佳的表达。如在实施例中所示的,成熟的人促红细胞生成素作为融合蛋白被编码,其中EPO在促红细胞生成素的成熟形式的N-末端与信号肽的C-末端融合,所述信号肽将融合蛋白靶向分泌途径用于加工,包括糖基化。信号肽的实例包括但不限于酿酒酵母αMATpre信号肽或鸡溶菌酶信号肽。可以使用其他信号序列代替在此公开的那些,例如,黑曲霉α-淀粉酶信号肽以及人血清白蛋白(HSA)信号肽。在一个实施方式中,第一核酸分子编码下述融合蛋白,其中成熟的促红细胞生成素融合到酿酒酵母αMATpre 信号肽,第二核酸分子编码下述融合蛋白,其中成熟的促红细胞生成素融合到酿酒酵母αMATpre 信号肽鸡溶菌酶信号肽。所述信号肽可以通过接头肽融合到成熟的人促红细胞生成素,所述接头肽可以含有一个或更多个蛋白酶裂解位点。
在进一步的方面中,宿主细胞包括表达盒的二到十二个之间的拷贝,所述表达盒编码包含成熟的人促红细胞生成素的融合蛋白。在某些方面中,所述宿主细胞包括表达盒的约八个到十一个之间的拷贝,所述表达盒编码包含成熟的人促红细胞生成素的融合蛋白。在其他方面,所述宿主细胞包括约三到四个拷贝的第一核酸,以及五到七个拷贝的第二核酸。宿主细胞被遗传工程化以生产唾液酸封端的双分枝N-聚糖,其中至少BMT1、BMT2和BMT3基因被删除或破坏。这样的宿主细胞进一步包括至少OCH1、PNO1、MNN4和MNN4L1基因删除或破坏。宿主细胞进一步包括编码至少以下的嵌合的糖基化酶的一种或更多种核酸分子:与细胞靶向肽融合的α1,2-甘露糖苷酶催化结构域,所述细胞靶向肽将所述催化结构域靶向宿主细胞的ER或高尔基体;与细胞靶向肽融合的GlcNAc转移酶I催化结构域,所述细胞靶向肽将所述催化结构域靶向宿主细胞的ER或高尔基体;与细胞靶向肽融合的甘露糖苷酶II催化结构域,所述细胞靶向肽将所述催化结构域靶向宿主细胞的ER或高尔基体;与细胞靶向肽融合的GlcNAc转移酶II催化结构域,所述细胞靶向肽将所述催化结构域靶向宿主细胞的ER或高尔基体;与细胞靶向肽融合的β1,4-半乳糖基转移酶催化结构域,所述细胞靶向肽将所述催化结构域靶向宿主细胞的ER或高尔基体;以及与细胞靶向肽融合的α1,2-唾液酸转移酶催化结构域,所述细胞靶向肽将所述催化结构域靶向宿主细胞的ER或高尔基体。选择这些糖基化酶以在它们被靶向的ER或高尔基体中的位置处是有活性的。选择糖基化酶并为了最佳的活性将酶靶向ER或高尔基体的特定区域的方法已经在美国专利No. 7,029,872和7,449,308,和公开的美国申请Nos. 2006/0040353和2006/0286637中描述。宿主细胞被进一步修饰以包括如在公开的美国申请No.2006/0286637中公开的途径的酶,以生产CMP-唾液酸,并且以包括GlcNAc和半乳糖转运蛋白和UDP-半乳糖-4-差向异构酶。最后,宿主进一步包括核酸分子,其编码与细胞靶向肽融合的真菌α1,2-甘露糖苷酶催化结构域,所述细胞靶向肽将所述催化结构域靶向分泌途径用于分泌,并且其引起O-聚糖占用和链长度的降低。
与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性的检测可以在夹心ELISA中或在Western印迹中测定。
在进一步的方面中,回收成熟的人促红细胞生成素包括阳离子交换层析步骤和/或羟磷灰石层析步骤和/或阴离子交换层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。在一个实施方式中,成熟的人促红细胞生成素的回收包括阳离子交换层析步骤和随后的羟磷灰石层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。任选地,成熟的人促红细胞生成素的回收包括阴离子层析步骤,所述成熟的人促红细胞生成素主要地包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
进一步提供的是包含成熟的人促红细胞生成素和药学上可接受的盐的组合物,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述抗原是如在此公开的获得的。在特定的实施方式中,约50到60%的N-聚糖包含位于两个分枝上的唾液酸残基;在进一步的实施方式中,大于70%的N-聚糖包含位于两个分枝上的唾液酸残基。在进一步的方面中,小于30%的N-聚糖是中性的N-聚糖(即,在N-聚糖的非还原末端处的至少一个末端上不是唾液酸化的)。在再进一步的方面中,小于20%的N-聚糖是中性的N-聚糖。
在特定的方面中,成熟的人促红细胞生成素与亲水性聚合物共轭,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述亲水性聚合物在特定的实施方式中是聚乙二醇聚合物。与聚乙二醇聚合物共轭的、主要包含唾液酸封端的双分枝N-聚糖的成熟的人促红细胞生成素的实例已经在共同拥有的美国公开申请No. 2008/0139470中描述了。
聚乙二醇聚合物(PEG)基团可以是任何方便的分子量,可以是线性的或分枝的。PEG的平均分子量优选的从约2千道尔顿(“kD”)到约100 kDa;更优选的从约5 kDa到约60 kDa,更优选的从约20 kDa到约50 kDa;最优选的从约30 kDa到约40 kDa。这些PEG可以由任何商业上的供应商提供,包括NOF公司(Tokyo, Japan)、Dow Pharma(ChiroTech Technology,
Cambridge,UK)、Nektar(San Carlos, CA)和SunBio(Anyang City, South Korea)。适合的PEG部分包括,例如,40 kDa的甲氧基聚(乙二醇)丙醛;60 kDa的甲氧基聚(乙二醇)丙醛;31 kDa的α-甲基-w-(3-氧基丙氧基),聚氧乙烯;30 kDa的PEG:30kDa的甲氧基聚(乙二醇)丙醛和45 kDa的2,3-二(甲基聚氧乙烯基-氧)-1-[(3-氧基丙基)聚氧乙烯-氧]-丙烷。PEG基团一般经由酰化或还原性氨基化作用通过PEG部分上的反应基团(例如,醛、氨基、硫醇或酯基)到蛋白质或目标多肽上的反应基团(例如,醛、氨基或酯基)连接于促红细胞生成素。例如,PEG部分可以直接地或通过接头连接到促红细胞生成素的N-末端氨基酸残基。
对于合成肽的PEG化的有用的策略包括通过在溶液中形成共轭键来组合合成肽和PEG部分,其各自带有针对对方相互反应性的特定官能团。肽可以用常规的固相合成(参见,例如,实施例4)来容易地制备。肽是在特定位点与合适的功能基团“预先活化的”。在与PEG部分反应之前,纯化前体并完全表征。肽与PEG的连接通常在水相中发生,可以通过反相分析HPLC容易地监视。PEG化的肽可以通过制备型HPLC容易地纯化,通过分析HPLC、氨基酸分析和激光脱附质谱法来表征。
以下实施例意图促进本发明的进一步理解。
实施例1
遗传工程化的巴斯德毕赤氏酵母菌株YGLY3159是产生带有唾液酸化的N-聚糖的重组人红细胞生成素(rhEPO)的菌株。菌株的构建已经在美国公开的申请No. 20080139470中描述,在附图1中示意地说明。简要地,菌株如下构建。
菌株YGLY3159是利用早先描述的方法从野生型巴斯德毕赤氏酵母菌株 NRRL-Y11430构建的 (参见,例如,美国专利No. 7,449,308;美国专利No. 7,479,389;美国公开的专利申请No. 20090124000;公开的PCT申请No. WO2009085135;Nett and Gerngross, Yeast
20:1279(2003);Choi et al., Proc.
Natl. Acad. Sci. USA 100:5022(2003);Hamilton et al.,
Science 301:1244(2003))。所有质粒利用标准的分子生物学操作在pUC19质粒中制造。对于为在巴斯德毕赤氏酵母中表达而优化的核苷酸序列,天然的核苷酸序列通过GENEOPTIMIZER软件(GeneArt, Regensburg,
Germany)分析,结果用于产生密码子为了巴斯德毕赤氏酵母表达而优化的核苷酸序列。通过电穿孔转化酵母菌株(使用电穿仪BioRad的厂家建议的标准技术)。
质粒pGLY6(附图2)是靶向URA5座位的整合载体,含有包含酿酒酵母转化酶基因或转录单元(ScSUC2;SEQ ID NO:1)的核酸分子,其一侧是包含来自巴斯德毕赤氏酵母URA5基因的5'区域的核苷酸序列(SEQ ID NO:59)的核酸分子,另一侧是包含来自巴斯德毕赤氏酵母URA5基因的3'区域的核苷酸序列(SEQ ID NO:60)的核酸分子。质粒pGLY6被线性化,线性化的质粒转化到野生型菌株 NRRL-Y11430中以产生多个菌株,在其中ScSUC2基因通过双交叉同源重组插入到URA5座位中。菌株YGLY1-3从所产生的菌株中选出,是对尿苷营养缺陷的。
质粒pGLY40(附图3)是靶向OCH1座位的整合载体,含有包含巴斯德毕赤氏酵母URA5基因或转录单元(SEQ ID NO:61)的核酸分子,其侧翼是包含lacZ重复(SEQ ID NO:62)的核酸分子,随后在一侧是包含来自OCH1基因的5'区域的核苷酸序列(SEQ ID NO:64)的核酸分子,另一侧是包含来自OCH1基因的3'区域的核苷酸序列(SEQ ID NO:65)的核酸分子。质粒pGLY40用SfiI线性化,线性化的质粒转化到菌株YGLY1-3中以产生多个菌株,在其中侧翼是lacZ重复的URA5基因通过双交叉同源重组插入到OCH1座位中。菌株YGLY2-3从所产生的菌株中选出,是对URA5原养型的。菌株YGLY2-3在存在 5-氟乳清酸(5-FOA)的情况下反选择以产生多个菌株,在其中URA5基因已经丧失,在OCH1座位中仅留下lacZ重复。这使得菌株是对尿苷营养缺陷的。选出菌株YGLY4-3。
质粒pGLY43a(附图4)是靶向BMT2座位的整合载体,含有包含乳酸克鲁维酵母 UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)转运蛋白基因或转录单元(KlMNN2-2, SEQ ID NO:3)的核酸分子,其邻近于侧翼是包含lacZ重复的核酸分子的、包含巴斯德毕赤氏酵母URA5基因或转录单元的核酸分子。所述邻近的基因一侧是包含来自BMT2基因的5'区域的核苷酸序列(SEQ ID NO:66)的核酸分子,另一侧是包含来自BMT2基因的3'区域的核苷酸序列(SEQ ID NO:67)的核酸分子。质粒pGLY43a用SfiI线性化,线性化的质粒转化到菌株YGLY4-3中以产生多个菌株,在其中KlMNN2-2基因和侧翼是lacZ重复的URA5基因通过双交叉同源重组插入到BMT2座位中。BMT2基因已经在Mille et al., J.
Biol. Chem. 283: 9724-9736(2008)和美国专利No.7,465,557中公开。菌株YGLY6-3从产生的菌株中选出,是对尿苷原养型的。菌株YGLY6-3在存在5-FOA的情况下反选择以产生多个菌株,在其中URA5基因已经丧失,仅留下lacZ重复。这使得菌株是对尿苷营养缺陷的。选出菌株YGLY8-3。
质粒pGLY48(附图5)是靶向MNN4L1座位的整合载体,含有表达盒,所述表达盒包含编码UDP-GlcNAc转运蛋白的小鼠同源物(SEQ ID NO:17)开放阅读框(ORF)的核酸分子,其在5'末端可操作连接到包含巴斯德毕赤氏酵母GAPDH启动子(SEQ ID NO:53)的核酸分子,在3'末端可操作连接到包含酿酒酵母CYC终止序列(SEQ ID NO:56)的核酸分子,邻近于侧翼是lacZ重复、包含巴斯德毕赤氏酵母URA5基因的核酸分子,其中表达盒在一起的一侧是包含来自巴斯德毕赤氏酵母MNN4L1基因的5'区域的核苷酸序列(SEQ ID NO:76)的核酸分子,另一侧是包含来自MNN4L1基因的3'区域的核苷酸序列(SEQ ID NO:77)的核酸分子。质粒pGLY48用SfiI线性化,线性化的质粒转化到菌株YGLY8-3中以产生多个菌株,在其中编码小鼠UDP-GlcNAc转运蛋白和URA5基因的表达盒通过双交叉同源重组插入到MNN4L1座位中。MNN4L1基因(也称为MNN4B)已经在美国专利No. 7,259,007中公开。菌株YGLY10-3从产生的菌株中选出,然后在存在5-FOA的情况下反选择以产生多个菌株,在其中URA5基因已经丧失,仅留下lacZ重复。选出菌株YGLY12-3。
质粒pGLY45(附图6)是靶向PNO1/MNN4座位的整合载体,含有包含巴斯德毕赤氏酵母URA5基因或转录单元的核酸分子,其侧翼是包含lacZ重复的核酸分子,随后在一侧是包含来自PNO1基因的5'区域的核苷酸序列(SEQ ID NO:74)的核酸分子,另一侧是包含来自MNN4基因的3'区域的核苷酸序列(SEQ ID NO:75)的核酸分子。质粒pGLY45用SfiI线性化,线性化的质粒转化到菌株YGLY12-3中以产生多个菌株,在其中侧翼是lacZ重复的URA5基因通过双交叉同源重组插入到MNN4座位中。PNO1基因已经在美国专利No. 7,198,921中公开,MNN4基因(也称为MNN4B)已经在美国专利No. 7,259,007中公开。菌株YGLY14-3从产生的菌株中选出,然后在存在5-FOA的情况下反选择以产生多个菌株,在其中URA5基因已经丧失,仅留下lacZ重复。选出菌株YGLY16-3。
质粒pGLY247(附图7)是靶向MET16座位的整合载体,含有包含巴斯德毕赤氏酵母URA5基因或转录单元的核酸分子,其侧翼是包含lacZ重复的核酸分子,随后在一侧是包含来自MET16基因的5'区域的核苷酸序列(SEQ ID NO:84)的核酸分子,另一侧是包含来自MET16基因的3'区域的核苷酸序列(SEQ ID NO:85)的核酸分子。质粒pGLY247用SfiI线性化,线性化的质粒转化到菌株YGLY16-3中以产生多个菌株,在其中侧翼是lacZ重复的URA5通过双交叉同源重组插入到MET16座位中。选出菌株YGLY20-3。
质粒pGLY248(附图8)是靶向URA5座位的整合载体,含有包含巴斯德毕赤氏酵母MET16基因(SEQ ID NO:86)的核酸分子,其一侧是包含来自URA5基因的5'区域的核苷酸序列(SEQ ID NO:59)的核酸分子,另一侧是包含来自URA5基因的3'区域的核苷酸序列(SEQ ID NO:60)的核酸分子。质粒pGLY248线性化,线性化的质粒转化到菌株YGLY20-3中以产生多个菌株,在其中被插入到URA5座位中的ScSUC2基因通过双交叉同源重组被MET16基因替换。菌株YGLY22-3被选出,然后在存在5-FOA的情况下反选择以产生多个菌株,在其中插入到MET16座位中的URA5基因已经丧失,仅留下lacZ重复。选出菌株YGLY24-3。
质粒pGLY582(附图9)为靶向HIS1座位的整合载体,含有串联的四个表达盒,其编码(1)酿酒酵母UDP-葡萄糖差向异构酶(ScGAL10),(2)在N-末端融合到酿酒酵母KRE2-s前导肽(33)将嵌合的酶靶向ER或高尔基体的人半乳糖基转移酶I(hGalT)催化结构域,(3)侧翼是lacZ重复的巴斯德毕赤氏酵母URA5基因或转录单元,以及(4)黑腹果蝇UDP-半乳糖转运蛋白(DmUGT)。编码ScGAL10的表达盒包含编码ScGAL10 ORF(SEQ ID NO:21)的核酸分子,其在5'末端与包含巴斯德毕赤氏酵母PMA1启动子(SEQ ID NO:45)的核酸分子可操作连接,在3'末端与包含巴斯德毕赤氏酵母PMA1转录终止序列(SEQ ID NO:46)的核酸分子可操作连接。编码嵌合的半乳糖基转移酶I的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码hGalT催化结构域的核酸分子(SEQ ID NO:23),其在5'末端融合到编码KRE2-s前导区33的核酸分子(SEQ ID NO:13),其在5'末端可操作连接到包含巴斯德毕赤氏酵母GAPDH启动子的核酸分子,在3'末端可操作连接到包含酿酒酵母CYC转录终止序列的核酸分子。URA5表达盒包含核酸分子,其包含侧翼是包含lacZ重复的核酸分子的巴斯德毕赤氏酵母URA5基因或转录单元。编码DmUGT的表达盒包含编码DmUGTORF(SEQ ID NO:19)的核酸分子,其在5'末端与包含巴斯德毕赤氏酵母OCH1启动子(SEQ ID NO:47)的核酸分子可操作连接,在3'末端与包含巴斯德毕赤氏酵母ALG12转录终止序列(SEQ ID NO:48)的核酸分子可操作连接。所述四个串联的盒一侧是包含来自HIS1基因的5'区域的核苷酸序列(SEQ ID NO:87)的核酸分子,另一侧是包含来自HIS1基因的3'区域的核苷酸序列(SEQ ID NO:88)的核酸分子。质粒pGLY582线性化,线性化的质粒转化到菌株YGLY24-3中以产生多个菌株,在其中四个串联的表达盒通过同源重组插入到HIS1座位中。选出菌株YGLY58,是对组氨酸营养缺陷的,以及对尿苷原养型的。
质粒pGLY167b(附图10)靶向ARG1座位的整合载体,含有串联的三个表达盒,其编码(1)在N-末端融合到酿酒酵母MNN2前导肽(53)以将嵌合的酶靶向ER或高尔基体的黑腹果蝇甘露糖苷酶II催化结构域(KD),(2)巴斯德毕赤氏酵母HIS1基因或转录单元,和(3)在N-末端融合到酿酒酵母MNN2前导肽(54)以将嵌合的酶靶向ER或高尔基体的大鼠N-乙酰葡萄糖胺(GlcNAc)转移酶II催化结构域(TC)。编码KD53的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码黑腹果蝇甘露糖苷酶II催化结构域的核酸分子(SEQ ID NO:33),其在5'末端融合到编码MNN2前导区53的核酸分子(SEQ ID NO:5),其在5'末端可操作连接到包含巴斯德毕赤氏酵母GAPDH启动子的核酸分子,在3'末端可操作连接到包含酿酒酵母CYC转录终止序列的核酸分子。HIS1表达盒包含核酸分子,其包含巴斯德毕赤氏酵母HIS1基因或转录单元(SEQ ID NO:89)。编码TC54的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码大鼠GlcNAc转移酶II催化结构域的核酸分子(SEQ ID NO:31),其在5'末端融合到编码MNN2前导区54的核酸分子(SEQ ID NO:7),其在5'末端可操作连接到包含巴斯德毕赤氏酵母PMA1启动子的核酸分子,在3'末端可操作连接到包含巴斯德毕赤氏酵母PMA1转录终止序列的核酸分子。所述三个串联的盒一侧是包含来自ARG1基因的5'区域的核苷酸序列(SEQ ID NO:79)的核酸分子,另一侧是包含来自ARG1基因的3'区域的核苷酸序列(SEQ ID NO:80)的核酸分子。质粒pGLY167b用SfiI线性化,线性化的质粒转化到菌株YGLY58中以产生多个菌株(在其中三个串联的表达盒通过双交叉同源重组插入到ARG1座位中。菌株YGLY73从产生的菌株中选出,是对精氨酸营养缺陷的,并对尿苷和组氨酸原养型的。菌株然后在存在5-FOA的情况下反选择,以产生现在对尿苷营养缺陷的多个菌株。选出菌株YGLY1272。
质粒pGLY1430(附图11)是靶向ADE1座位而不破坏座位表达的KINKO整合载体,含有串联的四个表达盒,其编码(1)在N-末端融合到巴斯德毕赤氏酵母SEC12前导区肽(10)以将嵌合的酶靶向ER或高尔基体的人GlcNAc转移酶I催化结构域(NA),(2)UDP-GlcNAc转运蛋白的小鼠同源物(MmTr),(3)在N-末端融合到酿酒酵母SEC12前导肽(8)以将嵌合的酶靶向ER或高尔基体的小鼠甘露糖苷酶IA催化结构域(FB),和(4)巴斯德毕赤氏酵母URA5基因或转录单元。KINKO(很少或没有敲除的敲入)整合载体允许将异源DNA插入到靶点座位而不破坏在靶点座位处基因的表达,已经在美国公开的申请No. 20090124000中描述了。编码NA10的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码人GlcNAc转移酶I催化结构域的核酸分子(SEQ ID NO:25),其在5'末端融合到编码SEC12前导区10的核酸分子(SEQ ID NO:11),其在5'末端可操作连接到包含巴斯德毕赤氏酵母PMA1启动子的核酸分子,在3'末端可操作连接到包含巴斯德毕赤氏酵母PMA1转录终止序列的核酸分子。编码MmTr的表达盒包含编码UDP-GlcNAc转运蛋白的小鼠同源物ORF的核酸分子,其在5'末端与包含巴斯德毕赤氏酵母SEC4启动子(SEQ ID NO:49)的核酸分子可操作连接,在3'末端与包含巴斯德毕赤氏酵母OCH1终止序列(SEQ ID NO:50)的核酸分子可操作连接。编码FB8的表达盒包含编码小鼠甘露糖苷酶IA催化结构域的核酸分子(SEQ ID NO:27),其在5'末端融合到编码SEC12-m前导区8的核酸分子(SEQ ID NO:15),其在5'末端可操作连接到包含巴斯德毕赤氏酵母GADPH启动子的核酸分子,在3'末端可操作连接到包含酿酒酵母CYC转录终止序列的核酸分子。URA5表达盒包含核酸分子,其包含侧翼是包含lacZ重复的核酸分子的巴斯德毕赤氏酵母URA5基因或转录单元。四个串联的盒在一侧是包含来自ADE1基因的5'区域和完整ORF的核苷酸序列(SEQ ID NO:82)的核酸分子,随后是巴斯德毕赤氏酵母ALG3终止序列(SEQ ID NO:54),在另一侧是包含来自ADE1基因的3'区域的核苷酸序列(SEQ ID NO:83)的核酸分子。质粒pGLY1430用SfiI线性化,线性化的质粒转化到菌株YGLY1272中以产生多个菌株,在其中四个串联的表达盒通过双交叉同源重组紧跟着ADE1 ORF插入到ADE1座位中。菌株YGLY1305从产生的菌株中选出,是对精氨酸营养缺陷的,并且现在对尿苷、组氨酸和腺嘌呤原养型的。菌株然后在存在5-FOA的情况下反选择,以产生现在对尿苷营养缺陷的多个菌株。菌株YGLY1461被选出,能够产生主要具有半乳糖终止的N-聚糖的糖蛋白。
质粒pGFI165(附图12)是靶向PRO1座位而不破坏座位表达的KINKO整合载体,含有表达盒,其编码(1)在N-末端融合到酿酒酵母αMATpre信号肽(aMATTrMan)以将嵌合的蛋白靶向分泌途径并从细胞分泌的李氏木霉α-1,2-甘露糖苷酶催化结构域,和(2)巴斯德毕赤氏酵母URA5基因或转录单元。编码aMATTrMan的表达盒包含编码李氏木霉催化结构域的核酸分子(SEQ ID NO:29),其在5'末端融合到编码酿酒酵母αMATpre信号肽的核酸分子(SEQ ID NO:9),其在5'末端可操作连接到包含巴斯德毕赤氏酵母GADPH启动子的核酸分子,在3'末端可操作连接到包含酿酒酵母CYC转录终止序列的核酸分子。URA5表达盒包含核酸分子,其包含侧翼是包含lacZ重复的核酸分子的巴斯德毕赤氏酵母URA5基因或转录单元。两个串联的盒在一侧是包含来自PRO1基因的5'区域和完整ORF的核苷酸序列(SEQ ID NO:90)的核酸分子,随后是巴斯德毕赤氏酵母ALG3终止序列,在另一侧是包含来自PRO1基因的3'区域的核苷酸序列(SEQ ID NO:91)的核酸分子。质粒pGFI165用SfiI线性化,线性化的质粒转化到菌株YGLY1461中以产生多个菌株,在其中两个表达盒通过双交叉同源重组紧跟着PRO1 ORF插入到PRO1座位中。菌株YGLY1703从产生的菌株中选出,是对精氨酸营养缺陷的,并对尿苷、组氨酸、腺嘌呤和脯氨酸原养型的。这种菌株能够生产具有降低的O-糖基化的糖蛋白(参见公开的美国申请No.20090170159)。
质粒pGLY2088(附图13)是靶向TRP2或AOX1座位的整合载体,含有表达盒,其编码(1)在N-末端融合到酿酒酵母αMATpre信号肽(alpha MF-pre)以将嵌合的蛋白靶向分泌途径并从细胞分泌的成熟的人促红细胞生成素(EPO),以及(2)zeocin抗性蛋白(Sh ble或ZeocinR)。编码EPO的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码成熟的人EPO的核酸分子(SEQ ID NO:92),其在5'末端融合到编码酿酒酵母αMATpre信号肽的核酸分子,其在5'末端可操作连接到包含巴斯德毕赤氏酵母AOX1启动子(SEQ ID NO:55)的核酸分子,在3'末端可操作连接到包含酿酒酵母CYC转录终止序列的核酸分子。ZeocinR表达盒包含编码Sh ble ORF(SEQ ID NO:58)的核酸分子,其在5'末端可操作连接到酿酒酵母TEF1启动子(SEQ ID NO:57),在3'末端可操作连接到酿酒酵母CYC终止序列。两个串联的盒在一侧是包含核苷酸序列的核酸分子,所述核苷酸序列包含TRP2基因(SEQ ID NO:78)。质粒pGLY2088在PmeI位点线性化,转化到菌株YGLY1703中来产生多个菌株,在其中两个表达盒通过单交叉同源重组中的滚动插入到AOX1座位中,其引起EPO表达盒的多个拷贝插入到AOX1座位中而不破坏AOX1座位。菌株YGLY2849从产生的菌株中选出,是对精氨酸营养缺陷的,并现在对尿苷、组氨酸、腺嘌呤和脯氨酸原养型的。通过测量分离自菌株的DNA的测序数据的强度来测出的,菌株含有约三个到四个拷贝的EPO表达盒。在ER和高尔基体中嵌合EPO的加工期间,前导肽被除去。因而,产生的rhEPO是EPO的成熟形式。
质粒pGLY2456(附图14)是靶向TRP2座位而不破坏座位表达的KINKO整合载体,含有六个表达盒,其编码(1)小鼠CMP-唾液酸转运蛋白(mCMP-Sia Transp),(2)人UDP-GlcNAc 2-差向异构酶/N-乙酰甘露糖胺激酶(hGNE),(3)巴斯德毕赤氏酵母ARG1基因或转录单元,(4)人CMP-唾液酸合酶(hCMP-NANA),(5)人N-乙酰基神经氨酸-9-磷酸合酶(hSIAP S),(6)在N-末端融合到酿酒酵母KRE2前导肽(33)以将嵌合的酶靶向ER或高尔基体的小鼠α-2,6-唾液酸转移酶催化结构域(mST6),以及巴斯德毕赤氏酵母ARG1基因或转录单元。编码小鼠CMP-唾液酸转运蛋白的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码mCMP Sia Transp ORF的核酸分子(SEQ ID NO:35),其在5'末端与包含巴斯德毕赤氏酵母PMA1启动子的核酸分子可操作连接,在3'末端与包含巴斯德毕赤氏酵母PMA1转录终止序列的核酸分子可操作连接。编码人UDP-GlcNAc 2--差向异构酶/N-乙酰甘露糖胺激酶的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码hGNE ORF的核酸分子(SEQ ID NO:37),其在5'末端与包含巴斯德毕赤氏酵母GAPDH启动子的核酸分子可操作连接,在3'末端与包含酿酒酵母CYC转录终止序列的核酸分子可操作连接。编码巴斯德毕赤氏酵母ARG1基因的表达盒包含(SEQ ID NO:81)。编码人CMP-唾液酸合酶的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码hCMP-NANA S ORF的核酸分子(SEQ ID NO:39),其在5'末端与包含巴斯德毕赤氏酵母GPDAH启动子的核酸分子可操作连接,在3'末端与包含酿酒酵母CYC转录终止序列的核酸分子可操作连接。编码人N-乙酰基神经氨酸-9-磷酸合酶的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码hSIAP S ORF的核酸分子(SEQ ID NO:41),其在5'末端与包含巴斯德毕赤氏酵母PMA1启动子的核酸分子可操作连接,在3'末端与包含巴斯德毕赤氏酵母PMA1转录终止序列的核酸分子可操作连接。编码嵌合小鼠α-2,6-唾液酸转移酶的表达盒包含为在巴斯德毕赤氏酵母中表达而密码子优化的、编码mST6催化结构域的核酸分子(SEQ ID NO:43),其在5'末端融合到编码酿酒酵母KRE2信号肽的核酸分子,其在5'末端可操作连接到包含巴斯德毕赤氏酵母TEF启动子(SEQ ID NO:51)的核酸分子,在3'末端可操作连接到包含巴斯德毕赤氏酵母TEF转录终止序列(SEQ ID NO:52)的核酸分子。六个串联的盒在一侧是包含来自编码Trp2p的ORF的5'区域、以终止密码子结束的核苷酸序列(SEQ ID NO:98)的核酸分子,随后是巴斯德毕赤氏酵母ALG3终止序列,在另一侧是包含来自TRP2基因的3'区域的核苷酸序列(SEQ ID NO:99)的核酸分子。质粒pGLY2456用SfiI线性化,线性化的质粒转化到菌株YGLY2849中以产生多个菌株,在其中六个表达盒通过双交叉同源重组紧跟着TRP2 ORF插入到TRP2座位中。菌株YGLY3159从产生的菌株中选出,现在对尿苷、组氨酸、腺嘌呤、脯氨酸、精氨酸和色氨酸是原养型的。菌株对Zeocin有抗性,并含有约三个到四个拷贝的EPO表达盒。菌株产生rhEPO;然而,使用实施例5中的方法,rhEPO具有与针对HCA制得的抗体的交叉反应性结合(参见实施例6)。
虽然在此处的实例中各种表达盒被整合到巴斯德毕赤氏酵母基因组的特定座位中,要理解的是,本发明的操作与用于整合的座位是无关的。与此处公开的座位不同的座位可以用于表达盒的整合。许多适合的整合位点包括在美国公开的申请No. 20070072262中例举的那些,包括酿酒酵母和其他酵母或真菌已知的座位的同源物。
实施例2
实施例1中的菌株YGLY3159进一步遗传工程化以破坏BMT1、BMT3和BMT4基因,如下。
菌株YGLY3159在存在5-FOA的情况下反选择来产生菌株YGLY3225,其现在是对尿苷营养缺陷的。
质粒pGLY3411(pSH1092)(附图15)是含有表达盒的整合载体,所述表达盒包含侧翼是lacZ重复的巴斯德毕赤氏酵母URA5基因,其一侧是巴斯德毕赤氏酵母BMT4基因的5'核苷酸序列(SEQ ID NO:72),另一侧是巴斯德毕赤氏酵母BMT4基因的3'核苷酸序列(SEQ ID NO:73)。质粒pGLY3411线性化,线性化的质粒转化到YGLY3159中以产生多个菌株,在其中URA5表达盒通过双交叉同源重组插入到BMT4座位中。菌株YGLY4439从产生的菌株中选出,是对尿嘧啶、腺嘌呤、组氨酸、脯氨酸、精氨酸和色氨酸原养型的。菌株对Zeocin有抗性,并含有约三个到四个拷贝的rhEPO表达盒。菌株具有BMT2和BMT4基因的破坏或删除。
质粒pGLY3430(pSH1115)(附图16)是含有表达盒的整合载体,所述表达盒包含编码诺尔丝菌素抗性(NATR)ORF的核酸分子(原本来自pAG25,其来自EROSCARF, Scientific
Research and Development GmbH, Daimlerstrasse 13a, D-61352 Bad Homburg, Germany,参见Goldstein et al., Yeast 15
: 1541(1999))ORF(SEQ ID NO:102),与棉阿舒囊霉TEF1启动子(SEQ ID NO:105)和棉阿舒囊霉TEF1终止序列(SEQ ID NO:106)可操作地连接,在一侧是巴斯德毕赤氏酵母BMT1基因的5'核苷酸序列(SEQ ID NO:68),另一侧是巴斯德毕赤氏酵母BMT1基因的3'核苷酸序列(SEQ ID NO:69)。质粒pGLY3430线性化,线性化的质粒转化到菌株YGLY4439中以产生多个菌株,在其中NATR表达盒通过双交叉同源重组插入到BMT1座位中。菌株YGLY6661从产生的菌株中选出,对尿嘧啶、腺嘌呤、组氨酸、脯氨酸、精氨酸和色氨酸是原养型的。菌株对Zeocin和诺尔丝菌素有抗性,并含有约三个到四个拷贝的EPO表达盒。菌株具有BMT1、BMT2和BMT4基因的破坏或删除。也选出了菌株YGLY7013;然而,这个菌株仅有BMT1基因的部分破坏。这个菌株被指定为具有BMT1、BMT2和BMT4基因的破坏或删除。
质粒pGLY4472(pSH1186)(附图17)是含有表达盒的整合载体,所述表达盒包含编码大肠杆菌潮霉素B磷酸转移酶基因(HygR )ORF(SEQ ID NO:103)的核酸分子,与棉阿舒囊霉TEF1启动子(SEQ ID NO:105)和棉阿舒囊霉TEF1终止序列(SEQ ID NO:106)可操作地连接,一侧是巴斯德毕赤氏酵母BMT3基因的5'核苷酸序列(SEQ ID NO:70),另一侧是巴斯德毕赤氏酵母BMT3基因的3'核苷酸序列(SEQ ID NO:71)。质粒pGLY3430线性化,线性化的质粒转化到菌株YGLY6661中以产生多个菌株,在其中HygR 表达盒通过双交叉同源重组插入到BMT3座位中。从产生的菌株中选出菌株YGLY7361到YGLY7366和菌株YGLY7393到YGLY7398,其是对尿嘧啶、腺嘌呤、组氨酸、脯氨酸、精氨酸和色氨酸原养型的。菌株对Zeocin、诺尔丝菌素和潮霉素有抗性,并含有约三个到四个拷贝的EPO表达盒。菌株具有BMT1、BMT2、BMT3和BMT4基因的破坏或删除,并产生缺乏与针对宿主细胞抗原(HCA)制得的抗体的交叉反应性结合的rhEPO。
实施例3
实施例1中的菌株YGLY3159进一步遗传工程化以产生其中BMT1、BMT3和BMT4基因被破坏或删除的菌株,以及包括几个拷贝的表达盒,所述表达盒编码与鸡溶菌酶前导肽融合的成熟的人EPO。简要地,自YGLY3159开始的这些菌株的构建在附图1中显示,下文中简要地描述。
菌株YGLY3159在存在5-FOA的情况下反选择来产生菌株YGLY3225,其现在是对尿苷营养缺陷的。
质粒pGLY2057(附图18)是靶向ADE2座位的整合载体,含有编码侧翼是lacZ重复的巴斯德毕赤氏酵母URA5基因的表达盒。所述表达盒一侧是包含来自ADE2基因的5'区域的核苷酸序列(SEQ ID NO:100)的核酸分子,另一侧是包含来自ADE2基因的3'区域的核苷酸序列(SEQ ID NO:101)的核酸分子。质粒pGLY2057用SfiI线性化,线性化的质粒转化到菌株YGLY3225中以产生多个菌株,在其中URA5盒通过双交叉同源重组插入到ADE2座位中。菌株YGLY3229从产生的菌株中选出,是对腺嘌呤营养缺陷的,并对尿苷、组氨酸、脯氨酸、精氨酸和色氨酸是原养型的。菌株对Zeocin有抗性,并含有约三个到四个拷贝的EPO表达盒。
质粒pGLY2680(附图19)是可以靶向TRP2或AOX1座位的整合载体,含有表达盒,其编码(1)包含人成熟促红细胞生成素(EPO)的嵌合EPO,其在N-末端与鸡溶菌酶信号肽融合以将嵌合蛋白质靶向分泌途径并从细胞分泌,和(2)没有启动子的巴斯德毕赤氏酵母ADE2基因。ADE2基因是从隐藏启动子不良地转录的。因而,在没有补充腺嘌呤的培养基中,用该载体转化的ade2Δ酵母菌株的选择需要多个拷贝载体整合到基因组中,以使得对于腺嘌呤是重组原养型的。由于载体进一步包括EPO表达盒,重组酵母也将包括整合到基因组中的多个拷贝的EPO盒。这种载体和方法已经在公开的PCT申请WO2009085135中描述。编码鸡溶菌酶信号肽的DNA序列在SEQ ID NO:94中示出,编码成熟的人EPO的密码子优化的ORF在SEQ ID NO:92中示出,没有其启动子、但是包括其终止序列的巴斯德毕赤氏酵母ADE2基因在SEQ ID NO:96中示出。嵌合EPO与AOX1启动子和酿酒酵母CYC终止序列可操作连接。两个串联的盒在一侧是包含核苷酸序列的核酸分子,所述核苷酸序列包含TRP2基因。质粒pGLY2680在PmeI位点线性化,转化到YGLY3229中来产生多个菌株,在其中两个表达盒通过单交叉同源重组中的滚动插入到AOX1座位中,其引起EPO表达盒的多个拷贝插入到AOX1座位中而不破坏AOX1座位。从产生的菌株中选出菌株YGLY4209。通过测量被插入到座位中、分离自菌株的DNA的测序数据的强度来测出的,这个菌株有约5-7个拷贝的EPO表达盒。该菌株对于腺嘌呤、尿苷、组氨酸、脯氨酸、精氨酸和色氨酸是原养型的。菌株含有总共约八到十一个拷贝的EPO表达盒。在ER和高尔基体中嵌合EPO的加工期间,前导肽被除去。因而,产生的rhEPO是EPO的成熟形式。
菌株YGLY4209在存在5’-FOA的情况下反选择,以产生对尿嘧啶为营养缺陷的多个菌株。从产生的转化体中选出菌株YGLY4244。
质粒pGLY2713(附图20),靶向巴斯德毕赤氏酵母PEP4基因(SEQ ID NO:104)的整合载体,含有巴斯德毕赤氏酵母PNO1 ORF,其邻近于表达盒,所述表达盒包含侧翼是lacZ重复的巴斯德毕赤氏酵母URA5基因,其一侧是巴斯德毕赤氏酵母PEP4基因的5'核苷酸序列,另一侧是巴斯德毕赤氏酵母PEP4基因的3'核苷酸序列。质粒pGLY2713用SfiI线性化,线性化的质粒转化到菌株YGLY4244中以产生多个菌株,在其中PNO1 ORF和URA5表达盒表达盒通过双交叉同源重组插入到PEP4座位中。菌株YGLY5053从产生的菌株中选出,然后在存在5-FOA的情况下反选择以产生多个菌株,在其中URA5基因已经从基因组中缺失。菌株YGLY5597从产生的菌株中选出,是对腺嘌呤、组氨酸、脯氨酸、精氨酸和色氨酸原养型的。菌株对Zeocin有抗性,并含有约八个到十一个拷贝的rhEPO表达盒。
质粒pGLY3411(pSH1092)(附图15)是含有表达盒的整合载体,所述表达盒包含侧翼是lacZ重复的巴斯德毕赤氏酵母URA5基因,其一侧是巴斯德毕赤氏酵母BMT4基因的5'核苷酸序列(SEQ ID NO:72),另一侧是巴斯德毕赤氏酵母BMT4基因的3'核苷酸序列(SEQ ID NO:73)。质粒pGLY3411线性化,线性化的质粒转化到菌株YGLY5597中以产生多个菌株,在其中URA5表达盒通过双交叉同源重组插入到BMT4座位中。菌株YGLY5618从产生的菌株中选出,对尿嘧啶、腺嘌呤、组氨酸、脯氨酸、精氨酸和色氨酸是原养型的。菌株对Zeocin和诺尔丝菌素有抗性,并含有约八个到十一个拷贝的rhEPO表达盒。菌株具有BMT2和BMT4基因的破坏。
质粒pGLY3430(pSH1115)(附图16)是含有表达盒的整合载体,所述表达盒包含编码诺尔丝菌素抗性(NATR)ORF的核酸分子(原本来自pAG25,其来自EROSCARF, Scientific
Research and Development GmbH, Daimlerstrasse 13a, D-61352 Bad Homburg, Germany,参见Goldstein et al., Yeast 15
: 1541(1999))ORF(SEQ ID NO:102),与棉阿舒囊霉TEF1启动子和棉阿舒囊霉TEF1终止序列可操作地连接,在一侧是巴斯德毕赤氏酵母BMT1基因的5'核苷酸序列(SEQ ID NO:68),另一侧是巴斯德毕赤氏酵母BMT1基因的3'核苷酸序列(SEQ ID NO:69)。质粒pGLY3430线性化,线性化的质粒转化到菌株YGLY5618中以产生多个菌株,在其中NATR表达盒通过双交叉同源重组插入到BMT1座位中。菌株YGLY7110从产生的菌株中选出,对尿嘧啶、腺嘌呤、组氨酸、脯氨酸、精氨酸和色氨酸是原养型的。菌株对Zeocin和诺尔丝菌素有抗性,并含有约八个到十一个拷贝的rhEPO表达盒。菌株具有BMT1、BMT2和BMT4基因的破坏。
质粒pGLY4472(pSH1186)(附图17)是含有表达盒的整合载体,所述表达盒包含编码大肠杆菌潮霉素B磷酸转移酶基因(HygR )ORF(SEQ ID NO:103)的核酸分子,与棉阿舒囊霉TEF1启动子和棉阿舒囊霉TEF1终止序列可操作地连接,一侧是巴斯德毕赤氏酵母BMT3基因的5'核苷酸序列(SEQ ID NO:70),另一侧是巴斯德毕赤氏酵母BMT3基因的3'核苷酸序列(SEQ ID NO:71)。质粒pGLY3430线性化,线性化的质粒转化到菌株YGLY7110中以产生多个菌株,在其中HygR 表达盒通过双交叉同源重组插入到BMT3座位中。菌株YGLY7113到YGLY7122从产生的菌株中选出,对尿嘧啶、腺嘌呤、组氨酸、脯氨酸、精氨酸和色氨酸是原养型的。菌株对Zeocin、诺尔丝菌素和潮霉素有抗性,并含有约八个到十一个拷贝的EPO表达盒。菌株具有BMT1、BMT2、BMT3和BMT4基因的破坏,并产生缺乏与针对HCA制得的抗体的可检测的交叉反应性结合的rhEPO。
实施例4
实施例1到3中的几种菌株被用于生产rhEPO,如下文所述,在附图21中示意地显示。简要地,通过用来自工作细胞库的细胞接种含有培养基的摇瓶开始生产,继续通过一系列接种、孵育,以及扩展的培养物转移到大小增加的容器中,直到足够的生物质可用来接种生产生物反应器。甘油是分批阶段中的主碳源,然后通过甘油和盐的饲喂维持培养物生长。当甘油被耗尽时,通过转变为甲醇饲喂,诱导细胞表达rhEPO蛋白质。在诱导时添加抑制物以最小化O-糖基化(例如,PMTi 3、5-[ [ 3-(1-苯基乙氧基)-4-(2-苯基乙氧基)]苯基]亚甲基]-4-氧代2-硫代-3-噻唑烷乙酸,(参见公开的PCT申请No.WO 2007061631))和最小化蛋白水解作用。在阶段的末期再次添加蛋白水解作用的抑制物以最小化蛋白水解作用。培养物冷却到约4℃并收获。
菌株的实验室规模培养一般使用以下操作在500 mL SixFors和3L发酵器中进行。生物反应器筛选(SIXFORS)在0.5L 容器(Sixfors多发酵系统,ATR Biotech, Laurel, MD)中使用以下条件进行:pH值6.5,24℃,0.3 SLPM和550 rpm的起始搅拌速度,350 mL起始工作体积(330 mL BMGY培养基和20mL接种物)。在接种一小时后,IRIS多发酵器软件(ART Biotech, Laurel, MD)用于在10小时内线性地将搅拌子速度从550 rpm提高到1200 rpm。种子培养物(在1L挡板烧瓶中200 mL的BMGY)直接从琼脂平板接种。种子烧瓶在24℃孵育72小时来达到95到100之间的光密度(OD600)。发酵器用200 mL稳定期烧瓶培养物接种,所述培养物是通过离心浓缩到20 mL的。分批期在初始进料甘油(18-24h)发酵完成时结束,继之以第二分批期,其通过添加17 mL的甘油给料溶液(50%[w/w]甘油,5mg/L生物素,12.5ml/L PMTi盐(65 g/L FeSO4.7H2O, 20 g/L
ZnCl2, 9 g/L H2SO4, 6 g/L CuSO4.5H2O, 5 g/L H2SO4, 3 g/L MnSO4.7H2O,
500 mg/L CoCl2.6H2O, 200 mg/L NaMoO4.2H2O, 200 mg/L 生物素, 80 mg/L NaI, 20 mg/L
H3BO4))来启动。在由溶解氧中的尖峰所指示的第二分批期完成时,通过以0.6 g/h饲喂甲醇给料溶液(100% MeOH 5 mg/L生物素,12.5 mL/L PMTi)32-40小时来启动诱导期。通过离心收获培养物。
生物反应器培养(3L)在3L(Applikon, Foster City , CA)和15L(Applikon, Foster City , CA)玻璃生物反应器以及40L(Applikon, Foster City , CA)不锈钢的、在适当位置有蒸汽的生物反应器中进行。种子培养物通过直接用冷冻的储备小瓶以1%体积比接种BMGY培养基来制备。种子烧瓶在24℃孵育48小时以获得20±5的光密度(OD600)以确保细胞在转移时指数地生长。培养基每升含有40 g甘油、18.2 g山梨醇、2.3 g K2HPO4、11.9 g KH2PO4、10 g酵母提取物(BD, Franklin Lakes, NJ)、20 g蛋白胨(BD, Franklin Lakes, NJ)、4×10-3 g生物素和13.4 g Yeast Nitrogen Base(BD, Franklin Lakes, NJ)。生物反应器用种子与初始培养基10%的体积比来接种。培养在以下条件下以进料-分批方式进行:温度设置在24±0.5℃,pH值用NH4OH控制到6.5±0.1,通过级联添加O2时的搅动率将溶解氧维持在1.7±0.1 mg/L。空气流速维持在0.7 vvm。在初始进料甘油(40 g/L)耗尽之后,含有12.5 mL/L PTM1盐的50%(w/w)甘油溶液在最大生长速度的50%时指数地饲喂八小时,直到达到250g/L的湿细胞重量。诱导在30分钟的饥饿期之后启动,此时指数地饲喂甲醇以维持0.01h-1的比生长速率。当达到150 mM/L/h的氧吸收率时,甲醇进料速度保持恒定以避免氧限制。通过离心收获培养物。
通过离心和微过滤来澄清之后,滤液通过超滤浓缩10×,通过使用蓝染料-亲和性和羟磷灰石的两个层析步骤的顺序来纯化rhEPO蛋白质。初次澄清通过离心进行。整个细胞发酵液转移到1000 mL离心瓶中,在4℃在13,000×g下离心15分钟。可以对更大的发酵器采用超滤步骤(10L到40L以及更大)。这个步骤可以使用孔径大小10K的Sartorious扁平片层进行到五倍浓度。
捕获步骤使用Blue SEPHAROSE 6 Fast Flow(Pseudo-Affinity)层析进行。Blue SEPHAROSE 6 fast Flow(FF)柱(GE Healthcare)用50 mM MOPS,pH 7.0平衡。培养物上清液调节到100 mM NaCl,在加载到柱上之前通过终端滤器(Whatman, Polycap TC)。在加载后用3倍柱体积(CV)洗涤,留存时间维持在约10分钟。洗脱是50 mM MOPS,pH 7.0中的1 M NaCl的4 CV的梯级洗脱。EPO在1 M NaCl下洗脱。
中间步骤使用羟磷灰石(HA)层析进行。MacrO-prep陶瓷羟磷灰石I型40μm(BiO-Rad)在捕获步骤之后使用。这个柱用平衡溶液来平衡:50 mM MOPS,pH 7.0,含有1 M NaCl和10 mM CaCl2。在加载之前,约10 mM的CaCl2添加到来自blue柱的集中的rhEPO中。柱洗涤用3 CV的平衡溶液进行,随后是MPOS,pH 7.0中12.5 mM磷酸钠下10 CV的梯级洗脱,以提供含有rhEPO的HA库1。
阳离子交换层析步骤可以用于进一步纯化rhEPO。在羟磷灰石层析步骤之后集中的样品(例如,HA库1)相对于50 mM乙酸钠,pH 5.0在4℃透析过夜,Source 30S柱或Poros阳离子交换柱(GE Healthcare)用相同的缓冲液平衡。透析的样品施加到柱上,施加0到750 mM NaCl的10 CV线性梯度,rhEPO在350到500 mM NaCl之间洗脱,提供rhEPO。纯化的rhEPO分子的N-末端可以通过还原的氨基化(PEG化)共轭到40-kDa线型聚乙二醇(PEG)。活化的PEG以1:10的蛋白质:PEG比例添加到pH 5.2的50 mM乙酸钠缓冲液中的rhEPO样品中(浓度约1 mg/mL)。通过向反应混合物添加10 mM氰基硼氢钠并搅动过夜,反应在还原条件下在室温下进行。通过添加10 mM Tris,pH 6.0来停止反应。
单聚乙二醇化的rhEPO产物使用阳离子交换层析步骤纯化,之后渗滤到最终的制剂缓冲液中(20 mM磷酸钠,120 mM氯化钠,0.005%聚山梨酯20(w/v),pH 7.0)。
最终产品稀释到适合于填充的浓度,无菌过滤到药物贮藏容器中。聚乙二醇化的rhEPO可以保存在2-8℃直到填充,此时它们被无菌地填充到玻璃小瓶中,然后用橡皮塞和铝盖密封。蛋白质的商业配方是已知的,并可以使用。实例包括但不限于ARANESP®:聚山梨酸酯溶液:每1mL含有0.05 mg聚山梨酯80,用2.12 mg磷酸二氢钠一水合物、0.66 mg无水磷酸氢二钠和8.18 mg氯化钠在注射用水中配置为pH 6.2±0.2,USP(到1 mL)。白蛋白溶液:每1 mL含有2.5 mg白蛋白(人),用2.23 mg磷酸二氢钠一水合物、0.53 mg无水磷酸氢二钠和8.18 mg氯化钠在注射用水中配置为pH 6.0±0.3,USP(到1 mL)。EPOGEN®在等渗的氯化钠/柠檬酸钠缓冲溶液或氯化钠/磷酸钠缓冲溶液中配制为无菌的、无色液体,用于静脉内的(IV)或皮下的(SC)施用。单剂量的、无防腐剂的小瓶:每1 ml的溶液含有处在注射用水的2000、3000、4000或10,000单位的阿法依伯汀(Epoetin alfa),2.5 mg白蛋白(人),5.8 mg柠檬酸钠,5.8 mg氯化钠和0.06 mg柠檬酸,USP(pH 6.9±0.3)。这种制剂不含有防腐剂。保存的小瓶含有1%苯甲醇。
实施例5
用于分析宿主细胞抗原(HCA)的存在或缺乏的方法包括Western印迹分析以及夹心酶联免疫吸附测定(ELISA)。宿主细胞抗原(HCA)抗体使用来自NORF菌株培养物的上清液在兔中制备。NORF菌株与YGLY3159是遗传上相同的,只是它缺乏编码人成熟EPO的ORF。在完全弗氏佐剂中制备的NORF菌株发酵上清液注射到兔中,其然后用弗氏不完全佐剂中制备的发酵上清液强化三次。在45天之后,兔子进行放血,使用标准方法制备针对HCA的多克隆抗体,例如,兔多克隆IgG 9161 F072208-S,其是SLr蛋白A纯化的,以及GiF2多克隆兔::6316完整兔血清。GIF2抗体不是蛋白A纯化的。
用于检测巴斯德毕赤氏酵母HCA的Western印迹如下进行。含有纯化的聚乙二醇化或非聚乙二醇化rhEPO的样品在样品加载缓冲液中还原,其中1 μL然后添加到4-20%聚丙烯酰胺SDS Tris-HCl(4-20% SDS-PAGE)凝胶(Bio RAD)的孔中,在150 V电泳约60分钟。在100V下,分辨的蛋白质电转移到硝化纤维素膜上持续约60分钟。在转移之后,用1%阻断溶液(Roche Diagnostics)阻断膜一小时。在阻断之后,膜用1:3000稀释的兔抗-HCA多克隆抗体(初级抗体)探测。以后,洗涤膜,兔抗-HCA抗体的检测用1:5000稀释度的、缀合到辣根过氧化酶(HRP)的山羊-抗-兔IgG(H+L)(Pierce #_31460, Lot #
H51015156)二级抗体进行。在洗涤膜之后,结合的二级抗体的检测使用3,3'-二氨基联苯胺(DAB)。为了检测EPO蛋白质,初级抗体是在1:1000稀释度下使用的EPO(B-4)HRP-缀合的抗体(SC5290 Lot# A0507,Santa Cruz Biotechnology)。不使用二级抗体。常规地,EPO样品与已经用PNGaseF处理脱糖基化的rhEPO样品并行地电泳。脱糖基化使用50 μL样品进行,向其中添加500 单位/μL的1 μL的PNGaseF酶。在37℃下孵育2小时之后,样品在样品加载缓冲液中还原,除去1 μL等分量并施加到上述SDS凝胶上。
用于检测巴斯德毕赤氏酵母HCA的夹心ELISA如下进行。96孔ELISA平板的反应孔用1 μg/孔的小鼠抗hEPO单克隆抗体包被。然后反应孔用磷酸盐缓冲盐水(PBS)阻断30分钟。浓缩到约200 ng/mL、约100 μL含有纯化的非聚乙二醇化rhEPO的样品添加到反应孔。初级检测使用PBS中1:800起始稀释度的兔抗-HCA多克隆抗体,其然后一排地连续1:1在PBS中稀释,到第11个反应孔以1:819,200稀释度结束。第12个反应孔充当阴性对照。ELISA的标准物是从YGLY3159纯化的rhEPO。在60分钟之后,反应孔用PBS洗涤三次。兔抗-HCA抗体的检测使用PBS中1:10,000稀释度的与碱性磷酸酶(AP)缀合的山羊抗兔抗体。60分钟之后,反应孔用PBS洗涤三次,结合的二级抗体的检测使用4-甲基伞形酮酰基磷酸(4-MUPS)。ELISA平板使用Tecan Genios
Multidetection微量培养板读取器在340 nm激发波长和465 nm发射波长下读取。
实施例6
这个实施例显示了YGLY3159产生具有与抗-HCA抗体的交叉结合活性(CBA)的rhEPO,交叉结合活性是由于rhEPO上至少部分N-聚糖上β-1,2-甘露糖残基(α-1,2-甘露糖苷酶抗性)的存在,即使rhEPO是在β-1,2-甘露糖基转移酶基因BMT2被删除或破坏的菌株中产生的。rhEPO通过三步骤层析分离从糖工程化的巴斯德毕赤氏酵母生产菌株YGLY 3159的发酵上清液中回收,由SDS-PAGE、RP-HPLC和SEC-HPLC所测定的显示了约95%的蛋白质纯度。单聚乙二醇化的rhEPO通过阳离子交换层析步骤从它的超聚乙二醇化和未聚乙二醇化共轭物中分离,具有通过SDS-PAGE凝胶测定的约96%纯度。然而,针对YGLY3159菌株的HCA的抗体检测到从该菌株产生的rhEPO制品中的糖蛋白,其在Western印迹上与rhEPO共同迁移。附图22显示了抗-HCA抗体鉴定出在4-20% SDS-PAGE凝胶上与rhEPO共同迁移的蛋白质。从rhEPO上除去唾液酸不能消除交叉结合活性;然而,使用PNGase F从rhEPO上除去整个N-聚糖产生了rhEPO的脱糖基化的形式,其在使用抗-HCA抗体探测的Western印迹中是不可检出的。这在附图23中显示了,其显示了仅rhEPO的脱糖基化的形式缺乏与抗-HCA抗体的交叉结合活性。
为了确定该交叉结合活性是否是rhEPO特异性的,或是否可在来自其他重组巴斯德毕赤氏酵母菌株的纯化的糖蛋白制品中鉴定到,分离了其他菌株中产生的糖蛋白,通过4-20% SDS-PAGE凝胶分辨,凝胶转移到硝化纤维素膜。对于在重组巴斯德毕赤氏酵母中产生的重组人完整抗体(rhIgG)来说,在野生型巴斯德毕赤氏酵母(在N和O-糖基化区域中都是超甘露糖基化的)产生的、以及在重组GS2.0菌株中产生的蛋白质制品中检测到交叉结合活性,所述重组GS2.0菌株主要产生Man5GlcNAc2N-聚糖,并且也含有α-1,2-甘露糖苷酶抗性的可检测的Man9GlcNAc2N-聚糖(附图24,箭头)。然而,来自野生型巴斯德毕赤氏酵母的rhIgG制品含有大于rhIgG的表观分子量的交叉结合活性,表明制品含有污染的宿主细胞糖蛋白。交叉结合活性未能通过PNGase F消化除去(附图24中的圆圈)。附图25显示了在YGLY3159中产生的糖基化rhEPO具有与抗-HCA抗体的交叉结合活性,但是人胎球蛋白、人去唾液酸胎球蛋白、人血清白蛋白(HSA)和LEUKINE(在酿酒酵母中产生的重组人粒细胞巨噬细胞集落刺激因子(rhu GM-CSF)不具有与抗-HCA抗体的交叉结合活性。胎球蛋白是重度糖基化的血液糖蛋白,其在肝脏中产生,分泌到血流中。它们属于调节血流中各种货物物质的转运和可用性的结合蛋白质的大类。这些载体蛋白的公知的代表是血清白蛋白,是成年动物的血浆中最丰富的蛋白质。胎球蛋白在胎儿血液中是更为丰富的,由此得名“胎球蛋白(fetuin)”(来自拉丁语fetus)。胎牛血清含有比白蛋白更多的胎球蛋白,而成年血清含有的白蛋白比胎球蛋白更多。去唾液酸胎球蛋白是一类胎球蛋白,N-和O-聚糖上的末端唾液酸通过轻微的水解或神经氨酸酶处理被除去。当前,在酿酒酵母中没有β-连接的甘露糖的报道。HSA不是糖基化的蛋白质。
实验室规模的数据展现了,利用羟基磷灰石(HA)I型40μm树脂自Blue SEPHAROSE 6 FF捕获库中纯化rhEPO的中间层析步骤,可以从具有高甘露糖型N-聚糖的rhEPO(HA库2和3)中分离几乎不具有可检测的交叉结合活性的rhEPO(HA库1)。HA库1含有约90.40 %双唾液酸化的N-聚糖(期望的N-聚糖形式)和小于3.5%的中性的N-聚糖。相比之下,自0到100 mM磷酸钠的线性梯度洗脱显示了更晚的洗脱级分(HA库2和3)含有高甘露糖型N-聚糖,以及在Western印迹中提高的与抗-HCA抗体的交叉结合活性。这可以在附图26中显示的HPLC N-聚糖分析和4-20% SDS-PAGE凝胶的Western印迹中看出。
还测试了利用Q SEPHAROSE FF或Source 30Q阴离子树脂的阴离子柱层析。组合HA库1-3,并在4℃下相对于pH 5.0的50 mM乙酸钠透析过夜。透析的样品施加到柱上,施加0到750 mM NaCl的10 CV线性梯度,rhEPO在350到500 mM NaCl之间洗脱,提供rhEPO。附图27A显示了rhEPO的Q SEPHAROSE FF纯化的实例。数据显示了,当在夹心ELISA中分析结合和未结合的材料时,显示了更高交叉结合活性的高甘露糖型聚糖(Man6,7,8,9,>9,大部分是α1,2甘露糖苷酶抗性的)不结合阴离子交换树脂(附图27B)。表1显示了结合的级分(Q琼脂糖FF库1)和流通级分(Q SEPHAROSE FF流通物)中rhEPO的N-聚糖含量的HPLC分析结果。表2显示了表1中显示的中性的N-聚糖的N-聚糖含量。
附图和表格显示了,具有与抗-HCA抗体不可检测的交叉结合活性的rhEPO、以及好的蛋白质和聚糖质量因此可以结合/从阴离子交换树脂上洗脱。这些数据还表明,涉及β-1,2-连接的寡甘露糖生物合成的真菌基因的家族(BMT1、BMT2、BMT3、BMT4)对于rhEPO制品中低水平的交叉结合混杂物负责。
因而,当作为整体来看时,结果表明了,对抗-HCA抗体的交叉结合活性不是特异于rhEPO的,而是由于糖蛋白上的α-1,2-甘露糖苷酶抗性N-聚糖。通过敲除五种内源的糖基化基因并引入15种异源基因产生了YGLY 3159。YGLY3159是bmt2 Δ敲除的菌株。NMR光谱研究表明,bmt2 Δ敲除的菌株可以产生具有变化数量的残余β-1,2-甘露糖N-聚糖的糖蛋白。由于YGLY 3159是bmt2 Δ的,推测的是BMT1和BMT3对于核心N-聚糖上残余的低水平β-1,2-甘露糖转移负责。
虽然层析步骤的组合来纯化rhEPO可以产生没有与抗-HCA抗体的可检测交叉结合活性的rhEPO制品,特别希望的是遗传修饰巴斯德毕赤氏酵母宿主菌株来降低或消除菌株中与抗-HCA抗体的可检测交叉结合活性。这使得由于纯化中的变异性、带有交叉结合活性的rhEPO制品的可能的污染风险最小化了。此外,由于每个纯化步骤可能引起rhEPO的损失,遗传修饰的巴斯德毕赤氏酵母菌株可以降低纯化步骤的数量,因而减少了被省略的步骤期间损失的rhEPO数量。因而,四种BMT基因的表达被连续地删除或破坏,以鉴定不产生与抗-HCA抗体的可检测交叉结合活性的菌株。
实施例7
为了将β-连接的甘露糖型N-聚糖的存在降低到不可检测的水平,BMT1和BMT4基因被破坏,分析rhEPO中α-1,2-甘露糖苷酶抗性N-聚糖的存在。
菌株YGLY6661和YGLY7013如实施例2描述的构建,使用抗-HCA抗体分析α-1,2-甘露糖苷酶抗性N-聚糖的存在。菌株YGLY7013是bmt2 Δ和bmt4 Δ的,菌株YGLY6661是 bmt2 Δ、bmt4 Δ和 bmt1 Δ的。菌株产生的rhEPO经历Blue SEPHAROSE 6FF层析,Blue SEPHAROSE 6FF捕获库的等分量用PNGase F velnon处理。处理的和未处理的等分量在SDS-PAGE上电泳,凝胶转移到硝化纤维素膜,用抗EPO抗体或抗-HCA抗体探测膜。附图28显示了Blue SEPHAROSE 6 FF捕获库的等分量的4-20% SDS-PAGE凝胶的Western印迹中,每一个菌株产生的rhEPO仍然具有与抗-HCA抗体交叉反应的α-1,2-甘露糖苷酶抗性N-聚糖。表3和4显示了来自发酵和SixFors培养物的Blue Sepaharose 6 FF捕获库中rhEPO中N-聚糖种类的分布。如表格中所示的,两种菌株都产生了相当数量的中性的N-聚糖,其部分对体外α1,2-甘露糖苷酶消化有抗性。
与YGLY3159相比,从两种菌株中制得的Blue SEPHAROSE 6 FF捕获库中rhEPO的夹心ELISA显示了两种菌株都具有与抗-HCA抗体的交叉结合活性(附图29)。进一步通过羟磷灰石(HA)层析纯化rhEPO,通过夹心ELISA分析样品,显示了含有产自YGLY6661(bmt2 Δ、bmt4 Δ和bmt1 Δ)的rhEPO的HA库1看起来缺乏与抗-HCA抗体的可检测交叉结合活性,但是在YGLY7013(bmt2 Δ和 bmt4 Δ)中产生的rhEPO仍然具有与抗-HCA抗体的可检测交叉结合活性(附图30)。结果表明,删除BMT2和BMT1基因不足以除去所有可检测的交叉结合活性。结果还显示了羟磷灰石层析可以除去HA库1中可检测的交叉结合活性。附图31是4-20% SDS-PAGE凝胶的Western印迹,显示了在从菌株YGLY6661制备的其他Blue SEPHAROSE 6 FF捕获库中的rhEPO继续具有与抗-HCA抗体的交叉结合活性,并且交叉结合活性仍然可以通过rhEPO的脱糖基化变为不可检测。结果表明,为了产生没有与抗-HCA抗体的可检测交叉结合活性的rhEPO,需要通过破坏或删除来取消BMT3基因的表达。
实施例8
为了更有效地实现可检测的β-连接的甘露糖型聚糖的消除,涉及甘露糖基转移酶途径的所有四种BMT基因被破坏。评估菌株YGLY7361-7366和YGLY7393-7398(实施例2)产生缺乏与抗-HCA抗体的可检测交叉结合活性的rhEPO的能力。
其中涉及β-甘露糖基转移酶途径的所有四种BMT基因被破坏的各个YGLY7361-7366和YGLY7393-7398菌株在500 mL SixFors发酵器中生长,然后为rhEPO通过Blue SEPHAROSE 6 FF库(Blue库)加工。通过4-20% SDS-PAGE分析来自Blue库的等分量。附图32显示了有和没有PNGase F处理的、来自各个菌株的Blue库的Commassie Blue染色的4-20% SDS-PAGE凝胶。凝胶显示了,所有测试的菌株产生糖基化的rhEPO。通过夹心ELISA评估了一些菌株对抗-HCA抗体的交叉结合活性。附图33显示了大部分菌株缺乏与抗-HCA抗体的可检测交叉结合活性。然而,菌株YGLY7363和YGLY7365具有与抗-HCA抗体的可检测交叉结合活性。通过PCR对YGLY7365的重新确认表明了这个菌株不是完全敲除BMT3基因的,解释了在ELISA中出现的用抗-HCA抗体观察到的相对高的结合(附图33)。菌株YGLY7361-7366的HPLC N-聚糖分析在表5中显示,菌株YGLY7393-7398在表6中显示。表格中的数据在附图34中图形地呈现。
菌株YGLY7362、7366、7396和7398在3L发酵器中培养,通过Blue SEPHAROSE 6 FF层析、随后的羟磷灰石(HA)层析来加工。来自Blue库和HA库的等分量都被还原和通过4-20% SDS-PAGE分析。包括YGLY3159的相应的库作为阳性对照。附图35A显示了,Commassie Blue染色的4-20% SDS-PAGE显示了Blue库(凝胶的左半边)和HA库(凝胶的右半边)产生rhEPO。附图35B显示了抗-HCA抗体探测的相同样品的Western印迹。在Blue库或HA库1中,测试的菌株都没有与抗-HCA抗体的任何可检测的交叉结合活性。附图36分析了从YGLY7398的500mL SixFors培养物分离的rhEPO的Blue库和HA库1对抗-HCA抗体的交叉结合活性。最右侧画面显示了用另一种抗-HCA制品:GiF2多克隆兔::6316探测的Western印迹。这种抗体产生了与使用F072208-S抗体产生的相同的结果,所述F072208-S抗体已经被用于产生此处显示的ELISAs和Western印迹。6316抗体显示了交叉结合活性不是抗体特异性的。这些结果显示了,所有四种BMT基因的删除或破坏可以产生这样的菌株,在初步的Blue SEPHAROSE 6 FF捕获步骤,或使用I型40μM羟磷灰石的中间羟磷灰石步骤之后,在两种rhEPO中,所述菌株不产生对抗-HCA抗体的可检测交叉结合活性。这些菌株最小化了rhEPO制品被制成含有与抗-HCA抗体的交叉结合活性的风险。这允许产生在接受rhEPO的个体中诱导有害免疫反应的更低风险的rhEPO。
实施例9
所有四种BMT基因被破坏或删除的、实施例2中产生的菌株中生产的并被聚乙二醇化的rhEPO的药物动力学比较,与产自菌株YGLY3159的聚乙二醇化的rhEPO相比。比较显示了聚乙二醇化的EPO具有降低的体内半衰期和更低的体内效力(参见表7和8)。在实施例2中产生的菌株中生产的rhEPO没有与抗-HCA抗体的可检测交叉结合活性,具有的药物动力学一般地类似于EPOGEN,没有ARANESP的更高药物动力学。发现了降低的药物动力学是双唾液酸化的双分枝N-聚糖数量的函数。rhEPO上更高水平的双唾液酸化的双分枝N-聚糖与更高的药物动力学相关。这些结果与公开的数据一致,显示了更长的半衰期与CHO细胞中产生的重组人红细胞生成素的更高唾液酸含量相关(Egrie et al, Exp.
Hematol. 31: 290-299(2003))。
实施例10
为了有效地实现可检测的β-连接甘露糖型聚糖的消除,并产生生产更高药物动力学的rhEPO的菌株,制得实施例3中描述的菌株YGLY7113-7122,评估生产缺乏与抗-HCA抗体的可检测交叉结合活性的rhEPO的能力。这些菌株被修饰以也表达作为与鸡溶菌酶前导序列融合的融合蛋白的人成熟EPO。因而,这些菌株表达与酿酒酵母αMATpre信号肽融合的人成熟EPO,以及作为与鸡溶菌酶前导序列融合的融合蛋白的人成熟EPO。
其中涉及β-甘露糖基转移酶途径的所有四种BMT基因被破坏的各个YGLY7113-YGLY7122菌株在500 mL SixFors发酵器中生长,然后为了rhEPO通过Blue SEPHAROSE 6 FF库加工(Blue库)。使用抗-HCA抗体通过夹心ELISA分析了几种菌株的Blue库的等分量。附图37显示了YGLY7118具有与抗-HCA抗体的非常低的交叉结合活性,但是所有其他菌株没有显示与抗-HCA抗体的可检测的交叉结合活性。菌株YGLY7113-7117的HPLC N-聚糖分析在表9中示出,菌株YGLY7118-7122的在表10中示出。表格在附图38中图形地呈现。
菌株YGLY7115、7117和7120在3L发酵器中培养,通过Blue SEPHAROSE 6 FF层析、随后的羟磷灰石(HA)层析来加工。来自Blue库和HA库的等分量都被还原和通过4-20% SDS-PAGE分析。包括YGLY3159的相应的库作为阳性对照。包括YGLY7395的相应的库作为阴性对照。附图39A显示了,Commassie Blue染色的4-20% SDS-PAGE显示了Blue库(凝胶的左半边)和HA库(凝胶的右半边)产生rhEPO。附图35B显示了抗-HCA抗体探测的相同样品的Western印迹。在Blue库或HA库1中,测试的菌株都没有与抗-HCA抗体的任何可检测的交叉结合活性。这些结果也显示了,所有四种BMT基因的删除或破坏可以产生这样的菌株,在初步的Blue SEPHAROSE 6 FF捕获步骤,或使用I型40μM羟磷灰石的中间羟磷灰石步骤之后,在两种rhEPO中,所述菌株不产生对抗-HCA抗体的可检测交叉结合活性。这些菌株最小化了rhEPO制品被制成含有与抗-HCA抗体的交叉结合活性的风险。这允许产生在接受rhEPO的个体中诱导有害免疫反应的更低风险的rhEPO。
实施例11
含有YGLY7117产生的rhEPO的Blue库进一步进行羟磷灰石柱层析,分析HA库中的rhEPO的唾液酸化含量。附图40A和附图40B分别显示了,与来自YGLY7117中产生的rhEPO的N-聚糖相比,YGLY3159中产生的rhEPO的N-聚糖的HPLC痕迹。附图还显示了羟磷灰石柱除去了其他污染物;因而,在这个分析中,YGLY7117产生的rhEPO的唾液酸化含量是约99%(中性的N-聚糖是约1%),其中约89%是A2或双唾液酸化的,约10%是A1或单唾液酸化的。
在根据实施例3的过程PEG化之后,YGLY7117中产生的rhEPO的唾液酸化分析类似于PEG化之前唾液酸化的量;然而,唾液酸化的量可能取决于,例如,对生长条件进行什么样的修改,例如,培养基成分、饲喂速率等等而有限程度地改变(参见表11)。因而,此处的方法产生了rhEPO组合物,其具有至少约75%的A2唾液酸化,或约75%到89%之间的A2唾液酸化。因而,总唾液酸含量是至少4.5摩尔唾液酸每摩尔rhEPO,更具体地,约4.6到5.7摩尔唾液酸每摩尔rhEPO。
所有四种BMT基因被破坏或删除的、实施例3中产生的YGLY7117中生产的并被聚乙二醇化的rhEPO的药物动力学比较,与产自YGLY3159的聚乙二醇化的rhEPO相比。比较显示了菌株YGLY7117中产生的聚乙二醇化的rhEPO具有的体内半衰期和体内效力类似于YGLY3159和ARANESP的(参见表12和13)。
序列
用于生产实施例1-11中公开的某些菌株的序列在表14中提供。
虽然在此参考说明性实施方式描述了本发明,要理解的是本发明不限于此。具有本领域的普通技术并且接受此处的教导的人员将认识到其他修改和实施方式处于其范围内。因而,本发明仅由此处附随的权利要求限制。
序列表
<110> Bobrowicz, Piotr
Gomathinayagam, Sujatha
Hamilton, Stephen
Li, Huijuan
Setheraman, Natarajan
Stadheim, Terrance A.
Wildt, Stephan
<120> 在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的
可检测交叉结合活性的蛋白质的方法
<130> GFI-MIS-00002
<150> 61/252,312
<151> 2009-10-16
<160> 106
<170> FastSEQ for Windows
Version 4.0
<210> 1
<211> 3029
<212> DNA
<213> 酿酒酵母
<220>
<221> CDS
<222> (909)...(2504)
<223> 编码转化酶
<400> 1
aggcctcgca acaacctata attgagttaa
gtgcctttcc aagctaaaaa gtttgaggtt 60
ataggggctt agcatccaca cgtcacaatc
tcgggtatcg agtatagtat gtagaattac 120
ggcaggaggt ttcccaatga acaaaggaca
ggggcacggt gagctgtcga aggtatccat 180
tttatcatgt ttcgtttgta caagcacgac
atactaagac atttaccgta tgggagttgt 240
tgtcctagcg tagttctcgc tcccccagca
aagctcaaaa aagtacgtca tttagaatag 300
tttgtgagca aattaccagt cggtatgcta
cgttagaaag gcccacagta ttcttctacc 360
aaaggcgtgc ctttgttgaa ctcgatccat
tatgagggct tccattattc cccgcatttt 420
tattactctg aacaggaata aaaagaaaaa
acccagttta ggaaattatc cgggggcgaa 480
gaaatacgcg tagcgttaat cgaccccacg
tccagggttt ttccatggag gtttctggaa 540
aaactgacga ggaatgtgat tataaatccc
tttatgtgat gtctaagact tttaaggtac 600
gcccgatgtt tgcctattac catcatagag
acgtttcttt tcgaggaatg cttaaacgac 660
tttgtttgac aaaaatgttg cctaagggct
ctatagtaaa ccatttggaa gaaagatttg 720
acgacttttt ttttttggat ttcgatccta
taatccttcc tcctgaaaag aaacatataa 780
atagatatgt attattcttc aaaacattct
cttgttcttg tgcttttttt ttaccatata 840
tcttactttt ttttttctct cagagaaaca
agcaaaacaa aaagcttttc ttttcactaa 900
cgtatatg atg ctt ttg caa gct ttc
ctt ttc ctt ttg gct ggt ttt gca 950
Met Leu Leu Gln Ala Phe Leu Phe Leu
Leu Ala Gly Phe Ala
1 5 10
gcc aaa ata tct gca tca atg aca
aac gaa act agc gat aga cct ttg 998
Ala Lys Ile Ser Ala Ser Met Thr
Asn Glu Thr Ser Asp Arg Pro Leu
15 20 25 30
gtc cac ttc aca ccc aac aag ggc
tgg atg aat gac cca aat ggg ttg 1046
Val His Phe Thr Pro Asn Lys Gly
Trp Met Asn Asp Pro Asn Gly Leu
35 40 45
tgg tac gat gaa aaa gat gcc aaa
tgg cat ctg tac ttt caa tac aac 1094
Trp Tyr Asp Glu Lys Asp Ala Lys
Trp His Leu Tyr Phe Gln Tyr Asn
50 55 60
cca aat gac acc gta tgg ggt acg
cca ttg ttt tgg ggc cat gct act 1142
Pro Asn Asp Thr Val Trp Gly Thr
Pro Leu Phe Trp Gly His Ala Thr
65 70 75
tcc gat gat ttg act aat tgg gaa
gat caa ccc att gct atc gct ccc 1190
Ser Asp Asp Leu Thr Asn Trp Glu
Asp Gln Pro Ile Ala Ile Ala Pro
80 85 90
aag cgt aac gat tca ggt gct ttc
tct ggc tcc atg gtg gtt gat tac 1238
Lys Arg Asn Asp Ser Gly Ala Phe
Ser Gly Ser Met Val Val Asp Tyr
95
100 105 110
aac aac acg agt ggg ttt ttc aat
gat act att gat cca aga caa aga 1286
Asn Asn Thr Ser Gly Phe Phe Asn
Asp Thr Ile Asp Pro Arg Gln Arg
115 120 125
tgc gtt gcg att tgg act tat aac
act cct gaa agt gaa gag caa tac 1334
Cys Val Ala Ile Trp Thr Tyr Asn
Thr Pro Glu Ser Glu Glu Gln Tyr
130 135 140
att agc tat tct ctt gat ggt ggt
tac act ttt act gaa tac caa aag 1382
Ile Ser Tyr Ser Leu Asp Gly Gly
Tyr Thr Phe Thr Glu Tyr Gln Lys
145 150 155
aac cct gtt tta gct gcc aac tcc
act caa ttc aga gat cca aag gtg 1430
Asn Pro Val Leu Ala Ala Asn Ser
Thr Gln Phe Arg Asp Pro Lys Val
160 165 170
ttc tgg tat gaa cct tct caa aaa
tgg att atg acg gct gcc aaa tca 1478
Phe Trp Tyr Glu Pro Ser Gln Lys
Trp Ile Met Thr Ala Ala Lys Ser
175 180 185 190
caa gac tac aaa att gaa att tac
tcc tct gat gac ttg aag tcc tgg 1526
Gln Asp Tyr Lys Ile Glu Ile Tyr
Ser Ser Asp Asp Leu Lys Ser Trp
195 200 205
aag cta gaa tct gca ttt gcc aat
gaa ggt ttc tta ggc tac caa tac 1574
Lys Leu Glu Ser Ala Phe Ala Asn
Glu Gly Phe Leu Gly Tyr Gln Tyr
210 215 220
gaa tgt cca ggt ttg att gaa gtc
cca act gag caa gat cct tcc aaa 1622
Glu Cys Pro Gly Leu Ile Glu Val
Pro Thr Glu Gln Asp Pro Ser Lys
225 230 235
tct tat tgg gtc atg ttt att tct
atc aac cca ggt gca cct gct ggc 1670
Ser Tyr Trp Val Met Phe Ile Ser
Ile Asn Pro Gly Ala Pro Ala Gly
240 245 250
ggt tcc ttc aac caa tat ttt gtt
gga tcc ttc aat ggt act cat ttt 1718
Gly Ser Phe Asn Gln Tyr Phe Val
Gly Ser Phe Asn Gly Thr His Phe
255 260 265 270
gaa gcg ttt gac aat caa tct aga
gtg gta gat ttt ggt aag gac tac 1766
Glu Ala Phe Asp Asn Gln Ser Arg
Val Val Asp Phe Gly Lys Asp Tyr
275 280 285
tat gcc ttg caa act ttc ttc aac
act gac cca acc tac ggt tca gca 1814
Tyr Ala Leu Gln Thr Phe Phe Asn
Thr Asp Pro Thr Tyr Gly Ser Ala
290 295 300
tta ggt att gcc tgg gct tca aac
tgg gag tac agt gcc ttt gtc cca 1862
Leu Gly Ile Ala Trp Ala Ser Asn
Trp Glu Tyr Ser Ala Phe Val Pro
305 310 315
act aac cca tgg aga tca tcc atg
tct ttg gtc cgc aag ttt tct ttg 1910
Thr Asn Pro Trp Arg Ser Ser Met
Ser Leu Val Arg Lys Phe Ser Leu
320 325 330
aac act gaa tat caa gct aat cca
gag act gaa ttg atc aat ttg aaa 1958
Asn Thr Glu Tyr Gln Ala Asn Pro
Glu Thr Glu Leu Ile Asn Leu Lys
335 340 345 350
gcc gaa cca ata ttg aac att agt
aat gct ggt ccc tgg tct cgt ttt 2006
Ala Glu Pro Ile Leu Asn Ile Ser
Asn Ala Gly Pro Trp Ser Arg Phe
355 360 365
gct act aac aca act cta act aag
gcc aat tct tac aat gtc gat ttg 2054
Ala Thr Asn Thr Thr Leu Thr Lys
Ala Asn Ser Tyr Asn Val Asp Leu
370 375 380
agc aac tcg act ggt acc cta gag
ttt gag ttg gtt tac gct gtt aac 2102
Ser Asn Ser Thr Gly Thr Leu Glu
Phe Glu Leu Val Tyr Ala Val Asn
385 390 395
acc aca caa acc ata tcc aaa tcc
gtc ttt gcc gac tta tca ctt tgg 2150
Thr Thr Gln Thr Ile Ser Lys Ser
Val Phe Ala Asp Leu Ser Leu Trp
400 405 410
ttc aag ggt tta gaa gat cct gaa
gaa tat ttg aga atg ggt ttt gaa 2198
Phe Lys Gly Leu Glu Asp Pro Glu
Glu Tyr Leu Arg Met Gly Phe Glu
415 420 425 430
gtc agt gct tct tcc ttc ttt ttg
gac cgt ggt aac tct aag gtc aag 2246
Val Ser Ala Ser Ser Phe Phe Leu
Asp Arg Gly Asn Ser Lys Val Lys
435 440 445
ttt gtc aag gag aac cca tat ttc
aca aac aga atg tct gtc aac aac 2294
Phe Val Lys Glu Asn Pro Tyr Phe
Thr Asn Arg Met Ser Val Asn Asn
450 455 460
caa cca ttc aag tct gag aac gac
cta agt tac tat aaa gtg tac ggc 2342
Gln Pro Phe Lys Ser Glu Asn Asp
Leu Ser Tyr Tyr Lys Val Tyr Gly
465 470 475
cta ctg gat caa aac atc ttg gaa
ttg tac ttc aac gat gga gat gtg 2390
Leu Leu Asp Gln Asn Ile Leu Glu
Leu Tyr Phe Asn Asp Gly Asp Val
480 485 490
gtt tct aca aat acc tac ttc atg
acc acc ggt aac gct cta gga tct 2438
Val Ser Thr Asn Thr Tyr Phe Met
Thr Thr Gly Asn Ala Leu Gly Ser
495 500 505 510
gtg aac atg acc act ggt gtc gat
aat ttg ttc tac att gac aag ttc 2486
Val Asn Met Thr Thr Gly Val Asp
Asn Leu Phe Tyr Ile Asp Lys Phe
515 520 525
caa gta agg gaa gta aaa
tagaggttat aaaacttatt gtctttttta
2534
Gln Val Arg Glu Val Lys
530
tttttttcaa aagccattct aaagggcttt
agctaacgag tgacgaatgt aaaactttat 2594
gatttcaaag aatacctcca aaccattgaa
aatgtatttt tatttttatt ttctcccgac 2654
cccagttacc tggaatttgt tctttatgta
ctttatataa gtataattct cttaaaaatt 2714
tttactactt tgcaatagac atcatttttt
cacgtaataa acccacaatc gtaatgtagt 2774
tgccttacac tactaggatg gacctttttg
cctttatctg ttttgttact gacacaatga 2834
aaccgggtaa agtattagtt atgtgaaaat
ttaaaagcat taagtagaag tataccatat 2894
tgtaaaaaaa aaaagcgttg tcttctacgt
aaaagtgttc tcaaaaagaa gtagtgaggg 2954
aaatggatac caagctatct gtaacaggag
ctaaaaaatc tcagggaaaa gcttctggtt 3014
tgggaaacgg tcgac
3029
<210> 2
<211> 532
<212> PRT
<213> 酿酒酵母
<400> 2
Met Leu Leu Gln Ala Phe Leu Phe
Leu Leu Ala Gly Phe Ala Ala Lys
1
5 10 15
Ile Ser Ala Ser Met Thr Asn Glu
Thr Ser Asp Arg Pro Leu Val His
20 25 30
Phe Thr Pro Asn Lys Gly Trp Met
Asn Asp Pro Asn Gly Leu Trp Tyr
35 40 45
Asp Glu Lys Asp Ala Lys Trp His
Leu Tyr Phe Gln Tyr Asn Pro Asn
50 55 60
Asp Thr Val Trp Gly Thr Pro Leu
Phe Trp Gly His Ala Thr Ser Asp
65 70 75 80
Asp Leu Thr Asn Trp Glu Asp Gln
Pro Ile Ala Ile Ala Pro Lys Arg
85 90 95
Asn Asp Ser Gly Ala Phe Ser Gly
Ser Met Val Val Asp Tyr Asn Asn
100 105 110
Thr Ser Gly Phe Phe Asn Asp Thr
Ile Asp Pro Arg Gln Arg Cys Val
115 120 125
Ala Ile Trp Thr Tyr Asn Thr Pro
Glu Ser Glu Glu Gln Tyr Ile Ser
130 135 140
Tyr Ser Leu Asp Gly Gly Tyr Thr
Phe Thr Glu Tyr Gln Lys Asn Pro
145 150 155 160
Val Leu Ala Ala Asn Ser Thr Gln
Phe Arg Asp Pro Lys Val Phe Trp
165 170 175
Tyr Glu Pro Ser Gln Lys Trp Ile
Met Thr Ala Ala Lys Ser Gln Asp
180 185 190
Tyr Lys Ile Glu Ile Tyr Ser Ser
Asp Asp Leu Lys Ser Trp Lys Leu
195 200 205
Glu Ser Ala Phe Ala Asn Glu Gly
Phe Leu Gly Tyr Gln Tyr Glu Cys
210 215 220
Pro Gly Leu Ile Glu Val Pro Thr
Glu Gln Asp Pro Ser Lys Ser Tyr
225 230 235 240
Trp Val Met Phe Ile Ser Ile Asn
Pro Gly Ala Pro Ala Gly Gly Ser
245 250 255
Phe Asn Gln Tyr Phe Val Gly Ser
Phe Asn Gly Thr His Phe Glu Ala
260 265 270
Phe Asp Asn Gln Ser Arg Val Val
Asp Phe Gly Lys Asp Tyr Tyr Ala
275 280 285
Leu Gln Thr Phe Phe Asn Thr Asp
Pro Thr Tyr Gly Ser Ala Leu Gly
290 295 300
Ile Ala Trp Ala Ser Asn Trp Glu
Tyr Ser Ala Phe Val Pro Thr Asn
305 310 315 320
Pro Trp Arg Ser Ser Met Ser Leu
Val Arg Lys Phe Ser Leu Asn Thr
325 330 335
Glu Tyr Gln Ala Asn Pro Glu Thr
Glu Leu Ile Asn Leu Lys Ala Glu
340 345 350
Pro Ile Leu Asn Ile Ser Asn Ala
Gly Pro Trp Ser Arg Phe Ala Thr
355 360 365
Asn Thr Thr Leu Thr Lys Ala Asn
Ser Tyr Asn Val Asp Leu Ser Asn
370 375 380
Ser Thr Gly Thr Leu Glu Phe Glu
Leu Val Tyr Ala Val Asn Thr Thr
385 390 395 400
Gln Thr Ile Ser Lys Ser Val Phe
Ala Asp Leu Ser Leu Trp Phe Lys
405 410 415
Gly Leu Glu Asp Pro Glu Glu Tyr
Leu Arg Met Gly Phe Glu Val Ser
420 425 430
Ala Ser Ser Phe Phe Leu Asp Arg
Gly Asn Ser Lys Val Lys Phe Val
435 440 445
Lys Glu Asn Pro Tyr Phe Thr Asn
Arg Met Ser Val Asn Asn Gln Pro
450 455 460
Phe Lys Ser Glu Asn Asp Leu Ser
Tyr Tyr Lys Val Tyr Gly Leu Leu
465 470 475 480
Asp Gln Asn Ile Leu Glu Leu Tyr
Phe Asn Asp Gly Asp Val Val Ser
485 490 495
Thr Asn Thr Tyr Phe Met Thr Thr
Gly Asn Ala Leu Gly Ser Val Asn
500 505 510
Met Thr Thr Gly Val Asp Asn Leu
Phe Tyr Ile Asp Lys Phe Gln Val
515 520 525
Arg Glu Val Lys
530
<210> 3
<211> 2159
<212> DNA
<213> 乳酸克鲁维酵母
<220>
<221> CDS
<222> (1024)...(2007)
<223> 编码 UDP-GlcNAc 转运蛋白 (KIMNN2-2)
<400> 3
aaacgtaacg cctggcactc tattttctca
aacttctggg acggaagagc taaatattgt 60
gttgcttgaa caaacccaaa aaaacaaaaa
aatgaacaaa ctaaaactac acctaaataa 120
accgtgtgta aaacgtagta ccatattact
agaaaagatc acaagtgtat cacacatgtg 180
catctcatat tacatctttt atccaatcca
ttctctctat cccgtctgtt cctgtcagat 240
tctttttcca taaaaagaag aagaccccga
atctcaccgg tacaatgcaa aactgctgaa 300
aaaaaaagaa agttcactgg atacgggaac
agtgccagta ggcttcacca catggacaaa 360
acaattgacg ataaaataag caggtgagct
tctttttcaa gtcacgatcc ctttatgtct 420
cagaaacaat atatacaagc taaacccttt
tgaaccagtt ctctcttcat agttatgttc 480
acataaattg cgggaacaag actccgctgg
ctgtcaggta cacgttgtaa cgttttcgtc 540
cgcccaatta ttagcacaac attggcaaaa
agaaaaactg ctcgttttct ctacaggtaa 600
attacaattt ttttcagtaa ttttcgctga
aaaatttaaa gggcaggaaa aaaagacgat 660
ctcgactttg catagatgca agaactgtgg
tcaaaacttg aaatagtaat tttgctgtgc 720
gtgaactaat aaatatatat atatatatat
atatatattt gtgtattttg tatatgtaat 780
tgtgcacgtc ttggctattg gatataagat
tttcgcgggt tgatgacata gagcgtgtac 840
tactgtaata gttgtatatt caaaagctgc
tgcgtggaga aagactaaaa tagataaaaa 900
gcacacattt tgacttcggt accgtcaact
tagtgggaca gtcttttata tttggtgtaa 960
gctcatttct ggtactattc gaaacagaac
agtgttttct gtattaccgt ccaatcgttt 1020
gtc atg agt ttt gta ttg att ttg
tcg tta gtg ttc gga gga tgt tgt 1068
Met Ser Phe Val Leu Ile Leu Ser Leu Val Phe
Gly Gly Cys Cys
1 5 10 15
tcc aat gtg att agt ttc gag cac
atg gtg caa ggc agc aat ata aat 1116
Ser Asn Val Ile Ser Phe Glu His
Met Val Gln Gly Ser Asn Ile Asn
20 25 30
ttg gga aat att gtt aca ttc act
caa ttc gtg tct gtg acg cta att 1164
Leu Gly Asn Ile Val Thr Phe Thr
Gln Phe Val Ser Val Thr Leu Ile
35 40 45
cag ttg ccc aat gct ttg gac ttc
tct cac ttt ccg ttt agg ttg cga 1212
Gln Leu Pro Asn Ala Leu Asp Phe
Ser His Phe Pro Phe Arg Leu Arg
50 55 60
cct aga cac att cct ctt aag atc
cat atg tta gct gtg ttt ttg ttc 1260
Pro Arg His Ile Pro Leu Lys Ile
His Met Leu Ala Val Phe Leu Phe
65 70 75
ttt acc agt tca gtc gcc aat aac
agt gtg ttt aaa ttt gac att tcc 1308
Phe Thr Ser Ser Val Ala Asn Asn
Ser Val Phe Lys Phe Asp Ile Ser
80 85 90 95
gtt ccg att cat att atc att aga
ttt tca ggt acc act ttg acg atg 1356
Val Pro Ile His Ile Ile Ile Arg
Phe Ser Gly Thr Thr Leu Thr Met
100 105 110
ata ata ggt tgg gct gtt tgt aat
aag agg tac tcc aaa ctt cag gtg 1404
Ile Ile Gly Trp Ala Val Cys Asn
Lys Arg Tyr Ser Lys Leu Gln Val
115 120 125
caa tct gcc atc att atg acg ctt
ggt gcg att gtc gca tca tta tac 1452
Gln Ser Ala Ile Ile Met Thr Leu
Gly Ala Ile Val Ala Ser Leu Tyr
130 135 140
cgt gac aaa gaa ttt tca atg gac agt
tta aag ttg aat acg gat tca 1500
Arg Asp Lys Glu Phe Ser Met Asp
Ser Leu Lys Leu Asn Thr Asp Ser
145 150 155
gtg ggt atg acc caa aaa tct atg
ttt ggt atc ttt gtt gtg cta gtg 1548
Val Gly Met Thr Gln Lys Ser Met Phe
Gly Ile Phe Val Val Leu Val
160 165 170 175
gcc act gcc ttg atg tca ttg ttg
tcg ttg ctc aac gaa tgg acg tat 1596
Ala Thr Ala Leu Met Ser Leu Leu
Ser Leu Leu Asn Glu Trp Thr Tyr
180 185 190
aac aag tac ggg aaa cat tgg aaa
gaa act ttg ttc tat tcg cat ttc 1644
Asn Lys Tyr Gly Lys His Trp Lys
Glu Thr Leu Phe Tyr Ser His Phe
195 200 205
ttg gct cta ccg ttg ttt atg ttg
ggg tac aca agg ctc aga gac gaa 1692
Leu Ala Leu Pro Leu Phe Met Leu
Gly Tyr Thr Arg Leu Arg Asp Glu
210 215 220
ttc aga gac ctc tta att tcc tca
gac tca atg gat att cct att gtt 1740
Phe Arg Asp Leu Leu Ile Ser Ser
Asp Ser Met Asp Ile Pro Ile Val
225 230 235
aaa tta cca att gct acg aaa ctt
ttc atg cta ata gca aat aac gtg 1788
Lys Leu Pro Ile Ala Thr Lys Leu
Phe Met Leu Ile Ala Asn Asn Val
240 245 250 255
acc cag ttc att tgt atc aaa ggt
gtt aac atg cta gct agt aac acg 1836
Thr Gln Phe Ile Cys Ile Lys Gly
Val Asn Met Leu Ala Ser Asn Thr
260 265 270
gat gct ttg aca ctt tct gtc gtg
ctt cta gtg cgt aaa ttt gtt agt 1884
Asp Ala Leu Thr Leu Ser Val Val
Leu Leu Val Arg Lys Phe Val Ser
275 280 285
ctt tta ctc agt gtc tac atc tac
aag aac gtc cta tcc gtg act gca 1932
Leu Leu Leu Ser Val Tyr Ile Tyr
Lys Asn Val Leu Ser Val Thr Ala
290 295 300
tac cta ggg acc atc acc gtg ttc
ctg gga gct ggt ttg tat tca tat 1980
Tyr Leu Gly Thr Ile Thr Val Phe
Leu Gly Ala Gly Leu Tyr Ser Tyr
305
310 315
ggt tcg gtc aaa act gca ctg cct
cgc tgaaacaatc cacgtctgta 2027
Gly Ser Val Lys Thr Ala Leu Pro
Arg
320 325
tgatactcgt ttcagaattt ttttgatttt
ctgccggata tggtttctca tctttacaat 2087
cgcattctta attataccag aacgtaattc
aatgatccca gtgactcgta actcttatat 2147
gtcaatttaa gc
2159
<210> 4
<211> 328
<212> PRT
<213> 乳酸克鲁维酵母
<400> 4
Met Ser Phe Val Leu Ile Leu Ser
Leu Val Phe Gly Gly Cys Cys Ser
1
5 10 15
Asn Val Ile Ser Phe Glu His Met
Val Gln Gly Ser Asn Ile Asn Leu
20 25 30
Gly Asn Ile Val Thr Phe Thr Gln
Phe Val Ser Val Thr Leu Ile Gln
35
40 45
Leu Pro Asn Ala Leu Asp Phe Ser
His Phe Pro Phe Arg Leu Arg Pro
50 55 60
Arg His Ile Pro Leu Lys Ile His
Met Leu Ala Val Phe Leu Phe Phe
65 70 75 80
Thr Ser Ser Val Ala Asn Asn Ser
Val Phe Lys Phe Asp Ile Ser Val
85 90 95
Pro Ile His Ile Ile Ile Arg Phe
Ser Gly Thr Thr Leu Thr Met Ile
100 105 110
Ile Gly Trp Ala Val Cys Asn Lys
Arg Tyr Ser Lys Leu Gln Val Gln
115 120 125
Ser Ala Ile Ile Met Thr Leu Gly
Ala Ile Val Ala Ser Leu Tyr Arg
130 135 140
Asp Lys Glu Phe Ser Met Asp Ser
Leu Lys Leu Asn Thr Asp Ser Val
145 150 155 160
Gly Met Thr Gln Lys Ser Met Phe
Gly Ile Phe Val Val Leu Val Ala
165 170 175
Thr Ala Leu Met Ser Leu Leu Ser
Leu Leu Asn Glu Trp Thr Tyr Asn
180 185 190
Lys Tyr Gly Lys His Trp Lys Glu
Thr Leu Phe Tyr Ser His Phe Leu
195 200 205
Ala Leu Pro Leu Phe Met Leu Gly
Tyr Thr Arg Leu Arg Asp Glu Phe
210 215 220
Arg Asp Leu Leu Ile Ser Ser Asp
Ser Met Asp Ile Pro Ile Val Lys
225 230 235 240
Leu Pro Ile Ala Thr Lys Leu Phe
Met Leu Ile Ala Asn Asn Val Thr
245 250 255
Gln Phe Ile Cys Ile Lys Gly Val
Asn Met Leu Ala Ser Asn Thr Asp
260 265 270
Ala Leu Thr Leu Ser Val Val Leu
Leu Val Arg Lys Phe Val Ser Leu
275 280 285
Leu Leu Ser Val Tyr Ile Tyr Lys
Asn Val Leu Ser Val Thr Ala Tyr
290 295 300
Leu Gly Thr Ile Thr Val Phe Leu
Gly Ala Gly Leu Tyr Ser Tyr Gly
305 310 315 320
Ser Val Lys Thr Ala Leu Pro Arg
325
<210> 5
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 编码 Mnn2 前导区 (53)
<400> 5
atgctgctta ccaaaaggtt ttcaaagctg
ttcaagctga cgttcatagt tttgatattg 60
tgcgggctgt tcgtcattac aaacaaatac
atggatgaga acacgtcg 108
<210> 6
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> Mnn2 前导区 (53)
<400> 6
Met Leu Leu Thr Lys Arg Phe Ser
Lys Leu Phe Lys Leu Thr Phe Ile
1
5 10 15
Val Leu Ile Leu Cys Gly Leu Phe
Val Ile Thr Asn Lys Tyr Met Asp
20
25 30
Glu Asn Thr Ser
35
<210> 7
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> 编码 Mnn2 前导区 (54). 最后9个核苷酸是包含AscI限制性位点的接头)
<400> 7
atgctgctta ccaaaaggtt ttcaaagctg
ttcaagctga cgttcatagt tttgatattg 60
tgcgggctgt tcgtcattac aaacaaatac
atggatgaga acacgtcggt caaggagtac 120
aaggagtact tagacagata tgtccagagt
tactccaata agtattcatc ttcctcagac 180
gccgccagcg ctgacgattc aaccccattg
agggacaatg atgaggcagg caatgaaaag 240
ttgaaaagct tctacaacaa cgttttcaac
tttctaatgg ttgattcgcc cgggcgcgcc 300
<210> 8
<211> 100
<212> PRT
<213> 人工序列
<220>
<223> Mnn2 前导区 (54).
<400> 8
Met Leu Leu Thr Lys Arg Phe Ser
Lys Leu Phe Lys Leu Thr Phe Ile
1
5 10 15
Val Leu Ile Leu Cys Gly Leu Phe
Val Ile Thr Asn Lys Tyr Met Asp
20 25 30
Glu Asn Thr Ser Val Lys Glu Tyr
Lys Glu Tyr Leu Asp Arg Tyr Val
35 40 45
Gln Ser Tyr Ser Asn Lys Tyr Ser
Ser Ser Ser Asp Ala Ala Ser Ala
50 55 60
Asp Asp Ser Thr Pro Leu Arg Asp
Asn Asp Glu Ala Gly Asn Glu Lys
65 70 75 80
Leu Lys Ser Phe Tyr Asn Asn Val
Phe Asn Phe Leu Met Val Asp Ser
85 90 95
Pro Gly Arg Ala
100
<210> 9
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 编码酿酒酵母交配因子前信号序列
<400> 9
atgagattcc catccatctt cactgctgtt
ttgttcgctg cttcttctgc tttggct 57
<210> 10
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 酿酒酵母交配因子前信号序列
<400> 10
Met Arg Phe Pro Ser Ile Phe Thr
Ala Val Leu Phe Ala Ala Ser Ser
1
5 10 15
Ala Leu Ala
<210> 11
<211> 99
<212> DNA
<213> 人工序列
<220>
<223> 编码 Pp SEC12 (10)
<400> 11
atgcccagaa aaatatttaa ctacttcatt
ttgactgtat tcatggcaat tcttgctatt 60
gttttacaat ggtctataga gaatggacat
gggcgcgcc 99
<210> 12
<211> 33
<212> PRT
<213> 人工序列
<220>
<223> Pp SEC12 (10)
<400> 12
Met Pro Arg Lys Ile Phe Asn Tyr
Phe Ile Leu Thr Val Phe Met Ala
1
5 10 15
Ile Leu Ala Ile Val Leu Gln Trp
Ser Ile Glu Asn Gly His Gly Arg
20 25 30
Ala
<210> 13
<211> 183
<212> DNA
<213> 人工序列
<220>
<223> 编码 ScMnt1 (Kre2) (33)
<400> 13
atggccctct ttctcagtaa gagactgttg
agatttaccg tcattgcagg tgcggttatt 60
gttctcctcc taacattgaa ttccaacagt
agaactcagc aatatattcc gagttccatc 120
tccgctgcat ttgattttac ctcaggatct
atatcccctg aacaacaagt catcgggcgc 180
gcc
183
<210> 14
<211> 61
<212> PRT
<213> 人工序列
<220>
<223> ScMnt1 (Kre2) (33)
<400> 14
Met Ala Leu Phe Leu Ser Lys Arg
Leu Leu Arg Phe Thr Val Ile Ala
1
5 10 15
Gly Ala Val Ile Val Leu Leu Leu
Thr Leu Asn Ser Asn Ser Arg Thr
20 25 30
Gln Gln Tyr Ile Pro Ser Ser Ile
Ser Ala Ala Phe Asp Phe Thr Ser
35 40 45
Gly Ser Ile Ser Pro Glu Gln Gln
Val Ile Gly Arg Ala
50 55 60
<210> 15
<211> 318
<212> DNA
<213> 人工序列
<220>
<223> 编码 ScSEC12 (8)
<400> 15
atgaacacta tccacataat aaaattaccg
cttaactacg ccaactacac ctcaatgaaa 60
caaaaaatct ctaaattttt caccaacttc
atccttattg tgctgctttc ttacatttta 120
cagttctcct ataagcacaa tttgcattcc
atgcttttca attacgcgaa ggacaatttt 180
ctaacgaaaa gagacaccat ctcttcgccc
tacgtagttg atgaagactt acatcaaaca 240
actttgtttg gcaaccacgg tacaaaaaca
tctgtaccta gcgtagattc cataaaagtg 300
catggcgtgg ggcgcgcc
318
<210> 16
<211> 106
<212> PRT
<213> 人工序列
<220>
<223> ScSEC12 (8)
<400> 16
Met Asn Thr Ile His Ile Ile Lys
Leu Pro Leu Asn Tyr Ala Asn Tyr
1
5 10 15
Thr Ser Met Lys Gln Lys Ile Ser
Lys Phe Phe Thr Asn Phe Ile Leu
20 25 30
Ile Val Leu Leu Ser Tyr Ile Leu
Gln Phe Ser Tyr Lys His Asn Leu
35 40 45
His Ser Met Leu Phe Asn Tyr Ala
Lys Asp Asn Phe Leu Thr Lys Arg
50 55 60
Asp Thr Ile Ser Ser Pro Tyr Val
Val Asp Glu Asp Leu His Gln Thr
65 70 75 80
Thr Leu Phe Gly Asn His Gly Thr
Lys Thr Ser Val Pro Ser Val Asp
85 90 95
Ser Ile Lys Val His Gly Val Gly
Arg Ala
100 105
<210> 17
<211> 981
<212> DNA
<213> 小家属
<220>
<221> CDS
<222> (1)...(978)
<223> 编码 MmSLC35A3 UDP-GlcNAc 转运蛋白
<400> 17
atg tct gcc aac cta aaa tat ctt
tcc ttg gga att ttg gtg ttt cag 48
Met Ser Ala Asn Leu Lys Tyr Leu
Ser Leu Gly Ile Leu Val Phe Gln
1
5 10 15
act acc agt ctg gtt cta acg atg
cgg tat tct agg act tta aaa gag 96
Thr Thr Ser Leu Val Leu Thr Met
Arg Tyr Ser Arg Thr Leu Lys Glu
20 25 30
gag ggg cct cgt tat ctg tct tct
aca gca gtg gtt gtg gct gaa ttt 144
Glu Gly Pro Arg Tyr Leu Ser Ser
Thr Ala Val Val Val Ala Glu Phe
35 40 45
ttg aag ata atg gcc tgc atc ttt
tta gtc tac aaa gac agt aag tgt 192
Leu Lys Ile Met Ala Cys Ile Phe
Leu Val Tyr Lys Asp Ser Lys Cys
50 55 60
agt gtg aga gca ctg aat aga gta
ctg cat gat gaa att ctt aat aag 240
Ser Val Arg Ala Leu Asn Arg Val
Leu His Asp Glu Ile Leu Asn Lys
65 70 75 80
ccc atg gaa acc ctg aag ctc gct
atc ccg tca ggg ata tat act ctt 288
Pro Met Glu Thr Leu Lys Leu Ala
Ile Pro Ser Gly Ile Tyr Thr Leu
85 90 95
cag aac aac tta ctc tat gtg gca
ctg tca aac cta gat gca gcc act 336
Gln Asn Asn Leu Leu Tyr Val Ala
Leu Ser Asn Leu Asp Ala Ala Thr
100 105 110
tac cag gtt aca tat cag ttg aaa
ata ctt aca aca gca tta ttt tct 384
Tyr Gln Val Thr Tyr Gln Leu Lys
Ile Leu Thr Thr Ala Leu Phe Ser
115 120 125
gtg tct atg ctt ggt aaa aaa tta
ggt gtg tac cag tgg ctc tcc cta 432
Val Ser Met Leu Gly Lys Lys Leu
Gly Val Tyr Gln Trp Leu Ser Leu
130 135 140
gta att ctg atg gca gga gtt gct
ttt gta cag tgg cct tca gat tct 480
Val Ile Leu Met Ala Gly Val Ala
Phe Val Gln Trp Pro Ser Asp Ser
145 150 155 160
caa gag ctg aac tct aag gac ctt tca
aca ggc tca cag ttt gta ggc 528
Gln Glu Leu Asn Ser Lys Asp Leu
Ser Thr Gly Ser Gln Phe Val Gly
165 170 175
ctc atg gca gtt ctc aca gcc tgt
ttt tca agt ggc ttt gct gga gtt 576
Leu Met Ala Val Leu Thr Ala Cys
Phe Ser Ser Gly Phe Ala Gly Val
180 185 190
tat ttt gag aaa atc tta aaa gaa
aca aaa cag tca gta tgg ata agg 624
Tyr Phe Glu Lys Ile Leu Lys Glu
Thr Lys Gln Ser Val Trp Ile Arg
195 200 205
aac att caa ctt ggt ttc ttt gga
agt ata ttt gga tta atg ggt gta 672
Asn Ile Gln Leu Gly Phe Phe Gly
Ser Ile Phe Gly Leu Met Gly Val
210 215 220
tac gtt tat gat gga gaa ttg gtc
tca aag aat gga ttt ttt cag gga 720
Tyr Val Tyr Asp Gly Glu Leu Val
Ser Lys Asn Gly Phe Phe Gln Gly
225 230 235 240
tat aat caa ctg acg tgg ata gtt
gtt gct ctg cag gca ctt gga ggc 768
Tyr Asn Gln Leu Thr Trp Ile Val
Val Ala Leu Gln Ala Leu Gly Gly
245 250 255
ctt gta ata gct gct gtc atc aaa
tat gca gat aac att tta aaa gga 816
Leu Val Ile Ala Ala Val Ile Lys
Tyr Ala Asp Asn Ile Leu Lys Gly
260 265 270
ttt gcg acc tcc tta tcc ata ata
ttg tca aca ata ata tct tat ttt 864
Phe Ala Thr Ser Leu Ser Ile Ile
Leu Ser Thr Ile Ile Ser Tyr Phe
275 280 285
tgg ttg caa gat ttt gtg cca acc agt
gtc ttt ttc ctt gga gcc atc 912
Trp Leu Gln Asp Phe Val Pro Thr
Ser Val Phe Phe Leu Gly Ala Ile
290 295 300
ctt gta ata gca gct act ttc ttg
tat ggt tac gat ccc aaa cct gca 960
Leu Val Ile Ala Ala Thr Phe Leu
Tyr Gly Tyr Asp Pro Lys Pro Ala
305 310 315 320
gga aat ccc act aaa gca tag 981
Gly Asn Pro Thr Lys Ala
325
<210> 18
<211> 326
<212> PRT
<213> 小家属
<400> 18
Met Ser Ala Asn Leu Lys Tyr Leu
Ser Leu Gly Ile Leu Val Phe Gln
1
5 10 15
Thr Thr Ser Leu Val Leu Thr Met
Arg Tyr Ser Arg Thr Leu Lys Glu
20 25 30
Glu Gly Pro Arg Tyr Leu Ser Ser
Thr Ala Val Val Val Ala Glu Phe
35 40 45
Leu Lys Ile Met Ala Cys Ile Phe
Leu Val Tyr Lys Asp Ser Lys Cys
50 55 60
Ser Val Arg Ala Leu Asn Arg Val
Leu His Asp Glu Ile Leu Asn Lys
65 70 75 80
Pro Met Glu Thr Leu Lys Leu Ala
Ile Pro Ser Gly Ile Tyr Thr Leu
85 90 95
Gln Asn Asn Leu Leu Tyr Val Ala
Leu Ser Asn Leu Asp Ala Ala Thr
100 105 110
Tyr Gln Val Thr Tyr Gln Leu Lys
Ile Leu Thr Thr Ala Leu Phe Ser
115 120 125
Val Ser Met Leu Gly Lys Lys Leu
Gly Val Tyr Gln Trp Leu Ser Leu
130 135 140
Val Ile Leu Met Ala Gly Val Ala
Phe Val Gln Trp Pro Ser Asp Ser
145 150 155 160
Gln Glu Leu Asn Ser Lys Asp Leu
Ser Thr Gly Ser Gln Phe Val Gly
165 170 175
Leu Met Ala Val Leu Thr Ala Cys
Phe Ser Ser Gly Phe Ala Gly Val
180 185 190
Tyr Phe Glu Lys Ile Leu Lys Glu
Thr Lys Gln Ser Val Trp Ile Arg
195 200 205
Asn Ile Gln Leu Gly Phe Phe Gly
Ser Ile Phe Gly Leu Met Gly Val
210 215 220
Tyr Val Tyr Asp Gly Glu Leu Val
Ser Lys Asn Gly Phe Phe Gln Gly
225 230 235 240
Tyr Asn Gln Leu Thr Trp Ile Val
Val Ala Leu Gln Ala Leu Gly Gly
245 250 255
Leu Val Ile Ala Ala Val Ile Lys
Tyr Ala Asp Asn Ile Leu Lys Gly
260 265 270
Phe Ala Thr Ser Leu Ser Ile Ile
Leu Ser Thr Ile Ile Ser Tyr Phe
275 280 285
Trp Leu Gln Asp Phe Val Pro Thr
Ser Val Phe Phe Leu Gly Ala Ile
290 295 300
Leu Val Ile Ala Ala Thr Phe Leu
Tyr Gly Tyr Asp Pro Lys Pro Ala
305 310 315 320
Gly Asn Pro Thr Lys Ala
325
<210> 19
<211> 1074
<212> DNA
<213> 黑腹果蝇
<220>
<221> CDS
<222> (1)...(1071)
<223> 编码 DmUGT
<400> 19
atg aat agc ata cac atg aac gcc
aat acg ctg aag tac atc agc ctg 48
Met Asn Ser Ile His Met Asn Ala
Asn Thr Leu Lys Tyr Ile Ser Leu
1
5 10 15
ctg acg ctg acc ctg cag aat gcc
atc ctg ggc ctc agc atg cgc tac 96
Leu Thr Leu Thr Leu Gln Asn Ala
Ile Leu Gly Leu Ser Met Arg Tyr
20 25 30
gcc cgc acc cgg cca ggc gac atc
ttc ctc agc tcc acg gcc gta ctc 144
Ala Arg Thr Arg Pro Gly Asp Ile
Phe Leu Ser Ser Thr Ala Val Leu
35 40 45
atg gca gag ttc gcc aaa ctg atc
acg tgc ctg ttc ctg gtc ttc aac 192
Met Ala Glu Phe Ala Lys Leu Ile
Thr Cys Leu Phe Leu Val Phe Asn
50 55 60
gag gag ggc aag gat gcc cag aag
ttt gta cgc tcg ctg cac aag acc 240
Glu Glu Gly Lys Asp Ala Gln Lys
Phe Val Arg Ser Leu His Lys Thr
65 70 75 80
atc att gcg aat ccc atg gac acg
ctg aag gtg tgc gtc ccc tcg ctg 288
Ile Ile Ala Asn Pro Met Asp Thr
Leu Lys Val Cys Val Pro Ser Leu
85 90 95
gtc tat atc gtt caa aac aat ctg
ctg tac gtc tct gcc tcc cat ttg 336
Val Tyr Ile Val Gln Asn Asn Leu
Leu Tyr Val Ser Ala Ser His Leu
100 105 110
gat gcg gcc acc tac cag gtg acg
tac cag ctg aag att ctc acc acg 384
Asp Ala Ala Thr Tyr Gln Val Thr
Tyr Gln Leu Lys Ile Leu Thr Thr
115 120 125
gcc atg ttc gcg gtt gtc att ctg
cgc cgc aag ctg ctg aac acg cag 432
Ala Met Phe Ala Val Val Ile Leu
Arg Arg Lys Leu Leu Asn Thr Gln
130 135 140
tgg ggt gcg ctg ctg ctc ctg gtg
atg ggc atc gtc ctg gtg cag ttg 480
Trp Gly Ala Leu Leu Leu Leu Val
Met Gly Ile Val Leu Val Gln Leu
145 150 155 160
gcc caa acg gag ggt ccg acg agt
ggc tca gcc ggt ggt gcc gca gct 528
Ala Gln Thr Glu Gly Pro Thr Ser
Gly Ser Ala Gly Gly Ala Ala Ala
165 170 175
gca gcc acg gcc gcc tcc tct ggc
ggt gct ccc gag cag aac agg atg 576
Ala Ala Thr Ala Ala Ser Ser Gly
Gly Ala Pro Glu Gln Asn Arg Met
180 185 190
ctc gga ctg tgg gcc gca ctg ggc
gcc tgc ttc ctc tcc gga ttc gcg 624
Leu Gly Leu Trp Ala Ala Leu Gly
Ala Cys Phe Leu Ser Gly Phe Ala
195 200 205
ggc atc tac ttt gag aag atc ctc
aag ggt gcc gag atc tcc gtg tgg 672
Gly Ile Tyr Phe Glu Lys Ile Leu
Lys Gly Ala Glu Ile Ser Val Trp
210 215 220
atg cgg aat gtg cag ttg agt ctg
ctc agc att ccc ttc ggc ctg ctc 720
Met Arg Asn Val Gln Leu Ser Leu
Leu Ser Ile Pro Phe Gly Leu Leu
225 230 235 240
acc tgt ttc gtt aac gac ggc agt
agg atc ttc gac cag gga ttc ttc 768
Thr Cys Phe Val Asn Asp Gly Ser
Arg Ile Phe Asp Gln Gly Phe Phe
245 250 255
aag ggc tac gat ctg ttt gtc tgg
tac ctg gtc ctg ctg cag gcc ggc 816
Lys Gly Tyr Asp Leu Phe Val Trp
Tyr Leu Val Leu Leu Gln Ala Gly
260 265 270
ggt gga ttg atc gtt gcc gtg gtg
gtc aag tac gcg gat aac att ctc 864
Gly Gly Leu Ile Val Ala Val Val
Val Lys Tyr Ala Asp Asn Ile Leu
275 280 285
aag ggc ttc gcc acc tcg ctg gcc
atc atc atc tcg tgc gtg gcc tcc 912
Lys Gly Phe Ala Thr Ser Leu Ala
Ile Ile Ile Ser Cys Val Ala Ser
290 295 300
ata tac atc ttc gac ttc aat ctc
acg ctg cag ttc agc ttc gga gct 960
Ile Tyr Ile Phe Asp Phe Asn Leu
Thr Leu Gln Phe Ser Phe Gly Ala
305 310 315 320
ggc ctg gtc atc gcc tcc ata ttt
ctc tac ggc tac gat ccg gcc agg 1008
Gly Leu Val Ile Ala Ser Ile Phe
Leu Tyr Gly Tyr Asp Pro Ala Arg
325 330 335
tcg gcg ccg aag cca act atg cat
ggt cct ggc ggc gat gag gag aag 1056
Ser Ala Pro Lys Pro Thr Met His
Gly Pro Gly Gly Asp Glu Glu Lys
340 345 350
ctg ctg ccg cgc gtc tag 1074
Leu Leu Pro Arg Val
355
<210> 20
<211> 357
<212> PRT
<213> 黑腹果蝇
<400> 20
Met Asn Ser Ile His Met Asn Ala Asn
Thr Leu Lys Tyr Ile Ser Leu
1
5 10 15
Leu Thr Leu Thr Leu Gln Asn Ala
Ile Leu Gly Leu Ser Met Arg Tyr
20 25 30
Ala Arg Thr Arg Pro Gly Asp Ile
Phe Leu Ser Ser Thr Ala Val Leu
35 40 45
Met Ala Glu Phe Ala Lys Leu Ile
Thr Cys Leu Phe Leu Val Phe Asn
50 55 60
Glu Glu Gly Lys Asp Ala Gln Lys
Phe Val Arg Ser Leu His Lys Thr
65 70 75 80
Ile Ile Ala Asn Pro Met Asp Thr
Leu Lys Val Cys Val Pro Ser Leu
85 90 95
Val Tyr Ile Val Gln Asn Asn Leu
Leu Tyr Val Ser Ala Ser His Leu
100 105 110
Asp Ala Ala Thr Tyr Gln Val Thr
Tyr Gln Leu Lys Ile Leu Thr Thr
115 120 125
Ala Met Phe Ala Val Val Ile Leu
Arg Arg Lys Leu Leu Asn Thr Gln
130 135 140
Trp Gly Ala Leu Leu Leu Leu Val
Met Gly Ile Val Leu Val Gln Leu
145 150 155 160
Ala Gln Thr Glu Gly Pro Thr Ser
Gly Ser Ala Gly Gly Ala Ala Ala
165 170 175
Ala Ala Thr Ala Ala Ser Ser Gly
Gly Ala Pro Glu Gln Asn Arg Met
180 185 190
Leu Gly Leu Trp Ala Ala Leu Gly
Ala Cys Phe Leu Ser Gly Phe Ala
195 200 205
Gly Ile Tyr Phe Glu Lys Ile Leu
Lys Gly Ala Glu Ile Ser Val Trp
210 215 220
Met Arg Asn Val Gln Leu Ser Leu
Leu Ser Ile Pro Phe Gly Leu Leu
225 230 235 240
Thr Cys Phe Val Asn Asp Gly Ser
Arg Ile Phe Asp Gln Gly Phe Phe
245 250 255
Lys Gly Tyr Asp Leu Phe Val Trp
Tyr Leu Val Leu Leu Gln Ala Gly
260 265 270
Gly Gly Leu Ile Val Ala Val Val
Val Lys Tyr Ala Asp Asn Ile Leu
275 280 285
Lys Gly Phe Ala Thr Ser Leu Ala
Ile Ile Ile Ser Cys Val Ala Ser
290 295 300
Ile Tyr Ile Phe Asp Phe Asn Leu
Thr Leu Gln Phe Ser Phe Gly Ala
305 310 315 320
Gly Leu Val Ile Ala Ser Ile Phe
Leu Tyr Gly Tyr Asp Pro Ala Arg
325 330 335
Ser Ala Pro Lys Pro Thr Met His
Gly Pro Gly Gly Asp Glu Glu Lys
340 345 350
Leu Leu Pro Arg Val
355
<210> 21
<211> 2100
<212> DNA
<213> 酿酒酵母
<220>
<221> CDS
<222> (1)...(2097)
<223> 编码 ScGAL10
<400> 21
atg aca gct cag tta caa agt gaa
agt act tct aaa att gtt ttg gtt 48
Met Thr Ala Gln Leu Gln Ser Glu
Ser Thr Ser Lys Ile Val Leu Val
1
5 10 15
aca ggt ggt gct gga tac att ggt
tca cac act gtg gta gag cta att 96
Thr Gly Gly Ala Gly Tyr Ile Gly
Ser His Thr Val Val Glu Leu Ile
20 25 30
gag aat gga tat gac tgt gtt gtt
gct gat aac ctg tcg aat tca act 144
Glu Asn Gly Tyr Asp Cys Val Val
Ala Asp Asn Leu Ser Asn Ser Thr
35 40 45
tat gat tct gta gcc agg tta gag
gtc ttg acc aag cat cac att ccc 192
Tyr Asp Ser Val Ala Arg Leu Glu
Val Leu Thr Lys His His Ile Pro
50 55 60
ttc tat gag gtt gat ttg tgt gac
cga aaa ggt ctg gaa aag gtt ttc 240
Phe Tyr Glu Val Asp Leu Cys Asp
Arg Lys Gly Leu Glu Lys Val Phe
65 70 75 80
aaa gaa tat aaa att gat tcg gta
att cac ttt gct ggt tta aag gct 288
Lys Glu Tyr Lys Ile Asp Ser Val
Ile His Phe Ala Gly Leu Lys Ala
85 90 95
gta ggt gaa tct aca caa atc ccg
ctg aga tac tat cac aat aac att 336
Val Gly Glu Ser Thr Gln Ile Pro
Leu Arg Tyr Tyr His Asn Asn Ile
100 105 110
ttg gga act gtc gtt tta tta gag
tta atg caa caa tac aac gtt tcc 384
Leu Gly Thr Val Val Leu Leu Glu
Leu Met Gln Gln Tyr Asn Val Ser
115 120 125
aaa ttt gtt ttt tca tct tct gct
act gtc tat ggt gat gct acg aga 432
Lys Phe Val Phe Ser Ser Ser Ala
Thr Val Tyr Gly Asp Ala Thr Arg
130 135 140
ttc cca aat atg att cct atc cca
gaa gaa tgt ccc tta ggg cct act 480
Phe Pro Asn Met Ile Pro Ile Pro
Glu Glu Cys Pro Leu Gly Pro Thr
145 150 155 160
aat ccg tat ggt cat acg aaa tac
gcc att gag aat atc ttg aat gat 528
Asn Pro Tyr Gly His Thr Lys Tyr
Ala Ile Glu Asn Ile Leu Asn Asp
165 170 175
ctt tac aat agc gac aaa aaa agt
tgg aag ttt gct atc ttg cgt tat 576
Leu Tyr Asn Ser Asp Lys Lys Ser
Trp Lys Phe Ala Ile Leu Arg Tyr
180 185 190
ttt aac cca att ggc gca cat ccc
tct gga tta atc gga gaa gat ccg 624
Phe Asn Pro Ile Gly Ala His Pro
Ser Gly Leu Ile Gly Glu Asp Pro
195 200 205
cta ggt ata cca aac aat ttg ttg
cca tat atg gct caa gta gct gtt 672
Leu Gly Ile Pro Asn Asn Leu Leu
Pro Tyr Met Ala Gln Val Ala Val
210 215 220
ggt agg cgc gag aag ctt tac atc
ttc gga gac gat tat gat tcc aga 720
Gly Arg Arg Glu Lys Leu Tyr Ile
Phe Gly Asp Asp Tyr Asp Ser Arg
225 230 235 240
gat ggt acc ccg atc agg gat tat
atc cac gta gtt gat cta gca aaa 768
Asp Gly Thr Pro Ile Arg Asp Tyr
Ile His Val Val Asp Leu Ala Lys
245 250 255
ggt cat att gca gcc ctg caa tac
cta gag gcc tac aat gaa aat gaa 816
Gly His Ile Ala Ala Leu Gln Tyr
Leu Glu Ala Tyr Asn Glu Asn Glu
260 265 270
ggt ttg tgt cgt gag tgg aac ttg
ggt tcc ggt aaa ggt tct aca gtt 864
Gly Leu Cys Arg Glu Trp Asn Leu
Gly Ser Gly Lys Gly Ser Thr Val
275 280 285
ttt gaa gtt tat cat gca ttc tgc
aaa gct tct ggt att gat ctt cca 912
Phe Glu Val Tyr His Ala Phe Cys
Lys Ala Ser Gly Ile Asp Leu Pro
290 295 300
tac aaa gtt acg ggc aga aga gca
ggt gat gtt ttg aac ttg acg gct 960
Tyr Lys Val Thr Gly Arg Arg Ala
Gly Asp Val Leu Asn Leu Thr Ala
305 310 315 320
aaa cca gat agg gcc aaa cgc gaa
ctg aaa tgg cag acc gag ttg cag 1008
Lys Pro Asp Arg Ala Lys Arg Glu
Leu Lys Trp Gln Thr Glu Leu Gln
325 330 335
gtt gaa gac tcc tgc aag gat tta
tgg aaa tgg act act gag aat cct 1056
Val Glu Asp Ser Cys Lys Asp Leu
Trp Lys Trp Thr Thr Glu Asn Pro
340 345 350
ttt ggt tac cag tta agg ggt gtc
gag gcc aga ttt tcc gct gaa gat 1104
Phe Gly Tyr Gln Leu Arg Gly Val
Glu Ala Arg Phe Ser Ala Glu Asp
355 360 365
atg cgt tat gac gca aga ttt gtg
act att ggt gcc ggc acc aga ttt 1152
Met Arg Tyr Asp Ala Arg Phe Val
Thr Ile Gly Ala Gly Thr Arg Phe
370 375 380
caa gcc acg ttt gcc aat ttg ggc
gcc agc att gtt gac ctg aaa gtg 1200
Gln Ala Thr Phe Ala Asn Leu Gly
Ala Ser Ile Val Asp Leu Lys Val
385 390 395 400
aac gga caa tca gtt gtt ctt ggc
tat gaa aat gag gaa ggg tat ttg 1248
Asn Gly Gln Ser Val Val Leu Gly
Tyr Glu Asn Glu Glu Gly Tyr Leu
405 410 415
aat cct gat agt gct tat ata ggc
gcc acg atc ggc agg tat gct aat 1296
Asn Pro Asp Ser Ala Tyr Ile Gly
Ala Thr Ile Gly Arg Tyr Ala Asn
420 425 430
cgt att tcg aag ggt aag ttt agt
tta tgc aac aaa gac tat cag tta 1344
Arg Ile Ser Lys Gly Lys Phe Ser
Leu Cys Asn Lys Asp Tyr Gln Leu
435 440 445
acc gtt aat aac ggc gtt aat gcg
aat cat agt agt atc ggt tct ttc 1392
Thr Val Asn Asn Gly Val Asn Ala
Asn His Ser Ser Ile Gly Ser Phe
450 455 460
cac aga aaa aga ttt ttg gga ccc
atc att caa aat cct tca aag gat 1440
His Arg Lys Arg Phe Leu Gly Pro
Ile Ile Gln Asn Pro Ser Lys Asp
465 470 475 480
gtt ttt acc gcc gag tac atg ctg
ata gat aat gag aag gac acc gaa 1488
Val Phe Thr Ala Glu Tyr Met Leu
Ile Asp Asn Glu Lys Asp Thr Glu
485 490 495
ttt cca ggt gat cta ttg gta acc
ata cag tat act gtg aac gtt gcc 1536
Phe Pro Gly Asp Leu Leu Val Thr
Ile Gln Tyr Thr Val Asn Val Ala
500 505 510
caa aaa agt ttg gaa atg gta tat
aaa ggt aaa ttg act gct ggt gaa 1584
Gln Lys Ser Leu Glu Met Val Tyr
Lys Gly Lys Leu Thr Ala Gly Glu
515 520 525
gcg acg cca ata aat tta aca aat
cat agt tat ttc aat ctg aac aag 1632
Ala Thr Pro Ile Asn Leu Thr Asn
His Ser Tyr Phe Asn Leu Asn Lys
530 535 540
cca tat gga gac act att gag ggt
acg gag att atg gtg cgt tca aaa 1680
Pro Tyr Gly Asp Thr Ile Glu Gly
Thr Glu Ile Met Val Arg Ser Lys
545 550 555 560
aaa tct gtt gat gtc gac aaa aac
atg att cct acg ggt aat atc gtc 1728
Lys Ser Val Asp Val Asp Lys Asn
Met Ile Pro Thr Gly Asn Ile Val
565 570 575
gat aga gaa att gct acc ttt aac
tct aca aag cca acg gtc tta ggc 1776
Asp Arg Glu Ile Ala Thr Phe Asn
Ser Thr Lys Pro Thr Val Leu Gly
580 585 590
ccc aaa aat ccc cag ttt gat tgt
tgt ttt gtg gtg gat gaa aat gct 1824
Pro Lys Asn Pro Gln Phe Asp Cys
Cys Phe Val Val Asp Glu Asn Ala
595 600 605
aag cca agt caa atc aat act cta
aac aat gaa ttg acg ctt att gtc 1872
Lys Pro Ser Gln Ile Asn Thr Leu
Asn Asn Glu Leu Thr Leu Ile Val
610 615 620
aag gct ttt cat ccc gat tcc aat
att aca tta gaa gtt tta agt aca 1920
Lys Ala Phe His Pro Asp Ser Asn
Ile Thr Leu Glu Val Leu Ser Thr
625 630 635 640
gag cca act tat caa ttt tat acc
ggt gat ttc ttg tct gct ggt tac 1968
Glu Pro Thr Tyr Gln Phe Tyr Thr
Gly Asp Phe Leu Ser Ala Gly Tyr
645 650 655
gaa gca aga caa ggt ttt gca att
gag cct ggt aga tac att gat gct 2016
Glu Ala Arg Gln Gly Phe Ala Ile
Glu Pro Gly Arg Tyr Ile Asp Ala
660 665 670
atc aat caa gag aac tgg aaa gat
tgt gta acc ttg aaa aac ggt gaa 2064
Ile Asn Gln Glu Asn Trp Lys Asp
Cys Val Thr Leu Lys Asn Gly Glu
675 680 685
act tac ggg tcc aag att gtc tac
aga ttt tcc tga 2100
Thr Tyr Gly Ser Lys Ile Val Tyr
Arg Phe Ser
690 695
<210> 22
<211> 699
<212> PRT
<213> 酿酒酵母
<400> 22
Met Thr Ala Gln Leu Gln Ser Glu
Ser Thr Ser Lys Ile Val Leu Val
1
5 10 15
Thr Gly Gly Ala Gly Tyr Ile Gly
Ser His Thr Val Val Glu Leu Ile
20 25 30
Glu Asn Gly Tyr Asp Cys Val Val
Ala Asp Asn Leu Ser Asn Ser Thr
35 40 45
Tyr Asp Ser Val Ala Arg Leu Glu
Val Leu Thr Lys His His Ile Pro
50 55 60
Phe Tyr Glu Val Asp Leu Cys Asp
Arg Lys Gly Leu Glu Lys Val Phe
65 70 75 80
Lys Glu Tyr Lys Ile Asp Ser Val
Ile His Phe Ala Gly Leu Lys Ala
85 90 95
Val Gly Glu Ser Thr Gln Ile Pro
Leu Arg Tyr Tyr His Asn Asn Ile
100 105 110
Leu Gly Thr Val Val Leu Leu Glu
Leu Met Gln Gln Tyr Asn Val Ser
115 120 125
Lys Phe Val Phe Ser Ser Ser Ala
Thr Val Tyr Gly Asp Ala Thr Arg
130 135 140
Phe Pro Asn Met Ile Pro Ile Pro
Glu Glu Cys Pro Leu Gly Pro Thr
145 150 155 160
Asn Pro Tyr Gly His Thr Lys Tyr
Ala Ile Glu Asn Ile Leu Asn Asp
165 170 175
Leu Tyr Asn Ser Asp Lys Lys Ser
Trp Lys Phe Ala Ile Leu Arg Tyr
180 185 190
Phe Asn Pro Ile Gly Ala His Pro
Ser Gly Leu Ile Gly Glu Asp Pro
195 200 205
Leu Gly Ile Pro Asn Asn Leu Leu
Pro Tyr Met Ala Gln Val Ala Val
210 215 220
Gly Arg Arg Glu Lys Leu Tyr Ile
Phe Gly Asp Asp Tyr Asp Ser Arg
225 230 235 240
Asp Gly Thr Pro Ile Arg Asp Tyr
Ile His Val Val Asp Leu Ala Lys
245 250 255
Gly His Ile Ala Ala Leu Gln Tyr
Leu Glu Ala Tyr Asn Glu Asn Glu
260 265 270
Gly Leu Cys Arg Glu Trp Asn Leu
Gly Ser Gly Lys Gly Ser Thr Val
275 280 285
Phe Glu Val Tyr His Ala Phe Cys
Lys Ala Ser Gly Ile Asp Leu Pro
290 295 300
Tyr Lys Val Thr Gly Arg Arg Ala
Gly Asp Val Leu Asn Leu Thr Ala
305 310 315 320
Lys Pro Asp Arg Ala Lys Arg Glu
Leu Lys Trp Gln Thr Glu Leu Gln
325 330 335
Val Glu Asp Ser Cys Lys Asp Leu
Trp Lys Trp Thr Thr Glu Asn Pro
340 345 350
Phe Gly Tyr Gln Leu Arg Gly Val
Glu Ala Arg Phe Ser Ala Glu Asp
355 360 365
Met Arg Tyr Asp Ala Arg Phe Val
Thr Ile Gly Ala Gly Thr Arg Phe
370 375 380
Gln Ala Thr Phe Ala Asn Leu Gly
Ala Ser Ile Val Asp Leu Lys Val
385 390 395 400
Asn Gly Gln Ser Val Val Leu Gly
Tyr Glu Asn Glu Glu Gly Tyr Leu
405 410 415
Asn Pro Asp Ser Ala Tyr Ile Gly
Ala Thr Ile Gly Arg Tyr Ala Asn
420 425 430
Arg Ile Ser Lys Gly Lys Phe Ser
Leu Cys Asn Lys Asp Tyr Gln Leu
435 440 445
Thr Val Asn Asn Gly Val Asn Ala
Asn His Ser Ser Ile Gly Ser Phe
450 455 460
His Arg Lys Arg Phe Leu Gly Pro
Ile Ile Gln Asn Pro Ser Lys Asp
465 470 475 480
Val Phe Thr Ala Glu Tyr Met Leu
Ile Asp Asn Glu Lys Asp Thr Glu
485 490 495
Phe Pro Gly Asp Leu Leu Val Thr
Ile Gln Tyr Thr Val Asn Val Ala
500 505 510
Gln Lys Ser Leu Glu Met Val Tyr
Lys Gly Lys Leu Thr Ala Gly Glu
515 520 525
Ala Thr Pro Ile Asn Leu Thr Asn
His Ser Tyr Phe Asn Leu Asn Lys
530 535 540
Pro Tyr Gly Asp Thr Ile Glu Gly
Thr Glu Ile Met Val Arg Ser Lys
545 550 555 560
Lys Ser Val Asp Val Asp Lys Asn
Met Ile Pro Thr Gly Asn Ile Val
565 570 575
Asp Arg Glu Ile Ala Thr Phe Asn
Ser Thr Lys Pro Thr Val Leu Gly
580 585 590
Pro Lys Asn Pro Gln Phe Asp Cys
Cys Phe Val Val Asp Glu Asn Ala
595 600 605
Lys Pro Ser Gln Ile Asn Thr Leu
Asn Asn Glu Leu Thr Leu Ile Val
610 615 620
Lys Ala Phe His Pro Asp Ser Asn
Ile Thr Leu Glu Val Leu Ser Thr
625 630 635 640
Glu Pro Thr Tyr Gln Phe Tyr Thr
Gly Asp Phe Leu Ser Ala Gly Tyr
645 650 655
Glu Ala Arg Gln Gly Phe Ala Ile
Glu Pro Gly Arg Tyr Ile Asp Ala
660 665 670
Ile Asn Gln Glu Asn Trp Lys Asp
Cys Val Thr Leu Lys Asn Gly Glu
675 680 685
Thr Tyr Gly Ser Lys Ile Val Tyr
Arg Phe Ser
690 695
<210> 23
<211> 1068
<212> DNA
<213> 人工序列
<220>
<223> 编码 hGalT 催化结构域 密码子优化的
(XB)
<400> 23
ggt aga gat ttg tct aga ttg cca
cag ttg gtt ggt gtt tcc act cca 48
ttg caa gga ggt tct aac tct gct
gct gct att ggt caa tct tcc ggt 96
gag ttg aga act ggt gga gct aga
cca cct cca cca ttg gga gct tcc 144
tct caa cca aga cca ggt ggt gat
tct tct cca gtt gtt gac tct ggt 192
cca ggt cca gct tct aac ttg act
tcc gtt cca gtt cca cac act act 240
gct ttg tcc ttg cca gct tgt cca
gaa gaa tcc cca ttg ttg gtt ggt 288
cca atg ttg atc gag ttc aac atg cca
gtt gac ttg gag ttg gtt gct 336
aag cag aac cca aac gtt aag atg
ggt ggt aga tac gct cca aga gac 384
tgt gtt tcc cca cac aaa gtt gct
atc atc atc cca ttc aga aac aga 432
cag gag cac ttg aag tac tgg ttg
tac tac ttg cac cca gtt ttg caa 480
aga cag cag ttg gac tac ggt atc
tac gtt atc aac cag gct ggt gac 528
act att ttc aac aga gct aag ttg
ttg aat gtt ggt ttc cag gag gct 576
ttg aag gat tac gac tac act tgt
ttc gtt ttc tcc gac gtt gac ttg 624
att cca atg aac gac cac aac gct
tac aga tgt ttc tcc cag cca aga 672
cac att tct gtt gct atg gac aag
ttc ggt ttc tcc ttg cca tac gtt 720
caa tac ttc ggt ggt gtt tcc gct
ttg tcc aag cag cag ttc ttg act 768
atc aac ggt ttc cca aac aat tac
tgg gga tgg ggt ggt gaa gat gac 816
gac atc ttt aac aga ttg gtt ttc
aga gga atg tcc atc tct aga cca 864
aac gct gtt gtt ggt aga tgt aga
atg atc aga cac tcc aga gac aag 912
aag aac gag cca aac cca caa aga
ttc gac aga atc gct cac act aag 960
gaa act atg ttg tcc gac gga ttg
aac tcc ttg act tac cag gtt ttg 1008
gac gtt cag aga tac cca ttg tac
act cag atc act gtt gac atc ggt 1056
act cca tcc tag
1068
<210> 24
<211> 355
<212> PRT
<213> 人工序列
<220>
<223> hGalT 催化结构域 (XB)
<400> 24
Gly Arg Asp Leu Ser Arg Leu Pro
Gln Leu Val Gly Val Ser Thr Pro
1
5 10 15
Leu Gln Gly Gly Ser Asn Ser Ala
Ala Ala Ile Gly Gln Ser Ser Gly
20
25 30
Glu Leu Arg Thr Gly Gly Ala Arg
Pro Pro Pro Pro Leu Gly Ala Ser
35 40 45
Ser Gln Pro Arg Pro Gly Gly Asp
Ser Ser Pro Val Val Asp Ser Gly
50
55 60
Pro Gly Pro Ala Ser Asn Leu Thr
Ser Val Pro Val Pro His Thr Thr
65 70 75 80
Ala Leu Ser Leu Pro Ala Cys Pro
Glu Glu Ser Pro Leu Leu Val Gly
85 90 95
Pro Met Leu Ile Glu Phe Asn Met
Pro Val Asp Leu Glu Leu Val Ala
100 105 110
Lys Gln Asn Pro Asn Val Lys Met
Gly Gly Arg Tyr Ala Pro Arg Asp
115 120 125
Cys Val Ser Pro His Lys Val Ala
Ile Ile Ile Pro Phe Arg Asn Arg
130 135 140
Gln Glu His Leu Lys Tyr Trp Leu
Tyr Tyr Leu His Pro Val Leu Gln
145 150 155 160
Arg Gln Gln Leu Asp Tyr Gly Ile
Tyr Val Ile Asn Gln Ala Gly Asp
165 170 175
Thr Ile Phe Asn Arg Ala Lys Leu
Leu Asn Val Gly Phe Gln Glu Ala
180 185 190
Leu Lys Asp Tyr Asp Tyr Thr Cys
Phe Val Phe Ser Asp Val Asp Leu
195 200 205
Ile Pro Met Asn Asp His Asn Ala
Tyr Arg Cys Phe Ser Gln Pro Arg
210 215 220
His Ile Ser Val Ala Met Asp Lys
Phe Gly Phe Ser Leu Pro Tyr Val
225 230 235 240
Gln Tyr Phe Gly Gly Val Ser Ala
Leu Ser Lys Gln Gln Phe Leu Thr
245 250 255
Ile Asn Gly Phe Pro Asn Asn Tyr
Trp Gly Trp Gly Gly Glu Asp Asp
260 265 270
Asp Ile Phe Asn Arg Leu Val Phe
Arg Gly Met Ser Ile Ser Arg Pro
275 280 285
Asn Ala Val Val Gly Arg Cys Arg
Met Ile Arg His Ser Arg Asp Lys
290 295 300
Lys Asn Glu Pro Asn Pro Gln Arg
Phe Asp Arg Ile Ala His Thr Lys
305 310 315 320
Glu Thr Met Leu Ser Asp Gly Leu
Asn Ser Leu Thr Tyr Gln Val Leu
325 330 335
Asp Val Gln Arg Tyr Pro Leu Tyr
Thr Gln Ile Thr Val Asp Ile Gly
340 345 350
Thr Pro Ser
355
<210> 25
<211> 1224
<212> DNA
<213> 人工序列
<220>
<223> 编码人 GnTI 催化结构域 (NA)
密码子优化的
<400> 25
tcagtcagtg ctcttgatgg tgacccagca
agtttgacca gagaagtgat tagattggcc 60
caagacgcag aggtggagtt ggagagacaa
cgtggactgc tgcagcaaat cggagatgca 120
ttgtctagtc aaagaggtag ggtgcctacc
gcagctcctc cagcacagcc tagagtgcat 180
gtgacccctg caccagctgt gattcctatc
ttggtcatcg cctgtgacag atctactgtt 240
agaagatgtc tggacaagct gttgcattac agaccatctg
ctgagttgtt ccctatcatc 300
gttagtcaag actgtggtca cgaggagact
gcccaagcca tcgcctccta cggatctgct 360
gtcactcaca tcagacagcc tgacctgtca
tctattgctg tgccaccaga ccacagaaag 420
ttccaaggtt actacaagat cgctagacac
tacagatggg cattgggtca agtcttcaga 480
cagtttagat tccctgctgc tgtggtggtg
gaggatgact tggaggtggc tcctgacttc 540
tttgagtact ttagagcaac ctatccattg
ctgaaggcag acccatccct gtggtgtgtc 600
tctgcctgga atgacaacgg taaggagcaa
atggtggacg cttctaggcc tgagctgttg 660
tacagaaccg acttctttcc tggtctggga
tggttgctgt tggctgagtt gtgggctgag 720
ttggagccta agtggccaaa ggcattctgg
gacgactgga tgagaagacc tgagcaaaga 780
cagggtagag cctgtatcag acctgagatc
tcaagaacca tgacctttgg tagaaaggga 840
gtgtctcacg gtcaattctt tgaccaacac
ttgaagttta tcaagctgaa ccagcaattt 900
gtgcacttca cccaactgga cctgtcttac
ttgcagagag aggcctatga cagagatttc 960
ctagctagag tctacggagc tcctcaactg
caagtggaga aagtgaggac caatgacaga 1020
aaggagttgg gagaggtgag agtgcagtac
actggtaggg actcctttaa ggctttcgct 1080
aaggctctgg gtgtcatgga tgaccttaag
tctggagttc ctagagctgg ttacagaggt 1140
attgtcacct ttcaattcag aggtagaaga
gtccacttgg ctcctccacc tacttgggag 1200
ggttatgatc cttcttggaa ttag 1224
<210> 26
<211> 407
<212> PRT
<213> 人工序列
<220>
<223> 人 GnTI 催化结构域 (NA)
<400> 26
Ser Val Ser Ala Leu Asp Gly Asp
Pro Ala Ser Leu Thr Arg Glu Val
1
5 10 15
Ile Arg Leu Ala Gln Asp Ala Glu
Val Glu Leu Glu Arg Gln Arg Gly
20 25 30
Leu Leu Gln Gln Ile Gly Asp Ala
Leu Ser Ser Gln Arg Gly Arg Val
35 40 45
Pro Thr Ala Ala Pro Pro Ala Gln
Pro Arg Val His Val Thr Pro Ala
50 55 60
Pro Ala Val Ile Pro Ile Leu Val
Ile Ala Cys Asp Arg Ser Thr Val
65 70 75 80
Arg Arg Cys Leu Asp Lys Leu Leu
His Tyr Arg Pro Ser Ala Glu Leu
85 90 95
Phe Pro Ile Ile Val Ser Gln Asp
Cys Gly His Glu Glu Thr Ala Gln
100 105 110
Ala Ile Ala Ser Tyr Gly Ser Ala
Val Thr His Ile Arg Gln Pro Asp
115 120 125
Leu Ser Ser Ile Ala Val Pro Pro
Asp His Arg Lys Phe Gln Gly Tyr
130 135 140
Tyr Lys Ile Ala Arg His Tyr Arg
Trp Ala Leu Gly Gln Val Phe Arg
145 150 155 160
Gln Phe Arg Phe Pro Ala Ala Val
Val Val Glu Asp Asp Leu Glu Val
165 170 175
Ala Pro Asp Phe Phe Glu Tyr Phe
Arg Ala Thr Tyr Pro Leu Leu Lys
180 185 190
Ala Asp Pro Ser Leu Trp Cys Val
Ser Ala Trp Asn Asp Asn Gly Lys
195 200 205
Glu Gln Met Val Asp Ala Ser Arg
Pro Glu Leu Leu Tyr Arg Thr Asp
210 215 220
Phe Phe Pro Gly Leu Gly Trp Leu
Leu Leu Ala Glu Leu Trp Ala Glu
225 230 235 240
Leu Glu Pro Lys Trp Pro Lys Ala
Phe Trp Asp Asp Trp Met Arg Arg
245 250 255
Pro Glu Gln Arg Gln Gly Arg Ala
Cys Ile Arg Pro Glu Ile Ser Arg
260 265 270
Thr Met Thr Phe Gly Arg Lys Gly
Val Ser His Gly Gln Phe Phe Asp
275 280 285
Gln His Leu Lys Phe Ile Lys Leu
Asn Gln Gln Phe Val His Phe Thr
290 295 300
Gln Leu Asp Leu Ser Tyr Leu Gln
Arg Glu Ala Tyr Asp Arg Asp Phe
305 310 315 320
Leu Ala Arg Val Tyr Gly Ala Pro
Gln Leu Gln Val Glu Lys Val Arg
325 330 335
Thr Asn Asp Arg Lys Glu Leu Gly
Glu Val Arg Val Gln Tyr Thr Gly
340 345 350
Arg Asp Ser Phe Lys Ala Phe Ala
Lys Ala Leu Gly Val Met Asp Asp
355 360 365
Leu Lys Ser Gly Val Pro Arg Ala
Gly Tyr Arg Gly Ile Val Thr Phe
370 375 380
Gln Phe Arg Gly Arg Arg Val His
Leu Ala Pro Pro Pro Thr Trp Glu
385 390 395 400
Gly Tyr Asp Pro Ser Trp Asn
405
<210> 27
<211> 1407
<212> DNA
<213> 人工序列
<220>
<223> 编码 Mm ManI 催化结构域 (FB)
<400> 27
gagcccgctg acgccaccat ccgtgagaag
agggcaaaga tcaaagagat gatgacccat 60
gcttggaata attataaacg ctatgcgtgg
ggcttgaacg aactgaaacc tatatcaaaa 120
gaaggccatt caagcagttt gtttggcaac
atcaaaggag ctacaatagt agatgccctg 180
gatacccttt tcattatggg catgaagact
gaatttcaag aagctaaatc gtggattaaa 240
aaatatttag attttaatgt gaatgctgaa
gtttctgttt ttgaagtcaa catacgcttc 300
gtcggtggac tgctgtcagc ctactatttg
tccggagagg agatatttcg aaagaaagca 360
gtggaacttg gggtaaaatt gctacctgca
tttcatactc cctctggaat accttgggca 420
ttgctgaata tgaaaagtgg gatcgggcgg
aactggccct gggcctctgg aggcagcagt 480
atcctggccg aatttggaac tctgcattta
gagtttatgc acttgtccca cttatcagga 540
gacccagtct ttgccgaaaa ggttatgaaa
attcgaacag tgttgaacaa actggacaaa 600
ccagaaggcc tttatcctaa ctatctgaac
cccagtagtg gacagtgggg tcaacatcat 660
gtgtcggttg gaggacttgg agacagcttt
tatgaatatt tgcttaaggc gtggttaatg 720
tctgacaaga cagatctcga agccaagaag
atgtattttg atgctgttca ggccatcgag 780
actcacttga tccgcaagtc aagtggggga
ctaacgtaca tcgcagagtg gaaggggggc 840
ctcctggaac acaagatggg ccacctgacg
tgctttgcag gaggcatgtt tgcacttggg 900
gcagatggag ctccggaagc ccgggcccaa
cactaccttg aactcggagc tgaaattgcc 960
cgcacttgtc atgaatctta taatcgtaca
tatgtgaagt tgggaccgga agcgtttcga 1020
tttgatggcg gtgtggaagc tattgccacg
aggcaaaatg aaaagtatta catcttacgg 1080
cccgaggtca tcgagacata catgtacatg
tggcgactga ctcacgaccc caagtacagg 1140
acctgggcct gggaagccgt ggaggctcta
gaaagtcact gcagagtgaa cggaggctac 1200
tcaggcttac gggatgttta cattgcccgt
gagagttatg acgatgtcca gcaaagtttc 1260
ttcctggcag agacactgaa gtatttgtac
ttgatatttt ccgatgatga ccttcttcca 1320
ctagaacact ggatcttcaa caccgaggct
catcctttcc ctatactccg tgaacagaag 1380
aaggaaattg atggcaaaga
gaaatga
1407
<210> 28
<211> 468
<212> PRT
<213> 人工序列
<220>
<223> Mm ManI 催化结构域 (FB)
<400> 28
Glu Pro Ala Asp Ala Thr Ile Arg
Glu Lys Arg Ala Lys Ile Lys Glu
1
5 10 15
Met Met Thr His Ala Trp Asn Asn
Tyr Lys Arg Tyr Ala Trp Gly Leu
20 25 30
Asn Glu Leu Lys Pro Ile Ser Lys
Glu Gly His Ser Ser Ser Leu Phe
35 40 45
Gly Asn Ile Lys Gly Ala Thr Ile
Val Asp Ala Leu Asp Thr Leu Phe
50 55 60
Ile Met Gly Met Lys Thr Glu Phe
Gln Glu Ala Lys Ser Trp Ile Lys
65 70 75 80
Lys Tyr Leu Asp Phe Asn Val Asn Ala
Glu Val Ser Val Phe Glu Val
85 90 95
Asn Ile Arg Phe Val Gly Gly Leu
Leu Ser Ala Tyr Tyr Leu Ser Gly
100 105 110
Glu Glu Ile Phe Arg Lys Lys Ala
Val Glu Leu Gly Val Lys Leu Leu
115 120 125
Pro Ala Phe His Thr Pro Ser Gly
Ile Pro Trp Ala Leu Leu Asn Met
130 135 140
Lys Ser Gly Ile Gly Arg Asn Trp
Pro Trp Ala Ser Gly Gly Ser Ser
145 150 155 160
Ile Leu Ala Glu Phe Gly Thr Leu
His Leu Glu Phe Met His Leu Ser
165 170 175
His Leu Ser Gly Asp Pro Val Phe
Ala Glu Lys Val Met Lys Ile Arg
180 185 190
Thr Val Leu Asn Lys Leu Asp Lys
Pro Glu Gly Leu Tyr Pro Asn Tyr
195 200 205
Leu Asn Pro Ser Ser Gly Gln Trp
Gly Gln His His Val Ser Val Gly
210 215 220
Gly Leu Gly Asp Ser Phe Tyr Glu
Tyr Leu Leu Lys Ala Trp Leu Met
225 230 235 240
Ser Asp Lys Thr Asp Leu Glu Ala
Lys Lys Met Tyr Phe Asp Ala Val
245 250 255
Gln Ala Ile Glu Thr His Leu Ile
Arg Lys Ser Ser Gly Gly Leu Thr
260 265 270
Tyr Ile Ala Glu Trp Lys Gly Gly
Leu Leu Glu His Lys Met Gly His
275 280 285
Leu Thr Cys Phe Ala Gly Gly Met
Phe Ala Leu Gly Ala Asp Gly Ala
290 295 300
Pro Glu Ala Arg Ala Gln His Tyr
Leu Glu Leu Gly Ala Glu Ile Ala
305 310 315 320
Arg Thr Cys His Glu Ser Tyr Asn
Arg Thr Tyr Val Lys Leu Gly Pro
325 330 335
Glu Ala Phe Arg Phe Asp Gly Gly
Val Glu Ala Ile Ala Thr Arg Gln
340 345 350
Asn Glu Lys Tyr Tyr Ile Leu Arg
Pro Glu Val Ile Glu Thr Tyr Met
355 360 365
Tyr Met Trp Arg Leu Thr His Asp
Pro Lys Tyr Arg Thr Trp Ala Trp
370 375 380
Glu Ala Val Glu Ala Leu Glu Ser
His Cys Arg Val Asn Gly Gly Tyr
385 390 395 400
Ser Gly Leu Arg Asp Val Tyr Ile
Ala Arg Glu Ser Tyr Asp Asp Val
405 410 415
Gln Gln Ser Phe Phe Leu Ala Glu
Thr Leu Lys Tyr Leu Tyr Leu Ile
420 425 430
Phe Ser Asp Asp Asp Leu Leu Pro
Leu Glu His Trp Ile Phe Asn Thr
435 440 445
Glu Ala His Pro Phe Pro Ile Leu
Arg Glu Gln Lys Lys Glu Ile Asp
450 455 460
Gly Lys Glu Lys
465
<210> 29
<211> 1494
<212> DNA
<213> 人工序列
<220>
<223> 编码 Tr ManI 催化结构域
<400> 29
cgcgccggat ctcccaaccc tacgagggcg
gcagcagtca aggccgcatt ccagacgtcg 60
tggaacgctt accaccattt tgcctttccc
catgacgacc tccacccggt cagcaacagc 120
tttgatgatg agagaaacgg ctggggctcg
tcggcaatcg atggcttgga cacggctatc 180
ctcatggggg atgccgacat tgtgaacacg
atccttcagt atgtaccgca gatcaacttc 240
accacgactg cggttgccaa ccaaggcatc
tccgtgttcg agaccaacat tcggtacctc 300
ggtggcctgc tttctgccta tgacctgttg
cgaggtcctt tcagctcctt ggcgacaaac 360
cagaccctgg taaacagcct tctgaggcag
gctcaaacac tggccaacgg cctcaaggtt 420
gcgttcacca ctcccagcgg tgtcccggac
cctaccgtct tcttcaaccc tactgtccgg 480
agaagtggtg catctagcaa caacgtcgct
gaaattggaa gcctggtgct cgagtggaca 540
cggttgagcg acctgacggg aaacccgcag
tatgcccagc ttgcgcagaa gggcgagtcg 600
tatctcctga atccaaaggg aagcccggag
gcatggcctg gcctgattgg aacgtttgtc 660
agcacgagca acggtacctt tcaggatagc
agcggcagct ggtccggcct catggacagc 720
ttctacgagt acctgatcaa gatgtacctg
tacgacccgg ttgcgtttgc acactacaag 780
gatcgctggg tccttgctgc cgactcgacc
attgcgcatc tcgcctctca cccgtcgacg 840
cgcaaggact tgaccttttt gtcttcgtac
aacggacagt ctacgtcgcc aaactcagga 900
catttggcca gttttgccgg tggcaacttc
atcttgggag gcattctcct gaacgagcaa 960
aagtacattg actttggaat caagcttgcc
agctcgtact ttgccacgta caaccagacg 1020
gcttctggaa tcggccccga aggcttcgcg
tgggtggaca gcgtgacggg cgccggcggc 1080
tcgccgccct cgtcccagtc cgggttctac
tcgtcggcag gattctgggt gacggcaccg 1140
tattacatcc tgcggccgga gacgctggag
agcttgtact acgcataccg cgtcacgggc 1200
gactccaagt ggcaggacct ggcgtgggaa
gcgttcagtg ccattgagga cgcatgccgc 1260
gccggcagcg cgtactcgtc catcaacgac
gtgacgcagg ccaacggcgg gggtgcctct 1320
gacgatatgg agagcttctg gtttgccgag
gcgctcaagt atgcgtacct gatctttgcg 1380
gaggagtcgg atgtgcaggt gcaggccaac
ggcgggaaca aatttgtctt taacacggag 1440
gcgcacccct ttagcatccg ttcatcatca
cgacggggcg gccaccttgc ttaa 1494
<210> 30
<211> 497
<212> PRT
<213> 人工序列
<220>
<223> Tr ManI 催化结构域
<400> 30
Arg Ala Gly Ser Pro Asn Pro Thr
Arg Ala Ala Ala Val Lys Ala Ala
1
5 10 15
Phe Gln Thr Ser Trp Asn Ala Tyr
His His Phe Ala Phe Pro His Asp
20 25 30
Asp Leu His Pro Val Ser Asn Ser
Phe Asp Asp Glu Arg Asn Gly Trp
35 40 45
Gly Ser Ser Ala Ile Asp Gly Leu
Asp Thr Ala Ile Leu Met Gly Asp
50 55 60
Ala Asp Ile Val Asn Thr Ile Leu
Gln Tyr Val Pro Gln Ile Asn Phe
65 70 75 80
Thr Thr Thr Ala Val Ala Asn Gln
Gly Ile Ser Val Phe Glu Thr Asn
85 90 95
Ile Arg Tyr Leu Gly Gly Leu Leu
Ser Ala Tyr Asp Leu Leu Arg Gly
100 105 110
Pro Phe Ser Ser Leu Ala Thr Asn
Gln Thr Leu Val Asn Ser Leu Leu
115 120 125
Arg Gln Ala Gln Thr Leu Ala Asn
Gly Leu Lys Val Ala Phe Thr Thr
130
135 140
Pro Ser Gly Val Pro Asp Pro Thr
Val Phe Phe Asn Pro Thr Val Arg
145 150 155 160
Arg Ser Gly Ala Ser Ser Asn Asn
Val Ala Glu Ile Gly Ser Leu Val
165 170 175
Leu Glu Trp Thr Arg Leu Ser Asp
Leu Thr Gly Asn Pro Gln Tyr Ala
180 185 190
Gln Leu Ala Gln Lys Gly Glu Ser
Tyr Leu Leu Asn Pro Lys Gly Ser
195
200 205
Pro Glu Ala Trp Pro Gly Leu Ile
Gly Thr Phe Val Ser Thr Ser Asn
210 215 220
Gly Thr Phe Gln Asp Ser Ser Gly
Ser Trp Ser Gly Leu Met Asp Ser
225 230 235 240
Phe Tyr Glu Tyr Leu Ile Lys Met
Tyr Leu Tyr Asp Pro Val Ala Phe
245 250 255
Ala His Tyr Lys Asp Arg Trp Val
Leu Ala Ala Asp Ser Thr Ile Ala
260 265 270
His Leu Ala Ser His Pro Ser Thr
Arg Lys Asp Leu Thr Phe Leu Ser
275 280 285
Ser Tyr Asn Gly Gln Ser Thr Ser
Pro Asn Ser Gly His Leu Ala Ser
290 295 300
Phe Ala Gly Gly Asn Phe Ile Leu
Gly Gly Ile Leu Leu Asn Glu Gln
305 310 315 320
Lys Tyr Ile Asp Phe Gly Ile Lys
Leu Ala Ser Ser Tyr Phe Ala Thr
325 330 335
Tyr Asn Gln Thr Ala Ser Gly Ile
Gly Pro Glu Gly Phe Ala Trp Val
340 345 350
Asp Ser Val Thr Gly Ala Gly Gly
Ser Pro Pro Ser Ser Gln Ser Gly
355 360 365
Phe Tyr Ser Ser Ala Gly Phe Trp
Val Thr Ala Pro Tyr Tyr Ile Leu
370 375 380
Arg Pro Glu Thr Leu Glu Ser Leu
Tyr Tyr Ala Tyr Arg Val Thr Gly
385 390 395 400
Asp Ser Lys Trp Gln Asp Leu Ala
Trp Glu Ala Phe Ser Ala Ile Glu
405 410 415
Asp Ala Cys Arg Ala Gly Ser Ala
Tyr Ser Ser Ile Asn Asp Val Thr
420 425 430
Gln Ala Asn Gly Gly Gly Ala Ser
Asp Asp Met Glu Ser Phe Trp Phe
435 440 445
Ala Glu Ala Leu Lys Tyr Ala Tyr
Leu Ile Phe Ala Glu Glu Ser Asp
450 455 460
Val Gln Val Gln Ala Asn Gly Gly
Asn Lys Phe Val Phe Asn Thr Glu
465 470 475 480
Ala His Pro Phe Ser Ile Arg Ser
Ser Ser Arg Arg Gly Gly His Leu
485 490 495
Ala
<210> 31
<211> 1068
<212> DNA
<213> 人工序列
<220>
<223> 编码大鼠 GnT II (TC) 密码子优化的
<400> 31
tccttggttt accaattgaa cttcgaccag
atgttgagaa acgttgacaa ggacggtact 60
tggtctcctg gtgagttggt tttggttgtt
caggttcaca acagaccaga gtacttgaga 120
ttgttgatcg actccttgag aaaggctcaa
ggtatcagag aggttttggt tatcttctcc 180
cacgatttct ggtctgctga gatcaactcc
ttgatctcct ccgttgactt ctgtccagtt 240
ttgcaggttt tcttcccatt ctccatccaa
ttgtacccat ctgagttccc aggttctgat 300
ccaagagact gtccaagaga cttgaagaag
aacgctgctt tgaagttggg ttgtatcaac 360
gctgaatacc cagattcttt cggtcactac agagaggcta
agttctccca aactaagcat 420
cattggtggt ggaagttgca ctttgtttgg
gagagagtta aggttttgca ggactacact 480
ggattgatct tgttcttgga ggaggatcat
tacttggctc cagacttcta ccacgttttc 540
aagaagatgt ggaagttgaa gcaacaagag
tgtccaggtt gtgacgtttt gtccttggga 600
acttacacta ctatcagatc cttctacggt
atcgctgaca aggttgacgt taagacttgg 660
aagtccactg aacacaacat gggattggct
ttgactagag atgcttacca gaagttgatc 720
gagtgtactg acactttctg tacttacgac
gactacaact gggactggac tttgcagtac 780
ttgactttgg cttgtttgcc aaaagtttgg
aaggttttgg ttccacaggc tccaagaatt 840
ttccacgctg gtgactgtgg aatgcaccac
aagaaaactt gtagaccatc cactcagtcc 900
gctcaaattg agtccttgtt gaacaacaac
aagcagtact tgttcccaga gactttggtt 960
atcggagaga agtttccaat ggctgctatt
tccccaccaa gaaagaatgg tggatggggt 1020
gatattagag accacgagtt gtgtaaatcc
tacagaagat tgcagtag 1068
<210> 32
<211> 355
<212> PRT
<213> 人工序列
<220>
<223> 大鼠 GnT II (TC) 密码子优化的
<400> 32
Ser Leu Val Tyr Gln Leu Asn Phe
Asp Gln Met Leu Arg Asn Val Asp
1
5 10 15
Lys Asp Gly Thr Trp Ser Pro Gly
Glu Leu Val Leu Val Val Gln Val
20 25 30
His Asn Arg Pro Glu Tyr Leu Arg
Leu Leu Ile Asp Ser Leu Arg Lys
35 40 45
Ala Gln Gly Ile Arg Glu Val Leu
Val Ile Phe Ser His Asp Phe Trp
50 55 60
Ser Ala Glu Ile Asn Ser Leu Ile
Ser Ser Val Asp Phe Cys Pro Val
65 70 75 80
Leu Gln Val Phe Phe Pro Phe Ser
Ile Gln Leu Tyr Pro Ser Glu Phe
85 90 95
Pro Gly Ser Asp Pro Arg Asp Cys
Pro Arg Asp Leu Lys Lys Asn Ala
100 105 110
Ala Leu Lys Leu Gly Cys Ile Asn
Ala Glu Tyr Pro Asp Ser Phe Gly
115 120 125
His Tyr Arg Glu Ala Lys Phe Ser
Gln Thr Lys His His Trp Trp Trp
130 135 140
Lys Leu His Phe Val Trp Glu Arg
Val Lys Val Leu Gln Asp Tyr Thr
145 150 155 160
Gly Leu Ile Leu Phe Leu Glu Glu
Asp His Tyr Leu Ala Pro Asp Phe
165 170 175
Tyr His Val Phe Lys Lys Met Trp
Lys Leu Lys Gln Gln Glu Cys Pro
180 185 190
Gly Cys Asp Val Leu Ser Leu Gly
Thr Tyr Thr Thr Ile Arg Ser Phe
195 200 205
Tyr Gly Ile Ala Asp Lys Val Asp
Val Lys Thr Trp Lys Ser Thr Glu
210 215 220
His Asn Met Gly Leu Ala Leu Thr
Arg Asp Ala Tyr Gln Lys Leu Ile
225 230 235 240
Glu Cys Thr Asp Thr Phe Cys Thr
Tyr Asp Asp Tyr Asn Trp Asp Trp
245 250 255
Thr Leu Gln Tyr Leu Thr Leu Ala
Cys Leu Pro Lys Val Trp Lys Val
260 265 270
Leu Val Pro Gln Ala Pro Arg Ile
Phe His Ala Gly Asp Cys Gly Met
275 280 285
His His Lys Lys Thr Cys Arg Pro
Ser Thr Gln Ser Ala Gln Ile Glu
290 295 300
Ser Leu Leu Asn Asn Asn Lys Gln
Tyr Leu Phe Pro Glu Thr Leu Val
305 310 315 320
Ile Gly Glu Lys Phe Pro Met Ala
Ala Ile Ser Pro Pro Arg Lys Asn
325 330 335
Gly Gly Trp Gly Asp Ile Arg Asp
His Glu Leu Cys Lys Ser Tyr Arg
340 345 350
Arg Leu Gln
355
<210> 33
<211> 3105
<212> DNA
<213> 人工序列
<220>
<223> 编码黑腹果蝇 ManII
密码子优化的 (KD)
<400> 33
agagacgatc caattagacc tccattgaag
gttgctagat ccccaagacc aggtcaatgt 60
caagatgttg ttcaggacgt cccaaacgtt
gatgtccaga tgttggagtt gtacgataga 120
atgtccttca aggacattga tggtggtgtt
tggaagcagg gttggaacat taagtacgat 180
ccattgaagt acaacgctca tcacaagttg
aaggtcttcg ttgtcccaca ctcccacaac 240
gatcctggtt ggattcagac cttcgaggaa
tactaccagc acgacaccaa gcacatcttg 300
tccaacgctt tgagacattt gcacgacaac
ccagagatga agttcatctg ggctgaaatc 360
tcctacttcg ctagattcta ccacgatttg
ggtgagaaca agaagttgca gatgaagtcc 420
atcgtcaaga acggtcagtt ggaattcgtc
actggtggat gggtcatgcc agacgaggct 480
aactcccact ggagaaacgt tttgttgcag
ttgaccgaag gtcaaacttg gttgaagcaa 540
ttcatgaacg tcactccaac tgcttcctgg
gctatcgatc cattcggaca ctctccaact 600
atgccataca ttttgcagaa gtctggtttc
aagaatatgt tgatccagag aacccactac 660
tccgttaaga aggagttggc tcaacagaga
cagttggagt tcttgtggag acagatctgg 720
gacaacaaag gtgacactgc tttgttcacc
cacatgatgc cattctactc ttacgacatt 780
cctcatacct gtggtccaga tccaaaggtt
tgttgtcagt tcgatttcaa aagaatgggt 840
tccttcggtt tgtcttgtcc atggaaggtt
ccacctagaa ctatctctga tcaaaatgtt 900
gctgctagat ccgatttgtt ggttgatcag
tggaagaaga aggctgagtt gtacagaacc 960
aacgtcttgt tgattccatt gggtgacgac
ttcagattca agcagaacac cgagtgggat 1020
gttcagagag tcaactacga aagattgttc
gaacacatca actctcaggc tcacttcaat 1080
gtccaggctc agttcggtac tttgcaggaa
tacttcgatg ctgttcacca ggctgaaaga 1140
gctggacaag ctgagttccc aaccttgtct
ggtgacttct tcacttacgc tgatagatct 1200
gataactact ggtctggtta ctacacttcc
agaccatacc ataagagaat ggacagagtc 1260
ttgatgcact acgttagagc tgctgaaatg
ttgtccgctt ggcactcctg ggacggtatg 1320
gctagaatcg aggaaagatt ggagcaggct
agaagagagt tgtccttgtt ccagcaccac 1380
gacggtatta ctggtactgc taaaactcac
gttgtcgtcg actacgagca aagaatgcag 1440
gaagctttga aagcttgtca aatggtcatg
caacagtctg tctacagatt gttgactaag 1500
ccatccatct actctccaga cttctccttc
tcctacttca ctttggacga ctccagatgg 1560
ccaggttctg gtgttgagga ctctagaact
accatcatct tgggtgagga tatcttgcca 1620
tccaagcatg ttgtcatgca caacaccttg
ccacactgga gagagcagtt ggttgacttc 1680
tacgtctcct ctccattcgt ttctgttacc
gacttggcta acaatccagt tgaggctcag 1740
gtttctccag tttggtcttg gcaccacgac
actttgacta agactatcca cccacaaggt 1800
tccaccacca agtacagaat catcttcaag
gctagagttc caccaatggg tttggctacc 1860
tacgttttga ccatctccga ttccaagcca
gagcacacct cctacgcttc caatttgttg 1920
cttagaaaga acccaacttc cttgccattg
ggtcaatacc cagaggatgt caagttcggt 1980
gatccaagag agatctcctt gagagttggt
aacggtccaa ccttggcttt ctctgagcag 2040
ggtttgttga agtccattca gttgactcag
gattctccac atgttccagt tcacttcaag 2100
ttcttgaagt acggtgttag atctcatggt
gatagatctg gtgcttactt gttcttgcca 2160
aatggtccag cttctccagt cgagttgggt
cagccagttg tcttggtcac taagggtaaa 2220
ttggagtctt ccgtttctgt tggtttgcca
tctgtcgttc accagaccat catgagaggt 2280
ggtgctccag agattagaaa tttggtcgat
attggttctt tggacaacac tgagatcgtc 2340
atgagattgg agactcatat cgactctggt gatatcttct
acactgattt gaatggattg 2400
caattcatca agaggagaag attggacaag
ttgccattgc aggctaacta ctacccaatt 2460
ccatctggta tgttcattga ggatgctaat
accagattga ctttgttgac cggtcaacca 2520
ttgggtggat cttctttggc ttctggtgag
ttggagatta tgcaagatag aagattggct 2580
tctgatgatg aaagaggttt gggtcagggt
gttttggaca acaagccagt tttgcatatt 2640
tacagattgg tcttggagaa ggttaacaac
tgtgtcagac catctaagtt gcatccagct 2700
ggttacttga cttctgctgc tcacaaagct
tctcagtctt tgttggatcc attggacaag 2760
ttcatcttcg ctgaaaatga gtggatcggt
gctcagggtc aattcggtgg tgatcatcca 2820
tctgctagag aggatttgga tgtctctgtc
atgagaagat tgaccaagtc ttctgctaaa 2880
acccagagag ttggttacgt tttgcacaga
accaatttga tgcaatgtgg tactccagag 2940
gagcatactc agaagttgga tgtctgtcac
ttgttgccaa atgttgctag atgtgagaga 3000
actaccttga ctttcttgca gaatttggag
cacttggatg gtatggttgc tccagaagtt 3060
tgtccaatgg aaaccgctgc ttacgtctct
tctcactctt cttga 3105
<210> 34
<211> 1034
<212> PRT
<213> 人工序列
<220>
<223> 黑腹果蝇 ManII 密码子优化的 (KD)
<400> 34
Arg Asp Asp Pro Ile Arg Pro Pro
Leu Lys Val Ala Arg Ser Pro Arg
1
5 10 15
Pro Gly Gln Cys Gln Asp Val Val
Gln Asp Val Pro Asn Val Asp Val
20 25 30
Gln Met Leu Glu Leu Tyr Asp Arg
Met Ser Phe Lys Asp Ile Asp Gly
35 40 45
Gly Val Trp Lys Gln Gly Trp Asn
Ile Lys Tyr Asp Pro Leu Lys Tyr
50 55 60
Asn Ala His His Lys Leu Lys Val
Phe Val Val Pro His Ser His Asn
65 70 75 80
Asp Pro Gly Trp Ile Gln Thr Phe
Glu Glu Tyr Tyr Gln His Asp Thr
85 90 95
Lys His Ile Leu Ser Asn Ala Leu
Arg His Leu His Asp Asn Pro Glu
100 105 110
Met Lys Phe Ile Trp Ala Glu Ile
Ser Tyr Phe Ala Arg Phe Tyr His
115 120 125
Asp Leu Gly Glu Asn Lys Lys Leu
Gln Met Lys Ser Ile Val Lys Asn
130 135 140
Gly Gln Leu Glu Phe Val Thr Gly
Gly Trp Val Met Pro Asp Glu Ala
145 150 155 160
Asn Ser His Trp Arg Asn Val Leu
Leu Gln Leu Thr Glu Gly Gln Thr
165 170 175
Trp Leu Lys Gln Phe Met Asn Val
Thr Pro Thr Ala Ser Trp Ala Ile
180 185 190
Asp Pro Phe Gly His Ser Pro Thr
Met Pro Tyr Ile Leu Gln Lys Ser
195 200 205
Gly Phe Lys Asn Met Leu Ile Gln
Arg Thr His Tyr Ser Val Lys Lys
210 215 220
Glu Leu Ala Gln Gln Arg Gln Leu
Glu Phe Leu Trp Arg Gln Ile Trp
225 230 235 240
Asp Asn Lys Gly Asp Thr Ala Leu
Phe Thr His Met Met Pro Phe Tyr
245 250 255
Ser Tyr Asp Ile Pro His Thr Cys
Gly Pro Asp Pro Lys Val Cys Cys
260 265 270
Gln Phe Asp Phe Lys Arg Met Gly
Ser Phe Gly Leu Ser Cys Pro Trp
275 280 285
Lys Val Pro Pro Arg Thr Ile Ser
Asp Gln Asn Val Ala Ala Arg Ser
290 295 300
Asp Leu Leu Val Asp Gln Trp Lys
Lys Lys Ala Glu Leu Tyr Arg Thr
305 310 315 320
Asn Val Leu Leu Ile Pro Leu Gly
Asp Asp Phe Arg Phe Lys Gln Asn
325 330 335
Thr Glu Trp Asp Val Gln Arg Val
Asn Tyr Glu Arg Leu Phe Glu His
340 345 350
Ile Asn Ser Gln Ala His Phe Asn
Val Gln Ala Gln Phe Gly Thr Leu
355 360 365
Gln Glu Tyr Phe Asp Ala Val His
Gln Ala Glu Arg Ala Gly Gln Ala
370 375 380
Glu Phe Pro Thr Leu Ser Gly Asp
Phe Phe Thr Tyr Ala Asp Arg Ser
385 390 395 400
Asp Asn Tyr Trp Ser Gly Tyr Tyr
Thr Ser Arg Pro Tyr His Lys Arg
405 410 415
Met Asp Arg Val Leu Met His Tyr
Val Arg Ala Ala Glu Met Leu Ser
420 425 430
Ala Trp His Ser Trp Asp Gly Met
Ala Arg Ile Glu Glu Arg Leu Glu
435 440 445
Gln Ala Arg Arg Glu Leu Ser Leu
Phe Gln His His Asp Gly Ile Thr
450 455 460
Gly Thr Ala Lys Thr His Val Val
Val Asp Tyr Glu Gln Arg Met Gln
465 470 475 480
Glu Ala Leu Lys Ala Cys Gln Met
Val Met Gln Gln Ser Val Tyr Arg
485 490 495
Leu Leu Thr Lys Pro Ser Ile Tyr
Ser Pro Asp Phe Ser Phe Ser Tyr
500 505 510
Phe Thr Leu Asp Asp Ser Arg Trp
Pro Gly Ser Gly Val Glu Asp Ser
515 520 525
Arg Thr Thr Ile Ile Leu Gly Glu
Asp Ile Leu Pro Ser Lys His Val
530 535 540
Val Met His Asn Thr Leu Pro His
Trp Arg Glu Gln Leu Val Asp Phe
545 550 555 560
Tyr Val Ser Ser Pro Phe Val Ser
Val Thr Asp Leu Ala Asn Asn Pro
565 570 575
Val Glu Ala Gln Val Ser Pro Val
Trp Ser Trp His His Asp Thr Leu
580 585 590
Thr Lys Thr Ile His Pro Gln Gly Ser
Thr Thr Lys Tyr Arg Ile Ile
595 600 605
Phe Lys Ala Arg Val Pro Pro Met
Gly Leu Ala Thr Tyr Val Leu Thr
610 615 620
Ile Ser Asp Ser Lys Pro Glu His
Thr Ser Tyr Ala Ser Asn Leu Leu
625 630 635 640
Leu Arg Lys Asn Pro Thr Ser Leu
Pro Leu Gly Gln Tyr Pro Glu Asp
645 650 655
Val Lys Phe Gly Asp Pro Arg Glu
Ile Ser Leu Arg Val Gly Asn Gly
660 665 670
Pro Thr Leu Ala Phe Ser Glu Gln
Gly Leu Leu Lys Ser Ile Gln Leu
675 680 685
Thr Gln Asp Ser Pro His Val Pro
Val His Phe Lys Phe Leu Lys Tyr
690 695 700
Gly Val Arg Ser His Gly Asp Arg
Ser Gly Ala Tyr Leu Phe Leu Pro
705 710 715 720
Asn Gly Pro Ala Ser Pro Val Glu
Leu Gly Gln Pro Val Val Leu Val
725 730 735
Thr Lys Gly Lys Leu Glu Ser Ser
Val Ser Val Gly Leu Pro Ser Val
740 745 750
Val His Gln Thr Ile Met Arg Gly
Gly Ala Pro Glu Ile Arg Asn Leu
755 760 765
Val Asp Ile Gly Ser Leu Asp Asn
Thr Glu Ile Val Met Arg Leu Glu
770 775 780
Thr His Ile Asp Ser Gly Asp Ile
Phe Tyr Thr Asp Leu Asn Gly Leu
785 790 795 800
Gln Phe Ile Lys Arg Arg Arg Leu
Asp Lys Leu Pro Leu Gln Ala Asn
805 810 815
Tyr Tyr Pro Ile Pro Ser Gly Met
Phe Ile Glu Asp Ala Asn Thr Arg
820 825 830
Leu Thr Leu Leu Thr Gly Gln Pro
Leu Gly Gly Ser Ser Leu Ala Ser
835 840 845
Gly Glu Leu Glu Ile Met Gln Asp
Arg Arg Leu Ala Ser Asp Asp Glu
850 855 860
Arg Gly Leu Gly Gln Gly Val Leu
Asp Asn Lys Pro Val Leu His Ile
865 870 875 880
Tyr Arg Leu Val Leu Glu Lys Val
Asn Asn Cys Val Arg Pro Ser Lys
885 890 895
Leu His Pro Ala Gly Tyr Leu Thr
Ser Ala Ala His Lys Ala Ser Gln
900 905 910
Ser Leu Leu Asp Pro Leu Asp Lys
Phe Ile Phe Ala Glu Asn Glu Trp
915 920 925
Ile Gly Ala Gln Gly Gln Phe Gly
Gly Asp His Pro Ser Ala Arg Glu
930 935 940
Asp Leu Asp Val Ser Val Met Arg
Arg Leu Thr Lys Ser Ser Ala Lys
945 950 955 960
Thr Gln Arg Val Gly Tyr Val Leu
His Arg Thr Asn Leu Met Gln Cys
965 970 975
Gly Thr Pro Glu Glu His Thr Gln
Lys Leu Asp Val Cys His Leu Leu
980 985 990
Pro Asn Val Ala Arg Cys Glu Arg
Thr Thr Leu Thr Phe Leu Gln Asn
995 1000 1005
Leu Glu His Leu Asp Gly Met Val
Ala Pro Glu Val Cys Pro Met Glu
1010 1015 1020
Thr Ala Ala Tyr Val Ser Ser His
Ser Ser
1025 1030
<210> 35
<211> 1014
<212> DNA
<213> 人工序列
<220>
<223> 编码小鼠 CMP-唾液酸转运蛋白 (MmCST)
密码子优化的
<400> 35
atggctccag ctagagaaaa cgtttccttg
ttcttcaagt tgtactgttt ggctgttatg 60
actttggttg ctgctgctta cactgttgct
ttgagataca ctagaactac tgctgaggag 120
ttgtacttct ccactactgc tgtttgtatc
actgaggtta tcaagttgtt gatctccgtt 180
ggtttgttgg ctaaggagac tggttctttg
ggaagattca aggcttcctt gtccgaaaac 240
gttttgggtt ccccaaagga gttggctaag
ttgtctgttc catccttggt ttacgctgtt 300
cagaacaaca tggctttctt ggctttgtct
aacttggacg ctgctgttta ccaagttact 360
taccagttga agatcccatg tactgctttg
tgtactgttt tgatgttgaa cagaacattg 420
tccaagttgc agtggatctc cgttttcatg
ttgtgtggtg gtgttacttt ggttcagtgg 480
aagccagctc aagcttccaa agttgttgtt
gctcagaacc cattgttggg tttcggtgct 540
attgctatcg ctgttttgtg ttccggtttc
gctggtgttt acttcgagaa ggttttgaag 600
tcctccgaca cttctttgtg ggttagaaac
atccagatgt acttgtccgg tatcgttgtt 660
actttggctg gtacttactt gtctgacggt
gctgagattc aagagaaggg attcttctac 720
ggttacactt actatgtttg gttcgttatc
ttcttggctt ccgttggtgg tttgtacact 780
tccgttgttg ttaagtacac tgacaacatc
atgaagggat tctctgctgc tgctgctatt 840
gttttgtcca ctatcgcttc cgttttgttg
ttcggattgc agatcacatt gtcctttgct 900
ttgggagctt tgttggtttg tgtttccatc
tacttgtacg gattgccaag acaagacact 960
acttccattc agcaagaggc tacttccaag
gagagaatca tcggtgttta gtag 1014
<210> 36
<211> 336
<212> PRT
<213> 人工序列
<220>
<223> 小鼠 CMP-唾液酸转运蛋白 (MmCST)
密码子优化的
<400> 36
Met Ala Pro Ala Arg Glu Asn Val
Ser Leu Phe Phe Lys Leu Tyr Cys
1
5 10 15
Leu Ala Val Met Thr Leu Val Ala
Ala Ala Tyr Thr Val Ala Leu Arg
20 25 30
Tyr Thr Arg Thr Thr Ala Glu Glu
Leu Tyr Phe Ser Thr Thr Ala Val
35 40 45
Cys Ile Thr Glu Val Ile Lys Leu
Leu Ile Ser Val Gly Leu Leu Ala
50 55 60
Lys Glu Thr Gly Ser Leu Gly Arg
Phe Lys Ala Ser Leu Ser Glu Asn
65 70 75 80
Val Leu Gly Ser Pro Lys Glu Leu
Ala Lys Leu Ser Val Pro Ser Leu
85 90 95
Val Tyr Ala Val Gln Asn Asn Met
Ala Phe Leu Ala Leu Ser Asn Leu
100 105 110
Asp Ala Ala Val Tyr Gln Val Thr
Tyr Gln Leu Lys Ile Pro Cys Thr
115 120 125
Ala Leu Cys Thr Val Leu Met Leu
Asn Arg Thr Leu Ser Lys Leu Gln
130 135 140
Trp Ile Ser Val Phe Met Leu Cys
Gly Gly Val Thr Leu Val Gln Trp
145 150 155 160
Lys Pro Ala Gln Ala Ser Lys Val
Val Val Ala Gln Asn Pro Leu Leu
165 170 175
Gly Phe Gly Ala Ile Ala Ile Ala
Val Leu Cys Ser Gly Phe Ala Gly
180 185 190
Val Tyr Phe Glu Lys Val Leu Lys
Ser Ser Asp Thr Ser Leu Trp Val
195 200 205
Arg Asn Ile Gln Met Tyr Leu Ser
Gly Ile Val Val Thr Leu Ala Gly
210 215 220
Thr Tyr Leu Ser Asp Gly Ala Glu
Ile Gln Glu Lys Gly Phe Phe Tyr
225 230 235 240
Gly Tyr Thr Tyr Tyr Val Trp Phe
Val Ile Phe Leu Ala Ser Val Gly
245 250 255
Gly Leu Tyr Thr Ser Val Val Val
Lys Tyr Thr Asp Asn Ile Met Lys
260 265 270
Gly Phe Ser Ala Ala Ala Ala Ile
Val Leu Ser Thr Ile Ala Ser Val
275 280 285
Leu Leu Phe Gly Leu Gln Ile Thr
Leu Ser Phe Ala Leu Gly Ala Leu
290 295 300
Leu Val Cys Val Ser Ile Tyr Leu
Tyr Gly Leu Pro Arg Gln Asp Thr
305 310 315 320
Thr Ser Ile Gln Gln Glu Ala Thr
Ser Lys Glu Arg Ile Ile Gly Val
325 330 335
<210> 37
<211> 2172
<212> DNA
<213> 人工序列
<220>
<223> 编码人 UDP-GlcNAc
2-差向异构酶/N-乙酰甘露糖胺激酶 (HsGNE)
密码子优化的
<400> 37
atggaaaaga acggtaacaa cagaaagttg
agagtttgtg ttgctacttg taacagagct 60
gactactcca agttggctcc aatcatgttc
ggtatcaaga ctgagccaga gttcttcgag 120
ttggacgttg ttgttttggg ttcccacttg
attgatgact acggtaacac ttacagaatg 180
atcgagcagg acgacttcga catcaacact
agattgcaca ctattgttag aggagaggac 240
gaagctgcta tggttgaatc tgttggattg
gctttggtta agttgccaga cgttttgaac 300
agattgaagc cagacatcat gattgttcac
ggtgacagat tcgatgcttt ggctttggct 360
acttccgctg ctttgatgaa cattagaatc
ttgcacatcg agggtggtga agtttctggt 420
actatcgacg actccatcag acacgctatc
actaagttgg ctcactacca tgtttgttgt 480
actagatccg ctgagcaaca cttgatttcc
atgtgtgagg accacgacag aattttgttg 540
gctggttgtc catcttacga caagttgttg
tccgctaaga acaaggacta catgtccatc 600
atcagaatgt ggttgggtga cgacgttaag
tctaaggact acatcgttgc tttgcagcac 660
ccagttacta ctgacatcaa gcactccatc
aagatgttcg agttgacttt ggacgctttg 720
atctccttca acaagagaac tttggttttg
ttcccaaaca ttgacgctgg ttccaaagag 780
atggttagag ttatgagaaa gaagggtatc
gaacaccacc caaacttcag agctgttaag 840
cacgttccat tcgaccaatt catccagttg
gttgctcatg ctggttgtat gatcggtaac 900
tcctcctgtg gtgttagaga agttggtgct
ttcggtactc cagttatcaa cttgggtact 960
agacagatcg gtagagagac tggagaaaac
gttttgcatg ttagagatgc tgacactcag 1020
gacaagattt tgcaggcttt gcacttgcaa
ttcggaaagc agtacccatg ttccaaaatc 1080
tacggtgacg gtaacgctgt tccaagaatc
ttgaagtttt tgaagtccat cgacttgcaa 1140
gagccattgc agaagaagtt ctgtttccca
ccagttaagg agaacatctc ccaggacatt 1200
gaccacatct tggagacatt gtccgctttg
gctgttgatt tgggtggaac taacttgaga 1260
gttgctatcg tttccatgaa gggagagatc
gttaagaagt acactcagtt caacccaaag 1320
acttacgagg agagaatcaa cttgatcttg
cagatgtgtg ttgaagctgc tgctgaggct 1380
gttaagttga actgtagaat cttgggtgtt
ggtatctcta ctggtggtag agttaatcca 1440
agagagggta tcgttttgca ctccactaag
ttgattcagg agtggaactc cgttgatttg 1500
agaactccat tgtccgacac attgcacttg
ccagtttggg ttgacaacga cggtaattgt 1560
gctgctttgg ctgagagaaa gttcggtcaa
ggaaagggat tggagaactt cgttactttg 1620
atcactggta ctggtattgg tggtggtatc
attcaccagc acgagttgat tcacggttct 1680
tccttctgtg ctgctgaatt gggacacttg
gttgtttctt tggacggtcc agactgttct 1740
tgtggttccc acggttgtat tgaagcttac
gcatcaggaa tggcattgca gagagaggct 1800
aagaagttgc acgacgagga cttgttgttg
gttgagggaa tgtctgttcc aaaggacgag 1860
gctgttggtg ctttgcattt gatccaggct
gctaagttgg gtaatgctaa ggctcagtcc 1920
atcttgagaa ctgctggtac tgctttggga
ttgggtgttg ttaatatctt gcacactatg 1980
aacccatcct tggttatctt gtccggtgtt
ttggcttctc actacatcca catcgttaag 2040
gacgttatca gacagcaagc tttgtcctcc
gttcaagacg ttgatgttgt tgtttccgac 2100
ttggttgacc cagctttgtt gggtgctgct
tccatggttt tggactacac tactagaaga 2160
atctactaat ag
2172
<210> 38
<211> 722
<212> PRT
<213> 人工序列
<220>
<223> 人 UDP-GlcNAc 2-差向异构酶/N-乙酰甘露糖胺
激酶 (HsGNE)
密码子优化的
<400> 38
Met Glu Lys Asn Gly Asn Asn Arg
Lys Leu Arg Val Cys Val Ala Thr
1
5 10 15
Cys Asn Arg Ala Asp Tyr Ser Lys
Leu Ala Pro Ile Met Phe Gly Ile
20 25 30
Lys Thr Glu Pro Glu Phe Phe Glu
Leu Asp Val Val Val Leu Gly Ser
35 40 45
His Leu Ile Asp Asp Tyr Gly Asn
Thr Tyr Arg Met Ile Glu Gln Asp
50 55 60
Asp Phe Asp Ile Asn Thr Arg Leu
His Thr Ile Val Arg Gly Glu Asp
65 70 75 80
Glu Ala Ala Met Val Glu Ser Val
Gly Leu Ala Leu Val Lys Leu Pro
85 90 95
Asp Val Leu Asn Arg Leu Lys Pro
Asp Ile Met Ile Val His Gly Asp
100 105 110
Arg Phe Asp Ala Leu Ala Leu Ala
Thr Ser Ala Ala Leu Met Asn Ile
115 120 125
Arg Ile Leu His Ile Glu Gly Gly
Glu Val Ser Gly Thr Ile Asp Asp
130 135 140
Ser Ile Arg His Ala Ile Thr Lys
Leu Ala His Tyr His Val Cys Cys
145 150 155 160
Thr Arg Ser Ala Glu Gln His Leu
Ile Ser Met Cys Glu Asp His Asp
165 170 175
Arg Ile Leu Leu Ala Gly Cys Pro
Ser Tyr Asp Lys Leu Leu Ser Ala
180 185 190
Lys Asn Lys Asp Tyr Met Ser Ile
Ile Arg Met Trp Leu Gly Asp Asp
195 200 205
Val Lys Ser Lys Asp Tyr Ile Val
Ala Leu Gln His Pro Val Thr Thr
210 215 220
Asp Ile Lys His Ser Ile Lys Met
Phe Glu Leu Thr Leu Asp Ala Leu
225 230 235 240
Ile Ser Phe Asn Lys Arg Thr Leu
Val Leu Phe Pro Asn Ile Asp Ala
245 250 255
Gly Ser Lys Glu Met Val Arg Val
Met Arg Lys Lys Gly Ile Glu His
260 265 270
His Pro Asn Phe Arg Ala Val Lys
His Val Pro Phe Asp Gln Phe Ile
275 280 285
Gln Leu Val Ala His Ala Gly Cys
Met Ile Gly Asn Ser Ser Cys Gly
290 295 300
Val Arg Glu Val Gly Ala Phe Gly
Thr Pro Val Ile Asn Leu Gly Thr
305 310 315 320
Arg Gln Ile Gly Arg Glu Thr Gly
Glu Asn Val Leu His Val Arg Asp
325 330 335
Ala Asp Thr Gln Asp Lys Ile Leu
Gln Ala Leu His Leu Gln Phe Gly
340 345 350
Lys Gln Tyr Pro Cys Ser Lys Ile
Tyr Gly Asp Gly Asn Ala Val Pro
355 360 365
Arg Ile Leu Lys Phe Leu Lys Ser
Ile Asp Leu Gln Glu Pro Leu Gln
370 375 380
Lys Lys Phe Cys Phe Pro Pro Val
Lys Glu Asn Ile Ser Gln Asp Ile
385 390 395 400
Asp His Ile Leu Glu Thr Leu Ser
Ala Leu Ala Val Asp Leu Gly Gly
405 410 415
Thr Asn Leu Arg Val Ala Ile Val
Ser Met Lys Gly Glu Ile Val Lys
420 425 430
Lys Tyr Thr Gln Phe Asn Pro Lys
Thr Tyr Glu Glu Arg Ile Asn Leu
435 440 445
Ile Leu Gln Met Cys Val Glu Ala
Ala Ala Glu Ala Val Lys Leu Asn
450 455 460
Cys Arg Ile Leu Gly Val Gly Ile
Ser Thr Gly Gly Arg Val Asn Pro
465 470 475 480
Arg Glu Gly Ile Val Leu His Ser
Thr Lys Leu Ile Gln Glu Trp Asn
485 490 495
Ser Val Asp Leu Arg Thr Pro Leu
Ser Asp Thr Leu His Leu Pro Val
500 505 510
Trp Val Asp Asn Asp Gly Asn Cys
Ala Ala Leu Ala Glu Arg Lys Phe
515 520 525
Gly Gln Gly Lys Gly Leu Glu Asn
Phe Val Thr Leu Ile Thr Gly Thr
530 535 540
Gly Ile Gly Gly Gly Ile Ile His
Gln His Glu Leu Ile His Gly Ser
545 550 555 560
Ser Phe Cys Ala Ala Glu Leu Gly
His Leu Val Val Ser Leu Asp Gly
565 570 575
Pro Asp Cys Ser Cys Gly Ser His
Gly Cys Ile Glu Ala Tyr Ala Ser
580 585 590
Gly Met Ala Leu Gln Arg Glu Ala
Lys Lys Leu His Asp Glu Asp Leu
595 600 605
Leu Leu Val Glu Gly Met Ser Val
Pro Lys Asp Glu Ala Val Gly Ala
610 615 620
Leu His Leu Ile Gln Ala Ala Lys
Leu Gly Asn Ala Lys Ala Gln Ser
625 630 635 640
Ile Leu Arg Thr Ala Gly Thr Ala
Leu Gly Leu Gly Val Val Asn Ile
645 650 655
Leu His Thr Met Asn Pro Ser Leu
Val Ile Leu Ser Gly Val Leu Ala
660 665 670
Ser His Tyr Ile His Ile Val Lys
Asp Val Ile Arg Gln Gln Ala Leu
675 680 685
Ser Ser Val Gln Asp Val Asp Val
Val Val Ser Asp Leu Val Asp Pro
690 695 700
Ala Leu Leu Gly Ala Ala Ser Met
Val Leu Asp Tyr Thr Thr Arg Arg
705 710 715 720
Ile Tyr
<210> 39
<211> 1308
<212> DNA
<213> 人工序列
<220>
<223> 编码人 CMP-唾液酸合酶 (HsCSS)
密码子优化的
<400> 39
atggactctg ttgaaaaggg tgctgctact
tctgtttcca acccaagagg tagaccatcc 60
agaggtagac ctcctaagtt gcagagaaac
tccagaggtg gtcaaggtag aggtgttgaa 120
aagccaccac acttggctgc tttgatcttg
gctagaggag gttctaaggg tatcccattg 180
aagaacatca agcacttggc tggtgttcca
ttgattggat gggttttgag agctgctttg 240
gactctggtg ctttccaatc tgtttgggtt
tccactgacc acgacgagat tgagaacgtt 300
gctaagcaat tcggtgctca ggttcacaga
agatcctctg aggtttccaa ggactcttct 360
acttccttgg acgctatcat cgagttcttg
aactaccaca acgaggttga catcgttggt 420
aacatccaag ctacttcccc atgtttgcac
ccaactgact tgcaaaaagt tgctgagatg 480
atcagagaag agggttacga ctccgttttc
tccgttgtta gaaggcacca gttcagatgg 540
tccgagattc agaagggtgt tagagaggtt
acagagccat tgaacttgaa cccagctaaa 600
agaccaagaa ggcaggattg ggacggtgaa
ttgtacgaaa acggttcctt ctacttcgct 660
aagagacact tgatcgagat gggatacttg
caaggtggaa agatggctta ctacgagatg 720
agagctgaac actccgttga catcgacgtt
gatatcgact ggccaattgc tgagcagaga 780
gttttgagat acggttactt cggaaaggag
aagttgaagg agatcaagtt gttggtttgt 840
aacatcgacg gttgtttgac taacggtcac
atctacgttt ctggtgacca gaaggagatt 900
atctcctacg acgttaagga cgctattggt
atctccttgt tgaagaagtc cggtatcgaa 960
gttagattga tctccgagag agcttgttcc
aagcaaacat tgtcctcttt gaagttggac 1020
tgtaagatgg aggtttccgt ttctgacaag
ttggctgttg ttgacgaatg gagaaaggag 1080
atgggtttgt gttggaagga agttgcttac
ttgggtaacg aagtttctga cgaggagtgt 1140
ttgaagagag ttggtttgtc tggtgctcca
gctgatgctt gttccactgc tcaaaaggct 1200
gttggttaca tctgtaagtg taacggtggt
agaggtgcta ttagagagtt cgctgagcac 1260
atctgtttgt tgatggagaa agttaataac
tcctgtcaga agtagtag 1308
<210> 40
<211> 434
<212> PRT
<213> 人工序列
<220>
<223> 人 CMP-唾液酸合酶 (HsCSS)
密码子优化的
<400> 40
Met Asp Ser Val Glu Lys Gly Ala
Ala Thr Ser Val Ser Asn Pro Arg
1
5 10 15
Gly Arg Pro Ser Arg Gly Arg Pro
Pro Lys Leu Gln Arg Asn Ser Arg
20 25 30
Gly Gly Gln Gly Arg Gly Val Glu
Lys Pro Pro His Leu Ala Ala Leu
35 40 45
Ile Leu Ala Arg Gly Gly Ser Lys
Gly Ile Pro Leu Lys Asn Ile Lys
50 55 60
His Leu Ala Gly Val Pro Leu Ile
Gly Trp Val Leu Arg Ala Ala Leu
65 70 75 80
Asp Ser Gly Ala Phe Gln Ser Val
Trp Val Ser Thr Asp His Asp Glu
85 90 95
Ile Glu Asn Val Ala Lys Gln Phe
Gly Ala Gln Val His Arg Arg Ser
100 105 110
Ser Glu Val Ser Lys Asp Ser Ser
Thr Ser Leu Asp Ala Ile Ile Glu
115 120 125
Phe Leu Asn Tyr His Asn Glu Val
Asp Ile Val Gly Asn Ile Gln Ala
130 135 140
Thr Ser Pro Cys Leu His Pro Thr
Asp Leu Gln Lys Val Ala Glu Met
145 150 155 160
Ile Arg Glu Glu Gly Tyr Asp Ser
Val Phe Ser Val Val Arg Arg His
165 170 175
Gln Phe Arg Trp Ser Glu Ile Gln
Lys Gly Val Arg Glu Val Thr Glu
180 185 190
Pro Leu Asn Leu Asn Pro Ala Lys
Arg Pro Arg Arg Gln Asp Trp Asp
195 200 205
Gly Glu Leu Tyr Glu Asn Gly Ser
Phe Tyr Phe Ala Lys Arg His Leu
210 215 220
Ile Glu Met Gly Tyr Leu Gln Gly
Gly Lys Met Ala Tyr Tyr Glu Met
225 230 235 240
Arg Ala Glu His Ser Val Asp Ile
Asp Val Asp Ile Asp Trp Pro Ile
245 250 255
Ala Glu Gln Arg Val Leu Arg Tyr
Gly Tyr Phe Gly Lys Glu Lys Leu
260 265 270
Lys Glu Ile Lys Leu Leu Val Cys
Asn Ile Asp Gly Cys Leu Thr Asn
275 280 285
Gly His Ile Tyr Val Ser Gly Asp
Gln Lys Glu Ile Ile Ser Tyr Asp
290 295 300
Val Lys Asp Ala Ile Gly Ile Ser Leu
Leu Lys Lys Ser Gly Ile Glu
305 310 315 320
Val Arg Leu Ile Ser Glu Arg Ala
Cys Ser Lys Gln Thr Leu Ser Ser
325 330 335
Leu Lys Leu Asp Cys Lys Met Glu
Val Ser Val Ser Asp Lys Leu Ala
340 345 350
Val Val Asp Glu Trp Arg Lys Glu
Met Gly Leu Cys Trp Lys Glu Val
355 360 365
Ala Tyr Leu Gly Asn Glu Val Ser
Asp Glu Glu Cys Leu Lys Arg Val
370 375 380
Gly Leu Ser Gly Ala Pro Ala Asp
Ala Cys Ser Thr Ala Gln Lys Ala
385 390 395 400
Val Gly Tyr Ile Cys Lys Cys Asn
Gly Gly Arg Gly Ala Ile Arg Glu
405 410 415
Phe Ala Glu His Ile Cys Leu Leu
Met Glu Lys Val Asn Asn Ser Cys
420 425 430
Gln Lys
<210> 41
<211> 1080
<212> DNA
<213> 人工序列
<220>
<223> 编码人 N-乙酰神经氨酸-9-磷酸
合酶 (HsSPS) 密码子优化的
<400> 41
atgccattgg aattggagtt gtgtcctggt
agatgggttg gtggtcaaca cccatgtttc 60
atcatcgctg agatcggtca aaaccaccaa
ggagacttgg acgttgctaa gagaatgatc 120
agaatggcta aggaatgtgg tgctgactgt
gctaagttcc agaagtccga gttggagttc 180
aagttcaaca gaaaggcttt ggaaagacca
tacacttcca agcactcttg gggaaagact 240
tacggagaac acaagagaca cttggagttc
tctcacgacc aatacagaga gttgcagaga 300
tacgctgagg aagttggtat cttcttcact
gcttctggaa tggacgaaat ggctgttgag 360
ttcttgcacg agttgaacgt tccattcttc
aaagttggtt ccggtgacac taacaacttc 420
ccatacttgg aaaagactgc taagaaaggt
agaccaatgg ttatctcctc tggaatgcag 480
tctatggaca ctatgaagca ggtttaccag
atcgttaagc cattgaaccc aaacttttgt 540
ttcttgcagt gtacttccgc ttacccattg
caaccagagg acgttaattt gagagttatc 600
tccgagtacc agaagttgtt cccagacatc
ccaattggtt actctggtca cgagactggt 660
attgctattt ccgttgctgc tgttgctttg
ggtgctaagg ttttggagag acacatcact 720
ttggacaaga cttggaaggg ttctgatcac
tctgcttctt tggaacctgg tgagttggct 780
gaacttgtta gatcagttag attggttgag
agagctttgg gttccccaac taagcaattg 840
ttgccatgtg agatggcttg taacgagaag
ttgggaaagt ccgttgttgc taaggttaag 900
atcccagagg gtactatctt gactatggac
atgttgactg ttaaagttgg agagccaaag 960
ggttacccac cagaggacat ctttaacttg
gttggtaaaa aggttttggt tactgttgag 1020
gaggacgaca ctattatgga ggagttggtt
gacaaccacg gaaagaagat caagtcctag 1080
<210> 42
<211> 359
<212> PRT
<213> 人工序列
<220>
<223> 人 N-乙酰神经氨酸-9-磷酸合酶
(HsSPS) 密码子优化的
<400> 42
Met Pro Leu Glu Leu Glu Leu Cys
Pro Gly Arg Trp Val Gly Gly Gln
1 5 10 15
His Pro Cys Phe Ile Ile Ala Glu
Ile Gly Gln Asn His Gln Gly Asp
20 25 30
Leu Asp Val Ala Lys Arg Met Ile
Arg Met Ala Lys Glu Cys Gly Ala
35 40 45
Asp Cys Ala Lys Phe Gln Lys Ser
Glu Leu Glu Phe Lys Phe Asn Arg
50 55 60
Lys Ala Leu Glu Arg Pro Tyr Thr
Ser Lys His Ser Trp Gly Lys Thr
65 70 75 80
Tyr Gly Glu His Lys Arg His Leu
Glu Phe Ser His Asp Gln Tyr Arg
85 90 95
Glu Leu Gln Arg Tyr Ala Glu Glu
Val Gly Ile Phe Phe Thr Ala Ser
100 105 110
Gly Met Asp Glu Met Ala Val Glu
Phe Leu His Glu Leu Asn Val Pro
115 120 125
Phe Phe Lys Val Gly Ser Gly Asp
Thr Asn Asn Phe Pro Tyr Leu Glu
130 135 140
Lys Thr Ala Lys Lys Gly Arg Pro
Met Val Ile Ser Ser Gly Met Gln
145 150 155 160
Ser Met Asp Thr Met Lys Gln Val
Tyr Gln Ile Val Lys Pro Leu Asn
165 170 175
Pro Asn Phe Cys Phe Leu Gln Cys
Thr Ser Ala Tyr Pro Leu Gln Pro
180 185 190
Glu Asp Val Asn Leu Arg Val Ile
Ser Glu Tyr Gln Lys Leu Phe Pro
195 200 205
Asp Ile Pro Ile Gly Tyr Ser Gly
His Glu Thr Gly Ile Ala Ile Ser
210 215 220
Val Ala Ala Val Ala Leu Gly Ala
Lys Val Leu Glu Arg His Ile Thr
225 230 235 240
Leu Asp Lys Thr Trp Lys Gly Ser
Asp His Ser Ala Ser Leu Glu Pro
245 250 255
Gly Glu Leu Ala Glu Leu Val Arg
Ser Val Arg Leu Val Glu Arg Ala
260 265 270
Leu Gly Ser Pro Thr Lys Gln Leu
Leu Pro Cys Glu Met Ala Cys Asn
275 280 285
Glu Lys Leu Gly Lys Ser Val Val
Ala Lys Val Lys Ile Pro Glu Gly
290 295 300
Thr Ile Leu Thr Met Asp Met Leu
Thr Val Lys Val Gly Glu Pro Lys
305 310 315 320
Gly Tyr Pro Pro Glu Asp Ile Phe
Asn Leu Val Gly Lys Lys Val Leu
325 330 335
Val Thr Val Glu Glu Asp Asp Thr
Ile Met Glu Glu Leu Val Asp Asn
340 345 350
His Gly Lys Lys Ile Lys Ser
355
<210> 43
<211> 1092
<212> DNA
<213> 人工序列
<220>
<223> 编码小鼠 alpha-2,6-唾液酸转移酶
催化结构域
(MmmST6) 密码子优化的
<400> 43
gtttttcaaa tgccaaagtc ccaggagaaa
gttgctgttg gtccagctcc acaagctgtt 60
ttctccaact ccaagcaaga tccaaaggag
ggtgttcaaa tcttgtccta cccaagagtt 120
actgctaagg ttaagccaca accatccttg
caagtttggg acaaggactc cacttactcc 180
aagttgaacc caagattgtt gaagatttgg
agaaactact tgaacatgaa caagtacaag 240
gtttcctaca agggtccagg tccaggtgtt
aagttctccg ttgaggcttt gagatgtcac 300
ttgagagacc acgttaacgt ttccatgatc
gaggctactg acttcccatt caacactact 360
gaatgggagg gatacttgcc aaaggagaac
ttcagaacta aggctggtcc atggcataag 420
tgtgctgttg tttcttctgc tggttccttg
aagaactccc agttgggtag agaaattgac 480
aaccacgacg ctgttttgag attcaacggt
gctccaactg acaacttcca gcaggatgtt 540
ggtactaaga ctactatcag attggttaac
tcccaattgg ttactactga gaagagattc 600
ttgaaggact ccttgtacac tgagggaatc
ttgattttgt gggacccatc tgtttaccac 660
gctgacattc cacaatggta tcagaagcca
gactacaact tcttcgagac ttacaagtcc 720
tacagaagat tgcacccatc ccagccattc
tacatcttga agccacaaat gccatgggaa 780
ttgtgggaca tcatccagga aatttcccca
gacttgatcc aaccaaaccc accatcttct 840
ggaatgttgg gtatcatcat catgatgact
ttgtgtgacc aggttgacat ctacgagttc 900
ttgccatcca agagaaagac tgatgtttgt
tactaccacc agaagttctt cgactccgct 960
tgtactatgg gagcttacca cccattgttg
ttcgagaaga acatggttaa gcacttgaac 1020
gaaggtactg acgaggacat ctacttgttc
ggaaaggcta ctttgtccgg tttcagaaac 1080
aacagatgtt ag
1092
<210> 44
<211> 363
<212> PRT
<213> 人工序列
<220>
<223> 小鼠 alpha-2,6-唾液酸转移酶
催化结构域
(MmmST6) 密码子优化的
<400> 44
Val Phe Gln Met Pro Lys Ser Gln
Glu Lys Val Ala Val Gly Pro Ala
1
5 10 15
Pro Gln Ala Val Phe Ser Asn Ser
Lys Gln Asp Pro Lys Glu Gly Val
20 25 30
Gln Ile Leu Ser Tyr Pro Arg Val
Thr Ala Lys Val Lys Pro Gln Pro
35 40 45
Ser Leu Gln Val Trp Asp Lys Asp
Ser Thr Tyr Ser Lys Leu Asn Pro
50 55 60
Arg Leu Leu Lys Ile Trp Arg Asn
Tyr Leu Asn Met Asn Lys Tyr Lys
65 70 75 80
Val Ser Tyr Lys Gly Pro Gly Pro
Gly Val Lys Phe Ser Val Glu Ala
85 90 95
Leu Arg Cys His Leu Arg Asp His
Val Asn Val Ser Met Ile Glu Ala
100 105 110
Thr Asp Phe Pro Phe Asn Thr Thr
Glu Trp Glu Gly Tyr Leu Pro Lys
115 120 125
Glu Asn Phe Arg Thr Lys Ala Gly
Pro Trp His Lys Cys Ala Val Val
130 135 140
Ser Ser Ala Gly Ser Leu Lys Asn
Ser Gln Leu Gly Arg Glu Ile Asp
145 150 155 160
Asn His Asp Ala Val Leu Arg Phe
Asn Gly Ala Pro Thr Asp Asn Phe
165 170 175
Gln Gln Asp Val Gly Thr Lys Thr
Thr Ile Arg Leu Val Asn Ser Gln
180 185 190
Leu Val Thr Thr Glu Lys Arg Phe
Leu Lys Asp Ser Leu Tyr Thr Glu
195 200 205
Gly Ile Leu Ile Leu Trp Asp Pro
Ser Val Tyr His Ala Asp Ile Pro
210 215 220
Gln Trp Tyr Gln Lys Pro Asp Tyr
Asn Phe Phe Glu Thr Tyr Lys Ser
225 230 235 240
Tyr Arg Arg Leu His Pro Ser Gln
Pro Phe Tyr Ile Leu Lys Pro Gln
245 250 255
Met Pro Trp Glu Leu Trp Asp Ile
Ile Gln Glu Ile Ser Pro Asp Leu
260 265 270
Ile Gln Pro Asn Pro Pro Ser Ser
Gly Met Leu Gly Ile Ile Ile Met
275 280 285
Met Thr Leu Cys Asp Gln Val Asp
Ile Tyr Glu Phe Leu Pro Ser Lys
290 295 300
Arg Lys Thr Asp Val Cys Tyr Tyr
His Gln Lys Phe Phe Asp Ser Ala
305 310 315 320
Cys Thr Met Gly Ala Tyr His Pro
Leu Leu Phe Glu Lys Asn Met Val
325 330 335
Lys His Leu Asn Glu Gly Thr Asp
Glu Asp Ile Tyr Leu Phe Gly Lys
340 345 350
Ala Thr Leu Ser Gly Phe Arg Asn
Asn Arg Cys
355 360
<210> 45
<211> 1037
<212> DNA
<213> 人工序列
<220>
<223> PpPMA1 启动子
<400> 45
aaatgcgtac ctcttctacg agattcaagc
gaatgagaat aatgtaatat gcaagatcag 60
aaagaatgaa aggagttgaa aaaaaaaacc
gttgcgtttt gaccttgaat ggggtggagg 120
tttccattca aagtaaagcc tgtgtcttgg
tattttcggc ggcacaagaa atcgtaattt 180
tcatcttcta aacgatgaag atcgcagccc
aacctgtatg tagttaaccg gtcggaatta 240
taagaaagat tttcgatcaa caaaccctag
caaatagaaa gcagggttac aactttaaac 300
cgaagtcaca aacgataaac cactcagctc
ccacccaaat tcattcccac tagcagaaag 360
gaattattta atccctcagg aaacctcgat
gattctcccg ttcttccatg ggcgggtatc 420
gcaaaatgag gaatttttca aatttctcta
ttgtcaagac tgtttattat ctaagaaata 480
gcccaatccg aagctcagtt ttgaaaaaat
cacttccgcg tttctttttt acagcccgat 540
gaatatccaa atttggaata tggattactc
tatcgggact gcagataata tgacaacaac 600
gcagattaca ttttaggtaa ggcataaaca
ccagccagaa atgaaacgcc cactagccat 660
ggtcgaatag tccaatgaat tcagatagct
atggtctaaa agctgatgtt ttttattggg 720
taatggcgaa gagtccagta cgacttccag
cagagctgag atggccattt ttgggggtat 780
tagtaacttt ttgagctctt ttcacttcga
tgaagtgtcc cattcgggat ataatcggat 840
cgcgtcgttt tctcgaaaat acagcttagc
gtcgtccgct tgttgtaaaa gcagcaccac 900
attcctaatc tcttatataa acaaaacaac
ccaaattatc agtgctgttt tcccaccaga 960
tataagtttc ttttctcttc cgctttttga
ttttttatct ctttccttta aaaacttctt 1020
taccttaaag ggcggcc 1037
<210> 46
<211> 512
<212> DNA
<213> 人工序列
<220>
<223> PpPMA1 终止子
<400> 46
taagcttcac gatttgtgtt ccagtttatc
ccccctttat ataccgttaa ccctttccct 60
gttgagctga ctgttgttgt attaccgcaa
tttttccaag tttgccatgc ttttcgtgtt 120
atttgaccga tgtctttttt cccaaatcaa
actatatttg ttaccattta aaccaagtta 180
tcttttgtat taagagtcta agtttgttcc
caggcttcat gtgagagtga taaccatcca 240
gactatgatt cttgtttttt attgggtttg
tttgtgtgat acatctgagt tgtgattcgt 300
aaagtatgtc agtctatcta gatttttaat
agttaattgg taatcaatga cttgtttgtt 360
ttaactttta aattgtgggt cgtatccacg
cgtttagtat agctgttcat ggctgttaga 420
ggagggcgat gtttatatac agaggacaag
aatgaggagg cggcgtgtat ttttaaaatg 480
gagacgcgac tcctgtacac cttatcggtt
gg 512
<210> 47
<211> 798
<212> DNA
<213> 人工序列
<220>
<223> PpOCH1 启动子
<400> 47
tggacacagg agactcagaa acagacacag
agcgttctga gtcctggtgc tcctgacgta 60
ggcctagaac aggaattatt ggctttattt
gtttgtccat ttcataggct tggggtaata 120
gatagatgac agagaaatag agaagaccta
atattttttg ttcatggcaa atcgcgggtt 180
cgcggtcggg tcacacacgg agaagtaatg
agaagagctg gtaatctggg gtaaaagggt 240
tcaaaagaag gtcgcctggt agggatgcaa
tacaaggttg tcttggagtt tacattgacc 300
agatgatttg gctttttctc tgttcaattc
acatttttca gcgagaatcg gattgacgga 360
gaaatggcgg ggtgtggggt ggatagatgg
cagaaatgct cgcaatcacc gcgaaagaaa 420
gactttatgg aatagaacta ctgggtggtg
taaggattac atagctagtc caatggagtc 480
cgttggaaag gtaagaagaa gctaaaaccg
gctaagtaac tagggaagaa tgatcagact 540
ttgatttgat gaggtctgaa aatactctgc
tgctttttca gttgcttttt ccctgcaacc 600
tatcattttc cttttcataa gcctgccttt
tctgttttca cttatatgag ttccgccgag 660
acttccccaa attctctcct ggaacattct
ctatcgctct ccttccaagt tgcgccccct 720
ggcactgcct agtaatatta ccacgcgact
tatattcagt tccacaattt ccagtgttcg 780
tagcaaatat catcagcc 798
<210> 48
<211> 302
<212> DNA
<213> 人工序列
<220>
<223> PpALG12 终止子
<400> 48
aatatatacc tcatttgttc aatttggtgt
aaagagtgtg gcggatagac ttcttgtaaa 60
tcaggaaagc tacaattcca attgctgcaa
aaaataccaa tgcccataaa ccagtatgag 120
cggtgccttc gacggattgc ttactttccg
accctttgtc gtttgattct tctgcctttg 180
gtgagtcagt ttgtttcgac tttatatctg
actcatcaac ttcctttacg gttgcgtttt 240
taatcataat tttagccgtt ggcttattat
cccttgagtt ggtaggagtt ttgatgatgc 300
tg
302
<210> 49
<211> 435
<212> DNA
<213> 人工序列
<220>
<223> PpSEC4 启动子
<400> 49
gaagtaaagt tggcgaaact ttgggaacct
ttggttaaaa ctttgtaatt tttgtcgcta 60
cccattaggc agaatctgca tcttgggagg
gggatgtggt ggcgttctga gatgtacgcg 120
aagaatgaag agccagtggt aacaacaggc
ctagagagat acgggcataa tgggtataac 180
ctacaagtta agaatgtagc agccctggaa
accagattga aacgaaaaac gaaatcattt 240
aaactgtagg atgttttggc tcattgtctg
gaaggctggc tgtttattgc cctgttcttt 300
gcatgggaat aagctattat atccctcaca
taatcccaga aaatagattg aagcaacgcg 360
aaatccttac gtatcgaagt agccttctta
cacattcacg ttgtacggat aagaaaacta 420
ctcaaacgaa caatc
435
<210> 50
<211> 404
<212> DNA
<213> 人工序列
<220>
<223> PpOCH1 终止子
<400> 50
aatagatata gcgagattag agaatgaata
ccttcttcta agcgatcgtc cgtcatcata 60
gaatatcatg gactgtatag tttttttttt
gtacatataa tgattaaacg gtcatccaac 120
atctcgttga cagatctctc agtacgcgaa
atccctgact atcaaagcaa gaaccgatga 180
agaaaaaaac aacagtaacc caaacaccac
aacaaacact ttatcttctc ccccccaaca 240
ccaatcatca aagagatgtc ggaacacaaa
caccaagaag caaaaactaa ccccatataa 300
aaacatcctg gtagataatg ctggtaaccc
gctctccttc catattctgg gctacttcac 360
gaagtctgac cggtctcagt tgatcaacat
gatcctcgaa atgg 404
<210> 51
<211> 600
<212> DNA
<213> 人工序列
<220>
<223> PpTEF1 启动子
<400> 51
ttaaggtttg gaacaacact aaactacctt
gcggtactac cattgacact acacatcctt 60
aattccaatc ctgtctggcc tccttcacct
tttaaccatc ttgcccattc caactcgtgt 120
cagattgcgt atcaagtgaa aaaaaaaaaa
ttttaaatct ttaacccaat caggtaataa 180
ctgtcgcctc ttttatctgc cgcactgcat
gaggtgtccc cttagtggga aagagtactg 240
agccaaccct ggaggacagc aagggaaaaa
tacctacaac ttgcttcata atggtcgtaa 300
aaacaatcct tgtcggatat aagtgttgta
gactgtccct tatcctctgc gatgttcttc 360
ctctcaaagt ttgcgatttc tctctatcag
aattgccatc aagagactca ggactaattt 420
cgcagtccca cacgcactcg tacatgattg
gctgaaattt ccctaaagaa tttctttttc 480
acgaaaattt tttttttaca caagattttc
agcagatata aaatggagag caggacctcc 540
gctgtgactc ttcttttttt tcttttattc
tcactacata cattttagtt attcgccaac 600
<210> 52
<211> 301
<212> DNA
<213> 人工序列
<220>
<223> PpTEF1 终止子
<400> 52
attgcttgaa gctttaattt attttattaa
cataataata atacaagcat gatatatttg 60
tattttgttc gttaacattg atgttttctt
catttactgt tattgtttgt aactttgatc 120
gatttatctt ttctacttta ctgtaatatg
gctggcgggt gagccttgaa ctccctgtat 180
tactttacct tgctattact taatctattg
actagcagcg acctcttcaa ccgaagggca 240
agtacacagc aagttcatgt ctccgtaagt
gtcatcaacc ctggaaacag tgggccatgt 300
c
301
<210> 53
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> PpGAPDH 启动子
<400> 53
tttttgtaga aatgtcttgg tgtcctcgtc
caatcaggta gccatctctg aaatatctgg 60
ctccgttgca actccgaacg acctgctggc
aacgtaaaat tctccggggt aaaacttaaa 120
tgtggagtaa tggaaccaga aacgtctctt
cccttctctc tccttccacc gcccgttacc 180
gtccctagga aattttactc tgctggagag
cttcttctac ggcccccttg cagcaatgct 240
cttcccagca ttacgttgcg ggtaaaacgg
aggtcgtgta cccgacctag cagcccaggg 300
atggaaaagt cccggccgtc gctggcaata
atagcgggcg gacgcatgtc atgagattat 360
tggaaaccac cagaatcgaa tataaaaggc
gaacaccttt cccaattttg gtttctcctg 420
acccaaagac tttaaattta atttatttgt
ccctatttca atcaattgaa caactatcaa 480
aacaca
486
<210> 54
<211> 376
<212> DNA
<213> 人工序列
<220>
<223> PpALG3 终止子
<400> 54
atttacaatt agtaatatta aggtggtaaa
aacattcgta gaattgaaat gaattaatat 60
agtatgacaa tggttcatgt ctataaatct
ccggcttcgg taccttctcc ccaattgaat 120
acattgtcaa aatgaatggt tgaactatta
ggttcgccag tttcgttatt aagaaaactg 180
ttaaaatcaa attccatatc atcggttcca
gtgggaggac cagttccatc gccaaaatcc 240
tgtaagaatc cattgtcaga acctgtaaag
tcagtttgag atgaaatttt tccggtcttt 300
gttgacttgg aagcttcgtt aaggttaggt
gaaacagttt gatcaaccag cggctcccgt 360
tttcgtcgct tagtag 376
<210> 55
<211> 934
<212> DNA
<213> 人工序列
<220>
<223> PpAOX1 启动子和整合座位
<400> 55
aacatccaaa gacgaaaggt tgaatgaaac
ctttttgcca tccgacatcc acaggtccat 60
tctcacacat aagtgccaaa cgcaacagga
ggggatacac tagcagcaga ccgttgcaaa 120
cgcaggacct ccactcctct tctcctcaac
acccactttt gccatcgaaa aaccagccca 180
gttattgggc ttgattggag ctcgctcatt
ccaattcctt ctattaggct actaacacca 240
tgactttatt agcctgtcta tcctggcccc
cctggcgagg ttcatgtttg tttatttccg 300
aatgcaacaa gctccgcatt acacccgaac
atcactccag atgagggctt tctgagtgtg 360
gggtcaaata gtttcatgtt ccccaaatgg
cccaaaactg acagtttaaa cgctgtcttg 420
gaacctaata tgacaaaagc gtgatctcat
ccaagatgaa ctaagtttgg ttcgttgaaa 480
tgctaacggc cagttggtca aaaagaaact
tccaaaagtc ggcataccgt ttgtcttgtt 540
tggtattgat tgacgaatgc tcaaaaataa
tctcattaat gcttagcgca gtctctctat 600
cgcttctgaa ccccggtgca cctgtgccga
aacgcaaatg gggaaacacc cgctttttgg 660
atgattatgc attgtctcca cattgtatgc
ttccaagatt ctggtgggaa tactgctgat 720
agcctaacgt tcatgatcaa aatttaactg
ttctaacccc tacttgacag caatatataa 780
acagaaggaa gctgccctgt cttaaacctt
tttttttatc atcattatta gcttactttc 840
ataattgcga ctggttccaa ttgacaagct
tttgatttta acgactttta acgacaactt 900
gagaagatca aaaaacaact aattattcga
aacg 934
<210> 56
<211> 293
<212> DNA
<213> 人工序列
<220>
<223> ScCYC1 终止子
<400> 56
acaggcccct tttcctttgt cgatatcatg
taattagtta tgtcacgctt acattcacgc 60
cctcctccca catccgctct aaccgaaaag
gaaggagtta gacaacctga agtctaggtc 120
cctatttatt ttttttaata gttatgttag
tattaagaac gttatttata tttcaaattt 180
ttcttttttt tctgtacaaa cgcgtgtacg
catgtaacat tatactgaaa accttgcttg 240
agaaggtttt gggacgctcg aaggctttaa
tttgcaagct gccggctctt aag 293
<210> 57
<211> 427
<212> DNA
<213> 人工序列
<220>
<223> ScTEF1 启动子
<400> 57
gatcccccac acaccatagc ttcaaaatgt
ttctactcct tttttactct tccagatttt 60
ctcggactcc gcgcatcgcc gtaccacttc
aaaacaccca agcacagcat actaaatttc 120
ccctctttct tcctctaggg tgtcgttaat
tacccgtact aaaggtttgg aaaagaaaaa 180
agagaccgcc tcgtttcttt ttcttcgtcg
aaaaaggcaa taaaaatttt tatcacgttt 240
ctttttcttg aaaatttttt tttttgattt
ttttctcttt cgatgacctc ccattgatat 300
ttaagttaat aaacggtctt caatttctca
agtttcagtt tcatttttct tgttctatta 360
caactttttt tacttcttgc tcattagaaa
gaaagcatag caatctaatc taagttttaa 420
ttacaaa
427
<210> 58
<211> 375
<212> DNA
<213> 人工序列
<220>
<223> 编码 Sh ble ORF (Zeocin 抗性标记物):
<400> 58
atggccaagt tgaccagtgc cgttccggtg
ctcaccgcgc gcgacgtcgc cggagcggtc 60
gagttctgga ccgaccggct cgggttctcc
cgggacttcg tggaggacga cttcgccggt 120
gtggtccggg acgacgtgac cctgttcatc
agcgcggtcc aggaccaggt ggtgccggac 180
aacaccctgg cctgggtgtg ggtgcgcggc
ctggacgagc tgtacgccga gtggtcggag 240
gtcgtgtcca cgaacttccg ggacgcctcc
gggccggcca tgaccgagat cggcgagcag 300
ccgtgggggc gggagttcgc cctgcgcgac
ccggccggca actgcgtgca cttcgtggcc 360
gaggagcagg actga
375
<210> 59
<211> 898
<212> DNA
<213> 人工序列
<220>
<223> PpURA5的5'-区
<400> 59
atcggccttt gttgatgcaa gttttacgtg
gatcatggac taaggagttt tatttggacc 60
aagttcatcg tcctagacat tacggaaagg
gttctgctcc tctttttgga aactttttgg 120
aacctctgag tatgacagct tggtggattg
tacccatggt atggcttcct gtgaatttct 180
attttttcta cattggattc accaatcaaa
acaaattagt cgccatggct ttttggcttt 240
tgggtctatt tgtttggacc ttcttggaat
atgctttgca tagatttttg ttccacttgg 300
actactatct tccagagaat caaattgcat
ttaccattca tttcttattg catgggatac 360
accactattt accaatggat aaatacagat
tggtgatgcc acctacactt ttcattgtac 420
tttgctaccc aatcaagacg ctcgtctttt
ctgttctacc atattacatg gcttgttctg 480
gatttgcagg tggattcctg ggctatatca
tgtatgatgt cactcattac gttctgcatc 540
actccaagct gcctcgttat ttccaagagt
tgaagaaata tcatttggaa catcactaca 600
agaattacga gttaggcttt ggtgtcactt
ccaaattctg ggacaaagtc tttgggactt 660
atctgggtcc agacgatgtg tatcaaaaga
caaattagag tatttataaa gttatgtaag 720
caaatagggg ctaataggga aagaaaaatt
ttggttcttt atcagagctg gctcgcgcgc 780
agtgtttttc gtgctccttt gtaatagtca
tttttgacta ctgttcagat tgaaatcaca 840
ttgaagatgt cactcgaggg gtaccaaaaa
aggtttttgg atgctgcagt ggcttcgc 898
<210> 60
<211> 1060
<212> DNA
<213> 人工序列
<220>
<223> PpURA5的3'-区
<400> 60
ggtcttttca acaaagctcc attagtgagt
cagctggctg aatcttatgc acaggccatc 60
attaacagca acctggagat agacgttgta
tttggaccag cttataaagg tattcctttg 120
gctgctatta ccgtgttgaa gttgtacgag
ctcggcggca aaaaatacga aaatgtcgga 180
tatgcgttca atagaaaaga aaagaaagac
cacggagaag gtggaagcat cgttggagaa 240
agtctaaaga ataaaagagt actgattatc
gatgatgtga tgactgcagg tactgctatc 300
aacgaagcat ttgctataat tggagctgaa
ggtgggagag ttgaaggtag tattattgcc 360
ctagatagaa tggagactac aggagatgac
tcaaatacca gtgctaccca ggctgttagt 420
cagagatatg gtacccctgt cttgagtata
gtgacattgg accatattgt ggcccatttg 480
ggcgaaactt tcacagcaga cgagaaatct
caaatggaaa cgtatagaaa aaagtatttg 540
cccaaataag tatgaatctg cttcgaatga
atgaattaat ccaattatct tctcaccatt 600
attttcttct gtttcggagc tttgggcacg
gcggcgggtg gtgcgggctc aggttccctt 660
tcataaacag atttagtact tggatgctta
atagtgaatg gcgaatgcaa aggaacaatt 720
tcgttcatct ttaacccttt cactcggggt
acacgttctg gaatgtaccc gccctgttgc 780
aactcaggtg gaccgggcaa ttcttgaact
ttctgtaacg ttgttggatg ttcaaccaga 840
aattgtccta ccaactgtat tagtttcctt
ttggtcttat attgttcatc gagatacttc 900
ccactctcct tgatagccac tctcactctt
cctggattac caaaatcttg aggatgagtc 960
ttttcaggct ccaggatgca aggtatatcc
aagtacctgc aagcatctaa tattgtcttt 1020
gccagggggt tctccacacc atactccttt
tggcgcatgc 1060
<210> 61
<211> 957
<212> DNA
<213> 人工序列
<220>
<223> 编码 PpURA5 营养缺陷标记物
<400> 61
tctagaggga cttatctggg tccagacgat
gtgtatcaaa agacaaatta gagtatttat 60
aaagttatgt aagcaaatag gggctaatag
ggaaagaaaa attttggttc tttatcagag 120
ctggctcgcg cgcagtgttt ttcgtgctcc
tttgtaatag tcatttttga ctactgttca 180
gattgaaatc acattgaaga tgtcactgga
ggggtaccaa aaaaggtttt tggatgctgc 240
agtggcttcg caggccttga agtttggaac
tttcaccttg aaaagtggaa gacagtctcc 300
atacttcttt aacatgggtc ttttcaacaa
agctccatta gtgagtcagc tggctgaatc 360
ttatgctcag gccatcatta acagcaacct
ggagatagac gttgtatttg gaccagctta 420
taaaggtatt cctttggctg ctattaccgt
gttgaagttg tacgagctgg gcggcaaaaa 480
atacgaaaat gtcggatatg cgttcaatag
aaaagaaaag aaagaccacg gagaaggtgg 540
aagcatcgtt ggagaaagtc taaagaataa
aagagtactg attatcgatg atgtgatgac 600
tgcaggtact gctatcaacg aagcatttgc
tataattgga gctgaaggtg ggagagttga 660
aggttgtatt attgccctag atagaatgga
gactacagga gatgactcaa ataccagtgc 720
tacccaggct gttagtcaga gatatggtac
ccctgtcttg agtatagtga cattggacca 780
tattgtggcc catttgggcg aaactttcac
agcagacgag aaatctcaaa tggaaacgta 840
tagaaaaaag tatttgccca aataagtatg
aatctgcttc gaatgaatga attaatccaa 900
ttatcttctc accattattt tcttctgttt
cggagctttg ggcacggcgg cggatcc 957
<210> 62
<211> 709
<212> DNA
<213> 人工序列
<220>
<223> Ec lacZ 基因的部分
<400> 62
cctgcactgg atggtggcgc tggatggtaa
gccgctggca agcggtgaag tgcctctgga 60
tgtcgctcca caaggtaaac agttgattga
actgcctgaa ctaccgcagc cggagagcgc 120
cgggcaactc tggctcacag tacgcgtagt
gcaaccgaac gcgaccgcat ggtcagaagc 180
cgggcacatc agcgcctggc agcagtggcg
tctggcggaa aacctcagtg tgacgctccc 240
cgccgcgtcc cacgccatcc cgcatctgac
caccagcgaa atggattttt gcatcgagct 300
gggtaataag cgttggcaat ttaaccgcca
gtcaggcttt ctttcacaga tgtggattgg 360
cgataaaaaa caactgctga cgccgctgcg
cgatcagttc acccgtgcac cgctggataa 420
cgacattggc gtaagtgaag cgacccgcat
tgaccctaac gcctgggtcg aacgctggaa 480
ggcggcgggc cattaccagg ccgaagcagc
gttgttgcag tgcacggcag atacacttgc 540
tgatgcggtg ctgattacga ccgctcacgc
gtggcagcat caggggaaaa ccttatttat 600
cagccggaaa acctaccgga ttgatggtag
tggtcaaatg gcgattaccg ttgatgttga 660
agtggcgagc gatacaccgc atccggcgcg
gattggcctg aactgccag 709
<210> 63
<211> 222
<212> PRT
<213> 巴斯德毕赤氏酵母
<400> 63
Met Ser Leu Glu Gly Tyr Gln Lys
Arg Phe Leu Asp Ala Ala Val Ala
1
5 10 15
Ser Gln Ala Leu Lys Phe Gly Thr
Phe Thr Leu Lys Ser Gly Arg Gln
20 25 30
Ser Pro Tyr Phe Phe Asn Met Gly
Leu Phe Asn Lys Ala Pro Leu Val
35 40 45
Ser Gln Leu Ala Glu Ser Tyr Ala
Gln Ala Ile Ile Asn Ser Asn Leu
50 55 60
Glu Ile Asp Val Val Phe Gly Pro
Ala Tyr Lys Gly Ile Pro Leu Ala
65 70 75 80
Ala Ile Thr Val Leu Lys Leu Tyr
Glu Leu Gly Gly Lys Lys Tyr Glu
85 90 95
Asn Val Gly Tyr Ala Phe Asn Arg
Lys Glu Lys Lys Asp His Gly Glu
100
105 110
Gly Gly Ser Ile Val Gly Glu Ser
Leu Lys Asn Lys Arg Val Leu Ile
115 120 125
Ile Asp Asp Val Met Thr Ala Gly
Thr Ala Ile Asn Glu Ala Phe Ala
130
135 140
Ile Ile Gly Ala Glu Gly Gly Arg
Val Glu Gly Cys Ile Ile Ala Leu
145 150 155 160
Asp Arg Met Glu Thr Thr Gly Asp
Asp Ser Asn Thr Ser Ala Thr Gln
165 170 175
Ala Val Ser Gln Arg Tyr Gly Thr
Pro Val Leu Ser Ile Val Thr Leu
180 185 190
Asp His Ile Val Ala His Leu Gly
Glu Thr Phe Thr Ala Asp Glu Lys
195 200 205
Ser Gln Met Glu Thr Tyr Arg Lys
Lys Tyr Leu Pro Lys Glx
210 215 220
<210> 64
<211> 2875
<212> DNA
<213> 人工序列
<220>
<223> PpOCH1的5'-区
<400> 64
aaaacctttt ttcctattca aacacaaggc
attgcttcaa cacgtgtgcg tatccttaac 60
acagatactc catacttcta ataatgtgat
agacgaatac aaagatgttc actctgtgtt 120
gtgtctacaa gcatttctta ttctgattgg
ggatattcta gttacagcac taaacaactg 180
gcgatacaaa cttaaattaa ataatccgaa
tctagaaaat gaacttttgg atggtccgcc 240
tgttggttgg ataaatcaat accgattaaa
tggattctat tccaatgaga gagtaatcca 300
agacactctg atgtcaataa tcatttgctt
gcaacaacaa acccgtcatc taatcaaagg 360
gtttgatgag gcttaccttc aattgcagat
aaactcattg ctgtccactg ctgtattatg 420
tgagaatatg ggtgatgaat ctggtcttct ccactcagct
aacatggctg tttgggcaaa 480
ggtggtacaa ttatacggag atcaggcaat
agtgaaattg ttgaatatgg ctactggacg 540
atgcttcaag gatgtacgtc tagtaggagc
cgtgggaaga ttgctggcag aaccagttgg 600
cacgtcgcaa caatccccaa gaaatgaaat
aagtgaaaac gtaacgtcaa agacagcaat 660
ggagtcaata ttgataacac cactggcaga
gcggttcgta cgtcgttttg gagccgatat 720
gaggctcagc gtgctaacag cacgattgac
aagaagactc tcgagtgaca gtaggttgag 780
taaagtattc gcttagattc ccaaccttcg
ttttattctt tcgtagacaa agaagctgca 840
tgcgaacata gggacaactt ttataaatcc
aattgtcaaa ccaacgtaaa accctctggc 900
accattttca acatatattt gtgaagcagt
acgcaatatc gataaatact caccgttgtt 960
tgtaacagcc ccaacttgca tacgccttct
aatgacctca aatggataag ccgcagcttg 1020
tgctaacata ccagcagcac cgcccgcggt
cagctgcgcc cacacatata aaggcaatct 1080
acgatcatgg gaggaattag ttttgaccgt
caggtcttca agagttttga actcttcttc 1140
ttgaactgtg taacctttta aatgacggga
tctaaatacg tcatggatga gatcatgtgt 1200
gtaaaaactg actccagcat atggaatcat
tccaaagatt gtaggagcga acccacgata 1260
aaagtttccc aaccttgcca aagtgtctaa
tgctgtgact tgaaatctgg gttcctcgtt 1320
gaagaccctg cgtactatgc ccaaaaactt
tcctccacga gccctattaa cttctctatg 1380
agtttcaaat gccaaacgga cacggattag
gtccaatggg taagtgaaaa acacagagca 1440
aaccccagct aatgagccgg ccagtaaccg
tcttggagct gtttcataag agtcattagg 1500
gatcaataac gttctaatct gttcataaca
tacaaatttt atggctgcat agggaaaaat 1560
tctcaacagg gtagccgaat gaccctgata
tagacctgcg acaccatcat acccatagat 1620
ctgcctgaca gccttaaaga gcccgctaaa
agacccggaa aaccgagaga actctggatt 1680
agcagtctga aaaagaatct tcactctgtc
tagtggagca attaatgtct tagcggcact 1740
tcctgctact ccgccagcta ctcctgaata
gatcacatac tgcaaagact gcttgtcgat 1800
gaccttgggg ttatttagct tcaagggcaa
tttttgggac attttggaca caggagactc 1860
agaaacagac acagagcgtt ctgagtcctg
gtgctcctga cgtaggccta gaacaggaat 1920
tattggcttt atttgtttgt ccatttcata
ggcttggggt aatagataga tgacagagaa 1980
atagagaaga cctaatattt tttgttcatg
gcaaatcgcg ggttcgcggt cgggtcacac 2040
acggagaagt aatgagaaga gctggtaatc
tggggtaaaa gggttcaaaa gaaggtcgcc 2100
tggtagggat gcaatacaag gttgtcttgg
agtttacatt gaccagatga tttggctttt 2160
tctctgttca attcacattt ttcagcgaga
atcggattga cggagaaatg gcggggtgtg 2220
gggtggatag atggcagaaa tgctcgcaat
caccgcgaaa gaaagacttt atggaataga 2280
actactgggt ggtgtaagga ttacatagct
agtccaatgg agtccgttgg aaaggtaaga 2340
agaagctaaa accggctaag taactaggga
agaatgatca gactttgatt tgatgaggtc 2400
tgaaaatact ctgctgcttt ttcagttgct
ttttccctgc aacctatcat tttccttttc 2460
ataagcctgc cttttctgtt ttcacttata
tgagttccgc cgagacttcc ccaaattctc 2520
tcctggaaca ttctctatcg ctctccttcc
aagttgcgcc ccctggcact gcctagtaat 2580
attaccacgc gacttatatt cagttccaca
atttccagtg ttcgtagcaa atatcatcag 2640
ccatggcgaa ggcagatggc agtttgctct
actataatcc tcacaatcca cccagaaggt 2700
attacttcta catggctata ttcgccgttt
ctgtcatttg cgttttgtac ggaccctcac 2760
aacaattatc atctccaaaa atagactatg
atccattgac gctccgatca cttgatttga 2820
agactttgga agctccttca cagttgagtc
caggcaccgt agaagataat cttcg 2875
<210> 65
<211> 997
<212> DNA
<213> 人工序列
<220>
<223> PpOCH1的3'-区
<400> 65
aaagctagag taaaatagat atagcgagat
tagagaatga ataccttctt ctaagcgatc 60
gtccgtcatc atagaatatc atggactgta
tagttttttt tttgtacata taatgattaa 120
acggtcatcc aacatctcgt tgacagatct
ctcagtacgc gaaatccctg actatcaaag 180
caagaaccga tgaagaaaaa aacaacagta
acccaaacac cacaacaaac actttatctt 240
ctccccccca acaccaatca tcaaagagat
gtcggaacca aacaccaaga agcaaaaact 300
aaccccatat aaaaacatcc tggtagataa
tgctggtaac ccgctctcct tccatattct 360
gggctacttc acgaagtctg accggtctca
gttgatcaac atgatcctcg aaatgggtgg 420
caagatcgtt ccagacctgc ctcctctggt
agatggagtg ttgtttttga caggggatta 480
caagtctatt gatgaagata ccctaaagca
actgggggac gttccaatat acagagactc 540
cttcatctac cagtgttttg tgcacaagac
atctcttccc attgacactt tccgaattga 600
caagaacgtc gacttggctc aagatttgat
caatagggcc cttcaagagt ctgtggatca 660
tgtcacttct gccagcacag ctgcagctgc
tgctgttgtt gtcgctacca acggcctgtc 720
ttctaaacca gacgctcgta ctagcaaaat
acagttcact cccgaagaag atcgttttat 780
tcttgacttt gttaggagaa atcctaaacg
aagaaacaca catcaactgt acactgagct 840
cgctcagcac atgaaaaacc atacgaatca
ttctatccgc cacagatttc gtcgtaatct 900
ttccgctcaa cttgattggg tttatgatat
cgatccattg accaaccaac ctcgaaaaga 960
tgaaaacggg aactacatca aggtacaagg
ccttcca 997
<210> 66
<211> 870
<212> DNA
<213> 人工序列
<220>
<223> PpBMT2的5'-区
<400> 66
ggccgagcgg gcctagattt tcactacaaa
tttcaaaact acgcggattt attgtctcag 60
agagcaattt ggcatttctg agcgtagcag
gaggcttcat aagattgtat aggaccgtac 120
caacaaattg ccgaggcaca acacggtatg
ctgtgcactt atgtggctac ttccctacaa 180
cggaatgaaa ccttcctctt tccgcttaaa
cgagaaagtg tgtcgcaatt gaatgcaggt 240
gcctgtgcgc cttggtgtat tgtttttgag
ggcccaattt atcaggcgcc ttttttcttg 300
gttgttttcc cttagcctca agcaaggttg
gtctatttca tctccgcttc tataccgtgc 360
ctgatactgt tggatgagaa cacgactcaa
cttcctgctg ctctgtattg ccagtgtttt 420
gtctgtgatt tggatcggag tcctccttac
ttggaatgat aataatcttg gcggaatctc 480
cctaaacgga ggcaaggatt ctgcctatga
tgatctgcta tcattgggaa gcttcaacga 540
catggaggtc gactcctatg tcaccaacat
ctacgacaat gctccagtgc taggatgtac 600
ggatttgtct tatcatggat tgttgaaagt
caccccaaag catgacttag cttgcgattt 660
ggagttcata agagctcaga ttttggacat
tgacgtttac tccgccataa aagacttaga 720
agataaagcc ttgactgtaa aacaaaaggt
tgaaaaacac tggtttacgt tttatggtag 780
ttcagtcttt ctgcccgaac acgatgtgca
ttacctggtt agacgagtca tcttttcggc 840
tgaaggaaag gcgaactctc
cagtaacatc
870
<210> 67
<211> 1733
<212> DNA
<213> 人工序列
<220>
<223> PpBMT2的3'-区
<400> 67
ccatatgatg ggtgtttgct cactcgtatg
gatcaaaatt ccatggtttc ttctgtacaa 60
cttgtacact tatttggact tttctaacgg
tttttctggt gatttgagaa gtccttattt 120
tggtgttcgc agcttatccg tgattgaacc
atcagaaata ctgcagctcg ttatctagtt 180
tcagaatgtg ttgtagaata caatcaattc
tgagtctagt ttgggtgggt cttggcgacg 240
ggaccgttat atgcatctat gcagtgttaa
ggtacataga atgaaaatgt aggggttaat 300
cgaaagcatc gttaatttca gtagaacgta
gttctattcc ctacccaaat aatttgccaa 360
gaatgcttcg tatccacata cgcagtggac
gtagcaaatt tcactttgga ctgtgacctc 420
aagtcgttat cttctacttg gacattgatg
gtcattacgt aatccacaaa gaattggata 480
gcctctcgtt ttatctagtg cacagcctaa
tagcacttaa gtaagagcaa tggacaaatt 540
tgcatagaca ttgagctaga tacgtaactc
agatcttgtt cactcatggt gtactcgaag 600
tactgctgga accgttacct cttatcattt
cgctactggc tcgtgaaact actggatgaa 660
aaaaaaaaaa gagctgaaag cgagatcatc
ccattttgtc atcatacaaa ttcacgcttg 720
cagttttgct tcgttaacaa gacaagatgt
ctttatcaaa gacccgtttt ttcttcttga 780
agaatacttc cctgttgagc acatgcaaac
catatttatc tcagatttca ctcaacttgg 840
gtgcttccaa gagaagtaaa attcttccca
ctgcatcaac ttccaagaaa cccgtagacc 900
agtttctctt cagccaaaag aagttgctcg
ccgatcaccg cggtaacaga ggagtcagaa 960
ggtttcacac ccttccatcc cgatttcaaa
gtcaaagtgc tgcgttgaac caaggttttc 1020
aggttgccaa agcccagtct gcaaaaacta
gttccaaatg gcctattaat tcccataaaa 1080
gtgttggcta cgtatgtatc ggtacctcca
ttctggtatt tgctattgtt gtcgttggtg 1140
ggttgactag actgaccgaa tccggtcttt
ccataacgga gtggaaacct atcactggtt 1200
cggttccccc actgactgag gaagactgga
agttggaatt tgaaaaatac aaacaaagcc 1260
ctgagtttca ggaactaaat tctcacataa
cattggaaga gttcaagttt atattttcca 1320
tggaatgggg acatagattg ttgggaaggg
tcatcggcct gtcgtttgtt cttcccacgt 1380
tttacttcat tgcccgtcga aagtgttcca
aagatgttgc attgaaactg cttgcaatat 1440
gctctatgat aggattccaa ggtttcatcg
gctggtggat ggtgtattcc ggattggaca 1500
aacagcaatt ggctgaacgt aactccaaac
caactgtgtc tccatatcgc ttaactaccc 1560
atcttggaac tgcatttgtt atttactgtt
acatgattta cacagggctt caagttttga 1620
agaactataa gatcatgaaa cagcctgaag
cgtatgttca aattttcaag caaattgcgt 1680
ctccaaaatt gaaaactttc aagagactct
cttcagttct attaggcctg gtg 1733
<210> 68
<211> 411
<212> DNA
<213> 人工序列
<220>
<223> PpBMT1的5'-区
<400> 68
catatggtga gagccgttct gcacaactag
atgttttcga gcttcgcatt gtttcctgca 60
gctcgactat tgaattaaga tttccggata
tctccaatct cacaaaaact tatgttgacc 120
acgtgctttc ctgaggcgag gtgttttata
tgcaagctgc caaaaatgga aaacgaatgg 180
ccatttttcg cccaggcaaa ttattcgatt
actgctgtca taaagacagt gttgcaaggc 240
tcacattttt ttttaggatc cgagataaag
tgaatacagg acagcttatc tctatatctt 300
gtaccattcg tgaatcttaa gagttcggtt
agggggactc tagttgaggg ttggcactca 360
cgtatggctg ggcgcagaaa taaaattcag
gcgcagcagc acttatcgat g 411
<210> 69
<211> 692
<212> DNA
<213> 人工序列
<220>
<223> PpBMT1的3'-区
<400> 69
gaattcacag ttataaataa aaacaaaaac
tcaaaaagtt tgggctccac aaaataactt 60
aatttaaatt tttgtctaat aaatgaatgt
aattccaaga ttatgtgatg caagcacagt 120
atgcttcagc cctatgcagc tactaatgtc
aatctcgcct gcgagcgggc ctagattttc 180
actacaaatt tcaaaactac gcggatttat
tgtctcagag agcaatttgg catttctgag 240
cgtagcagga ggcttcataa gattgtatag
gaccgtacca acaaattgcc gaggcacaac 300
acggtatgct gtgcacttat gtggctactt
ccctacaacg gaatgaaacc ttcctctttc 360
cgcttaaacg agaaagtgtg tcgcaattga
atgcaggtgc ctgtgcgcct tggtgtattg 420
tttttgaggg cccaatttat caggcgcctt
ttttcttggt tgttttccct tagcctcaag 480
caaggttggt ctatttcatc tccgcttcta
taccgtgcct gatactgttg gatgagaaca 540
cgactcaact tcctgctgct ctgtattgcc
agtgttttgt ctgtgatttg gatcggagtc 600
ctccttactt ggaatgataa taatcttggc
ggaatctccc taaacggagg caaggattct 660
gcctatgatg atctgctatc attgggaagc
tt 692
<210> 70
<211> 546
<212> DNA
<213> 人工序列
<220>
<223> PpBMT3的5'-区
<400> 70
gatatctccc tggggacaat atgtgttgca
actgttcgtt gttggtgccc cagtccccca 60
accggtacta atcggtctat gttcccgtaa
ctcatattcg gttagaacta gaacaataag 120
tgcatcattg ttcaacattg tggttcaatt
gtcgaacatt gctggtgctt atatctacag 180
ggaagacgat aagcctttgt acaagagagg
taacagacag ttaattggta tttctttggg 240
agtcgttgcc ctctacgttg tctccaagac
atactacatt ctgagaaaca gatggaagac 300
tcaaaaatgg gagaagctta gtgaagaaga
gaaagttgcc tacttggaca gagctgagaa 360
ggagaacctg ggttctaaga ggctggactt
tttgttcgag agttaaactg cataattttt 420
tctaagtaaa tttcatagtt atgaaatttc
tgcagcttag tgtttactgc atcgtttact 480
gcatcaccct gtaaataatg tgagcttttt
tccttccatt gcttggtatc ttccttgctg 540
ctgttt
546
<210> 71
<211> 378
<212> DNA
<213> 人工序列
<220>
<223> PpBMT3的3'-区
<400> 71
acaaaacagt catgtacaga actaacgcct
ttaagatgca gaccactgaa aagaattggg 60
tcccattttt cttgaaagac gaccaggaat
ctgtccattt tgtttactcg ttcaatcctc 120
tgagagtact caactgcagt cttgataacg
gtgcatgtga tgttctattt gagttaccac 180
atgattttgg catgtcttcc gagctacgtg
gtgccactcc tatgctcaat cttcctcagg 240
caatcccgat ggcagacgac aaagaaattt
gggtttcatt cccaagaacg agaatatcag 300
attgcgggtg ttctgaaaca atgtacaggc
caatgttaat gctttttgtt agagaaggaa 360
caaacttttt tgctgagc
378
<210> 72
<211> 1043
<212> DNA
<213> 人工序列
<220>
<223> PpBMT4的5'-区
<400> 72
aagcttgttc accgttggga cttttccgtg
gacaatgttg actactccag gagggattcc 60
agctttctct actagctcag caataatcaa
tgcagcccca ggcgcccgtt ctgatggctt 120
gatgaccgtt gtattgcctg tcactatagc
caggggtagg gtccataaag gaatcatagc 180
agggaaatta aaagggcata ttgatgcaat
cactcccaat ggctctcttg ccattgaagt 240
ctccatatca gcactaactt ccaagaagga
ccccttcaag tctgacgtga tagagcacgc 300
ttgctctgcc acctgtagtc ctctcaaaac
gtcaccttgt gcatcagcaa agactttacc 360
ttgctccaat actatgacgg aggcaattct
gtcaaaattc tctctcagca attcaaccaa 420
cttgaaagca aattgctgtc tcttgatgat
ggagactttt ttccaagatt gaaatgcaat 480
gtgggacgac tcaattgctt cttccagctc
ctcttcggtt gattgaggaa cttttgaaac 540
cacaaaattg gtcgttgggt catgtacatc
aaaccattct gtagatttag attcgacgaa 600
agcgttgttg atgaaggaaa aggttggata
cggtttgtcg gtctctttgg tatggccggt 660
ggggtatgca attgcagtag aagataattg
gacagccatt gttgaaggta gagaaaaggt 720
cagggaactt gggggttatt tataccattt
taccccacaa ataacaactg aaaagtaccc 780
attccatagt gagaggtaac cgacggaaaa
agacgggccc atgttctggg accaatagaa 840
ctgtgtaatc cattgggact aatcaacaga
cgattggcaa tataatgaaa tagttcgttg 900
aaaagccacg tcagctgtct tttcattaac
tttggtcgga cacaacattt tctactgttg 960
tatctgtcct actttgctta tcatctgcca
cagggcaagt ggatttcctt ctcgcgcggc 1020
tgggtgaaaa cggttaacgt gaa 1043
<210> 73
<211> 695
<212> DNA
<213> 人工序列
<220>
<223> PpBMT4的3'-区
<400> 73
gccttggggg acttcaagtc tttgctagaa
actagatgag gtcaggccct cttatggttg 60
tgtcccaatt gggcaatttc actcacctaa
aaagcatgac aattatttag cgaaataggt 120
agtatatttt ccctcatctc ccaagcagtt
tcgtttttgc atccatatct ctcaaatgag 180
cagctacgac tcattagaac cagagtcaag
taggggtgag ctcagtcatc agccttcgtt 240
tctaaaacga ttgagttctt ttgttgctac
aggaagcgcc ctagggaact ttcgcacttt 300
ggaaatagat tttgatgacc aagagcggga
gttgatatta gagaggctgt ccaaagtaca 360
tgggatcagg ccggccaaat tgattggtgt
gactaaacca ttgtgtactt ggacactcta 420
ttacaaaagc gaagatgatt tgaagtatta
caagtcccga agtgttagag gattctatcg 480
agcccagaat gaaatcatca accgttatca
gcagattgat aaactcttgg aaagcggtat 540
cccattttca ttattgaaga actacgataa
tgaagatgtg agagacggcg accctctgaa 600
cgtagacgaa gaaacaaatc tacttttggg
gtacaataga gaaagtgaat caagggaggt 660
atttgtggcc ataatactca actctatcat
taatg 695
<210> 74
<211> 937
<212> DNA
<213> 人工序列
<220>
<223> PpPNO1 和 PpMNN4的5'-区
<400> 74
tcattctata tgttcaagaa aagggtagtg
aaaggaaaga aaaggcatat aggcgaggga 60
gagttagcta gcatacaaga taatgaagga
tcaatagcgg tagttaaagt gcacaagaaa 120
agagcacctg ttgaggctga tgataaagct
ccaattacat tgccacagag aaacacagta 180
acagaaatag gaggggatgc accacgagaa
gagcattcag tgaacaactt tgccaaattc 240
ataaccccaa gcgctaataa gccaatgtca
aagtcggcta ctaacattaa tagtacaaca 300
actatcgatt ttcaaccaga tgtttgcaag
gactacaaac agacaggtta ctgcggatat 360
ggtgacactt gtaagttttt gcacctgagg
gatgatttca aacagggatg gaaattagat 420
agggagtggg aaaatgtcca aaagaagaag
cataatactc tcaaaggggt taaggagatc 480
caaatgttta atgaagatga gctcaaagat
atcccgttta aatgcattat atgcaaagga 540
gattacaaat cacccgtgaa aacttcttgc
aatcattatt tttgcgaaca atgtttcctg 600
caacggtcaa gaagaaaacc aaattgtatt
atatgtggca gagacacttt aggagttgct 660
ttaccagcaa agaagttgtc ccaatttctg
gctaagatac ataataatga aagtaataaa 720
gtttagtaat tgcattgcgt tgactattga
ttgcattgat gtcgtgtgat actttcaccg 780
aaaaaaaaca cgaagcgcaa taggagcggt
tgcatattag tccccaaagc tatttaattg 840
tgcctgaaac tgttttttaa gctcatcaag
cataattgta tgcattgcga cgtaaccaac 900
gtttaggcgc agtttaatca tagcccactg
ctaagcc 937
<210> 75
<211> 1906
<212> DNA
<213> 人工序列
<220>
<223> PpPNO1 和 PpMNN4的3'-区
<400> 75
cggaggaatg caaataataa tctccttaat
tacccactga taagctcaag agacgcggtt 60
tgaaaacgat ataatgaatc atttggattt
tataataaac cctgacagtt tttccactgt 120
attgttttaa cactcattgg aagctgtatt
gattctaaga agctagaaat caatacggcc 180
atacaaaaga tgacattgaa taagcaccgg
cttttttgat tagcatatac cttaaagcat 240
gcattcatgg ctacatagtt gttaaagggc
ttcttccatt atcagtataa tgaattacat 300
aatcatgcac ttatatttgc ccatctctgt
tctctcactc ttgcctgggt atattctatg 360
aaattgcgta tagcgtgtct ccagttgaac
cccaagcttg gcgagtttga agagaatgct 420
aaccttgcgt attccttgct tcaggaaaca
ttcaaggaga aacaggtcaa gaagccaaac 480
attttgatcc ttcccgagtt agcattgact
ggctacaatt ttcaaagcca gcagcggata 540
gagccttttt tggaggaaac aaccaaggga
gctagtaccc aatgggctca aaaagtatcc 600
aagacgtggg attgctttac tttaatagga
tacccagaaa aaagtttaga gagccctccc 660
cgtatttaca acagtgcggt acttgtatcg
cctcagggaa aagtaatgaa caactacaga 720
aagtccttct tgtatgaagc tgatgaacat
tggggatgtt cggaatcttc tgatgggttt 780
caaacagtag atttattaat tgaaggaaag
actgtaaaga catcatttgg aatttgcatg 840
gatttgaatc cttataaatt tgaagctcca
ttcacagact tcgagttcag tggccattgc 900
ttgaaaaccg gtacaagact cattttgtgc
ccaatggcct ggttgtcccc tctatcgcct 960
tccattaaaa aggatcttag tgatatagag
aaaagcagac ttcaaaagtt ctaccttgaa 1020
aaaatagata ccccggaatt tgacgttaat
tacgaattga aaaaagatga agtattgccc 1080
acccgtatga atgaaacgtt ggaaacaatt
gactttgagc cttcaaaacc ggactactct 1140
aatataaatt attggatact aaggtttttt
ccctttctga ctcatgtcta taaacgagat 1200
gtgctcaaag agaatgcagt tgcagtctta
tgcaaccgag ttggcattga gagtgatgtc 1260
ttgtacggag gatcaaccac gattctaaac
ttcaatggta agttagcatc gacacaagag 1320
gagctggagt tgtacgggca gactaatagt
ctcaacccca gtgtggaagt attgggggcc 1380
cttggcatgg gtcaacaggg aattctagta
cgagacattg aattaacata atatacaata 1440
tacaataaac acaaataaag aatacaagcc
tgacaaaaat tcacaaatta ttgcctagac 1500
ttgtcgttat cagcagcgac ctttttccaa
tgctcaattt cacgatatgc cttttctagc 1560
tctgctttaa gcttctcatt ggaattggct
aactcgttga ctgcttggtc agtgatgagt 1620
ttctccaagg tccatttctc gatgttgttg
ttttcgtttt cctttaatct cttgatataa 1680
tcaacagcct tctttaatat ctgagccttg
ttcgagtccc ctgttggcaa cagagcggcc 1740
agttccttta ttccgtggtt tatattttct
cttctacgcc tttctacttc tttgtgattc 1800
tctttacgca tcttatgcca ttcttcagaa
ccagtggctg gcttaaccga atagccagag 1860
cctgaagaag ccgcactaga agaagcagtg
gcattgttga ctatgg 1906
<210> 76
<211> 1128
<212> DNA
<213> 人工序列
<220>
<223> PpMNN4L1的5'-区
<400> 76
gatctggcca ttgtgaaact tgacactaaa
gacaaaactc ttagagtttc caatcactta 60
ggagacgatg tttcctacaa cgagtacgat
ccctcattga tcatgagcaa tttgtatgtg 120
aaaaaagtca tcgaccttga caccttggat
aaaagggctg gaggaggtgg aaccacctgt 180
gcaggcggtc tgaaagtgtt caagtacgga
tctactacca aatatacatc tggtaacctg 240
aacggcgtca ggttagtata ctggaacgaa
ggaaagttgc aaagctccaa atttgtggtt 300
cgatcctcta attactctca aaagcttgga
ggaaacagca acgccgaatc aattgacaac 360
aatggtgtgg gttttgcctc agctggagac
tcaggcgcat ggattctttc caagctacaa 420
gatgttaggg agtaccagtc attcactgaa
aagctaggtg aagctacgat gagcattttc 480
gatttccacg gtcttaaaca ggagacttct
actacagggc ttggggtagt tggtatgatt 540
cattcttacg acggtgagtt caaacagttt
ggtttgttca ctccaatgac atctattcta 600
caaagacttc aacgagtgac caatgtagaa
tggtgtgtag cgggttgcga agatggggat 660
gtggacactg aaggagaaca cgaattgagt
gatttggaac aactgcatat gcatagtgat 720
tccgactagt caggcaagag agagccctca
aatttacctc tctgcccctc ctcactcctt 780
ttggtacgca taattgcagt ataaagaact
tgctgccagc cagtaatctt atttcatacg 840
cagttctata tagcacataa tcttgcttgt
atgtatgaaa tttaccgcgt tttagttgaa 900
attgtttatg ttgtgtgcct tgcatgaaat
ctctcgttag ccctatcctt acatttaact 960
ggtctcaaaa cctctaccaa ttccattgct
gtacaacaat atgaggcggc attactgtag 1020
ggttggaaaa aaattgtcat tccagctaga
gatcacacga cttcatcacg cttattgctc 1080
ctcattgcta aatcatttac tcttgacttc
gacccagaaa agttcgcc 1128
<210> 77
<211> 1231
<212> DNA
<213> 人工序列
<220>
<223> PpMNN4L1的3'-区
<400> 77
gcatgtcaaa cttgaacaca acgactagat
agttgttttt tctatataaa acgaaacgtt 60
atcatcttta ataatcattg aggtttaccc
ttatagttcc gtattttcgt ttccaaactt 120
agtaatcttt tggaaatatc atcaaagctg
gtgccaatct tcttgtttga agtttcaaac 180
tgctccacca agctacttag agactgttct
aggtctgaag caacttcgaa cacagagaca 240
gctgccgccg attgttcttt tttgtgtttt
tcttctggaa gaggggcatc atcttgtatg 300
tccaatgccc gtatcctttc tgagttgtcc
gacacattgt ccttcgaaga gtttcctgac 360
attgggcttc ttctatccgt gtattaattt
tgggttaagt tcctcgtttg catagcagtg 420
gatacctcga tttttttggc tcctatttac
ctgacataat attctactat aatccaactt 480
ggacgcgtca tctatgataa ctaggctctc
ctttgttcaa aggggacgtc ttcataatcc 540
actggcacga agtaagtctg caacgaggcg
gcttttgcaa cagaacgata gtgtcgtttc 600
gtacttggac tatgctaaac aaaaggatct
gtcaaacatt tcaaccgtgt ttcaaggcac 660
tctttacgaa ttatcgacca agaccttcct
agacgaacat ttcaacatat ccaggctact 720
gcttcaaggt ggtgcaaatg ataaaggtat
agatattaga tgtgtttggg acctaaaaca 780
gttcttgcct gaagattccc ttgagcaaca
ggcttcaata gccaagttag agaagcagta 840
ccaaatcggt aacaaaaggg ggaagcatat
aaaaccttta ctattgcgac aaaatccatc 900
cttgaaagta aagctgtttg ttcaatgtaa
agcatacgaa acgaaggagg tagatcctaa 960
gatggttaga gaacttaacg ggacatactc
cagctgcatc ccatattacg atcgctggaa 1020
gacttttttc atgtacgtat cgcccaccaa
cctttcaaag caagctaggt atgattttga 1080
cagttctcac aatccattgg ttttcatgca
acttgaaaaa acccaactca aacttcatgg 1140
ggatccatac aatgtaaatc attacgagag
ggcgaggttg aaaagtttcc attgcaatca 1200
cgtcgcatca tggctactga aaggccttaa
c 1231
<210> 78
<211> 1815
<212> DNA
<213> 人工序列
<220>
<223> PpTRP2 基因整合座位
<400> 78
taatggccaa acggtttctc aattactata
tactactaac catttacctg tagcgtattt 60
cttttccctc ttcgcgaaag ctcaagggca
tcttcttgac tcatgaaaaa tatctggatt 120
tcttctgaca gatcatcacc cttgagccca
actctctagc ctatgagtgt aagtgatagt 180
catcttgcaa cagattattt tggaacgcaa
ctaacaaagc agatacaccc ttcagcagaa 240
tcctttctgg atattgtgaa gaatgatcgc
caaagtcaca gtcctgagac agttcctaat 300
ctttacccca tttacaagtt catccaatca
gacttcttaa cgcctcatct ggcttatatc 360
aagcttacca acagttcaga aactcccagt
ccaagtttct tgcttgaaag tgcgaagaat 420
ggtgacaccg ttgacaggta cacctttatg
ggacattccc ccagaaaaat aatcaagact 480
gggcctttag agggtgctga agttgacccc
ttggtgcttc tggaaaaaga actgaagggc 540
accagacaag cgcaacttcc tggtattcct
cgtctaagtg gtggtgccat aggatacatc 600
tcgtacgatt gtattaagta ctttgaacca
aaaactgaaa gaaaactgaa agatgttttg 660
caacttccgg aagcagcttt gatgttgttc
gacacgatcg tggcttttga caatgtttat 720
caaagattcc aggtaattgg aaacgtttct
ctatccgttg atgactcgga cgaagctatt 780
cttgagaaat attataagac aagagaagaa
gtggaaaaga tcagtaaagt ggtatttgac 840
aataaaactg ttccctacta tgaacagaaa
gatattattc aaggccaaac gttcacctct 900
aatattggtc aggaagggta tgaaaaccat
gttcgcaagc tgaaagaaca tattctgaaa 960
ggagacatct tccaagctgt tccctctcaa
agggtagcca ggccgacctc attgcaccct 1020
ttcaacatct atcgtcattt gagaactgtc
aatccttctc catacatgtt ctatattgac 1080
tatctagact tccaagttgt tggtgcttca
cctgaattac tagttaaatc cgacaacaac 1140
aacaaaatca tcacacatcc tattgctgga
actcttccca gaggtaaaac tatcgaagag 1200
gacgacaatt atgctaagca attgaagtcg
tctttgaaag acagggccga gcacgtcatg 1260
ctggtagatt tggccagaaa tgatattaac
cgtgtgtgtg agcccaccag taccacggtt 1320
gatcgtttat tgactgtgga gagattttct
catgtgatgc atcttgtgtc agaagtcagt 1380
ggaacattga gaccaaacaa gactcgcttc
gatgctttca gatccatttt cccagcagga 1440
accgtctccg gtgctccgaa ggtaagagca
atgcaactca taggagaatt ggaaggagaa 1500
aagagaggtg tttatgcggg ggccgtagga
cactggtcgt acgatggaaa atcgatggac 1560
acatgtattg ccttaagaac aatggtcgtc
aaggacggtg tcgcttacct tcaagccgga 1620
ggtggaattg tctacgattc tgacccctat
gacgagtaca tcgaaaccat gaacaaaatg 1680
agatccaaca ataacaccat cttggaggct
gagaaaatct ggaccgatag gttggccaga 1740
gacgagaatc aaagtgaatc cgaagaaaac
gatcaatgaa cggaggacgt aagtaggaat 1800
ttatggtttg gccat
1815
<210> 79
<211> 1373
<212> DNA
<213> 人工序列
<220>
<223> PpARG1的5'-区
<400> 79
gatctggcct tccctgaatt tttacgtcca
gctatacgat ccgttgtgac tgtatttcct 60
gaaatgaagt ttcaacctaa agttttggtt
gtacttgctc cacctaccac ggaaactaat 120
atcgaaacca atgaaaaagt agaactggaa
tcgtcaatcg aaattcgcaa ccaagtggaa 180
cccaaagact tgaatctttc taaagtctat
tctagtgaca ctaatggcaa cagaagattt 240
gagctgactt ttcaaatgaa tctcaataat
gcaatatcaa catcagacaa tcaatgggct 300
ttgtctagtg acacaggatc aattatagta
gtgtcttctg caggaagaat aacttccccg 360
atcctagaag tcggggcatc cgtctgtgtc
ttaagatcgt acaacgaaca ccttttggca 420
ataacttgtg aaggaacatg cttttcatgg
aatttaaaga agcaagaatg tgttctaaac 480
agcatttcat tagcacctat agtcaattca
cacatgctag ttaagaaagt tggagatgca 540
aggaactatt ctattgtatc tgccgaagga
gacaacaatc cgttacccca gattctagac 600
tgcgaacttt ccaaaaatgg cgctccaatt
gtggctctta gcacgaaaga catctactct 660
tattcaaaga aaatgaaatg ctggatccat
ttgattgatt cgaaatactt tgaattgttg 720
ggtgctgaca atgcactgtt tgagtgtgtg
gaagcgctag aaggtccaat tggaatgcta 780
attcatagat tggtagatga gttcttccat
gaaaacactg ccggtaaaaa actcaaactt 840
tacaacaagc gagtactgga ggacctttca
aattcacttg aagaactagg tgaaaatgcg 900
tctcaattaa gagagaaact tgacaaactc
tatggtgatg aggttgaggc ttcttgacct 960
cttctctcta tctgcgtttc tttttttttt
tttttttttt tttttttcag ttgagccaga 1020
ccgcgctaaa cgcataccaa ttgccaaatc
aggcaattgt gagacagtgg taaaaaagat 1080
gcctgcaaag ttagattcac acagtaagag
agatcctact cataaatgag gcgcttattt 1140
agtagctagt gatagccact gcggttctgc
tttatgctat ttgttgtatg ccttactatc 1200
tttgtttggc tcctttttct tgacgttttc
cgttggaggg actccctatt ctgagtcatg 1260
agccgcacag attatcgccc aaaattgaca
aaatcttctg gcgaaaaaag tataaaagga 1320
gaaaaaagct cacccttttc cagcgtagaa
agtatatatc agtcattgaa gac 1373
<210> 80
<211> 1470
<212> DNA
<213> 人工序列
<220>
<223> PpARG1的3'-区
<400> 80
gggactttaa ctcaagtaaa aggatagttg
tacaattata tatacgaaga ataaatcatt 60
acaaaaagta ttcgtttctt tgattcttaa
caggattcat tttctgggtg tcatcaggta 120
cagcgctgaa tatcttgaag ttaacatcga
gctcatcatc gacgttcatc acactagcca 180
cgtttccgca acggtagcaa taattaggag
cggaccacac agtgacgaca tctttctctt 240
tgaaatggta tctgaagcct tccatgacca
attgatgggc tctagcgatg agttgcaagt 300
tattaatgtg gttgaactca cgtgctactc
gagcaccgaa taaccagcca gctccacgag 360
gagaaacagc ccaactgtcg acttcatctg
ggtcagacca aaccaagtca caaaatcctc 420
cttcatgagg gacctcttgc gctcggctga
gaactctgat ttgatctaac atgcgaatat 480
cgggagagag accaccatgg atacataata
ttttaccatc aatgatggca ctaagggtta 540
aaaagtcgaa cacctggcaa cagtacttcc
agacagtggt ggaaccatat ttattgagac 600
attcctcata aaatccataa acctgagtga
tctgtctgga ttcatgattt ccccttacca 660
atgtgatatg ttgaggaaac ttaattttta
aaatcatgag taacgtgaac gtctccaacg 720
agaaatagcc tctatccaca tagtctccta
ggaagatata gttctgtttt attccattag 780
aggaggatcc gggaaaccca ccactaatct
tgaaaagttc cagtagatcg tgaaattggc 840
cgtgaatatc tccgcatact gtcactggac
tctgcactgg ctgtatattg gattcctcca 900
tcagcaaatc cttcacccgt tcgcaaagat
gcttcatatc attttcactt aaagccttgc 960
agcttttgac ttcttcaaac cactgatctg
gtcctctttc tggcatgatt aaggtctata 1020
atatttctga gctgagatgt aaaaaaaaat
aataaaaatg gggagtgaaa aagtgtgtag 1080
cttttaggag tttgggattg ataccccaaa
atgatcttta tgagaattaa aaggtagata 1140
cgcttttaat aagaacacct atctatagta
ctttgtggtc ttgagtaatt gagatgttca 1200
gcttctgagg tttgccgtta ttctgggata
gtagtgcgcg accaaacaac ccgccaggca 1260
aagtgtgttg tgctcgaaga cgattgccag
aagagtaagt ccgtcctgcc tcagatgtta 1320
cacactttct tccctagaca gtcgatgcat
catcggattt aaacctgaaa ctttgatgcc 1380
atgatacgcc tagtcacgtc gactgagatt
ttagataagc cccgatccct ttagtacatt 1440
cctgttatcc atggatggaa
tggcctgata
1470
<210> 81
<211> 1854
<212> DNA
<213> 人工序列
<220>
<223> PpARG1 营养缺陷标记物
<400> 81
cagttgagcc agaccgcgct aaacgcatac
caattgccaa atcaggcaat tgtgagacag 60
tggtaaaaaa gatgcctgca aagttagatt
cacacagtaa gagagatcct actcataaat 120
gaggcgctta tttagtagct agtgatagcc
actgcggttc tgctttatgc tatttgttgt 180
atgccttact atctttgttt ggctcctttt
tcttgacgtt ttccgttgga gggactccct 240
attctgagtc atgagccgca cagattatcg
cccaaaattg acaaaatctt ctggcgaaaa 300
aagtataaaa ggagaaaaaa gctcaccctt
ttccagcgta gaaagtatat atcagtcatt 360
gaagactatt atttaaataa cacaatgtct
aaaggaaaag tttgtttggc ctactccggt 420
ggtttggata cctccatcat cctagcttgg
ttgttggagc agggatacga agtcgttgcc 480
tttttagcca acattggtca agaggaagac
tttgaggctg ctagagagaa agctctgaag 540
atcggtgcta ccaagtttat cgtcagtgac
gttaggaagg aatttgttga ggaagttttg 600
ttcccagcag tccaagttaa cgctatctac
gagaacgtct acttactggg tacctctttg 660
gccagaccag tcattgccaa ggcccaaata
gaggttgctg aacaagaagg ttgttttgct 720
gttgcccacg gttgtaccgg aaagggtaac
gatcaggtta gatttgagct ttccttttat 780
gctctgaagc ctgacgttgt ctgtatcgcc
ccatggagag acccagaatt cttcgaaaga 840
ttcgctggta gaaatgactt gctgaattac
gctgctgaga aggatattcc agttgctcag 900
actaaagcca agccatggtc tactgatgag
aacatggctc acatctcctt cgaggctggt 960
attctagaag atccaaacac tactcctcca
aaggacatgt ggaagctcac tgttgaccca 1020
gaagatgcac cagacaagcc agagttcttt
gacgtccact ttgagaaggg taagccagtt 1080
aaattagttc tcgagaacaa aactgaggtc
accgatccgg ttgagatctt tttgactgct 1140
aacgccattg ctagaagaaa cggtgttggt
agaattgaca ttgtcgagaa cagattcatc 1200
ggaatcaagt ccagaggttg ttatgaaact
ccaggtttga ctctactgag aaccactcac 1260
atcgacttgg aaggtcttac cgttgaccgt
gaagttagat cgatcagaga cacttttgtt 1320
accccaacct actctaagtt gttatacaac
gggttgtact ttaccccaga aggtgagtac 1380
gtcagaacta tgattcagcc ttctcaaaac
accgtcaacg gtgttgttag agccaaggcc 1440
tacaaaggta atgtgtataa cctaggaaga
tactctgaaa ccgagaaatt gtacgatgct 1500
accgaatctt ccatggatga gttgaccgga
ttccaccctc aagaagctgg aggatttatc 1560
acaacacaag ccatcagaat caagaagtac
ggagaaagtg tcagagagaa gggaaagttt 1620
ttgggacttt aactcaagta aaaggatagt
tgtacaatta tatatacgaa gaataaatca 1680
ttacaaaaag tattcgtttc tttgattctt
aacaggattc attttctggg tgtcatcagg 1740
tacagcgctg aatatcttga agttaacatc
gagctcatca tcgacgttca tcacactagc 1800
cacgtttccg caacggtagc aataattagg
agcggaccac acagtgacga catc 1854
<210> 82
<211> 1250
<212> DNA
<213> 人工序列
<220>
<223> PpADE1的5'-区
<400> 82
gagtcggcca agagatgata actgttacta
agcttctccg taattagtgg tattttgtaa 60
cttttaccaa taatcgttta tgaatacgga
tatttttcga ccttatccag tgccaaatca 120
cgtaacttaa tcatggttta aatactccac
ttgaacgatt cattattcag aaaaaagtca 180
ggttggcaga aacacttggg cgctttgaag
agtataagag tattaagcat taaacatctg 240
aactttcacc gccccaatat actactctag
gaaactcgaa aaattccttt ccatgtgtca 300
tcgcttccaa cacactttgc tgtatccttc
caagtatgtc cattgtgaac actgatctgg 360
acggaatcct acctttaatc gccaaaggaa
aggttagaga catttatgca gtcgatgaga 420
acaacttgct gttcgtcgca actgaccgta
tctccgctta cgatgtgatt atgacaaacg 480
gtattcctga taagggaaag attttgactc
agctctcagt tttctggttt gattttttgg 540
caccctacat aaagaatcat ttggttgctt
ctaatgacaa ggaagtcttt gctttactac 600
catcaaaact gtctgaagaa aaatacaaat
ctcaattaga gggacgatcc ttgatagtaa 660
aaaagcacag actgatacct ttggaagcca
ttgtcagagg ttacatcact ggaagtgcat 720
ggaaagagta caagaactca aaaactgtcc
atggagtcaa ggttgaaaac gagaaccttc 780
aagagagcga cgcctttcca actccgattt
tcacaccttc aacgaaagct gaacagggtg 840
aacacgatga aaacatctct attgaacaag
ctgctgagat tgtaggtaaa gacatttgtg 900
agaaggtcgc tgtcaaggcg gtcgagttgt
attctgctgc aaaaaacctc gcccttttga 960
aggggatcat tattgctgat acgaaattcg
aatttggact ggacgaaaac aatgaattgg 1020
tactagtaga tgaagtttta actccagatt
cttctagatt ttggaatcaa aagacttacc 1080
aagtgggtaa atcgcaagag agttacgata
agcagtttct cagagattgg ttgacggcca 1140
acggattgaa tggcaaagag ggcgtagcca
tggatgcaga aattgctatc aagagtaaag 1200
aaaagtatat tgaagcttat gaagcaatta
ctggcaagaa atgggcttga 1250
<210> 83
<211> 882
<212> DNA
<213> 人工序列
<220>
<223> PpADE1的3'-区
<400> 83
atgattagta ccctcctcgc ctttttcaga
catctgaaat ttcccttatt cttccaattc 60
catataaaat cctatttagg taattagtaa
acaatgatca taaagtgaaa tcattcaagt 120
aaccattccg tttatcgttg atttaaaatc
aataacgaat gaatgtcggt ctgagtagtc 180
aatttgttgc cttggagctc attggcaggg
ggtcttttgg ctcagtatgg aaggttgaaa 240
ggaaaacaga tggaaagtgg ttcgtcagaa
aagaggtatc ctacatgaag atgaatgcca 300
aagagatatc tcaagtgata gctgagttca
gaattcttag tgagttaagc catcccaaca 360
ttgtgaagta ccttcatcac gaacatattt
ctgagaataa aactgtcaat ttatacatgg 420
aatactgtga tggtggagat ctctccaagc
tgattcgaac acatagaagg aacaaagagt 480
acatttcaga agaaaaaata tggagtattt
ttacgcaggt tttattagca ttgtatcgtt 540
gtcattatgg aactgatttc acggcttcaa
aggagtttga atcgctcaat aaaggtaata 600
gacgaaccca gaatccttcg tgggtagact
cgacaagagt tattattcac agggatataa 660
aacccgacaa catctttctg atgaacaatt
caaaccttgt caaactggga gattttggat 720
tagcaaaaat tctggaccaa gaaaacgatt
ttgccaaaac atacgtcggt acgccgtatt 780
acatgtctcc tgaagtgctg ttggaccaac
cctactcacc attatgtgat atatggtctc 840
ttgggtgcgt catgtatgag ctatgtgcat
tgaggcctcc tt 882
<210> 84
<211> 909
<212> DNA
<213> 人工序列
<220>
<223> MET16的5'-区
<400> 84
gggtgggcct ggtaatgttc actcctagga
actactagaa aaactgtgct aaacggatta 60
cgtaattatt atacaaattc tctatggtct
atggtacata tgggctggtt caataatgaa 120
tctatgaaga atttgtgccc atggggaccg
tttctataaa cgttctcttc tttatgtttt 180
ccacctgctc tttgagttcc ggaaattcgt
tgacaatctt ttgtcccaat gtcgattggg 240
cgtatttaaa gcccagctgt tttcctctga
gaaattgatt caacttcctc accacctcca 300
caaactcacg cgtgtatata tcagggtttc
taccgtcttc gatataattg actacgtcca 360
cggggatggg aatgttcaaa tctgtgttgt
ggagcttttg caagtgctct acaaccttgt 420
taatgttgtt ggaaagaccc aattgacttt
ccgctgtacc ggcgtaatcg tgcacctgaa 480
cacccaaatg gatgagggtt tcgatgagtt
gacttagttc attttcaact tgatctaatg 540
ttgtcgcagg tgcactcata cttgtcatgg
agaatgaaag taagttgata gagagcagac 600
ttcgaggatg ggatgaactt gattaggtaa
tctttgacaa tgtcttagag gtaggcagag 660
gatgctggaa aaaaaaaatt gaaaacgccc
aagcttccag ctttgcaagg aaagaagaaa 720
agggagttgc cagcacgaaa tcggcttcct
ccgaaaggtt cacaattgca gaattgtcac 780
cattcaaatg cctttaccct tcatctgtgg
tacctcaggc taagaacggg tcacgtgata 840
tttcgacact catcgccaca atatgtacta
gcaagaactt ttcagattta gtaatccgtt 900
cgaaacggg
909
<210> 85
<211> 825
<212> DNA
<213> 人工序列
<220>
<223> MET16的3'-区
<400> 85
ctagatttgc acaatatttg aaagctcagc
aaaacatatg aatataattt tttttttctc 60
tacactattt atcctgtaag tttctgtttc
cccatgtagg atctttttct ccttctctgt 120
ctcccatttt ttttgttccc tgtagtcttg
ccttgcctga gatgcgagct cgtccgccca 180
tccagtcgtg tgaagggcct agcttttcaa
aaagaaaata cctcccgcta aaggaggcgt 240
tgccccttct atcagtagtg tcgtaaccaa
ttttcacaaa caataaaaaa aggacaccaa 300
caacgaaatc aactatttac acacatccag
atccgtcccc ctccccatcc aagagttaaa 360
gacaaatatg gctgttaata atccgtctga
atttagaaag aagttggtcg tagtaggaga 420
tggtgcttgc ggtaaaactt gtctattgat
ggtgtttgcc gagggcgagt tccctccatc 480
ttatgttcca actgtttttg agaactatgc
caccccagta gaggttgaca acagaatagt 540
acaactcact ctatgggata ctgccggaca
ggaagattat gatagactga gacctctttc 600
ctatcccgat gccaatgtgg tcttgatttg
ttttgctatt gacattcctg acaccttaga 660
taacgttcaa gagaagtgga ttagtgaggt
gttgcatttc tgtcctggag tccctatcat 720
tttagttggt tgtaaacttg acttgagaaa
cgatccagag gttatccgtg aattacaagc 780
tgttggaaag caaccagtct ccaccagtga
gggtcaggcc gttgc 825
<210> 86
<211> 1796
<212> DNA
<213> 人工序列
<220>
<223> PpMET16 营养缺陷标记物
<400> 86
caacttcctc accacctcca caaactcacg
cgtgtatata tcagggtttc taccgtcttc 60
gatataattg actacgtcca cggggatggg
aatgttcaaa tctgtgttgt ggagcttttg 120
caagtgctct acaaccttgt taatgttgtt
ggaaagaccc aattgacttt ccgctgtacc 180
ggcgtaatcg tgcacctgaa cacccaaatg
gatgagggtt tcgatgagtt gacttagttc 240
attttcaact tgatctaatg ttgtcgcagg
tgcactcata cttgtcatgg agaatgaaag 300
taagttgata gagagcagac ttcgaggatg
ggatgaactt gattaggtaa tctttgacaa 360
tgtcttagag gtaggcagag gatgctggaa
aaaaaaaatt gaaaacgccc aagcttccag 420
ctttgcaagg aaagaagaaa agggagttgc
cagcacgaaa tcggcttcct ccgaaaggtt 480
cacaattgca gaattgtcac cattcaaatg
cctttaccct tcatctgtgg tacctcaggc 540
taagaacggg tcacgtgata tttcgacact
catcgccaca atatgtacta gcaagaactt 600
ttcagattta gtaatccgtt cgaaacggga
aaaaatgttt ttacccttct atcaactgct 660
aatctttcta ggtttatact gccagcagcc
cgttccagat accaacatgc cattcactat 720
aggccagtca aaaaccagtt tgaacctctc
caaggtccaa gtggaccacc ttaacctttc 780
tcttcagaat ctcagtccag aagaaatcat
acaatggtct atcattacct tcccacacct 840
gtatcaaact acggcattcg gattgactgg
gttgtgtata actgacatgg ttcacaaaat 900
aacagccaaa agaggcaaaa agcatgctat
tgacttgatt ttcatagaca ccttacatca 960
ttttccacag actttagatc tcgttgaacg
agtcaaagat aaataccact gcaatgttca 1020
tgtcttcaaa ccacagaatg ccactactga
gctcgagttt ggggcgcaat atggcgaaaa 1080
cttatgggaa acagatgata acaagtatga
ctacctcgta aaagttgaac cctcacaacg 1140
tgcctaccat gcattagacg tctgcgccgt
cttcacagga agaagacggt ctcaaggtgg 1200
taaaagggga gaattgcccg tgattgaaat
tgatgaaatt tctcaggtgg tcaagattaa 1260
tccgttagca tcctgggggt ttgaacaagt
tcaaaactat atccaagcta atagcgttcc 1320
atacaacgaa ttgctggatt tgggatacaa
gtcagttgga gattaccatt ccacacaacc 1380
cactaaaaat ggtgaagatg aaagagcagg
caggtggaga ggtaaacaaa agagtgagtg 1440
tggtatccac gaagcttcta gatttgcaca
atatttgaaa gctcagcaaa acatatgaat 1500
ataatttttt ttttctctac actatttatc
ctgtaagttt ctgtttcccc atgtaggatc 1560
tttttctcct tctctgtctc ccattttttt
tgttccctgt agtcttgcct tgcctgagat 1620
gcgagctcgt ccgcccatcc agtcgtgtga
agggcctagc ttttcaaaaa gaaaatacct 1680
cccgctaaag gaggcgttgc cccttctatc
agtagtgtcg taaccaattt tcacaaacaa 1740
taaaaaaagg acaccaacaa cgaaatcaac
tatttacaca catccagatc cgtccc 1796
<210> 87
<211> 461
<212> DNA
<213> 人工序列
<220>
<223> PpHIS1的5'-区
<400> 87
taactggccc tttgacgttt ctgacaatag
ttctagagga gtcgtccaaa aactcaactc 60
tgacttgggt gacaccacca cgggatccgg
ttcttccgag gaccttgatg accttggcta 120
atgtaactgg agttttagta tccattttaa
gatgtgtgtt tctgtaggtt ctgggttgga 180
aaaaaatttt agacaccaga agagaggagt
gaactggttt gcgtgggttt agactgtgta 240
aggcactact ctgtcgaagt tttagatagg
ggttacccgc tccgatgcat gggaagcgat 300
tagcccggct gttgcccgtt tggtttttga
agggtaattt tcaatatctc tgtttgagtc 360
atcaatttca tattcaaaga ttcaaaaaca
aaatctggtc caaggagcgc atttaggatt 420
atggagttgg cgaatcactt gaacgataga
ctattatttg c 461
<210> 88
<211> 1841
<212> DNA
<213> 人工序列
<220>
<223> PpHIS1的3'-区
<400> 88
gtgacattct tgtctttgag atcagtaatt
gtagagcata gatagaataa tattcaagac 60
caacggcttc tcttcggaag ctccaagtag
cttatagtga tgagtaccgg catatattta 120
taggcttaaa atttcgaggg ttcactatat
tcgtttagtg ggaagagttc ctttcactct 180
tgttatctat attgtcagcg tggactgttt
ataactgtac caacttagtt tctttcaact 240
ccaggttaag agacataaat gtcctttgat
gctgacaata atcagtggaa ttcaaggaag 300
gacaatcccg acctcaatct gttcattaat
gaagagttcg aatcgtcctt aaatcaagcg 360
ctagactcaa ttgtcaatga gaaccctttc
tttgaccaag aaactataaa tagatcgaat 420
gacaaagttg gaaatgagtc cattagctta
catgatattg agcaggcaga ccaaaataaa 480
ccgtcctttg agagcgatat tgatggttcg
gcgccgttga taagagacga caaattgcca 540
aagaaacaaa gctgggggct gagcaatttt
ttttcaagaa gaaatagcat atgtttacca 600
ctacatgaaa atgattcaag tgttgttaag
accgaaagat ctattgcagt gggaacaccc 660
catcttcaat actgcttcaa tggaatctcc
aatgccaagt acaatgcatt tacctttttc 720
ccagtcatcc tatacgagca attcaaattt
tttttcaatt tatactttac tttagtggct 780
ctctctcaag cgataccgca acttcgcatt
ggatatcttt cttcgtatgt cgtcccactt 840
ttgtttgtac tcatagtgac catgtcaaaa
gaggcgatgg atgatattca acgccgaaga 900
agggatagag aacagaacaa tgaaccatat
gaggttctgt ccagcccatc accagttttg 960
tccaaaaact taaaatgtgg tcacttggtt
cgattgcata agggaatgag agtgcccgca 1020
gatatggttc ttgtccagtc aagcgaatcc
accggagagt catttatcaa gacagatcag 1080
ctggatggtg agactgattg gaagcttcgg
attgtttctc cagttacaca atcgttacca 1140
atgactgaac ttcaaaatgt cgccatcact
gcaagcgcac cctcaaaatc aattcactcc 1200
tttcttggaa gattgaccta caatgggcaa
tcatatggtc ttacgataga caacacaatg 1260
tggtgtaata ctgtattagc ttctggttca
gcaattggtt gtataattta cacaggtaaa 1320
gatactcgac aatcgatgaa cacaactcag
cccaaactga aaacgggctt gttagaactg 1380
gaaatcaata gtttgtccaa gatcttatgt
gtttgtgtgt ttgcattatc tgtcatctta 1440
gtgctattcc aaggaatagc tgatgattgg
tacgtcgata tcatgcggtt tctcattcta 1500
ttctccacta ttatcccagt gtctctgaga
gttaaccttg atcttggaaa gtcagtccat 1560
gctcatcaaa tagaaactga tagctcaata
cctgaaaccg ttgttagaac tagtacaata 1620
ccggaagacc tgggaagaat tgaataccta
ttaagtgaca aaactggaac tcttactcaa 1680
aatgatatgg aaatgaaaaa actacaccta
ggaacagtct cttatgctgg tgataccatg 1740
gatattattt ctgatcatgt taaaggtctt
aataacgcta aaacatcgag gaaagatctt 1800
ggtatgagaa taagagattt ggttacaact
ctggccatct g 1841
<210> 89
<211> 1729
<212> DNA
<213> 人工序列
<220>
<223> PpHIS1 营养缺陷标记物
<400> 89
caagttgcgt ccggtatacg taacgtctca
cgatgatcaa agataatact taatcttcat 60
ggtctactga ataactcatt taaacaattg
actaattgta cattatattg aacttatgca 120
tcctattaac gtaatcttct ggcttctctc
tcagactcca tcagacacag aatatcgttc 180
tctctaactg gtcctttgac gtttctgaca
atagttctag aggagtcgtc caaaaactca 240
actctgactt gggtgacacc accacgggat
ccggttcttc cgaggacctt gatgaccttg 300
gctaatgtaa ctggagtttt agtatccatt
ttaagatgtg tgtttctgta ggttctgggt 360
tggaaaaaaa ttttagacac cagaagagag
gagtgaactg gtttgcgtgg gtttagactg 420
tgtaaggcac tactctgtcg aagttttaga
taggggttac ccgctccgat gcatgggaag 480
cgattagccc ggctgttgcc cgtttggttt
ttgaagggta attttcaata tctctgtttg 540
agtcatcaat ttcatattca aagattcaaa
aacaaaatct ggtccaagga gcgcatttag 600
gattatggag ttggcgaatc acttgaacga
tagactatta tttgctgttc ctaaagaggg 660
cagattgtat gagaaatgcg ttgaattact
taggggatca gatattcagt ttcgaagatc 720
cagtagattg gatatagctt tgtgcactaa
cctgcccctg gcattggttt tccttccagc 780
tgctgacatt cccacgtttg taggagaggg
taaatgtgat ttgggtataa ctggtattga 840
ccaggttcag gaaagtgacg tagatgtcat
acctttatta gacttgaatt tcggtaagtg 900
caagttgcag attcaagttc ccgagaatgg
tgacttgaaa gaacctaaac agctaattgg 960
taaagaaatt gtttcctcct ttactagctt
aaccaccagg tactttgaac aactggaagg 1020
agttaagcct ggtgagccac taaagacaaa
aatcaaatat gttggagggt ctgttgaggc 1080
ctcttgtgcc ctaggagttg ccgatgctat
tgtggatctt gttgagagtg gagaaaccat 1140
gaaagcggca gggctgatcg atattgaaac
tgttctttct acttccgctt acctgatctc 1200
ttcgaagcat cctcaacacc cagaactgat
ggatactatc aaggagagaa ttgaaggtgt 1260
actgactgct cagaagtatg tcttgtgtaa
ttacaacgca cctagaggta accttcctca 1320
gctgctaaaa ctgactccag gcaagagagc
tgctaccgtt tctccattag atgaagaaga 1380
ttgggtggga gtgtcctcga tggtagagaa
gaaagatgtt ggaagaatca tggacgaatt 1440
aaagaaacaa ggtgccagtg acattcttgt
ctttgagatc agtaattgta gagcatagat 1500
agaataatat tcaagaccaa cggcttctct
tcggaagctc caagtagctt atagtgatga 1560
gtaccggcat atatttatag gcttaaaatt
tcgagggttc actatattcg tttagtggga 1620
agagttcctt tcactcttgt tatctatatt
gtcagcgtgg actgtttata actgtaccaa 1680
cttagtttct ttcaactcca ggttaagaga cataaatgtc
ctttgatgc 1729
<210> 90
<211> 1231
<212> DNA
<213> 人工序列
<220>
<223> PpPRO1的5'-区
<400> 90
gaagggccat cgaattgtca tcgtctcctc
aggtgccatc gctgtgggca tgaagagagt 60
caacatgaag cggaaaccaa aaaagttaca
gcaagtgcag gcattggctg ctataggaca 120
aggccgtttg ataggacttt gggacgacct
tttccgtcag ttgaatcagc ctattgcgca 180
gattttactg actagaacgg atttggtcga
ttacacccag tttaagaacg ctgaaaatac 240
attggaacag cttattaaaa tgggtattat
tcctattgtc aatgagaatg acaccctatc 300
cattcaagaa atcaaatttg gtgacaatga
caccttatcc gccataacag ctggtatgtg 360
tcatgcagac tacctgtttt tggtgactga
tgtggactgt ctttacacgg ataaccctcg 420
tacgaatccg gacgctgagc caatcgtgtt
agttagaaat atgaggaatc taaacgtcaa 480
taccgaaagt ggaggttccg ccgtaggaac
aggaggaatg acaactaaat tgatcgcagc 540
tgatttgggt gtatctgcag gtgttacaac
gattatttgc aaaagtgaac atcccgagca 600
gattttggac attgtagagt acagtatccg
tgctgataga gtcgaaaatg aggctaaata 660
tctggtcatc aacgaagagg aaactgtgga
acaatttcaa gagatcaatc ggtcagaact 720
gagggagttg aacaagctgg acattccttt
gcatacacgt ttcgttggcc acagttttaa 780
tgctgttaat aacaaagagt tttggttact
ccatggacta aaggccaacg gagccattat 840
cattgatcca ggttgttata aggctatcac
tagaaaaaac aaagctggta ttcttccagc 900
tggaattatt tccgtagagg gtaatttcca
tgaatacgag tgtgttgatg ttaaggtagg 960
actaagagat ccagatgacc cacattcact
agaccccaat gaagaacttt acgtcgttgg 1020
ccgtgcccgt tgtaattacc ccagcaatca
aatcaacaaa attaagggtc tacaaagctc 1080
gcagatcgag caggttctag gttacgctga
cggtgagtat gttgttcaca gggacaactt 1140
ggctttccca gtatttgccg atccagaact
gttggatgtt gttgagagta ccctgtctga 1200
acaggagaga gaatccaaac caaataaata
g 1231
<210> 91
<211> 1425
<212> DNA
<213> 人工序列
<220>
<223> PpPRO1的3'-区
<400> 91
aatttcacat atgctgcttg attatgtaat
tataccttgc gttcgatggc atcgatttcc 60
tcttctgtca atcgcgcatc gcattaaaag
tatacttttt tttttttcct atagtactat 120
tcgccttatt ataaactttg ctagtatgag
ttctaccccc aagaaagagc ctgatttgac 180
tcctaagaag agtcagcctc caaagaatag
tctcggtggg ggtaaaggct ttagtgagga 240
gggtttctcc caaggggact tcagcgctaa
gcatatacta aatcgtcgcc ctaacaccga 300
aggctcttct gtggcttcga acgtcatcag
ttcgtcatca ttgcaaaggt taccatcctc 360
tggatctgga agcgttgctg tgggaagtgt
gttgggatct tcgccattaa ctctttctgg 420
agggttccac gggcttgatc caaccaagaa
taaaatagac gttccaaagt cgaaacagtc 480
aaggagacaa agtgttcttt ctgacatgat
ttccacttct catgcagcta gaaatgatca 540
ctcagagcag cagttacaaa ctggacaaca
atcagaacaa aaagaagaag atggtagtcg 600
atcttctttt tctgtttctt cccccgcaag
agatatccgg cacccagatg tactgaaaac 660
tgtcgagaaa catcttgcca atgacagcga
gatcgactca tctttacaac ttcaaggtgg 720
agatgtcact agaggcattt atcaatgggt
aactggagaa agtagtcaaa aagataaccc 780
gcctttgaaa cgagcaaata gttttaatga
tttttcttct gtgcatggtg acgaggtagg 840
caaggcagat gctgaccacg atcgtgaaag
cgtattcgac gaggatgata tctccattga 900
tgatatcaaa gttccgggag ggatgcgtcg
aagtttttta ttacaaaagc atagagacca 960
acaactttct ggactgaata aaacggctca
ccaaccaaaa caacttacta aacctaattt 1020
cttcacgaac aactttatag agtttttggc
attgtatggg cattttgcag gtgaagattt 1080
ggaggaagac gaagatgaag atttagacag
tggttccgaa tcagtcgcag tcagtgatag 1140
tgagggagaa ttcagtgagg ctgacaacaa
tttgttgtat gatgaagagt ctctcctatt 1200
agcacctagt acctccaact atgcgagatc
aagaatagga agtattcgta ctcctactta 1260
tggatctttc agttcaaatg ttggttcttc
gtctattcat cagcagttaa tgaaaagtca 1320
aatcccgaag ctgaagaaac gtggacagca
caagcataaa acacaatcaa aaatacgctc 1380
gaagaagcaa actaccaccg taaaagcagt
gttgctgcta ttaaa 1425
<210> 92
<211> 501
<212> DNA
<213> 人工序列
<220>
<223> 编码截短的 hEPO DNA (密码子优化的)
<400> 92
gctccaccaa gattgatttg tgactccaga
gttttggaga gatacttgtt ggaggctaaa 60
gaggctgaga acatcactac tggttgtgct
gaacactgtt ccttgaacga gaacatcaca 120
gttccagaca ctaaggttaa cttctacgct
tggaagagaa tggaagttgg acaacaggct 180
gttgaagttt ggcaaggatt ggctttgttg
tccgaggctg ttttgagagg tcaagctttg 240
ttggttaact cctcccaacc atgggaacca
ttgcaattgc acgttgacaa ggctgtttct 300
ggattgagat ccttgactac tttgttgaga
gctttgggtg ctcagaaaga ggctatttct 360
ccaccagatg ctgcttcagc tgctccattg
agaactatca ctgctgacac tttcagaaag 420
ttgttcagag tttactccaa cttcttgaga
ggaaagttga agttgtacac tggtgaagct 480
tgtagaactg gtgactagta a 501
<210> 93
<211> 165
<212> PRT
<213> 人工序列
<220>
<223> 截短的 hEPO
<400> 93
Ala Pro Pro Arg Leu Ile Cys Asp
Ser Arg Val Leu Glu Arg Tyr Leu
1
5 10 15
Leu Glu Ala Lys Glu Ala Glu Asn
Ile Thr Thr Gly Cys Ala Glu His
20 25 30
Cys Ser Leu Asn Glu Asn Ile Thr
Val Pro Asp Thr Lys Val Asn Phe
35 40 45
Tyr Ala Trp Lys Arg Met Glu Val
Gly Gln Gln Ala Val Glu Val Trp
50 55 60
Gln Gly Leu Ala Leu Leu Ser Glu
Ala Val Leu Arg Gly Gln Ala Leu
65 70 75 80
Leu Val Asn Ser Ser Gln Pro Trp
Glu Pro Leu Gln Leu His Val Asp
85 90 95
Lys Ala Val Ser Gly Leu Arg Ser
Leu Thr Thr Leu Leu Arg Ala Leu
100 105 110
Gly Ala Gln Lys Glu Ala Ile Ser
Pro Pro Asp Ala Ala Ser Ala Ala
115 120 125
Pro Leu Arg Thr Ile Thr Ala Asp
Thr Phe Arg Lys Leu Phe Arg Val
130 135 140
Tyr Ser Asn Phe Leu Arg Gly Lys
Leu Lys Leu Tyr Thr Gly Glu Ala
145 150 155 160
Cys Arg Thr Gly Asp
165
<210> 94
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 编码鸡溶菌酶信号肽 (CLSP)
<400> 94
atgctgggta agaacgaccc aatgtgtctt
gttttggtct tgttgggatt gactgctttg 60
ttgggtatct gtcaaggt
78
<210> 95
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> 鸡溶菌酶信号肽 (CLSP)
<400> 95
Met Leu Gly Lys Asn Asp Pro Met
Cys Leu Val Leu Val Leu Leu Gly
1
5 10 15
Leu Thr Ala Leu Leu Gly Ile Cys
Gln Gly
20 25
<210> 96
<211> 1892
<212> DNA
<213> 人工序列
<220>
<223> 编码 PpAde2
<400> 96
atggattctc aggtaatagg tattctagga
ggaggccagc taggccgaat gattgttgag 60
gccgctagca ggctcaatat caagaccgtg
attcttgatg atggtttttc acctgctaag 120
cacattaatg ctgcgcaaga ccacatcgac
ggatcattca aagatgagga ggctatcgcc 180
aagttagctg ccaaatgtga tgttctcact
gtagagattg agcatgtcaa cacagatgct 240
ctaaagagag ttcaagacag aactggaatc
aagatatatc ctttaccaga gacaatcgaa 300
ctaatcaagg ataagtactt gcaaaaggaa
catttgatca agcacaacat ttcggtgaca 360
aagtctcagg gtatagaatc taatgaaaag
gcgctgcttt tgtttggaga agagaatgga 420
tttccatatc tgttgaagtc ccggactatg
gcttatgatg gaagaggcaa ttttgtagtg 480
gagtctaaag aggacatcag taaggcatta
gaattcttga aagatcgtcc attgtatgcc 540
gagaagtttg ctccttttgt taaagaatta
gcggtaatgg ttgtgagatc actggaaggc 600
gaagtattct cctacccaac cgtagaaact
gtgcacaagg acaatatctg tcatattgtg 660
tatgctccgg ccagagttaa tgacaccatc
caaaagaaag ctcaaatatt agctgaaaac 720
actgtgaaga ctttcccagg cgctggaatc
ttcggagttg agatgttcct attgtctgat 780
ggagaacttc ttgtaaatga gattgctcca
aggccccaca attctggtca ctatacaatc 840
gatgcatgtg taacatctca gttcgaagca
catgtaagag ccataactgg tctgccaatg 900
ccactagatt tcaccaaact atctacttcc
aacaccaacg ctattatgct caatgttttg 960
ggtgctgaaa aatctcacgg ggaattagag
ttttgtagaa gagccttaga aacacccggt 1020
gcttctgtat atctgtacgg aaagaccacc
cgattggctc gtaagatggg tcatatcaac 1080
ataataggat cttccatgtt ggaagcagaa
caaaagttag agtacattct agaagaatca 1140
acccacttac catccagtac tgtatcagct
gacactaaac cgttggttgg agttatcatg 1200
ggttcagact ctgatctacc tgtgatttcg
aaaggttgcg atattttaaa acagtttggt 1260
gttccattcg aagttactat tgtctctgct
catagaacac cacagagaat gaccagatat 1320
gcctttgaag ccgctagtag aggtatcaag
gctatcattg caggtgctgg tggtgctgct 1380
catcttccag gaatggttgc tgccatgact
ccgttgccag tcattggtgt tcctgtcaag 1440
ggctctacgt tggatggtgt agactcgcta
cactcgattg tccaaatgcc tagaggtgtt 1500
cctgtggcta cggttgctat caacaacgcc
accaatgccg ctctgttggc catcaggatt 1560
ttaggtacaa ttgaccacaa atggcaaaag
gaaatgtcca agtatatgaa tgcaatggag 1620
accgaagtgt tggggaaggc atccaacttg
gaatctgaag ggtatgaatc ctatttgaag 1680
aatcgtcttt gaatttagta ttgtttttta
atagatgtat atataatagt acacgtaact 1740
tatctattcc attcataatt ttattttaaa
ggttcggtag aaatttgtcc tccaaaaagt 1800
tggttagagc ctggcagttt tgataggcat
tattatagat tgggtaatat ttaccctgca 1860
cctggaggaa ctttgcaaag agcctcatgt
gc 1892
<210> 97
<211> 563
<212> PRT
<213> 巴斯德毕赤氏酵母
<400> 97
Met Asp Ser Gln Val Ile Gly Ile
Leu Gly Gly Gly Gln Leu Gly Arg
1
5 10 15
Met Ile Val Glu Ala Ala Ser Arg
Leu Asn Ile Lys Thr Val Ile Leu
20 25 30
Asp Asp Gly Phe Ser Pro Ala Lys
His Ile Asn Ala Ala Gln Asp His
35 40 45
Ile Asp Gly Ser Phe Lys Asp Glu
Glu Ala Ile Ala Lys Leu Ala Ala
50 55 60
Lys Cys Asp Val Leu Thr Val Glu
Ile Glu His Val Asn Thr Asp Ala
65 70 75 80
Leu Lys Arg Val Gln Asp Arg Thr
Gly Ile Lys Ile Tyr Pro Leu Pro
85 90 95
Glu Thr Ile Glu Leu Ile Lys Asp
Lys Tyr Leu Gln Lys Glu His Leu
100
105 110
Ile Lys His Asn Ile Ser Val Thr
Lys Ser Gln Gly Ile Glu Ser Asn
115 120 125
Glu Lys Ala Leu Leu Leu Phe Gly
Glu Glu Asn Gly Phe Pro Tyr Leu
130
135 140
Leu Lys Ser Arg Thr Met Ala Tyr
Asp Gly Arg Gly Asn Phe Val Val
145 150 155 160
Glu Ser Lys Glu Asp Ile Ser Lys
Ala Leu Glu Phe Leu Lys Asp Arg
165 170 175
Pro Leu Tyr Ala Glu Lys Phe Ala
Pro Phe Val Lys Glu Leu Ala Val
180 185 190
Met Val Val Arg Ser Leu Glu Gly
Glu Val Phe Ser Tyr Pro Thr Val
195 200 205
Glu Thr Val His Lys Asp Asn Ile
Cys His Ile Val Tyr Ala Pro Ala
210 215 220
Arg Val Asn Asp Thr Ile Gln Lys
Lys Ala Gln Ile Leu Ala Glu Asn
225 230 235 240
Thr Val Lys Thr Phe Pro Gly Ala
Gly Ile Phe Gly Val Glu Met Phe
245 250 255
Leu Leu Ser Asp Gly Glu Leu Leu
Val Asn Glu Ile Ala Pro Arg Pro
260 265 270
His Asn Ser Gly His Tyr Thr Ile
Asp Ala Cys Val Thr Ser Gln Phe
275 280 285
Glu Ala His Val Arg Ala Ile Thr
Gly Leu Pro Met Pro Leu Asp Phe
290 295 300
Thr Lys Leu Ser Thr Ser Asn Thr
Asn Ala Ile Met Leu Asn Val Leu
305 310 315 320
Gly Ala Glu Lys Ser His Gly Glu
Leu Glu Phe Cys Arg Arg Ala Leu
325 330 335
Glu Thr Pro Gly Ala Ser Val Tyr
Leu Tyr Gly Lys Thr Thr Arg Leu
340 345 350
Ala Arg Lys Met Gly His Ile Asn
Ile Ile Gly Ser Ser Met Leu Glu
355 360 365
Ala Glu Gln Lys Leu Glu Tyr Ile
Leu Glu Glu Ser Thr His Leu Pro
370 375 380
Ser Ser Thr Val Ser Ala Asp Thr
Lys Pro Leu Val Gly Val Ile Met
385 390 395 400
Gly Ser Asp Ser Asp Leu Pro Val
Ile Ser Lys Gly Cys Asp Ile Leu
405 410 415
Lys Gln Phe Gly Val Pro Phe Glu
Val Thr Ile Val Ser Ala His Arg
420 425 430
Thr Pro Gln Arg Met Thr Arg Tyr
Ala Phe Glu Ala Ala Ser Arg Gly
435 440 445
Ile Lys Ala Ile Ile Ala Gly Ala
Gly Gly Ala Ala His Leu Pro Gly
450 455 460
Met Val Ala Ala Met Thr Pro Leu
Pro Val Ile Gly Val Pro Val Lys
465 470 475 480
Gly Ser Thr Leu Asp Gly Val Asp
Ser Leu His Ser Ile Val Gln Met
485 490 495
Pro Arg Gly Val Pro Val Ala Thr
Val Ala Ile Asn Asn Ala Thr Asn
500 505 510
Ala Ala Leu Leu Ala Ile Arg Ile
Leu Gly Thr Ile Asp His Lys Trp
515 520 525
Gln Lys Glu Met Ser Lys Tyr Met
Asn Ala Met Glu Thr Glu Val Leu
530 535 540
Gly Lys Ala Ser Asn Leu Glu Ser
Glu Gly Tyr Glu Ser Tyr Leu Lys
545 550 555 560
Asn Arg Leu
<210> 98
<211> 1302
<212> DNA
<213> 人工序列
<220>
<223> Pp TRP2: 5' 和 ORF
<400> 98
actgggcctt tagagggtgc tgaagttgac
cccttggtgc ttctggaaaa agaactgaag 60
ggcaccagac aagcgcaact tcctggtatt
cctcgtctaa gtggtggtgc cataggatac 120
atctcgtacg attgtattaa gtactttgaa
ccaaaaactg aaagaaaact gaaagatgtt 180
ttgcaacttc cggaagcagc tttgatgttg
ttcgacacga tcgtggcttt tgacaatgtt 240
tatcaaagat tccaggtaat tggaaacgtt
tctctatccg ttgatgactc ggacgaagct 300
attcttgaga aatattataa gacaagagaa
gaagtggaaa agatcagtaa agtggtattt 360
gacaataaaa ctgttcccta ctatgaacag
aaagatatta ttcaaggcca aacgttcacc 420
tctaatattg gtcaggaagg gtatgaaaac
catgttcgca agctgaaaga acatattctg 480
aaaggagaca tcttccaagc tgttccctct
caaagggtag ccaggccgac ctcattgcac 540
cctttcaaca tctatcgtca tttgagaact
gtcaatcctt ctccatacat gttctatatt 600
gactatctag acttccaagt tgttggtgct
tcacctgaat tactagttaa atccgacaac 660
aacaacaaaa tcatcacaca tcctattgct
ggaactcttc ccagaggtaa aactatcgaa 720
gaggacgaca attatgctaa gcaattgaag
tcgtctttga aagacagggc cgagcacgtc 780
atgctggtag atttggccag aaatgatatt
aaccgtgtgt gtgagcccac cagtaccacg 840
gttgatcgtt tattgactgt ggagagattt
tctcatgtga tgcatcttgt gtcagaagtc 900
agtggaacat tgagaccaaa caagactcgc
ttcgatgctt tcagatccat tttcccagca 960
ggtaccgtct ccggtgctcc gaaggtaaga
gcaatgcaac tcataggaga attggaagga 1020
gaaaagagag gtgtttatgc gggggccgta
ggacactggt cgtacgatgg aaaatcgatg 1080
gacacatgta ttgccttaag aacaatggtc
gtcaaggacg gtgtcgctta ccttcaagcc 1140
ggaggtggaa ttgtctacga ttctgacccc
tatgacgagt acatcgaaac catgaacaaa 1200
atgagatcca acaataacac catcttggag
gctgagaaaa tctggaccga taggttggcc 1260
agagacgaga atcaaagtga atccgaagaa
aacgatcaat ga 1302
<210> 99
<211> 1085
<212> DNA
<213> 人工序列
<220>
<223> Pp TRP2: 3'
<400> 99
acggaggacg taagtaggaa tttatgtaat
catgccaata catctttaga tttcttcctc 60
ttctttttaa cgaaagacct ccagttttgc
actctcgact ctctagtatc ttcccatttc 120
tgttgctgca acctcttgcc ttctgtttcc
ttcaattgtt cttctttctt ctgttgcact 180
tggccttctt cctccatctt tcgttttttt
tcaagccttt tcagcagttc ttcttccaag 240
agcagttctt tgattttctc tctccaatcc
accaaaaaac tggatgaatt caaccgggca 300
tcatcaatgt tccactttct ttctcttatc
aataatctac gtgcttcggc atacgaggaa 360
tccagttgct ccctaatcga gtcatccaca
aggttagcat gggccttttt cagggtgtca 420
aaagcatctg gagctcgttt attcggagtc
ttgtctggat ggatcagcaa agactttttg 480
cggaaagtct ttcttatatc ttccggagaa
caacctggtt tcaaatccaa gatggcatag 540
ctgtccaatt tgaaagtgga aagaatcctg
ccaatttcct tctctcgtgt cagctcgttc 600
tcctcctttt gcaacaggtc cacttcatct
ggcatttttc tttatgttaa ctttaattat 660
tattaattat aaagttgatt atcgttatca
aaataatcat attcgagaaa taatccgtcc 720
atgcaatata taaataagaa ttcataataa
tgtaatgata acagtacctc tgatgacctt 780
tgatgaaccg caattttctt tccaatgaca
agacatccct ataatacaat tatacagttt 840
atatatcaca aataatcacc tttttataag
aaaaccgtcc tctccgtaac agaacttatt 900
atccgcacgt tatggttaac acactactaa
taccgatata gtgtatgaag tcgctacgag 960
atagccatcc aggaaactta ccaattcatc
agcactttca tgatccgatt gttggcttta 1020
ttctttgcga gacagatact tgccaatgaa
ataactgatc ccacagatga gaatccggtg 1080
ctcgt
1085
<210> 100
<211> 1007
<212> DNA
<213> 人工序列
<220>
<223> Pp ADE2 5' 区
<400> 100
cttaaaatca tctgcctcac cccaccgacc
aatgggaatt ctagaaacaa tttcattgct 60
cttcttctcg ttaccataag aatcggctgt
catgtttgac ttaacgaacc ctggaacaag 120
ggaattcacg gtaatacctt ttggagcaag
ttcaaccgat agagccttca ttaatgagtt 180
gattgcacct ttggtggtcg catataccga
ttgattcggg taggtcactt cgaaactgta 240
cagggaggca gtaaagatga tcctaccctt
aatctggttc ttaataaagt gtttagtgac 300
tagctgtgtc aatctaaatg gaaaatcgac
atttaccttt tggatagccg cgtaatcttt 360
ctccgtaaaa cttgtaaact cagatttaat
ggcaatggca gcgttgttga ttaaaatgtc 420
aatctttcca gtggaactct tctccaccgc
aggactcgtt acggtctctt ccagctttgc 480
aagatcggca tccactagat ccaactcaat
tgtatgtatg gaggcaccat cggcatttga 540
cattctcacc tcttcaatga aagccgttgg
gtctgtagaa ggtctatgga taagaataag 600
ttctgcacct gcttcataaa gtcctcgaac
tattccttgg cctaatccgc tggtaccacc 660
ggtgatcaag gcgaccttac cattcaaaga
aaacaaatca gcggacatta gcgacttgaa 720
tagggaatgg gttagacaaa tgaaagccga
cgagccagca ctttatagta agtgcaggtg 780
agtcaataag aataaatgta tggcttgctg
tccctatcgc gtaagaagct tactaagatc 840
gcctaaattg aaaagttgaa caaatcagtt
ctagctggcc tccatcagca tttcgttctc 900
ctctgatcat ctttgccaat cgctagcatg
ccctcagcgt gcaaggaaaa gcacgcttct 960
ttcttatcga cgtattttca actatggcag
agccaggtta gcaagtc 1007
<210> 101
<211> 1676
<212> DNA
<213> 人工序列
<220>
<223> Pp ADE2 3' 区
<400> 101
atttagtatt gttttttaat agatgtatat
ataatagtac acgtaactta tctattccat 60
tcataatttt attttaaagg ttcggtagaa
atttgtcctc caaaaagttg gttagagcct 120
ggcagttttg ataggcatta ttatagattg
ggtaatattt accctgcacc tggaggaact 180
ttgcaaagag cctcatgtgc tctaaaagga
tgtcagaatt ccaacatttc aaaattatat 240
ctgcatgcgt ctgtaatact ggaactgtta
tttttctggt caggatttca ccgctcttgt 300
cgtcatgttt ctcgtcgtct gaaagtaaac
tgactttcct ctttccataa acacaaaaat 360
cgattgcaac ttggttattc ttgagattga
aatttgctgt gtcttcagtg cttagctgaa 420
tatcaacaaa cttacttagt actaataacg
aagcactatg gtaagtggca taacatagtg 480
gtattgaagc gaacagtgga tattgaaccc
aagcattggc aacatctggc tctgttgata 540
ctgatccgga tcgtttggca ccaattcctg
aaacggcgta gtgccaccaa ggtttcgatt 600
tgagaacagg ttcatcatca gagtcaacca
ccccaatgtc aatggcaggc tccaacgaag 660
taggtccaac aacaacagga agtatttgac
cttgaagatc tgttccttta tgatccacca 720
caccttgccc caattccaat aactttacca
gtcccgatgc agacatgata actggtacta 780
atgatctcca ttgattttcg tcggcactac
gtaaagcctc caaaaatgaa ttcagaatat 840
cttctgaaac tagattctgc ttctgtgatt
caagcattgc tttatgtaga catctcttga 900
ataaaagcaa ttctccacat attggtgtgt
gtaagataga tctggaaaga tgtatctgga 960
atagtccagt caacgttgtg caattgatta
gcattacctt actgtgaaca tctctatcta 1020
caacaacaga ctcaattcga tagacgttcc
gggaaagttt ttcaagcgca ttcagtttgc 1080
tgttgaacaa agtgactttg ctttccaatg
tgcaaatacc cctgtatatc aagtccatca 1140
catcactcaa gaccttggtg gaaaagaatg
aaacagctgg agcataattt tcgaatgaat 1200
taggtaaggt cacttcatcc ttatctgttg
taatgctata atcaatagcg gaactaacat 1260
cttcccatgt aacaggtttc ttgatctctg
aatctgaatc tttatttgaa aaagaattga 1320
aaaaagactc atcactcatt gggaattcaa
ggtcattagg gtattccatt gttagttctg 1380
gtctaggttt aaagggatca ccttcgttaa
gacgatggaa aatagctaat ctgtacaata 1440
accagatact tctaacgaag ctctctctat
ccatcagttg acgtgttgag gatatctgaa 1500
ctagctcttt ccactgcgaa tcaggcatgc
tcgtatagct ggcaagcatg ttattcagct 1560
ttaccaagtt agaagccctt tggaaaccat
ctatagattc ccgaaaaaac ttatacccac 1620
tgagggtttc actgagcata gtcagtgaca
tcaaagagca tttcaaatcc atctca 1676
<210> 102
<211> 582
<212> DNA
<213> 人工序列
<220>
<223> NATR ORF
<400> 102
atgggtacca ctcttgacga cacggcttac
cggtaccgca ccagtgtccc gggggacgcc 60
gaggccatcg aggcactgga tgggtccttc
accaccgaca ccgtcttccg cgtcaccgcc 120
accggggacg gcttcaccct gcgggaggtg
ccggtggacc cgcccctgac caaggtgttc 180
cccgacgacg aatcggacga cgaatcggac
gacggggagg acggcgaccc ggactcccgg 240
acgttcgtcg cgtacgggga cgacggcgac
ctggcgggct tcgtggtcgt ctcgtactcc 300
ggctggaacc gccggctgac cgtcgaggac
atcgaggtcg ccccggagca ccgggggcac 360
ggggtcgggc gcgcgttgat ggggctcgcg
acggagttcg cccgcgagcg gggcgccggg 420
cacctctggc tggaggtcac caacgtcaac
gcaccggcga tccacgcgta ccggcggatg 480
gggttcaccc tctgcggcct ggacaccgcc
ctgtacgacg gcaccgcctc ggacggcgag 540
caggcgctct acatgagcat gccctgcccc
taatcagtac tg 582
<210> 103
<211> 1029
<212> DNA
<213> 人工序列
<220>
<223> HygR ORF
<400> 103
atgggtaaaa agcctgaact caccgcgacg
tctgtcgaga agtttctgat cgaaaagttc 60
gacagcgtct ccgacctgat gcagctctcg
gagggcgaag aatctcgtgc tttcagcttc 120
gatgtaggag ggcgtggata tgtcctgcgg
gtaaatagct gcgccgatgg tttctacaaa 180
gatcgttatg tttatcggca ctttgcatcg
gccgcgctcc cgattccgga agtgcttgac 240
attggggaat tcagcgagag cctgacctat
tgcatctccc gccgtgcaca gggtgtcacg 300
ttgcaagacc tgcctgaaac cgaactgccc
gctgttctgc agccggtcgc ggaggccatg 360
gatgcgatcg ctgcggccga tcttagccag
acgagcgggt tcggcccatt cggaccgcaa 420
ggaatcggtc aatacactac atggcgtgat
ttcatatgcg cgattgctga tccccatgtg 480
tatcactggc aaactgtgat ggacgacacc
gtcagtgcgt ccgtcgcgca ggctctcgat 540
gagctgatgc tttgggccga ggactgcccc
gaagtccggc acctcgtgca cgcggatttc 600
ggctccaaca atgtcctgac ggacaatggc
cgcataacag cggtcattga ctggagcgag 660
gcgatgttcg gggattccca atacgaggtc
gccaacatct tcttctggag gccgtggttg 720
gcttgtatgg agcagcagac gcgctacttc
gagcggaggc atccggagct tgcaggatcg 780
ccgcggctcc gggcgtatat gctccgcatt
ggtcttgacc aactctatca gagcttggtt 840
gacggcaatt tcgatgatgc agcttgggcg
cagggtcgat gcgacgcaat cgtccgatcc 900
ggagccggga ctgtcgggcg tacacaaatc
gcccgcagaa gcgcggccgt ctggaccgat 960
ggctgtgtag aagtactcgc cgatagtgga
aaccgacgcc ccagcactcg tccgagggca 1020
aaggaatag 1029
<210> 104
<211> 2957
<212> DNA
<213> 人工序列
<220>
<223> PpPEP4 区
<400> 104
atttgagtca cctgctttag ggctggaaga
tatttggtta ctagatttta gtacaaactc 60
ttgctttgtc aatgacatta aaataggcaa
gaatcgcaaa actcaaatat ttcatggaga 120
tgagatatgc ttgttcaaag atgcccagaa
aaaagagcaa ctcgtttata gggttcatat 180
tgatgatgga acaggccttt tccagggagg
tgaaagaacc caagccaatt ctgatgacat 240
tctggatatt gatgaggttg atgaaaagtt
aagagaacta ttgacaagag cctcaaggaa 300
acggcatatc acccctgcat tggaaactcc
tgataaacgt gtaaaaagag cttatttgaa 360
cagtattact gataactctt gatggacctt
aaagatgtat aatagtagac agaattcata 420
atggtgagat taggtaatcg tccggaatag
gaatagtggt ttggggcgat taatcgcacc 480
tgccttatat ggtaagtacc ttgaccgata
aggtggcaac tatttagaac aaagcaagcc 540
acctttcttt atctgtaact ctgtcgaagc
aagcatcttt actagagaac atctaaacca 600
ttttacattc tagagttcca tttctcaatt
actgataatc aatttaaaga tgatatttga 660
cggtactacg atgtcaattg ccattggttt
gctctctact ctaggtattg gtgctgaagc 720
caaagttcat tctgctaaga tacacaagca
tccagtctca gaaactttaa aagaggccaa 780
ttttgggcag tatgtctctg ctctggaaca
taaatatgtt tctctgttca acgaacaaaa 840
tgctttgtcc aagtcgaatt ttatgtctca
gcaagatggt tttgccgttg aagcttcgca 900
tgatgctcca cttacaaact atcttaacgc
tcagtatttt actgaggtat cattaggtac 960
ccctccacaa tcgttcaagg tgattcttga
cacaggatcc tccaatttat gggttcctag 1020
caaagattgt ggatcattag cttgcttctt
gcatgctaag tatgaccatg atgagtcttc 1080
tacttataag aagaatggta gtagctttga
aattaggtat ggatccggtt ccatggaagg 1140
gtatgtttct caggatgtgt tgcaaattgg
ggatttgacc attcccaaag ttgattttgc 1200
tgaggccaca tcggagccgg ggttggcctt
cgcttttggc aaatttgacg gaattttggg 1260
gcttgcttat gattcaatat cagtaaataa
gattgttcct ccaatttaca aggctttgga 1320
attagatctc cttgacgaac caaaatttgc
cttctacttg ggggatacgg acaaagatga 1380
atccgatggc ggtttggcca catttggtgg
tgtggacaaa tctaagtatg aaggaaagat 1440
cacctggttg cctgtcagaa gaaaggctta
ctgggaggtc tcttttgatg gtgtaggttt 1500
gggatccgaa tatgctgaat tgcaaaaaac
tggtgcagcc atcgacactg gaacctcatt 1560
gattgctttg cccagtggcc tagctgaaat
tctcaatgca gaaattggtg ctaccaaggg 1620
ttggtctggt caatacgctg tggactgtga
cactagagac tctttgccag acttaacttt 1680
aaccttcgcc ggttacaact ttaccattac
tccatatgac tatactttgg aggtttctgg 1740
gtcatgtatt agtgctttca cccccatgga
ctttcctgaa ccaataggtc ctttggcaat 1800
cattggtgac tcgttcttga gaaaatatta
ctcagtttat gacctaggca aagatgcagt 1860
aggtttagcc aagtctattt aggcaagaat
aaaagttgct cagctgaact tatttggtta 1920
cttatcaggt agtgaagatg tagagaatat
atgtttaggt attttttttt agtttttctc 1980
ctataactca tcttcagtac gtgattgctt
gtcagctacc ttgacagggg cgcataagtg 2040
atatcgtgta ctgctcaatc aagatttgcc
tgctccattg ataagggtat aagagaccca 2100
cctgctcctc tttaaaattc tctcttaact
gttgtgaaaa tcatcttcga agcaaattcg 2160
agtttaaatc tatgcggttg gtaactaaag
gtatgtcatg gtggtatata gtttttcatt 2220
ttacctttta ctaatcagtt ttacagaaga
ggaacgtctt tctcaagatc gaaataggac 2280
taaatactgg agacgatggg gtccttattt
gggtgaaagg cagtgggcta cagtaaggga 2340
agactattcc gatgatggag atgcttggtc
tgcttttcct tttgagcaat ctcatttgag 2400
aacttatcgc tggggagagg atggactagc
tggagtctca gacaatcatc aactaatttg 2460
tttctcaatg gcactgtgga atgagaatga
tgatattttg aaggagcgat tatttggggt 2520
cactggagag gctgcaaatc atggagagga
tgttaaggag ctttattatt atcttgataa 2580
tacaccttct cactcttata tgaaatacct
ttacaaatat ccacaatcga aatttcctta 2640
cgaagaattg atttcagaga accgtaaacg
ttccagatta gaaagagagt acgagattac 2700
tgactctgaa gtactgaagg ataacagata
ttttgatgtg atctttgaaa tggcaaagga 2760
cgatgaagat gagaatgaac tttactttag
aattaccgct tacaaccgag gtcccacccc 2820
tgccccttta catgtcgctc cacaggtaac
ctttagaaat acctggtcct ggggtataga 2880
tgaggaaaag gatcacgaca aacctatagc
ttgcaaggaa taccaagaca acaactattc 2940
tattcggtta gatagtt
2957
<210> 105
<211> 388
<212> DNA
<213> 人工序列
<220>
<223> 棉阿舒囊霉 TEF1 启动子
<400> 105
gatctgttta gcttgcctcg tccccgccgg
gtcacccggc cagcgacatg gaggcccaga 60
ataccctcct tgacagtctt gacgtgcgca
gctcaggggc atgatgtgac tgtcgcccgt 120
acatttagcc catacatccc catgtataat
catttgcatc catacatttt gatggccgca 180
cggcgcgaag caaaaattac ggctcctcgc
tgcagacctg cgagcaggga aacgctcccc 240
tcacagacgc gttgaattgt ccccacgccg
cgcccctgta gagaaatata aaaggttagg 300
atttgccact gaggttcttc tttcatatac
ttccttttaa aatcttgcta ggatacagtt 360
ctcacatcac atccgaacat
aaacaacc 388
<210> 106
<211> 247
<212> DNA
<213> 人工序列
<220>
<223> 棉阿舒囊霉 TEF1 终止序列
<400> 106
taatcagtac tgacaataaa aagattcttg
ttttcaagaa cttgtcattt gtatagtttt 60
tttatattgt agttgttcta ttttaatcaa
atgttagcgt gatttatatt ttttttcgcc 120
tcgacatcat ctgcccagat gcgaagttaa
gtgcgcagaa agtaatatca tgcgtcaatc 180
gtatgtgaat gctggtcgct atactgctgt
cgattcgata ctaacgccgc catccagtgt 240
cgaaaac
247
Claims (14)
1.一种在巴斯德毕赤氏酵母中生产成熟的人促红细胞生成素的方法,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖,并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性,所述方法包括:
(a) 提供重组巴斯德毕赤氏酵母宿主细胞,其被遗传工程化以生产唾液酸封端的双分枝N-聚糖,并且不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性,并且不展现选自对于N-聚糖或O-聚糖的β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性的至少一种活性,并且其包括两种或更多种核酸分子,各自编码包含融合到信号肽的成熟的人促红细胞生成素的融合蛋白,所述信号肽靶向ER并且当所述融合蛋白处于ER中时被除去;
(b) 在对表达和加工所述第一和第二融合蛋白有效的条件下在培养基中生长所述宿主细胞;以及
(c) 从所述培养基回收所述成熟的人促红细胞生成素,来产生所述成熟的人促红细胞生成素,其主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
2.权利要求1的方法,其中所述宿主细胞不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶2活性、β-甘露糖基转移酶1活性和β-甘露糖基转移酶3活性。
3.权利要求2的方法,其中所述宿主细胞进一步不展现对于N-聚糖或O-聚糖的β-甘露糖基转移酶4活性。
4.权利要求1的方法,其中所述信号肽是酿酒酵母αMATpre信号肽或鸡溶菌酶信号肽。
5.权利要求1的方法,其中至少一种核酸分子编码下述融合蛋白,其中促红细胞生成素融合到酿酒酵母αMATpre信号肽,并且至少一种核酸分子编码下述融合蛋白,其中促红细胞生成素融合到酿酒酵母αMATpre信号肽鸡溶菌酶信号肽。
6.权利要求1的方法,其中编码促红细胞生成素的核酸分子的核酸序列的密码子为了在巴斯德毕赤氏酵母中表达而被优化。
7.权利要求1的方法,其中与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性在夹心ELISA中测定。
8.权利要求1的方法,其中与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性在Western印迹中测定。
9.权利要求1的方法,其中从所述培养基回收所述成熟的人促红细胞生成素包括阳离子交换层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
10.权利要求1的方法,其中从所述培养基回收所述成熟的人促红细胞生成素包括羟磷灰石层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
11.权利要求1的方法,其中从所述培养基回收所述成熟的人促红细胞生成素包括阴离子交换层析步骤,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
12.一种包含获自权利要求8的方法的成熟的人促红细胞生成素和药学上可接受的盐的组合物,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
13.权利要求12的组合物,其中所述成熟的人促红细胞生成素共轭到亲水性聚合物,所述成熟的人促红细胞生成素主要包含唾液酸封端的双分枝N-聚糖并且没有与针对宿主细胞抗原制得的抗体的可检测的交叉结合活性。
14.权利要求13的组合物,其中所述亲水性聚合物是聚乙二醇聚合物。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US25231209P | 2009-10-16 | 2009-10-16 | |
US61/252312 | 2009-10-16 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800577907A Division CN102648286A (zh) | 2009-10-16 | 2010-10-11 | 在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性的蛋白质的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104031961A true CN104031961A (zh) | 2014-09-10 |
Family
ID=43876456
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410094457.3A Pending CN104031961A (zh) | 2009-10-16 | 2010-10-11 | 生产成熟的人促红细胞生成素的方法以及包含获自该方法的人促红细胞生成素的组合物 |
CN2010800577907A Pending CN102648286A (zh) | 2009-10-16 | 2010-10-11 | 在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性的蛋白质的方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800577907A Pending CN102648286A (zh) | 2009-10-16 | 2010-10-11 | 在巴斯德毕赤氏酵母中生产缺乏与针对宿主细胞抗原的抗体的可检测交叉结合活性的蛋白质的方法 |
Country Status (12)
Country | Link |
---|---|
US (2) | US9139632B2 (zh) |
EP (1) | EP2488657B1 (zh) |
JP (1) | JP2013507921A (zh) |
KR (1) | KR20120084734A (zh) |
CN (2) | CN104031961A (zh) |
AU (1) | AU2010307098A1 (zh) |
BR (1) | BR112012008862A2 (zh) |
CA (1) | CA2776392A1 (zh) |
ES (1) | ES2589655T3 (zh) |
MX (1) | MX2012004381A (zh) |
RU (1) | RU2012120102A (zh) |
WO (1) | WO2011046855A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112888315A (zh) * | 2018-08-21 | 2021-06-01 | 克莱拉食品公司 | 微生物中的蛋白质糖基化的修饰 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3702363A1 (en) * | 2011-04-01 | 2020-09-02 | Genomatica, Inc. | Fadr overexpressing bacterial cells for improved production of fatty acids and derivatives thereof |
AU2013207165B2 (en) | 2012-01-05 | 2018-10-04 | Glykos Finland Oy | Protease deficient filamentous fungal cells and methods of use thereof |
WO2013174927A1 (en) | 2012-05-23 | 2013-11-28 | Novartis International Pharmaceutical Limited | Production of fucosylated glycoproteins |
WO2014041483A2 (en) * | 2012-09-11 | 2014-03-20 | Centre For Bioseparation Technology-Vit | Methods for producing recombinant factor viii chains from non-filamentous fungi, their functional reconstitution and applications thereof |
US9707276B2 (en) | 2012-12-03 | 2017-07-18 | Merck Sharp & Dohme Corp. | O-glycosylated carboxy terminal portion (CTP) peptide-based insulin and insulin analogues |
WO2014138188A1 (en) | 2013-03-07 | 2014-09-12 | The General Hospital Corporation | Human ctla4 mutants and use thereof |
CN105492457A (zh) | 2013-07-04 | 2016-04-13 | 诺华股份有限公司 | O-甘露糖基转移酶缺陷的丝状真菌细胞及其使用方法 |
EP3019602B1 (en) | 2013-07-10 | 2018-09-05 | Glykos Finland Oy | Multiple proteases deficient filamentous fungal cells and methods of use thereof |
CA2954974A1 (en) | 2014-07-21 | 2016-01-28 | Glykos Finland Oy | Production of glycoproteins with mammalian-like n-glycans in filamentous fungi |
US10329323B2 (en) * | 2014-07-25 | 2019-06-25 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Method for purifying antibodies using PBS |
CN104946675A (zh) * | 2015-07-02 | 2015-09-30 | 江苏敖众生物科技有限公司 | 一种鸡蛋清溶菌酶基因(rjm)的克隆及其酵母表达方法 |
CN106957362B (zh) * | 2016-01-12 | 2021-06-18 | 华北制药集团新药研究开发有限责任公司 | 一种毕赤酵母宿主蛋白抗体的制备方法及其应用 |
US20220127368A1 (en) | 2019-02-19 | 2022-04-28 | The Regents Of The University Of Colorado, A Body Corporate | Bispecific immunotoxins targeting human cd25+ccr4+ tumors and regulatory t-cells |
CN110684771A (zh) * | 2019-10-30 | 2020-01-14 | 福建师范大学 | 一种不受甘油和葡萄糖抑制的可诱导启动子及利用该启动子构建的毕赤酵母表达载体 |
CN113549560B (zh) * | 2020-04-24 | 2024-02-13 | 中国人民解放军军事科学院军事医学研究院 | 一种用于糖蛋白制备的工程化酵母构建方法及其菌株 |
CN113754739A (zh) * | 2020-06-03 | 2021-12-07 | 中国人民解放军军事科学院军事医学研究院 | 一种冠状病毒s蛋白rbd糖蛋白的制备方法及其应用 |
CN113621041A (zh) * | 2021-09-26 | 2021-11-09 | 江南大学 | 一种截短的马铃薯糖蛋白Patatin及其制备方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101084233A (zh) * | 2004-04-29 | 2007-12-05 | 格利科菲公司 | 用于在糖蛋白产生中减少或消除a-甘露糖苷酶抗性聚糖的方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US181041A (en) * | 1876-08-15 | Improvement in cultivators | ||
US4818700A (en) | 1985-10-25 | 1989-04-04 | Phillips Petroleum Company | Pichia pastoris argininosuccinate lyase gene and uses thereof |
DK1283265T3 (da) | 2000-05-17 | 2009-11-09 | Mitsubishi Tanabe Pharma Corp | Fremgangsmåde til fremstilling af protein med reduktion af mannosephosphat i sukkerkæden og glycoprotein fremstillet derved |
US8697394B2 (en) * | 2000-06-28 | 2014-04-15 | Glycofi, Inc. | Production of modified glycoproteins having multiple antennary structures |
US7863020B2 (en) | 2000-06-28 | 2011-01-04 | Glycofi, Inc. | Production of sialylated N-glycans in lower eukaryotes |
US7449308B2 (en) | 2000-06-28 | 2008-11-11 | Glycofi, Inc. | Combinatorial DNA library for producing modified N-glycans in lower eukaryotes |
MXPA03000105A (es) | 2000-06-28 | 2004-09-13 | Glycofi Inc | Metodo para producir glicoproteinas modificadas. |
US20080124763A1 (en) * | 2001-04-24 | 2008-05-29 | Erwin Sablon | Constructs and methods for expression of recombinant proteins in methylotrophic yeast cells |
EP1452607A4 (en) | 2001-10-04 | 2005-06-22 | Sapporo Breweries | METHOD FOR SELECTING BARLEY VARIETY, BARLEY BETA-AMYLASE GENE, AND PROCESS FOR PRODUCING ALCOHOLIC BEVERAGE DRINK |
US7514253B2 (en) | 2003-05-16 | 2009-04-07 | Glycofi, Inc. | URA5 gene and methods for stable genetic integration in yeast |
US20080305992A1 (en) * | 2003-11-24 | 2008-12-11 | Neose Technologies, Inc. | Glycopegylated erythropoietin |
ES2528739T3 (es) | 2003-12-24 | 2015-02-12 | Glycofi, Inc. | Métodos para eliminar la manosilfosforilación de glucanos en la producción de glucoproteínas |
US7479389B2 (en) | 2004-03-02 | 2009-01-20 | Glycofi, Inc. | ARG1, ARG2, ARG3, HIS1, HIS2, HIS5, HIS6 genes and methods for stable genetic integration |
DE102004027816A1 (de) | 2004-06-08 | 2006-01-05 | Bioceuticals Arzneimittel Ag | Verfahren zur Reinigung von Erythropoietin |
US7004906B1 (en) | 2004-07-26 | 2006-02-28 | Siemens Medical Solutions Usa, Inc. | Contrast agent imaging with agent specific ultrasound detection |
AU2006316838B2 (en) | 2005-11-15 | 2012-04-12 | Glycofi, Inc | Production of glycoproteins with reduced O-glycosylation |
US20090181041A1 (en) | 2006-01-23 | 2009-07-16 | Jan Holgersson | Production of proteins carrying oligomannose or human-like glycans in yeast and methods of use thereof |
EP2027271A4 (en) | 2006-05-19 | 2010-06-09 | Glycofi Inc | RECOMBINANT VECTORS |
AU2007254141B2 (en) | 2006-05-19 | 2012-10-11 | Glycofi, Inc. | Erythropoietin compositions |
AU2008343972B2 (en) | 2007-12-19 | 2014-07-03 | Glycofi, Inc. | Yeast strains for protein production |
-
2010
- 2010-10-11 AU AU2010307098A patent/AU2010307098A1/en not_active Abandoned
- 2010-10-11 BR BR112012008862A patent/BR112012008862A2/pt not_active IP Right Cessation
- 2010-10-11 JP JP2012534262A patent/JP2013507921A/ja active Pending
- 2010-10-11 EP EP10823888.2A patent/EP2488657B1/en active Active
- 2010-10-11 KR KR20127009494A patent/KR20120084734A/ko not_active Application Discontinuation
- 2010-10-11 CA CA2776392A patent/CA2776392A1/en not_active Abandoned
- 2010-10-11 ES ES10823888.2T patent/ES2589655T3/es active Active
- 2010-10-11 CN CN201410094457.3A patent/CN104031961A/zh active Pending
- 2010-10-11 RU RU2012120102/10A patent/RU2012120102A/ru not_active Application Discontinuation
- 2010-10-11 MX MX2012004381A patent/MX2012004381A/es not_active Application Discontinuation
- 2010-10-11 CN CN2010800577907A patent/CN102648286A/zh active Pending
- 2010-10-11 US US13/501,350 patent/US9139632B2/en active Active
- 2010-10-11 WO PCT/US2010/052140 patent/WO2011046855A1/en active Application Filing
-
2014
- 2014-01-15 US US14/155,878 patent/US20140200180A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101084233A (zh) * | 2004-04-29 | 2007-12-05 | 格利科菲公司 | 用于在糖蛋白产生中减少或消除a-甘露糖苷酶抗性聚糖的方法 |
Non-Patent Citations (1)
Title |
---|
MILLE ET AL: "Identification of a new family of genes involved in β-1,2-Mannosylation of glycans in Pichia pastoris and candida albicans", 《THE JOURNAL OF BIOLOGICAL CHEMISTRY》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112888315A (zh) * | 2018-08-21 | 2021-06-01 | 克莱拉食品公司 | 微生物中的蛋白质糖基化的修饰 |
Also Published As
Publication number | Publication date |
---|---|
MX2012004381A (es) | 2012-06-01 |
US20120232007A1 (en) | 2012-09-13 |
BR112012008862A2 (pt) | 2019-09-24 |
JP2013507921A (ja) | 2013-03-07 |
ES2589655T3 (es) | 2016-11-15 |
KR20120084734A (ko) | 2012-07-30 |
CA2776392A1 (en) | 2011-04-21 |
RU2012120102A (ru) | 2013-12-10 |
EP2488657B1 (en) | 2016-07-06 |
AU2010307098A1 (en) | 2012-04-26 |
WO2011046855A1 (en) | 2011-04-21 |
EP2488657A1 (en) | 2012-08-22 |
EP2488657A4 (en) | 2013-10-30 |
CN102648286A (zh) | 2012-08-22 |
US9139632B2 (en) | 2015-09-22 |
US20140200180A1 (en) | 2014-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104031961A (zh) | 生产成熟的人促红细胞生成素的方法以及包含获自该方法的人促红细胞生成素的组合物 | |
KR101930961B1 (ko) | 피키아 파스토리스에서 생산된 치료 당단백질 상의 n-글리코실화 부위 점유를 증가시키는 방법 | |
JP5406710B2 (ja) | エリスロポエチン組成物 | |
US20110207214A1 (en) | Novel tools for the production of glycosylated proteins in host cells | |
KR20140015137A (ko) | 분비 효율이 개선된 재조합 단백질의 생산 방법 | |
KR20140091017A (ko) | Alg3 발현이 결핍된 피키아 파스토리스 균주에서 n-글리칸 점유율을 증가시키고 하이브리드 n-글리칸의 생산을 감소시키는 방법 | |
MXPA03004853A (es) | Metodos y composiciones para produccion sumamente eficiente de proteinas heterologas en levadura. | |
CN103764837A (zh) | 用于生产具有修饰的o-糖基化的蛋白的酵母菌株 | |
JPH08336387A (ja) | ピキア属酵母由来の糖鎖伸長タンパク及びそのdna | |
KR20140134272A (ko) | 효모에서 만노실트랜스퍼라제 활성을 감소시키는 방법 | |
CN113549560B (zh) | 一种用于糖蛋白制备的工程化酵母构建方法及其菌株 | |
KR101782938B1 (ko) | 사카로마이세스 세레비지애 효모의 만노스 인산화 활성에 핵심적인 유전자 mnn14 및 그 결손 변이주를 활용한 재조합 당단백질 생산 방법 | |
JPH09261A (ja) | 糖蛋白質の製造方法 | |
JPH06277086A (ja) | 哺乳類の高マンノース型糖蛋白質糖鎖の酵母による製造法 | |
KR101419266B1 (ko) | 한세눌라 폴리모르파 유래의 단백질 o-만노실 전이효소의 신규 유전자 및 이 유전자가 결손된 한세눌라 폴리모르파 변이주 | |
WO2004003205A1 (en) | Hansenula polymorpha mutant strains with defect in outer chain biosynthesis and the production of recombinant glycoproteins using the same strains | |
JPH093097A (ja) | ピキア属酵母由来の糖鎖伸長タンパク、該蛋白質をコードするdna、修飾該dnaおよび形質転換体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140910 |