CN110835624A - 生产型细胞系的增强子 - Google Patents

生产型细胞系的增强子 Download PDF

Info

Publication number
CN110835624A
CN110835624A CN201911104558.3A CN201911104558A CN110835624A CN 110835624 A CN110835624 A CN 110835624A CN 201911104558 A CN201911104558 A CN 201911104558A CN 110835624 A CN110835624 A CN 110835624A
Authority
CN
China
Prior art keywords
leu
ser
gly
ala
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911104558.3A
Other languages
English (en)
Inventor
陈刚
D·布拉科夫
D·德施潘德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN110835624A publication Critical patent/CN110835624A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/22Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against growth factors ; against growth regulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/2488Mannanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/14Specific host cells or culture conditions, e.g. components, pH or temperature
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/51Complete heavy chain or Fd fragment, i.e. VH + CH1
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/515Complete light chain, i.e. VL + CL
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8518Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Cell Biology (AREA)

Abstract

本发明涉及在生产型细胞中异位表达EDEM2从而改善有用的多亚基蛋白质的产率的发现。因此,本发明提供了包含编码EDEM2的重组多核苷酸的生产型细胞系,例如经典的哺乳动物生物制药生产型细胞—CHO细胞。此外,本发明还公开了包含EDEM2的编码多核苷酸以及XBP1的编码多核苷酸的生产型细胞。也公开由这些细胞系生产的抗体的改善效价以及培养中由这些细胞得到的改善的细胞密度。

Description

生产型细胞系的增强子
本申请是2013年5月29日提交的同名发明专利申请201380028164.9的分案申请。
相关申请的交叉引用
根据35U.S.C.§119(e),本申请要求2012年5月29日提交的美国临时专利申请号61/652,549的权益,该申请的全部内容明确地以引用方式并入本文。
技术领域
本申请涉及一种或多种细胞,其表达用于改善地生产多亚基蛋白质的重组应激反应凝集素。具体而言,本发明提供了包含编码EDEM2的基因的哺乳动物细胞及由其衍生的细胞系,并且其产生高效价的抗体。
背景技术
制造治疗活性的蛋白质需要在分泌之前进行适当的折叠和加工。适当的折叠与蛋白质(例如抗体)尤其相关,所述的蛋白质由多个亚基组成,这些亚基在分泌之前必须适当地组装。真核细胞适应这样的系统,该系统确保蛋白质适当地折叠,并除去分泌途径中错误折叠的蛋白质。该系统被称为未折叠蛋白质反应(UPR)途径,并且由错误折叠的蛋白质在内质网(ER)中的累积所引发。
UPR的早期事件是转录因子Xbp1的激活,其依次激活内质网降解增强α-甘露糖苷酶-样蛋白质2(EDEM2)的转录,而该内质网降解增强α-甘露糖苷酶-样蛋白质2为内质网相关性降解(ERAD)途径的成员。EDEM2促进了错误折叠蛋白质的去除。ERAD途径包含5个步骤:(1)分子伴侣介导的对畸形蛋白质的识别;(2)使畸形蛋白质靶向与EDEM2有关的逆向转运机制或E3连接酶;(3)逆向转运的引发;(4)泛素化及进一步逆向转运;以及(5)蛋白体靶向及降解。
抗体为包含两条重链和两条轻链的多亚基蛋白质,其必须适当地折叠并结合从而形成功能异四聚体。为了改善功能抗体异四聚体的产率或效价,对重链和轻链的高效和精确加工的任何改良以都是需要的。
发明概述
本申请人惊奇地发现,在制造蛋白质的细胞系中,EDEM2的异位表达增加蛋白质的平均产量/细胞,增加被分泌至培养基中的蛋白质的效价,并增加生产型细胞系的积分细胞密度。
因此,在一个方面中,本发明提供了细胞,其包含(a)编码应激诱导的甘露糖结合凝集素的重组多核苷酸和(b)编码多亚基蛋白质的多核苷酸。在一些实施方案中,应激诱导的甘露糖结合凝集素为EDEM2蛋白质,其非限定性的实例在表1中提供,并且多亚基蛋白质为抗体。在其他的实施方案中,所述的细胞还包含编码活性剪切形式的XBP1的多核苷酸,其非限定性的实例在表2中提供。在一个实施方案中,所述的细胞为哺乳动物细胞,例如在生物制药制造中使用的CHO细胞。
在另一个方面中,本发明提供了由在上一方面中所述的细胞衍生的细胞系。“由……衍生”的意思是指由单个细胞以克隆方式遗传并具有一些所选的品质的细胞群体,例如生产给定效价的活性蛋白质的能力或增殖至特定密度的能力。在一些实施方案中,所述的细胞系能够生产效价为至少3克/升培养基(g/L)、至少5g/L或至少8g/L的多亚基蛋白质,其中所述的细胞系衍生自容留编码应激诱导的甘露糖结合凝集素的重组多核苷酸和编码多亚基蛋白质的多核苷酸的细胞。在一些实施方案中,与由基本相同的细胞衍生的但不具有编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系所获得的积分细胞密度相比,所述的细胞系可以获得高至少30%、至少50%、至少60%或者至少90%的积分细胞密度(ICD)。
在另一个方面中,本发明提供了包含编码EDEM2蛋白质的核酸序列的分离的或重组的多核苷酸,所述的多核苷酸与构成型且普遍表达的哺乳动物启动子(例如泛素C启动子)可操作地连接(顺式)。在一些实施方案中,EDEM2蛋白质具有SEQ ID NO:8的氨基酸,或者与SEQ ID NO:1-7的任意一个具有至少92%一致性的氨基酸序列。在一些实施方案中,所述的多核苷酸包含SEQ ID NO:16的核酸序列。在一个具体的实施方案中,所述的多核苷酸由SEQ ID NO:14的核酸序列组成;在另一个具体的实施方案中,所述的多核苷酸由SEQ IDNO:15的核酸序列组成。
在另一个方面中,本发明提供了包含编码XBP1蛋白质的核酸序列的分离的或重组的多核苷酸,所述的多核苷酸与构成型且普遍表达的哺乳动物启动子(例如泛素C启动子)可操作地连接(顺式)。在一些实施方案中,XBP1蛋白质具有SEQ ID NO:13的氨基酸,或者与SEQ ID NO:9-12的任意一个具有至少86%一致性的氨基酸序列。在一些实施方案中,所述的多核苷酸包含SEQ ID NO:18的核酸序列。在一个具体的实施方案中,所述的多核苷酸由SEQ ID NO:17的核酸序列组成。
在另一个方面中,本发明提供了一种细胞,其包含在上一方面中所述的EDEM2的编码多核苷酸和编码多亚基蛋白质(例如抗体)的多核苷酸。在一些实施方案中,所述的细胞还包含在上一方面所述的XBP1的编码多核苷酸。在一个实施方案中,多亚基蛋白质为抗体,抗体的重链包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列,抗体的轻链包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列。在这种及多个实施方案中,多亚基蛋白质的各个多肽亚基由独立的多核苷酸所编码。因此,例如编码抗体的多核苷酸可以包含编码重链的多核苷酸和编码轻链的多核苷酸,因此包含两个亚基。在一些实施方案中,所述的细胞为中国仓鼠卵巢(CHO)细胞。
在一个实施方案中,所编码的多亚基蛋白质为具有SEQ ID NO:20的重链可变区氨基酸序列和SEQ ID NO:22的轻链可变区氨基酸序列的抗GDF8抗体。在一个实施方案中,抗GDF8抗体包含具有SEQ ID NO:19的氨基酸序列的重链和具有SEQ ID NO:21的氨基酸序列的轻链。在一个实施方案中,编码抗GDF8抗体的重链的多核苷酸包含SEQ ID NO:23的核酸序列;并且编码抗GDF8抗体的轻链的多核苷酸包含SEQ ID NO:25的核酸序列。在一个实施方案中,编码抗GDF8抗体的重链的多核苷酸由SEQ ID NO:24的核酸序列组成;并且编码抗GDF8抗体的轻链的多核苷酸由SEQ ID NO:25的核酸序列组成。
在另一个实施方案中,所编码的多亚基蛋白质为具有SEQ ID NO:28的重链可变区氨基酸序列和SEQ ID NO:30的轻链可变区氨基酸序列的抗ANG2抗体。在一个实施方案中,抗ANG2抗体包含具有SEQ ID NO:27的氨基酸序列的重链和具有SEQ ID NO:29的氨基酸序列的轻链。在一个实施方案中,编码抗ANG2抗体的重链的多核苷酸包含SEQ ID NO:31的核酸序列;并且编码抗ANG2抗体的轻链的多核苷酸包含SEQ ID NO:33的核酸序列。在一个实施方案中,编码抗ANG2抗体的重链的多核苷酸由SEQ ID NO:32的核酸序列组成;并且编码抗ANG2抗体的轻链的多核苷酸由SEQ ID NO:34的核酸序列组成。
在另一个实施方案中,所编码的多亚基蛋白质为具有SEQ ID NO:36的重链可变区氨基酸序列和SEQ ID NO:38的轻链可变区氨基酸序列的抗ANGPTL4抗体。在一个实施方案中,抗ANGPTL4抗体包含具有SEQ ID NO:35的氨基酸序列的重链和具有SEQ ID NO:37的氨基酸序列的轻链。在一个实施方案中,编码抗ANGPTL4抗体的重链的多核苷酸包含SEQ IDNO:39的核酸序列;并且编码抗ANGPTL4抗体的轻链的多核苷酸包含SEQ ID NO:41的核酸序列。在一个实施方案中,编码抗ANGPTL4抗体的重链的多核苷酸由SEQ ID NO:40的核酸序列组成;并且编码抗ANGPTL4抗体的轻链的多核苷酸由SEQ ID NO:42的核酸序列组成。
在另一个方面中,本发明提供了通过在培养基中培养之前方面所述的细胞来制造多亚基蛋白质的方法,其中所述的多亚基蛋白质是在细胞内合成的,并在随后被分泌至培养基中。在一些实施方案中,所述的多亚基蛋白质为抗体,例如抗GDF8、抗ANG2、抗ANGPTL4或者具有SEQ ID NO:43和44的重链序列以及SEQ ID NO:45和46的轻链序列的抗体。在一些实施方案中,所述的多亚基蛋白质的效价达到至少3g/L、至少5g/L、至少6g/L或者至少8g/L。在一些实施方案中,所述的细胞在培养基中增殖,并且建立大约≥5x 107个细胞-天/mL、大约≥1x 108个细胞-天/mL或者大约≥1.5x 108个细胞-天/mL的积分细胞密度。
在另一个方面中,本发明提供了根据在之前的方面中所述的方法制造的多亚基蛋白质。在一个实施方案中,所述的制造的多亚基蛋白质是抗体。在一些实施方案中,所述的抗体由包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列的重链和包含SEQ ID NO:45和SEQID NO:46的氨基酸序列的轻链组成。在一个特定的实施方案中,所述的制造的多亚基蛋白质为具有SEQ ID NO:20的重链可变区氨基酸序列和SEQ ID NO:22的轻链可变区氨基酸序列的抗GDF8抗体。在另一个特定的实施方案中,所述的制造的多亚基蛋白质为具有SEQ IDNO:28的重链可变区氨基酸序列和SEQ ID NO:30的轻链可变区氨基酸序列的抗ANG2抗体。在另一个特定的实施方案中,所述的制造的多亚基蛋白质为具有SEQ ID NO:36的重链可变区氨基酸序列和SEQ ID NO:38的轻链可变区氨基酸序列的抗ANGPTL4抗体。
发明详述
在描述本发明之前,应该理解的是本发明不限于所描述的具体的方法和试验条件,这些方法和条件本身是可以改变的。此外,还应该理解的是本发明所用的术语仅是为了描述具体的实施方案,并且无意于进行限定,因为本发明的范围仅由所附的权利要求书来限定。
除非另作说明,否则本发明所用的所有的技术和科学术语都具有与本领域的任一普通技术人员所通常理解的含义。如本文所用,当术语“大约”用于指具体引用的数值或数值的范围时,其是指所述的值可以与所引用的值相差不超过1%。例如如本文所用,表述“大约100”包含99和101以及其中的所有值(例如99.1、99.2、99.3、99.4等)。
尽管与本发明所述的那些相似或相当的任何方法和材料都可以用于实施或测试本发明,但是优选的方法和材料现在进行描述。本发明提及的所有公开的全部内容均以引用方式并入本文。
如本文所用,当术语“重组多核苷酸”与“分离的多核苷酸”交换使用时,其是指来源于基因改造操作的、单链或双链的核酸聚合物,例如核酸或脱氧核酸。重组多核苷酸可以是在体外存在的或者在细胞内作为附加体存在的环状质粒或线性构建体。重组多核苷酸可以是整合在较大的多核苷酸分子或超分子结构(例如线性或环状染色体)中的构建体。较大的多核苷酸分子或超分子结构可以在细胞内或在细胞的细胞核中。因此,重组多核苷酸可以整合在细胞的染色体中。
如本文所用,术语“应激诱导的甘露糖结合凝集素”是指甘露糖结合蛋白质,其是指结合或者能够结合甘露糖和甘露糖的衍生物(例如甘露糖-6-磷酸)的蛋白质,或在其多糖-蛋白质复合物中表达甘露糖或甘露糖衍生物的糖蛋白;并且其活性在应激过程中受到上调。细胞应激包含饥饿、DNA损伤、缺氧、中毒、剪切应力和其他机械应力、肿瘤应激、错误折叠的蛋白质在内质网中的累积等。应激诱导的甘露糖结合凝集素的实例包含EDEM蛋白质(EDEM1、EDEM2和EDEM3)、Yos9、OS9和XTP3-B(参见Vembar and Brodsky,Nat.Rev.Mol.Cell.Biol.9(12):944-957,2008,以及其中引用的参考文献)。
如本文所用,术语“EDEM2”是指内质网降解增强α-甘露糖苷酶-样蛋白质的任何直系同源物、同源物或保守取代的变体。本领域公知的是EDEM2蛋白质与内质网相关性降解(ERAD)有关,其受到Xbp-1的上调并促进从钙连蛋白循环中提取错误折叠的糖蛋白用以去除(参见,Mast et al.,Glycobiology 15(4):421-436,2004;Olivari and Molinari,FEBSLett.581:3658-3664,2007;Olivari et al.,J.Biol.Chem.280(4):2424-2428,2005;andVembar and Brodsky 2008,这些文献的内容以引用方式并入本文)。示例性EDEM2序列在表1中描述,其与序列表相互参考。
表1
动物 SEQ ID NO: 与人的%一致性 与小鼠的%一致性 与仓鼠的%一致性
小鼠 1 93 100 96
大鼠 2 94 98 96
仓鼠 3 93 96 100
4 100 93 93
黑猩猩 5 99 94 93
猩猩 6 97 92 92
斑马鱼 7 69 70 69
总计 8 100 100 100
如本文所用,术语“Xbp1”也称为XBP1或X盒结合蛋白质1,其是指Xbp1的任何直系同源物、同源物或保守取代的变体。Xbp1为UPR的转录因子和功能元件。ER应激激活:(1)转录因子ATF6,其进而上调Xbp1 mRNA的转录;和(2)ER膜蛋白IRE1,其介导了前体Xbp1 mRNA的剪切,从而生产活性的Xbp1。如上文所提及,激活的Xbp1进而上调EDEM2的活性(参见Yoshida et al.,Cell Structure and Function 31(2):117-125,2006;和Olivari,2005)。示例性Xbp1氨基酸序列在表2中描述,其与序列表相互参考。
表2
动物 SEQ ID NO 与人的%一致性 与小鼠的%一致性 与仓鼠的%一致性
小鼠 9 86 100 92
仓鼠 10 86 92 100
11 100 86 86
斑马鱼 12 47 47 48
总计 13 100 100 100
如本文所用,术语“抗体”通常是指包含四条多肽链的免疫球蛋白分子及其多聚体(例如IgM),其中两条重链(H)和两条轻链(L)通过二硫键相互连接;然而,仅由重链组成(即,缺乏轻链)的免疫球蛋白分子也被涵盖在术语“抗体”的定义范围内。各重链均包含重链可变区(本发明中简称为HCVR或VH)和重链恒定区。重链恒定区包含三个结构域CH1、CH2和CH3。各轻链均包含轻链可变区(本发明中简称为LCVR或VL)和轻链恒定区。轻链恒定区包含一个结构域(CL1)。VH和VL区可以进一步细分成超变区,也称为互补决定区(CDR),其被更保守的所谓构架区(FR)间隔。各VH和VL均由三个CDR和四个FR组成,由氨基末端至羧基末端的顺序为:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4。“分离的抗体”或“纯化的抗体”基本上不含有其他的细胞材料或化学品。
术语“特异性地结合”等是指抗体或其抗原结合片段与抗体形成复合物,其在生理性条件下相对稳定。特异性地结合可以表征为解离常数为至少大约1x10-6Μ或更高。用于确定两个分子是否特异性地结合的方法是本领域的公知的,包括例如平衡透析、表面等离子共振等。而且,与人GDF8(例如)特异性地结合的分离的抗体与其他抗原(例如得自其他物种的GDF8分子(直系同源物))可以具有交叉反应。
多种抗体可以作为由细胞所分泌的多亚基蛋白质的实例,其中所述的细胞容留编码应激诱导的甘露糖结合凝集素的多核苷酸。这些实例包含抗GDF8、抗ANG2和抗ANGPTL4抗体。这些及相似的抗体分别在美国专利申请号20110293630、20110027286和20110159015中有所描述,这些文献的内容以引用方式并入本文。
如本文所用,术语“细胞”是指能够复制DNA、转录RNA、翻译多肽并分泌蛋白质的原核或真核细胞。细胞包括用于商业化生产生物产物的动物细胞,例如昆虫细胞(例如Schneider细胞、Sf9细胞、Sf21细胞、Tn-368细胞、BTI-TN-5B1-4细胞,参见Jarvis,MethodsEnzymol.463:191-222,2009和Potter et al.,Int.Rev.Immunol.10(2-3):103-112,1993)和哺乳动物细胞(例如CHO或CHO-K1细胞、COS或COS-7细胞、HEK293细胞、PC12细胞、HeLa细胞、Hybridoma细胞,Trill et al.,Curr.Opin.Biotechnol.6(5):553-560,1995;Kipriyanov和Little,Mo.Biotechnol.12(2):173-201,1999)。在一个实施方案中,所述的细胞为包含所描述的UPR途径多核苷酸的CHO-K1细胞。对于CHO-K1细胞的描述,还可以参见Kao et al.,Proc.Nat’l.Acad.Sci.USA 60:1275-1281,1968。
如本文所用,术语“启动子”是指通常以顺式并位于蛋白质的编码序列的上游的基因序列,并且其能促进蛋白质的编码序列的转录。启动子可以被调节(发育的、组织特异性的或诱导的(化学品、温度))或构成型活性的。在某些实施方案中,编码蛋白质的多核苷酸可操作地与构成型启动子连接。“可操作地连接”是指使蛋白质的编码多核苷酸位于启动子的3'端(下游),在启动子的顺式作用下并处于启动子的控制之下。在某些实施方案中,所述的启动子为构成型哺乳动物的启动子,例如泛素C启动子(参见Schorpp et al.,Nucl.Acids Res.24(9):1787-1788,1996;Byun et al.,Biochem.Biophys.Res.Comm.332(2):518-523,2005))、或CMV-IE启动子(参见Addison et al.,J.Gen.Virol.78(7):1653-1661,1997;Hunninghake et al.,J.Virol.63(7):3026-3033,1989)或hCMV-IE启动子(人巨细胞病毒即早期基因启动子)(参见Stinski&Roehr,J.Virol.55(2):431-441,1985;Hunninghake et al.,J.Virol.63(7):3026-3033,1989)。
如本文所用,短语“积分细胞密度”或“ICD”是对一段时间对培养物培养基中的细胞密度的积分,其表示为个细胞-天/mL。在一些实施方案中,在细胞处于培养中大约第12天时,测量ICD。
如本文所用,术语“培养物或培养”是指:(1)包含细胞、培养基和分泌的多亚基蛋白质的组合物;以及(2)不管细胞是否积极地分裂,都在培养基中温育细胞的行为。可以在25mL烧瓶或更小、及10000升或更大的商业化生物反应器的容器中培养细胞。“培养基”是指培养物培养基,其包含营养物、脂类、氨基酸、核酸、缓冲剂和痕量元素等,从而允许细胞的生长、繁殖或维持,以及细胞的多亚基蛋白质生产。细胞的培养物培养基包含无血清且无水解产物的合成培养基,以及补充有血清(例如胎牛血清(FBS))或蛋白质水解产物的培养基。可以商业获得的培养基的非限定性实例包括RPMI培养基1640、杜氏改良Eagle培养基(DMEM)、DMEM/F12混合物、F10营养混合物、Ham F12营养混合物和最基本培养基(MEM)。
如本文所用,当短语“保守取代的变体”用于多肽时,其是指具有一个或多个保守的氨基酸取代的多肽。“保守的氨基酸取代”是其中氨基酸残基被另一个具有相似化学性质(例如电荷或疏水性)的侧链(R基)的氨基酸残基所取代。通常,保守的氨基酸取代基本不会改变蛋白质的功能性。在其中两条或多条氨基酸序列通过保守的取代而彼此不同的情况下,可以向上调节相似性的百分率或相似度,从而校正取代的保守性。用于进行这种调节的手段是本领域的那些技术人员所公知的。例如参见Pearson(1994)Methods Mol.Biol.24:307-331,该文献的内容以引用方式并入本文。具有相似化学性质的侧链的氨基酸基团的实例包含:1)脂肪族侧链:甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;2)脂肪族-羟基侧链:丝氨酸和苏氨酸;3)包含氨基的侧链:天冬酰氨和谷氨酰胺;4)芳香族侧链:苯丙氨酸、酪氨酸和色氨酸;5)碱性侧链:赖氨酸、精氨酸和组氨酸;6)酸性侧链:天冬氨酸和谷氨酸;和7)包含硫的侧链:半胱氨酸和蛋氨酸。优选的保守氨基酸取代基团为:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸,谷氨酸-天冬氨酸,和天冬酰氨-谷氨酰胺。备选地,保守替代是在Gonnet et al.(1992)Science 256:1443-45所公开的PAM250对数似然矩阵中具有正值的任何变化,其中所述文献的内容以引用方式并入本文。“适度保守的”替代是在PAM250对数似然矩阵中具有非负值的任何变化。
实施方案-细胞
在一个方面中,本发明提供了用于生产具有治疗或研究用途的蛋白质的细胞。在一些实施方案中,所述的蛋白质由多个亚基组成,这些亚基必须适当地折叠并组装,从而生产足量的活性蛋白质。抗体是具有治疗或研究用途的多亚基蛋白质的实例。在一些实施方案中,所述的细胞容留重组基因构建体(即,多核苷酸),该构建体编码多亚基蛋白质的一个或多个单个的亚基。在其他的实施方案中,编码单个多肽亚基的基因构建体是天然形成的,例如在B细胞中编码抗体亚基的核酸序列。
为了促进多亚基蛋白质的适当组装和分泌,所述的细胞包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸,其中在一些实施方案中,应激诱导的甘露糖结合凝集素为ERAD的成分。在一些实施方案中,应激诱导的甘露糖结合凝集素为内质网降解增强α-甘露糖苷酶-样蛋白质2(EDEM2)。可以预见的是任何编码的EDEM2或保守取代的变体都可以成功地用于本发明。表1列出了脊椎动物EDEM2蛋白质的一些实例。这些蛋白质序列的多个成对比较表明每条所公开的EDEM2多核苷酸序列均与每条其他的EDEM2序列具有至少69%的一致性,其中所述的比较是使用Thompson et al.,Nucl.Acids Rev.22(22):4673-80,1994的Clustal W程序来进行的(此外参见Yuan et al.,Bioinformatics15(10):862-3,1999)。所公开的哺乳动物EDEM2序列的Clustal W比较表明每条序列与其他序列具有至少92%的一致性。因此在一些实施方案中,所述的细胞包含编码EDEM2多肽的多核苷酸,其中所述的EDEM2多肽具有与任一哺乳动物EDEM2至少92%的一致性的序列。通过比对小鼠、大鼠、仓鼠、黑猩猩和人EDEM2多肽氨基酸序列来建立共有的EDEM2氨基酸序列。该共有序列描绘于SEQ ID NO:8中。因此在一些实施方案中,所述的细胞包含编码EDEM2多肽的多核苷酸,其中所述的EDEM2多肽具有SEQ ID NO:8的氨基酸序列。
在多个实施方案中,所述的细胞包含编码EDEM2多肽的重组多核苷酸,其中所述的EDEM2多肽具有与小鼠EDEM2(mEDEM2)氨基酸序列至少92%的一致性的氨基酸序列;并且在具体的实施方案中,所述的多肽为mEDEM2或其保守取代的变体。
在一些实施方案中,所述的多亚基蛋白质为抗体,并且所述的细胞包含编码任意一条或多条多肽的多核苷酸,其中所述的多肽包含SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45和SEQ ID NO:46的氨基酸序列。SEQ ID NO:43和SEQ ID NO:44各分别代表了特定抗体重链的大致的N末端和C末端部分的共有序列。因此在一个实施方案中,编码蛋白质亚基的多核苷酸编码包含SEQ ID NO:43和SEQ ID NO:44的多肽。SEQ ID NO:45和SEQ ID NO:46各分别代表了特定抗体轻链的大致的N末端和C末端部分的共有序列。因此在一个实施方案中,编码蛋白质亚基的多核苷酸编码包含SEQ ID NO:45和SEQ ID NO:46的多肽。在一些实施方案中,除了编码EDEM2蛋白质的重组多核苷酸以外,所述的细胞包含至少两条多核苷酸,每条多核苷酸均编码多亚基蛋白质的特定的亚基。例如并且如下举例,所述的细胞包含编码抗体重链(包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列)的多核苷酸和编码抗体轻链(包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列)的另一个多核苷酸。
在一些实施方案中,如上文所述,所述的细胞除了包含应激反应多核苷酸和一条或多条编码多肽亚基的多核苷酸以外,还包含编码未折叠蛋白质反应转录因子(其在EDEM2的上游进行操作)的多核苷酸。在一些情况下,所述的上游转录因子为剪切形式的XBP1。可以预见的是任何编码的XBP1都可以成功地用于本发明中。表2列出了脊椎动物XBP1剪切形式的多肽的序列的实例。这些多肽序列的多个成对比较表明每条所公开的剪切XBP1多核苷酸序列均与每条其他的XBP1序列具有至少48%的一致性,其中所述的比较是使用ClustalW程序(Thompson 1994;Yuan 1999)来进行的。所公开的哺乳动物XBP1序列的Clustal W比较表明每条序列与其他序列具有至少86%的一致性。因此在一些实施方案中,所述的细胞包含编码剪切形式的XBP1多肽的多核苷酸,其中所述的XBP1多肽具有与任一哺乳动物剪切XBP1至少86%的一致性的序列。通过比对小鼠、仓鼠和人XBP1氨基酸序列来建立共有的XBP1氨基酸序列。该共有序列描绘于SEQ ID NO:13中。因此在一些实施方案中,所述的细胞包含编码XBP1多肽的多核苷酸,其中所述的XBP1多肽具有SEQ ID NO:13的氨基酸序列。
在多个实施方案中,所述的细胞包含编码XBP1多肽的多核苷酸,其中所述的XBP1多肽具有与小鼠XBP1(mXBP1)氨基酸序列(SEQ ID NO:9)至少86%的一致性的氨基酸序列;并且在具体的实施方案中,所述的多肽为mXBP1或其保守取代的变体。
本发明预见任何细胞都可以用于容留凝集素编码多肽,以用于生产适当折叠且具有活性的多亚基蛋白质。此类细胞包含公知的蛋白质生产型细胞,例如细菌大肠埃希氏杆菌(Escherichia coli)和类似的原核细胞,酵母菌毕赤酵母(Pichia pastoris)和其他毕赤及非毕赤酵母,植物细胞外植体(例如烟草的那些),昆虫细胞(例如Schneider 2细胞、Sf9和Sf21,和粉纹夜蛾(Trichoplusia ni)衍生的High Five细胞),以及通常用于生物生产的哺乳动物细胞(例如CHO、CHO-K1、COS、HeLa、HEK293、Jurkat和PC12细胞)。在一些实施方案中,所述的细胞为CHO-K1或改性的CHO-K1细胞,例如在美国专利号7,435,553,7,514,545和7,771,997、及美国专利申请公开号US 2010-0304436A1中所教导的那些,其中每一份文献的全部内容均以引用方式并入本文。
在一些具体的实施方案中,本发明离体提供了CHO-K1细胞,该细胞包含:(1)mEDEM2的编码多核苷酸,其包含SEQ ID NO:16的核苷酸序列;(2)XBP1的编码多核苷酸,其包含SEQ ID NO:18的核苷酸序列;(3)抗体重链的编码多核苷酸,其包含编码多肽的核苷酸序列,其中所述的多肽包含SEQ ID NO:43和44的氨基酸序列;以及(4)抗体轻链的编码多核苷酸,其包含编码多肽的核苷酸序列,其中所述的多肽包含SEQ ID NO:45和46的氨基酸序列。
在一个具体的实施方案中,本发明离体提供了CHO-K1细胞,该细胞包含:(1)mEDEM2的编码多核苷酸,其包含SEQ ID NO:16的核苷酸序列;(2)XBP1的编码多核苷酸,其包含SEQ ID NO:18的核苷酸序列;(3)抗体重链的编码多核苷酸,其包含SEQ ID NO:23的核苷酸序列;以及(4)抗体轻链的编码多核苷酸,其包含SEQ ID NO:25的核苷酸序列。
在另一个具体的实施方案中,本发明离体提供了CHO-K1细胞,该细胞包含:(1)mEDEM2的编码多核苷酸,其包含SEQ ID NO:16的核苷酸序列;(2)XBP1的编码多核苷酸,其包含SEQ ID NO:18的核苷酸序列;(3)抗体重链的编码多核苷酸,其包含SEQ ID NO:31的核苷酸序列;以及(4)抗体轻链的编码多核苷酸,其包含SEQ ID NO:33的核苷酸序列。
在另一个具体的实施方案中,本发明离体提供了CHO-K1细胞,该细胞包含:(1)mEDEM2的编码多核苷酸,其包含SEQ ID NO:16的核苷酸序列;(2)XBP1的编码多核苷酸,其包含SEQ ID NO:18的核苷酸序列;(3)抗体重链的编码多核苷酸,其包含SEQ ID NO:39的核苷酸序列;以及(4)抗体轻链的编码多核苷酸,其包含SEQ ID NO:41的核苷酸序列。
细胞系
在另一个方面中,本发明提供了细胞系,其包含起源于上文所述的细胞通过克隆扩增得到的多个细胞。至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或者大约100%的细胞系构成细胞包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸,在一些实施方案中,所述的应激诱导的甘露糖结合凝集素为ERAD的成分。在一些实施方案中,所述的应激诱导的甘露糖结合凝集素为内质网降解增强α-甘露糖苷酶-样蛋白质2(EDEM2)。可以预见的是任何编码的EDEM2或其保守取代的变体都可以成功地用于本发明中。如上述部分中所讨论的那样,表1列出了脊椎动物EDEM2蛋白质的一些实例。在一些实施方案中,所述的构成细胞包含编码EDEM2多肽的多核苷酸,其中所述的EDEM2多肽具有与任何哺乳动物EDEM2至少92%一致性的序列。在一些实施方案中,所述的构成细胞包含编码EDEM2多肽的多核苷酸,其中所述的EDEM2多肽具有SEQ ID NO:8的哺乳动物共有氨基酸序列。在一些实施方案中,所述的构成细胞包含SEQ ID NO:1的重组多核苷酸或其保守取代的变体。
在一些实施方案中,由所述的细胞系生产的多亚基蛋白质为抗体,并且所述的细胞系的构成细胞包含编码任意一条或多条多肽的多核苷酸,其中所述的多肽包含SEQ IDNO:43和SEQ ID NO:44的氨基酸序列(其分别代表了特定抗体重链的N末端和C末端部分的共有序列),以及SEQ ID NO:45和SEQ ID NO:46的氨基酸序列(其分别代表了特定抗体轻链的N末端和C末端部分的共有序列)。在一些实施方案中,所述的细胞系的构成细胞除了包含编码EDEM2蛋白质的重组多核苷酸以外,还包含至少两条多核苷酸,每条多核苷酸都编码多亚基蛋白质的特定的亚基。例如所述的构成细胞包含编码抗体重链(包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列)的多核苷酸和编码抗体轻链(包含SEQ ID NO:45和SEQ IDNO:46的氨基酸序列)的另一种多核苷酸。
在一些实施方案中,如上文所述,所述的构成细胞除了包含应激反应多核苷酸和一条或多条编码多肽亚基的多核苷酸以外,还包含编码未折叠蛋白质反应转录因子(例如剪切形式的XBP1)(其在EDEM2的上游进行操作)的多核苷酸。可以预见的是任何编码的XBP1都可以成功地用于本发明中。如在上文部分中所讨论的那样,表2列出了脊椎动物XBP1剪切形式的多肽的一些实例。这些序列的Clustal W分析表明每条所公开的剪切XBP1多核苷酸序列均与每条其他的XBP1序列具有至少48%的一致性;并且哺乳动物XBP1序列的比较表明每条序列与其他序列具有至少86%的一致性。因此在一些实施方案中,所述的细胞系的构成细胞包含编码剪切形式的XBP1多肽的多核苷酸,其中所述的XBP1多肽具有与任一哺乳动物剪切XBP1至少86%的一致性的序列。在一些实施方案中,所述的构成细胞包含编码XBP1多肽的多核苷酸,其中所述的XBP1多肽具有SEQ ID NO:13的氨基酸序列。
在多个实施方案中,所述的细胞包含编码XBP1多肽的多核苷酸,其中所述的XBP1多肽具有与小鼠XBP1(mXBP1)氨基酸序列(SEQ ID NO:9)至少86%的一致性的氨基酸序列;并且在具体的实施方案中,所述的多肽为SEQ ID NO:9的mXBP1或其保守取代的变体。
本发明预见所述的细胞系包含构成细胞,其亲本选自公知的蛋白质生产型细胞的列表中,例如细菌大肠埃希氏杆菌和类似的原核细胞,酵母菌毕赤酵母和其他毕赤及非毕赤酵母,植物细胞外植体(例如烟草的那些),昆虫细胞(例如Schneider 2细胞、Sf9和Sf21,和粉纹夜蛾(Trichoplusia ni)衍生的High Five细胞),以及通常用于生物生产的哺乳动物细胞(例如CHO、CHO-K1、COS、HeLa、HEK293、Jurkat和PC12细胞)。在一些实施方案中,所述的细胞为CHO-K1或改性的CHO-K1细胞,例如在美国专利号7,435,553,7,514,545和7,771,997、及美国专利申请公开号US 2010-0304436A1中所教导的那些。
在一些实施方案中,在培养基中培养的细胞系能够生产多亚基蛋白质并将适当组装的多亚基蛋白质分泌至培养基中,其效价为至少3g/L、至少5g/L或至少8g/L。
此外,与不包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系积分细胞密度相比,所述的细胞系的构成细胞在培养中能够增殖达到积分细胞密度高出大约30%的程度。在一些情况下,与不包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系积分细胞密度相比,所述的细胞系能够达到积分细胞密度高出至少大约50%、至少60%或者至少90%。在一些实施方案中,在处于培养中大约第12天后,评估细胞系的积分细胞密度。
在一些具体的实施方案中,本发明提供了包含克隆衍生的构成细胞的细胞系,其中所述的构成细胞为CHO-K1细胞,该细胞包含:(1)mEDEM2的编码多核苷酸,其包含SEQ IDNO:16的核苷酸序列;(2)XBP1的编码多核苷酸,其包含SEQ ID NO:18的核苷酸序列;(3)抗体重链的编码多核苷酸,其包含编码多肽的核苷酸序列,其中所述的多肽包含SEQ ID NO:43和44的氨基酸序列;以及(4)抗体轻链的编码多核苷酸,其包含编码多肽的核苷酸序列,其中所述的多肽包含SEQ ID NO:45和46的氨基酸序列。
在一个具体的实施方案中,本发明提供了包含克隆衍生的构成细胞的细胞系,其中所述的构成细胞为CHO-K1细胞,该细胞包含:(1)mEDEM2的编码多核苷酸,其包含SEQ IDNO:16的核苷酸序列;(2)XBP1的编码多核苷酸,其包含SEQ ID NO:18的核苷酸序列;(3)抗体重链的编码多核苷酸,其包含SEQ ID NO:23的核苷酸序列;以及(4)抗体轻链的编码多核苷酸,其包含SEQ ID NO:25的核苷酸序列。
在另一个具体的实施方案中,本发明提供了包含克隆衍生的构成细胞的细胞系,其中所述的构成细胞为CHO-K1细胞,该细胞包含:(1)mEDEM2的编码多核苷酸,其包含SEQID NO:16的核苷酸序列;(2)XBP1的编码多核苷酸,其包含SEQ ID NO:18的核苷酸序列;(3)抗体重链的编码多核苷酸,其包含SEQ ID NO:31的核苷酸序列;以及(4)抗体轻链的编码多核苷酸,其包含SEQ ID NO:33的核苷酸序列。
在另一个具体的实施方案中,本发明提供了包含克隆衍生的构成细胞的细胞系,其中所述的构成细胞为CHO-K1细胞,该细胞包含:(1)mEDEM2的编码多核苷酸,其包含SEQID NO:16的核苷酸序列;(2)XBP1的编码多核苷酸,其包含SEQ ID NO:18的核苷酸序列;(3)抗体重链的编码多核苷酸,其包含SEQ ID NO:39的核苷酸序列;以及(4)抗体轻链的编码多核苷酸,其包含SEQ ID NO:41的核苷酸序列。
EDEM2多核苷酸
在另一个方面中,本发明提供了编码EDEM2蛋白质的多核苷酸。EDEM2的编码多核苷酸是重组的,并且可以在体外(例如在试管中或在体外翻译系统中)或者在体内(例如在细胞中,细胞可以是离体的,例如细胞培养物中;或者是在体内的,例如在有机体中)制造、储存、使用或表达。在一些实施方案中,EDEM2的编码多核苷酸在基因中,这表示其处于启动子的控制之下,并且位于启动子下游且多聚腺苷酸位点的上游。EDEM2的编码多核苷酸或基因可以在质粒或者其他环状或线性载体中。EDEM2的编码多核苷酸或基因可以在环状或线性DNA构建体中,其可以作为附加体处于细胞中,或者整合至细胞的基因组中。
如上文所述,EDEM2的编码多核苷酸编码表1的任何直系同源物、同源物或保守取代的EDEM2多肽,或者具有与SEQ ID NO:1-5和8的任一至少92%的一致性的氨基酸序列(包括SEQ ID NO:8的哺乳动物共有序列)的EDEM2多肽。
在一些情况下,重组的或分离的EDEM2的编码多核苷酸可操作地与哺乳动物启动子连接。该启动子可以为任何启动子,但是在一些情况下,其为哺乳动物启动子,例如泛素C启动子。
在具体的实施方案中,EDEM2的编码多核苷酸基本上由(由5’至3’的顺序)启动子(例如泛素C启动子)、其后为可任选的内含子(β球蛋白内含子)、其后为编码EDEM2的序列、其后为多聚腺苷酸序列(例如SV40pA序列)组成。此类EDEM2的编码多核苷酸的特定实例(其也为具体的实施方案)如SEQ ID NO:16所述。该序列的保守变体也被设想为本发明的实施方案。
在一些情况下,重组EDEM2的编码多核苷酸为质粒的一部分,其可以为线性、环状、附加体、整合的、静态的DNA构建体,或者用于传递EDEM2基因或表达EDEM2蛋白质的载体。在一个具体的实施方案中,所述的质粒包含:(1)EDEM2基因,其处于泛素C启动子的控制之下,并以SV40多聚腺苷酸信号为结尾;和(2)选择标记,例如编码赋予对博来霉素抗性的多肽的多核苷酸或编码赋予对新霉素抗性的多肽的多核苷酸,其处于启动子(例如SV40启动子)的控制之下,并以多聚腺苷酸序列(例如PGK pA序列)为结尾。在一个具体的实施方案中,所述的质粒包含(5’至3’方向进行的环状形式)泛素C启动子、β球蛋白内含子、EDEM2的编码序列、SV40 pA序列、SV40启动子、新霉素抗性的编码序列和PGK pA序列。通过具有SEQ ID NO:14序列的质粒来举例说明该实施方案的特定实例。在另一个具体的实施方案中,所述的质粒包含(5’至3’方向进行的环状形式)泛素C启动子、β球蛋白内含子、EDEM2的编码序列、SV40 pA序列、SV40启动子、博来霉素抗性的编码序列和PGK pA序列。通过具有SEQ ID NO:15序列的质粒来举例说明该实施方案的特定实例。
XBP1多核苷酸
在另一个方面中,本发明提供了编码XBP1蛋白质的多核苷酸。XBP1的编码多核苷酸是重组的,并且可以在体外(例如在试管中或在体外翻译系统中)或者在体内(例如在细胞中,细胞可以是离体的,例如细胞培养物中;或者是在体内的,例如在有机体中)制造、储存、使用或表达。在一些实施方案中,XBP1的编码多核苷酸在基因中,这表示其处于启动子的控制之下,并且位于启动子下游且多聚腺苷酸位点的上游。XBP1的编码多核苷酸可以在质粒或者其他环状或线性载体中。XBP1的编码多核苷酸或基因可以在环状或线性DNA构建体中,其可以作为附加体处于细胞中,或者整合至细胞的基因组中。
如上文所述,XBP1的编码多核苷酸编码表2的任何直系同源物、同源物或保守取代的XBP1多肽,或者具有与SEQ ID NO:9、10和11的任一至少86%的一致性的氨基酸序列(包括SEQ ID NO:13的哺乳动物共有序列)的XBP1多肽。
在一些情况下,重组的或分离的XBP1的编码多核苷酸可操作地与哺乳动物启动子连接。该启动子可以为任何启动子,但是在一些情况下,其为哺乳动物启动子,例如泛素C启动子。
在具体的实施方案中,XBP1的编码多核苷酸基本上由(由5’至3’的顺序)启动子(例如泛素C启动子)、其后为可任选的内含子(β球蛋白内含子)、其后为XBP1的编码序列、其后为多聚腺苷酸序列(例如SV40pA序列)组成。SEQ ID NO:18描述了XBP1的编码多核苷酸的实例。该示例序列的保守变体也被设想为本发明的实施方案。
在一些情况下,重组的XBP1的编码多核苷酸为质粒的一部分,其可以为线性、环状、附加体、整合的、静态的DNA构建体,或者用于传递XBP1基因或表达剪切的且具有活性的XBP1蛋白质的载体。在一个具体的实施方案中,所述的质粒包含:(1)XBP1基因,其处于泛素C启动子的控制之下,并以SV40多聚腺苷酸信号为结尾;和(2)选择标记,例如编码赋予对博来霉素抗性的多肽的多核苷酸或编码赋予对新霉素抗性的多肽的多核苷酸,其处于启动子(例如SV40启动子)的控制之下,并以多聚腺苷酸序列(例如PGK pA序列)为结尾。在一个具体的实施方案中,所述的质粒包含(5’至3’方向进行的环状形式)泛素C启动子、β球蛋白内含子、XBP1的编码序列、SV40 pA序列、SV40启动子、博来霉素抗性的编码序列和PGK pA序列。通过具有SEQ ID NO:17序列的环状质粒来举例说明该实施方案的特定实例。
编码抗体重链和轻链的多核苷酸
在另一个方面中,本发明提供了编码抗体重链多肽(HC)的多核苷酸。HC的编码多核苷酸是重组的,并且可以在体外(例如在试管中或在体外翻译系统中)或者在体内(例如在细胞中,细胞可以是离体的,例如细胞培养物中;或者是在体内的,例如在有机体中)制造、储存、使用或表达。在一些实施方案中,HC的编码多核苷酸在基因中,这表示其处于启动子的控制之下,并且位于启动子下游且多聚腺苷酸位点的上游。HC的编码多核苷酸可以在质粒或者其他环状或线性载体中。HC的编码多核苷酸或基因可以在环状或线性DNA构建体中,其可以作为附加体处于细胞中,或者整合至细胞的基因组中。
在一些情况下,重组的或分离的HC的编码多核苷酸可操作地与哺乳动物启动子连接。该启动子可以为任何启动子,但是在一些情况下,其为哺乳动物启动子,例如泛素C启动子或hCMV-IE启动子。
在具体的实施方案中,HC的编码多核苷酸为HC基因,其基本上由(由5’至3’的顺序)启动子(例如hCMV-IE启动子)、其后为可任选的内含子(β球蛋白内含子)、其后为重链的编码序列(例如编码SEQ ID NO:43和44、SEQ ID NO:19、SEQ ID NO:27或SEQ ID NO:35的氨基酸序列的序列)、其后为多聚腺苷酸序列(例如SV40pA序列)组成。通过SEQ ID NO:23、SEQID NO:31和SEQ ID NO:39描述了HC基因的特定实例。这些序列的任意一个的保守变体也被设想为本发明的实施方案。
在一些情况下,重组的HC的编码多核苷酸为质粒的一部分,其可以为线性、环状、附加体、整合的、静态的DNA构建体,或者用于传递重链基因或表达重链亚基的载体。在一个具体的实施方案中,所述的质粒包含:(1)HC基因,其处于hCMV-IE启动子的控制之下,并以SV40多聚腺苷酸信号为结尾;和(2)选择标记,例如编码赋予对潮霉素抗性的多肽的多核苷酸,其处于启动子(例如SV40启动子)的控制之下,并以多聚腺苷酸序列(例如PGK pA序列)为结尾。在一个具体的实施方案中,所述的质粒包含(5’至3’方向进行的环状形式)hCMV-IE启动子、β球蛋白内含子、抗体重链的编码序列(其编码具有SEQ ID NO:43和44、SEQ ID NO:19、SEQ ID NO:27或SEQ ID NO:35的氨基酸的HC)、SV40 pA序列、SV40启动子、潮霉素抗性的编码序列和PGK pA序列。通过SEQ ID NO:24、SEQ ID NO:32或SEQ ID NO:40描述了此类包含HC基因的质粒的特定实例和具体实施方案。这些序列的任意一个的保守变体也被设想为本发明的实施方案。
在另一个方面中,本发明提供了编码抗体轻链多肽(LC)的多核苷酸。LC的编码多核苷酸是重组的,并且可以在体外(例如在试管中或在体外翻译系统中)或者在体内(例如在细胞中,细胞可以是离体的,例如细胞培养物中;或者是在体内的,例如在有机体中)制造、储存、使用或表达。在一些实施方案中,LC的编码多核苷酸在基因中,这表示其处于启动子的控制之下,并且位于启动子下游且多聚腺苷酸位点的上游。LC的编码多核苷酸或基因可以在质粒或者其他环状或线性载体中。LC的编码多核苷酸或基因可以在环状或线性DNA构建体中,其可以作为附加体处于细胞中,或者整合至细胞的基因组中。
在一些情况下,重组的或分离的LC的编码多核苷酸可操作地与哺乳动物启动子连接。该启动子可以为任何启动子,但是在一些情况下,其为哺乳动物启动子,例如泛素C启动子或hCMV-IE启动子。
在具体的实施方案中,LC的编码多核苷酸为LC基因,其基本上由(由5’至3’的顺序)启动子(例如hCMV-IE启动子)、其后为可任选的内含子(β球蛋白内含子)、其后为轻链的编码序列(例如编码SEQ ID NO:45和46、SEQ ID NO:21、SEQ ID NO:29或SEQ ID NO:37的氨基酸序列的序列)、其后为多聚腺苷酸序列(例如SV40pA序列)组成。通过SEQ ID NO:25、SEQID NO:33或SEQ ID NO:41描述了此类LC基因的特定实例和具体实施方案。这些序列的任意一个的保守变体也被设想为本发明的实施方案。
在一些情况下,重组的LC的编码多核苷酸为质粒的一部分,其可以为线性、环状、附加体、整合的、静态的DNA构建体或者用于传递轻链基因或表达轻链亚基的载体。在一个具体的实施方案中,所述的质粒包含:(1)LC基因,其处于hCMV-IE启动子的控制之下,并以SV40多聚腺苷酸信号为结尾;和(2)选择标记,例如编码赋予对潮霉素抗性的多肽的多核苷酸,其处于启动子(例如SV40启动子)的控制之下,并以多聚腺苷酸序列(例如PGK pA序列)为结尾。在一个具体的实施方案中,所述的质粒包含(5’至3’方向进行的环状形式)hCMV-IE启动子、β球蛋白内含子、抗体轻链的编码序列(其编码具有SEQ ID NO:45和46、SEQ ID NO:21、SEQ ID NO:29或SEQ ID NO:37的氨基酸的LC)、SV40 pA序列、SV40启动子、潮霉素抗性的编码序列和PGK pA序列。通过SEQ ID NO:26、SEQ ID NO:34或SEQ ID NO:42描述了此类包含LC基因的质粒的特定实例和具体实施方案。这些序列的任意一个的保守变体也被设想为本发明的实施方案。
制造多亚基蛋白质的方法
在另一个方面中,本发明提供了通过培养细胞或细胞系的构成细胞来制造多亚基蛋白质的方法,其中所述的细胞或细胞系的构成细胞在培养基中能够生产和分泌相对大量的适当组装的多亚基蛋白质,其中所述的多亚基成分以相对高的效价被分泌至培养基中。在该制造方法中使用的细胞为在之前的方面中所描述的细胞,其包含本发明所述的ERAD凝集素的编码多核苷酸。
为生产有用的重组蛋白质的培养细胞(特别是哺乳动物细胞)的方法是本领域公知的(例如参见De Jesus&Wurm,Eur.J.Pharm.Biopharm.78:184-188,2011,及其中引用的参考文献)。简言之,将包含所述的多核苷酸的细胞在培养基中培养,其中所述的培养基可以包含血清或水解产物,或者可以是化学限定并优化的,以用于蛋白质的生产。培养可以是分批供料培养或连续培养,例如在恒化器中。所述的细胞可以在试验台尺寸烧瓶(~25mL)中、在按生产规模呈比例扩大的生物反应器(1-5L)中或工业规模的生物反应器(5000-25000L)中培养。生产运行可以持续几周是一个月,其间多亚基蛋白质被分泌至培养基中。
题述细胞具有增强的生产和分泌适当组装的多亚基蛋白质的能力。在一些实施方案中,所述的多亚基蛋白质(例如抗体)以至少94pg/个细胞/天、至少37pg/个细胞/天或者至少39pg/个细胞/天的速率分泌至培养基中。在一些实施方案中,所述的多亚基蛋白质在培养大约12天后的效价达到至少3g/L、至少5g/L、至少6g/L或者至少8g/L。
此外,题述细胞具有增强的增殖和达到相对高的细胞密度的能力,从而进一步优化生产率。在一些实施方案中,在培养中,细胞或细胞系的种子培养(seed train)的积分细胞密度达到至少5x 107个细胞-天/mL、至少1x 108个细胞-天/mL或者至少1.5x 108个细胞-天/mL。
可任选地,随后由其中分泌有多亚基蛋白质的培养基中纯化该蛋白质。蛋白质的纯化方法是本领域公知的(例如参见Kelley,mAbs 1(5):443-452)。在一些实施方案中,通过离心除去液体培养基上清液中的细胞,然后经历多个层析步骤和过滤步骤以除去病毒和其他污染物或残杂物等,从而收获蛋白质。在一些实施方案中,层析步骤包括离子交换层析,例如阳离子交换或阴离子交换。此外,还可以使用多种亲和层析介质,例如用于纯化抗体的蛋白质A层析。
可任选地,所述的制造方法可以包括创建细胞的预备步骤。因此在一些实施方案中,制造多亚基蛋白质的方法包括使用上文所述的编码应激诱导的甘露糖凝集素的载体来转染细胞的步骤,然后选择其稳定的部分。载体的非限定性实例包括包含多核苷酸的基因构建体,其中所述的多核苷酸编码EDEM2,该EDEM2具有SEQ ID NO:1-8的任意一个的氨基酸序列,与SEQ ID NO:1-8的任意一个具有至少92%的一致性的氨基酸序列,或者SEQ ID NO:1-8的任意一种保守取代的变体。此外,有用的载体还包含例如容留SEQ ID NO:16基因的质粒、SEQ ID NO:15的质粒和SEQ ID NO:14的质粒。人们应该注意所述的质粒序列(例如SEQID NO:14、15、17、24、26、32、34、40和42)是在序列表中以线性方式描述的环状序列。因此在这些情况下,书写序列的3'最末端的核苷酸可以被认为与该书写序列的5'最末端核苷酸的5'端紧接。在SEQ ID NO:14质粒的实例中,通过对新霉素的抗性来选择转化子;在SEQ IDNO:15质粒的实例中,通过选择对博来霉素的抗性来选择转化子。
用于构建多核苷酸及包含该多核苷酸的载体的详细方法在美国专利号7,435,553和7,771,997(这些文献的内容以引用方式并入本文)、以及例如Zwarthoff et al.,J.Gen.Virol.66(4):685-91,1985;Mory et al.,DNA.5(3):181-93,1986;和Pichler etal.,Biotechnol.Bioeng.108(2):386-94,2011中有所描述。
起始细胞(其中放置有编码应激诱导的甘露糖结合凝集素的载体)已经包含编码或调节多亚基蛋白质的亚基、或XBP1(对于使用XBP1的那些实施方案而言)的表达的构建体或基因元件。备选地,编码应激诱导的甘露糖结合凝集素的载体可以首先放置到细胞的内部,然后放置其他的构建体。
通过所述的方法来制造多亚基蛋白质
在另一个方面中,本发明提供了根据本发明公开的方法制造的多亚基蛋白质。考虑到包含可以促进多亚基蛋白质(例如抗体)的适当折叠、组装和翻译后修饰的一个或多个元件,本领域的任一普通技术人员有理由认为此类蛋白质具有不同的结构和功能性。例如有理由认为通过所公开的方法制造的抗体具有特定的糖基化模式和数量上较高比率的非累积的异四聚体。
实施例
提供以下实施例,从而为本领域的那些普通技术人员提供如何制备和使用本发明的方法和组合物的完整公开和描述,并且无意于限定发明人所认为的该发明的范围。对于使用的数字(例如量、温度等),努力确保精确,但是仍会导致一些试验误差和偏差。除非另作说明,否则份数为摩尔份数;分子量为平均分子量;浓度百分率(%)是指溶质质量(以克计)除以溶液的体积(以毫升计),再乘以100%(例如10%物质X平均0.1克的物质X每毫升溶液);温度为℃;而压力为大气压力或接近大气压力。
实施例1:细胞系
使用编码人抗体的重链和轻链的两个质粒转染CHO-K1衍生的宿主细胞系。所述的两个质粒均包含赋予对潮霉素B抗性的hph基因(Asselbergs and Pronk,1992,Mol.Biol.Rep.,17(1):61-70)。使用LIPOFECTAMIN试剂(Invitrogen编号#18324020)转染细胞。简言之,在转染前的一天,将3.5x106个细胞平板接种于10cm平板的包含10%胎牛血清(FBS)(Invitrogen编号#10100)的完全F12(Invitrogen编号#11765)中。在转染当天,清洗细胞一次,并使用OPTIMEM(Invitrogen编号#31985)替代培养基。在OPTIMEM培养基中制备DNA/Lipofectamin复合物,然后将其加入到细胞中。6小时后,将培养基再次更换成具有10%FBS的完全F12。使用400μg/ml的潮霉素B选择试剂来选择稳定整合的质粒。使用FASTR技术来分离克隆抗体的表达细胞系(在美国专利号6,919,183中有所描述,该文献的内容以引用方式并入本文)。
然后,使用EDEM2的编码质粒再次转染抗体的表达细胞系。EDEM2质粒包含新霉素磷酸转移酶(质粒构建体被命名为“p3”)或sh ble(质粒“p7”)基因,从而分别赋予对G418或博来霉素的抗性。使用相同的转染方法。根据选择标记,选择分别具有400μg/ml G418抗性或250μg/ml博来霉素抗性的细胞。然后,使用FASTR技术分离克隆细胞系。
表3:细胞系
Figure BDA0002270886130000221
实施例2
使用摇瓶,在规模缩小的12天分批供料方法中评价抗体的生产。在该方法中,将细胞以8x105个细胞/mL的密度接种于烧瓶的生产培养基(定义为具有高含量氨基酸的培养基)中。培养持续大约12天,并补充3份供料、以及糖。在整个批次中监视活细胞的密度和抗体的效价。
为了测定mEDEM2对蛋白质生产增强的影响,将包含mEDEM2和mXBP1的CHO细胞系的蛋白质生产与包含mXBP1但不包含mEDEM2的对照细胞的生产比较。在表达mEDEM2的那些细胞系中的蛋白质的效价高于不表达mEDEM2的那些细胞系的蛋白质的效价。
表4:效价
细胞系 增强子 生产率(pg/个细胞/天) 效价g/L(增加%)
C1 EDEM2+XBP1 39 8.1(93)
C2 XBP1 39 4.2
C3 EDEM2+XBP1 37 5.9(55)
C8 XBP1 32 3.8
C6 EDEM2+XBP1 94 5.3(152)
C7 XBP1 52 2.1
C5 EDEM2 29 3.1(343)
C9 --- 9 0.7
实施例3:积分细胞天数
积分细胞天数(“ICD”)是用于描述在整个分批供料工艺中培养物生长的短语。在为期12天的生产测定期间,我们在第0、3、5、7、10和12天监视活细胞的密度。然后将该数据针对时间绘图。ICD为活细胞密度的积分,以细胞密度曲线下的面积计算。EDEM2转染的细胞系在为期12天的分批供料工艺中具有更高的ICD(参见表5)。
表5:积分细胞密度
细胞系 增强子 ICD 10<sup>6</sup>个细胞-天/mL(增加%)
C1 EDEM2+XBP1 205(93)
C2 XBP1 106
C3 EDEM2+XBP1 157(34)
C4 XBP1 117
C6 EDEM2+XBP1 56(51)
C7 XBP1 37
C5 EDEM2 116(59)
C9 --- 73
实施例4:抗GDF8抗体的生产
检测EDEM2、XBP1或两者的异位表达对具有SEQ ID NO:19的重链序列和SEQ IDNO:21的轻链序列的抗GDF8抗体的影响。检测单个细胞系的效价和积分细胞密度,并将其归于各“库”或值的范围中。EDEM2的异位表达显著增加了表达抗体的效价范围为5-6g/L的细胞系的数量。XBP1和EDEM2的组合显示不仅是增加高效价细胞系的相加的效应。此外,EDEM2在抗体的分泌细胞中的表达还显著地增加获得高ICD的细胞系的数量(参见表6)。
表6:
Figure BDA0002270886130000231
本说明书还包括下列内容:
1.一种细胞,其包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸和编码多亚基蛋白质的多核苷酸。
2.实施方式1所述的细胞,其中所述的应激诱导的甘露糖结合凝集素为内质网降解增强α-甘露糖苷酶-样蛋白质2(EDEM2)。
3.实施方式2所述的细胞,其中所述的EDEM2包含SEQ ID NO:8的氨基酸序列。
4.实施方式2所述的细胞,其中所述的EDEM2包含与SEQ ID NO:1具有至少92%的一致性的氨基酸序列。
5.实施方式1-4的任意一项所述的细胞,其中所述的多亚基蛋白质为抗体。
6.实施方式5所述的细胞,其中所述的抗体包含SEQ ID NO:43、SEQ ID NO:44、SEQID NO:45和SEQ ID NO:46的氨基酸序列。
7.实施方式1-6的任意一项所述的细胞,其包含编码未折叠蛋白质反应转录因子的多核苷酸,其中所述的未折叠蛋白质反应转录因子在所述的EDEM2的上游进行操作。
8.实施方式7所述的细胞,其中所述的转录因子为剪切形式的XBP-1。
9.实施方式8所述的细胞,其中所述的XBP-1包含SEQ ID NO:13的氨基酸序列。
10.实施方式8所述的细胞,其中所述的XBP-1包含与SEQ ID NO:9具有至少86%的一致性的氨基酸序列。
11.实施方式1-10的任意一项所述的细胞,其中所述的细胞为哺乳动物的细胞。
12.实施方式1-11的任意一项所述的细胞,其中所述的细胞为CHO细胞。
13.一种由实施方式1-12的任意一项所述的细胞衍生得到的细胞系。
14.实施方式13所述的细胞系,其生产效价为至少3g/L的所述的蛋白质。
15.实施方式13或实施方式14所述的细胞系,其生产效价为至少5g/L的所述的蛋白质。
16.实施方式13-15的任意一项所述的细胞系,其生产效价为至少8g/L的所述的蛋白质。
17.实施方式13-16的任意一项所述的细胞系,其中与不包含所述的编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系的积分细胞密度相比,所述的细胞系的积分细胞密度高出至少大约30%。
18.实施方式13-17的任意一项所述的细胞系,其中与不包含所述的编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系的积分细胞密度相比,所述的细胞系的积分细胞密度高出至少大约50%。
19.实施方式13-18的任意一项所述的细胞系,其中与不包含所述的编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系的积分细胞密度相比,所述的细胞系的积分细胞密度高出至少大约60%。
20.实施方式13-19的任意一项所述的细胞系,其中与不包含所述的编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系的积分细胞密度相比,所述的细胞系的积分细胞密度高出至少大约90%。
21.一种包含编码EDEM2的核苷酸序列的分离的多核苷酸,与哺乳动物的泛素C启动子可操作地连接。
22.实施方式21所述的分离的多核苷酸,其中所述的EDEM2包含SEQ ID NO:8的氨基酸序列。
23.实施方式21或实施方式22所述的分离的多核苷酸,其中所述的EDEM2由SEQ IDNO:8的氨基酸序列组成。
24.实施方式21-23的任意一项所述的分离的多核苷酸,其中所述的EDEM2包含与SEQ ID NO:1具有至少92%的一致性的氨基酸序列。
25.实施方式21-24的任意一项所述的分离的多核苷酸,其中所述的EDEM2由与SEQID NO:1具有至少92%的一致性的氨基酸序列组成。
26.实施方式21-25的任意一项所述的分离的多核苷酸,其中所述的EDEM2包含SEQID NO:1的氨基酸序列。
27.实施方式21-26的任意一项所述的分离的多核苷酸,其中所述的EDEM2由SEQID NO:1的氨基酸序列组成。
28.实施方式21-27的任意一项所述的多核苷酸,其包含SEQ ID NO:16的核苷酸序列。
29.实施方式21-28的任意一项所述的多核苷酸,其包含SEQ ID NO:14或SEQ IDNO:15的核苷酸序列。
30.实施方式21-29的任意一项所述的多核苷酸,其基本上由SEQ ID NO:14或SEQID NO:15的核苷酸序列组成。
31.一种包含编码Xbp-1蛋白质的核苷酸序列的分离的多核苷酸,与哺乳动物的泛素C启动子可操作地连接。
32.权力要求31所述的分离的多核苷酸,其中所述的Xbp-1蛋白质包含SEQ ID NO:13的氨基酸序列。
33.权力要求31或实施方式32所述的分离的多核苷酸,其中所述的Xbp-1蛋白质由SEQ ID NO:13的氨基酸序列组成。
34.实施方式31-33的任意一项所述的分离的多核苷酸,其中所述的Xbp-1蛋白质包含与SEQ ID NO:9具有至少86%的一致性的氨基酸序列。
35.实施方式31-34的任意一项所述的分离的多核苷酸,其中所述的Xbp-1蛋白质由与SEQ ID NO:9具有至少86%的一致性的氨基酸序列组成。
36.实施方式31-35的任意一项所述的分离的多核苷酸,其中所述的Xbp-1蛋白质包含SEQ ID NO:9的氨基酸序列。
37.实施方式31-36的任意一项所述的分离的多核苷酸,其中所述的Xbp-1蛋白质由SEQ ID NO:9的氨基酸序列组成。
38.实施方式31-37的任意一项所述的多核苷酸,其包含SEQ ID NO:18的核苷酸序列。
39.实施方式31-38的任意一项所述的多核苷酸,其包含SEQ ID NO:17的核苷酸序列。
40.实施方式31-39的任意一项所述的多核苷酸,其基本上由SEQ ID NO:17的核苷酸序列组成。
41.一种包含编码抗GDF8抗体重链的核苷酸序列的分离的多核苷酸,与哺乳动物的泛素C启动子或人CMV-IE启动子可操作地连接。
42.实施方式41所述的分离的多核苷酸,其中所述的抗GDF8抗体重链包含SEQ IDNO:20的氨基酸序列。
43.实施方式41或实施方式42所述的分离的多核苷酸,其中所述的抗GDF8抗体重链包含SEQ ID NO:19的氨基酸序列。
44.实施方式41-43的任意一项所述的分离的多核苷酸,其中所述的抗GDF8抗体重链由SEQ ID NO:19的氨基酸序列组成。
45.实施方式41-44的任意一项所述的多核苷酸,其包含SEQ ID NO:23的核苷酸序列。
46.实施方式41-45的任意一项所述的多核苷酸,其包含SEQ ID NO:24的核苷酸序列。
47.实施方式41-46的任意一项所述的多核苷酸,其基本上由SEQ ID NO:24的核苷酸序列组成。
48.一种包含编码抗GDF8抗体轻链的核苷酸序列的分离的多核苷酸,与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。
49.实施方式48所述的分离的多核苷酸,其中所述的抗GDF8抗体轻链包含SEQ IDNO:22的氨基酸序列。
50.实施方式48或实施方式49所述的分离的多核苷酸,其中所述的抗GDF8抗体轻链包含SEQ ID NO:21的氨基酸序列。
51.实施方式48-50的任意一项所述的分离的多核苷酸,其中所述的抗GDF8抗体轻链由SEQ ID NO:21的氨基酸序列组成。
52.实施方式48-51的任意一项所述的多核苷酸,其包含SEQ ID NO:25的核苷酸序列。
53.实施方式48-52的任意一项所述的多核苷酸,其包含SEQ ID NO:26的核苷酸序列。
54.实施方式48-53的任意一项所述的多核苷酸,其基本上由SEQ ID NO:26的核苷酸序列组成。
55.一种包含编码抗ANG2抗体重链的核苷酸序列的分离的多核苷酸,与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。
56.实施方式55所述的分离的多核苷酸,其中所述的抗ANG2抗体重链包含SEQ IDNO:28的氨基酸序列。
57.实施方式55或实施方式56所述的分离的多核苷酸,其中所述的抗ANG2抗体重链包含SEQ ID NO:27的氨基酸序列。
58.实施方式55-57的任意一项所述的分离的多核苷酸,其中所述的抗ANG2抗体重链由SEQ ID NO:27的氨基酸序列组成。
59.实施方式55-58的任意一项所述的多核苷酸,其包含SEQ ID NO:31的核苷酸序列。
60.实施方式55-59的任意一项所述的多核苷酸,其包含SEQ ID NO:32的核苷酸序列。
61.实施方式55-60的任意一项所述的多核苷酸,其基本上由SEQ ID NO:32的核苷酸序列组成。
62.一种包含编码抗ANG2抗体轻链的核苷酸序列的分离的多核苷酸,与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。
63.实施方式62所述的分离的多核苷酸,其中所述的抗ANG2抗体轻链包含SEQ IDNO:30的氨基酸序列。
64.实施方式62或实施方式63所述的分离的多核苷酸,其中所述的抗ANG2抗体轻链包含SEQ ID NO:29的氨基酸序列。
65.实施方式62-64的任意一项所述的分离的多核苷酸,其中所述的抗ANG2抗体轻链由SEQ ID NO:29的氨基酸序列组成。
66.实施方式62-65的任意一项所述的多核苷酸,其包含SEQ ID NO:33的核苷酸序列。
67.实施方式62-66的任意一项所述的多核苷酸,其包含SEQ ID NO:34的核苷酸序列。
68.实施方式62-67的任意一项所述的多核苷酸,其基本上由SEQ ID NO:34的核苷酸序列组成。
69.一种包含编码抗AngPtl4抗体重链的核苷酸序列的分离的多核苷酸,与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。
70.实施方式69所述的分离的多核苷酸,其中所述的抗AngPtl4抗体重链包含SEQID NO:36的氨基酸序列。
71.实施方式69或实施方式70所述的分离的多核苷酸,其中所述的抗AngPtl4抗体重链包含SEQ ID NO:35的氨基酸序列。
72.实施方式69-71的任意一项所述的分离的多核苷酸,其中所述的抗AngPtl4抗体重链由SEQ ID NO:35的氨基酸序列组成。
73.实施方式69-72的任意一项所述的分离的多核苷酸,其包含SEQ ID NO:39的核苷酸序列。
74.实施方式69-73的任意一项所述的分离的多核苷酸,其包含SEQ ID NO:40的核苷酸序列。
75.实施方式69-74的任意一项所述的分离的多核苷酸,其基本上由SEQ ID NO:40的核苷酸序列组成。
76.一种包含编码抗AngPtl4抗体轻链的核苷酸序列的分离的多核苷酸,与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。
77.实施方式76所述的分离的多核苷酸,其中所述的抗AngPtl4抗体轻链包含SEQID NO:38的氨基酸序列。
78.实施方式76或实施方式77所述的分离的多核苷酸,其中所述的抗AngPtl4抗体轻链包含SEQ ID NO:37的氨基酸序列。
79.实施方式76-78的任意一项所述的分离的多核苷酸,其中所述的抗AngPtl4抗体轻链由SEQ ID NO:37的氨基酸序列组成。
80.实施方式76-79的任意一项所述的多核苷酸,其包含SEQ ID NO:41的核苷酸序列。
81.实施方式76-80的任意一项所述的多核苷酸,其包含SEQ ID NO:42的核苷酸序列。
82.实施方式76-81的任意一项所述的多核苷酸,其基本上由SEQ ID NO:42的核苷酸序列组成。
83.一种编码多肽的分离的多核苷酸,其中所述的多肽包含SEQ ID NO:43的氨基酸序列。
84.一种编码多肽的分离的多核苷酸,其中所述的多肽包含SEQ ID NO:44的氨基酸序列。
85.一种编码多肽的分离的多核苷酸,其中所述的多肽包含SEQ ID NO:43和SEQID NO:44的氨基酸序列。
86.一种编码多肽的分离的多核苷酸,其中所述的多肽包含SEQ ID NO:45的氨基酸序列。
87.一种编码多肽的分离的多核苷酸,其中所述的多肽包含SEQ ID NO:46的氨基酸序列。
88.一种编码多肽的分离的多核苷酸,其中所述的多肽包含SEQ ID NO:45和SEQID NO:46的氨基酸序列。
89.一种细胞,其包含:实施方式21-30的任意一项所述的分离的多核苷酸;以及(b)编码多亚基蛋白质的多核苷酸。
90.实施方式89所述的细胞,其中所述的多亚基蛋白质为抗体。
91.实施方式90所述的细胞,其中所述的抗体包含实施方式83-88的任意一项所述的氨基酸序列。
92.实施方式91所述的细胞,其中所述的抗体包含实施方式85和88所述的氨基酸序列。
93.实施方式89-92的任意一项所述的细胞,其进一步包含实施方式31-40的任意一项所述的多核苷酸。
94.实施方式89-93的任意一项所述的细胞,其包含实施方式41-47的任意一项所述的多核苷酸和实施方式48-54的任意一项所述的多核苷酸。
95.实施方式89-93的任意一项所述的细胞,其包含实施方式55-61的任意一项所述的多核苷酸和实施方式62-68的任意一项所述的多核苷酸。
96.实施方式89-93的任意一项所述的细胞,其包含实施方式69-75的任意一项所述的多核苷酸和实施方式76-82的任意一项所述的多核苷酸。
97.实施方式89-96的任意一项所述的细胞,其中所述的细胞为中国仓鼠卵巢细胞(CHO)。
98.一种制备多亚基蛋白质的方法,其包括在培养基中培养实施方式89-97的任意一项所述的细胞的步骤,其中所述的多亚基蛋白质被所述的细胞分泌至所述的培养基中。
99.实施方式98所述的方法,其中所述的分泌的多亚基蛋白质在所述的培养基中的效价达到大约至少3g/L。
100.实施方式98或实施方式99所述的方法,其中所述的分泌的多亚基蛋白质在所述的培养基中的效价达到大约至少5g/L。
101.实施方式89-91的任意一项所述的方法,其中所述的分泌的多亚基蛋白质在所述的培养基中的效价达到大约至少6g/L。
102.实施方式89-92的任意一项所述的方法,其中所述的分泌的多亚基蛋白质在所述的培养基中的效价达到大约至少8g/L。
103.实施方式89-93的任意一项所述的方法,其中所述的细胞在所述的培养基中分裂达到积分细胞密度为大约至少5x 107个细胞-天/mL。
104.实施方式89-94的任意一项所述的方法,其中所述的细胞在所述的培养基中分裂,从而产生积分细胞密度为大约至少1x 108个细胞-天/mL。
105.实施方式89-95的任意一项所述的方法,其中所述的细胞在所述的培养基中分裂,从而产生积分细胞密度为大约至少1.5x 108个细胞-天/mL。
106.实施方式89-96的任意一项所述的方法,其进一步包含从所述的培养基中纯化所述的分泌多亚基蛋白质的步骤。
107.一种根据实施方式98-106的任意一项所述的方法生产的多亚基蛋白质。
108.实施方式107所述的多亚基蛋白质,其中所述的多亚基蛋白质为抗体。
109.实施方式108所述的多亚基蛋白质,其中所述的抗体包含SEQ ID NO:43、SEQID NO:44、SEQ ID NO:45和SEQ ID NO:46的氨基酸序列。
110.实施方式109所述的多亚基蛋白质,其中所述的抗体为抗GDF8抗体。
111.实施方式110所述的多亚基蛋白质,其中所述的抗体包含SEQ ID NO:20和SEQID NO:22的氨基酸序列。
112.实施方式109所述的多亚基蛋白质,其中所述的抗体为抗ANG2抗体。
113.实施方式112所述的多亚基蛋白质,其中所述的抗体包含SEQ ID NO:28和SEQID NO:30的氨基酸序列。
114.实施方式109所述的多亚基蛋白质,其中所述的抗体为抗AngPtl4抗体。
115.实施方式114所述的多亚基蛋白质,其中所述的抗体包含SEQ ID NO:36和SEQID NO:38的氨基酸序列。
116.一种包含多核苷酸的离体哺乳动物细胞,所述的多核苷酸包含SEQ ID NO:16的核酸序列。
117.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;和(b)多核苷酸,其包含SEQ ID NO:18的核酸序列。
118.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;(b)多核苷酸,其编码包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列的多肽;和(c)多核苷酸,其编码包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列的多肽。
119.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;(b)多核苷酸,其包含SEQ ID NO:23的核酸序列;和(c)多核苷酸,其包含SEQ ID NO:25的核酸序列。
120.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;(b)多核苷酸,其包含SEQ ID NO:31的核酸序列;和(c)多核苷酸,其包含SEQ ID NO:33的核酸序列。
121.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;(b)多核苷酸,其包含SEQ ID NO:39的核酸序列;和(c)多核苷酸,其包含SEQ ID NO:41的核酸序列。
122.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;(b)多核苷酸,其包含SEQ ID NO:18的核酸序列;(c)多核苷酸,其编码包含SEQ IDNO:43和SEQ ID NO:44的氨基酸序列的多肽;和(d)多核苷酸,其编码包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列的多肽。
123.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;(b)多核苷酸,其包含SEQ ID NO:18的核酸序列;(c)多核苷酸,其包含SEQ ID NO:23的核酸序列;和(d)多核苷酸,其包含SEQ ID NO:25的核酸序列。
124.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;(b)多核苷酸,其包含SEQ ID NO:18的核酸序列;(c)多核苷酸,其包含SEQ ID NO:31的核酸序列;和(d)多核苷酸,其包含SEQ ID NO:33的核酸序列。
125.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其包含SEQ ID NO:16的核酸序列;(b)多核苷酸,其包含SEQ ID NO:18的核酸序列;(c)多核苷酸,其包含SEQ ID NO:39的核酸序列;和(d)多核苷酸,其包含SEQ ID NO:41的核酸序列。
126.一种包含多核苷酸的离体哺乳动物细胞,所述的多核苷酸由SEQ ID NO:14或15的核酸序列组成。
127.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;和(b)多核苷酸,其由SEQ ID NO:17的核酸序列组成。
128.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;(b)多核苷酸,其编码包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列的多肽;和(c)多核苷酸,其编码包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列的多肽。
129.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;(b)多核苷酸,其由SEQ ID NO:24的核酸序列组成;和(c)多核苷酸,其由SEQID NO:26的核酸序列组成。
130.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;(b)多核苷酸,其由SEQ ID NO:32的核酸序列组成;和(c)多核苷酸,其由SEQID NO:4的核酸序列组成。
131.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;(b)多核苷酸,其由SEQ ID NO:40的核酸序列组成;和(c)多核苷酸,其由SEQID NO:42的核酸序列组成。
132.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;(b)多核苷酸,其由SEQ ID NO:17的核酸序列组成;(c)多核苷酸,其编码包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列的多肽;和(d)多核苷酸,其编码包含SEQ IDNO:45和SEQ ID NO:46的氨基酸序列的多肽。
133.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;(b)多核苷酸,其由SEQ ID NO:17的核酸序列组成;(c)多核苷酸,其由SEQ IDNO:24的核酸序列组成;和(d)多核苷酸,其由SEQ ID NO:26的核酸序列组成。
134.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;(b)多核苷酸,其由SEQ ID NO:17的核酸序列组成;(c)多核苷酸,其由SEQ IDNO:32的核酸序列组成;和(d)多核苷酸,其由SEQ ID NO:34的核酸序列组成。
135.一种离体哺乳动物细胞,其包含:(a)多核苷酸,其由SEQ ID NO:14或15的核酸序列组成;(b)多核苷酸,其由SEQ ID NO:17的核酸序列组成;(c)多核苷酸,其由SEQ IDNO:40的核酸序列组成;和(d)多核苷酸,其由SEQ ID NO:42的核酸序列组成。
本说明书还包括下列内容:
11.实施方式7的细胞,其中所述细胞以至少37pg/个细胞/天的速率生产所述多亚基蛋白。
12.实施方式1的细胞,其中所述编码多亚基蛋白的核酸序列还包含SEQ ID NO:45的氨基酸序列。
13.实施方式1的细胞,其中所述编码多亚基蛋白的核酸序列还包含SEQ ID NO:44的氨基酸序列。
14.实施方式1的细胞,其中所述多亚基蛋白是抗体。
15.实施方式14的细胞,其中所述抗体包含具有SEQ ID NO:44的氨基酸序列的重链。
16.实施方式15的细胞,其中所述抗体是抗GDF8抗体、抗Ang2抗体或抗AngPtl4抗体。
17.实施方式1的细胞,其中所述细胞是真核细胞。
18.实施方式17的细胞,其中所述细胞是修饰的CHO-K1细胞。
19.实施方式7的细胞,其还包含第四多核苷酸,所述第四多核苷酸编码结合所述多亚基蛋白的细胞表面捕获分子。
20.细胞系,其包含多个起源于实施方式1的细胞而通过克隆扩增得到的细胞。
21.制备多亚基蛋白的方法,其包括:
(a)在培养基中培养通过克隆扩增从一个细胞中分离下来的多个细胞,该细胞包括:
(i)第一多核苷酸,其包含编码第一生产增强蛋白的核酸序列,所述第一生产增强蛋白包含与SEQ ID NO:9至少86%一致的氨基酸序列;和
(ii)第二多核苷酸,其包含编码多亚基蛋白的核酸序列,所述多亚基蛋白包含SEQID NO:46的氨基酸序列;
(b)使细胞以大于9pg/个细胞/天的速率将所述多亚基蛋白分泌到培养基中;和
(c)通过亲和层析、离子交换层析或者亲和层析和离子交换层析的组合从所述培养基中纯化所述多亚基蛋白。
22.实施方式21的方法,其中所述第一生产增强蛋白包含选自下列的氨基酸序列:SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:13。
23.实施方式21的方法,其中所述编码所述第一生产增强蛋白的核酸序列与组成型遍在启动子可操作地连接。
24.实施方式23的方法,其中所述组成型启动子选自:泛素C启动子、CMV-IE启动子和SV40启动子。
25.实施方式22的方法,其中所述第一多核苷酸包含SEQ ID NO:18的核酸序列。
26.实施方式25的方法,其中所述第一多核苷酸包含SEQ ID NO:17的核酸序列。
27.实施方式21的方法,其中所述细胞以大于32pg/个细胞/天的速率将所述多亚基蛋白分泌到所述培养基中。
28.实施方式21的方法,其还在步骤(a)之前包括下列步骤:
(aa)以任何顺序
(i)用所述第一多核苷酸转染所述细胞,和
(ii)用所述第二多核苷酸转染所述细胞;和
(bb)克隆扩增所述包含所述第一多核苷酸和所述第二多核苷酸的细胞。
29.实施方式21的方法,其中所述细胞还包含第三多核苷酸,所述第三多核苷酸包含编码第二生产增强蛋白的核酸序列,
所述第二生产增强蛋白包含与SEQ ID NO:1具有至少92%一致性的氨基酸序列,且
所述第二生产增强蛋白使步骤(b)的细胞以≥37pg/个细胞/天的速率将所述多亚基蛋白分泌到所述培养基中。
30.实施方式29的方法,其中所述第二生产增强蛋白包含选自下列的氨基酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6和SEQID NO:8。
31.实施方式29的方法,其中所述编码所述第二生产增强蛋白的核酸序列与第二组成型启动子可操作地连接。
32.实施方式31的方法,其中所述第二组成型启动子选自:泛素C启动子、CMV-IE启动子和SV40启动子。
33.实施方式31的方法,其中所述第三多核苷酸包含SEQ ID NO:16的核酸序列。
34.实施方式31的方法,其中所述第三多核苷酸包含SEQ ID NO:14或15的核酸序列。
35.实施方式29的方法,其还在步骤(a)之前包括下列步骤:
(aa)以任何顺序
(i)用所述第一多核苷酸转染所述细胞,
(ii)用所述第二多核苷酸转染所述细胞,及
(iii)用所述第三多核苷酸转染所述细胞;和
(bb)克隆扩增所述包含所述第一多核苷酸、所述第二多核苷酸和所述第三多核苷酸的细胞。
36.实施方式21的方法,其中所述多亚基蛋白在培养基中积累的滴度≥2.1g/L,≥3.8g/L或≥4.2g/L。
37.实施方式29的方法,其中所述多亚基蛋白在培养基中积累的滴度≥5.3g/L,≥5.9g/L或≥8.1g/L。
38.实施方式21的方法,其中所述编码多亚基蛋白的核酸序列还包含SEQ ID NO:45的氨基酸序列。
39.实施方式21的方法,其中所述编码多亚基蛋白的核酸序列还包含SEQ ID NO:44的氨基酸序列。
40.实施方式21的方法,其中所述多亚基蛋白是抗体。
41.实施方式40的方法,其中所述抗体包含具有SEQ ID NO:44的氨基酸序列的重链。
42.实施方式41的方法,其中所述抗体是抗GDF8抗体、抗Ang2抗体或抗AngPtl4抗体。
序列表
<110> Regeneron Pharmaceuticals, Inc.
<120> 生产型细胞系的增强子
<130> 8150A
<150> US 61/652,549
<151> 2012-05-29
<160> 46
<170> PatentIn version 3.5
<210> 1
<211> 577
<212> PRT
<213> 小鼠(Mus musculus)
<400> 1
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Ile Lys Glu Phe Tyr Ser Leu Lys Gln Ser Arg
500 505 510
Pro Lys Arg Ala Gln Arg Lys Thr Val Arg Ser Gly Pro Trp Glu Pro
515 520 525
Gln Ser Gly Pro Ala Thr Leu Ser Ser Pro Ala Asn Gln Pro Arg Glu
530 535 540
Lys Gln Pro Ala Gln Gln Arg Thr Pro Leu Leu Ser Cys Pro Ser Gln
545 550 555 560
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
565 570 575
Ser
<210> 2
<211> 576
<212> PRT
<213> 大鼠(Rattus norvegicus)
<400> 2
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Glu Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Ile Lys Glu Phe Tyr Ser Leu Arg Gln Ser Arg
500 505 510
Ser Arg Ala Gln Arg Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Gly Pro Gly Thr Leu Ser Ser Pro Glu Asn Gln Pro Arg Glu Lys
530 535 540
Gln Pro Ala Arg Gln Arg Ala Pro Leu Leu Ser Cys Pro Ser Gln Pro
545 550 555 560
Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser Ser
565 570 575
<210> 3
<211> 578
<212> PRT
<213> 黑线仓鼠(Cricetulus griseus)
<400> 3
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Phe Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Leu Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Arg Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Ala Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Leu His Ser Leu Lys Gln Ser Arg
500 505 510
Ser Arg Ala Gln Arg Lys Thr Thr Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Gly Pro Gly Ser Pro Ser Ala Pro Gly Lys Gln Asp Gln Pro Arg
530 535 540
Glu Lys Gln Pro Ala Lys Gln Arg Thr Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 4
<211> 578
<212> PRT
<213> 智人(Homo sapiens)
<400> 4
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Leu Cys Ala Leu Leu
1 5 10 15
Pro Gln His His Gly Ala Pro Gly Pro Asp Gly Ser Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Phe Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Ser Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Thr Val Ile Thr Pro Tyr Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Ser Arg
500 505 510
Ser Lys Phe Gln Lys Asn Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg
530 535 540
Glu Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 5
<211> 578
<212> PRT
<213> 黑猩猩(Pan troglodytes)
<400> 5
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Leu Cys Ala Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Ser Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Phe Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Ser Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ala Val Ile Thr Pro Tyr Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Ser Arg
500 505 510
Ser Lys Phe Gln Lys Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg
530 535 540
Glu Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 6
<211> 513
<212> PRT
<213> 婆罗洲猩猩(Pongo pygmaeus)
<400> 6
Met Asn Thr Leu Ser Cys Ser Leu Phe Ser Leu Thr Leu Ile Asp Ala
1 5 10 15
Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg Val
20 25 30
Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn Ala
35 40 45
Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser Ala
50 55 60
His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp Pro
65 70 75 80
Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys Leu
85 90 95
Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val Asn
100 105 110
Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr Ala
115 120 125
Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu Thr
130 135 140
Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg Leu
145 150 155 160
Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp Val
165 170 175
Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly Val
180 185 190
Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln Asp
195 200 205
Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg Asn
210 215 220
Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys Gly
225 230 235 240
Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro Gly
245 250 255
Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe Leu
260 265 270
Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe Tyr
275 280 285
Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro Leu
290 295 300
Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr Gly
305 310 315 320
Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile Glu
325 330 335
Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu Arg
340 345 350
Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu Thr
355 360 365
Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His Asn
370 375 380
Asn Gly Ser Thr Phe Asp Ala Val Ile Thr Pro Tyr Gly Glu Cys Ile
385 390 395 400
Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile Asp
405 410 415
Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp Glu
420 425 430
Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Asn Arg Ser
435 440 445
Lys Phe Gln Lys Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro Ala
450 455 460
Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg Gly
465 470 475 480
Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser Gln
485 490 495
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
500 505 510
Ser
<210> 7
<211> 572
<212> PRT
<213> 斑马鱼(Danio rerio)
<400> 7
Leu Tyr Tyr Leu Pro Leu Phe Thr Ser Arg Tyr Phe Met Leu Thr Phe
1 5 10 15
Leu Phe Ser Ala Ile Phe Cys Ala Ala Tyr Leu Ser Pro Ile Ile Ser
20 25 30
His Val Lys Gly Arg Asp Phe Thr Glu Gln Glu Met Ser His Tyr Arg
35 40 45
Asp Arg Val Lys Ser Met Phe Tyr His Ala Tyr Asn Ser Tyr Leu Asp
50 55 60
Asn Ala Tyr Pro Tyr Asp Glu Leu Arg Pro Leu Thr Cys Asp Gly Gln
65 70 75 80
Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp Ala Leu Asp Thr
85 90 95
Leu Leu Ile Leu Gly Asn His Thr Glu Phe Gln Arg Val Ala Thr Leu
100 105 110
Leu Gln Asp Thr Val Asp Phe Asp Ile Asp Val Asn Ala Ser Val Phe
115 120 125
Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser Ala His Leu Leu
130 135 140
Ser Lys Arg Ala Gly Met Lys Val Glu Glu Gly Trp Pro Cys Ser Gly
145 150 155 160
Pro Leu Leu Arg Met Ala Glu Asp Ala Ala Arg Lys Leu Leu Pro Ala
165 170 175
Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val Asn Leu Leu Arg
180 185 190
Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr Ala Gly Val Gly
195 200 205
Thr Phe Ile Leu Glu Phe Ser Thr Leu Ser Arg Leu Thr Gly Asp Pro
210 215 220
Val Phe Glu Asn Val Ala Arg Lys Ala Leu Arg Ala Leu Trp Arg Thr
225 230 235 240
Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp Val Ile Thr Ser
245 250 255
Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly Val Asp Ser Tyr
260 265 270
Phe Glu Tyr Leu Val Arg Gly Ala Ile Met Leu Gln Asp Glu Glu Leu
275 280 285
Leu Thr Met Phe Tyr Glu Phe Asp Lys Ser Ile Lys Asn Tyr Thr Lys
290 295 300
Phe Asp Asp Trp Tyr Leu Trp Val Gln Met His Lys Gly Thr Val Ser
305 310 315 320
Met Pro Val Phe Gln Ser Leu Glu Ala Phe Trp Pro Gly Met Gln Ser
325 330 335
Leu Ile Gly Asp Ile Ser Ser Ala Thr Lys Ser Phe His Asn Tyr Tyr
340 345 350
Ser Val Trp Arg Gln Phe Gly Gly Leu Pro Glu Phe Tyr Ser Ile Pro
355 360 365
Gln Gly Tyr Thr Val Asp Lys Arg Glu Gly Tyr Pro Leu Arg Pro Glu
370 375 380
Leu Ile Glu Ser Ala Met Tyr Leu Tyr Lys Ala Thr Gly Asp Pro Ser
385 390 395 400
Phe Ile Gln Leu Gly Arg Asp Ala Val Glu Ser Ile Asp Arg Ile Ser
405 410 415
Arg Val Asn Cys Gly Phe Ala Thr Val Lys Asp Val Arg Asp His Lys
420 425 430
Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu Thr Ile Lys Tyr
435 440 445
Leu Tyr Leu Leu Phe Asp Pro Asp Asn Phe Leu His Asn Thr Gly Thr
450 455 460
Glu Phe Glu Leu Gly Gly Leu Arg Gly Asp Cys Ile Leu Ser Ala Gly
465 470 475 480
Gly Tyr Val Phe Asn Thr Glu Ala His Pro Leu Asp Pro Ala Ala Leu
485 490 495
His Cys Cys Ser Arg Glu Gln Gln Asp Arg Arg Glu Ile Gln Asp Ile
500 505 510
Leu Leu Ser Phe Ser Gln Pro His Thr Glu Glu Pro Ser Arg Asp Gln
515 520 525
Ser Ala Gly Gly Ser Pro Glu Ser Ile Ala Leu Lys Pro Gly Glu Gln
530 535 540
Arg Lys Ala Pro Val Leu Ser Cys Pro Thr Gln Pro Phe Ser Ala Lys
545 550 555 560
Leu Ala Val Met Gly Gln Val Phe Ser Asp Asn Ser
565 570
<210> 8
<211> 577
<212> PRT
<213> 人工的
<220>
<223> 共有序列
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> V或L
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> V或A
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> L或F
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> D或E
<220>
<221> MISC_FEATURE
<222> (28)..(28)
<223> T或S
<220>
<221> MISC_FEATURE
<222> (57)..(57)
<223> Y或F
<220>
<221> MISC_FEATURE
<222> (91)..(91)
<223> T或V
<220>
<221> MISC_FEATURE
<222> (104)..(104)
<223> N或S
<220>
<221> MISC_FEATURE
<222> (220)..(220)
<223> V或L
<220>
<221> MISC_FEATURE
<222> (285)..(285)
<223> K或R
<220>
<221> MISC_FEATURE
<222> (292)..(292)
<223> H或R
<220>
<221> MISC_FEATURE
<222> (356)..(356)
<223> P或A
<220>
<221> MISC_FEATURE
<222> (442)..(442)
<223> H或D
<220>
<221> MISC_FEATURE
<222> (444)..(444)
<223> N或T
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> S, T或A
<220>
<221> MISC_FEATURE
<222> (458)..(458)
<223> M或I
<220>
<221> MISC_FEATURE
<222> (461)..(461)
<223> H或Y
<220>
<221> MISC_FEATURE
<222> (489)..(489)
<223> R或Q
<220>
<221> MISC_FEATURE
<222> (502)..(502)
<223> I或M
<220>
<221> MISC_FEATURE
<222> (503)..(503)
<223> K或R
<220>
<221> MISC_FEATURE
<222> (505)..(505)
<223> F或L
<220>
<221> MISC_FEATURE
<222> (506)..(506)
<223> Y或H
<220>
<221> MISC_FEATURE
<222> (509)..(509)
<223> K或R
<220>
<221> MISC_FEATURE
<222> (510)..(510)
<223> Q或R
<220>
<221> MISC_FEATURE
<222> (513)..(513)
<223> P或S
<220>
<221> MISC_FEATURE
<222> (514)..(516)
<223> KRA, RA或KF
<220>
<221> MISC_FEATURE
<222> (518)..(518)
<223> R或K
<220>
<221> MISC_FEATURE
<222> (519)..(519)
<223> K或N
<220>
<221> MISC_FEATURE
<222> (522)..(522)
<223> R或S
<220>
<221> MISC_FEATURE
<222> (529)..(529)
<223> Q或P
<220>
<221> MISC_FEATURE
<222> (530)..(530)
<223> S或A
<220>
<221> MISC_FEATURE
<222> (531)..(531)
<223> G或R
<220>
<221> MISC_FEATURE
<222> (533)..(533)
<223> A或G
<220>
<221> MISC_FEATURE
<222> (534)..(534)
<223> T或S
<220>
<221> MISC_FEATURE
<222> (535)..(535)
<223> L或P
<220>
<221> MISC_FEATURE
<222> (536)..(536)
<223> S或F
<220>
<221> MISC_FEATURE
<222> (537)..(537)
<223> S或A
<220>
<221> MISC_FEATURE
<222> (539)..(540)
<223> AN, EN, GKQD或ENHD
<220>
<221> MISC_FEATURE
<222> (542)..(542)
<223> P或A
<220>
<221> MISC_FEATURE
<222> (545)..(545)
<223> K或R
<220>
<221> MISC_FEATURE
<222> (546)..(546)
<223> Q或K
<220>
<221> MISC_FEATURE
<222> (549)..(549)
<223> Q, R或K
<220>
<221> MISC_FEATURE
<222> (551)..(551)
<223> R或K
<220>
<221> MISC_FEATURE
<222> (552)..(552)
<223> T, A或V
<400> 8
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Xaa Cys Xaa Xaa Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Xaa Gly Xaa Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Xaa Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Xaa Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Xaa Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Xaa Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Xaa Ala Ile Arg
275 280 285
Asn Tyr Thr Xaa Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Xaa Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Xaa Pro Xaa Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Xaa Val Xaa Thr Pro Xaa Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Xaa Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Xaa Xaa Glu Xaa Xaa Ser Leu Xaa Xaa Ser Arg
500 505 510
Xaa Xaa Xaa Xaa Gln Xaa Xaa Thr Val Xaa Ser Gly Pro Trp Glu Pro
515 520 525
Xaa Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Gln Xaa Arg Glu
530 535 540
Xaa Xaa Pro Ala Xaa Gln Xaa Xaa Pro Leu Leu Ser Cys Pro Ser Gln
545 550 555 560
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
565 570 575
Ser
<210> 9
<211> 371
<212> PRT
<213> 小鼠(Mus musculus)
<400> 9
Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Gly Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Pro Arg Ala Ala Gly Ser Glu Ala Ser Gly Thr
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn His Lys Leu Gln Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Val Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Thr Leu Asp Pro Asp Glu Val Pro Glu Val Glu
130 135 140
Ala Lys Gly Ser Gly Val Arg Leu Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Ala Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Ser Leu Glu Glu Leu Pro Glu Val Tyr Pro Glu Gly Pro
210 215 220
Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala
225 230 235 240
Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr
245 250 255
Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn
260 265 270
Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp
275 280 285
His Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Leu Glu Asp Asp
290 295 300
Phe Ile Pro Glu Leu Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys
305 310 315 320
Leu Arg Pro Pro Ser Cys Leu Leu Asp Ala His Ser Asp Cys Gly Tyr
325 330 335
Glu Gly Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Thr
340 345 350
Asp His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu
355 360 365
Ile Ser Val
370
<210> 10
<211> 369
<212> PRT
<213> 黑线仓鼠(Cricetulus griseus)
<400> 10
Met Val Val Val Ala Ala Ser Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ala Asp Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Ser Arg Ala Ala Gly Ser Glu Ala Asn Gly Ala
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu
130 135 140
Ser Lys Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Asp Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Asn Leu Glu Glu Leu Pro Glu Val Tyr Pro Gly Pro Ser
210 215 220
Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala Lys
225 230 235 240
Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr Lys
245 250 255
Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn Val
260 265 270
Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp His
275 280 285
Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Glu Glu Asp Phe Ile
290 295 300
Pro Glu Pro Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys Leu Lys
305 310 315 320
Pro Ser Ser Cys Leu Leu Asp Ala Tyr Ser Asp Cys Gly Tyr Glu Gly
325 330 335
Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Ile Asp His
340 345 350
Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu Ile Ser
355 360 365
Val
<210> 11
<211> 376
<212> PRT
<213> 智人(Homo sapiens)
<400> 11
Met Val Val Val Ala Ala Ala Pro Asn Pro Ala Asp Gly Thr Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Ala Ala Gly Ala Pro Ala
20 25 30
Gly Gln Ala Leu Pro Leu Met Val Pro Ala Gln Arg Gly Ala Ser Pro
35 40 45
Glu Ala Ala Ser Gly Gly Leu Pro Gln Ala Arg Lys Arg Gln Arg Leu
50 55 60
Thr His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn
65 70 75 80
Arg Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Arg Met Ser
85 90 95
Glu Leu Glu Gln Gln Val Val Asp Leu Glu Glu Glu Asn Gln Lys Leu
100 105 110
Leu Leu Glu Asn Gln Leu Leu Arg Glu Lys Thr His Gly Leu Val Val
115 120 125
Glu Asn Gln Glu Leu Arg Gln Arg Leu Gly Met Asp Ala Leu Val Ala
130 135 140
Glu Glu Glu Ala Glu Ala Lys Gly Asn Glu Val Arg Pro Val Ala Gly
145 150 155 160
Ser Ala Glu Ser Ala Ala Gly Ala Gly Pro Val Val Thr Pro Pro Glu
165 170 175
His Leu Pro Met Asp Ser Gly Gly Ile Asp Ser Ser Asp Ser Glu Ser
180 185 190
Asp Ile Leu Leu Gly Ile Leu Asp Asn Leu Asp Pro Val Met Phe Phe
195 200 205
Lys Cys Pro Ser Pro Glu Pro Ala Ser Leu Glu Glu Leu Pro Glu Val
210 215 220
Tyr Pro Glu Gly Pro Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val
225 230 235 240
Gly Thr Ser Ser Ala Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe
245 250 255
Asp His Ile Tyr Thr Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr
260 265 270
Glu Ser Gln Ala Asn Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser
275 280 285
Pro Ser Glu Asn Asp His Pro Glu Phe Ile Val Ser Val Lys Glu Glu
290 295 300
Pro Val Glu Asp Asp Leu Val Pro Glu Leu Gly Ile Ser Asn Leu Leu
305 310 315 320
Ser Ser Ser His Cys Pro Lys Pro Ser Ser Cys Leu Leu Asp Ala Tyr
325 330 335
Ser Asp Cys Gly Tyr Gly Gly Ser Leu Ser Pro Phe Ser Asp Met Ser
340 345 350
Ser Leu Leu Gly Val Asn His Ser Trp Glu Asp Thr Phe Ala Asn Glu
355 360 365
Leu Phe Pro Gln Leu Ile Ser Val
370 375
<210> 12
<211> 383
<212> PRT
<213> 斑马鱼(Danio rerio)
<400> 12
Met Val Val Val Thr Ala Gly Thr Gly Gly Ala His Lys Val Leu Leu
1 5 10 15
Ile Ser Gly Lys Gln Ser Ala Ser Thr Gly Ala Thr Gln Gly Gly Tyr
20 25 30
Ser Arg Ser Ile Ser Val Met Ile Pro Asn Gln Ala Ser Ser Asp Ser
35 40 45
Asp Ser Thr Thr Ser Gly Pro Pro Leu Arg Lys Arg Gln Arg Leu Thr
50 55 60
His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg
65 70 75 80
Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Lys Met Gly Glu
85 90 95
Leu Glu Gln Gln Val Leu Glu Leu Glu Leu Glu Asn Gln Lys Leu His
100 105 110
Val Glu Asn Arg Leu Leu Arg Asp Lys Thr Ser Asp Leu Leu Ser Glu
115 120 125
Asn Glu Glu Leu Arg Gln Arg Leu Gly Leu Asp Thr Leu Glu Thr Lys
130 135 140
Glu Gln Val Gln Val Leu Glu Ser Ala Val Ser Asp Leu Gly Leu Val
145 150 155 160
Thr Gly Ser Ser Glu Ser Ala Ala Gly Ala Gly Pro Ala Val Pro Lys
165 170 175
Ser Glu Asp Phe Thr Met Asp Thr His Ser Pro Gly Pro Ala Asp Ser
180 185 190
Glu Ser Asp Leu Leu Leu Gly Ile Leu Asp Ile Leu Asp Pro Glu Leu
195 200 205
Phe Leu Lys Thr Asp Leu Pro Glu Ala Gln Glu Pro Gln Gln Glu Leu
210 215 220
Val Leu Val Gly Gly Ala Gly Glu Gln Val Pro Ser Ser Ala Pro Ala
225 230 235 240
Ala Leu Gly Pro Ala Pro Val Lys Leu Glu Ala Leu Asn Glu Leu Ile
245 250 255
His Phe Asp His Ile Tyr Thr Lys Pro Ala Glu Val Leu Val Ser Glu
260 265 270
Glu Ser Ile Cys Glu Val Lys Ala Glu Asp Ser Val Ala Phe Ser Glu
275 280 285
Thr Glu Glu Glu Ile Gln Val Glu Asp Gln Thr Val Ser Val Lys Asp
290 295 300
Glu Pro Glu Glu Val Val Ile Pro Ala Glu Asn Gln Asn Pro Asp Ala
305 310 315 320
Ala Asp Asp Phe Leu Ser Asp Thr Ser Phe Gly Gly Tyr Glu Lys Ala
325 330 335
Ser Tyr Leu Thr Asp Ala Tyr Ser Asp Ser Gly Tyr Glu Arg Ser Pro
340 345 350
Ser Pro Phe Ser Asn Ile Ser Ser Pro Leu Cys Ser Glu Gly Ser Trp
355 360 365
Asp Asp Met Phe Ala Ser Glu Leu Phe Pro Gln Leu Ile Ser Val
370 375 380
<210> 13
<211> 371
<212> PRT
<213> 人工的
<220>
<223> 共有序列
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> A或S
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> S或N
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> A或P
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> T或D
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> A或G
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> A或T
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> S或A
<220>
<221> misc_feature
<222> (27)..(27)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (29)..(29)
<223> R或Q
<220>
<221> MISC_FEATURE
<222> (37)..(37)
<223> G或A
<220>
<221> misc_feature
<222> (38)..(38)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (40)..(40)
<223> A或G
<220>
<221> MISC_FEATURE
<222> (46)..(46)
<223> S或N或ASG
<220>
<221> MISC_FEATURE
<222> (48)..(48)
<223> T, A或L
<220>
<221> MISC_FEATURE
<222> (103)..(103)
<223> H或Q
<220>
<221> MISC_FEATURE
<222> (106)..(106)
<223> Q或L
<220>
<221> MISC_FEATURE
<222> (121)..(121)
<223> V或I
<220>
<221> MISC_FEATURE
<222> (128)..(128)
<223> T或Q
<220>
<221> MISC_FEATURE
<222> (134)..(134)
<223> T, V或A
<220>
<221> MISC_FEATURE
<222> (136)..(136)
<223> D, T或V
<220>
<221> MISC_FEATURE
<222> (137)..(137)
<223> P, T或A
<220>
<221> MISC_FEATURE
<222> (138)..(138)
<223> D或E
<220>
<221> MISC_FEATURE
<222> (140)..(140)
<223> V, A或无
<220>
<221> MISC_FEATURE
<222> (141)..(141)
<223> P或无
<220>
<221> MISC_FEATURE
<222> (143)..(143)
<223> V, T或A
<220>
<221> MISC_FEATURE
<222> (145)..(145)
<223> A或S
<220>
<221> MISC_FEATURE
<222> (148)..(148)
<223> S或N
<220>
<221> MISC_FEATURE
<222> (149)..(149)
<223> G或E
<220>
<221> MISC_FEATURE
<222> (152)..(152)
<223> L或P
<220>
<221> MISC_FEATURE
<222> (169)..(169)
<223> S或P
<220>
<221> MISC_FEATURE
<222> (178)..(178)
<223> D或G
<220>
<221> MISC_FEATURE
<222> (179)..(179)
<223> T或G
<220>
<221> MISC_FEATURE
<222> (180)..(180)
<223> V或I
<220>
<221> MISC_FEATURE
<222> (181)..(181)
<223> A或D
<220>
<221> MISC_FEATURE
<222> (196)..(196)
<223> K或N
<220>
<221> MISC_FEATURE
<222> (210)..(210)
<223> S或P
<220>
<221> MISC_FEATURE
<222> (212)..(212)
<223> S或N
<220>
<221> MISC_FEATURE
<222> (222)..(222)
<223> E或无
<220>
<221> MISC_FEATURE
<222> (254)..(254)
<223> V或I
<220>
<221> MISC_FEATURE
<222> (271)..(271)
<223> T或A
<220>
<221> MISC_FEATURE
<222> (284)..(284)
<223> S或P
<220>
<221> MISC_FEATURE
<222> (287)..(287)
<223> E或N
<220>
<221> MISC_FEATURE
<222> (298)..(298)
<223> K或E
<220>
<221> MISC_FEATURE
<222> (301)..(301)
<223> L, V或无
<220>
<221> MISC_FEATURE
<222> (303)..(303)
<223> D或E
<220>
<221> MISC_FEATURE
<222> (305)..(305)
<223> F或L
<220>
<221> MISC_FEATURE
<222> (306)..(306)
<223> I或V
<220>
<221> MISC_FEATURE
<222> (309)..(309)
<223> L或P
<220>
<221> MISC_FEATURE
<222> (321)..(321)
<223> L或P
<220>
<221> MISC_FEATURE
<222> (322)..(322)
<223> R或K
<220>
<221> MISC_FEATURE
<222> (324)..(324)
<223> P或S
<220>
<221> MISC_FEATURE
<222> (331)..(331)
<223> H或Y
<220>
<221> MISC_FEATURE
<222> (337)..(337)
<223> E或G
<220>
<221> MISC_FEATURE
<222> (340)..(340)
<223> P或L
<220>
<221> MISC_FEATURE
<222> (349)..(349)
<223> P或L
<220>
<221> MISC_FEATURE
<222> (352)..(352)
<223> T, I或V
<220>
<221> MISC_FEATURE
<222> (353)..(353)
<223> D或N
<400> 13
Met Val Val Val Ala Ala Xaa Pro Xaa Xaa Ala Xaa Xaa Xaa Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Xaa Xaa Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Xaa Xaa Arg Xaa Ala Gly Ser Glu Ala Xaa Gly Xaa
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Xaa Lys Leu Xaa Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Xaa Glu Asn Gln Glu Leu Arg Xaa
115 120 125
Arg Leu Gly Met Asp Xaa Leu Asp Xaa Xaa Glu Xaa Xaa Glu Xaa Glu
130 135 140
Xaa Lys Gly Xaa Xaa Val Arg Xaa Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Xaa Pro Glu His Leu Pro Met Asp
165 170 175
Ser Xaa Xaa Xaa Xaa Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Xaa Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Xaa Ala Xaa Leu Glu Glu Leu Pro Glu Val Tyr Pro Xaa Gly Pro
210 215 220
Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala
225 230 235 240
Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Xaa Tyr Thr
245 250 255
Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Xaa Asn
260 265 270
Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Xaa Ser Glu Xaa Asp
275 280 285
His Pro Glu Phe Ile Val Ser Val Lys Xaa Glu Pro Xaa Glu Xaa Asp
290 295 300
Xaa Xaa Pro Glu Xaa Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys
305 310 315 320
Xaa Xaa Pro Xaa Ser Cys Leu Leu Asp Ala Xaa Ser Asp Cys Gly Tyr
325 330 335
Xaa Gly Ser Xaa Ser Pro Phe Ser Asp Met Ser Ser Xaa Leu Gly Xaa
340 345 350
Xaa His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu
355 360 365
Ile Ser Val
370
<210> 14
<211> 7686
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 14
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgat gccttttaga 60
ctcctgatac cattgggtct tgtttgcgtt ctcctccctc tccatcacgg cgccccaggt 120
ccagacggta ccgcacctga tcctgcccat taccgcgaac gcgttaaagc catgttctac 180
cacgcctatg actcctatct ggaaaatgca ttcccctatg atgagctccg accccttacc 240
tgcgatggtc atgatacttg gggctctttt tcccttaccc ttattgacgc tctggacaca 300
ctccttatcc tcggaaacac cagcgaattt caaagagtag ttgaagtact tcaggacaat 360
gtcgactttg acatcgatgt gaacgcatca gttttcgaaa caaatataag agtcgttgga 420
ggtctgctct ccgcccacct tctctctaaa aaagccggag tagaagttga agctggctgg 480
ccctgctccg gacccctcct tcgtatggct gaagaagctg cccgcaaact ccttcccgct 540
tttcagaccc caaccggtat gccctatggt actgttaacc tcctgcacgg agtaaatccc 600
ggcgaaaccc ccgtcacatg tacagccgga attggaacct ttattgtgga atttgcaacc 660
cttagcagcc tgaccggaga tcctgtattc gaagacgtgg ctcgggttgc cctgatgcga 720
ctgtgggaat ccaggtctga tatcggtctg gtcggtaacc atatagacgt actcactggt 780
aaatgggttg cacaagacgc tggaattggg gcaggcgtgg attcttattt tgaatatctc 840
gtaaaagggg ccatactctt gcaggacaaa aaacttatgg ctatgttcct ggaatataac 900
aaagctatta ggaactacac acacttcgat gattggtatt tgtgggtcca aatgtataaa 960
ggaaccgttt ctatgcctgt ctttcagtca ctggaggctt attggcctgg tctgcaatcc 1020
ctgatcggag acattgacaa tgcaatgagg acattcctta attattacac tgtttggaag 1080
cagttcggcg gattgcccga attttacaac attcctcaag gctatacagt tgaaaaaaga 1140
gaaggatatc ccctgcgccc cgagcttatt gaaagcgcta tgtatctgta tcgtgcaaca 1200
ggtgatccaa ccctgcttga actgggacga gacgccgtcg aatcaatcga gaaaatttca 1260
aaagtggaat gcggctttgc aacaattaaa gatcttagag accacaaact ggataatcgc 1320
atggagtcat tctttttggc tgagaccgtc aagtatctgt atctgctttt tcatcccaac 1380
aacttcatcc ataataacgg gtccaccttc gattcagtca tgacccctca cggtgaatgc 1440
atactcggag ctggaggcta tatttttaac actgaagctc acccaattga cccagctgcc 1500
cttcattgtt gtcgacgtct gaaagaagaa caatgggagg ttgaagattt gatcaaagaa 1560
ttttactcac ttaaacaaag tcgacctaaa cgcgcacaga gaaaaactgt aagatctggt 1620
ccttgggaac ctcagtccgg cccagcaact ctttcatccc ccgccaacca accacgagaa 1680
aaacaaccag cccaacagag aacccccctg ctcagctgcc cctctcagcc cttcacttca 1740
aaactcgccc tgcttggaca ggtgtttctg gactcctctt gatttaaaca cgcggccgct 1800
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 1860
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 1920
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 1980
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtaggg 2040
cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2100
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2160
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2220
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2280
cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg 2340
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2400
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2460
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2520
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 2580
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2640
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2700
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2760
ggattttggt catgggcgcg cctcatactc ctgcaggcat gagattatca aaaaggatct 2820
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 2880
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 2940
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 3000
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 3060
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 3120
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 3180
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 3240
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 3300
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 3360
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 3420
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 3480
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 3540
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 3600
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 3660
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 3720
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 3780
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3840
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtcaggtacc 3900
aagcctaggc ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggcagaggcg 3960
gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 4020
ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 4080
ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 4140
gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 4200
tttccacacc ggatccacca tgggatcggc cattgaacaa gatggattgc acgcaggttc 4260
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 4320
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 4380
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 4440
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 4500
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 4560
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 4620
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 4680
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 4740
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 4800
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 4860
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 4920
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 4980
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaacgcgtg ctgtaagtct 5040
gcagaaattg atgatctatt aaacaataaa gatgtccact aaaatggaag tttttcctgt 5100
catactttgt taagaagggt gagaacagag tacctacatt ttgaatggaa ggattggagc 5160
tacgggggtg ggggtggggt gggattagat aaatgcctgc tctttactga aggctcttta 5220
ctattgcttt atgataatgt ttcatagttg gatatcataa tttaaacaag caaaaccaaa 5280
ttaagggcca gctcattcct cccactcatg atctatggat ctatagatct ctcgtgcagc 5340
tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 5400
gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 5460
ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 5520
ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 5580
ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 5640
gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 5700
tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 5760
gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagtcg 5820
cgaggcctcc gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg 5880
ctgccacgtc agacgaaggg cgcagcgagc gtcctgatcc ttccgcccgg acgctcagga 5940
cagcggcccg ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt 6000
taggacggga cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg 6060
aggaaaagta gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc 6120
gatgattata taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg 6180
ggtcgcggtt cttgtttgtg gatcgctgtg atcgtcactt ggtgagtagc gggctgctgg 6240
gctggccggg gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac 6300
cgccaagggc tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga 6360
gcgcagcaaa atggcggctg ttcccgagtc ttgaatggaa gacgcttgtg aggcgggctg 6420
tgaggtcgtt gaaacaaggt ggggggcatg gtgggcggca agaacccaag gtcttgaggc 6480
cttcgctaat gcgggaaagc tcttattcgg gtgagatggg ctggggcacc atctggggac 6540
cctgacgtga agtttgtcac tgactggaga actcggtttg tcgtctgttg cgggggcggc 6600
agttatggcg gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg ccctcgtcgt 6660
gtcgtgacgt cacccgttct gttggcttat aatgcagggt ggggccacct gccggtaggt 6720
gtgcggtagg cttttctccg tcgcaggacg cagggttcgg gcctagggta ggctctcctg 6780
aatcgacagg cgccggacct ctggtgaggg gagggataag tgaggcgtca gtttctttgg 6840
tcggttttat gtacctatct tcttaagtag ctgaagctcc ggttttgaac tatgcgctcg 6900
gggttggcga gtgtgttttg tgaagttttt taggcacctt ttgaaatgta atcatttggg 6960
tcaatatgta attttcagtg ttagactagt aaattgtccg ctaaattctg gccgtttttg 7020
gcttttttgt tagacgtcga ccgatcctga gaacttcagg gtgagtttgg ggacccttga 7080
ttgttctttc tttttcgcta ttgtaaaatt catgttatat ggagggggca aagttttcag 7140
ggtgttgttt agaatgggaa gatgtccctt gtatcaccat ggaccctcat gataattttg 7200
tttctttcac tttctactct gttgacaacc attgtctcct cttattttct tttcattttc 7260
tgtaactttt tcgttaaact ttagcttgca tttgtaacga atttttaaat tcacttttgt 7320
ttatttgtca gattgtaagt actttctcta atcacttttt tttcaaggca atcagggtat 7380
attatattgt acttcagcac agttttagag aacaattgtt ataattaaat gataaggtag 7440
aatatttctg catataaatt ctggctggcg tggaaatatt cttattggta gaaacaacta 7500
caccctggtc atcatcctgc ctttctcttt atggttacaa tgatatacac tgtttgagat 7560
gaggataaaa tactctgagt ccaaaccggg cccctctgct aaccatgttc atgccttctt 7620
ctctttccta cagctcctgg gcaacgtgct ggttgttgtg ctgtctcatc attttggcaa 7680
agaatt 7686
<210> 15
<211> 7257
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 15
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgat gccttttaga 60
ctcctgatac cattgggtct tgtttgcgtt ctcctccctc tccatcacgg cgccccaggt 120
ccagacggta ccgcacctga tcctgcccat taccgcgaac gcgttaaagc catgttctac 180
cacgcctatg actcctatct ggaaaatgca ttcccctatg atgagctccg accccttacc 240
tgcgatggtc atgatacttg gggctctttt tcccttaccc ttattgacgc tctggacaca 300
ctccttatcc tcggaaacac cagcgaattt caaagagtag ttgaagtact tcaggacaat 360
gtcgactttg acatcgatgt gaacgcatca gttttcgaaa caaatataag agtcgttgga 420
ggtctgctct ccgcccacct tctctctaaa aaagccggag tagaagttga agctggctgg 480
ccctgctccg gacccctcct tcgtatggct gaagaagctg cccgcaaact ccttcccgct 540
tttcagaccc caaccggtat gccctatggt actgttaacc tcctgcacgg agtaaatccc 600
ggcgaaaccc ccgtcacatg tacagccgga attggaacct ttattgtgga atttgcaacc 660
cttagcagcc tgaccggaga tcctgtattc gaagacgtgg ctcgggttgc cctgatgcga 720
ctgtgggaat ccaggtctga tatcggtctg gtcggtaacc atatagacgt actcactggt 780
aaatgggttg cacaagacgc tggaattggg gcaggcgtgg attcttattt tgaatatctc 840
gtaaaagggg ccatactctt gcaggacaaa aaacttatgg ctatgttcct ggaatataac 900
aaagctatta ggaactacac acacttcgat gattggtatt tgtgggtcca aatgtataaa 960
ggaaccgttt ctatgcctgt ctttcagtca ctggaggctt attggcctgg tctgcaatcc 1020
ctgatcggag acattgacaa tgcaatgagg acattcctta attattacac tgtttggaag 1080
cagttcggcg gattgcccga attttacaac attcctcaag gctatacagt tgaaaaaaga 1140
gaaggatatc ccctgcgccc cgagcttatt gaaagcgcta tgtatctgta tcgtgcaaca 1200
ggtgatccaa ccctgcttga actgggacga gacgccgtcg aatcaatcga gaaaatttca 1260
aaagtggaat gcggctttgc aacaattaaa gatcttagag accacaaact ggataatcgc 1320
atggagtcat tctttttggc tgagaccgtc aagtatctgt atctgctttt tcatcccaac 1380
aacttcatcc ataataacgg gtccaccttc gattcagtca tgacccctca cggtgaatgc 1440
atactcggag ctggaggcta tatttttaac actgaagctc acccaattga cccagctgcc 1500
cttcattgtt gtcgacgtct gaaagaagaa caatgggagg ttgaagattt gatcaaagaa 1560
ttttactcac ttaaacaaag tcgacctaaa cgcgcacaga gaaaaactgt aagatctggt 1620
ccttgggaac ctcagtccgg cccagcaact ctttcatccc ccgccaacca accacgagaa 1680
aaacaaccag cccaacagag aacccccctg ctcagctgcc cctctcagcc cttcacttca 1740
aaactcgccc tgcttggaca ggtgtttctg gactcctctt gatttaaaca cgcggccgct 1800
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 1860
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 1920
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 1980
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtaggg 2040
cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2100
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2160
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2220
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2280
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 2340
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2400
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2460
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2520
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 2580
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2640
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2700
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2760
ggattttggt catgggcgcg cctcatactc ctgcaggcat gagattatca aaaaggatct 2820
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 2880
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 2940
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 3000
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 3060
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 3120
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 3180
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 3240
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 3300
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 3360
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 3420
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 3480
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 3540
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 3600
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 3660
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 3720
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 3780
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3840
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtcaggtacc 3900
aagcctaggc ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggcagaggcg 3960
gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 4020
ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 4080
ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 4140
gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 4200
tttccacacc ggatccacca tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg 4260
cgacgtcgcc ggagcggtcg agttctggac cgaccggctc gggttctccc gggacttcgt 4320
ggaggacgac ttcgccggtg tggtccggga cgacgtgacc ctgttcatca gcgcggtcca 4380
ggaccaggtg gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct 4440
gtacgccgag tggtcggagg tcgtgtccac gaacttccgg gacgcctccg ggccggccat 4500
gaccgagatc ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa 4560
ctgcgtgcac ttcgtggccg aggagcagga ctgaacgcgt gctgtaagtc tgcagaaatt 4620
gatgatctat taaacaataa agatgtccac taaaatggaa gtttttcctg tcatactttg 4680
ttaagaaggg tgagaacaga gtacctacat tttgaatgga aggattggag ctacgggggt 4740
gggggtgggg tgggattaga taaatgcctg ctctttactg aaggctcttt actattgctt 4800
tatgataatg tttcatagtt ggatatcata atttaaacaa gcaaaaccaa attaagggcc 4860
agctcattcc tcccactcat gatctatgga tctatagatc tctcgtgcag ctggggctct 4920
agggggtatc cccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 4980
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5040
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5100
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5160
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5220
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5280
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5340
taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg tcagttagtc gcgaggcctc 5400
cgcgccgggt tttggcgcct cccgcgggcg cccccctcct cacggcgagc gctgccacgt 5460
cagacgaagg gcgcagcgag cgtcctgatc cttccgcccg gacgctcagg acagcggccc 5520
gctgctcata agactcggcc ttagaacccc agtatcagca gaaggacatt ttaggacggg 5580
acttgggtga ctctagggca ctggttttct ttccagagag cggaacaggc gaggaaaagt 5640
agtcccttct cggcgattct gcggagggat ctccgtgggg cggtgaacgc cgatgattat 5700
ataaggacgc gccgggtgtg gcacagctag ttccgtcgca gccgggattt gggtcgcggt 5760
tcttgtttgt ggatcgctgt gatcgtcact tggtgagtag cgggctgctg ggctggccgg 5820
ggctttcgtg gccgccgggc cgctcggtgg gacggaagcg tgtggagaga ccgccaaggg 5880
ctgtagtctg ggtccgcgag caaggttgcc ctgaactggg ggttgggggg agcgcagcaa 5940
aatggcggct gttcccgagt cttgaatgga agacgcttgt gaggcgggct gtgaggtcgt 6000
tgaaacaagg tggggggcat ggtgggcggc aagaacccaa ggtcttgagg ccttcgctaa 6060
tgcgggaaag ctcttattcg ggtgagatgg gctggggcac catctgggga ccctgacgtg 6120
aagtttgtca ctgactggag aactcggttt gtcgtctgtt gcgggggcgg cagttatggc 6180
ggtgccgttg ggcagtgcac ccgtaccttt gggagcgcgc gccctcgtcg tgtcgtgacg 6240
tcacccgttc tgttggctta taatgcaggg tggggccacc tgccggtagg tgtgcggtag 6300
gcttttctcc gtcgcaggac gcagggttcg ggcctagggt aggctctcct gaatcgacag 6360
gcgccggacc tctggtgagg ggagggataa gtgaggcgtc agtttctttg gtcggtttta 6420
tgtacctatc ttcttaagta gctgaagctc cggttttgaa ctatgcgctc ggggttggcg 6480
agtgtgtttt gtgaagtttt ttaggcacct tttgaaatgt aatcatttgg gtcaatatgt 6540
aattttcagt gttagactag taaattgtcc gctaaattct ggccgttttt ggcttttttg 6600
ttagacgtcg accgatcctg agaacttcag ggtgagtttg gggacccttg attgttcttt 6660
ctttttcgct attgtaaaat tcatgttata tggagggggc aaagttttca gggtgttgtt 6720
tagaatggga agatgtccct tgtatcacca tggaccctca tgataatttt gtttctttca 6780
ctttctactc tgttgacaac cattgtctcc tcttattttc ttttcatttt ctgtaacttt 6840
ttcgttaaac tttagcttgc atttgtaacg aatttttaaa ttcacttttg tttatttgtc 6900
agattgtaag tactttctct aatcactttt ttttcaaggc aatcagggta tattatattg 6960
tacttcagca cagttttaga gaacaattgt tataattaaa tgataaggta gaatatttct 7020
gcatataaat tctggctggc gtggaaatat tcttattggt agaaacaact acaccctggt 7080
catcatcctg cctttctctt tatggttaca atgatataca ctgtttgaga tgaggataaa 7140
atactctgag tccaaaccgg gcccctctgc taaccatgtt catgccttct tctctttcct 7200
acagctcctg ggcaacgtgc tggttgttgt gctgtctcat cattttggca aagaatt 7257
<210> 16
<211> 3892
<212> DNA
<213> 人工的
<220>
<223> 合成的构建体
<400> 16
aggcctccgc gccgggtttt ggcgcctccc gcgggcgccc ccctcctcac ggcgagcgct 60
gccacgtcag acgaagggcg cagcgagcgt cctgatcctt ccgcccggac gctcaggaca 120
gcggcccgct gctcataaga ctcggcctta gaaccccagt atcagcagaa ggacatttta 180
ggacgggact tgggtgactc tagggcactg gttttctttc cagagagcgg aacaggcgag 240
gaaaagtagt cccttctcgg cgattctgcg gagggatctc cgtggggcgg tgaacgccga 300
tgattatata aggacgcgcc gggtgtggca cagctagttc cgtcgcagcc gggatttggg 360
tcgcggttct tgtttgtgga tcgctgtgat cgtcacttgg tgagtagcgg gctgctgggc 420
tggccggggc tttcgtggcc gccgggccgc tcggtgggac ggaagcgtgt ggagagaccg 480
ccaagggctg tagtctgggt ccgcgagcaa ggttgccctg aactgggggt tggggggagc 540
gcagcaaaat ggcggctgtt cccgagtctt gaatggaaga cgcttgtgag gcgggctgtg 600
aggtcgttga aacaaggtgg ggggcatggt gggcggcaag aacccaaggt cttgaggcct 660
tcgctaatgc gggaaagctc ttattcgggt gagatgggct ggggcaccat ctggggaccc 720
tgacgtgaag tttgtcactg actggagaac tcggtttgtc gtctgttgcg ggggcggcag 780
ttatggcggt gccgttgggc agtgcacccg tacctttggg agcgcgcgcc ctcgtcgtgt 840
cgtgacgtca cccgttctgt tggcttataa tgcagggtgg ggccacctgc cggtaggtgt 900
gcggtaggct tttctccgtc gcaggacgca gggttcgggc ctagggtagg ctctcctgaa 960
tcgacaggcg ccggacctct ggtgagggga gggataagtg aggcgtcagt ttctttggtc 1020
ggttttatgt acctatcttc ttaagtagct gaagctccgg ttttgaacta tgcgctcggg 1080
gttggcgagt gtgttttgtg aagtttttta ggcacctttt gaaatgtaat catttgggtc 1140
aatatgtaat tttcagtgtt agactagtaa attgtccgct aaattctggc cgtttttggc 1200
ttttttgtta gacgtcgacc gatcctgaga acttcagggt gagtttgggg acccttgatt 1260
gttctttctt tttcgctatt gtaaaattca tgttatatgg agggggcaaa gttttcaggg 1320
tgttgtttag aatgggaaga tgtcccttgt atcaccatgg accctcatga taattttgtt 1380
tctttcactt tctactctgt tgacaaccat tgtctcctct tattttcttt tcattttctg 1440
taactttttc gttaaacttt agcttgcatt tgtaacgaat ttttaaattc acttttgttt 1500
atttgtcaga ttgtaagtac tttctctaat cacttttttt tcaaggcaat cagggtatat 1560
tatattgtac ttcagcacag ttttagagaa caattgttat aattaaatga taaggtagaa 1620
tatttctgca tataaattct ggctggcgtg gaaatattct tattggtaga aacaactaca 1680
ccctggtcat catcctgcct ttctctttat ggttacaatg atatacactg tttgagatga 1740
ggataaaata ctctgagtcc aaaccgggcc cctctgctaa ccatgttcat gccttcttct 1800
ctttcctaca gctcctgggc aacgtgctgg ttgttgtgct gtctcatcat tttggcaaag 1860
aattaagctt atactcgagc tctagattgg gaacccgggt ctctcgaatt cgatgccttt 1920
tagactcctg ataccattgg gtcttgtttg cgttctcctc cctctccatc acggcgcccc 1980
aggtccagac ggtaccgcac ctgatcctgc ccattaccgc gaacgcgtta aagccatgtt 2040
ctaccacgcc tatgactcct atctggaaaa tgcattcccc tatgatgagc tccgacccct 2100
tacctgcgat ggtcatgata cttggggctc tttttccctt acccttattg acgctctgga 2160
cacactcctt atcctcggaa acaccagcga atttcaaaga gtagttgaag tacttcagga 2220
caatgtcgac tttgacatcg atgtgaacgc atcagttttc gaaacaaata taagagtcgt 2280
tggaggtctg ctctccgccc accttctctc taaaaaagcc ggagtagaag ttgaagctgg 2340
ctggccctgc tccggacccc tccttcgtat ggctgaagaa gctgcccgca aactccttcc 2400
cgcttttcag accccaaccg gtatgcccta tggtactgtt aacctcctgc acggagtaaa 2460
tcccggcgaa acccccgtca catgtacagc cggaattgga acctttattg tggaatttgc 2520
aacccttagc agcctgaccg gagatcctgt attcgaagac gtggctcggg ttgccctgat 2580
gcgactgtgg gaatccaggt ctgatatcgg tctggtcggt aaccatatag acgtactcac 2640
tggtaaatgg gttgcacaag acgctggaat tggggcaggc gtggattctt attttgaata 2700
tctcgtaaaa ggggccatac tcttgcagga caaaaaactt atggctatgt tcctggaata 2760
taacaaagct attaggaact acacacactt cgatgattgg tatttgtggg tccaaatgta 2820
taaaggaacc gtttctatgc ctgtctttca gtcactggag gcttattggc ctggtctgca 2880
atccctgatc ggagacattg acaatgcaat gaggacattc cttaattatt acactgtttg 2940
gaagcagttc ggcggattgc ccgaatttta caacattcct caaggctata cagttgaaaa 3000
aagagaagga tatcccctgc gccccgagct tattgaaagc gctatgtatc tgtatcgtgc 3060
aacaggtgat ccaaccctgc ttgaactggg acgagacgcc gtcgaatcaa tcgagaaaat 3120
ttcaaaagtg gaatgcggct ttgcaacaat taaagatctt agagaccaca aactggataa 3180
tcgcatggag tcattctttt tggctgagac cgtcaagtat ctgtatctgc tttttcatcc 3240
caacaacttc atccataata acgggtccac cttcgattca gtcatgaccc ctcacggtga 3300
atgcatactc ggagctggag gctatatttt taacactgaa gctcacccaa ttgacccagc 3360
tgcccttcat tgttgtcgac gtctgaaaga agaacaatgg gaggttgaag atttgatcaa 3420
agaattttac tcacttaaac aaagtcgacc taaacgcgca cagagaaaaa ctgtaagatc 3480
tggtccttgg gaacctcagt ccggcccagc aactctttca tcccccgcca accaaccacg 3540
agaaaaacaa ccagcccaac agagaacccc cctgctcagc tgcccctctc agcccttcac 3600
ttcaaaactc gccctgcttg gacaggtgtt tctggactcc tcttgattta aacacgcggc 3660
cgctaatcag ccataccaca tttgtagagg ttttacttgc tttaaaaaac ctcccacacc 3720
tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag 3780
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 3840
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gt 3892
<210> 17
<211> 6629
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 17
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcatg gtggtggtgg 60
ctgctgctcc ttctgctgct acagctgctc ctaaggtgct gctgctgtct ggacagcctg 120
cttctggagg aagagctctg cctctgatgg tgcctggacc tagagctgct ggatctgagg 180
cttctggaac acctcaggct agaaagagac agagactgac acatctgtct cctgaagaaa 240
aggctctgag aagaaagctg aagaatagag tggctgctca gacagctaga gatagaaaga 300
aggctagaat gtctgaactg gaacagcagg tggtggatct ggaagaagaa aatcataagc 360
tgcagctgga aaatcagctg ctgagagaaa agacacatgg actggtggtg gaaaatcagg 420
aactgagaac aagactggga atggatacac tggatcctga tgaagtgcct gaagtggaag 480
ctaagggatc tggagtgaga ctggtggctg gatctgctga atctgctgct ggagctggac 540
ctgtggtgac atctcctgaa catctgccta tggattctga tacagtggct tcttctgatt 600
ctgaatctga tatcctgctg ggaatcctgg ataagctgga tcctgtgatg ttttttaagt 660
gtccttctcc tgaatctgct tctctggaag aactgcctga agtgtatcct gaaggacctt 720
cttctctgcc tgcttctctg tctctgtctg tgggaacatc ttctgctaag ctggaagcta 780
tcaatgaact gatcagattt gatcatgtgt atacaaagcc tctggtgctg gaaatccctt 840
ctgaaacaga atctcagaca aatgtggtgg tgaagatcga agaagctcct ctgtcttctt 900
ctgaagaaga tcatcctgaa tttatcgtgt ctgtgaagaa ggaacctctg gaagatgatt 960
ttatccctga actgggaatc tctaatctgc tgtcttcttc tcattgtctg agacctcctt 1020
cttgtctgct ggatgctcat tctgattgtg gatatgaagg atctccttct cctttttctg 1080
atatgtcttc tcctctggga acagatcatt cttgggaaga tacatttgct aatgaactgt 1140
ttcctcagct gatctctgtg tgagcggccg ctaatcagcc ataccacatt tgtagaggtt 1200
ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca 1260
attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 1320
acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 1380
atcaatgtat cttatcatgt ctaccggtag ggcccctctc ttcatgtgag caaaaggcca 1440
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1500
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1560
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1620
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1680
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1740
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1800
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1860
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1920
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1980
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 2040
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2100
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgggcg cgcctcatac 2160
tcctgcaggc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 2220
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 2280
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 2340
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 2400
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 2460
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 2520
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 2580
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 2640
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 2700
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 2760
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 2820
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 2880
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 2940
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 3000
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 3060
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 3120
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 3180
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 3240
tccccgaaaa gtgccacctg acgtcaggta ccaagcctag gcctccaaaa aagcctcctc 3300
actacttctg gaatagctca gaggcagagg cggcctcggc ctctgcataa ataaaaaaaa 3360
ttagtcagcc atggggcgga gaatgggcgg aactgggcgg agttaggggc gggatgggcg 3420
gagttagggg cgggactatg gttgctgact aattgagatg catgctttgc atacttctgc 3480
ctgctgggga gcctggggac tttccacacc tggttgctga ctaattgaga tgcatgcttt 3540
gcatacttct gcctgctggg gagcctgggg actttccaca ccggatccac catggccaag 3600
ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg 3660
accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg 3720
gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg 3780
gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc 3840
acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg 3900
cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag 3960
gactgaacgc gtgctgtaag tctgcagaaa ttgatgatct attaaacaat aaagatgtcc 4020
actaaaatgg aagtttttcc tgtcatactt tgttaagaag ggtgagaaca gagtacctac 4080
attttgaatg gaaggattgg agctacgggg gtgggggtgg ggtgggatta gataaatgcc 4140
tgctctttac tgaaggctct ttactattgc tttatgataa tgtttcatag ttggatatca 4200
taatttaaac aagcaaaacc aaattaaggg ccagctcatt cctcccactc atgatctatg 4260
gatctataga tctctcgtgc agctggggct ctagggggta tccccacgcg ccctgtagcg 4320
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 4380
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4440
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4500
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4560
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4620
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4680
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattaattct 4740
gtggaatgtg tgtcagttag tcgcgaggcc tccgcgccgg gttttggcgc ctcccgcggg 4800
cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg agcgtcctga 4860
tccttccgcc cggacgctca ggacagcggc ccgctgctca taagactcgg ccttagaacc 4920
ccagtatcag cagaaggaca ttttaggacg ggacttgggt gactctaggg cactggtttt 4980
ctttccagag agcggaacag gcgaggaaaa gtagtccctt ctcggcgatt ctgcggaggg 5040
atctccgtgg ggcggtgaac gccgatgatt atataaggac gcgccgggtg tggcacagct 5100
agttccgtcg cagccgggat ttgggtcgcg gttcttgttt gtggatcgct gtgatcgtca 5160
cttggtgagt agcgggctgc tgggctggcc ggggctttcg tggccgccgg gccgctcggt 5220
gggacggaag cgtgtggaga gaccgccaag ggctgtagtc tgggtccgcg agcaaggttg 5280
ccctgaactg ggggttgggg ggagcgcagc aaaatggcgg ctgttcccga gtcttgaatg 5340
gaagacgctt gtgaggcggg ctgtgaggtc gttgaaacaa ggtggggggc atggtgggcg 5400
gcaagaaccc aaggtcttga ggccttcgct aatgcgggaa agctcttatt cgggtgagat 5460
gggctggggc accatctggg gaccctgacg tgaagtttgt cactgactgg agaactcggt 5520
ttgtcgtctg ttgcgggggc ggcagttatg gcggtgccgt tgggcagtgc acccgtacct 5580
ttgggagcgc gcgccctcgt cgtgtcgtga cgtcacccgt tctgttggct tataatgcag 5640
ggtggggcca cctgccggta ggtgtgcggt aggcttttct ccgtcgcagg acgcagggtt 5700
cgggcctagg gtaggctctc ctgaatcgac aggcgccgga cctctggtga ggggagggat 5760
aagtgaggcg tcagtttctt tggtcggttt tatgtaccta tcttcttaag tagctgaagc 5820
tccggttttg aactatgcgc tcggggttgg cgagtgtgtt ttgtgaagtt ttttaggcac 5880
cttttgaaat gtaatcattt gggtcaatat gtaattttca gtgttagact agtaaattgt 5940
ccgctaaatt ctggccgttt ttggcttttt tgttagacgt cgaccgatcc tgagaacttc 6000
agggtgagtt tggggaccct tgattgttct ttctttttcg ctattgtaaa attcatgtta 6060
tatggagggg gcaaagtttt cagggtgttg tttagaatgg gaagatgtcc cttgtatcac 6120
catggaccct catgataatt ttgtttcttt cactttctac tctgttgaca accattgtct 6180
cctcttattt tcttttcatt ttctgtaact ttttcgttaa actttagctt gcatttgtaa 6240
cgaattttta aattcacttt tgtttatttg tcagattgta agtactttct ctaatcactt 6300
ttttttcaag gcaatcaggg tatattatat tgtacttcag cacagtttta gagaacaatt 6360
gttataatta aatgataagg tagaatattt ctgcatataa attctggctg gcgtggaaat 6420
attcttattg gtagaaacaa ctacaccctg gtcatcatcc tgcctttctc tttatggtta 6480
caatgatata cactgtttga gatgaggata aaatactctg agtccaaacc gggcccctct 6540
gctaaccatg ttcatgcctt cttctctttc ctacagctcc tgggcaacgt gctggttgtt 6600
gtgctgtctc atcattttgg caaagaatt 6629
<210> 18
<211> 3264
<212> DNA
<213> 人工的
<220>
<223> 合成的构建体
<400> 18
ggcctccgcg ccgggttttg gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg 60
ccacgtcaga cgaagggcgc agcgagcgtc ctgatccttc cgcccggacg ctcaggacag 120
cggcccgctg ctcataagac tcggccttag aaccccagta tcagcagaag gacattttag 180
gacgggactt gggtgactct agggcactgg ttttctttcc agagagcgga acaggcgagg 240
aaaagtagtc ccttctcggc gattctgcgg agggatctcc gtggggcggt gaacgccgat 300
gattatataa ggacgcgccg ggtgtggcac agctagttcc gtcgcagccg ggatttgggt 360
cgcggttctt gtttgtggat cgctgtgatc gtcacttggt gagtagcggg ctgctgggct 420
ggccggggct ttcgtggccg ccgggccgct cggtgggacg gaagcgtgtg gagagaccgc 480
caagggctgt agtctgggtc cgcgagcaag gttgccctga actgggggtt ggggggagcg 540
cagcaaaatg gcggctgttc ccgagtcttg aatggaagac gcttgtgagg cgggctgtga 600
ggtcgttgaa acaaggtggg gggcatggtg ggcggcaaga acccaaggtc ttgaggcctt 660
cgctaatgcg ggaaagctct tattcgggtg agatgggctg gggcaccatc tggggaccct 720
gacgtgaagt ttgtcactga ctggagaact cggtttgtcg tctgttgcgg gggcggcagt 780
tatggcggtg ccgttgggca gtgcacccgt acctttggga gcgcgcgccc tcgtcgtgtc 840
gtgacgtcac ccgttctgtt ggcttataat gcagggtggg gccacctgcc ggtaggtgtg 900
cggtaggctt ttctccgtcg caggacgcag ggttcgggcc tagggtaggc tctcctgaat 960
cgacaggcgc cggacctctg gtgaggggag ggataagtga ggcgtcagtt tctttggtcg 1020
gttttatgta cctatcttct taagtagctg aagctccggt tttgaactat gcgctcgggg 1080
ttggcgagtg tgttttgtga agttttttag gcaccttttg aaatgtaatc atttgggtca 1140
atatgtaatt ttcagtgtta gactagtaaa ttgtccgcta aattctggcc gtttttggct 1200
tttttgttag acgtcgaccg atcctgagaa cttcagggtg agtttgggga cccttgattg 1260
ttctttcttt ttcgctattg taaaattcat gttatatgga gggggcaaag ttttcagggt 1320
gttgtttaga atgggaagat gtcccttgta tcaccatgga ccctcatgat aattttgttt 1380
ctttcacttt ctactctgtt gacaaccatt gtctcctctt attttctttt cattttctgt 1440
aactttttcg ttaaacttta gcttgcattt gtaacgaatt tttaaattca cttttgttta 1500
tttgtcagat tgtaagtact ttctctaatc actttttttt caaggcaatc agggtatatt 1560
atattgtact tcagcacagt tttagagaac aattgttata attaaatgat aaggtagaat 1620
atttctgcat ataaattctg gctggcgtgg aaatattctt attggtagaa acaactacac 1680
cctggtcatc atcctgcctt tctctttatg gttacaatga tatacactgt ttgagatgag 1740
gataaaatac tctgagtcca aaccgggccc ctctgctaac catgttcatg ccttcttctc 1800
tttcctacag ctcctgggca acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga 1860
attaagctta tactcgagct ctagattggg aacccgggtc tctcgaattc atggtggtgg 1920
tggctgctgc tccttctgct gctacagctg ctcctaaggt gctgctgctg tctggacagc 1980
ctgcttctgg aggaagagct ctgcctctga tggtgcctgg acctagagct gctggatctg 2040
aggcttctgg aacacctcag gctagaaaga gacagagact gacacatctg tctcctgaag 2100
aaaaggctct gagaagaaag ctgaagaata gagtggctgc tcagacagct agagatagaa 2160
agaaggctag aatgtctgaa ctggaacagc aggtggtgga tctggaagaa gaaaatcata 2220
agctgcagct ggaaaatcag ctgctgagag aaaagacaca tggactggtg gtggaaaatc 2280
aggaactgag aacaagactg ggaatggata cactggatcc tgatgaagtg cctgaagtgg 2340
aagctaaggg atctggagtg agactggtgg ctggatctgc tgaatctgct gctggagctg 2400
gacctgtggt gacatctcct gaacatctgc ctatggattc tgatacagtg gcttcttctg 2460
attctgaatc tgatatcctg ctgggaatcc tggataagct ggatcctgtg atgtttttta 2520
agtgtccttc tcctgaatct gcttctctgg aagaactgcc tgaagtgtat cctgaaggac 2580
cttcttctct gcctgcttct ctgtctctgt ctgtgggaac atcttctgct aagctggaag 2640
ctatcaatga actgatcaga tttgatcatg tgtatacaaa gcctctggtg ctggaaatcc 2700
cttctgaaac agaatctcag acaaatgtgg tggtgaagat cgaagaagct cctctgtctt 2760
cttctgaaga agatcatcct gaatttatcg tgtctgtgaa gaaggaacct ctggaagatg 2820
attttatccc tgaactggga atctctaatc tgctgtcttc ttctcattgt ctgagacctc 2880
cttcttgtct gctggatgct cattctgatt gtggatatga aggatctcct tctccttttt 2940
ctgatatgtc ttctcctctg ggaacagatc attcttggga agatacattt gctaatgaac 3000
tgtttcctca gctgatctct gtgtgagcgg ccgctaatca gccataccac atttgtagag 3060
gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat 3120
gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 3180
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 3240
ctcatcaatg tatcttatca tgtc 3264
<210> 19
<211> 447
<212> PRT
<213> 智人(Homo sapiens)
<400> 19
Glu Val Gln Val Leu Glu Ser Gly Gly Asp Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ala Tyr
20 25 30
Ala Met Thr Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ala Ile Ser Gly Ser Gly Gly Ser Ala Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Lys Asp Gly Ala Trp Lys Met Ser Gly Leu Asp Val Trp Gly Gln
100 105 110
Gly Thr Thr Val Ile Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val
115 120 125
Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala
130 135 140
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
145 150 155 160
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
165 170 175
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
180 185 190
Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp His Lys
195 200 205
Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr Gly Pro
210 215 220
Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser Val
225 230 235 240
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
245 250 255
Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu
260 265 270
Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
275 280 285
Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser
290 295 300
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
305 310 315 320
Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile
325 330 335
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
340 345 350
Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
355 360 365
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
370 375 380
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
385 390 395 400
Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg
405 410 415
Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
420 425 430
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Lys
435 440 445
<210> 20
<211> 110
<212> PRT
<213> 智人(Homo sapiens)
<400> 20
Glu Ser Gly Gly Asp Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser
1 5 10 15
Cys Ala Ala Ser Gly Phe Thr Phe Ser Ala Tyr Ala Met Thr Trp Val
20 25 30
Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Ser Gly
35 40 45
Ser Gly Gly Ser Ala Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr
50 55 60
Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr Leu Gln Met Asn Ser
65 70 75 80
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Asp Gly Ala
85 90 95
Trp Lys Met Ser Gly Leu Asp Val Trp Gly Gln Gly Thr Thr
100 105 110
<210> 21
<211> 214
<212> PRT
<213> 智人(Homo sapiens)
<400> 21
Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Ile Ser Asp Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ile Pro Arg Leu Leu Ile
35 40 45
Tyr Thr Thr Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Arg Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Lys Tyr Asp Ser Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 22
<211> 100
<212> PRT
<213> 智人(Homo sapiens)
<400> 22
Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile
1 5 10 15
Thr Cys Arg Ala Ser Gln Asp Ile Ser Asp Tyr Leu Ala Trp Tyr Gln
20 25 30
Gln Lys Pro Gly Lys Ile Pro Arg Leu Leu Ile Tyr Thr Thr Ser Thr
35 40 45
Leu Gln Ser Gly Val Pro Ser Arg Phe Arg Gly Ser Gly Ser Gly Thr
50 55 60
Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr
65 70 75 80
Tyr Tyr Cys Gln Lys Tyr Asp Ser Ala Pro Leu Thr Phe Gly Gly Gly
85 90 95
Thr Lys Val Glu
100
<210> 23
<211> 2971
<212> DNA
<213> 人工的
<220>
<223> 合成的构建体
<400> 23
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aggtgcaggt gttggagtct gggggagact tggtacagcc tggggggtcc 1440
ctgagactct cctgtgcagc ctctggattc acctttagtg cctatgccat gacctgggtc 1500
cgccaggctc cagggaaggg gctggagtgg gtctcagcta ttagtggtag tggtggtagc 1560
gcatactacg cagactccgt gaagggccgg ttcaccatct ccagagacaa ttccaagaac 1620
acggtatatc tgcagatgaa cagcctgaga gccgaggaca cggccgtata ttactgtgcg 1680
aaagatgggg cctggaaaat gtccggtttg gacgtctggg gccaagggac cacggtcatc 1740
gtctcctcag cctccaccaa gggcccatcg gtcttccccc tggcgccctg ctccaggagc 1800
acctccgaga gcacagccgc cctgggctgc ctggtcaagg actacttccc cgaaccggtg 1860
acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 1920
cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 1980
acgaagacct acacctgcaa cgtagatcac aagcccagca acaccaaggt ggacaagaga 2040
gttgagtcca aatatggtcc cccatgccca ccctgcccag cacctgagtt cctgggggga 2100
ccatcagtct tcctgttccc cccaaaaccc aaggacactc tcatgatctc ccggacccct 2160
gaggtcacgt gcgtggtggt ggacgtgagc caggaagacc ccgaggtcca gttcaactgg 2220
tacgtggatg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga gcagttcaac 2280
agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct gaacggcaag 2340
gagtacaagt gcaaggtctc caacaaaggc ctcccgtcct ccatcgagaa aaccatctcc 2400
aaagccaaag ggcagccccg agagccacag gtgtacaccc tgcccccatc ccaggaggag 2460
atgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctaccc cagcgacatc 2520
gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg 2580
ctggactccg acggctcctt cttcctctac agcaggctca ccgtggacaa gagcaggtgg 2640
caggagggga atgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacaca 2700
cagaagtccc tctccctgtc tctgggtaaa tgagcggccg ctaatcagcc ataccacatt 2760
tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa 2820
aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag 2880
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 2940
gtccaaactc atcaatgtat cttatcatgt c 2971
<210> 24
<211> 7013
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 24
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcagag gtgcaggtgt tggagtctgg gggagacttg 1440
gtacagcctg gggggtccct gagactctcc tgtgcagcct ctggattcac ctttagtgcc 1500
tatgccatga cctgggtccg ccaggctcca gggaaggggc tggagtgggt ctcagctatt 1560
agtggtagtg gtggtagcgc atactacgca gactccgtga agggccggtt caccatctcc 1620
agagacaatt ccaagaacac ggtatatctg cagatgaaca gcctgagagc cgaggacacg 1680
gccgtatatt actgtgcgaa agatggggcc tggaaaatgt ccggtttgga cgtctggggc 1740
caagggacca cggtcatcgt ctcctcagcc tccaccaagg gcccatcggt cttccccctg 1800
gcgccctgct ccaggagcac ctccgagagc acagccgccc tgggctgcct ggtcaaggac 1860
tacttccccg aaccggtgac ggtgtcgtgg aactcaggcg ccctgaccag cggcgtgcac 1920
accttcccgg ctgtcctaca gtcctcagga ctctactccc tcagcagcgt ggtgaccgtg 1980
ccctccagca gcttgggcac gaagacctac acctgcaacg tagatcacaa gcccagcaac 2040
accaaggtgg acaagagagt tgagtccaaa tatggtcccc catgcccacc ctgcccagca 2100
cctgagttcc tggggggacc atcagtcttc ctgttccccc caaaacccaa ggacactctc 2160
atgatctccc ggacccctga ggtcacgtgc gtggtggtgg acgtgagcca ggaagacccc 2220
gaggtccagt tcaactggta cgtggatggc gtggaggtgc ataatgccaa gacaaagccg 2280
cgggaggagc agttcaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 2340
gactggctga acggcaagga gtacaagtgc aaggtctcca acaaaggcct cccgtcctcc 2400
atcgagaaaa ccatctccaa agccaaaggg cagccccgag agccacaggt gtacaccctg 2460
cccccatccc aggaggagat gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 2520
ttctacccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 2580
aagaccacgc ctcccgtgct ggactccgac ggctccttct tcctctacag caggctcacc 2640
gtggacaaga gcaggtggca ggaggggaat gtcttctcat gctccgtgat gcatgaggct 2700
ctgcacaacc actacacaca gaagtccctc tccctgtctc tgggtaaatg agcggccgct 2760
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 2820
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 2880
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 2940
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtcctg 3000
cagggcccct ctcttcatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 3060
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 3120
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 3180
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 3240
tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 3300
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 3360
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 3420
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 3480
cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 3540
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 3600
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 3660
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 3720
ttaagggatt ttggtcatgg gcgcgcctca tactcctgca ggcatgagat tatcaaaaag 3780
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3840
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3900
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 3960
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4020
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4080
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4140
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4200
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4260
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4320
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4380
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4440
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4500
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4560
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4620
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4680
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4740
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4800
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag 4860
gtaccaagcc taggcctcca aaaaagcctc ctcactactt ctggaatagc tcagaggcag 4920
aggcggcctc ggcctctgca taaataaaaa aaattagtca gccatggggc ggagaatggg 4980
cggaactggg cggagttagg ggcgggatgg gcggagttag gggcgggact atggttgctg 5040
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 5100
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 5160
gggactttcc acaccggatc caccatggat agatccggaa agcctgaact caccgcgacg 5220
tctgtcgaga agtttctgat cgaaaagttc gacagcgtct ccgacctgat gcagctctcg 5280
gagggcgaag aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctgcgg 5340
gtaaatagct gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg 5400
gccgcgctcc cgattccgga agtgcttgac attggggagt tcagcgagag cctgacctat 5460
tgcatctccc gccgtgcaca gggtgtcacg ttgcaagacc tgcctgaaac cgaactgccc 5520
gctgttctgc agccggtcgc ggaggccatg gatgcgatcg ctgcggccga tcttagccag 5580
acgagcgggt tcggcccatt cggaccgcaa ggaatcggtc aatacactac atggcgtgat 5640
ttcatatgcg cgattgctga tccccatgtg tatcactggc aaactgtgat ggacgacacc 5700
gtcagtgcgt ccgtcgcgca ggctctcgat gagctgatgc tttgggccga ggactgcccc 5760
gaagtccggc acctcgtgca cgcggatttc ggctccaaca atgtcctgac ggacaatggc 5820
cgcataacag cggtcattga ctggagcgag gcgatgttcg gggattccca atacgaggtc 5880
gccaacatct tcttctggag gccgtggttg gcttgtatgg agcagcagac gcgctacttc 5940
gagcggaggc atccggagct tgcaggatcg ccgcggctcc gggcgtatat gctccgcatt 6000
ggtcttgacc aactctatca gagcttggtt gacggcaatt tcgatgatgc agcttgggcg 6060
cagggtcgat gcgacgcaat cgtccgatcc ggagccggga ctgtcgggcg tacacaaatc 6120
gcccgcagaa gcgcggccgt ctggaccgat ggctgtgtag aagtactcgc cgatagtgga 6180
aaccgacgcc ccagcactcg tccgagggca aaggaataga cgcgtgctgt aagtctgcag 6240
aaattgatga tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata 6300
ctttgttaag aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg 6360
ggggtggggg tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat 6420
tgctttatga taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa 6480
gggccagctc attcctccca ctcatgatct atggatctat agatctctcg tgcagctggg 6540
gctctagggg gtatccccac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 6600
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 6660
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 6720
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 6780
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 6840
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 6900
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 6960
tgatttaaca aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt tag 7013
<210> 25
<211> 2272
<212> DNA
<213> 人工的
<220>
<223> 合成的构建体
<400> 25
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag acatccagat gacccagtct ccagcctccc tgtctgcatc tgttggagac 1440
agagtcacca tcacttgtcg ggcgagtcag gacattagcg attatttagc ctggtatcag 1500
cagaaaccag ggaaaattcc taggctcctg atctatacta catccacttt gcaatcaggg 1560
gtcccatctc ggttccgtgg cagtgggtct gggacagatt tcactctcac catcagcagc 1620
ctgcagcctg aagatgttgc aacttattac tgtcagaagt atgacagtgc cccgctcact 1680
ttcggcggag ggaccaaggt ggagatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 26
<211> 6335
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 26
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaca tccagatgac ccagtctcca gcctccctgt ctgcatctgt 180
tggagacaga gtcaccatca cttgtcgggc gagtcaggac attagcgatt atttagcctg 240
gtatcagcag aaaccaggga aaattcctag gctcctgatc tatactacat ccactttgca 300
atcaggggtc ccatctcggt tccgtggcag tgggtctggg acagatttca ctctcaccat 360
cagcagcctg cagcctgaag atgttgcaac ttattactgt cagaagtatg acagtgcccc 420
gctcactttc ggcggaggga ccaaggtgga gatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 27
<211> 452
<212> PRT
<213> 智人(Homo sapiens)
<400> 27
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr
20 25 30
Asp Ile His Trp Val Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ala Ile Gly Pro Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys
50 55 60
Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu
65 70 75 80
Gln Met Asn Ser Leu Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Arg Gly Leu Ile Thr Phe Gly Gly Leu Ile Ala Pro Phe Asp Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
115 120 125
Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr
130 135 140
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
145 150 155 160
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
165 170 175
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
180 185 190
Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn
195 200 205
His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser
210 215 220
Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
225 230 235 240
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
245 250 255
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
260 265 270
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
275 280 285
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
290 295 300
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
305 310 315 320
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
325 330 335
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
340 345 350
Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val
355 360 365
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
370 375 380
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
385 390 395 400
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr
405 410 415
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
420 425 430
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
435 440 445
Ser Pro Gly Lys
450
<210> 28
<211> 112
<212> PRT
<213> 智人(Homo sapiens)
<400> 28
Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser
1 5 10 15
Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr Asp Ile His Trp Val
20 25 30
Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Gly Pro
35 40 45
Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys Gly Arg Phe Thr Ile
50 55 60
Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser Leu
65 70 75 80
Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Leu Ile Thr
85 90 95
Phe Gly Gly Leu Ile Ala Pro Phe Asp Tyr Trp Gly Gln Gly Thr Leu
100 105 110
<210> 29
<211> 214
<212> PRT
<213> 智人(Homo sapiens)
<400> 29
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Thr
20 25 30
Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu
35 40 45
Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
50 55 60
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
65 70 75 80
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Tyr Asp Asn Ser Gln
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 30
<211> 107
<212> PRT
<213> 智人(Homo sapiens)
<400> 30
Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu
1 5 10 15
Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Thr Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile
35 40 45
Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro
65 70 75 80
Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Tyr Asp Asn Ser Gln Thr
85 90 95
Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
100 105
<210> 31
<211> 2986
<212> DNA
<213> 人工的
<220>
<223> 合成的构建体
<400> 31
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aggtgcagct ggtggagtct gggggaggct tggtacagcc gggggggtcc 1440
ctgagactct cctgtgcagc ctctggattc accttcagta gctacgacat acactgggtc 1500
cgtcaagcta caggaaaagg tctggagtgg gtctcagcta ttggtcctgc tggtgacaca 1560
tactatccag gctccgtgaa gggccgattc accatctcca gagaaaatgc caagaactcc 1620
ttgtatcttc aaatgaacag cctgagagcc ggggacacgg ctgtgtatta ctgtgcaaga 1680
ggtttgatta cgtttggggg gcttatcgcc ccgtttgact actggggcca gggaaccctg 1740
gtcaccgtct cctcagcctc caccaagggc ccatcggtct tccccctggc accctcctcc 1800
aagagcacct ctgggggcac agcggccctg ggctgcctgg tcaaggacta cttccccgaa 1860
ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 1920
gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 1980
ttgggcaccc agacctacat ctgcaacgtg aatcacaagc ccagcaacac caaggtggac 2040
aagaaagttg agcccaaatc ttgtgacaaa actcacacat gcccaccgtg cccagcacct 2100
gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 2160
atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 2220
gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 2280
gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 2340
tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 2400
gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc 2460
ccatcccggg atgagctgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 2520
tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 2580
accacgcctc ccgtgctgga ctccgacggc tccttcttcc tctacagcaa gctcaccgtg 2640
gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg 2700
cacaaccact acacgcagaa gtccctctcc ctgtctccgg gtaaatgagc ggccgctaat 2760
cagccatacc acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct 2820
gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa 2880
tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 2940
ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtc 2986
<210> 32
<211> 7028
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 32
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcagag gtgcagctgg tggagtctgg gggaggcttg 1440
gtacagccgg gggggtccct gagactctcc tgtgcagcct ctggattcac cttcagtagc 1500
tacgacatac actgggtccg tcaagctaca ggaaaaggtc tggagtgggt ctcagctatt 1560
ggtcctgctg gtgacacata ctatccaggc tccgtgaagg gccgattcac catctccaga 1620
gaaaatgcca agaactcctt gtatcttcaa atgaacagcc tgagagccgg ggacacggct 1680
gtgtattact gtgcaagagg tttgattacg tttggggggc ttatcgcccc gtttgactac 1740
tggggccagg gaaccctggt caccgtctcc tcagcctcca ccaagggccc atcggtcttc 1800
cccctggcac cctcctccaa gagcacctct gggggcacag cggccctggg ctgcctggtc 1860
aaggactact tccccgaacc ggtgacggtg tcgtggaact caggcgccct gaccagcggc 1920
gtgcacacct tcccggctgt cctacagtcc tcaggactct actccctcag cagcgtggtg 1980
accgtgccct ccagcagctt gggcacccag acctacatct gcaacgtgaa tcacaagccc 2040
agcaacacca aggtggacaa gaaagttgag cccaaatctt gtgacaaaac tcacacatgc 2100
ccaccgtgcc cagcacctga actcctgggg ggaccgtcag tcttcctctt ccccccaaaa 2160
cccaaggaca ccctcatgat ctcccggacc cctgaggtca catgcgtggt ggtggacgtg 2220
agccacgaag accctgaggt caagttcaac tggtacgtgg acggcgtgga ggtgcataat 2280
gccaagacaa agccgcggga ggagcagtac aacagcacgt accgtgtggt cagcgtcctc 2340
accgtcctgc accaggactg gctgaatggc aaggagtaca agtgcaaggt ctccaacaaa 2400
gccctcccag cccccatcga gaaaaccatc tccaaagcca aagggcagcc ccgagaacca 2460
caggtgtaca ccctgccccc atcccgggat gagctgacca agaaccaggt cagcctgacc 2520
tgcctggtca aaggcttcta tcccagcgac atcgccgtgg agtgggagag caatgggcag 2580
ccggagaaca actacaagac cacgcctccc gtgctggact ccgacggctc cttcttcctc 2640
tacagcaagc tcaccgtgga caagagcagg tggcagcagg ggaacgtctt ctcatgctcc 2700
gtgatgcatg aggctctgca caaccactac acgcagaagt ccctctccct gtctccgggt 2760
aaatgagcgg ccgctaatca gccataccac atttgtagag gttttacttg ctttaaaaaa 2820
cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt 2880
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 2940
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca 3000
tgtctaccgg tcctgcaggg cccctctctt catgtgagca aaaggccagc aaaaggccag 3060
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 3120
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 3180
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 3240
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag 3300
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 3360
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 3420
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 3480
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 3540
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 3600
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 3660
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 3720
gaacgaaaac tcacgttaag ggattttggt catgggcgcg cctcatactc ctgcaggcat 3780
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 3840
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 3900
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 3960
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 4020
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 4080
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 4140
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 4200
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 4260
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 4320
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 4380
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 4440
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 4500
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 4560
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 4620
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 4680
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 4740
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 4800
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 4860
gccacctgac gtcaggtacc aagcctaggc ctccaaaaaa gcctcctcac tacttctgga 4920
atagctcaga ggcagaggcg gcctcggcct ctgcataaat aaaaaaaatt agtcagccat 4980
ggggcggaga atgggcggaa ctgggcggag ttaggggcgg gatgggcgga gttaggggcg 5040
ggactatggt tgctgactaa ttgagatgca tgctttgcat acttctgcct gctggggagc 5100
ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc atacttctgc 5160
ctgctgggga gcctggggac tttccacacc ggatccacca tggatagatc cggaaagcct 5220
gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag cgtctccgac 5280
ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt aggagggcgt 5340
ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg ttatgtttat 5400
cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg ggagttcagc 5460
gagagcctga cctattgcat ctcccgccgt gcacagggtg tcacgttgca agacctgcct 5520
gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg ccatggatgc gatcgctgcg 5580
gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat cggtcaatac 5640
actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca ctggcaaact 5700
gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct gatgctttgg 5760
gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc caacaatgtc 5820
ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat gttcggggat 5880
tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg tatggagcag 5940
cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccgcg gctccgggcg 6000
tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg caatttcgat 6060
gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc 6120
gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta 6180
ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagga atagacgcgt 6240
gctgtaagtc tgcagaaatt gatgatctat taaacaataa agatgtccac taaaatggaa 6300
gtttttcctg tcatactttg ttaagaaggg tgagaacaga gtacctacat tttgaatgga 6360
aggattggag ctacgggggt gggggtgggg tgggattaga taaatgcctg ctctttactg 6420
aaggctcttt actattgctt tatgataatg tttcatagtt ggatatcata atttaaacaa 6480
gcaaaaccaa attaagggcc agctcattcc tcccactcat gatctatgga tctatagatc 6540
tctcgtgcag ctggggctct agggggtatc cccacgcgcc ctgtagcggc gcattaagcg 6600
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6660
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6720
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6780
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6840
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6900
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6960
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg 7020
tcagttag 7028
<210> 33
<211> 2272
<212> DNA
<213> 人工的
<220>
<223> 合成的构建体
<400> 33
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aaattgtgtt gacgcagtct ccaggcaccc tgtctttgtc tccaggggaa 1440
agagccaccc tctcctgcag ggccagtcag agtgttagca gcacctactt agcctggtac 1500
cagcagaaac ctggccaggc tcccaggctc ctcatctatg gtgcatccag cagggccact 1560
ggcatcccag acaggttcag tggcagtggg tctgggacag acttcactct caccatcagc 1620
agactggagc ctgaagattt tgcagtgtat tactgtcagc attatgataa ctcacaaacg 1680
ttcggccaag ggaccaaggt ggagatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 34
<211> 6335
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 34
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaaa ttgtgttgac gcagtctcca ggcaccctgt ctttgtctcc 180
aggggaaaga gccaccctct cctgcagggc cagtcagagt gttagcagca cctacttagc 240
ctggtaccag cagaaacctg gccaggctcc caggctcctc atctatggtg catccagcag 300
ggccactggc atcccagaca ggttcagtgg cagtgggtct gggacagact tcactctcac 360
catcagcaga ctggagcctg aagattttgc agtgtattac tgtcagcatt atgataactc 420
acaaacgttc ggccaaggga ccaaggtgga gatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 35
<211> 449
<212> PRT
<213> 智人(Homo sapiens)
<400> 35
Gln Val Gln Leu Gln Gln Ser Gly Ala Gly Leu Leu Lys Pro Ser Glu
1 5 10 15
Thr Leu Ser Leu Thr Cys Thr Val Tyr Gly Gly Ser Phe Ser Ile His
20 25 30
His Trp Thr Trp Ile Arg His Pro Pro Gly Lys Gly Leu Glu Trp Ile
35 40 45
Gly Glu Ile Asn His Arg Gly Ser Thr Asn Tyr Asn Pro Ser Leu Lys
50 55 60
Ser Arg Val Thr Ile Ser Ile Asp Thr Ser Lys Asn Gln Phe Ser Leu
65 70 75 80
Lys Leu Ser Ala Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Arg Gly Leu Arg Phe Leu Asp Trp Leu Ser Ser Tyr Phe Asp Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
115 120 125
Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr
130 135 140
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
145 150 155 160
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
165 170 175
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
180 185 190
Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp
195 200 205
His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr
210 215 220
Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro
225 230 235 240
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
245 250 255
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp
260 265 270
Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
275 280 285
Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val
290 295 300
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
305 310 315 320
Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys
325 330 335
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
340 345 350
Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
355 360 365
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
370 375 380
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
385 390 395 400
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys
405 410 415
Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu
420 425 430
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
435 440 445
Lys
<210> 36
<211> 103
<212> PRT
<213> 智人(Homo sapiens)
<400> 36
Gln Ser Gly Ala Gly Leu Leu Lys Pro Ser Glu Thr Leu Ser Leu Thr
1 5 10 15
Cys Thr Val Tyr Gly Gly Ser Phe Ser Ile His His Trp Thr Trp Ile
20 25 30
Arg His Pro Pro Gly Lys Gly Leu Glu Trp Ile Gly Glu Ile Asn His
35 40 45
Arg Gly Ser Thr Asn Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr Ile
50 55 60
Ser Ile Asp Thr Ser Lys Asn Gln Phe Ser Leu Lys Leu Ser Ala Val
65 70 75 80
Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Leu Arg Phe
85 90 95
Leu Asp Trp Leu Ser Ser Tyr
100
<210> 37
<211> 214
<212> PRT
<213> 智人(Homo sapiens)
<400> 37
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asp Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Val Pro Asn Leu Leu Ile
35 40 45
Tyr Ala Ala Ser Ala Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Thr Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 38
<211> 107
<212> PRT
<213> 智人(Homo sapiens)
<400> 38
Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp
1 5 10 15
Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asp Tyr Leu
20 25 30
Ala Trp Tyr Gln Gln Lys Pro Gly Lys Val Pro Asn Leu Leu Ile Tyr
35 40 45
Ala Ala Ser Ala Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser
50 55 60
Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu
65 70 75 80
Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Thr Ala Pro Leu Thr
85 90 95
Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg
100 105
<210> 39
<211> 2977
<212> DNA
<213> 人工的
<220>
<223> 合成的构建体
<400> 39
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcac aggtacagct gcagcagtcg ggcgcaggac tgttgaagcc ttcggagacc 1440
ctgtccctca cctgcactgt ctatggtgga tccttcagta ttcatcactg gacctggatc 1500
cgccatcccc cagggaaggg gctggagtgg attggggaga tcaatcatcg tggaagcacc 1560
aactacaacc cgtccctcaa gagtcgagtc accatatcaa tagacacgtc caagaaccag 1620
ttctccctga agctgagcgc tgtgaccgcc gcggacacgg ctgtatatta ctgtgcgaga 1680
ggcttacgat ttttggactg gttatcgtcc tactttgact actggggcca gggaaccctg 1740
gtcaccgtct cctcagcctc caccaagggc ccatcggtct tccccctggc gccctgctcc 1800
aggagcacct ccgagagcac agccgccctg ggctgcctgg tcaaggacta cttccccgaa 1860
ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 1920
gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 1980
ttgggcacga agacctacac ctgcaacgta gatcacaagc ccagcaacac caaggtggac 2040
aagagagttg agtccaaata tggtccccca tgcccaccct gcccagcacc tgagttcctg 2100
gggggaccat cagtcttcct gttcccccca aaacccaagg acactctcat gatctcccgg 2160
acccctgagg tcacgtgcgt ggtggtggac gtgagccagg aagaccccga ggtccagttc 2220
aactggtacg tggatggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 2280
ttcaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaac 2340
ggcaaggagt acaagtgcaa ggtctccaac aaaggcctcc cgtcctccat cgagaaaacc 2400
atctccaaag ccaaagggca gccccgagag ccacaggtgt acaccctgcc cccatcccag 2460
gaggagatga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctaccccagc 2520
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 2580
cccgtgctgg actccgacgg ctccttcttc ctctacagca ggctcaccgt ggacaagagc 2640
aggtggcagg aggggaatgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 2700
tacacacaga agtccctctc cctgtctctg ggtaaatgag cggccgctaa tcagccatac 2760
cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa 2820
acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 2880
ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 2940
tggtttgtcc aaactcatca atgtatctta tcatgtc 2977
<210> 40
<211> 7019
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 40
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcacag gtacagctgc agcagtcggg cgcaggactg 1440
ttgaagcctt cggagaccct gtccctcacc tgcactgtct atggtggatc cttcagtatt 1500
catcactgga cctggatccg ccatccccca gggaaggggc tggagtggat tggggagatc 1560
aatcatcgtg gaagcaccaa ctacaacccg tccctcaaga gtcgagtcac catatcaata 1620
gacacgtcca agaaccagtt ctccctgaag ctgagcgctg tgaccgccgc ggacacggct 1680
gtatattact gtgcgagagg cttacgattt ttggactggt tatcgtccta ctttgactac 1740
tggggccagg gaaccctggt caccgtctcc tcagcctcca ccaagggccc atcggtcttc 1800
cccctggcgc cctgctccag gagcacctcc gagagcacag ccgccctggg ctgcctggtc 1860
aaggactact tccccgaacc ggtgacggtg tcgtggaact caggcgccct gaccagcggc 1920
gtgcacacct tcccggctgt cctacagtcc tcaggactct actccctcag cagcgtggtg 1980
accgtgccct ccagcagctt gggcacgaag acctacacct gcaacgtaga tcacaagccc 2040
agcaacacca aggtggacaa gagagttgag tccaaatatg gtcccccatg cccaccctgc 2100
ccagcacctg agttcctggg gggaccatca gtcttcctgt tccccccaaa acccaaggac 2160
actctcatga tctcccggac ccctgaggtc acgtgcgtgg tggtggacgt gagccaggaa 2220
gaccccgagg tccagttcaa ctggtacgtg gatggcgtgg aggtgcataa tgccaagaca 2280
aagccgcggg aggagcagtt caacagcacg taccgtgtgg tcagcgtcct caccgtcctg 2340
caccaggact ggctgaacgg caaggagtac aagtgcaagg tctccaacaa aggcctcccg 2400
tcctccatcg agaaaaccat ctccaaagcc aaagggcagc cccgagagcc acaggtgtac 2460
accctgcccc catcccagga ggagatgacc aagaaccagg tcagcctgac ctgcctggtc 2520
aaaggcttct accccagcga catcgccgtg gagtgggaga gcaatgggca gccggagaac 2580
aactacaaga ccacgcctcc cgtgctggac tccgacggct ccttcttcct ctacagcagg 2640
ctcaccgtgg acaagagcag gtggcaggag gggaatgtct tctcatgctc cgtgatgcat 2700
gaggctctgc acaaccacta cacacagaag tccctctccc tgtctctggg taaatgagcg 2760
gccgctaatc agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca 2820
cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 2880
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 2940
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctaccg 3000
gtcctgcagg gcccctctct tcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 3060
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 3120
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 3180
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 3240
cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag 3300
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 3360
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 3420
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 3480
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 3540
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 3600
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 3660
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 3720
ctcacgttaa gggattttgg tcatgggcgc gcctcatact cctgcaggca tgagattatc 3780
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 3840
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 3900
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 3960
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 4020
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 4080
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 4140
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 4200
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 4260
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 4320
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 4380
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 4440
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 4500
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 4560
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 4620
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 4680
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 4740
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 4800
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 4860
cgtcaggtac caagcctagg cctccaaaaa agcctcctca ctacttctgg aatagctcag 4920
aggcagaggc ggcctcggcc tctgcataaa taaaaaaaat tagtcagcca tggggcggag 4980
aatgggcgga actgggcgga gttaggggcg ggatgggcgg agttaggggc gggactatgg 5040
ttgctgacta attgagatgc atgctttgca tacttctgcc tgctggggag cctggggact 5100
ttccacacct ggttgctgac taattgagat gcatgctttg catacttctg cctgctgggg 5160
agcctgggga ctttccacac cggatccacc atggatagat ccggaaagcc tgaactcacc 5220
gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca gcgtctccga cctgatgcag 5280
ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg taggagggcg tggatatgtc 5340
ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc gttatgttta tcggcacttt 5400
gcatcggccg cgctcccgat tccggaagtg cttgacattg gggagttcag cgagagcctg 5460
acctattgca tctcccgccg tgcacagggt gtcacgttgc aagacctgcc tgaaaccgaa 5520
ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg cgatcgctgc ggccgatctt 5580
agccagacga gcgggttcgg cccattcgga ccgcaaggaa tcggtcaata cactacatgg 5640
cgtgatttca tatgcgcgat tgctgatccc catgtgtatc actggcaaac tgtgatggac 5700
gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc tgatgctttg ggccgaggac 5760
tgccccgaag tccggcacct cgtgcacgcg gatttcggct ccaacaatgt cctgacggac 5820
aatggccgca taacagcggt cattgactgg agcgaggcga tgttcgggga ttcccaatac 5880
gaggtcgcca acatcttctt ctggaggccg tggttggctt gtatggagca gcagacgcgc 5940
tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc ggctccgggc gtatatgctc 6000
cgcattggtc ttgaccaact ctatcagagc ttggttgacg gcaatttcga tgatgcagct 6060
tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag ccgggactgt cgggcgtaca 6120
caaatcgccc gcagaagcgc ggccgtctgg accgatggct gtgtagaagt actcgccgat 6180
agtggaaacc gacgccccag cactcgtccg agggcaaagg aatagacgcg tgctgtaagt 6240
ctgcagaaat tgatgatcta ttaaacaata aagatgtcca ctaaaatgga agtttttcct 6300
gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga 6360
gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt 6420
tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca 6480
aattaagggc cagctcattc ctcccactca tgatctatgg atctatagat ctctcgtgca 6540
gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg 6600
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 6660
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 6720
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 6780
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 6840
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 6900
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 6960
atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttag 7019
<210> 41
<211> 2272
<212> DNA
<213> 人工的
<220>
<223> 合成的构建体
<400> 41
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag acatccagat gacccagtct ccatcctccc tgtctgcatc tgtaggagac 1440
agagtcacca tcacttgccg ggcgagtcag ggcattagcg attatttagc ctggtatcag 1500
cagaaaccag ggaaagttcc taacctcctg atctatgctg cgtccgcttt acaatcaggg 1560
gtcccatctc gtttcagtgg cagtggatct gggacagatt tcactctcac catcagcagc 1620
ctgcagcctg aggatgttgc aacttattac tgtcaaaatt ataacactgc cccgctcact 1680
ttcggcgggg ggaccaaggt ggaaatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 42
<211> 6335
<212> DNA
<213> 人工的
<220>
<223> 合成的质粒
<400> 42
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaca tccagatgac ccagtctcca tcctccctgt ctgcatctgt 180
aggagacaga gtcaccatca cttgccgggc gagtcagggc attagcgatt atttagcctg 240
gtatcagcag aaaccaggga aagttcctaa cctcctgatc tatgctgcgt ccgctttaca 300
atcaggggtc ccatctcgtt tcagtggcag tggatctggg acagatttca ctctcaccat 360
cagcagcctg cagcctgagg atgttgcaac ttattactgt caaaattata acactgcccc 420
gctcactttc ggcgggggga ccaaggtgga aatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 43
<211> 115
<212> PRT
<213> 人工的
<220>
<223> 共有序列
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (28)..(28)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (30)..(30)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (34)..(35)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (93)..(93)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (93)..(93)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (96)..(96)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (100)..(100)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (111)..(111)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (114)..(114)
<223> Xaa可为任何天然氨基酸
<400> 43
Xaa Asp Val Trp Gly Gln Gly Thr Thr Val Xaa Val Ser Ser Ala Ser
1 5 10 15
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Xaa Ser Xaa Ser Thr
20 25 30
Ser Xaa Xaa Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
35 40 45
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
50 55 60
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
65 70 75 80
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Xaa Thr Tyr Xaa
85 90 95
Cys Asn Val Xaa His Lys Pro Ser Asn Thr Lys Val Asp Lys Xaa Val
100 105 110
Glu Xaa Lys
115
<210> 44
<211> 225
<212> PRT
<213> 人工的
<220>
<223> 共有序列
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (47)..(47)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (53)..(53)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (75)..(75)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (106)..(106)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (109)..(110)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (134)..(135)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (137)..(137)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (188)..(188)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (198)..(198)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (224)..(224)
<223> Xaa可为任何天然氨基酸
<400> 44
Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Xaa Leu Gly Gly
1 5 10 15
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
20 25 30
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Xaa Glu
35 40 45
Asp Pro Glu Val Xaa Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
50 55 60
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Xaa Asn Ser Thr Tyr Arg
65 70 75 80
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
85 90 95
Glu Tyr Lys Cys Lys Val Ser Asn Lys Xaa Leu Pro Xaa Xaa Ile Glu
100 105 110
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
115 120 125
Thr Leu Pro Pro Ser Xaa Xaa Glu Xaa Thr Lys Asn Gln Val Ser Leu
130 135 140
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
145 150 155 160
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
165 170 175
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Xaa Leu Thr Val Asp
180 185 190
Lys Ser Arg Trp Gln Xaa Gly Asn Val Phe Ser Cys Ser Val Met His
195 200 205
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Xaa
210 215 220
Gly
225
<210> 45
<211> 60
<212> PRT
<213> 人工的
<220>
<223> 共有序列
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (21)..(22)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (24)..(27)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (31)..(31)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (34)..(34)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (48)..(48)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (50)..(50)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (54)..(54)
<223> Xaa可为任何天然氨基酸
<220>
<221> MISC_FEATURE
<222> (56)..(56)
<223> Xaa可为任何天然氨基酸
<400> 45
Ser Asp Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Xaa Xaa Pro Xaa
1 5 10 15
Leu Leu Ile Tyr Xaa Xaa Ser Xaa Xaa Xaa Xaa Gly Val Pro Xaa Arg
20 25 30
Phe Xaa Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Xaa
35 40 45
Leu Xaa Pro Glu Asp Xaa Ala Xaa Tyr Tyr Cys Gln
50 55 60
<210> 46
<211> 118
<212> PRT
<213> 人工的
<220>
<223> 共有序列
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa可为任何天然氨基酸
<400> 46
Thr Phe Gly Xaa Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
1 5 10 15
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
20 25 30
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
35 40 45
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
50 55 60
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
65 70 75 80
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
85 90 95
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
100 105 110
Phe Asn Arg Gly Glu Cys
115

Claims (10)

1.细胞,其包含:
(i)第一多核苷酸,其包含编码第一生产增强蛋白的核酸序列,所述第一生产增强蛋白包含与SEQ ID NO:9至少86%一致的氨基酸序列;和
(ii)第二多核苷酸,其包含编码多亚基蛋白的核酸序列,所述多亚基蛋白包含SEQ IDNO:46的氨基酸序列。
2.权利要求1的细胞,其中所述第一多核苷酸还包含与编码所述第一生产增强蛋白的核酸序列可操作连接的组成型启动子。
3.权利要求2的细胞,其中所述第一多核苷酸的组成型启动子选自:泛素C启动子、CMV-IE启动子和SV40启动子。
4.权利要求1的细胞,其中所述第一多核苷酸整合在所述细胞的转录活性基因座处。
5.权利要求1的细胞,其中所述第一生产增强蛋白包含选自下列的氨基酸序列:SEQ IDNO:13、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11。
6.权利要求1的细胞,其中所述细胞以至少32pg/个细胞/天的速率生产所述多亚基蛋白。
7.权利要求1的细胞,其中所述细胞还包含第三多核苷酸,所述第三多核苷酸包含编码第二生产增强蛋白的核酸序列,所述第二生产增强蛋白包含与SEQ ID NO:1至少92%一致的氨基酸序列。
8.权利要求7的细胞,其中所述第三多核苷酸还包含第二组成型启动子,所述第二组成型启动子与编码所述第二生产增强蛋白的核酸序列可操作地连接。
9.权利要求8的细胞,其中所述第二组成型启动子是SV40启动子。
10.权利要求7的细胞,其中所述第二生产增强蛋白包含选自下列的氨基酸序列:SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6和SEQ IDNO:8。
CN201911104558.3A 2012-05-29 2013-05-29 生产型细胞系的增强子 Pending CN110835624A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261652549P 2012-05-29 2012-05-29
US61/652,549 2012-05-29
CN201380028164.9A CN104350068B (zh) 2012-05-29 2013-05-29 生产型细胞系的增强子

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380028164.9A Division CN104350068B (zh) 2012-05-29 2013-05-29 生产型细胞系的增强子

Publications (1)

Publication Number Publication Date
CN110835624A true CN110835624A (zh) 2020-02-25

Family

ID=49670701

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201911104558.3A Pending CN110835624A (zh) 2012-05-29 2013-05-29 生产型细胞系的增强子
CN201380028164.9A Active CN104350068B (zh) 2012-05-29 2013-05-29 生产型细胞系的增强子

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201380028164.9A Active CN104350068B (zh) 2012-05-29 2013-05-29 生产型细胞系的增强子

Country Status (21)

Country Link
US (9) US9079954B2 (zh)
EP (3) EP3564262A1 (zh)
JP (5) JP6298455B2 (zh)
KR (3) KR102126210B1 (zh)
CN (2) CN110835624A (zh)
AU (4) AU2013267525B2 (zh)
BR (1) BR112014029095A2 (zh)
CA (1) CA2873131A1 (zh)
DK (1) DK2875047T3 (zh)
EA (2) EA201792213A1 (zh)
ES (1) ES2940900T3 (zh)
FI (1) FI2875047T3 (zh)
HK (1) HK1205137A1 (zh)
HU (1) HUE061479T2 (zh)
IL (3) IL235573B (zh)
MX (1) MX360359B (zh)
PL (1) PL2875047T3 (zh)
SG (2) SG10201606654XA (zh)
TW (2) TWI641687B (zh)
WO (1) WO2013181253A1 (zh)
ZA (1) ZA201408289B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI641687B (zh) 2012-05-29 2018-11-21 美商再生元醫藥公司 生產細胞株增強子
BR112018071283A2 (pt) 2016-04-20 2019-02-12 Regeneron Pharma célula, conjunto de vetores para expressar uma proteína de ligação a antígeno biespecífica em uma célula, conjunto de vetores, método, e, método para produção de uma proteína de ligação a antígeno.
KR20180134894A (ko) 2016-04-20 2018-12-19 리제너론 파마슈티칼스 인코포레이티드 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법
WO2018081448A1 (en) 2016-10-26 2018-05-03 The Board Of Trustees Of The Leland Stanford Junior University Modified immunoglobulin hinge regions to reduce hemagglutination
CN116327963A (zh) 2016-11-21 2023-06-27 济世-伊沃泰克生物制品有限公司 一种眼科制剂及其用途
CA3067735A1 (en) 2017-08-17 2019-02-21 Just Biotherapeutics, Inc. Method of purifying glycosylated protein from host cell galectins and other contaminants

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050106222A1 (en) * 2003-06-11 2005-05-19 Ailor Eric N. Method to increase protein production in culture
US20070141065A1 (en) * 2003-08-01 2007-06-21 Genentech, Inc. Anti-VEGF antibodies
CN101048509A (zh) * 2004-09-02 2007-10-03 惠氏公司 用于产生蛋白质的体系和方法
CN101426812A (zh) * 2004-03-31 2009-05-06 森托科尔公司 用于改变蛋白生产速率的方法
CN101622353A (zh) * 2007-03-02 2010-01-06 贝林格尔英格海姆法玛两合公司 蛋白生产的改良
CN101903529A (zh) * 2007-12-20 2010-12-01 贝林格尔英格海姆法玛两合公司 基于sm-蛋白的分泌工程化
US20110034373A1 (en) * 2007-08-03 2011-02-10 Eli Lilly And Company Use of an fgf-21 compound and a glp-1 compound for the treatment of obesity
CN102112622A (zh) * 2008-05-28 2011-06-29 拜耳医药保健有限公司 用于在表达HBx的哺乳动物细胞中生产重组蛋白的方法和组合物
US20110159015A1 (en) * 2009-12-24 2011-06-30 Regeneron Pharmaceuticals, Inc. Human antibodies to human angiopoietin-like protein 4
US20120094297A1 (en) * 2009-02-10 2012-04-19 Ucb Pharma S.A. Method For Producing Protein
US20120114656A1 (en) * 2009-04-08 2012-05-10 Kei Amemiya Human Monoclonal Antibodies Protective Against Bubonic Plague

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60211329T2 (de) 2001-01-16 2007-05-24 Regeneron Pharmaceuticals, Inc. Isolierung von sezernierte proteine exprimierenden zellen
CA2485939C (en) 2002-05-29 2013-10-29 Regeneron Pharmaceuticals, Inc. Inducible eukaryotic expression system
EP1572944A4 (en) 2002-08-30 2007-12-26 Harvard College METHOD AND COMPOSITIONS FOR MODULATING THE ACTIVITY OF XBP-1
DK1781698T3 (en) 2004-07-20 2016-10-03 Genentech Inc COMPOSITIONS AND METHODS FOR THE USE OF Angiopoietin-like-4-PROTEIN
AU2005284798B2 (en) * 2004-09-15 2012-02-02 The President And Fellows Of Harvard College Reducing ER stress in the treatment of obesity and diabetes
EP2129685B1 (en) 2007-03-21 2013-11-20 Danisco US Inc. Over expression of foldases and chaperones improves protein production
EP2150617B1 (en) 2007-06-04 2014-10-22 Regeneron Pharmaceuticals, Inc. Enhanced expression and stability regions
PE20091163A1 (es) 2007-11-01 2009-08-09 Wyeth Corp Anticuerpos para gdf8
EP2209891A1 (en) 2007-11-13 2010-07-28 Boehringer Ingelheim Pharma GmbH & Co. KG Improving the secretory capacity in host cells
US20110142799A1 (en) 2008-06-23 2011-06-16 President And Fellows Of Harvard College Modulation of neurodegenerative disease by modulating xbp-1 activity
US8268314B2 (en) * 2008-10-08 2012-09-18 Hoffmann-La Roche Inc. Bispecific anti-VEGF/anti-ANG-2 antibodies
KR101441437B1 (ko) 2009-06-02 2014-09-25 리제너론 파마슈티칼스 인코포레이티드 푸코실화-결핍 세포
JO3182B1 (ar) 2009-07-29 2018-03-08 Regeneron Pharma مضادات حيوية بشرية عالية الالفة مع تولد الاوعية البشرية - 2
JO3340B1 (ar) * 2010-05-26 2019-03-13 Regeneron Pharma مضادات حيوية لـعامل تمايز النمو 8 البشري
TWI641687B (zh) 2012-05-29 2018-11-21 美商再生元醫藥公司 生產細胞株增強子
JP6374392B2 (ja) 2012-11-05 2018-08-15 デイナ ファーバー キャンサー インスティチュート,インコーポレイテッド Xbp1、cd138およびcs1ペプチド、該ペプチドを含有する薬学的組成物、ならびにかかるペプチドおよび組成物を使用する方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050106222A1 (en) * 2003-06-11 2005-05-19 Ailor Eric N. Method to increase protein production in culture
US20070141065A1 (en) * 2003-08-01 2007-06-21 Genentech, Inc. Anti-VEGF antibodies
CN101426812A (zh) * 2004-03-31 2009-05-06 森托科尔公司 用于改变蛋白生产速率的方法
CN101048509A (zh) * 2004-09-02 2007-10-03 惠氏公司 用于产生蛋白质的体系和方法
CN101622353A (zh) * 2007-03-02 2010-01-06 贝林格尔英格海姆法玛两合公司 蛋白生产的改良
US20110034373A1 (en) * 2007-08-03 2011-02-10 Eli Lilly And Company Use of an fgf-21 compound and a glp-1 compound for the treatment of obesity
CN101903529A (zh) * 2007-12-20 2010-12-01 贝林格尔英格海姆法玛两合公司 基于sm-蛋白的分泌工程化
CN102112622A (zh) * 2008-05-28 2011-06-29 拜耳医药保健有限公司 用于在表达HBx的哺乳动物细胞中生产重组蛋白的方法和组合物
US20120094297A1 (en) * 2009-02-10 2012-04-19 Ucb Pharma S.A. Method For Producing Protein
US20120114656A1 (en) * 2009-04-08 2012-05-10 Kei Amemiya Human Monoclonal Antibodies Protective Against Bubonic Plague
US20110159015A1 (en) * 2009-12-24 2011-06-30 Regeneron Pharmaceuticals, Inc. Human antibodies to human angiopoietin-like protein 4

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
CALFON,M.,ET AL.: "Genbank accession number:AAL60202.1", 《GENBANK》 *
CALFON,M.,ET AL.: "Genbank accession number:AAL60202.1", 《GENBANK》, 27 March 2002 (2002-03-27), pages 1 *
HANSEN,J. ET AL.: "Genbank accession number:NP_663512.2", 《GENBANK》 *
HANSEN,J. ET AL.: "Genbank accession number:NP_663512.2", 《GENBANK》, 7 March 2012 (2012-03-07), pages 1 *
刘丽丽等: "未折叠蛋白反应的信号通路", 《中国医药生物技术》 *
刘丽丽等: "未折叠蛋白反应的信号通路", 《中国医药生物技术》, vol. 4, no. 06, 10 December 2009 (2009-12-10), pages 455 - 457 *
孙强玲等: "内质网甘露糖甙酶-Ⅰ样蛋白的研究进展", 《国际检验医学杂志》 *
孙强玲等: "内质网甘露糖甙酶-Ⅰ样蛋白的研究进展", 《国际检验医学杂志》, vol. 27, no. 09, 28 September 2006 (2006-09-28), pages 828 - 829 *

Also Published As

Publication number Publication date
US20190270800A1 (en) 2019-09-05
TW201823460A (zh) 2018-07-01
ZA201408289B (en) 2016-09-28
DK2875047T3 (da) 2023-03-27
USRE48651E1 (en) 2021-07-20
WO2013181253A1 (en) 2013-12-05
BR112014029095A2 (pt) 2017-07-18
US9228012B2 (en) 2016-01-05
US20150353634A1 (en) 2015-12-10
US9688751B2 (en) 2017-06-27
EA201792213A1 (ru) 2018-01-31
US10227401B2 (en) 2019-03-12
EA201492242A1 (ru) 2015-05-29
SG11201407652RA (en) 2014-12-30
CA2873131A1 (en) 2013-12-05
AU2021240303A1 (en) 2021-10-28
EA028790B1 (ru) 2017-12-29
JP2022044609A (ja) 2022-03-17
JP7382383B2 (ja) 2023-11-16
KR102126210B1 (ko) 2020-06-25
US10351622B2 (en) 2019-07-16
KR102346867B1 (ko) 2022-01-04
KR20230065370A (ko) 2023-05-11
US20150175688A1 (en) 2015-06-25
MX2014014630A (es) 2015-02-12
US20170291938A1 (en) 2017-10-12
FI2875047T3 (fi) 2023-03-30
US20160304598A1 (en) 2016-10-20
SG10201606654XA (en) 2016-10-28
HK1205137A1 (zh) 2015-12-11
AU2013267525A1 (en) 2014-12-11
IL265867A (en) 2019-06-30
CN104350068A (zh) 2015-02-11
JP2020022514A (ja) 2020-02-13
EP4219546A2 (en) 2023-08-02
JP6622334B2 (ja) 2019-12-18
EP3564262A1 (en) 2019-11-06
EP2875047B1 (en) 2023-01-25
US20150299309A1 (en) 2015-10-22
AU2018201094A1 (en) 2018-03-15
JP2018108094A (ja) 2018-07-12
MX360359B (es) 2018-10-30
US10611831B2 (en) 2020-04-07
PL2875047T3 (pl) 2023-05-29
TWI641687B (zh) 2018-11-21
AU2013267525B2 (en) 2017-11-16
IL235573B (en) 2019-09-26
TW201402815A (zh) 2014-01-16
JP2015518728A (ja) 2015-07-06
AU2019203780A1 (en) 2019-06-20
KR20150015492A (ko) 2015-02-10
US9382315B2 (en) 2016-07-05
ES2940900T3 (es) 2023-05-12
AU2019203780B2 (en) 2021-07-01
CN104350068B (zh) 2019-12-03
US20150299310A1 (en) 2015-10-22
EP4219546A3 (en) 2023-08-23
AU2018201094B2 (en) 2019-06-20
KR102528950B1 (ko) 2023-05-08
KR20220003165A (ko) 2022-01-07
JP2023153268A (ja) 2023-10-17
KR20200074273A (ko) 2020-06-24
US9193786B2 (en) 2015-11-24
IL235573A0 (en) 2015-01-29
EP2875047A1 (en) 2015-05-27
HUE061479T2 (hu) 2023-07-28
IL279922A (en) 2021-03-01
JP7037535B2 (ja) 2022-03-16
JP6298455B2 (ja) 2018-03-20
US20130323788A1 (en) 2013-12-05
US9079954B2 (en) 2015-07-14

Similar Documents

Publication Publication Date Title
AU2019203780B2 (en) Production cell line enhancers
CN101553506B (zh) Lingo结合分子及其制药用途
KR101761709B1 (ko) 부위 특이적 통합
DK2788478T3 (en) Multiplex IMMUNSCREENINGSASSAY
CN109260478A (zh) 通过序列特异性转肽酶制备免疫配体/效应分子结合物的方法
CN101595228A (zh) 包括sorf构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法
CN101208425A (zh) 产生复制缺陷型腺病毒的细胞系
CN110023500A (zh) 作为选择标记的减毒谷氨酰胺合成酶
KR20070002052A (ko) IL-15/Fc 융합 단백질의 제조를 위한 발현 시스템 및이의 용도
CN101287498A (zh) Psma抗体-药物缀合物
KR20210143897A (ko) 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합
KR102636351B1 (ko) 고활성 조절 요소
KR20210144861A (ko) 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위
AU2024200154A1 (en) An engineered multi-component system for identification and characterisation of T-cell receptors, T-cell antigens and their functional interaction
CN107207603A (zh) 趋化因子‑免疫球蛋白融合多肽,其组合物、制备方法以及用途
KR20230056630A (ko) 신규의 omni-59, 61, 67, 76, 79, 80, 81 및 82 crispr 뉴클레아제
CN112877292A (zh) 产生人抗体的细胞
CN101180082A (zh) 利用siv-pedf载体治疗伴随眼组织细胞凋亡变性的疾患的药物
CN101160139A (zh) 含有pedf以及fgf2的伴随眼组织细胞凋亡变性的疾患的治疗药物
KR102663134B1 (ko) 생성 셀라인 인핸서
KR20240021906A (ko) 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법
CN110777147A (zh) 一种ikzf3基因沉默的t细胞及其应用
KR20070018054A (ko) 정제된 인터루킨-15/Fc융합 단백질 및 이의 제조방법
CN117881788A (zh) 表达载体、无细菌序列载体及其制备和使用方法
KR20230117327A (ko) 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination