CN110835624A

CN110835624A - 生产型细胞系的增强子

Info

Publication number: CN110835624A
Application number: CN201911104558.3A
Authority: CN
Inventors: 陈刚; D·布拉科夫; D·德施潘德
Original assignee: Regeneron Pharmaceuticals Inc
Current assignee: Regeneron Pharmaceuticals Inc
Priority date: 2012-05-29
Filing date: 2013-05-29
Publication date: 2020-02-25
Also published as: US20190270800A1; TW201823460A; ZA201408289B; DK2875047T3; USRE48651E1; WO2013181253A1; BR112014029095A2; US9228012B2; US20150353634A1; US9688751B2; EA201792213A1; US10227401B2; EA201492242A1; SG11201407652RA; CA2873131A1; AU2021240303A1; EA028790B1; JP2022044609A; JP7382383B2; KR102126210B1

Abstract

本发明涉及在生产型细胞中异位表达EDEM2从而改善有用的多亚基蛋白质的产率的发现。因此，本发明提供了包含编码EDEM2的重组多核苷酸的生产型细胞系，例如经典的哺乳动物生物制药生产型细胞—CHO细胞。此外，本发明还公开了包含EDEM2的编码多核苷酸以及XBP1的编码多核苷酸的生产型细胞。也公开由这些细胞系生产的抗体的改善效价以及培养中由这些细胞得到的改善的细胞密度。

Description

生产型细胞系的增强子

本申请是2013年5月29日提交的同名发明专利申请201380028164.9的分案申请。

相关申请的交叉引用

根据35U.S.C.§119(e)，本申请要求2012年5月29日提交的美国临时专利申请号61/652,549的权益，该申请的全部内容明确地以引用方式并入本文。

技术领域

本申请涉及一种或多种细胞，其表达用于改善地生产多亚基蛋白质的重组应激反应凝集素。具体而言，本发明提供了包含编码EDEM2的基因的哺乳动物细胞及由其衍生的细胞系，并且其产生高效价的抗体。

背景技术

制造治疗活性的蛋白质需要在分泌之前进行适当的折叠和加工。适当的折叠与蛋白质(例如抗体)尤其相关，所述的蛋白质由多个亚基组成，这些亚基在分泌之前必须适当地组装。真核细胞适应这样的系统，该系统确保蛋白质适当地折叠，并除去分泌途径中错误折叠的蛋白质。该系统被称为未折叠蛋白质反应(UPR)途径，并且由错误折叠的蛋白质在内质网(ER)中的累积所引发。

UPR的早期事件是转录因子Xbp1的激活，其依次激活内质网降解增强α-甘露糖苷酶-样蛋白质2(EDEM2)的转录，而该内质网降解增强α-甘露糖苷酶-样蛋白质2为内质网相关性降解(ERAD)途径的成员。EDEM2促进了错误折叠蛋白质的去除。ERAD途径包含5个步骤：(1)分子伴侣介导的对畸形蛋白质的识别；(2)使畸形蛋白质靶向与EDEM2有关的逆向转运机制或E3连接酶；(3)逆向转运的引发；(4)泛素化及进一步逆向转运；以及(5)蛋白体靶向及降解。

抗体为包含两条重链和两条轻链的多亚基蛋白质，其必须适当地折叠并结合从而形成功能异四聚体。为了改善功能抗体异四聚体的产率或效价，对重链和轻链的高效和精确加工的任何改良以都是需要的。

发明概述

本申请人惊奇地发现，在制造蛋白质的细胞系中，EDEM2的异位表达增加蛋白质的平均产量/细胞，增加被分泌至培养基中的蛋白质的效价，并增加生产型细胞系的积分细胞密度。

因此，在一个方面中，本发明提供了细胞，其包含(a)编码应激诱导的甘露糖结合凝集素的重组多核苷酸和(b)编码多亚基蛋白质的多核苷酸。在一些实施方案中，应激诱导的甘露糖结合凝集素为EDEM2蛋白质，其非限定性的实例在表1中提供，并且多亚基蛋白质为抗体。在其他的实施方案中，所述的细胞还包含编码活性剪切形式的XBP1的多核苷酸，其非限定性的实例在表2中提供。在一个实施方案中，所述的细胞为哺乳动物细胞，例如在生物制药制造中使用的CHO细胞。

在另一个方面中，本发明提供了由在上一方面中所述的细胞衍生的细胞系。“由……衍生”的意思是指由单个细胞以克隆方式遗传并具有一些所选的品质的细胞群体，例如生产给定效价的活性蛋白质的能力或增殖至特定密度的能力。在一些实施方案中，所述的细胞系能够生产效价为至少3克/升培养基(g/L)、至少5g/L或至少8g/L的多亚基蛋白质，其中所述的细胞系衍生自容留编码应激诱导的甘露糖结合凝集素的重组多核苷酸和编码多亚基蛋白质的多核苷酸的细胞。在一些实施方案中，与由基本相同的细胞衍生的但不具有编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系所获得的积分细胞密度相比，所述的细胞系可以获得高至少30％、至少50％、至少60％或者至少90％的积分细胞密度(ICD)。

在另一个方面中，本发明提供了包含编码EDEM2蛋白质的核酸序列的分离的或重组的多核苷酸，所述的多核苷酸与构成型且普遍表达的哺乳动物启动子(例如泛素C启动子)可操作地连接(顺式)。在一些实施方案中，EDEM2蛋白质具有SEQ ID NO:8的氨基酸，或者与SEQ ID NO:1-7的任意一个具有至少92％一致性的氨基酸序列。在一些实施方案中，所述的多核苷酸包含SEQ ID NO:16的核酸序列。在一个具体的实施方案中，所述的多核苷酸由SEQ ID NO:14的核酸序列组成；在另一个具体的实施方案中，所述的多核苷酸由SEQ IDNO:15的核酸序列组成。

在另一个方面中，本发明提供了包含编码XBP1蛋白质的核酸序列的分离的或重组的多核苷酸，所述的多核苷酸与构成型且普遍表达的哺乳动物启动子(例如泛素C启动子)可操作地连接(顺式)。在一些实施方案中，XBP1蛋白质具有SEQ ID NO:13的氨基酸，或者与SEQ ID NO:9-12的任意一个具有至少86％一致性的氨基酸序列。在一些实施方案中，所述的多核苷酸包含SEQ ID NO:18的核酸序列。在一个具体的实施方案中，所述的多核苷酸由SEQ ID NO:17的核酸序列组成。

在另一个方面中，本发明提供了一种细胞，其包含在上一方面中所述的EDEM2的编码多核苷酸和编码多亚基蛋白质(例如抗体)的多核苷酸。在一些实施方案中，所述的细胞还包含在上一方面所述的XBP1的编码多核苷酸。在一个实施方案中，多亚基蛋白质为抗体，抗体的重链包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列，抗体的轻链包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列。在这种及多个实施方案中，多亚基蛋白质的各个多肽亚基由独立的多核苷酸所编码。因此，例如编码抗体的多核苷酸可以包含编码重链的多核苷酸和编码轻链的多核苷酸，因此包含两个亚基。在一些实施方案中，所述的细胞为中国仓鼠卵巢(CHO)细胞。

在一个实施方案中，所编码的多亚基蛋白质为具有SEQ ID NO:20的重链可变区氨基酸序列和SEQ ID NO:22的轻链可变区氨基酸序列的抗GDF8抗体。在一个实施方案中，抗GDF8抗体包含具有SEQ ID NO:19的氨基酸序列的重链和具有SEQ ID NO:21的氨基酸序列的轻链。在一个实施方案中，编码抗GDF8抗体的重链的多核苷酸包含SEQ ID NO:23的核酸序列；并且编码抗GDF8抗体的轻链的多核苷酸包含SEQ ID NO:25的核酸序列。在一个实施方案中，编码抗GDF8抗体的重链的多核苷酸由SEQ ID NO:24的核酸序列组成；并且编码抗GDF8抗体的轻链的多核苷酸由SEQ ID NO:25的核酸序列组成。

在另一个实施方案中，所编码的多亚基蛋白质为具有SEQ ID NO:28的重链可变区氨基酸序列和SEQ ID NO:30的轻链可变区氨基酸序列的抗ANG2抗体。在一个实施方案中，抗ANG2抗体包含具有SEQ ID NO:27的氨基酸序列的重链和具有SEQ ID NO:29的氨基酸序列的轻链。在一个实施方案中，编码抗ANG2抗体的重链的多核苷酸包含SEQ ID NO:31的核酸序列；并且编码抗ANG2抗体的轻链的多核苷酸包含SEQ ID NO:33的核酸序列。在一个实施方案中，编码抗ANG2抗体的重链的多核苷酸由SEQ ID NO:32的核酸序列组成；并且编码抗ANG2抗体的轻链的多核苷酸由SEQ ID NO:34的核酸序列组成。

在另一个实施方案中，所编码的多亚基蛋白质为具有SEQ ID NO:36的重链可变区氨基酸序列和SEQ ID NO:38的轻链可变区氨基酸序列的抗ANGPTL4抗体。在一个实施方案中，抗ANGPTL4抗体包含具有SEQ ID NO:35的氨基酸序列的重链和具有SEQ ID NO:37的氨基酸序列的轻链。在一个实施方案中，编码抗ANGPTL4抗体的重链的多核苷酸包含SEQ IDNO:39的核酸序列；并且编码抗ANGPTL4抗体的轻链的多核苷酸包含SEQ ID NO:41的核酸序列。在一个实施方案中，编码抗ANGPTL4抗体的重链的多核苷酸由SEQ ID NO:40的核酸序列组成；并且编码抗ANGPTL4抗体的轻链的多核苷酸由SEQ ID NO:42的核酸序列组成。

在另一个方面中，本发明提供了通过在培养基中培养之前方面所述的细胞来制造多亚基蛋白质的方法，其中所述的多亚基蛋白质是在细胞内合成的，并在随后被分泌至培养基中。在一些实施方案中，所述的多亚基蛋白质为抗体，例如抗GDF8、抗ANG2、抗ANGPTL4或者具有SEQ ID NO:43和44的重链序列以及SEQ ID NO:45和46的轻链序列的抗体。在一些实施方案中，所述的多亚基蛋白质的效价达到至少3g/L、至少5g/L、至少6g/L或者至少8g/L。在一些实施方案中，所述的细胞在培养基中增殖，并且建立大约≥5x 10⁷个细胞-天/mL、大约≥1x 10⁸个细胞-天/mL或者大约≥1.5x 10⁸个细胞-天/mL的积分细胞密度。

在另一个方面中，本发明提供了根据在之前的方面中所述的方法制造的多亚基蛋白质。在一个实施方案中，所述的制造的多亚基蛋白质是抗体。在一些实施方案中，所述的抗体由包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列的重链和包含SEQ ID NO:45和SEQID NO:46的氨基酸序列的轻链组成。在一个特定的实施方案中，所述的制造的多亚基蛋白质为具有SEQ ID NO:20的重链可变区氨基酸序列和SEQ ID NO:22的轻链可变区氨基酸序列的抗GDF8抗体。在另一个特定的实施方案中，所述的制造的多亚基蛋白质为具有SEQ IDNO:28的重链可变区氨基酸序列和SEQ ID NO:30的轻链可变区氨基酸序列的抗ANG2抗体。在另一个特定的实施方案中，所述的制造的多亚基蛋白质为具有SEQ ID NO:36的重链可变区氨基酸序列和SEQ ID NO:38的轻链可变区氨基酸序列的抗ANGPTL4抗体。

发明详述

在描述本发明之前，应该理解的是本发明不限于所描述的具体的方法和试验条件，这些方法和条件本身是可以改变的。此外，还应该理解的是本发明所用的术语仅是为了描述具体的实施方案，并且无意于进行限定，因为本发明的范围仅由所附的权利要求书来限定。

除非另作说明，否则本发明所用的所有的技术和科学术语都具有与本领域的任一普通技术人员所通常理解的含义。如本文所用，当术语“大约”用于指具体引用的数值或数值的范围时，其是指所述的值可以与所引用的值相差不超过1％。例如如本文所用，表述“大约100”包含99和101以及其中的所有值(例如99.1、99.2、99.3、99.4等)。

尽管与本发明所述的那些相似或相当的任何方法和材料都可以用于实施或测试本发明，但是优选的方法和材料现在进行描述。本发明提及的所有公开的全部内容均以引用方式并入本文。

如本文所用，当术语“重组多核苷酸”与“分离的多核苷酸”交换使用时，其是指来源于基因改造操作的、单链或双链的核酸聚合物，例如核酸或脱氧核酸。重组多核苷酸可以是在体外存在的或者在细胞内作为附加体存在的环状质粒或线性构建体。重组多核苷酸可以是整合在较大的多核苷酸分子或超分子结构(例如线性或环状染色体)中的构建体。较大的多核苷酸分子或超分子结构可以在细胞内或在细胞的细胞核中。因此，重组多核苷酸可以整合在细胞的染色体中。

如本文所用，术语“应激诱导的甘露糖结合凝集素”是指甘露糖结合蛋白质，其是指结合或者能够结合甘露糖和甘露糖的衍生物(例如甘露糖-6-磷酸)的蛋白质，或在其多糖-蛋白质复合物中表达甘露糖或甘露糖衍生物的糖蛋白；并且其活性在应激过程中受到上调。细胞应激包含饥饿、DNA损伤、缺氧、中毒、剪切应力和其他机械应力、肿瘤应激、错误折叠的蛋白质在内质网中的累积等。应激诱导的甘露糖结合凝集素的实例包含EDEM蛋白质(EDEM1、EDEM2和EDEM3)、Yos9、OS9和XTP3-B(参见Vembar and Brodsky,Nat.Rev.Mol.Cell.Biol.9(12):944-957,2008，以及其中引用的参考文献)。

如本文所用，术语“EDEM2”是指内质网降解增强α-甘露糖苷酶-样蛋白质的任何直系同源物、同源物或保守取代的变体。本领域公知的是EDEM2蛋白质与内质网相关性降解(ERAD)有关，其受到Xbp-1的上调并促进从钙连蛋白循环中提取错误折叠的糖蛋白用以去除(参见，Mast et al.,Glycobiology 15(4):421-436,2004；Olivari and Molinari,FEBSLett.581:3658-3664,2007；Olivari et al.,J.Biol.Chem.280(4):2424-2428,2005；andVembar and Brodsky 2008，这些文献的内容以引用方式并入本文)。示例性EDEM2序列在表1中描述，其与序列表相互参考。

表1

动物	SEQ ID NO:	与人的％一致性	与小鼠的％一致性	与仓鼠的％一致性
					小鼠	1	93	100	96
大鼠	2	94	98	96
					仓鼠	3	93	96	100
人	4	100	93	93
					黑猩猩	5	99	94	93
猩猩	6	97	92	92
					斑马鱼	7	69	70	69
总计	8	100	100	100

如本文所用，术语“Xbp1”也称为XBP1或X盒结合蛋白质1，其是指Xbp1的任何直系同源物、同源物或保守取代的变体。Xbp1为UPR的转录因子和功能元件。ER应激激活：(1)转录因子ATF6，其进而上调Xbp1 mRNA的转录；和(2)ER膜蛋白IRE1，其介导了前体Xbp1 mRNA的剪切，从而生产活性的Xbp1。如上文所提及，激活的Xbp1进而上调EDEM2的活性(参见Yoshida et al.,Cell Structure and Function 31(2):117-125,2006；和Olivari,2005)。示例性Xbp1氨基酸序列在表2中描述，其与序列表相互参考。

表2

动物	SEQ ID NO	与人的％一致性	与小鼠的％一致性	与仓鼠的％一致性
					小鼠	9	86	100	92
仓鼠	10	86	92	100
					人	11	100	86	86
斑马鱼	12	47	47	48
					总计	13	100	100	100

如本文所用，术语“抗体”通常是指包含四条多肽链的免疫球蛋白分子及其多聚体(例如IgM)，其中两条重链(H)和两条轻链(L)通过二硫键相互连接；然而，仅由重链组成(即，缺乏轻链)的免疫球蛋白分子也被涵盖在术语“抗体”的定义范围内。各重链均包含重链可变区(本发明中简称为HCVR或VH)和重链恒定区。重链恒定区包含三个结构域CH1、CH2和CH3。各轻链均包含轻链可变区(本发明中简称为LCVR或VL)和轻链恒定区。轻链恒定区包含一个结构域(CL1)。VH和VL区可以进一步细分成超变区，也称为互补决定区(CDR)，其被更保守的所谓构架区(FR)间隔。各VH和VL均由三个CDR和四个FR组成，由氨基末端至羧基末端的顺序为：FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4。“分离的抗体”或“纯化的抗体”基本上不含有其他的细胞材料或化学品。

术语“特异性地结合”等是指抗体或其抗原结合片段与抗体形成复合物，其在生理性条件下相对稳定。特异性地结合可以表征为解离常数为至少大约1x10^-6Μ或更高。用于确定两个分子是否特异性地结合的方法是本领域的公知的，包括例如平衡透析、表面等离子共振等。而且，与人GDF8(例如)特异性地结合的分离的抗体与其他抗原(例如得自其他物种的GDF8分子(直系同源物))可以具有交叉反应。

多种抗体可以作为由细胞所分泌的多亚基蛋白质的实例，其中所述的细胞容留编码应激诱导的甘露糖结合凝集素的多核苷酸。这些实例包含抗GDF8、抗ANG2和抗ANGPTL4抗体。这些及相似的抗体分别在美国专利申请号20110293630、20110027286和20110159015中有所描述，这些文献的内容以引用方式并入本文。

如本文所用，术语“细胞”是指能够复制DNA、转录RNA、翻译多肽并分泌蛋白质的原核或真核细胞。细胞包括用于商业化生产生物产物的动物细胞，例如昆虫细胞(例如Schneider细胞、Sf9细胞、Sf21细胞、Tn-368细胞、BTI-TN-5B1-4细胞，参见Jarvis,MethodsEnzymol.463:191-222,2009和Potter et al.,Int.Rev.Immunol.10(2-3):103-112,1993)和哺乳动物细胞(例如CHO或CHO-K1细胞、COS或COS-7细胞、HEK293细胞、PC12细胞、HeLa细胞、Hybridoma细胞，Trill et al.,Curr.Opin.Biotechnol.6(5):553-560,1995；Kipriyanov和Little,Mo.Biotechnol.12(2):173-201,1999)。在一个实施方案中，所述的细胞为包含所描述的UPR途径多核苷酸的CHO-K1细胞。对于CHO-K1细胞的描述，还可以参见Kao et al.,Proc.Nat’l.Acad.Sci.USA 60:1275-1281,1968。

如本文所用，术语“启动子”是指通常以顺式并位于蛋白质的编码序列的上游的基因序列，并且其能促进蛋白质的编码序列的转录。启动子可以被调节(发育的、组织特异性的或诱导的(化学品、温度))或构成型活性的。在某些实施方案中，编码蛋白质的多核苷酸可操作地与构成型启动子连接。“可操作地连接”是指使蛋白质的编码多核苷酸位于启动子的3'端(下游)，在启动子的顺式作用下并处于启动子的控制之下。在某些实施方案中，所述的启动子为构成型哺乳动物的启动子，例如泛素C启动子(参见Schorpp et al.,Nucl.Acids Res.24(9):1787-1788,1996；Byun et al.,Biochem.Biophys.Res.Comm.332(2):518-523,2005))、或CMV-IE启动子(参见Addison et al.,J.Gen.Virol.78(7):1653-1661,1997；Hunninghake et al.,J.Virol.63(7):3026-3033,1989)或hCMV-IE启动子(人巨细胞病毒即早期基因启动子)(参见Stinski&Roehr,J.Virol.55(2):431-441,1985；Hunninghake et al.,J.Virol.63(7):3026-3033,1989)。

如本文所用，短语“积分细胞密度”或“ICD”是对一段时间对培养物培养基中的细胞密度的积分，其表示为个细胞-天/mL。在一些实施方案中，在细胞处于培养中大约第12天时，测量ICD。

如本文所用，术语“培养物或培养”是指：(1)包含细胞、培养基和分泌的多亚基蛋白质的组合物；以及(2)不管细胞是否积极地分裂，都在培养基中温育细胞的行为。可以在25mL烧瓶或更小、及10000升或更大的商业化生物反应器的容器中培养细胞。“培养基”是指培养物培养基，其包含营养物、脂类、氨基酸、核酸、缓冲剂和痕量元素等，从而允许细胞的生长、繁殖或维持，以及细胞的多亚基蛋白质生产。细胞的培养物培养基包含无血清且无水解产物的合成培养基，以及补充有血清(例如胎牛血清(FBS))或蛋白质水解产物的培养基。可以商业获得的培养基的非限定性实例包括RPMI培养基1640、杜氏改良Eagle培养基(DMEM)、DMEM/F12混合物、F10营养混合物、Ham F12营养混合物和最基本培养基(MEM)。

如本文所用，当短语“保守取代的变体”用于多肽时，其是指具有一个或多个保守的氨基酸取代的多肽。“保守的氨基酸取代”是其中氨基酸残基被另一个具有相似化学性质(例如电荷或疏水性)的侧链(R基)的氨基酸残基所取代。通常，保守的氨基酸取代基本不会改变蛋白质的功能性。在其中两条或多条氨基酸序列通过保守的取代而彼此不同的情况下，可以向上调节相似性的百分率或相似度，从而校正取代的保守性。用于进行这种调节的手段是本领域的那些技术人员所公知的。例如参见Pearson(1994)Methods Mol.Biol.24:307-331，该文献的内容以引用方式并入本文。具有相似化学性质的侧链的氨基酸基团的实例包含：1)脂肪族侧链：甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸；2)脂肪族-羟基侧链：丝氨酸和苏氨酸；3)包含氨基的侧链：天冬酰氨和谷氨酰胺；4)芳香族侧链：苯丙氨酸、酪氨酸和色氨酸；5)碱性侧链：赖氨酸、精氨酸和组氨酸；6)酸性侧链：天冬氨酸和谷氨酸；和7)包含硫的侧链：半胱氨酸和蛋氨酸。优选的保守氨基酸取代基团为：缬氨酸-亮氨酸-异亮氨酸，苯丙氨酸-酪氨酸，赖氨酸-精氨酸，丙氨酸-缬氨酸，谷氨酸-天冬氨酸，和天冬酰氨-谷氨酰胺。备选地，保守替代是在Gonnet et al.(1992)Science 256:1443-45所公开的PAM250对数似然矩阵中具有正值的任何变化，其中所述文献的内容以引用方式并入本文。“适度保守的”替代是在PAM250对数似然矩阵中具有非负值的任何变化。

实施方案-细胞

在一个方面中，本发明提供了用于生产具有治疗或研究用途的蛋白质的细胞。在一些实施方案中，所述的蛋白质由多个亚基组成，这些亚基必须适当地折叠并组装，从而生产足量的活性蛋白质。抗体是具有治疗或研究用途的多亚基蛋白质的实例。在一些实施方案中，所述的细胞容留重组基因构建体(即，多核苷酸)，该构建体编码多亚基蛋白质的一个或多个单个的亚基。在其他的实施方案中，编码单个多肽亚基的基因构建体是天然形成的，例如在B细胞中编码抗体亚基的核酸序列。

为了促进多亚基蛋白质的适当组装和分泌，所述的细胞包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸，其中在一些实施方案中，应激诱导的甘露糖结合凝集素为ERAD的成分。在一些实施方案中，应激诱导的甘露糖结合凝集素为内质网降解增强α-甘露糖苷酶-样蛋白质2(EDEM2)。可以预见的是任何编码的EDEM2或保守取代的变体都可以成功地用于本发明。表1列出了脊椎动物EDEM2蛋白质的一些实例。这些蛋白质序列的多个成对比较表明每条所公开的EDEM2多核苷酸序列均与每条其他的EDEM2序列具有至少69％的一致性，其中所述的比较是使用Thompson et al.,Nucl.Acids Rev.22(22):4673-80,1994的Clustal W程序来进行的(此外参见Yuan et al.,Bioinformatics15(10):862-3,1999)。所公开的哺乳动物EDEM2序列的Clustal W比较表明每条序列与其他序列具有至少92％的一致性。因此在一些实施方案中，所述的细胞包含编码EDEM2多肽的多核苷酸，其中所述的EDEM2多肽具有与任一哺乳动物EDEM2至少92％的一致性的序列。通过比对小鼠、大鼠、仓鼠、黑猩猩和人EDEM2多肽氨基酸序列来建立共有的EDEM2氨基酸序列。该共有序列描绘于SEQ ID NO:8中。因此在一些实施方案中，所述的细胞包含编码EDEM2多肽的多核苷酸，其中所述的EDEM2多肽具有SEQ ID NO:8的氨基酸序列。

在多个实施方案中，所述的细胞包含编码EDEM2多肽的重组多核苷酸，其中所述的EDEM2多肽具有与小鼠EDEM2(mEDEM2)氨基酸序列至少92％的一致性的氨基酸序列；并且在具体的实施方案中，所述的多肽为mEDEM2或其保守取代的变体。

在一些实施方案中，所述的多亚基蛋白质为抗体，并且所述的细胞包含编码任意一条或多条多肽的多核苷酸，其中所述的多肽包含SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45和SEQ ID NO:46的氨基酸序列。SEQ ID NO:43和SEQ ID NO:44各分别代表了特定抗体重链的大致的N末端和C末端部分的共有序列。因此在一个实施方案中，编码蛋白质亚基的多核苷酸编码包含SEQ ID NO:43和SEQ ID NO:44的多肽。SEQ ID NO:45和SEQ ID NO:46各分别代表了特定抗体轻链的大致的N末端和C末端部分的共有序列。因此在一个实施方案中，编码蛋白质亚基的多核苷酸编码包含SEQ ID NO:45和SEQ ID NO:46的多肽。在一些实施方案中，除了编码EDEM2蛋白质的重组多核苷酸以外，所述的细胞包含至少两条多核苷酸，每条多核苷酸均编码多亚基蛋白质的特定的亚基。例如并且如下举例，所述的细胞包含编码抗体重链(包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列)的多核苷酸和编码抗体轻链(包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列)的另一个多核苷酸。

在一些实施方案中，如上文所述，所述的细胞除了包含应激反应多核苷酸和一条或多条编码多肽亚基的多核苷酸以外，还包含编码未折叠蛋白质反应转录因子(其在EDEM2的上游进行操作)的多核苷酸。在一些情况下，所述的上游转录因子为剪切形式的XBP1。可以预见的是任何编码的XBP1都可以成功地用于本发明中。表2列出了脊椎动物XBP1剪切形式的多肽的序列的实例。这些多肽序列的多个成对比较表明每条所公开的剪切XBP1多核苷酸序列均与每条其他的XBP1序列具有至少48％的一致性，其中所述的比较是使用ClustalW程序(Thompson 1994；Yuan 1999)来进行的。所公开的哺乳动物XBP1序列的Clustal W比较表明每条序列与其他序列具有至少86％的一致性。因此在一些实施方案中，所述的细胞包含编码剪切形式的XBP1多肽的多核苷酸，其中所述的XBP1多肽具有与任一哺乳动物剪切XBP1至少86％的一致性的序列。通过比对小鼠、仓鼠和人XBP1氨基酸序列来建立共有的XBP1氨基酸序列。该共有序列描绘于SEQ ID NO:13中。因此在一些实施方案中，所述的细胞包含编码XBP1多肽的多核苷酸，其中所述的XBP1多肽具有SEQ ID NO:13的氨基酸序列。

在多个实施方案中，所述的细胞包含编码XBP1多肽的多核苷酸，其中所述的XBP1多肽具有与小鼠XBP1(mXBP1)氨基酸序列(SEQ ID NO:9)至少86％的一致性的氨基酸序列；并且在具体的实施方案中，所述的多肽为mXBP1或其保守取代的变体。

本发明预见任何细胞都可以用于容留凝集素编码多肽，以用于生产适当折叠且具有活性的多亚基蛋白质。此类细胞包含公知的蛋白质生产型细胞，例如细菌大肠埃希氏杆菌(Escherichia coli)和类似的原核细胞，酵母菌毕赤酵母(Pichia pastoris)和其他毕赤及非毕赤酵母，植物细胞外植体(例如烟草的那些)，昆虫细胞(例如Schneider 2细胞、Sf9和Sf21，和粉纹夜蛾(Trichoplusia ni)衍生的High Five细胞)，以及通常用于生物生产的哺乳动物细胞(例如CHO、CHO-K1、COS、HeLa、HEK293、Jurkat和PC12细胞)。在一些实施方案中，所述的细胞为CHO-K1或改性的CHO-K1细胞，例如在美国专利号7,435,553,7,514,545和7,771,997、及美国专利申请公开号US 2010-0304436A1中所教导的那些，其中每一份文献的全部内容均以引用方式并入本文。

在一些具体的实施方案中，本发明离体提供了CHO-K1细胞，该细胞包含：(1)mEDEM2的编码多核苷酸，其包含SEQ ID NO:16的核苷酸序列；(2)XBP1的编码多核苷酸，其包含SEQ ID NO:18的核苷酸序列；(3)抗体重链的编码多核苷酸，其包含编码多肽的核苷酸序列，其中所述的多肽包含SEQ ID NO:43和44的氨基酸序列；以及(4)抗体轻链的编码多核苷酸，其包含编码多肽的核苷酸序列，其中所述的多肽包含SEQ ID NO:45和46的氨基酸序列。

在一个具体的实施方案中，本发明离体提供了CHO-K1细胞，该细胞包含：(1)mEDEM2的编码多核苷酸，其包含SEQ ID NO:16的核苷酸序列；(2)XBP1的编码多核苷酸，其包含SEQ ID NO:18的核苷酸序列；(3)抗体重链的编码多核苷酸，其包含SEQ ID NO:23的核苷酸序列；以及(4)抗体轻链的编码多核苷酸，其包含SEQ ID NO:25的核苷酸序列。

在另一个具体的实施方案中，本发明离体提供了CHO-K1细胞，该细胞包含：(1)mEDEM2的编码多核苷酸，其包含SEQ ID NO:16的核苷酸序列；(2)XBP1的编码多核苷酸，其包含SEQ ID NO:18的核苷酸序列；(3)抗体重链的编码多核苷酸，其包含SEQ ID NO:31的核苷酸序列；以及(4)抗体轻链的编码多核苷酸，其包含SEQ ID NO:33的核苷酸序列。

在另一个具体的实施方案中，本发明离体提供了CHO-K1细胞，该细胞包含：(1)mEDEM2的编码多核苷酸，其包含SEQ ID NO:16的核苷酸序列；(2)XBP1的编码多核苷酸，其包含SEQ ID NO:18的核苷酸序列；(3)抗体重链的编码多核苷酸，其包含SEQ ID NO:39的核苷酸序列；以及(4)抗体轻链的编码多核苷酸，其包含SEQ ID NO:41的核苷酸序列。

细胞系

在另一个方面中，本发明提供了细胞系，其包含起源于上文所述的细胞通过克隆扩增得到的多个细胞。至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或者大约100％的细胞系构成细胞包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸，在一些实施方案中，所述的应激诱导的甘露糖结合凝集素为ERAD的成分。在一些实施方案中，所述的应激诱导的甘露糖结合凝集素为内质网降解增强α-甘露糖苷酶-样蛋白质2(EDEM2)。可以预见的是任何编码的EDEM2或其保守取代的变体都可以成功地用于本发明中。如上述部分中所讨论的那样，表1列出了脊椎动物EDEM2蛋白质的一些实例。在一些实施方案中，所述的构成细胞包含编码EDEM2多肽的多核苷酸，其中所述的EDEM2多肽具有与任何哺乳动物EDEM2至少92％一致性的序列。在一些实施方案中，所述的构成细胞包含编码EDEM2多肽的多核苷酸，其中所述的EDEM2多肽具有SEQ ID NO:8的哺乳动物共有氨基酸序列。在一些实施方案中，所述的构成细胞包含SEQ ID NO:1的重组多核苷酸或其保守取代的变体。

在一些实施方案中，由所述的细胞系生产的多亚基蛋白质为抗体，并且所述的细胞系的构成细胞包含编码任意一条或多条多肽的多核苷酸，其中所述的多肽包含SEQ IDNO:43和SEQ ID NO:44的氨基酸序列(其分别代表了特定抗体重链的N末端和C末端部分的共有序列)，以及SEQ ID NO:45和SEQ ID NO:46的氨基酸序列(其分别代表了特定抗体轻链的N末端和C末端部分的共有序列)。在一些实施方案中，所述的细胞系的构成细胞除了包含编码EDEM2蛋白质的重组多核苷酸以外，还包含至少两条多核苷酸，每条多核苷酸都编码多亚基蛋白质的特定的亚基。例如所述的构成细胞包含编码抗体重链(包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列)的多核苷酸和编码抗体轻链(包含SEQ ID NO:45和SEQ IDNO:46的氨基酸序列)的另一种多核苷酸。

在一些实施方案中，如上文所述，所述的构成细胞除了包含应激反应多核苷酸和一条或多条编码多肽亚基的多核苷酸以外，还包含编码未折叠蛋白质反应转录因子(例如剪切形式的XBP1)(其在EDEM2的上游进行操作)的多核苷酸。可以预见的是任何编码的XBP1都可以成功地用于本发明中。如在上文部分中所讨论的那样，表2列出了脊椎动物XBP1剪切形式的多肽的一些实例。这些序列的Clustal W分析表明每条所公开的剪切XBP1多核苷酸序列均与每条其他的XBP1序列具有至少48％的一致性；并且哺乳动物XBP1序列的比较表明每条序列与其他序列具有至少86％的一致性。因此在一些实施方案中，所述的细胞系的构成细胞包含编码剪切形式的XBP1多肽的多核苷酸，其中所述的XBP1多肽具有与任一哺乳动物剪切XBP1至少86％的一致性的序列。在一些实施方案中，所述的构成细胞包含编码XBP1多肽的多核苷酸，其中所述的XBP1多肽具有SEQ ID NO:13的氨基酸序列。

在多个实施方案中，所述的细胞包含编码XBP1多肽的多核苷酸，其中所述的XBP1多肽具有与小鼠XBP1(mXBP1)氨基酸序列(SEQ ID NO:9)至少86％的一致性的氨基酸序列；并且在具体的实施方案中，所述的多肽为SEQ ID NO:9的mXBP1或其保守取代的变体。

本发明预见所述的细胞系包含构成细胞，其亲本选自公知的蛋白质生产型细胞的列表中，例如细菌大肠埃希氏杆菌和类似的原核细胞，酵母菌毕赤酵母和其他毕赤及非毕赤酵母，植物细胞外植体(例如烟草的那些)，昆虫细胞(例如Schneider 2细胞、Sf9和Sf21，和粉纹夜蛾(Trichoplusia ni)衍生的High Five细胞)，以及通常用于生物生产的哺乳动物细胞(例如CHO、CHO-K1、COS、HeLa、HEK293、Jurkat和PC12细胞)。在一些实施方案中，所述的细胞为CHO-K1或改性的CHO-K1细胞，例如在美国专利号7,435,553,7,514,545和7,771,997、及美国专利申请公开号US 2010-0304436A1中所教导的那些。

在一些实施方案中，在培养基中培养的细胞系能够生产多亚基蛋白质并将适当组装的多亚基蛋白质分泌至培养基中，其效价为至少3g/L、至少5g/L或至少8g/L。

此外，与不包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系积分细胞密度相比，所述的细胞系的构成细胞在培养中能够增殖达到积分细胞密度高出大约30％的程度。在一些情况下，与不包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系积分细胞密度相比，所述的细胞系能够达到积分细胞密度高出至少大约50％、至少60％或者至少90％。在一些实施方案中，在处于培养中大约第12天后，评估细胞系的积分细胞密度。

在一些具体的实施方案中，本发明提供了包含克隆衍生的构成细胞的细胞系，其中所述的构成细胞为CHO-K1细胞，该细胞包含：(1)mEDEM2的编码多核苷酸，其包含SEQ IDNO:16的核苷酸序列；(2)XBP1的编码多核苷酸，其包含SEQ ID NO:18的核苷酸序列；(3)抗体重链的编码多核苷酸，其包含编码多肽的核苷酸序列，其中所述的多肽包含SEQ ID NO:43和44的氨基酸序列；以及(4)抗体轻链的编码多核苷酸，其包含编码多肽的核苷酸序列，其中所述的多肽包含SEQ ID NO:45和46的氨基酸序列。

在一个具体的实施方案中，本发明提供了包含克隆衍生的构成细胞的细胞系，其中所述的构成细胞为CHO-K1细胞，该细胞包含：(1)mEDEM2的编码多核苷酸，其包含SEQ IDNO:16的核苷酸序列；(2)XBP1的编码多核苷酸，其包含SEQ ID NO:18的核苷酸序列；(3)抗体重链的编码多核苷酸，其包含SEQ ID NO:23的核苷酸序列；以及(4)抗体轻链的编码多核苷酸，其包含SEQ ID NO:25的核苷酸序列。

在另一个具体的实施方案中，本发明提供了包含克隆衍生的构成细胞的细胞系，其中所述的构成细胞为CHO-K1细胞，该细胞包含：(1)mEDEM2的编码多核苷酸，其包含SEQID NO:16的核苷酸序列；(2)XBP1的编码多核苷酸，其包含SEQ ID NO:18的核苷酸序列；(3)抗体重链的编码多核苷酸，其包含SEQ ID NO:31的核苷酸序列；以及(4)抗体轻链的编码多核苷酸，其包含SEQ ID NO:33的核苷酸序列。

在另一个具体的实施方案中，本发明提供了包含克隆衍生的构成细胞的细胞系，其中所述的构成细胞为CHO-K1细胞，该细胞包含：(1)mEDEM2的编码多核苷酸，其包含SEQID NO:16的核苷酸序列；(2)XBP1的编码多核苷酸，其包含SEQ ID NO:18的核苷酸序列；(3)抗体重链的编码多核苷酸，其包含SEQ ID NO:39的核苷酸序列；以及(4)抗体轻链的编码多核苷酸，其包含SEQ ID NO:41的核苷酸序列。

EDEM2多核苷酸

在另一个方面中，本发明提供了编码EDEM2蛋白质的多核苷酸。EDEM2的编码多核苷酸是重组的，并且可以在体外(例如在试管中或在体外翻译系统中)或者在体内(例如在细胞中，细胞可以是离体的，例如细胞培养物中；或者是在体内的，例如在有机体中)制造、储存、使用或表达。在一些实施方案中，EDEM2的编码多核苷酸在基因中，这表示其处于启动子的控制之下，并且位于启动子下游且多聚腺苷酸位点的上游。EDEM2的编码多核苷酸或基因可以在质粒或者其他环状或线性载体中。EDEM2的编码多核苷酸或基因可以在环状或线性DNA构建体中，其可以作为附加体处于细胞中，或者整合至细胞的基因组中。

如上文所述，EDEM2的编码多核苷酸编码表1的任何直系同源物、同源物或保守取代的EDEM2多肽，或者具有与SEQ ID NO:1-5和8的任一至少92％的一致性的氨基酸序列(包括SEQ ID NO:8的哺乳动物共有序列)的EDEM2多肽。

在一些情况下，重组的或分离的EDEM2的编码多核苷酸可操作地与哺乳动物启动子连接。该启动子可以为任何启动子，但是在一些情况下，其为哺乳动物启动子，例如泛素C启动子。

在具体的实施方案中，EDEM2的编码多核苷酸基本上由(由5’至3’的顺序)启动子(例如泛素C启动子)、其后为可任选的内含子(β球蛋白内含子)、其后为编码EDEM2的序列、其后为多聚腺苷酸序列(例如SV40pA序列)组成。此类EDEM2的编码多核苷酸的特定实例(其也为具体的实施方案)如SEQ ID NO:16所述。该序列的保守变体也被设想为本发明的实施方案。

在一些情况下，重组EDEM2的编码多核苷酸为质粒的一部分，其可以为线性、环状、附加体、整合的、静态的DNA构建体，或者用于传递EDEM2基因或表达EDEM2蛋白质的载体。在一个具体的实施方案中，所述的质粒包含：(1)EDEM2基因，其处于泛素C启动子的控制之下，并以SV40多聚腺苷酸信号为结尾；和(2)选择标记，例如编码赋予对博来霉素抗性的多肽的多核苷酸或编码赋予对新霉素抗性的多肽的多核苷酸，其处于启动子(例如SV40启动子)的控制之下，并以多聚腺苷酸序列(例如PGK pA序列)为结尾。在一个具体的实施方案中，所述的质粒包含(5’至3’方向进行的环状形式)泛素C启动子、β球蛋白内含子、EDEM2的编码序列、SV40 pA序列、SV40启动子、新霉素抗性的编码序列和PGK pA序列。通过具有SEQ ID NO:14序列的质粒来举例说明该实施方案的特定实例。在另一个具体的实施方案中，所述的质粒包含(5’至3’方向进行的环状形式)泛素C启动子、β球蛋白内含子、EDEM2的编码序列、SV40 pA序列、SV40启动子、博来霉素抗性的编码序列和PGK pA序列。通过具有SEQ ID NO:15序列的质粒来举例说明该实施方案的特定实例。

XBP1多核苷酸

在另一个方面中，本发明提供了编码XBP1蛋白质的多核苷酸。XBP1的编码多核苷酸是重组的，并且可以在体外(例如在试管中或在体外翻译系统中)或者在体内(例如在细胞中，细胞可以是离体的，例如细胞培养物中；或者是在体内的，例如在有机体中)制造、储存、使用或表达。在一些实施方案中，XBP1的编码多核苷酸在基因中，这表示其处于启动子的控制之下，并且位于启动子下游且多聚腺苷酸位点的上游。XBP1的编码多核苷酸可以在质粒或者其他环状或线性载体中。XBP1的编码多核苷酸或基因可以在环状或线性DNA构建体中，其可以作为附加体处于细胞中，或者整合至细胞的基因组中。

如上文所述，XBP1的编码多核苷酸编码表2的任何直系同源物、同源物或保守取代的XBP1多肽，或者具有与SEQ ID NO:9、10和11的任一至少86％的一致性的氨基酸序列(包括SEQ ID NO:13的哺乳动物共有序列)的XBP1多肽。

在一些情况下，重组的或分离的XBP1的编码多核苷酸可操作地与哺乳动物启动子连接。该启动子可以为任何启动子，但是在一些情况下，其为哺乳动物启动子，例如泛素C启动子。

在具体的实施方案中，XBP1的编码多核苷酸基本上由(由5’至3’的顺序)启动子(例如泛素C启动子)、其后为可任选的内含子(β球蛋白内含子)、其后为XBP1的编码序列、其后为多聚腺苷酸序列(例如SV40pA序列)组成。SEQ ID NO:18描述了XBP1的编码多核苷酸的实例。该示例序列的保守变体也被设想为本发明的实施方案。

在一些情况下，重组的XBP1的编码多核苷酸为质粒的一部分，其可以为线性、环状、附加体、整合的、静态的DNA构建体，或者用于传递XBP1基因或表达剪切的且具有活性的XBP1蛋白质的载体。在一个具体的实施方案中，所述的质粒包含：(1)XBP1基因，其处于泛素C启动子的控制之下，并以SV40多聚腺苷酸信号为结尾；和(2)选择标记，例如编码赋予对博来霉素抗性的多肽的多核苷酸或编码赋予对新霉素抗性的多肽的多核苷酸，其处于启动子(例如SV40启动子)的控制之下，并以多聚腺苷酸序列(例如PGK pA序列)为结尾。在一个具体的实施方案中，所述的质粒包含(5’至3’方向进行的环状形式)泛素C启动子、β球蛋白内含子、XBP1的编码序列、SV40 pA序列、SV40启动子、博来霉素抗性的编码序列和PGK pA序列。通过具有SEQ ID NO:17序列的环状质粒来举例说明该实施方案的特定实例。

编码抗体重链和轻链的多核苷酸

在另一个方面中，本发明提供了编码抗体重链多肽(HC)的多核苷酸。HC的编码多核苷酸是重组的，并且可以在体外(例如在试管中或在体外翻译系统中)或者在体内(例如在细胞中，细胞可以是离体的，例如细胞培养物中；或者是在体内的，例如在有机体中)制造、储存、使用或表达。在一些实施方案中，HC的编码多核苷酸在基因中，这表示其处于启动子的控制之下，并且位于启动子下游且多聚腺苷酸位点的上游。HC的编码多核苷酸可以在质粒或者其他环状或线性载体中。HC的编码多核苷酸或基因可以在环状或线性DNA构建体中，其可以作为附加体处于细胞中，或者整合至细胞的基因组中。

在一些情况下，重组的或分离的HC的编码多核苷酸可操作地与哺乳动物启动子连接。该启动子可以为任何启动子，但是在一些情况下，其为哺乳动物启动子，例如泛素C启动子或hCMV-IE启动子。

在具体的实施方案中，HC的编码多核苷酸为HC基因，其基本上由(由5’至3’的顺序)启动子(例如hCMV-IE启动子)、其后为可任选的内含子(β球蛋白内含子)、其后为重链的编码序列(例如编码SEQ ID NO:43和44、SEQ ID NO:19、SEQ ID NO:27或SEQ ID NO:35的氨基酸序列的序列)、其后为多聚腺苷酸序列(例如SV40pA序列)组成。通过SEQ ID NO:23、SEQID NO:31和SEQ ID NO:39描述了HC基因的特定实例。这些序列的任意一个的保守变体也被设想为本发明的实施方案。

在一些情况下，重组的HC的编码多核苷酸为质粒的一部分，其可以为线性、环状、附加体、整合的、静态的DNA构建体，或者用于传递重链基因或表达重链亚基的载体。在一个具体的实施方案中，所述的质粒包含：(1)HC基因，其处于hCMV-IE启动子的控制之下，并以SV40多聚腺苷酸信号为结尾；和(2)选择标记，例如编码赋予对潮霉素抗性的多肽的多核苷酸，其处于启动子(例如SV40启动子)的控制之下，并以多聚腺苷酸序列(例如PGK pA序列)为结尾。在一个具体的实施方案中，所述的质粒包含(5’至3’方向进行的环状形式)hCMV-IE启动子、β球蛋白内含子、抗体重链的编码序列(其编码具有SEQ ID NO:43和44、SEQ ID NO:19、SEQ ID NO:27或SEQ ID NO:35的氨基酸的HC)、SV40 pA序列、SV40启动子、潮霉素抗性的编码序列和PGK pA序列。通过SEQ ID NO:24、SEQ ID NO:32或SEQ ID NO:40描述了此类包含HC基因的质粒的特定实例和具体实施方案。这些序列的任意一个的保守变体也被设想为本发明的实施方案。

在另一个方面中，本发明提供了编码抗体轻链多肽(LC)的多核苷酸。LC的编码多核苷酸是重组的，并且可以在体外(例如在试管中或在体外翻译系统中)或者在体内(例如在细胞中，细胞可以是离体的，例如细胞培养物中；或者是在体内的，例如在有机体中)制造、储存、使用或表达。在一些实施方案中，LC的编码多核苷酸在基因中，这表示其处于启动子的控制之下，并且位于启动子下游且多聚腺苷酸位点的上游。LC的编码多核苷酸或基因可以在质粒或者其他环状或线性载体中。LC的编码多核苷酸或基因可以在环状或线性DNA构建体中，其可以作为附加体处于细胞中，或者整合至细胞的基因组中。

在一些情况下，重组的或分离的LC的编码多核苷酸可操作地与哺乳动物启动子连接。该启动子可以为任何启动子，但是在一些情况下，其为哺乳动物启动子，例如泛素C启动子或hCMV-IE启动子。

在具体的实施方案中，LC的编码多核苷酸为LC基因，其基本上由(由5’至3’的顺序)启动子(例如hCMV-IE启动子)、其后为可任选的内含子(β球蛋白内含子)、其后为轻链的编码序列(例如编码SEQ ID NO:45和46、SEQ ID NO:21、SEQ ID NO:29或SEQ ID NO:37的氨基酸序列的序列)、其后为多聚腺苷酸序列(例如SV40pA序列)组成。通过SEQ ID NO:25、SEQID NO:33或SEQ ID NO:41描述了此类LC基因的特定实例和具体实施方案。这些序列的任意一个的保守变体也被设想为本发明的实施方案。

在一些情况下，重组的LC的编码多核苷酸为质粒的一部分，其可以为线性、环状、附加体、整合的、静态的DNA构建体或者用于传递轻链基因或表达轻链亚基的载体。在一个具体的实施方案中，所述的质粒包含：(1)LC基因，其处于hCMV-IE启动子的控制之下，并以SV40多聚腺苷酸信号为结尾；和(2)选择标记，例如编码赋予对潮霉素抗性的多肽的多核苷酸，其处于启动子(例如SV40启动子)的控制之下，并以多聚腺苷酸序列(例如PGK pA序列)为结尾。在一个具体的实施方案中，所述的质粒包含(5’至3’方向进行的环状形式)hCMV-IE启动子、β球蛋白内含子、抗体轻链的编码序列(其编码具有SEQ ID NO:45和46、SEQ ID NO:21、SEQ ID NO:29或SEQ ID NO:37的氨基酸的LC)、SV40 pA序列、SV40启动子、潮霉素抗性的编码序列和PGK pA序列。通过SEQ ID NO:26、SEQ ID NO:34或SEQ ID NO:42描述了此类包含LC基因的质粒的特定实例和具体实施方案。这些序列的任意一个的保守变体也被设想为本发明的实施方案。

制造多亚基蛋白质的方法

在另一个方面中，本发明提供了通过培养细胞或细胞系的构成细胞来制造多亚基蛋白质的方法，其中所述的细胞或细胞系的构成细胞在培养基中能够生产和分泌相对大量的适当组装的多亚基蛋白质，其中所述的多亚基成分以相对高的效价被分泌至培养基中。在该制造方法中使用的细胞为在之前的方面中所描述的细胞，其包含本发明所述的ERAD凝集素的编码多核苷酸。

为生产有用的重组蛋白质的培养细胞(特别是哺乳动物细胞)的方法是本领域公知的(例如参见De Jesus&Wurm,Eur.J.Pharm.Biopharm.78:184-188,2011，及其中引用的参考文献)。简言之，将包含所述的多核苷酸的细胞在培养基中培养，其中所述的培养基可以包含血清或水解产物，或者可以是化学限定并优化的，以用于蛋白质的生产。培养可以是分批供料培养或连续培养，例如在恒化器中。所述的细胞可以在试验台尺寸烧瓶(～25mL)中、在按生产规模呈比例扩大的生物反应器(1-5L)中或工业规模的生物反应器(5000-25000L)中培养。生产运行可以持续几周是一个月，其间多亚基蛋白质被分泌至培养基中。

题述细胞具有增强的生产和分泌适当组装的多亚基蛋白质的能力。在一些实施方案中，所述的多亚基蛋白质(例如抗体)以至少94pg/个细胞/天、至少37pg/个细胞/天或者至少39pg/个细胞/天的速率分泌至培养基中。在一些实施方案中，所述的多亚基蛋白质在培养大约12天后的效价达到至少3g/L、至少5g/L、至少6g/L或者至少8g/L。

此外，题述细胞具有增强的增殖和达到相对高的细胞密度的能力，从而进一步优化生产率。在一些实施方案中，在培养中，细胞或细胞系的种子培养(seed train)的积分细胞密度达到至少5x 10⁷个细胞-天/mL、至少1x 10⁸个细胞-天/mL或者至少1.5x 10⁸个细胞-天/mL。

可任选地，随后由其中分泌有多亚基蛋白质的培养基中纯化该蛋白质。蛋白质的纯化方法是本领域公知的(例如参见Kelley,mAbs 1(5):443-452)。在一些实施方案中，通过离心除去液体培养基上清液中的细胞，然后经历多个层析步骤和过滤步骤以除去病毒和其他污染物或残杂物等，从而收获蛋白质。在一些实施方案中，层析步骤包括离子交换层析，例如阳离子交换或阴离子交换。此外，还可以使用多种亲和层析介质，例如用于纯化抗体的蛋白质A层析。

可任选地，所述的制造方法可以包括创建细胞的预备步骤。因此在一些实施方案中，制造多亚基蛋白质的方法包括使用上文所述的编码应激诱导的甘露糖凝集素的载体来转染细胞的步骤，然后选择其稳定的部分。载体的非限定性实例包括包含多核苷酸的基因构建体，其中所述的多核苷酸编码EDEM2，该EDEM2具有SEQ ID NO:1-8的任意一个的氨基酸序列，与SEQ ID NO:1-8的任意一个具有至少92％的一致性的氨基酸序列，或者SEQ ID NO:1-8的任意一种保守取代的变体。此外，有用的载体还包含例如容留SEQ ID NO:16基因的质粒、SEQ ID NO:15的质粒和SEQ ID NO:14的质粒。人们应该注意所述的质粒序列(例如SEQID NO:14、15、17、24、26、32、34、40和42)是在序列表中以线性方式描述的环状序列。因此在这些情况下，书写序列的3'最末端的核苷酸可以被认为与该书写序列的5'最末端核苷酸的5'端紧接。在SEQ ID NO:14质粒的实例中，通过对新霉素的抗性来选择转化子；在SEQ IDNO:15质粒的实例中，通过选择对博来霉素的抗性来选择转化子。

用于构建多核苷酸及包含该多核苷酸的载体的详细方法在美国专利号7,435,553和7,771,997(这些文献的内容以引用方式并入本文)、以及例如Zwarthoff et al.,J.Gen.Virol.66(4):685-91,1985；Mory et al.,DNA.5(3):181-93,1986；和Pichler etal.,Biotechnol.Bioeng.108(2):386-94,2011中有所描述。

起始细胞(其中放置有编码应激诱导的甘露糖结合凝集素的载体)已经包含编码或调节多亚基蛋白质的亚基、或XBP1(对于使用XBP1的那些实施方案而言)的表达的构建体或基因元件。备选地，编码应激诱导的甘露糖结合凝集素的载体可以首先放置到细胞的内部，然后放置其他的构建体。

通过所述的方法来制造多亚基蛋白质

在另一个方面中，本发明提供了根据本发明公开的方法制造的多亚基蛋白质。考虑到包含可以促进多亚基蛋白质(例如抗体)的适当折叠、组装和翻译后修饰的一个或多个元件，本领域的任一普通技术人员有理由认为此类蛋白质具有不同的结构和功能性。例如有理由认为通过所公开的方法制造的抗体具有特定的糖基化模式和数量上较高比率的非累积的异四聚体。

实施例

提供以下实施例，从而为本领域的那些普通技术人员提供如何制备和使用本发明的方法和组合物的完整公开和描述，并且无意于限定发明人所认为的该发明的范围。对于使用的数字(例如量、温度等)，努力确保精确，但是仍会导致一些试验误差和偏差。除非另作说明，否则份数为摩尔份数；分子量为平均分子量；浓度百分率(％)是指溶质质量(以克计)除以溶液的体积(以毫升计)，再乘以100％(例如10％物质X平均0.1克的物质X每毫升溶液)；温度为℃；而压力为大气压力或接近大气压力。

实施例1：细胞系

使用编码人抗体的重链和轻链的两个质粒转染CHO-K1衍生的宿主细胞系。所述的两个质粒均包含赋予对潮霉素B抗性的hph基因(Asselbergs and Pronk,1992,Mol.Biol.Rep.,17(1):61-70)。使用LIPOFECTAMIN试剂(Invitrogen编号#18324020)转染细胞。简言之，在转染前的一天，将3.5x10⁶个细胞平板接种于10cm平板的包含10％胎牛血清(FBS)(Invitrogen编号#10100)的完全F12(Invitrogen编号#11765)中。在转染当天，清洗细胞一次，并使用OPTIMEM(Invitrogen编号#31985)替代培养基。在OPTIMEM培养基中制备DNA/Lipofectamin复合物，然后将其加入到细胞中。6小时后，将培养基再次更换成具有10％FBS的完全F12。使用400μg/ml的潮霉素B选择试剂来选择稳定整合的质粒。使用FASTR技术来分离克隆抗体的表达细胞系(在美国专利号6,919,183中有所描述，该文献的内容以引用方式并入本文)。

然后，使用EDEM2的编码质粒再次转染抗体的表达细胞系。EDEM2质粒包含新霉素磷酸转移酶(质粒构建体被命名为“p3”)或sh ble(质粒“p7”)基因，从而分别赋予对G418或博来霉素的抗性。使用相同的转染方法。根据选择标记，选择分别具有400μg/ml G418抗性或250μg/ml博来霉素抗性的细胞。然后，使用FASTR技术分离克隆细胞系。

表3：细胞系

实施例2

使用摇瓶，在规模缩小的12天分批供料方法中评价抗体的生产。在该方法中，将细胞以8x10⁵个细胞/mL的密度接种于烧瓶的生产培养基(定义为具有高含量氨基酸的培养基)中。培养持续大约12天，并补充3份供料、以及糖。在整个批次中监视活细胞的密度和抗体的效价。

为了测定mEDEM2对蛋白质生产增强的影响，将包含mEDEM2和mXBP1的CHO细胞系的蛋白质生产与包含mXBP1但不包含mEDEM2的对照细胞的生产比较。在表达mEDEM2的那些细胞系中的蛋白质的效价高于不表达mEDEM2的那些细胞系的蛋白质的效价。

表4：效价

细胞系	增强子	生产率(pg/个细胞/天)	效价g/L(增加％)
				C1	EDEM2+XBP1	39	8.1(93)
C2	XBP1	39	4.2
				C3	EDEM2+XBP1	37	5.9(55)
C8	XBP1	32	3.8
				C6	EDEM2+XBP1	94	5.3(152)
C7	XBP1	52	2.1
				C5	EDEM2	29	3.1(343)
C9	---	9	0.7

实施例3：积分细胞天数

积分细胞天数(“ICD”)是用于描述在整个分批供料工艺中培养物生长的短语。在为期12天的生产测定期间，我们在第0、3、5、7、10和12天监视活细胞的密度。然后将该数据针对时间绘图。ICD为活细胞密度的积分，以细胞密度曲线下的面积计算。EDEM2转染的细胞系在为期12天的分批供料工艺中具有更高的ICD(参见表5)。

表5：积分细胞密度

细胞系	增强子	ICD 10<sup>6</sup>个细胞-天/mL(增加％)
			C1	EDEM2+XBP1	205(93)
C2	XBP1	106
			C3	EDEM2+XBP1	157(34)
C4	XBP1	117
			C6	EDEM2+XBP1	56(51)
C7	XBP1	37
			C5	EDEM2	116(59)
C9	---	73

实施例4：抗GDF8抗体的生产

检测EDEM2、XBP1或两者的异位表达对具有SEQ ID NO:19的重链序列和SEQ IDNO:21的轻链序列的抗GDF8抗体的影响。检测单个细胞系的效价和积分细胞密度，并将其归于各“库”或值的范围中。EDEM2的异位表达显著增加了表达抗体的效价范围为5-6g/L的细胞系的数量。XBP1和EDEM2的组合显示不仅是增加高效价细胞系的相加的效应。此外，EDEM2在抗体的分泌细胞中的表达还显著地增加获得高ICD的细胞系的数量(参见表6)。

表6：

本说明书还包括下列内容：

1.一种细胞，其包含编码应激诱导的甘露糖结合凝集素的重组多核苷酸和编码多亚基蛋白质的多核苷酸。

2.实施方式1所述的细胞，其中所述的应激诱导的甘露糖结合凝集素为内质网降解增强α-甘露糖苷酶-样蛋白质2(EDEM2)。

3.实施方式2所述的细胞，其中所述的EDEM2包含SEQ ID NO:8的氨基酸序列。

4.实施方式2所述的细胞，其中所述的EDEM2包含与SEQ ID NO:1具有至少92％的一致性的氨基酸序列。

5.实施方式1-4的任意一项所述的细胞，其中所述的多亚基蛋白质为抗体。

6.实施方式5所述的细胞，其中所述的抗体包含SEQ ID NO:43、SEQ ID NO:44、SEQID NO:45和SEQ ID NO:46的氨基酸序列。

7.实施方式1-6的任意一项所述的细胞，其包含编码未折叠蛋白质反应转录因子的多核苷酸，其中所述的未折叠蛋白质反应转录因子在所述的EDEM2的上游进行操作。

8.实施方式7所述的细胞，其中所述的转录因子为剪切形式的XBP-1。

9.实施方式8所述的细胞，其中所述的XBP-1包含SEQ ID NO:13的氨基酸序列。

10.实施方式8所述的细胞，其中所述的XBP-1包含与SEQ ID NO:9具有至少86％的一致性的氨基酸序列。

11.实施方式1-10的任意一项所述的细胞，其中所述的细胞为哺乳动物的细胞。

12.实施方式1-11的任意一项所述的细胞，其中所述的细胞为CHO细胞。

13.一种由实施方式1-12的任意一项所述的细胞衍生得到的细胞系。

14.实施方式13所述的细胞系，其生产效价为至少3g/L的所述的蛋白质。

15.实施方式13或实施方式14所述的细胞系，其生产效价为至少5g/L的所述的蛋白质。

16.实施方式13-15的任意一项所述的细胞系，其生产效价为至少8g/L的所述的蛋白质。

17.实施方式13-16的任意一项所述的细胞系，其中与不包含所述的编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系的积分细胞密度相比，所述的细胞系的积分细胞密度高出至少大约30％。

18.实施方式13-17的任意一项所述的细胞系，其中与不包含所述的编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系的积分细胞密度相比，所述的细胞系的积分细胞密度高出至少大约50％。

19.实施方式13-18的任意一项所述的细胞系，其中与不包含所述的编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系的积分细胞密度相比，所述的细胞系的积分细胞密度高出至少大约60％。

20.实施方式13-19的任意一项所述的细胞系，其中与不包含所述的编码应激诱导的甘露糖结合凝集素的重组多核苷酸的细胞系的积分细胞密度相比，所述的细胞系的积分细胞密度高出至少大约90％。

21.一种包含编码EDEM2的核苷酸序列的分离的多核苷酸，与哺乳动物的泛素C启动子可操作地连接。

22.实施方式21所述的分离的多核苷酸，其中所述的EDEM2包含SEQ ID NO:8的氨基酸序列。

23.实施方式21或实施方式22所述的分离的多核苷酸，其中所述的EDEM2由SEQ IDNO:8的氨基酸序列组成。

24.实施方式21-23的任意一项所述的分离的多核苷酸，其中所述的EDEM2包含与SEQ ID NO:1具有至少92％的一致性的氨基酸序列。

25.实施方式21-24的任意一项所述的分离的多核苷酸，其中所述的EDEM2由与SEQID NO:1具有至少92％的一致性的氨基酸序列组成。

26.实施方式21-25的任意一项所述的分离的多核苷酸，其中所述的EDEM2包含SEQID NO:1的氨基酸序列。

27.实施方式21-26的任意一项所述的分离的多核苷酸，其中所述的EDEM2由SEQID NO:1的氨基酸序列组成。

28.实施方式21-27的任意一项所述的多核苷酸，其包含SEQ ID NO:16的核苷酸序列。

29.实施方式21-28的任意一项所述的多核苷酸，其包含SEQ ID NO:14或SEQ IDNO:15的核苷酸序列。

30.实施方式21-29的任意一项所述的多核苷酸，其基本上由SEQ ID NO:14或SEQID NO:15的核苷酸序列组成。

31.一种包含编码Xbp-1蛋白质的核苷酸序列的分离的多核苷酸，与哺乳动物的泛素C启动子可操作地连接。

32.权力要求31所述的分离的多核苷酸，其中所述的Xbp-1蛋白质包含SEQ ID NO:13的氨基酸序列。

33.权力要求31或实施方式32所述的分离的多核苷酸，其中所述的Xbp-1蛋白质由SEQ ID NO:13的氨基酸序列组成。

34.实施方式31-33的任意一项所述的分离的多核苷酸，其中所述的Xbp-1蛋白质包含与SEQ ID NO:9具有至少86％的一致性的氨基酸序列。

35.实施方式31-34的任意一项所述的分离的多核苷酸，其中所述的Xbp-1蛋白质由与SEQ ID NO:9具有至少86％的一致性的氨基酸序列组成。

36.实施方式31-35的任意一项所述的分离的多核苷酸，其中所述的Xbp-1蛋白质包含SEQ ID NO:9的氨基酸序列。

37.实施方式31-36的任意一项所述的分离的多核苷酸，其中所述的Xbp-1蛋白质由SEQ ID NO:9的氨基酸序列组成。

38.实施方式31-37的任意一项所述的多核苷酸，其包含SEQ ID NO:18的核苷酸序列。

39.实施方式31-38的任意一项所述的多核苷酸，其包含SEQ ID NO:17的核苷酸序列。

40.实施方式31-39的任意一项所述的多核苷酸，其基本上由SEQ ID NO:17的核苷酸序列组成。

41.一种包含编码抗GDF8抗体重链的核苷酸序列的分离的多核苷酸，与哺乳动物的泛素C启动子或人CMV-IE启动子可操作地连接。

42.实施方式41所述的分离的多核苷酸，其中所述的抗GDF8抗体重链包含SEQ IDNO:20的氨基酸序列。

43.实施方式41或实施方式42所述的分离的多核苷酸，其中所述的抗GDF8抗体重链包含SEQ ID NO:19的氨基酸序列。

44.实施方式41-43的任意一项所述的分离的多核苷酸，其中所述的抗GDF8抗体重链由SEQ ID NO:19的氨基酸序列组成。

45.实施方式41-44的任意一项所述的多核苷酸，其包含SEQ ID NO:23的核苷酸序列。

46.实施方式41-45的任意一项所述的多核苷酸，其包含SEQ ID NO:24的核苷酸序列。

47.实施方式41-46的任意一项所述的多核苷酸，其基本上由SEQ ID NO:24的核苷酸序列组成。

48.一种包含编码抗GDF8抗体轻链的核苷酸序列的分离的多核苷酸，与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。

49.实施方式48所述的分离的多核苷酸，其中所述的抗GDF8抗体轻链包含SEQ IDNO:22的氨基酸序列。

50.实施方式48或实施方式49所述的分离的多核苷酸，其中所述的抗GDF8抗体轻链包含SEQ ID NO:21的氨基酸序列。

51.实施方式48-50的任意一项所述的分离的多核苷酸，其中所述的抗GDF8抗体轻链由SEQ ID NO:21的氨基酸序列组成。

52.实施方式48-51的任意一项所述的多核苷酸，其包含SEQ ID NO:25的核苷酸序列。

53.实施方式48-52的任意一项所述的多核苷酸，其包含SEQ ID NO:26的核苷酸序列。

54.实施方式48-53的任意一项所述的多核苷酸，其基本上由SEQ ID NO:26的核苷酸序列组成。

55.一种包含编码抗ANG2抗体重链的核苷酸序列的分离的多核苷酸，与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。

56.实施方式55所述的分离的多核苷酸，其中所述的抗ANG2抗体重链包含SEQ IDNO:28的氨基酸序列。

57.实施方式55或实施方式56所述的分离的多核苷酸，其中所述的抗ANG2抗体重链包含SEQ ID NO:27的氨基酸序列。

58.实施方式55-57的任意一项所述的分离的多核苷酸，其中所述的抗ANG2抗体重链由SEQ ID NO:27的氨基酸序列组成。

59.实施方式55-58的任意一项所述的多核苷酸，其包含SEQ ID NO:31的核苷酸序列。

60.实施方式55-59的任意一项所述的多核苷酸，其包含SEQ ID NO:32的核苷酸序列。

61.实施方式55-60的任意一项所述的多核苷酸，其基本上由SEQ ID NO:32的核苷酸序列组成。

62.一种包含编码抗ANG2抗体轻链的核苷酸序列的分离的多核苷酸，与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。

63.实施方式62所述的分离的多核苷酸，其中所述的抗ANG2抗体轻链包含SEQ IDNO:30的氨基酸序列。

64.实施方式62或实施方式63所述的分离的多核苷酸，其中所述的抗ANG2抗体轻链包含SEQ ID NO:29的氨基酸序列。

65.实施方式62-64的任意一项所述的分离的多核苷酸，其中所述的抗ANG2抗体轻链由SEQ ID NO:29的氨基酸序列组成。

66.实施方式62-65的任意一项所述的多核苷酸，其包含SEQ ID NO:33的核苷酸序列。

67.实施方式62-66的任意一项所述的多核苷酸，其包含SEQ ID NO:34的核苷酸序列。

68.实施方式62-67的任意一项所述的多核苷酸，其基本上由SEQ ID NO:34的核苷酸序列组成。

69.一种包含编码抗AngPtl4抗体重链的核苷酸序列的分离的多核苷酸，与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。

70.实施方式69所述的分离的多核苷酸，其中所述的抗AngPtl4抗体重链包含SEQID NO:36的氨基酸序列。

71.实施方式69或实施方式70所述的分离的多核苷酸，其中所述的抗AngPtl4抗体重链包含SEQ ID NO:35的氨基酸序列。

72.实施方式69-71的任意一项所述的分离的多核苷酸，其中所述的抗AngPtl4抗体重链由SEQ ID NO:35的氨基酸序列组成。

73.实施方式69-72的任意一项所述的分离的多核苷酸，其包含SEQ ID NO:39的核苷酸序列。

74.实施方式69-73的任意一项所述的分离的多核苷酸，其包含SEQ ID NO:40的核苷酸序列。

75.实施方式69-74的任意一项所述的分离的多核苷酸，其基本上由SEQ ID NO:40的核苷酸序列组成。

76.一种包含编码抗AngPtl4抗体轻链的核苷酸序列的分离的多核苷酸，与哺乳动物泛素C启动子或人CMV-IE启动子可操作地连接。

77.实施方式76所述的分离的多核苷酸，其中所述的抗AngPtl4抗体轻链包含SEQID NO:38的氨基酸序列。

78.实施方式76或实施方式77所述的分离的多核苷酸，其中所述的抗AngPtl4抗体轻链包含SEQ ID NO:37的氨基酸序列。

79.实施方式76-78的任意一项所述的分离的多核苷酸，其中所述的抗AngPtl4抗体轻链由SEQ ID NO:37的氨基酸序列组成。

80.实施方式76-79的任意一项所述的多核苷酸，其包含SEQ ID NO:41的核苷酸序列。

81.实施方式76-80的任意一项所述的多核苷酸，其包含SEQ ID NO:42的核苷酸序列。

82.实施方式76-81的任意一项所述的多核苷酸，其基本上由SEQ ID NO:42的核苷酸序列组成。

83.一种编码多肽的分离的多核苷酸，其中所述的多肽包含SEQ ID NO:43的氨基酸序列。

84.一种编码多肽的分离的多核苷酸，其中所述的多肽包含SEQ ID NO:44的氨基酸序列。

85.一种编码多肽的分离的多核苷酸，其中所述的多肽包含SEQ ID NO:43和SEQID NO:44的氨基酸序列。

86.一种编码多肽的分离的多核苷酸，其中所述的多肽包含SEQ ID NO:45的氨基酸序列。

87.一种编码多肽的分离的多核苷酸，其中所述的多肽包含SEQ ID NO:46的氨基酸序列。

88.一种编码多肽的分离的多核苷酸，其中所述的多肽包含SEQ ID NO:45和SEQID NO:46的氨基酸序列。

89.一种细胞，其包含：实施方式21-30的任意一项所述的分离的多核苷酸；以及(b)编码多亚基蛋白质的多核苷酸。

90.实施方式89所述的细胞，其中所述的多亚基蛋白质为抗体。

91.实施方式90所述的细胞，其中所述的抗体包含实施方式83-88的任意一项所述的氨基酸序列。

92.实施方式91所述的细胞，其中所述的抗体包含实施方式85和88所述的氨基酸序列。

93.实施方式89-92的任意一项所述的细胞，其进一步包含实施方式31-40的任意一项所述的多核苷酸。

94.实施方式89-93的任意一项所述的细胞，其包含实施方式41-47的任意一项所述的多核苷酸和实施方式48-54的任意一项所述的多核苷酸。

95.实施方式89-93的任意一项所述的细胞，其包含实施方式55-61的任意一项所述的多核苷酸和实施方式62-68的任意一项所述的多核苷酸。

96.实施方式89-93的任意一项所述的细胞，其包含实施方式69-75的任意一项所述的多核苷酸和实施方式76-82的任意一项所述的多核苷酸。

97.实施方式89-96的任意一项所述的细胞，其中所述的细胞为中国仓鼠卵巢细胞(CHO)。

98.一种制备多亚基蛋白质的方法，其包括在培养基中培养实施方式89-97的任意一项所述的细胞的步骤，其中所述的多亚基蛋白质被所述的细胞分泌至所述的培养基中。

99.实施方式98所述的方法，其中所述的分泌的多亚基蛋白质在所述的培养基中的效价达到大约至少3g/L。

100.实施方式98或实施方式99所述的方法，其中所述的分泌的多亚基蛋白质在所述的培养基中的效价达到大约至少5g/L。

101.实施方式89-91的任意一项所述的方法，其中所述的分泌的多亚基蛋白质在所述的培养基中的效价达到大约至少6g/L。

102.实施方式89-92的任意一项所述的方法，其中所述的分泌的多亚基蛋白质在所述的培养基中的效价达到大约至少8g/L。

103.实施方式89-93的任意一项所述的方法，其中所述的细胞在所述的培养基中分裂达到积分细胞密度为大约至少5x 107个细胞-天/mL。

104.实施方式89-94的任意一项所述的方法，其中所述的细胞在所述的培养基中分裂，从而产生积分细胞密度为大约至少1x 108个细胞-天/mL。

105.实施方式89-95的任意一项所述的方法，其中所述的细胞在所述的培养基中分裂，从而产生积分细胞密度为大约至少1.5x 108个细胞-天/mL。

106.实施方式89-96的任意一项所述的方法，其进一步包含从所述的培养基中纯化所述的分泌多亚基蛋白质的步骤。

107.一种根据实施方式98-106的任意一项所述的方法生产的多亚基蛋白质。

108.实施方式107所述的多亚基蛋白质，其中所述的多亚基蛋白质为抗体。

109.实施方式108所述的多亚基蛋白质，其中所述的抗体包含SEQ ID NO:43、SEQID NO:44、SEQ ID NO:45和SEQ ID NO:46的氨基酸序列。

110.实施方式109所述的多亚基蛋白质，其中所述的抗体为抗GDF8抗体。

111.实施方式110所述的多亚基蛋白质，其中所述的抗体包含SEQ ID NO:20和SEQID NO:22的氨基酸序列。

112.实施方式109所述的多亚基蛋白质，其中所述的抗体为抗ANG2抗体。

113.实施方式112所述的多亚基蛋白质，其中所述的抗体包含SEQ ID NO:28和SEQID NO:30的氨基酸序列。

114.实施方式109所述的多亚基蛋白质，其中所述的抗体为抗AngPtl4抗体。

115.实施方式114所述的多亚基蛋白质，其中所述的抗体包含SEQ ID NO:36和SEQID NO:38的氨基酸序列。

116.一种包含多核苷酸的离体哺乳动物细胞，所述的多核苷酸包含SEQ ID NO:16的核酸序列。

117.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；和(b)多核苷酸，其包含SEQ ID NO:18的核酸序列。

118.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；(b)多核苷酸，其编码包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列的多肽；和(c)多核苷酸，其编码包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列的多肽。

119.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；(b)多核苷酸，其包含SEQ ID NO:23的核酸序列；和(c)多核苷酸，其包含SEQ ID NO:25的核酸序列。

120.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；(b)多核苷酸，其包含SEQ ID NO:31的核酸序列；和(c)多核苷酸，其包含SEQ ID NO:33的核酸序列。

121.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；(b)多核苷酸，其包含SEQ ID NO:39的核酸序列；和(c)多核苷酸，其包含SEQ ID NO:41的核酸序列。

122.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；(b)多核苷酸，其包含SEQ ID NO:18的核酸序列；(c)多核苷酸，其编码包含SEQ IDNO:43和SEQ ID NO:44的氨基酸序列的多肽；和(d)多核苷酸，其编码包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列的多肽。

123.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；(b)多核苷酸，其包含SEQ ID NO:18的核酸序列；(c)多核苷酸，其包含SEQ ID NO:23的核酸序列；和(d)多核苷酸，其包含SEQ ID NO:25的核酸序列。

124.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；(b)多核苷酸，其包含SEQ ID NO:18的核酸序列；(c)多核苷酸，其包含SEQ ID NO:31的核酸序列；和(d)多核苷酸，其包含SEQ ID NO:33的核酸序列。

125.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其包含SEQ ID NO:16的核酸序列；(b)多核苷酸，其包含SEQ ID NO:18的核酸序列；(c)多核苷酸，其包含SEQ ID NO:39的核酸序列；和(d)多核苷酸，其包含SEQ ID NO:41的核酸序列。

126.一种包含多核苷酸的离体哺乳动物细胞，所述的多核苷酸由SEQ ID NO:14或15的核酸序列组成。

127.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；和(b)多核苷酸，其由SEQ ID NO:17的核酸序列组成。

128.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；(b)多核苷酸，其编码包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列的多肽；和(c)多核苷酸，其编码包含SEQ ID NO:45和SEQ ID NO:46的氨基酸序列的多肽。

129.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；(b)多核苷酸，其由SEQ ID NO:24的核酸序列组成；和(c)多核苷酸，其由SEQID NO:26的核酸序列组成。

130.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；(b)多核苷酸，其由SEQ ID NO:32的核酸序列组成；和(c)多核苷酸，其由SEQID NO:4的核酸序列组成。

131.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；(b)多核苷酸，其由SEQ ID NO:40的核酸序列组成；和(c)多核苷酸，其由SEQID NO:42的核酸序列组成。

132.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；(b)多核苷酸，其由SEQ ID NO:17的核酸序列组成；(c)多核苷酸，其编码包含SEQ ID NO:43和SEQ ID NO:44的氨基酸序列的多肽；和(d)多核苷酸，其编码包含SEQ IDNO:45和SEQ ID NO:46的氨基酸序列的多肽。

133.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；(b)多核苷酸，其由SEQ ID NO:17的核酸序列组成；(c)多核苷酸，其由SEQ IDNO:24的核酸序列组成；和(d)多核苷酸，其由SEQ ID NO:26的核酸序列组成。

134.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；(b)多核苷酸，其由SEQ ID NO:17的核酸序列组成；(c)多核苷酸，其由SEQ IDNO:32的核酸序列组成；和(d)多核苷酸，其由SEQ ID NO:34的核酸序列组成。

135.一种离体哺乳动物细胞，其包含：(a)多核苷酸，其由SEQ ID NO:14或15的核酸序列组成；(b)多核苷酸，其由SEQ ID NO:17的核酸序列组成；(c)多核苷酸，其由SEQ IDNO:40的核酸序列组成；和(d)多核苷酸，其由SEQ ID NO:42的核酸序列组成。

本说明书还包括下列内容：

11.实施方式7的细胞，其中所述细胞以至少37pg/个细胞/天的速率生产所述多亚基蛋白。

12.实施方式1的细胞，其中所述编码多亚基蛋白的核酸序列还包含SEQ ID NO：45的氨基酸序列。

13.实施方式1的细胞，其中所述编码多亚基蛋白的核酸序列还包含SEQ ID NO：44的氨基酸序列。

14.实施方式1的细胞，其中所述多亚基蛋白是抗体。

15.实施方式14的细胞，其中所述抗体包含具有SEQ ID NO：44的氨基酸序列的重链。

16.实施方式15的细胞，其中所述抗体是抗GDF8抗体、抗Ang2抗体或抗AngPtl4抗体。

17.实施方式1的细胞，其中所述细胞是真核细胞。

18.实施方式17的细胞，其中所述细胞是修饰的CHO-K1细胞。

19.实施方式7的细胞，其还包含第四多核苷酸，所述第四多核苷酸编码结合所述多亚基蛋白的细胞表面捕获分子。

20.细胞系，其包含多个起源于实施方式1的细胞而通过克隆扩增得到的细胞。

21.制备多亚基蛋白的方法，其包括：

(a)在培养基中培养通过克隆扩增从一个细胞中分离下来的多个细胞，该细胞包括：

(i)第一多核苷酸，其包含编码第一生产增强蛋白的核酸序列，所述第一生产增强蛋白包含与SEQ ID NO：9至少86％一致的氨基酸序列；和

(ii)第二多核苷酸，其包含编码多亚基蛋白的核酸序列，所述多亚基蛋白包含SEQID NO：46的氨基酸序列；

(b)使细胞以大于9pg/个细胞/天的速率将所述多亚基蛋白分泌到培养基中；和

(c)通过亲和层析、离子交换层析或者亲和层析和离子交换层析的组合从所述培养基中纯化所述多亚基蛋白。

22.实施方式21的方法，其中所述第一生产增强蛋白包含选自下列的氨基酸序列：SEQ ID NO：9、SEQ ID NO：10、SEQ ID NO：11和SEQ ID NO：13。

23.实施方式21的方法，其中所述编码所述第一生产增强蛋白的核酸序列与组成型遍在启动子可操作地连接。

24.实施方式23的方法，其中所述组成型启动子选自：泛素C启动子、CMV-IE启动子和SV40启动子。

25.实施方式22的方法，其中所述第一多核苷酸包含SEQ ID NO：18的核酸序列。

26.实施方式25的方法，其中所述第一多核苷酸包含SEQ ID NO：17的核酸序列。

27.实施方式21的方法，其中所述细胞以大于32pg/个细胞/天的速率将所述多亚基蛋白分泌到所述培养基中。

28.实施方式21的方法，其还在步骤(a)之前包括下列步骤：

(aa)以任何顺序

(i)用所述第一多核苷酸转染所述细胞，和

(ii)用所述第二多核苷酸转染所述细胞；和

(bb)克隆扩增所述包含所述第一多核苷酸和所述第二多核苷酸的细胞。

29.实施方式21的方法，其中所述细胞还包含第三多核苷酸，所述第三多核苷酸包含编码第二生产增强蛋白的核酸序列，

所述第二生产增强蛋白包含与SEQ ID NO：1具有至少92％一致性的氨基酸序列，且

所述第二生产增强蛋白使步骤(b)的细胞以≥37pg/个细胞/天的速率将所述多亚基蛋白分泌到所述培养基中。

30.实施方式29的方法，其中所述第二生产增强蛋白包含选自下列的氨基酸序列：SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6和SEQID NO：8。

31.实施方式29的方法，其中所述编码所述第二生产增强蛋白的核酸序列与第二组成型启动子可操作地连接。

32.实施方式31的方法，其中所述第二组成型启动子选自：泛素C启动子、CMV-IE启动子和SV40启动子。

33.实施方式31的方法，其中所述第三多核苷酸包含SEQ ID NO：16的核酸序列。

34.实施方式31的方法，其中所述第三多核苷酸包含SEQ ID NO：14或15的核酸序列。

35.实施方式29的方法，其还在步骤(a)之前包括下列步骤：

(aa)以任何顺序

(i)用所述第一多核苷酸转染所述细胞，

(ii)用所述第二多核苷酸转染所述细胞，及

(iii)用所述第三多核苷酸转染所述细胞；和

(bb)克隆扩增所述包含所述第一多核苷酸、所述第二多核苷酸和所述第三多核苷酸的细胞。

36.实施方式21的方法，其中所述多亚基蛋白在培养基中积累的滴度≥2.1g/L，≥3.8g/L或≥4.2g/L。

37.实施方式29的方法，其中所述多亚基蛋白在培养基中积累的滴度≥5.3g/L，≥5.9g/L或≥8.1g/L。

38.实施方式21的方法，其中所述编码多亚基蛋白的核酸序列还包含SEQ ID NO：45的氨基酸序列。

39.实施方式21的方法，其中所述编码多亚基蛋白的核酸序列还包含SEQ ID NO：44的氨基酸序列。

40.实施方式21的方法，其中所述多亚基蛋白是抗体。

41.实施方式40的方法，其中所述抗体包含具有SEQ ID NO：44的氨基酸序列的重链。

42.实施方式41的方法，其中所述抗体是抗GDF8抗体、抗Ang2抗体或抗AngPtl4抗体。

序列表

<110> Regeneron Pharmaceuticals, Inc.

<120> 生产型细胞系的增强子

<130> 8150A

<150> US 61/652,549

<151> 2012-05-29

<160> 46

<170> PatentIn version 3.5

<210> 1

<211> 577

<212> PRT

<213> 小鼠（Mus musculus）

<400> 1

Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Leu Leu

1 5 10 15

Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Thr Ala Pro Asp Pro

20 25 30

Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp

35 40 45

Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr

50 55 60

Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp

65 70 75 80

Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg

85 90 95

Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn

100 105 110

Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser

115 120 125

Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp

130 135 140

Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys

145 150 155 160

Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val

165 170 175

Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr

180 185 190

Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu

195 200 205

Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg

210 215 220

Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp

225 230 235 240

Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly

245 250 255

Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln

260 265 270

Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg

275 280 285

Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys

290 295 300

Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro

305 310 315 320

Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe

325 330 335

Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe

340 345 350

Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro

355 360 365

Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr

370 375 380

Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile

385 390 395 400

Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu

405 410 415

Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu

420 425 430

Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His

435 440 445

Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys

450 455 460

Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile

465 470 475 480

Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp

485 490 495

Glu Val Glu Asp Leu Ile Lys Glu Phe Tyr Ser Leu Lys Gln Ser Arg

500 505 510

Pro Lys Arg Ala Gln Arg Lys Thr Val Arg Ser Gly Pro Trp Glu Pro

515 520 525

Gln Ser Gly Pro Ala Thr Leu Ser Ser Pro Ala Asn Gln Pro Arg Glu

530 535 540

Lys Gln Pro Ala Gln Gln Arg Thr Pro Leu Leu Ser Cys Pro Ser Gln

545 550 555 560

Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser

565 570 575

Ser

<210> 2

<211> 576

<212> PRT

<213> 大鼠（Rattus norvegicus）

<400> 2

Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Leu Leu

1 5 10 15

Pro Leu His His Gly Ala Pro Gly Pro Glu Gly Thr Ala Pro Asp Pro

20 25 30

Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp

35 40 45

Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr

50 55 60

Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp

65 70 75 80

Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg

85 90 95

Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn

100 105 110

Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser

115 120 125

Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp

130 135 140

Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys

145 150 155 160

Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val

165 170 175

Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr

180 185 190

Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu

195 200 205

Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg

210 215 220

Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp

225 230 235 240

Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly

245 250 255

Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln

260 265 270

Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg

275 280 285

Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys

290 295 300

Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro

305 310 315 320

Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe

325 330 335

Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe

340 345 350

Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro

355 360 365

Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr

370 375 380

Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile

385 390 395 400

Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu

405 410 415

Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu

420 425 430

Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His

435 440 445

Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys

450 455 460

Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile

465 470 475 480

Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp

485 490 495

Glu Val Glu Asp Leu Ile Lys Glu Phe Tyr Ser Leu Arg Gln Ser Arg

500 505 510

Ser Arg Ala Gln Arg Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro

515 520 525

Ala Gly Pro Gly Thr Leu Ser Ser Pro Glu Asn Gln Pro Arg Glu Lys

530 535 540

Gln Pro Ala Arg Gln Arg Ala Pro Leu Leu Ser Cys Pro Ser Gln Pro

545 550 555 560

Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser Ser

565 570 575

<210> 3

<211> 578

<212> PRT

<213> 黑线仓鼠（Cricetulus griseus）

<400> 3

Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Phe Leu

1 5 10 15

Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Thr Ala Pro Asp Pro

20 25 30

Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp

35 40 45

Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr

50 55 60

Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp

65 70 75 80

Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg

85 90 95

Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn

100 105 110

Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser

115 120 125

Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp

130 135 140

Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys

145 150 155 160

Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val

165 170 175

Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr

180 185 190

Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu

195 200 205

Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Leu Ala Leu Met Arg

210 215 220

Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp

225 230 235 240

Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly

245 250 255

Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln

260 265 270

Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Arg Ala Ile Arg

275 280 285

Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys

290 295 300

Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro

305 310 315 320

Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe

325 330 335

Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe

340 345 350

Tyr Asn Ile Ala Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro

355 360 365

Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr

370 375 380

Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile

385 390 395 400

Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu

405 410 415

Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu

420 425 430

Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His

435 440 445

Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys

450 455 460

Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile

465 470 475 480

Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp

485 490 495

Glu Val Glu Asp Leu Met Arg Glu Leu His Ser Leu Lys Gln Ser Arg

500 505 510

Ser Arg Ala Gln Arg Lys Thr Thr Ser Ser Gly Pro Trp Glu Pro Pro

515 520 525

Ala Gly Pro Gly Ser Pro Ser Ala Pro Gly Lys Gln Asp Gln Pro Arg

530 535 540

Glu Lys Gln Pro Ala Lys Gln Arg Thr Pro Leu Leu Ser Cys Pro Ser

545 550 555 560

Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp

565 570 575

Ser Ser

<210> 4

<211> 578

<212> PRT

<213> 智人（Homo sapiens）

<400> 4

Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Leu Cys Ala Leu Leu

1 5 10 15

Pro Gln His His Gly Ala Pro Gly Pro Asp Gly Ser Ala Pro Asp Pro

20 25 30

Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp

35 40 45

Ser Tyr Leu Glu Asn Ala Phe Pro Phe Asp Glu Leu Arg Pro Leu Thr

50 55 60

Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp

65 70 75 80

Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg

85 90 95

Val Val Glu Val Leu Gln Asp Ser Val Asp Phe Asp Ile Asp Val Asn

100 105 110

Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser

115 120 125

Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp

130 135 140

Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys

145 150 155 160

Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val

165 170 175

Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr

180 185 190

Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu

195 200 205

Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg

210 215 220

Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp

225 230 235 240

Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly

245 250 255

Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln

260 265 270

Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg

275 280 285

Asn Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys

290 295 300

Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro

305 310 315 320

Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe

325 330 335

Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe

340 345 350

Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro

355 360 365

Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr

370 375 380

Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile

385 390 395 400

Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu

405 410 415

Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu

420 425 430

Thr Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His

435 440 445

Asn Asn Gly Ser Thr Phe Asp Thr Val Ile Thr Pro Tyr Gly Glu Cys

450 455 460

Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile

465 470 475 480

Asp Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp

485 490 495

Glu Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Ser Arg

500 505 510

Ser Lys Phe Gln Lys Asn Thr Val Ser Ser Gly Pro Trp Glu Pro Pro

515 520 525

Ala Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg

530 535 540

Glu Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser

545 550 555 560

Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp

565 570 575

Ser Ser

<210> 5

<211> 578

<212> PRT

<213> 黑猩猩（Pan troglodytes）

<400> 5

Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Leu Cys Ala Leu Leu

1 5 10 15

Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Ser Ala Pro Asp Pro

20 25 30

Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp

35 40 45

Ser Tyr Leu Glu Asn Ala Phe Pro Phe Asp Glu Leu Arg Pro Leu Thr

50 55 60

Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp

65 70 75 80

Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg

85 90 95

Val Val Glu Val Leu Gln Asp Ser Val Asp Phe Asp Ile Asp Val Asn

100 105 110

Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser

115 120 125

Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp

130 135 140

Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys

145 150 155 160

Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val

165 170 175

Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr

180 185 190

Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu

195 200 205

Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg

210 215 220

Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp

225 230 235 240

Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly

245 250 255

Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln

260 265 270

Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg

275 280 285

Asn Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys

290 295 300

Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro

305 310 315 320

Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe

325 330 335

Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe

340 345 350

Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro

355 360 365

Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr

370 375 380

Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile

385 390 395 400

Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu

405 410 415

Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu

420 425 430

Thr Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His

435 440 445

Asn Asn Gly Ser Thr Phe Asp Ala Val Ile Thr Pro Tyr Gly Glu Cys

450 455 460

Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile

465 470 475 480

Asp Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp

485 490 495

Glu Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Ser Arg

500 505 510

Ser Lys Phe Gln Lys Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro

515 520 525

Ala Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg

530 535 540

Glu Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser

545 550 555 560

Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp

565 570 575

Ser Ser

<210> 6

<211> 513

<212> PRT

<213> 婆罗洲猩猩（Pongo pygmaeus）

<400> 6

Met Asn Thr Leu Ser Cys Ser Leu Phe Ser Leu Thr Leu Ile Asp Ala

1 5 10 15

Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg Val

20 25 30

Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn Ala

35 40 45

Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser Ala

50 55 60

His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp Pro

65 70 75 80

Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys Leu

85 90 95

Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val Asn

100 105 110

Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr Ala

115 120 125

Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu Thr

130 135 140

Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg Leu

145 150 155 160

Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp Val

165 170 175

Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly Val

180 185 190

Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln Asp

195 200 205

Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg Asn

210 215 220

Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys Gly

225 230 235 240

Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro Gly

245 250 255

Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe Leu

260 265 270

Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe Tyr

275 280 285

Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro Leu

290 295 300

Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr Gly

305 310 315 320

Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile Glu

325 330 335

Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu Arg

340 345 350

Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu Thr

355 360 365

Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His Asn

370 375 380

Asn Gly Ser Thr Phe Asp Ala Val Ile Thr Pro Tyr Gly Glu Cys Ile

385 390 395 400

Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile Asp

405 410 415

Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp Glu

420 425 430

Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Asn Arg Ser

435 440 445

Lys Phe Gln Lys Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro Ala

450 455 460

Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg Gly

465 470 475 480

Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser Gln

485 490 495

Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser

500 505 510

Ser

<210> 7

<211> 572

<212> PRT

<213> 斑马鱼（Danio rerio）

<400> 7

Leu Tyr Tyr Leu Pro Leu Phe Thr Ser Arg Tyr Phe Met Leu Thr Phe

1 5 10 15

Leu Phe Ser Ala Ile Phe Cys Ala Ala Tyr Leu Ser Pro Ile Ile Ser

20 25 30

His Val Lys Gly Arg Asp Phe Thr Glu Gln Glu Met Ser His Tyr Arg

35 40 45

Asp Arg Val Lys Ser Met Phe Tyr His Ala Tyr Asn Ser Tyr Leu Asp

50 55 60

Asn Ala Tyr Pro Tyr Asp Glu Leu Arg Pro Leu Thr Cys Asp Gly Gln

65 70 75 80

Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp Ala Leu Asp Thr

85 90 95

Leu Leu Ile Leu Gly Asn His Thr Glu Phe Gln Arg Val Ala Thr Leu

100 105 110

Leu Gln Asp Thr Val Asp Phe Asp Ile Asp Val Asn Ala Ser Val Phe

115 120 125

Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser Ala His Leu Leu

130 135 140

Ser Lys Arg Ala Gly Met Lys Val Glu Glu Gly Trp Pro Cys Ser Gly

145 150 155 160

Pro Leu Leu Arg Met Ala Glu Asp Ala Ala Arg Lys Leu Leu Pro Ala

165 170 175

Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val Asn Leu Leu Arg

180 185 190

Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr Ala Gly Val Gly

195 200 205

Thr Phe Ile Leu Glu Phe Ser Thr Leu Ser Arg Leu Thr Gly Asp Pro

210 215 220

Val Phe Glu Asn Val Ala Arg Lys Ala Leu Arg Ala Leu Trp Arg Thr

225 230 235 240

Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp Val Ile Thr Ser

245 250 255

Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly Val Asp Ser Tyr

260 265 270

Phe Glu Tyr Leu Val Arg Gly Ala Ile Met Leu Gln Asp Glu Glu Leu

275 280 285

Leu Thr Met Phe Tyr Glu Phe Asp Lys Ser Ile Lys Asn Tyr Thr Lys

290 295 300

Phe Asp Asp Trp Tyr Leu Trp Val Gln Met His Lys Gly Thr Val Ser

305 310 315 320

Met Pro Val Phe Gln Ser Leu Glu Ala Phe Trp Pro Gly Met Gln Ser

325 330 335

Leu Ile Gly Asp Ile Ser Ser Ala Thr Lys Ser Phe His Asn Tyr Tyr

340 345 350

Ser Val Trp Arg Gln Phe Gly Gly Leu Pro Glu Phe Tyr Ser Ile Pro

355 360 365

Gln Gly Tyr Thr Val Asp Lys Arg Glu Gly Tyr Pro Leu Arg Pro Glu

370 375 380

Leu Ile Glu Ser Ala Met Tyr Leu Tyr Lys Ala Thr Gly Asp Pro Ser

385 390 395 400

Phe Ile Gln Leu Gly Arg Asp Ala Val Glu Ser Ile Asp Arg Ile Ser

405 410 415

Arg Val Asn Cys Gly Phe Ala Thr Val Lys Asp Val Arg Asp His Lys

420 425 430

Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu Thr Ile Lys Tyr

435 440 445

Leu Tyr Leu Leu Phe Asp Pro Asp Asn Phe Leu His Asn Thr Gly Thr

450 455 460

Glu Phe Glu Leu Gly Gly Leu Arg Gly Asp Cys Ile Leu Ser Ala Gly

465 470 475 480

Gly Tyr Val Phe Asn Thr Glu Ala His Pro Leu Asp Pro Ala Ala Leu

485 490 495

His Cys Cys Ser Arg Glu Gln Gln Asp Arg Arg Glu Ile Gln Asp Ile

500 505 510

Leu Leu Ser Phe Ser Gln Pro His Thr Glu Glu Pro Ser Arg Asp Gln

515 520 525

Ser Ala Gly Gly Ser Pro Glu Ser Ile Ala Leu Lys Pro Gly Glu Gln

530 535 540

Arg Lys Ala Pro Val Leu Ser Cys Pro Thr Gln Pro Phe Ser Ala Lys

545 550 555 560

Leu Ala Val Met Gly Gln Val Phe Ser Asp Asn Ser

565 570

<210> 8

<211> 577

<212> PRT

<213> 人工的

<220>

<223> 共有序列

<220>

<221> MISC_FEATURE

<222> (12)..(12)

<223> V或L

<220>

<221> MISC_FEATURE

<222> (14)..(14)

<223> V或A

<220>

<221> MISC_FEATURE

<222> (15)..(15)

<223> L或F

<220>

<221> MISC_FEATURE

<222> (26)..(26)

<223> D或E

<220>

<221> MISC_FEATURE

<222> (28)..(28)

<223> T或S

<220>

<221> MISC_FEATURE

<222> (57)..(57)

<223> Y或F

<220>

<221> MISC_FEATURE

<222> (91)..(91)

<223> T或V

<220>

<221> MISC_FEATURE

<222> (104)..(104)

<223> N或S

<220>

<221> MISC_FEATURE

<222> (220)..(220)

<223> V或L

<220>

<221> MISC_FEATURE

<222> (285)..(285)

<223> K或R

<220>

<221> MISC_FEATURE

<222> (292)..(292)

<223> H或R

<220>

<221> MISC_FEATURE

<222> (356)..(356)

<223> P或A

<220>

<221> MISC_FEATURE

<222> (442)..(442)

<223> H或D

<220>

<221> MISC_FEATURE

<222> (444)..(444)

<223> N或T

<220>

<221> MISC_FEATURE

<222> (456)..(456)

<223> S, T或A

<220>

<221> MISC_FEATURE

<222> (458)..(458)

<223> M或I

<220>

<221> MISC_FEATURE

<222> (461)..(461)

<223> H或Y

<220>

<221> MISC_FEATURE

<222> (489)..(489)

<223> R或Q

<220>

<221> MISC_FEATURE

<222> (502)..(502)

<223> I或M

<220>

<221> MISC_FEATURE

<222> (503)..(503)

<223> K或R

<220>

<221> MISC_FEATURE

<222> (505)..(505)

<223> F或L

<220>

<221> MISC_FEATURE

<222> (506)..(506)

<223> Y或H

<220>

<221> MISC_FEATURE

<222> (509)..(509)

<223> K或R

<220>

<221> MISC_FEATURE

<222> (510)..(510)

<223> Q或R

<220>

<221> MISC_FEATURE

<222> (513)..(513)

<223> P或S

<220>

<221> MISC_FEATURE

<222> (514)..(516)

<223> KRA, RA或KF

<220>

<221> MISC_FEATURE

<222> (518)..(518)

<223> R或K

<220>

<221> MISC_FEATURE

<222> (519)..(519)

<223> K或N

<220>

<221> MISC_FEATURE

<222> (522)..(522)

<223> R或S

<220>

<221> MISC_FEATURE

<222> (529)..(529)

<223> Q或P

<220>

<221> MISC_FEATURE

<222> (530)..(530)

<223> S或A

<220>

<221> MISC_FEATURE

<222> (531)..(531)

<223> G或R

<220>

<221> MISC_FEATURE

<222> (533)..(533)

<223> A或G

<220>

<221> MISC_FEATURE

<222> (534)..(534)

<223> T或S

<220>

<221> MISC_FEATURE

<222> (535)..(535)

<223> L或P

<220>

<221> MISC_FEATURE

<222> (536)..(536)

<223> S或F

<220>

<221> MISC_FEATURE

<222> (537)..(537)

<223> S或A

<220>

<221> MISC_FEATURE

<222> (539)..(540)

<223> AN, EN, GKQD或ENHD

<220>

<221> MISC_FEATURE

<222> (542)..(542)

<223> P或A

<220>

<221> MISC_FEATURE

<222> (545)..(545)

<223> K或R

<220>

<221> MISC_FEATURE

<222> (546)..(546)

<223> Q或K

<220>

<221> MISC_FEATURE

<222> (549)..(549)

<223> Q, R或K

<220>

<221> MISC_FEATURE

<222> (551)..(551)

<223> R或K

<220>

<221> MISC_FEATURE

<222> (552)..(552)

<223> T, A或V

<400> 8

Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Xaa Cys Xaa Xaa Leu

1 5 10 15

Pro Leu His His Gly Ala Pro Gly Pro Xaa Gly Xaa Ala Pro Asp Pro

20 25 30

Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp

35 40 45

Ser Tyr Leu Glu Asn Ala Phe Pro Xaa Asp Glu Leu Arg Pro Leu Thr

50 55 60

Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp

65 70 75 80

Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Xaa Ser Glu Phe Gln Arg

85 90 95

Val Val Glu Val Leu Gln Asp Xaa Val Asp Phe Asp Ile Asp Val Asn

100 105 110

Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser

115 120 125

Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp

130 135 140

Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys

145 150 155 160

Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val

165 170 175

Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr

180 185 190

Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu

195 200 205

Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Xaa Ala Leu Met Arg

210 215 220

Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp

225 230 235 240

Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly

245 250 255

Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln

260 265 270

Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Xaa Ala Ile Arg

275 280 285

Asn Tyr Thr Xaa Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys

290 295 300

Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro

305 310 315 320

Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe

325 330 335

Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe

340 345 350

Tyr Asn Ile Xaa Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro

355 360 365

Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr

370 375 380

Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile

385 390 395 400

Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu

405 410 415

Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu

420 425 430

Thr Val Lys Tyr Leu Tyr Leu Leu Phe Xaa Pro Xaa Asn Phe Ile His

435 440 445

Asn Asn Gly Ser Thr Phe Asp Xaa Val Xaa Thr Pro Xaa Gly Glu Cys

450 455 460

Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile

465 470 475 480

Asp Pro Ala Ala Leu His Cys Cys Xaa Arg Leu Lys Glu Glu Gln Trp

485 490 495

Glu Val Glu Asp Leu Xaa Xaa Glu Xaa Xaa Ser Leu Xaa Xaa Ser Arg

500 505 510

Xaa Xaa Xaa Xaa Gln Xaa Xaa Thr Val Xaa Ser Gly Pro Trp Glu Pro

515 520 525

Xaa Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Gln Xaa Arg Glu

530 535 540

Xaa Xaa Pro Ala Xaa Gln Xaa Xaa Pro Leu Leu Ser Cys Pro Ser Gln

545 550 555 560

Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser

565 570 575

Ser

<210> 9

<211> 371

<212> PRT

<213> 小鼠（Mus musculus）

<400> 9

Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys

1 5 10 15

Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Gly Gly Arg Ala Leu Pro

20 25 30

Leu Met Val Pro Gly Pro Arg Ala Ala Gly Ser Glu Ala Ser Gly Thr

35 40 45

Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu

50 55 60

Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala

65 70 75 80

Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val

85 90 95

Asp Leu Glu Glu Glu Asn His Lys Leu Gln Leu Glu Asn Gln Leu Leu

100 105 110

Arg Glu Lys Thr His Gly Leu Val Val Glu Asn Gln Glu Leu Arg Thr

115 120 125

Arg Leu Gly Met Asp Thr Leu Asp Pro Asp Glu Val Pro Glu Val Glu

130 135 140

Ala Lys Gly Ser Gly Val Arg Leu Val Ala Gly Ser Ala Glu Ser Ala

145 150 155 160

Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp

165 170 175

Ser Asp Thr Val Ala Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly

180 185 190

Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro

195 200 205

Glu Ser Ala Ser Leu Glu Glu Leu Pro Glu Val Tyr Pro Glu Gly Pro

210 215 220

Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala

225 230 235 240

Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr

245 250 255

Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn

260 265 270

Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp

275 280 285

His Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Leu Glu Asp Asp

290 295 300

Phe Ile Pro Glu Leu Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys

305 310 315 320

Leu Arg Pro Pro Ser Cys Leu Leu Asp Ala His Ser Asp Cys Gly Tyr

325 330 335

Glu Gly Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Thr

340 345 350

Asp His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu

355 360 365

Ile Ser Val

370

<210> 10

<211> 369

<212> PRT

<213> 黑线仓鼠（Cricetulus griseus）

<400> 10

Met Val Val Val Ala Ala Ser Pro Ser Ala Ala Thr Ala Ala Pro Lys

1 5 10 15

Val Leu Leu Leu Ser Gly Gln Pro Ala Ala Asp Gly Arg Ala Leu Pro

20 25 30

Leu Met Val Pro Gly Ser Arg Ala Ala Gly Ser Glu Ala Asn Gly Ala

35 40 45

Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu

50 55 60

Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala

65 70 75 80

Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val

85 90 95

Asp Leu Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu

100 105 110

Arg Glu Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr

115 120 125

Arg Leu Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu

130 135 140

Ser Lys Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala

145 150 155 160

Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp

165 170 175

Ser Asp Thr Val Asp Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly

180 185 190

Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro

195 200 205

Glu Ser Ala Asn Leu Glu Glu Leu Pro Glu Val Tyr Pro Gly Pro Ser

210 215 220

Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala Lys

225 230 235 240

Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr Lys

245 250 255

Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn Val

260 265 270

Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp His

275 280 285

Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Glu Glu Asp Phe Ile

290 295 300

Pro Glu Pro Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys Leu Lys

305 310 315 320

Pro Ser Ser Cys Leu Leu Asp Ala Tyr Ser Asp Cys Gly Tyr Glu Gly

325 330 335

Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Ile Asp His

340 345 350

Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu Ile Ser

355 360 365

Val

<210> 11

<211> 376

<212> PRT

<213> 智人（Homo sapiens）

<400> 11

Met Val Val Val Ala Ala Ala Pro Asn Pro Ala Asp Gly Thr Pro Lys

1 5 10 15

Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Ala Ala Gly Ala Pro Ala

20 25 30

Gly Gln Ala Leu Pro Leu Met Val Pro Ala Gln Arg Gly Ala Ser Pro

35 40 45

Glu Ala Ala Ser Gly Gly Leu Pro Gln Ala Arg Lys Arg Gln Arg Leu

50 55 60

Thr His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn

65 70 75 80

Arg Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Arg Met Ser

85 90 95

Glu Leu Glu Gln Gln Val Val Asp Leu Glu Glu Glu Asn Gln Lys Leu

100 105 110

Leu Leu Glu Asn Gln Leu Leu Arg Glu Lys Thr His Gly Leu Val Val

115 120 125

Glu Asn Gln Glu Leu Arg Gln Arg Leu Gly Met Asp Ala Leu Val Ala

130 135 140

Glu Glu Glu Ala Glu Ala Lys Gly Asn Glu Val Arg Pro Val Ala Gly

145 150 155 160

Ser Ala Glu Ser Ala Ala Gly Ala Gly Pro Val Val Thr Pro Pro Glu

165 170 175

His Leu Pro Met Asp Ser Gly Gly Ile Asp Ser Ser Asp Ser Glu Ser

180 185 190

Asp Ile Leu Leu Gly Ile Leu Asp Asn Leu Asp Pro Val Met Phe Phe

195 200 205

Lys Cys Pro Ser Pro Glu Pro Ala Ser Leu Glu Glu Leu Pro Glu Val

210 215 220

Tyr Pro Glu Gly Pro Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val

225 230 235 240

Gly Thr Ser Ser Ala Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe

245 250 255

Asp His Ile Tyr Thr Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr

260 265 270

Glu Ser Gln Ala Asn Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser

275 280 285

Pro Ser Glu Asn Asp His Pro Glu Phe Ile Val Ser Val Lys Glu Glu

290 295 300

Pro Val Glu Asp Asp Leu Val Pro Glu Leu Gly Ile Ser Asn Leu Leu

305 310 315 320

Ser Ser Ser His Cys Pro Lys Pro Ser Ser Cys Leu Leu Asp Ala Tyr

325 330 335

Ser Asp Cys Gly Tyr Gly Gly Ser Leu Ser Pro Phe Ser Asp Met Ser

340 345 350

Ser Leu Leu Gly Val Asn His Ser Trp Glu Asp Thr Phe Ala Asn Glu

355 360 365

Leu Phe Pro Gln Leu Ile Ser Val

370 375

<210> 12

<211> 383

<212> PRT

<213> 斑马鱼（Danio rerio）

<400> 12

Met Val Val Val Thr Ala Gly Thr Gly Gly Ala His Lys Val Leu Leu

1 5 10 15

Ile Ser Gly Lys Gln Ser Ala Ser Thr Gly Ala Thr Gln Gly Gly Tyr

20 25 30

Ser Arg Ser Ile Ser Val Met Ile Pro Asn Gln Ala Ser Ser Asp Ser

35 40 45

Asp Ser Thr Thr Ser Gly Pro Pro Leu Arg Lys Arg Gln Arg Leu Thr

50 55 60

His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg

65 70 75 80

Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Lys Met Gly Glu

85 90 95

Leu Glu Gln Gln Val Leu Glu Leu Glu Leu Glu Asn Gln Lys Leu His

100 105 110

Val Glu Asn Arg Leu Leu Arg Asp Lys Thr Ser Asp Leu Leu Ser Glu

115 120 125

Asn Glu Glu Leu Arg Gln Arg Leu Gly Leu Asp Thr Leu Glu Thr Lys

130 135 140

Glu Gln Val Gln Val Leu Glu Ser Ala Val Ser Asp Leu Gly Leu Val

145 150 155 160

Thr Gly Ser Ser Glu Ser Ala Ala Gly Ala Gly Pro Ala Val Pro Lys

165 170 175

Ser Glu Asp Phe Thr Met Asp Thr His Ser Pro Gly Pro Ala Asp Ser

180 185 190

Glu Ser Asp Leu Leu Leu Gly Ile Leu Asp Ile Leu Asp Pro Glu Leu

195 200 205

Phe Leu Lys Thr Asp Leu Pro Glu Ala Gln Glu Pro Gln Gln Glu Leu

210 215 220

Val Leu Val Gly Gly Ala Gly Glu Gln Val Pro Ser Ser Ala Pro Ala

225 230 235 240

Ala Leu Gly Pro Ala Pro Val Lys Leu Glu Ala Leu Asn Glu Leu Ile

245 250 255

His Phe Asp His Ile Tyr Thr Lys Pro Ala Glu Val Leu Val Ser Glu

260 265 270

Glu Ser Ile Cys Glu Val Lys Ala Glu Asp Ser Val Ala Phe Ser Glu

275 280 285

Thr Glu Glu Glu Ile Gln Val Glu Asp Gln Thr Val Ser Val Lys Asp

290 295 300

Glu Pro Glu Glu Val Val Ile Pro Ala Glu Asn Gln Asn Pro Asp Ala

305 310 315 320

Ala Asp Asp Phe Leu Ser Asp Thr Ser Phe Gly Gly Tyr Glu Lys Ala

325 330 335

Ser Tyr Leu Thr Asp Ala Tyr Ser Asp Ser Gly Tyr Glu Arg Ser Pro

340 345 350

Ser Pro Phe Ser Asn Ile Ser Ser Pro Leu Cys Ser Glu Gly Ser Trp

355 360 365

Asp Asp Met Phe Ala Ser Glu Leu Phe Pro Gln Leu Ile Ser Val

370 375 380

<210> 13

<211> 371

<212> PRT

<213> 人工的

<220>

<223> 共有序列

<220>

<221> MISC_FEATURE

<222> (7)..(7)

<223> A或S

<220>

<221> MISC_FEATURE

<222> (9)..(9)

<223> S或N

<220>

<221> MISC_FEATURE

<222> (10)..(10)

<223> A或P

<220>

<221> MISC_FEATURE

<222> (12)..(12)

<223> T或D

<220>

<221> MISC_FEATURE

<222> (13)..(13)

<223> A或G

<220>

<221> MISC_FEATURE

<222> (14)..(14)

<223> A或T

<220>

<221> MISC_FEATURE

<222> (26)..(26)

<223> S或A

<220>

<221> misc_feature

<222> (27)..(27)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (29)..(29)

<223> R或Q

<220>

<221> MISC_FEATURE

<222> (37)..(37)

<223> G或A

<220>

<221> misc_feature

<222> (38)..(38)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (40)..(40)

<223> A或G

<220>

<221> MISC_FEATURE

<222> (46)..(46)

<223> S或N或ASG

<220>

<221> MISC_FEATURE

<222> (48)..(48)

<223> T, A或L

<220>

<221> MISC_FEATURE

<222> (103)..(103)

<223> H或Q

<220>

<221> MISC_FEATURE

<222> (106)..(106)

<223> Q或L

<220>

<221> MISC_FEATURE

<222> (121)..(121)

<223> V或I

<220>

<221> MISC_FEATURE

<222> (128)..(128)

<223> T或Q

<220>

<221> MISC_FEATURE

<222> (134)..(134)

<223> T, V或A

<220>

<221> MISC_FEATURE

<222> (136)..(136)

<223> D, T或V

<220>

<221> MISC_FEATURE

<222> (137)..(137)

<223> P, T或A

<220>

<221> MISC_FEATURE

<222> (138)..(138)

<223> D或E

<220>

<221> MISC_FEATURE

<222> (140)..(140)

<223> V, A或无

<220>

<221> MISC_FEATURE

<222> (141)..(141)

<223> P或无

<220>

<221> MISC_FEATURE

<222> (143)..(143)

<223> V, T或A

<220>

<221> MISC_FEATURE

<222> (145)..(145)

<223> A或S

<220>

<221> MISC_FEATURE

<222> (148)..(148)

<223> S或N

<220>

<221> MISC_FEATURE

<222> (149)..(149)

<223> G或E

<220>

<221> MISC_FEATURE

<222> (152)..(152)

<223> L或P

<220>

<221> MISC_FEATURE

<222> (169)..(169)

<223> S或P

<220>

<221> MISC_FEATURE

<222> (178)..(178)

<223> D或G

<220>

<221> MISC_FEATURE

<222> (179)..(179)

<223> T或G

<220>

<221> MISC_FEATURE

<222> (180)..(180)

<223> V或I

<220>

<221> MISC_FEATURE

<222> (181)..(181)

<223> A或D

<220>

<221> MISC_FEATURE

<222> (196)..(196)

<223> K或N

<220>

<221> MISC_FEATURE

<222> (210)..(210)

<223> S或P

<220>

<221> MISC_FEATURE

<222> (212)..(212)

<223> S或N

<220>

<221> MISC_FEATURE

<222> (222)..(222)

<223> E或无

<220>

<221> MISC_FEATURE

<222> (254)..(254)

<223> V或I

<220>

<221> MISC_FEATURE

<222> (271)..(271)

<223> T或A

<220>

<221> MISC_FEATURE

<222> (284)..(284)

<223> S或P

<220>

<221> MISC_FEATURE

<222> (287)..(287)

<223> E或N

<220>

<221> MISC_FEATURE

<222> (298)..(298)

<223> K或E

<220>

<221> MISC_FEATURE

<222> (301)..(301)

<223> L, V或无

<220>

<221> MISC_FEATURE

<222> (303)..(303)

<223> D或E

<220>

<221> MISC_FEATURE

<222> (305)..(305)

<223> F或L

<220>

<221> MISC_FEATURE

<222> (306)..(306)

<223> I或V

<220>

<221> MISC_FEATURE

<222> (309)..(309)

<223> L或P

<220>

<221> MISC_FEATURE

<222> (321)..(321)

<223> L或P

<220>

<221> MISC_FEATURE

<222> (322)..(322)

<223> R或K

<220>

<221> MISC_FEATURE

<222> (324)..(324)

<223> P或S

<220>

<221> MISC_FEATURE

<222> (331)..(331)

<223> H或Y

<220>

<221> MISC_FEATURE

<222> (337)..(337)

<223> E或G

<220>

<221> MISC_FEATURE

<222> (340)..(340)

<223> P或L

<220>

<221> MISC_FEATURE

<222> (349)..(349)

<223> P或L

<220>

<221> MISC_FEATURE

<222> (352)..(352)

<223> T, I或V

<220>

<221> MISC_FEATURE

<222> (353)..(353)

<223> D或N

<400> 13

Met Val Val Val Ala Ala Xaa Pro Xaa Xaa Ala Xaa Xaa Xaa Pro Lys

1 5 10 15

Val Leu Leu Leu Ser Gly Gln Pro Ala Xaa Xaa Gly Arg Ala Leu Pro

20 25 30

Leu Met Val Pro Xaa Xaa Arg Xaa Ala Gly Ser Glu Ala Xaa Gly Xaa

35 40 45

Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu

50 55 60

Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala

65 70 75 80

Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val

85 90 95

Asp Leu Glu Glu Glu Asn Xaa Lys Leu Xaa Leu Glu Asn Gln Leu Leu

100 105 110

Arg Glu Lys Thr His Gly Leu Val Xaa Glu Asn Gln Glu Leu Arg Xaa

115 120 125

Arg Leu Gly Met Asp Xaa Leu Asp Xaa Xaa Glu Xaa Xaa Glu Xaa Glu

130 135 140

Xaa Lys Gly Xaa Xaa Val Arg Xaa Val Ala Gly Ser Ala Glu Ser Ala

145 150 155 160

Ala Gly Ala Gly Pro Val Val Thr Xaa Pro Glu His Leu Pro Met Asp

165 170 175

Ser Xaa Xaa Xaa Xaa Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly

180 185 190

Ile Leu Asp Xaa Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro

195 200 205

Glu Xaa Ala Xaa Leu Glu Glu Leu Pro Glu Val Tyr Pro Xaa Gly Pro

210 215 220

Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala

225 230 235 240

Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Xaa Tyr Thr

245 250 255

Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Xaa Asn

260 265 270

Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Xaa Ser Glu Xaa Asp

275 280 285

His Pro Glu Phe Ile Val Ser Val Lys Xaa Glu Pro Xaa Glu Xaa Asp

290 295 300

Xaa Xaa Pro Glu Xaa Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys

305 310 315 320

Xaa Xaa Pro Xaa Ser Cys Leu Leu Asp Ala Xaa Ser Asp Cys Gly Tyr

325 330 335

Xaa Gly Ser Xaa Ser Pro Phe Ser Asp Met Ser Ser Xaa Leu Gly Xaa

340 345 350

Xaa His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu

355 360 365

Ile Ser Val

370

<210> 14

<211> 7686

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 14

aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgat gccttttaga 60

ctcctgatac cattgggtct tgtttgcgtt ctcctccctc tccatcacgg cgccccaggt 120

ccagacggta ccgcacctga tcctgcccat taccgcgaac gcgttaaagc catgttctac 180

cacgcctatg actcctatct ggaaaatgca ttcccctatg atgagctccg accccttacc 240

tgcgatggtc atgatacttg gggctctttt tcccttaccc ttattgacgc tctggacaca 300

ctccttatcc tcggaaacac cagcgaattt caaagagtag ttgaagtact tcaggacaat 360

gtcgactttg acatcgatgt gaacgcatca gttttcgaaa caaatataag agtcgttgga 420

ggtctgctct ccgcccacct tctctctaaa aaagccggag tagaagttga agctggctgg 480

ccctgctccg gacccctcct tcgtatggct gaagaagctg cccgcaaact ccttcccgct 540

tttcagaccc caaccggtat gccctatggt actgttaacc tcctgcacgg agtaaatccc 600

ggcgaaaccc ccgtcacatg tacagccgga attggaacct ttattgtgga atttgcaacc 660

cttagcagcc tgaccggaga tcctgtattc gaagacgtgg ctcgggttgc cctgatgcga 720

ctgtgggaat ccaggtctga tatcggtctg gtcggtaacc atatagacgt actcactggt 780

aaatgggttg cacaagacgc tggaattggg gcaggcgtgg attcttattt tgaatatctc 840

gtaaaagggg ccatactctt gcaggacaaa aaacttatgg ctatgttcct ggaatataac 900

aaagctatta ggaactacac acacttcgat gattggtatt tgtgggtcca aatgtataaa 960

ggaaccgttt ctatgcctgt ctttcagtca ctggaggctt attggcctgg tctgcaatcc 1020

ctgatcggag acattgacaa tgcaatgagg acattcctta attattacac tgtttggaag 1080

cagttcggcg gattgcccga attttacaac attcctcaag gctatacagt tgaaaaaaga 1140

gaaggatatc ccctgcgccc cgagcttatt gaaagcgcta tgtatctgta tcgtgcaaca 1200

ggtgatccaa ccctgcttga actgggacga gacgccgtcg aatcaatcga gaaaatttca 1260

aaagtggaat gcggctttgc aacaattaaa gatcttagag accacaaact ggataatcgc 1320

atggagtcat tctttttggc tgagaccgtc aagtatctgt atctgctttt tcatcccaac 1380

aacttcatcc ataataacgg gtccaccttc gattcagtca tgacccctca cggtgaatgc 1440

atactcggag ctggaggcta tatttttaac actgaagctc acccaattga cccagctgcc 1500

cttcattgtt gtcgacgtct gaaagaagaa caatgggagg ttgaagattt gatcaaagaa 1560

ttttactcac ttaaacaaag tcgacctaaa cgcgcacaga gaaaaactgt aagatctggt 1620

ccttgggaac ctcagtccgg cccagcaact ctttcatccc ccgccaacca accacgagaa 1680

aaacaaccag cccaacagag aacccccctg ctcagctgcc cctctcagcc cttcacttca 1740

aaactcgccc tgcttggaca ggtgtttctg gactcctctt gatttaaaca cgcggccgct 1800

aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 1860

cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 1920

taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 1980

gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtaggg 2040

cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2100

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2160

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2220

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2280

cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg 2340

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2400

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2460

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2520

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 2580

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2640

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2700

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2760

ggattttggt catgggcgcg cctcatactc ctgcaggcat gagattatca aaaaggatct 2820

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 2880

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 2940

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 3000

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 3060

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 3120

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 3180

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 3240

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 3300

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 3360

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 3420

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 3480

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 3540

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 3600

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 3660

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 3720

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 3780

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3840

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtcaggtacc 3900

aagcctaggc ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggcagaggcg 3960

gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 4020

ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 4080

ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 4140

gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 4200

tttccacacc ggatccacca tgggatcggc cattgaacaa gatggattgc acgcaggttc 4260

tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 4320

ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 4380

cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 4440

cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 4500

gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 4560

gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 4620

cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 4680

tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 4740

cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 4800

ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 4860

gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 4920

gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 4980

gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaacgcgtg ctgtaagtct 5040

gcagaaattg atgatctatt aaacaataaa gatgtccact aaaatggaag tttttcctgt 5100

catactttgt taagaagggt gagaacagag tacctacatt ttgaatggaa ggattggagc 5160

tacgggggtg ggggtggggt gggattagat aaatgcctgc tctttactga aggctcttta 5220

ctattgcttt atgataatgt ttcatagttg gatatcataa tttaaacaag caaaaccaaa 5280

ttaagggcca gctcattcct cccactcatg atctatggat ctatagatct ctcgtgcagc 5340

tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 5400

gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 5460

ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 5520

ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 5580

ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 5640

gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 5700

tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 5760

gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagtcg 5820

cgaggcctcc gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg 5880

ctgccacgtc agacgaaggg cgcagcgagc gtcctgatcc ttccgcccgg acgctcagga 5940

cagcggcccg ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt 6000

taggacggga cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg 6060

aggaaaagta gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc 6120

gatgattata taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg 6180

ggtcgcggtt cttgtttgtg gatcgctgtg atcgtcactt ggtgagtagc gggctgctgg 6240

gctggccggg gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac 6300

cgccaagggc tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga 6360

gcgcagcaaa atggcggctg ttcccgagtc ttgaatggaa gacgcttgtg aggcgggctg 6420

tgaggtcgtt gaaacaaggt ggggggcatg gtgggcggca agaacccaag gtcttgaggc 6480

cttcgctaat gcgggaaagc tcttattcgg gtgagatggg ctggggcacc atctggggac 6540

cctgacgtga agtttgtcac tgactggaga actcggtttg tcgtctgttg cgggggcggc 6600

agttatggcg gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg ccctcgtcgt 6660

gtcgtgacgt cacccgttct gttggcttat aatgcagggt ggggccacct gccggtaggt 6720

gtgcggtagg cttttctccg tcgcaggacg cagggttcgg gcctagggta ggctctcctg 6780

aatcgacagg cgccggacct ctggtgaggg gagggataag tgaggcgtca gtttctttgg 6840

tcggttttat gtacctatct tcttaagtag ctgaagctcc ggttttgaac tatgcgctcg 6900

gggttggcga gtgtgttttg tgaagttttt taggcacctt ttgaaatgta atcatttggg 6960

tcaatatgta attttcagtg ttagactagt aaattgtccg ctaaattctg gccgtttttg 7020

gcttttttgt tagacgtcga ccgatcctga gaacttcagg gtgagtttgg ggacccttga 7080

ttgttctttc tttttcgcta ttgtaaaatt catgttatat ggagggggca aagttttcag 7140

ggtgttgttt agaatgggaa gatgtccctt gtatcaccat ggaccctcat gataattttg 7200

tttctttcac tttctactct gttgacaacc attgtctcct cttattttct tttcattttc 7260

tgtaactttt tcgttaaact ttagcttgca tttgtaacga atttttaaat tcacttttgt 7320

ttatttgtca gattgtaagt actttctcta atcacttttt tttcaaggca atcagggtat 7380

attatattgt acttcagcac agttttagag aacaattgtt ataattaaat gataaggtag 7440

aatatttctg catataaatt ctggctggcg tggaaatatt cttattggta gaaacaacta 7500

caccctggtc atcatcctgc ctttctcttt atggttacaa tgatatacac tgtttgagat 7560

gaggataaaa tactctgagt ccaaaccggg cccctctgct aaccatgttc atgccttctt 7620

ctctttccta cagctcctgg gcaacgtgct ggttgttgtg ctgtctcatc attttggcaa 7680

agaatt 7686

<210> 15

<211> 7257

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 15

aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgat gccttttaga 60

ctcctgatac cattgggtct tgtttgcgtt ctcctccctc tccatcacgg cgccccaggt 120

ccagacggta ccgcacctga tcctgcccat taccgcgaac gcgttaaagc catgttctac 180

cacgcctatg actcctatct ggaaaatgca ttcccctatg atgagctccg accccttacc 240

tgcgatggtc atgatacttg gggctctttt tcccttaccc ttattgacgc tctggacaca 300

ctccttatcc tcggaaacac cagcgaattt caaagagtag ttgaagtact tcaggacaat 360

gtcgactttg acatcgatgt gaacgcatca gttttcgaaa caaatataag agtcgttgga 420

ggtctgctct ccgcccacct tctctctaaa aaagccggag tagaagttga agctggctgg 480

ccctgctccg gacccctcct tcgtatggct gaagaagctg cccgcaaact ccttcccgct 540

tttcagaccc caaccggtat gccctatggt actgttaacc tcctgcacgg agtaaatccc 600

ggcgaaaccc ccgtcacatg tacagccgga attggaacct ttattgtgga atttgcaacc 660

cttagcagcc tgaccggaga tcctgtattc gaagacgtgg ctcgggttgc cctgatgcga 720

ctgtgggaat ccaggtctga tatcggtctg gtcggtaacc atatagacgt actcactggt 780

aaatgggttg cacaagacgc tggaattggg gcaggcgtgg attcttattt tgaatatctc 840

gtaaaagggg ccatactctt gcaggacaaa aaacttatgg ctatgttcct ggaatataac 900

aaagctatta ggaactacac acacttcgat gattggtatt tgtgggtcca aatgtataaa 960

ggaaccgttt ctatgcctgt ctttcagtca ctggaggctt attggcctgg tctgcaatcc 1020

ctgatcggag acattgacaa tgcaatgagg acattcctta attattacac tgtttggaag 1080

cagttcggcg gattgcccga attttacaac attcctcaag gctatacagt tgaaaaaaga 1140

gaaggatatc ccctgcgccc cgagcttatt gaaagcgcta tgtatctgta tcgtgcaaca 1200

ggtgatccaa ccctgcttga actgggacga gacgccgtcg aatcaatcga gaaaatttca 1260

aaagtggaat gcggctttgc aacaattaaa gatcttagag accacaaact ggataatcgc 1320

atggagtcat tctttttggc tgagaccgtc aagtatctgt atctgctttt tcatcccaac 1380

aacttcatcc ataataacgg gtccaccttc gattcagtca tgacccctca cggtgaatgc 1440

atactcggag ctggaggcta tatttttaac actgaagctc acccaattga cccagctgcc 1500

cttcattgtt gtcgacgtct gaaagaagaa caatgggagg ttgaagattt gatcaaagaa 1560

ttttactcac ttaaacaaag tcgacctaaa cgcgcacaga gaaaaactgt aagatctggt 1620

ccttgggaac ctcagtccgg cccagcaact ctttcatccc ccgccaacca accacgagaa 1680

aaacaaccag cccaacagag aacccccctg ctcagctgcc cctctcagcc cttcacttca 1740

aaactcgccc tgcttggaca ggtgtttctg gactcctctt gatttaaaca cgcggccgct 1800

aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 1860

cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 1920

taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 1980

gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtaggg 2040

cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2100

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2160

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2220

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2280

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 2340

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2400

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2460

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2520

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 2580

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2640

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2700

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2760

ggattttggt catgggcgcg cctcatactc ctgcaggcat gagattatca aaaaggatct 2820

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 2880

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 2940

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 3000

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 3060

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 3120

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 3180

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 3240

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 3300

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 3360

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 3420

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 3480

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 3540

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 3600

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 3660

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 3720

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 3780

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3840

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtcaggtacc 3900

aagcctaggc ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggcagaggcg 3960

gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 4020

ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 4080

ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 4140

gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 4200

tttccacacc ggatccacca tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg 4260

cgacgtcgcc ggagcggtcg agttctggac cgaccggctc gggttctccc gggacttcgt 4320

ggaggacgac ttcgccggtg tggtccggga cgacgtgacc ctgttcatca gcgcggtcca 4380

ggaccaggtg gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct 4440

gtacgccgag tggtcggagg tcgtgtccac gaacttccgg gacgcctccg ggccggccat 4500

gaccgagatc ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa 4560

ctgcgtgcac ttcgtggccg aggagcagga ctgaacgcgt gctgtaagtc tgcagaaatt 4620

gatgatctat taaacaataa agatgtccac taaaatggaa gtttttcctg tcatactttg 4680

ttaagaaggg tgagaacaga gtacctacat tttgaatgga aggattggag ctacgggggt 4740

gggggtgggg tgggattaga taaatgcctg ctctttactg aaggctcttt actattgctt 4800

tatgataatg tttcatagtt ggatatcata atttaaacaa gcaaaaccaa attaagggcc 4860

agctcattcc tcccactcat gatctatgga tctatagatc tctcgtgcag ctggggctct 4920

agggggtatc cccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 4980

cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5040

tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5100

gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5160

tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5220

ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5280

tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5340

taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg tcagttagtc gcgaggcctc 5400

cgcgccgggt tttggcgcct cccgcgggcg cccccctcct cacggcgagc gctgccacgt 5460

cagacgaagg gcgcagcgag cgtcctgatc cttccgcccg gacgctcagg acagcggccc 5520

gctgctcata agactcggcc ttagaacccc agtatcagca gaaggacatt ttaggacggg 5580

acttgggtga ctctagggca ctggttttct ttccagagag cggaacaggc gaggaaaagt 5640

agtcccttct cggcgattct gcggagggat ctccgtgggg cggtgaacgc cgatgattat 5700

ataaggacgc gccgggtgtg gcacagctag ttccgtcgca gccgggattt gggtcgcggt 5760

tcttgtttgt ggatcgctgt gatcgtcact tggtgagtag cgggctgctg ggctggccgg 5820

ggctttcgtg gccgccgggc cgctcggtgg gacggaagcg tgtggagaga ccgccaaggg 5880

ctgtagtctg ggtccgcgag caaggttgcc ctgaactggg ggttgggggg agcgcagcaa 5940

aatggcggct gttcccgagt cttgaatgga agacgcttgt gaggcgggct gtgaggtcgt 6000

tgaaacaagg tggggggcat ggtgggcggc aagaacccaa ggtcttgagg ccttcgctaa 6060

tgcgggaaag ctcttattcg ggtgagatgg gctggggcac catctgggga ccctgacgtg 6120

aagtttgtca ctgactggag aactcggttt gtcgtctgtt gcgggggcgg cagttatggc 6180

ggtgccgttg ggcagtgcac ccgtaccttt gggagcgcgc gccctcgtcg tgtcgtgacg 6240

tcacccgttc tgttggctta taatgcaggg tggggccacc tgccggtagg tgtgcggtag 6300

gcttttctcc gtcgcaggac gcagggttcg ggcctagggt aggctctcct gaatcgacag 6360

gcgccggacc tctggtgagg ggagggataa gtgaggcgtc agtttctttg gtcggtttta 6420

tgtacctatc ttcttaagta gctgaagctc cggttttgaa ctatgcgctc ggggttggcg 6480

agtgtgtttt gtgaagtttt ttaggcacct tttgaaatgt aatcatttgg gtcaatatgt 6540

aattttcagt gttagactag taaattgtcc gctaaattct ggccgttttt ggcttttttg 6600

ttagacgtcg accgatcctg agaacttcag ggtgagtttg gggacccttg attgttcttt 6660

ctttttcgct attgtaaaat tcatgttata tggagggggc aaagttttca gggtgttgtt 6720

tagaatggga agatgtccct tgtatcacca tggaccctca tgataatttt gtttctttca 6780

ctttctactc tgttgacaac cattgtctcc tcttattttc ttttcatttt ctgtaacttt 6840

ttcgttaaac tttagcttgc atttgtaacg aatttttaaa ttcacttttg tttatttgtc 6900

agattgtaag tactttctct aatcactttt ttttcaaggc aatcagggta tattatattg 6960

tacttcagca cagttttaga gaacaattgt tataattaaa tgataaggta gaatatttct 7020

gcatataaat tctggctggc gtggaaatat tcttattggt agaaacaact acaccctggt 7080

catcatcctg cctttctctt tatggttaca atgatataca ctgtttgaga tgaggataaa 7140

atactctgag tccaaaccgg gcccctctgc taaccatgtt catgccttct tctctttcct 7200

acagctcctg ggcaacgtgc tggttgttgt gctgtctcat cattttggca aagaatt 7257

<210> 16

<211> 3892

<212> DNA

<213> 人工的

<220>

<223> 合成的构建体

<400> 16

aggcctccgc gccgggtttt ggcgcctccc gcgggcgccc ccctcctcac ggcgagcgct 60

gccacgtcag acgaagggcg cagcgagcgt cctgatcctt ccgcccggac gctcaggaca 120

gcggcccgct gctcataaga ctcggcctta gaaccccagt atcagcagaa ggacatttta 180

ggacgggact tgggtgactc tagggcactg gttttctttc cagagagcgg aacaggcgag 240

gaaaagtagt cccttctcgg cgattctgcg gagggatctc cgtggggcgg tgaacgccga 300

tgattatata aggacgcgcc gggtgtggca cagctagttc cgtcgcagcc gggatttggg 360

tcgcggttct tgtttgtgga tcgctgtgat cgtcacttgg tgagtagcgg gctgctgggc 420

tggccggggc tttcgtggcc gccgggccgc tcggtgggac ggaagcgtgt ggagagaccg 480

ccaagggctg tagtctgggt ccgcgagcaa ggttgccctg aactgggggt tggggggagc 540

gcagcaaaat ggcggctgtt cccgagtctt gaatggaaga cgcttgtgag gcgggctgtg 600

aggtcgttga aacaaggtgg ggggcatggt gggcggcaag aacccaaggt cttgaggcct 660

tcgctaatgc gggaaagctc ttattcgggt gagatgggct ggggcaccat ctggggaccc 720

tgacgtgaag tttgtcactg actggagaac tcggtttgtc gtctgttgcg ggggcggcag 780

ttatggcggt gccgttgggc agtgcacccg tacctttggg agcgcgcgcc ctcgtcgtgt 840

cgtgacgtca cccgttctgt tggcttataa tgcagggtgg ggccacctgc cggtaggtgt 900

gcggtaggct tttctccgtc gcaggacgca gggttcgggc ctagggtagg ctctcctgaa 960

tcgacaggcg ccggacctct ggtgagggga gggataagtg aggcgtcagt ttctttggtc 1020

ggttttatgt acctatcttc ttaagtagct gaagctccgg ttttgaacta tgcgctcggg 1080

gttggcgagt gtgttttgtg aagtttttta ggcacctttt gaaatgtaat catttgggtc 1140

aatatgtaat tttcagtgtt agactagtaa attgtccgct aaattctggc cgtttttggc 1200

ttttttgtta gacgtcgacc gatcctgaga acttcagggt gagtttgggg acccttgatt 1260

gttctttctt tttcgctatt gtaaaattca tgttatatgg agggggcaaa gttttcaggg 1320

tgttgtttag aatgggaaga tgtcccttgt atcaccatgg accctcatga taattttgtt 1380

tctttcactt tctactctgt tgacaaccat tgtctcctct tattttcttt tcattttctg 1440

taactttttc gttaaacttt agcttgcatt tgtaacgaat ttttaaattc acttttgttt 1500

atttgtcaga ttgtaagtac tttctctaat cacttttttt tcaaggcaat cagggtatat 1560

tatattgtac ttcagcacag ttttagagaa caattgttat aattaaatga taaggtagaa 1620

tatttctgca tataaattct ggctggcgtg gaaatattct tattggtaga aacaactaca 1680

ccctggtcat catcctgcct ttctctttat ggttacaatg atatacactg tttgagatga 1740

ggataaaata ctctgagtcc aaaccgggcc cctctgctaa ccatgttcat gccttcttct 1800

ctttcctaca gctcctgggc aacgtgctgg ttgttgtgct gtctcatcat tttggcaaag 1860

aattaagctt atactcgagc tctagattgg gaacccgggt ctctcgaatt cgatgccttt 1920

tagactcctg ataccattgg gtcttgtttg cgttctcctc cctctccatc acggcgcccc 1980

aggtccagac ggtaccgcac ctgatcctgc ccattaccgc gaacgcgtta aagccatgtt 2040

ctaccacgcc tatgactcct atctggaaaa tgcattcccc tatgatgagc tccgacccct 2100

tacctgcgat ggtcatgata cttggggctc tttttccctt acccttattg acgctctgga 2160

cacactcctt atcctcggaa acaccagcga atttcaaaga gtagttgaag tacttcagga 2220

caatgtcgac tttgacatcg atgtgaacgc atcagttttc gaaacaaata taagagtcgt 2280

tggaggtctg ctctccgccc accttctctc taaaaaagcc ggagtagaag ttgaagctgg 2340

ctggccctgc tccggacccc tccttcgtat ggctgaagaa gctgcccgca aactccttcc 2400

cgcttttcag accccaaccg gtatgcccta tggtactgtt aacctcctgc acggagtaaa 2460

tcccggcgaa acccccgtca catgtacagc cggaattgga acctttattg tggaatttgc 2520

aacccttagc agcctgaccg gagatcctgt attcgaagac gtggctcggg ttgccctgat 2580

gcgactgtgg gaatccaggt ctgatatcgg tctggtcggt aaccatatag acgtactcac 2640

tggtaaatgg gttgcacaag acgctggaat tggggcaggc gtggattctt attttgaata 2700

tctcgtaaaa ggggccatac tcttgcagga caaaaaactt atggctatgt tcctggaata 2760

taacaaagct attaggaact acacacactt cgatgattgg tatttgtggg tccaaatgta 2820

taaaggaacc gtttctatgc ctgtctttca gtcactggag gcttattggc ctggtctgca 2880

atccctgatc ggagacattg acaatgcaat gaggacattc cttaattatt acactgtttg 2940

gaagcagttc ggcggattgc ccgaatttta caacattcct caaggctata cagttgaaaa 3000

aagagaagga tatcccctgc gccccgagct tattgaaagc gctatgtatc tgtatcgtgc 3060

aacaggtgat ccaaccctgc ttgaactggg acgagacgcc gtcgaatcaa tcgagaaaat 3120

ttcaaaagtg gaatgcggct ttgcaacaat taaagatctt agagaccaca aactggataa 3180

tcgcatggag tcattctttt tggctgagac cgtcaagtat ctgtatctgc tttttcatcc 3240

caacaacttc atccataata acgggtccac cttcgattca gtcatgaccc ctcacggtga 3300

atgcatactc ggagctggag gctatatttt taacactgaa gctcacccaa ttgacccagc 3360

tgcccttcat tgttgtcgac gtctgaaaga agaacaatgg gaggttgaag atttgatcaa 3420

agaattttac tcacttaaac aaagtcgacc taaacgcgca cagagaaaaa ctgtaagatc 3480

tggtccttgg gaacctcagt ccggcccagc aactctttca tcccccgcca accaaccacg 3540

agaaaaacaa ccagcccaac agagaacccc cctgctcagc tgcccctctc agcccttcac 3600

ttcaaaactc gccctgcttg gacaggtgtt tctggactcc tcttgattta aacacgcggc 3660

cgctaatcag ccataccaca tttgtagagg ttttacttgc tttaaaaaac ctcccacacc 3720

tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag 3780

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 3840

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gt 3892

<210> 17

<211> 6629

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 17

aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcatg gtggtggtgg 60

ctgctgctcc ttctgctgct acagctgctc ctaaggtgct gctgctgtct ggacagcctg 120

cttctggagg aagagctctg cctctgatgg tgcctggacc tagagctgct ggatctgagg 180

cttctggaac acctcaggct agaaagagac agagactgac acatctgtct cctgaagaaa 240

aggctctgag aagaaagctg aagaatagag tggctgctca gacagctaga gatagaaaga 300

aggctagaat gtctgaactg gaacagcagg tggtggatct ggaagaagaa aatcataagc 360

tgcagctgga aaatcagctg ctgagagaaa agacacatgg actggtggtg gaaaatcagg 420

aactgagaac aagactggga atggatacac tggatcctga tgaagtgcct gaagtggaag 480

ctaagggatc tggagtgaga ctggtggctg gatctgctga atctgctgct ggagctggac 540

ctgtggtgac atctcctgaa catctgccta tggattctga tacagtggct tcttctgatt 600

ctgaatctga tatcctgctg ggaatcctgg ataagctgga tcctgtgatg ttttttaagt 660

gtccttctcc tgaatctgct tctctggaag aactgcctga agtgtatcct gaaggacctt 720

cttctctgcc tgcttctctg tctctgtctg tgggaacatc ttctgctaag ctggaagcta 780

tcaatgaact gatcagattt gatcatgtgt atacaaagcc tctggtgctg gaaatccctt 840

ctgaaacaga atctcagaca aatgtggtgg tgaagatcga agaagctcct ctgtcttctt 900

ctgaagaaga tcatcctgaa tttatcgtgt ctgtgaagaa ggaacctctg gaagatgatt 960

ttatccctga actgggaatc tctaatctgc tgtcttcttc tcattgtctg agacctcctt 1020

cttgtctgct ggatgctcat tctgattgtg gatatgaagg atctccttct cctttttctg 1080

atatgtcttc tcctctggga acagatcatt cttgggaaga tacatttgct aatgaactgt 1140

ttcctcagct gatctctgtg tgagcggccg ctaatcagcc ataccacatt tgtagaggtt 1200

ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca 1260

attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 1320

acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 1380

atcaatgtat cttatcatgt ctaccggtag ggcccctctc ttcatgtgag caaaaggcca 1440

gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1500

ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1560

ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1620

gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1680

ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1740

cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1800

cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1860

gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1920

aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1980

tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 2040

gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2100

tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgggcg cgcctcatac 2160

tcctgcaggc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 2220

aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 2280

aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 2340

ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 2400

gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 2460

aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 2520

ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 2580

tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 2640

ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 2700

cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 2760

agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 2820

gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 2880

gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 2940

acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 3000

acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 3060

agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 3120

aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 3180

gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 3240

tccccgaaaa gtgccacctg acgtcaggta ccaagcctag gcctccaaaa aagcctcctc 3300

actacttctg gaatagctca gaggcagagg cggcctcggc ctctgcataa ataaaaaaaa 3360

ttagtcagcc atggggcgga gaatgggcgg aactgggcgg agttaggggc gggatgggcg 3420

gagttagggg cgggactatg gttgctgact aattgagatg catgctttgc atacttctgc 3480

ctgctgggga gcctggggac tttccacacc tggttgctga ctaattgaga tgcatgcttt 3540

gcatacttct gcctgctggg gagcctgggg actttccaca ccggatccac catggccaag 3600

ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg 3660

accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg 3720

gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg 3780

gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc 3840

acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg 3900

cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag 3960

gactgaacgc gtgctgtaag tctgcagaaa ttgatgatct attaaacaat aaagatgtcc 4020

actaaaatgg aagtttttcc tgtcatactt tgttaagaag ggtgagaaca gagtacctac 4080

attttgaatg gaaggattgg agctacgggg gtgggggtgg ggtgggatta gataaatgcc 4140

tgctctttac tgaaggctct ttactattgc tttatgataa tgtttcatag ttggatatca 4200

taatttaaac aagcaaaacc aaattaaggg ccagctcatt cctcccactc atgatctatg 4260

gatctataga tctctcgtgc agctggggct ctagggggta tccccacgcg ccctgtagcg 4320

gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 4380

ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4440

cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4500

tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4560

cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4620

ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4680

tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattaattct 4740

gtggaatgtg tgtcagttag tcgcgaggcc tccgcgccgg gttttggcgc ctcccgcggg 4800

cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg agcgtcctga 4860

tccttccgcc cggacgctca ggacagcggc ccgctgctca taagactcgg ccttagaacc 4920

ccagtatcag cagaaggaca ttttaggacg ggacttgggt gactctaggg cactggtttt 4980

ctttccagag agcggaacag gcgaggaaaa gtagtccctt ctcggcgatt ctgcggaggg 5040

atctccgtgg ggcggtgaac gccgatgatt atataaggac gcgccgggtg tggcacagct 5100

agttccgtcg cagccgggat ttgggtcgcg gttcttgttt gtggatcgct gtgatcgtca 5160

cttggtgagt agcgggctgc tgggctggcc ggggctttcg tggccgccgg gccgctcggt 5220

gggacggaag cgtgtggaga gaccgccaag ggctgtagtc tgggtccgcg agcaaggttg 5280

ccctgaactg ggggttgggg ggagcgcagc aaaatggcgg ctgttcccga gtcttgaatg 5340

gaagacgctt gtgaggcggg ctgtgaggtc gttgaaacaa ggtggggggc atggtgggcg 5400

gcaagaaccc aaggtcttga ggccttcgct aatgcgggaa agctcttatt cgggtgagat 5460

gggctggggc accatctggg gaccctgacg tgaagtttgt cactgactgg agaactcggt 5520

ttgtcgtctg ttgcgggggc ggcagttatg gcggtgccgt tgggcagtgc acccgtacct 5580

ttgggagcgc gcgccctcgt cgtgtcgtga cgtcacccgt tctgttggct tataatgcag 5640

ggtggggcca cctgccggta ggtgtgcggt aggcttttct ccgtcgcagg acgcagggtt 5700

cgggcctagg gtaggctctc ctgaatcgac aggcgccgga cctctggtga ggggagggat 5760

aagtgaggcg tcagtttctt tggtcggttt tatgtaccta tcttcttaag tagctgaagc 5820

tccggttttg aactatgcgc tcggggttgg cgagtgtgtt ttgtgaagtt ttttaggcac 5880

cttttgaaat gtaatcattt gggtcaatat gtaattttca gtgttagact agtaaattgt 5940

ccgctaaatt ctggccgttt ttggcttttt tgttagacgt cgaccgatcc tgagaacttc 6000

agggtgagtt tggggaccct tgattgttct ttctttttcg ctattgtaaa attcatgtta 6060

tatggagggg gcaaagtttt cagggtgttg tttagaatgg gaagatgtcc cttgtatcac 6120

catggaccct catgataatt ttgtttcttt cactttctac tctgttgaca accattgtct 6180

cctcttattt tcttttcatt ttctgtaact ttttcgttaa actttagctt gcatttgtaa 6240

cgaattttta aattcacttt tgtttatttg tcagattgta agtactttct ctaatcactt 6300

ttttttcaag gcaatcaggg tatattatat tgtacttcag cacagtttta gagaacaatt 6360

gttataatta aatgataagg tagaatattt ctgcatataa attctggctg gcgtggaaat 6420

attcttattg gtagaaacaa ctacaccctg gtcatcatcc tgcctttctc tttatggtta 6480

caatgatata cactgtttga gatgaggata aaatactctg agtccaaacc gggcccctct 6540

gctaaccatg ttcatgcctt cttctctttc ctacagctcc tgggcaacgt gctggttgtt 6600

gtgctgtctc atcattttgg caaagaatt 6629

<210> 18

<211> 3264

<212> DNA

<213> 人工的

<220>

<223> 合成的构建体

<400> 18

ggcctccgcg ccgggttttg gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg 60

ccacgtcaga cgaagggcgc agcgagcgtc ctgatccttc cgcccggacg ctcaggacag 120

cggcccgctg ctcataagac tcggccttag aaccccagta tcagcagaag gacattttag 180

gacgggactt gggtgactct agggcactgg ttttctttcc agagagcgga acaggcgagg 240

aaaagtagtc ccttctcggc gattctgcgg agggatctcc gtggggcggt gaacgccgat 300

gattatataa ggacgcgccg ggtgtggcac agctagttcc gtcgcagccg ggatttgggt 360

cgcggttctt gtttgtggat cgctgtgatc gtcacttggt gagtagcggg ctgctgggct 420

ggccggggct ttcgtggccg ccgggccgct cggtgggacg gaagcgtgtg gagagaccgc 480

caagggctgt agtctgggtc cgcgagcaag gttgccctga actgggggtt ggggggagcg 540

cagcaaaatg gcggctgttc ccgagtcttg aatggaagac gcttgtgagg cgggctgtga 600

ggtcgttgaa acaaggtggg gggcatggtg ggcggcaaga acccaaggtc ttgaggcctt 660

cgctaatgcg ggaaagctct tattcgggtg agatgggctg gggcaccatc tggggaccct 720

gacgtgaagt ttgtcactga ctggagaact cggtttgtcg tctgttgcgg gggcggcagt 780

tatggcggtg ccgttgggca gtgcacccgt acctttggga gcgcgcgccc tcgtcgtgtc 840

gtgacgtcac ccgttctgtt ggcttataat gcagggtggg gccacctgcc ggtaggtgtg 900

cggtaggctt ttctccgtcg caggacgcag ggttcgggcc tagggtaggc tctcctgaat 960

cgacaggcgc cggacctctg gtgaggggag ggataagtga ggcgtcagtt tctttggtcg 1020

gttttatgta cctatcttct taagtagctg aagctccggt tttgaactat gcgctcgggg 1080

ttggcgagtg tgttttgtga agttttttag gcaccttttg aaatgtaatc atttgggtca 1140

atatgtaatt ttcagtgtta gactagtaaa ttgtccgcta aattctggcc gtttttggct 1200

tttttgttag acgtcgaccg atcctgagaa cttcagggtg agtttgggga cccttgattg 1260

ttctttcttt ttcgctattg taaaattcat gttatatgga gggggcaaag ttttcagggt 1320

gttgtttaga atgggaagat gtcccttgta tcaccatgga ccctcatgat aattttgttt 1380

ctttcacttt ctactctgtt gacaaccatt gtctcctctt attttctttt cattttctgt 1440

aactttttcg ttaaacttta gcttgcattt gtaacgaatt tttaaattca cttttgttta 1500

tttgtcagat tgtaagtact ttctctaatc actttttttt caaggcaatc agggtatatt 1560

atattgtact tcagcacagt tttagagaac aattgttata attaaatgat aaggtagaat 1620

atttctgcat ataaattctg gctggcgtgg aaatattctt attggtagaa acaactacac 1680

cctggtcatc atcctgcctt tctctttatg gttacaatga tatacactgt ttgagatgag 1740

gataaaatac tctgagtcca aaccgggccc ctctgctaac catgttcatg ccttcttctc 1800

tttcctacag ctcctgggca acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga 1860

attaagctta tactcgagct ctagattggg aacccgggtc tctcgaattc atggtggtgg 1920

tggctgctgc tccttctgct gctacagctg ctcctaaggt gctgctgctg tctggacagc 1980

ctgcttctgg aggaagagct ctgcctctga tggtgcctgg acctagagct gctggatctg 2040

aggcttctgg aacacctcag gctagaaaga gacagagact gacacatctg tctcctgaag 2100

aaaaggctct gagaagaaag ctgaagaata gagtggctgc tcagacagct agagatagaa 2160

agaaggctag aatgtctgaa ctggaacagc aggtggtgga tctggaagaa gaaaatcata 2220

agctgcagct ggaaaatcag ctgctgagag aaaagacaca tggactggtg gtggaaaatc 2280

aggaactgag aacaagactg ggaatggata cactggatcc tgatgaagtg cctgaagtgg 2340

aagctaaggg atctggagtg agactggtgg ctggatctgc tgaatctgct gctggagctg 2400

gacctgtggt gacatctcct gaacatctgc ctatggattc tgatacagtg gcttcttctg 2460

attctgaatc tgatatcctg ctgggaatcc tggataagct ggatcctgtg atgtttttta 2520

agtgtccttc tcctgaatct gcttctctgg aagaactgcc tgaagtgtat cctgaaggac 2580

cttcttctct gcctgcttct ctgtctctgt ctgtgggaac atcttctgct aagctggaag 2640

ctatcaatga actgatcaga tttgatcatg tgtatacaaa gcctctggtg ctggaaatcc 2700

cttctgaaac agaatctcag acaaatgtgg tggtgaagat cgaagaagct cctctgtctt 2760

cttctgaaga agatcatcct gaatttatcg tgtctgtgaa gaaggaacct ctggaagatg 2820

attttatccc tgaactggga atctctaatc tgctgtcttc ttctcattgt ctgagacctc 2880

cttcttgtct gctggatgct cattctgatt gtggatatga aggatctcct tctccttttt 2940

ctgatatgtc ttctcctctg ggaacagatc attcttggga agatacattt gctaatgaac 3000

tgtttcctca gctgatctct gtgtgagcgg ccgctaatca gccataccac atttgtagag 3060

gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat 3120

gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 3180

atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 3240

ctcatcaatg tatcttatca tgtc 3264

<210> 19

<211> 447

<212> PRT

<213> 智人（Homo sapiens）

<400> 19

Glu Val Gln Val Leu Glu Ser Gly Gly Asp Leu Val Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ala Tyr

20 25 30

Ala Met Thr Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45

Ser Ala Ile Ser Gly Ser Gly Gly Ser Ala Tyr Tyr Ala Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr

65 70 75 80

Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Lys Asp Gly Ala Trp Lys Met Ser Gly Leu Asp Val Trp Gly Gln

100 105 110

Gly Thr Thr Val Ile Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val

115 120 125

Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala

130 135 140

Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser

145 150 155 160

Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val

165 170 175

Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro

180 185 190

Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp His Lys

195 200 205

Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr Gly Pro

210 215 220

Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser Val

225 230 235 240

Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr

245 250 255

Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu

260 265 270

Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys

275 280 285

Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser

290 295 300

Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys

305 310 315 320

Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile

325 330 335

Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro

340 345 350

Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu

355 360 365

Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn

370 375 380

Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser

385 390 395 400

Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg

405 410 415

Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu

420 425 430

His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Lys

435 440 445

<210> 20

<211> 110

<212> PRT

<213> 智人（Homo sapiens）

<400> 20

Glu Ser Gly Gly Asp Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser

1 5 10 15

Cys Ala Ala Ser Gly Phe Thr Phe Ser Ala Tyr Ala Met Thr Trp Val

20 25 30

Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Ser Gly

35 40 45

Ser Gly Gly Ser Ala Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr

50 55 60

Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr Leu Gln Met Asn Ser

65 70 75 80

Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Asp Gly Ala

85 90 95

Trp Lys Met Ser Gly Leu Asp Val Trp Gly Gln Gly Thr Thr

100 105 110

<210> 21

<211> 214

<212> PRT

<213> 智人（Homo sapiens）

<400> 21

Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Ile Ser Asp Tyr

20 25 30

Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ile Pro Arg Leu Leu Ile

35 40 45

Tyr Thr Thr Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Arg Gly

50 55 60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro

65 70 75 80

Glu Asp Val Ala Thr Tyr Tyr Cys Gln Lys Tyr Asp Ser Ala Pro Leu

85 90 95

Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala

100 105 110

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

115 120 125

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

130 135 140

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

145 150 155 160

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

165 170 175

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

180 185 190

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

195 200 205

Phe Asn Arg Gly Glu Cys

210

<210> 22

<211> 100

<212> PRT

<213> 智人（Homo sapiens）

<400> 22

Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile

1 5 10 15

Thr Cys Arg Ala Ser Gln Asp Ile Ser Asp Tyr Leu Ala Trp Tyr Gln

20 25 30

Gln Lys Pro Gly Lys Ile Pro Arg Leu Leu Ile Tyr Thr Thr Ser Thr

35 40 45

Leu Gln Ser Gly Val Pro Ser Arg Phe Arg Gly Ser Gly Ser Gly Thr

50 55 60

Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr

65 70 75 80

Tyr Tyr Cys Gln Lys Tyr Asp Ser Ala Pro Leu Thr Phe Gly Gly Gly

85 90 95

Thr Lys Val Glu

100

<210> 23

<211> 2971

<212> DNA

<213> 人工的

<220>

<223> 合成的构建体

<400> 23

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600

atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660

taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720

gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780

gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840

gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900

ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960

tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020

gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080

tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140

aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200

acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260

ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320

cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380

gctgatgcag aggtgcaggt gttggagtct gggggagact tggtacagcc tggggggtcc 1440

ctgagactct cctgtgcagc ctctggattc acctttagtg cctatgccat gacctgggtc 1500

cgccaggctc cagggaaggg gctggagtgg gtctcagcta ttagtggtag tggtggtagc 1560

gcatactacg cagactccgt gaagggccgg ttcaccatct ccagagacaa ttccaagaac 1620

acggtatatc tgcagatgaa cagcctgaga gccgaggaca cggccgtata ttactgtgcg 1680

aaagatgggg cctggaaaat gtccggtttg gacgtctggg gccaagggac cacggtcatc 1740

gtctcctcag cctccaccaa gggcccatcg gtcttccccc tggcgccctg ctccaggagc 1800

acctccgaga gcacagccgc cctgggctgc ctggtcaagg actacttccc cgaaccggtg 1860

acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 1920

cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 1980

acgaagacct acacctgcaa cgtagatcac aagcccagca acaccaaggt ggacaagaga 2040

gttgagtcca aatatggtcc cccatgccca ccctgcccag cacctgagtt cctgggggga 2100

ccatcagtct tcctgttccc cccaaaaccc aaggacactc tcatgatctc ccggacccct 2160

gaggtcacgt gcgtggtggt ggacgtgagc caggaagacc ccgaggtcca gttcaactgg 2220

tacgtggatg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga gcagttcaac 2280

agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct gaacggcaag 2340

gagtacaagt gcaaggtctc caacaaaggc ctcccgtcct ccatcgagaa aaccatctcc 2400

aaagccaaag ggcagccccg agagccacag gtgtacaccc tgcccccatc ccaggaggag 2460

atgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctaccc cagcgacatc 2520

gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg 2580

ctggactccg acggctcctt cttcctctac agcaggctca ccgtggacaa gagcaggtgg 2640

caggagggga atgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacaca 2700

cagaagtccc tctccctgtc tctgggtaaa tgagcggccg ctaatcagcc ataccacatt 2760

tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa 2820

aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag 2880

caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 2940

gtccaaactc atcaatgtat cttatcatgt c 2971

<210> 24

<211> 7013

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 24

tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60

cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120

caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180

gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240

tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300

ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360

attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420

gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480

ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540

aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600

tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660

ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720

tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780

ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840

ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900

tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960

attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020

ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080

tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140

taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200

tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260

taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320

atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380

ctcctggctg cacgtggtgc tgatgcagag gtgcaggtgt tggagtctgg gggagacttg 1440

gtacagcctg gggggtccct gagactctcc tgtgcagcct ctggattcac ctttagtgcc 1500

tatgccatga cctgggtccg ccaggctcca gggaaggggc tggagtgggt ctcagctatt 1560

agtggtagtg gtggtagcgc atactacgca gactccgtga agggccggtt caccatctcc 1620

agagacaatt ccaagaacac ggtatatctg cagatgaaca gcctgagagc cgaggacacg 1680

gccgtatatt actgtgcgaa agatggggcc tggaaaatgt ccggtttgga cgtctggggc 1740

caagggacca cggtcatcgt ctcctcagcc tccaccaagg gcccatcggt cttccccctg 1800

gcgccctgct ccaggagcac ctccgagagc acagccgccc tgggctgcct ggtcaaggac 1860

tacttccccg aaccggtgac ggtgtcgtgg aactcaggcg ccctgaccag cggcgtgcac 1920

accttcccgg ctgtcctaca gtcctcagga ctctactccc tcagcagcgt ggtgaccgtg 1980

ccctccagca gcttgggcac gaagacctac acctgcaacg tagatcacaa gcccagcaac 2040

accaaggtgg acaagagagt tgagtccaaa tatggtcccc catgcccacc ctgcccagca 2100

cctgagttcc tggggggacc atcagtcttc ctgttccccc caaaacccaa ggacactctc 2160

atgatctccc ggacccctga ggtcacgtgc gtggtggtgg acgtgagcca ggaagacccc 2220

gaggtccagt tcaactggta cgtggatggc gtggaggtgc ataatgccaa gacaaagccg 2280

cgggaggagc agttcaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 2340

gactggctga acggcaagga gtacaagtgc aaggtctcca acaaaggcct cccgtcctcc 2400

atcgagaaaa ccatctccaa agccaaaggg cagccccgag agccacaggt gtacaccctg 2460

cccccatccc aggaggagat gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 2520

ttctacccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 2580

aagaccacgc ctcccgtgct ggactccgac ggctccttct tcctctacag caggctcacc 2640

gtggacaaga gcaggtggca ggaggggaat gtcttctcat gctccgtgat gcatgaggct 2700

ctgcacaacc actacacaca gaagtccctc tccctgtctc tgggtaaatg agcggccgct 2760

aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 2820

cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 2880

taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 2940

gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtcctg 3000

cagggcccct ctcttcatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 3060

cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 3120

ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 3180

aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 3240

tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 3300

gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 3360

cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 3420

ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 3480

cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 3540

gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 3600

cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 3660

tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 3720

ttaagggatt ttggtcatgg gcgcgcctca tactcctgca ggcatgagat tatcaaaaag 3780

gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3840

tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3900

ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 3960

ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4020

tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4080

aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4140

gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4200

gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4260

ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4320

gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4380

gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4440

gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4500

tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4560

gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4620

agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4680

aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4740

ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4800

gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag 4860

gtaccaagcc taggcctcca aaaaagcctc ctcactactt ctggaatagc tcagaggcag 4920

aggcggcctc ggcctctgca taaataaaaa aaattagtca gccatggggc ggagaatggg 4980

cggaactggg cggagttagg ggcgggatgg gcggagttag gggcgggact atggttgctg 5040

actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 5100

acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 5160

gggactttcc acaccggatc caccatggat agatccggaa agcctgaact caccgcgacg 5220

tctgtcgaga agtttctgat cgaaaagttc gacagcgtct ccgacctgat gcagctctcg 5280

gagggcgaag aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctgcgg 5340

gtaaatagct gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg 5400

gccgcgctcc cgattccgga agtgcttgac attggggagt tcagcgagag cctgacctat 5460

tgcatctccc gccgtgcaca gggtgtcacg ttgcaagacc tgcctgaaac cgaactgccc 5520

gctgttctgc agccggtcgc ggaggccatg gatgcgatcg ctgcggccga tcttagccag 5580

acgagcgggt tcggcccatt cggaccgcaa ggaatcggtc aatacactac atggcgtgat 5640

ttcatatgcg cgattgctga tccccatgtg tatcactggc aaactgtgat ggacgacacc 5700

gtcagtgcgt ccgtcgcgca ggctctcgat gagctgatgc tttgggccga ggactgcccc 5760

gaagtccggc acctcgtgca cgcggatttc ggctccaaca atgtcctgac ggacaatggc 5820

cgcataacag cggtcattga ctggagcgag gcgatgttcg gggattccca atacgaggtc 5880

gccaacatct tcttctggag gccgtggttg gcttgtatgg agcagcagac gcgctacttc 5940

gagcggaggc atccggagct tgcaggatcg ccgcggctcc gggcgtatat gctccgcatt 6000

ggtcttgacc aactctatca gagcttggtt gacggcaatt tcgatgatgc agcttgggcg 6060

cagggtcgat gcgacgcaat cgtccgatcc ggagccggga ctgtcgggcg tacacaaatc 6120

gcccgcagaa gcgcggccgt ctggaccgat ggctgtgtag aagtactcgc cgatagtgga 6180

aaccgacgcc ccagcactcg tccgagggca aaggaataga cgcgtgctgt aagtctgcag 6240

aaattgatga tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata 6300

ctttgttaag aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg 6360

ggggtggggg tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat 6420

tgctttatga taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa 6480

gggccagctc attcctccca ctcatgatct atggatctat agatctctcg tgcagctggg 6540

gctctagggg gtatccccac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 6600

ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 6660

tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 6720

ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 6780

atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 6840

ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 6900

tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 6960

tgatttaaca aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt tag 7013

<210> 25

<211> 2272

<212> DNA

<213> 人工的

<220>

<223> 合成的构建体

<400> 25

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600

atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660

taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720

gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780

gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840

gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900

ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960

tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020

gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080

tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140

aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200

acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260

ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320

cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380

gctgatgcag acatccagat gacccagtct ccagcctccc tgtctgcatc tgttggagac 1440

agagtcacca tcacttgtcg ggcgagtcag gacattagcg attatttagc ctggtatcag 1500

cagaaaccag ggaaaattcc taggctcctg atctatacta catccacttt gcaatcaggg 1560

gtcccatctc ggttccgtgg cagtgggtct gggacagatt tcactctcac catcagcagc 1620

ctgcagcctg aagatgttgc aacttattac tgtcagaagt atgacagtgc cccgctcact 1680

ttcggcggag ggaccaaggt ggagatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740

ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800

aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860

aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920

accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980

catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040

gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100

ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160

ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220

actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272

<210> 26

<211> 6335

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 26

tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60

tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120

acgtggtgct gatgcagaca tccagatgac ccagtctcca gcctccctgt ctgcatctgt 180

tggagacaga gtcaccatca cttgtcgggc gagtcaggac attagcgatt atttagcctg 240

gtatcagcag aaaccaggga aaattcctag gctcctgatc tatactacat ccactttgca 300

atcaggggtc ccatctcggt tccgtggcag tgggtctggg acagatttca ctctcaccat 360

cagcagcctg cagcctgaag atgttgcaac ttattactgt cagaagtatg acagtgcccc 420

gctcactttc ggcggaggga ccaaggtgga gatcaaacga actgtggctg caccatctgt 480

cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540

gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600

atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660

cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720

agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780

ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840

cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020

accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080

aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140

cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200

cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260

gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320

tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380

cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440

ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500

gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560

gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620

accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680

ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740

tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800

tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860

tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920

cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980

ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040

tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100

gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160

agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220

atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280

tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340

gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400

agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460

cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520

ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580

ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640

actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700

ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760

atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820

caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880

gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940

cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000

aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060

ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120

ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180

ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240

tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300

cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360

cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420

agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480

cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540

gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600

ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660

aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720

gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780

tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840

cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900

ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960

ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020

gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080

tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140

cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200

tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260

aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320

gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380

ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440

tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500

atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560

tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620

agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680

agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740

tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800

cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860

tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920

caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980

ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040

ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100

aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160

aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220

tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280

gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340

cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400

tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460

gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520

cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580

taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640

aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700

tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760

gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820

gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880

ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940

tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000

ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060

taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120

ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180

gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240

accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300

tgtctcatca ttttggcaaa gaattaagct tatac 6335

<210> 27

<211> 452

<212> PRT

<213> 智人（Homo sapiens）

<400> 27

Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr

20 25 30

Asp Ile His Trp Val Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val

35 40 45

Ser Ala Ile Gly Pro Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys

50 55 60

Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu

65 70 75 80

Gln Met Asn Ser Leu Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala

85 90 95

Arg Gly Leu Ile Thr Phe Gly Gly Leu Ile Ala Pro Phe Asp Tyr Trp

100 105 110

Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro

115 120 125

Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr

130 135 140

Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr

145 150 155 160

Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro

165 170 175

Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr

180 185 190

Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn

195 200 205

His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser

210 215 220

Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu

225 230 235 240

Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu

245 250 255

Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser

260 265 270

His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu

275 280 285

Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr

290 295 300

Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn

305 310 315 320

Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro

325 330 335

Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln

340 345 350

Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val

355 360 365

Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val

370 375 380

Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro

385 390 395 400

Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr

405 410 415

Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val

420 425 430

Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu

435 440 445

Ser Pro Gly Lys

450

<210> 28

<211> 112

<212> PRT

<213> 智人（Homo sapiens）

<400> 28

Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser

1 5 10 15

Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr Asp Ile His Trp Val

20 25 30

Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Gly Pro

35 40 45

Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys Gly Arg Phe Thr Ile

50 55 60

Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser Leu

65 70 75 80

Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Leu Ile Thr

85 90 95

Phe Gly Gly Leu Ile Ala Pro Phe Asp Tyr Trp Gly Gln Gly Thr Leu

100 105 110

<210> 29

<211> 214

<212> PRT

<213> 智人（Homo sapiens）

<400> 29

Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly

1 5 10 15

Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Thr

20 25 30

Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu

35 40 45

Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser

50 55 60

Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu

65 70 75 80

Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Tyr Asp Asn Ser Gln

85 90 95

Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala

100 105 110

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

115 120 125

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

130 135 140

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

145 150 155 160

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

165 170 175

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

180 185 190

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

195 200 205

Phe Asn Arg Gly Glu Cys

210

<210> 30

<211> 107

<212> PRT

<213> 智人（Homo sapiens）

<400> 30

Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu

1 5 10 15

Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Thr Tyr

20 25 30

Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile

35 40 45

Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly

50 55 60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro

65 70 75 80

Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Tyr Asp Asn Ser Gln Thr

85 90 95

Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg

100 105

<210> 31

<211> 2986

<212> DNA

<213> 人工的

<220>

<223> 合成的构建体

<400> 31

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600

atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660

taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720

gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780

gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840

gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900

ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960

tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020

gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080

tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140

aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200

acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260

ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320

cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380

gctgatgcag aggtgcagct ggtggagtct gggggaggct tggtacagcc gggggggtcc 1440

ctgagactct cctgtgcagc ctctggattc accttcagta gctacgacat acactgggtc 1500

cgtcaagcta caggaaaagg tctggagtgg gtctcagcta ttggtcctgc tggtgacaca 1560

tactatccag gctccgtgaa gggccgattc accatctcca gagaaaatgc caagaactcc 1620

ttgtatcttc aaatgaacag cctgagagcc ggggacacgg ctgtgtatta ctgtgcaaga 1680

ggtttgatta cgtttggggg gcttatcgcc ccgtttgact actggggcca gggaaccctg 1740

gtcaccgtct cctcagcctc caccaagggc ccatcggtct tccccctggc accctcctcc 1800

aagagcacct ctgggggcac agcggccctg ggctgcctgg tcaaggacta cttccccgaa 1860

ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 1920

gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 1980

ttgggcaccc agacctacat ctgcaacgtg aatcacaagc ccagcaacac caaggtggac 2040

aagaaagttg agcccaaatc ttgtgacaaa actcacacat gcccaccgtg cccagcacct 2100

gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 2160

atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 2220

gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 2280

gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 2340

tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 2400

gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc 2460

ccatcccggg atgagctgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 2520

tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 2580

accacgcctc ccgtgctgga ctccgacggc tccttcttcc tctacagcaa gctcaccgtg 2640

gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg 2700

cacaaccact acacgcagaa gtccctctcc ctgtctccgg gtaaatgagc ggccgctaat 2760

cagccatacc acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct 2820

gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa 2880

tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 2940

ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtc 2986

<210> 32

<211> 7028

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 32

tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60

cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120

caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180

gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240

tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300

ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360

attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420

gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480

ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540

aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600

tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660

ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720

tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780

ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840

ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900

tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960

attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020

ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080

tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140

taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200

tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260

taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320

atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380

ctcctggctg cacgtggtgc tgatgcagag gtgcagctgg tggagtctgg gggaggcttg 1440

gtacagccgg gggggtccct gagactctcc tgtgcagcct ctggattcac cttcagtagc 1500

tacgacatac actgggtccg tcaagctaca ggaaaaggtc tggagtgggt ctcagctatt 1560

ggtcctgctg gtgacacata ctatccaggc tccgtgaagg gccgattcac catctccaga 1620

gaaaatgcca agaactcctt gtatcttcaa atgaacagcc tgagagccgg ggacacggct 1680

gtgtattact gtgcaagagg tttgattacg tttggggggc ttatcgcccc gtttgactac 1740

tggggccagg gaaccctggt caccgtctcc tcagcctcca ccaagggccc atcggtcttc 1800

cccctggcac cctcctccaa gagcacctct gggggcacag cggccctggg ctgcctggtc 1860

aaggactact tccccgaacc ggtgacggtg tcgtggaact caggcgccct gaccagcggc 1920

gtgcacacct tcccggctgt cctacagtcc tcaggactct actccctcag cagcgtggtg 1980

accgtgccct ccagcagctt gggcacccag acctacatct gcaacgtgaa tcacaagccc 2040

agcaacacca aggtggacaa gaaagttgag cccaaatctt gtgacaaaac tcacacatgc 2100

ccaccgtgcc cagcacctga actcctgggg ggaccgtcag tcttcctctt ccccccaaaa 2160

cccaaggaca ccctcatgat ctcccggacc cctgaggtca catgcgtggt ggtggacgtg 2220

agccacgaag accctgaggt caagttcaac tggtacgtgg acggcgtgga ggtgcataat 2280

gccaagacaa agccgcggga ggagcagtac aacagcacgt accgtgtggt cagcgtcctc 2340

accgtcctgc accaggactg gctgaatggc aaggagtaca agtgcaaggt ctccaacaaa 2400

gccctcccag cccccatcga gaaaaccatc tccaaagcca aagggcagcc ccgagaacca 2460

caggtgtaca ccctgccccc atcccgggat gagctgacca agaaccaggt cagcctgacc 2520

tgcctggtca aaggcttcta tcccagcgac atcgccgtgg agtgggagag caatgggcag 2580

ccggagaaca actacaagac cacgcctccc gtgctggact ccgacggctc cttcttcctc 2640

tacagcaagc tcaccgtgga caagagcagg tggcagcagg ggaacgtctt ctcatgctcc 2700

gtgatgcatg aggctctgca caaccactac acgcagaagt ccctctccct gtctccgggt 2760

aaatgagcgg ccgctaatca gccataccac atttgtagag gttttacttg ctttaaaaaa 2820

cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt 2880

gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 2940

agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca 3000

tgtctaccgg tcctgcaggg cccctctctt catgtgagca aaaggccagc aaaaggccag 3060

gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 3120

tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 3180

ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 3240

atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag 3300

gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 3360

tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 3420

cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 3480

cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 3540

tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 3600

cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 3660

cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 3720

gaacgaaaac tcacgttaag ggattttggt catgggcgcg cctcatactc ctgcaggcat 3780

gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 3840

aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 3900

acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 3960

gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 4020

cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 4080

cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 4140

tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 4200

cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 4260

gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 4320

cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 4380

ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 4440

gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 4500

taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 4560

gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 4620

acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 4680

aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 4740

cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 4800

atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 4860

gccacctgac gtcaggtacc aagcctaggc ctccaaaaaa gcctcctcac tacttctgga 4920

atagctcaga ggcagaggcg gcctcggcct ctgcataaat aaaaaaaatt agtcagccat 4980

ggggcggaga atgggcggaa ctgggcggag ttaggggcgg gatgggcgga gttaggggcg 5040

ggactatggt tgctgactaa ttgagatgca tgctttgcat acttctgcct gctggggagc 5100

ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc atacttctgc 5160

ctgctgggga gcctggggac tttccacacc ggatccacca tggatagatc cggaaagcct 5220

gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag cgtctccgac 5280

ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt aggagggcgt 5340

ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg ttatgtttat 5400

cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg ggagttcagc 5460

gagagcctga cctattgcat ctcccgccgt gcacagggtg tcacgttgca agacctgcct 5520

gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg ccatggatgc gatcgctgcg 5580

gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat cggtcaatac 5640

actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca ctggcaaact 5700

gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct gatgctttgg 5760

gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc caacaatgtc 5820

ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat gttcggggat 5880

tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg tatggagcag 5940

cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccgcg gctccgggcg 6000

tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg caatttcgat 6060

gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc 6120

gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta 6180

ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagga atagacgcgt 6240

gctgtaagtc tgcagaaatt gatgatctat taaacaataa agatgtccac taaaatggaa 6300

gtttttcctg tcatactttg ttaagaaggg tgagaacaga gtacctacat tttgaatgga 6360

aggattggag ctacgggggt gggggtgggg tgggattaga taaatgcctg ctctttactg 6420

aaggctcttt actattgctt tatgataatg tttcatagtt ggatatcata atttaaacaa 6480

gcaaaaccaa attaagggcc agctcattcc tcccactcat gatctatgga tctatagatc 6540

tctcgtgcag ctggggctct agggggtatc cccacgcgcc ctgtagcggc gcattaagcg 6600

cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6660

ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6720

taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6780

aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6840

ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6900

tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6960

ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg 7020

tcagttag 7028

<210> 33

<211> 2272

<212> DNA

<213> 人工的

<220>

<223> 合成的构建体

<400> 33

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600

atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660

taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720

gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780

gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840

gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900

ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960

tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020

gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080

tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140

aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200

acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260

ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320

cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380

gctgatgcag aaattgtgtt gacgcagtct ccaggcaccc tgtctttgtc tccaggggaa 1440

agagccaccc tctcctgcag ggccagtcag agtgttagca gcacctactt agcctggtac 1500

cagcagaaac ctggccaggc tcccaggctc ctcatctatg gtgcatccag cagggccact 1560

ggcatcccag acaggttcag tggcagtggg tctgggacag acttcactct caccatcagc 1620

agactggagc ctgaagattt tgcagtgtat tactgtcagc attatgataa ctcacaaacg 1680

ttcggccaag ggaccaaggt ggagatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740

ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800

aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860

aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920

accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980

catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040

gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100

ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160

ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220

actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272

<210> 34

<211> 6335

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 34

tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60

tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120

acgtggtgct gatgcagaaa ttgtgttgac gcagtctcca ggcaccctgt ctttgtctcc 180

aggggaaaga gccaccctct cctgcagggc cagtcagagt gttagcagca cctacttagc 240

ctggtaccag cagaaacctg gccaggctcc caggctcctc atctatggtg catccagcag 300

ggccactggc atcccagaca ggttcagtgg cagtgggtct gggacagact tcactctcac 360

catcagcaga ctggagcctg aagattttgc agtgtattac tgtcagcatt atgataactc 420

acaaacgttc ggccaaggga ccaaggtgga gatcaaacga actgtggctg caccatctgt 480

cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540

gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600

atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660

cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720

agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780

ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840

cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020

accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080

aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140

cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200

cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260

gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320

tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380

cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440

ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500

gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560

gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620

accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680

ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740

tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800

tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860

tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920

cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980

ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040

tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100

gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160

agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220

atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280

tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340

gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400

agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460

cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520

ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580

ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640

actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700

ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760

atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820

caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880

gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940

cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000

aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060

ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120

ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180

ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240

tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300

cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360

cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420

agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480

cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540

gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600

ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660

aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720

gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780

tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840

cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900

ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960

ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020

gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080

tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140

cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200

tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260

aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320

gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380

ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440

tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500

atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560

tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620

agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680

agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740

tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800

cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860

tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920

caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980

ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040

ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100

aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160

aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220

tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280

gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340

cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400

tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460

gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520

cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580

taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640

aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700

tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760

gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820

gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880

ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940

tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000

ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060

taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120

ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180

gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240

accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300

tgtctcatca ttttggcaaa gaattaagct tatac 6335

<210> 35

<211> 449

<212> PRT

<213> 智人（Homo sapiens）

<400> 35

Gln Val Gln Leu Gln Gln Ser Gly Ala Gly Leu Leu Lys Pro Ser Glu

1 5 10 15

Thr Leu Ser Leu Thr Cys Thr Val Tyr Gly Gly Ser Phe Ser Ile His

20 25 30

His Trp Thr Trp Ile Arg His Pro Pro Gly Lys Gly Leu Glu Trp Ile

35 40 45

Gly Glu Ile Asn His Arg Gly Ser Thr Asn Tyr Asn Pro Ser Leu Lys

50 55 60

Ser Arg Val Thr Ile Ser Ile Asp Thr Ser Lys Asn Gln Phe Ser Leu

65 70 75 80

Lys Leu Ser Ala Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala

85 90 95

Arg Gly Leu Arg Phe Leu Asp Trp Leu Ser Ser Tyr Phe Asp Tyr Trp

100 105 110

Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro

115 120 125

Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr

130 135 140

Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr

145 150 155 160

Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro

165 170 175

Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr

180 185 190

Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp

195 200 205

His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr

210 215 220

Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro

225 230 235 240

Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser

245 250 255

Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp

260 265 270

Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn

275 280 285

Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val

290 295 300

Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu

305 310 315 320

Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys

325 330 335

Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr

340 345 350

Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr

355 360 365

Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu

370 375 380

Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu

385 390 395 400

Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys

405 410 415

Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu

420 425 430

Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly

435 440 445

Lys

<210> 36

<211> 103

<212> PRT

<213> 智人（Homo sapiens）

<400> 36

Gln Ser Gly Ala Gly Leu Leu Lys Pro Ser Glu Thr Leu Ser Leu Thr

1 5 10 15

Cys Thr Val Tyr Gly Gly Ser Phe Ser Ile His His Trp Thr Trp Ile

20 25 30

Arg His Pro Pro Gly Lys Gly Leu Glu Trp Ile Gly Glu Ile Asn His

35 40 45

Arg Gly Ser Thr Asn Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr Ile

50 55 60

Ser Ile Asp Thr Ser Lys Asn Gln Phe Ser Leu Lys Leu Ser Ala Val

65 70 75 80

Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Leu Arg Phe

85 90 95

Leu Asp Trp Leu Ser Ser Tyr

100

<210> 37

<211> 214

<212> PRT

<213> 智人（Homo sapiens）

<400> 37

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asp Tyr

20 25 30

Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Val Pro Asn Leu Leu Ile

35 40 45

Tyr Ala Ala Ser Ala Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro

65 70 75 80

Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Thr Ala Pro Leu

85 90 95

Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala

100 105 110

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

115 120 125

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

130 135 140

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

145 150 155 160

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

165 170 175

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

180 185 190

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

195 200 205

Phe Asn Arg Gly Glu Cys

210

<210> 38

<211> 107

<212> PRT

<213> 智人（Homo sapiens）

<400> 38

Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp

1 5 10 15

Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asp Tyr Leu

20 25 30

Ala Trp Tyr Gln Gln Lys Pro Gly Lys Val Pro Asn Leu Leu Ile Tyr

35 40 45

Ala Ala Ser Ala Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser

50 55 60

Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu

65 70 75 80

Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Thr Ala Pro Leu Thr

85 90 95

Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg

100 105

<210> 39

<211> 2977

<212> DNA

<213> 人工的

<220>

<223> 合成的构建体

<400> 39

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600

atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660

taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720

gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780

gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840

gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900

ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960

tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020

gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080

tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140

aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200

acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260

ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320

cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380

gctgatgcac aggtacagct gcagcagtcg ggcgcaggac tgttgaagcc ttcggagacc 1440

ctgtccctca cctgcactgt ctatggtgga tccttcagta ttcatcactg gacctggatc 1500

cgccatcccc cagggaaggg gctggagtgg attggggaga tcaatcatcg tggaagcacc 1560

aactacaacc cgtccctcaa gagtcgagtc accatatcaa tagacacgtc caagaaccag 1620

ttctccctga agctgagcgc tgtgaccgcc gcggacacgg ctgtatatta ctgtgcgaga 1680

ggcttacgat ttttggactg gttatcgtcc tactttgact actggggcca gggaaccctg 1740

gtcaccgtct cctcagcctc caccaagggc ccatcggtct tccccctggc gccctgctcc 1800

aggagcacct ccgagagcac agccgccctg ggctgcctgg tcaaggacta cttccccgaa 1860

ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 1920

gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 1980

ttgggcacga agacctacac ctgcaacgta gatcacaagc ccagcaacac caaggtggac 2040

aagagagttg agtccaaata tggtccccca tgcccaccct gcccagcacc tgagttcctg 2100

gggggaccat cagtcttcct gttcccccca aaacccaagg acactctcat gatctcccgg 2160

acccctgagg tcacgtgcgt ggtggtggac gtgagccagg aagaccccga ggtccagttc 2220

aactggtacg tggatggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 2280

ttcaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaac 2340

ggcaaggagt acaagtgcaa ggtctccaac aaaggcctcc cgtcctccat cgagaaaacc 2400

atctccaaag ccaaagggca gccccgagag ccacaggtgt acaccctgcc cccatcccag 2460

gaggagatga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctaccccagc 2520

gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 2580

cccgtgctgg actccgacgg ctccttcttc ctctacagca ggctcaccgt ggacaagagc 2640

aggtggcagg aggggaatgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 2700

tacacacaga agtccctctc cctgtctctg ggtaaatgag cggccgctaa tcagccatac 2760

cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa 2820

acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 2880

ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 2940

tggtttgtcc aaactcatca atgtatctta tcatgtc 2977

<210> 40

<211> 7019

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 40

tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60

cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120

caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180

gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240

tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300

ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360

attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420

gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480

ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540

aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600

tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660

ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720

tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780

ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840

ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900

tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960

attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020

ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080

tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140

taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200

tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260

taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320

atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380

ctcctggctg cacgtggtgc tgatgcacag gtacagctgc agcagtcggg cgcaggactg 1440

ttgaagcctt cggagaccct gtccctcacc tgcactgtct atggtggatc cttcagtatt 1500

catcactgga cctggatccg ccatccccca gggaaggggc tggagtggat tggggagatc 1560

aatcatcgtg gaagcaccaa ctacaacccg tccctcaaga gtcgagtcac catatcaata 1620

gacacgtcca agaaccagtt ctccctgaag ctgagcgctg tgaccgccgc ggacacggct 1680

gtatattact gtgcgagagg cttacgattt ttggactggt tatcgtccta ctttgactac 1740

tggggccagg gaaccctggt caccgtctcc tcagcctcca ccaagggccc atcggtcttc 1800

cccctggcgc cctgctccag gagcacctcc gagagcacag ccgccctggg ctgcctggtc 1860

aaggactact tccccgaacc ggtgacggtg tcgtggaact caggcgccct gaccagcggc 1920

gtgcacacct tcccggctgt cctacagtcc tcaggactct actccctcag cagcgtggtg 1980

accgtgccct ccagcagctt gggcacgaag acctacacct gcaacgtaga tcacaagccc 2040

agcaacacca aggtggacaa gagagttgag tccaaatatg gtcccccatg cccaccctgc 2100

ccagcacctg agttcctggg gggaccatca gtcttcctgt tccccccaaa acccaaggac 2160

actctcatga tctcccggac ccctgaggtc acgtgcgtgg tggtggacgt gagccaggaa 2220

gaccccgagg tccagttcaa ctggtacgtg gatggcgtgg aggtgcataa tgccaagaca 2280

aagccgcggg aggagcagtt caacagcacg taccgtgtgg tcagcgtcct caccgtcctg 2340

caccaggact ggctgaacgg caaggagtac aagtgcaagg tctccaacaa aggcctcccg 2400

tcctccatcg agaaaaccat ctccaaagcc aaagggcagc cccgagagcc acaggtgtac 2460

accctgcccc catcccagga ggagatgacc aagaaccagg tcagcctgac ctgcctggtc 2520

aaaggcttct accccagcga catcgccgtg gagtgggaga gcaatgggca gccggagaac 2580

aactacaaga ccacgcctcc cgtgctggac tccgacggct ccttcttcct ctacagcagg 2640

ctcaccgtgg acaagagcag gtggcaggag gggaatgtct tctcatgctc cgtgatgcat 2700

gaggctctgc acaaccacta cacacagaag tccctctccc tgtctctggg taaatgagcg 2760

gccgctaatc agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca 2820

cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 2880

agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 2940

ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctaccg 3000

gtcctgcagg gcccctctct tcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 3060

aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 3120

tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 3180

ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 3240

cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag 3300

ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 3360

ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 3420

gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 3480

agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 3540

cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 3600

aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 3660

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 3720

ctcacgttaa gggattttgg tcatgggcgc gcctcatact cctgcaggca tgagattatc 3780

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 3840

tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 3900

agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 3960

gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 4020

accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 4080

tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 4140

tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 4200

acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 4260

atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 4320

aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 4380

tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 4440

agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 4500

gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 4560

ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 4620

atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 4680

tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 4740

tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 4800

tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 4860

cgtcaggtac caagcctagg cctccaaaaa agcctcctca ctacttctgg aatagctcag 4920

aggcagaggc ggcctcggcc tctgcataaa taaaaaaaat tagtcagcca tggggcggag 4980

aatgggcgga actgggcgga gttaggggcg ggatgggcgg agttaggggc gggactatgg 5040

ttgctgacta attgagatgc atgctttgca tacttctgcc tgctggggag cctggggact 5100

ttccacacct ggttgctgac taattgagat gcatgctttg catacttctg cctgctgggg 5160

agcctgggga ctttccacac cggatccacc atggatagat ccggaaagcc tgaactcacc 5220

gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca gcgtctccga cctgatgcag 5280

ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg taggagggcg tggatatgtc 5340

ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc gttatgttta tcggcacttt 5400

gcatcggccg cgctcccgat tccggaagtg cttgacattg gggagttcag cgagagcctg 5460

acctattgca tctcccgccg tgcacagggt gtcacgttgc aagacctgcc tgaaaccgaa 5520

ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg cgatcgctgc ggccgatctt 5580

agccagacga gcgggttcgg cccattcgga ccgcaaggaa tcggtcaata cactacatgg 5640

cgtgatttca tatgcgcgat tgctgatccc catgtgtatc actggcaaac tgtgatggac 5700

gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc tgatgctttg ggccgaggac 5760

tgccccgaag tccggcacct cgtgcacgcg gatttcggct ccaacaatgt cctgacggac 5820

aatggccgca taacagcggt cattgactgg agcgaggcga tgttcgggga ttcccaatac 5880

gaggtcgcca acatcttctt ctggaggccg tggttggctt gtatggagca gcagacgcgc 5940

tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc ggctccgggc gtatatgctc 6000

cgcattggtc ttgaccaact ctatcagagc ttggttgacg gcaatttcga tgatgcagct 6060

tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag ccgggactgt cgggcgtaca 6120

caaatcgccc gcagaagcgc ggccgtctgg accgatggct gtgtagaagt actcgccgat 6180

agtggaaacc gacgccccag cactcgtccg agggcaaagg aatagacgcg tgctgtaagt 6240

ctgcagaaat tgatgatcta ttaaacaata aagatgtcca ctaaaatgga agtttttcct 6300

gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga 6360

gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt 6420

tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca 6480

aattaagggc cagctcattc ctcccactca tgatctatgg atctatagat ctctcgtgca 6540

gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg 6600

tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 6660

ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 6720

ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 6780

agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 6840

tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 6900

tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 6960

atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttag 7019

<210> 41

<211> 2272

<212> DNA

<213> 人工的

<220>

<223> 合成的构建体

<400> 41

tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360

catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420

atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480

ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540

acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600

atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660

taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720

gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780

gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840

gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900

ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960

tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020

gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080

tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140

aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200

acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260

ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320

cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380

gctgatgcag acatccagat gacccagtct ccatcctccc tgtctgcatc tgtaggagac 1440

agagtcacca tcacttgccg ggcgagtcag ggcattagcg attatttagc ctggtatcag 1500

cagaaaccag ggaaagttcc taacctcctg atctatgctg cgtccgcttt acaatcaggg 1560

gtcccatctc gtttcagtgg cagtggatct gggacagatt tcactctcac catcagcagc 1620

ctgcagcctg aggatgttgc aacttattac tgtcaaaatt ataacactgc cccgctcact 1680

ttcggcgggg ggaccaaggt ggaaatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740

ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800

aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860

aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920

accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980

catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040

gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100

ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160

ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220

actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272

<210> 42

<211> 6335

<212> DNA

<213> 人工的

<220>

<223> 合成的质粒

<400> 42

tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60

tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120

acgtggtgct gatgcagaca tccagatgac ccagtctcca tcctccctgt ctgcatctgt 180

aggagacaga gtcaccatca cttgccgggc gagtcagggc attagcgatt atttagcctg 240

gtatcagcag aaaccaggga aagttcctaa cctcctgatc tatgctgcgt ccgctttaca 300

atcaggggtc ccatctcgtt tcagtggcag tggatctggg acagatttca ctctcaccat 360

cagcagcctg cagcctgagg atgttgcaac ttattactgt caaaattata acactgcccc 420

gctcactttc ggcgggggga ccaaggtgga aatcaaacga actgtggctg caccatctgt 480

cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540

gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600

atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660

cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720

agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780

ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840

cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020

accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080

aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140

cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200

cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260

gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320

tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380

cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440

ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500

gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560

gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620

accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680

ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740

tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800

tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860

tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920

cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980

ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040

tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100

gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160

agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220

atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280

tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340

gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400

agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460

cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520

ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580

ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640

actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700

ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760

atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820

caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880

gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940

cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000

aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060

ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120

ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180

ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240

tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300

cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360

cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420

agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480

cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540

gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600

ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660

aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720

gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780

tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840

cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900

ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960

ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020

gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080

tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140

cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200

tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260

aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320

gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380

ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440

tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500

atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560

tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620

agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680

agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740

tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800

cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860

tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920

caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980

ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040

ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100

aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160

aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220

tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280

gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340

cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400

tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460

gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520

cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580

taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640

aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700

tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760

gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820

gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880

ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940

tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000

ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060

taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120

ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180

gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240

accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300

tgtctcatca ttttggcaaa gaattaagct tatac 6335

<210> 43

<211> 115

<212> PRT

<213> 人工的

<220>

<223> 共有序列

<220>

<221> MISC_FEATURE

<222> (1)..(1)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (11)..(11)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (28)..(28)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (30)..(30)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (34)..(35)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (93)..(93)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (93)..(93)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (96)..(96)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (100)..(100)

<223> Xaa可为任何天然氨基酸

<220>

<221> misc_feature

<222> (111)..(111)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (114)..(114)

<223> Xaa可为任何天然氨基酸

<400> 43

Xaa Asp Val Trp Gly Gln Gly Thr Thr Val Xaa Val Ser Ser Ala Ser

1 5 10 15

Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Xaa Ser Xaa Ser Thr

20 25 30

Ser Xaa Xaa Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro

35 40 45

Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val

50 55 60

His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser

65 70 75 80

Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Xaa Thr Tyr Xaa

85 90 95

Cys Asn Val Xaa His Lys Pro Ser Asn Thr Lys Val Asp Lys Xaa Val

100 105 110

Glu Xaa Lys

115

<210> 44

<211> 225

<212> PRT

<213> 人工的

<220>

<223> 共有序列

<220>

<221> MISC_FEATURE

<222> (13)..(13)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (47)..(47)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (53)..(53)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (75)..(75)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (106)..(106)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (109)..(110)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (134)..(135)

<223> Xaa可为任何天然氨基酸

<220>

<221> misc_feature

<222> (137)..(137)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (188)..(188)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (198)..(198)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (224)..(224)

<223> Xaa可为任何天然氨基酸

<400> 44

Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Xaa Leu Gly Gly

1 5 10 15

Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile

20 25 30

Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Xaa Glu

35 40 45

Asp Pro Glu Val Xaa Phe Asn Trp Tyr Val Asp Gly Val Glu Val His

50 55 60

Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Xaa Asn Ser Thr Tyr Arg

65 70 75 80

Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys

85 90 95

Glu Tyr Lys Cys Lys Val Ser Asn Lys Xaa Leu Pro Xaa Xaa Ile Glu

100 105 110

Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr

115 120 125

Thr Leu Pro Pro Ser Xaa Xaa Glu Xaa Thr Lys Asn Gln Val Ser Leu

130 135 140

Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp

145 150 155 160

Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val

165 170 175

Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Xaa Leu Thr Val Asp

180 185 190

Lys Ser Arg Trp Gln Xaa Gly Asn Val Phe Ser Cys Ser Val Met His

195 200 205

Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Xaa

210 215 220

Gly

225

<210> 45

<211> 60

<212> PRT

<213> 人工的

<220>

<223> 共有序列

<220>

<221> MISC_FEATURE

<222> (13)..(14)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (16)..(16)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (21)..(22)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (24)..(27)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (31)..(31)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (34)..(34)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (48)..(48)

<223> Xaa可为任何天然氨基酸

<220>

<221> misc_feature

<222> (50)..(50)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (54)..(54)

<223> Xaa可为任何天然氨基酸

<220>

<221> MISC_FEATURE

<222> (56)..(56)

<223> Xaa可为任何天然氨基酸

<400> 45

Ser Asp Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Xaa Xaa Pro Xaa

1 5 10 15

Leu Leu Ile Tyr Xaa Xaa Ser Xaa Xaa Xaa Xaa Gly Val Pro Xaa Arg

20 25 30

Phe Xaa Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Xaa

35 40 45

Leu Xaa Pro Glu Asp Xaa Ala Xaa Tyr Tyr Cys Gln

50 55 60

<210> 46

<211> 118

<212> PRT

<213> 人工的

<220>

<223> 共有序列

<220>

<221> MISC_FEATURE

<222> (4)..(4)

<223> Xaa可为任何天然氨基酸

<400> 46

Thr Phe Gly Xaa Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala

1 5 10 15

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

20 25 30

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

35 40 45

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

50 55 60

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

65 70 75 80

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

85 90 95

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

100 105 110

Phe Asn Arg Gly Glu Cys

115

Claims

1.细胞，其包含：

(ii)第二多核苷酸，其包含编码多亚基蛋白的核酸序列，所述多亚基蛋白包含SEQ IDNO：46的氨基酸序列。

2.权利要求1的细胞，其中所述第一多核苷酸还包含与编码所述第一生产增强蛋白的核酸序列可操作连接的组成型启动子。

3.权利要求2的细胞，其中所述第一多核苷酸的组成型启动子选自：泛素C启动子、CMV-IE启动子和SV40启动子。

4.权利要求1的细胞，其中所述第一多核苷酸整合在所述细胞的转录活性基因座处。

5.权利要求1的细胞，其中所述第一生产增强蛋白包含选自下列的氨基酸序列：SEQ IDNO：13、SEQ ID NO：9、SEQ ID NO：10和SEQ ID NO：11。

6.权利要求1的细胞，其中所述细胞以至少32pg/个细胞/天的速率生产所述多亚基蛋白。

7.权利要求1的细胞，其中所述细胞还包含第三多核苷酸，所述第三多核苷酸包含编码第二生产增强蛋白的核酸序列，所述第二生产增强蛋白包含与SEQ ID NO：1至少92％一致的氨基酸序列。

8.权利要求7的细胞，其中所述第三多核苷酸还包含第二组成型启动子，所述第二组成型启动子与编码所述第二生产增强蛋白的核酸序列可操作地连接。

9.权利要求8的细胞，其中所述第二组成型启动子是SV40启动子。

10.权利要求7的细胞，其中所述第二生产增强蛋白包含选自下列的氨基酸序列：SEQID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6和SEQ IDNO：8。