CN106255752A

CN106255752A - 表达构建体和用于选择表达多肽的宿主细胞的方法

Info

Publication number: CN106255752A
Application number: CN201580023386.0A
Authority: CN
Inventors: 克里斯特尔·阿埃比斯舍尔-古姆; 皮埃尔·莫雷蒂; 马丁·伯奇英奇
Original assignee: Glenmark Pharmaceuticals SA
Current assignee: Ichnos Sciences SA
Priority date: 2014-02-28
Filing date: 2015-03-02
Publication date: 2016-12-21
Also published as: BR112016019832A2; MA39502A; JP7008406B2; AU2015222065B2; NZ723624A; SG10201913396RA; JP2017508459A; CA2940880A1; EA201691548A1; US20190056396A1; US20170350886A1; WO2015128509A1; KR20160135738A; EP3110950A1; IL247491A0; MX2016011194A; EP3110950B1; CA2940880C; SG11201607114VA; AU2015222065A1

Abstract

本发明涉及用于使用选择性剪接多肽在宿主细胞中的可溶性表达和多肽在宿主细胞的表面上表达的表达构建体。多肽例如抗体、抗体片段和双特异性抗体的细胞膜表达的量可以与所表达的可溶性多肽的量直接相关。在双特异性抗体的情况下，异源二聚体和同源二聚体产物的细胞膜表达可以与这些产物的可溶性表达直接相关，从而有助于期望的生产者克隆的选择。

Description

表达构建体和用于选择表达多肽的宿主细胞的方法

技术领域

本发明涉及表达构建体和用于使用选择性剪接在真核细胞的表面上表达目的分泌蛋白的一部分的方法。本发明还涉及通过检测目的蛋白质的膜表达水平选择以期望的水平表达目的分泌蛋白的(多个)细胞的方法。本发明还涉及通过检测目的异源多聚蛋白质的膜表达水平选择表达分泌的目的异源多聚蛋白质的(多个)细胞。

背景技术

为了在真核细胞中产生蛋白质，必须将编码这种蛋白质的DNA转录成信使RNA(mRNA)，所述信使RNA将转而被翻译成蛋白质。mRNA首先在细胞核中作为含有内含子和外显子的前mRNA被转录。在前mRNA成熟为成熟的mRNA的过程中，内含子由称为剪接体的细胞机械切出(“剪接”)。外显子被融合在一起并且mRNA通过在其5'端加入所谓的CAP和在其3'端加入聚腺苷酸化(聚(A))尾而被修饰。成熟的mRNA被输出到细胞质并充当用于蛋白质的翻译的模板。

选择性剪接是描述相同的转录可能以不同的方式剪接从而导致不同的成熟mRNA并在某些情况下导致不同的蛋白质的术语。这种机制本质上用于改变蛋白质的表达水平或者为了在发育期间修饰特定蛋白质的活性(Cooper TA &Ordahl CP(1985),J Biol Chem,260(20):11140-8)。选择性剪接通常由多种因素的复杂的相互作用控制(Orengo JP etal.,(2006)Nucleic Acids Res,34(22):e148)。

选择性剪接能够从相同的DNA模板产生两种(或更多种)不同的RNA转录。这可以用于产生相同的蛋白质或多肽的两种(或更多种)同种型。在整个说明书中，术语蛋白质和多肽将互换使用。

在自然界中，这是在例如通过人免疫系统中的活化的B细胞产生抗体的过程中使用的高度控制的过程。大多数抗体被分泌到细胞外的空间，但所产生的抗体的一小部分以膜结合同种型的形式被从分泌途径重定向到外细胞膜。

膜结合同种型与分泌到细胞外空间的抗体具有相同的氨基酸序列和结构。所不同的是带有跨膜区的分泌抗体的重链的C-末端延伸包含跨膜结构域。在B细胞中，该结构域可以具有大约40至75个氨基酸(Major JG et al.,(1996)Mol.Immunol.33:179-87)。

用于生产重组多肽的表达系统是本领域中公知的。为了生产药物制剂中使用的多肽和蛋白质，通常使用哺乳动物宿主细胞如CHO、BHK、NS0、SP2/0、COS、HEK和PER.C6。为了大规模生产治疗性蛋白，需要产生高生产细胞系。用编码目的多肽的基因转染宿主细胞系之后，获得和选择了许多具有不同特性的克隆。这通过使用，例如，可选择标记、基因扩增和/或报道分子常规地进行。选择具有所需性质的合适的克隆例如高生产克隆是费时，往往非常规并因此昂贵的过程。

对于异源多聚蛋白质，如双特异性抗体的表达，合适的宿主细胞系的产生变得更加复杂。组成多聚体的该蛋白质亚基可在不同的细胞系中表达，然后汇集用于关联到多聚蛋白中或可选地不同的亚基可以在相同的细胞系中表达。在相同的细胞系中的亚基的表达具有缺点，其中不是所有的蛋白质亚基将关联到正确的形式，从而导致不同种类的混合物。为了产生双特异性抗体，很常见的是将生产显著水平的同源二聚体而不是所希望的异源二聚体，这大大影响双特异性抗体的生产产量。虽然可以通过各种纯化技术除去不希望的同源二聚体，理想的是具有其中异源二聚体以比同源二聚体高的水平表达的宿主细胞系，以减少浪费在下游处理中的时间和成本。

因此，需要一种这样的表达系统，其可用于选择以高水平表达目的产物的(多个)细胞克隆，即定量选择。还需要能够选择表达具有所需质量的目的产物的(多个)细胞克隆，即定性选择，例如目的异源多聚蛋白质的表达。

发明内容

本发明涉及用于通过可溶性目的多肽的选择性剪接的表达的表达构建体或构建体集，其中所述可溶性肽的一部分被分泌到细胞外空间并且一部分在(多个)细胞的外膜上呈现。

本发明还包括用于选择包含根据本发明的一个或多个构建体的宿主细胞的方法，所述宿主细胞在其外膜上以期望的水平呈现目的多肽。

本发明还涉及通过检测目的异源二聚体蛋白质在包括根据本发明的一个或多个构建体的(多个)细胞上的膜呈现来选择表达所分泌的异源二聚体蛋白质的(多个)细胞。

在第一方面，本发明提供了一种表达构建体，其在5'至3'方向上包含：

启动子；

编码目的多肽的第一外显子；

剪接供体位点，内含子和剪接受体位点，其中第一终止密码子位于剪接供体位点和所述内含子内的剪接受体位点之间；

编码跨膜区的第二外显子，所述跨膜区是经修饰的免疫球蛋白跨膜区或非免疫球蛋白跨膜区；

第二终止密码子；和

多聚腺苷酸化位点；

其中当进入宿主细胞时，第一外显子和第二外显子的转录导致目的多肽表达和一定比例的目的多肽在宿主细胞的外膜上呈现。

根据本发明的另一个方面，通过构建体的第二外显子编码的跨膜区包含至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个氨基酸残基。

根据本发明的另一个方面，通过构建体的第二外显子编码的跨膜区包含不超过48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26个氨基酸残基。

特别地，跨膜区可包含17和29个之间的残基、19和26个之间的残基或21和24个之间的残基。

根据本发明，修饰的免疫球蛋白跨膜区或修饰的非免疫球蛋白跨膜区可以是天然存在的免疫球蛋白或非免疫球蛋白跨膜区的任何修饰版本。

本发明人已修饰不同的跨膜区组，以便改变它们的性质，特别是调节它们整合到细胞膜中，从而呈现目的多肽。特别是可以改变跨膜区的氨基酸组成，以便通过一个或多个残基减少或增加其中的非疏水残基的数目，以及提高或降低跨膜区的大小。

本发明的发明人惊奇地发现，使用非免疫球蛋白跨膜区例如鼠B7-1跨膜区(SEQID NO：173)导致与使用IgG1跨膜区所观察到的水平相比高水平的细胞膜表达。

本发明人还测试了来自ACLV1(NP_001070869.1)SEQ ID NO:174、ANTR2(NP_477520.2)SEQ ID NO:175、CD4(NP_000607.1)SEQ ID NO:176、PTPRM(NP_002836.3)SEQ IDNO:177、TNR5(NP_001241.1)SEQ ID NO:178、ITB1(NP_596867.1)SEQ ID NO:179、IGF1R(NP_000866.1)SEQ ID NO:181、1B07(NP_005505.2)SEQ ID NO:180、TRMB(NP_000352.1)SEQ ID NO:182、IL4RA(NP_000409.1)SEQ ID NO:183、LRP6(NP_002327.2)SEQ ID NO:184、GpA(NP_002090)SEQ ID NO:185、PTCRA(NP_001230097.1)SEQ ID NO:186的其它跨膜区以及这些跨膜区的修饰版本，并且表明了这些适用于根据本发明的(多种)构建体。

根据本发明的另一个方面，第一终止密码子位于内含子的剪接供体位点的3'。

在一个实施方案中，本发明还提供了用于改变给定的构建体中观察到的剪接比的方法，从而足够量的多肽在细胞膜上呈现以实现细胞选择，尽管大部分的多肽可溶性地表达。

发明人已经测试了所要求保护的表达构建体的不同组分，使它们能够调节目的蛋白质的膜呈现。

根据本发明，可溶性多肽的表达水平可以通过在如本文所述的表达构建体的内含子中包括多聚(A)位点来增加。

根据本发明的一个方面，构建体可以包括位于启动子和第一外显子之间的组成型内含子(constitutive intron)。

根据本发明，可以修饰剪接受体和剪接供体的强度，以便增加或减少在细胞膜上呈现的目的蛋白质的量。

特别地，通过减少或增加存在于构建体中的剪接供体位点的序列与共有剪接供体位点序列(C/A)AGGT(A/G)AGT(SEQ ID NO:345)的％同一性或相似性可以修饰剪接供体位点的共有序列。

在进一步的实施方案中，修饰剪接供体位点的共有序列以便降低剪接供体强度。可通过替代密码子使用修饰剪接供体位点的共有序列，例如通过用编码赖氨酸的AAG取代编码赖氨酸的AAA。这将减少膜表达的水平。相反，通过增加剪接供体位点与共有剪接供体位点序列(C/A)AGGT(A/G)AGT(SEQ ID NO:345)的％同一性或相似性，这会增加构建体中的剪接供体位点的强度并增加膜表达的水平。

根据本发明的一个方面，剪接供体位点与第一外显子的3'末端和内含子的5'末端部分重叠并且内含子的剪接受体位点位于内含子的3'末端。

根据本发明的一个方面，第一终止密码子位于剪接供体位点的3'。

根据表达构建体的内含子任选地包括包含在剪接受体位点中的多聚(Y)道(poly(Y)tract)。可以修饰包括在表达构建体的内含子的剪接受体位点中的多聚(Y)道的Y含量。改变多聚(Y)道中的嘧啶碱基(Y)的数量可以用于减少或增加目的多肽的细胞膜表达。对于由细胞高水平地膜表达的目的多肽，降低多聚(Y)道中的Y的数量将降低膜表达的水平。对于由细胞低水平地膜表达的多肽，增加多聚(Y)道中的Ys的数量将增加膜表达的水平。

特别地，通过改变剪接受体位点的多聚(Y)含量，可以减少剪接受体的多聚(Y)含量，从而减小剪接受体位点的强度，因此降低目的多肽的膜呈现。

可选地，通过改变剪接受体位点的多聚(Y)含量，可以增加剪接受体的多聚(Y)含量，以便增加剪接受体位点的强度，因此增加目的多肽的膜呈现。

除了上面提到的修饰，导致膜呈现的多肽的选择性剪接事件也可以通过修饰分支点区域的序列的DNA(因此RNA)影响。分支点区域的核苷酸通过攻击内含子在5'剪接位点的的第一个核苷酸启动剪接事件，从而形成套索中间体。相对于共有序列(CTRAYY SEQ IDNO:347)改变分支点区域的序列可以对剪接事件的启动的效果产生影响从而对分泌的多肽相对于膜呈现的多肽的比率产生影响。

此外，内含子的长度可以影响剪接比。已证明，当外显子上游紧接的内含子缩短时，在CD44中包括选择性外显子的可能性增加(Bell,M.,Cowper,A.,Lefranc,M.,Bell,J.and Screaton,G.(1998).Influence of Intron长度on Alternative Splicing ofCD44Mol Cell Biol.18(10):5930–5941。)。因此，修饰构建体的进一步的方法是缩短选择性剪接构建体中的内含子的长度，以便增加膜呈现的多肽的份数，或反之亦然。

影响剪接事件的另外的机制是导致外显子纳入或跳过的RNA结合蛋白的共表达。例如蛋白质CUG-BP(Uniprot Acc.-否.:Q5F3T7)和肌盲样3(MBNL)(Uniprot Acc.-否.:Q5ZKW9)已经被证明影响表达EGFP和dsRED的构建体中的剪接比(Orengo等人，2006)。

因此，本发明还提供了进一步修饰的构建体，其包含编码引起外显子纳入或跳过的RNA结合蛋白的可表达ORF。以及涉及根据本发明的构建体的共转染的方法，其包含编码引起外显子纳入或跳过的RNA结合蛋白的可表达ORF和/或包含此类ORF的单独构建体。

此外，大多数膜蛋白在到达细胞表面之前穿过内质网(ER)和高尔基体。从ER输出是由从ER出口的部位萌芽的外被体复合体II(COPII)运输小泡介导的选择性过程。COPII运输小泡的组分与具有线性二羧酸，膜锚定蛋白的胞质结构域中的疏水和芳香族基序或结构基序的短氨基酸序列之间的相互作用在ER出口点集中货物蛋白并促进货物招募到COPII小泡中。这些短的直链或结构性的氨基酸序列基序被称为ER出口信号。

因此，调整目的蛋白质的膜呈现的另一种方法是包括或不包括ER出口信号，以便修饰与跨膜区融合的目的多肽的ER通道。包含在构建体中以便增加ER出口的ER出口信号的修饰可用于增加具有低半衰期或其它稳定性或降解问题的蛋白的膜呈现，反之亦然。

本发明的发明人已经发现，在细胞膜上呈现的目的多肽的量与可溶性多肽的表达水平成正比。因此，以高滴度表达目的多肽的宿主细胞比以低滴度表达多肽的宿主细胞在膜上呈现更多的多肽。

在本发明的一个方面，由表达构建编码的多肽可以是蛋白质多聚体例如异源多聚多肽的一部分，如重组抗体或其片段。该抗体片段可以选自以下组成的组：Fab、Fd、Fv、dAb、F(ab’)₂和scFv。在一个优选的实施方案中，通过表达构建体表达的多肽可以是抗体重链或其片段。

在本发明的另一个方面中，表达构建体可用于双特异性抗体在宿主细胞中的表达。在一个实施方案中，所表达的多肽是抗体重链。可选地，所表达的多肽是连接于抗体Fc区的抗体片段。抗体片段可以选自以下组成的组：Fab,Fd、Fv、dAb、F(ab’)₂和scFv。优选的抗体片段是Fab或scFv。更优选地，抗体片段是scFv。为了实现双特异性抗体的表达，还可以提供另外的表达构建体用于抗体轻链的表达。编码抗体重链的表达构建体和具有编码宿主细胞中的抗体轻链的表达构建体的抗体片段-Fc的共表达导致双特异性抗体的表达。如上所讨论的，宿主细胞中的双特异性抗体的表达导致除期望的异源二聚体之外的许多不需要的同源二聚体种类。在本发明的一个优选实施方案中，这些双特异性抗体组分的细胞膜呈现使得能够直接选择表达主要的异源二聚抗体的宿主细胞。

本发明还提供了用于改变剪接比的方法从而足够量的多肽在细胞膜上呈现以实现细胞选择，尽管大部分的多肽可溶性地表达。

根据本发明的该方面，该方法涉及测量目的多肽的膜呈现，然后基于目的多肽的观察到的膜呈现修饰构建体的组分，从而增加或减少膜呈现以便允许更好地选择表达目的多肽的(多个)细胞。

本发明还提供一种方法以选择包含根据本发明的至少一个构建体的(多个)细胞，涉及通过检测目的蛋白质或包括目的蛋白质的异源多聚蛋白的膜表达水平来选择(多个)细胞。

附图说明

图1：本发明的选择性剪接构建体的示意图。多肽的选择性剪接产生两种剪接产物。对于剪接产物1，编码最后两个氨基酸甘氨酸(G)和赖氨酸(K)的密码子被并入mRNA中并且多肽从细胞分泌。对于剪接产物2，所述多肽不包含两个氨基酸G和K，但通过跨膜区延伸，由任选的连接区、跨膜结构域和任选的小胞内域组成并且所得的多肽不被分泌，但呈现在细胞的外膜上。

图2：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用不同的跨膜区呈现和分泌IgG1抗体。在转染后的第2天进行分析。作为阴性对照，用编码分泌的IgG1抗体(Ctrl)的非剪接构建体转染CHO-S细胞。对用不同的选择性剪接构建体转染的细胞进行的染色被表示为填充直方图并且用编码分泌的IgG1抗体的非剪接构建体转染的对照细胞的染色被包括为覆盖黑线(A-D)。使用直方图以便确定染色的细胞(E)的百分比以及选择性剪接构建体和对照的染色(G)的平均荧光。用八位装置(Octetdevice)(H)在转染后第4天测定所分泌抗体的滴度。

图3：以用于呈现和分泌IgG4抗体的选择性剪接构建体转染的CHO-S细胞的染色概况。在转染后的第2天进行分析。作为阴性对照，用编码分泌的IgG4抗体(IgG4)的非剪接构建体转染CHO-S细胞。对用选择性剪接构建体转染的细胞进行的染色被表示为填充直方图并且用编码分泌的IgG4抗体的非剪接构建体转染的对照细胞的染色被包括为覆盖黑线(A)。使用直方图以便确定染色的细胞(B)的百分比以及选择性剪接构建体和对照的染色(D)的平均荧光。用八位装置(C)在转染后第4天测定所分泌抗体的滴度。

图4：使用选择性剪接技术在细胞膜上呈现双特异性抗体的特异性检测。在转染后的第2天染色细胞。使用PE缀合的山羊抗人Fcγ特异性抗体(A-C，J-L)检测Fc片段(scFv-Fc和HC)。使用鼠抗人κLC APC标记的抗体(D-F，M-O)检测κ轻链。使用FITC标记的蛋白A进行scFv-Fc的染色。为转染的细胞进行的染色被表示为填充的直方图。对于第一转染混合物(A，D，G)，对非转染细胞获得的概况被表示为为覆盖(黑线)。对于所有其他实验(B，C，E，F和H-R)阴性对照(对无跨膜结构域的转染细胞获得的概况)呈现为覆盖(虚线)。

图5：瞬时转染后第6天分泌的和scFv-Fc同源二聚体分子的滴度。

图6：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于包括不同的跨膜区和表达构建体的不同修饰的IgG1抗体的呈现和分泌。在转染后的第二天进行分析。作为阴性对照，用编码分泌的IgG1抗体(对照)的非剪接构建体转染CHO-S细胞。

图7：用于在CHO-S细胞中转染的IgG1抗体的呈现和分泌的不同选择性剪接构建体的标准化的表达水平。使用八位QK设备和蛋白A生物探针分析上清液(标准HC：无选择性剪接的对照)。

图8：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用B7-1跨膜区和剪接受体的多聚(Y)道的不同Y含量呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阴性对照，用编码分泌的IgG4抗体(ctrl)的非剪接构建体转染CHO-S细胞。对用不同的选择性剪接构建体转染的细胞进行的染色被表示为为填充直方图并且用编码分泌的IgG1抗体的非剪接构建体转染的对照细胞的染色被包括为覆盖黑线(A-G)。使用直方图以便确定染色的细胞(H)的百分比以及选择性剪接构建体和对照的染色(J)的平均荧光。用八位装置(I)在转染后第4天测定所分泌抗体的滴度。

图9：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用B7-1跨膜区和剪接供体共有序列的修饰呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阴性对照，用编码分泌的IgG1(ctrl)的非剪接构建体转染CHO-S细胞。对用不同的选择性剪接构建体转染的细胞进行的染色被表示为为填充直方图并且用编码分泌的IgG1抗体的非剪接构建体转染的细胞的染色被包括为覆盖黑线(A-G)。使用直方图以便确定染色的细胞(D)的百分比以及选择性剪接构建体和对照的染色(F)的平均荧光。用八位装置(E)在转染后第4天测定所分泌抗体的滴度。

图10：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用具有22-23个疏水氨基酸的不同的跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照，转染用包括B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照，用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-G)。使用直方图以便确定染色的细胞(H)的百分比以及选择性剪接构建体和对照的染色(I)的平均荧光。用八位装置(G)在转染后第4天测定所分泌抗体的滴度。

图11：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用具有21-24个包含疏水、极性和带电残基的疏水氨基酸的不同的跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照，转染用包括B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照，用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-H)。对用使用PTCRA跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用编码分泌的IgG1抗体的非剪接构建体转染的细胞的染色被包括为覆盖黑线(I)。使用直方图以便确定染色的细胞(J)的百分比以及选择性剪接构建体和对照的染色(L)的平均荧光。用八位装置(G)在转染后第4天测定所分泌抗体的滴度。

图12：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用包括PTCRA跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体，所述PTCRA跨膜结构域具有PTCRA跨膜结构域中的疏水残基数量的变化。在转染后的第二天进行分析。作为阳性对照，转染用B7-1跨膜区和野生型PTCRA跨膜结构域编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照，用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用PTCRA跨膜结构域的不同修饰编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用B7-1跨膜区和野生型PTCRA跨膜结构域的构建体转染的细胞的染色被包括为覆盖黑线(B-H)。使用直方图以便确定染色的细胞(I)的百分比以及选择性剪接构建体和对照的染色(K)的平均荧光。用八位装置(J)在转染后第4天测定所分泌抗体的滴度。

图13：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用具有17-19个包含疏水、极性和带电残基的疏水氨基酸的不同的跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照，转染用包括B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照，用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-D)。使用直方图以便确定染色的细胞(E)的百分比以及选择性剪接构建体和对照的染色(G)的平均荧光。用八位装置(F)在转染后第4天测定所分泌抗体的滴度。

图14：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用具有26-27个包含疏水、极性和带电残基的疏水氨基酸的不同的跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照，转染用包括B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照，用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-E)。使用直方图以便确定染色的细胞(F)的百分比以及选择性剪接构建体和对照的染色(H)的平均荧光。用八位装置(G)在转染后第4天测定所分泌抗体的滴度。

图15：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用具有缩短的或延长的B7-1跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照，转染用包括野生型B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照，用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1野生型跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-E)。使用直方图以便确定染色的细胞(F)的百分比以及选择性剪接构建体和对照的染色(H)的平均荧光。用八位装置(G)在转染后第4天测定所分泌抗体的滴度。

图16：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用具有不同的胞质尾的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照，转染用包括B7-1胞质尾的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照，用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的胞质尾编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1胞质尾的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-N)。使用直方图以便确定染色的细胞(O)的百分比以及选择性剪接构建体和对照的染色(Q)的平均荧光。用八位装置(P)在转染后第4天测定所分泌抗体的滴度。

图17：用选择性剪接构建体转染的CHO-S细胞的染色概况，所述选择性剪接构建体用于使用具有不同的胞质尾的M1M2跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照，转染用包括M1M2胞质尾的M1M2跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照，用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用具有B7-1胞质尾的M1M2跨膜区编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括M1M2胞质尾的M1M2跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B)。使用直方图以便确定染色的细胞(C)的百分比以及选择性剪接构建体和对照的染色(E)的平均荧光。用八位装置(D)在转染后第4天测定所分泌抗体的滴度。

图18：BEAT双特异性抗体的三个亚基的装配变体(assembly variant)。

图19：在选定的稳定细胞池的双κ轻链(LC)和Fc片段染色后得到的点图的实施例。通过细胞膜上的染色检测到的潜在分子被显示在右侧。使用PE缀合的山羊抗人Fcγ特异性抗体检测Fc片段。使用小鼠抗人κLC APC标记的抗体检测κ轻链。

图20：用选择性剪接载体转染的稳定池的表面染色和分泌概况之间的相关性。所绘制的Q6*和Q7*百分比是指100％是整个生产细胞种群(不包括Q8)。

图21：细胞分选前在稳定的细胞池的表面染色后得到的点图。染色使用可溶性靶标1和2用于检测细胞表面呈现的粘合物(binder)。通过细胞膜上的染色检测到的潜在分子在相应的象限中表示。

图22：在14天分批补料的上清液中检测到的分子的级分与在其细胞表面上呈现表型的细胞级分之间的相关性。

图23：对用选择性剪接构建体转染的选定的稳定细胞池获得的测量表面Fc概况的实施例。使用PE缀合的山羊抗人Fcγ特异性抗体检测存在于细胞膜上的IgG。在FSC对SSC点图中圈门活细胞(A中的gl)以显示所测试的选择性剪接池的荧光分布(填充直方图，B)。缺乏选择性剪接构建体的IgG分泌克隆的染色用作阴性对照并表示为覆盖(虚线)。

图24：表面染色强度和批处理期间测定的分泌细胞的表达水平之间的相关性：表面强度和在补充一批(A)的第1天的IgG滴度之间的相关性以及第1天的表面强度和对数生长期(第1-3天)期间测量的qP之间的相关性(B)。

图25：第1天的表面染色强度预测第7天的累积分泌的IgG。

图26：根据IgG表面呈现选择高生产者。通过流式细胞术细胞分选选择在它们的细胞膜上呈现“低”，“中”和“高”密度的IgG的细胞(A)。在分选之后的第二周确定表面荧光的分布(B)并且在补充批中评价分选的克隆的单位生产率(C)。

具体实施方式

本发明提供了表达构建体以及用于多肽特别是异源多聚多肽的细胞膜表达的方法。特别地，目的蛋白质可以是使用选择性剪接的宿主细胞中的重组抗体或其片段或双特异性抗体。细胞膜呈现的水平指示重组宿主细胞中的多肽的分泌水平并且对于异源二聚抗体细胞膜呈现也指示分泌概况，即异源二聚体或同源二聚体表达。

如本文中可互换使用的术语“表达构建体”或“构建体”包含多核苷酸序列，所述多核苷酸序列编码待表达的多肽和控制其表达的序列如启动子以及任选地增强子序列，包括顺式作用转录性控制单元的任何组合。控制基因表达(即其转录和转录产物翻译)的序列常称作调节单元。调节单元的大多数部分位于基因的编码序列上游并与之有效连接。表达构建体也可以含有包含多聚(A)位点的下游3'非翻译区。

本发明的调节单元与待表达的基因即转录单位有效连接，或由间插DNA例如异源基因的5'-非翻译区(5’UTR)分隔。优选地，表达构建体侧翼为一种或多种合适的限制性位点以便可以将表达构建体插入载体中和/或将其从载体切除。因而，本发明的表达构建体可以用于构建表达载体，尤其哺乳动物表达载体。

如本文所用的术语“编码多肽的多核苷酸序列”包括编码表达所述多肽的基因、优选地异源基因的DNA。

术语“异源编码序列”、“异源基因序列”、“异源基因”、“重组基因”或“基因”互换使用。这些术语指这样的DNA序列，所述DNA序列编码设法在宿主细胞中、优选地在哺乳动物细胞中表达并收获用于进一步使用的重组多肽，尤其重组异源蛋白产物。基因的产物可以是多肽。异源基因序列可以不天然地存在于宿主细胞中并且源自相同或不同物种的生物并且可以是基因修饰的。可选地，异源基因序列天然地存在于宿主细胞中。

术语“蛋白质”和“多肽”互换地用来包括通过相邻残基的α-氨基和羧基之间的肽键彼此连接的一串氨基酸残基。

如本文所用的术语“启动子”限定一般位于基因上游的调节性DNA序列，所述调节性DNA序列通过指导RNA聚合酶与DNA结合并启动RNA合成介导转录的起始。用于本发明的启动子包括提供高水平表达的例如病毒、哺乳动物、昆虫和酵母启动子，例如哺乳动物巨细胞病毒或CMV启动子、SV40启动子或适用于在真核细胞中表达的本领域已知的任何启动子。特别适用于本发明的表达构建体的启动子可以选自以下组成的列表：SV40启动子、人tk启动子、MPSV启动子、小鼠CMV、人CMV、大鼠CMV、人EF1α、中国仓鼠EF1α、人GAPDH、包括MYC、HYK和CX启动子的杂合启动子、基于转录因子结合位点的重排的合成启动子。本发明的特别优选的启动子是小鼠CMV启动子。

术语“5'非翻译区(5'UTR)”指的是前mRNA或成熟mRNA的5'端中的非翻译段。在成熟mRNA上，5'UTR通常在其5'端藏匿7-甲基鸟苷帽并参与许多过程，如剪接、聚腺苷酸化、朝向细胞质的mRNA输出，通过翻译机械识别mRNA的5'端和防止mRNA降解(Cowling VH(2010)Biochem J,425:295-302)。

术语“内含子”是指转录和存在于前mRNA中但由基于剪接供体位点和剪接受体位点(分别位于内含子的5'和3'端)的序列的剪接机械切除，并且因此不存在于成熟mRNA转录物中的核酸非编码序列的片段。通常内含子具有内部位点，称为分支点，位于3'剪接位点的上游的20个和50个核苷酸之间。本发明中使用的内含子的长度可以是50至10000个核苷酸长。缩短的内含子可包含50个或更多个核苷酸。全长内含子可包括超过10000个核苷酸。适用于本发明的表达构建体的内含子可以选自以下组成的列表：合成或人造内含子；或天然存在的内含子，如β-球蛋白/IgG嵌合内含子，β-球蛋白内含子，IgG内含子，小鼠CMV第一内含子，鼠CMV第一内含子，人CMV第一内含子，Ig可变区内含子和剪接受体位点(Bothwell etal.,(1981)Cell,24:625-637；US5,024,939)，鸡TNT基因的内含子和EF1α的第一内含子或其修饰版本。

本发明中使用的内含子可具有来自不同的内含子的剪接受体和剪接供体位点，例如内含子可以包括来自人IgG内含子的剪接供体位点，例如ighg1基因的剪接供体位点和来自鸡cTNT内含子4的剪接受体位点。

在一个优选的实施方案中，内含子包括来自人IgG内含子的剪接供体位点和来自鸡cTNT内含子4的剪接受体位点。更优选的是包含来自人IgG内含子的剪接供体位点以及选自由鸡TNT内含子4(SEQ ID NO：69)和衍生自鸡TNT内含子4的构建体(SEQ ID NOs：70-78)组成的组的剪接受体。

术语“外显子”是指被转录成mRNA并在剪接之后保持在成熟mRNA中的核酸序列的片段。

术语“剪接位点”是指能够由真核细胞的剪接机制识别为适合于被切割和/或连接到相应的剪接位点的特定的核酸序列。剪接位点允许存在于前mRNA转录物中的内含子的切除。通常将剪接位点的5'部分称为剪接供体位点和将3'对应的剪接位点称为剪接受体位点。术语剪接位点包括，例如，天然存在的剪接位点，工程化的剪接位点，例如，合成的剪接位点，典型或一致剪接位点，和/或非典型剪接位点，例如，隐蔽剪接位点。适用于本发明的表达构建体的剪接供体或受体位点可以选自以下组成的列表：来自β-球蛋白/IgG嵌合内含子的剪接供体和受体、来自β-球蛋白内含子的剪接供体和受体、来自IgG内含子的剪接供体和受体、来自小鼠CMV第一内含子的剪接供体和受体、来自大鼠CMV第一内含子的剪接供体和受体、来自人CMV第一内含子的剪接供体和受体、来自Ig可变区内含子和剪接受体序列的剪接供体和受体(Bothwell et al.,(1981)Cell,24:625-637；US5,024,939)、来自鸡TNT基因的内含子的剪接供体和受体以及来自EF1α基因的第一内含子或其融合构建体的剪接供体和受体。在优选的实施方案中，剪接供体位点来自人IgG内含子并且剪接受体位点选自由鸡TNT内含子4(SEQ ID NO：69)和衍生自鸡TNT内含子4的构建体(SEQ ID NOs：70-78)组成的组。

如本文中所使用的术语剪接供体区域的共有序列是指在“Molecular Biology ofthe Cell”(Alberts et al.,Garland Publishing,New York 1995)中描述的序列(C/A)AGGU(A/G)AGU(下划线的序列是内含子的一部分)SEQ ID NO：345。

如本文所用的术语剪接受体区域的共有序列是指在“Molecular Biology of theCell”(Alberts et al.,Garland Science,New York 2002)中描述的序列CTRAYY---poly (Y)tract---NCAGG(下划线的序列是内含子的一部分；斜体：分支点区域)SEQ ID NO：346。

术语“终止密码子”是指信号终止蛋白质合成的三种终止密码子(TAA(RNA:UAA),TAG(RNA:UAG)和TGA(RNA：UGA))中的任一个。为了避免不完全终止效率或终止密码子的“泄漏”，2,3-或多个终止密码子可以用于蛋白合成的信号终止。

术语“跨膜区”是指由核酸序列编码的多肽或蛋白质并且其包括可选的胞外部分、跨膜结构域和任选的胞质尾。跨膜结构域是任何三维蛋白质结构，该结构在膜中热力学稳定，并且通常包括跨膜蛋白的单一跨膜α螺旋，主要由疏水氨基酸组成。跨膜结构域的长度为平均21个氨基酸，但可以在4至48个氨基酸之间变化(Baeza-Delgado等人，2012)。跨膜区包含任选的氨基酸的N-末端胞外连接伸展和跨膜结构域。在一些实施方案中，跨膜区可进一步包括C末端胞质氨基酸伸展或胞内结构域。在人ighgl基因中发现的跨膜区例如由被两个结构域M1和M2跟随的氨基酸的连接伸展组成(该跨膜区将被称为“M1M2”或“IgG1跨膜区”)。本发明中使用的跨膜区包括，但不限于，人血小板衍生的生长因子受体(PDGFR)基因(Swissprot条目P33681)、人脱唾液酸糖蛋白受体(Swissprot条目P07306)、人和鼠B7-1(人：Swissprot条目P33681和小鼠：Swissprot条目Q00609)、人ICAM-1(Swissprot条目P05362)、人erbb1(Swissprot条目P00533)、人erbb2(Swissprot条目P04626)、人erbb3(Swissprot条目P21860)、人erbb4(Swissprot条目Q15303)、人成纤维细胞生长因子受体，如FGFR1(Swissprot条目P11362)、FGFR2(Swissprot条目P21802)、FGFR3(Swissprot条目P22607)、FGFR4(Swissprot条目P22455)、人VEGFR-1(Swissprot条目P17948)、人VEGFR-2(Swissprot条目P35968)、人促红细胞生成素受体(Swissprot条目P19235)、人PRL-R、催乳素受体(Swissprot条目P16471)、人EphAl、肝配蛋白A型受体1(Swissprot条目P21709)、人胰岛素(Swissprot条目P06213)、胰岛素样生长因子1受体(IGFR1、Swissprot条目P08069，SEQ ID NO：181)、人受体样蛋白酪氨酸磷酸酶(Swissprot条目Q12913、P23471、P23467、P18433、P23470、P23469、P23468)、人神经毡蛋白(Swissprot条目P014786)、人主要组织相容性复合体类II(α和β链)、人整合素(α和β家族)、人多配体聚糖、人髓鞘蛋白、人钙粘素、人小突触泡蛋白-2(Swissprot条目P63027)、人血型糖蛋白-A(GpA，Swissprot条目P02724，SEQ ID NO：185)、人Bnip3(Swissprot条目Q12983)、人APP(Swissprot条目P05067)、淀粉体蛋白前体蛋白(Swissprot条目P0DJI8)、人T细胞受体α基因(PTCRA，Swissprot条目PQ6ISU1，SEQ ID NO：186)和T细胞受体β、CD3γ(Swissprot条目P09693)、CD3δ(Swissprot条目P04234)、CD3ζ(Swissprot条目P20963)、和CD3ε(CD3E，Swissprot条目P07766，SEQ IDNO：197)、人丝氨酸/苏氨酸-蛋白激酶受体R3(ACVL1，Swissprot条目P37023，SEQ ID NO：174)、人炭疽毒素受体2(ANTR2，Swissprot条目P58335，SEQ ID NO：175)、人T细胞表面糖蛋白CD4(CD4，Swissprot条目P01730，SEQ ID NO：176)、人受体型酪氨酸-蛋白质磷酸酶μ(PTPRM，Swissprot条目P28827，SEQ ID NO：177)、人肿瘤坏死因子受体超家族成员5(TNR5，Swissprot条目P25942，SEQ ID NO：178)。人整合素β-1(ITB1，Swissprot条目P05556，SEQID NO：179)、人HLAI类组织相容性抗原、B-7α链(Swissprot条目P01889，SEQ ID NO：180)、人血栓调节蛋白(TRBM，Swissprot条目P07204，SEQ ID NO：182)、人白细胞介素-4受体亚基α(IL4RA，Swissprot条目P24394，SEQ ID NO：183)、人低密度脂蛋白受体相关蛋白6(LRP6，Swissprot条目075581，SEQ ID NO：184)、人高亲和力免疫球蛋白ε受体亚基α(FCERA，Swissprot条目P12319，SEQ ID NO：194)、人杀伤细胞免疫球蛋白样受体2DL2(KI2L2，Swissprot条目P43627，SEQ ID NO：195)、人细胞因子受体常见亚基β(IL3RB，Swissprot条目P32927，SEQ ID NO：196)、人整合素α-IIb(ITA2B，Swissprot条目P08514，SEQ ID NO：198)、人T细胞特异性表面糖蛋白CD28(CD28，Swissprot条目P10747，SEQ ID NO：199)的跨膜区。

在一个优选的实施方案中，本发明中使用的跨膜区选自由人B7-1跨膜区、鼠B7-1跨膜区、PDGFR跨膜区、人脱唾液酸糖蛋白受体跨膜区和erbb-2跨膜区组成的组。更优选的是鼠B7-1跨膜区，最优选的是如SEQ ID NO：66所示的鼠B7-1跨膜区。

免疫球蛋白跨膜区包括来自人免疫球蛋白基因IGHA1(NCBI登录号：M60193)、IGHA2(NCBI登录号：M60194)、IGHD(NCBI登录号：K02881)、IGHE(NCBI登录号：X63693)、IGHG1(NCBI登录号：X52847)、IGHG2(NCBI登录号：AB006775)、IGHG3(NCBI登录号：D78345)、IGHG4(NCBI登录号：AL928742)、IGHGP(NCBI登录号：X52849)、IGHM(NCBI登录号：X14940)的跨膜区以及来自鼠免疫球蛋白基因IGHA1(NCBI登录号：K00691)、IGHD(NCBI登录号：J00450)、IGHE(NCBI登录号：X03624，U08933)、IGHG1(NCBI登录号：J00454，J00455)、IGHG2A(NCBI登录号：J00471)、IGHG2B(NCBI登录号：J00462，D78344)、IGHG3(NCBI登录号：X00915，V01526)、IGHM(NCBI登录号：J00444)的跨膜区。

在本发明的一个实施方案中，所使用的跨膜区是不包含由免疫球蛋白基因编码的跨膜区的非免疫球蛋白跨膜区，尤其是不包括由人免疫球蛋白基因IGHA1(NCBI登录号：M60193)、IGHA2(NCBI登录号：M60194)、IGHD(NCBI登录号：K02881)、IGHE(NCBI登录号：X63693)、IGHG1(NCBI登录号：X52847)、IGHG2(NCBI登录号：AB006775)、IGHG3(NCBI登录号：D78345)、IGHG4(NCBI登录号：AL928742)、IGHGP(NCBI登录号：X52849)、IGHM(NCBI登录号：X14940)编码的跨膜区并且不包括由鼠免疫球蛋白基因IGHA1(NCBI登录号：K00691)、IGHD(NCBI登录号：J00450)、IGHE(NCBI登录号：X03624，U08933)、IGHG1(NCBI登录号：J00454，J00455)、IGHG2A(NCBI登录号：J00471)、IGHG2B(NCBI登录号：J00462，D78344)、IGHG3(NCBI登录号：X00915，V01526)，IGHM(NCBI登录号：J00444)编码的跨膜区的非免疫球蛋白跨膜区。

术语“多聚(Y)区”是指内含子的分支点和内含子-外显子边界之间发现的一段核酸。该段核酸具有大量的嘧啶(Y)，这意味着具有大量的嘧啶碱基C或T。

术语“3'非翻译区(3'UTR)”是指预mRNA或成熟mRNA的3'端的非翻译片段。在成熟mRNA上，这一区域藏匿聚(A)尾并已知在mRNA稳定性、翻译起始和mRNA输出方面具有许多作用(Jia J et al.,(2013)Curr Opin Genet Dev,23(1):29-34)。

如本文所用的术语“增强子”限定一种核苷酸序列，该核苷酸序列作用为使激动基因转录成为可能，所述基因转录与基因的身份、该序列相对于基因的位置或序列的取向无关。本发明的载体任选地包含增强子。

术语“聚腺苷酸化信号”或“多聚(A)信号”或“多聚(A)”或“多聚(A)位点”是指存在于mRNA转录中的核酸序列，其在存在聚(A)聚合酶时允许转录在位于聚(A)信号下游的10至30个碱基的聚腺苷酸化位点上被聚腺苷酸化。许多聚(A)信号是本领域公知的并且可以用于本发明。实例包括人类变体生长激素多聚(A)信号，SV40晚期多聚(A)信号和牛生长激素多聚(A)信号。

术语“功能性连接”和“有效连接”互换使用并且指两个或更多个DNA区段、尤其待表达基因序列和控制其表达的那些序列之间的功能关系。例如，如果启动子和/或增强子序列(包括顺式作用转录性控制元件的任何组合)在适宜的宿主细胞或其他表达系统中刺激或调节编码序列的转录，则它与编码序列有效连接。与转录的基因序列有效连接的启动子调节序列是在物理上与转录的序列邻接的。

“取向”指给定DNA序列中的核苷酸顺序。例如，DNA序列相对于另一个DNA序列以相反方向的取向是这种情况，其中与从其中获得该序列的DNA中的参照点相比时，该序列相对于另一个序列的5'至3'顺序反转。这类参考点可以包括源DNA中转录其他指定DNA序列的方向和/或含有该序列的复制型载体的复制起点。

如本文所用的术语“核酸序列同源性”或“核苷酸序列同源性”包括在比对序列和根据需要引入缺口以达到最大百分数序列同一性之后，候选序列中的与例如比较序列的核苷酸序列相同的核苷酸的百分比。因此，可以通过常用来比较两个核苷酸序列的核苷酸位置中相似性的标准方法确定序列同一性。

如本文所用的术语“表达载体”包括分离和纯化的DNA分子，所述分子在转染入适宜的宿主细胞时在宿主细胞内部提供重组基因产物的合适的表达水平。除编码重组或基因产物的DNA序列之外，表达载体还包含宿主细胞系中将DNA编码序列有效转录成mRNA并将mRNA有效翻译成蛋白质所需要的调节性DNA序列。

如本文所用的术语“宿主细胞”或“宿主细胞系”包括能够在培养物中生长并表达所需重组产物蛋白质的任何细胞、尤其哺乳动物细胞。

可以以各种表达系统，如原核(例如大肠杆菌)、真核(例如酵母、昆虫、骨架动物、哺乳动物)，和体外表达系统来生产重组多肽和蛋白质。用于大规模生产基于蛋白质的生物制剂的最常用方法依赖于通过DNA载体的转染将遗传物质导入宿主细胞。可用宿主细胞的瞬时转染来实现多肽的瞬时表达。将载体DNA整合到宿主细胞基因组中导致被稳定转染的细胞系并且这样的稳定的细胞系的繁殖可用于大规模生产多肽和蛋白质。

用于通过选择性剪接在真核细胞中生产多个多肽的方法在WO2005/089285中描述。两种不同的表达盒在单一的启动子的控制下，其中表达盒具有剪接位点，这允许其选择性剪接和表达为处于期望比例的两种或多种独立的基因产物。

然而本发明人已经发现，这种方法对于可溶性多肽变体和等离子体膜结合变体的表达有限制，因为将产生两种完全独立的蛋白质，因此，等离子体膜结合变体并不代表可溶性多肽变体的期望的产物质量。

用于选择表达异源性蛋白质的真核细胞的方法以及来自可选地可剪接的核酸的可溶性多肽变体和等离子体膜结合变体的表达在WO2007/131774中描述。等离子体膜结合变体被连接到表达其的细胞并可以用作标记以分离已成功被转染的细胞。

然而本发明人已经发现，因为没有办法来控制可溶性多肽的表达与膜呈现多肽的比值，因此这种方法是有限制的。如上所述的选择性剪接是一种方法，通过该方法可以表达多肽的不同变体，但由于选择性剪接的机制是高度可变的，而没有任何控制剪接比的能力，因此所表达的多肽变体的量会变化。

因此，这样的一种细胞表达系统将具有降低的可溶性多肽的滴度，通过所述细胞表达系统所表达的多肽的一部分被重新定向以在细胞膜上表达。尽管多肽的细胞膜表达是分离高表达克隆的有用标记，如果没有任何形式的对细胞膜上表达的多肽的量的控制，可溶性多肽的滴度可显著降低。此外，在相同的培养条件下没有任何两个多肽以相同的水平表达，因此，为一种多肽的可溶性和细胞膜表达开发的方法不太可能适用于所有的多肽。

与前面描述的选择性剪接方法相反，本申请人已经设计了用于可溶性的多肽和细胞膜呈现的多肽两者的表达的选择性剪接方法，其中表达构建体的组分可以被修饰，以优化所表达的可溶性多肽的量而仍然允许足以实现细胞克隆选择的量的多肽的细胞膜表达。

在本发明的用于抗体重链的表达的示例性表达构建体中，IgG1重链恒定区包含终止分泌重链的开放阅读框的终止密码子的弱剪接供体上游。剪接受体位点和编码跨膜区的DNA序列后跟终止密码子和位于终止密码子的3'的多聚(A)位点，使得跨膜区在剪接后在具有IgG1重链的开放阅读框的框中。所得选择性开放阅读框分别由终止密码子和多聚(A)位点终止。本申请人已经发现，通过修饰该表达构建体，他们可以改变剪接比，因此，可溶性多肽的量相对于膜呈现多肽。

这些修饰可以包括，例如，使用异源的跨膜区。IgG1的天然存在的跨膜区由氨基酸的连接伸展和结构域M1和M2构成。通过是非免疫球蛋白跨膜区的跨膜区置换IgG1跨膜区，例如通过用鼠B7-1跨膜区置换，可以增加膜呈现多肽的量。如在实施例2的图2中所示，瞬时转染细胞的几乎40％对于膜呈现的IgG1阳性，这相对于用包括IgG1跨膜区的构建体转染的细胞的百分比显著增加(高达20％)。这样的结果是令人惊奇的，因为这将可以预期，利用自然的IgG1跨膜区而不是异源跨膜区对于IgG1的细胞膜呈现将是最有效的。优选地，在本发明的表达构建体中使用的跨膜区包含这样的跨膜区，所述跨膜区选自由人血小板衍生的生长因子受体(PDGFR)基因、人脱唾液酸糖蛋白受体、人和鼠B7-1、人ICAM-1、人erbb1、人erbb2、人erbb3、人erbb4、人成纤维细胞生长因子受体如FGFR 1、FGFR2、FGFR3、FGFR4、人VEGFR-1、人VEGFR-2、人促红细胞生成素受体、人PRL-R、催乳素受体、人EphAl、肝配蛋白型-A受体1、人胰岛素、IGF-1受体、人受体样蛋白酪氨酸磷酸酶、人神经毡蛋白、人主要组织相容性复合体II类(α和β链)、人整合素(α和β家族)、人多配体聚糖、人髓鞘蛋白、人钙粘素、人小突触泡蛋白-2、人血型糖蛋白A、人Bnip3、人APP、淀粉体前体蛋白、人T细胞受体α(PTCRA)和T-细胞受体β、CD3γ、CD3δ、CD3ζ和CD3ε的跨膜区组成的组。在一个优选的实施方案中，用于本发明的跨膜区选自由人B7-1跨膜区、鼠B7-1跨膜区、PDGFR跨膜区、人脱唾液酸糖蛋白受体跨膜区和erbb-2跨膜区组成的组。更优选的是鼠B7-1跨膜区，最优选的是如SEQ IDNO：66所示的鼠B7-1跨膜区。

进一步的修饰以改变分泌多肽的量相对于膜呈现多肽的剪接比包括改变编码跨膜区的外显子的多聚嘧啶(多聚(Y))道上游中的嘧啶碱基的数目和/或修饰剪接供体和受体共有序列。降低嘧啶碱基(Y)的数量已经在实施例3中示出导致剪接比朝向分泌蛋白变化。如果构建体不包括嘧啶碱基，目的蛋白质无表面表达。使剪接比远离细胞膜表达变化的机制可能可用于在细胞膜上强烈表达但呈现较弱的可溶性表达的蛋白质。多聚(Y)道中的嘧啶碱基的数目可以包括0至30个之间的碱基。优选地，多聚(Y)道包括20个嘧啶碱基或更少，更优选15个碱基或更少，甚至更优选10个碱基或更少。

因为膜呈现蛋白质的量的增加可对可溶性多肽的滴度产生负面影响，本发明人对表达构建体开发了这样的修饰，其可以提高宿主细胞中的可溶性多肽的表达而不影响膜呈现多肽的量。据发现在内含子中添加多聚(A)位点增加可溶性多肽滴度最大达50％(对于M1M2跨膜区)，同时维持显著水平的细胞膜呈现。在本发明的进一步的实施方案中，多聚(A)位点位于表达构建体的内含子中。

在本发明的一个方面，表达构建体适用于多肽多聚体和蛋白质例如抗体或其片段或双特异性抗体或其片段。

如本文所用的术语“抗体”包括整个抗体及其任何抗原结合片段或其单链。“抗体”是指包含通过二硫键相互连接的至少两条重(H)链和两条轻(L)链，或它们的抗原结合片段的糖蛋白。每条重链由重链可变区(本文缩写为VH)和重链恒定区组成。重链恒定区由三个结构域CH1、CH2和CH3组成。每条轻链由轻链可变区(本文缩写为VL)和轻链恒定区组成。轻链恒定区由一个结构域CL组成。VH和VL区可以进一步细分成称为互补决定区(CDR)的高变区，其在序列上高度可变和/或参与抗原识别和/或通常形成结构定义的环，与称为框架区(FR或FW)的更保守的区域穿插。每条VH和VL由三个CDR和四个FW组成，从氨基末端到羧基末端按以下顺序排列：FW1，CDR1，FW2，CDR2，FW3，CDR3，FW4。FW1，FW2，FW3和FW4的氨基酸序列一起构成如本文所述的VH或VL的“非CDR区”或“非扩展的CDR区”。

重链和轻链的可变区包含与抗原相互作用的结合结构域。抗体的恒定区可以介导免疫球蛋白与宿主组织或因子，包括免疫系统(例如，效应细胞)和经典补体系统的第一组分(C1q)的各种细胞的结合。

如通过恒定区从遗传学角度确定的，可以将抗体分成类，也被称为同种型。人类恒定轻链分类为kappa(Cκ)和lambda(Cλ)轻链。重链分类为mu(μ)、delta(δ)、gamma(γ)、alpha(α)或epsilon(ε)，并分别定义抗体的同种型为IgM、IgD、IgG、IgA和IgE。IgG类最常用于治疗目的。在人类中，该类包括亚类IgG1、IgG2、IgG3和IgG4。

如本文所用的术语“Fab”或“Fab区”包括这样的多肽，其包含VH、CH1、VL和CL免疫球蛋白结构域。Fab可以指该区域处于孤立状态，或该区域在全长抗体或抗体片段的背景中。

如本文所用的术语“Fc”或“Fc区”包括这样的多肽，其包含不具有第一恒定区免疫球蛋白结构域的抗体的恒定区。因此，Fc是指IgA，IgD和IgG的最后两个恒定区免疫球蛋白结构域，以及IgE和IgM的最后三个恒定区免疫球蛋白结构域，和这些结构域的柔性铰链N末端。对于IgA和IgM，Fc可以包括J链。对于IgG，Fc包括免疫球蛋白结构域C gamma 2和Cgamma 3(Cγ2和Cγ3)和C gamma l(Cγl)和C gamma 2(Cγ2)之间的铰链。尽管Fc区的边界可以变化，但是人IgG重链Fc区通常被定义为包括到其羧基末端的残基C226VS P230，其中根据EU编号系统编号。对于人IgG1，Fc区在本文中定义为包括到其羧基末端的残基P232，其中编号根据EU编号系统编号(Edelman GM等人,(1969)Proc Natl Acad Sci USA,63(1):78-85)。Fc可以指该区域处于孤立状态或该区域在Fc多肽例如抗体的背景中。

如本文所用的术语“全长抗体”包括构成抗体的天然生物形式，包括可变区和恒定区的结构。例如，在大多数哺乳动物，包括人类和小鼠中，IgG类的全长抗体为四聚体并且由两对相同的两个免疫球蛋白链组成，每对具有一条轻链和一条重链，每条轻链包含免疫球蛋白结构域VL和CL，并且每条重链包含免疫球蛋白结构域VH和CH1(Cγ1)，CH2(Cγ2)和CH3(Cγ3)。在一些哺乳动物，例如骆驼和美洲驼中，IgG抗体可以仅由两条重链组成，每条重链包含连接于Fc区的可变域。

抗体片段包括但不限于：(i)由VL、VH、CL和CH1结构域组成的Fab片段，包括Fab'和Fab'-SH；(ii)由VH和CH1结构域组成的Fd片段；(iii)由单个抗体的VL和VH结构域组成的Fv片段；(iv)由单个可变域组成的dAb片段(WardES等人，(1989)Nature,341(6242):544-546)；(v)F(ab')₂片段，一种包含两个连接的Fab片段的双价片段；(vi)单链Fv分子(scFv)，其中VH结构域和VL结构域由允许这两个结构域缔合以形成抗原结合位点的肽连接子连接(Bird RE等人,(1988)Science,242:423-426；Huston JS等人,(1988)Proc.Natl.Acad.Sci.USA,85:5879-83)；(vii)双特异性单链Fv二聚体(PCT/US92/09965),(viii)“双抗体”或“三抗体”，通过基因融合所构建的多价或多特异性片段(Tomlinson I&Hollinger P(2000)Methods Enzymol.326:461-79；WO94/13804；Holliger P et al.,(1993)Proc.Natl.Acad.Sci.USA,90:6444)；和(ix)与相同或不同抗体基因融合的scFv(Coloma MJ&Morrison SL(1997)Nature Biotech,15(2):159-163)。

可通过如本文所述的表达构建体表达的抗体和其片段可结合选自由下面组成的组的抗原：AXL、Bcl2、HER2、HER3、EGF、EGFR、VEGF、VEGFR、IGFR、PD-1、PD-1L、BTLA、CTLA-4、GITR、mTOR、CS1、CD3、CD16、CD16a、CD19、CD20、CD22、CD25、CD27、CD28、CD30、CD32b、CD33、CD38、CD40、CD52、CD64、CD79、CD89、CD137、CD138、CA125、cMet、CCR6、MUCI、PEM抗原、Ep-CAM、EphA2、17-1a、CEA、AFP、HLA类II、HLA-DR、HSG、IgE、IL-12、IL-17a、IL-18、IL-23、IL-1alpha、IL-1beta、GD2-神经节苷脂、MCSP、NG2、SK-I抗原、Lag3、PAR2、PDGFR、PSMA、Tim3、TF、CTLA4、TL1A、TIGIT、SIRPa、ICOS、Treml2、NCR3、HVEM、OX40、VLA-2和4-1BB。

双特异性或异源二聚抗体已经在本领域中可获得许多年。然而，这样的抗体的产生通常与错配的副产物的存在关联，所述副产物显著降低了所需的双特异性抗体的产率，并且需要复杂的纯化程序以实现产物的同质性。可通过使用若干合理的设计策略减少免疫球蛋白重链的错配，其中大部分设计策略通过在CH3结构域同源二聚体的两个亚基之间设计人为的互补异源二聚体界面来工程化用于异型二聚的抗体重链。Carter等人作出了工程化的CH3异源二聚体结构域对的首次报道，描述了用于生成异源二聚Fc部分的“突起-进入-腔”方法(US5,807,706；‘knobs-into-holes’；Merchant AM等人,(1998)Nat Biotechnol,16(7):677-81)。近来已经开发了替代设计并涉及如WO2007110205中所描述地通过修饰分子的核心成分来设计新的CH3模序对或者如WO2007147901或WO2009089004所描述地在模件之间设计互补的盐桥。CH3工程化策略的缺点是这些技术仍导致产生显著量的不需要的同源二聚体。PCT公开号WO2012131555中描述了其中主要产生异源二聚体的用于产生双特异性抗体的更优选技术。可以对若干靶点，例如，位于肿瘤细胞上的靶点和/或位于效应细胞上的靶点产生双特异性抗体。优选地，双特异性抗体可以结合于选自由下列组成的组中的两个靶点：AXL、Bcl2、HER2、HER3、EGF、EGFR、VEGF、VEGFR、IGFR、PD-1、PD-1L、BTLA、CTLA-4、GITR、mTOR、CS1、CD3、CD16、CD16a、CD19、CD20、CD22、CD25、CD27、CD28、CD30、CD32b、CD33、CD38、CD40、CD52、CD64、CD79、CD89、CD137、CD138、CA125、cMet、CCR6、MUCI、PEM抗原、Ep-CAM、EphA2、17-1a、CEA、AFP、HLA类II、HLA-DR、HSG、IgE、IL-12、IL-17a、IL-18、IL-23、IL-1alpha、IL-1beta、GD2-神经节苷脂、MCSP、NG2、SK-I抗原、Lag3、PAR2、PDGFR、PSMA、Tim3、TF、CTLA4、TL1A、TIGIT、SIRPa、ICOS、Treml2、NCR3、HVEM、OX40、VLA-2和4-1BB。

在进一步的方面，本发明提供了一种宿主细胞，其包含如上文描述的表达构建体或表达载体。通常该宿主细胞选自由哺乳动物细胞，昆虫细胞和酵母细胞组成的组。该宿主细胞可以是人或非人细胞。优选的宿主细胞是哺乳动物细胞。哺乳动物宿主细胞的优选例子包括而不限于人胚肾细胞(Graham FL等人,(1997)J.Gen.Virol.36:59-74)、MRC5人成纤维细胞、983M人黑色素瘤细胞、MDCK犬肾细胞、RF培养的从Sprague-Dawley大鼠分离的大鼠肺成纤维细胞、B16BL6鼠黑色素瘤细胞、P815鼠肥大细胞瘤细胞、MTl A2鼠乳房腺癌细胞、PER:C6细胞(Leiden、荷兰)和中国仓鼠卵巢(CHO)细胞或细胞系(Puck TT等人,(1958),J.Exp.Med.108:945-955)。

在一个具体的优选实施方案中，宿主细胞是中国仓鼠卵巢(CHO)细胞或细胞系。合适的CHO细胞系例如包括CHO-S(Invitrogen，Carlsbad，CA，美国)、CHO Kl(ATCC CCL-61)、CHO pro3-、CHO DG44、CHO P12或dhfr-CHO细胞系DUK-BII(Urlaub G&Chasin LA(1980)PNAS 77(7),4216-4220)、DUXBI l(Simonsen CC&Levinson AD(1983),PNAS 80,(9):2495-2499)、或CHO-K1SV(Lonza，巴赛尔，瑞士)。

在进一步的方面，本公开内容提供了用于表达目的多肽的宿主细胞的选择的方法，其包括用如前所述的表达构建体或表达载体转染宿主细胞，培养所述宿主细胞，检测目的多肽的细胞膜表达，并选择具有期望的细胞膜表达的宿主细胞克隆。在进一步的步骤中，可以从宿主细胞回收目的多肽。所述多肽优选是异源的，更优选人多肽。如实施例中所示，目的多肽的细胞膜表达的水平与所表达的可溶性多肽的水平成正比。因此，这使得能够定量选择表达高水平的目的多肽的宿主细胞克隆。

在一个优选的实施方案中，本发明提供了一种用于表达多聚蛋白优选异源二聚抗体的宿主细胞的选择的体外方法，其通过用如前所述的表达构建体或表达载体转染宿主细胞，培养所述宿主细胞，检测目的多聚蛋白的细胞膜表达，并选择具有期望的细胞膜表达的宿主细胞克隆。在进一步的步骤中，可以从宿主细胞回收目的多聚蛋白，例如异源二聚抗体。如实施例中所示，可以容易地选择相对于不期望的同源二聚抗体种类更多地呈现异源二聚抗体的宿主细胞，即，实现宿主细胞克隆的定性选择。

根据本发明为了将表达构建体或表达载体转染入宿主细胞，可以使用任何转染技术，如本领域熟知的那些，例如电穿孔法、磷酸钙共沉淀法、阳离子聚合物介导的转染、脂质体转染法，适当时用于给定宿主细胞类型。应当指出，用本发明表达构建体或表达载体转染的宿主细胞应当解释为是瞬时或稳定转染的细胞系。因此，根据本发明，本发明表达构建体或表达载体可以按附加型方式维持，即瞬时转染的，或可以稳定整合在宿主细胞的基因组中，即稳定转染的。

瞬时转染以不采用针对具有选择标记的载体的任何选择压力为特征。在转染后通常持续2直至10日的瞬时表达实验中，转染的表达构建体或表达载体作为附加型元件维持并也不整合至基因组中。即，转染的DNA通常不整合至宿主细胞基因组中。宿主细胞倾向于丢失转染的DNA并且当培养瞬时转染的细胞汇集物时丢失转染的DNA的细胞倾向于在种群中长满转染的细胞。因此表达在紧邻转染后的时间段中最强烈并且随时间减少。优选地，将本发明的瞬时转染子理解为在选择压力不存在的情况下在细胞培养物中维持直至转染后2至10日时间的细胞。

在本发明的优选实施方案中，宿主细胞例如CHO宿主细胞用本发明的表达构建体或表达载体稳定转染。稳定转染意指新引入的外来DNA如载体DNA被掺入基因组DNA中，通常借助随机非同源重组事件。可以通过选择其中在整合入宿主细胞的DNA之后载体序列已经被扩增的细胞系，增加载体DNA的拷贝数以及同时增加基因产物的量。因此，可能的是当暴露于用于扩增基因的选择压力进一步增加时，这种稳定整合在CHO细胞中产生双倍微小染色体。另外，稳定转染可以导致丢失与重组基因产物表达不直接相关的载体序列部分，例如当基因组整合时变得多余的细菌拷贝数控制区。因此，转染的宿主细胞已经将表达构建体或表达载体的至少部分或不同部分整合至基因组中。

在又一个方面，本公开提供如上文描述的表达构建体或表达载体用于从哺乳动物宿主细胞表达异源多肽的用途，特别是如上文描述的表达构建体或表达载体用于从哺乳动物宿主细胞体外表达异源多肽的用途。在一个优选的实施方案中，如上文所述的表达构建体或表达载体用于来自哺乳动物宿主细胞的异源二聚抗体的体外表达。

在本发明中描述的表达构建体可以用于这样的方法，所述方法用于选择表达目的多肽或蛋白的重组宿主细胞。优选地，目的蛋白是抗体。该方法包括：

(ⅰ)共转染宿主细胞与：

(a)一种表达构建体，其在5'至3'方向上包含：

启动子；

编码抗体重链的外显子；

剪接供体位点、内含子和剪接受体位点，其中第一终止密码子位于剪接供体位点和所述内含子内的剪接受体位点之间；

编码跨膜区的第二外显子，所述跨膜区选自修饰的免疫球蛋白跨膜区或修饰的或未经修饰的非免疫球蛋白跨膜区；

第二终止密码子；和

多聚(A)位点，

(b)编码抗体轻链的表达构建体，

(ⅱ)在适于抗体表达的条件下培养转染的宿主细胞；

(iii)检测抗体的细胞膜表达；和

(四)选择在细胞膜的表面上呈现抗体的宿主细胞。

此外，上面详述的方法可用于表达双特异性抗体的重组宿主细胞的选择，由此所述宿主细胞与编码scFv-Fc的第三表达构建体或编码scFv-Fc的具有非免疫球蛋白跨膜区如鼠B7-1跨膜区的剪接的第三表达构建体共转染。

所需的宿主细胞的选择可根据本领域已知的方法进行。这样的方法包括，荧光、ELISA、Western印迹、SDS聚丙烯酰胺凝胶电泳、放射免疫测定或通过使用识别并结合到目的蛋白质的抗体或特异性分子如适体。优选地，在宿主细胞的细胞膜上呈现的目的蛋白通过荧光探针检测，或连接到荧光标记，因此允许使用荧光激活细胞分选或FACS的选择。

可以根据本领域技术人员已知的方法实施蛋白质的表达和回收。

在又一个方面，本公开提供如上文描述的表达构建体或表达载体制备用于治疗疾病的药物的用途。

在又一个方面，本公开提供如上文描述的表达构建体或表达载体，其用作治疗疾病的药物。

在又一个方面，本公开提供如上文描述的表达构建体或表达载体，其用于基因疗法。

实施例

实施例1：载体的克隆

介绍

所制备的选择性剪接构建体包含人ighg1基因的剪接供体序列。内含子(包括剪接受体位点)衍生自鸡cTNT内含子4，而外显子衍生自ighgl基因的跨膜区(在下文中称为M1M2)、T细胞受体α的跨膜区(PTCRA)或鼠B7-1基因。在几个构建体，鼠B7-1跨膜结构域由其它跨膜结构域替换，包括天然存在的跨膜结构域以及这些的修饰。此外，B7-1跨膜区中的B7-1胞质尾由具有或不具有ER出口信号的几个其他胞质尾替换。

为了IgG1或IgG4形式的全长抗体的表达，重和轻链的同时表达是必要的。使用共转染策略使用分别的质粒表达所有的亚基。选择性剪接构建体用于IgG1或IgG4重链的表达。IgG1或IgG4的轻链在相同的表达载体骨架中克隆，但没有选择性剪接。

为了内部产生的双特异性抗体形式的表达(技术；在WO2012/131555中所述)，必须在细胞中转染三种不同的亚基：重链，轻链和scFv-Fc。为了评价双特异性抗体形式的膜呈现的最佳策略，克隆剪接和选择性剪接构建体用于重链和scFv-Fc的表达。在相同的表达载体骨架中克隆轻链，但没有选择性剪接。表1总结了在该实例中产生的所有构建体。

表1：所产生的所有构建体的汇总(*)

*所列举的序列对于DNA序列从非剪接ORF的最后5个氨基酸至表达构建体的末端延伸以及对于蛋白质序列从相同的氨基酸至融合的跨膜区的末端延伸，除了GSC314(SEQIDNO：48)、GSC315(SEQ ID NO：294)、GSC5607(SEQ ID NO：296)、GSC5644(SEQ ID NO：49)、GSC5608(SEQ ID NO：51)、GSC5540(SEQ ID NO：302)、GSB59(SEQ ID NO：79)(完成ORF序列)。

材料和方法

LB培养板

将500ml水与16g LB琼脂(Invitrogen，Carlsbad，CA，美国)混合并煮沸(1升LB含有10g胰蛋白胨、5g酵母提取物和10g NaCl)。在冷却后，将相应的抗生素添加至溶液，所述溶液随后铺板(氨苄青霉素平板为100μg/ml和卡那霉素平板为50μg/ml)。

聚合酶链反应(PCR)

全部PCR均使用50μl终体积中的1μldNTP(每种dNTP为10mM；Invitrogen，Carlsbad，CA，美国)、2单位DNA聚合酶(Finnzymes Oy，Espoo，芬兰)、25nmol引物A(Mycrosynth，Balgach，瑞士或Operon，Ebersberg，德国)、25nmol引物B(Mycrosynth，Balgach，瑞士或Operon，Ebersberg，德国)、10μl5X HF缓冲剂(7.5mM MgCl2，Finnzymes，Espoo，芬兰)、1.5μl二甲基亚砜(DMSO，Finnzymes，Espoo，芬兰)和1-3μl模板(10-20ng)进行。使用的所有引物在表2中列出。

通过在98℃初始变性3分钟启动PCR，随后是35个循环：在98℃变性30秒，在引物特异性温度(根据CG含量)退火30秒和在72℃下2分钟延长。在72℃进行最终延长10分钟，之后冷却和保持在4℃。

表2：在PCRs中使用的引物汇总。引物从Operon(Ebersberg，德国)或者从Microsynth(巴尔加赫，瑞士)获得。

限制性消化

对于全部限制性消化，将大约1μg质粒DNA(用NanoDrop，ND-1000分光光度计(Thermo Scientific,Wilmington,DE,USA)定量)混合入10-20单位的每种酶、4μl相应10XNEBuffer(NEB，Ipswich，MA，美国)中，并且将体积用无菌H₂O补足至40μl。将反应在酶所必需的温度下温育1小时。

在每次制备性消化骨架后，添加1单位牛小肠碱性磷酸酶(CIP；NEB，Ipswich，MA，美国)并将混合物在37℃温育30分钟。

PCR清除

为实现消化，在限制性消化之前，使用Macherey Nagel Extract II试剂盒(Macherey Nagel，Oensingen，瑞士)或Gel和PCR清除试剂盒(相同试剂盒的新商标名)遵循制造商的手册使用40μl的洗脱缓冲液净化全部PCR片段。这种方案还用于改变DNA样品的缓冲液。

DNA提取

使用2％琼脂糖凝胶进行凝胶电泳。使用必要量的UltraPure^TM琼脂糖(Invitrogen，Carlsbad，CA，美国)和1X Tris乙酸EDTA缓冲液(TAE，pH 8.3；Bio RAD，Munich，德国)制备这些。为了DNA染色，将1μl Gel Red Dye(Biotum，Hayward，CA，美国)添加至100ml琼脂糖凝胶中。作为大小标志物，使用2μl的1kb DNA梯(NEB，Ipswich，MA，美国)。电泳以125伏运行约1小时。

将目的条带从琼脂糖凝胶切下并使用试剂盒Extract II(Macherey-Nagel，Oensingen，瑞士)Gel和PCR清除试剂盒(相同试剂盒的新商标名)或Qiaquick Gel提取试剂盒(Qiagen，Hilden，德国)遵循制造商的手册使用40μl的洗脱缓冲液或遵循制造商手册进行纯化。

连接

对于每个连接，将4μl插入物与1μl载体、400单位连接酶(T4DNA连接酶，NEB，Ipswich，MA，美国)和1μl10X连接酶缓冲液(T4DNA连接酶缓冲液；NEB，Ipswich，MA，美国)，使用UHP水补足至10μl终体积。将混合物在室温温育1-2小时。

转化连接产物成能感受态细菌

为了转化连接产物，使用感受态细菌“TOP 10”(One TOP 10感受态大肠杆菌；Life Technologies，CA，美国)。在冰上融化25-50μl细菌5分钟。随后，将3-5μl连接产物添加至感受态细菌并在冰上温育20-30分钟，随后在42℃短暂热休克1分钟。随后，每管添加500μl S.O.C培养基(Invitrogen，Carlsbad，CA，美国)并在37℃搅拌下温育1小时。最后，将细菌涂布在含氨苄青霉素或卡那霉素(Sigma-Aldrich，St.Louis，MO，美国)的LB平板上并在37℃温育过夜。

小量制备质粒

为了小量制备，将转化细菌的菌落在2.5ml LB和氨苄青霉素或卡那霉素中在37℃，200rpm培育6-16小时。遵循制造商的手册，用大肠杆菌质粒纯化试剂盒(NucleoSpinQuickPure，或NucleoSpin Plasmid(Macherey Nagel，Oensingen，瑞士)或QiagenQuickLyse Miniprep(Qiagen))提取DNA。

通过测量260nm处的吸光度并评估必须在1.8和2之间的OD260nm/OD280nm的比率用NanoDrop ND-1000分光光度计(Thermo Scientific，威尔明顿，DE，USA)一次定量来自小量制备的质粒DNA。在将样品送到Fasteris SA(Plan-les-Ouates，瑞士)用于序列确认之前进行对照消化。

中量制备质粒

为了中等量制备，将转化的细菌在200ml LB和氨苄青霉素(或卡那霉素)中于37℃培育过夜。随后，将培养物以725g离心20分钟并且使用商业试剂盒(NucleoBond XtraMidi；Macherey Nagel，Oensingen，瑞士)，遵循制造商的手册中量制备供的方案纯化质粒。

通过测量260nm处的吸光度并评估如通过限制性消化所确认的必须在1.8和2之间的OD260nm/OD280nm的比率用NanoDrop ND-1000分光光度计三次定量来自中量制备的质粒DNA。然后将样品送去测序(Fasteris SA，Plan-les-Ouates，瑞士)。

大量制备质粒

为了大量制备，将转化的细菌在500ml LB和氨苄青霉素(或卡那霉素)中于37℃培育过夜。随后，将培养物以725g离心20分钟并且使用商业试剂盒(NucleoBond PC500或NucleoBond Xtra Maxi；Macherey Nagel，Oensingen，瑞士)遵循制造商的手册中量制备供的方案纯化质粒。

通过测量260nm处的吸光度并评估如通过限制性消化所确认的必须在1.8和2之间的OD260nm/OD280nm的比率用NanoDrop ND-1000分光光度计三次定量来自大量制备的质粒DNA。然后将样品送去测序(Fasteris SA，Plan-les-Ouates，瑞士)。

吉咖制备(Gigapreparation)质粒

为了吉咖制备，将转化的细菌在500ml LB和氨苄青霉素(或卡那霉素)中于37℃培育过夜。随后，将培养物以725g离心20分钟并且使用商业试剂盒(NucleoBond PC10000；Macherey Nagel，Oensingen，瑞士)遵循制造商的手册中量制备供的方案纯化质粒。

通过测量260nm处的吸光度并评估如通过限制性消化所确认的必须在1.8和2之间的OD260nm/OD280nm的比率用NanoDrop ND-1000分光光度计三次定量来自大量吉咖制备的质粒DNA。然后将样品送去测序(Fasteris SA，Plan-les-Ouates，瑞士)。

结果

IgG1抗体的重链的克隆

通过GeneArt(雷根斯堡，德国)优化在本专利中所使用的编码IgG1重链的基因。通过GeneArt在两种不同的质粒中量制备供重链的可变部分和恒定部分。接收之后，在水中溶解GeneArt构建体并使用酶KpnI和ApaI将重链恒定区和重链可变区克隆在一起。由外部CRO执行这项工作并将融合产物运送至Glenmark。该融合构建体测序后，在Fc区的CH2结构域(EEMTK到DELTK)中识别相比于理论序列，重链恒定区中的序列变化。设计引物以通过大引物PCR和同时引入的开放阅读框的方便的限制性位点5'和3来改变该区域。

对原始构建体进行使用引物GlnPr497(SEQ ID NO：2)和GlnPr498(SEQ ID NO：3)的第一PCR。将所得到的扩增子(304bps)以不同的浓度用作第二PCR中的大引物，使用第二引物GlnPr501和原始构建体作为模板。将最终的PCR产物凝胶纯化并克隆到穿梭载体pCR-钝(ZeroPCR克隆试剂盒，Invitrogen，LifeTechnologies)中。小量制备物筛选后，看来虽然插入序列是正确的，对开放阅读框的限制位点5'和3'丢失。因此使用引物GlnPr501(SEQ ID NO：4)和GlnPr498(SEQ ID NO：3)和较高的退火温度(64℃)再扩增插入物。将扩增子凝胶纯化并克隆到pCR-钝(ZeroPCR克隆试剂盒，Invitrogen，LifeTechnologies)中。具有正确的限制图谱的一个小量被选择为使用限制酶HindIII位和XbaI在穿梭载体pSELl中亚克隆。在小量制备物筛选后，生产大量制备。使用限制酶XbaI和HindIII将该大量制备的插入物再切出并克隆到质粒pGLEX41(GSC281，SEQ ID NO：304)的骨架中，用同样的酶打开并用CIP处理。pGLEX41是用于表达的标准内部载体，并包含由鼠CMV启动子，接着是组成性剪接内含子，多克隆位点(MCS)和SV40多聚(A)序列组成的表达盒。在小量制备物筛选后，进行pGLEX41_HC的大量制备并获得质粒批号GSC314。相同DNA的进一步的中量制备或吉咖制备接收质粒批号GSC314a、GSC314b、GSC314c、GSC314d和GSC314e(所有这些制备通过DNA测序确认为相同，并将被称为GSC314质粒(SEQ ID NO：48))。

用于IgG1抗体的膜呈现重链的选择性剪接表达载体的克隆

使用引物GlnPrl518(SEQ ID NO：11)，GlnPrl519(SEQ ID NO：12)和GlnPrl520(SEQ ID NO：13)和质粒pGLEX41_HC(GSC314，SEQ ID NO：48)作为模板通过PCR扩增IgG1形式的抗体的重链的编码区。对所得的在扩增子的5'末端和3'末端含有NheI限制性位点的PCR产物进行修饰以便精确地包含用于ighgl基因的NCBI数据库条目的最后40bps(SEQ IDNO：65)以及HindⅢ限制位点。进行3'末端修饰以在IgG1重链的恒定部分的C-末端区域重组天然剪接供体位点。使用限制酶NheI和HindIII切割PCR产物并在pGLEX41(GSC281，SEQ IDNO：304)中克隆，使用相同的酶和CIPed切割。将得到的载体称为pGLEX41_HC-AS(质粒批号GSC3836，SEQ ID NO：287)，并通过限制性消化和序列分析证实。用引物GlnPrl516(SEQ IDNO：9)和GlnPrl517(SEQ ID NO：10)从含有其序列(GSC2819，SEQ ID NO：67)的内部质粒扩增鸡肌钙蛋白(cTNT)内含子数4(SEQ ID NO：69)。在心肌和胚胎骨骼肌中特异表达肌钙蛋白。90％以上的mRNA包括早期胚胎心脏和骨骼肌中的外显子，而成人的>95％的mRNA排除该外显子(Cooper&Ordahl(1985)J Biol Chem,260(20):11140-8)。引物加入HindIII位点5'和Agel位点随后BstBI到3'末端。将扩增子凝胶纯化，用HindIII和BstBI消化并克隆到使用相同的酶和CIPed打开的载体pGLEX41_HC-IgAS(GSC3836，SEQ ID NO：287)中。将得到的载体称作pGLEX41_HC-cTNT内含子4(质粒批号GSC3848，SEQ ID NO：289)，并通过限制性消化和序列分析证实。

使用质粒GlnPrl521(SEQ ID NO：14)和GlnPrl522(SEQ ID NO：15)装配编码人类ighg1基因的跨膜区(M1M2)的序列。这些引物部分重叠，并被使用PCR完成以使双链DNA加倍。将钝端PCR产物克隆到pCR-钝(Zero PCR克隆试剂盒，Invitrogen，LifeTechnologies)，从而导致通过测序证实的质粒pCRblunt-M1M2。用引物GlnPrl523(SEQID NO：16)和GlnPrl524(SEQ ID NO：17)再扩增插入物以完成M1M2跨膜结构域序列。将扩增子凝胶纯化，用AgeI和BstBI消化，并克隆到载体pGLEX4l_HC-cTNT内含子4(GSC3848，SEQID NO：289)中。将所得质粒命名为pGLEX41_HC-I4-M1M2-M1M2-M1M2并以大量制备规模生产，获得质粒批号GSC3899并通过序列分析证实(SEQ ID NO：36)。

为了增加表达和膜呈现抗体之间的剪接比，减少编码跨膜区的外显子的多聚(Y)道中的嘧啶的数量。对于这种情况，使用引物GlnPrl516(9 SEQ ID NO：9)和GlnPrl649(SEQID NO：18)从内部载体(GSC3469，SEQ ID否.68)扩增I4(0Y)片段(SEQ ID NO：70)。将扩增子用限制性酶HindIII和AgeI消化并克隆到使用相同的酶打开并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)的骨架中。小量制备物筛选之后，制备了中量制备pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2，接收批号GSC4398并通过测序证实(SEQ ID NO：37)。

将多聚(A)引入这样的内含子中，所述内含子分开编码IgG1的外显子和编码跨膜区的备用外显子。用引物GlnPrl650(SEQ ID NO：19)和GlnPrl651(SEQ ID NO：20)从内部载体(GSC3469，SEQ ID NO：305)扩增SV40多聚(A)信号。将扩增子用限制酶ClaI消化，并克隆到使用ClaI和CIPed消化的载体pGLEX41_HC-M1M2-M1M2-M1M2(GSC3899，SEQ ID NO：36)中，导致I4(聚A)内含子(SEQ ID NO：71)。在小量制备物筛选和插入物的正确取向的确认后，制备pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2中量制备物，获得批号GSC4401并通过测序证实(SEQ ID NO：38)。

将胃泌素终止子序列预先加入到与pGLEX41(GSC281，SEQ ID NO：304)共享相同的一般骨架但载有不同的启动子的内部载体(GSC23，SEQ ID NO：306)的SV40多聚(A)信号中。将SV40多聚(A)和胃泌素终止子的融合以质粒命名法指定为“SV40ter”(SEQ ID NO：306)。将GSC23(SEQ ID NO：306)的表达盒(启动子+编码序列)替换为pGLEX41_HC-I4-M1M2-M1M2-M1M1(GSC3899，SEQ ID NO：36)的表达盒，除了SV40多聚(A)信号(即启动子和编码序列)。将插入物用限制酶BstBI及Nrul切出并克隆到用相同的酶消化并用CIP处理的GSC23(SEQ IDNO：306)的骨架中。在小量制备物筛选之后，制备质粒pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter的中量制备，获得质粒批号GSC4402并通过测序(SEQ ID NO：39)确认。

另一个优选的构建体包括具有内含子中的胃泌素终止子的多聚(A)信号。I4(SV40ter)的序列以SEQ ID NO:77给出。

使用人T细胞受体α跨膜结构域(PTCRA)克隆用于IgG1抗体的膜呈现重链的选择性剪接表达载体

为了用人T细胞受体α(PTCRA)基因的跨膜结构域替换选择性剪接构建体中的M1M2跨膜区，互补引物GlnPrl799(SEQ ID NO：28)和GlnPrl735(SEQ ID NO：26)用于产生插入片段。这些引物部分重叠，并使用PCR完成以使双链DNA加倍。将插入片段用AgeI和BstBI切割并克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899，SEQID NO：36)的骨架中。由于插入物的一部分从所得的小量制备丢失，使用引物GlnPrl799(SEQ ID NO：28)和GlnPr269(SEQ ID NO：1)对小量制备进行新的扩增。将扩增的插入片段用AgeI和BstBI消化并克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398，SEQ ID NO：37)的骨架中。将小量制备通过测序确认，并用引物GlnPrl840(SEQ ID NO：31)和GlnPr269(SEQ ID NO：1)用于另一PCR。将扩增子用AgeI和BstBI消化并克隆到使用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)、pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398、SEQ IDNO:37)、pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2(GSC4401,SEQ ID NO:38)和pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402,SEQ ID NO:39)中。连接分别导致中量制备pGLEX41_HC-I4-PTCRA(GSC5854,SEQ ID NO:40)、pGLEX41_HC-I4(0Y)-PTCRA(GSC5855,SEQID NO:41)、pGLEX41_HC-I4(polyA)-PTCRA(GSC5857,SEQ ID NO:42)和pGLEX41_HC-I4-PTCRA-SV40ter(GSC5856,SEQ ID NO:43)。所有中量制备通过测序验证。

使用M1M2-PTCRA融合构建体克隆用于IgG1抗体的膜呈现重链的选择性剪接表达载体

从GeneArt订购名称为GeneArt_Seq32(SEQ ID NO：64)的编码M1M2-PTCRA融合构建体的插入物。该片段包含IgG1重链中的常规M1M2跨膜区，不同的是跨膜结构域由T细胞受体α亚基(PTCRA)的跨膜结构域替换。用限制酶AgeI和BstBI切割由GeneArt提供的质粒并分别在用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ IDNO:36)、pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398,SEQ ID NO:37)、pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2(GSC4401,SEQ ID NO:38)和pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402,SEQ ID NO:39)的骨架中连接纯化的插入物。

连接导致中量制备物pGLEX41_HC-I4-M1M2-PTCRA-M1M2(GSC6030,SEQ ID NO:44)、pGLEX41_HC-I4(0Y)-M1M2-PTCRA-M1M2(GSC6048,SEQ ID NO:45)、pGLEX41_HC-I4(polyA)-M1M2-PTCRA-M1M2(GSC6047,SEQ ID NO:46)和pGLEX41_HC-I4-M1M2-PTCRA-M1M2-SV40ter(GSC6046,SEQ ID NO:47)。所有中量制备物经测序确认。

生成第一M1M2-PTCRA融合，这些构建体允许IgG1的膜呈现并且关于内含子的修饰表现出与天然M1M2构建体相同的行为(参见实施例3中的图6)。

设计进一步的构建体pGLEX41_HC-I4-M1M2-PTCRA-M1M2_校正以实现对跨膜区中的跨膜结构域的修饰的影响的正确分析。

对于该构建体，进行融合PCR。用引物GlnPrl285(SEQ ID NO：259)和GlnPr2378(SEQ ID NO：221)从质粒pGLEX41_HC-I4-M1M2-M1M2-M1M2-(GSC3899,SEQ ID NO:36)扩增M1M2跨膜区的cTNT 4内含子的一部分和M1M2胞外部分。用引物GlnPr2379(SEQ ID NO：222)和GlnPrl650(SEQ ID NO：19)从相同的模板扩增M1M2跨膜区的胞质尾以及SV40多聚(A)信号。引物GlnPr2378(SEQ ID NO：221)和GlnPr2379(SEQ ID NO：222)允许创建校正的PTCRA跨膜结构域的两个PCR产物的重叠端部的创建。然后用引物GlnP1285(SEQ ID NO：259)和GlnPrl650(SEQ ID NO：19)从这两个第一PCR产物进行重叠PCR。将所得到的融合PCR产物用AgeI和BstBI消化并在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899，SEQ ID NO：36)中连接。小量制备物筛选后，生产中量制备pGLEX41_HC-I4-M1M2-PTCRA-M1M2_校正，获得质粒批号GSC11206并通过测序(SEQ ID NO：284)确认。

使用鼠B7-1跨膜区克隆用于IgG1抗体的膜呈现重链的选择性剪接表达载体

为了将跨膜区改变为鼠B7-1基因的跨膜区，进行融合PCR。

首先，使用引物GlnPr2100(SEQ ID NO：33)和GlnPr2101(SEQ ID NO：34)从内部构建体(订购自GeneArt，为GeneArt_Seq43，SEQ ID NO：66)通过PCR扩增编码鼠B7-1跨膜区的序列。

对于载体pGLEX41_HC-I4(0Y)-B7-B7-B7的克隆，用引物GlnPrl516(SEQ ID NO：9)和GlnPr2102(SEQ ID NO：35)从模板pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398，SEQID NO：37)通过PCR扩增编码cTNT-I4(0Y)的片段。使用引物GlnPr2100(SEQ ID NO：33)和GlnPr2101(SEQ ID NO：34)从内部构建体(订购自GeneArt，为GeneArt_Seq43，SEQ ID NO：66)通过PCR扩增编码鼠B7-1跨膜区的序列。使用引物GlnPrl516(SEQ ID NO：9)和GlnPr2100(SEQ ID NO：33)融合这两个PCR产物。将所得PCR产物用BstBI和HindIII消化，并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899，SEQ IDNO：36)中。在小量制备物筛选之后，生产pGLEX41_HC-I4(0Y)-B7-B7-B7的中量制备，获得批号GSC7057并通过限制性消化和测序(SEQ ID NO：53)确认。

对于载体pGLEX41_HC-I4(聚A)-B7-B7-B7的克隆，用引物GlnPrl516(SEQ ID NO：9)和GlnPr2099(SEQ ID NO：32)从模板pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2(GSC4401,SEQ ID NO:38)通过PCR扩增编码cTNT-I4(聚A)的片段。用引物GlnPr2100(SEQ ID NO：33)和GlnPr2101(SEQ ID NO：34)从内部构建体(订购自GeneArt，为GeneArt_Seq43，SEQ IDNO：66)通过PCR扩增编码鼠B7-1跨膜区的序列。使用引物GlnPrl516(SEQ ID NO：9)和GlnPr2100(SEQ ID NO：33)融合这两个PCR产物。将所得PCR产物用BstBI和HindIII消化，并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899，SEQ IDNO：36)中。在小量制备物筛选之后，为所得的pGLEX41_HC-I4(聚A)-B7-B7-B7中量制备提供批号GSC7057并通过限制性消化和测序(SEQ ID NO:54)确认。

对于载体pGLEX41_HC-I4-B7-B7-B7的克隆，用引物GlnPrl516(SEQ ID NO：9)和GlnPr2099(SEQ ID NO：32)从模板pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)通过PCR扩增cTNT-I4。使用引物GlnPr2100(SEQ ID NO：33)和GlnPr2101(SEQ ID NO：34)从内部构建体(订购自GeneArt，为GeneArt_Seq43，SEQ ID NO：66)通过PCR扩增编码鼠B7-1跨膜区的序列。使用引物GlnPrl516(SEQ ID NO：9)和GlnPr2100(SEQ ID NO：33)融合这两个PCR产物。将所得PCR产物用BstBI和HindIII消化，并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899，SEQ ID NO：36)中。在小量制备物筛选之后，为所得的pGLEX41_HC-I4-B7-B7-B7中量制备提供批号GSC7056并通过限制性消化和测序(SEQ ID NO:55)确认。

对于载体pGLEX41_HC-I4-B7-B7-B7-SV40ter的克隆，使用与用于pGLEX41_HC-I4-B7-B7-B7构建体的相同的PCR产物，用BstBI和HindIII消化，并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402，SEQ ID NO：39)中。在小量制备物筛选之后，为所得的pGLEX41_HC-I4-B7-B7-B7-SV40ter中量制备提供批号GSC7059并通过限制性消化和测序(SEQ ID NO:56)确认。

使用鼠B7-1跨膜区进一步减少分泌到IgG1抗体的膜呈现重链的剪接比

已经呈现利用鼠B7-1跨膜区，嵌合蛋白的膜呈现高度有效(Chou W-C et al.,(1999)Biotechnol Bioeng,65:160-9；Liao K-W et al.,(2001)Biotechnol Bioeng,73:313-23)。本文也呈现，降低剪接-受体的多聚(Y)道中的Ys的量为0显著降低细胞膜上的呈现抗体的量(见实施例3中的图6F)。

为了评估内含子的多聚(Y)道中的嘧啶的量的减少的效果，通过PCR融合产生若干构建体。

表3：内含子的修饰：用于PCR的引物对和模板。

第一PCR允许从含有修饰的内含子的内部骨架扩增所需的内含子。用于每个构建体的引物和模板列于表3中。第二PCR(对所有构建体共同的)允许用引物GlnPr2101(SEQIDNO：34)和GlnPr2100(SEQ ID NO：33)从构建体pGLEX41_HC 6-14B7-B7-B7(GSC7056，SEQ IDNO：55)扩增B7-1跨膜结构域。在这些PCR产物纯化后，用引物GlnPr1516(SEQID NO：9)和GlnPr2100(SEQ ID NO：33)通过重叠延伸PCR融合内含子和跨膜结构域。将纯化的PCR产物用HindIIII和BstB消化，并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO:55)中。在小量制备物筛选之后，对每个构建体生产中量制备物并通过测验证。属于每个构建体的质粒批号如下：

pGLEX41_HC-I4(3Y)-I4-B7-B7-B7	GSC9770(SEQ ID NO:62)
		pGLEX41_HC-I4(5Y)-I4-B7-B7-B7	GSC9763(SEQ ID NO:61)
pGLEX41_HC-I4(5Y-5)-I4-B7-B7-B7	GSC9768(SEQ ID NO:60)
		pGLEX41_HC-I4(9Y)-I4-B7-B7-B7	GSC9949(SEQ ID NO:59)
pGLEX41_HC-I4(15Y-3’)-I4-B7-B7-B7	GSC9950(SEQ ID NO:63)

减少剪接的另一种方式是削弱剪接供体位点。该剪接供体的特征在于定义内含子的5'端的共有序列。因此，设计两个构建体，其中修饰剪接供体共有序列的DNA序列而不影响通过基因表达的蛋白质序列。

对于SD_CCC构建体用引物GlnPrl518(SEQ ID NO：11)和GlnPr2161(SEQ ID NO：313)以及对于SD_GGC构建体用GlnPrl518(SEQ ID NO：11)和GlnPr2160(SEQ ID NO：314)，在模板pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO:55)上进行具有修饰的3'末端序列的IgG1重链的PCR扩增。将PCR用NheI和HindIIII消化，并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO:55)中。在小量制备物筛选之后，生产中量制备物pGLEX41_HC-SD_CCC-I4-B7-B7-B7(质粒批号GSC9764，SEQ ID NO：58)和pGLEX41_HC-SD_GGC-I4-B7-B7-B7(质粒批号GSC9765，SEQ ID NO：57)并通过测序验证。构建体pGLEX41_HC-SD_GGC-I4-B7-B7-B7的内含子序列以SEQ ID NO:78给出。

用仅具有疏水残基的类似长度的跨膜结构域替换B7-L跨膜结构域

为了评估跨膜结构域对膜呈现的影响，设计了若干构建体。据认为主要含有疏水残基的跨膜螺旋对表面呈现的稳定有利，因此，作为第一种方法，将B7-1跨膜区的B7-1跨膜结构域替换为只含有疏水残基的其他蛋白质的跨膜结构域。此外，由于跨膜螺旋的长度可能影响表面呈现，这些第一构建体仅由具有与B7-1跨膜结构域类似的长度的跨膜结构域组成。

这些跨膜结构域的序列和特征总结在表4中。

表4：具有22-23个氨基酸(都疏水)的跨膜结构域：特征和序列

表5：用于疏水跨膜结构域的克隆的引物对

用修饰跨膜结构域的3'端的引物通过cTNT内含子4的一部分的2步PCR扩增创建不同的跨膜结构域。模板一直是pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)构建体。对于每个构建体，用表5中所列的相应的引物进行第一轮PCR。在清除该第一轮PCR产物之后，用表5中所列的引物进行第2轮PCR。清除后，将这些PCR产物用AgeI和ClaI消化，并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO:55)中。在确认小量水平的序列之后，生产不同构建体的中量制备物并将下列GSC号分配给这些质粒批次：

通过测序确认所有中量制备物。

用包含带电和/或极性残基的类似长度的跨膜结构域替换B7-L跨膜结构域

由于仅含有疏水残基的跨膜结构域对表面呈现没有影响(见实施例4中的图10)，其它跨膜结构域被选择具有与B7-1跨膜结构域相似的长度但包含一个或多个带电和/或极性的残基。

这些跨膜结构域的序列和特征总结在表6中。

表6：含有带电和/或极性的残基的具有21-24个氨基酸的跨膜结构域：特征和序列。

表7：用于含有带电和/或极性的残基的具有21-24个氨基酸的跨膜结构域的克隆的GeneArt构建体。

从GeneArt订购具有表7所示的名称的不同的跨膜结构域(除了PTCRA)。一旦收到，在水中再悬浮GeneArt构建体，然后用AgeI和ClaI消化。将所得的插入物连接在用同样的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)中。小量制备物筛选后，生产中量制备物并获得了以下批号：

对于构建体pGLEX41_HC-I4-B7-PTCRA-B7，进行两步PCR。使用引物GlnPrl516(9SEQ ID NO：9)和GlnPr2380(SEQ ID NO：223)以及pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)作为模板扩增具有B7-1跨膜区的B7胞外部分的cTNT内含子。将所得的PCR产物用引物GlnPrl516(SEQ ID NO：9)和GlnPr2381(SEQ ID NO：224)再扩增。引物GlnPr2380(SEQ ID NO：223)和GlnPr2381(SEQ ID NO：224)允许融合PTCRA跨膜结构域到B7-1跨膜区的B7-1胞外部分。将所得的PCR产物用ClaI和AgeI消化，并在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)中再克隆。在小量制备物筛选选之后，制备中量制备pGLEX41_HC-I4-B7-PTCRA-B7。其获得批号GSCl 1204，并通过测序(SEQID NO：93)确认。

PTCRA跨膜结构域中的带电残基的修饰

PTCRA跨膜结构域长度为21个氨基酸，其中3个是带电残基。这些带电残基的存在可能解释表面呈现系统中的特定跨膜结构域的相对差性能(参见实施例4中的图11)。因此，这些残基突变成疏水性氨基酸缬氨酸可能对表面呈现有益。

表8：PTCRA跨膜结构域中的带电残基的突变：序列，引物和DNA批号：

用作为正向引物的GlnPrl516(SEQ ID NO：9)以及表8中描述的用于不同的构建体的反向引物，使用pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)作为模板，通过两步PCR生成PTCRA跨膜结构域中的非突变和突变带电残基的所有可能的组合。在第一轮PCR后，清除PCR产物并用GlnPrl516(SEQ ID NO：9)作为正向引物以及表8中所述的反向引物进行第二轮PCR。清除所得的PCR产物，用消化ClaI和Age I消化并连接在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO:55)中。小量制备物筛选后，以中量制备规模制备阳性构建体并通过测序确认。各构建体的批号如下：

由含有带电和/或极性残基的不同长度的跨膜结构域替换B7-L跨膜结构域

由于在跨膜结构域中存在带电和残基不消除表面呈现(参见实施例4中的图12)，使用比B7-1跨膜结构域更短或更长并且这次含有一个或多个带电和/或极性残基的跨膜结构域评估跨膜结构域的长度。

这些跨膜结构域的序列和特征总结在表9中。

表9：含有带电和/或极性残基的不同长度的跨膜结构域：特征和序列。

表10：用于含有带电和/或极性的残基的具有不同长度的跨膜结构域的克隆的GeneArt构建体。

从GeneArt订购具有表10所示的名称的不同的跨膜结构域。一旦收到，在水中再悬浮GeneArt构建体，然后用AgeI和ClaI消化。将所得的插入物连接在用同样的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)中。小量制备物筛选后，生产中量制备物并获得了以下批号：

B7-L跨膜结构域长度的修饰

为了评估表面呈现上的跨膜长度的影响，通过在B7-1跨膜结构域序列的中间移除或加入疏水性残基产生B7-1跨膜结构域的不同变体。

表11：B7-1跨膜结构域长度的修饰：序列和引物对。

为了这个目的，进行引物退火。对于B7-1跨膜结构域的每个变体，订购其3'端退火的引物。用于每个构建体的引物对在表11中描述。允许引物退火，然后将序列通过PCR完成。清除后，将所得PCR产物用Sfol和Agel直接消化，并克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO:55)骨架中，或连接到pCR-钝(ZeroPCR克隆试剂盒，Invitrogen，LifeTechnologies)穿梭载体中(由于退火产物非常短，直接连接并不是对于每种产物奏效)。在第二种情况下，从在pCR-钝(Zero PCR克隆试剂盒，Invitrogen，LifeTechnologies)中连接退火产物之后获得的克隆提取小量制备。序列确认后，将阳性小量制备物用Sfol和AgeI消化并将得到的片段连接克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)骨架中。小量制备物筛选后，对每种构建体制备中量制备物。如下所述地对这些中量制备物分配GSC批号并通过测序确认。

B7-1跨膜区中的胞质尾的修饰

由于胞质尾(具有或不具有ER出口信号)可能影响表面呈现，用修饰的胞质尾设计若干构建体。

这些胞质尾的序列和特征总结在表12中。

表12：胞质尾：特征和顺序。

根据不同的构建体的长度施加不同的克隆策略。

用修饰胞质尾的引物通过具有B7-1胞外和跨膜结构域的cTNT内含子4的PCR扩增产生第一构建体。

表13：用于胞质尾修饰的引物对和酶。

所使用的引物对在表13中描述并且所使用的模板是pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)。将纯化的PCR产物用表13中描述的酶消化，并在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO:55)中克隆。小量制备物筛选后，生产获得以下批号的中量制备物：

所有中量制备物经测序确认。

为了融合M1M2胞质尾到B7-1跨膜区，进行融合PCR。使用pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)作为模板，用GlnPrl516(SEQ ID NO：9)和GlnPr2391(SEQ ID NO：234)扩增具有B7-1胞外和跨膜结构域的cTNT内含子4。使用pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899，SEQ ID NO：36)作为模板，用引物GlnPr2390(SEQ ID NO：233)和GlnPrl650(SEQ ID NO：19)扩增具有SV40多聚(A)信号的M1M2胞质尾。清除后，使用GlnPrl516(SEQ IDNO：9)和GlnPrl650(SEQ ID NO：19)作为引物将这两种PCR产物在第三轮PCR中融合。将所得的PCR产物清除，用Sfol和BstBI消化并连接在用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)中。在小量制备物筛选后，生产中量制备pGLEX41_HC-I4-B7-B7-M1M2，获得批号GSC11758并通过测序确认(SEQ ID NO：114)。

对于一些构建体，选择了引物退火的战略。对于每一个胞质尾，订购在其3’端退火的引物。用于每个构建体的引物对在表14中描述。允许引物退火，然后将序列通过PCR完成。清除后，将所得PCR产物用Sfol和BstBI直接消化和克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)骨架中，或连接到PCR-钝穿梭载体(ZeroPCR克隆试剂盒，Invitrogen，LifeTechnologies)中(由于退火的产物非常短，直接连接不是对每一种产物奏效)。在第二种情况下，从在pCR-钝(ZeroPCR克隆试剂盒，Invitrogen，LifeTechnologies)中连接退火产物之后获得的克隆提取小量制备。序列确认后，将阳性小量制备物用Sfol和BstBI消化并将得到的片段连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)骨架中。小量制备物筛选后，对每种构建体制备中量制备物。如表14所述地对这些中量制备物分配GSC批号并通过测序确认这些制备物。

表14：用于胞质尾修饰的引物退火所使用的引物对和DNA批号。

最后，对于最后的构建体，从GeneArt订购具有表15所述的序列名称的序列。一旦收到，在水中再悬浮GeneArt构建体，然后用SfoI和BstBI消化。将所得的插入物连接在用同样的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)中。小量制备物筛选后，生产中量制备物并获得在下表中详述的批号。

表15：为胞质尾修饰和DNA批号订购的GeneArt序列。

为了进一步评估B7-1胞质尾的影响，通过B7-1胞质尾替换M1M2跨膜结构域的胞质尾。为了这个目的，从GeneArt订购为GeneArt_Seq82(SEQ ID NO：264)的具有B7-1胞质尾的M1M2跨膜结构域。将GeneArt构建体用ClaI和BstBI消化并将插入物连接在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)中。小量制备物筛选后，生产中量制备物pGLEX41_HC-M1M2-M1M2-B7，获得质粒批号GSC11294并通过测序确认(SEQ ID NO：125)。

用于IgG1抗体的轻链的表达的载体的克隆

从GeneArt提供的携带轻链插入物(0704970pGA4)克隆载体用作使用引物GlnPr501(SEQ ID NO：4)和GlnPr502(SEQ ID NO：5)的PCR的模板。这些引物扩增轻链的开放阅读框并添加HindⅢ限制位点5'和XbaI限制位点3'到开放阅读框。将扩增子用XbaI和HindIII消化，并使用XbaI和HindIII连接在穿梭载体切出中。小量制备物筛选后，生产吉咖制备物，其通过测序和消化确认。

用XbaI和HindIII从该吉咖制备物切割IgG1形式的抗体的轻链的编码区，并克隆到用相同的酶打开并用CIP处理的质粒pGLEX41(GSC281，SEQ ID NO：304)的骨架中。小量制备物筛选后，产生pGLEX41_LC的大量制备物，获得批号GSC315(SEQ ID NO：294)，并通过测序确认。随后，以中量制备或吉咖制备水平生产相同的DNA的几个批次并获得批号GSC315a，GSC315b，GSC315c，GSC315d和GSC315e(因为所有这些制备物通过测序确认，以下将它们称为GSC315质粒(SEQ ID NO：294))。

用于IgG4抗体的轻链的表达的载体的克隆

编码IgG4重链的序列在Glenmark生成并在穿梭载体中获得。用引物GlnPrl488(SEQ ID NO：328)和GlnPrl452(SEQ ID NO：327)通过PCR扩增IgG4重链编码序列。纯化后，将得到的PCR产物用引物GlnPrl494(SEQ ID NO：260)和GlnPrl452(SEQ ID NO：327)再扩增。这两轮PCR修饰前导肽，并在编码序列的两端添加限制性位点。将得到的PCR产物进行纯化，并在穿梭载体pCR-钝(ZeroPCR克隆试剂盒，Invitrogen公司，LifeTechnologies)中克隆。小量制备物筛选后，用SpeI和ClaI消化阳性克隆以提取IgG4重链编码序列。将所得的插入物连接在用NheI和BstBI消化和用CIP处理的pGLEX41(GSC281，SEQ ID NO：304)中。小量制备物筛选后，生产吉咖制备物pGLEX41_IgG4-HC，获得质粒批号GSB59并通过测序确认(SEQ ID NO：79)。

用允许B7-1跨膜区的表达的选择性剪接克隆用于IgG4抗体的重链的表达的载体

为了添加用于膜结合IgG4表达的选择性剪接盒，使用pGLEX41_IgG4-HC(GSB59，SEQ ID NO：79)作为模板，用引物GlnPrl494(SEQ ID NO：260)和GlnPr2294(SEQ ID NO：261)通过PCR扩增用于IgG4重链的编码序列。将所得的PCR产物清除，用SpeI和HindIII消化并连接到用NheI和HindIII消化和用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ IDNO：55)骨架中。小量制备物筛选后，制备中量制备物pGLEX41_IgG4-HC-B7 B7-B7，其获得质粒批号GSC11218并通过测序确认(SEQ ID NO：80)。

用于IgG4抗体的轻链的表达的载体的克隆

编码IgG4轻链的序列在Glenmark生成并在穿梭载体中获得。使用具有三种不同的引物GlnPrl487(SEQ ID NO：325)，GlnPrl491(SEQ ID NO：326)和GlnPrl494(SEQ ID NO：260)的单轮PCR，交换前导肽并在编码序列的两端添加限制性位点。将PCR产物用SpeI和ClaI消化，并在用NheI和BstBI打开和用CIP处理的pGLEX41(GSC281，SEQ ID NO：304)骨架中连接。小量制备物筛选后，生产中量制备物pGLEX41_IgG4-LC，获得质粒批号GSC3704并通过测序确认(SEQ ID NO：319)。

用于双特异性抗体的分泌重链的表达的载体的克隆

在Glenmark生成双特异性抗体的重链作为双特异性形式的一部分。使用两轮PCR，添加Kozak序列，信号肽和侧翼限制性位点。在第一轮中，使用引物GlnPrl726(SEQID NO：24)和GlnPrl500(SEQ ID NO：7)扩增模板。将PCR产物纯化并用作模板用于使用引物GlnPrl500(SEQ ID NO：7)和GlnPrl725(SEQ ID NO：23)的第二轮PCR。将所得的扩增子纯化并使用限制酶SpeI和ClaI切割。将该插入物克隆到用NheI和BstBI打开和用CIP处理的骨架pGLEX41(GSC281，SEQ ID NO：304)中。小量制备物筛选后，以中量制备规模生产pGLEX41_BEAT-HC-His并获得批号GSC5607(SEQ ID NO：296)。测序对照和限制性消化确认质粒。

将该质粒作为模板用于使用引物GlnPrl725(SEQ ID NO：23)和GlnPrl760(SEQ IDNO：27)的修饰的PCR，用于从模板序列去除His-标签。将扩增子用SpeI和ClaI消化并克隆到用限制酶NheI和BstBI打开和用CIP处理的载体pGLEX41(GSC281，SEQ ID NO：304)的骨架中。小量制备物筛选后，对中量制备物pGLEX41_BEAT-的HC提供质粒批号GSC5644并通过测序确认(SEQ ID NO：49)。

用于双特异性抗体的膜呈现重链的选择性剪接表达载体的克隆

使用引物GlnPrl800(SEQ ID NO：29)和GlnPrl725(SEQ ID NO：23)扩增编码BEAT重链(GSC5644，SEQ ID NO：49)的模板载体。将纯化的产物用限制酶SpeI和HindIII消化并克隆到使用酶NheI和HindIII打开并用CIP处理的载体pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899，SEQ ID NO：36)中。小量制备物筛选后，大量制备物pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2获得质粒批号GSC5537(SEQ ID NO：50)并通过限制性消化和测序确认。

为了使用B7-1跨膜区用于表面呈现，将构建体pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(GSC5537，SEQ ID NO：50)的插入物用SacI和HindIII消化，并在用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)中再克隆。小量制备物筛选后，生产大量制备物pGLEX41_BEAT-HC-I4-B7-B7-B7，获得质粒批号GSC10488并通过测序确认(SEQ ID NO：321)。

用于双特异性抗体的分泌的scFv-Fc的表达载体的克隆

内部开发scFv-Fc序列作为双特异性形式的一部分。使用引物GlnPrl690(SEQ ID NO：22)、GlnPrl689(SEQ ID NO：21)和GlnPrl502(SEQ ID NO：8)进行扩增。这些引物添加Kozak序列，信号肽和限制性位点到扩增子。使用引物GlnPrl689(SEQ ID NO：21)和GlnPrl502(SEQ ID NO：8)再次扩增PCR产物，并将所得的扩增子用NheI和ClaI消化。该插入片段与使用NheI和BstBI切割和用CIP处理的骨架pGLEX41(GSC281，SEQ ID NO：304)连接。小量制备物筛选后，生产具有批号GSC5608(SEQ ID NO：51)的中量制备物pGLEX41_scFv-Fc并通过限制性消化和测序确认。

用于双特异性抗体的膜呈现scFv-Fc的选择性剪接表达载体的克隆

使用引物GlnPrl801(SEQ ID NO：30)和GlnPrl689(SEQ ID NO：21)扩增编码scFv(GSC5608，SEQ ID NO：51)的模板载体。将纯化的产物用NheI和HindIII消化，并在使用相同的酶打开和用CIP处理的载体pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899，SEQ ID NO：36)中克隆。小量制备物筛选后，生产具有质粒批号GSC5538(SEQ ID NO：52)的中量制备物pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2并通过限制性消化和测序确认。

为了使用B7-1跨膜区用于表面呈现，将构建体pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(GSC5537，SEQ ID NO：50)的插入物用NheI和HindIII消化，并在用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056，SEQ ID NO：55)中再克隆。小量制备物筛选后，生产大量制备物pGLEX41_scFv-Fc-I4-B7-B7-B7，获得质粒批号GSC10487并通过测序确认(SEQ ID NO：323)。

用于双特异性抗体的轻链的表达载体的克隆

内部开发轻链序列作为双特异性形式的一部分。使用引物GlnPrl689(SEQ ID NO：21)，GlnPrl727(SEQ ID NO：25)和GlnPrl437(SEQ ID NO：6)实施扩增。这些引物添加信号肽，Kozak序列和侧翼限制性位点到扩增子。将扩增子纯化并使用限制酶ClaI和NheI消化和在用NheI和ClaI打开并用CIP处理的穿梭载体的骨架中克隆。小量制备物筛选后，制备大量制备物并通过测序验证。使用限制酶NheI和ClaI消化编码双特异性构建体的轻链的穿梭载体并将该插入物克隆到用NheI和BstBI打开并用CIPed处理的载体pGLEX41(GSC281，SEQ ID NO：304)中。小量制备物筛选，制备pGLEX41_BEAT-LC的中量制备物(质粒批号GSC5540，SEQ ID NO：302)并通过限制性消化和测序确认质粒。

实施例2：翻译产物的表面呈现和特异性检测

介绍

实施例1描述了从相同的DNA模板克隆导致两种不同的mRNA的表达的选择性剪接构建体，编码分泌蛋白或具有C末端跨膜区(TM)的相同的蛋白质。如在定义部分详细描述的，跨膜区包括任选的连接子、跨膜结构域和任选的胞质尾。在CHO-S细胞中转染这些构建体，以确定该技术是否可用于在细胞膜上呈现蛋白的一部分，同时保持靶蛋白的有效的分泌。

三种不同的蛋白质在本实验中使用：IgG1亚类的抗体，IgG4亚类的抗体和形式的双特异性抗体。

材料与方法

转染

在50ml生物反应器管(Tubespins，TPP)形式中用使用聚乙烯亚胺( Polyplus-转染，伊尔基希，法国)的表达载体转染悬浮CHO-S细胞。为了这个目的，在5ml的OptiMEM培养基(#31985-047，Invitrogen)或CD-CHO培养基(#10743-011，LifeTechnologies)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。细胞悬浮液中的最终DNA浓度为2.5μg/mL。在37℃振荡(200rpm)下温育5小时后，将5ml的新鲜培养基加入到细胞悬浮液中。然后将细胞在37℃，5％CO₂和80％湿度下在摇动平台上温育。

表面染色

转染后第1天，进行细胞的表面染色。收获总共1E5细胞，并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2％FBS在PBS中)洗涤两次，然后再悬浮在含有检测抗体的100μL洗涤缓冲液中。使用通过红色激光(640nm)激发和在光谱范围661/19nm内检测的小鼠抗-人κ轻链APC标记的抗体(#561323，BD Pharmingen)进行κ轻链的特异性检测。使用通过蓝色激光(488nm)激发和在光谱范围583/26nm内检测的PE缀合的山羊抗人Fcγ特异性抗体(#12-4998-82，eBioscience)检测重链和scFv-Fc两者并且使用通过蓝色激光在488nm下激发和在光谱范围525/30内检测的FITC标记的蛋白A(#P5145，Sigma)特异性地检测scFv-Fc。在室温下在黑暗中温育20分钟后，将细胞在洗涤缓冲液中洗涤一次，并再悬浮于200μL的洗涤缓冲液中用于流式细胞分析。用Guava流式细胞仪(Merck Millipore)或用FACSCalibur(Becton Dickinson)分析细胞。

使用八位QK仪(Fortebio，门洛帕克，CA)和蛋白A生物传感器在转染后第4-6天测量分泌的分子的瞬时表达水平。

结果

对于IgG1抗体表达，如在材料和方法部分中所述地转染CHO-S细胞，分别使用表达轻链的表达载体pGLEX41_LC(SEQ ID NO：294)和命名为pGLEX41_HC-I4-B7-B7-B7(SEQ IDNO：55)，pGLEX41_HC-I4-M1M2-M1M2-M1M2(SEQ ID NO：36)，pGLEX41_HC-I4-PTCRA(SEQ IDNO：40)或pGLEX41_HC-I4-M1M2-PTCRA-M1M2_校正(SEQID NO：284)的第二载体。作为对照，使用编码分泌重链的非剪接构建体(SEQ ID NO：48)。

转染后，如材料和方法中描述地染色并通过流式细胞仪分析细胞。表达轻链和重链的分泌版本的阴性对照(无跨膜区的选择性剪接)仅得到具有相对高的IgG1分泌水平(见图2F)的低强度的表面染色(参见用于染色的细胞的百分比的图2A和图2E中的未填充的直方图)。与此相反，用包含M1M2区域的构建体(SEQ ID NO：36)转染的细胞表现出在细胞膜上呈现该抗体的显著阳性群(参见图2B中的填充的直方图)。通过PTCRA跨膜区(参见图2C；SEQID NO：40)交换整个M1M2跨膜区，或通过PTCRA的跨膜结构域(参见图2D；SEQ ID NO：284)特异性交换M1M2的跨膜结构域导致阳性的但弱染色的细胞群。鼠B7-1跨膜区(参见图2A；SEQID NO：55)显示令人惊讶的高水平的染色，其中40％的种群对膜呈现的IgG1为阳性。

选择性剪接以及因此所有产生的抗体的一部分的膜结合表达似乎对分泌的IgG的滴度具有负面影响。尽管如此，M1M2跨膜区(也与PTCRA跨膜结构域组合)，特别是B7-1跨膜区允许无选择性剪接的对照构建体的达到80％的分泌水平(参见图2F)。

对于IgG4抗体表达，如在材料和方法部分中所述地转染CHO-S细胞，使用表达轻链的表达载体pGLEX41_IgG4-LC(SEQ ID NO：319)以及编码具有用于膜呈现的B7-1跨膜区的选择性剪接的重链的第二载体(SEQ ID NO：80)。作为对照，使用编码分泌的IgG4重链的非剪接构建体(SEQ ID NO：79)。

转染后，如材料和方法中描述地染色并通过流式细胞仪分析细胞。表达轻链和重链的分泌版本的阴性对照(无跨膜区的选择性剪接)仅得到具有大约6μg/mL的大量分泌水平(参见图3C)的阴性群(见图3A)。与此相反，用包含B7-1区域的构建体(SEQ ID NO：80)转染的细胞表现出在细胞膜上呈现该抗体的显著阳性群(参见图3A的直方图和图3B的染色的百分比)而表达水平保持在具有和不具有选择性剪接的类似水平(参见图3C)。

为了解决双特异性抗体是否可以通过跨膜区(TM)呈现在细胞膜上，在CHO细胞中瞬时表达编码双特异性抗体的在实施例1中描述的选择性剪接构建体。选择性剪接构建体编码内部开发并在WO2012/131555中描述的双特异性抗体形(称为)，其用作本实施例中的模型蛋白。BEAT分子是融合至重链恒定区(“scFv-Fc”)的IgG重链(“重链”)，κ轻链(“轻链”)和scFv的三聚体。废除重链的蛋白A结合位点，使得仅scFv-Fc的Fc片段能够结合到蛋白A。分子的设计和重链蛋白A结合位点的工程化允许三聚体的每个亚基的特异性检测。通过转染重链或scFv-Fc的选择性剪接构建体或转染选择性剪接构建体两者来实现细胞膜上的呈现。通过流式细胞术特异性地检测在单一细胞的表面上呈现的膜结合BEAT双特异性抗体。

在下文中，编码正则表达构建体的载体将被简称为用于pGLEX41_BEAT-HC(SEQ IDNO：49)的“pHC”，用于pGLEX41_BEAT-LC(SEQ ID NO：302)的“pLC”和用于pGLEX41_scFv-Fc(SEQ ID NO：51)的“pScFv-Fc”。添加跨膜区到HC的选择性剪接构建体将被称为“pHC-M1M”(pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2；SEQ ID NO:50)和添加跨膜区到scFv-Fc的构建体将被称为“pScFv-Fc-M1M2”(pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2；SEQ ID NO：52)。使用不同组合的选择性剪接表达构建体或正则表达构建体共转染编码BEAT抗体的三个亚基的表达载体。表16总结了所进行的转染以及在细胞膜上预期呈现的种类。

表16：转染方案和在细胞膜上呈现的期望种类：

转染后第1天获得的流式细胞概况在4A和B中示出。第一转染混合物(PHC+pScFv-Fc+pLC)不包括具有用于细胞膜呈现的跨膜区的构建体。因此，对该转染获得的概况(图4A，D，G)被认为是该实验的阴性对照，并且表示为直方图中的虚线分布。

载体pScFv-Fc-M1M2的转染本身仅给出抗Fc的阳性细胞(检测重链)和蛋白A染色(图4K，N，Q)。在这种情况下，在细胞膜上没有检测到轻链证明了测定的特异性。

载体pHC-M1M2和pLC的共转染产生了抗Fc的阳性细胞和κ轻链染色，但没有观察到蛋白A结合(图4L，O，R)。这是根据这样的事实，在BEAT分子的重链亚基中蛋白A结合位点已被废除。因此，虽然抗人Fcγ抗体不对重链特异性并识别scFv-Fc，轻链的检测允许我们推断重链的表达。

用编码所有三种亚基的质粒混合物进行的转染，独立于所使用的选择性剪接构建体，显示具有至少一个跨膜区的BEAT构建体的表达(图4B，C，J，E，F，M，H，I，P)。染色对于轻链和scFv-Fc，以及Fc片段(重链和scFv-Fc)阳性，表明所有预期的种类存在于细胞膜上。因此，完全折叠的多聚体存在于细胞膜上，确认报告系统对多聚蛋白的表达的有效性。出人意料的是，不管跨膜区的位置，检测到所有种类。无论是跨膜区(TM)被连接到重链(HC)和scFv-Fc亚基(图4B，E，H)两者，或仅连接到HC(图4C，F，I)或仅连接到scFv-Fc(图4J，M，P)，没有观察到任何差别。

因此，这里提出的方法允许在细胞膜上呈现的异源二聚体(例如重链+scFv-Fc+轻链)和同源二聚体(重链+轻链或scFv-Fc同源二聚体)之间的区别。在多聚蛋白如双特异性抗体的表达的背景下，该信息的质量相当有用。

在转染后第6天通过使用蛋白A生物传感器的八位QK仪测量分泌BEAT和scFv-Fc二聚体的浓度。结果示于图5中。由于最终产物(重链-轻链二聚体)不结合蛋白A，根据预期，对于使用表达载体pHC-M1M2+pLC的转染，用蛋白A生物传感器测量不到表达。对于使用表达载体pScFv-Fc-M1M2的转染，只观察到相比于只导致分泌产物的对照转染的较低的表达水平。对于使用选择性剪接构建体的所有转染，可以在上清液中检测到B EAT分子或scFv-Fc同源二聚体。这证实了BEAT异源二聚体不仅如以前所证明地呈现在细胞膜上，也使用细胞的分泌途径被成功地分泌。更重要的是，用选择性剪接构建体获得的表达水平与对照(PHC+pScFv-Fc+pLC)相当。这表明，只有蛋白的一小部分偏离表面呈现的分泌途径，因为在这个实验设置中未测量到对分泌水平的显著影响。

总结

基于这些结果，可以得出的结论是，选择性剪接构建体通过选择性剪接成功地转移所产生的抗体的一部分到细胞膜。虽然对于含PTCRA跨膜结构域的构建体，表面染色低，但是对于用包含M1M2跨膜区的构建体转染的细胞，染色高，而且对于包含B7-1跨膜区的构建体，甚至更高。除了信号强度，在用B7-1构建体转染时能够被染色的细胞种群的百分比令人惊讶地高，考虑到在B细胞的进化过程中M1M2跨膜区被选择用于抗体的高效膜呈现并因此应该代表用于免疫球蛋白的膜呈现的最有效的构建体。

当分泌抗体的一部分被重定向到细胞膜时总的抗体表达水平降低，但用不同的构建体达到未剪接对照的表达水平的80％左右。

如构建体的实施例所证明的，使用本发明的选择性剪接构建体，具有多于两个的亚基的分子也可以成功地呈现在细胞膜上。这些构建体融合跨膜区到所表达的蛋白质的一小部分。使用双特异性抗体(BEAT)作为一个例子，相比于只导致分泌蛋白质的对照转染，观察到无显著差异的分泌水平。选择性剪接对表达水平没有影响或仅有较小的影响的观察使得该技术可被工业应用接受。而且，可以表明，如本文所述的方法允许在细胞膜上呈现的多聚体的特异性检测。令人惊讶地，可以将跨膜区添加到重链或scFv-Fc或这两种亚基，而对分泌蛋白的表面呈现或表达水平没有影响。

因为通过选择性剪接在细胞膜上呈现的多聚分子反映特定细胞的分泌多聚蛋白的产物组分，该技术将允许单细胞水平上的分泌概况的基于流式细胞的定性预测。这在实施例5中说明。

实施例3：由内含子序列的修饰调节细胞表面呈现和表达滴度

前言

如实施例2中所说明的，跨膜区的选择性剪接允许重定向否则通常分泌的抗体的一部分到细胞表面。然而，分泌过程的这种修饰可能对抗体的分泌水平造成负面影响。微调分泌和膜呈现抗体之间的剪接比可能有助于恢复用非剪接抗体构建体(无选择性剪接跨膜区)所观察到的表达水平。这将在下面的例子中说明。

材料与方法

转染

在50ml生物反应器管(Tubespins，TPP)形式中用使用聚乙烯亚胺( Polyplus-转染，伊尔基希，法国)的表达载体转染悬浮CHO-S细胞。为了这个目的，在5ml的OptiMEM培养基(#31985-047，Invitrogen)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。细胞悬浮液中的最终DNA浓度为2.5μg/mL。在37℃振荡(200rpm)下温育5小时后，将5ml的新鲜培养基加入到细胞悬浮液中。然后将细胞在37℃，5％CO₂和80％湿度下在摇动平台上温育。

表面染色

转染后第1天，进行细胞的表面染色。收获总共1E5细胞，并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2％FBS在PBS中)洗涤两次，然后再悬浮在含有检测抗体的100μL洗涤缓冲液中。使用通过蓝色激光(488nm)激发和在光谱范围583/26nm内检测的PE缀合的山羊抗人IgG抗体(#512-4998-82，eBioscience)进行重链的特异性检测。在室温下在黑暗中温育20分钟后，将细胞在洗涤缓冲液中洗涤一次，并再悬浮于200μL的洗涤缓冲液中用于流式细胞分析。用Guava流式细胞仪(Merck Millipore)或用FACSCalibur(BectonDickinson)分析细胞。使用八位QK仪(Fortebio，门洛帕克，CA)和蛋白A生物传感器在转染后第4-6天测量分泌的分子的瞬时表达水平。

结果

如在材料和方法部分中所述地转染CHO-S细胞，使用表达轻链的表达载体pGLEX41_LC(SEQ ID NO：294)和编码重链并含有具有M1M2跨膜结构域(SEQ ID NO：36-39)，具有PTCRA跨膜结构域(SEQ ID NO：40-43)，具有M1M2-PTCRA融合跨膜结构域(SEQ ID NO：44-47)或具有B7-1跨膜结构域(SEQ ID NO：53-56)的内含子的修饰版本的第二载体。作为对照，使用不具有选择性剪接的分泌重链(SEQ ID NO：48)。

转染后，如在材料和方法中所述地染色细胞并通过流式细胞分析。如实施例2中已经观察到的，表达轻链和重链的分泌版本的阴性对照(无跨膜区的选择性剪接)只产生具有大量的IgG1分泌水平(参见图7)的小部分染色细胞(见图6)。与此相反，用含有M1M2区(SEQID NO：36，图6A)和B7-1跨膜结构域(SEQ ID NO：55，图6M)的构建体转染的细胞显示出显著的在细胞膜上呈现抗体的阳性群。由于PTCRA跨膜结构域(SEQ ID NO：40，图6E)或M1M2-PTCRA融合跨膜结构域(SEQ ID NO：44，图61)，阳性群被弱染色。

内含子的多聚(Y)道中的Y含量的降低已表明削弱剪接受体并且被引入以改变剪接比有利于分泌抗体。对于导致成功的呈现(M1M2和B7-1)的两个跨膜区，不具有内含子的多聚(Y)道中的Y的构建体(SEQ ID NO：37和SEQ ID NO：53)显示无细胞的表面染色(参见图6B和N)。这表明，剪接的比率大多朝向分泌的抗体偏移。

小鼠免疫球蛋白μ初级转录物的内含子中的附加的多聚(A)位点的存在已经显示出影响选择性剪接事件，导致更高的分泌产物部分(Galli等人，1987年)以及更少的膜呈现抗体。基于该发现，SV40多聚(A)位点被引入分泌多肽的终止密码子的3’以及内含子的分支点的5’以便改变剪接比有利于抗体分泌。随着在内含子中加入SV 40多聚(A)位点，对于M1M2构建体，抗体的分泌水平相比于原141显著增加(参见图7)。同时，对于M1M2构建体，膜呈现抗体的部分(参见图6C)增加。由于B7-1细胞的染色已经非常高，对于多聚(A)对膜呈现的影响的结论不能得出(参见图6O)。

将胃泌素终止子位点(报道为终止mRNA的转录)直接引入表达盒的多聚(A)位点的3'以避免与邻近表达盒的其他剪接受体的异常剪接事件。尤其是对于M1M2构建体，胃泌素终止子构建体增加膜呈现抗体部分(图6D)，但并不导致分泌水平的显著增加。同样，对于B7-1细胞没有结论可以得出(图6P)。

选择性剪接以及因此所有产生的抗体的一部分的膜结合表达似乎对整体分泌的IgG滴度具有负面影响。尽管如此，M1M2跨膜区(也与PTCRA跨膜结构域组合)，特别是B7-1跨膜区允许无选择性剪接的对照构建体的达到80％的分泌水平(参见图7)。此外，在内含子中加入多聚(A)信号被认为对IgG分泌有利，同时保持细胞膜上的显著染色。另一方面，胃泌素终止子相比于各个对照构建体只显示出对分泌的轻微影响(参见图7)。

在以前的实验中，内含子序列的不同的修饰显示出对选择性剪接的效率的类似的影响，独立于构建体的跨膜区。因此选择B7-1跨膜区以进一步表征内含子序列修饰对选择性剪接比和抗体分泌水平的影响，因为其导致最高的染色水平。

为了降低细胞表面呈现抗体的量并恢复对照构建体的表达水平，改变剪接比以有利于分泌的产物，即，削弱剪接供体和剪接受体位点。

剪接受体共有序列中存在的多聚(Y)道已知对剪接受体强度具有重要作用(多聚(Y)道越短，剪接受体位点越弱)。在先前的实验，结果表明多聚(Y)道中的Y含量完全降低为零废除抗体的细胞表面呈现。

天然鸡TNT内含子4多聚(Y)道包含27Y。如前所述地在CHO-S细胞中转染具有修饰的内含子的一系列构建体(SEQ ID NO：53，55，59-63)，所述修饰的内含子在其多聚(Y)道中包含降低数量的Y。在表面染色和用八位设备和蛋白A生物传感器评估表达水平之后，可以在抗体的细胞表面呈现上清楚地确定多聚(Y)道的影响：多聚(Y)道中小于9Y显著降低染色细胞的百分比(见图8A，B，C，D，E，F，G，H)以及染色强度(见图8A，B，C，D，E，F，G，J)。不幸的是，细胞表面呈现的这种减少对整体表达水平没有影响，其保持低于每个构建体的对照(见图8Ⅰ)。

朝向分泌产物增加剪接比另一种方式是通过改变剪接供体的DNA序列来减少在选择性剪接内含子的5'末端的剪接供体的强度。通过利用编码相同的氨基酸的选择性密码子可以产生编码与原始构建体相同的氨基酸序列的两种不同的DNA构建体(SD_CCC，SEQ IDNO：58和SD_GGC，SEQ ID NO：57)。

虽然剪接供体共有序列的第一修饰(SD_CCC，SEQ ID NO：58)对染色细胞的百分比，染色的强度或表达水平没有影响(参见图9)，第二修饰(SD_GGC,SEQ ID NO 57)显示出表面呈现(百分比和强度，参见图9C，D和F)的显着降低。表面呈现的这种降低与表达滴度的明显增加相关，达到不具有选择性跨膜结构域的对照的水平(参见图9E)。此外，虽然与天然鸡TNT 4内含子序列相比时细胞表面呈现显着降低，当与没有跨膜结构域的对照相比时可以观察到显著染色(参见图9C)。

总结

胃泌素终止子增加对细胞膜上的IgG特别是对M1M2构建体染色阳性的细胞部分，但并没有导致分泌IgG的相比于标准构建体的更高的表达。在内含子中掺入额外的多聚(A)增加构建体M1M2中的膜呈现抗体部分(对于B7-1没有结论可以得出)。具有额外的多聚(A)的M1M2构建体也呈现高水平的分泌的IgG(高达非剪接对照构建体的表达的80％)。

多聚(Y)道的减少预期减弱剪接受体和降低膜呈现剪接变体的表达。这可以对所有四种不同的基础构建体证实(M1M2，PTCRA，M1M2-PTCRA和B7-1)。另外，表面呈现的水平据发现与多聚(Y)道的长度直接相关，如通过用B7-1跨膜结构域的实施例所描述的。在这方面，多聚(Y)道中至少5Y据发现对于显著表面染色是必要的。同时，可以观察到分泌抗体的表达水平没有增加。因此，选择性剪接的移位不利于分泌产物的积累。

出乎意料的是，剪接供体共有序列的特定修饰允许降低表面染色的水平的降低，同时提高分泌抗体的水平。表面呈现的水平相当低，但相比于对照构建体仍然显著，并且分泌水平被认为与对照相同。

本发明人考虑的是，选择性剪接事件的频率由剪接供体位点的强度确定。如果相应的剪接受体足够强(超过多聚(Y)道中的5Y)，选择性剪接将导致编码具有跨膜区的构建体的选择性mRNA的形成并因此膜呈现。如果剪接受体是通过降低多聚(Y)道中的Y的量小于5Y来削弱，剪接事件将效率降低并且选择性前mRNA可能变差，同时对非剪接mRNA因此对分泌水平没有影响。按照这种情况，剪接受体弱化后观察到较少的膜呈现，但对分泌水平没有影响。降低剪接供体的强度另一方面可能会降低选择性剪接事件的频率。其结果是，更多的mRNA编码非剪接mRNA的分泌产物，导致所观察到的分泌抗体的增加。强剪接受体导致mRNA的有效选择性剪接，但由于弱剪接供体而处于较低的频率，这可以解释所观察到的显著但弱的膜呈现。

综上所述，剪接供体和/或剪接受体序列的修饰允许抗体的表面呈现水平和分泌水平的调节达到不用选择性剪接表达的抗体的分泌水平。因此，所提出的构建体允许通过调节选择性剪接效率来微调呈现和分泌达到期望的水平。Galli G1,Guise J,Tucker PW,Nevins JR(1988)。多聚(A)位点选择而不是剪接位点选择支配IgM重链RNA的规范生产。Proc Natl Acad Sci U S A.Apr；85(8):2439-43。

达的抗体的分泌水平的调节无表达。因此结构允许呈现的微调和的效率至所需。加利GL，吉斯塔克PW，内文斯JR(1988)。保利(A)位点的选择，而不是支配生产规范。PROC国家科学院科学美A.4月；85(8)：2439-43。

实施例4：跨膜区对细胞表面呈现的影响

前言

用于通过细胞产生的抗体的一部分的膜呈现的选择性剪接系统可能通过跨膜区的特性改变。例如，可以推测的是，跨膜结构域的长度和结构可以影响膜呈现的效率。此外，跨膜区的胞质尾可能通过ER出口信号的存在或不存在影响细胞表面呈现。在下面的实施例中，我们证明了无论是跨膜结构域的氨基酸组成，其长度，还是跨膜区的胞质尾都对表面呈现和分泌无关键的影响。

材料与方法

转染

表面染色

结果

如在材料和方法部分中所述地转染CHO-S细胞，使用表达轻链的表达载体pGLEX41_LC(SEQ ID NO：294)和编码具有不同的跨膜区的重链的第二载体。作为对照，使用不具有选择性剪接的分泌重链(SEQ ID NO：48)以及具有B7-1跨膜区(SEQ ID NO:55)的构建体用作阳性对照。

转染后，如在材料和方法中所述地染色细胞并通过流式细胞分析。

跨膜结构域长度和组成

为了分析跨膜结构域对细胞表面呈现和抗体分泌水平的影响，将B7-1跨膜结构域替换为具有类似长度的(22-23个氨基酸)仅含有疏水残基的跨膜结构域(见SEQ ID NO：81-86)。跨膜结构域的交换对细胞表面呈现或抗体的分泌没有影响(见图10)。

当B7-1跨膜结构域由具有相似长度(21-24个氨基酸)的不仅含疏水残基，而且也含有极性或带电残基(SEQ ID NO：87-93)的跨膜结构域替换时，可能不观察到对表面呈现或分泌的影响，除了从PTCRA(SEQ ID NO：93)衍生的跨膜结构域。这个跨膜结构域，无需改变在细胞表面上呈现产物的细胞部分，显着地降低产物的表面密度，而不会对分泌水平造成任何影响(见图11H，J，K和L)。

跨膜结构域由疏水脂质相包围。在膜的疏水环境中插入可电离基团的能量成本非常高，因此应该有对抗跨膜结构域中的带电氨基酸的强烈倾向(White和Wimley，1999)。跨膜螺旋的统计分析证实，跨膜结构域主要由疏水性氨基酸残基组成，特别是在跨膜区的疏水性核心中(Beza-Delgado，2012)。基于该观察，我们希望找出PTCRA跨膜结构域中的三种带电残基(R8，K13和D18，从跨膜螺旋的开头开始编号)对所观察到的弱染色强度的影响中。设计几个PTCRA构建体，其中不同的带电残基分别交换为氨基酸缬氨酸(跨膜结构域中的四个最常见的氨基酸之一(Baeza-Delgado等人，2012))并在CHO-S细胞中转染(SEQID NO：94-100)。这些转染的结果证实带电残基对表面染色强度的影响。单个氨基酸R8V(SEQ ID NO：94)，K13V(SEQ ID NO：95)或D 18V(SEQ ID NO：96)的突变允许显著增加表面呈现抗体的强度，但不显著影响抗体的分泌水平(参见图12B，C，D和J)。从单个突变的结果预期的是，2个突变的带电残基的组合(R8V和K13V(SEQ ID NO：97)，R8V和D18V(SEQ ID NO：98)或K13V和D18V(SEQ ID NO：99))呈现表面呈现的水平以及与PTCRA的跨膜结构域类似的分泌水平(见图12E，F，G和J)。最后，所有三种带电残基突变为缬氨酸(SEQ ID NO：100)如预期地导致相比于对照的高表面呈现。出乎意料的是，用该构建体，分泌抗体的表达水平以及染色的细胞的百分比略低(见图12H和J)。目前还不清楚分泌和染色水平降低的原因。

当B7-1跨膜结构域由不仅含有疏水残基，还含有极性或带电残基(SEQ ID NO：101-103)的较短的跨膜结构域(17-19个氨基酸)替换时，可确定不同的效果。结果可以在图13中看出。而FCERA(SED ID NO：101)和KI2L2(SEQ ID NO：102)的跨膜结构域对染色的细胞的百分比具有小的不利影响(图13B，C和E)，只有从FCERA衍生的跨膜结构域对染色的强度具有负面影响(图13C和G)。此外，这两个跨膜结构域(FCERA和KI2L2)对分泌水平具有轻微良好的效果(图13F)。另一方面，对于来自IL3RB的跨膜结构域(SEQ ID NO：103)，对于染色细胞的百分比和分泌水平观察到相比于B7-1对照构建体没有变化(图13D，E和F)，只观察到染色强度略有下降(图13G)。这使得短的跨膜结构域是微调产物表面呈现的潜在工具。

当B7-1跨膜结构域由不仅含有疏水残基，而且含有极性或带电残基的更长跨膜结构域(SEQ ID NO：104-107)替换时，相比于具有B7-1跨膜结构域的对照构建体，观察到对染色细胞的百分比没有影响，也对染色强度没有影响(参见图14B，C，D，E，F和H)。尽管如此，相比于具有B7-1，具有所有这些跨膜结构域，分泌略好(见图14G)。

为了以更明确的方式而不用从一种跨膜结构域变换到另一种跨膜结构域来评估跨膜结构域长度的影响，设计具有修饰的B7-1跨膜结构域的构建体。从B7-1跨膜结构域的疏水性中心去除或向其中加入几个疏水性氨基酸(SEQ ID NO：108-111)。缩短B7-1至18个氨基酸(SEQ ID NO：108)在染色细胞的百分比方面有益，但在染色强度方面稍有不利(见图15B，F和H)。其他三种构建体(分别为20(SEQ ID NO：109)，24(SEQ ID NO：110)和26(SEQ IDNO：111)个氨基酸)不显著影响染色细胞的百分比或染色强度(见图14C，D，E，F和H)。对于分泌水平，缩短跨膜结构域的长度被发现是有益的，而具有延长的跨膜结构域的构建体显示出与具有天然B7-1构建体相当的分泌水平(见图14G)。

在一般情况下，就染色细胞的百分比和抗体的分泌而言，更短的跨膜结构域似乎是有利的，尽管相比于更长的跨膜结构域染色强度可能略有下降。

胞质尾

文献指出在B7-1胞质尾中存在结构性的，非线性的ER出口信号(Lin等人，2013)。作者发现在跨膜蛋白的胞质结构域中存在靶向细胞表面的ER出口信号可能对细胞表面上的蛋白质的量具有积极影响。在具有高翻转的蛋白质的情况下，从ER到膜的加速输出可以补偿从质膜的蛋白水解切割。

为了评估ER出口信号是否与我们的系统中的膜呈现相关，将B7-1胞质尾替换为已知含有ER出口信号的几个跨膜蛋白和无ER出口信号的缺失突变体的胞质尾(SEQ ID NO：112-124)。

如在图16P中所示，由于ER出口信号的缺乏据发现对于分泌抗体的水平略微有利，而染色细胞的百分比(图16B-N和O)和染色强度(图16B-N和Q)未受到显著影响。因此，我们的膜呈现抗体可能不会受到快速翻转。

除了这些构建体，进行M1M2胞质尾与M1M2跨膜结构域中的B7-1胞质尾的交换(SEQID NO：125)。如图17E中所示，这种交换略微增加荧光的强度，但对染色细胞的百分比没有影响(图17C)，也对分泌水平没有影响(图17D)。

总结

总的来说，数据表明，我们的选择性剪接系统中的跨膜结构域的长度或氨基酸组成对抗体的分泌水平和细胞膜上的产物呈现仅具有轻微的影响。观察到分泌与膜呈现产物的比率的轻微变化，这可能被用于选择性剪接系统的微调。所有的构建体允许抗体的显著的表面呈现，并且也允许相关的分泌水平。

有趣的是，观察到跨膜结构域对细胞表面呈现的荧光水平的重大影响。存在或不存在疏水性氨基酸允许控制平均荧光，而它不影响示出细胞表面呈现的细胞的分泌水平或百分比。

胞质尾中的ER出口信号据发现对于对照抗体的细胞表面呈现不是必需的。由甘氨酸-丙氨酸连接子和6个组氨酸或B7-1尾的前5个氨基酸组成的最小胞质尾对于细胞表面呈现是足够的。这对于受到快速翻转的其它抗体或蛋白质可能是不同的。因此，胞质尾可能是用于调节目的蛋白质的表面呈现的有趣的工具。

总的来说，实施例2-4的数据表明，表面呈现水平和分泌水平受到参与膜结合蛋白的选择性剪接和膜集成的不同序列的影响。虽然剪接供体位点的特异性修饰允许恢复与对照非选择性剪接构建体相同的分泌水平(参见实施例3图9)，当使用B7-1跨膜区时表面染色显著降低。另一方面，在使用M1M2跨膜区时，在内含子中增加SV40多聚(A)增加分泌和表面呈现水平两者(参见实施例3图6和7)。此外，B7-1跨膜结构域的修饰如B7-1减少到18或20个氨基酸(参见图15)对分泌水平和表面呈现水平具有积极影响。最后，通过不含ER出口信号如6His或KCFCK的胞质尾替换B7-1胞质尾也改善表面呈现和分泌水平两者。最后，表达盒的端部的胃泌素终止子对表达的影响是阳性的，并且如果放置在内含子中可能是更有利的。因此，组合这些不同的特征的构建体可能是更有利的，实现最佳的分泌水平以及细胞选择所希望的细胞表面呈现的高动态范围。

这些构建体的骨架将是pGLEX41(GSC281，SEQ ID NO：304)并且非剪接ORF的最后5个氨基酸到表达构建体的端部的序列作为DNA序列以及蛋白质序列列出，所述DNA序列以及蛋白质序列从与表17中的蛋白质序列相同的具有融合的跨膜区的氨基酸开始。

表17：潜在构建体的序列(*)

*所列出的序列从非剪接ORF的后5个氨基酸延伸至表达构建体的末端

出版物：

Lin,Y.,Chen,B.,Wei-Cheng Lu,W.,Chien-I Su,C.,Prijovich,Z.,Chung,W.,Wu,P.,Chen,K.,Lee,I.,Juan,T and Roffler,S.(2013).The B7-1Cytoplasmic TailEnhances Intracellular Transport and Mammalian Cell Surface Display ofChimeric Proteins in the Absence of a Linear ER Export Motif PLoS One.Sep 20；8(9)

Baeza-Delgado,C1,Marti-Renom,MA,Mingarro,I.(2012).Structure-basedstatistical analysis of transmembrane helices.Eur Biophys J.2013 Mar；42(2-3):199-207

White,SH and Wimley,WC.(1999).Membrane protein folding and stability:physical principles.Annu Rev Biophys Biomol Struct.28:319-65。

实施例5：使用用于表面呈现的选择性剪接定性预测产物分泌

介绍

细胞转染是建立用于重组蛋白表达的稳定细胞系的初始步骤。出于许多原因(多相初始细胞群，在基因组中的质粒的不同的集成位点，不同的翻译后机械，和表达的外遗传调节)，该步骤通常导致在表达和分泌水平，以及产物质量属性如蛋白质折叠、糖基化和其它翻译后修饰方面的异源细胞种群。双特异性抗体由可能以所有可能的组合装配的多达四种不同的亚基(2条重链和2条轻链)组成。根据质粒整合，转录和翻译的调节以及ER中的折叠效果，特定的克隆可优选地分泌正确装配的产物而不是不需要的副产物。具有这种期望的分泌模式的克隆的选择需要大量的筛选和分泌蛋白的表征。减少获得产生目的产物和最少的副产物的细胞系所需的筛选量将是一个重大的发展。

如先前在实施例2～4中表明的，使用选择性剪接技术，分泌蛋白的一部分可以从分泌途径偏离用于细胞膜呈现。也表明了通过流式细胞仪特异性检测在细胞膜上呈现的蛋白是可能的。

本实施例的目的是要表明，细胞膜上的产物模式呈现可预测克隆的分泌谱。为了这个目的，实施例2中呈现的异源双特异性抗体用作模型。在下文中，该分子结合被称为“靶l”和“靶2”的两种不同的可溶性分子。该分子的示意卡通图可以在图18，结构A中看出。它将在下文中缩写为“BEAT”。转染后不仅BEAT分子被分泌，而且单特异性重链-轻链二聚体结合至“靶1”。这种分子被称为Fab同源二聚体(缩写为“Fab-DIM”)。第二副产物是结合“靶2”的单特异性scFv-Fc同源二聚体(缩写为“scFv-Fc-DIM”)。这些副产物可被视为图18中的结构B和C。

在用表达构建体pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(SEQ ID NO:50)、pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2(SEQ ID NO:52)和pGLEX41_BEAT-LC(SEQ ID NO:302)或用pGLEX41_BEAT-LC(SEQ ID NO:302)、pGLEX41_scFv-Fc-I4-B7-B7-B7(SEQ ID NO:323)和pGLEX41_BEAT-HC-I4-B7-B7-B7(SEQ ID NO:321)稳定转染细胞之后，通过表面染色筛选克隆。接着是两种方法用于表征细胞的表面表型。首先，进行轻链和Fc片段的双重表面染色。虽然这种染色并不是都允许检测所有所生产的种类(BEAT和Fab-DIM之间没有区别)，其检测到单特异性污染物scFv-Fc-DIM。这种方法普遍适用于各种BEAT分子。第二种方法更特异性并且需要可溶性靶标用于检测各自的结合臂。在这种情况下，通过表面染色明确地检测所有三种可能的产物。分别通过有限的稀释和流式细胞术的细胞分选产生重组池和克隆。进行分批或补料分批培养，并通过毛细管电泳分析上清液中积累的产物。最终在上清液中测定的分泌概况(BEAT，Fab-DIM或scFv-Fc-DIM部分)与在重组细胞的细胞膜上呈现的产物概况相当。

材料与方法

稳定池的建立

由先前描述的载体pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(缩写为“pHC-M1M2”；SEQ ID NO：50)，pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2(缩写为“pscFv-FC-M1M2”；SEQ IDNO：52)和pGLEX41_BEAT-LC(缩写为“pLC”；SEQ ID NO：302)的共转染生成稳定转染的CHO细胞用于双特异性异源二聚体BEAT的表达以及两种专有载体用于分别对抗生素嘌呤霉素和遗传霉素提供抗性的蛋白的表达。

在50ml生物反应器形式中用使用聚乙烯亚胺(Polyplus-转染，伊尔基希，法国)的线性化的载体转染悬浮CHO-S细胞。为了这个目的，在5ml的OptiMEM培养基(#31985-047，Invitrogen)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。将2.5μg/mL的最终DNA浓度加入细胞中。在37℃振荡(200rpm)下用DNA复合物温育细胞5小时后，将5ml的培养基PowerCHO2(#BE12-771Q,Lonza)加入到细胞悬浮液中。然后将细胞在37℃，5％CO₂和80％湿度下在摇动平台上温育。转染后的一天在包含具有允许稳定池的生长的浓度的嘌呤霉素(#P8833-25mg，Sigma)和遗传霉素(#11811-098，Gibco)的选择性培养基中以不同的浓度(0.7，0.5和0.4E5细胞/mL)在96孔板中接种细胞。在静态条件下选择14天后，从池取出15个产生的稳定池并扩展到TubeSpin生物反应器中。

重组克隆克隆的建立

由先前描述的载体pGLEX41_BEAT-HC-I4-B7-B7-B7(缩写为“pHC-B7”；SEQ ID NO:321)，pGLEX41_scFv-Fc-I4-B7-B7-B7(缩写为“pscFv-Fc-B7”；SEQ ID NO:323)和pGLEX41_BEAT-LC(缩写为“pLC”；SEQ ID NO：302)的共转染生成克隆用于双特异性异源二聚体BEAT的表达以及两种专有载体用于分别对抗生素嘌呤霉素和遗传霉素提供抗性的蛋白的表达。

如先前所述地进行转染和稳定转染的选择。在静态条件下选择14天后，在动态条件(轨道振荡)下收集、汇集和传代所有稳定的转染体一周。使用FACSAriaII通过对活细胞圈门进行单细胞分选，通过脉冲处理排除细胞双峰。

细胞表面上呈现的产物的LC和Fc染色

如实施例2中详细描述地在批次接种后第2天，在稳定的细胞上进行轻链(LC)和Fc片段的双重表面染色。简言之，收获总共1E5细胞，并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2％FBS在PBS中)洗涤两次，然后再悬浮在100μL的检测抗体中。使用小鼠抗人κLCAPC标记的抗体(#561323，BD Pharmingen)进行κ轻链的特异性检测，使用PE缀合的山羊抗人Fcγ特异性抗体(#12-4998-82，eBioscience)进行检测Fc片段。在室温下在黑暗中温育20分钟后，将细胞在洗涤缓冲液中洗涤一次，并再悬浮于200μL的洗涤缓冲液中用于流式细胞分析。用Guava流式细胞仪(Merck Millipore)分析细胞。

在细胞表面上呈现的特异性结合体(binder)的染色

为了这种染色，可溶性靶标用于在细胞表面上呈现的分子的结合臂的检测。简言之，收获总共1E5细胞，并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2％FBS在PBS中)洗涤两次，然后再悬浮在100μL的生物素化的靶1和His-标签的靶2的混合物中。在室温下在黑暗中温育20分钟后，将细胞在洗涤缓冲液中洗涤二次，并再悬浮于100μL的包含用APC(#554067,BD Pharmingen)缀合的链霉亲和素和用PE(#IC050P,RD系统)标记的His-Tag抗体的混合物中。在室温下在黑暗中温育20分钟后，将细胞在洗涤缓冲液中洗涤一次，并再悬浮于200μL中用于用Guava流式细胞仪(Merck Millipore)进行流式细胞分析。

细胞分泌概况的分析

在补充的生长培养基(PowerCHO2，2mM L-谷氨酰胺，8mM Glutamax(LifeTechnologies，卡尔斯巴德，CA)，15％高效饲料A(Life Technologies)，15％高效饲料B(Life Technologies)中以0.5E6细胞/mL的细胞密度在TubeSpins中接种重组池。在生长培养基(PowerCHO2，2mM L-谷氨酰胺)中以0.5E6细胞/ml的细胞密度在TubeSpins中接种克隆并且每天进行ActiCHO饲料A和B饲料(#U050-078，PAA Laboratories GmbH)的进料。在分批或补料分批培养的第14天，通过离心收集上清液，并使用0.2μm注射过滤器(#99722.TPP)过滤。使用Streamline蛋白A珠(#17-1281-02，GE)直接分析或纯化粗上清液。使用Caliper LabChip GXII蛋白测定法分析蛋白质。根据它们的分子量确定不同的种类，并测定各产物的级分。

结果

在用pHC-M1M2，pScFv-Fc-M1M2和pLC构建体转染之后，获得总共15个稳定池。启动补充的批次，以确定这些池的分泌概况。在批次接种后第2天，在池上进行轻链和Fc片段(scFv-Fc和重链)的双重表面染色。图19给出了通过补充批次的第2天的双重染色测得的池之一的表面概况的一个例子。点图呈现了κLC染色的强度(y轴)对人Fc染色的强度(x轴)。象限固定负和正染色细胞之间的任何限制。象限Q8表示不在细胞膜上表达蛋白的细胞部分，例如非生产者的子群。Q7是对于Fc片段阳性但对于κLC阴性的细胞部分，因此对应于细胞膜上的呈现scFv-Fc-DIM的细胞。Q6中的双阳性细胞是在细胞膜上呈现Lc和Fc片段的细胞，例如BEAT或Fab-DIM分子。

分析指示了非生产者(Q8)的33.8％的异源细胞群，50.3％的scFv-FC-DIM分泌者(Q7)和15.8％的潜在BEAT或Fab-DIM分泌者(Q6)。为了能够计算表面染色和分泌的产物之间的相关性，只考虑生产种群。因此，排除非生产者部分Q8，重新计算BEAT和Fab-DIM生产者部分以及生产细胞部分(Q6+Q7)内的scFv-Fc-DIM生产者部分(该部分将被称为Q6*和Q7*)。在图17所示的分析中例如种群计算如下：

Q6*＝Q6/(Q6+Q7)＝23.9％和Q7*＝Q7/(Q6+Q7)＝76.1％。

对所有15个产生的稳定池进行该分析，并用于图20中所示的相关性。

根据由选择性剪接引起的细胞膜上的物质种类呈现通过表面染色可以确定BEAT、Fab-DIM和scFv-FC-DIM生产者部分。然后，使结果面对所分析的池的实际分泌概况。为了这个目的，通过蛋白A在第14天纯化15个生产稳定池的上清液并将各分泌分子根据分子量确定以及通过Caliper LabChip GXII蛋白测定定量。应该指出的是，在这些纯化的条件下，仅蛋白A结合种类，即BEAT和scFv-Fc-DIM分子，从上清液中纯化，因为Fab-DIM分子缺乏蛋白A结合位点。图20示出分泌的分子的百分比和通过表面染色识别的相应细胞部分之间的关系。

数据表明，对于BEAT和scFv-Fc-DIM分泌，表面呈现和分泌概况是高度相关的(R²＝0.9)。但是关系的性质不是线性的。缺乏线性回归可以由以下事实解释：在本实验中进行的表面染色不区分BEAT和Fab-DIM，而纯化的分泌产物排除Fab-DIM部分。上清液中的分泌的BEAT和scFv-FC-DIM的百分比可能会略有高估。然而，该实验清楚地表明，用于特定的分子的表面呈现的阳性细胞的分数越高，这种分子在上清液中的分数越高。在这个例子中，当所测试的稳定池藏有高于20％的百分比的阳性细胞时，所分泌的BEAT分子的分数线性增加。藏有超过75％的双阳性细胞(Q6)的稳定池的选择将允许分泌细胞种群的选择得到超过90％的所需BEAT分子。对于藏有双阳性表型的克隆种群，例如100％的细胞种群对LC和Fc表面染色阳性，可以合理地期望甚至更高分数的BEAT分泌，接近约100％。

为了提高该方法的灵敏度和展示表面呈现和分泌模式之间的线性关系，施用涉及可溶性靶作为检测试剂的不同的检测方法。这样，所有3种可能的产物都明确地通过它们的结合模式识别。图21给出了在细胞分选之前测量的池的表面概况的一个例子。该点图呈现了靶1的结合物的细胞表面密度(y轴)相对于靶2的结合物的细胞表面密度(x轴)。象限固定阴性和阳性染色细胞之间的任何限制。Q1是对靶1结合阳性但对靶2结合阴性的细胞的分数，从而对应于在细胞膜上呈现Fab-DIM的细胞。在Q2中，双阳性细胞，是在细胞膜上呈现用于靶1和2两者的结合物的细胞，从而对应于在膜上呈现BEAT的细胞。Q3是仅呈现靶2结合物的细胞，因此对应于scFv-FC-DIM。象限Q4表示不在细胞膜上表达蛋白的细胞的分数，例如非生产者的一个子群。因为这些细胞不引起抗体的分泌，将它们排除在分析之外。

使用这种方法分析在用pHC-B7，pScFv-FC-B7和pLC构建体转染之后通过流式细胞仪的细胞分选产生的所有产生的克隆(28)。如前所述地，根据由选择性剪接引起的细胞膜上的物质种类呈现通过表面染色可以识别BEAT、Fab-DIM和scFv-FC-DIM生产者的分数。通过Caliper LabChip GXII蛋白质测定法直接在补料分批培养的第14天确定每个克隆的实际分泌轮廓。图22示出了在上清液中检测的BEAT分子的分数与在其细胞表面上呈现BEAT表型的细胞的分数(Q2的％)之间的相关性。使用这种特异性染色，获得良好的线性相关(R²＝0.8)。该数据清楚地表明，克隆分泌BEAT分子的倾向可以通过细胞膜上检测到的产物图案来预测。

结论

在本实施例中已证实了与细胞膜呈现组合的选择性剪接技术是用于单一细胞的分泌概况的定性预测的有效报告系统。使用基于LC和Fc表面检测的通用检测方法或使用涉及分子的可溶性靶的产物特异性染色方法在细胞膜呈现图案和转染细胞的实际分泌概况之间发现明显的相关性。该方法并不需要在分批或补料分批培养物中耗时地筛选细胞表现，也不需要收获、纯化和广泛表征分泌产物。

总之，这里所描述的报告系统为包含异源三聚分子的特定分泌概况的细胞克隆提供可靠、高通量筛选工具。

除了分泌概况的定性预测，出于细胞系发展目的，高度关注特定细胞克隆的分泌水平的定量预测。在下面的例子中，研究膜结合的水平，使用选择性剪接方法的表面呈现产物是否与克隆地分泌水平相关。

实施例6：使用用于表面呈现的选择性剪接定量预测分泌水平

前言

细胞系发展过程中的主要挑战是以时间有效的方式选择高性能克隆，例如，质量好的重组蛋白的高分泌率。据以前所证明的，所表达的蛋白质的一部分通过选择性剪接在细胞膜上的呈现指示克隆的实际定性分泌概况。在这个例子中将被证明的是细胞膜呈现的水平与克隆的分泌水平定量相关以及高生产细胞可以在表面呈现的强度的基础上进行选择。

材料与方法

稳定细胞系发展

由载体pGLEX41_HC-I4-M1M2-M1M2-M1M2(SEQ ID NO:36)和pGLEX41_LC(SEQ IDNO:294)的共转染生成稳定转染的CHO细胞用于人源化IgG1抗体的表达以及两种专有载体用于分别对抗生素嘌呤霉素和遗传霉素提供抗性的蛋白的表达。

在50ml生物反应器形式中用使用聚乙烯亚胺(Polyplus-转染，伊尔基希，法国)的线性化的载体转染悬浮CHO-S细胞。为了这个目的，在5ml的OptiMEM培养基(#31985-047，Invitrogen)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。将2.5μg/mL的最终DNA浓度加入细胞中。在37℃振荡(200rpm)下用DNA复合物温育细胞5小时后，将5ml的培养基PowerCHO2(#BE12-771Q,Lonza)加入到细胞悬浮液中。然后将细胞在37℃，5％CO₂和80％湿度下在摇动平台上温育。转染后的一天在包含4μg/mL嘌呤霉素(#P8833-25mg，Sigma)和400μg/mL遗传霉素(#11811-098，Gibco)的选择性培养基中以不同的浓度(0.7，0.5和0.4E5细胞/mL)在96孔板中接种细胞。在静态条件下选择14天后，从池取出15个产生的稳定池并扩展到TubeSpin生物反应器中用于表达水平的评估。

表达水平的评估

在补充有2mM L-谷氨酰胺，8mM Glutamax，15％高效饲料A(#A1023401，Invitrogen)和15％高效饲料B(#A1024001,Invitrogen)的PowerCHO(#BE12-771Q,Lonza)中以0.5E6细胞/mL的细胞密度接种补充批次。使用Guava流式细胞仪的ViaCount测定在第1,3和7天监测活细胞计数(VCC)和生存能力。使用八位QK仪在第1，3和7天测量IgG滴度。根据下列公式在第1和第3天之间计算稳定池的单位生产率qP。

q P = \frac{{ΔIgG}_{d 3 - d 1}}{{Δt}_{d 3 - d 1}} \times {\frac{1}{V C C}}_{m e a n d 1 - d 3}

其中：

qP＝特定分泌率或生产率[pg/细胞/天]

IgG＝在第3天和第1天的IgG滴度[pg/mL]

T＝培养时间[天]

VCC_平均d1-d3＝第1天和第3天之间的平均活菌数[细胞/mL]

如在下面所描述的在指数生长期的第1天进行在细胞膜上所呈现的IgG的定量。

细胞的染色

批接种后第1天，进行稳定池上的Fc片段的染色。简言之，收获总共1E5细胞，并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2％FBS在PBS中)洗涤两次，然后再悬浮在100μL的检测抗体中。使用PE缀合的山羊抗人Fcγ特异性抗体(#12-4998-82，eBioscience)进行Fc片段的特异性检测。在室温下在黑暗中温育20分钟后，将细胞在洗涤缓冲液中洗涤一次，并再悬浮于200μL中用于流式细胞分析。用Guava流式细胞仪分析细胞。

流式细胞仪细胞分选

从如前所述地建立的稳定转染体的异源池通过流式细胞仪细胞分选生成克隆(参见“稳定细胞系发展”部分)。为了这个目的，根据先前描述的方案进行Fc片段的表面染色。使用FACSAria II通过对活细胞的圈门实施分选，通过脉冲处理排除细胞双峰。根据表面荧光强度(“低”，“中”和“高”)定义三个圈门并且将单细胞分配质含有200μL的克隆培养基的96孔板中。在静态条件下生长2周后，将细胞在动态条件下扩展并如先前所述评价所选克隆的表现。

结果

在图23中示出稳定池的表面染色概况的分析。在区域g1中圈门的活细胞的表面荧光(图23，A图)表示为直方图(图23，B图)并且计算分布的平均荧光(平均[RFU])。平均荧光用作在细胞膜上表达的IgG水平的度量。对所有生成的稳定池进行该分析并且将表面IgG的水平与在上清液中测得的分泌的IgG的实际水平相比。

图24示出了在补充批次的第1天测得的表面荧光强度和所有稳定池的分泌水平之间的相关性。在表面IgG表达和滴度(图24，图A)之间以及表面IgG表达和单位生产率(图24，图B)之间观察到很好的相关性(R²>0.8)。该数据表明，选择性剪接的跨膜IgG的表面表达报告稳定转染的细胞的实际分泌水平。在第1天的池的表面荧光和7天分批法中的体积生产率之间观察到相似的良好的相关性(R²>0.8)(参见图25；在该批次中第7天对应于固定相的端部)。数据表明，根据所检测到的表面IgG表达可以早期预测分批法结束时池的性能。在分批法中，根据不断变化的培养基环境，细胞的生理状态连续变化。因此，通过选择性剪接的报告基因IgG的表面呈现与分批法中的实际分泌水平之间的相关性独立于细胞(指数生长的或固定的)的生理状态以及批处理阶段(生长或生产)。

验证假设克隆是根据细胞表面上呈现的抗体的密度通过流式细胞仪细胞分选生成。为了此目的，使用抗人Fc PE标记的抗体为表面IgG染色稳定池。根据细胞的表面荧光(“低”，“中”和“高”)定义三个区域并且在96孔板中相应地克隆单细胞。可以在图26A中看出圈门策略。约两周后，扩展克隆并且再次确定细胞的表面强度以验证在克隆以后确实获得分选表型。所有克隆的表面强度的分布可以在图26B中看出。整体分选是成功的，因为这三个不同分选的组的表面IgG的分布对应于预期的表型“低”，“中”和“高”。检测到一些异常值，例如在显示高表面荧光的“低”组中，有可能是由于分选之前的染色的伪影。随后在补充批次中评估所产生的克隆的性能。图26C示出了每组的单位生产率qP的分布。还一式四份地评估原始池的qP并在图中给出作为对照。在具有大约10pg/细胞/天的中间qP的“高”表面的荧光组内清楚地识别最好的表现者。相比于原始池(约5pg/细胞/天)，生产率显著提高2-6倍因子，最好的克隆达到超过30pg/细胞/天。与此相反，具有“低”和“中等”类别的克隆是整体低表现者，具有接近0pg/细胞/天的中间qP。有些异常值达到>20pg/细胞/天，但这些表型也显示出通过流式细胞仪所检测到的IgG的高表面密度。

结论

在本实施例中已证实通过选择性剪接在细胞膜上表达的IgG的水平报告重组细胞的实际分泌水平。在产物的特异性检测后的细胞膜荧光与上清液中积累的IgG浓度和转染的稳定细胞的qP相关。也已证明，该相关性是有效的而不管分批生产过程的阶段。总之，这些数据表明，重组细胞的定量分泌水平可以通过本文所描述的选择性剪接表面呈现报告系统来预测。这通过使用流式细胞仪细胞分选根据在细胞表面上呈现的IgG的密度选择克隆来验证。实际上，高的生产者可以使用这种方法来选择，并且显示出工业相关单位生产率的克隆可以以时间效率的方式来产生。

序列表

<110> 格兰马克药品股份有限公司

GLENMARK PHARMACEUTICALS S.A.

<120> 表达构建体和用于选择表达多肽的宿主细胞的方法

EXPRESSION CONSTRUCTS AND METHODS FOR SELECTING HOST CELLS EXPRESSINGPOLYPEPTIDES

<130> P3125PC00

<160> 347

<170> PatentIn版本3.5

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr269

<400> 1

caggggggcg gagcctatgg 20

<210> 2

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr497

<400> 2

gcccccctcc cgcgaggaga tgaccaagaa ccaggtgtcc ctg 43

<210> 3

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr498

<400> 3

tttctagatt catcacttgc cgggggacag gctc 34

<210> 4

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr501

<400> 4

tataaagctt ccaccatgga gagccctgcc c 31

<210> 5

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr502

<400> 5

tatatctaga ttcatcagca ctcgccccgg ttg 33

<210> 6

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1437

<400> 6

ccaaatcgat ttatcagcac tcgccccggt tgaag 35

<210> 7

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1500

<400> 7

ccgggatcga tttatcagtg atggtgatgg tgatg 35

<210> 8

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1502

<400> 8

ggccgatcga tttatcactt gccaggagac ag 32

<210> 9

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1516

<400> 9

gatgaaagct tggtaggtga tcctcctg 28

<210> 10

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1517

<400> 10

atgtattcga atatctccac cggttgcagc tctgagccag ggaggaggga ag 52

<210> 11

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1518

<400> 11

taagctagcc caccatggag agccctgc 28

<210> 12

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1519

<400> 12

gaggctcttc tgcgtgtagt ggttgtgcaa ggcctcgtgc atcacgctg 49

<210> 13

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1520

<400> 13

ctaccaagct ttcatcattt acccggagac agggagaggc tcttctgcgt g 51

<210> 14

<211> 92

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1521

<400> 14

gggagctgga cgggctgtgg acgaccatca ccatcttcat cacactcttc ctgttaagcg 60

tgtgctacag tgccaccgtc accttcttca ag 92

<210> 15

<211> 92

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1522

<400> 15

gtagtcgggg atgatggtct gcttcaggtc caccaccgag gagaagatcc acttcacctt 60

gaagaaggtg acggtggcac tgtagcacac gc 92

<210> 16

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1523

<400> 16

atataccggt ggagagctgt gcggaggcgc aggacgggga gctggacggg ctgtg 55

<210> 17

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1524

<400> 17

atatttcgaa tcactaggcc ccctgtccga tcatgttcct gtagtcgggg atgatggtc 59

<210> 18

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1649

<400> 18

tctccaccgg ttgcagctct gttccctcct ccctcggtta g 41

<210> 19

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1650

<400> 19

gcgccatcga tacagacatg ataagataca ttg 33

<210> 20

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1651

<400> 20

gcgcgatcga tacttgttta ttgcagctta taatgg 36

<210> 21

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1689

<400> 21

atatgctagc ccaccatgcg gagccctgcc cagctgctgt tcctgctgct gctg 54

<210> 22

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1690

<400> 22

tgctgttcct gctgctgctg tggatccctg gcaccaacgc cgaggtgcag ctggtcgagt 60

c 61

<210> 23

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1725

<400> 23

atatactagt ccaccatgcg gagccctgcc cagctgctgt tcctgctgct gctg 54

<210> 24

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1726

<400> 24

ctgttcctgc tgctgctgtg gatccctggc accaacgccc aggtgcagct gcagcagtc 59

<210> 25

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1727

<400> 25

ctgttcctgc tgctgctgtg gatccctggc accaacgcca tggagacaga cacactcc 58

<210> 26

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1735

<400> 26

gacttcgaat catcaatgat ggtggtggtg atgggcgctg gcgaggagca ggtcgaacag 60

gagcagcttg 70

<210> 27

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1760

<400> 27

ccgcatcgat ttatcattta cccgggctca ggctcag 37

<210> 28

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1799

<400> 28

atataccggt ggaggccctg tggctgggcg tgctgagact gctgctgttc aagctgctcc 60

tgttcgacct g 71

<210> 29

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1800

<400> 29

gtaagctttc atcatttacc cggagacagg gagaggctct tctgcgtgaa tcggttgtgc 60

<210> 30

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1801

<400> 30

gcgcgaagct ttcatcattt acccggagac agggagaggc tcttctgcgt ataatgattg 60

<210> 31

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1840

<400> 31

atataccggt ggaggccctg tggctgggcg tgctg 35

<210> 32

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2099

<400> 32

tcctcggggg gagatccacc accacctgag ccagggagga gggaag 46

<210> 33

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2100

<400> 33

gcgcttcgaa tcatcacaga aacacggtct g 31

<210> 34

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2101

<400> 34

tggtggtgga tctccccccg aggacccccc tgactccaag 40

<210> 35

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2102

<400> 35

tcctcggggg gagatccacc accacctgtt ccctcctccc tcggttag 48

<210> 36

<211> 1082

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC3899

<400> 36

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600

aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660

tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tggatcttct 720

cctcggtggt ggacctgaag cagaccatca tccccgacta caggaacatg atcggacagg 780

gggcctagtg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840

attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900

ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080

gt 1082

<210> 37

<211> 1064

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC4398

<400> 37

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540

gggaggaggg aacagagctg caaccggtgg agagctgtgc ggaggcgcag gacggggagc 600

tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta agcgtgtgct 660

acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg gtggacctga 720

agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag tgattcgaaa 780

tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 840

atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 900

gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 960

acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 1020

gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1064

<210> 38

<211> 1219

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC4401

<400> 38

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420

tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480

cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540

gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600

gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660

ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720

ggtggagagc tgtgcggagg cgcaggacgg ggagctggac gggctgtgga cgaccatcac 780

catcttcatc acactcttcc tgttaagcgt gtgctacagt gccaccgtca ccttcttcaa 840

ggtgaagtgg atcttctcct cggtggtgga cctgaagcag accatcatcc ccgactacag 900

gaacatgatc ggacaggggg cctagtgatt cgaaatgacc gaccaagcga cgcccaacct 960

gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt 1020

tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc 1080

ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 1140

tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 1200

tgtatcttat catgtctgt 1219

<210> 39

<211> 1263

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC4402

<400> 39

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600

aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660

tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tggatcttct 720

cctcggtggt ggacctgaag cagaccatca tccccgacta caggaacatg atcggacagg 780

gggcctagtg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840

attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900

ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080

gtataccgtc gacctctagc tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt 1140

gaaattgtta tccgctcaca attccacaca acatacgagc cggggcagga taatatatgg 1200

tagggttcat agccagagta accttttttt ttaattttta ttttatttta tttttgagat 1260

cag 1263

<210> 40

<211> 977

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC5854

<400> 40

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag gccctgtggc 600

tgggcgtgct gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcgccagcg 660

cccatcacca ccaccatcat tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 720

catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 780

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 840

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 900

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 960

tatcttatca tgtctgt 977

<210> 41

<211> 959

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC5855

<400> 41

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540

gggaggaggg aacagagctg caaccggtgg aggccctgtg gctgggcgtg ctgagactgc 600

tgctgttcaa gctgctcctg ttcgacctgc tcctcgccag cgcccatcac caccaccatc 660

attgatgatt cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt 720

ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga 780

tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg 840

cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 900

tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 959

<210> 42

<211> 1114

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC5857

<400> 42

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420

tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480

cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540

gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600

gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660

ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720

ggtggaggcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc tcctgttcga 780

cctgctcctc gccagcgccc atcaccacca ccatcattga tgattcgaaa tgaccgacca 840

agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 900

gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 960

gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 1020

caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 1080

gtccaaactc atcaatgtat cttatcatgt ctgt 1114

<210> 43

<211> 1158

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC5856

<400> 43

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag gccctgtggc 600

tgggcgtgct gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcgccagcg 660

cccatcacca ccaccatcat tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 720

catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 780

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 840

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 900

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 960

tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa tcatggtcat 1020

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccgggg 1080

caggataata tatggtaggg ttcatagcca gagtaacctt tttttttaat ttttatttta 1140

ttttattttt gagatcag 1158

<210> 44

<211> 1076

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC6030

<400> 44

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600

aggcgcagga cggggagctg gacgccctgt ggctgggcgt gctgagactg ctgctgttca 660

agctgctcct gttcgacctg ctcctcacct tcttcaaggt gaagtggatc ttctcctcgg 720

tggtggacct gaagcagacc atcatccccg actacaggaa catgatcgga cagggggcct 780

agtgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840

ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900

tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076

<210> 45

<211> 1058

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC6048

<400> 45

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540

gggaggaggg aacagagctg caaccggtgg agagctgtgc ggaggcgcag gacggggagc 600

tggacgccct gtggctgggc gtgctgagac tgctgctgtt caagctgctc ctgttcgacc 660

tgctcctcac cttcttcaag gtgaagtgga tcttctcctc ggtggtggac ctgaagcaga 720

ccatcatccc cgactacagg aacatgatcg gacagggggc ctagtgattc gaaatgaccg 780

accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 840

ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 900

tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 960

aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1020

gtttgtccaa actcatcaat gtatcttatc atgtctgt 1058

<210> 46

<211> 1213

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC6047

<400> 46

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420

tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480

cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540

gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600

gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660

ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720

ggtggagagc tgtgcggagg cgcaggacgg ggagctggac gccctgtggc tgggcgtgct 780

gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcaccttct tcaaggtgaa 840

gtggatcttc tcctcggtgg tggacctgaa gcagaccatc atccccgact acaggaacat 900

gatcggacag ggggcctagt gattcgaaat gaccgaccaa gcgacgccca acctgccatc 960

acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 1020

ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 1080

caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 1140

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 1200

ttatcatgtc tgt 1213

<210> 47

<211> 1257

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC6046

<400> 47

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600

aggcgcagga cggggagctg gacgccctgt ggctgggcgt gctgagactg ctgctgttca 660

agctgctcct gttcgacctg ctcctcacct tcttcaaggt gaagtggatc ttctcctcgg 720

tggtggacct gaagcagacc atcatccccg actacaggaa catgatcgga cagggggcct 780

agtgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840

ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900

tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgtatac 1080

cgtcgacctc tagctagagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 1140

gttatccgct cacaattcca cacaacatac gagccggggc aggataatat atggtagggt 1200

tcatagccag agtaaccttt ttttttaatt tttattttat tttatttttg agatcag 1257

<210> 48

<211> 1738

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC314

<400> 48

atggagagcc ctgcccagct gctgttcctg ctgctgctgt ggctgcctga cacccaggcc 60

gaggtgcagc tggtcgagtc tggcggcgga ctggtgcagc ctggcggctc cctgcggctg 120

tcctgcgccg cctccggctt caacatcaag gacacctaca tccactgggt gcggcaggcc 180

cctggcaagg gcctggagtg ggtggcccgg atctacccta ccaacggcta caccagatac 240

gccgactccg tgaagggccg gttcaccatc tccgccgaca cctccaagaa caccgcctac 300

ctgcagatga actccctgcg ggccgaggac accgccgtgt actactgctc cagatgggga 360

ggagatggct tctacgccat ggactactgg ggccagggca ccctggtgac cgtgtcctcc 420

gcctccacca agggccccag cgtgttcccc ctggccccca gcagcaagtc taccagcggc 480

ggcacagcag ccctgggatg cctggtgaag gactacttcc ccgagcccgt gaccgtgagc 540

tggaacagcg gagccctgac ctccggcgtg cacaccttcc ccgccgtgct gcagagcagc 600

ggcctgtaca gcctgagcag cgtggtgacc gtgcccagca gcagcctggg cacccagacc 660

tacatctgca acgtgaacca caagcccagc aacaccaagg tggacaagaa ggtggagccc 720

aagagctgcg acaagaccca cacctgccct ccctgtcctg ctcctgagct gctcggcgga 780

ccctccgtgt tcctgttccc ccccaagccc aaggacaccc tgatgatcag caggaccccc 840

gaggtgacct gcgtggtggt ggacgtgagc cacgaggacc cagaggtgaa gttcaactgg 900

tacgtggacg gcgtggaggt gcacaacgcc aagaccaagc ccagagagga acagtacaac 960

agcacctaca gggtggtgtc cgtgctgacc gtgctgcacc aggactggct gaacggcaaa 1020

gagtacaagt gcaaggtctc caacaaggcc ctgccagccc ccatcgagaa aaccatcagc 1080

aaggccaagg gccagccacg ggagccccag gtgtacaccc tgcccccctc ccgcgaggag 1140

atgaccaaga accaggtgtc cctgacatgt ctggtgaaag gcttctaccc cagcgacatc 1200

gccgtggagt gggagagcaa cggccagccc gagaacaact acaagaccac ccccccagtg 1260

ctggacagcg acggcagctt cttcctgtac agcaagctga ccgtggacaa gagcaggtgg 1320

cagcagggca acgtgttcag ctgcagcgtg atgcacgagg ccctgcacaa ccactacacc 1380

cagaagagcc tgagcctgtc ccccggcaag tgatgaatct agaggtaccc ccggggggcc 1440

cctcgagttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc 1500

caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 1560

gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 1620

agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 1680

ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgt 1738

<210> 49

<211> 1410

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC5644

<400> 49

atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60

caggtgcagc tgcagcagtc tggcgccgaa ctggccagac caggcgccag cgtgaagatg 120

agctgcaagg ccagcggcta caccttcacc cggtacacca tgcactgggt gaaacagcgg 180

cctggacagg gcctggaatg gatcggctac atcaacccca gccggggcta caccaactac 240

aaccagaagt tcaaggacaa ggccaccctg accaccgaca agagcagcag caccgcctac 300

atgcagctga gcagcctgac cagcgaggac agcgccgtgt actactgcgc ccggtactac 360

gacgaccact actgcctgga ctactggggc cagggcacca ccctgaccgt gagcagcgcg 420

tcgaccaagg gccccagcgt gttcccgcta gcccccagca gcaagagcac cagcggcggc 480

acagccgccc tgggctgcct ggtgaaggac tacttccccg agcccgttac cgtgtcctgg 540

aactctggag ccctgacctc cggcgtgcac accttccccg ccgtgctcca gagcagcggc 600

ctgtacagcc tgagcagcgt ggtgacagtg cccagcagca gcctgggaac ccagacctac 660

atctgcaacg tgaaccacaa gcccagcaac accaaggtgg acaagaaggt ggagcccaag 720

agctgcgaca aaactcacac ctgcccaccc tgccctgccc ctgagctgct gggcggaccc 780

tccgtgttcc tgttcccccc caagcccaag gacaccctga tgatcagccg gacccccgag 840

gtgacctgcg tggtggtgga cgtgagccac gaggaccctg aggtgaagtt caattggtac 900

gtggacggcg tggaggtgca caacgccaag accaagcccc gggaggaaca gtacaacagc 960

acctaccggg tggtgtccgt gctgaccgtg ctgcaccagg actggctgaa cggcaaggaa 1020

tacaagtgca aggtctccaa caaggccctg cctgccccca tcgaaaagac catcagcaag 1080

gccaagggcc agccgcgcga accgcaggtg tacaccctgc cccccagccg ggaagagatg 1140

accaagaacc aggtgaaact ggtgtgcctg gtgacaggct tctaccccag cgatatcgcc 1200

gtggaatggg agagcagcgg ccagcctgag aacaactact acaccacccc ccccatgctg 1260

gacagcgacg gcagcttcag cctggtgtcc tggctgaacg tggacaagag ccggtggcag 1320

cagggcaaca tcttcagctg cagcgtgatg cacgaggccc tgcacaaccg gttcacccag 1380

aagtccctga gcctgagccc gggtaaatga 1410

<210> 50

<211> 1074

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC5537

<400> 50

gggtaaatga tgaaagcttg gtaggtgatc ctcctgctgc tttggttcag ggttttgctt 60

gagggggggg ggtggtgatt tccttgccat gggcagactg agcagaaaag gccattggga 120

ccatgttctg aatgcctcca cctcaaccac cggccggtag gaccaaagcc accccgtgtt 180

ttctcaggat ctcttttccc agggagatcc ctcggcccaa agagggagat ggcaatgctg 240

gatgtgtgca caataattca acaggcattg gaacttcagc atcgatgctg aatgcaatta 300

acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 360

cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 420

ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 480

ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 540

ttcccttccc tcctccctgg ctcagagctg caaccggtgg agagctgtgc ggaggcgcag 600

gacggggagc tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta 660

agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg 720

gtggacctga agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag 780

tgattcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc 840

gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc 900

ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct 960

tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1020

ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1074

<210> 51

<211> 1488

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC5608

<400> 51

atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60

gaggtgcagc tggtcgagtc tggcggcgga ctggtgcagc ctggcggctc cctgcggctg 120

tcctgcgccg cctccggctt caacatcaag gacacctaca tccactgggt gcggcaggcc 180

cctggcaagg gcctggagtg ggtggcccgg atctacccta ccaacggcta caccagatac 240

gccgactccg tgaagggccg gttcaccatc tccgccgaca cctccaagaa caccgcctac 300

ctgcagatga actccctgcg ggccgaggac accgccgtgt actactgctc cagatgggga 360

ggagatggct tctacgccat ggactactgg ggccagggca ccctggtgac cgtgtcctcc 420

ggtggcggtg gcagcggcgg tggtggttcc ggaggcggcg gttctgacat ccagatgacc 480

cagtccccct ccagcctgtc tgcctccgtg ggcgaccggg tgaccatcac ctgccgggcc 540

tcccaggacg tgaacaccgc cgtggcctgg tatcagcaga agcctggcaa ggcccctaag 600

ctgctgatct actccgcctc cttcctgtac tccggcgtgc cttcccggtt ctccggctcc 660

cggtccggca ccgacttcac cctgaccatc tcctccctgc agcctgagga cttcgccacc 720

tactactgcc agcagcacta caccacccct cctaccttcg gccagggcac caaggtggag 780

atcaagaggg gaggaggagg taccgacaaa actcacacat gcccaccgtg cccagcacct 840

gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 900

atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 960

gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 1020

gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 1080

tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 1140

gagaaaacca tctccaaagc caaaggacag cccagggaac ctgaggtggc cacattccca 1200

cctagccggg acgagctgac aaaaaatcag gtcaccctcg tctgtctcgt gaccggcttt 1260

tacccttccg acattgccgt ggaatgggaa tccaatgggc agcccgagaa caattacaag 1320

acagaccccc ccctgctgga atccgatggc agcttcgccc tgagcagccg gctgcgggtg 1380

gacaagtcca gatggcagca ggggaatgtc ttttcctgct ccgtcatgca tgaagccctc 1440

cacaatcatt atacacagaa aagcctgagc ctgtctcctg gcaagtga 1488

<210> 52

<211> 1074

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC5538

<400> 52

gggtaaatga tgaaagcttg gtaggtgatc ctcctgctgc tttggttcag ggttttgctt 60

gagggggggg ggtggtgatt tccttgccat gggcagactg agcagaaaag gccattggga 120

ccatgttctg aatgcctcca cctcaaccac cggccggtag gaccaaagcc accccgtgtt 180

ttctcaggat ctcttttccc agggagatcc ctcggcccaa agagggagat ggcaatgctg 240

gatgtgtgca caataattca acaggcattg gaacttcagc atcgatgctg aatgcaatta 300

acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 360

cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 420

ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 480

ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 540

ttcccttccc tcctccctgg ctcagagctg caaccggtgg agagctgtgc ggaggcgcag 600

gacggggagc tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta 660

agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg 720

gtggacctga agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag 780

tgattcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc 840

gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc 900

ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct 960

tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1020

ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1074

<210> 53

<211> 1076

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC7057

<400> 53

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540

gggaggaggg aacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600

ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660

ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720

caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780

gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840

ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900

tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076

<210> 54

<211> 1231

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC7058

<400> 54

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420

tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480

cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540

gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600

gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660

ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720

atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780

cggcgccgtg attaccgtgg tcgtgatcgt cgtgattatc aagtgcttct gcaagcaccg 840

gtcctgcttc cggcggaacg aggcctccag agagacaaac aactccctga ccttcggccc 900

cgaggaagcc ctggctgagc agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc 960

gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg aaaggttggg 1020

cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct 1080

ggagttcttc gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa 1140

tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc 1200

caaactcatc aatgtatctt atcatgtctg t 1231

<210> 55

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC7056

<400> 55

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 56

<211> 1275

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC7059

<400> 56

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc 1140

tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggggcag 1200

gataatatat ggtagggttc atagccagag taaccttttt ttttaatttt tattttattt 1260

tatttttgag atcag 1275

<210> 57

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> GSC9765

<400> 57

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 58

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> GSC9764

<400> 58

ctgtctcccg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 59

<211> 1076

<212> DNA

<213> 人工序列

<220>

<223> GSC9949

<400> 59

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccgt 540

ctccttctgg gacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600

ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660

ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720

caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780

gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840

ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900

tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076

<210> 60

<211> 1076

<212> DNA

<213> 人工序列

<220>

<223> GSC9768

<400> 60

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct 540

gggaggattg cacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600

ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660

ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720

caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780

gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840

ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900

tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076

<210> 61

<211> 1076

<212> DNA

<213> 人工序列

<220>

<223> GSC9763

<400> 61

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct 540

gtccttattg cacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600

ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660

ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720

caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780

gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840

ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900

tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076

<210> 62

<211> 1076

<212> DNA

<213> 人工序列

<220>

<223> GSC9770

<400> 62

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540

gacctgaggg gacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600

ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660

ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720

caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780

gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840

ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900

tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076

<210> 63

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> GSC9950

<400> 63

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctg ctacctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 64

<211> 211

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq32

<400> 64

accggtggag agctgtgcgg aggcgcagga cggggagctg gacgccctgt ggctgggcgt 60

gctgagactg ctgctgttca agctgctcct gttcgacctg ctcctcacct tcttcaaggt 120

gaagtggatc ttctcctcgg tggtggacct gaagcagacc atcatccccg actacaggaa 180

catgatcgga cagggggcct agtgattcga a 211

<210> 65

<211> 2009

<212> DNA

<213> 人类

<400> 65

agctttctgg ggcaggccag gcctgacctt ggctttgggg cagggagggg gctaaggtga 60

ggcaggtggc gccagcaggt gcacacccaa tgcccatgag cccagacact ggacgctgaa 120

cctcgcggac agttaagaac ccaggggcct ctgcgcctgg gcccagctct gtcccacacc 180

gcggtcacat ggcaccacct ctcttgcagc ctccaccaag ggcccatcgg tcttccccct 240

ggcaccctcc tccaagagca cctctggggg cacagcggcc ctgggctgcc tggtcaagga 300

ctacttcccc gaaccggtga cggtgtcgtg gaactcaggc gccctgacca gcggcgtgca 360

caccttcccg gctgtcctac agtcctcagg actctactcc ctcagcagcg tggtgaccgt 420

gccctccagc agcttgggca cccagaccta catctgcaac gtgaatcaca agcccagcaa 480

caccaaggtg gacaagaaag ttggtgagag gccagcacag ggagggaggg tgtctgctgg 540

aagcaggctc agcgctcctg cctggacgca tcccggctat gcagccccag tccagggcag 600

caaggcaggc cccgtctgcc tcttcacccg gagcctctgc ccgccccact catgctcagg 660

gagagggtct tctggctttt tcccaggctc tgggcaggca caggctaggt gcccctaacc 720

caggccctgc acacaaaggg gcaggtgctg ggctcagacc tgccaagagc catatccggg 780

aggaccctgc ccctgaccta agcccacccc aaaggccaaa ctctccactc cctcagctcg 840

gacaccttct ctcctcccag attccagtaa ctcccaatct tctctctgca gagcccaaat 900

cttgtgacaa aactcacaca tgcccaccgt gcccaggtaa gccagcccag gcctcgccct 960

ccagctcaag gcgggacagg tgccctagag tagcctgcat ccagggacag gccccagccg 1020

ggtgctgaca cgtccacctc catctcttcc tcagcacctg aactcctggg gggaccgtca 1080

gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 1140

acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 1200

gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 1260

taccgggtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 1320

aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 1380

aaaggtggga cccgtggggt gcgagggcca catggacaga ggccggctcg gcccaccctc 1440

tgccctgaga gtgaccgctg taccaacctc tgtcctacag ggcagccccg agaaccacag 1500

gtgtacaccc tgcccccatc ccgggatgag ctgaccaaga accaggtcag cctgacctgc 1560

ctggtcaaag gcttctatcc cagcgacatc gccgtggagt gggagagcaa tgggcagccg 1620

gagaacaact acaagaccac gcctcccgtg ctggactccg acggctcctt cttcctctac 1680

agcaagctca ccgtggacaa gagcaggtgg cagcagggga acgtcttctc atgctccgtg 1740

atgcatgagg ctctgcacaa ccactacacg cagaagagcc tctccctgtc tccgggtaaa 1800

tgagtgcgac ggccggcaag ccccgctccc cgggctctcg cggtcgcacg aggatgcttg 1860

gcacgtaccc cctgtacata cttcccgggc gcccagcatg gaaataaagc acccagcgct 1920

gccctgggcc cctgcgagac tgtgatggtt ctttccacgg gtcaggccga gtctgaggcc 1980

tgagtggcat gagggaggca gagcgggtc 2009

<210> 66

<211> 216

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq43

<400> 66

ccccccgagg acccccctga ctccaagaat accctggtgc tgttcggcgc tggcttcggc 60

gccgtgatta ccgtggtcgt gatcgtcgtg attatcaagt gcttctgcaa gcaccggtcc 120

tgcttccggc ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag 180

gaagccctgg ctgagcagac cgtgtttctg tgatga 216

<210> 67

<211> 546

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC2819

<400> 67

ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60

ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120

acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180

cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240

aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300

cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360

acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420

cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480

tgccccacag ctttaaggca cctggctaac ctctgcgctt cttcccttcc ctcctccctg 540

gctcag 546

<210> 68

<211> 528

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC3469

<400> 68

ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60

ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120

acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180

cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240

aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300

cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360

acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420

cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480

tgccccacag ctttaaggca cctggctaac cgagggagga gggaacag 528

<210> 69

<211> 563

<212> DNA

<213> 人工序列

<220>

<223> 内含子cTNT-I4

<400> 69

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300

aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360

gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420

gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480

ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540

cccttccctc ctccctggct cag 563

<210> 70

<211> 545

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(0Y)

<400> 70

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300

aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360

gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420

gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480

ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga gggaggaggg 540

aacag 545

<210> 71

<211> 700

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(polyA)

<400> 71

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt ttattgcagc 300

ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 360

actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatcga 420

tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca cagtgcagga 480

ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg gaaccggggt 540

ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga gagctgaaag 600

ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa ggcacctggc 660

taacctctgc gcttcttccc ttccctcctc cctggctcag 700

<210> 72

<211> 545

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(3Y)

<400> 72

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300

aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360

gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420

gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480

ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga gacctgaggg 540

gacag 545

<210> 73

<211> 545

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(5Y)

<400> 73

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300

aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360

gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420

gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480

ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct gtccttattg 540

cacag 545

<210> 74

<211> 545

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(5Y-5)

<400> 74

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300

aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360

gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420

gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480

ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct gggaggattg 540

cacag 545

<210> 75

<211> 545

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(9Y)

<400> 75

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300

aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360

gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420

gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480

ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccgt ctccttctgg 540

gacag 545

<210> 76

<211> 563

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(15Y-3?

<400> 76

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300

aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360

gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420

gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480

ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540

cccttccctg ctacctggct cag 563

<210> 77

<211> 1035

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(SV40ter)

<400> 77

gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc gaccaagcga 300

cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 360

tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 420

agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 480

gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 540

aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag agcttggcgt 600

aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca 660

tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc ttttttttta 720

atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta acaatgctca 780

agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg cagcagtggg 840

gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg ctgcttcagt 900

gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac ctggtgcaca 960

ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc ttcccttccc 1020

tcctccctgg ctcag 1035

<210> 78

<211> 563

<212> DNA

<213> 人工序列

<220>

<223> 内含子I4(SD_GGC)

<400> 78

gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60

gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120

atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180

ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240

tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300

aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360

gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420

gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480

ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540

cccttccctc ctccctggct cag 563

<210> 79

<211> 375

<212> DNA

<213> 人工序列

<220>

<223> GSB59abc

<400> 79

ctgtccctgg gcaagtgata gaagcttgcg gccgcgctta gcgatatcga attctctaga 60

ggtacccccg gggggcccct cgagttcgaa atgaccgacc aagcgacgcc caacctgcca 120

tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc 180

cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac 240

cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 300

acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 360

tcttatcatg tctgt 375

<210> 80

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> GSC11218

<400> 80

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 81

<211> 1097

<212> DNA

<213> 人工序列

<220>

<223> GSC11213

<400> 81

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatctg gctctgatcc tgggacctgt gctggctctg ctggcactgg 660

tggctctggg agtgctggga ctgtggaagt gcttctgcaa gcaccggtcc tgcttccggc 720

ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780

ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840

catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080

tatcttatca tgtctgt 1097

<210> 82

<211> 1097

<212> DNA

<213> 人工序列

<220>

<223> GSC11214

<400> 82

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatatc gccgccatca tcgtgatcct ggtgttgctc ctgctgctgg 660

gcatcggcct gatgtggtgg ttctggaagt gcttctgcaa gcaccggtcc tgcttccggc 720

ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780

ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840

catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080

tatcttatca tgtctgt 1097

<210> 83

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> GSC11210

<400> 83

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatatg gccctgattg tgctgggcgg agtggctggc ctgctgctgt 660

ttatcggcct gggcatcttc ttcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 84

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> GSC11205

<400> 84

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatatc gctggcgtga tcgctggcat cctgctgttc gtgatcatct 660

tcctgggcgt ggtgctcgtg atgaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 85

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> GSC11217

<400> 85

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgct ctggtcgtga tccccatcat cttcggcatc ctgttcgcca 660

tcctgctggt gctggtgttc atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 86

<211> 1097

<212> DNA

<213> 人工序列

<220>

<223> GSC11756

<400> 86

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatatc atccctatcg tggccggcgt ggtggctggc atcgtgctga 660

ttggactggc cctgctgctg atctggaagt gcttctgcaa gcaccggtcc tgcttccggc 720

ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780

ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840

catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080

tatcttatca tgtctgt 1097

<210> 87

<211> 1100

<212> DNA

<213> 人工序列

<220>

<223> GSC11296

<400> 87

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgga atcgtggctg gactggctgt gctggccgtg gtcgtgattg 660

gagctgtggt ggccgccgtg atgtgcagaa agtgcttctg caagcaccgg tcctgcttcc 720

ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780

tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840

tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900

ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960

cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020

atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080

atgtatctta tcatgtctgt 1100

<210> 88

<211> 1100

<212> DNA

<213> 人工序列

<220>

<223> GSC11295

<400> 88

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatctg atcattgccc tgcctgtggc cgtgctgctg atcgtgggag 660

gcctcgtgat catgctgtac gtgttccaca agtgcttctg caagcaccgg tcctgcttcc 720

ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780

tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840

tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900

ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960

cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020

atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080

atgtatctta tcatgtctgt 1100

<210> 89

<211> 1100

<212> DNA

<213> 人工序列

<220>

<223> GSC11390

<400> 89

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatggc ctgctgatcg gcatctccat cgcctccctg tgcctggtgg 660

tggccctgct ggccctgctg tgccacctga agtgcttctg caagcaccgg tcctgcttcc 720

ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780

tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840

tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900

ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960

cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020

atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080

atgtatctta tcatgtctgt 1100

<210> 90

<211> 1100

<212> DNA

<213> 人工序列

<220>

<223> GSC11391

<400> 90

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatctg ctgctgggcg tgtccgtgtc ctgcatcgtg atcctggccg 660

tgtgcctgct gtgctacgtg tccatcacca agtgcttctg caagcaccgg tcctgcttcc 720

ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780

tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840

tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900

ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960

cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020

atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080

atgtatctta tcatgtctgt 1100

<210> 91

<211> 1097

<212> DNA

<213> 人工序列

<220>

<223> GSC11392

<400> 91

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc aacaccgtgg gctccgtgat cggcgtgatc gtgaccatct 660

tcgtgtccgg caccgtgtac ttcatcaagt gcttctgcaa gcaccggtcc tgcttccggc 720

ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780

ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840

catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080

tatcttatca tgtctgt 1097

<210> 92

<211> 1097

<212> DNA

<213> 人工序列

<220>

<223> GSC11397

<400> 92

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatatc accctgatca tcttcggcgt gatggccggc gtgatcggca 660

ccatcctgct gatctcctac ggcatcaagt gcttctgcaa gcaccggtcc tgcttccggc 720

ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780

ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840

catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900

tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960

accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020

tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080

tatcttatca tgtctgt 1097

<210> 93

<211> 1091

<212> DNA

<213> 人工序列

<220>

<223> GSC11204

<400> 93

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc 660

tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720

aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780

agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080

atcatgtctg t 1091

<210> 94

<211> 1091

<212> DNA

<213> 人工序列

<220>

<223> GSC11216

<400> 94

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcaagctgc 660

tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720

aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780

agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080

atcatgtctg t 1091

<210> 95

<211> 1091

<212> DNA

<213> 人工序列

<220>

<223> GSC11203

<400> 95

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcgtgctgc 660

tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720

aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780

agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080

atcatgtctg t 1091

<210> 96

<211> 1091

<212> DNA

<213> 人工序列

<220>

<223> GSC11211

<400> 96

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc 660

tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720

aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780

agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080

atcatgtctg t 1091

<210> 97

<211> 1091

<212> DNA

<213> 人工序列

<220>

<223> GSC11212

<400> 97

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcgtgctgc 660

tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720

aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780

agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080

atcatgtctg t 1091

<210> 98

<211> 1091

<212> DNA

<213> 人工序列

<220>

<223> GSC11398

<400> 98

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcaagctgc 660

tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720

aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780

agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080

atcatgtctg t 1091

<210> 99

<211> 1091

<212> DNA

<213> 人工序列

<220>

<223> GSC11208

<400> 99

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcgtgctgc 660

tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720

aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780

agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080

atcatgtctg t 1091

<210> 100

<211> 1091

<212> DNA

<213> 人工序列

<220>

<223> GSC11291

<400> 100

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcgtgctgc 660

tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720

aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780

agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840

gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900

acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080

atcatgtctg t 1091

<210> 101

<211> 1085

<212> DNA

<213> 人工序列

<220>

<223> GSC11297

<400> 101

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatttc ttcatccccc tgctggtggt gatcctgttc gccgtggaca 660

ccggcctgtt catcaagtgc ttctgcaagc accggtcctg cttccggcgg aacgaggcct 720

ccagagagac aaacaactcc ctgaccttcg gccccgagga agccctggct gagcagaccg 780

tgtttctgtg atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 840

tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 900

gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 960

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 1020

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 1080

tctgt 1085

<210> 102

<211> 1085

<212> DNA

<213> 人工序列

<220>

<223> GSC11298

<400> 102

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatatc ctgatcggca cctccgtggt gatcatcctg ttcatcctgc 660

tgttcttcct gctgaagtgc ttctgcaagc accggtcctg cttccggcgg aacgaggcct 720

ccagagagac aaacaactcc ctgaccttcg gccccgagga agccctggct gagcagaccg 780

tgtttctgtg atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 840

tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 900

gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 960

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 1020

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 1080

tctgt 1085

<210> 103

<211> 1079

<212> DNA

<213> 人工序列

<220>

<223> GSC11393

<400> 103

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgtg ctggccctga tcgtgatctt cctgaccatc gccgtgctgc 660

tggccctgaa gtgcttctgc aagcaccggt cctgcttccg gcggaacgag gcctccagag 720

agacaaacaa ctccctgacc ttcggccccg aggaagccct ggctgagcag accgtgtttc 780

tgtgatgatt cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt 840

ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga 900

tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg 960

cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 1020

tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 1079

<210> 104

<211> 1106

<212> DNA

<213> 人工序列

<220>

<223> GSC11394

<400> 104

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgtg atgtccgtgg ccaccatcgt gatcgtggac atctgcatca 660

ccggcggcct gctgctgctg gtgtactact ggtccaagtg cttctgcaag caccggtcct 720

gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780

aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840

ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900

gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960

tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020

tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080

tcatcaatgt atcttatcat gtctgt 1106

<210> 105

<211> 1106

<212> DNA

<213> 人工序列

<220>

<223> GSC11395

<400> 105

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatgcc atccccatct ggtgggtgct ggtgggcgtg ctgggcggcc 660

tgctgctgct gaccatcctg gtgctggcca tgtggaagtg cttctgcaag caccggtcct 720

gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780

aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840

ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900

gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960

tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020

tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080

tcatcaatgt atcttatcat gtctgt 1106

<210> 106

<211> 1109

<212> DNA

<213> 人工序列

<220>

<223> GSC11396

<400> 106

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatttc tgggtgctgg tggtggtggg cggcgtgctg gcctgctact 660

ccctgctggt gaccgtggcc ttcatcatct tctgggtgaa gtgcttctgc aagcaccggt 720

cctgcttccg gcggaacgag gcctccagag agacaaacaa ctccctgacc ttcggccccg 780

aggaagccct ggctgagcag accgtgtttc tgtgatgatt cgaaatgacc gaccaagcga 840

cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 900

tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 960

agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1020

gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1080

aactcatcaa tgtatcttat catgtctgt 1109

<210> 107

<211> 1109

<212> DNA

<213> 人工序列

<220>

<223> GSC11389

<400> 107

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatctg tggacgacca tcaccatctt catcacactc ttcctgttaa 660

gcgtgtgcta cagtgccacc gtcaccttct tcaaggtgaa gtgcttctgc aagcaccggt 720

cctgcttccg gcggaacgag gcctccagag agacaaacaa ctccctgacc ttcggccccg 780

aggaagccct ggctgagcag accgtgtttc tgtgatgatt cgaaatgacc gaccaagcga 840

cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 900

tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 960

agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1020

gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1080

aactcatcaa tgtatcttat catgtctgt 1109

<210> 108

<211> 1082

<212> DNA

<213> 人工序列

<220>

<223> GSC11677

<400> 108

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc accgtgatcg 660

tcgtgattat caagtgcttc tgcaagcacc ggtcctgctt ccggcggaac gaggcctcca 720

gagagacaaa caactccctg accttcggcc ccgaggaagc cctggctgag cagaccgtgt 780

ttctgtgatg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840

attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900

ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080

gt 1082

<210> 109

<211> 1088

<212> DNA

<213> 人工序列

<220>

<223> GSC11679

<400> 109

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc accgtggtcg 660

tgatcgtcgt gattatcaag tgcttctgca agcaccggtc ctgcttccgg cggaacgagg 720

cctccagaga gacaaacaac tccctgacct tcggccccga ggaagccctg gctgagcaga 780

ccgtgtttct gtgatgattc gaaatgaccg accaagcgac gcccaacctg ccatcacgag 840

atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg 900

ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact 960

tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 1020

aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 1080

atgtctgt 1088

<210> 110

<211> 1100

<212> DNA

<213> 人工序列

<220>

<223> GSC11484

<400> 110

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtggtcattg 660

taaccgtggt cgtgatcgtc gtgattatca agtgcttctg caagcaccgg tcctgcttcc 720

ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780

tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840

tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900

ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960

cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020

atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080

atgtatctta tcatgtctgt 1100

<210> 111

<211> 1106

<212> DNA

<213> 人工序列

<220>

<223> GSC11292

<400> 111

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtggtcattg 660

tagtcgtaac cgtggtcgtg atcgtcgtga ttatcaagtg cttctgcaag caccggtcct 720

gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780

aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840

ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900

gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960

tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020

tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080

tcatcaatgt atcttatcat gtctgt 1106

<210> 112

<211> 1007

<212> DNA

<213> 人工序列

<220>

<223> GSC11207

<400> 112

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcgccagcg cccatcacca ccaccatcat tgatgattcg 720

aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct 780

tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc 840

gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg 900

gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 960

ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgt 1007

<210> 113

<211> 995

<212> DNA

<213> 人工序列

<220>

<223> GSC11209

<400> 113

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagtg atgattcgaa atgaccgacc 720

aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 780

tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 840

tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 900

gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 960

tgtccaaact catcaatgta tcttatcatg tctgt 995

<210> 114

<211> 1058

<212> DNA

<213> 人工序列

<220>

<223> GSC11758

<400> 114

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgga tcttctcctc ggtggtggac ctgaagcaga 720

ccatcatccc cgactacagg aacatgatcg gacagggggc ctagtgattc gaaatgaccg 780

accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 840

ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 900

tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 960

aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1020

gtttgtccaa actcatcaat gtatcttatc atgtctgt 1058

<210> 115

<211> 1016

<212> PRT

<213> 人工序列

<220>

<223> GSC11764

<400> 115

Cys Thr Gly Thr Cys Thr Cys Cys Gly Gly Gly Thr Ala Ala Ala Thr

1 5 10 15

Gly Ala Thr Gly Ala Ala Ala Gly Cys Thr Thr Gly Gly Thr Ala Gly

20 25 30

Gly Thr Gly Ala Thr Cys Cys Thr Cys Cys Thr Gly Cys Thr Gly Cys

35 40 45

Thr Thr Thr Gly Gly Thr Thr Cys Ala Gly Gly Gly Thr Thr Thr Thr

50 55 60

Gly Cys Thr Thr Gly Ala Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly

65 70 75 80

Thr Gly Gly Thr Gly Ala Thr Thr Thr Cys Cys Thr Thr Gly Cys Cys

85 90 95

Ala Thr Gly Gly Gly Cys Ala Gly Ala Cys Thr Gly Ala Gly Cys Ala

100 105 110

Gly Ala Ala Ala Ala Gly Gly Cys Cys Ala Thr Thr Gly Gly Gly Ala

115 120 125

Cys Cys Ala Thr Gly Thr Thr Cys Thr Gly Ala Ala Thr Gly Cys Cys

130 135 140

Thr Cys Cys Ala Cys Cys Thr Cys Ala Ala Cys Cys Ala Cys Cys Gly

145 150 155 160

Gly Cys Cys Gly Gly Thr Ala Gly Gly Ala Cys Cys Ala Ala Ala Gly

165 170 175

Cys Cys Ala Cys Cys Cys Cys Gly Thr Gly Thr Thr Thr Thr Cys Thr

180 185 190

Cys Ala Gly Gly Ala Thr Cys Thr Cys Thr Thr Thr Thr Cys Cys Cys

195 200 205

Ala Gly Gly Gly Ala Gly Ala Thr Cys Cys Cys Thr Cys Gly Gly Cys

210 215 220

Cys Cys Ala Ala Ala Gly Ala Gly Gly Gly Ala Gly Ala Thr Gly Gly

225 230 235 240

Cys Ala Ala Thr Gly Cys Thr Gly Gly Ala Thr Gly Thr Gly Thr Gly

245 250 255

Cys Ala Cys Ala Ala Thr Ala Ala Thr Thr Cys Ala Ala Cys Ala Gly

260 265 270

Gly Cys Ala Thr Thr Gly Gly Ala Ala Cys Thr Thr Cys Ala Gly Cys

275 280 285

Ala Thr Cys Gly Ala Thr Gly Cys Thr Gly Ala Ala Thr Gly Cys Ala

290 295 300

Ala Thr Thr Ala Ala Cys Ala Ala Thr Gly Cys Thr Cys Ala Ala Gly

305 310 315 320

Cys Ala Gly Ala Ala Cys Cys Cys Cys Cys Gly Gly Cys Thr Cys Cys

325 330 335

Ala Thr Cys Ala Gly Cys Ala Cys Ala Gly Thr Gly Cys Ala Gly Gly

340 345 350

Ala Cys Cys Ala Ala Ala Cys Cys Cys Cys Ala Thr Gly Cys Thr Gly

355 360 365

Cys Ala Gly Cys Ala Gly Thr Gly Gly Gly Gly Cys Thr Gly Thr Cys

370 375 380

Thr Gly Thr Ala Cys Gly Gly Gly Gly Thr Gly Gly Gly Cys Ala Ala

385 390 395 400

Thr Gly Gly Gly Ala Ala Cys Cys Gly Gly Gly Gly Thr Cys Thr Gly

405 410 415

Cys Thr Gly Gly Gly Gly Cys Thr Cys Cys Thr Gly Cys Thr Gly Cys

420 425 430

Thr Thr Cys Ala Gly Thr Gly Cys Thr Gly Cys Cys Ala Thr Gly Cys

435 440 445

Ala Gly Cys Cys Ala Cys Ala Cys Ala Thr Cys Cys Thr Gly Ala Gly

450 455 460

Ala Gly Cys Thr Gly Ala Ala Ala Gly Gly Gly Thr Cys Gly Gly Cys

465 470 475 480

Gly Thr Cys Cys Thr Cys Ala Cys Cys Thr Gly Gly Thr Gly Cys Ala

485 490 495

Cys Ala Cys Cys Gly Thr Ala Gly Cys Thr Cys Thr Gly Cys Cys Cys

500 505 510

Cys Ala Cys Ala Gly Cys Thr Thr Thr Ala Ala Gly Gly Cys Ala Cys

515 520 525

Cys Thr Gly Gly Cys Thr Ala Ala Cys Cys Thr Cys Thr Gly Cys Gly

530 535 540

Cys Thr Thr Cys Thr Thr Cys Cys Cys Thr Thr Cys Cys Cys Thr Cys

545 550 555 560

Cys Thr Cys Cys Cys Thr Gly Gly Cys Thr Cys Ala Gly Gly Thr Gly

565 570 575

Gly Thr Gly Gly Thr Gly Gly Ala Thr Cys Thr Cys Cys Cys Cys Cys

580 585 590

Cys Gly Ala Gly Gly Ala Cys Cys Cys Cys Cys Cys Thr Gly Ala Cys

595 600 605

Thr Cys Cys Ala Ala Gly Ala Ala Thr Ala Cys Cys Cys Thr Gly Gly

610 615 620

Thr Gly Cys Thr Gly Thr Thr Cys Gly Gly Cys Gly Cys Thr Gly Gly

625 630 635 640

Cys Thr Thr Cys Gly Gly Cys Gly Cys Cys Gly Thr Gly Ala Thr Thr

645 650 655

Ala Cys Cys Gly Thr Gly Gly Thr Cys Gly Thr Gly Ala Thr Cys Gly

660 665 670

Thr Cys Gly Thr Gly Ala Thr Thr Ala Thr Cys Ala Gly Gly Thr Cys

675 680 685

Cys Cys Ala Gly Cys Ala Gly Gly Ala Gly Gly Cys Cys Gly Cys Cys

690 695 700

Gly Cys Cys Ala Ala Gly Ala Ala Gly Thr Thr Cys Thr Thr Cys Thr

705 710 715 720

Gly Ala Thr Gly Ala Thr Thr Cys Gly Ala Ala Ala Thr Gly Ala Cys

725 730 735

Cys Gly Ala Cys Cys Ala Ala Gly Cys Gly Ala Cys Gly Cys Cys Cys

740 745 750

Ala Ala Cys Cys Thr Gly Cys Cys Ala Thr Cys Ala Cys Gly Ala Gly

755 760 765

Ala Thr Thr Thr Cys Gly Ala Thr Thr Cys Cys Ala Cys Cys Gly Cys

770 775 780

Cys Gly Cys Cys Thr Thr Cys Thr Ala Thr Gly Ala Ala Ala Gly Gly

785 790 795 800

Thr Thr Gly Gly Gly Cys Thr Thr Cys Gly Gly Ala Ala Thr Cys Gly

805 810 815

Thr Thr Thr Thr Cys Cys Gly Gly Gly Ala Cys Gly Cys Cys Gly Gly

820 825 830

Cys Thr Gly Gly Ala Thr Gly Ala Thr Cys Cys Thr Cys Cys Ala Gly

835 840 845

Cys Gly Cys Gly Gly Gly Gly Ala Thr Cys Thr Cys Ala Thr Gly Cys

850 855 860

Thr Gly Gly Ala Gly Thr Thr Cys Thr Thr Cys Gly Cys Cys Cys Ala

865 870 875 880

Cys Cys Cys Cys Ala Ala Cys Thr Thr Gly Thr Thr Thr Ala Thr Thr

885 890 895

Gly Cys Ala Gly Cys Thr Thr Ala Thr Ala Ala Thr Gly Gly Thr Thr

900 905 910

Ala Cys Ala Ala Ala Thr Ala Ala Ala Gly Cys Ala Ala Thr Ala Gly

915 920 925

Cys Ala Thr Cys Ala Cys Ala Ala Ala Thr Thr Thr Cys Ala Cys Ala

930 935 940

Ala Ala Thr Ala Ala Ala Gly Cys Ala Thr Thr Thr Thr Thr Thr Thr

945 950 955 960

Cys Ala Cys Thr Gly Cys Ala Thr Thr Cys Thr Ala Gly Thr Thr Gly

965 970 975

Thr Gly Gly Thr Thr Thr Gly Thr Cys Cys Ala Ala Ala Cys Thr Cys

980 985 990

Ala Thr Cys Ala Ala Thr Gly Thr Ala Thr Cys Thr Thr Ala Thr Cys

995 1000 1005

Ala Thr Gly Thr Cys Thr Gly Thr

1010 1015

<210> 116

<211> 1016

<212> DNA

<213> 人工序列

<220>

<223> GSC11678

<400> 116

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaggtccc agcaggaggc cgccgccaag aagtggtggt 720

gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 780

ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 840

tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 900

cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 960

cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1016

<210> 117

<211> 1115

<212> DNA

<213> 人工序列

<220>

<223> GSC11759

<400> 117

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcatgttcc tgaccctgaa gggctccctg aagcagaggc 720

tgcaggtgat gatccagccc tccgaggaca tcgtgaggcc cgagaacggc cccgagcagc 780

cccaggccgg ctcctccgcc tccaaggagg cctacatctg atgattcgaa atgaccgacc 840

aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 900

tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 960

tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 1020

gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 1080

tgtccaaact catcaatgta tcttatcatg tctgt 1115

<210> 118

<211> 1004

<212> DNA

<213> 人工序列

<220>

<223> GSC11483

<400> 118

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcatgttcc tgaccctgaa gggctcctga tgattcgaaa 720

tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 780

atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 840

gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 900

acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 960

gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1004

<210> 119

<211> 1115

<212> DNA

<213> 人工序列

<220>

<223> GSC11760

<400> 119

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atctgcttcg tgggcaacag gttccagcag aagctgaggt 720

ccgtgttcag ggtgcccatc acctggctgc agggcaagag ggagaccatg tcctgcagga 780

agtcctcctc cctgagggag atggacacct tcgtgtcctg atgattcgaa atgaccgacc 840

aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 900

tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 960

tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 1020

gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 1080

tgtccaaact catcaatgta tcttatcatg tctgt 1115

<210> 120

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> GSC11761

<400> 120

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atctgcttcg tgggcaacag gttccagcag aagctgaggt 720

ccgtgttcag ggtgcccatc acctggctgc agggcaagag ggagaccatg tcctgcagga 780

agtcctcctc cctgaggtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 121

<211> 1229

<212> DNA

<213> 人工序列

<220>

<223> GSC11762

<400> 121

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaactccc acctgctgcc caggcccctg aggcacctgg 720

cctgctgcgg cggcccccag cccaggatga ggaggaggct gtccgacggc tccctgtcct 780

ccaggcacac caccctgctg accaggtcct cctgccccgc caccctgtcc ctgtccctgt 840

ccctgaccct gtccggcagg cccaggcccg aggagtcccc cagggacctg gagctggccg 900

acggcgaggg caccgccgag accatcatct tctgatgatt cgaaatgacc gaccaagcga 960

cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 1020

tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 1080

agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1140

gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1200

aactcatcaa tgtatcttat catgtctgt 1229

<210> 122

<211> 1052

<212> DNA

<213> 人工序列

<220>

<223> GSC11765

<400> 122

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaactccc acgaggagtc ccccagggac ctggagctgg 720

ccgacggcga gggcaccgcc gagaccatca tcttctgatg attcgaaatg accgaccaag 780

cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 840

gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 900

tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 960

atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 1020

ccaaactcat caatgtatct tatcatgtct gt 1052

<210> 123

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> GSC11766

<400> 123

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atctgcatca agctgaagca caccaagaag aggcagatct 720

acaccgacat cgagatgaac aggctgggca agtgatgatt cgaaatgacc gaccaagcga 780

cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 840

tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 900

agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 960

gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1020

aactcatcaa tgtatcttat catgtctgt 1049

<210> 124

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> GSC11763

<400> 124

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atctgcatca agctgaagca caccaagaag aggcagatcg 720

ccgccgccgc cgccgccaac aggctgggca agtgatgatt cgaaatgacc gaccaagcga 780

cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 840

tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 900

agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 960

gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1020

aactcatcaa tgtatcttat catgtctgt 1049

<210> 125

<211> 1118

<212> DNA

<213> 人工序列

<220>

<223> GSC11294

<400> 125

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600

aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660

tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tgcttctgca 720

agcaccggtc ctgcttccgg cggaacgagg cctccagaga gacaaacaac tccctgacct 780

tcggccccga ggaagccctg gctgagcaga ccgtgtttct gtagtgattc gaaatgaccg 840

accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 900

ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 960

tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 1020

aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1080

gtttgtccaa actcatcaat gtatcttatc atgtctgt 1118

<210> 126

<211> 466

<212> PRT

<213> 人工序列

<220>

<223> GSB59abc

<400> 126

Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro

1 5 10 15

Asp Gly Val His Ala Gln Val Thr Leu Lys Glu Ser Gly Pro Ala Leu

20 25 30

Val Lys Pro Thr Gln Thr Leu Thr Leu Thr Cys Ser Phe Ser Gly Phe

35 40 45

Ser Leu Ser Thr Ser Gly Met Gly Val Gly Trp Ile Arg Gln Pro Pro

50 55 60

Gly Lys Ala Leu Glu Trp Ile Ala His Ile Trp Trp Asp Asp Asp Lys

65 70 75 80

Tyr Tyr Asn Thr Ala Leu Lys Thr Arg Leu Thr Ile Ser Lys Asp Thr

85 90 95

Ser Lys Asn Gln Val Val Leu Thr Met Thr Asn Met Asp Pro Val Asp

100 105 110

Thr Ala Thr Tyr Tyr Cys Ala Arg Ile Asp Trp Asp Gly Phe Ala Tyr

115 120 125

Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly

130 135 140

Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser

145 150 155 160

Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val

165 170 175

Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe

180 185 190

Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val

195 200 205

Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val

210 215 220

Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys

225 230 235 240

Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly

245 250 255

Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile

260 265 270

Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu

275 280 285

Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His

290 295 300

Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg

305 310 315 320

Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys

325 330 335

Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu

340 345 350

Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr

355 360 365

Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu

370 375 380

Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp

385 390 395 400

Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val

405 410 415

Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp

420 425 430

Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His

435 440 445

Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu

450 455 460

Gly Lys

465

<210> 127

<211> 80

<212> PRT

<213> 人工序列

<220>

<223> GSC11218

<400> 127

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His

35 40 45

Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser

50 55 60

Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75 80

<210> 128

<211> 81

<212> PRT

<213> 人工序列

<220>

<223> GSC11213

<400> 128

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Leu Ala Leu Ile Leu Gly Pro Val Leu Ala Leu Leu

20 25 30

Ala Leu Val Ala Leu Gly Val Leu Gly Leu Trp Lys Cys Phe Cys Lys

35 40 45

His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn

50 55 60

Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe

65 70 75 80

Leu

<210> 129

<211> 81

<212> PRT

<213> 人工序列

<220>

<223> GSC11214

<400> 129

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ile Ala Ala Ile Ile Val Ile Leu Val Leu Leu Leu

20 25 30

Leu Leu Gly Ile Gly Leu Met Trp Trp Phe Trp Lys Cys Phe Cys Lys

35 40 45

His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn

50 55 60

Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe

65 70 75 80

Leu

<210> 130

<211> 80

<212> PRT

<213> 人工序列

<220>

<223> GSC11210

<400> 130

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Met Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu

20 25 30

Leu Leu Phe Ile Gly Leu Gly Ile Phe Phe Lys Cys Phe Cys Lys His

35 40 45

Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser

50 55 60

Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75 80

<210> 131

<211> 80

<212> PRT

<213> 人工序列

<220>

<223> GSC11205

<400> 131

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ile Ala Gly Val Ile Ala Gly Ile Leu Leu Phe Val

20 25 30

Ile Ile Phe Leu Gly Val Val Leu Val Met Lys Cys Phe Cys Lys His

35 40 45

Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser

50 55 60

Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75 80

<210> 132

<211> 80

<212> PRT

<213> 人工序列

<220>

<223> GSC11217

<400> 132

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Val Val Ile Pro Ile Ile Phe Gly Ile Leu

20 25 30

Phe Ala Ile Leu Leu Val Leu Val Phe Ile Lys Cys Phe Cys Lys His

35 40 45

Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser

50 55 60

Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75 80

<210> 133

<211> 81

<212> PRT

<213> 人工序列

<220>

<223> GSC11756

<400> 133

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ile Ile Pro Ile Val Ala Gly Val Val Ala Gly Ile

20 25 30

Val Leu Ile Gly Leu Ala Leu Leu Leu Ile Trp Lys Cys Phe Cys Lys

35 40 45

His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn

50 55 60

Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe

65 70 75 80

Leu

<210> 134

<211> 82

<212> PRT

<213> 人工序列

<220>

<223> GSC11296

<400> 134

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Gly Ile Val Ala Gly Leu Ala Val Leu Ala Val Val

20 25 30

Val Ile Gly Ala Val Val Ala Ala Val Met Cys Arg Lys Cys Phe Cys

35 40 45

Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn

50 55 60

Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val

65 70 75 80

Phe Leu

<210> 135

<211> 82

<212> PRT

<213> 人工序列

<220>

<223> GSC11295

<400> 135

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Leu Ile Ile Ala Leu Pro Val Ala Val Leu Leu Ile

20 25 30

Val Gly Gly Leu Val Ile Met Leu Tyr Val Phe His Lys Cys Phe Cys

35 40 45

Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn

50 55 60

Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val

65 70 75 80

Phe Leu

<210> 136

<211> 82

<212> PRT

<213> 人工序列

<220>

<223> GSC11390

<400> 136

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Gly Leu Leu Ile Gly Ile Ser Ile Ala Ser Leu Cys

20 25 30

Leu Val Val Ala Leu Leu Ala Leu Leu Cys His Leu Lys Cys Phe Cys

35 40 45

Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn

50 55 60

Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val

65 70 75 80

Phe Leu

<210> 137

<211> 82

<212> PRT

<213> 人工序列

<220>

<223> GSC11391

<400> 137

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Leu Leu Leu Gly Val Ser Val Ser Cys Ile Val Ile

20 25 30

Leu Ala Val Cys Leu Leu Cys Tyr Val Ser Ile Thr Lys Cys Phe Cys

35 40 45

Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn

50 55 60

Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val

65 70 75 80

Phe Leu

<210> 138

<211> 81

<212> PRT

<213> 人工序列

<220>

<223> GSC11392

<400> 138

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Asn Thr Val Gly Ser Val Ile Gly Val Ile Val

20 25 30

Thr Ile Phe Val Ser Gly Thr Val Tyr Phe Ile Lys Cys Phe Cys Lys

35 40 45

His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn

50 55 60

Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe

65 70 75 80

Leu

<210> 139

<211> 81

<212> PRT

<213> 人工序列

<220>

<223> GSC11397

<400> 139

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ile Thr Leu Ile Ile Phe Gly Val Met Ala Gly Val

20 25 30

Ile Gly Thr Ile Leu Leu Ile Ser Tyr Gly Ile Lys Cys Phe Cys Lys

35 40 45

His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn

50 55 60

Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe

65 70 75 80

Leu

<210> 140

<211> 79

<212> PRT

<213> 人工序列

<220>

<223> GSC11204

<400> 140

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe

20 25 30

Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg

35 40 45

Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu

50 55 60

Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 141

<211> 79

<212> PRT

<213> 人工序列

<220>

<223> GSC11216

<400> 141

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe

20 25 30

Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg

35 40 45

Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu

50 55 60

Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 142

<211> 79

<212> PRT

<213> 人工序列

<220>

<223> GSC11203

<400> 142

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe

20 25 30

Val Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg

35 40 45

Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu

50 55 60

Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 143

<211> 79

<212> PRT

<213> 人工序列

<220>

<223> GSC11211

<400> 143

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe

20 25 30

Lys Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg

35 40 45

Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu

50 55 60

Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 144

<211> 79

<212> PRT

<213> 人工序列

<220>

<223> GSC11212

<400> 144

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe

20 25 30

Val Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg

35 40 45

Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu

50 55 60

Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 145

<211> 79

<212> PRT

<213> 人工序列

<220>

<223> GSC11398

<400> 145

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe

20 25 30

Lys Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg

35 40 45

Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu

50 55 60

Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 146

<211> 79

<212> PRT

<213> 人工序列

<220>

<223> GSC11208

<400> 146

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe

20 25 30

Val Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg

35 40 45

Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu

50 55 60

Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 147

<211> 79

<212> PRT

<213> 人工序列

<220>

<223> GSC11291

<400> 147

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe

20 25 30

Val Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg

35 40 45

Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu

50 55 60

Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 148

<211> 77

<212> PRT

<213> 人工序列

<220>

<223> GSC11297

<400> 148

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Phe Phe Ile Pro Leu Leu Val Val Ile Leu Phe Ala

20 25 30

Val Asp Thr Gly Leu Phe Ile Lys Cys Phe Cys Lys His Arg Ser Cys

35 40 45

Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe

50 55 60

Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 149

<211> 77

<212> PRT

<213> 人工序列

<220>

<223> GSC11298

<400> 149

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ile Leu Ile Gly Thr Ser Val Val Ile Ile Leu Phe

20 25 30

Ile Leu Leu Phe Phe Leu Leu Lys Cys Phe Cys Lys His Arg Ser Cys

35 40 45

Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe

50 55 60

Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 150

<211> 75

<212> PRT

<213> 人工序列

<220>

<223> GSC11393

<400> 150

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Val Leu Ala Leu Ile Val Ile Phe Leu Thr Ile Ala

20 25 30

Val Leu Leu Ala Leu Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg

35 40 45

Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro

50 55 60

Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 151

<211> 84

<212> PRT

<213> 人工序列

<220>

<223> GSC11394

<400> 151

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile

20 25 30

Cys Ile Thr Gly Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser Lys Cys

35 40 45

Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu

50 55 60

Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln

65 70 75 80

Thr Val Phe Leu

<210> 152

<211> 84

<212> PRT

<213> 人工序列

<220>

<223> GSC11395

<400> 152

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Ala Ile Pro Ile Trp Trp Val Leu Val Gly Val Leu

20 25 30

Gly Gly Leu Leu Leu Leu Thr Ile Leu Val Leu Ala Met Trp Lys Cys

35 40 45

Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu

50 55 60

Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln

65 70 75 80

Thr Val Phe Leu

<210> 153

<211> 85

<212> PRT

<213> 人工序列

<220>

<223> GSC11396

<400> 153

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala

20 25 30

Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Lys

35 40 45

Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg

50 55 60

Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu

65 70 75 80

Gln Thr Val Phe Leu

85

<210> 154

<211> 85

<212> PRT

<213> 人工序列

<220>

<223> GSC11389

<400> 154

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Leu Trp Thr Thr Ile Thr Ile Phe Ile Thr Leu Phe

20 25 30

Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe Lys Val Lys

35 40 45

Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg

50 55 60

Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu

65 70 75 80

Gln Thr Val Phe Leu

85

<210> 155

<211> 76

<212> PRT

<213> 人工序列

<220>

<223> GSC11677

<400> 155

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr

20 25 30

Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser Cys Phe

35 40 45

Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly

50 55 60

Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 156

<211> 78

<212> PRT

<213> 人工序列

<220>

<223> GSC11679

<400> 156

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr

20 25 30

Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser

35 40 45

Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr

50 55 60

Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 157

<211> 82

<212> PRT

<213> 人工序列

<220>

<223> GSC11484

<400> 157

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Val Ile Val Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys

35 40 45

Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn

50 55 60

Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val

65 70 75 80

Phe Leu

<210> 158

<211> 84

<212> PRT

<213> 人工序列

<220>

<223> GSC11292

<400> 158

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Val Ile Val Val Val Thr Val Val Val Ile Val Val Ile Ile Lys Cys

35 40 45

Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu

50 55 60

Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln

65 70 75 80

Thr Val Phe Leu

<210> 159

<211> 51

<212> PRT

<213> 人工序列

<220>

<223> GSC11207

<400> 159

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Ala Ser Ala His His His

35 40 45

His His His

50

<210> 160

<211> 47

<212> PRT

<213> 人工序列

<220>

<223> GSC11209

<400> 160

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys

35 40 45

<210> 161

<211> 68

<212> PRT

<213> 人工序列

<220>

<223> GSC11758

<400> 161

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Lys Trp Ile Phe Ser Ser

35 40 45

Val Val Asp Leu Lys Gln Thr Ile Ile Pro Asp Tyr Arg Asn Met Ile

50 55 60

Gly Gln Gly Ala

65

<210> 162

<211> 54

<212> PRT

<213> 人工序列

<220>

<223> GSC11764

<400> 162

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Arg Ser Gln Gln Glu Ala

35 40 45

Ala Ala Lys Lys Phe Phe

50

<210> 163

<211> 54

<212> PRT

<213> 人工序列

<220>

<223> GSC11678

<400> 163

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Arg Ser Gln Gln Glu Ala

35 40 45

Ala Ala Lys Lys Trp Trp

50

<210> 164

<211> 87

<212> PRT

<213> 人工序列

<220>

<223> GSC11759

<400> 164

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Met Phe Leu Thr Leu Lys

35 40 45

Gly Ser Leu Lys Gln Arg Leu Gln Val Met Ile Gln Pro Ser Glu Asp

50 55 60

Ile Val Arg Pro Glu Asn Gly Pro Glu Gln Pro Gln Ala Gly Ser Ser

65 70 75 80

Ala Ser Lys Glu Ala Tyr Ile

85

<210> 165

<211> 50

<212> PRT

<213> 人工序列

<220>

<223> GSC11483

<400> 165

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Met Phe Leu Thr Leu Lys

35 40 45

Gly Ser

50

<210> 166

<211> 87

<212> PRT

<213> 人工序列

<220>

<223> GSC11760

<400> 166

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Cys Phe Val Gly Asn Arg

35 40 45

Phe Gln Gln Lys Leu Arg Ser Val Phe Arg Val Pro Ile Thr Trp Leu

50 55 60

Gln Gly Lys Arg Glu Thr Met Ser Cys Arg Lys Ser Ser Ser Leu Arg

65 70 75 80

Glu Met Asp Thr Phe Val Ser

85

<210> 167

<211> 80

<212> PRT

<213> 人工序列

<220>

<223> GSC11761

<400> 167

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Cys Phe Val Gly Asn Arg

35 40 45

Phe Gln Gln Lys Leu Arg Ser Val Phe Arg Val Pro Ile Thr Trp Leu

50 55 60

Gln Gly Lys Arg Glu Thr Met Ser Cys Arg Lys Ser Ser Ser Leu Arg

65 70 75 80

<210> 168

<211> 125

<212> PRT

<213> 人工序列

<220>

<223> GSC11762

<400> 168

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Asn Ser His Leu Leu Pro

35 40 45

Arg Pro Leu Arg His Leu Ala Cys Cys Gly Gly Pro Gln Pro Arg Met

50 55 60

Arg Arg Arg Leu Ser Asp Gly Ser Leu Ser Ser Arg His Thr Thr Leu

65 70 75 80

Leu Thr Arg Ser Ser Cys Pro Ala Thr Leu Ser Leu Ser Leu Ser Leu

85 90 95

Thr Leu Ser Gly Arg Pro Arg Pro Glu Glu Ser Pro Arg Asp Leu Glu

100 105 110

Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr Ile Ile Phe

115 120 125

<210> 169

<211> 66

<212> PRT

<213> 人工序列

<220>

<223> GSC11765

<400> 169

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Asn Ser His Glu Glu Ser

35 40 45

Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr Ile

50 55 60

Ile Phe

65

<210> 170

<211> 65

<212> PRT

<213> 人工序列

<220>

<223> GSC11766

<400> 170

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Cys Ile Lys Leu Lys His

35 40 45

Thr Lys Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly

50 55 60

Lys

65

<210> 171

<211> 65

<212> PRT

<213> 人工序列

<220>

<223> GSC11763

<400> 171

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Cys Ile Lys Leu Lys His

35 40 45

Thr Lys Lys Arg Gln Ile Ala Ala Ala Ala Ala Ala Asn Arg Leu Gly

50 55 60

Lys

65

<210> 172

<211> 88

<212> PRT

<213> 人工序列

<220>

<223> GSC11294

<400> 172

Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala

1 5 10 15

Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile

20 25 30

Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe

35 40 45

Lys Val Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu

50 55 60

Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala

65 70 75 80

Leu Ala Glu Gln Thr Val Phe Leu

85

<210> 173

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> B7 TM结构域

<400> 173

Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Ile Thr Val Val

1 5 10 15

Val Ile Val Val Ile Ile

20

<210> 174

<211> 23

<212> PRT

<213> 人类

<400> 174

Leu Ala Leu Ile Leu Gly Pro Val Leu Ala Leu Leu Ala Leu Val Ala

1 5 10 15

Leu Gly Val Leu Gly Leu Trp

20

<210> 175

<211> 23

<212> PRT

<213> 人类

<400> 175

Ile Ala Ala Ile Ile Val Ile Leu Val Leu Leu Leu Leu Leu Gly Ile

1 5 10 15

Gly Leu Met Trp Trp Phe Trp

20

<210> 176

<211> 22

<212> PRT

<213> 人类

<400> 176

Met Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu Leu Leu Phe Ile

1 5 10 15

Gly Leu Gly Ile Phe Phe

20

<210> 177

<211> 22

<212> PRT

<213> 人类

<400> 177

Ile Ala Gly Val Ile Ala Gly Ile Leu Leu Phe Val Ile Ile Phe Leu

1 5 10 15

Gly Val Val Leu Val Met

20

<210> 178

<211> 22

<212> PRT

<213> 人类

<400> 178

Ala Leu Val Val Ile Pro Ile Ile Phe Gly Ile Leu Phe Ala Ile Leu

1 5 10 15

Leu Val Leu Val Phe Ile

20

<210> 179

<211> 23

<212> PRT

<213> 人类

<400> 179

Ile Ile Pro Ile Val Ala Gly Val Val Ala Gly Ile Val Leu Ile Gly

1 5 10 15

Leu Ala Leu Leu Leu Ile Trp

20

<210> 180

<211> 24

<212> PRT

<213> 人类

<400> 180

Gly Ile Val Ala Gly Leu Ala Val Leu Ala Val Val Val Ile Gly Ala

1 5 10 15

Val Val Ala Ala Val Met Cys Arg

20

<210> 181

<211> 24

<212> PRT

<213> 人类

<400> 181

Leu Ile Ile Ala Leu Pro Val Ala Val Leu Leu Ile Val Gly Gly Leu

1 5 10 15

Val Ile Met Leu Tyr Val Phe His

20

<210> 182

<211> 24

<212> PRT

<213> 人类

<400> 182

Gly Leu Leu Ile Gly Ile Ser Ile Ala Ser Leu Cys Leu Val Val Ala

1 5 10 15

Leu Leu Ala Leu Leu Cys His Leu

20

<210> 183

<211> 24

<212> PRT

<213> 人类

<400> 183

Leu Leu Leu Gly Val Ser Val Ser Cys Ile Val Ile Leu Ala Val Cys

1 5 10 15

Leu Leu Cys Tyr Val Ser Ile Thr

20

<210> 184

<211> 23

<212> PRT

<213> 人类

<400> 184

Thr Asn Thr Val Gly Ser Val Ile Gly Val Ile Val Thr Ile Phe Val

1 5 10 15

Ser Gly Thr Val Tyr Phe Ile

20

<210> 185

<211> 23

<212> PRT

<213> 人类

<400> 185

Ile Thr Leu Ile Ile Phe Gly Val Met Ala Gly Val Ile Gly Thr Ile

1 5 10 15

Leu Leu Ile Ser Tyr Gly Ile

20

<210> 186

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PTCRA TM结构域

<400> 186

Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu

1 5 10 15

Phe Asp Leu Leu Leu

20

<210> 187

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PTCRA_R8V TM结构域

<400> 187

Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Lys Leu Leu Leu

1 5 10 15

Phe Asp Leu Leu Leu

20

<210> 188

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PTCRA_K13V TM结构域

<400> 188

Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Val Leu Leu Leu

1 5 10 15

Phe Asp Leu Leu Leu

20

<210> 189

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PTCRA_D18V TM结构域

<400> 189

Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu

1 5 10 15

Phe Val Leu Leu Leu

20

<210> 190

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PTCRA_R8V_K13V TM结构域

<400> 190

Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Val Leu Leu Leu

1 5 10 15

Phe Asp Leu Leu Leu

20

<210> 191

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PTCRA_R8V_D18V TM结构域

<400> 191

Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Lys Leu Leu Leu

1 5 10 15

Phe Val Leu Leu Leu

20

<210> 192

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PTCRA_K13V_D18V TM结构域

<400> 192

Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Val Leu Leu Leu

1 5 10 15

Phe Val Leu Leu Leu

20

<210> 193

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> PTCRA_R8V_K13V_D18V TM结构域

<400> 193

Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Val Leu Leu Leu

1 5 10 15

Phe Val Leu Leu Leu

20

<210> 194

<211> 19

<212> PRT

<213> 人类

<400> 194

Phe Phe Ile Pro Leu Leu Val Val Ile Leu Phe Ala Val Asp Thr Gly

1 5 10 15

Leu Phe Ile

<210> 195

<211> 19

<212> PRT

<213> 人类

<400> 195

Ile Leu Ile Gly Thr Ser Val Val Ile Ile Leu Phe Ile Leu Leu Phe

1 5 10 15

Phe Leu Leu

<210> 196

<211> 17

<212> PRT

<213> 人类

<400> 196

Val Leu Ala Leu Ile Val Ile Phe Leu Thr Ile Ala Val Leu Leu Ala

1 5 10 15

Leu

<210> 197

<211> 26

<212> PRT

<213> 人类

<400> 197

Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly

1 5 10 15

Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser

20 25

<210> 198

<211> 26

<212> PRT

<213> 人类

<400> 198

Ala Ile Pro Ile Trp Trp Val Leu Val Gly Val Leu Gly Gly Leu Leu

1 5 10 15

Leu Leu Thr Ile Leu Val Leu Ala Met Trp

20 25

<210> 199

<211> 27

<212> PRT

<213> 人类

<400> 199

Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu

1 5 10 15

Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val

20 25

<210> 200

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> M1M2 TM结构域

<400> 200

Leu Trp Thr Thr Ile Thr Ile Phe Ile Thr Leu Phe Leu Leu Ser Val

1 5 10 15

Cys Tyr Ser Ala Thr Val Thr Phe Phe Lys Val

20 25

<210> 201

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> B7(18) TM结构域

<400> 201

Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile Val Val

1 5 10 15

Ile Ile

<210> 202

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> B7(20) TM结构域

<400> 202

Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val Val Ile

1 5 10 15

Val Val Ile Ile

20

<210> 203

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> B7(24) TM结构域

<400> 203

Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Val Ile Val Thr

1 5 10 15

Val Val Val Ile Val Val Ile Ile

20

<210> 204

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> B7(26) TM结构域

<400> 204

Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Val Ile Val Val

1 5 10 15

Val Thr Val Val Val Ile Val Val Ile Ile

20 25

<210> 205

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 6His胞质尾

<400> 205

Ala Ser Ala His His His His His His

1 5

<210> 206

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> KCFCK胞质尾

<400> 206

Lys Cys Phe Cys Lys

1 5

<210> 207

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> M1M2胞质尾

<400> 207

Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro

1 5 10 15

Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala

20 25

<210> 208

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> ERGIC53胞质尾

<400> 208

Arg Ser Gln Gln Glu Ala Ala Ala Lys Lys Phe Phe

1 5 10

<210> 209

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> ERGICnoER胞质尾

<400> 209

Arg Ser Gln Gln Glu Ala Ala Ala Lys Lys Trp Trp

1 5 10

<210> 210

<211> 45

<212> PRT

<213> 人工序列

<220>

<223> GAT1胞质尾

<400> 210

Met Phe Leu Thr Leu Lys Gly Ser Leu Lys Gln Arg Leu Gln Val Met

1 5 10 15

Ile Gln Pro Ser Glu Asp Ile Val Arg Pro Glu Asn Gly Pro Glu Gln

20 25 30

Pro Gln Ala Gly Ser Ser Ala Ser Lys Glu Ala Tyr Ile

35 40 45

<210> 211

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> GAT1noER胞质尾

<400> 211

Met Phe Leu Thr Leu Lys Gly Ser

1 5

<210> 212

<211> 45

<212> PRT

<213> 人工序列

<220>

<223> AGTR2胞质尾

<400> 212

Cys Phe Val Gly Asn Arg Phe Gln Gln Lys Leu Arg Ser Val Phe Arg

1 5 10 15

Val Pro Ile Thr Trp Leu Gln Gly Lys Arg Glu Thr Met Ser Cys Arg

20 25 30

Lys Ser Ser Ser Leu Arg Glu Met Asp Thr Phe Val Ser

35 40 45

<210> 213

<211> 38

<212> PRT

<213> 人工序列

<220>

<223> AGTR2noER胞质尾

<400> 213

Cys Phe Val Gly Asn Arg Phe Gln Gln Lys Leu Arg Ser Val Phe Arg

1 5 10 15

Val Pro Ile Thr Trp Leu Gln Gly Lys Arg Glu Thr Met Ser Cys Arg

20 25 30

Lys Ser Ser Ser Leu Arg

35

<210> 214

<211> 83

<212> PRT

<213> 人工序列

<220>

<223> V1BR胞质尾

<400> 214

Asn Ser His Leu Leu Pro Arg Pro Leu Arg His Leu Ala Cys Cys Gly

1 5 10 15

Gly Pro Gln Pro Arg Met Arg Arg Arg Leu Ser Asp Gly Ser Leu Ser

20 25 30

Ser Arg His Thr Thr Leu Leu Thr Arg Ser Ser Cys Pro Ala Thr Leu

35 40 45

Ser Leu Ser Leu Ser Leu Thr Leu Ser Gly Arg Pro Arg Pro Glu Glu

50 55 60

Ser Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr

65 70 75 80

Ile Ile Phe

<210> 215

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> V1BRnoER胞质尾

<400> 215

Asn Ser His Glu Glu Ser Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu

1 5 10 15

Gly Thr Ala Glu Thr Ile Ile Phe

20

<210> 216

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> VGLG胞质尾

<400> 216

Cys Ile Lys Leu Lys His Thr Lys Lys Arg Gln Ile Tyr Thr Asp Ile

1 5 10 15

Glu Met Asn Arg Leu Gly Lys

20

<210> 217

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> VGLGnoER胞质尾

<400> 217

Cys Ile Lys Leu Lys His Thr Lys Lys Arg Gln Ile Ala Ala Ala Ala

1 5 10 15

Ala Ala Asn Arg Leu Gly Lys

20

<210> 218

<211> 38

<212> PRT

<213> 人工序列

<220>

<223> B7胞质尾

<400> 218

Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser

1 5 10 15

Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala

20 25 30

Glu Gln Thr Val Phe Leu

35

<210> 219

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2376

<400> 219

ggccgttcga atcatcactt gcagaagcac ttgataatc 39

<210> 220

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2377

<400> 220

gtcatttcga atcatcaatg atggtggtgg tgatgggcgc tggcgataat cacgacgatc 60

acgac 65

<210> 221

<211> 59

<212> PRT

<213> 人工序列

<220>

<223> 引物GlnPr2378

<400> 221

Thr Thr Gly Ala Ala Cys Ala Gly Cys Ala Gly Cys Ala Gly Thr Cys

1 5 10 15

Thr Cys Ala Gly Cys Ala Cys Gly Cys Cys Cys Ala Gly Cys Cys Ala

20 25 30

Cys Ala Gly Gly Gly Cys Cys Cys Cys Gly Thr Cys Cys Ala Gly Cys

35 40 45

Thr Cys Cys Cys Cys Gly Thr Cys Cys Thr Gly

50 55

<210> 222

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2379

<400> 222

ctgagactgc tgctgttcaa gctgctcctg ttcgacctgc tcctcaagtg gatcttctcc 60

tcggtg 66

<210> 223

<211> 64

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2380

<400> 223

gcttgaacag cagcagtctc agcacgccca gccacagggc attcttggag tcaggggggt 60

cctc 64

<210> 224

<211> 69

<212> PRT

<213> 人工序列

<220>

<223> 引物GlnPr2381

<400> 224

Cys Ala Gly Gly Ala Cys Cys Gly Gly Thr Gly Cys Thr Thr Gly Cys

1 5 10 15

Ala Gly Ala Ala Gly Cys Ala Cys Thr Thr Gly Ala Gly Gly Ala Gly

20 25 30

Cys Ala Gly Gly Thr Cys Gly Ala Ala Cys Ala Gly Gly Ala Gly Cys

35 40 45

Ala Gly Cys Thr Thr Gly Ala Ala Cys Ala Gly Cys Ala Gly Cys Ala

50 55 60

Gly Thr Cys Thr Cys

65

<210> 225

<211> 64

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2382

<400> 225

gcttgaacag cagcagtacc agcacgccca gccacagggc attcttggag tcaggggggt 60

cctc 64

<210> 226

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2383

<400> 226

caggaccggt gcttgcagaa gcacttgagg agcaggtcga acaggagcag cttgaacagc 60

agcagtacc 69

<210> 227

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2384

<400> 227

gaccggtgct tgcagaagca cttgaggagc aggtcgaaca ggagcagcac gaacagcagc 60

agtctc 66

<210> 228

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2385

<400> 228

gaccggtgct tgcagaagca cttgaggagc aggacgaaca ggagcagctt gaacagcagc 60

agtctc 66

<210> 229

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2386

<400> 229

caggaccggt gcttgcagaa gcacttgagg agcaggtcga acaggagcag cacgaacagc 60

agcagtacc 69

<210> 230

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2387

<400> 230

caggaccggt gcttgcagaa gcacttgagg agcaggacga acaggagcag cttgaacagc 60

agcagtacc 69

<210> 231

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2388

<400> 231

gaccggtgct tgcagaagca cttgaggagc aggacgaaca ggagcagcac gaacagcagc 60

agtctc 66

<210> 232

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2389

<400> 232

caggaccggt gcttgcagaa gcacttgagg agcaggacga acaggagcag cacgaacagc 60

agcagtacc 69

<210> 233

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2390

<400> 233

ggtcgtgatc gtcgtgatta tcaagtggat cttctcctcg gtggtgg 47

<210> 234

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2391

<400> 234

ccaccaccga ggagaagatc cacttgataa tcacgacgat cacgacc 47

<210> 235

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2392

<400> 235

cttcggcgcc accgtggtcg tgatcgtcgt gattatcaag tg 42

<210> 236

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2393

<400> 236

caggaccggt gcttgcagaa gcacttgata atcacgacga tc 42

<210> 237

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2394

<400> 237

cttcggcgcc accgtgatcg tcgtgattat caagtgcttc 40

<210> 238

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2395

<400> 238

caggaccggt gcttgcagaa gcacttgata atcacgac 38

<210> 239

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2396

<400> 239

cttcggcgcc gtggtcattg taaccgtggt cgtgatcgtc gtg 43

<210> 240

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2397

<400> 240

caggaccggt gcttgcagaa gcacttgata atcacgacga tcacgaccac 50

<210> 241

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2398

<400> 241

cttcggcgcc gtggtcattg tagtcgtaac cgtggtcgtg atcgtcgtg 49

<210> 242

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2399

<400> 242

caggaccggt gcttgcagaa gcacttgata atcacgacga tcacgaccac gg 52

<210> 243

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2400

<400> 243

gagccaccag tgccagcaga gccagcacag gtcccaggat cagagccaga ttcttggagt 60

caggggggtc 70

<210> 244

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> > Seq Id No. 244 引物GlnPr2401

<400> 244

caggaccggt gcttgcagaa gcacttccac agtcccagca ctcccagagc caccagtgcc 60

agcag 65

<210> 245

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2402

<400> 245

cgatgcccag cagcaggagc aacaccagga tcacgatgat ggcggcgata ttcttggagt 60

caggggggtc 70

<210> 246

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2403

<400> 246

caggaccggt gcttgcagaa gcacttccag aaccaccaca tcaggccgat gcccagcagc 60

aggag 65

<210> 247

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2404

<400> 247

gataaacagc agcaggccag ccactccgcc cagcacaatc agggccatat tcttggagtc 60

aggggggtc 69

<210> 248

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2405

<400> 248

caggaccggt gcttgcagaa gcacttgaag aagatgccca ggccgataaa cagcagcagg 60

cc 62

<210> 249

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2406

<400> 249

gtccaatcag cacgatgcca gccaccacgc cggccacgat agggatgata ttcttggagt 60

caggggggtc 70

<210> 250

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2407

<400> 250

caggaccggt gcttgcagaa gcacttccag atcagcagca gggccagtcc aatcagcacg 60

atgcc 65

<210> 251

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2408

<400> 251

ccaggaagat gatcacgaac agcaggatgc cagcgatcac gccagcgata ttcttggagt 60

caggggggtc 70

<210> 252

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2409

<400> 252

caggaccggt gcttgcagaa gcacttcatc acgagcacca cgcccaggaa gatgatcacg 60

aa 62

<210> 253

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2410

<400> 253

gcaggatggc gaacaggatg ccgaagatga tggggatcac gaccagagca ttcttggagt 60

caggggggtc 70

<210> 254

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2411

<400> 254

caggaccggt gcttgcagaa gcacttgatg aacaccagca ccagcaggat ggcgaacagg 60

atg 63

<210> 255

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2412

<400> 255

cttcggcgcc gtgattaccg tggtcgtgat cgtcgtgatt atcaggtccc agcaggaggc 60

cgccg 65

<210> 256

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2413

<400> 256

gtcatttcga atcatcagaa gaacttcttg gcggcggcct cctgctggga c 51

<210> 257

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2414

<400> 257

gtcatttcga atcatcacca ccacttcttg gcggcggcct cctgctggga c 51

<210> 258

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2415

<400> 258

ggtcatttcg aatcatcagg agcccttcag ggtcaggaac atgataatca cgacgatcac 60

gac 63

<210> 259

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1285

<400> 259

cggaagaatt cagccacagc tttaaggcac ctggctaac 39

<210> 260

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr1494

<400> 260

acgaactagt ccaccatgga aagcccagcc cagctgctgt tcctgctgct gctgtggctg 60

cccgac 66

<210> 261

<211> 72

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2294

<400> 261

ctaccaagct ttcatcattt acccggagac agggagaggc tcttctgcgt gtagtggttg 60

tgcaaggcct cg 72

<210> 262

<211> 432

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq80

<400> 262

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatc tgtggacgac catcaccatc ttcatcacac 360

tcttcctgtt aagcgtgtgc tacagtgcca ccgtcacctt cttcaaggtg aagtgcttct 420

gcaagcaccg gt 432

<210> 263

<211> 500

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq81

<400> 263

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatc tgtggacgac catcaccatc ttcatcacac 360

tcttcctgtt aagcgtgtgc tacagtgcca ccgtcacctt cttcaaggtg aagtggatct 420

tctcctcggt ggtggacctg aagcagacca tcatccccga ctacaggaac atgatcggac 480

agggggccta gtgattcgaa 500

<210> 264

<211> 545

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq82

<400> 264

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcagagctg caaccggtgg 300

agagctgtgc ggaggcgcag gacggggagc tggacgggct gtggacgacc atcaccatct 360

tcatcacact cttcctgtta agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga 420

agtgcttctg caagcaccgg tcctgcttcc ggcggaacga ggcctccaga gagacaaaca 480

actccctgac cttcggcccc gaggaagccc tggctgagca gaccgtgttt ctgtagtgat 540

tcgaa 545

<210> 265

<211> 423

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq83

<400> 265

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatc tgatcattgc cctgcctgtg gccgtgctgc 360

tgatcgtggg aggcctcgtg atcatgctgt acgtgttcca caagtgcttc tgcaagcacc 420

ggt 423

<210> 266

<211> 423

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq84

<400> 266

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatg gaatcgtggc tggactggct gtgctggccg 360

tggtcgtgat tggagctgtg gtggccgccg tgatgtgcag aaagtgcttc tgcaagcacc 420

ggt 423

<210> 267

<211> 423

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq85

<400> 267

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatg gcctgctgat cggcatctcc atcgcctccc 360

tgtgcctggt ggtggccctg ctggccctgc tgtgccacct gaagtgcttc tgcaagcacc 420

ggt 423

<210> 268

<211> 423

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq86

<400> 268

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatc tgctgctggg cgtgtccgtg tcctgcatcg 360

tgatcctggc cgtgtgcctg ctgtgctacg tgtccatcac caagtgcttc tgcaagcacc 420

ggt 423

<210> 269

<211> 420

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq87

<400> 269

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaata ccaacaccgt gggctccgtg atcggcgtga 360

tcgtgaccat cttcgtgtcc ggcaccgtgt acttcatcaa gtgcttctgc aagcaccggt 420

<210> 270

<211> 402

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq88

<400> 270

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatg tgctggccct gatcgtgatc ttcctgacca 360

tcgccgtgct gctggccctg aagtgcttct gcaagcaccg gt 402

<210> 271

<211> 408

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq89

<400> 271

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatt tcttcatccc cctgctggtg gtgatcctgt 360

tcgccgtgga caccggcctg ttcatcaagt gcttctgcaa gcaccggt 408

<210> 272

<211> 408

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq90

<400> 272

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaata tcctgatcgg cacctccgtg gtgatcatcc 360

tgttcatcct gctgttcttc ctgctgaagt gcttctgcaa gcaccggt 408

<210> 273

<211> 429

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq91

<400> 273

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatg tgatgtccgt ggccaccatc gtgatcgtgg 360

acatctgcat caccggcggc ctgctgctgc tggtgtacta ctggtccaag tgcttctgca 420

agcaccggt 429

<210> 274

<211> 429

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq92

<400> 274

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatg ccatccccat ctggtgggtg ctggtgggcg 360

tgctgggcgg cctgctgctg ctgaccatcc tggtgctggc catgtggaag tgcttctgca 420

agcaccggt 429

<210> 275

<211> 432

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq93

<400> 275

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaatt tctgggtgct ggtggtggtg ggcggcgtgc 360

tggcctgcta ctccctgctg gtgaccgtgg ccttcatcat cttctgggtg aagtgcttct 420

gcaagcaccg gt 432

<210> 276

<211> 420

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq94

<400> 276

atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60

caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120

ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180

gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240

ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300

cccccgagga cccccctgac tccaagaata tcaccctgat catcttcggc gtgatggccg 360

gcgtgatcgg caccatcctg ctgatctcct acggcatcaa gtgcttctgc aagcaccggt 420

<210> 277

<211> 186

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq95

<400> 277

ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca tgttcctgac cctgaagggc 60

tccctgaagc agaggctgca ggtgatgatc cagccctccg aggacatcgt gaggcccgag 120

aacggccccg agcagcccca ggccggctcc tccgcctcca aggaggccta catctgatga 180

ttcgaa 186

<210> 278

<211> 186

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq96

<400> 278

ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcttcgtggg caacaggttc 60

cagcagaagc tgaggtccgt gttcagggtg cccatcacct ggctgcaggg caagagggag 120

accatgtcct gcaggaagtc ctcctccctg agggagatgg acaccttcgt gtcctgatga 180

ttcgaa 186

<210> 279

<211> 165

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq97

<400> 279

ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcttcgtggg caacaggttc 60

cagcagaagc tgaggtccgt gttcagggtg cccatcacct ggctgcaggg caagagggag 120

accatgtcct gcaggaagtc ctcctccctg aggtgatgat tcgaa 165

<210> 280

<211> 300

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq98

<400> 280

ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca actcccacct gctgcccagg 60

cccctgaggc acctggcctg ctgcggcggc ccccagccca ggatgaggag gaggctgtcc 120

gacggctccc tgtcctccag gcacaccacc ctgctgacca ggtcctcctg ccccgccacc 180

ctgtccctgt ccctgtccct gaccctgtcc ggcaggccca ggcccgagga gtcccccagg 240

gacctggagc tggccgacgg cgagggcacc gccgagacca tcatcttctg atgattcgaa 300

<210> 281

<211> 123

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq99

<400> 281

ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca actcccacga ggagtccccc 60

agggacctgg agctggccga cggcgagggc accgccgaga ccatcatctt ctgatgattc 120

gaa 123

<210> 282

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq100

<400> 282

ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcatcaagct gaagcacacc 60

aagaagaggc agatctacac cgacatcgag atgaacaggc tgggcaagtg atgattcgaa 120

<210> 283

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> GeneArt_Seq101

<400> 283

ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcatcaagct gaagcacacc 60

aagaagaggc agatcgccgc cgccgccgcc gccaacaggc tgggcaagtg atgattcgaa 120

<210> 284

<211> 1064

<212> DNA

<213> 人工序列

<220>

<223> GSC11206

<400> 284

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600

aggcgcagga cggggagctg gacggggccc tgtggctggg cgtgctgaga ctgctgctgt 660

tcaagctgct cctgttcgac ctgctcctca agtggatctt ctcctcggtg gtggacctga 720

agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag tgattcgaaa 780

tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 840

atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 900

gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 960

acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 1020

gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1064

<210> 285

<211> 70

<212> PRT

<213> 人工序列

<220>

<223> GSC11206

<400> 285

Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala

1 5 10 15

Gln Asp Gly Glu Leu Asp Gly Ala Leu Trp Leu Gly Val Leu Arg Leu

20 25 30

Leu Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Trp Ile Phe

35 40 45

Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro Asp Tyr Arg Asn

50 55 60

Met Ile Gly Gln Gly Ala

65 70

<210> 286

<211> 470

<212> PRT

<213> 人工序列

<220>

<223> GSC314

<400> 286

Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro

1 5 10 15

Asp Thr Gln Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val

20 25 30

Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn

35 40 45

Ile Lys Asp Thr Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Val Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr

65 70 75 80

Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys

85 90 95

Asn Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala

100 105 110

Val Tyr Tyr Cys Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp

115 120 125

Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys

130 135 140

Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly

145 150 155 160

Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro

165 170 175

Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr

180 185 190

Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val

195 200 205

Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn

210 215 220

Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro

225 230 235 240

Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu

245 250 255

Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp

260 265 270

Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp

275 280 285

Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly

290 295 300

Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn

305 310 315 320

Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp

325 330 335

Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro

340 345 350

Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu

355 360 365

Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn

370 375 380

Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile

385 390 395 400

Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr

405 410 415

Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys

420 425 430

Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys

435 440 445

Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu

450 455 460

Ser Leu Ser Pro Gly Lys

465 470

<210> 287

<211> 375

<212> DNA

<213> 人工序列

<220>

<223> GSC3836

<400> 287

ctgtctccgg gtaaatgatg aaagcttgcg gccgcgctta gcgatatcga attctctaga 60

ggtacccccg gggggcccct cgagttcgaa atgaccgacc aagcgacgcc caacctgcca 120

tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc 180

cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac 240

cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 300

acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 360

tcttatcatg tctgt 375

<210> 288

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> GSC3836 / GSC3848

<400> 288

Leu Ser Pro Gly Lys

1 5

<210> 289

<211> 884

<212> DNA

<213> 人工序列

<220>

<223> GSC3848

<400> 289

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag atattcgaaa 600

tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 660

atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 720

gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 780

acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 840

gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 884

<210> 290

<211> 76

<212> PRT

<213> 人工序列

<220>

<223> GSC3899 / GSC4398 / GSC4401 / GSC4402

<400> 290

Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala

1 5 10 15

Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile

20 25 30

Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe

35 40 45

Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile

50 55 60

Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala

65 70 75

<210> 291

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> GSC5854 / GSC5855 / GSC5857 / GSC5856

<400> 291

Leu Ser Leu Ser Pro Ala Glu Leu Gln Pro Val Glu Ala Leu Trp Leu

1 5 10 15

Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu

20 25 30

Leu Ala Ser Ala His His His His His His

35 40

<210> 292

<211> 74

<212> PRT

<213> 人工序列

<220>

<223> GSC6030 / GSC6048 / GSC6047 / GSC6046

<400> 292

Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala

1 5 10 15

Gln Asp Gly Glu Leu Asp Ala Leu Trp Leu Gly Val Leu Arg Leu Leu

20 25 30

Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu Leu Thr Phe Phe Lys Val

35 40 45

Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro

50 55 60

Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala

65 70

<210> 293

<211> 78

<212> PRT

<213> 人工序列

<220>

<223> GSC7057 / GSC7058 / GSC7056 / GSC7059 / GSC9763 / GSC9764 /

GSC9765 / GSC9768 / GSC9770 / GSC9949 / GSC9950

<400> 293

Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser

1 5 10 15

Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Ile Thr

20 25 30

Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser

35 40 45

Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr

50 55 60

Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75

<210> 294

<211> 708

<212> DNA

<213> 人工序列

<220>

<223> GSC315

<400> 294

atggagagcc ctgcccagct gctgttcctg ctgctgctgt ggctgcctga cggagtccat 60

gccgacatcc agatgaccca gtccccctcc agcctgtctg cctccgtggg cgaccgggtg 120

accatcacct gccgggcctc ccaggacgtg aacaccgccg tggcctggta tcagcagaag 180

cctggcaagg cccctaagct gctgatctac tccgcctcct tcctgtactc cggcgtgcct 240

tcccggttct ccggctcccg gtccggcacc gacttcaccc tgaccatctc ctccctgcag 300

cctgaggact tcgccaccta ctactgccag cagcactaca ccacccctcc taccttcggc 360

cagggcacca aggtggagat caagcggacc gtggccgctc cttccgtgtt catcttccct 420

ccctccgacg agcagctgaa gagcggcacc gccagcgtgg tgtgcctgct gaacaacttt 480

taccctcggg aggccaaggt gcagtggaag gtggacaacg ccctgcagtc cggcaactcc 540

caggaatccg tcaccgagca ggactccaag gacagcacct actccctgtc ctccaccctg 600

accctgtcca aggccgacta cgagaagcac aaggtgtacg cctgcgaggt gacccaccag 660

ggcctgtcca gccctgtgac caagtccttc aaccggggcg agtgctga 708

<210> 295

<211> 235

<212> PRT

<213> 人工序列

<220>

<223> GSC315

<400> 295

Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro

1 5 10 15

Asp Gly Val His Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu

20 25 30

Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln

35 40 45

Asp Val Asn Thr Ala Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala

50 55 60

Pro Lys Leu Leu Ile Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro

65 70 75 80

Ser Arg Phe Ser Gly Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile

85 90 95

Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His

100 105 110

Tyr Thr Thr Pro Pro Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys

115 120 125

Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu

130 135 140

Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe

145 150 155 160

Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln

165 170 175

Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser

180 185 190

Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu

195 200 205

Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser

210 215 220

Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys

225 230 235

<210> 296

<211> 1428

<212> DNA

<213> 人工序列

<220>

<223> GSC5607

<400> 296

atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60

caggtgcagc tgcagcagtc tggcgccgaa ctggccagac caggcgccag cgtgaagatg 120

agctgcaagg ccagcggcta caccttcacc cggtacacca tgcactgggt gaaacagcgg 180

cctggacagg gcctggaatg gatcggctac atcaacccca gccggggcta caccaactac 240

aaccagaagt tcaaggacaa ggccaccctg accaccgaca agagcagcag caccgcctac 300

atgcagctga gcagcctgac cagcgaggac agcgccgtgt actactgcgc ccggtactac 360

gacgaccact actgcctgga ctactggggc cagggcacca ccctgaccgt gagcagcgcg 420

tcgaccaagg gccccagcgt gttcccgcta gcccccagca gcaagagcac cagcggcggc 480

acagccgccc tgggctgcct ggtgaaggac tacttccccg agcccgttac cgtgtcctgg 540

aactctggag ccctgacctc cggcgtgcac accttccccg ccgtgctcca gagcagcggc 600

ctgtacagcc tgagcagcgt ggtgacagtg cccagcagca gcctgggaac ccagacctac 660

atctgcaacg tgaaccacaa gcccagcaac accaaggtgg acaagaaggt ggagcccaag 720

agctgcgaca aaactcacac ctgcccaccc tgccctgccc ctgagctgct gggcggaccc 780

tccgtgttcc tgttcccccc caagcccaag gacaccctga tgatcagccg gacccccgag 840

gtgacctgcg tggtggtgga cgtgagccac gaggaccctg aggtgaagtt caattggtac 900

gtggacggcg tggaggtgca caacgccaag accaagcccc gggaggaaca gtacaacagc 960

acctaccggg tggtgtccgt gctgaccgtg ctgcaccagg actggctgaa cggcaaggaa 1020

tacaagtgca aggtctccaa caaggccctg cctgccccca tcgaaaagac catcagcaag 1080

gccaagggcc agccgcgcga accgcaggtg tacaccctgc cccccagccg ggaagagatg 1140

accaagaacc aggtgaaact ggtgtgcctg gtgacaggct tctaccccag cgatatcgcc 1200

gtggaatggg agagcagcgg ccagcctgag aacaactact acaccacccc ccccatgctg 1260

gacagcgacg gcagcttcag cctggtgtcc tggctgaacg tggacaagag ccggtggcag 1320

cagggcaaca tcttcagctg cagcgtgatg cacgaggccc tgcacaaccg gttcacccag 1380

aagtccctga gcctgagccc gggtaaacat caccatcacc atcactga 1428

<210> 297

<211> 475

<212> PRT

<213> 人工序列

<220>

<223> GSC5607

<400> 297

Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro

1 5 10 15

Gly Thr Asn Ala Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala

20 25 30

Arg Pro Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr

35 40 45

Phe Thr Arg Tyr Thr Met His Trp Val Lys Gln Arg Pro Gly Gln Gly

50 55 60

Leu Glu Trp Ile Gly Tyr Ile Asn Pro Ser Arg Gly Tyr Thr Asn Tyr

65 70 75 80

Asn Gln Lys Phe Lys Asp Lys Ala Thr Leu Thr Thr Asp Lys Ser Ser

85 90 95

Ser Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala

100 105 110

Val Tyr Tyr Cys Ala Arg Tyr Tyr Asp Asp His Tyr Cys Leu Asp Tyr

115 120 125

Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly

130 135 140

Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly

145 150 155 160

Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val

165 170 175

Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe

180 185 190

Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val

195 200 205

Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val

210 215 220

Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys

225 230 235 240

Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu

245 250 255

Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr

260 265 270

Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val

275 280 285

Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val

290 295 300

Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser

305 310 315 320

Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu

325 330 335

Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala

340 345 350

Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro

355 360 365

Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln

370 375 380

Val Lys Leu Val Cys Leu Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala

385 390 395 400

Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Tyr Thr Thr

405 410 415

Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Ser Leu Val Ser Trp Leu

420 425 430

Asn Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser Cys Ser

435 440 445

Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser Leu Ser

450 455 460

Leu Ser Pro Gly Lys His His His His His His

465 470 475

<210> 298

<211> 469

<212> PRT

<213> 人工序列

<220>

<223> GSC5644

<400> 298

Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro

1 5 10 15

Gly Thr Asn Ala Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala

20 25 30

Arg Pro Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr

35 40 45

Phe Thr Arg Tyr Thr Met His Trp Val Lys Gln Arg Pro Gly Gln Gly

50 55 60

Leu Glu Trp Ile Gly Tyr Ile Asn Pro Ser Arg Gly Tyr Thr Asn Tyr

65 70 75 80

Asn Gln Lys Phe Lys Asp Lys Ala Thr Leu Thr Thr Asp Lys Ser Ser

85 90 95

Ser Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala

100 105 110

Val Tyr Tyr Cys Ala Arg Tyr Tyr Asp Asp His Tyr Cys Leu Asp Tyr

115 120 125

Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly

130 135 140

Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly

145 150 155 160

Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val

165 170 175

Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe

180 185 190

Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val

195 200 205

Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val

210 215 220

Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys

225 230 235 240

Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu

245 250 255

Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr

260 265 270

Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val

275 280 285

Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val

290 295 300

Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser

305 310 315 320

Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu

325 330 335

Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala

340 345 350

Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro

355 360 365

Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln

370 375 380

Val Lys Leu Val Cys Leu Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala

385 390 395 400

Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Tyr Thr Thr

405 410 415

Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Ser Leu Val Ser Trp Leu

420 425 430

Asn Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser Cys Ser

435 440 445

Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser Leu Ser

450 455 460

Leu Ser Pro Gly Lys

465

<210> 299

<211> 76

<212> PRT

<213> 人工序列

<220>

<223> GSC5537

<400> 299

Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala

1 5 10 15

Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile

20 25 30

Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe

35 40 45

Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile

50 55 60

Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala

65 70 75

<210> 300

<211> 495

<212> PRT

<213> 人工序列

<220>

<223> GSC5608

<400> 300

Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro

1 5 10 15

Gly Thr Asn Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val

20 25 30

Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn

35 40 45

Ile Lys Asp Thr Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Val Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr

65 70 75 80

Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys

85 90 95

Asn Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala

100 105 110

Val Tyr Tyr Cys Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp

115 120 125

Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly Gly Gly Gly

130 135 140

Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Gln Met Thr

145 150 155 160

Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile

165 170 175

Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala Val Ala Trp Tyr Gln

180 185 190

Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ser Ala Ser Phe

195 200 205

Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Arg Ser Gly Thr

210 215 220

Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr

225 230 235 240

Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro Thr Phe Gly Gln Gly

245 250 255

Thr Lys Val Glu Ile Lys Arg Gly Gly Gly Gly Thr Asp Lys Thr His

260 265 270

Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val

275 280 285

Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr

290 295 300

Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu

305 310 315 320

Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys

325 330 335

Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser

340 345 350

Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys

355 360 365

Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile

370 375 380

Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Glu Val Ala Thr Phe Pro

385 390 395 400

Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Thr Leu Val Cys Leu

405 410 415

Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn

420 425 430

Gly Gln Pro Glu Asn Asn Tyr Lys Thr Asp Pro Pro Leu Leu Glu Ser

435 440 445

Asp Gly Ser Phe Ala Leu Ser Ser Arg Leu Arg Val Asp Lys Ser Arg

450 455 460

Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu

465 470 475 480

His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

485 490 495

<210> 301

<211> 76

<212> PRT

<213> 人工序列

<220>

<223> GSC5538

<400> 301

Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala

1 5 10 15

Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile

20 25 30

Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe

35 40 45

Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile

50 55 60

Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala

65 70 75

<210> 302

<211> 702

<212> DNA

<213> 人工序列

<220>

<223> GSC5540

<400> 302

atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60

cagattgtgc tgacccagag ccccgccatc atgtctgcca gccctggcga gaaagtgacc 120

atgacctgca gcgccagcag cagcgtgtcc tacatgaact ggtatcagca gaagtccggc 180

accagcccca agcggtggat ctacgacacc agcaagctgg cctccggcgt gcccgcccac 240

tttagaggca gcggcagcgg cacctcctac tccctgacca tcagcggcat ggaagccgag 300

gacgccgcca cctactactg ccagcagtgg tccagcaacc ccttcacctt cggctccggc 360

accaaactgg aaattaaccg tacggtggcc gctcccagcg tgttcatctt cccccccagc 420

gacgagcagc tgaagagcgg caccgcctcc gtggtgtgcc tgctgaacaa cttctacccc 480

cgggaggcca aggtgcagtg gaaggtggac aacgccctcc agagcggcaa cagccaggaa 540

agcgtcaccg agcaggacag caaggactcc acctacagcc tgagcagcac cctgaccctg 600

agcaaggccg actacgagaa gcacaaggtg tacgcctgcg aggtgaccca ccagggcctg 660

tccagccccg tgaccaagag cttcaaccgg ggcgagtgct ga 702

<210> 303

<211> 233

<212> PRT

<213> 人工序列

<220>

<223> GSC5540

<400> 303

Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro

1 5 10 15

Gly Thr Asn Ala Gln Ile Val Leu Thr Gln Ser Pro Ala Ile Met Ser

20 25 30

Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser

35 40 45

Val Ser Tyr Met Asn Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys

50 55 60

Arg Trp Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ala His

65 70 75 80

Phe Arg Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Ser Gly

85 90 95

Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Ser

100 105 110

Asn Pro Phe Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Asn Arg Thr

115 120 125

Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu

130 135 140

Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro

145 150 155 160

Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly

165 170 175

Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr

180 185 190

Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His

195 200 205

Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val

210 215 220

Thr Lys Ser Phe Asn Arg Gly Glu Cys

225 230

<210> 304

<211> 1522

<212> DNA

<213> 人工序列

<220>

<223> GSC281

<400> 304

gaattgtacc tgcccgtaca taaggtcaat aggggtgaat caacggaaaa gtcccattgg 60

agccaagtac actgcgtcaa tagggacttt ccattgggtt ttgcccagta cataaggtca 120

ataggggatg agtcaatggg aaaaacccat tggagccaag tacactgact caatagggac 180

tttccattgg gttttgccca gtacataagg tcaatagggg gtgagtcaac aggaaagttc 240

cattggagcc aagtacattg agtcaatagg gactttccaa tgggttttgc ccagtacata 300

aggtcaatgg gaggtaagcc aatgggtttt tcccattact ggcacgtata ctgagtcatt 360

agggactttc caatgggttt tgcccagtac ataaggtcaa taggggtgaa tcaacaggaa 420

agtcccattg gagccaagta cactgagtca atagggactt tccattgggt tttgcccagt 480

acaaaaggtc aatagggggt gagtcaatgg gtttttccca ttattggcac gtacataagg 540

tcaatagggg tgagtcattg ggtttttcca gccaatttaa ttaaaacgcc atgtactttc 600

ccaccattga cgtcaatggg ctattgaaac taatgcaacg tgacctttaa acggtacttt 660

cccatagctg attaatggga aagtaccgtt ctcgagccaa tacacgtcaa tgggaagtga 720

aagggcagcc aaaacgtaac accgccccgg ttttccctgg aaattccata ttggcacgca 780

ttctattggc tgagctgcgt tcacgtgggt ataagcagag ctcgtttagt gaaccgtcag 840

atcgcctgga gacgccatcc acgctgtttt gacctccata gaagacaccg ggaccgatcc 900

agcctccgcg gccgggaacg gtgcattgga acgcggattc cccgtgccaa gagtgacgta 960

agtaccgcct atagagtcta taggcccacc cccttggctt cttatgcgac ggatcccgta 1020

ctatgaggtg tggcaggctt gagatctggc catacacttg agtgacaatg acatccactt 1080

tgcctttctc tccacaggtg tccactccca cgtccaactg cagctcggtt cgatcgataa 1140

ttaattaagc tagcggcgcc gttaacaccg gttgatcaaa gcttgcggcc gcgcttagcg 1200

atatcgaatt ctctagaggt acccccgggg ggcccctcga gttcgaaatg accgaccaag 1260

cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 1320

gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 1380

tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 1440

atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 1500

ccaaactcat caatgtatct ta 1522

<210> 305

<211> 132

<212> DNA

<213> 人工序列

<220>

<223> GSC3469

<400> 305

aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60

aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120

tatcatgtct gt 132

<210> 306

<211> 470

<212> DNA

<213> 人工序列

<220>

<223> GSC23

<400> 306

cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 60

cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 120

gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa 180

tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 240

ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac 300

ctctagctag agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 360

gctcacaatt ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc 420

cagagtaacc ttttttttta atttttattt tattttattt ttgagatcag 470

<210> 307

<211> 528

<212> DNA

<213> 人工序列

<220>

<223> GSC4340

<400> 307

ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60

ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120

acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180

cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240

aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300

cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360

acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420

cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480

tgccccacag ctttaaggca cctggctaac cgagacctga ggggacag 528

<210> 308

<211> 528

<212> DNA

<213> 人工序列

<220>

<223> GSC4222

<400> 308

ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60

ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120

acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180

cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240

aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300

cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360

acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420

cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480

tgccccacag ctttaaggca cctggctaac cctgtcctta ttgcacag 528

<210> 309

<211> 528

<212> DNA

<213> 人工序列

<220>

<223> GSC2617

<400> 309

ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60

ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120

acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180

cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240

aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300

cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360

acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420

cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480

tgccccacag ctttaaggca cctggctaac cctgggagga ttgcacag 528

<210> 310

<211> 528

<212> DNA

<213> 人工序列

<220>

<223> GSC4335

<400> 310

ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60

ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120

acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180

cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240

aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300

cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360

acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420

cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480

tgccccacag ctttaaggca cctggctaac cgtctccttc tgggacag 528

<210> 311

<211> 546

<212> DNA

<213> 人工序列

<220>

<223> GSC2332

<400> 311

ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60

ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120

acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180

cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240

aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300

cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360

acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420

cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480

tgccccacag ctttaaggca cctggctaac ctctgcgctt cttcccttcc ctgctacctg 540

gctcag 546

<210> 312

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2160

<400> 312

ccaagctttc atcatttgcc cggagacagg gagagg 36

<210> 313

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2161

<400> 313

ccaagctttc atcatttacc gggagacagg gagaggctct tc 42

<210> 314

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2162

<400> 314

gtcctcgggg ggagatccac caccacctgt cccagaagga gacggttag 49

<210> 315

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2163

<400> 315

gtcctcgggg ggagatccac caccacctgt gcaatcctcc cagggttag 49

<210> 316

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2164

<400> 316

gtcctcgggg ggagatccac caccacctgt gcaataagga cagggttag 49

<210> 317

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2165

<400> 317

gtcctcgggg ggagatccac caccacctgt cccctcaggt ctcggttag 49

<210> 318

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 引物GlnPr2166

<400> 318

gtcctcgggg ggagatccac caccacctga gccaggtagc agggaaggg 49

<210> 319

<211> 705

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC3704

<400> 319

atggaaagcc cagcccagct gctgttcctg ctgctgctgt ggctgcccga cggggtgcac 60

gctgagatcg tgctgacaca gagccccgcc accctgtctc tgagccctgg cgaaagagcc 120

accctgagct gtagagccag cagcagcgtg tcctacatgc actggtatca gcagaagccc 180

ggccaggcgc cgcgcccgtg gatttatgcg accagcaatc gggccacagg catccctgcc 240

agattttctg gcagcggctc cggcaccgac tacaccctga ccatctccag cctggaaccc 300

gaggacttcg ccgtgtacta ctgccagcag tggtccagca acccctggac atttggccag 360

ggcaccaaag tggaaattaa acgtacggtg gccgctccca gcgtgttcat cttccccccc 420

agcgacgagc agctgaagag cggcaccgcc tccgtggtgt gcctgctgaa caacttctac 480

ccccgggagg ccaaggtgca gtggaaggtg gacaacgccc tccagagcgg caacagccag 540

gaaagcgtca ccgagcagga cagcaaggac tccacctaca gcctgagcag caccctgacc 600

ctgagcaagg ccgactacga gaagcacaag gtgtacgcct gcgaggtgac ccaccagggc 660

ctgtccagcc ccgtgaccaa gagcttcaac cggggcgagt gctga 705

<210> 320

<211> 234

<212> PRT

<213> 人工序列

<220>

<223> 构建体GSC3704

<400> 320

Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro

1 5 10 15

Asp Gly Val His Ala Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu

20 25 30

Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Ser

35 40 45

Ser Val Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro

50 55 60

Arg Pro Trp Ile Tyr Ala Thr Ser Asn Arg Ala Thr Gly Ile Pro Ala

65 70 75 80

Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Thr Leu Thr Ile Ser

85 90 95

Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Trp Ser

100 105 110

Ser Asn Pro Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg

115 120 125

Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln

130 135 140

Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr

145 150 155 160

Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser

165 170 175

Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr

180 185 190

Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys

195 200 205

His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro

210 215 220

Val Thr Lys Ser Phe Asn Arg Gly Glu Cys

225 230

<210> 321

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC10488

<400> 321

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 322

<211> 80

<212> PRT

<213> 人工序列

<220>

<223> 构建体GSC10488

<400> 322

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His

35 40 45

Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser

50 55 60

Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75 80

<210> 323

<211> 1094

<212> DNA

<213> 人工序列

<220>

<223> 构建体GSC10487

<400> 323

ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300

tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360

ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420

ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480

gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540

tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600

cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660

tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720

acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780

agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960

ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020

caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080

cttatcatgt ctgt 1094

<210> 324

<211> 80

<212> PRT

<213> 人工序列

<220>

<223> 构建体GSC10487

<400> 324

Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro

1 5 10 15

Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val

20 25 30

Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His

35 40 45

Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser

50 55 60

Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu

65 70 75 80

<210> 325

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> GlnPr1487

<400> 325

ctgctgctgt ggctgcccga cggggtgcac gctgagatcg tgctgacaca gag 53

<210> 326

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> GlnPr1491

<400> 326

ccaaatcgat ttatcagcac tcgccccggt tgaag 35

<210> 327

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> GlnPr1452

<400> 327

acgtatcgat tcatcacttg ccgggggaca g 31

<210> 328

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> GlnPr1488

<400> 328

ctgctgctgt ggctgcccga cggggtgcac gctcaggtca cactgaaaga gtc 53

<210> 329

<211> 1470

<212> DNA

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-6His

<400> 329

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300

gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360

aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420

ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480

taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540

ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600

agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660

ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720

ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780

acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840

cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900

ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960

ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020

ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080

tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtgat cgtcgtgatt 1140

atcgccagcg cccatcacca ccaccatcat tgatgatgat tcgaaatgac cgaccaagcg 1200

acgcccaacc tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc 1260

ttcggaatcg ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg 1320

gagttcttcg cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat 1380

agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc 1440

aaactcatca atgtatctta tcatgtctgt 1470

<210> 330

<211> 46

<212> PRT

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-6His

<400> 330

Leu Ser Leu Ser Arg Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp

1 5 10 15

Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val

20 25 30

Ile Val Val Ile Ile Ala Ser Ala His His His His His His

35 40 45

<210> 331

<211> 1135

<212> DNA

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-6His

<400> 331

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420

tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480

cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540

gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600

gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660

ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720

atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780

cggcgccacc gtgatcgtcg tgattatcgc cagcgcccat caccaccacc atcattgatg 840

atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac 900

cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat 960

cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc 1020

ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 1080

actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgt 1135

<210> 332

<211> 45

<212> PRT

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-6His

<400> 332

Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser

1 5 10 15

Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile

20 25 30

Val Val Ile Ile Ala Ser Ala His His His His His His

35 40 45

<210> 333

<211> 1123

<212> DNA

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-KCFCK

<400> 333

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420

tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480

cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540

gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600

gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660

ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720

atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780

cggcgccacc gtgatcgtcg tgattatcaa gtgcttctgc aagtgatgat gattcgaaat 840

gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg ccgccttcta 900

tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc tccagcgcgg 960

ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt ataatggtta 1020

caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag 1080

ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgt 1123

<210> 334

<211> 41

<212> PRT

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-KCFCK

<400> 334

Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser

1 5 10 15

Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile

20 25 30

Val Val Ile Ile Lys Cys Phe Cys Lys

35 40

<210> 335

<211> 1141

<212> DNA

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-6His

<400> 335

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420

tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480

cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540

gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600

gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660

ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720

atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780

cggcgccacc gtggtcgtga tcgtcgtgat tatcgccagc gcccatcacc accaccatca 840

ttgatgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac gagatttcga 900

ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg 960

gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca acttgtttat 1020

tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 1080

tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg 1140

t 1141

<210> 336

<211> 47

<212> PRT

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-6His

<400> 336

Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser

1 5 10 15

Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val

20 25 30

Val Ile Val Val Ile Ile Ala Ser Ala His His His His His His

35 40 45

<210> 337

<211> 1129

<212> DNA

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-KCFCK

<400> 337

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300

ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360

catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420

tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480

cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540

gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600

gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660

ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720

atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780

cggcgccacc gtggtcgtga tcgtcgtgat tatcaagtgc ttctgcaagt gatgatgatt 840

cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 900

cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 960

gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa 1020

tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 1080

ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 1129

<210> 338

<211> 43

<212> PRT

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-KCFCK

<400> 338

Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser

1 5 10 15

Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val

20 25 30

Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys

35 40

<210> 339

<211> 1458

<212> DNA

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-KCFCK

<400> 339

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300

gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360

aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420

ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480

taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540

ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600

agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660

ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720

ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780

acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840

cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900

ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960

ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020

ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080

tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtgat cgtcgtgatt 1140

atcaagtgct tctgcaagtg atgatgattc gaaatgaccg accaagcgac gcccaacctg 1200

ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt 1260

ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc 1320

caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat 1380

ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat 1440

gtatcttatc atgtctgt 1458

<210> 340

<211> 41

<212> PRT

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-KCFCK

<400> 340

Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser

1 5 10 15

Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile

20 25 30

Val Val Ile Ile Lys Cys Phe Cys Lys

35 40

<210> 341

<211> 1476

<212> DNA

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-6His

<400> 341

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300

gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360

aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420

ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480

taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540

ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600

agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660

ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720

ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780

acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840

cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900

ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960

ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020

ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080

tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtggt cgtgatcgtc 1140

gtgattatcg ccagcgccca tcaccaccac catcattgat gatgattcga aatgaccgac 1200

caagcgacgc ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg 1260

ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc 1320

atgctggagt tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa 1380

agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 1440

ttgtccaaac tcatcaatgt atcttatcat gtctgt 1476

<210> 342

<211> 47

<212> PRT

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-6His

<400> 342

Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser

1 5 10 15

Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val

20 25 30

Val Ile Val Val Ile Ile Ala Ser Ala His His His His His His

35 40 45

<210> 343

<211> 1464

<212> DNA

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-KCFCK

<400> 343

ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60

ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120

cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180

cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240

caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300

gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360

aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420

ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480

taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540

ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600

agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660

ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720

ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780

acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840

cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900

ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960

ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020

ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080

tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtggt cgtgatcgtc 1140

gtgattatca agtgcttctg caagtgatga tgattcgaaa tgaccgacca agcgacgccc 1200

aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga 1260

atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc 1320

ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 1380

acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 1440

atcaatgtat cttatcatgt ctgt 1464

<210> 344

<211> 43

<212> PRT

<213> 人工序列

<220>

<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-KCFCK

<400> 344

Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser

1 5 10 15

Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val

20 25 30

Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys

35 40

<210> 345

<211> 9

<212> DNA

<213> 人工序列

<220>

<223> 剪接供体共有序列

<400> 345

maggtragt 9

<210> 346

<211> 12

<212> DNA

<213> 人工序列

<220>

<223> 剪接受体共有序列

<220>

<221> misc_特征

<222> (7)..(7)

<223> 含有至少15个核苷酸和丰富的嘧啶（C或T）碱基的聚（Y）道

<220>

<221> misc_特征

<222> (8)..(8)

<223> n is a, c, g, or t

<400> 346

ctrayynnca gg 12

<210> 347

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> 分支点共有序列

<400> 347

ctrayy 6

Claims

1.一种表达构建体，其在5'至3'方向上包含：

启动子；

编码目的多肽的第一外显子；

编码跨膜区的第二外显子，所述跨膜区选自经修饰的免疫球蛋白跨膜区或者修饰或未修饰的非免疫球蛋白跨膜区；

第二终止密码子；和

多聚(A)位点；

其中当进入宿主细胞时，第一外显子和第二外显子的转录导致目的多肽表达和一定比例的目的多肽在宿主细胞膜上表面呈现。

2.根据权利要求1所述的表达构建体，其中所述跨膜区包含17和29个之间的残基，优选19和26个之间的残基且最优选21和24个之间的残基。

3.根据权利要求1或2所述的表达构建体，其中所述非免疫球蛋白跨膜区选自由人血小板衍生的生长因子受体(PDGFR)、人脱唾液酸糖蛋白受体、人和鼠B7-1、人ICAM-1、人erbb1、人erbb2、人erbb3、人erbb4、人成纤维细胞生长因子受体如FGFR1、FGFR2、FGFR3、FGFR4、人VEGFR-1、人VEGFR-2、人促红细胞生成素受体、人PRL-R、催乳素受体、人EphAl、肝配蛋白A型受体1、人胰岛素、IGF-1受体、人受体样蛋白酪氨酸磷酸酶、人神经毡蛋白、人主要组织相容性复合体类II(α和β链)、人整合素(α和β家族)、人多配体聚糖、人髓鞘蛋白、人钙粘素、人小突触泡蛋白-2、人血型糖蛋白-A、人Bnip3、人APP、淀粉体蛋白前体蛋白、人T细胞受体α和β、CD3γ、CD3δ、CD3ζ和CD3ε的跨膜区组成的组。

4.根据权利要求1所述的表达构建体，其中所述非免疫球蛋白跨膜区是鼠B7-1跨膜区(SEQ ID NO:173)、ACLV1(SEQ ID NO:174)、ANTR2(SEQ ID NO:175)、CD4(SEQ ID NO:176)、PTPRM(SEQ ID NO:177)、TNR5(SEQ ID NO:178)、ITB1(SEQ ID NO:179)、IGF1R(SEQ ID NO:181)、1B07(SEQ ID NO:180)、TRMB(SEQ ID NO:182)、IL4RA(SEQ ID NO:183)、LRP6(SEQ IDNO:184)、GpA(SEQ ID NO:185)、PTCRA(SEQ ID NO:186)。

5.根据前述权利要求中的任一项所述的表达构建体，其中所述内含子包括多聚(A)位点。

6.根据前述权利要求中的任一项所述的表达构建体，其中所述内含子的剪接受体位点包含多聚(Y)道，并且其中通过改变其中的嘧啶碱基的数目来修饰多聚(Y)道的Y含量。

7.根据前述权利要求中的任一项所述的表达构建体，其包含至少一个分支点区域，其中所述至少一个分支点区域的序列对于分支点区域共有序列CTRAYY(SEQ ID NO：347)被修饰。

8.根据前述权利要求中的任一项所述的表达构建体，其中所述内含子的剪接供体位点的共有序列被修饰。

9.根据前述权利要求中的任一项所述的表达构建体，其中所述目的多肽包含抗体重链或其片段。

10.编码根据前述权利要求中的任一项所述的表达构建体的多核苷酸。

11.包含一个或多个根据权利要求10所述的多核苷酸的克隆或表达载体。

12.一种宿主细胞，其包含一个或多个根据权利要求11所述的克隆或表达载体。

13.根据权利要求12的宿主细胞，其包括：包含编码用于表达抗体重链的权利要求9的表达构建体的多核苷酸的表达载体，和包含编码用于表达抗体轻链的表达构建体的多核苷酸。

14.根据权利要求12所述的宿主细胞，其包括：包含编码用于表达抗体重链的权利要求9的表达构建体的多核苷酸的表达载体，包含编码用于表达scFv-Fc的权利要求8的表达构建体的多核苷酸的表达载体，和包含编码用于表达抗体轻链的表达构建体的多核苷酸的表达载体。

15.一种生产多肽的方法，其包括在培养物中培养权利要求12至14中的任一项所述的(多个)宿主细胞并从所述培养物分离所表达的多肽。

16.一种选择用于表达目的多肽的(多个)宿主细胞的方法，其包括

(i)用权利要求1的表达构建体转染(多个)宿主细胞；

(ii)在适于表达所述目的多肽的条件下培养所述(多个)宿主细胞；

(iii)检测所述目的多肽的细胞膜表达；以及

(iv)选择以期望的表达水平在细胞膜的表面上呈现呈现所述目的多肽的(多个)宿主细胞。

17.一种用于表达目的异源多聚多肽的(多个)宿主细胞的选择的方法，其包括

(i)至少用编码目的第一多肽的权利要求1的表达构建体和编码目的第二多肽的权利要求1的表达构建体共转染(多个)宿主细胞；

(ii)在适于表达所述目的异源多聚多肽的条件下培养所述(多个)宿主细胞；

(iii)检测所述目的异源多聚多肽的细胞膜表达；以及

(iv)选择以期望的表达水平在细胞膜的表面上呈现呈现期望的目的异源多聚多肽的(多个)宿主细胞。

18.一种用于表达双特异性抗体的(多个)宿主细胞的选择的方法，其包括

(i)至少用编码抗体重链的权利要求1的表达构建体和编码scFv-Fc的权利要求1的表达构建体以及编码抗体轻链的表达构建体共转染(多个)宿主细胞；

(ii)在适于表达双特异性抗体的条件下培养所述(多个)宿主细胞；

(iii)检测双特异性抗体的细胞膜表达；以及

(iv)选择以期望的表达水平在细胞膜的表面上呈现呈现期望的双特异性抗体的(多个)宿主细胞。