CN106255752A - 表达构建体和用于选择表达多肽的宿主细胞的方法 - Google Patents
表达构建体和用于选择表达多肽的宿主细胞的方法 Download PDFInfo
- Publication number
- CN106255752A CN106255752A CN201580023386.0A CN201580023386A CN106255752A CN 106255752 A CN106255752 A CN 106255752A CN 201580023386 A CN201580023386 A CN 201580023386A CN 106255752 A CN106255752 A CN 106255752A
- Authority
- CN
- China
- Prior art keywords
- seq
- cell
- expression
- construct
- antibody
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56966—Animal cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1037—Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6854—Immunoglobulins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/30—Immunoglobulins specific features characterized by aspects of specificity or valency
- C07K2317/31—Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/52—Constant or Fc region; Isotype
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/60—Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
- C07K2317/62—Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
- C07K2317/622—Single chain antibody (scFv)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Plant Pathology (AREA)
- Virology (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Tropical Medicine & Parasitology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及用于使用选择性剪接多肽在宿主细胞中的可溶性表达和多肽在宿主细胞的表面上表达的表达构建体。多肽例如抗体、抗体片段和双特异性抗体的细胞膜表达的量可以与所表达的可溶性多肽的量直接相关。在双特异性抗体的情况下,异源二聚体和同源二聚体产物的细胞膜表达可以与这些产物的可溶性表达直接相关,从而有助于期望的生产者克隆的选择。
Description
技术领域
本发明涉及表达构建体和用于使用选择性剪接在真核细胞的表面上表达目的分泌蛋白的一部分的方法。本发明还涉及通过检测目的蛋白质的膜表达水平选择以期望的水平表达目的分泌蛋白的(多个)细胞的方法。本发明还涉及通过检测目的异源多聚蛋白质的膜表达水平选择表达分泌的目的异源多聚蛋白质的(多个)细胞。
背景技术
为了在真核细胞中产生蛋白质,必须将编码这种蛋白质的DNA转录成信使RNA(mRNA),所述信使RNA将转而被翻译成蛋白质。mRNA首先在细胞核中作为含有内含子和外显子的前mRNA被转录。在前mRNA成熟为成熟的mRNA的过程中,内含子由称为剪接体的细胞机械切出(“剪接”)。外显子被融合在一起并且mRNA通过在其5'端加入所谓的CAP和在其3'端加入聚腺苷酸化(聚(A))尾而被修饰。成熟的mRNA被输出到细胞质并充当用于蛋白质的翻译的模板。
选择性剪接是描述相同的转录可能以不同的方式剪接从而导致不同的成熟mRNA并在某些情况下导致不同的蛋白质的术语。这种机制本质上用于改变蛋白质的表达水平或者为了在发育期间修饰特定蛋白质的活性(Cooper TA &Ordahl CP(1985),J Biol Chem,260(20):11140-8)。选择性剪接通常由多种因素的复杂的相互作用控制(Orengo JP etal.,(2006)Nucleic Acids Res,34(22):e148)。
选择性剪接能够从相同的DNA模板产生两种(或更多种)不同的RNA转录。这可以用于产生相同的蛋白质或多肽的两种(或更多种)同种型。在整个说明书中,术语蛋白质和多肽将互换使用。
在自然界中,这是在例如通过人免疫系统中的活化的B细胞产生抗体的过程中使用的高度控制的过程。大多数抗体被分泌到细胞外的空间,但所产生的抗体的一小部分以膜结合同种型的形式被从分泌途径重定向到外细胞膜。
膜结合同种型与分泌到细胞外空间的抗体具有相同的氨基酸序列和结构。所不同的是带有跨膜区的分泌抗体的重链的C-末端延伸包含跨膜结构域。在B细胞中,该结构域可以具有大约40至75个氨基酸(Major JG et al.,(1996)Mol.Immunol.33:179-87)。
用于生产重组多肽的表达系统是本领域中公知的。为了生产药物制剂中使用的多肽和蛋白质,通常使用哺乳动物宿主细胞如CHO、BHK、NS0、SP2/0、COS、HEK和PER.C6。为了大规模生产治疗性蛋白,需要产生高生产细胞系。用编码目的多肽的基因转染宿主细胞系之后,获得和选择了许多具有不同特性的克隆。这通过使用,例如,可选择标记、基因扩增和/或报道分子常规地进行。选择具有所需性质的合适的克隆例如高生产克隆是费时,往往非常规并因此昂贵的过程。
对于异源多聚蛋白质,如双特异性抗体的表达,合适的宿主细胞系的产生变得更加复杂。组成多聚体的该蛋白质亚基可在不同的细胞系中表达,然后汇集用于关联到多聚蛋白中或可选地不同的亚基可以在相同的细胞系中表达。在相同的细胞系中的亚基的表达具有缺点,其中不是所有的蛋白质亚基将关联到正确的形式,从而导致不同种类的混合物。为了产生双特异性抗体,很常见的是将生产显著水平的同源二聚体而不是所希望的异源二聚体,这大大影响双特异性抗体的生产产量。虽然可以通过各种纯化技术除去不希望的同源二聚体,理想的是具有其中异源二聚体以比同源二聚体高的水平表达的宿主细胞系,以减少浪费在下游处理中的时间和成本。
因此,需要一种这样的表达系统,其可用于选择以高水平表达目的产物的(多个)细胞克隆,即定量选择。还需要能够选择表达具有所需质量的目的产物的(多个)细胞克隆,即定性选择,例如目的异源多聚蛋白质的表达。
发明内容
本发明涉及用于通过可溶性目的多肽的选择性剪接的表达的表达构建体或构建体集,其中所述可溶性肽的一部分被分泌到细胞外空间并且一部分在(多个)细胞的外膜上呈现。
本发明还包括用于选择包含根据本发明的一个或多个构建体的宿主细胞的方法,所述宿主细胞在其外膜上以期望的水平呈现目的多肽。
本发明还涉及通过检测目的异源二聚体蛋白质在包括根据本发明的一个或多个构建体的(多个)细胞上的膜呈现来选择表达所分泌的异源二聚体蛋白质的(多个)细胞。
在第一方面,本发明提供了一种表达构建体,其在5'至3'方向上包含:
启动子;
编码目的多肽的第一外显子;
剪接供体位点,内含子和剪接受体位点,其中第一终止密码子位于剪接供体位点和所述内含子内的剪接受体位点之间;
编码跨膜区的第二外显子,所述跨膜区是经修饰的免疫球蛋白跨膜区或非免疫球蛋白跨膜区;
第二终止密码子;和
多聚腺苷酸化位点;
其中当进入宿主细胞时,第一外显子和第二外显子的转录导致目的多肽表达和一定比例的目的多肽在宿主细胞的外膜上呈现。
根据本发明的另一个方面,通过构建体的第二外显子编码的跨膜区包含至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个氨基酸残基。
根据本发明的另一个方面,通过构建体的第二外显子编码的跨膜区包含不超过48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26个氨基酸残基。
特别地,跨膜区可包含17和29个之间的残基、19和26个之间的残基或21和24个之间的残基。
根据本发明,修饰的免疫球蛋白跨膜区或修饰的非免疫球蛋白跨膜区可以是天然存在的免疫球蛋白或非免疫球蛋白跨膜区的任何修饰版本。
本发明人已修饰不同的跨膜区组,以便改变它们的性质,特别是调节它们整合到细胞膜中,从而呈现目的多肽。特别是可以改变跨膜区的氨基酸组成,以便通过一个或多个残基减少或增加其中的非疏水残基的数目,以及提高或降低跨膜区的大小。
本发明的发明人惊奇地发现,使用非免疫球蛋白跨膜区例如鼠B7-1跨膜区(SEQID NO:173)导致与使用IgG1跨膜区所观察到的水平相比高水平的细胞膜表达。
本发明人还测试了来自ACLV1(NP_001070869.1)SEQ ID NO:174、ANTR2(NP_477520.2)SEQ ID NO:175、CD4(NP_000607.1)SEQ ID NO:176、PTPRM(NP_002836.3)SEQ IDNO:177、TNR5(NP_001241.1)SEQ ID NO:178、ITB1(NP_596867.1)SEQ ID NO:179、IGF1R(NP_000866.1)SEQ ID NO:181、1B07(NP_005505.2)SEQ ID NO:180、TRMB(NP_000352.1)SEQ ID NO:182、IL4RA(NP_000409.1)SEQ ID NO:183、LRP6(NP_002327.2)SEQ ID NO:184、GpA(NP_002090)SEQ ID NO:185、PTCRA(NP_001230097.1)SEQ ID NO:186的其它跨膜区以及这些跨膜区的修饰版本,并且表明了这些适用于根据本发明的(多种)构建体。
根据本发明的另一个方面,第一终止密码子位于内含子的剪接供体位点的3'。
在一个实施方案中,本发明还提供了用于改变给定的构建体中观察到的剪接比的方法,从而足够量的多肽在细胞膜上呈现以实现细胞选择,尽管大部分的多肽可溶性地表达。
发明人已经测试了所要求保护的表达构建体的不同组分,使它们能够调节目的蛋白质的膜呈现。
根据本发明,可溶性多肽的表达水平可以通过在如本文所述的表达构建体的内含子中包括多聚(A)位点来增加。
根据本发明的一个方面,构建体可以包括位于启动子和第一外显子之间的组成型内含子(constitutive intron)。
根据本发明,可以修饰剪接受体和剪接供体的强度,以便增加或减少在细胞膜上呈现的目的蛋白质的量。
特别地,通过减少或增加存在于构建体中的剪接供体位点的序列与共有剪接供体位点序列(C/A)AGGT(A/G)AGT(SEQ ID NO:345)的%同一性或相似性可以修饰剪接供体位点的共有序列。
在进一步的实施方案中,修饰剪接供体位点的共有序列以便降低剪接供体强度。可通过替代密码子使用修饰剪接供体位点的共有序列,例如通过用编码赖氨酸的AAG取代编码赖氨酸的AAA。这将减少膜表达的水平。相反,通过增加剪接供体位点与共有剪接供体位点序列(C/A)AGGT(A/G)AGT(SEQ ID NO:345)的%同一性或相似性,这会增加构建体中的剪接供体位点的强度并增加膜表达的水平。
根据本发明的一个方面,剪接供体位点与第一外显子的3'末端和内含子的5'末端部分重叠并且内含子的剪接受体位点位于内含子的3'末端。
根据本发明的一个方面,第一终止密码子位于剪接供体位点的3'。
根据表达构建体的内含子任选地包括包含在剪接受体位点中的多聚(Y)道(poly(Y)tract)。可以修饰包括在表达构建体的内含子的剪接受体位点中的多聚(Y)道的Y含量。改变多聚(Y)道中的嘧啶碱基(Y)的数量可以用于减少或增加目的多肽的细胞膜表达。对于由细胞高水平地膜表达的目的多肽,降低多聚(Y)道中的Y的数量将降低膜表达的水平。对于由细胞低水平地膜表达的多肽,增加多聚(Y)道中的Ys的数量将增加膜表达的水平。
特别地,通过改变剪接受体位点的多聚(Y)含量,可以减少剪接受体的多聚(Y)含量,从而减小剪接受体位点的强度,因此降低目的多肽的膜呈现。
可选地,通过改变剪接受体位点的多聚(Y)含量,可以增加剪接受体的多聚(Y)含量,以便增加剪接受体位点的强度,因此增加目的多肽的膜呈现。
除了上面提到的修饰,导致膜呈现的多肽的选择性剪接事件也可以通过修饰分支点区域的序列的DNA(因此RNA)影响。分支点区域的核苷酸通过攻击内含子在5'剪接位点的的第一个核苷酸启动剪接事件,从而形成套索中间体。相对于共有序列(CTRAYY SEQ IDNO:347)改变分支点区域的序列可以对剪接事件的启动的效果产生影响从而对分泌的多肽相对于膜呈现的多肽的比率产生影响。
此外,内含子的长度可以影响剪接比。已证明,当外显子上游紧接的内含子缩短时,在CD44中包括选择性外显子的可能性增加(Bell,M.,Cowper,A.,Lefranc,M.,Bell,J.and Screaton,G.(1998).Influence of Intron长度on Alternative Splicing ofCD44Mol Cell Biol.18(10):5930–5941。)。因此,修饰构建体的进一步的方法是缩短选择性剪接构建体中的内含子的长度,以便增加膜呈现的多肽的份数,或反之亦然。
影响剪接事件的另外的机制是导致外显子纳入或跳过的RNA结合蛋白的共表达。例如蛋白质CUG-BP(Uniprot Acc.-否.:Q5F3T7)和肌盲样3(MBNL)(Uniprot Acc.-否.:Q5ZKW9)已经被证明影响表达EGFP和dsRED的构建体中的剪接比(Orengo等人,2006)。
因此,本发明还提供了进一步修饰的构建体,其包含编码引起外显子纳入或跳过的RNA结合蛋白的可表达ORF。以及涉及根据本发明的构建体的共转染的方法,其包含编码引起外显子纳入或跳过的RNA结合蛋白的可表达ORF和/或包含此类ORF的单独构建体。
此外,大多数膜蛋白在到达细胞表面之前穿过内质网(ER)和高尔基体。从ER输出是由从ER出口的部位萌芽的外被体复合体II(COPII)运输小泡介导的选择性过程。COPII运输小泡的组分与具有线性二羧酸,膜锚定蛋白的胞质结构域中的疏水和芳香族基序或结构基序的短氨基酸序列之间的相互作用在ER出口点集中货物蛋白并促进货物招募到COPII小泡中。这些短的直链或结构性的氨基酸序列基序被称为ER出口信号。
因此,调整目的蛋白质的膜呈现的另一种方法是包括或不包括ER出口信号,以便修饰与跨膜区融合的目的多肽的ER通道。包含在构建体中以便增加ER出口的ER出口信号的修饰可用于增加具有低半衰期或其它稳定性或降解问题的蛋白的膜呈现,反之亦然。
本发明的发明人已经发现,在细胞膜上呈现的目的多肽的量与可溶性多肽的表达水平成正比。因此,以高滴度表达目的多肽的宿主细胞比以低滴度表达多肽的宿主细胞在膜上呈现更多的多肽。
在本发明的一个方面,由表达构建编码的多肽可以是蛋白质多聚体例如异源多聚多肽的一部分,如重组抗体或其片段。该抗体片段可以选自以下组成的组:Fab、Fd、Fv、dAb、F(ab’)2和scFv。在一个优选的实施方案中,通过表达构建体表达的多肽可以是抗体重链或其片段。
在本发明的另一个方面中,表达构建体可用于双特异性抗体在宿主细胞中的表达。在一个实施方案中,所表达的多肽是抗体重链。可选地,所表达的多肽是连接于抗体Fc区的抗体片段。抗体片段可以选自以下组成的组:Fab,Fd、Fv、dAb、F(ab’)2和scFv。优选的抗体片段是Fab或scFv。更优选地,抗体片段是scFv。为了实现双特异性抗体的表达,还可以提供另外的表达构建体用于抗体轻链的表达。编码抗体重链的表达构建体和具有编码宿主细胞中的抗体轻链的表达构建体的抗体片段-Fc的共表达导致双特异性抗体的表达。如上所讨论的,宿主细胞中的双特异性抗体的表达导致除期望的异源二聚体之外的许多不需要的同源二聚体种类。在本发明的一个优选实施方案中,这些双特异性抗体组分的细胞膜呈现使得能够直接选择表达主要的异源二聚抗体的宿主细胞。
本发明还提供了用于改变剪接比的方法从而足够量的多肽在细胞膜上呈现以实现细胞选择,尽管大部分的多肽可溶性地表达。
根据本发明的该方面,该方法涉及测量目的多肽的膜呈现,然后基于目的多肽的观察到的膜呈现修饰构建体的组分,从而增加或减少膜呈现以便允许更好地选择表达目的多肽的(多个)细胞。
本发明还提供一种方法以选择包含根据本发明的至少一个构建体的(多个)细胞,涉及通过检测目的蛋白质或包括目的蛋白质的异源多聚蛋白的膜表达水平来选择(多个)细胞。
附图说明
图1:本发明的选择性剪接构建体的示意图。多肽的选择性剪接产生两种剪接产物。对于剪接产物1,编码最后两个氨基酸甘氨酸(G)和赖氨酸(K)的密码子被并入mRNA中并且多肽从细胞分泌。对于剪接产物2,所述多肽不包含两个氨基酸G和K,但通过跨膜区延伸,由任选的连接区、跨膜结构域和任选的小胞内域组成并且所得的多肽不被分泌,但呈现在细胞的外膜上。
图2:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用不同的跨膜区呈现和分泌IgG1抗体。在转染后的第2天进行分析。作为阴性对照,用编码分泌的IgG1抗体(Ctrl)的非剪接构建体转染CHO-S细胞。对用不同的选择性剪接构建体转染的细胞进行的染色被表示为填充直方图并且用编码分泌的IgG1抗体的非剪接构建体转染的对照细胞的染色被包括为覆盖黑线(A-D)。使用直方图以便确定染色的细胞(E)的百分比以及选择性剪接构建体和对照的染色(G)的平均荧光。用八位装置(Octetdevice)(H)在转染后第4天测定所分泌抗体的滴度。
图3:以用于呈现和分泌IgG4抗体的选择性剪接构建体转染的CHO-S细胞的染色概况。在转染后的第2天进行分析。作为阴性对照,用编码分泌的IgG4抗体(IgG4)的非剪接构建体转染CHO-S细胞。对用选择性剪接构建体转染的细胞进行的染色被表示为填充直方图并且用编码分泌的IgG4抗体的非剪接构建体转染的对照细胞的染色被包括为覆盖黑线(A)。使用直方图以便确定染色的细胞(B)的百分比以及选择性剪接构建体和对照的染色(D)的平均荧光。用八位装置(C)在转染后第4天测定所分泌抗体的滴度。
图4:使用选择性剪接技术在细胞膜上呈现双特异性抗体的特异性检测。在转染后的第2天染色细胞。使用PE缀合的山羊抗人Fcγ特异性抗体(A-C,J-L)检测Fc片段(scFv-Fc和HC)。使用鼠抗人κLC APC标记的抗体(D-F,M-O)检测κ轻链。使用FITC标记的蛋白A进行scFv-Fc的染色。为转染的细胞进行的染色被表示为填充的直方图。对于第一转染混合物(A,D,G),对非转染细胞获得的概况被表示为为覆盖(黑线)。对于所有其他实验(B,C,E,F和H-R)阴性对照(对无跨膜结构域的转染细胞获得的概况)呈现为覆盖(虚线)。
图5:瞬时转染后第6天分泌的和scFv-Fc同源二聚体分子的滴度。
图6:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于包括不同的跨膜区和表达构建体的不同修饰的IgG1抗体的呈现和分泌。在转染后的第二天进行分析。作为阴性对照,用编码分泌的IgG1抗体(对照)的非剪接构建体转染CHO-S细胞。
图7:用于在CHO-S细胞中转染的IgG1抗体的呈现和分泌的不同选择性剪接构建体的标准化的表达水平。使用八位QK设备和蛋白A生物探针分析上清液(标准HC:无选择性剪接的对照)。
图8:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用B7-1跨膜区和剪接受体的多聚(Y)道的不同Y含量呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阴性对照,用编码分泌的IgG4抗体(ctrl)的非剪接构建体转染CHO-S细胞。对用不同的选择性剪接构建体转染的细胞进行的染色被表示为为填充直方图并且用编码分泌的IgG1抗体的非剪接构建体转染的对照细胞的染色被包括为覆盖黑线(A-G)。使用直方图以便确定染色的细胞(H)的百分比以及选择性剪接构建体和对照的染色(J)的平均荧光。用八位装置(I)在转染后第4天测定所分泌抗体的滴度。
图9:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用B7-1跨膜区和剪接供体共有序列的修饰呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阴性对照,用编码分泌的IgG1(ctrl)的非剪接构建体转染CHO-S细胞。对用不同的选择性剪接构建体转染的细胞进行的染色被表示为为填充直方图并且用编码分泌的IgG1抗体的非剪接构建体转染的细胞的染色被包括为覆盖黑线(A-G)。使用直方图以便确定染色的细胞(D)的百分比以及选择性剪接构建体和对照的染色(F)的平均荧光。用八位装置(E)在转染后第4天测定所分泌抗体的滴度。
图10:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用具有22-23个疏水氨基酸的不同的跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照,转染用包括B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照,用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-G)。使用直方图以便确定染色的细胞(H)的百分比以及选择性剪接构建体和对照的染色(I)的平均荧光。用八位装置(G)在转染后第4天测定所分泌抗体的滴度。
图11:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用具有21-24个包含疏水、极性和带电残基的疏水氨基酸的不同的跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照,转染用包括B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照,用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-H)。对用使用PTCRA跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用编码分泌的IgG1抗体的非剪接构建体转染的细胞的染色被包括为覆盖黑线(I)。使用直方图以便确定染色的细胞(J)的百分比以及选择性剪接构建体和对照的染色(L)的平均荧光。用八位装置(G)在转染后第4天测定所分泌抗体的滴度。
图12:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用包括PTCRA跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体,所述PTCRA跨膜结构域具有PTCRA跨膜结构域中的疏水残基数量的变化。在转染后的第二天进行分析。作为阳性对照,转染用B7-1跨膜区和野生型PTCRA跨膜结构域编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照,用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用PTCRA跨膜结构域的不同修饰编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用B7-1跨膜区和野生型PTCRA跨膜结构域的构建体转染的细胞的染色被包括为覆盖黑线(B-H)。使用直方图以便确定染色的细胞(I)的百分比以及选择性剪接构建体和对照的染色(K)的平均荧光。用八位装置(J)在转染后第4天测定所分泌抗体的滴度。
图13:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用具有17-19个包含疏水、极性和带电残基的疏水氨基酸的不同的跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照,转染用包括B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照,用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-D)。使用直方图以便确定染色的细胞(E)的百分比以及选择性剪接构建体和对照的染色(G)的平均荧光。用八位装置(F)在转染后第4天测定所分泌抗体的滴度。
图14:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用具有26-27个包含疏水、极性和带电残基的疏水氨基酸的不同的跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照,转染用包括B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照,用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-E)。使用直方图以便确定染色的细胞(F)的百分比以及选择性剪接构建体和对照的染色(H)的平均荧光。用八位装置(G)在转染后第4天测定所分泌抗体的滴度。
图15:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用具有缩短的或延长的B7-1跨膜结构域的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照,转染用包括野生型B7-1跨膜结构域的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照,用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的跨膜结构域编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1野生型跨膜结构域的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-E)。使用直方图以便确定染色的细胞(F)的百分比以及选择性剪接构建体和对照的染色(H)的平均荧光。用八位装置(G)在转染后第4天测定所分泌抗体的滴度。
图16:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用具有不同的胞质尾的B7-1跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照,转染用包括B7-1胞质尾的B7-1跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照,用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用不同的胞质尾编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括B7-1胞质尾的B7-1跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B-N)。使用直方图以便确定染色的细胞(O)的百分比以及选择性剪接构建体和对照的染色(Q)的平均荧光。用八位装置(P)在转染后第4天测定所分泌抗体的滴度。
图17:用选择性剪接构建体转染的CHO-S细胞的染色概况,所述选择性剪接构建体用于使用具有不同的胞质尾的M1M2跨膜区呈现和分泌IgG1抗体。在转染后的第二天进行分析。作为阳性对照,转染用包括M1M2胞质尾的M1M2跨膜区编码所分泌和膜呈现的IgG1的选择性剪接构建体((A)中的填充的直方图)并且作为阴性对照,用编码分泌的IgG1抗体的非剪接构建体转染CHO-S细胞((A)中的覆盖黑线)。对用使用具有B7-1胞质尾的M1M2跨膜区编码所分泌和膜呈现的IgG1的构建体转染的细胞进行的染色被表示为为填充直方图并且用使用包括M1M2胞质尾的M1M2跨膜区的构建体转染的细胞的染色被包括为覆盖黑线(B)。使用直方图以便确定染色的细胞(C)的百分比以及选择性剪接构建体和对照的染色(E)的平均荧光。用八位装置(D)在转染后第4天测定所分泌抗体的滴度。
图18:BEAT双特异性抗体的三个亚基的装配变体(assembly variant)。
图19:在选定的稳定细胞池的双κ轻链(LC)和Fc片段染色后得到的点图的实施例。通过细胞膜上的染色检测到的潜在分子被显示在右侧。使用PE缀合的山羊抗人Fcγ特异性抗体检测Fc片段。使用小鼠抗人κLC APC标记的抗体检测κ轻链。
图20:用选择性剪接载体转染的稳定池的表面染色和分泌概况之间的相关性。所绘制的Q6*和Q7*百分比是指100%是整个生产细胞种群(不包括Q8)。
图21:细胞分选前在稳定的细胞池的表面染色后得到的点图。染色使用可溶性靶标1和2用于检测细胞表面呈现的粘合物(binder)。通过细胞膜上的染色检测到的潜在分子在相应的象限中表示。
图22:在14天分批补料的上清液中检测到的分子的级分与在其细胞表面上呈现表型的细胞级分之间的相关性。
图23:对用选择性剪接构建体转染的选定的稳定细胞池获得的测量表面Fc概况的实施例。使用PE缀合的山羊抗人Fcγ特异性抗体检测存在于细胞膜上的IgG。在FSC对SSC点图中圈门活细胞(A中的gl)以显示所测试的选择性剪接池的荧光分布(填充直方图,B)。缺乏选择性剪接构建体的IgG分泌克隆的染色用作阴性对照并表示为覆盖(虚线)。
图24:表面染色强度和批处理期间测定的分泌细胞的表达水平之间的相关性:表面强度和在补充一批(A)的第1天的IgG滴度之间的相关性以及第1天的表面强度和对数生长期(第1-3天)期间测量的qP之间的相关性(B)。
图25:第1天的表面染色强度预测第7天的累积分泌的IgG。
图26:根据IgG表面呈现选择高生产者。通过流式细胞术细胞分选选择在它们的细胞膜上呈现“低”,“中”和“高”密度的IgG的细胞(A)。在分选之后的第二周确定表面荧光的分布(B)并且在补充批中评价分选的克隆的单位生产率(C)。
具体实施方式
本发明提供了表达构建体以及用于多肽特别是异源多聚多肽的细胞膜表达的方法。特别地,目的蛋白质可以是使用选择性剪接的宿主细胞中的重组抗体或其片段或双特异性抗体。细胞膜呈现的水平指示重组宿主细胞中的多肽的分泌水平并且对于异源二聚抗体细胞膜呈现也指示分泌概况,即异源二聚体或同源二聚体表达。
如本文中可互换使用的术语“表达构建体”或“构建体”包含多核苷酸序列,所述多核苷酸序列编码待表达的多肽和控制其表达的序列如启动子以及任选地增强子序列,包括顺式作用转录性控制单元的任何组合。控制基因表达(即其转录和转录产物翻译)的序列常称作调节单元。调节单元的大多数部分位于基因的编码序列上游并与之有效连接。表达构建体也可以含有包含多聚(A)位点的下游3'非翻译区。
本发明的调节单元与待表达的基因即转录单位有效连接,或由间插DNA例如异源基因的5'-非翻译区(5’UTR)分隔。优选地,表达构建体侧翼为一种或多种合适的限制性位点以便可以将表达构建体插入载体中和/或将其从载体切除。因而,本发明的表达构建体可以用于构建表达载体,尤其哺乳动物表达载体。
如本文所用的术语“编码多肽的多核苷酸序列”包括编码表达所述多肽的基因、优选地异源基因的DNA。
术语“异源编码序列”、“异源基因序列”、“异源基因”、“重组基因”或“基因”互换使用。这些术语指这样的DNA序列,所述DNA序列编码设法在宿主细胞中、优选地在哺乳动物细胞中表达并收获用于进一步使用的重组多肽,尤其重组异源蛋白产物。基因的产物可以是多肽。异源基因序列可以不天然地存在于宿主细胞中并且源自相同或不同物种的生物并且可以是基因修饰的。可选地,异源基因序列天然地存在于宿主细胞中。
术语“蛋白质”和“多肽”互换地用来包括通过相邻残基的α-氨基和羧基之间的肽键彼此连接的一串氨基酸残基。
如本文所用的术语“启动子”限定一般位于基因上游的调节性DNA序列,所述调节性DNA序列通过指导RNA聚合酶与DNA结合并启动RNA合成介导转录的起始。用于本发明的启动子包括提供高水平表达的例如病毒、哺乳动物、昆虫和酵母启动子,例如哺乳动物巨细胞病毒或CMV启动子、SV40启动子或适用于在真核细胞中表达的本领域已知的任何启动子。特别适用于本发明的表达构建体的启动子可以选自以下组成的列表:SV40启动子、人tk启动子、MPSV启动子、小鼠CMV、人CMV、大鼠CMV、人EF1α、中国仓鼠EF1α、人GAPDH、包括MYC、HYK和CX启动子的杂合启动子、基于转录因子结合位点的重排的合成启动子。本发明的特别优选的启动子是小鼠CMV启动子。
术语“5'非翻译区(5'UTR)”指的是前mRNA或成熟mRNA的5'端中的非翻译段。在成熟mRNA上,5'UTR通常在其5'端藏匿7-甲基鸟苷帽并参与许多过程,如剪接、聚腺苷酸化、朝向细胞质的mRNA输出,通过翻译机械识别mRNA的5'端和防止mRNA降解(Cowling VH(2010)Biochem J,425:295-302)。
术语“内含子”是指转录和存在于前mRNA中但由基于剪接供体位点和剪接受体位点(分别位于内含子的5'和3'端)的序列的剪接机械切除,并且因此不存在于成熟mRNA转录物中的核酸非编码序列的片段。通常内含子具有内部位点,称为分支点,位于3'剪接位点的上游的20个和50个核苷酸之间。本发明中使用的内含子的长度可以是50至10000个核苷酸长。缩短的内含子可包含50个或更多个核苷酸。全长内含子可包括超过10000个核苷酸。适用于本发明的表达构建体的内含子可以选自以下组成的列表:合成或人造内含子;或天然存在的内含子,如β-球蛋白/IgG嵌合内含子,β-球蛋白内含子,IgG内含子,小鼠CMV第一内含子,鼠CMV第一内含子,人CMV第一内含子,Ig可变区内含子和剪接受体位点(Bothwell etal.,(1981)Cell,24:625-637;US5,024,939),鸡TNT基因的内含子和EF1α的第一内含子或其修饰版本。
本发明中使用的内含子可具有来自不同的内含子的剪接受体和剪接供体位点,例如内含子可以包括来自人IgG内含子的剪接供体位点,例如ighg1基因的剪接供体位点和来自鸡cTNT内含子4的剪接受体位点。
在一个优选的实施方案中,内含子包括来自人IgG内含子的剪接供体位点和来自鸡cTNT内含子4的剪接受体位点。更优选的是包含来自人IgG内含子的剪接供体位点以及选自由鸡TNT内含子4(SEQ ID NO:69)和衍生自鸡TNT内含子4的构建体(SEQ ID NOs:70-78)组成的组的剪接受体。
术语“外显子”是指被转录成mRNA并在剪接之后保持在成熟mRNA中的核酸序列的片段。
术语“剪接位点”是指能够由真核细胞的剪接机制识别为适合于被切割和/或连接到相应的剪接位点的特定的核酸序列。剪接位点允许存在于前mRNA转录物中的内含子的切除。通常将剪接位点的5'部分称为剪接供体位点和将3'对应的剪接位点称为剪接受体位点。术语剪接位点包括,例如,天然存在的剪接位点,工程化的剪接位点,例如,合成的剪接位点,典型或一致剪接位点,和/或非典型剪接位点,例如,隐蔽剪接位点。适用于本发明的表达构建体的剪接供体或受体位点可以选自以下组成的列表:来自β-球蛋白/IgG嵌合内含子的剪接供体和受体、来自β-球蛋白内含子的剪接供体和受体、来自IgG内含子的剪接供体和受体、来自小鼠CMV第一内含子的剪接供体和受体、来自大鼠CMV第一内含子的剪接供体和受体、来自人CMV第一内含子的剪接供体和受体、来自Ig可变区内含子和剪接受体序列的剪接供体和受体(Bothwell et al.,(1981)Cell,24:625-637;US5,024,939)、来自鸡TNT基因的内含子的剪接供体和受体以及来自EF1α基因的第一内含子或其融合构建体的剪接供体和受体。在优选的实施方案中,剪接供体位点来自人IgG内含子并且剪接受体位点选自由鸡TNT内含子4(SEQ ID NO:69)和衍生自鸡TNT内含子4的构建体(SEQ ID NOs:70-78)组成的组。
如本文中所使用的术语剪接供体区域的共有序列是指在“Molecular Biology ofthe Cell”(Alberts et al.,Garland Publishing,New York 1995)中描述的序列(C/A)AGGU(A/G)AGU(下划线的序列是内含子的一部分)SEQ ID NO:345。
如本文所用的术语剪接受体区域的共有序列是指在“Molecular Biology of theCell”(Alberts et al.,Garland Science,New York 2002)中描述的序列CTRAYY---poly (Y)tract---NCAGG(下划线的序列是内含子的一部分;斜体:分支点区域)SEQ ID NO:346。
术语“终止密码子”是指信号终止蛋白质合成的三种终止密码子(TAA(RNA:UAA),TAG(RNA:UAG)和TGA(RNA:UGA))中的任一个。为了避免不完全终止效率或终止密码子的“泄漏”,2,3-或多个终止密码子可以用于蛋白合成的信号终止。
术语“跨膜区”是指由核酸序列编码的多肽或蛋白质并且其包括可选的胞外部分、跨膜结构域和任选的胞质尾。跨膜结构域是任何三维蛋白质结构,该结构在膜中热力学稳定,并且通常包括跨膜蛋白的单一跨膜α螺旋,主要由疏水氨基酸组成。跨膜结构域的长度为平均21个氨基酸,但可以在4至48个氨基酸之间变化(Baeza-Delgado等人,2012)。跨膜区包含任选的氨基酸的N-末端胞外连接伸展和跨膜结构域。在一些实施方案中,跨膜区可进一步包括C末端胞质氨基酸伸展或胞内结构域。在人ighgl基因中发现的跨膜区例如由被两个结构域M1和M2跟随的氨基酸的连接伸展组成(该跨膜区将被称为“M1M2”或“IgG1跨膜区”)。本发明中使用的跨膜区包括,但不限于,人血小板衍生的生长因子受体(PDGFR)基因(Swissprot条目P33681)、人脱唾液酸糖蛋白受体(Swissprot条目P07306)、人和鼠B7-1(人:Swissprot条目P33681和小鼠:Swissprot条目Q00609)、人ICAM-1(Swissprot条目P05362)、人erbb1(Swissprot条目P00533)、人erbb2(Swissprot条目P04626)、人erbb3(Swissprot条目P21860)、人erbb4(Swissprot条目Q15303)、人成纤维细胞生长因子受体,如FGFR1(Swissprot条目P11362)、FGFR2(Swissprot条目P21802)、FGFR3(Swissprot条目P22607)、FGFR4(Swissprot条目P22455)、人VEGFR-1(Swissprot条目P17948)、人VEGFR-2(Swissprot条目P35968)、人促红细胞生成素受体(Swissprot条目P19235)、人PRL-R、催乳素受体(Swissprot条目P16471)、人EphAl、肝配蛋白A型受体1(Swissprot条目P21709)、人胰岛素(Swissprot条目P06213)、胰岛素样生长因子1受体(IGFR1、Swissprot条目P08069,SEQ ID NO:181)、人受体样蛋白酪氨酸磷酸酶(Swissprot条目Q12913、P23471、P23467、P18433、P23470、P23469、P23468)、人神经毡蛋白(Swissprot条目P014786)、人主要组织相容性复合体类II(α和β链)、人整合素(α和β家族)、人多配体聚糖、人髓鞘蛋白、人钙粘素、人小突触泡蛋白-2(Swissprot条目P63027)、人血型糖蛋白-A(GpA,Swissprot条目P02724,SEQ ID NO:185)、人Bnip3(Swissprot条目Q12983)、人APP(Swissprot条目P05067)、淀粉体蛋白前体蛋白(Swissprot条目P0DJI8)、人T细胞受体α基因(PTCRA,Swissprot条目PQ6ISU1,SEQ ID NO:186)和T细胞受体β、CD3γ(Swissprot条目P09693)、CD3δ(Swissprot条目P04234)、CD3ζ(Swissprot条目P20963)、和CD3ε(CD3E,Swissprot条目P07766,SEQ IDNO:197)、人丝氨酸/苏氨酸-蛋白激酶受体R3(ACVL1,Swissprot条目P37023,SEQ ID NO:174)、人炭疽毒素受体2(ANTR2,Swissprot条目P58335,SEQ ID NO:175)、人T细胞表面糖蛋白CD4(CD4,Swissprot条目P01730,SEQ ID NO:176)、人受体型酪氨酸-蛋白质磷酸酶μ(PTPRM,Swissprot条目P28827,SEQ ID NO:177)、人肿瘤坏死因子受体超家族成员5(TNR5,Swissprot条目P25942,SEQ ID NO:178)。人整合素β-1(ITB1,Swissprot条目P05556,SEQID NO:179)、人HLAI类组织相容性抗原、B-7α链(Swissprot条目P01889,SEQ ID NO:180)、人血栓调节蛋白(TRBM,Swissprot条目P07204,SEQ ID NO:182)、人白细胞介素-4受体亚基α(IL4RA,Swissprot条目P24394,SEQ ID NO:183)、人低密度脂蛋白受体相关蛋白6(LRP6,Swissprot条目075581,SEQ ID NO:184)、人高亲和力免疫球蛋白ε受体亚基α(FCERA,Swissprot条目P12319,SEQ ID NO:194)、人杀伤细胞免疫球蛋白样受体2DL2(KI2L2,Swissprot条目P43627,SEQ ID NO:195)、人细胞因子受体常见亚基β(IL3RB,Swissprot条目P32927,SEQ ID NO:196)、人整合素α-IIb(ITA2B,Swissprot条目P08514,SEQ ID NO:198)、人T细胞特异性表面糖蛋白CD28(CD28,Swissprot条目P10747,SEQ ID NO:199)的跨膜区。
在一个优选的实施方案中,本发明中使用的跨膜区选自由人B7-1跨膜区、鼠B7-1跨膜区、PDGFR跨膜区、人脱唾液酸糖蛋白受体跨膜区和erbb-2跨膜区组成的组。更优选的是鼠B7-1跨膜区,最优选的是如SEQ ID NO:66所示的鼠B7-1跨膜区。
免疫球蛋白跨膜区包括来自人免疫球蛋白基因IGHA1(NCBI登录号:M60193)、IGHA2(NCBI登录号:M60194)、IGHD(NCBI登录号:K02881)、IGHE(NCBI登录号:X63693)、IGHG1(NCBI登录号:X52847)、IGHG2(NCBI登录号:AB006775)、IGHG3(NCBI登录号:D78345)、IGHG4(NCBI登录号:AL928742)、IGHGP(NCBI登录号:X52849)、IGHM(NCBI登录号:X14940)的跨膜区以及来自鼠免疫球蛋白基因IGHA1(NCBI登录号:K00691)、IGHD(NCBI登录号:J00450)、IGHE(NCBI登录号:X03624,U08933)、IGHG1(NCBI登录号:J00454,J00455)、IGHG2A(NCBI登录号:J00471)、IGHG2B(NCBI登录号:J00462,D78344)、IGHG3(NCBI登录号:X00915,V01526)、IGHM(NCBI登录号:J00444)的跨膜区。
在本发明的一个实施方案中,所使用的跨膜区是不包含由免疫球蛋白基因编码的跨膜区的非免疫球蛋白跨膜区,尤其是不包括由人免疫球蛋白基因IGHA1(NCBI登录号:M60193)、IGHA2(NCBI登录号:M60194)、IGHD(NCBI登录号:K02881)、IGHE(NCBI登录号:X63693)、IGHG1(NCBI登录号:X52847)、IGHG2(NCBI登录号:AB006775)、IGHG3(NCBI登录号:D78345)、IGHG4(NCBI登录号:AL928742)、IGHGP(NCBI登录号:X52849)、IGHM(NCBI登录号:X14940)编码的跨膜区并且不包括由鼠免疫球蛋白基因IGHA1(NCBI登录号:K00691)、IGHD(NCBI登录号:J00450)、IGHE(NCBI登录号:X03624,U08933)、IGHG1(NCBI登录号:J00454,J00455)、IGHG2A(NCBI登录号:J00471)、IGHG2B(NCBI登录号:J00462,D78344)、IGHG3(NCBI登录号:X00915,V01526),IGHM(NCBI登录号:J00444)编码的跨膜区的非免疫球蛋白跨膜区。
术语“多聚(Y)区”是指内含子的分支点和内含子-外显子边界之间发现的一段核酸。该段核酸具有大量的嘧啶(Y),这意味着具有大量的嘧啶碱基C或T。
术语“3'非翻译区(3'UTR)”是指预mRNA或成熟mRNA的3'端的非翻译片段。在成熟mRNA上,这一区域藏匿聚(A)尾并已知在mRNA稳定性、翻译起始和mRNA输出方面具有许多作用(Jia J et al.,(2013)Curr Opin Genet Dev,23(1):29-34)。
如本文所用的术语“增强子”限定一种核苷酸序列,该核苷酸序列作用为使激动基因转录成为可能,所述基因转录与基因的身份、该序列相对于基因的位置或序列的取向无关。本发明的载体任选地包含增强子。
术语“聚腺苷酸化信号”或“多聚(A)信号”或“多聚(A)”或“多聚(A)位点”是指存在于mRNA转录中的核酸序列,其在存在聚(A)聚合酶时允许转录在位于聚(A)信号下游的10至30个碱基的聚腺苷酸化位点上被聚腺苷酸化。许多聚(A)信号是本领域公知的并且可以用于本发明。实例包括人类变体生长激素多聚(A)信号,SV40晚期多聚(A)信号和牛生长激素多聚(A)信号。
术语“功能性连接”和“有效连接”互换使用并且指两个或更多个DNA区段、尤其待表达基因序列和控制其表达的那些序列之间的功能关系。例如,如果启动子和/或增强子序列(包括顺式作用转录性控制元件的任何组合)在适宜的宿主细胞或其他表达系统中刺激或调节编码序列的转录,则它与编码序列有效连接。与转录的基因序列有效连接的启动子调节序列是在物理上与转录的序列邻接的。
“取向”指给定DNA序列中的核苷酸顺序。例如,DNA序列相对于另一个DNA序列以相反方向的取向是这种情况,其中与从其中获得该序列的DNA中的参照点相比时,该序列相对于另一个序列的5'至3'顺序反转。这类参考点可以包括源DNA中转录其他指定DNA序列的方向和/或含有该序列的复制型载体的复制起点。
如本文所用的术语“核酸序列同源性”或“核苷酸序列同源性”包括在比对序列和根据需要引入缺口以达到最大百分数序列同一性之后,候选序列中的与例如比较序列的核苷酸序列相同的核苷酸的百分比。因此,可以通过常用来比较两个核苷酸序列的核苷酸位置中相似性的标准方法确定序列同一性。
如本文所用的术语“表达载体”包括分离和纯化的DNA分子,所述分子在转染入适宜的宿主细胞时在宿主细胞内部提供重组基因产物的合适的表达水平。除编码重组或基因产物的DNA序列之外,表达载体还包含宿主细胞系中将DNA编码序列有效转录成mRNA并将mRNA有效翻译成蛋白质所需要的调节性DNA序列。
如本文所用的术语“宿主细胞”或“宿主细胞系”包括能够在培养物中生长并表达所需重组产物蛋白质的任何细胞、尤其哺乳动物细胞。
可以以各种表达系统,如原核(例如大肠杆菌)、真核(例如酵母、昆虫、骨架动物、哺乳动物),和体外表达系统来生产重组多肽和蛋白质。用于大规模生产基于蛋白质的生物制剂的最常用方法依赖于通过DNA载体的转染将遗传物质导入宿主细胞。可用宿主细胞的瞬时转染来实现多肽的瞬时表达。将载体DNA整合到宿主细胞基因组中导致被稳定转染的细胞系并且这样的稳定的细胞系的繁殖可用于大规模生产多肽和蛋白质。
用于通过选择性剪接在真核细胞中生产多个多肽的方法在WO2005/089285中描述。两种不同的表达盒在单一的启动子的控制下,其中表达盒具有剪接位点,这允许其选择性剪接和表达为处于期望比例的两种或多种独立的基因产物。
然而本发明人已经发现,这种方法对于可溶性多肽变体和等离子体膜结合变体的表达有限制,因为将产生两种完全独立的蛋白质,因此,等离子体膜结合变体并不代表可溶性多肽变体的期望的产物质量。
用于选择表达异源性蛋白质的真核细胞的方法以及来自可选地可剪接的核酸的可溶性多肽变体和等离子体膜结合变体的表达在WO2007/131774中描述。等离子体膜结合变体被连接到表达其的细胞并可以用作标记以分离已成功被转染的细胞。
然而本发明人已经发现,因为没有办法来控制可溶性多肽的表达与膜呈现多肽的比值,因此这种方法是有限制的。如上所述的选择性剪接是一种方法,通过该方法可以表达多肽的不同变体,但由于选择性剪接的机制是高度可变的,而没有任何控制剪接比的能力,因此所表达的多肽变体的量会变化。
因此,这样的一种细胞表达系统将具有降低的可溶性多肽的滴度,通过所述细胞表达系统所表达的多肽的一部分被重新定向以在细胞膜上表达。尽管多肽的细胞膜表达是分离高表达克隆的有用标记,如果没有任何形式的对细胞膜上表达的多肽的量的控制,可溶性多肽的滴度可显著降低。此外,在相同的培养条件下没有任何两个多肽以相同的水平表达,因此,为一种多肽的可溶性和细胞膜表达开发的方法不太可能适用于所有的多肽。
与前面描述的选择性剪接方法相反,本申请人已经设计了用于可溶性的多肽和细胞膜呈现的多肽两者的表达的选择性剪接方法,其中表达构建体的组分可以被修饰,以优化所表达的可溶性多肽的量而仍然允许足以实现细胞克隆选择的量的多肽的细胞膜表达。
在本发明的用于抗体重链的表达的示例性表达构建体中,IgG1重链恒定区包含终止分泌重链的开放阅读框的终止密码子的弱剪接供体上游。剪接受体位点和编码跨膜区的DNA序列后跟终止密码子和位于终止密码子的3'的多聚(A)位点,使得跨膜区在剪接后在具有IgG1重链的开放阅读框的框中。所得选择性开放阅读框分别由终止密码子和多聚(A)位点终止。本申请人已经发现,通过修饰该表达构建体,他们可以改变剪接比,因此,可溶性多肽的量相对于膜呈现多肽。
这些修饰可以包括,例如,使用异源的跨膜区。IgG1的天然存在的跨膜区由氨基酸的连接伸展和结构域M1和M2构成。通过是非免疫球蛋白跨膜区的跨膜区置换IgG1跨膜区,例如通过用鼠B7-1跨膜区置换,可以增加膜呈现多肽的量。如在实施例2的图2中所示,瞬时转染细胞的几乎40%对于膜呈现的IgG1阳性,这相对于用包括IgG1跨膜区的构建体转染的细胞的百分比显著增加(高达20%)。这样的结果是令人惊奇的,因为这将可以预期,利用自然的IgG1跨膜区而不是异源跨膜区对于IgG1的细胞膜呈现将是最有效的。优选地,在本发明的表达构建体中使用的跨膜区包含这样的跨膜区,所述跨膜区选自由人血小板衍生的生长因子受体(PDGFR)基因、人脱唾液酸糖蛋白受体、人和鼠B7-1、人ICAM-1、人erbb1、人erbb2、人erbb3、人erbb4、人成纤维细胞生长因子受体如FGFR 1、FGFR2、FGFR3、FGFR4、人VEGFR-1、人VEGFR-2、人促红细胞生成素受体、人PRL-R、催乳素受体、人EphAl、肝配蛋白型-A受体1、人胰岛素、IGF-1受体、人受体样蛋白酪氨酸磷酸酶、人神经毡蛋白、人主要组织相容性复合体II类(α和β链)、人整合素(α和β家族)、人多配体聚糖、人髓鞘蛋白、人钙粘素、人小突触泡蛋白-2、人血型糖蛋白A、人Bnip3、人APP、淀粉体前体蛋白、人T细胞受体α(PTCRA)和T-细胞受体β、CD3γ、CD3δ、CD3ζ和CD3ε的跨膜区组成的组。在一个优选的实施方案中,用于本发明的跨膜区选自由人B7-1跨膜区、鼠B7-1跨膜区、PDGFR跨膜区、人脱唾液酸糖蛋白受体跨膜区和erbb-2跨膜区组成的组。更优选的是鼠B7-1跨膜区,最优选的是如SEQ IDNO:66所示的鼠B7-1跨膜区。
进一步的修饰以改变分泌多肽的量相对于膜呈现多肽的剪接比包括改变编码跨膜区的外显子的多聚嘧啶(多聚(Y))道上游中的嘧啶碱基的数目和/或修饰剪接供体和受体共有序列。降低嘧啶碱基(Y)的数量已经在实施例3中示出导致剪接比朝向分泌蛋白变化。如果构建体不包括嘧啶碱基,目的蛋白质无表面表达。使剪接比远离细胞膜表达变化的机制可能可用于在细胞膜上强烈表达但呈现较弱的可溶性表达的蛋白质。多聚(Y)道中的嘧啶碱基的数目可以包括0至30个之间的碱基。优选地,多聚(Y)道包括20个嘧啶碱基或更少,更优选15个碱基或更少,甚至更优选10个碱基或更少。
因为膜呈现蛋白质的量的增加可对可溶性多肽的滴度产生负面影响,本发明人对表达构建体开发了这样的修饰,其可以提高宿主细胞中的可溶性多肽的表达而不影响膜呈现多肽的量。据发现在内含子中添加多聚(A)位点增加可溶性多肽滴度最大达50%(对于M1M2跨膜区),同时维持显著水平的细胞膜呈现。在本发明的进一步的实施方案中,多聚(A)位点位于表达构建体的内含子中。
在本发明的一个方面,表达构建体适用于多肽多聚体和蛋白质例如抗体或其片段或双特异性抗体或其片段。
如本文所用的术语“抗体”包括整个抗体及其任何抗原结合片段或其单链。“抗体”是指包含通过二硫键相互连接的至少两条重(H)链和两条轻(L)链,或它们的抗原结合片段的糖蛋白。每条重链由重链可变区(本文缩写为VH)和重链恒定区组成。重链恒定区由三个结构域CH1、CH2和CH3组成。每条轻链由轻链可变区(本文缩写为VL)和轻链恒定区组成。轻链恒定区由一个结构域CL组成。VH和VL区可以进一步细分成称为互补决定区(CDR)的高变区,其在序列上高度可变和/或参与抗原识别和/或通常形成结构定义的环,与称为框架区(FR或FW)的更保守的区域穿插。每条VH和VL由三个CDR和四个FW组成,从氨基末端到羧基末端按以下顺序排列:FW1,CDR1,FW2,CDR2,FW3,CDR3,FW4。FW1,FW2,FW3和FW4的氨基酸序列一起构成如本文所述的VH或VL的“非CDR区”或“非扩展的CDR区”。
重链和轻链的可变区包含与抗原相互作用的结合结构域。抗体的恒定区可以介导免疫球蛋白与宿主组织或因子,包括免疫系统(例如,效应细胞)和经典补体系统的第一组分(C1q)的各种细胞的结合。
如通过恒定区从遗传学角度确定的,可以将抗体分成类,也被称为同种型。人类恒定轻链分类为kappa(Cκ)和lambda(Cλ)轻链。重链分类为mu(μ)、delta(δ)、gamma(γ)、alpha(α)或epsilon(ε),并分别定义抗体的同种型为IgM、IgD、IgG、IgA和IgE。IgG类最常用于治疗目的。在人类中,该类包括亚类IgG1、IgG2、IgG3和IgG4。
如本文所用的术语“Fab”或“Fab区”包括这样的多肽,其包含VH、CH1、VL和CL免疫球蛋白结构域。Fab可以指该区域处于孤立状态,或该区域在全长抗体或抗体片段的背景中。
如本文所用的术语“Fc”或“Fc区”包括这样的多肽,其包含不具有第一恒定区免疫球蛋白结构域的抗体的恒定区。因此,Fc是指IgA,IgD和IgG的最后两个恒定区免疫球蛋白结构域,以及IgE和IgM的最后三个恒定区免疫球蛋白结构域,和这些结构域的柔性铰链N末端。对于IgA和IgM,Fc可以包括J链。对于IgG,Fc包括免疫球蛋白结构域C gamma 2和Cgamma 3(Cγ2和Cγ3)和C gamma l(Cγl)和C gamma 2(Cγ2)之间的铰链。尽管Fc区的边界可以变化,但是人IgG重链Fc区通常被定义为包括到其羧基末端的残基C226VS P230,其中根据EU编号系统编号。对于人IgG1,Fc区在本文中定义为包括到其羧基末端的残基P232,其中编号根据EU编号系统编号(Edelman GM等人,(1969)Proc Natl Acad Sci USA,63(1):78-85)。Fc可以指该区域处于孤立状态或该区域在Fc多肽例如抗体的背景中。
如本文所用的术语“全长抗体”包括构成抗体的天然生物形式,包括可变区和恒定区的结构。例如,在大多数哺乳动物,包括人类和小鼠中,IgG类的全长抗体为四聚体并且由两对相同的两个免疫球蛋白链组成,每对具有一条轻链和一条重链,每条轻链包含免疫球蛋白结构域VL和CL,并且每条重链包含免疫球蛋白结构域VH和CH1(Cγ1),CH2(Cγ2)和CH3(Cγ3)。在一些哺乳动物,例如骆驼和美洲驼中,IgG抗体可以仅由两条重链组成,每条重链包含连接于Fc区的可变域。
抗体片段包括但不限于:(i)由VL、VH、CL和CH1结构域组成的Fab片段,包括Fab'和Fab'-SH;(ii)由VH和CH1结构域组成的Fd片段;(iii)由单个抗体的VL和VH结构域组成的Fv片段;(iv)由单个可变域组成的dAb片段(WardES等人,(1989)Nature,341(6242):544-546);(v)F(ab')2片段,一种包含两个连接的Fab片段的双价片段;(vi)单链Fv分子(scFv),其中VH结构域和VL结构域由允许这两个结构域缔合以形成抗原结合位点的肽连接子连接(Bird RE等人,(1988)Science,242:423-426;Huston JS等人,(1988)Proc.Natl.Acad.Sci.USA,85:5879-83);(vii)双特异性单链Fv二聚体(PCT/US92/09965),(viii)“双抗体”或“三抗体”,通过基因融合所构建的多价或多特异性片段(Tomlinson I&Hollinger P(2000)Methods Enzymol.326:461-79;WO94/13804;Holliger P et al.,(1993)Proc.Natl.Acad.Sci.USA,90:6444);和(ix)与相同或不同抗体基因融合的scFv(Coloma MJ&Morrison SL(1997)Nature Biotech,15(2):159-163)。
可通过如本文所述的表达构建体表达的抗体和其片段可结合选自由下面组成的组的抗原:AXL、Bcl2、HER2、HER3、EGF、EGFR、VEGF、VEGFR、IGFR、PD-1、PD-1L、BTLA、CTLA-4、GITR、mTOR、CS1、CD3、CD16、CD16a、CD19、CD20、CD22、CD25、CD27、CD28、CD30、CD32b、CD33、CD38、CD40、CD52、CD64、CD79、CD89、CD137、CD138、CA125、cMet、CCR6、MUCI、PEM抗原、Ep-CAM、EphA2、17-1a、CEA、AFP、HLA类II、HLA-DR、HSG、IgE、IL-12、IL-17a、IL-18、IL-23、IL-1alpha、IL-1beta、GD2-神经节苷脂、MCSP、NG2、SK-I抗原、Lag3、PAR2、PDGFR、PSMA、Tim3、TF、CTLA4、TL1A、TIGIT、SIRPa、ICOS、Treml2、NCR3、HVEM、OX40、VLA-2和4-1BB。
双特异性或异源二聚抗体已经在本领域中可获得许多年。然而,这样的抗体的产生通常与错配的副产物的存在关联,所述副产物显著降低了所需的双特异性抗体的产率,并且需要复杂的纯化程序以实现产物的同质性。可通过使用若干合理的设计策略减少免疫球蛋白重链的错配,其中大部分设计策略通过在CH3结构域同源二聚体的两个亚基之间设计人为的互补异源二聚体界面来工程化用于异型二聚的抗体重链。Carter等人作出了工程化的CH3异源二聚体结构域对的首次报道,描述了用于生成异源二聚Fc部分的“突起-进入-腔”方法(US5,807,706;‘knobs-into-holes’;Merchant AM等人,(1998)Nat Biotechnol,16(7):677-81)。近来已经开发了替代设计并涉及如WO2007110205中所描述地通过修饰分子的核心成分来设计新的CH3模序对或者如WO2007147901或WO2009089004所描述地在模件之间设计互补的盐桥。CH3工程化策略的缺点是这些技术仍导致产生显著量的不需要的同源二聚体。PCT公开号WO2012131555中描述了其中主要产生异源二聚体的用于产生双特异性抗体的更优选技术。可以对若干靶点,例如,位于肿瘤细胞上的靶点和/或位于效应细胞上的靶点产生双特异性抗体。优选地,双特异性抗体可以结合于选自由下列组成的组中的两个靶点:AXL、Bcl2、HER2、HER3、EGF、EGFR、VEGF、VEGFR、IGFR、PD-1、PD-1L、BTLA、CTLA-4、GITR、mTOR、CS1、CD3、CD16、CD16a、CD19、CD20、CD22、CD25、CD27、CD28、CD30、CD32b、CD33、CD38、CD40、CD52、CD64、CD79、CD89、CD137、CD138、CA125、cMet、CCR6、MUCI、PEM抗原、Ep-CAM、EphA2、17-1a、CEA、AFP、HLA类II、HLA-DR、HSG、IgE、IL-12、IL-17a、IL-18、IL-23、IL-1alpha、IL-1beta、GD2-神经节苷脂、MCSP、NG2、SK-I抗原、Lag3、PAR2、PDGFR、PSMA、Tim3、TF、CTLA4、TL1A、TIGIT、SIRPa、ICOS、Treml2、NCR3、HVEM、OX40、VLA-2和4-1BB。
在进一步的方面,本发明提供了一种宿主细胞,其包含如上文描述的表达构建体或表达载体。通常该宿主细胞选自由哺乳动物细胞,昆虫细胞和酵母细胞组成的组。该宿主细胞可以是人或非人细胞。优选的宿主细胞是哺乳动物细胞。哺乳动物宿主细胞的优选例子包括而不限于人胚肾细胞(Graham FL等人,(1997)J.Gen.Virol.36:59-74)、MRC5人成纤维细胞、983M人黑色素瘤细胞、MDCK犬肾细胞、RF培养的从Sprague-Dawley大鼠分离的大鼠肺成纤维细胞、B16BL6鼠黑色素瘤细胞、P815鼠肥大细胞瘤细胞、MTl A2鼠乳房腺癌细胞、PER:C6细胞(Leiden、荷兰)和中国仓鼠卵巢(CHO)细胞或细胞系(Puck TT等人,(1958),J.Exp.Med.108:945-955)。
在一个具体的优选实施方案中,宿主细胞是中国仓鼠卵巢(CHO)细胞或细胞系。合适的CHO细胞系例如包括CHO-S(Invitrogen,Carlsbad,CA,美国)、CHO Kl(ATCC CCL-61)、CHO pro3-、CHO DG44、CHO P12或dhfr-CHO细胞系DUK-BII(Urlaub G&Chasin LA(1980)PNAS 77(7),4216-4220)、DUXBI l(Simonsen CC&Levinson AD(1983),PNAS 80,(9):2495-2499)、或CHO-K1SV(Lonza,巴赛尔,瑞士)。
在进一步的方面,本公开内容提供了用于表达目的多肽的宿主细胞的选择的方法,其包括用如前所述的表达构建体或表达载体转染宿主细胞,培养所述宿主细胞,检测目的多肽的细胞膜表达,并选择具有期望的细胞膜表达的宿主细胞克隆。在进一步的步骤中,可以从宿主细胞回收目的多肽。所述多肽优选是异源的,更优选人多肽。如实施例中所示,目的多肽的细胞膜表达的水平与所表达的可溶性多肽的水平成正比。因此,这使得能够定量选择表达高水平的目的多肽的宿主细胞克隆。
在一个优选的实施方案中,本发明提供了一种用于表达多聚蛋白优选异源二聚抗体的宿主细胞的选择的体外方法,其通过用如前所述的表达构建体或表达载体转染宿主细胞,培养所述宿主细胞,检测目的多聚蛋白的细胞膜表达,并选择具有期望的细胞膜表达的宿主细胞克隆。在进一步的步骤中,可以从宿主细胞回收目的多聚蛋白,例如异源二聚抗体。如实施例中所示,可以容易地选择相对于不期望的同源二聚抗体种类更多地呈现异源二聚抗体的宿主细胞,即,实现宿主细胞克隆的定性选择。
根据本发明为了将表达构建体或表达载体转染入宿主细胞,可以使用任何转染技术,如本领域熟知的那些,例如电穿孔法、磷酸钙共沉淀法、阳离子聚合物介导的转染、脂质体转染法,适当时用于给定宿主细胞类型。应当指出,用本发明表达构建体或表达载体转染的宿主细胞应当解释为是瞬时或稳定转染的细胞系。因此,根据本发明,本发明表达构建体或表达载体可以按附加型方式维持,即瞬时转染的,或可以稳定整合在宿主细胞的基因组中,即稳定转染的。
瞬时转染以不采用针对具有选择标记的载体的任何选择压力为特征。在转染后通常持续2直至10日的瞬时表达实验中,转染的表达构建体或表达载体作为附加型元件维持并也不整合至基因组中。即,转染的DNA通常不整合至宿主细胞基因组中。宿主细胞倾向于丢失转染的DNA并且当培养瞬时转染的细胞汇集物时丢失转染的DNA的细胞倾向于在种群中长满转染的细胞。因此表达在紧邻转染后的时间段中最强烈并且随时间减少。优选地,将本发明的瞬时转染子理解为在选择压力不存在的情况下在细胞培养物中维持直至转染后2至10日时间的细胞。
在本发明的优选实施方案中,宿主细胞例如CHO宿主细胞用本发明的表达构建体或表达载体稳定转染。稳定转染意指新引入的外来DNA如载体DNA被掺入基因组DNA中,通常借助随机非同源重组事件。可以通过选择其中在整合入宿主细胞的DNA之后载体序列已经被扩增的细胞系,增加载体DNA的拷贝数以及同时增加基因产物的量。因此,可能的是当暴露于用于扩增基因的选择压力进一步增加时,这种稳定整合在CHO细胞中产生双倍微小染色体。另外,稳定转染可以导致丢失与重组基因产物表达不直接相关的载体序列部分,例如当基因组整合时变得多余的细菌拷贝数控制区。因此,转染的宿主细胞已经将表达构建体或表达载体的至少部分或不同部分整合至基因组中。
在又一个方面,本公开提供如上文描述的表达构建体或表达载体用于从哺乳动物宿主细胞表达异源多肽的用途,特别是如上文描述的表达构建体或表达载体用于从哺乳动物宿主细胞体外表达异源多肽的用途。在一个优选的实施方案中,如上文所述的表达构建体或表达载体用于来自哺乳动物宿主细胞的异源二聚抗体的体外表达。
在本发明中描述的表达构建体可以用于这样的方法,所述方法用于选择表达目的多肽或蛋白的重组宿主细胞。优选地,目的蛋白是抗体。该方法包括:
(ⅰ)共转染宿主细胞与:
(a)一种表达构建体,其在5'至3'方向上包含:
启动子;
编码抗体重链的外显子;
剪接供体位点、内含子和剪接受体位点,其中第一终止密码子位于剪接供体位点和所述内含子内的剪接受体位点之间;
编码跨膜区的第二外显子,所述跨膜区选自修饰的免疫球蛋白跨膜区或修饰的或未经修饰的非免疫球蛋白跨膜区;
第二终止密码子;和
多聚(A)位点,
(b)编码抗体轻链的表达构建体,
(ⅱ)在适于抗体表达的条件下培养转染的宿主细胞;
(iii)检测抗体的细胞膜表达;和
(四)选择在细胞膜的表面上呈现抗体的宿主细胞。
此外,上面详述的方法可用于表达双特异性抗体的重组宿主细胞的选择,由此所述宿主细胞与编码scFv-Fc的第三表达构建体或编码scFv-Fc的具有非免疫球蛋白跨膜区如鼠B7-1跨膜区的剪接的第三表达构建体共转染。
所需的宿主细胞的选择可根据本领域已知的方法进行。这样的方法包括,荧光、ELISA、Western印迹、SDS聚丙烯酰胺凝胶电泳、放射免疫测定或通过使用识别并结合到目的蛋白质的抗体或特异性分子如适体。优选地,在宿主细胞的细胞膜上呈现的目的蛋白通过荧光探针检测,或连接到荧光标记,因此允许使用荧光激活细胞分选或FACS的选择。
可以根据本领域技术人员已知的方法实施蛋白质的表达和回收。
在又一个方面,本公开提供如上文描述的表达构建体或表达载体制备用于治疗疾病的药物的用途。
在又一个方面,本公开提供如上文描述的表达构建体或表达载体,其用作治疗疾病的药物。
在又一个方面,本公开提供如上文描述的表达构建体或表达载体,其用于基因疗法。
实施例
实施例1:载体的克隆
介绍
所制备的选择性剪接构建体包含人ighg1基因的剪接供体序列。内含子(包括剪接受体位点)衍生自鸡cTNT内含子4,而外显子衍生自ighgl基因的跨膜区(在下文中称为M1M2)、T细胞受体α的跨膜区(PTCRA)或鼠B7-1基因。在几个构建体,鼠B7-1跨膜结构域由其它跨膜结构域替换,包括天然存在的跨膜结构域以及这些的修饰。此外,B7-1跨膜区中的B7-1胞质尾由具有或不具有ER出口信号的几个其他胞质尾替换。
为了IgG1或IgG4形式的全长抗体的表达,重和轻链的同时表达是必要的。使用共转染策略使用分别的质粒表达所有的亚基。选择性剪接构建体用于IgG1或IgG4重链的表达。IgG1或IgG4的轻链在相同的表达载体骨架中克隆,但没有选择性剪接。
为了内部产生的双特异性抗体形式的表达(技术;在WO2012/131555中所述),必须在细胞中转染三种不同的亚基:重链,轻链和scFv-Fc。为了评价双特异性抗体形式的膜呈现的最佳策略,克隆剪接和选择性剪接构建体用于重链和scFv-Fc的表达。在相同的表达载体骨架中克隆轻链,但没有选择性剪接。表1总结了在该实例中产生的所有构建体。
表1:所产生的所有构建体的汇总(*)
*所列举的序列对于DNA序列从非剪接ORF的最后5个氨基酸至表达构建体的末端延伸以及对于蛋白质序列从相同的氨基酸至融合的跨膜区的末端延伸,除了GSC314(SEQIDNO:48)、GSC315(SEQ ID NO:294)、GSC5607(SEQ ID NO:296)、GSC5644(SEQ ID NO:49)、GSC5608(SEQ ID NO:51)、GSC5540(SEQ ID NO:302)、GSB59(SEQ ID NO:79)(完成ORF序列)。
材料和方法
LB培养板
将500ml水与16g LB琼脂(Invitrogen,Carlsbad,CA,美国)混合并煮沸(1升LB含有10g胰蛋白胨、5g酵母提取物和10g NaCl)。在冷却后,将相应的抗生素添加至溶液,所述溶液随后铺板(氨苄青霉素平板为100μg/ml和卡那霉素平板为50μg/ml)。
聚合酶链反应(PCR)
全部PCR均使用50μl终体积中的1μldNTP(每种dNTP为10mM;Invitrogen,Carlsbad,CA,美国)、2单位DNA聚合酶(Finnzymes Oy,Espoo,芬兰)、25nmol引物A(Mycrosynth,Balgach,瑞士或Operon,Ebersberg,德国)、25nmol引物B(Mycrosynth,Balgach,瑞士或Operon,Ebersberg,德国)、10μl5X HF缓冲剂(7.5mM MgCl2,Finnzymes,Espoo,芬兰)、1.5μl二甲基亚砜(DMSO,Finnzymes,Espoo,芬兰)和1-3μl模板(10-20ng)进行。使用的所有引物在表2中列出。
通过在98℃初始变性3分钟启动PCR,随后是35个循环:在98℃变性30秒,在引物特异性温度(根据CG含量)退火30秒和在72℃下2分钟延长。在72℃进行最终延长10分钟,之后冷却和保持在4℃。
表2:在PCRs中使用的引物汇总。引物从Operon(Ebersberg,德国)或者从Microsynth(巴尔加赫,瑞士)获得。
限制性消化
对于全部限制性消化,将大约1μg质粒DNA(用NanoDrop,ND-1000分光光度计(Thermo Scientific,Wilmington,DE,USA)定量)混合入10-20单位的每种酶、4μl相应10XNEBuffer(NEB,Ipswich,MA,美国)中,并且将体积用无菌H2O补足至40μl。将反应在酶所必需的温度下温育1小时。
在每次制备性消化骨架后,添加1单位牛小肠碱性磷酸酶(CIP;NEB,Ipswich,MA,美国)并将混合物在37℃温育30分钟。
PCR清除
为实现消化,在限制性消化之前,使用Macherey Nagel Extract II试剂盒(Macherey Nagel,Oensingen,瑞士)或Gel和PCR清除试剂盒(相同试剂盒的新商标名)遵循制造商的手册使用40μl的洗脱缓冲液净化全部PCR片段。这种方案还用于改变DNA样品的缓冲液。
DNA提取
使用2%琼脂糖凝胶进行凝胶电泳。使用必要量的UltraPureTM琼脂糖(Invitrogen,Carlsbad,CA,美国)和1X Tris乙酸EDTA缓冲液(TAE,pH 8.3;Bio RAD,Munich,德国)制备这些。为了DNA染色,将1μl Gel Red Dye(Biotum,Hayward,CA,美国)添加至100ml琼脂糖凝胶中。作为大小标志物,使用2μl的1kb DNA梯(NEB,Ipswich,MA,美国)。电泳以125伏运行约1小时。
将目的条带从琼脂糖凝胶切下并使用试剂盒Extract II(Macherey-Nagel,Oensingen,瑞士)Gel和PCR清除试剂盒(相同试剂盒的新商标名)或Qiaquick Gel提取试剂盒(Qiagen,Hilden,德国)遵循制造商的手册使用40μl的洗脱缓冲液或遵循制造商手册进行纯化。
连接
对于每个连接,将4μl插入物与1μl载体、400单位连接酶(T4DNA连接酶,NEB,Ipswich,MA,美国)和1μl10X连接酶缓冲液(T4DNA连接酶缓冲液;NEB,Ipswich,MA,美国),使用UHP水补足至10μl终体积。将混合物在室温温育1-2小时。
转化连接产物成能感受态细菌
为了转化连接产物,使用感受态细菌“TOP 10”(One TOP 10感受态大肠杆菌;Life Technologies,CA,美国)。在冰上融化25-50μl细菌5分钟。随后,将3-5μl连接产物添加至感受态细菌并在冰上温育20-30分钟,随后在42℃短暂热休克1分钟。随后,每管添加500μl S.O.C培养基(Invitrogen,Carlsbad,CA,美国)并在37℃搅拌下温育1小时。最后,将细菌涂布在含氨苄青霉素或卡那霉素(Sigma-Aldrich,St.Louis,MO,美国)的LB平板上并在37℃温育过夜。
小量制备质粒
为了小量制备,将转化细菌的菌落在2.5ml LB和氨苄青霉素或卡那霉素中在37℃,200rpm培育6-16小时。遵循制造商的手册,用大肠杆菌质粒纯化试剂盒(NucleoSpinQuickPure,或NucleoSpin Plasmid(Macherey Nagel,Oensingen,瑞士)或QiagenQuickLyse Miniprep(Qiagen))提取DNA。
通过测量260nm处的吸光度并评估必须在1.8和2之间的OD260nm/OD280nm的比率用NanoDrop ND-1000分光光度计(Thermo Scientific,威尔明顿,DE,USA)一次定量来自小量制备的质粒DNA。在将样品送到Fasteris SA(Plan-les-Ouates,瑞士)用于序列确认之前进行对照消化。
中量制备质粒
为了中等量制备,将转化的细菌在200ml LB和氨苄青霉素(或卡那霉素)中于37℃培育过夜。随后,将培养物以725g离心20分钟并且使用商业试剂盒(NucleoBond XtraMidi;Macherey Nagel,Oensingen,瑞士),遵循制造商的手册中量制备供的方案纯化质粒。
通过测量260nm处的吸光度并评估如通过限制性消化所确认的必须在1.8和2之间的OD260nm/OD280nm的比率用NanoDrop ND-1000分光光度计三次定量来自中量制备的质粒DNA。然后将样品送去测序(Fasteris SA,Plan-les-Ouates,瑞士)。
大量制备质粒
为了大量制备,将转化的细菌在500ml LB和氨苄青霉素(或卡那霉素)中于37℃培育过夜。随后,将培养物以725g离心20分钟并且使用商业试剂盒(NucleoBond PC500或NucleoBond Xtra Maxi;Macherey Nagel,Oensingen,瑞士)遵循制造商的手册中量制备供的方案纯化质粒。
通过测量260nm处的吸光度并评估如通过限制性消化所确认的必须在1.8和2之间的OD260nm/OD280nm的比率用NanoDrop ND-1000分光光度计三次定量来自大量制备的质粒DNA。然后将样品送去测序(Fasteris SA,Plan-les-Ouates,瑞士)。
吉咖制备(Gigapreparation)质粒
为了吉咖制备,将转化的细菌在500ml LB和氨苄青霉素(或卡那霉素)中于37℃培育过夜。随后,将培养物以725g离心20分钟并且使用商业试剂盒(NucleoBond PC10000;Macherey Nagel,Oensingen,瑞士)遵循制造商的手册中量制备供的方案纯化质粒。
通过测量260nm处的吸光度并评估如通过限制性消化所确认的必须在1.8和2之间的OD260nm/OD280nm的比率用NanoDrop ND-1000分光光度计三次定量来自大量吉咖制备的质粒DNA。然后将样品送去测序(Fasteris SA,Plan-les-Ouates,瑞士)。
结果
IgG1抗体的重链的克隆
通过GeneArt(雷根斯堡,德国)优化在本专利中所使用的编码IgG1重链的基因。通过GeneArt在两种不同的质粒中量制备供重链的可变部分和恒定部分。接收之后,在水中溶解GeneArt构建体并使用酶KpnI和ApaI将重链恒定区和重链可变区克隆在一起。由外部CRO执行这项工作并将融合产物运送至Glenmark。该融合构建体测序后,在Fc区的CH2结构域(EEMTK到DELTK)中识别相比于理论序列,重链恒定区中的序列变化。设计引物以通过大引物PCR和同时引入的开放阅读框的方便的限制性位点5'和3来改变该区域。
对原始构建体进行使用引物GlnPr497(SEQ ID NO:2)和GlnPr498(SEQ ID NO:3)的第一PCR。将所得到的扩增子(304bps)以不同的浓度用作第二PCR中的大引物,使用第二引物GlnPr501和原始构建体作为模板。将最终的PCR产物凝胶纯化并克隆到穿梭载体pCR-钝(ZeroPCR克隆试剂盒,Invitrogen,LifeTechnologies)中。小量制备物筛选后,看来虽然插入序列是正确的,对开放阅读框的限制位点5'和3'丢失。因此使用引物GlnPr501(SEQ ID NO:4)和GlnPr498(SEQ ID NO:3)和较高的退火温度(64℃)再扩增插入物。将扩增子凝胶纯化并克隆到pCR-钝(ZeroPCR克隆试剂盒,Invitrogen,LifeTechnologies)中。具有正确的限制图谱的一个小量被选择为使用限制酶HindIII位和XbaI在穿梭载体pSELl中亚克隆。在小量制备物筛选后,生产大量制备。使用限制酶XbaI和HindIII将该大量制备的插入物再切出并克隆到质粒pGLEX41(GSC281,SEQ ID NO:304)的骨架中,用同样的酶打开并用CIP处理。pGLEX41是用于表达的标准内部载体,并包含由鼠CMV启动子,接着是组成性剪接内含子,多克隆位点(MCS)和SV40多聚(A)序列组成的表达盒。在小量制备物筛选后,进行pGLEX41_HC的大量制备并获得质粒批号GSC314。相同DNA的进一步的中量制备或吉咖制备接收质粒批号GSC314a、GSC314b、GSC314c、GSC314d和GSC314e(所有这些制备通过DNA测序确认为相同,并将被称为GSC314质粒(SEQ ID NO:48))。
用于IgG1抗体的膜呈现重链的选择性剪接表达载体的克隆
使用引物GlnPrl518(SEQ ID NO:11),GlnPrl519(SEQ ID NO:12)和GlnPrl520(SEQ ID NO:13)和质粒pGLEX41_HC(GSC314,SEQ ID NO:48)作为模板通过PCR扩增IgG1形式的抗体的重链的编码区。对所得的在扩增子的5'末端和3'末端含有NheI限制性位点的PCR产物进行修饰以便精确地包含用于ighgl基因的NCBI数据库条目的最后40bps(SEQ IDNO:65)以及HindⅢ限制位点。进行3'末端修饰以在IgG1重链的恒定部分的C-末端区域重组天然剪接供体位点。使用限制酶NheI和HindIII切割PCR产物并在pGLEX41(GSC281,SEQ IDNO:304)中克隆,使用相同的酶和CIPed切割。将得到的载体称为pGLEX41_HC-AS(质粒批号GSC3836,SEQ ID NO:287),并通过限制性消化和序列分析证实。用引物GlnPrl516(SEQ IDNO:9)和GlnPrl517(SEQ ID NO:10)从含有其序列(GSC2819,SEQ ID NO:67)的内部质粒扩增鸡肌钙蛋白(cTNT)内含子数4(SEQ ID NO:69)。在心肌和胚胎骨骼肌中特异表达肌钙蛋白。90%以上的mRNA包括早期胚胎心脏和骨骼肌中的外显子,而成人的>95%的mRNA排除该外显子(Cooper&Ordahl(1985)J Biol Chem,260(20):11140-8)。引物加入HindIII位点5'和Agel位点随后BstBI到3'末端。将扩增子凝胶纯化,用HindIII和BstBI消化并克隆到使用相同的酶和CIPed打开的载体pGLEX41_HC-IgAS(GSC3836,SEQ ID NO:287)中。将得到的载体称作pGLEX41_HC-cTNT内含子4(质粒批号GSC3848,SEQ ID NO:289),并通过限制性消化和序列分析证实。
使用质粒GlnPrl521(SEQ ID NO:14)和GlnPrl522(SEQ ID NO:15)装配编码人类ighg1基因的跨膜区(M1M2)的序列。这些引物部分重叠,并被使用PCR完成以使双链DNA加倍。将钝端PCR产物克隆到pCR-钝(Zero PCR克隆试剂盒,Invitrogen,LifeTechnologies),从而导致通过测序证实的质粒pCRblunt-M1M2。用引物GlnPrl523(SEQID NO:16)和GlnPrl524(SEQ ID NO:17)再扩增插入物以完成M1M2跨膜结构域序列。将扩增子凝胶纯化,用AgeI和BstBI消化,并克隆到载体pGLEX4l_HC-cTNT内含子4(GSC3848,SEQID NO:289)中。将所得质粒命名为pGLEX41_HC-I4-M1M2-M1M2-M1M2并以大量制备规模生产,获得质粒批号GSC3899并通过序列分析证实(SEQ ID NO:36)。
为了增加表达和膜呈现抗体之间的剪接比,减少编码跨膜区的外显子的多聚(Y)道中的嘧啶的数量。对于这种情况,使用引物GlnPrl516(9 SEQ ID NO:9)和GlnPrl649(SEQID NO:18)从内部载体(GSC3469,SEQ ID否.68)扩增I4(0Y)片段(SEQ ID NO:70)。将扩增子用限制性酶HindIII和AgeI消化并克隆到使用相同的酶打开并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)的骨架中。小量制备物筛选之后,制备了中量制备pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2,接收批号GSC4398并通过测序证实(SEQ ID NO:37)。
将多聚(A)引入这样的内含子中,所述内含子分开编码IgG1的外显子和编码跨膜区的备用外显子。用引物GlnPrl650(SEQ ID NO:19)和GlnPrl651(SEQ ID NO:20)从内部载体(GSC3469,SEQ ID NO:305)扩增SV40多聚(A)信号。将扩增子用限制酶ClaI消化,并克隆到使用ClaI和CIPed消化的载体pGLEX41_HC-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)中,导致I4(聚A)内含子(SEQ ID NO:71)。在小量制备物筛选和插入物的正确取向的确认后,制备pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2中量制备物,获得批号GSC4401并通过测序证实(SEQ ID NO:38)。
将胃泌素终止子序列预先加入到与pGLEX41(GSC281,SEQ ID NO:304)共享相同的一般骨架但载有不同的启动子的内部载体(GSC23,SEQ ID NO:306)的SV40多聚(A)信号中。将SV40多聚(A)和胃泌素终止子的融合以质粒命名法指定为“SV40ter”(SEQ ID NO:306)。将GSC23(SEQ ID NO:306)的表达盒(启动子+编码序列)替换为pGLEX41_HC-I4-M1M2-M1M2-M1M1(GSC3899,SEQ ID NO:36)的表达盒,除了SV40多聚(A)信号(即启动子和编码序列)。将插入物用限制酶BstBI及Nrul切出并克隆到用相同的酶消化并用CIP处理的GSC23(SEQ IDNO:306)的骨架中。在小量制备物筛选之后,制备质粒pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter的中量制备,获得质粒批号GSC4402并通过测序(SEQ ID NO:39)确认。
另一个优选的构建体包括具有内含子中的胃泌素终止子的多聚(A)信号。I4(SV40ter)的序列以SEQ ID NO:77给出。
使用人T细胞受体α跨膜结构域(PTCRA)克隆用于IgG1抗体的膜呈现重链的选择性剪接表达载体
为了用人T细胞受体α(PTCRA)基因的跨膜结构域替换选择性剪接构建体中的M1M2跨膜区,互补引物GlnPrl799(SEQ ID NO:28)和GlnPrl735(SEQ ID NO:26)用于产生插入片段。这些引物部分重叠,并使用PCR完成以使双链DNA加倍。将插入片段用AgeI和BstBI切割并克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQID NO:36)的骨架中。由于插入物的一部分从所得的小量制备丢失,使用引物GlnPrl799(SEQ ID NO:28)和GlnPr269(SEQ ID NO:1)对小量制备进行新的扩增。将扩增的插入片段用AgeI和BstBI消化并克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398,SEQ ID NO:37)的骨架中。将小量制备通过测序确认,并用引物GlnPrl840(SEQ ID NO:31)和GlnPr269(SEQ ID NO:1)用于另一PCR。将扩增子用AgeI和BstBI消化并克隆到使用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)、pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398、SEQ IDNO:37)、pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2(GSC4401,SEQ ID NO:38)和pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402,SEQ ID NO:39)中。连接分别导致中量制备pGLEX41_HC-I4-PTCRA(GSC5854,SEQ ID NO:40)、pGLEX41_HC-I4(0Y)-PTCRA(GSC5855,SEQID NO:41)、pGLEX41_HC-I4(polyA)-PTCRA(GSC5857,SEQ ID NO:42)和pGLEX41_HC-I4-PTCRA-SV40ter(GSC5856,SEQ ID NO:43)。所有中量制备通过测序验证。
使用M1M2-PTCRA融合构建体克隆用于IgG1抗体的膜呈现重链的选择性剪接表达载体
从GeneArt订购名称为GeneArt_Seq32(SEQ ID NO:64)的编码M1M2-PTCRA融合构建体的插入物。该片段包含IgG1重链中的常规M1M2跨膜区,不同的是跨膜结构域由T细胞受体α亚基(PTCRA)的跨膜结构域替换。用限制酶AgeI和BstBI切割由GeneArt提供的质粒并分别在用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ IDNO:36)、pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398,SEQ ID NO:37)、pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2(GSC4401,SEQ ID NO:38)和pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402,SEQ ID NO:39)的骨架中连接纯化的插入物。
连接导致中量制备物pGLEX41_HC-I4-M1M2-PTCRA-M1M2(GSC6030,SEQ ID NO:44)、pGLEX41_HC-I4(0Y)-M1M2-PTCRA-M1M2(GSC6048,SEQ ID NO:45)、pGLEX41_HC-I4(polyA)-M1M2-PTCRA-M1M2(GSC6047,SEQ ID NO:46)和pGLEX41_HC-I4-M1M2-PTCRA-M1M2-SV40ter(GSC6046,SEQ ID NO:47)。所有中量制备物经测序确认。
生成第一M1M2-PTCRA融合,这些构建体允许IgG1的膜呈现并且关于内含子的修饰表现出与天然M1M2构建体相同的行为(参见实施例3中的图6)。
设计进一步的构建体pGLEX41_HC-I4-M1M2-PTCRA-M1M2_校正以实现对跨膜区中的跨膜结构域的修饰的影响的正确分析。
对于该构建体,进行融合PCR。用引物GlnPrl285(SEQ ID NO:259)和GlnPr2378(SEQ ID NO:221)从质粒pGLEX41_HC-I4-M1M2-M1M2-M1M2-(GSC3899,SEQ ID NO:36)扩增M1M2跨膜区的cTNT 4内含子的一部分和M1M2胞外部分。用引物GlnPr2379(SEQ ID NO:222)和GlnPrl650(SEQ ID NO:19)从相同的模板扩增M1M2跨膜区的胞质尾以及SV40多聚(A)信号。引物GlnPr2378(SEQ ID NO:221)和GlnPr2379(SEQ ID NO:222)允许创建校正的PTCRA跨膜结构域的两个PCR产物的重叠端部的创建。然后用引物GlnP1285(SEQ ID NO:259)和GlnPrl650(SEQ ID NO:19)从这两个第一PCR产物进行重叠PCR。将所得到的融合PCR产物用AgeI和BstBI消化并在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)中连接。小量制备物筛选后,生产中量制备pGLEX41_HC-I4-M1M2-PTCRA-M1M2_校正,获得质粒批号GSC11206并通过测序(SEQ ID NO:284)确认。
使用鼠B7-1跨膜区克隆用于IgG1抗体的膜呈现重链的选择性剪接表达载体
为了将跨膜区改变为鼠B7-1基因的跨膜区,进行融合PCR。
首先,使用引物GlnPr2100(SEQ ID NO:33)和GlnPr2101(SEQ ID NO:34)从内部构建体(订购自GeneArt,为GeneArt_Seq43,SEQ ID NO:66)通过PCR扩增编码鼠B7-1跨膜区的序列。
对于载体pGLEX41_HC-I4(0Y)-B7-B7-B7的克隆,用引物GlnPrl516(SEQ ID NO:9)和GlnPr2102(SEQ ID NO:35)从模板pGLEX41_HC-I4(0Y)-M1M2-M1M2-M1M2(GSC4398,SEQID NO:37)通过PCR扩增编码cTNT-I4(0Y)的片段。使用引物GlnPr2100(SEQ ID NO:33)和GlnPr2101(SEQ ID NO:34)从内部构建体(订购自GeneArt,为GeneArt_Seq43,SEQ ID NO:66)通过PCR扩增编码鼠B7-1跨膜区的序列。使用引物GlnPrl516(SEQ ID NO:9)和GlnPr2100(SEQ ID NO:33)融合这两个PCR产物。将所得PCR产物用BstBI和HindIII消化,并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ IDNO:36)中。在小量制备物筛选之后,生产pGLEX41_HC-I4(0Y)-B7-B7-B7的中量制备,获得批号GSC7057并通过限制性消化和测序(SEQ ID NO:53)确认。
对于载体pGLEX41_HC-I4(聚A)-B7-B7-B7的克隆,用引物GlnPrl516(SEQ ID NO:9)和GlnPr2099(SEQ ID NO:32)从模板pGLEX41_HC-I4(polyA)-M1M2-M1M2-M1M2(GSC4401,SEQ ID NO:38)通过PCR扩增编码cTNT-I4(聚A)的片段。用引物GlnPr2100(SEQ ID NO:33)和GlnPr2101(SEQ ID NO:34)从内部构建体(订购自GeneArt,为GeneArt_Seq43,SEQ IDNO:66)通过PCR扩增编码鼠B7-1跨膜区的序列。使用引物GlnPrl516(SEQ ID NO:9)和GlnPr2100(SEQ ID NO:33)融合这两个PCR产物。将所得PCR产物用BstBI和HindIII消化,并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ IDNO:36)中。在小量制备物筛选之后,为所得的pGLEX41_HC-I4(聚A)-B7-B7-B7中量制备提供批号GSC7057并通过限制性消化和测序(SEQ ID NO:54)确认。
对于载体pGLEX41_HC-I4-B7-B7-B7的克隆,用引物GlnPrl516(SEQ ID NO:9)和GlnPr2099(SEQ ID NO:32)从模板pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)通过PCR扩增cTNT-I4。使用引物GlnPr2100(SEQ ID NO:33)和GlnPr2101(SEQ ID NO:34)从内部构建体(订购自GeneArt,为GeneArt_Seq43,SEQ ID NO:66)通过PCR扩增编码鼠B7-1跨膜区的序列。使用引物GlnPrl516(SEQ ID NO:9)和GlnPr2100(SEQ ID NO:33)融合这两个PCR产物。将所得PCR产物用BstBI和HindIII消化,并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)中。在小量制备物筛选之后,为所得的pGLEX41_HC-I4-B7-B7-B7中量制备提供批号GSC7056并通过限制性消化和测序(SEQ ID NO:55)确认。
对于载体pGLEX41_HC-I4-B7-B7-B7-SV40ter的克隆,使用与用于pGLEX41_HC-I4-B7-B7-B7构建体的相同的PCR产物,用BstBI和HindIII消化,并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-M1M2-M1M2-M1M2-SV40ter(GSC4402,SEQ ID NO:39)中。在小量制备物筛选之后,为所得的pGLEX41_HC-I4-B7-B7-B7-SV40ter中量制备提供批号GSC7059并通过限制性消化和测序(SEQ ID NO:56)确认。
使用鼠B7-1跨膜区进一步减少分泌到IgG1抗体的膜呈现重链的剪接比
已经呈现利用鼠B7-1跨膜区,嵌合蛋白的膜呈现高度有效(Chou W-C et al.,(1999)Biotechnol Bioeng,65:160-9;Liao K-W et al.,(2001)Biotechnol Bioeng,73:313-23)。本文也呈现,降低剪接-受体的多聚(Y)道中的Ys的量为0显著降低细胞膜上的呈现抗体的量(见实施例3中的图6F)。
为了评估内含子的多聚(Y)道中的嘧啶的量的减少的效果,通过PCR融合产生若干构建体。
表3:内含子的修饰:用于PCR的引物对和模板。
第一PCR允许从含有修饰的内含子的内部骨架扩增所需的内含子。用于每个构建体的引物和模板列于表3中。第二PCR(对所有构建体共同的)允许用引物GlnPr2101(SEQIDNO:34)和GlnPr2100(SEQ ID NO:33)从构建体pGLEX41_HC 6-14B7-B7-B7(GSC7056,SEQ IDNO:55)扩增B7-1跨膜结构域。在这些PCR产物纯化后,用引物GlnPr1516(SEQID NO:9)和GlnPr2100(SEQ ID NO:33)通过重叠延伸PCR融合内含子和跨膜结构域。将纯化的PCR产物用HindIIII和BstB消化,并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。在小量制备物筛选之后,对每个构建体生产中量制备物并通过测验证。属于每个构建体的质粒批号如下:
pGLEX41_HC-I4(3Y)-I4-B7-B7-B7 | GSC9770(SEQ ID NO:62) |
pGLEX41_HC-I4(5Y)-I4-B7-B7-B7 | GSC9763(SEQ ID NO:61) |
pGLEX41_HC-I4(5Y-5)-I4-B7-B7-B7 | GSC9768(SEQ ID NO:60) |
pGLEX41_HC-I4(9Y)-I4-B7-B7-B7 | GSC9949(SEQ ID NO:59) |
pGLEX41_HC-I4(15Y-3’)-I4-B7-B7-B7 | GSC9950(SEQ ID NO:63) |
减少剪接的另一种方式是削弱剪接供体位点。该剪接供体的特征在于定义内含子的5'端的共有序列。因此,设计两个构建体,其中修饰剪接供体共有序列的DNA序列而不影响通过基因表达的蛋白质序列。
对于SD_CCC构建体用引物GlnPrl518(SEQ ID NO:11)和GlnPr2161(SEQ ID NO:313)以及对于SD_GGC构建体用GlnPrl518(SEQ ID NO:11)和GlnPr2160(SEQ ID NO:314),在模板pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)上进行具有修饰的3'末端序列的IgG1重链的PCR扩增。将PCR用NheI和HindIIII消化,并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。在小量制备物筛选之后,生产中量制备物pGLEX41_HC-SD_CCC-I4-B7-B7-B7(质粒批号GSC9764,SEQ ID NO:58)和pGLEX41_HC-SD_GGC-I4-B7-B7-B7(质粒批号GSC9765,SEQ ID NO:57)并通过测序验证。构建体pGLEX41_HC-SD_GGC-I4-B7-B7-B7的内含子序列以SEQ ID NO:78给出。
用仅具有疏水残基的类似长度的跨膜结构域替换B7-L跨膜结构域
为了评估跨膜结构域对膜呈现的影响,设计了若干构建体。据认为主要含有疏水残基的跨膜螺旋对表面呈现的稳定有利,因此,作为第一种方法,将B7-1跨膜区的B7-1跨膜结构域替换为只含有疏水残基的其他蛋白质的跨膜结构域。此外,由于跨膜螺旋的长度可能影响表面呈现,这些第一构建体仅由具有与B7-1跨膜结构域类似的长度的跨膜结构域组成。
这些跨膜结构域的序列和特征总结在表4中。
表4:具有22-23个氨基酸(都疏水)的跨膜结构域:特征和序列
表5:用于疏水跨膜结构域的克隆的引物对
用修饰跨膜结构域的3'端的引物通过cTNT内含子4的一部分的2步PCR扩增创建不同的跨膜结构域。模板一直是pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)构建体。对于每个构建体,用表5中所列的相应的引物进行第一轮PCR。在清除该第一轮PCR产物之后,用表5中所列的引物进行第2轮PCR。清除后,将这些PCR产物用AgeI和ClaI消化,并连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。在确认小量水平的序列之后,生产不同构建体的中量制备物并将下列GSC号分配给这些质粒批次:
通过测序确认所有中量制备物。
用包含带电和/或极性残基的类似长度的跨膜结构域替换B7-L跨膜结构域
由于仅含有疏水残基的跨膜结构域对表面呈现没有影响(见实施例4中的图10),其它跨膜结构域被选择具有与B7-1跨膜结构域相似的长度但包含一个或多个带电和/或极性的残基。
这些跨膜结构域的序列和特征总结在表6中。
表6:含有带电和/或极性的残基的具有21-24个氨基酸的跨膜结构域:特征和序列。
表7:用于含有带电和/或极性的残基的具有21-24个氨基酸的跨膜结构域的克隆的GeneArt构建体。
从GeneArt订购具有表7所示的名称的不同的跨膜结构域(除了PTCRA)。一旦收到,在水中再悬浮GeneArt构建体,然后用AgeI和ClaI消化。将所得的插入物连接在用同样的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。小量制备物筛选后,生产中量制备物并获得了以下批号:
对于构建体pGLEX41_HC-I4-B7-PTCRA-B7,进行两步PCR。使用引物GlnPrl516(9SEQ ID NO:9)和GlnPr2380(SEQ ID NO:223)以及pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)作为模板扩增具有B7-1跨膜区的B7胞外部分的cTNT内含子。将所得的PCR产物用引物GlnPrl516(SEQ ID NO:9)和GlnPr2381(SEQ ID NO:224)再扩增。引物GlnPr2380(SEQ ID NO:223)和GlnPr2381(SEQ ID NO:224)允许融合PTCRA跨膜结构域到B7-1跨膜区的B7-1胞外部分。将所得的PCR产物用ClaI和AgeI消化,并在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中再克隆。在小量制备物筛选选之后,制备中量制备pGLEX41_HC-I4-B7-PTCRA-B7。其获得批号GSCl 1204,并通过测序(SEQID NO:93)确认。
PTCRA跨膜结构域中的带电残基的修饰
PTCRA跨膜结构域长度为21个氨基酸,其中3个是带电残基。这些带电残基的存在可能解释表面呈现系统中的特定跨膜结构域的相对差性能(参见实施例4中的图11)。因此,这些残基突变成疏水性氨基酸缬氨酸可能对表面呈现有益。
表8:PTCRA跨膜结构域中的带电残基的突变:序列,引物和DNA批号:
用作为正向引物的GlnPrl516(SEQ ID NO:9)以及表8中描述的用于不同的构建体的反向引物,使用pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)作为模板,通过两步PCR生成PTCRA跨膜结构域中的非突变和突变带电残基的所有可能的组合。在第一轮PCR后,清除PCR产物并用GlnPrl516(SEQ ID NO:9)作为正向引物以及表8中所述的反向引物进行第二轮PCR。清除所得的PCR产物,用消化ClaI和Age I消化并连接在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。小量制备物筛选后,以中量制备规模制备阳性构建体并通过测序确认。各构建体的批号如下:
由含有带电和/或极性残基的不同长度的跨膜结构域替换B7-L跨膜结构域
由于在跨膜结构域中存在带电和残基不消除表面呈现(参见实施例4中的图12),使用比B7-1跨膜结构域更短或更长并且这次含有一个或多个带电和/或极性残基的跨膜结构域评估跨膜结构域的长度。
这些跨膜结构域的序列和特征总结在表9中。
表9:含有带电和/或极性残基的不同长度的跨膜结构域:特征和序列。
表10:用于含有带电和/或极性的残基的具有不同长度的跨膜结构域的克隆的GeneArt构建体。
从GeneArt订购具有表10所示的名称的不同的跨膜结构域。一旦收到,在水中再悬浮GeneArt构建体,然后用AgeI和ClaI消化。将所得的插入物连接在用同样的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。小量制备物筛选后,生产中量制备物并获得了以下批号:
B7-L跨膜结构域长度的修饰
为了评估表面呈现上的跨膜长度的影响,通过在B7-1跨膜结构域序列的中间移除或加入疏水性残基产生B7-1跨膜结构域的不同变体。
表11:B7-1跨膜结构域长度的修饰:序列和引物对。
为了这个目的,进行引物退火。对于B7-1跨膜结构域的每个变体,订购其3'端退火的引物。用于每个构建体的引物对在表11中描述。允许引物退火,然后将序列通过PCR完成。清除后,将所得PCR产物用Sfol和Agel直接消化,并克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)骨架中,或连接到pCR-钝(ZeroPCR克隆试剂盒,Invitrogen,LifeTechnologies)穿梭载体中(由于退火产物非常短,直接连接并不是对于每种产物奏效)。在第二种情况下,从在pCR-钝(Zero PCR克隆试剂盒,Invitrogen,LifeTechnologies)中连接退火产物之后获得的克隆提取小量制备。序列确认后,将阳性小量制备物用Sfol和AgeI消化并将得到的片段连接克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)骨架中。小量制备物筛选后,对每种构建体制备中量制备物。如下所述地对这些中量制备物分配GSC批号并通过测序确认。
B7-1跨膜区中的胞质尾的修饰
由于胞质尾(具有或不具有ER出口信号)可能影响表面呈现,用修饰的胞质尾设计若干构建体。
这些胞质尾的序列和特征总结在表12中。
表12:胞质尾:特征和顺序。
根据不同的构建体的长度施加不同的克隆策略。
用修饰胞质尾的引物通过具有B7-1胞外和跨膜结构域的cTNT内含子4的PCR扩增产生第一构建体。
表13:用于胞质尾修饰的引物对和酶。
所使用的引物对在表13中描述并且所使用的模板是pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)。将纯化的PCR产物用表13中描述的酶消化,并在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中克隆。小量制备物筛选后,生产获得以下批号的中量制备物:
所有中量制备物经测序确认。
为了融合M1M2胞质尾到B7-1跨膜区,进行融合PCR。使用pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)作为模板,用GlnPrl516(SEQ ID NO:9)和GlnPr2391(SEQ ID NO:234)扩增具有B7-1胞外和跨膜结构域的cTNT内含子4。使用pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)作为模板,用引物GlnPr2390(SEQ ID NO:233)和GlnPrl650(SEQ ID NO:19)扩增具有SV40多聚(A)信号的M1M2胞质尾。清除后,使用GlnPrl516(SEQ IDNO:9)和GlnPrl650(SEQ ID NO:19)作为引物将这两种PCR产物在第三轮PCR中融合。将所得的PCR产物清除,用Sfol和BstBI消化并连接在用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。在小量制备物筛选后,生产中量制备pGLEX41_HC-I4-B7-B7-M1M2,获得批号GSC11758并通过测序确认(SEQ ID NO:114)。
对于一些构建体,选择了引物退火的战略。对于每一个胞质尾,订购在其3’端退火的引物。用于每个构建体的引物对在表14中描述。允许引物退火,然后将序列通过PCR完成。清除后,将所得PCR产物用Sfol和BstBI直接消化和克隆到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)骨架中,或连接到PCR-钝穿梭载体(ZeroPCR克隆试剂盒,Invitrogen,LifeTechnologies)中(由于退火的产物非常短,直接连接不是对每一种产物奏效)。在第二种情况下,从在pCR-钝(ZeroPCR克隆试剂盒,Invitrogen,LifeTechnologies)中连接退火产物之后获得的克隆提取小量制备。序列确认后,将阳性小量制备物用Sfol和BstBI消化并将得到的片段连接到用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)骨架中。小量制备物筛选后,对每种构建体制备中量制备物。如表14所述地对这些中量制备物分配GSC批号并通过测序确认这些制备物。
表14:用于胞质尾修饰的引物退火所使用的引物对和DNA批号。
最后,对于最后的构建体,从GeneArt订购具有表15所述的序列名称的序列。一旦收到,在水中再悬浮GeneArt构建体,然后用SfoI和BstBI消化。将所得的插入物连接在用同样的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。小量制备物筛选后,生产中量制备物并获得在下表中详述的批号。
表15:为胞质尾修饰和DNA批号订购的GeneArt序列。
为了进一步评估B7-1胞质尾的影响,通过B7-1胞质尾替换M1M2跨膜结构域的胞质尾。为了这个目的,从GeneArt订购为GeneArt_Seq82(SEQ ID NO:264)的具有B7-1胞质尾的M1M2跨膜结构域。将GeneArt构建体用ClaI和BstBI消化并将插入物连接在用相同的酶消化并用CIP处理的骨架pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中。小量制备物筛选后,生产中量制备物pGLEX41_HC-M1M2-M1M2-B7,获得质粒批号GSC11294并通过测序确认(SEQ ID NO:125)。
用于IgG1抗体的轻链的表达的载体的克隆
从GeneArt提供的携带轻链插入物(0704970pGA4)克隆载体用作使用引物GlnPr501(SEQ ID NO:4)和GlnPr502(SEQ ID NO:5)的PCR的模板。这些引物扩增轻链的开放阅读框并添加HindⅢ限制位点5'和XbaI限制位点3'到开放阅读框。将扩增子用XbaI和HindIII消化,并使用XbaI和HindIII连接在穿梭载体切出中。小量制备物筛选后,生产吉咖制备物,其通过测序和消化确认。
用XbaI和HindIII从该吉咖制备物切割IgG1形式的抗体的轻链的编码区,并克隆到用相同的酶打开并用CIP处理的质粒pGLEX41(GSC281,SEQ ID NO:304)的骨架中。小量制备物筛选后,产生pGLEX41_LC的大量制备物,获得批号GSC315(SEQ ID NO:294),并通过测序确认。随后,以中量制备或吉咖制备水平生产相同的DNA的几个批次并获得批号GSC315a,GSC315b,GSC315c,GSC315d和GSC315e(因为所有这些制备物通过测序确认,以下将它们称为GSC315质粒(SEQ ID NO:294))。
用于IgG4抗体的轻链的表达的载体的克隆
编码IgG4重链的序列在Glenmark生成并在穿梭载体中获得。用引物GlnPrl488(SEQ ID NO:328)和GlnPrl452(SEQ ID NO:327)通过PCR扩增IgG4重链编码序列。纯化后,将得到的PCR产物用引物GlnPrl494(SEQ ID NO:260)和GlnPrl452(SEQ ID NO:327)再扩增。这两轮PCR修饰前导肽,并在编码序列的两端添加限制性位点。将得到的PCR产物进行纯化,并在穿梭载体pCR-钝(ZeroPCR克隆试剂盒,Invitrogen公司,LifeTechnologies)中克隆。小量制备物筛选后,用SpeI和ClaI消化阳性克隆以提取IgG4重链编码序列。将所得的插入物连接在用NheI和BstBI消化和用CIP处理的pGLEX41(GSC281,SEQ ID NO:304)中。小量制备物筛选后,生产吉咖制备物pGLEX41_IgG4-HC,获得质粒批号GSB59并通过测序确认(SEQ ID NO:79)。
用允许B7-1跨膜区的表达的选择性剪接克隆用于IgG4抗体的重链的表达的载体
为了添加用于膜结合IgG4表达的选择性剪接盒,使用pGLEX41_IgG4-HC(GSB59,SEQ ID NO:79)作为模板,用引物GlnPrl494(SEQ ID NO:260)和GlnPr2294(SEQ ID NO:261)通过PCR扩增用于IgG4重链的编码序列。将所得的PCR产物清除,用SpeI和HindIII消化并连接到用NheI和HindIII消化和用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ IDNO:55)骨架中。小量制备物筛选后,制备中量制备物pGLEX41_IgG4-HC-B7 B7-B7,其获得质粒批号GSC11218并通过测序确认(SEQ ID NO:80)。
用于IgG4抗体的轻链的表达的载体的克隆
编码IgG4轻链的序列在Glenmark生成并在穿梭载体中获得。使用具有三种不同的引物GlnPrl487(SEQ ID NO:325),GlnPrl491(SEQ ID NO:326)和GlnPrl494(SEQ ID NO:260)的单轮PCR,交换前导肽并在编码序列的两端添加限制性位点。将PCR产物用SpeI和ClaI消化,并在用NheI和BstBI打开和用CIP处理的pGLEX41(GSC281,SEQ ID NO:304)骨架中连接。小量制备物筛选后,生产中量制备物pGLEX41_IgG4-LC,获得质粒批号GSC3704并通过测序确认(SEQ ID NO:319)。
用于双特异性抗体的分泌重链的表达的载体的克隆
在Glenmark生成双特异性抗体的重链作为双特异性形式的一部分。使用两轮PCR,添加Kozak序列,信号肽和侧翼限制性位点。在第一轮中,使用引物GlnPrl726(SEQID NO:24)和GlnPrl500(SEQ ID NO:7)扩增模板。将PCR产物纯化并用作模板用于使用引物GlnPrl500(SEQ ID NO:7)和GlnPrl725(SEQ ID NO:23)的第二轮PCR。将所得的扩增子纯化并使用限制酶SpeI和ClaI切割。将该插入物克隆到用NheI和BstBI打开和用CIP处理的骨架pGLEX41(GSC281,SEQ ID NO:304)中。小量制备物筛选后,以中量制备规模生产pGLEX41_BEAT-HC-His并获得批号GSC5607(SEQ ID NO:296)。测序对照和限制性消化确认质粒。
将该质粒作为模板用于使用引物GlnPrl725(SEQ ID NO:23)和GlnPrl760(SEQ IDNO:27)的修饰的PCR,用于从模板序列去除His-标签。将扩增子用SpeI和ClaI消化并克隆到用限制酶NheI和BstBI打开和用CIP处理的载体pGLEX41(GSC281,SEQ ID NO:304)的骨架中。小量制备物筛选后,对中量制备物pGLEX41_BEAT-的HC提供质粒批号GSC5644并通过测序确认(SEQ ID NO:49)。
用于双特异性抗体的膜呈现重链的选择性剪接表达载体的克隆
使用引物GlnPrl800(SEQ ID NO:29)和GlnPrl725(SEQ ID NO:23)扩增编码BEAT重链(GSC5644,SEQ ID NO:49)的模板载体。将纯化的产物用限制酶SpeI和HindIII消化并克隆到使用酶NheI和HindIII打开并用CIP处理的载体pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)中。小量制备物筛选后,大量制备物pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2获得质粒批号GSC5537(SEQ ID NO:50)并通过限制性消化和测序确认。
为了使用B7-1跨膜区用于表面呈现,将构建体pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(GSC5537,SEQ ID NO:50)的插入物用SacI和HindIII消化,并在用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中再克隆。小量制备物筛选后,生产大量制备物pGLEX41_BEAT-HC-I4-B7-B7-B7,获得质粒批号GSC10488并通过测序确认(SEQ ID NO:321)。
用于双特异性抗体的分泌的scFv-Fc的表达载体的克隆
内部开发scFv-Fc序列作为双特异性形式的一部分。使用引物GlnPrl690(SEQ ID NO:22)、GlnPrl689(SEQ ID NO:21)和GlnPrl502(SEQ ID NO:8)进行扩增。这些引物添加Kozak序列,信号肽和限制性位点到扩增子。使用引物GlnPrl689(SEQ ID NO:21)和GlnPrl502(SEQ ID NO:8)再次扩增PCR产物,并将所得的扩增子用NheI和ClaI消化。该插入片段与使用NheI和BstBI切割和用CIP处理的骨架pGLEX41(GSC281,SEQ ID NO:304)连接。小量制备物筛选后,生产具有批号GSC5608(SEQ ID NO:51)的中量制备物pGLEX41_scFv-Fc并通过限制性消化和测序确认。
用于双特异性抗体的膜呈现scFv-Fc的选择性剪接表达载体的克隆
使用引物GlnPrl801(SEQ ID NO:30)和GlnPrl689(SEQ ID NO:21)扩增编码scFv(GSC5608,SEQ ID NO:51)的模板载体。将纯化的产物用NheI和HindIII消化,并在使用相同的酶打开和用CIP处理的载体pGLEX41_HC-I4-M1M2-M1M2-M1M2(GSC3899,SEQ ID NO:36)中克隆。小量制备物筛选后,生产具有质粒批号GSC5538(SEQ ID NO:52)的中量制备物pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2并通过限制性消化和测序确认。
为了使用B7-1跨膜区用于表面呈现,将构建体pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(GSC5537,SEQ ID NO:50)的插入物用NheI和HindIII消化,并在用相同的酶消化并用CIP处理的pGLEX41_HC-I4-B7-B7-B7(GSC7056,SEQ ID NO:55)中再克隆。小量制备物筛选后,生产大量制备物pGLEX41_scFv-Fc-I4-B7-B7-B7,获得质粒批号GSC10487并通过测序确认(SEQ ID NO:323)。
用于双特异性抗体的轻链的表达载体的克隆
内部开发轻链序列作为双特异性形式的一部分。使用引物GlnPrl689(SEQ ID NO:21),GlnPrl727(SEQ ID NO:25)和GlnPrl437(SEQ ID NO:6)实施扩增。这些引物添加信号肽,Kozak序列和侧翼限制性位点到扩增子。将扩增子纯化并使用限制酶ClaI和NheI消化和在用NheI和ClaI打开并用CIP处理的穿梭载体的骨架中克隆。小量制备物筛选后,制备大量制备物并通过测序验证。使用限制酶NheI和ClaI消化编码双特异性构建体的轻链的穿梭载体并将该插入物克隆到用NheI和BstBI打开并用CIPed处理的载体pGLEX41(GSC281,SEQ ID NO:304)中。小量制备物筛选,制备pGLEX41_BEAT-LC的中量制备物(质粒批号GSC5540,SEQ ID NO:302)并通过限制性消化和测序确认质粒。
实施例2:翻译产物的表面呈现和特异性检测
介绍
实施例1描述了从相同的DNA模板克隆导致两种不同的mRNA的表达的选择性剪接构建体,编码分泌蛋白或具有C末端跨膜区(TM)的相同的蛋白质。如在定义部分详细描述的,跨膜区包括任选的连接子、跨膜结构域和任选的胞质尾。在CHO-S细胞中转染这些构建体,以确定该技术是否可用于在细胞膜上呈现蛋白的一部分,同时保持靶蛋白的有效的分泌。
三种不同的蛋白质在本实验中使用:IgG1亚类的抗体,IgG4亚类的抗体和形式的双特异性抗体。
材料与方法
转染
在50ml生物反应器管(Tubespins,TPP)形式中用使用聚乙烯亚胺( Polyplus-转染,伊尔基希,法国)的表达载体转染悬浮CHO-S细胞。为了这个目的,在5ml的OptiMEM培养基(#31985-047,Invitrogen)或CD-CHO培养基(#10743-011,LifeTechnologies)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。细胞悬浮液中的最终DNA浓度为2.5μg/mL。在37℃振荡(200rpm)下温育5小时后,将5ml的新鲜培养基加入到细胞悬浮液中。然后将细胞在37℃,5%CO2和80%湿度下在摇动平台上温育。
表面染色
转染后第1天,进行细胞的表面染色。收获总共1E5细胞,并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2%FBS在PBS中)洗涤两次,然后再悬浮在含有检测抗体的100μL洗涤缓冲液中。使用通过红色激光(640nm)激发和在光谱范围661/19nm内检测的小鼠抗-人κ轻链APC标记的抗体(#561323,BD Pharmingen)进行κ轻链的特异性检测。使用通过蓝色激光(488nm)激发和在光谱范围583/26nm内检测的PE缀合的山羊抗人Fcγ特异性抗体(#12-4998-82,eBioscience)检测重链和scFv-Fc两者并且使用通过蓝色激光在488nm下激发和在光谱范围525/30内检测的FITC标记的蛋白A(#P5145,Sigma)特异性地检测scFv-Fc。在室温下在黑暗中温育20分钟后,将细胞在洗涤缓冲液中洗涤一次,并再悬浮于200μL的洗涤缓冲液中用于流式细胞分析。用Guava流式细胞仪(Merck Millipore)或用FACSCalibur(Becton Dickinson)分析细胞。
使用八位QK仪(Fortebio,门洛帕克,CA)和蛋白A生物传感器在转染后第4-6天测量分泌的分子的瞬时表达水平。
结果
对于IgG1抗体表达,如在材料和方法部分中所述地转染CHO-S细胞,分别使用表达轻链的表达载体pGLEX41_LC(SEQ ID NO:294)和命名为pGLEX41_HC-I4-B7-B7-B7(SEQ IDNO:55),pGLEX41_HC-I4-M1M2-M1M2-M1M2(SEQ ID NO:36),pGLEX41_HC-I4-PTCRA(SEQ IDNO:40)或pGLEX41_HC-I4-M1M2-PTCRA-M1M2_校正(SEQID NO:284)的第二载体。作为对照,使用编码分泌重链的非剪接构建体(SEQ ID NO:48)。
转染后,如材料和方法中描述地染色并通过流式细胞仪分析细胞。表达轻链和重链的分泌版本的阴性对照(无跨膜区的选择性剪接)仅得到具有相对高的IgG1分泌水平(见图2F)的低强度的表面染色(参见用于染色的细胞的百分比的图2A和图2E中的未填充的直方图)。与此相反,用包含M1M2区域的构建体(SEQ ID NO:36)转染的细胞表现出在细胞膜上呈现该抗体的显著阳性群(参见图2B中的填充的直方图)。通过PTCRA跨膜区(参见图2C;SEQID NO:40)交换整个M1M2跨膜区,或通过PTCRA的跨膜结构域(参见图2D;SEQ ID NO:284)特异性交换M1M2的跨膜结构域导致阳性的但弱染色的细胞群。鼠B7-1跨膜区(参见图2A;SEQID NO:55)显示令人惊讶的高水平的染色,其中40%的种群对膜呈现的IgG1为阳性。
选择性剪接以及因此所有产生的抗体的一部分的膜结合表达似乎对分泌的IgG的滴度具有负面影响。尽管如此,M1M2跨膜区(也与PTCRA跨膜结构域组合),特别是B7-1跨膜区允许无选择性剪接的对照构建体的达到80%的分泌水平(参见图2F)。
对于IgG4抗体表达,如在材料和方法部分中所述地转染CHO-S细胞,使用表达轻链的表达载体pGLEX41_IgG4-LC(SEQ ID NO:319)以及编码具有用于膜呈现的B7-1跨膜区的选择性剪接的重链的第二载体(SEQ ID NO:80)。作为对照,使用编码分泌的IgG4重链的非剪接构建体(SEQ ID NO:79)。
转染后,如材料和方法中描述地染色并通过流式细胞仪分析细胞。表达轻链和重链的分泌版本的阴性对照(无跨膜区的选择性剪接)仅得到具有大约6μg/mL的大量分泌水平(参见图3C)的阴性群(见图3A)。与此相反,用包含B7-1区域的构建体(SEQ ID NO:80)转染的细胞表现出在细胞膜上呈现该抗体的显著阳性群(参见图3A的直方图和图3B的染色的百分比)而表达水平保持在具有和不具有选择性剪接的类似水平(参见图3C)。
为了解决双特异性抗体是否可以通过跨膜区(TM)呈现在细胞膜上,在CHO细胞中瞬时表达编码双特异性抗体的在实施例1中描述的选择性剪接构建体。选择性剪接构建体编码内部开发并在WO2012/131555中描述的双特异性抗体形(称为),其用作本实施例中的模型蛋白。BEAT分子是融合至重链恒定区(“scFv-Fc”)的IgG重链(“重链”),κ轻链(“轻链”)和scFv的三聚体。废除重链的蛋白A结合位点,使得仅scFv-Fc的Fc片段能够结合到蛋白A。分子的设计和重链蛋白A结合位点的工程化允许三聚体的每个亚基的特异性检测。通过转染重链或scFv-Fc的选择性剪接构建体或转染选择性剪接构建体两者来实现细胞膜上的呈现。通过流式细胞术特异性地检测在单一细胞的表面上呈现的膜结合BEAT双特异性抗体。
在下文中,编码正则表达构建体的载体将被简称为用于pGLEX41_BEAT-HC(SEQ IDNO:49)的“pHC”,用于pGLEX41_BEAT-LC(SEQ ID NO:302)的“pLC”和用于pGLEX41_scFv-Fc(SEQ ID NO:51)的“pScFv-Fc”。添加跨膜区到HC的选择性剪接构建体将被称为“pHC-M1M”(pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2;SEQ ID NO:50)和添加跨膜区到scFv-Fc的构建体将被称为“pScFv-Fc-M1M2”(pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2;SEQ ID NO:52)。使用不同组合的选择性剪接表达构建体或正则表达构建体共转染编码BEAT抗体的三个亚基的表达载体。表16总结了所进行的转染以及在细胞膜上预期呈现的种类。
表16:转染方案和在细胞膜上呈现的期望种类:
转染后第1天获得的流式细胞概况在4A和B中示出。第一转染混合物(PHC+pScFv-Fc+pLC)不包括具有用于细胞膜呈现的跨膜区的构建体。因此,对该转染获得的概况(图4A,D,G)被认为是该实验的阴性对照,并且表示为直方图中的虚线分布。
载体pScFv-Fc-M1M2的转染本身仅给出抗Fc的阳性细胞(检测重链)和蛋白A染色(图4K,N,Q)。在这种情况下,在细胞膜上没有检测到轻链证明了测定的特异性。
载体pHC-M1M2和pLC的共转染产生了抗Fc的阳性细胞和κ轻链染色,但没有观察到蛋白A结合(图4L,O,R)。这是根据这样的事实,在BEAT分子的重链亚基中蛋白A结合位点已被废除。因此,虽然抗人Fcγ抗体不对重链特异性并识别scFv-Fc,轻链的检测允许我们推断重链的表达。
用编码所有三种亚基的质粒混合物进行的转染,独立于所使用的选择性剪接构建体,显示具有至少一个跨膜区的BEAT构建体的表达(图4B,C,J,E,F,M,H,I,P)。染色对于轻链和scFv-Fc,以及Fc片段(重链和scFv-Fc)阳性,表明所有预期的种类存在于细胞膜上。因此,完全折叠的多聚体存在于细胞膜上,确认报告系统对多聚蛋白的表达的有效性。出人意料的是,不管跨膜区的位置,检测到所有种类。无论是跨膜区(TM)被连接到重链(HC)和scFv-Fc亚基(图4B,E,H)两者,或仅连接到HC(图4C,F,I)或仅连接到scFv-Fc(图4J,M,P),没有观察到任何差别。
因此,这里提出的方法允许在细胞膜上呈现的异源二聚体(例如重链+scFv-Fc+轻链)和同源二聚体(重链+轻链或scFv-Fc同源二聚体)之间的区别。在多聚蛋白如双特异性抗体的表达的背景下,该信息的质量相当有用。
在转染后第6天通过使用蛋白A生物传感器的八位QK仪测量分泌BEAT和scFv-Fc二聚体的浓度。结果示于图5中。由于最终产物(重链-轻链二聚体)不结合蛋白A,根据预期,对于使用表达载体pHC-M1M2+pLC的转染,用蛋白A生物传感器测量不到表达。对于使用表达载体pScFv-Fc-M1M2的转染,只观察到相比于只导致分泌产物的对照转染的较低的表达水平。对于使用选择性剪接构建体的所有转染,可以在上清液中检测到B EAT分子或scFv-Fc同源二聚体。这证实了BEAT异源二聚体不仅如以前所证明地呈现在细胞膜上,也使用细胞的分泌途径被成功地分泌。更重要的是,用选择性剪接构建体获得的表达水平与对照(PHC+pScFv-Fc+pLC)相当。这表明,只有蛋白的一小部分偏离表面呈现的分泌途径,因为在这个实验设置中未测量到对分泌水平的显著影响。
总结
基于这些结果,可以得出的结论是,选择性剪接构建体通过选择性剪接成功地转移所产生的抗体的一部分到细胞膜。虽然对于含PTCRA跨膜结构域的构建体,表面染色低,但是对于用包含M1M2跨膜区的构建体转染的细胞,染色高,而且对于包含B7-1跨膜区的构建体,甚至更高。除了信号强度,在用B7-1构建体转染时能够被染色的细胞种群的百分比令人惊讶地高,考虑到在B细胞的进化过程中M1M2跨膜区被选择用于抗体的高效膜呈现并因此应该代表用于免疫球蛋白的膜呈现的最有效的构建体。
当分泌抗体的一部分被重定向到细胞膜时总的抗体表达水平降低,但用不同的构建体达到未剪接对照的表达水平的80%左右。
如构建体的实施例所证明的,使用本发明的选择性剪接构建体,具有多于两个的亚基的分子也可以成功地呈现在细胞膜上。这些构建体融合跨膜区到所表达的蛋白质的一小部分。使用双特异性抗体(BEAT)作为一个例子,相比于只导致分泌蛋白质的对照转染,观察到无显著差异的分泌水平。选择性剪接对表达水平没有影响或仅有较小的影响的观察使得该技术可被工业应用接受。而且,可以表明,如本文所述的方法允许在细胞膜上呈现的多聚体的特异性检测。令人惊讶地,可以将跨膜区添加到重链或scFv-Fc或这两种亚基,而对分泌蛋白的表面呈现或表达水平没有影响。
因为通过选择性剪接在细胞膜上呈现的多聚分子反映特定细胞的分泌多聚蛋白的产物组分,该技术将允许单细胞水平上的分泌概况的基于流式细胞的定性预测。这在实施例5中说明。
实施例3:由内含子序列的修饰调节细胞表面呈现和表达滴度
前言
如实施例2中所说明的,跨膜区的选择性剪接允许重定向否则通常分泌的抗体的一部分到细胞表面。然而,分泌过程的这种修饰可能对抗体的分泌水平造成负面影响。微调分泌和膜呈现抗体之间的剪接比可能有助于恢复用非剪接抗体构建体(无选择性剪接跨膜区)所观察到的表达水平。这将在下面的例子中说明。
材料与方法
转染
在50ml生物反应器管(Tubespins,TPP)形式中用使用聚乙烯亚胺( Polyplus-转染,伊尔基希,法国)的表达载体转染悬浮CHO-S细胞。为了这个目的,在5ml的OptiMEM培养基(#31985-047,Invitrogen)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。细胞悬浮液中的最终DNA浓度为2.5μg/mL。在37℃振荡(200rpm)下温育5小时后,将5ml的新鲜培养基加入到细胞悬浮液中。然后将细胞在37℃,5%CO2和80%湿度下在摇动平台上温育。
表面染色
转染后第1天,进行细胞的表面染色。收获总共1E5细胞,并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2%FBS在PBS中)洗涤两次,然后再悬浮在含有检测抗体的100μL洗涤缓冲液中。使用通过蓝色激光(488nm)激发和在光谱范围583/26nm内检测的PE缀合的山羊抗人IgG抗体(#512-4998-82,eBioscience)进行重链的特异性检测。在室温下在黑暗中温育20分钟后,将细胞在洗涤缓冲液中洗涤一次,并再悬浮于200μL的洗涤缓冲液中用于流式细胞分析。用Guava流式细胞仪(Merck Millipore)或用FACSCalibur(BectonDickinson)分析细胞。使用八位QK仪(Fortebio,门洛帕克,CA)和蛋白A生物传感器在转染后第4-6天测量分泌的分子的瞬时表达水平。
结果
如在材料和方法部分中所述地转染CHO-S细胞,使用表达轻链的表达载体pGLEX41_LC(SEQ ID NO:294)和编码重链并含有具有M1M2跨膜结构域(SEQ ID NO:36-39),具有PTCRA跨膜结构域(SEQ ID NO:40-43),具有M1M2-PTCRA融合跨膜结构域(SEQ ID NO:44-47)或具有B7-1跨膜结构域(SEQ ID NO:53-56)的内含子的修饰版本的第二载体。作为对照,使用不具有选择性剪接的分泌重链(SEQ ID NO:48)。
转染后,如在材料和方法中所述地染色细胞并通过流式细胞分析。如实施例2中已经观察到的,表达轻链和重链的分泌版本的阴性对照(无跨膜区的选择性剪接)只产生具有大量的IgG1分泌水平(参见图7)的小部分染色细胞(见图6)。与此相反,用含有M1M2区(SEQID NO:36,图6A)和B7-1跨膜结构域(SEQ ID NO:55,图6M)的构建体转染的细胞显示出显著的在细胞膜上呈现抗体的阳性群。由于PTCRA跨膜结构域(SEQ ID NO:40,图6E)或M1M2-PTCRA融合跨膜结构域(SEQ ID NO:44,图61),阳性群被弱染色。
内含子的多聚(Y)道中的Y含量的降低已表明削弱剪接受体并且被引入以改变剪接比有利于分泌抗体。对于导致成功的呈现(M1M2和B7-1)的两个跨膜区,不具有内含子的多聚(Y)道中的Y的构建体(SEQ ID NO:37和SEQ ID NO:53)显示无细胞的表面染色(参见图6B和N)。这表明,剪接的比率大多朝向分泌的抗体偏移。
小鼠免疫球蛋白μ初级转录物的内含子中的附加的多聚(A)位点的存在已经显示出影响选择性剪接事件,导致更高的分泌产物部分(Galli等人,1987年)以及更少的膜呈现抗体。基于该发现,SV40多聚(A)位点被引入分泌多肽的终止密码子的3’以及内含子的分支点的5’以便改变剪接比有利于抗体分泌。随着在内含子中加入SV 40多聚(A)位点,对于M1M2构建体,抗体的分泌水平相比于原141显著增加(参见图7)。同时,对于M1M2构建体,膜呈现抗体的部分(参见图6C)增加。由于B7-1细胞的染色已经非常高,对于多聚(A)对膜呈现的影响的结论不能得出(参见图6O)。
将胃泌素终止子位点(报道为终止mRNA的转录)直接引入表达盒的多聚(A)位点的3'以避免与邻近表达盒的其他剪接受体的异常剪接事件。尤其是对于M1M2构建体,胃泌素终止子构建体增加膜呈现抗体部分(图6D),但并不导致分泌水平的显著增加。同样,对于B7-1细胞没有结论可以得出(图6P)。
选择性剪接以及因此所有产生的抗体的一部分的膜结合表达似乎对整体分泌的IgG滴度具有负面影响。尽管如此,M1M2跨膜区(也与PTCRA跨膜结构域组合),特别是B7-1跨膜区允许无选择性剪接的对照构建体的达到80%的分泌水平(参见图7)。此外,在内含子中加入多聚(A)信号被认为对IgG分泌有利,同时保持细胞膜上的显著染色。另一方面,胃泌素终止子相比于各个对照构建体只显示出对分泌的轻微影响(参见图7)。
在以前的实验中,内含子序列的不同的修饰显示出对选择性剪接的效率的类似的影响,独立于构建体的跨膜区。因此选择B7-1跨膜区以进一步表征内含子序列修饰对选择性剪接比和抗体分泌水平的影响,因为其导致最高的染色水平。
为了降低细胞表面呈现抗体的量并恢复对照构建体的表达水平,改变剪接比以有利于分泌的产物,即,削弱剪接供体和剪接受体位点。
剪接受体共有序列中存在的多聚(Y)道已知对剪接受体强度具有重要作用(多聚(Y)道越短,剪接受体位点越弱)。在先前的实验,结果表明多聚(Y)道中的Y含量完全降低为零废除抗体的细胞表面呈现。
天然鸡TNT内含子4多聚(Y)道包含27Y。如前所述地在CHO-S细胞中转染具有修饰的内含子的一系列构建体(SEQ ID NO:53,55,59-63),所述修饰的内含子在其多聚(Y)道中包含降低数量的Y。在表面染色和用八位设备和蛋白A生物传感器评估表达水平之后,可以在抗体的细胞表面呈现上清楚地确定多聚(Y)道的影响:多聚(Y)道中小于9Y显著降低染色细胞的百分比(见图8A,B,C,D,E,F,G,H)以及染色强度(见图8A,B,C,D,E,F,G,J)。不幸的是,细胞表面呈现的这种减少对整体表达水平没有影响,其保持低于每个构建体的对照(见图8Ⅰ)。
朝向分泌产物增加剪接比另一种方式是通过改变剪接供体的DNA序列来减少在选择性剪接内含子的5'末端的剪接供体的强度。通过利用编码相同的氨基酸的选择性密码子可以产生编码与原始构建体相同的氨基酸序列的两种不同的DNA构建体(SD_CCC,SEQ IDNO:58和SD_GGC,SEQ ID NO:57)。
虽然剪接供体共有序列的第一修饰(SD_CCC,SEQ ID NO:58)对染色细胞的百分比,染色的强度或表达水平没有影响(参见图9),第二修饰(SD_GGC,SEQ ID NO 57)显示出表面呈现(百分比和强度,参见图9C,D和F)的显着降低。表面呈现的这种降低与表达滴度的明显增加相关,达到不具有选择性跨膜结构域的对照的水平(参见图9E)。此外,虽然与天然鸡TNT 4内含子序列相比时细胞表面呈现显着降低,当与没有跨膜结构域的对照相比时可以观察到显著染色(参见图9C)。
总结
胃泌素终止子增加对细胞膜上的IgG特别是对M1M2构建体染色阳性的细胞部分,但并没有导致分泌IgG的相比于标准构建体的更高的表达。在内含子中掺入额外的多聚(A)增加构建体M1M2中的膜呈现抗体部分(对于B7-1没有结论可以得出)。具有额外的多聚(A)的M1M2构建体也呈现高水平的分泌的IgG(高达非剪接对照构建体的表达的80%)。
多聚(Y)道的减少预期减弱剪接受体和降低膜呈现剪接变体的表达。这可以对所有四种不同的基础构建体证实(M1M2,PTCRA,M1M2-PTCRA和B7-1)。另外,表面呈现的水平据发现与多聚(Y)道的长度直接相关,如通过用B7-1跨膜结构域的实施例所描述的。在这方面,多聚(Y)道中至少5Y据发现对于显著表面染色是必要的。同时,可以观察到分泌抗体的表达水平没有增加。因此,选择性剪接的移位不利于分泌产物的积累。
出乎意料的是,剪接供体共有序列的特定修饰允许降低表面染色的水平的降低,同时提高分泌抗体的水平。表面呈现的水平相当低,但相比于对照构建体仍然显著,并且分泌水平被认为与对照相同。
本发明人考虑的是,选择性剪接事件的频率由剪接供体位点的强度确定。如果相应的剪接受体足够强(超过多聚(Y)道中的5Y),选择性剪接将导致编码具有跨膜区的构建体的选择性mRNA的形成并因此膜呈现。如果剪接受体是通过降低多聚(Y)道中的Y的量小于5Y来削弱,剪接事件将效率降低并且选择性前mRNA可能变差,同时对非剪接mRNA因此对分泌水平没有影响。按照这种情况,剪接受体弱化后观察到较少的膜呈现,但对分泌水平没有影响。降低剪接供体的强度另一方面可能会降低选择性剪接事件的频率。其结果是,更多的mRNA编码非剪接mRNA的分泌产物,导致所观察到的分泌抗体的增加。强剪接受体导致mRNA的有效选择性剪接,但由于弱剪接供体而处于较低的频率,这可以解释所观察到的显著但弱的膜呈现。
综上所述,剪接供体和/或剪接受体序列的修饰允许抗体的表面呈现水平和分泌水平的调节达到不用选择性剪接表达的抗体的分泌水平。因此,所提出的构建体允许通过调节选择性剪接效率来微调呈现和分泌达到期望的水平。Galli G1,Guise J,Tucker PW,Nevins JR(1988)。多聚(A)位点选择而不是剪接位点选择支配IgM重链RNA的规范生产。Proc Natl Acad Sci U S A.Apr;85(8):2439-43。
达的抗体的分泌水平的调节无表达。因此结构允许呈现的微调和的效率至所需。加利GL,吉斯塔克PW,内文斯JR(1988)。保利(A)位点的选择,而不是支配生产规范。PROC国家科学院科学美A.4月;85(8):2439-43。
实施例4:跨膜区对细胞表面呈现的影响
前言
用于通过细胞产生的抗体的一部分的膜呈现的选择性剪接系统可能通过跨膜区的特性改变。例如,可以推测的是,跨膜结构域的长度和结构可以影响膜呈现的效率。此外,跨膜区的胞质尾可能通过ER出口信号的存在或不存在影响细胞表面呈现。在下面的实施例中,我们证明了无论是跨膜结构域的氨基酸组成,其长度,还是跨膜区的胞质尾都对表面呈现和分泌无关键的影响。
材料与方法
转染
在50ml生物反应器管(Tubespins,TPP)形式中用使用聚乙烯亚胺( Polyplus-转染,伊尔基希,法国)的表达载体转染悬浮CHO-S细胞。为了这个目的,在5ml的OptiMEM培养基(#31985-047,Invitrogen)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。细胞悬浮液中的最终DNA浓度为2.5μg/mL。在37℃振荡(200rpm)下温育5小时后,将5ml的新鲜培养基加入到细胞悬浮液中。然后将细胞在37℃,5%CO2和80%湿度下在摇动平台上温育。
表面染色
转染后第1天,进行细胞的表面染色。收获总共1E5细胞,并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2%FBS在PBS中)洗涤两次,然后再悬浮在含有检测抗体的100μL洗涤缓冲液中。使用通过蓝色激光(488nm)激发和在光谱范围583/26nm内检测的PE缀合的山羊抗人IgG抗体(#512-4998-82,eBioscience)进行重链的特异性检测。在室温下在黑暗中温育20分钟后,将细胞在洗涤缓冲液中洗涤一次,并再悬浮于200μL的洗涤缓冲液中用于流式细胞分析。用Guava流式细胞仪(Merck Millipore)或用FACSCalibur(BectonDickinson)分析细胞。使用八位QK仪(Fortebio,门洛帕克,CA)和蛋白A生物传感器在转染后第4-6天测量分泌的分子的瞬时表达水平。
结果
如在材料和方法部分中所述地转染CHO-S细胞,使用表达轻链的表达载体pGLEX41_LC(SEQ ID NO:294)和编码具有不同的跨膜区的重链的第二载体。作为对照,使用不具有选择性剪接的分泌重链(SEQ ID NO:48)以及具有B7-1跨膜区(SEQ ID NO:55)的构建体用作阳性对照。
转染后,如在材料和方法中所述地染色细胞并通过流式细胞分析。
跨膜结构域长度和组成
为了分析跨膜结构域对细胞表面呈现和抗体分泌水平的影响,将B7-1跨膜结构域替换为具有类似长度的(22-23个氨基酸)仅含有疏水残基的跨膜结构域(见SEQ ID NO:81-86)。跨膜结构域的交换对细胞表面呈现或抗体的分泌没有影响(见图10)。
当B7-1跨膜结构域由具有相似长度(21-24个氨基酸)的不仅含疏水残基,而且也含有极性或带电残基(SEQ ID NO:87-93)的跨膜结构域替换时,可能不观察到对表面呈现或分泌的影响,除了从PTCRA(SEQ ID NO:93)衍生的跨膜结构域。这个跨膜结构域,无需改变在细胞表面上呈现产物的细胞部分,显着地降低产物的表面密度,而不会对分泌水平造成任何影响(见图11H,J,K和L)。
跨膜结构域由疏水脂质相包围。在膜的疏水环境中插入可电离基团的能量成本非常高,因此应该有对抗跨膜结构域中的带电氨基酸的强烈倾向(White和Wimley,1999)。跨膜螺旋的统计分析证实,跨膜结构域主要由疏水性氨基酸残基组成,特别是在跨膜区的疏水性核心中(Beza-Delgado,2012)。基于该观察,我们希望找出PTCRA跨膜结构域中的三种带电残基(R8,K13和D18,从跨膜螺旋的开头开始编号)对所观察到的弱染色强度的影响中。设计几个PTCRA构建体,其中不同的带电残基分别交换为氨基酸缬氨酸(跨膜结构域中的四个最常见的氨基酸之一(Baeza-Delgado等人,2012))并在CHO-S细胞中转染(SEQID NO:94-100)。这些转染的结果证实带电残基对表面染色强度的影响。单个氨基酸R8V(SEQ ID NO:94),K13V(SEQ ID NO:95)或D 18V(SEQ ID NO:96)的突变允许显著增加表面呈现抗体的强度,但不显著影响抗体的分泌水平(参见图12B,C,D和J)。从单个突变的结果预期的是,2个突变的带电残基的组合(R8V和K13V(SEQ ID NO:97),R8V和D18V(SEQ ID NO:98)或K13V和D18V(SEQ ID NO:99))呈现表面呈现的水平以及与PTCRA的跨膜结构域类似的分泌水平(见图12E,F,G和J)。最后,所有三种带电残基突变为缬氨酸(SEQ ID NO:100)如预期地导致相比于对照的高表面呈现。出乎意料的是,用该构建体,分泌抗体的表达水平以及染色的细胞的百分比略低(见图12H和J)。目前还不清楚分泌和染色水平降低的原因。
当B7-1跨膜结构域由不仅含有疏水残基,还含有极性或带电残基(SEQ ID NO:101-103)的较短的跨膜结构域(17-19个氨基酸)替换时,可确定不同的效果。结果可以在图13中看出。而FCERA(SED ID NO:101)和KI2L2(SEQ ID NO:102)的跨膜结构域对染色的细胞的百分比具有小的不利影响(图13B,C和E),只有从FCERA衍生的跨膜结构域对染色的强度具有负面影响(图13C和G)。此外,这两个跨膜结构域(FCERA和KI2L2)对分泌水平具有轻微良好的效果(图13F)。另一方面,对于来自IL3RB的跨膜结构域(SEQ ID NO:103),对于染色细胞的百分比和分泌水平观察到相比于B7-1对照构建体没有变化(图13D,E和F),只观察到染色强度略有下降(图13G)。这使得短的跨膜结构域是微调产物表面呈现的潜在工具。
当B7-1跨膜结构域由不仅含有疏水残基,而且含有极性或带电残基的更长跨膜结构域(SEQ ID NO:104-107)替换时,相比于具有B7-1跨膜结构域的对照构建体,观察到对染色细胞的百分比没有影响,也对染色强度没有影响(参见图14B,C,D,E,F和H)。尽管如此,相比于具有B7-1,具有所有这些跨膜结构域,分泌略好(见图14G)。
为了以更明确的方式而不用从一种跨膜结构域变换到另一种跨膜结构域来评估跨膜结构域长度的影响,设计具有修饰的B7-1跨膜结构域的构建体。从B7-1跨膜结构域的疏水性中心去除或向其中加入几个疏水性氨基酸(SEQ ID NO:108-111)。缩短B7-1至18个氨基酸(SEQ ID NO:108)在染色细胞的百分比方面有益,但在染色强度方面稍有不利(见图15B,F和H)。其他三种构建体(分别为20(SEQ ID NO:109),24(SEQ ID NO:110)和26(SEQ IDNO:111)个氨基酸)不显著影响染色细胞的百分比或染色强度(见图14C,D,E,F和H)。对于分泌水平,缩短跨膜结构域的长度被发现是有益的,而具有延长的跨膜结构域的构建体显示出与具有天然B7-1构建体相当的分泌水平(见图14G)。
在一般情况下,就染色细胞的百分比和抗体的分泌而言,更短的跨膜结构域似乎是有利的,尽管相比于更长的跨膜结构域染色强度可能略有下降。
胞质尾
文献指出在B7-1胞质尾中存在结构性的,非线性的ER出口信号(Lin等人,2013)。作者发现在跨膜蛋白的胞质结构域中存在靶向细胞表面的ER出口信号可能对细胞表面上的蛋白质的量具有积极影响。在具有高翻转的蛋白质的情况下,从ER到膜的加速输出可以补偿从质膜的蛋白水解切割。
为了评估ER出口信号是否与我们的系统中的膜呈现相关,将B7-1胞质尾替换为已知含有ER出口信号的几个跨膜蛋白和无ER出口信号的缺失突变体的胞质尾(SEQ ID NO:112-124)。
如在图16P中所示,由于ER出口信号的缺乏据发现对于分泌抗体的水平略微有利,而染色细胞的百分比(图16B-N和O)和染色强度(图16B-N和Q)未受到显著影响。因此,我们的膜呈现抗体可能不会受到快速翻转。
除了这些构建体,进行M1M2胞质尾与M1M2跨膜结构域中的B7-1胞质尾的交换(SEQID NO:125)。如图17E中所示,这种交换略微增加荧光的强度,但对染色细胞的百分比没有影响(图17C),也对分泌水平没有影响(图17D)。
总结
总的来说,数据表明,我们的选择性剪接系统中的跨膜结构域的长度或氨基酸组成对抗体的分泌水平和细胞膜上的产物呈现仅具有轻微的影响。观察到分泌与膜呈现产物的比率的轻微变化,这可能被用于选择性剪接系统的微调。所有的构建体允许抗体的显著的表面呈现,并且也允许相关的分泌水平。
有趣的是,观察到跨膜结构域对细胞表面呈现的荧光水平的重大影响。存在或不存在疏水性氨基酸允许控制平均荧光,而它不影响示出细胞表面呈现的细胞的分泌水平或百分比。
胞质尾中的ER出口信号据发现对于对照抗体的细胞表面呈现不是必需的。由甘氨酸-丙氨酸连接子和6个组氨酸或B7-1尾的前5个氨基酸组成的最小胞质尾对于细胞表面呈现是足够的。这对于受到快速翻转的其它抗体或蛋白质可能是不同的。因此,胞质尾可能是用于调节目的蛋白质的表面呈现的有趣的工具。
总的来说,实施例2-4的数据表明,表面呈现水平和分泌水平受到参与膜结合蛋白的选择性剪接和膜集成的不同序列的影响。虽然剪接供体位点的特异性修饰允许恢复与对照非选择性剪接构建体相同的分泌水平(参见实施例3图9),当使用B7-1跨膜区时表面染色显著降低。另一方面,在使用M1M2跨膜区时,在内含子中增加SV40多聚(A)增加分泌和表面呈现水平两者(参见实施例3图6和7)。此外,B7-1跨膜结构域的修饰如B7-1减少到18或20个氨基酸(参见图15)对分泌水平和表面呈现水平具有积极影响。最后,通过不含ER出口信号如6His或KCFCK的胞质尾替换B7-1胞质尾也改善表面呈现和分泌水平两者。最后,表达盒的端部的胃泌素终止子对表达的影响是阳性的,并且如果放置在内含子中可能是更有利的。因此,组合这些不同的特征的构建体可能是更有利的,实现最佳的分泌水平以及细胞选择所希望的细胞表面呈现的高动态范围。
这些构建体的骨架将是pGLEX41(GSC281,SEQ ID NO:304)并且非剪接ORF的最后5个氨基酸到表达构建体的端部的序列作为DNA序列以及蛋白质序列列出,所述DNA序列以及蛋白质序列从与表17中的蛋白质序列相同的具有融合的跨膜区的氨基酸开始。
表17:潜在构建体的序列(*)
*所列出的序列从非剪接ORF的后5个氨基酸延伸至表达构建体的末端
出版物:
Lin,Y.,Chen,B.,Wei-Cheng Lu,W.,Chien-I Su,C.,Prijovich,Z.,Chung,W.,Wu,P.,Chen,K.,Lee,I.,Juan,T and Roffler,S.(2013).The B7-1Cytoplasmic TailEnhances Intracellular Transport and Mammalian Cell Surface Display ofChimeric Proteins in the Absence of a Linear ER Export Motif PLoS One.Sep 20;8(9)
Baeza-Delgado,C1,Marti-Renom,MA,Mingarro,I.(2012).Structure-basedstatistical analysis of transmembrane helices.Eur Biophys J.2013 Mar;42(2-3):199-207
White,SH and Wimley,WC.(1999).Membrane protein folding and stability:physical principles.Annu Rev Biophys Biomol Struct.28:319-65。
实施例5:使用用于表面呈现的选择性剪接定性预测产物分泌
介绍
细胞转染是建立用于重组蛋白表达的稳定细胞系的初始步骤。出于许多原因(多相初始细胞群,在基因组中的质粒的不同的集成位点,不同的翻译后机械,和表达的外遗传调节),该步骤通常导致在表达和分泌水平,以及产物质量属性如蛋白质折叠、糖基化和其它翻译后修饰方面的异源细胞种群。双特异性抗体由可能以所有可能的组合装配的多达四种不同的亚基(2条重链和2条轻链)组成。根据质粒整合,转录和翻译的调节以及ER中的折叠效果,特定的克隆可优选地分泌正确装配的产物而不是不需要的副产物。具有这种期望的分泌模式的克隆的选择需要大量的筛选和分泌蛋白的表征。减少获得产生目的产物和最少的副产物的细胞系所需的筛选量将是一个重大的发展。
如先前在实施例2~4中表明的,使用选择性剪接技术,分泌蛋白的一部分可以从分泌途径偏离用于细胞膜呈现。也表明了通过流式细胞仪特异性检测在细胞膜上呈现的蛋白是可能的。
本实施例的目的是要表明,细胞膜上的产物模式呈现可预测克隆的分泌谱。为了这个目的,实施例2中呈现的异源双特异性抗体用作模型。在下文中,该分子结合被称为“靶l”和“靶2”的两种不同的可溶性分子。该分子的示意卡通图可以在图18,结构A中看出。它将在下文中缩写为“BEAT”。转染后不仅BEAT分子被分泌,而且单特异性重链-轻链二聚体结合至“靶1”。这种分子被称为Fab同源二聚体(缩写为“Fab-DIM”)。第二副产物是结合“靶2”的单特异性scFv-Fc同源二聚体(缩写为“scFv-Fc-DIM”)。这些副产物可被视为图18中的结构B和C。
在用表达构建体pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(SEQ ID NO:50)、pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2(SEQ ID NO:52)和pGLEX41_BEAT-LC(SEQ ID NO:302)或用pGLEX41_BEAT-LC(SEQ ID NO:302)、pGLEX41_scFv-Fc-I4-B7-B7-B7(SEQ ID NO:323)和pGLEX41_BEAT-HC-I4-B7-B7-B7(SEQ ID NO:321)稳定转染细胞之后,通过表面染色筛选克隆。接着是两种方法用于表征细胞的表面表型。首先,进行轻链和Fc片段的双重表面染色。虽然这种染色并不是都允许检测所有所生产的种类(BEAT和Fab-DIM之间没有区别),其检测到单特异性污染物scFv-Fc-DIM。这种方法普遍适用于各种BEAT分子。第二种方法更特异性并且需要可溶性靶标用于检测各自的结合臂。在这种情况下,通过表面染色明确地检测所有三种可能的产物。分别通过有限的稀释和流式细胞术的细胞分选产生重组池和克隆。进行分批或补料分批培养,并通过毛细管电泳分析上清液中积累的产物。最终在上清液中测定的分泌概况(BEAT,Fab-DIM或scFv-Fc-DIM部分)与在重组细胞的细胞膜上呈现的产物概况相当。
材料与方法
稳定池的建立
由先前描述的载体pGLEX41_BEAT-HC-I4-M1M2-M1M2-M1M2(缩写为“pHC-M1M2”;SEQ ID NO:50),pGLEX41_scFv-Fc-I4-M1M2-M1M2-M1M2(缩写为“pscFv-FC-M1M2”;SEQ IDNO:52)和pGLEX41_BEAT-LC(缩写为“pLC”;SEQ ID NO:302)的共转染生成稳定转染的CHO细胞用于双特异性异源二聚体BEAT的表达以及两种专有载体用于分别对抗生素嘌呤霉素和遗传霉素提供抗性的蛋白的表达。
在50ml生物反应器形式中用使用聚乙烯亚胺(Polyplus-转染,伊尔基希,法国)的线性化的载体转染悬浮CHO-S细胞。为了这个目的,在5ml的OptiMEM培养基(#31985-047,Invitrogen)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。将2.5μg/mL的最终DNA浓度加入细胞中。在37℃振荡(200rpm)下用DNA复合物温育细胞5小时后,将5ml的培养基PowerCHO2(#BE12-771Q,Lonza)加入到细胞悬浮液中。然后将细胞在37℃,5%CO2和80%湿度下在摇动平台上温育。转染后的一天在包含具有允许稳定池的生长的浓度的嘌呤霉素(#P8833-25mg,Sigma)和遗传霉素(#11811-098,Gibco)的选择性培养基中以不同的浓度(0.7,0.5和0.4E5细胞/mL)在96孔板中接种细胞。在静态条件下选择14天后,从池取出15个产生的稳定池并扩展到TubeSpin生物反应器中。
重组克隆克隆的建立
由先前描述的载体pGLEX41_BEAT-HC-I4-B7-B7-B7(缩写为“pHC-B7”;SEQ ID NO:321),pGLEX41_scFv-Fc-I4-B7-B7-B7(缩写为“pscFv-Fc-B7”;SEQ ID NO:323)和pGLEX41_BEAT-LC(缩写为“pLC”;SEQ ID NO:302)的共转染生成克隆用于双特异性异源二聚体BEAT的表达以及两种专有载体用于分别对抗生素嘌呤霉素和遗传霉素提供抗性的蛋白的表达。
如先前所述地进行转染和稳定转染的选择。在静态条件下选择14天后,在动态条件(轨道振荡)下收集、汇集和传代所有稳定的转染体一周。使用FACSAriaII通过对活细胞圈门进行单细胞分选,通过脉冲处理排除细胞双峰。
细胞表面上呈现的产物的LC和Fc染色
如实施例2中详细描述地在批次接种后第2天,在稳定的细胞上进行轻链(LC)和Fc片段的双重表面染色。简言之,收获总共1E5细胞,并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2%FBS在PBS中)洗涤两次,然后再悬浮在100μL的检测抗体中。使用小鼠抗人κLCAPC标记的抗体(#561323,BD Pharmingen)进行κ轻链的特异性检测,使用PE缀合的山羊抗人Fcγ特异性抗体(#12-4998-82,eBioscience)进行检测Fc片段。在室温下在黑暗中温育20分钟后,将细胞在洗涤缓冲液中洗涤一次,并再悬浮于200μL的洗涤缓冲液中用于流式细胞分析。用Guava流式细胞仪(Merck Millipore)分析细胞。
在细胞表面上呈现的特异性结合体(binder)的染色
为了这种染色,可溶性靶标用于在细胞表面上呈现的分子的结合臂的检测。简言之,收获总共1E5细胞,并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2%FBS在PBS中)洗涤两次,然后再悬浮在100μL的生物素化的靶1和His-标签的靶2的混合物中。在室温下在黑暗中温育20分钟后,将细胞在洗涤缓冲液中洗涤二次,并再悬浮于100μL的包含用APC(#554067,BD Pharmingen)缀合的链霉亲和素和用PE(#IC050P,RD系统)标记的His-Tag抗体的混合物中。在室温下在黑暗中温育20分钟后,将细胞在洗涤缓冲液中洗涤一次,并再悬浮于200μL中用于用Guava流式细胞仪(Merck Millipore)进行流式细胞分析。
细胞分泌概况的分析
在补充的生长培养基(PowerCHO2,2mM L-谷氨酰胺,8mM Glutamax(LifeTechnologies,卡尔斯巴德,CA),15%高效饲料A(Life Technologies),15%高效饲料B(Life Technologies)中以0.5E6细胞/mL的细胞密度在TubeSpins中接种重组池。在生长培养基(PowerCHO2,2mM L-谷氨酰胺)中以0.5E6细胞/ml的细胞密度在TubeSpins中接种克隆并且每天进行ActiCHO饲料A和B饲料(#U050-078,PAA Laboratories GmbH)的进料。在分批或补料分批培养的第14天,通过离心收集上清液,并使用0.2μm注射过滤器(#99722.TPP)过滤。使用Streamline蛋白A珠(#17-1281-02,GE)直接分析或纯化粗上清液。使用Caliper LabChip GXII蛋白测定法分析蛋白质。根据它们的分子量确定不同的种类,并测定各产物的级分。
结果
在用pHC-M1M2,pScFv-Fc-M1M2和pLC构建体转染之后,获得总共15个稳定池。启动补充的批次,以确定这些池的分泌概况。在批次接种后第2天,在池上进行轻链和Fc片段(scFv-Fc和重链)的双重表面染色。图19给出了通过补充批次的第2天的双重染色测得的池之一的表面概况的一个例子。点图呈现了κLC染色的强度(y轴)对人Fc染色的强度(x轴)。象限固定负和正染色细胞之间的任何限制。象限Q8表示不在细胞膜上表达蛋白的细胞部分,例如非生产者的子群。Q7是对于Fc片段阳性但对于κLC阴性的细胞部分,因此对应于细胞膜上的呈现scFv-Fc-DIM的细胞。Q6中的双阳性细胞是在细胞膜上呈现Lc和Fc片段的细胞,例如BEAT或Fab-DIM分子。
分析指示了非生产者(Q8)的33.8%的异源细胞群,50.3%的scFv-FC-DIM分泌者(Q7)和15.8%的潜在BEAT或Fab-DIM分泌者(Q6)。为了能够计算表面染色和分泌的产物之间的相关性,只考虑生产种群。因此,排除非生产者部分Q8,重新计算BEAT和Fab-DIM生产者部分以及生产细胞部分(Q6+Q7)内的scFv-Fc-DIM生产者部分(该部分将被称为Q6*和Q7*)。在图17所示的分析中例如种群计算如下:
Q6*=Q6/(Q6+Q7)=23.9%和Q7*=Q7/(Q6+Q7)=76.1%。
对所有15个产生的稳定池进行该分析,并用于图20中所示的相关性。
根据由选择性剪接引起的细胞膜上的物质种类呈现通过表面染色可以确定BEAT、Fab-DIM和scFv-FC-DIM生产者部分。然后,使结果面对所分析的池的实际分泌概况。为了这个目的,通过蛋白A在第14天纯化15个生产稳定池的上清液并将各分泌分子根据分子量确定以及通过Caliper LabChip GXII蛋白测定定量。应该指出的是,在这些纯化的条件下,仅蛋白A结合种类,即BEAT和scFv-Fc-DIM分子,从上清液中纯化,因为Fab-DIM分子缺乏蛋白A结合位点。图20示出分泌的分子的百分比和通过表面染色识别的相应细胞部分之间的关系。
数据表明,对于BEAT和scFv-Fc-DIM分泌,表面呈现和分泌概况是高度相关的(R2=0.9)。但是关系的性质不是线性的。缺乏线性回归可以由以下事实解释:在本实验中进行的表面染色不区分BEAT和Fab-DIM,而纯化的分泌产物排除Fab-DIM部分。上清液中的分泌的BEAT和scFv-FC-DIM的百分比可能会略有高估。然而,该实验清楚地表明,用于特定的分子的表面呈现的阳性细胞的分数越高,这种分子在上清液中的分数越高。在这个例子中,当所测试的稳定池藏有高于20%的百分比的阳性细胞时,所分泌的BEAT分子的分数线性增加。藏有超过75%的双阳性细胞(Q6)的稳定池的选择将允许分泌细胞种群的选择得到超过90%的所需BEAT分子。对于藏有双阳性表型的克隆种群,例如100%的细胞种群对LC和Fc表面染色阳性,可以合理地期望甚至更高分数的BEAT分泌,接近约100%。
为了提高该方法的灵敏度和展示表面呈现和分泌模式之间的线性关系,施用涉及可溶性靶作为检测试剂的不同的检测方法。这样,所有3种可能的产物都明确地通过它们的结合模式识别。图21给出了在细胞分选之前测量的池的表面概况的一个例子。该点图呈现了靶1的结合物的细胞表面密度(y轴)相对于靶2的结合物的细胞表面密度(x轴)。象限固定阴性和阳性染色细胞之间的任何限制。Q1是对靶1结合阳性但对靶2结合阴性的细胞的分数,从而对应于在细胞膜上呈现Fab-DIM的细胞。在Q2中,双阳性细胞,是在细胞膜上呈现用于靶1和2两者的结合物的细胞,从而对应于在膜上呈现BEAT的细胞。Q3是仅呈现靶2结合物的细胞,因此对应于scFv-FC-DIM。象限Q4表示不在细胞膜上表达蛋白的细胞的分数,例如非生产者的一个子群。因为这些细胞不引起抗体的分泌,将它们排除在分析之外。
使用这种方法分析在用pHC-B7,pScFv-FC-B7和pLC构建体转染之后通过流式细胞仪的细胞分选产生的所有产生的克隆(28)。如前所述地,根据由选择性剪接引起的细胞膜上的物质种类呈现通过表面染色可以识别BEAT、Fab-DIM和scFv-FC-DIM生产者的分数。通过Caliper LabChip GXII蛋白质测定法直接在补料分批培养的第14天确定每个克隆的实际分泌轮廓。图22示出了在上清液中检测的BEAT分子的分数与在其细胞表面上呈现BEAT表型的细胞的分数(Q2的%)之间的相关性。使用这种特异性染色,获得良好的线性相关(R2=0.8)。该数据清楚地表明,克隆分泌BEAT分子的倾向可以通过细胞膜上检测到的产物图案来预测。
结论
在本实施例中已证实了与细胞膜呈现组合的选择性剪接技术是用于单一细胞的分泌概况的定性预测的有效报告系统。使用基于LC和Fc表面检测的通用检测方法或使用涉及分子的可溶性靶的产物特异性染色方法在细胞膜呈现图案和转染细胞的实际分泌概况之间发现明显的相关性。该方法并不需要在分批或补料分批培养物中耗时地筛选细胞表现,也不需要收获、纯化和广泛表征分泌产物。
总之,这里所描述的报告系统为包含异源三聚分子的特定分泌概况的细胞克隆提供可靠、高通量筛选工具。
除了分泌概况的定性预测,出于细胞系发展目的,高度关注特定细胞克隆的分泌水平的定量预测。在下面的例子中,研究膜结合的水平,使用选择性剪接方法的表面呈现产物是否与克隆地分泌水平相关。
实施例6:使用用于表面呈现的选择性剪接定量预测分泌水平
前言
细胞系发展过程中的主要挑战是以时间有效的方式选择高性能克隆,例如,质量好的重组蛋白的高分泌率。据以前所证明的,所表达的蛋白质的一部分通过选择性剪接在细胞膜上的呈现指示克隆的实际定性分泌概况。在这个例子中将被证明的是细胞膜呈现的水平与克隆的分泌水平定量相关以及高生产细胞可以在表面呈现的强度的基础上进行选择。
材料与方法
稳定细胞系发展
由载体pGLEX41_HC-I4-M1M2-M1M2-M1M2(SEQ ID NO:36)和pGLEX41_LC(SEQ IDNO:294)的共转染生成稳定转染的CHO细胞用于人源化IgG1抗体的表达以及两种专有载体用于分别对抗生素嘌呤霉素和遗传霉素提供抗性的蛋白的表达。
在50ml生物反应器形式中用使用聚乙烯亚胺(Polyplus-转染,伊尔基希,法国)的线性化的载体转染悬浮CHO-S细胞。为了这个目的,在5ml的OptiMEM培养基(#31985-047,Invitrogen)中以2E6细胞/mL的密度接种指数生长的细胞。以3(μg/μg)的重量比将DNA复合物加入到细胞中。将2.5μg/mL的最终DNA浓度加入细胞中。在37℃振荡(200rpm)下用DNA复合物温育细胞5小时后,将5ml的培养基PowerCHO2(#BE12-771Q,Lonza)加入到细胞悬浮液中。然后将细胞在37℃,5%CO2和80%湿度下在摇动平台上温育。转染后的一天在包含4μg/mL嘌呤霉素(#P8833-25mg,Sigma)和400μg/mL遗传霉素(#11811-098,Gibco)的选择性培养基中以不同的浓度(0.7,0.5和0.4E5细胞/mL)在96孔板中接种细胞。在静态条件下选择14天后,从池取出15个产生的稳定池并扩展到TubeSpin生物反应器中用于表达水平的评估。
表达水平的评估
在补充有2mM L-谷氨酰胺,8mM Glutamax,15%高效饲料A(#A1023401,Invitrogen)和15%高效饲料B(#A1024001,Invitrogen)的PowerCHO(#BE12-771Q,Lonza)中以0.5E6细胞/mL的细胞密度接种补充批次。使用Guava流式细胞仪的ViaCount测定在第1,3和7天监测活细胞计数(VCC)和生存能力。使用八位QK仪在第1,3和7天测量IgG滴度。根据下列公式在第1和第3天之间计算稳定池的单位生产率qP。
其中:
qP=特定分泌率或生产率[pg/细胞/天]
IgG=在第3天和第1天的IgG滴度[pg/mL]
T=培养时间[天]
VCC平均d1-d3=第1天和第3天之间的平均活菌数[细胞/mL]
如在下面所描述的在指数生长期的第1天进行在细胞膜上所呈现的IgG的定量。
细胞的染色
批接种后第1天,进行稳定池上的Fc片段的染色。简言之,收获总共1E5细胞,并转移到96孔板的圆底孔中。将细胞用洗涤缓冲液(2%FBS在PBS中)洗涤两次,然后再悬浮在100μL的检测抗体中。使用PE缀合的山羊抗人Fcγ特异性抗体(#12-4998-82,eBioscience)进行Fc片段的特异性检测。在室温下在黑暗中温育20分钟后,将细胞在洗涤缓冲液中洗涤一次,并再悬浮于200μL中用于流式细胞分析。用Guava流式细胞仪分析细胞。
流式细胞仪细胞分选
从如前所述地建立的稳定转染体的异源池通过流式细胞仪细胞分选生成克隆(参见“稳定细胞系发展”部分)。为了这个目的,根据先前描述的方案进行Fc片段的表面染色。使用FACSAria II通过对活细胞的圈门实施分选,通过脉冲处理排除细胞双峰。根据表面荧光强度(“低”,“中”和“高”)定义三个圈门并且将单细胞分配质含有200μL的克隆培养基的96孔板中。在静态条件下生长2周后,将细胞在动态条件下扩展并如先前所述评价所选克隆的表现。
结果
在图23中示出稳定池的表面染色概况的分析。在区域g1中圈门的活细胞的表面荧光(图23,A图)表示为直方图(图23,B图)并且计算分布的平均荧光(平均[RFU])。平均荧光用作在细胞膜上表达的IgG水平的度量。对所有生成的稳定池进行该分析并且将表面IgG的水平与在上清液中测得的分泌的IgG的实际水平相比。
图24示出了在补充批次的第1天测得的表面荧光强度和所有稳定池的分泌水平之间的相关性。在表面IgG表达和滴度(图24,图A)之间以及表面IgG表达和单位生产率(图24,图B)之间观察到很好的相关性(R2>0.8)。该数据表明,选择性剪接的跨膜IgG的表面表达报告稳定转染的细胞的实际分泌水平。在第1天的池的表面荧光和7天分批法中的体积生产率之间观察到相似的良好的相关性(R2>0.8)(参见图25;在该批次中第7天对应于固定相的端部)。数据表明,根据所检测到的表面IgG表达可以早期预测分批法结束时池的性能。在分批法中,根据不断变化的培养基环境,细胞的生理状态连续变化。因此,通过选择性剪接的报告基因IgG的表面呈现与分批法中的实际分泌水平之间的相关性独立于细胞(指数生长的或固定的)的生理状态以及批处理阶段(生长或生产)。
验证假设克隆是根据细胞表面上呈现的抗体的密度通过流式细胞仪细胞分选生成。为了此目的,使用抗人Fc PE标记的抗体为表面IgG染色稳定池。根据细胞的表面荧光(“低”,“中”和“高”)定义三个区域并且在96孔板中相应地克隆单细胞。可以在图26A中看出圈门策略。约两周后,扩展克隆并且再次确定细胞的表面强度以验证在克隆以后确实获得分选表型。所有克隆的表面强度的分布可以在图26B中看出。整体分选是成功的,因为这三个不同分选的组的表面IgG的分布对应于预期的表型“低”,“中”和“高”。检测到一些异常值,例如在显示高表面荧光的“低”组中,有可能是由于分选之前的染色的伪影。随后在补充批次中评估所产生的克隆的性能。图26C示出了每组的单位生产率qP的分布。还一式四份地评估原始池的qP并在图中给出作为对照。在具有大约10pg/细胞/天的中间qP的“高”表面的荧光组内清楚地识别最好的表现者。相比于原始池(约5pg/细胞/天),生产率显著提高2-6倍因子,最好的克隆达到超过30pg/细胞/天。与此相反,具有“低”和“中等”类别的克隆是整体低表现者,具有接近0pg/细胞/天的中间qP。有些异常值达到>20pg/细胞/天,但这些表型也显示出通过流式细胞仪所检测到的IgG的高表面密度。
结论
在本实施例中已证实通过选择性剪接在细胞膜上表达的IgG的水平报告重组细胞的实际分泌水平。在产物的特异性检测后的细胞膜荧光与上清液中积累的IgG浓度和转染的稳定细胞的qP相关。也已证明,该相关性是有效的而不管分批生产过程的阶段。总之,这些数据表明,重组细胞的定量分泌水平可以通过本文所描述的选择性剪接表面呈现报告系统来预测。这通过使用流式细胞仪细胞分选根据在细胞表面上呈现的IgG的密度选择克隆来验证。实际上,高的生产者可以使用这种方法来选择,并且显示出工业相关单位生产率的克隆可以以时间效率的方式来产生。
序列表
<110> 格兰马克药品股份有限公司
GLENMARK PHARMACEUTICALS S.A.
<120> 表达构建体和用于选择表达多肽的宿主细胞的方法
EXPRESSION CONSTRUCTS AND METHODS FOR SELECTING HOST CELLS EXPRESSINGPOLYPEPTIDES
<130> P3125PC00
<160> 347
<170> PatentIn版本3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr269
<400> 1
caggggggcg gagcctatgg 20
<210> 2
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr497
<400> 2
gcccccctcc cgcgaggaga tgaccaagaa ccaggtgtcc ctg 43
<210> 3
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr498
<400> 3
tttctagatt catcacttgc cgggggacag gctc 34
<210> 4
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr501
<400> 4
tataaagctt ccaccatgga gagccctgcc c 31
<210> 5
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr502
<400> 5
tatatctaga ttcatcagca ctcgccccgg ttg 33
<210> 6
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1437
<400> 6
ccaaatcgat ttatcagcac tcgccccggt tgaag 35
<210> 7
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1500
<400> 7
ccgggatcga tttatcagtg atggtgatgg tgatg 35
<210> 8
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1502
<400> 8
ggccgatcga tttatcactt gccaggagac ag 32
<210> 9
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1516
<400> 9
gatgaaagct tggtaggtga tcctcctg 28
<210> 10
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1517
<400> 10
atgtattcga atatctccac cggttgcagc tctgagccag ggaggaggga ag 52
<210> 11
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1518
<400> 11
taagctagcc caccatggag agccctgc 28
<210> 12
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1519
<400> 12
gaggctcttc tgcgtgtagt ggttgtgcaa ggcctcgtgc atcacgctg 49
<210> 13
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1520
<400> 13
ctaccaagct ttcatcattt acccggagac agggagaggc tcttctgcgt g 51
<210> 14
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1521
<400> 14
gggagctgga cgggctgtgg acgaccatca ccatcttcat cacactcttc ctgttaagcg 60
tgtgctacag tgccaccgtc accttcttca ag 92
<210> 15
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1522
<400> 15
gtagtcgggg atgatggtct gcttcaggtc caccaccgag gagaagatcc acttcacctt 60
gaagaaggtg acggtggcac tgtagcacac gc 92
<210> 16
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1523
<400> 16
atataccggt ggagagctgt gcggaggcgc aggacgggga gctggacggg ctgtg 55
<210> 17
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1524
<400> 17
atatttcgaa tcactaggcc ccctgtccga tcatgttcct gtagtcgggg atgatggtc 59
<210> 18
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1649
<400> 18
tctccaccgg ttgcagctct gttccctcct ccctcggtta g 41
<210> 19
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1650
<400> 19
gcgccatcga tacagacatg ataagataca ttg 33
<210> 20
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1651
<400> 20
gcgcgatcga tacttgttta ttgcagctta taatgg 36
<210> 21
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1689
<400> 21
atatgctagc ccaccatgcg gagccctgcc cagctgctgt tcctgctgct gctg 54
<210> 22
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1690
<400> 22
tgctgttcct gctgctgctg tggatccctg gcaccaacgc cgaggtgcag ctggtcgagt 60
c 61
<210> 23
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1725
<400> 23
atatactagt ccaccatgcg gagccctgcc cagctgctgt tcctgctgct gctg 54
<210> 24
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1726
<400> 24
ctgttcctgc tgctgctgtg gatccctggc accaacgccc aggtgcagct gcagcagtc 59
<210> 25
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1727
<400> 25
ctgttcctgc tgctgctgtg gatccctggc accaacgcca tggagacaga cacactcc 58
<210> 26
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1735
<400> 26
gacttcgaat catcaatgat ggtggtggtg atgggcgctg gcgaggagca ggtcgaacag 60
gagcagcttg 70
<210> 27
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1760
<400> 27
ccgcatcgat ttatcattta cccgggctca ggctcag 37
<210> 28
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1799
<400> 28
atataccggt ggaggccctg tggctgggcg tgctgagact gctgctgttc aagctgctcc 60
tgttcgacct g 71
<210> 29
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1800
<400> 29
gtaagctttc atcatttacc cggagacagg gagaggctct tctgcgtgaa tcggttgtgc 60
<210> 30
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1801
<400> 30
gcgcgaagct ttcatcattt acccggagac agggagaggc tcttctgcgt ataatgattg 60
<210> 31
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1840
<400> 31
atataccggt ggaggccctg tggctgggcg tgctg 35
<210> 32
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2099
<400> 32
tcctcggggg gagatccacc accacctgag ccagggagga gggaag 46
<210> 33
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2100
<400> 33
gcgcttcgaa tcatcacaga aacacggtct g 31
<210> 34
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2101
<400> 34
tggtggtgga tctccccccg aggacccccc tgactccaag 40
<210> 35
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2102
<400> 35
tcctcggggg gagatccacc accacctgtt ccctcctccc tcggttag 48
<210> 36
<211> 1082
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC3899
<400> 36
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600
aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660
tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tggatcttct 720
cctcggtggt ggacctgaag cagaccatca tccccgacta caggaacatg atcggacagg 780
gggcctagtg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840
attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900
ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080
gt 1082
<210> 37
<211> 1064
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC4398
<400> 37
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540
gggaggaggg aacagagctg caaccggtgg agagctgtgc ggaggcgcag gacggggagc 600
tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta agcgtgtgct 660
acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg gtggacctga 720
agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag tgattcgaaa 780
tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 840
atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 900
gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 960
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 1020
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1064
<210> 38
<211> 1219
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC4401
<400> 38
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420
tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480
cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540
gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600
gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660
ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720
ggtggagagc tgtgcggagg cgcaggacgg ggagctggac gggctgtgga cgaccatcac 780
catcttcatc acactcttcc tgttaagcgt gtgctacagt gccaccgtca ccttcttcaa 840
ggtgaagtgg atcttctcct cggtggtgga cctgaagcag accatcatcc ccgactacag 900
gaacatgatc ggacaggggg cctagtgatt cgaaatgacc gaccaagcga cgcccaacct 960
gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt 1020
tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc 1080
ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 1140
tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 1200
tgtatcttat catgtctgt 1219
<210> 39
<211> 1263
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC4402
<400> 39
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600
aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660
tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tggatcttct 720
cctcggtggt ggacctgaag cagaccatca tccccgacta caggaacatg atcggacagg 780
gggcctagtg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840
attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900
ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080
gtataccgtc gacctctagc tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt 1140
gaaattgtta tccgctcaca attccacaca acatacgagc cggggcagga taatatatgg 1200
tagggttcat agccagagta accttttttt ttaattttta ttttatttta tttttgagat 1260
cag 1263
<210> 40
<211> 977
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC5854
<400> 40
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag gccctgtggc 600
tgggcgtgct gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcgccagcg 660
cccatcacca ccaccatcat tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 720
catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 780
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 840
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 900
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 960
tatcttatca tgtctgt 977
<210> 41
<211> 959
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC5855
<400> 41
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540
gggaggaggg aacagagctg caaccggtgg aggccctgtg gctgggcgtg ctgagactgc 600
tgctgttcaa gctgctcctg ttcgacctgc tcctcgccag cgcccatcac caccaccatc 660
attgatgatt cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt 720
ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga 780
tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg 840
cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 900
tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 959
<210> 42
<211> 1114
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC5857
<400> 42
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420
tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480
cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540
gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600
gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660
ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720
ggtggaggcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc tcctgttcga 780
cctgctcctc gccagcgccc atcaccacca ccatcattga tgattcgaaa tgaccgacca 840
agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt 900
gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 960
gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 1020
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 1080
gtccaaactc atcaatgtat cttatcatgt ctgt 1114
<210> 43
<211> 1158
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC5856
<400> 43
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag gccctgtggc 600
tgggcgtgct gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcgccagcg 660
cccatcacca ccaccatcat tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 720
catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 780
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 840
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 900
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 960
tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa tcatggtcat 1020
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccgggg 1080
caggataata tatggtaggg ttcatagcca gagtaacctt tttttttaat ttttatttta 1140
ttttattttt gagatcag 1158
<210> 44
<211> 1076
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC6030
<400> 44
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600
aggcgcagga cggggagctg gacgccctgt ggctgggcgt gctgagactg ctgctgttca 660
agctgctcct gttcgacctg ctcctcacct tcttcaaggt gaagtggatc ttctcctcgg 720
tggtggacct gaagcagacc atcatccccg actacaggaa catgatcgga cagggggcct 780
agtgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076
<210> 45
<211> 1058
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC6048
<400> 45
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540
gggaggaggg aacagagctg caaccggtgg agagctgtgc ggaggcgcag gacggggagc 600
tggacgccct gtggctgggc gtgctgagac tgctgctgtt caagctgctc ctgttcgacc 660
tgctcctcac cttcttcaag gtgaagtgga tcttctcctc ggtggtggac ctgaagcaga 720
ccatcatccc cgactacagg aacatgatcg gacagggggc ctagtgattc gaaatgaccg 780
accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 840
ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 900
tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 960
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1020
gtttgtccaa actcatcaat gtatcttatc atgtctgt 1058
<210> 46
<211> 1213
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC6047
<400> 46
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420
tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480
cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540
gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600
gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660
ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag agctgcaacc 720
ggtggagagc tgtgcggagg cgcaggacgg ggagctggac gccctgtggc tgggcgtgct 780
gagactgctg ctgttcaagc tgctcctgtt cgacctgctc ctcaccttct tcaaggtgaa 840
gtggatcttc tcctcggtgg tggacctgaa gcagaccatc atccccgact acaggaacat 900
gatcggacag ggggcctagt gattcgaaat gaccgaccaa gcgacgccca acctgccatc 960
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 1020
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 1080
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 1140
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 1200
ttatcatgtc tgt 1213
<210> 47
<211> 1257
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC6046
<400> 47
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600
aggcgcagga cggggagctg gacgccctgt ggctgggcgt gctgagactg ctgctgttca 660
agctgctcct gttcgacctg ctcctcacct tcttcaaggt gaagtggatc ttctcctcgg 720
tggtggacct gaagcagacc atcatccccg actacaggaa catgatcgga cagggggcct 780
agtgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgtatac 1080
cgtcgacctc tagctagagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 1140
gttatccgct cacaattcca cacaacatac gagccggggc aggataatat atggtagggt 1200
tcatagccag agtaaccttt ttttttaatt tttattttat tttatttttg agatcag 1257
<210> 48
<211> 1738
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC314
<400> 48
atggagagcc ctgcccagct gctgttcctg ctgctgctgt ggctgcctga cacccaggcc 60
gaggtgcagc tggtcgagtc tggcggcgga ctggtgcagc ctggcggctc cctgcggctg 120
tcctgcgccg cctccggctt caacatcaag gacacctaca tccactgggt gcggcaggcc 180
cctggcaagg gcctggagtg ggtggcccgg atctacccta ccaacggcta caccagatac 240
gccgactccg tgaagggccg gttcaccatc tccgccgaca cctccaagaa caccgcctac 300
ctgcagatga actccctgcg ggccgaggac accgccgtgt actactgctc cagatgggga 360
ggagatggct tctacgccat ggactactgg ggccagggca ccctggtgac cgtgtcctcc 420
gcctccacca agggccccag cgtgttcccc ctggccccca gcagcaagtc taccagcggc 480
ggcacagcag ccctgggatg cctggtgaag gactacttcc ccgagcccgt gaccgtgagc 540
tggaacagcg gagccctgac ctccggcgtg cacaccttcc ccgccgtgct gcagagcagc 600
ggcctgtaca gcctgagcag cgtggtgacc gtgcccagca gcagcctggg cacccagacc 660
tacatctgca acgtgaacca caagcccagc aacaccaagg tggacaagaa ggtggagccc 720
aagagctgcg acaagaccca cacctgccct ccctgtcctg ctcctgagct gctcggcgga 780
ccctccgtgt tcctgttccc ccccaagccc aaggacaccc tgatgatcag caggaccccc 840
gaggtgacct gcgtggtggt ggacgtgagc cacgaggacc cagaggtgaa gttcaactgg 900
tacgtggacg gcgtggaggt gcacaacgcc aagaccaagc ccagagagga acagtacaac 960
agcacctaca gggtggtgtc cgtgctgacc gtgctgcacc aggactggct gaacggcaaa 1020
gagtacaagt gcaaggtctc caacaaggcc ctgccagccc ccatcgagaa aaccatcagc 1080
aaggccaagg gccagccacg ggagccccag gtgtacaccc tgcccccctc ccgcgaggag 1140
atgaccaaga accaggtgtc cctgacatgt ctggtgaaag gcttctaccc cagcgacatc 1200
gccgtggagt gggagagcaa cggccagccc gagaacaact acaagaccac ccccccagtg 1260
ctggacagcg acggcagctt cttcctgtac agcaagctga ccgtggacaa gagcaggtgg 1320
cagcagggca acgtgttcag ctgcagcgtg atgcacgagg ccctgcacaa ccactacacc 1380
cagaagagcc tgagcctgtc ccccggcaag tgatgaatct agaggtaccc ccggggggcc 1440
cctcgagttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc 1500
caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 1560
gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 1620
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 1680
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgt 1738
<210> 49
<211> 1410
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC5644
<400> 49
atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60
caggtgcagc tgcagcagtc tggcgccgaa ctggccagac caggcgccag cgtgaagatg 120
agctgcaagg ccagcggcta caccttcacc cggtacacca tgcactgggt gaaacagcgg 180
cctggacagg gcctggaatg gatcggctac atcaacccca gccggggcta caccaactac 240
aaccagaagt tcaaggacaa ggccaccctg accaccgaca agagcagcag caccgcctac 300
atgcagctga gcagcctgac cagcgaggac agcgccgtgt actactgcgc ccggtactac 360
gacgaccact actgcctgga ctactggggc cagggcacca ccctgaccgt gagcagcgcg 420
tcgaccaagg gccccagcgt gttcccgcta gcccccagca gcaagagcac cagcggcggc 480
acagccgccc tgggctgcct ggtgaaggac tacttccccg agcccgttac cgtgtcctgg 540
aactctggag ccctgacctc cggcgtgcac accttccccg ccgtgctcca gagcagcggc 600
ctgtacagcc tgagcagcgt ggtgacagtg cccagcagca gcctgggaac ccagacctac 660
atctgcaacg tgaaccacaa gcccagcaac accaaggtgg acaagaaggt ggagcccaag 720
agctgcgaca aaactcacac ctgcccaccc tgccctgccc ctgagctgct gggcggaccc 780
tccgtgttcc tgttcccccc caagcccaag gacaccctga tgatcagccg gacccccgag 840
gtgacctgcg tggtggtgga cgtgagccac gaggaccctg aggtgaagtt caattggtac 900
gtggacggcg tggaggtgca caacgccaag accaagcccc gggaggaaca gtacaacagc 960
acctaccggg tggtgtccgt gctgaccgtg ctgcaccagg actggctgaa cggcaaggaa 1020
tacaagtgca aggtctccaa caaggccctg cctgccccca tcgaaaagac catcagcaag 1080
gccaagggcc agccgcgcga accgcaggtg tacaccctgc cccccagccg ggaagagatg 1140
accaagaacc aggtgaaact ggtgtgcctg gtgacaggct tctaccccag cgatatcgcc 1200
gtggaatggg agagcagcgg ccagcctgag aacaactact acaccacccc ccccatgctg 1260
gacagcgacg gcagcttcag cctggtgtcc tggctgaacg tggacaagag ccggtggcag 1320
cagggcaaca tcttcagctg cagcgtgatg cacgaggccc tgcacaaccg gttcacccag 1380
aagtccctga gcctgagccc gggtaaatga 1410
<210> 50
<211> 1074
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC5537
<400> 50
gggtaaatga tgaaagcttg gtaggtgatc ctcctgctgc tttggttcag ggttttgctt 60
gagggggggg ggtggtgatt tccttgccat gggcagactg agcagaaaag gccattggga 120
ccatgttctg aatgcctcca cctcaaccac cggccggtag gaccaaagcc accccgtgtt 180
ttctcaggat ctcttttccc agggagatcc ctcggcccaa agagggagat ggcaatgctg 240
gatgtgtgca caataattca acaggcattg gaacttcagc atcgatgctg aatgcaatta 300
acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 360
cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 420
ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 480
ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 540
ttcccttccc tcctccctgg ctcagagctg caaccggtgg agagctgtgc ggaggcgcag 600
gacggggagc tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta 660
agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg 720
gtggacctga agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag 780
tgattcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc 840
gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc 900
ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct 960
tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1020
ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1074
<210> 51
<211> 1488
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC5608
<400> 51
atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60
gaggtgcagc tggtcgagtc tggcggcgga ctggtgcagc ctggcggctc cctgcggctg 120
tcctgcgccg cctccggctt caacatcaag gacacctaca tccactgggt gcggcaggcc 180
cctggcaagg gcctggagtg ggtggcccgg atctacccta ccaacggcta caccagatac 240
gccgactccg tgaagggccg gttcaccatc tccgccgaca cctccaagaa caccgcctac 300
ctgcagatga actccctgcg ggccgaggac accgccgtgt actactgctc cagatgggga 360
ggagatggct tctacgccat ggactactgg ggccagggca ccctggtgac cgtgtcctcc 420
ggtggcggtg gcagcggcgg tggtggttcc ggaggcggcg gttctgacat ccagatgacc 480
cagtccccct ccagcctgtc tgcctccgtg ggcgaccggg tgaccatcac ctgccgggcc 540
tcccaggacg tgaacaccgc cgtggcctgg tatcagcaga agcctggcaa ggcccctaag 600
ctgctgatct actccgcctc cttcctgtac tccggcgtgc cttcccggtt ctccggctcc 660
cggtccggca ccgacttcac cctgaccatc tcctccctgc agcctgagga cttcgccacc 720
tactactgcc agcagcacta caccacccct cctaccttcg gccagggcac caaggtggag 780
atcaagaggg gaggaggagg taccgacaaa actcacacat gcccaccgtg cccagcacct 840
gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 900
atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 960
gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 1020
gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 1080
tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 1140
gagaaaacca tctccaaagc caaaggacag cccagggaac ctgaggtggc cacattccca 1200
cctagccggg acgagctgac aaaaaatcag gtcaccctcg tctgtctcgt gaccggcttt 1260
tacccttccg acattgccgt ggaatgggaa tccaatgggc agcccgagaa caattacaag 1320
acagaccccc ccctgctgga atccgatggc agcttcgccc tgagcagccg gctgcgggtg 1380
gacaagtcca gatggcagca ggggaatgtc ttttcctgct ccgtcatgca tgaagccctc 1440
cacaatcatt atacacagaa aagcctgagc ctgtctcctg gcaagtga 1488
<210> 52
<211> 1074
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC5538
<400> 52
gggtaaatga tgaaagcttg gtaggtgatc ctcctgctgc tttggttcag ggttttgctt 60
gagggggggg ggtggtgatt tccttgccat gggcagactg agcagaaaag gccattggga 120
ccatgttctg aatgcctcca cctcaaccac cggccggtag gaccaaagcc accccgtgtt 180
ttctcaggat ctcttttccc agggagatcc ctcggcccaa agagggagat ggcaatgctg 240
gatgtgtgca caataattca acaggcattg gaacttcagc atcgatgctg aatgcaatta 300
acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 360
cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 420
ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 480
ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 540
ttcccttccc tcctccctgg ctcagagctg caaccggtgg agagctgtgc ggaggcgcag 600
gacggggagc tggacgggct gtggacgacc atcaccatct tcatcacact cttcctgtta 660
agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga agtggatctt ctcctcggtg 720
gtggacctga agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag 780
tgattcgaaa tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc 840
gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc 900
ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct 960
tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1020
ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1074
<210> 53
<211> 1076
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC7057
<400> 53
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540
gggaggaggg aacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600
ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660
ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720
caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780
gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076
<210> 54
<211> 1231
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC7058
<400> 54
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420
tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480
cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540
gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600
gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660
ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720
atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780
cggcgccgtg attaccgtgg tcgtgatcgt cgtgattatc aagtgcttct gcaagcaccg 840
gtcctgcttc cggcggaacg aggcctccag agagacaaac aactccctga ccttcggccc 900
cgaggaagcc ctggctgagc agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc 960
gacgcccaac ctgccatcac gagatttcga ttccaccgcc gccttctatg aaaggttggg 1020
cttcggaatc gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct 1080
ggagttcttc gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa 1140
tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc 1200
caaactcatc aatgtatctt atcatgtctg t 1231
<210> 55
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC7056
<400> 55
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 56
<211> 1275
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC7059
<400> 56
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgtataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc 1140
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggggcag 1200
gataatatat ggtagggttc atagccagag taaccttttt ttttaatttt tattttattt 1260
tatttttgag atcag 1275
<210> 57
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> GSC9765
<400> 57
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 58
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> GSC9764
<400> 58
ctgtctcccg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 59
<211> 1076
<212> DNA
<213> 人工序列
<220>
<223> GSC9949
<400> 59
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccgt 540
ctccttctgg gacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600
ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660
ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720
caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780
gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076
<210> 60
<211> 1076
<212> DNA
<213> 人工序列
<220>
<223> GSC9768
<400> 60
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct 540
gggaggattg cacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600
ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660
ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720
caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780
gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076
<210> 61
<211> 1076
<212> DNA
<213> 人工序列
<220>
<223> GSC9763
<400> 61
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct 540
gtccttattg cacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600
ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660
ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720
caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780
gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076
<210> 62
<211> 1076
<212> DNA
<213> 人工序列
<220>
<223> GSC9770
<400> 62
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga 540
gacctgaggg gacaggtggt ggtggatctc cccccgagga cccccctgac tccaagaata 600
ccctggtgct gttcggcgct ggcttcggcg ccgtgattac cgtggtcgtg atcgtcgtga 660
ttatcaagtg cttctgcaag caccggtcct gcttccggcg gaacgaggcc tccagagaga 720
caaacaactc cctgaccttc ggccccgagg aagccctggc tgagcagacc gtgtttctgt 780
gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 840
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 900
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 960
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 1020
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1076
<210> 63
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> GSC9950
<400> 63
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctg ctacctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 64
<211> 211
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq32
<400> 64
accggtggag agctgtgcgg aggcgcagga cggggagctg gacgccctgt ggctgggcgt 60
gctgagactg ctgctgttca agctgctcct gttcgacctg ctcctcacct tcttcaaggt 120
gaagtggatc ttctcctcgg tggtggacct gaagcagacc atcatccccg actacaggaa 180
catgatcgga cagggggcct agtgattcga a 211
<210> 65
<211> 2009
<212> DNA
<213> 人类
<400> 65
agctttctgg ggcaggccag gcctgacctt ggctttgggg cagggagggg gctaaggtga 60
ggcaggtggc gccagcaggt gcacacccaa tgcccatgag cccagacact ggacgctgaa 120
cctcgcggac agttaagaac ccaggggcct ctgcgcctgg gcccagctct gtcccacacc 180
gcggtcacat ggcaccacct ctcttgcagc ctccaccaag ggcccatcgg tcttccccct 240
ggcaccctcc tccaagagca cctctggggg cacagcggcc ctgggctgcc tggtcaagga 300
ctacttcccc gaaccggtga cggtgtcgtg gaactcaggc gccctgacca gcggcgtgca 360
caccttcccg gctgtcctac agtcctcagg actctactcc ctcagcagcg tggtgaccgt 420
gccctccagc agcttgggca cccagaccta catctgcaac gtgaatcaca agcccagcaa 480
caccaaggtg gacaagaaag ttggtgagag gccagcacag ggagggaggg tgtctgctgg 540
aagcaggctc agcgctcctg cctggacgca tcccggctat gcagccccag tccagggcag 600
caaggcaggc cccgtctgcc tcttcacccg gagcctctgc ccgccccact catgctcagg 660
gagagggtct tctggctttt tcccaggctc tgggcaggca caggctaggt gcccctaacc 720
caggccctgc acacaaaggg gcaggtgctg ggctcagacc tgccaagagc catatccggg 780
aggaccctgc ccctgaccta agcccacccc aaaggccaaa ctctccactc cctcagctcg 840
gacaccttct ctcctcccag attccagtaa ctcccaatct tctctctgca gagcccaaat 900
cttgtgacaa aactcacaca tgcccaccgt gcccaggtaa gccagcccag gcctcgccct 960
ccagctcaag gcgggacagg tgccctagag tagcctgcat ccagggacag gccccagccg 1020
ggtgctgaca cgtccacctc catctcttcc tcagcacctg aactcctggg gggaccgtca 1080
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 1140
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 1200
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 1260
taccgggtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 1320
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 1380
aaaggtggga cccgtggggt gcgagggcca catggacaga ggccggctcg gcccaccctc 1440
tgccctgaga gtgaccgctg taccaacctc tgtcctacag ggcagccccg agaaccacag 1500
gtgtacaccc tgcccccatc ccgggatgag ctgaccaaga accaggtcag cctgacctgc 1560
ctggtcaaag gcttctatcc cagcgacatc gccgtggagt gggagagcaa tgggcagccg 1620
gagaacaact acaagaccac gcctcccgtg ctggactccg acggctcctt cttcctctac 1680
agcaagctca ccgtggacaa gagcaggtgg cagcagggga acgtcttctc atgctccgtg 1740
atgcatgagg ctctgcacaa ccactacacg cagaagagcc tctccctgtc tccgggtaaa 1800
tgagtgcgac ggccggcaag ccccgctccc cgggctctcg cggtcgcacg aggatgcttg 1860
gcacgtaccc cctgtacata cttcccgggc gcccagcatg gaaataaagc acccagcgct 1920
gccctgggcc cctgcgagac tgtgatggtt ctttccacgg gtcaggccga gtctgaggcc 1980
tgagtggcat gagggaggca gagcgggtc 2009
<210> 66
<211> 216
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq43
<400> 66
ccccccgagg acccccctga ctccaagaat accctggtgc tgttcggcgc tggcttcggc 60
gccgtgatta ccgtggtcgt gatcgtcgtg attatcaagt gcttctgcaa gcaccggtcc 120
tgcttccggc ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag 180
gaagccctgg ctgagcagac cgtgtttctg tgatga 216
<210> 67
<211> 546
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC2819
<400> 67
ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60
ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120
acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180
cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240
aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300
cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360
acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420
cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480
tgccccacag ctttaaggca cctggctaac ctctgcgctt cttcccttcc ctcctccctg 540
gctcag 546
<210> 68
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC3469
<400> 68
ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60
ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120
acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180
cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240
aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300
cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360
acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420
cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480
tgccccacag ctttaaggca cctggctaac cgagggagga gggaacag 528
<210> 69
<211> 563
<212> DNA
<213> 人工序列
<220>
<223> 内含子cTNT-I4
<400> 69
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300
aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360
gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420
gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480
ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540
cccttccctc ctccctggct cag 563
<210> 70
<211> 545
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(0Y)
<400> 70
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300
aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360
gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420
gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480
ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga gggaggaggg 540
aacag 545
<210> 71
<211> 700
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(polyA)
<400> 71
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt ttattgcagc 300
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 360
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatcga 420
tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca cagtgcagga 480
ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg gaaccggggt 540
ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga gagctgaaag 600
ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa ggcacctggc 660
taacctctgc gcttcttccc ttccctcctc cctggctcag 700
<210> 72
<211> 545
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(3Y)
<400> 72
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300
aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360
gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420
gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480
ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccga gacctgaggg 540
gacag 545
<210> 73
<211> 545
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(5Y)
<400> 73
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300
aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360
gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420
gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480
ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct gtccttattg 540
cacag 545
<210> 74
<211> 545
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(5Y-5)
<400> 74
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300
aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360
gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420
gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480
ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccct gggaggattg 540
cacag 545
<210> 75
<211> 545
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(9Y)
<400> 75
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300
aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360
gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420
gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480
ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaaccgt ctccttctgg 540
gacag 545
<210> 76
<211> 563
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(15Y-3?
<400> 76
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300
aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360
gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420
gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480
ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540
cccttccctg ctacctggct cag 563
<210> 77
<211> 1035
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(SV40ter)
<400> 77
gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc gaccaagcga 300
cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 360
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 420
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 480
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 540
aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag agcttggcgt 600
aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca 660
tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc ttttttttta 720
atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta acaatgctca 780
agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg cagcagtggg 840
gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg ctgcttcagt 900
gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac ctggtgcaca 960
ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc ttcccttccc 1020
tcctccctgg ctcag 1035
<210> 78
<211> 563
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4(SD_GGC)
<400> 78
gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg ttttgcttga 60
gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc cattgggacc 120
atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac cccgtgtttt 180
ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg caatgctgga 240
tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa tgcaattaac 300
aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc ccatgctgca 360
gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg ggctcctgct 420
gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc gtcctcacct 480
ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc tgcgcttctt 540
cccttccctc ctccctggct cag 563
<210> 79
<211> 375
<212> DNA
<213> 人工序列
<220>
<223> GSB59abc
<400> 79
ctgtccctgg gcaagtgata gaagcttgcg gccgcgctta gcgatatcga attctctaga 60
ggtacccccg gggggcccct cgagttcgaa atgaccgacc aagcgacgcc caacctgcca 120
tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc 180
cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac 240
cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 300
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 360
tcttatcatg tctgt 375
<210> 80
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> GSC11218
<400> 80
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 81
<211> 1097
<212> DNA
<213> 人工序列
<220>
<223> GSC11213
<400> 81
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatctg gctctgatcc tgggacctgt gctggctctg ctggcactgg 660
tggctctggg agtgctggga ctgtggaagt gcttctgcaa gcaccggtcc tgcttccggc 720
ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780
ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840
catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080
tatcttatca tgtctgt 1097
<210> 82
<211> 1097
<212> DNA
<213> 人工序列
<220>
<223> GSC11214
<400> 82
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatatc gccgccatca tcgtgatcct ggtgttgctc ctgctgctgg 660
gcatcggcct gatgtggtgg ttctggaagt gcttctgcaa gcaccggtcc tgcttccggc 720
ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780
ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840
catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080
tatcttatca tgtctgt 1097
<210> 83
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> GSC11210
<400> 83
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatatg gccctgattg tgctgggcgg agtggctggc ctgctgctgt 660
ttatcggcct gggcatcttc ttcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 84
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> GSC11205
<400> 84
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatatc gctggcgtga tcgctggcat cctgctgttc gtgatcatct 660
tcctgggcgt ggtgctcgtg atgaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 85
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> GSC11217
<400> 85
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgct ctggtcgtga tccccatcat cttcggcatc ctgttcgcca 660
tcctgctggt gctggtgttc atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 86
<211> 1097
<212> DNA
<213> 人工序列
<220>
<223> GSC11756
<400> 86
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatatc atccctatcg tggccggcgt ggtggctggc atcgtgctga 660
ttggactggc cctgctgctg atctggaagt gcttctgcaa gcaccggtcc tgcttccggc 720
ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780
ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840
catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080
tatcttatca tgtctgt 1097
<210> 87
<211> 1100
<212> DNA
<213> 人工序列
<220>
<223> GSC11296
<400> 87
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgga atcgtggctg gactggctgt gctggccgtg gtcgtgattg 660
gagctgtggt ggccgccgtg atgtgcagaa agtgcttctg caagcaccgg tcctgcttcc 720
ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780
tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840
tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960
cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020
atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080
atgtatctta tcatgtctgt 1100
<210> 88
<211> 1100
<212> DNA
<213> 人工序列
<220>
<223> GSC11295
<400> 88
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatctg atcattgccc tgcctgtggc cgtgctgctg atcgtgggag 660
gcctcgtgat catgctgtac gtgttccaca agtgcttctg caagcaccgg tcctgcttcc 720
ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780
tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840
tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960
cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020
atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080
atgtatctta tcatgtctgt 1100
<210> 89
<211> 1100
<212> DNA
<213> 人工序列
<220>
<223> GSC11390
<400> 89
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatggc ctgctgatcg gcatctccat cgcctccctg tgcctggtgg 660
tggccctgct ggccctgctg tgccacctga agtgcttctg caagcaccgg tcctgcttcc 720
ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780
tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840
tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960
cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020
atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080
atgtatctta tcatgtctgt 1100
<210> 90
<211> 1100
<212> DNA
<213> 人工序列
<220>
<223> GSC11391
<400> 90
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatctg ctgctgggcg tgtccgtgtc ctgcatcgtg atcctggccg 660
tgtgcctgct gtgctacgtg tccatcacca agtgcttctg caagcaccgg tcctgcttcc 720
ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780
tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840
tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960
cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020
atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080
atgtatctta tcatgtctgt 1100
<210> 91
<211> 1097
<212> DNA
<213> 人工序列
<220>
<223> GSC11392
<400> 91
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc aacaccgtgg gctccgtgat cggcgtgatc gtgaccatct 660
tcgtgtccgg caccgtgtac ttcatcaagt gcttctgcaa gcaccggtcc tgcttccggc 720
ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780
ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840
catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080
tatcttatca tgtctgt 1097
<210> 92
<211> 1097
<212> DNA
<213> 人工序列
<220>
<223> GSC11397
<400> 92
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatatc accctgatca tcttcggcgt gatggccggc gtgatcggca 660
ccatcctgct gatctcctac ggcatcaagt gcttctgcaa gcaccggtcc tgcttccggc 720
ggaacgaggc ctccagagag acaaacaact ccctgacctt cggccccgag gaagccctgg 780
ctgagcagac cgtgtttctg tgatgattcg aaatgaccga ccaagcgacg cccaacctgc 840
catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 900
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 960
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 1020
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 1080
tatcttatca tgtctgt 1097
<210> 93
<211> 1091
<212> DNA
<213> 人工序列
<220>
<223> GSC11204
<400> 93
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc 660
tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720
aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780
agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080
atcatgtctg t 1091
<210> 94
<211> 1091
<212> DNA
<213> 人工序列
<220>
<223> GSC11216
<400> 94
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcaagctgc 660
tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720
aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780
agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080
atcatgtctg t 1091
<210> 95
<211> 1091
<212> DNA
<213> 人工序列
<220>
<223> GSC11203
<400> 95
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcgtgctgc 660
tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720
aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780
agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080
atcatgtctg t 1091
<210> 96
<211> 1091
<212> DNA
<213> 人工序列
<220>
<223> GSC11211
<400> 96
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcaagctgc 660
tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720
aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780
agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080
atcatgtctg t 1091
<210> 97
<211> 1091
<212> DNA
<213> 人工序列
<220>
<223> GSC11212
<400> 97
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcgtgctgc 660
tcctgttcga cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720
aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780
agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080
atcatgtctg t 1091
<210> 98
<211> 1091
<212> DNA
<213> 人工序列
<220>
<223> GSC11398
<400> 98
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcaagctgc 660
tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720
aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780
agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080
atcatgtctg t 1091
<210> 99
<211> 1091
<212> DNA
<213> 人工序列
<220>
<223> GSC11208
<400> 99
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc ctgtggctgg gcgtgctgag actgctgctg ttcgtgctgc 660
tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720
aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780
agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080
atcatgtctg t 1091
<210> 100
<211> 1091
<212> DNA
<213> 人工序列
<220>
<223> GSC11291
<400> 100
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc ctgtggctgg gcgtgctggt actgctgctg ttcgtgctgc 660
tcctgttcgt cctgctcctc aagtgcttct gcaagcaccg gtcctgcttc cggcggaacg 720
aggcctccag agagacaaac aactccctga ccttcggccc cgaggaagcc ctggctgagc 780
agaccgtgtt tctgtgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac 840
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 900
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 960
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 1020
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 1080
atcatgtctg t 1091
<210> 101
<211> 1085
<212> DNA
<213> 人工序列
<220>
<223> GSC11297
<400> 101
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatttc ttcatccccc tgctggtggt gatcctgttc gccgtggaca 660
ccggcctgtt catcaagtgc ttctgcaagc accggtcctg cttccggcgg aacgaggcct 720
ccagagagac aaacaactcc ctgaccttcg gccccgagga agccctggct gagcagaccg 780
tgtttctgtg atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 840
tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 900
gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 960
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 1020
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 1080
tctgt 1085
<210> 102
<211> 1085
<212> DNA
<213> 人工序列
<220>
<223> GSC11298
<400> 102
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatatc ctgatcggca cctccgtggt gatcatcctg ttcatcctgc 660
tgttcttcct gctgaagtgc ttctgcaagc accggtcctg cttccggcgg aacgaggcct 720
ccagagagac aaacaactcc ctgaccttcg gccccgagga agccctggct gagcagaccg 780
tgtttctgtg atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 840
tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 900
gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 960
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 1020
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 1080
tctgt 1085
<210> 103
<211> 1079
<212> DNA
<213> 人工序列
<220>
<223> GSC11393
<400> 103
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgtg ctggccctga tcgtgatctt cctgaccatc gccgtgctgc 660
tggccctgaa gtgcttctgc aagcaccggt cctgcttccg gcggaacgag gcctccagag 720
agacaaacaa ctccctgacc ttcggccccg aggaagccct ggctgagcag accgtgtttc 780
tgtgatgatt cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt 840
ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga 900
tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg 960
cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 1020
tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 1079
<210> 104
<211> 1106
<212> DNA
<213> 人工序列
<220>
<223> GSC11394
<400> 104
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgtg atgtccgtgg ccaccatcgt gatcgtggac atctgcatca 660
ccggcggcct gctgctgctg gtgtactact ggtccaagtg cttctgcaag caccggtcct 720
gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780
aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840
ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900
gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960
tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080
tcatcaatgt atcttatcat gtctgt 1106
<210> 105
<211> 1106
<212> DNA
<213> 人工序列
<220>
<223> GSC11395
<400> 105
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatgcc atccccatct ggtgggtgct ggtgggcgtg ctgggcggcc 660
tgctgctgct gaccatcctg gtgctggcca tgtggaagtg cttctgcaag caccggtcct 720
gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780
aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840
ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900
gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960
tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080
tcatcaatgt atcttatcat gtctgt 1106
<210> 106
<211> 1109
<212> DNA
<213> 人工序列
<220>
<223> GSC11396
<400> 106
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatttc tgggtgctgg tggtggtggg cggcgtgctg gcctgctact 660
ccctgctggt gaccgtggcc ttcatcatct tctgggtgaa gtgcttctgc aagcaccggt 720
cctgcttccg gcggaacgag gcctccagag agacaaacaa ctccctgacc ttcggccccg 780
aggaagccct ggctgagcag accgtgtttc tgtgatgatt cgaaatgacc gaccaagcga 840
cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 900
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 960
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1020
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1080
aactcatcaa tgtatcttat catgtctgt 1109
<210> 107
<211> 1109
<212> DNA
<213> 人工序列
<220>
<223> GSC11389
<400> 107
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatctg tggacgacca tcaccatctt catcacactc ttcctgttaa 660
gcgtgtgcta cagtgccacc gtcaccttct tcaaggtgaa gtgcttctgc aagcaccggt 720
cctgcttccg gcggaacgag gcctccagag agacaaacaa ctccctgacc ttcggccccg 780
aggaagccct ggctgagcag accgtgtttc tgtgatgatt cgaaatgacc gaccaagcga 840
cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 900
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 960
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1020
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1080
aactcatcaa tgtatcttat catgtctgt 1109
<210> 108
<211> 1082
<212> DNA
<213> 人工序列
<220>
<223> GSC11677
<400> 108
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc accgtgatcg 660
tcgtgattat caagtgcttc tgcaagcacc ggtcctgctt ccggcggaac gaggcctcca 720
gagagacaaa caactccctg accttcggcc ccgaggaagc cctggctgag cagaccgtgt 780
ttctgtgatg attcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg 840
attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 900
ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 960
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 1020
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1080
gt 1082
<210> 109
<211> 1088
<212> DNA
<213> 人工序列
<220>
<223> GSC11679
<400> 109
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc accgtggtcg 660
tgatcgtcgt gattatcaag tgcttctgca agcaccggtc ctgcttccgg cggaacgagg 720
cctccagaga gacaaacaac tccctgacct tcggccccga ggaagccctg gctgagcaga 780
ccgtgtttct gtgatgattc gaaatgaccg accaagcgac gcccaacctg ccatcacgag 840
atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg 900
ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact 960
tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 1020
aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 1080
atgtctgt 1088
<210> 110
<211> 1100
<212> DNA
<213> 人工序列
<220>
<223> GSC11484
<400> 110
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtggtcattg 660
taaccgtggt cgtgatcgtc gtgattatca agtgcttctg caagcaccgg tcctgcttcc 720
ggcggaacga ggcctccaga gagacaaaca actccctgac cttcggcccc gaggaagccc 780
tggctgagca gaccgtgttt ctgtgatgat tcgaaatgac cgaccaagcg acgcccaacc 840
tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 900
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 960
cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 1020
atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 1080
atgtatctta tcatgtctgt 1100
<210> 111
<211> 1106
<212> DNA
<213> 人工序列
<220>
<223> GSC11292
<400> 111
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtggtcattg 660
tagtcgtaac cgtggtcgtg atcgtcgtga ttatcaagtg cttctgcaag caccggtcct 720
gcttccggcg gaacgaggcc tccagagaga caaacaactc cctgaccttc ggccccgagg 780
aagccctggc tgagcagacc gtgtttctgt gatgattcga aatgaccgac caagcgacgc 840
ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 900
gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 960
tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 1020
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 1080
tcatcaatgt atcttatcat gtctgt 1106
<210> 112
<211> 1007
<212> DNA
<213> 人工序列
<220>
<223> GSC11207
<400> 112
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcgccagcg cccatcacca ccaccatcat tgatgattcg 720
aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct 780
tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc 840
gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg 900
gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 960
ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgt 1007
<210> 113
<211> 995
<212> DNA
<213> 人工序列
<220>
<223> GSC11209
<400> 113
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagtg atgattcgaa atgaccgacc 720
aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 780
tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 840
tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 900
gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 960
tgtccaaact catcaatgta tcttatcatg tctgt 995
<210> 114
<211> 1058
<212> DNA
<213> 人工序列
<220>
<223> GSC11758
<400> 114
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgga tcttctcctc ggtggtggac ctgaagcaga 720
ccatcatccc cgactacagg aacatgatcg gacagggggc ctagtgattc gaaatgaccg 780
accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 840
ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 900
tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 960
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1020
gtttgtccaa actcatcaat gtatcttatc atgtctgt 1058
<210> 115
<211> 1016
<212> PRT
<213> 人工序列
<220>
<223> GSC11764
<400> 115
Cys Thr Gly Thr Cys Thr Cys Cys Gly Gly Gly Thr Ala Ala Ala Thr
1 5 10 15
Gly Ala Thr Gly Ala Ala Ala Gly Cys Thr Thr Gly Gly Thr Ala Gly
20 25 30
Gly Thr Gly Ala Thr Cys Cys Thr Cys Cys Thr Gly Cys Thr Gly Cys
35 40 45
Thr Thr Thr Gly Gly Thr Thr Cys Ala Gly Gly Gly Thr Thr Thr Thr
50 55 60
Gly Cys Thr Thr Gly Ala Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
65 70 75 80
Thr Gly Gly Thr Gly Ala Thr Thr Thr Cys Cys Thr Thr Gly Cys Cys
85 90 95
Ala Thr Gly Gly Gly Cys Ala Gly Ala Cys Thr Gly Ala Gly Cys Ala
100 105 110
Gly Ala Ala Ala Ala Gly Gly Cys Cys Ala Thr Thr Gly Gly Gly Ala
115 120 125
Cys Cys Ala Thr Gly Thr Thr Cys Thr Gly Ala Ala Thr Gly Cys Cys
130 135 140
Thr Cys Cys Ala Cys Cys Thr Cys Ala Ala Cys Cys Ala Cys Cys Gly
145 150 155 160
Gly Cys Cys Gly Gly Thr Ala Gly Gly Ala Cys Cys Ala Ala Ala Gly
165 170 175
Cys Cys Ala Cys Cys Cys Cys Gly Thr Gly Thr Thr Thr Thr Cys Thr
180 185 190
Cys Ala Gly Gly Ala Thr Cys Thr Cys Thr Thr Thr Thr Cys Cys Cys
195 200 205
Ala Gly Gly Gly Ala Gly Ala Thr Cys Cys Cys Thr Cys Gly Gly Cys
210 215 220
Cys Cys Ala Ala Ala Gly Ala Gly Gly Gly Ala Gly Ala Thr Gly Gly
225 230 235 240
Cys Ala Ala Thr Gly Cys Thr Gly Gly Ala Thr Gly Thr Gly Thr Gly
245 250 255
Cys Ala Cys Ala Ala Thr Ala Ala Thr Thr Cys Ala Ala Cys Ala Gly
260 265 270
Gly Cys Ala Thr Thr Gly Gly Ala Ala Cys Thr Thr Cys Ala Gly Cys
275 280 285
Ala Thr Cys Gly Ala Thr Gly Cys Thr Gly Ala Ala Thr Gly Cys Ala
290 295 300
Ala Thr Thr Ala Ala Cys Ala Ala Thr Gly Cys Thr Cys Ala Ala Gly
305 310 315 320
Cys Ala Gly Ala Ala Cys Cys Cys Cys Cys Gly Gly Cys Thr Cys Cys
325 330 335
Ala Thr Cys Ala Gly Cys Ala Cys Ala Gly Thr Gly Cys Ala Gly Gly
340 345 350
Ala Cys Cys Ala Ala Ala Cys Cys Cys Cys Ala Thr Gly Cys Thr Gly
355 360 365
Cys Ala Gly Cys Ala Gly Thr Gly Gly Gly Gly Cys Thr Gly Thr Cys
370 375 380
Thr Gly Thr Ala Cys Gly Gly Gly Gly Thr Gly Gly Gly Cys Ala Ala
385 390 395 400
Thr Gly Gly Gly Ala Ala Cys Cys Gly Gly Gly Gly Thr Cys Thr Gly
405 410 415
Cys Thr Gly Gly Gly Gly Cys Thr Cys Cys Thr Gly Cys Thr Gly Cys
420 425 430
Thr Thr Cys Ala Gly Thr Gly Cys Thr Gly Cys Cys Ala Thr Gly Cys
435 440 445
Ala Gly Cys Cys Ala Cys Ala Cys Ala Thr Cys Cys Thr Gly Ala Gly
450 455 460
Ala Gly Cys Thr Gly Ala Ala Ala Gly Gly Gly Thr Cys Gly Gly Cys
465 470 475 480
Gly Thr Cys Cys Thr Cys Ala Cys Cys Thr Gly Gly Thr Gly Cys Ala
485 490 495
Cys Ala Cys Cys Gly Thr Ala Gly Cys Thr Cys Thr Gly Cys Cys Cys
500 505 510
Cys Ala Cys Ala Gly Cys Thr Thr Thr Ala Ala Gly Gly Cys Ala Cys
515 520 525
Cys Thr Gly Gly Cys Thr Ala Ala Cys Cys Thr Cys Thr Gly Cys Gly
530 535 540
Cys Thr Thr Cys Thr Thr Cys Cys Cys Thr Thr Cys Cys Cys Thr Cys
545 550 555 560
Cys Thr Cys Cys Cys Thr Gly Gly Cys Thr Cys Ala Gly Gly Thr Gly
565 570 575
Gly Thr Gly Gly Thr Gly Gly Ala Thr Cys Thr Cys Cys Cys Cys Cys
580 585 590
Cys Gly Ala Gly Gly Ala Cys Cys Cys Cys Cys Cys Thr Gly Ala Cys
595 600 605
Thr Cys Cys Ala Ala Gly Ala Ala Thr Ala Cys Cys Cys Thr Gly Gly
610 615 620
Thr Gly Cys Thr Gly Thr Thr Cys Gly Gly Cys Gly Cys Thr Gly Gly
625 630 635 640
Cys Thr Thr Cys Gly Gly Cys Gly Cys Cys Gly Thr Gly Ala Thr Thr
645 650 655
Ala Cys Cys Gly Thr Gly Gly Thr Cys Gly Thr Gly Ala Thr Cys Gly
660 665 670
Thr Cys Gly Thr Gly Ala Thr Thr Ala Thr Cys Ala Gly Gly Thr Cys
675 680 685
Cys Cys Ala Gly Cys Ala Gly Gly Ala Gly Gly Cys Cys Gly Cys Cys
690 695 700
Gly Cys Cys Ala Ala Gly Ala Ala Gly Thr Thr Cys Thr Thr Cys Thr
705 710 715 720
Gly Ala Thr Gly Ala Thr Thr Cys Gly Ala Ala Ala Thr Gly Ala Cys
725 730 735
Cys Gly Ala Cys Cys Ala Ala Gly Cys Gly Ala Cys Gly Cys Cys Cys
740 745 750
Ala Ala Cys Cys Thr Gly Cys Cys Ala Thr Cys Ala Cys Gly Ala Gly
755 760 765
Ala Thr Thr Thr Cys Gly Ala Thr Thr Cys Cys Ala Cys Cys Gly Cys
770 775 780
Cys Gly Cys Cys Thr Thr Cys Thr Ala Thr Gly Ala Ala Ala Gly Gly
785 790 795 800
Thr Thr Gly Gly Gly Cys Thr Thr Cys Gly Gly Ala Ala Thr Cys Gly
805 810 815
Thr Thr Thr Thr Cys Cys Gly Gly Gly Ala Cys Gly Cys Cys Gly Gly
820 825 830
Cys Thr Gly Gly Ala Thr Gly Ala Thr Cys Cys Thr Cys Cys Ala Gly
835 840 845
Cys Gly Cys Gly Gly Gly Gly Ala Thr Cys Thr Cys Ala Thr Gly Cys
850 855 860
Thr Gly Gly Ala Gly Thr Thr Cys Thr Thr Cys Gly Cys Cys Cys Ala
865 870 875 880
Cys Cys Cys Cys Ala Ala Cys Thr Thr Gly Thr Thr Thr Ala Thr Thr
885 890 895
Gly Cys Ala Gly Cys Thr Thr Ala Thr Ala Ala Thr Gly Gly Thr Thr
900 905 910
Ala Cys Ala Ala Ala Thr Ala Ala Ala Gly Cys Ala Ala Thr Ala Gly
915 920 925
Cys Ala Thr Cys Ala Cys Ala Ala Ala Thr Thr Thr Cys Ala Cys Ala
930 935 940
Ala Ala Thr Ala Ala Ala Gly Cys Ala Thr Thr Thr Thr Thr Thr Thr
945 950 955 960
Cys Ala Cys Thr Gly Cys Ala Thr Thr Cys Thr Ala Gly Thr Thr Gly
965 970 975
Thr Gly Gly Thr Thr Thr Gly Thr Cys Cys Ala Ala Ala Cys Thr Cys
980 985 990
Ala Thr Cys Ala Ala Thr Gly Thr Ala Thr Cys Thr Thr Ala Thr Cys
995 1000 1005
Ala Thr Gly Thr Cys Thr Gly Thr
1010 1015
<210> 116
<211> 1016
<212> DNA
<213> 人工序列
<220>
<223> GSC11678
<400> 116
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaggtccc agcaggaggc cgccgccaag aagtggtggt 720
gatgattcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 780
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 840
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 900
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 960
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgt 1016
<210> 117
<211> 1115
<212> DNA
<213> 人工序列
<220>
<223> GSC11759
<400> 117
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcatgttcc tgaccctgaa gggctccctg aagcagaggc 720
tgcaggtgat gatccagccc tccgaggaca tcgtgaggcc cgagaacggc cccgagcagc 780
cccaggccgg ctcctccgcc tccaaggagg cctacatctg atgattcgaa atgaccgacc 840
aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 900
tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 960
tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 1020
gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 1080
tgtccaaact catcaatgta tcttatcatg tctgt 1115
<210> 118
<211> 1004
<212> DNA
<213> 人工序列
<220>
<223> GSC11483
<400> 118
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcatgttcc tgaccctgaa gggctcctga tgattcgaaa 720
tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 780
atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 840
gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 900
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 960
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1004
<210> 119
<211> 1115
<212> DNA
<213> 人工序列
<220>
<223> GSC11760
<400> 119
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atctgcttcg tgggcaacag gttccagcag aagctgaggt 720
ccgtgttcag ggtgcccatc acctggctgc agggcaagag ggagaccatg tcctgcagga 780
agtcctcctc cctgagggag atggacacct tcgtgtcctg atgattcgaa atgaccgacc 840
aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 900
tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 960
tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa 1020
gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 1080
tgtccaaact catcaatgta tcttatcatg tctgt 1115
<210> 120
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> GSC11761
<400> 120
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atctgcttcg tgggcaacag gttccagcag aagctgaggt 720
ccgtgttcag ggtgcccatc acctggctgc agggcaagag ggagaccatg tcctgcagga 780
agtcctcctc cctgaggtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 121
<211> 1229
<212> DNA
<213> 人工序列
<220>
<223> GSC11762
<400> 121
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaactccc acctgctgcc caggcccctg aggcacctgg 720
cctgctgcgg cggcccccag cccaggatga ggaggaggct gtccgacggc tccctgtcct 780
ccaggcacac caccctgctg accaggtcct cctgccccgc caccctgtcc ctgtccctgt 840
ccctgaccct gtccggcagg cccaggcccg aggagtcccc cagggacctg gagctggccg 900
acggcgaggg caccgccgag accatcatct tctgatgatt cgaaatgacc gaccaagcga 960
cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 1020
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 1080
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 1140
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1200
aactcatcaa tgtatcttat catgtctgt 1229
<210> 122
<211> 1052
<212> DNA
<213> 人工序列
<220>
<223> GSC11765
<400> 122
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaactccc acgaggagtc ccccagggac ctggagctgg 720
ccgacggcga gggcaccgcc gagaccatca tcttctgatg attcgaaatg accgaccaag 780
cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 840
gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 900
tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 960
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 1020
ccaaactcat caatgtatct tatcatgtct gt 1052
<210> 123
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> GSC11766
<400> 123
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atctgcatca agctgaagca caccaagaag aggcagatct 720
acaccgacat cgagatgaac aggctgggca agtgatgatt cgaaatgacc gaccaagcga 780
cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 840
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 900
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 960
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1020
aactcatcaa tgtatcttat catgtctgt 1049
<210> 124
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> GSC11763
<400> 124
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atctgcatca agctgaagca caccaagaag aggcagatcg 720
ccgccgccgc cgccgccaac aggctgggca agtgatgatt cgaaatgacc gaccaagcga 780
cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 840
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 900
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 960
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 1020
aactcatcaa tgtatcttat catgtctgt 1049
<210> 125
<211> 1118
<212> DNA
<213> 人工序列
<220>
<223> GSC11294
<400> 125
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600
aggcgcagga cggggagctg gacgggctgt ggacgaccat caccatcttc atcacactct 660
tcctgttaag cgtgtgctac agtgccaccg tcaccttctt caaggtgaag tgcttctgca 720
agcaccggtc ctgcttccgg cggaacgagg cctccagaga gacaaacaac tccctgacct 780
tcggccccga ggaagccctg gctgagcaga ccgtgtttct gtagtgattc gaaatgaccg 840
accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc ttctatgaaa 900
ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 960
tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 1020
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 1080
gtttgtccaa actcatcaat gtatcttatc atgtctgt 1118
<210> 126
<211> 466
<212> PRT
<213> 人工序列
<220>
<223> GSB59abc
<400> 126
Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro
1 5 10 15
Asp Gly Val His Ala Gln Val Thr Leu Lys Glu Ser Gly Pro Ala Leu
20 25 30
Val Lys Pro Thr Gln Thr Leu Thr Leu Thr Cys Ser Phe Ser Gly Phe
35 40 45
Ser Leu Ser Thr Ser Gly Met Gly Val Gly Trp Ile Arg Gln Pro Pro
50 55 60
Gly Lys Ala Leu Glu Trp Ile Ala His Ile Trp Trp Asp Asp Asp Lys
65 70 75 80
Tyr Tyr Asn Thr Ala Leu Lys Thr Arg Leu Thr Ile Ser Lys Asp Thr
85 90 95
Ser Lys Asn Gln Val Val Leu Thr Met Thr Asn Met Asp Pro Val Asp
100 105 110
Thr Ala Thr Tyr Tyr Cys Ala Arg Ile Asp Trp Asp Gly Phe Ala Tyr
115 120 125
Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly
130 135 140
Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser
145 150 155 160
Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val
165 170 175
Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe
180 185 190
Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val
195 200 205
Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val
210 215 220
Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys
225 230 235 240
Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly
245 250 255
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
260 265 270
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu
275 280 285
Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
290 295 300
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg
305 310 315 320
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
325 330 335
Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu
340 345 350
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
355 360 365
Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu
370 375 380
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
385 390 395 400
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
405 410 415
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp
420 425 430
Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His
435 440 445
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu
450 455 460
Gly Lys
465
<210> 127
<211> 80
<212> PRT
<213> 人工序列
<220>
<223> GSC11218
<400> 127
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His
35 40 45
Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser
50 55 60
Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75 80
<210> 128
<211> 81
<212> PRT
<213> 人工序列
<220>
<223> GSC11213
<400> 128
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Leu Ala Leu Ile Leu Gly Pro Val Leu Ala Leu Leu
20 25 30
Ala Leu Val Ala Leu Gly Val Leu Gly Leu Trp Lys Cys Phe Cys Lys
35 40 45
His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn
50 55 60
Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe
65 70 75 80
Leu
<210> 129
<211> 81
<212> PRT
<213> 人工序列
<220>
<223> GSC11214
<400> 129
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ile Ala Ala Ile Ile Val Ile Leu Val Leu Leu Leu
20 25 30
Leu Leu Gly Ile Gly Leu Met Trp Trp Phe Trp Lys Cys Phe Cys Lys
35 40 45
His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn
50 55 60
Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe
65 70 75 80
Leu
<210> 130
<211> 80
<212> PRT
<213> 人工序列
<220>
<223> GSC11210
<400> 130
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Met Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu
20 25 30
Leu Leu Phe Ile Gly Leu Gly Ile Phe Phe Lys Cys Phe Cys Lys His
35 40 45
Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser
50 55 60
Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75 80
<210> 131
<211> 80
<212> PRT
<213> 人工序列
<220>
<223> GSC11205
<400> 131
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ile Ala Gly Val Ile Ala Gly Ile Leu Leu Phe Val
20 25 30
Ile Ile Phe Leu Gly Val Val Leu Val Met Lys Cys Phe Cys Lys His
35 40 45
Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser
50 55 60
Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75 80
<210> 132
<211> 80
<212> PRT
<213> 人工序列
<220>
<223> GSC11217
<400> 132
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Val Val Ile Pro Ile Ile Phe Gly Ile Leu
20 25 30
Phe Ala Ile Leu Leu Val Leu Val Phe Ile Lys Cys Phe Cys Lys His
35 40 45
Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser
50 55 60
Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75 80
<210> 133
<211> 81
<212> PRT
<213> 人工序列
<220>
<223> GSC11756
<400> 133
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ile Ile Pro Ile Val Ala Gly Val Val Ala Gly Ile
20 25 30
Val Leu Ile Gly Leu Ala Leu Leu Leu Ile Trp Lys Cys Phe Cys Lys
35 40 45
His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn
50 55 60
Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe
65 70 75 80
Leu
<210> 134
<211> 82
<212> PRT
<213> 人工序列
<220>
<223> GSC11296
<400> 134
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Gly Ile Val Ala Gly Leu Ala Val Leu Ala Val Val
20 25 30
Val Ile Gly Ala Val Val Ala Ala Val Met Cys Arg Lys Cys Phe Cys
35 40 45
Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn
50 55 60
Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val
65 70 75 80
Phe Leu
<210> 135
<211> 82
<212> PRT
<213> 人工序列
<220>
<223> GSC11295
<400> 135
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Leu Ile Ile Ala Leu Pro Val Ala Val Leu Leu Ile
20 25 30
Val Gly Gly Leu Val Ile Met Leu Tyr Val Phe His Lys Cys Phe Cys
35 40 45
Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn
50 55 60
Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val
65 70 75 80
Phe Leu
<210> 136
<211> 82
<212> PRT
<213> 人工序列
<220>
<223> GSC11390
<400> 136
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Gly Leu Leu Ile Gly Ile Ser Ile Ala Ser Leu Cys
20 25 30
Leu Val Val Ala Leu Leu Ala Leu Leu Cys His Leu Lys Cys Phe Cys
35 40 45
Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn
50 55 60
Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val
65 70 75 80
Phe Leu
<210> 137
<211> 82
<212> PRT
<213> 人工序列
<220>
<223> GSC11391
<400> 137
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Leu Leu Leu Gly Val Ser Val Ser Cys Ile Val Ile
20 25 30
Leu Ala Val Cys Leu Leu Cys Tyr Val Ser Ile Thr Lys Cys Phe Cys
35 40 45
Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn
50 55 60
Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val
65 70 75 80
Phe Leu
<210> 138
<211> 81
<212> PRT
<213> 人工序列
<220>
<223> GSC11392
<400> 138
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Asn Thr Val Gly Ser Val Ile Gly Val Ile Val
20 25 30
Thr Ile Phe Val Ser Gly Thr Val Tyr Phe Ile Lys Cys Phe Cys Lys
35 40 45
His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn
50 55 60
Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe
65 70 75 80
Leu
<210> 139
<211> 81
<212> PRT
<213> 人工序列
<220>
<223> GSC11397
<400> 139
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ile Thr Leu Ile Ile Phe Gly Val Met Ala Gly Val
20 25 30
Ile Gly Thr Ile Leu Leu Ile Ser Tyr Gly Ile Lys Cys Phe Cys Lys
35 40 45
His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn
50 55 60
Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe
65 70 75 80
Leu
<210> 140
<211> 79
<212> PRT
<213> 人工序列
<220>
<223> GSC11204
<400> 140
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe
20 25 30
Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg
35 40 45
Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu
50 55 60
Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 141
<211> 79
<212> PRT
<213> 人工序列
<220>
<223> GSC11216
<400> 141
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe
20 25 30
Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg
35 40 45
Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu
50 55 60
Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 142
<211> 79
<212> PRT
<213> 人工序列
<220>
<223> GSC11203
<400> 142
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe
20 25 30
Val Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg
35 40 45
Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu
50 55 60
Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 143
<211> 79
<212> PRT
<213> 人工序列
<220>
<223> GSC11211
<400> 143
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe
20 25 30
Lys Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg
35 40 45
Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu
50 55 60
Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 144
<211> 79
<212> PRT
<213> 人工序列
<220>
<223> GSC11212
<400> 144
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe
20 25 30
Val Leu Leu Leu Phe Asp Leu Leu Leu Lys Cys Phe Cys Lys His Arg
35 40 45
Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu
50 55 60
Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 145
<211> 79
<212> PRT
<213> 人工序列
<220>
<223> GSC11398
<400> 145
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe
20 25 30
Lys Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg
35 40 45
Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu
50 55 60
Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 146
<211> 79
<212> PRT
<213> 人工序列
<220>
<223> GSC11208
<400> 146
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe
20 25 30
Val Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg
35 40 45
Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu
50 55 60
Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 147
<211> 79
<212> PRT
<213> 人工序列
<220>
<223> GSC11291
<400> 147
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe
20 25 30
Val Leu Leu Leu Phe Val Leu Leu Leu Lys Cys Phe Cys Lys His Arg
35 40 45
Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu
50 55 60
Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 148
<211> 77
<212> PRT
<213> 人工序列
<220>
<223> GSC11297
<400> 148
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Phe Phe Ile Pro Leu Leu Val Val Ile Leu Phe Ala
20 25 30
Val Asp Thr Gly Leu Phe Ile Lys Cys Phe Cys Lys His Arg Ser Cys
35 40 45
Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe
50 55 60
Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 149
<211> 77
<212> PRT
<213> 人工序列
<220>
<223> GSC11298
<400> 149
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ile Leu Ile Gly Thr Ser Val Val Ile Ile Leu Phe
20 25 30
Ile Leu Leu Phe Phe Leu Leu Lys Cys Phe Cys Lys His Arg Ser Cys
35 40 45
Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe
50 55 60
Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 150
<211> 75
<212> PRT
<213> 人工序列
<220>
<223> GSC11393
<400> 150
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Val Leu Ala Leu Ile Val Ile Phe Leu Thr Ile Ala
20 25 30
Val Leu Leu Ala Leu Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg
35 40 45
Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro
50 55 60
Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 151
<211> 84
<212> PRT
<213> 人工序列
<220>
<223> GSC11394
<400> 151
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile
20 25 30
Cys Ile Thr Gly Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser Lys Cys
35 40 45
Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu
50 55 60
Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln
65 70 75 80
Thr Val Phe Leu
<210> 152
<211> 84
<212> PRT
<213> 人工序列
<220>
<223> GSC11395
<400> 152
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Ala Ile Pro Ile Trp Trp Val Leu Val Gly Val Leu
20 25 30
Gly Gly Leu Leu Leu Leu Thr Ile Leu Val Leu Ala Met Trp Lys Cys
35 40 45
Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu
50 55 60
Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln
65 70 75 80
Thr Val Phe Leu
<210> 153
<211> 85
<212> PRT
<213> 人工序列
<220>
<223> GSC11396
<400> 153
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala
20 25 30
Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Lys
35 40 45
Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg
50 55 60
Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu
65 70 75 80
Gln Thr Val Phe Leu
85
<210> 154
<211> 85
<212> PRT
<213> 人工序列
<220>
<223> GSC11389
<400> 154
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Leu Trp Thr Thr Ile Thr Ile Phe Ile Thr Leu Phe
20 25 30
Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe Lys Val Lys
35 40 45
Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg
50 55 60
Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu
65 70 75 80
Gln Thr Val Phe Leu
85
<210> 155
<211> 76
<212> PRT
<213> 人工序列
<220>
<223> GSC11677
<400> 155
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr
20 25 30
Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser Cys Phe
35 40 45
Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly
50 55 60
Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 156
<211> 78
<212> PRT
<213> 人工序列
<220>
<223> GSC11679
<400> 156
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr
20 25 30
Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser
35 40 45
Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr
50 55 60
Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 157
<211> 82
<212> PRT
<213> 人工序列
<220>
<223> GSC11484
<400> 157
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Val Ile Val Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys
35 40 45
Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn
50 55 60
Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val
65 70 75 80
Phe Leu
<210> 158
<211> 84
<212> PRT
<213> 人工序列
<220>
<223> GSC11292
<400> 158
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Val Ile Val Val Val Thr Val Val Val Ile Val Val Ile Ile Lys Cys
35 40 45
Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu
50 55 60
Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln
65 70 75 80
Thr Val Phe Leu
<210> 159
<211> 51
<212> PRT
<213> 人工序列
<220>
<223> GSC11207
<400> 159
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Ala Ser Ala His His His
35 40 45
His His His
50
<210> 160
<211> 47
<212> PRT
<213> 人工序列
<220>
<223> GSC11209
<400> 160
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys
35 40 45
<210> 161
<211> 68
<212> PRT
<213> 人工序列
<220>
<223> GSC11758
<400> 161
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Lys Trp Ile Phe Ser Ser
35 40 45
Val Val Asp Leu Lys Gln Thr Ile Ile Pro Asp Tyr Arg Asn Met Ile
50 55 60
Gly Gln Gly Ala
65
<210> 162
<211> 54
<212> PRT
<213> 人工序列
<220>
<223> GSC11764
<400> 162
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Arg Ser Gln Gln Glu Ala
35 40 45
Ala Ala Lys Lys Phe Phe
50
<210> 163
<211> 54
<212> PRT
<213> 人工序列
<220>
<223> GSC11678
<400> 163
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Arg Ser Gln Gln Glu Ala
35 40 45
Ala Ala Lys Lys Trp Trp
50
<210> 164
<211> 87
<212> PRT
<213> 人工序列
<220>
<223> GSC11759
<400> 164
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Met Phe Leu Thr Leu Lys
35 40 45
Gly Ser Leu Lys Gln Arg Leu Gln Val Met Ile Gln Pro Ser Glu Asp
50 55 60
Ile Val Arg Pro Glu Asn Gly Pro Glu Gln Pro Gln Ala Gly Ser Ser
65 70 75 80
Ala Ser Lys Glu Ala Tyr Ile
85
<210> 165
<211> 50
<212> PRT
<213> 人工序列
<220>
<223> GSC11483
<400> 165
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Met Phe Leu Thr Leu Lys
35 40 45
Gly Ser
50
<210> 166
<211> 87
<212> PRT
<213> 人工序列
<220>
<223> GSC11760
<400> 166
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Cys Phe Val Gly Asn Arg
35 40 45
Phe Gln Gln Lys Leu Arg Ser Val Phe Arg Val Pro Ile Thr Trp Leu
50 55 60
Gln Gly Lys Arg Glu Thr Met Ser Cys Arg Lys Ser Ser Ser Leu Arg
65 70 75 80
Glu Met Asp Thr Phe Val Ser
85
<210> 167
<211> 80
<212> PRT
<213> 人工序列
<220>
<223> GSC11761
<400> 167
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Cys Phe Val Gly Asn Arg
35 40 45
Phe Gln Gln Lys Leu Arg Ser Val Phe Arg Val Pro Ile Thr Trp Leu
50 55 60
Gln Gly Lys Arg Glu Thr Met Ser Cys Arg Lys Ser Ser Ser Leu Arg
65 70 75 80
<210> 168
<211> 125
<212> PRT
<213> 人工序列
<220>
<223> GSC11762
<400> 168
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Asn Ser His Leu Leu Pro
35 40 45
Arg Pro Leu Arg His Leu Ala Cys Cys Gly Gly Pro Gln Pro Arg Met
50 55 60
Arg Arg Arg Leu Ser Asp Gly Ser Leu Ser Ser Arg His Thr Thr Leu
65 70 75 80
Leu Thr Arg Ser Ser Cys Pro Ala Thr Leu Ser Leu Ser Leu Ser Leu
85 90 95
Thr Leu Ser Gly Arg Pro Arg Pro Glu Glu Ser Pro Arg Asp Leu Glu
100 105 110
Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr Ile Ile Phe
115 120 125
<210> 169
<211> 66
<212> PRT
<213> 人工序列
<220>
<223> GSC11765
<400> 169
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Asn Ser His Glu Glu Ser
35 40 45
Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr Ile
50 55 60
Ile Phe
65
<210> 170
<211> 65
<212> PRT
<213> 人工序列
<220>
<223> GSC11766
<400> 170
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Cys Ile Lys Leu Lys His
35 40 45
Thr Lys Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly
50 55 60
Lys
65
<210> 171
<211> 65
<212> PRT
<213> 人工序列
<220>
<223> GSC11763
<400> 171
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Cys Ile Lys Leu Lys His
35 40 45
Thr Lys Lys Arg Gln Ile Ala Ala Ala Ala Ala Ala Asn Arg Leu Gly
50 55 60
Lys
65
<210> 172
<211> 88
<212> PRT
<213> 人工序列
<220>
<223> GSC11294
<400> 172
Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala
1 5 10 15
Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile
20 25 30
Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe
35 40 45
Lys Val Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu
50 55 60
Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala
65 70 75 80
Leu Ala Glu Gln Thr Val Phe Leu
85
<210> 173
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> B7 TM结构域
<400> 173
Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Ile Thr Val Val
1 5 10 15
Val Ile Val Val Ile Ile
20
<210> 174
<211> 23
<212> PRT
<213> 人类
<400> 174
Leu Ala Leu Ile Leu Gly Pro Val Leu Ala Leu Leu Ala Leu Val Ala
1 5 10 15
Leu Gly Val Leu Gly Leu Trp
20
<210> 175
<211> 23
<212> PRT
<213> 人类
<400> 175
Ile Ala Ala Ile Ile Val Ile Leu Val Leu Leu Leu Leu Leu Gly Ile
1 5 10 15
Gly Leu Met Trp Trp Phe Trp
20
<210> 176
<211> 22
<212> PRT
<213> 人类
<400> 176
Met Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu Leu Leu Phe Ile
1 5 10 15
Gly Leu Gly Ile Phe Phe
20
<210> 177
<211> 22
<212> PRT
<213> 人类
<400> 177
Ile Ala Gly Val Ile Ala Gly Ile Leu Leu Phe Val Ile Ile Phe Leu
1 5 10 15
Gly Val Val Leu Val Met
20
<210> 178
<211> 22
<212> PRT
<213> 人类
<400> 178
Ala Leu Val Val Ile Pro Ile Ile Phe Gly Ile Leu Phe Ala Ile Leu
1 5 10 15
Leu Val Leu Val Phe Ile
20
<210> 179
<211> 23
<212> PRT
<213> 人类
<400> 179
Ile Ile Pro Ile Val Ala Gly Val Val Ala Gly Ile Val Leu Ile Gly
1 5 10 15
Leu Ala Leu Leu Leu Ile Trp
20
<210> 180
<211> 24
<212> PRT
<213> 人类
<400> 180
Gly Ile Val Ala Gly Leu Ala Val Leu Ala Val Val Val Ile Gly Ala
1 5 10 15
Val Val Ala Ala Val Met Cys Arg
20
<210> 181
<211> 24
<212> PRT
<213> 人类
<400> 181
Leu Ile Ile Ala Leu Pro Val Ala Val Leu Leu Ile Val Gly Gly Leu
1 5 10 15
Val Ile Met Leu Tyr Val Phe His
20
<210> 182
<211> 24
<212> PRT
<213> 人类
<400> 182
Gly Leu Leu Ile Gly Ile Ser Ile Ala Ser Leu Cys Leu Val Val Ala
1 5 10 15
Leu Leu Ala Leu Leu Cys His Leu
20
<210> 183
<211> 24
<212> PRT
<213> 人类
<400> 183
Leu Leu Leu Gly Val Ser Val Ser Cys Ile Val Ile Leu Ala Val Cys
1 5 10 15
Leu Leu Cys Tyr Val Ser Ile Thr
20
<210> 184
<211> 23
<212> PRT
<213> 人类
<400> 184
Thr Asn Thr Val Gly Ser Val Ile Gly Val Ile Val Thr Ile Phe Val
1 5 10 15
Ser Gly Thr Val Tyr Phe Ile
20
<210> 185
<211> 23
<212> PRT
<213> 人类
<400> 185
Ile Thr Leu Ile Ile Phe Gly Val Met Ala Gly Val Ile Gly Thr Ile
1 5 10 15
Leu Leu Ile Ser Tyr Gly Ile
20
<210> 186
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PTCRA TM结构域
<400> 186
Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu
1 5 10 15
Phe Asp Leu Leu Leu
20
<210> 187
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PTCRA_R8V TM结构域
<400> 187
Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Lys Leu Leu Leu
1 5 10 15
Phe Asp Leu Leu Leu
20
<210> 188
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PTCRA_K13V TM结构域
<400> 188
Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Val Leu Leu Leu
1 5 10 15
Phe Asp Leu Leu Leu
20
<210> 189
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PTCRA_D18V TM结构域
<400> 189
Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu
1 5 10 15
Phe Val Leu Leu Leu
20
<210> 190
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PTCRA_R8V_K13V TM结构域
<400> 190
Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Val Leu Leu Leu
1 5 10 15
Phe Asp Leu Leu Leu
20
<210> 191
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PTCRA_R8V_D18V TM结构域
<400> 191
Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Lys Leu Leu Leu
1 5 10 15
Phe Val Leu Leu Leu
20
<210> 192
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PTCRA_K13V_D18V TM结构域
<400> 192
Ala Leu Trp Leu Gly Val Leu Arg Leu Leu Leu Phe Val Leu Leu Leu
1 5 10 15
Phe Val Leu Leu Leu
20
<210> 193
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> PTCRA_R8V_K13V_D18V TM结构域
<400> 193
Ala Leu Trp Leu Gly Val Leu Val Leu Leu Leu Phe Val Leu Leu Leu
1 5 10 15
Phe Val Leu Leu Leu
20
<210> 194
<211> 19
<212> PRT
<213> 人类
<400> 194
Phe Phe Ile Pro Leu Leu Val Val Ile Leu Phe Ala Val Asp Thr Gly
1 5 10 15
Leu Phe Ile
<210> 195
<211> 19
<212> PRT
<213> 人类
<400> 195
Ile Leu Ile Gly Thr Ser Val Val Ile Ile Leu Phe Ile Leu Leu Phe
1 5 10 15
Phe Leu Leu
<210> 196
<211> 17
<212> PRT
<213> 人类
<400> 196
Val Leu Ala Leu Ile Val Ile Phe Leu Thr Ile Ala Val Leu Leu Ala
1 5 10 15
Leu
<210> 197
<211> 26
<212> PRT
<213> 人类
<400> 197
Val Met Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly
1 5 10 15
Gly Leu Leu Leu Leu Val Tyr Tyr Trp Ser
20 25
<210> 198
<211> 26
<212> PRT
<213> 人类
<400> 198
Ala Ile Pro Ile Trp Trp Val Leu Val Gly Val Leu Gly Gly Leu Leu
1 5 10 15
Leu Leu Thr Ile Leu Val Leu Ala Met Trp
20 25
<210> 199
<211> 27
<212> PRT
<213> 人类
<400> 199
Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu
1 5 10 15
Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val
20 25
<210> 200
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> M1M2 TM结构域
<400> 200
Leu Trp Thr Thr Ile Thr Ile Phe Ile Thr Leu Phe Leu Leu Ser Val
1 5 10 15
Cys Tyr Ser Ala Thr Val Thr Phe Phe Lys Val
20 25
<210> 201
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> B7(18) TM结构域
<400> 201
Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile Val Val
1 5 10 15
Ile Ile
<210> 202
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> B7(20) TM结构域
<400> 202
Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val Val Ile
1 5 10 15
Val Val Ile Ile
20
<210> 203
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> B7(24) TM结构域
<400> 203
Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Val Ile Val Thr
1 5 10 15
Val Val Val Ile Val Val Ile Ile
20
<210> 204
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> B7(26) TM结构域
<400> 204
Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Val Ile Val Val
1 5 10 15
Val Thr Val Val Val Ile Val Val Ile Ile
20 25
<210> 205
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 6His胞质尾
<400> 205
Ala Ser Ala His His His His His His
1 5
<210> 206
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> KCFCK胞质尾
<400> 206
Lys Cys Phe Cys Lys
1 5
<210> 207
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> M1M2胞质尾
<400> 207
Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro
1 5 10 15
Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala
20 25
<210> 208
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> ERGIC53胞质尾
<400> 208
Arg Ser Gln Gln Glu Ala Ala Ala Lys Lys Phe Phe
1 5 10
<210> 209
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> ERGICnoER胞质尾
<400> 209
Arg Ser Gln Gln Glu Ala Ala Ala Lys Lys Trp Trp
1 5 10
<210> 210
<211> 45
<212> PRT
<213> 人工序列
<220>
<223> GAT1胞质尾
<400> 210
Met Phe Leu Thr Leu Lys Gly Ser Leu Lys Gln Arg Leu Gln Val Met
1 5 10 15
Ile Gln Pro Ser Glu Asp Ile Val Arg Pro Glu Asn Gly Pro Glu Gln
20 25 30
Pro Gln Ala Gly Ser Ser Ala Ser Lys Glu Ala Tyr Ile
35 40 45
<210> 211
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> GAT1noER胞质尾
<400> 211
Met Phe Leu Thr Leu Lys Gly Ser
1 5
<210> 212
<211> 45
<212> PRT
<213> 人工序列
<220>
<223> AGTR2胞质尾
<400> 212
Cys Phe Val Gly Asn Arg Phe Gln Gln Lys Leu Arg Ser Val Phe Arg
1 5 10 15
Val Pro Ile Thr Trp Leu Gln Gly Lys Arg Glu Thr Met Ser Cys Arg
20 25 30
Lys Ser Ser Ser Leu Arg Glu Met Asp Thr Phe Val Ser
35 40 45
<210> 213
<211> 38
<212> PRT
<213> 人工序列
<220>
<223> AGTR2noER胞质尾
<400> 213
Cys Phe Val Gly Asn Arg Phe Gln Gln Lys Leu Arg Ser Val Phe Arg
1 5 10 15
Val Pro Ile Thr Trp Leu Gln Gly Lys Arg Glu Thr Met Ser Cys Arg
20 25 30
Lys Ser Ser Ser Leu Arg
35
<210> 214
<211> 83
<212> PRT
<213> 人工序列
<220>
<223> V1BR胞质尾
<400> 214
Asn Ser His Leu Leu Pro Arg Pro Leu Arg His Leu Ala Cys Cys Gly
1 5 10 15
Gly Pro Gln Pro Arg Met Arg Arg Arg Leu Ser Asp Gly Ser Leu Ser
20 25 30
Ser Arg His Thr Thr Leu Leu Thr Arg Ser Ser Cys Pro Ala Thr Leu
35 40 45
Ser Leu Ser Leu Ser Leu Thr Leu Ser Gly Arg Pro Arg Pro Glu Glu
50 55 60
Ser Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu Gly Thr Ala Glu Thr
65 70 75 80
Ile Ile Phe
<210> 215
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> V1BRnoER胞质尾
<400> 215
Asn Ser His Glu Glu Ser Pro Arg Asp Leu Glu Leu Ala Asp Gly Glu
1 5 10 15
Gly Thr Ala Glu Thr Ile Ile Phe
20
<210> 216
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> VGLG胞质尾
<400> 216
Cys Ile Lys Leu Lys His Thr Lys Lys Arg Gln Ile Tyr Thr Asp Ile
1 5 10 15
Glu Met Asn Arg Leu Gly Lys
20
<210> 217
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> VGLGnoER胞质尾
<400> 217
Cys Ile Lys Leu Lys His Thr Lys Lys Arg Gln Ile Ala Ala Ala Ala
1 5 10 15
Ala Ala Asn Arg Leu Gly Lys
20
<210> 218
<211> 38
<212> PRT
<213> 人工序列
<220>
<223> B7胞质尾
<400> 218
Lys Cys Phe Cys Lys His Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser
1 5 10 15
Arg Glu Thr Asn Asn Ser Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala
20 25 30
Glu Gln Thr Val Phe Leu
35
<210> 219
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2376
<400> 219
ggccgttcga atcatcactt gcagaagcac ttgataatc 39
<210> 220
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2377
<400> 220
gtcatttcga atcatcaatg atggtggtgg tgatgggcgc tggcgataat cacgacgatc 60
acgac 65
<210> 221
<211> 59
<212> PRT
<213> 人工序列
<220>
<223> 引物GlnPr2378
<400> 221
Thr Thr Gly Ala Ala Cys Ala Gly Cys Ala Gly Cys Ala Gly Thr Cys
1 5 10 15
Thr Cys Ala Gly Cys Ala Cys Gly Cys Cys Cys Ala Gly Cys Cys Ala
20 25 30
Cys Ala Gly Gly Gly Cys Cys Cys Cys Gly Thr Cys Cys Ala Gly Cys
35 40 45
Thr Cys Cys Cys Cys Gly Thr Cys Cys Thr Gly
50 55
<210> 222
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2379
<400> 222
ctgagactgc tgctgttcaa gctgctcctg ttcgacctgc tcctcaagtg gatcttctcc 60
tcggtg 66
<210> 223
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2380
<400> 223
gcttgaacag cagcagtctc agcacgccca gccacagggc attcttggag tcaggggggt 60
cctc 64
<210> 224
<211> 69
<212> PRT
<213> 人工序列
<220>
<223> 引物GlnPr2381
<400> 224
Cys Ala Gly Gly Ala Cys Cys Gly Gly Thr Gly Cys Thr Thr Gly Cys
1 5 10 15
Ala Gly Ala Ala Gly Cys Ala Cys Thr Thr Gly Ala Gly Gly Ala Gly
20 25 30
Cys Ala Gly Gly Thr Cys Gly Ala Ala Cys Ala Gly Gly Ala Gly Cys
35 40 45
Ala Gly Cys Thr Thr Gly Ala Ala Cys Ala Gly Cys Ala Gly Cys Ala
50 55 60
Gly Thr Cys Thr Cys
65
<210> 225
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2382
<400> 225
gcttgaacag cagcagtacc agcacgccca gccacagggc attcttggag tcaggggggt 60
cctc 64
<210> 226
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2383
<400> 226
caggaccggt gcttgcagaa gcacttgagg agcaggtcga acaggagcag cttgaacagc 60
agcagtacc 69
<210> 227
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2384
<400> 227
gaccggtgct tgcagaagca cttgaggagc aggtcgaaca ggagcagcac gaacagcagc 60
agtctc 66
<210> 228
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2385
<400> 228
gaccggtgct tgcagaagca cttgaggagc aggacgaaca ggagcagctt gaacagcagc 60
agtctc 66
<210> 229
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2386
<400> 229
caggaccggt gcttgcagaa gcacttgagg agcaggtcga acaggagcag cacgaacagc 60
agcagtacc 69
<210> 230
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2387
<400> 230
caggaccggt gcttgcagaa gcacttgagg agcaggacga acaggagcag cttgaacagc 60
agcagtacc 69
<210> 231
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2388
<400> 231
gaccggtgct tgcagaagca cttgaggagc aggacgaaca ggagcagcac gaacagcagc 60
agtctc 66
<210> 232
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2389
<400> 232
caggaccggt gcttgcagaa gcacttgagg agcaggacga acaggagcag cacgaacagc 60
agcagtacc 69
<210> 233
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2390
<400> 233
ggtcgtgatc gtcgtgatta tcaagtggat cttctcctcg gtggtgg 47
<210> 234
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2391
<400> 234
ccaccaccga ggagaagatc cacttgataa tcacgacgat cacgacc 47
<210> 235
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2392
<400> 235
cttcggcgcc accgtggtcg tgatcgtcgt gattatcaag tg 42
<210> 236
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2393
<400> 236
caggaccggt gcttgcagaa gcacttgata atcacgacga tc 42
<210> 237
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2394
<400> 237
cttcggcgcc accgtgatcg tcgtgattat caagtgcttc 40
<210> 238
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2395
<400> 238
caggaccggt gcttgcagaa gcacttgata atcacgac 38
<210> 239
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2396
<400> 239
cttcggcgcc gtggtcattg taaccgtggt cgtgatcgtc gtg 43
<210> 240
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2397
<400> 240
caggaccggt gcttgcagaa gcacttgata atcacgacga tcacgaccac 50
<210> 241
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2398
<400> 241
cttcggcgcc gtggtcattg tagtcgtaac cgtggtcgtg atcgtcgtg 49
<210> 242
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2399
<400> 242
caggaccggt gcttgcagaa gcacttgata atcacgacga tcacgaccac gg 52
<210> 243
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2400
<400> 243
gagccaccag tgccagcaga gccagcacag gtcccaggat cagagccaga ttcttggagt 60
caggggggtc 70
<210> 244
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> > Seq Id No. 244 引物GlnPr2401
<400> 244
caggaccggt gcttgcagaa gcacttccac agtcccagca ctcccagagc caccagtgcc 60
agcag 65
<210> 245
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2402
<400> 245
cgatgcccag cagcaggagc aacaccagga tcacgatgat ggcggcgata ttcttggagt 60
caggggggtc 70
<210> 246
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2403
<400> 246
caggaccggt gcttgcagaa gcacttccag aaccaccaca tcaggccgat gcccagcagc 60
aggag 65
<210> 247
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2404
<400> 247
gataaacagc agcaggccag ccactccgcc cagcacaatc agggccatat tcttggagtc 60
aggggggtc 69
<210> 248
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2405
<400> 248
caggaccggt gcttgcagaa gcacttgaag aagatgccca ggccgataaa cagcagcagg 60
cc 62
<210> 249
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2406
<400> 249
gtccaatcag cacgatgcca gccaccacgc cggccacgat agggatgata ttcttggagt 60
caggggggtc 70
<210> 250
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2407
<400> 250
caggaccggt gcttgcagaa gcacttccag atcagcagca gggccagtcc aatcagcacg 60
atgcc 65
<210> 251
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2408
<400> 251
ccaggaagat gatcacgaac agcaggatgc cagcgatcac gccagcgata ttcttggagt 60
caggggggtc 70
<210> 252
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2409
<400> 252
caggaccggt gcttgcagaa gcacttcatc acgagcacca cgcccaggaa gatgatcacg 60
aa 62
<210> 253
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2410
<400> 253
gcaggatggc gaacaggatg ccgaagatga tggggatcac gaccagagca ttcttggagt 60
caggggggtc 70
<210> 254
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2411
<400> 254
caggaccggt gcttgcagaa gcacttgatg aacaccagca ccagcaggat ggcgaacagg 60
atg 63
<210> 255
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2412
<400> 255
cttcggcgcc gtgattaccg tggtcgtgat cgtcgtgatt atcaggtccc agcaggaggc 60
cgccg 65
<210> 256
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2413
<400> 256
gtcatttcga atcatcagaa gaacttcttg gcggcggcct cctgctggga c 51
<210> 257
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2414
<400> 257
gtcatttcga atcatcacca ccacttcttg gcggcggcct cctgctggga c 51
<210> 258
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2415
<400> 258
ggtcatttcg aatcatcagg agcccttcag ggtcaggaac atgataatca cgacgatcac 60
gac 63
<210> 259
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1285
<400> 259
cggaagaatt cagccacagc tttaaggcac ctggctaac 39
<210> 260
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr1494
<400> 260
acgaactagt ccaccatgga aagcccagcc cagctgctgt tcctgctgct gctgtggctg 60
cccgac 66
<210> 261
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2294
<400> 261
ctaccaagct ttcatcattt acccggagac agggagaggc tcttctgcgt gtagtggttg 60
tgcaaggcct cg 72
<210> 262
<211> 432
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq80
<400> 262
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatc tgtggacgac catcaccatc ttcatcacac 360
tcttcctgtt aagcgtgtgc tacagtgcca ccgtcacctt cttcaaggtg aagtgcttct 420
gcaagcaccg gt 432
<210> 263
<211> 500
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq81
<400> 263
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatc tgtggacgac catcaccatc ttcatcacac 360
tcttcctgtt aagcgtgtgc tacagtgcca ccgtcacctt cttcaaggtg aagtggatct 420
tctcctcggt ggtggacctg aagcagacca tcatccccga ctacaggaac atgatcggac 480
agggggccta gtgattcgaa 500
<210> 264
<211> 545
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq82
<400> 264
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcagagctg caaccggtgg 300
agagctgtgc ggaggcgcag gacggggagc tggacgggct gtggacgacc atcaccatct 360
tcatcacact cttcctgtta agcgtgtgct acagtgccac cgtcaccttc ttcaaggtga 420
agtgcttctg caagcaccgg tcctgcttcc ggcggaacga ggcctccaga gagacaaaca 480
actccctgac cttcggcccc gaggaagccc tggctgagca gaccgtgttt ctgtagtgat 540
tcgaa 545
<210> 265
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq83
<400> 265
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatc tgatcattgc cctgcctgtg gccgtgctgc 360
tgatcgtggg aggcctcgtg atcatgctgt acgtgttcca caagtgcttc tgcaagcacc 420
ggt 423
<210> 266
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq84
<400> 266
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatg gaatcgtggc tggactggct gtgctggccg 360
tggtcgtgat tggagctgtg gtggccgccg tgatgtgcag aaagtgcttc tgcaagcacc 420
ggt 423
<210> 267
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq85
<400> 267
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatg gcctgctgat cggcatctcc atcgcctccc 360
tgtgcctggt ggtggccctg ctggccctgc tgtgccacct gaagtgcttc tgcaagcacc 420
ggt 423
<210> 268
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq86
<400> 268
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatc tgctgctggg cgtgtccgtg tcctgcatcg 360
tgatcctggc cgtgtgcctg ctgtgctacg tgtccatcac caagtgcttc tgcaagcacc 420
ggt 423
<210> 269
<211> 420
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq87
<400> 269
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaata ccaacaccgt gggctccgtg atcggcgtga 360
tcgtgaccat cttcgtgtcc ggcaccgtgt acttcatcaa gtgcttctgc aagcaccggt 420
<210> 270
<211> 402
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq88
<400> 270
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatg tgctggccct gatcgtgatc ttcctgacca 360
tcgccgtgct gctggccctg aagtgcttct gcaagcaccg gt 402
<210> 271
<211> 408
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq89
<400> 271
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatt tcttcatccc cctgctggtg gtgatcctgt 360
tcgccgtgga caccggcctg ttcatcaagt gcttctgcaa gcaccggt 408
<210> 272
<211> 408
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq90
<400> 272
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaata tcctgatcgg cacctccgtg gtgatcatcc 360
tgttcatcct gctgttcttc ctgctgaagt gcttctgcaa gcaccggt 408
<210> 273
<211> 429
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq91
<400> 273
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatg tgatgtccgt ggccaccatc gtgatcgtgg 360
acatctgcat caccggcggc ctgctgctgc tggtgtacta ctggtccaag tgcttctgca 420
agcaccggt 429
<210> 274
<211> 429
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq92
<400> 274
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatg ccatccccat ctggtgggtg ctggtgggcg 360
tgctgggcgg cctgctgctg ctgaccatcc tggtgctggc catgtggaag tgcttctgca 420
agcaccggt 429
<210> 275
<211> 432
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq93
<400> 275
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaatt tctgggtgct ggtggtggtg ggcggcgtgc 360
tggcctgcta ctccctgctg gtgaccgtgg ccttcatcat cttctgggtg aagtgcttct 420
gcaagcaccg gt 432
<210> 276
<211> 420
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq94
<400> 276
atcgatgctg aatgcaatta acaatgctca agcagaaccc ccggctccat cagcacagtg 60
caggaccaaa ccccatgctg cagcagtggg gctgtctgta cggggtgggc aatgggaacc 120
ggggtctgct ggggctcctg ctgcttcagt gctgccatgc agccacacat cctgagagct 180
gaaagggtcg gcgtcctcac ctggtgcaca ccgtagctct gccccacagc tttaaggcac 240
ctggctaacc tctgcgcttc ttcccttccc tcctccctgg ctcaggtggt ggtggatctc 300
cccccgagga cccccctgac tccaagaata tcaccctgat catcttcggc gtgatggccg 360
gcgtgatcgg caccatcctg ctgatctcct acggcatcaa gtgcttctgc aagcaccggt 420
<210> 277
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq95
<400> 277
ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca tgttcctgac cctgaagggc 60
tccctgaagc agaggctgca ggtgatgatc cagccctccg aggacatcgt gaggcccgag 120
aacggccccg agcagcccca ggccggctcc tccgcctcca aggaggccta catctgatga 180
ttcgaa 186
<210> 278
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq96
<400> 278
ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcttcgtggg caacaggttc 60
cagcagaagc tgaggtccgt gttcagggtg cccatcacct ggctgcaggg caagagggag 120
accatgtcct gcaggaagtc ctcctccctg agggagatgg acaccttcgt gtcctgatga 180
ttcgaa 186
<210> 279
<211> 165
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq97
<400> 279
ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcttcgtggg caacaggttc 60
cagcagaagc tgaggtccgt gttcagggtg cccatcacct ggctgcaggg caagagggag 120
accatgtcct gcaggaagtc ctcctccctg aggtgatgat tcgaa 165
<210> 280
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq98
<400> 280
ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca actcccacct gctgcccagg 60
cccctgaggc acctggcctg ctgcggcggc ccccagccca ggatgaggag gaggctgtcc 120
gacggctccc tgtcctccag gcacaccacc ctgctgacca ggtcctcctg ccccgccacc 180
ctgtccctgt ccctgtccct gaccctgtcc ggcaggccca ggcccgagga gtcccccagg 240
gacctggagc tggccgacgg cgagggcacc gccgagacca tcatcttctg atgattcgaa 300
<210> 281
<211> 123
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq99
<400> 281
ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatca actcccacga ggagtccccc 60
agggacctgg agctggccga cggcgagggc accgccgaga ccatcatctt ctgatgattc 120
gaa 123
<210> 282
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq100
<400> 282
ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcatcaagct gaagcacacc 60
aagaagaggc agatctacac cgacatcgag atgaacaggc tgggcaagtg atgattcgaa 120
<210> 283
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> GeneArt_Seq101
<400> 283
ggcgccgtga ttaccgtggt cgtgatcgtc gtgattatct gcatcaagct gaagcacacc 60
aagaagaggc agatcgccgc cgccgccgcc gccaacaggc tgggcaagtg atgattcgaa 120
<210> 284
<211> 1064
<212> DNA
<213> 人工序列
<220>
<223> GSC11206
<400> 284
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag agctgtgcgg 600
aggcgcagga cggggagctg gacggggccc tgtggctggg cgtgctgaga ctgctgctgt 660
tcaagctgct cctgttcgac ctgctcctca agtggatctt ctcctcggtg gtggacctga 720
agcagaccat catccccgac tacaggaaca tgatcggaca gggggcctag tgattcgaaa 780
tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 840
atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 900
gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 960
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 1020
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 1064
<210> 285
<211> 70
<212> PRT
<213> 人工序列
<220>
<223> GSC11206
<400> 285
Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala
1 5 10 15
Gln Asp Gly Glu Leu Asp Gly Ala Leu Trp Leu Gly Val Leu Arg Leu
20 25 30
Leu Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu Leu Lys Trp Ile Phe
35 40 45
Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro Asp Tyr Arg Asn
50 55 60
Met Ile Gly Gln Gly Ala
65 70
<210> 286
<211> 470
<212> PRT
<213> 人工序列
<220>
<223> GSC314
<400> 286
Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro
1 5 10 15
Asp Thr Gln Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val
20 25 30
Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn
35 40 45
Ile Lys Asp Thr Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly
50 55 60
Leu Glu Trp Val Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr
65 70 75 80
Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys
85 90 95
Asn Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala
100 105 110
Val Tyr Tyr Cys Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp
115 120 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys
465 470
<210> 287
<211> 375
<212> DNA
<213> 人工序列
<220>
<223> GSC3836
<400> 287
ctgtctccgg gtaaatgatg aaagcttgcg gccgcgctta gcgatatcga attctctaga 60
ggtacccccg gggggcccct cgagttcgaa atgaccgacc aagcgacgcc caacctgcca 120
tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc 180
cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac 240
cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 300
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 360
tcttatcatg tctgt 375
<210> 288
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> GSC3836 / GSC3848
<400> 288
Leu Ser Pro Gly Lys
1 5
<210> 289
<211> 884
<212> DNA
<213> 人工序列
<220>
<223> GSC3848
<400> 289
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct cagagctgca accggtggag atattcgaaa 600
tgaccgacca agcgacgccc aacctgccat cacgagattt cgattccacc gccgccttct 660
atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 720
gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 780
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 840
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgt 884
<210> 290
<211> 76
<212> PRT
<213> 人工序列
<220>
<223> GSC3899 / GSC4398 / GSC4401 / GSC4402
<400> 290
Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala
1 5 10 15
Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile
20 25 30
Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe
35 40 45
Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile
50 55 60
Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala
65 70 75
<210> 291
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> GSC5854 / GSC5855 / GSC5857 / GSC5856
<400> 291
Leu Ser Leu Ser Pro Ala Glu Leu Gln Pro Val Glu Ala Leu Trp Leu
1 5 10 15
Gly Val Leu Arg Leu Leu Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu
20 25 30
Leu Ala Ser Ala His His His His His His
35 40
<210> 292
<211> 74
<212> PRT
<213> 人工序列
<220>
<223> GSC6030 / GSC6048 / GSC6047 / GSC6046
<400> 292
Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala
1 5 10 15
Gln Asp Gly Glu Leu Asp Ala Leu Trp Leu Gly Val Leu Arg Leu Leu
20 25 30
Leu Phe Lys Leu Leu Leu Phe Asp Leu Leu Leu Thr Phe Phe Lys Val
35 40 45
Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile Ile Pro
50 55 60
Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala
65 70
<210> 293
<211> 78
<212> PRT
<213> 人工序列
<220>
<223> GSC7057 / GSC7058 / GSC7056 / GSC7059 / GSC9763 / GSC9764 /
GSC9765 / GSC9768 / GSC9770 / GSC9949 / GSC9950
<400> 293
Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser
1 5 10 15
Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val Ile Thr
20 25 30
Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His Arg Ser
35 40 45
Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser Leu Thr
50 55 60
Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75
<210> 294
<211> 708
<212> DNA
<213> 人工序列
<220>
<223> GSC315
<400> 294
atggagagcc ctgcccagct gctgttcctg ctgctgctgt ggctgcctga cggagtccat 60
gccgacatcc agatgaccca gtccccctcc agcctgtctg cctccgtggg cgaccgggtg 120
accatcacct gccgggcctc ccaggacgtg aacaccgccg tggcctggta tcagcagaag 180
cctggcaagg cccctaagct gctgatctac tccgcctcct tcctgtactc cggcgtgcct 240
tcccggttct ccggctcccg gtccggcacc gacttcaccc tgaccatctc ctccctgcag 300
cctgaggact tcgccaccta ctactgccag cagcactaca ccacccctcc taccttcggc 360
cagggcacca aggtggagat caagcggacc gtggccgctc cttccgtgtt catcttccct 420
ccctccgacg agcagctgaa gagcggcacc gccagcgtgg tgtgcctgct gaacaacttt 480
taccctcggg aggccaaggt gcagtggaag gtggacaacg ccctgcagtc cggcaactcc 540
caggaatccg tcaccgagca ggactccaag gacagcacct actccctgtc ctccaccctg 600
accctgtcca aggccgacta cgagaagcac aaggtgtacg cctgcgaggt gacccaccag 660
ggcctgtcca gccctgtgac caagtccttc aaccggggcg agtgctga 708
<210> 295
<211> 235
<212> PRT
<213> 人工序列
<220>
<223> GSC315
<400> 295
Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro
1 5 10 15
Asp Gly Val His Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
20 25 30
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
35 40 45
Asp Val Asn Thr Ala Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
50 55 60
Pro Lys Leu Leu Ile Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro
65 70 75 80
Ser Arg Phe Ser Gly Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile
85 90 95
Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His
100 105 110
Tyr Thr Thr Pro Pro Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
115 120 125
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
130 135 140
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
145 150 155 160
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
165 170 175
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
180 185 190
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
195 200 205
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
210 215 220
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230 235
<210> 296
<211> 1428
<212> DNA
<213> 人工序列
<220>
<223> GSC5607
<400> 296
atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60
caggtgcagc tgcagcagtc tggcgccgaa ctggccagac caggcgccag cgtgaagatg 120
agctgcaagg ccagcggcta caccttcacc cggtacacca tgcactgggt gaaacagcgg 180
cctggacagg gcctggaatg gatcggctac atcaacccca gccggggcta caccaactac 240
aaccagaagt tcaaggacaa ggccaccctg accaccgaca agagcagcag caccgcctac 300
atgcagctga gcagcctgac cagcgaggac agcgccgtgt actactgcgc ccggtactac 360
gacgaccact actgcctgga ctactggggc cagggcacca ccctgaccgt gagcagcgcg 420
tcgaccaagg gccccagcgt gttcccgcta gcccccagca gcaagagcac cagcggcggc 480
acagccgccc tgggctgcct ggtgaaggac tacttccccg agcccgttac cgtgtcctgg 540
aactctggag ccctgacctc cggcgtgcac accttccccg ccgtgctcca gagcagcggc 600
ctgtacagcc tgagcagcgt ggtgacagtg cccagcagca gcctgggaac ccagacctac 660
atctgcaacg tgaaccacaa gcccagcaac accaaggtgg acaagaaggt ggagcccaag 720
agctgcgaca aaactcacac ctgcccaccc tgccctgccc ctgagctgct gggcggaccc 780
tccgtgttcc tgttcccccc caagcccaag gacaccctga tgatcagccg gacccccgag 840
gtgacctgcg tggtggtgga cgtgagccac gaggaccctg aggtgaagtt caattggtac 900
gtggacggcg tggaggtgca caacgccaag accaagcccc gggaggaaca gtacaacagc 960
acctaccggg tggtgtccgt gctgaccgtg ctgcaccagg actggctgaa cggcaaggaa 1020
tacaagtgca aggtctccaa caaggccctg cctgccccca tcgaaaagac catcagcaag 1080
gccaagggcc agccgcgcga accgcaggtg tacaccctgc cccccagccg ggaagagatg 1140
accaagaacc aggtgaaact ggtgtgcctg gtgacaggct tctaccccag cgatatcgcc 1200
gtggaatggg agagcagcgg ccagcctgag aacaactact acaccacccc ccccatgctg 1260
gacagcgacg gcagcttcag cctggtgtcc tggctgaacg tggacaagag ccggtggcag 1320
cagggcaaca tcttcagctg cagcgtgatg cacgaggccc tgcacaaccg gttcacccag 1380
aagtccctga gcctgagccc gggtaaacat caccatcacc atcactga 1428
<210> 297
<211> 475
<212> PRT
<213> 人工序列
<220>
<223> GSC5607
<400> 297
Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro
1 5 10 15
Gly Thr Asn Ala Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala
20 25 30
Arg Pro Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr
35 40 45
Phe Thr Arg Tyr Thr Met His Trp Val Lys Gln Arg Pro Gly Gln Gly
50 55 60
Leu Glu Trp Ile Gly Tyr Ile Asn Pro Ser Arg Gly Tyr Thr Asn Tyr
65 70 75 80
Asn Gln Lys Phe Lys Asp Lys Ala Thr Leu Thr Thr Asp Lys Ser Ser
85 90 95
Ser Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala
100 105 110
Val Tyr Tyr Cys Ala Arg Tyr Tyr Asp Asp His Tyr Cys Leu Asp Tyr
115 120 125
Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly
130 135 140
Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly
145 150 155 160
Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val
165 170 175
Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe
180 185 190
Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val
195 200 205
Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val
210 215 220
Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys
225 230 235 240
Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu
245 250 255
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
260 265 270
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
275 280 285
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val
290 295 300
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser
305 310 315 320
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
325 330 335
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
340 345 350
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
355 360 365
Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln
370 375 380
Val Lys Leu Val Cys Leu Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala
385 390 395 400
Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Tyr Thr Thr
405 410 415
Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Ser Leu Val Ser Trp Leu
420 425 430
Asn Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser Cys Ser
435 440 445
Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser Leu Ser
450 455 460
Leu Ser Pro Gly Lys His His His His His His
465 470 475
<210> 298
<211> 469
<212> PRT
<213> 人工序列
<220>
<223> GSC5644
<400> 298
Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro
1 5 10 15
Gly Thr Asn Ala Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Ala
20 25 30
Arg Pro Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr
35 40 45
Phe Thr Arg Tyr Thr Met His Trp Val Lys Gln Arg Pro Gly Gln Gly
50 55 60
Leu Glu Trp Ile Gly Tyr Ile Asn Pro Ser Arg Gly Tyr Thr Asn Tyr
65 70 75 80
Asn Gln Lys Phe Lys Asp Lys Ala Thr Leu Thr Thr Asp Lys Ser Ser
85 90 95
Ser Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala
100 105 110
Val Tyr Tyr Cys Ala Arg Tyr Tyr Asp Asp His Tyr Cys Leu Asp Tyr
115 120 125
Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly
130 135 140
Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly
145 150 155 160
Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val
165 170 175
Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe
180 185 190
Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val
195 200 205
Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val
210 215 220
Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys
225 230 235 240
Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu
245 250 255
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
260 265 270
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
275 280 285
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val
290 295 300
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser
305 310 315 320
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
325 330 335
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
340 345 350
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
355 360 365
Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln
370 375 380
Val Lys Leu Val Cys Leu Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala
385 390 395 400
Val Glu Trp Glu Ser Ser Gly Gln Pro Glu Asn Asn Tyr Tyr Thr Thr
405 410 415
Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Ser Leu Val Ser Trp Leu
420 425 430
Asn Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Ile Phe Ser Cys Ser
435 440 445
Val Met His Glu Ala Leu His Asn Arg Phe Thr Gln Lys Ser Leu Ser
450 455 460
Leu Ser Pro Gly Lys
465
<210> 299
<211> 76
<212> PRT
<213> 人工序列
<220>
<223> GSC5537
<400> 299
Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala
1 5 10 15
Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile
20 25 30
Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe
35 40 45
Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile
50 55 60
Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala
65 70 75
<210> 300
<211> 495
<212> PRT
<213> 人工序列
<220>
<223> GSC5608
<400> 300
Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro
1 5 10 15
Gly Thr Asn Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val
20 25 30
Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn
35 40 45
Ile Lys Asp Thr Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly
50 55 60
Leu Glu Trp Val Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr
65 70 75 80
Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys
85 90 95
Asn Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala
100 105 110
Val Tyr Tyr Cys Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp
115 120 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Gln Met Thr
145 150 155 160
Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile
165 170 175
Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala Val Ala Trp Tyr Gln
180 185 190
Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ser Ala Ser Phe
195 200 205
Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Arg Ser Gly Thr
210 215 220
Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr
225 230 235 240
Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro Thr Phe Gly Gln Gly
245 250 255
Thr Lys Val Glu Ile Lys Arg Gly Gly Gly Gly Thr Asp Lys Thr His
260 265 270
Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val
275 280 285
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
290 295 300
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
305 310 315 320
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
325 330 335
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
340 345 350
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
355 360 365
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
370 375 380
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Glu Val Ala Thr Phe Pro
385 390 395 400
Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Thr Leu Val Cys Leu
405 410 415
Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
420 425 430
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Asp Pro Pro Leu Leu Glu Ser
435 440 445
Asp Gly Ser Phe Ala Leu Ser Ser Arg Leu Arg Val Asp Lys Ser Arg
450 455 460
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
465 470 475 480
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
485 490 495
<210> 301
<211> 76
<212> PRT
<213> 人工序列
<220>
<223> GSC5538
<400> 301
Leu Ser Leu Ser Pro Glu Leu Gln Pro Val Glu Ser Cys Ala Glu Ala
1 5 10 15
Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr Ile Phe Ile
20 25 30
Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val Thr Phe Phe
35 40 45
Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys Gln Thr Ile
50 55 60
Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala
65 70 75
<210> 302
<211> 702
<212> DNA
<213> 人工序列
<220>
<223> GSC5540
<400> 302
atgcggagcc ctgcccagct gctgttcctg ctgctgctgt ggatccctgg caccaacgcc 60
cagattgtgc tgacccagag ccccgccatc atgtctgcca gccctggcga gaaagtgacc 120
atgacctgca gcgccagcag cagcgtgtcc tacatgaact ggtatcagca gaagtccggc 180
accagcccca agcggtggat ctacgacacc agcaagctgg cctccggcgt gcccgcccac 240
tttagaggca gcggcagcgg cacctcctac tccctgacca tcagcggcat ggaagccgag 300
gacgccgcca cctactactg ccagcagtgg tccagcaacc ccttcacctt cggctccggc 360
accaaactgg aaattaaccg tacggtggcc gctcccagcg tgttcatctt cccccccagc 420
gacgagcagc tgaagagcgg caccgcctcc gtggtgtgcc tgctgaacaa cttctacccc 480
cgggaggcca aggtgcagtg gaaggtggac aacgccctcc agagcggcaa cagccaggaa 540
agcgtcaccg agcaggacag caaggactcc acctacagcc tgagcagcac cctgaccctg 600
agcaaggccg actacgagaa gcacaaggtg tacgcctgcg aggtgaccca ccagggcctg 660
tccagccccg tgaccaagag cttcaaccgg ggcgagtgct ga 702
<210> 303
<211> 233
<212> PRT
<213> 人工序列
<220>
<223> GSC5540
<400> 303
Met Arg Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Ile Pro
1 5 10 15
Gly Thr Asn Ala Gln Ile Val Leu Thr Gln Ser Pro Ala Ile Met Ser
20 25 30
Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser
35 40 45
Val Ser Tyr Met Asn Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys
50 55 60
Arg Trp Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ala His
65 70 75 80
Phe Arg Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Ser Gly
85 90 95
Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Ser
100 105 110
Asn Pro Phe Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Asn Arg Thr
115 120 125
Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu
130 135 140
Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro
145 150 155 160
Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly
165 170 175
Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr
180 185 190
Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His
195 200 205
Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val
210 215 220
Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230
<210> 304
<211> 1522
<212> DNA
<213> 人工序列
<220>
<223> GSC281
<400> 304
gaattgtacc tgcccgtaca taaggtcaat aggggtgaat caacggaaaa gtcccattgg 60
agccaagtac actgcgtcaa tagggacttt ccattgggtt ttgcccagta cataaggtca 120
ataggggatg agtcaatggg aaaaacccat tggagccaag tacactgact caatagggac 180
tttccattgg gttttgccca gtacataagg tcaatagggg gtgagtcaac aggaaagttc 240
cattggagcc aagtacattg agtcaatagg gactttccaa tgggttttgc ccagtacata 300
aggtcaatgg gaggtaagcc aatgggtttt tcccattact ggcacgtata ctgagtcatt 360
agggactttc caatgggttt tgcccagtac ataaggtcaa taggggtgaa tcaacaggaa 420
agtcccattg gagccaagta cactgagtca atagggactt tccattgggt tttgcccagt 480
acaaaaggtc aatagggggt gagtcaatgg gtttttccca ttattggcac gtacataagg 540
tcaatagggg tgagtcattg ggtttttcca gccaatttaa ttaaaacgcc atgtactttc 600
ccaccattga cgtcaatggg ctattgaaac taatgcaacg tgacctttaa acggtacttt 660
cccatagctg attaatggga aagtaccgtt ctcgagccaa tacacgtcaa tgggaagtga 720
aagggcagcc aaaacgtaac accgccccgg ttttccctgg aaattccata ttggcacgca 780
ttctattggc tgagctgcgt tcacgtgggt ataagcagag ctcgtttagt gaaccgtcag 840
atcgcctgga gacgccatcc acgctgtttt gacctccata gaagacaccg ggaccgatcc 900
agcctccgcg gccgggaacg gtgcattgga acgcggattc cccgtgccaa gagtgacgta 960
agtaccgcct atagagtcta taggcccacc cccttggctt cttatgcgac ggatcccgta 1020
ctatgaggtg tggcaggctt gagatctggc catacacttg agtgacaatg acatccactt 1080
tgcctttctc tccacaggtg tccactccca cgtccaactg cagctcggtt cgatcgataa 1140
ttaattaagc tagcggcgcc gttaacaccg gttgatcaaa gcttgcggcc gcgcttagcg 1200
atatcgaatt ctctagaggt acccccgggg ggcccctcga gttcgaaatg accgaccaag 1260
cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 1320
gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 1380
tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 1440
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 1500
ccaaactcat caatgtatct ta 1522
<210> 305
<211> 132
<212> DNA
<213> 人工序列
<220>
<223> GSC3469
<400> 305
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
tatcatgtct gt 132
<210> 306
<211> 470
<212> DNA
<213> 人工序列
<220>
<223> GSC23
<400> 306
cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 60
cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 120
gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa 180
tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 240
ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac 300
ctctagctag agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 360
gctcacaatt ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc 420
cagagtaacc ttttttttta atttttattt tattttattt ttgagatcag 470
<210> 307
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> GSC4340
<400> 307
ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60
ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120
acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180
cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240
aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300
cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360
acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420
cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480
tgccccacag ctttaaggca cctggctaac cgagacctga ggggacag 528
<210> 308
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> GSC4222
<400> 308
ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60
ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120
acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180
cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240
aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300
cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360
acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420
cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480
tgccccacag ctttaaggca cctggctaac cctgtcctta ttgcacag 528
<210> 309
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> GSC2617
<400> 309
ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60
ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120
acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180
cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240
aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300
cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360
acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420
cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480
tgccccacag ctttaaggca cctggctaac cctgggagga ttgcacag 528
<210> 310
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> GSC4335
<400> 310
ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60
ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120
acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180
cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240
aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300
cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360
acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420
cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480
tgccccacag ctttaaggca cctggctaac cgtctccttc tgggacag 528
<210> 311
<211> 546
<212> DNA
<213> 人工序列
<220>
<223> GSC2332
<400> 311
ggtaggtgat cctcctgctg ctttggttca gggttttgct tgaggggggg gggtggtgat 60
ttccttgcca tgggcagact gagcagaaaa ggccattggg accatgttct gaatgcctcc 120
acctcaacca ccggccggta ggaccaaagc caccccgtgt tttctcagga tctcttttcc 180
cagggagatc cctcggccca aagagggaga tggcaatgct ggatgtgtgc acaataattc 240
aacaggcatt ggaacttcag catcgatgct gaatgcaatt aacaatgctc aagcagaacc 300
cccggctcca tcagcacagt gcaggaccaa accccatgct gcagcagtgg ggctgtctgt 360
acggggtggg caatgggaac cggggtctgc tggggctcct gctgcttcag tgctgccatg 420
cagccacaca tcctgagagc tgaaagggtc ggcgtcctca cctggtgcac accgtagctc 480
tgccccacag ctttaaggca cctggctaac ctctgcgctt cttcccttcc ctgctacctg 540
gctcag 546
<210> 312
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2160
<400> 312
ccaagctttc atcatttgcc cggagacagg gagagg 36
<210> 313
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2161
<400> 313
ccaagctttc atcatttacc gggagacagg gagaggctct tc 42
<210> 314
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2162
<400> 314
gtcctcgggg ggagatccac caccacctgt cccagaagga gacggttag 49
<210> 315
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2163
<400> 315
gtcctcgggg ggagatccac caccacctgt gcaatcctcc cagggttag 49
<210> 316
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2164
<400> 316
gtcctcgggg ggagatccac caccacctgt gcaataagga cagggttag 49
<210> 317
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2165
<400> 317
gtcctcgggg ggagatccac caccacctgt cccctcaggt ctcggttag 49
<210> 318
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 引物GlnPr2166
<400> 318
gtcctcgggg ggagatccac caccacctga gccaggtagc agggaaggg 49
<210> 319
<211> 705
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC3704
<400> 319
atggaaagcc cagcccagct gctgttcctg ctgctgctgt ggctgcccga cggggtgcac 60
gctgagatcg tgctgacaca gagccccgcc accctgtctc tgagccctgg cgaaagagcc 120
accctgagct gtagagccag cagcagcgtg tcctacatgc actggtatca gcagaagccc 180
ggccaggcgc cgcgcccgtg gatttatgcg accagcaatc gggccacagg catccctgcc 240
agattttctg gcagcggctc cggcaccgac tacaccctga ccatctccag cctggaaccc 300
gaggacttcg ccgtgtacta ctgccagcag tggtccagca acccctggac atttggccag 360
ggcaccaaag tggaaattaa acgtacggtg gccgctccca gcgtgttcat cttccccccc 420
agcgacgagc agctgaagag cggcaccgcc tccgtggtgt gcctgctgaa caacttctac 480
ccccgggagg ccaaggtgca gtggaaggtg gacaacgccc tccagagcgg caacagccag 540
gaaagcgtca ccgagcagga cagcaaggac tccacctaca gcctgagcag caccctgacc 600
ctgagcaagg ccgactacga gaagcacaag gtgtacgcct gcgaggtgac ccaccagggc 660
ctgtccagcc ccgtgaccaa gagcttcaac cggggcgagt gctga 705
<210> 320
<211> 234
<212> PRT
<213> 人工序列
<220>
<223> 构建体GSC3704
<400> 320
Met Glu Ser Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro
1 5 10 15
Asp Gly Val His Ala Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu
20 25 30
Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Ser
35 40 45
Ser Val Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro
50 55 60
Arg Pro Trp Ile Tyr Ala Thr Ser Asn Arg Ala Thr Gly Ile Pro Ala
65 70 75 80
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Thr Leu Thr Ile Ser
85 90 95
Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Trp Ser
100 105 110
Ser Asn Pro Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
115 120 125
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
130 135 140
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
145 150 155 160
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
165 170 175
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
180 185 190
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
195 200 205
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
210 215 220
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230
<210> 321
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC10488
<400> 321
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 322
<211> 80
<212> PRT
<213> 人工序列
<220>
<223> 构建体GSC10488
<400> 322
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His
35 40 45
Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser
50 55 60
Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75 80
<210> 323
<211> 1094
<212> DNA
<213> 人工序列
<220>
<223> 构建体GSC10487
<400> 323
ctgtctccgg gtaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatgctgaa 300
tgcaattaac aatgctcaag cagaaccccc ggctccatca gcacagtgca ggaccaaacc 360
ccatgctgca gcagtggggc tgtctgtacg gggtgggcaa tgggaaccgg ggtctgctgg 420
ggctcctgct gcttcagtgc tgccatgcag ccacacatcc tgagagctga aagggtcggc 480
gtcctcacct ggtgcacacc gtagctctgc cccacagctt taaggcacct ggctaacctc 540
tgcgcttctt cccttccctc ctccctggct caggtggtgg tggatctccc cccgaggacc 600
cccctgactc caagaatacc ctggtgctgt tcggcgctgg cttcggcgcc gtgattaccg 660
tggtcgtgat cgtcgtgatt atcaagtgct tctgcaagca ccggtcctgc ttccggcgga 720
acgaggcctc cagagagaca aacaactccc tgaccttcgg ccccgaggaa gccctggctg 780
agcagaccgt gtttctgtga tgattcgaaa tgaccgacca agcgacgccc aacctgccat 840
cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 900
gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc 960
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 1020
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 1080
cttatcatgt ctgt 1094
<210> 324
<211> 80
<212> PRT
<213> 人工序列
<220>
<223> 构建体GSC10487
<400> 324
Leu Ser Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro
1 5 10 15
Asp Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Val
20 25 30
Ile Thr Val Val Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys His
35 40 45
Arg Ser Cys Phe Arg Arg Asn Glu Ala Ser Arg Glu Thr Asn Asn Ser
50 55 60
Leu Thr Phe Gly Pro Glu Glu Ala Leu Ala Glu Gln Thr Val Phe Leu
65 70 75 80
<210> 325
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> GlnPr1487
<400> 325
ctgctgctgt ggctgcccga cggggtgcac gctgagatcg tgctgacaca gag 53
<210> 326
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> GlnPr1491
<400> 326
ccaaatcgat ttatcagcac tcgccccggt tgaag 35
<210> 327
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> GlnPr1452
<400> 327
acgtatcgat tcatcacttg ccgggggaca g 31
<210> 328
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> GlnPr1488
<400> 328
ctgctgctgt ggctgcccga cggggtgcac gctcaggtca cactgaaaga gtc 53
<210> 329
<211> 1470
<212> DNA
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-6His
<400> 329
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300
gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420
ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540
ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660
ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720
ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780
acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840
cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900
ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960
ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020
ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080
tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtgat cgtcgtgatt 1140
atcgccagcg cccatcacca ccaccatcat tgatgatgat tcgaaatgac cgaccaagcg 1200
acgcccaacc tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc 1260
ttcggaatcg ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg 1320
gagttcttcg cccaccccaa cttgtttatt gcagcttata atggttacaa ataaagcaat 1380
agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc 1440
aaactcatca atgtatctta tcatgtctgt 1470
<210> 330
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-6His
<400> 330
Leu Ser Leu Ser Arg Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp
1 5 10 15
Ser Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val
20 25 30
Ile Val Val Ile Ile Ala Ser Ala His His His His His His
35 40 45
<210> 331
<211> 1135
<212> DNA
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-6His
<400> 331
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420
tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480
cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540
gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600
gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660
ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720
atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780
cggcgccacc gtgatcgtcg tgattatcgc cagcgcccat caccaccacc atcattgatg 840
atgattcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac 900
cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat 960
cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc 1020
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 1080
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgt 1135
<210> 332
<211> 45
<212> PRT
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-6His
<400> 332
Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser
1 5 10 15
Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile
20 25 30
Val Val Ile Ile Ala Ser Ala His His His His His His
35 40 45
<210> 333
<211> 1123
<212> DNA
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-KCFCK
<400> 333
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420
tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480
cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540
gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600
gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660
ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720
atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780
cggcgccacc gtgatcgtcg tgattatcaa gtgcttctgc aagtgatgat gattcgaaat 840
gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg ccgccttcta 900
tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc tccagcgcgg 960
ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt ataatggtta 1020
caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag 1080
ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgt 1123
<210> 334
<211> 41
<212> PRT
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(18)-KCFCK
<400> 334
Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser
1 5 10 15
Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile
20 25 30
Val Val Ile Ile Lys Cys Phe Cys Lys
35 40
<210> 335
<211> 1141
<212> DNA
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-6His
<400> 335
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420
tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480
cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540
gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600
gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660
ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720
atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780
cggcgccacc gtggtcgtga tcgtcgtgat tatcgccagc gcccatcacc accaccatca 840
ttgatgatga ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac gagatttcga 900
ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg 960
gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca acttgtttat 1020
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 1080
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg 1140
t 1141
<210> 336
<211> 47
<212> PRT
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-6His
<400> 336
Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser
1 5 10 15
Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val
20 25 30
Val Ile Val Val Ile Ile Ala Ser Ala His His His His His His
35 40 45
<210> 337
<211> 1129
<212> DNA
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-KCFCK
<400> 337
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgatacttgt 300
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 360
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 420
tctgtatcga tgctgaatgc aattaacaat gctcaagcag aacccccggc tccatcagca 480
cagtgcagga ccaaacccca tgctgcagca gtggggctgt ctgtacgggg tgggcaatgg 540
gaaccggggt ctgctggggc tcctgctgct tcagtgctgc catgcagcca cacatcctga 600
gagctgaaag ggtcggcgtc ctcacctggt gcacaccgta gctctgcccc acagctttaa 660
ggcacctggc taacctctgc gcttcttccc ttccctcctc cctggctcag gtggtggtgg 720
atctcccccc gaggaccccc ctgactccaa gaataccctg gtgctgttcg gcgctggctt 780
cggcgccacc gtggtcgtga tcgtcgtgat tatcaagtgc ttctgcaagt gatgatgatt 840
cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 900
cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 960
gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa 1020
tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 1080
ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgt 1129
<210> 338
<211> 43
<212> PRT
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(polyA)-B7-B7(20)-KCFCK
<400> 338
Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser
1 5 10 15
Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val
20 25 30
Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys
35 40
<210> 339
<211> 1458
<212> DNA
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-KCFCK
<400> 339
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300
gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420
ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540
ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660
ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720
ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780
acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840
cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900
ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960
ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020
ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080
tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtgat cgtcgtgatt 1140
atcaagtgct tctgcaagtg atgatgattc gaaatgaccg accaagcgac gcccaacctg 1200
ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt 1260
ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc 1320
caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat 1380
ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat 1440
gtatcttatc atgtctgt 1458
<210> 340
<211> 41
<212> PRT
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(18)-KCFCK
<400> 340
Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser
1 5 10 15
Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Ile
20 25 30
Val Val Ile Ile Lys Cys Phe Cys Lys
35 40
<210> 341
<211> 1476
<212> DNA
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-6His
<400> 341
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300
gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420
ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540
ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660
ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720
ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780
acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840
cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900
ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960
ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020
ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080
tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtggt cgtgatcgtc 1140
gtgattatcg ccagcgccca tcaccaccac catcattgat gatgattcga aatgaccgac 1200
caagcgacgc ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg 1260
ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc 1320
atgctggagt tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa 1380
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 1440
ttgtccaaac tcatcaatgt atcttatcat gtctgt 1476
<210> 342
<211> 47
<212> PRT
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-6His
<400> 342
Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser
1 5 10 15
Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val
20 25 30
Val Ile Val Val Ile Ile Ala Ser Ala His His His His His His
35 40 45
<210> 343
<211> 1464
<212> DNA
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-KCFCK
<400> 343
ctgtctccgg gcaaatgatg aaagcttggt aggtgatcct cctgctgctt tggttcaggg 60
ttttgcttga gggggggggg tggtgatttc cttgccatgg gcagactgag cagaaaaggc 120
cattgggacc atgttctgaa tgcctccacc tcaaccaccg gccggtagga ccaaagccac 180
cccgtgtttt ctcaggatct cttttcccag ggagatccct cggcccaaag agggagatgg 240
caatgctgga tgtgtgcaca ataattcaac aggcattgga acttcagcat cgaaatgacc 300
gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 360
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 420
ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 480
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 540
ggtttgtcca aactcatcaa tgtatcttat catgtctgta taccgtcgac ctctagctag 600
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 660
ccacacaaca tacgagccgg ggcaggataa tatatggtag ggttcatagc cagagtaacc 720
ttttttttta atttttattt tattttattt ttgagatcag ttcgatgctg aatgcaatta 780
acaatgctca agcagaaccc ccggctccat cagcacagtg caggaccaaa ccccatgctg 840
cagcagtggg gctgtctgta cggggtgggc aatgggaacc ggggtctgct ggggctcctg 900
ctgcttcagt gctgccatgc agccacacat cctgagagct gaaagggtcg gcgtcctcac 960
ctggtgcaca ccgtagctct gccccacagc tttaaggcac ctggctaacc tctgcgcttc 1020
ttcccttccc tcctccctgg ctcaggtggt ggtggatctc cccccgagga cccccctgac 1080
tccaagaata ccctggtgct gttcggcgct ggcttcggcg ccaccgtggt cgtgatcgtc 1140
gtgattatca agtgcttctg caagtgatga tgattcgaaa tgaccgacca agcgacgccc 1200
aacctgccat cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga 1260
atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc 1320
ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 1380
acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 1440
atcaatgtat cttatcatgt ctgt 1464
<210> 344
<211> 43
<212> PRT
<213> 人工序列
<220>
<223> pGLEX41_HC-GGC-I4(SV40ter)-B7-B7(20)-KCFCK
<400> 344
Leu Ser Pro Gly Gly Gly Gly Ser Pro Pro Glu Asp Pro Pro Asp Ser
1 5 10 15
Lys Asn Thr Leu Val Leu Phe Gly Ala Gly Phe Gly Ala Thr Val Val
20 25 30
Val Ile Val Val Ile Ile Lys Cys Phe Cys Lys
35 40
<210> 345
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 剪接供体共有序列
<400> 345
maggtragt 9
<210> 346
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 剪接受体共有序列
<220>
<221> misc_特征
<222> (7)..(7)
<223> 含有至少15个核苷酸和丰富的嘧啶(C或T)碱基的聚(Y)道
<220>
<221> misc_特征
<222> (8)..(8)
<223> n is a, c, g, or t
<400> 346
ctrayynnca gg 12
<210> 347
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 分支点共有序列
<400> 347
ctrayy 6
Claims (18)
1.一种表达构建体,其在5'至3'方向上包含:
启动子;
编码目的多肽的第一外显子;
剪接供体位点,内含子和剪接受体位点,其中第一终止密码子位于剪接供体位点和所述内含子内的剪接受体位点之间;
编码跨膜区的第二外显子,所述跨膜区选自经修饰的免疫球蛋白跨膜区或者修饰或未修饰的非免疫球蛋白跨膜区;
第二终止密码子;和
多聚(A)位点;
其中当进入宿主细胞时,第一外显子和第二外显子的转录导致目的多肽表达和一定比例的目的多肽在宿主细胞膜上表面呈现。
2.根据权利要求1所述的表达构建体,其中所述跨膜区包含17和29个之间的残基,优选19和26个之间的残基且最优选21和24个之间的残基。
3.根据权利要求1或2所述的表达构建体,其中所述非免疫球蛋白跨膜区选自由人血小板衍生的生长因子受体(PDGFR)、人脱唾液酸糖蛋白受体、人和鼠B7-1、人ICAM-1、人erbb1、人erbb2、人erbb3、人erbb4、人成纤维细胞生长因子受体如FGFR1、FGFR2、FGFR3、FGFR4、人VEGFR-1、人VEGFR-2、人促红细胞生成素受体、人PRL-R、催乳素受体、人EphAl、肝配蛋白A型受体1、人胰岛素、IGF-1受体、人受体样蛋白酪氨酸磷酸酶、人神经毡蛋白、人主要组织相容性复合体类II(α和β链)、人整合素(α和β家族)、人多配体聚糖、人髓鞘蛋白、人钙粘素、人小突触泡蛋白-2、人血型糖蛋白-A、人Bnip3、人APP、淀粉体蛋白前体蛋白、人T细胞受体α和β、CD3γ、CD3δ、CD3ζ和CD3ε的跨膜区组成的组。
4.根据权利要求1所述的表达构建体,其中所述非免疫球蛋白跨膜区是鼠B7-1跨膜区(SEQ ID NO:173)、ACLV1(SEQ ID NO:174)、ANTR2(SEQ ID NO:175)、CD4(SEQ ID NO:176)、PTPRM(SEQ ID NO:177)、TNR5(SEQ ID NO:178)、ITB1(SEQ ID NO:179)、IGF1R(SEQ ID NO:181)、1B07(SEQ ID NO:180)、TRMB(SEQ ID NO:182)、IL4RA(SEQ ID NO:183)、LRP6(SEQ IDNO:184)、GpA(SEQ ID NO:185)、PTCRA(SEQ ID NO:186)。
5.根据前述权利要求中的任一项所述的表达构建体,其中所述内含子包括多聚(A)位点。
6.根据前述权利要求中的任一项所述的表达构建体,其中所述内含子的剪接受体位点包含多聚(Y)道,并且其中通过改变其中的嘧啶碱基的数目来修饰多聚(Y)道的Y含量。
7.根据前述权利要求中的任一项所述的表达构建体,其包含至少一个分支点区域,其中所述至少一个分支点区域的序列对于分支点区域共有序列CTRAYY(SEQ ID NO:347)被修饰。
8.根据前述权利要求中的任一项所述的表达构建体,其中所述内含子的剪接供体位点的共有序列被修饰。
9.根据前述权利要求中的任一项所述的表达构建体,其中所述目的多肽包含抗体重链或其片段。
10.编码根据前述权利要求中的任一项所述的表达构建体的多核苷酸。
11.包含一个或多个根据权利要求10所述的多核苷酸的克隆或表达载体。
12.一种宿主细胞,其包含一个或多个根据权利要求11所述的克隆或表达载体。
13.根据权利要求12的宿主细胞,其包括:包含编码用于表达抗体重链的权利要求9的表达构建体的多核苷酸的表达载体,和包含编码用于表达抗体轻链的表达构建体的多核苷酸。
14.根据权利要求12所述的宿主细胞,其包括:包含编码用于表达抗体重链的权利要求9的表达构建体的多核苷酸的表达载体,包含编码用于表达scFv-Fc的权利要求8的表达构建体的多核苷酸的表达载体,和包含编码用于表达抗体轻链的表达构建体的多核苷酸的表达载体。
15.一种生产多肽的方法,其包括在培养物中培养权利要求12至14中的任一项所述的(多个)宿主细胞并从所述培养物分离所表达的多肽。
16.一种选择用于表达目的多肽的(多个)宿主细胞的方法,其包括
(i)用权利要求1的表达构建体转染(多个)宿主细胞;
(ii)在适于表达所述目的多肽的条件下培养所述(多个)宿主细胞;
(iii)检测所述目的多肽的细胞膜表达;以及
(iv)选择以期望的表达水平在细胞膜的表面上呈现呈现所述目的多肽的(多个)宿主细胞。
17.一种用于表达目的异源多聚多肽的(多个)宿主细胞的选择的方法,其包括
(i)至少用编码目的第一多肽的权利要求1的表达构建体和编码目的第二多肽的权利要求1的表达构建体共转染(多个)宿主细胞;
(ii)在适于表达所述目的异源多聚多肽的条件下培养所述(多个)宿主细胞;
(iii)检测所述目的异源多聚多肽的细胞膜表达;以及
(iv)选择以期望的表达水平在细胞膜的表面上呈现呈现期望的目的异源多聚多肽的(多个)宿主细胞。
18.一种用于表达双特异性抗体的(多个)宿主细胞的选择的方法,其包括
(i)至少用编码抗体重链的权利要求1的表达构建体和编码scFv-Fc的权利要求1的表达构建体以及编码抗体轻链的表达构建体共转染(多个)宿主细胞;
(ii)在适于表达双特异性抗体的条件下培养所述(多个)宿主细胞;
(iii)检测双特异性抗体的细胞膜表达;以及
(iv)选择以期望的表达水平在细胞膜的表面上呈现呈现期望的双特异性抗体的(多个)宿主细胞。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14157324 | 2014-02-28 | ||
EP14157324.6 | 2014-02-28 | ||
PCT/EP2015/054331 WO2015128509A1 (en) | 2014-02-28 | 2015-03-02 | Expression constructs and methods for selecting host cells expressing polypeptides |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106255752A true CN106255752A (zh) | 2016-12-21 |
Family
ID=50184819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580023386.0A Pending CN106255752A (zh) | 2014-02-28 | 2015-03-02 | 表达构建体和用于选择表达多肽的宿主细胞的方法 |
Country Status (15)
Country | Link |
---|---|
US (2) | US20170350886A1 (zh) |
EP (1) | EP3110950B1 (zh) |
JP (1) | JP7008406B2 (zh) |
KR (1) | KR20160135738A (zh) |
CN (1) | CN106255752A (zh) |
AU (1) | AU2015222065B2 (zh) |
BR (1) | BR112016019832A2 (zh) |
CA (1) | CA2940880C (zh) |
EA (1) | EA035266B1 (zh) |
IL (1) | IL247491A0 (zh) |
MA (1) | MA39502A (zh) |
MX (1) | MX2016011194A (zh) |
NZ (1) | NZ723624A (zh) |
SG (2) | SG11201607114VA (zh) |
WO (1) | WO2015128509A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110709421A (zh) * | 2017-05-02 | 2020-01-17 | 鳄鱼生物科学公司 | 针对ox40和ctla-4的双特异性抗体 |
CN112739713A (zh) * | 2018-06-25 | 2021-04-30 | 华盛顿大学 | 有力的且选择性的白介素模拟物的从头设计 |
CN113881701A (zh) * | 2021-09-08 | 2022-01-04 | 山东大学 | 一种阳性转染细胞亲和分选方法及试剂盒 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3320099B1 (en) * | 2015-07-09 | 2023-09-13 | Institut National de la Santé et de la Recherche Médicale (INSERM) | Lentiviral vector expressing membrane-anchored or secreted antibody |
EP3463396A1 (en) | 2016-06-07 | 2019-04-10 | Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft | Chimeric antigen receptor and car-t cells that bind bcma |
WO2019169071A1 (en) * | 2018-03-01 | 2019-09-06 | University Of Washington | Transmembrane polypeptides |
JP7511591B2 (ja) * | 2019-06-28 | 2024-07-05 | エフ. ホフマン-ラ ロシュ アーゲー | 抗体の製造方法 |
KR20240038000A (ko) | 2021-07-08 | 2024-03-22 | 메딕 라이프 사이언시스 인코포레이티드 | 신규 약물 및 약물 표적 식별을 위한 고처리량 스크리닝 시스템 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007131774A1 (en) * | 2006-05-17 | 2007-11-22 | F. Hoffmann-La Roche Ag | Polypeptide producing cells |
WO2009151605A1 (en) * | 2008-06-11 | 2009-12-17 | Jn Biosciences Llc | Expression vectors |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009059235A2 (en) * | 2007-11-01 | 2009-05-07 | Facet Biotech Corporation | Immunoglobulin display vectors |
WO2014126254A1 (ja) * | 2013-02-18 | 2014-08-21 | 協和発酵キリン株式会社 | 膜結合型タンパク質発現ベクター |
-
2015
- 2015-03-02 JP JP2016554490A patent/JP7008406B2/ja active Active
- 2015-03-02 KR KR1020167026968A patent/KR20160135738A/ko not_active Application Discontinuation
- 2015-03-02 US US15/121,819 patent/US20170350886A1/en not_active Abandoned
- 2015-03-02 CA CA2940880A patent/CA2940880C/en active Active
- 2015-03-02 AU AU2015222065A patent/AU2015222065B2/en active Active
- 2015-03-02 EP EP15707625.8A patent/EP3110950B1/en active Active
- 2015-03-02 SG SG11201607114VA patent/SG11201607114VA/en unknown
- 2015-03-02 EA EA201691548A patent/EA035266B1/ru unknown
- 2015-03-02 WO PCT/EP2015/054331 patent/WO2015128509A1/en active Application Filing
- 2015-03-02 NZ NZ723624A patent/NZ723624A/en unknown
- 2015-03-02 MX MX2016011194A patent/MX2016011194A/es unknown
- 2015-03-02 BR BR112016019832A patent/BR112016019832A2/pt not_active Application Discontinuation
- 2015-03-02 CN CN201580023386.0A patent/CN106255752A/zh active Pending
- 2015-03-02 MA MA039502A patent/MA39502A/fr unknown
- 2015-03-02 SG SG10201913396RA patent/SG10201913396RA/en unknown
-
2016
- 2016-08-25 IL IL247491A patent/IL247491A0/en unknown
-
2018
- 2018-07-24 US US16/043,408 patent/US20190056396A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007131774A1 (en) * | 2006-05-17 | 2007-11-22 | F. Hoffmann-La Roche Ag | Polypeptide producing cells |
WO2009151605A1 (en) * | 2008-06-11 | 2009-12-17 | Jn Biosciences Llc | Expression vectors |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110709421A (zh) * | 2017-05-02 | 2020-01-17 | 鳄鱼生物科学公司 | 针对ox40和ctla-4的双特异性抗体 |
CN112739713A (zh) * | 2018-06-25 | 2021-04-30 | 华盛顿大学 | 有力的且选择性的白介素模拟物的从头设计 |
CN113881701A (zh) * | 2021-09-08 | 2022-01-04 | 山东大学 | 一种阳性转染细胞亲和分选方法及试剂盒 |
CN113881701B (zh) * | 2021-09-08 | 2024-04-19 | 山东大学 | 一种阳性转染细胞亲和分选方法及试剂盒 |
Also Published As
Publication number | Publication date |
---|---|
BR112016019832A2 (pt) | 2017-10-17 |
MA39502A (fr) | 2015-09-03 |
JP7008406B2 (ja) | 2022-01-25 |
AU2015222065B2 (en) | 2021-05-20 |
NZ723624A (en) | 2022-07-29 |
SG10201913396RA (en) | 2020-03-30 |
JP2017508459A (ja) | 2017-03-30 |
CA2940880A1 (en) | 2015-09-03 |
EA201691548A1 (ru) | 2017-02-28 |
US20190056396A1 (en) | 2019-02-21 |
US20170350886A1 (en) | 2017-12-07 |
WO2015128509A1 (en) | 2015-09-03 |
KR20160135738A (ko) | 2016-11-28 |
EP3110950A1 (en) | 2017-01-04 |
IL247491A0 (en) | 2016-11-30 |
MX2016011194A (es) | 2017-04-06 |
EP3110950B1 (en) | 2022-09-21 |
CA2940880C (en) | 2023-09-26 |
SG11201607114VA (en) | 2016-09-29 |
AU2015222065A1 (en) | 2016-09-15 |
EA035266B1 (ru) | 2020-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106255752A (zh) | 表达构建体和用于选择表达多肽的宿主细胞的方法 | |
CN107406508B (zh) | 人源化的抗trop-2单克隆抗体及其应用 | |
RU2747011C2 (ru) | Общие легкие цепи и способы их применения | |
KR102272932B1 (ko) | 이종 유전자로 무장된 종양살상 아데노바이러스 | |
JP6034696B2 (ja) | ポリペプチド発現細胞の同定及び単離の方法 | |
JP5315489B2 (ja) | エフェクター機能が増強されたヒトIgG抗体を作製する方法 | |
FI97303B (fi) | Kimeeristen vasta-aineiden tuottaminen homologisella rekombinaatiolla | |
WO2017166804A1 (zh) | 抗pd-1的单克隆抗体 | |
JP6668074B2 (ja) | 組換え型の細胞表面捕捉タンパク質 | |
BRPI0613784A2 (pt) | expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise | |
KR102573622B1 (ko) | Bdnf를 포함하는 융합 단백질 | |
JP2000511768A (ja) | 指向性スイッチ媒介dna組換え | |
KR20140019385A (ko) | 이중특이성 및 단일특이성, 비대칭성 항체 및 이의 제조방법 | |
KR20140091031A (ko) | 저밀도 지단백질-관련 단백질 6 (lrp6) - 반감기 연장제 구축물 | |
EA006972B1 (ru) | Моноклональное антитело человека к ctla-4 и способы его применения | |
KR20180134894A (ko) | 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법 | |
CN110753552B (zh) | 用于降低嵌合Notch受体的免疫原性的方法和组合物 | |
KR20170132819A (ko) | 항-cd303 모노클로날 항체 | |
CN111448314A (zh) | 根据可开发性选择真核细胞展示系统中的多肽药物 | |
US20140018521A1 (en) | Methods for the identification and repair of amino acid residues destabilizing single-chain variable fragments (scFv) | |
KR20230059789A (ko) | 항-가변 muc1* 항체 및 이의 용도 | |
CN110964745A (zh) | 一种检测vegf靶向治疗药物生物学活性的方法 | |
US20190031752A1 (en) | Method for Producing Antibodies | |
KR20230066552A (ko) | 항체-다량체-융합체의 발현 방법 | |
WO2014126254A1 (ja) | 膜結合型タンパク質発現ベクター |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1232562 Country of ref document: HK |