CN110938658B - 一种抗体进化方法及其应用 - Google Patents

一种抗体进化方法及其应用 Download PDF

Info

Publication number
CN110938658B
CN110938658B CN201811110388.5A CN201811110388A CN110938658B CN 110938658 B CN110938658 B CN 110938658B CN 201811110388 A CN201811110388 A CN 201811110388A CN 110938658 B CN110938658 B CN 110938658B
Authority
CN
China
Prior art keywords
lys
leu
antibody
glu
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811110388.5A
Other languages
English (en)
Other versions
CN110938658A (zh
Inventor
孟飞龙
刘浏
黄敏
刘婷婷
蔡燕妮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Molecular Cell Science of CAS
Original Assignee
Center for Excellence in Molecular Cell Science of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center for Excellence in Molecular Cell Science of CAS filed Critical Center for Excellence in Molecular Cell Science of CAS
Priority to CN201811110388.5A priority Critical patent/CN110938658B/zh
Publication of CN110938658A publication Critical patent/CN110938658A/zh
Application granted granted Critical
Publication of CN110938658B publication Critical patent/CN110938658B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供一种抗体进化方法,所述抗体进化方法包含以下步骤:1)提供单碱基基因编辑系统,所述单碱基基因编辑系统可形成单碱基基因编辑复合体,所述单碱基基因编辑复合体包括dCas9酶、sgRNA、MS2胞嘧啶脱氨酶融合蛋白,所述sgRNA靶向待进化抗体的可变区基因;2)利用1)中所述的单碱基基因编辑系统对待进化抗体的可变区基因进行碱基突变,表达突变抗体,获得突变抗体库;3)筛选并富集高亲和力抗体。本发明通过对细胞进行基因编辑,真正实现了抗体基因的定范围自主突变。并通过结合后续的流式分选技术,从而定向选择抗体的进化,提高抗体进化效率。

Description

一种抗体进化方法及其应用
技术领域
本发明涉及细胞生物学领域,特别是涉及一种抗体进化方法及其应用。
背景技术
面对复杂的生存环境,人体适应性免疫系统中的免疫细胞可以通过多样化其细胞受体来识别不同的抗原或病原体。例如:多样化的B细胞受体和T细胞受体是B或T细胞介导的免疫反应中各类病原体识别的分子基础。B细胞受体可以分为膜结合型或分泌型,其中分泌型B细胞受体又被称为抗体。抗体是体液免疫的重要分子,它由两条相同的重链和轻链组成,其中N端由于其组成氨基酸具有多样性,也被称为可变区,能够识别并结合抗原分子,决定了抗体的特异性。可变区通过半胱氨酸形成的二硫键连接成三级结构。其中,暴露在可变区结构域外端的高变区的序列多样性最为显著,它们能与抗原表位形成互补结构域,又被称为互补决定区(CDR)。而可变区的其他位置的氨基酸序列相对CDR区域而言更为保守,可被称为框架区(FWR)。CDR1和CDR2位于VH或VL元件内部,而CDR3位于VHDHJH或VLJL的连接区,序列多样性最为明显(Hwang et al.,2015)。抗体分子的C端序列氨基酸组成相对稳定,被称为恒定区。重链的恒定区一般有五种类型,μ、δ、γ、ε以及α,它们通过与不同的下游免疫反应分子相作用,从而介导不同的免疫反应。
据估计,人类一生可以产生多达109种类的抗体,足以识别5×1013种抗原。如果每一种抗体分子都对应不同的编码基因,那这将大大超出人类基因组的最大容量。事实上,在我们的机体内,存在着抗体分子多样化的复杂机制,使得我们可以利用少量的基因元件,组成基因序列极为丰富的初级抗体库。在免疫B细胞发育早期,细胞需要经历V(D)J重排,淋巴细胞中特异表达的重排酶RAG(Recombination-Activating Gene)能在V,D,J元件的编码基因附近产生DNA双链断裂(DSB),并通过招募下游的多种非同源末端连接蛋白对不同的元件进行连接,最终拼接产生抗体可变区。人体和小鼠中,重排过程能形成约105-106不同类型的抗体分子。重排后的细胞成功表达了B细胞受体(BCR),但此时表面的BCR亲和力较低,对致病菌中和作用较低,且分子多为IgM亚型。当同源B细胞遇到对应抗原后将迅速被激活,细胞快速分裂分化并迁移至生发中心的暗区,成为生发中心母细胞。在生发中心中,B细胞将经历体细胞高频突变(SHM)和抗体类型转换(CSR)两大过程,从而表达高效力抗体。这两个过程均由胞嘧啶脱氨酶(AID)介导,通过对单链DNA上的胞嘧啶N4位的氨基进行脱氨,从而使得胞嘧啶转化成为尿嘧啶,并通过下游的错配修复途径,而在抗体基因簇上形成碱基高频突变,或被处理为DNA双链断裂。相较于正常状态下基因上每分裂一代产生的~10-9的突变率,抗体可变区基因在高频突变过程中能产生约10-5-10-3的突变率。多样化的抗体分子组合成一个次级抗体库,其中表达抗原特异性的高亲和力抗体的B细胞可以在生发中心中被进一步的筛选出来,从而机体可以分泌各种高亲和力抗体。这一过程也被称为抗体的亲和力成熟。
抗体分子的生产可以简单分为免疫动物、构建抗体库、筛选高效抗体、人源化等步骤。目前,有多种方法可被用于构建抗体库,并筛选得到高效抗体。如应用最广泛的单克隆抗体制备的杂交瘤技术,将来自小鼠的骨髓瘤细胞与能分泌高亲和力抗体的浆细胞进行融合,形成杂交瘤细胞。但应用这种方法进行筛选通量小,需要耗费较多人力物力。噬菌体表面展示技术,能在大肠杆菌和噬菌体表面高通量地表达抗体表位分子,通过该方法已获得多种高亲和力抗体,并被成功应用在多种领域。但该方法中,噬菌体不能表达抗体分子在自然配对后产生的重链和轻链,且真核生物中特有的多种氨基酸修饰也无法在该体系中体现。酵母表面展示技术以及真核细胞表面展示技术等部分解决了原核系统表达缺陷、糖基化缺失等问题,但面临通量不够等问题。随着测序技术的不断进步,基于单个B细胞的抗体基因进行克隆得以实现,通过结合流式细胞术,可以有效得到多种高亲和的抗体分子,但这种技术依赖于流式细胞术以及特定的抗原分子。近年来,人源化基因工程小鼠也被广泛应用在抗体分子人源化过程。但这些技术并没有解决抗体多样性产生的问题,因此抗体的生产仍然依赖于免疫动物或大样本的人群样品。
抗体体外亲和力成熟或亲和力提升是人源化抗体制备流程中重要的技术环节。目前主要的手段包括:1.随机突变或易错DNA聚合酶合成,结合表面展示技术的筛选;2.定范围合成DNA短链库,结合表面展示技术的筛选;3.通过过表达脱氨酶AID,结合流式细胞术进行筛选。前两种方法依赖于抗体库的构建,工作量较大而效率低。而第三种方法,利用细胞内源AID的方法,过表达AID虽然在基因上能够造成很多突变,但并不能定点靶向AID活性到特定区域。因此,该方法效率极低。
抗体类药物由于其自身与靶抗原结合具有特异性、有效性和安全性等特点,在自身免疫病、癌症等多种临床疾病治疗过程中发挥了重要作用,是当前生物医药中增长速率最快的一类药物。截止2017年,FDA已累计批准超过70种抗体类药物,自2014年开始,抗体新药批准数量呈爆发式增长。目前仍有26种抗体类药物正在处于临床研究的最终阶段,有望在2018年通过批准。除此之外,抗体也被广泛地运用在生物医学等领域的诊断中。在生物医学的研究中,抗体被用于检测特定蛋白、蛋白的氨基酸修饰、核酸的特殊结构等等,已经成为不可缺少的手段。在疾病和病原体诊断领域,抗体诊断试剂已经成为快速诊断的标准方法。更高亲和力、更稳定的抗体分子是快速并廉价诊断试剂盒的核心成分,也是诊断领域急需的试剂。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种抗体进化方法及其应用,用于解决现有技术中抗体突变效率低的问题。
为实现上述目的及其他相关目的,本发明第一方面提供一种抗体进化方法,所述抗体进化方法包含以下步骤:
1)提供单碱基基因编辑系统,所述单碱基基因编辑系统可形成单碱基基因编辑复合体,所述单碱基基因编辑复合体包括dCas9酶、sgRNA、MS2胞嘧啶脱氨酶融合蛋白,所述sgRNA靶向待进化抗体的可变区基因;
2)利用1)中所述的单碱基基因编辑系统对待进化抗体的可变区基因进行碱基突变,表达突变抗体,获得突变抗体库;
3)筛选并富集高亲和力抗体。
进一步的,步骤2)还包括:利用1)中所述的单碱基基因编辑系统对获得的突变抗体库进行多轮的碱基突变,获得突变抗体库。一般可以进行1~4轮突变,甚至更多轮的突变。例如,首次利用1)中所述的单碱基基因编辑系统对待进化抗体的可变区基因进行碱基突变获得的突变抗体库为第一轮突变抗体库;利用1)中所述的单碱基基因编辑系统对第一轮突变抗体库进行碱基突变获得的突变抗体库为第二轮突变抗体库;利用1)中所述的单碱基基因编辑系统对第二轮突变抗体库进行碱基突变获得的突变抗体库为第三轮突变抗体库;利用1)中所述的单碱基基因编辑系统对第三轮突变抗体库进行碱基突变获得的突变抗体库为第四轮突变抗体库;利用1)中所述的单碱基基因编辑系统对第四轮突变抗体库进行碱基突变获得的突变抗体库为第五轮突变抗体库。
优选的,步骤2)中,所述突变抗体库进行下一轮碱基突变时,先进行筛选与富集。
进一步的,步骤3)中,所述高亲和力抗体,是指相对于突变之前的抗体,亲和力提升的抗体。
进一步的,所述sgRNA包括靶向待进化抗体的可变区基因的靶向段,以及MS2发夹结构,所述MS2发夹结构用于招募MS2胞嘧啶脱氨酶融合蛋白。
进一步的,所述sgRNA可包括用于结合dCas9酶的发夹结构,所述用于结合dCas9酶的发夹结构与Crispr/Cas9系统中的tracrRNA相同或相似,是由重复序列区转录而成的具有发卡结构的RNA,其编码基因可为如SEQ ID NO:29所示的核苷酸序列。
优选的,所述sgRNA靶向待进化抗体的可变区基因能表达抗体互补决定区(CDR)的位置。
进一步的,所述dCas9酶是指已经丧失剪切活性的cas9酶dCas9酶能特异地结合在靶向位点,将DNA双链打开,而不发生双链切割的,为招募的胞嘧啶脱氨酶提供单链DNA底物,并以此实现在定范围的基因组区域实现高频突变。
进一步的,所述sgRNA包括2个MS2发夹结构。
进一步的,所述MS2胞嘧啶脱氨酶融合蛋白中,胞嘧啶脱氨酶包括AID-mono、AID-crystal、AID-act、人Apobec3a、人Apobec3b、AID-A3c和AID-A3f中的一种或多种。优选的,为AID-mono、人Apobec3a。选用为AID-mono、人Apobec3a时,单碱基基因编辑系统能使抗体的突变在sgRNA靶向的序列的上下游至少50bp。进一步的,达到400bp。
所述MS2是指噬菌体外壳蛋白。
优选的,在对待进化抗体的可变区基因进行碱基突变之前,对所述待进化抗体基因进行密码子优化,使得在不改变所生成的氨基酸序列的情况下,使得序列中保留胞嘧啶脱氨酶容易发生作用的序列,保留所有临近序列中的WRC和AGCT序列模体。密码子的优化根据DNA序列和密码子表,手动进行密码子优化。具体方式可采用分子生物学领域常用技术手段。
进一步的,所述单碱基基因编辑系统包括DNA构建体,所述DNA构建体中,含有sgRNA编码基因、MS2胞嘧啶脱氨酶融合蛋白的编码基因、dCas9酶的编码基因中的一个或多个。例如,可以是含有sgRNA编码基因的DNA构建体;或者是含有MS2胞嘧啶脱氨酶融合蛋白的编码基因的DNA构建体;或者是含有dCas9酶的编码基因的DNA构建体;或者是含有sgRNA编码基因和MS2胞嘧啶脱氨酶融合蛋白的编码基因的DNA构建体;或者是MS2胞嘧啶脱氨酶融合蛋白的编码基因和dCas9酶的编码基因的DNA构建体;或者是含有sgRNA编码基因和dCas9酶的编码基因的DNA构建体;或者是含有sgRNA编码基因、MS2胞嘧啶脱氨酶融合蛋白的编码基因和dCas9酶的编码基因的DNA构建体。
进一步的,所述单碱基基因编辑系统中的sgRNA编码基因可以是一种或多种,优选多种sgRNA编码基因,用以形成靶向sgRNA库。其中,多种sgRNA编码基因是指,sgRNA编码基因编码多条序列不同的sgRNA,且所述各序列不同的sgRNA靶向待进化抗体的可变区中的不同位置。利用多种sgRNA靶向待进化抗体的可变区中的不同位置,可以抗体基因上产生多点、多范围高效突变,提升突变效率。
所述DNA构建体选自含有上述编码基因的质粒或慢病毒载体。
进一步的,所述质粒可以选自pX330、pLL1_sgRNA(MS2)_MS2_AIDmono、pLL4_sgRNA(MS2)_MS2_hA3a。
进一步的,所述慢病毒载体可以选自lenti-dCAS-VP64_Blast、pLL7_lenti_dcas9_3xflag_blast、plenti-universal-CH-cd28-gp41-puro(该载体采用Taube,R.etal.(2008).Lentivirus display:stable expression of human antibodies on thesurface of human cells and virus particles.PLoS One 3,e3181.记载的方法进行构建)。
进一步的,步骤2)中,所述突变抗体经抗体表面展示系统进行展示。
进一步的,所述抗体表面展示系统包括抗体表面展示载体,所述抗体表面展示载体能表达突变抗体基因。
优选的,步骤2)中所用的抗体表面展示载体上,在利用单碱基基因编辑系统进行基因突变之前,在抗体表面展示载体上的抗体的可变区基因与抗生素抗性基因中插入t2A肽段编码序列,将抗体的可变区基因与抗生素抗性基因通过t2A肽段编码序列相连。以提高抗体表面展示的效率。将抗体的可变区基因与抗生素抗性基因相连,使得抗体的可变区基因的移码突变或终止密码子突变可影响抗生素抗性基因或营养缺陷互补基因的编码。通过抗性基因筛选系统的引入,可以排除抗体编码基因编辑过程中发生移码错义突变或终止密码突变的克隆,以提高抗体表面展示的效率。之前报道的系统并没有将可变区基因与抗性基因进行过耦连,而是质粒中分别通过不同的启动子进行表达。
t2A肽段的氨基酸序列如SEQ ID NO:1所示。核苷酸序列如SEQ ID NO:30所示。
所述抗体表面展示系统选自噬菌体表面展示系统,大肠杆菌表面展示系统,酵母菌表面展示系统,哺乳动物细胞表面展示系统。优选的,为哺乳动物细胞表面展示系统。
具体的,哺乳动物细胞表面展示系统是指,含有抗体表面展示载体的宿主细胞,所述宿主细胞为哺乳动物细胞。例如为人、鼠或兔子,具体地,可为HEK293T细胞。
进一步的,所述抗体表面展示载体能表达突变抗体基因,并能表达于宿主细胞表面。
进一步的,所述抗体表面展示载体含有抗体的可变区基因、跨膜融合肽段基因与信号肽基因,并能表达于细胞表面。所述跨膜融合肽段可为CD28-gp41或跨膜蛋白PDGFR。
所述跨膜融合蛋白肽段具有如下功能:将融合的目的蛋白展示于细胞外侧。
本发明中,具体的将单碱基基因编辑系统和抗体的可变区基因共转化进入抗体表面展示系统中的方法不作限定,本领域技术人员可以根据实际需要采用本领域公知的技术进行。
进一步的,所述步骤3)中,所述筛选表达高亲和力抗体的细胞的方法为利用流式细胞仪进行筛选。使用APC荧光耦连的anti-IgG抗体对抗体表达情况进行标记,然后用PE荧光耦连的NP检测抗原抗体的结合情况。抗体表达量越高,检测到的抗原抗体结合力就会越强,处于一个线性范围,与抗体能够高亲和力结合的细胞会超出线性染色细胞群。
本发明第二方面,提供一种抗体,所述抗体为采用如本发明第一方面所述的抗体进化方法获得。
如上所述,本发明的抗体进化方法及其应用,具有以下有益效果:本发明是以哺乳动物细胞为研究体系,应用哺乳动物表面展示技术,使得胞嘧啶脱氨酶可以通过sgRNA定位,从而对抗体基因编码序列进行靶向编辑。目前已有的多种抗体生产方法均依赖于机体自身产生突变或外源引入突变。而本发明通过对细胞进行基因编辑,真正实现了抗体基因的定范围自主突变,大大提升了抗体进化效率。并通过结合后续的流式分选技术,从而定向选择抗体的进化。
本发明中所使用的单碱基基因编辑系统,在进行基因编辑时具有显著的底物序列偏好性。本发明所具有的选择性能够大大减少与抗体亲和无关的位点干扰,提高抗体筛选的效率。提高抗体亲和力。
附图说明
图1显示为膜结合型抗体表达系统的建立结果图。(用anti-human IgG1标记抗体分子Fc段的human IgG1,用PE-NP检测其与抗体分子的亲和性)
图2显示为融合蛋白在细胞内对GFP基因进行编辑后产生的突变图谱。图上至下分别是AID多种突变体,以及humanA3a,humanA3b,ratApobec1,AID 3c,AID 3f蛋白。
图3显示为单个sgRNA在单碱基基因编辑系统中造成的突变图谱(突变可达PAM序列上下游数百bp)。
图4显示为单碱基基因编辑系统-AID对VB18编码基因的CDR区域以及FWR区域突变图谱;
图5显示为本发明密码子优化前后突变图谱(图上:优化前;图下:优化后)。
图6显示为本发明VB18抗体基因一轮亲和成熟流式检测图。横坐标为APC荧光信号,纵坐标为PE荧光信号,阴性对照为未转染单碱基基因编辑系统的细胞。
图7显示为单碱基基因编辑系统-hA3a,单碱基基因编辑系统-AID-3c,单碱基基因编辑系统-AID-3f对VB18编码基因突变图谱。
图8显示为利用单碱基基因编辑系统在体外对抗体基因进行筛选后多轮亲和成熟的突变图谱。其中,A组显示为单碱基基因编辑系统-AID三轮亲和突变图谱(A1:分选前,A2:分选后);B组显示为单碱基基因编辑系统-A3a三轮亲和突变图谱(左:分选前,右:分选后)
图9显示为关键突变位点的确定以及亲和力检测结果图。(体外BLI检测得到的抗原抗体解离常数,分别对应野生型和各突变体。)
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指出,单数形式“一个”、“一”和“这个”包括复数形式。
应理解,本发明中提到的一个或多个方法步骤并不排斥在所述组合步骤前后还可以存在其他方法步骤或在这些明确提到的步骤之间还可以插入其他方法步骤,除非另有说明;还应理解,本发明中提到的一个或多个设备/装置之间的组合连接关系并不排斥在所述组合设备/装置前后还可以存在其他设备/装置或在这些明确提到的两个设备/装置之间还可以插入其他设备/装置,除非另有说明。而且,除非另有说明,各方法步骤的编号仅为鉴别各方法步骤的便利工具,而非为限制各方法步骤的排列次序或限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容的情况下,当亦视为本发明可实施的范畴。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。
实施例1抗体亲和力提升的方法
1.1抗体表面展示系统的构建
先进行密码子优化,列举出VB18基因序列中氨基酸对应的所有碱基组合,手动挑选保留最多的WRC或AGCT序列模体,交给苏州金唯智公司进行合成。优化后的VB18基因核苷酸序列如SEQ ID NO:2所示。
用于在293T细胞表面过表达膜结合型抗体分子的载体是lenti dCAS-VP64_Blast进行改造,保留病毒包装骨架,对lenti dCAS-VP64_Blast质粒使用BsiWI,EcoRI进行酶切,信号肽(SEQ ID NO:3)、优化后的VB18基因序列、IgG恒定区序列(CH2-CH3)(SEQ ID NO:4)均合成于苏州金唯智公司。通过PCR扩增和Gibson assembly的方法将重组片段与对应质粒连接,VB18-重链扩增正向引物(SEQ ID NO:5):
5’-CTGGTGGCAGCGGCCCAGCCGGCCATGCAGGTCCAACTGCAGCAGCCT-3’
VB18-重链扩增反向引物(SEQ ID NO:6):
5’-CCAGAACCACCACCTCCGGAACCGCCGCCACCTGAGGAGACTGTGAGAGT-3’
VB18-轻链扩增正向引物(SEQ ID NO:7):
5’-TCCGGAGGTGGTGGTTCTGGCGGTGGTGGCAGCTCCCAG-3’
VB18-轻链扩增反向引物(SEQ ID NO:8):
5’-GTTTTGTCACAAGATTTGGGCTCTGCGGCCGCCGAGGGGGC-3’
将Cas9蛋白编码基因替换成为信号肽-VB18重链-VB18轻链-CH2-CH3-CD28-gp41融合蛋白编码序列。
Cas9蛋白的氨基酸序列如SEQ ID NO:9所示。核苷酸序列如SEQ ID NO:10所示。
CD28-gp41的核苷酸序列如SEQ ID NO:11所示。
1.2单碱基基因编辑系统的构建
1.2.1构建dCas9稳转细胞株的质粒:通过分子克隆的方法对张峰实验室(Addgeneplasmid#61425)lenti-dCAS-VP64_Blast进行改造,使用BamHI,BsrGI对lenti-dCAS-VP64_Blast质粒进行酶切,去除VP64基因(SEQ ID NO:12),并通过连接克隆进3xFlag标签序列(SEQ ID NO:13),得到lenti-dCAS_3xFlag_Blast质粒。
构建dCas9稳转细胞株的质粒:D10ACas9载体是在前一步得到的lenti-dCAS_3xFlag_Blast质粒基础上将dCas9基因的A863位点突变为N。
dCas9蛋白的氨基酸序列如SEQ ID NO:14所示。核苷酸序列如SEQ ID NO:15所示。D10ACas9蛋白的氨基酸序列如SEQ ID NO:16所示。核苷酸序列如SEQ ID NO:17所示。
1.2.2.电转以及瞬时转染实验需要用到过表达MS2-胞嘧啶脱氨酶融合蛋白的载体的制备方法:
(1)在张峰实验室(Addgene plasmid#42230)PX330质粒的基础上,对PX330载体使用BbSI,KpnI进行酶切,使用PCR技术将sgRNA基因(SEQ ID NO:18)克隆到PX330载体上,形成含有sgRNA基因的PX330载体。所述sgRNA基因可以形成用于招募MS2胞嘧啶脱氨酶融合蛋白的MS2发夹结构。PCR时所用的包含所述sgRNA序列的模板购自addgene,货号为61426,PCR反应条件为98℃,30s;98℃,10s;60℃,30s;72℃,20s;30个循环;72℃,5min。
sgRNA扩增上游引物(SEQ ID NO:19):
5’-GGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCGAGAAGACCTGTTTTAGAGCTAG-3’;
sgRNA扩增下游引物(SEQ ID NO:20):
5’ATTTTAACTTGCTATTTCTAGCTCTAAAACAAAAAAAGCACCGACTCGGTG-3
(2)将上述形成的含有sgRNA基因的PX330载体使用AgeI,EcoRI进行酶切,使用PCR技术将MS2基因序列连接到所述载体上,得到含有sgRNA基因-MS2基因的PX330载体。PCR时所用的包含所述MS2基因序列的模板购自addgene,货号为61426,PCR反应条件为98℃,30s;98℃,10s;60℃,30s;72℃,20s;30个循环;72℃,5min。
MS2基因上游引物(SEQ ID NO:21):
5’-cctgcctgaaatcactttttttcaggttggaccggtccaccatggcttcaaacttt actc-3’;
MS2基因下游引物(SEQ ID NO:22):
5’-gtcgaggctgatcagcgagctctaggaattaggatccagcggccgccaccttc-3’;
(3)通过Gibson assembly的方法将胞嘧啶脱氨酶基因进行连接到步骤(2)形成的含有sgRNA基因-MS2基因的PX330载体上,形成含有sgRNA基因-MS2基因-胞嘧啶脱氨酶基因的PX330载体,用于表达MS2-胞嘧啶脱氨酶融合蛋白。胞嘧啶脱氨酶基因包括Apobec3a,Apobec3c,Apobec3f,Apobec3g基因,均合成于苏州金唯智公司。
1.3利用单碱基基因编辑系统进行基因编辑
使用lipofectamine 2000脂质体试剂对293T细胞转染单碱基基因编辑系统中的MS2-胞嘧啶脱氨酶蛋白复合体,以及sgRNA库的质粒。提前24h,将293T细胞铺至6孔板中,使得细胞第二天密度约为50-60%。转染前对细胞进行换液,换至2ml新鲜DMEM培养基中。转染时,向250μl Opti-MEM中加入10μl lipofectamine 2000,轻弹混匀后静置5min,同时向250μl Opti-MEM中加入4μl质粒,充分混匀后,与静置完成的脂质体稀释物混合,室温静置20min后,逐滴加入细胞培养基中,轻摇混合均匀,将细胞板置于37℃,5%CO2培养箱中培养4-6h后更换新鲜培养基。培养两天后进行下一轮转染,三次之后进行分选。
1.4利用流式细胞仪进行筛选
利用流式细胞分选技术,对表达高亲和力抗体细胞进行富集。取适量细胞悬液离心,并用FACS缓冲液(PBS加2.5%FBS)洗一遍。用FACS缓冲液按1:500稀释所需抗体,每个样品用2million/100μl稀释后抗体在室温下染色15分钟,然后用FACS缓冲液洗一遍,用合适体积的FACS缓冲液重悬细胞后立即上机分选,收集表达高亲和力抗体的细胞群。收集后的细胞铺至24孔板中并置于37℃,5%CO2培养箱中培养。通过流式染色,收集超出线性染色范围的细胞群,并判定其为高亲和力细胞。
1.5碱基突变的检测
对溶解充分的分选富集出来的表达高亲和力抗体的细胞群的突变VB18抗体基因DNA进行浓度测定,取部分DNA稀释至200ng/μl作为PCR模板,反应体系及条件如下:
反应体系:
Figure BDA0001808941780000101
反应条件:98℃,30s;98℃,10s;60℃,20s;72℃,20s;25个循环;72℃,5min。
一轮PCR完成后,取1μl第一轮产物作为第二轮PCR的模板,进行第二轮PCR反应。
反应体系:
Figure BDA0001808941780000102
反应条件:98℃,30s;98℃,10s;60℃,20s;72℃,20s;11个循环;72℃,5min。
一轮PCR需要进行两个反应,所用的引物序列如下:
突变VB18基因扩增子一上游引物(SEQ ID NO:23):
5’-TCCCTACACGACGCTCTTCCGATCTNNNNNNCAGGAGCCCACTCCCAGGTCC-3’;
突变VB18基因扩增子一下游引物(SEQ ID NO:24):
5’-AGTTCAGACGTGTGCTCTTCCGATCTNNNNNNGTAGGCTGTG CTGGAGGGTT-3’;
突变VB18基因扩增子二上游引物(SEQ ID NO:25):
5’-TTCCCTACACGACGCTCTTCCGATCT CNNNNNNGGCCACACTGACTGTAGACAA-3’;
突变VB18基因扩增子二下游引物(SEQ ID NO:26):
5’-AGTTCAGACGTGTGCTCTTCCGATCTNNNNNNCTGAGGAGACTGTGAGAGTGGTG-3
二轮PCR所需要使用的引物序列如下:
二轮上游引物(SEQ ID NO:27):
5’-TTCCCTACACGACGCTCT TCCGATCTNNNNNNTAGGTGAGTAAGGGTGAGG-3’;
二轮下游引物(SEQ ID NO:28):
5’-AGTTCAGACG TGTGCTCTTCCGATCTNNNNNNTCATCCACTTCACCACCCTATC-3’。
将反应产物进行琼脂糖凝胶电泳,切下目的条带,并进行胶回收试验,对纯化后的样品进行二代测序,利用生物信息学方法对突变序列和位点进行分析。
所采用的生物信息学方法是指利用ea-utils工具对双端测序得到的所有源文件进行序列分离,以得到多个单个样品的序列源文件。然后利用Bowtie2工具将源文件与参考基因序列进行比对,最后得到序列的碱基突变,插入和删除信息。
1.6蛋白表达和亲和力验证
对筛选后获得的突变体进行蛋白纯化,将目的质粒转化进入BL21(DE3)感受态中,37℃培养过夜。挑取阳性克隆至6ml 2xTY培养基中,37℃,220rpm,摇7-8h。将培养物转移至含300ml 2xTY培养基的锥形瓶中,37℃,220rpm,待OD600达到0.7-0.8后,16℃,加入1mMIPTG,220rpm过夜。
将过夜培养的细胞于4000rpm离心15min,用事先预冷的20ml裂解(150mM Nacl,20mM HEPES(PH7.5),10%glycerol)重悬细胞,使用时加入终浓度均1mM的TECP.Hcl和PMSF。利用细胞破碎仪对重悬物进行破碎,800Pa压力下破碎10min。将破碎好的菌进行离心,14000rpm离心45min。取500μl
Figure BDA0001808941780000111
Metal Affinity Resins加入层析柱中,并分别用用水和裂解液对其进行平衡,将用于储存的20%乙醇彻底去除。将离心得到的上清与平衡好的beads进行轻柔混合并置在混合仪上,结合45分钟。
将充分结合后的混合产物加入层析柱中,使得未结合产物匀速流出,先用5倍柱体积的裂解液,再用5倍柱体积的含20mM咪唑的裂解液去除掉层析柱中未结合的多余物质。最后加入含300mM咪唑的裂解液将目的蛋白洗脱下来。将纯化得到的蛋白采用Bradford法进行蛋白浓度测定,同时进行SDS-PAGE胶鉴定,并用考马斯亮蓝法对蛋白条带进行染色,通过蛋白条带大小判断蛋白纯化是否成功。
使用Octet Red 96仪器对抗原抗体的解离常数进行测定,用生物素标记NP_CGG抗原(mole ratio=3:1),并最终以20g/ml与感应器进行结合,多种抗体突变体稀释至100nM,50nM,25nM,12.5nM,6.25nM。稀释所用缓冲液为常规动力学缓冲液(1xPBS,0.01%BSA,0.002%Tween 20)。实验所使用参数为baseline1,60s,load,300s,baseline2,300s,association,600s,dissociation,600s。
1.7结果分析
1.7.1抗体表面展示系统的构建结果
本发明采用采用荧光标记对应的抗原分子检测抗原抗体亲和情况,以及荧光标记的IgG1检测抗体的表达情况。通过流式检测,证明VB18抗体基因成功表达在HEK293T细胞膜表面(图1)。
1.7.2单碱基基因编辑工具的特性分析
通过对单碱基基因编辑系统中编辑位点进行分析,表明融合了不同胞嘧啶脱氨酶的单碱基基因编辑系统具有突变底物序列的偏好性,这些序列多对应了不同胞嘧啶脱氨酶在体内发挥脱氨作用的底物偏好序列模体(图2)。这表明单碱基基因编辑系统的耦连方式能够在极大程度上保有胞苷脱氨酶在体内发挥活性的特性,从而实现在体外培养的细胞中特异地对一段基因序列进行多样突变。
通过对靶向区域进行高通量测序,表明融合不同胞嘧啶脱氨酶的单碱基基因编辑系统产生的突变均能在PAM序列的上下游50bp被检测到,甚至能产生在数百碱基对的范围之外,这证明耦连了不同工具酶的单碱基基因编辑系统能在一定程度上实现较广范围的碱基编辑(图3)。
抗体序列可分为CDR区域和FWR区域,其中CDR区域可以与抗原表位结合,在抗体亲和中发挥了重要功能。通过对这两个不同的区域设置靶向sgRNA库,分别进行靶向编辑,结果表明对CDR区域进行靶向编辑也能得到很好的效果(图4)。
1.7.3密码子优化结果分析
在自然界中,由于遗传密码子具有简并性,特定氨基酸可对应几种不同的遗传密码子。基于对不同脱氨酶的作用特性的研究,对一段抗体基因编码的核苷酸序列进行密码子优化,在不改变氨基酸序列的情况下,使得序列中更多的出现AID偏好的序列模体,如AGCT序列等。实验结果表明,优化后的序列相较于原有抗体基因序列,编辑后能产生更明显的多样性(图5)。这表明通过密码子优化,可以更好的实现高频广范围多位点的突变。
1.7.4利用单碱基基因编辑系统进行抗体基因突变的结果分析
通过试验持续转染特定工具或不同工具交替转染的方法,发现不同的突变策略都能得到显著的抗体亲和力提高。通过一轮亲和成熟,VB18抗体与NP抗原产生高亲和结合的细胞数量明显增多,由原有的不足1%上升至10%(图6)。
如图7所示,当耦连不同胞嘧啶脱氨酶时,抗体基因的突变图谱具有较大差异,突变的位点也有较大不同。通过扩增三轮分选得到的高亲和细胞群对应的抗体编码序列,使用本发明的方法,应用单碱基基因编辑系统-AID进行突变时,得到以下几个突变频率显著增高的位点:T30,S31,T58,Q82,S84,A97(氨基酸位点)。使用本发明的方法,应用单碱基基因编辑系统-A3a进行突变时,得到以下几个显著增加的点:W33,Q39,S84(氨基酸位点)。其中每个位点每轮突变成的氨基酸序列和比率表1及图8所示。其中W33L的突变,为已知提升该抗体亲和力的重要突变位点。通过本发明的方法,成功富集了这个重要位点,这表明采用本发明所述的抗体进化的方法,在体外培养的细胞中成功进行抗体进化,提升抗体的亲和力,找到影响抗体亲和成熟的重要位点。
表1利用单碱基基因编辑系统在体外对抗体基因进行筛选后多轮亲和成熟
Figure BDA0001808941780000131
1.7.5亲和力的测定结果分析
根据CDR区域的突变信息,本发明设计了包括S31R,T58I,T58I+A24S,W33L在内的多个突变体,并在体外纯化了这些突变体蛋白。随后通过应用BLI技术,检测这些突变体抗体蛋白和NP_CGG抗原对应的解离常数,结果表明S31R突变和T58I+A24S两个点突变可以提高约2-3倍的亲和力,而T58I单点突变可以提高约10倍亲和力,W33L单点突变也可以提升约10倍亲和力(图9)。这充分说明本发明的方法可在体外通过定范围随机筛选,以实现抗体的亲和成熟。
以上所述,仅为本发明的较佳实施例,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员,在不脱离本发明的精神和范围的情况下,当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变,均仍属于本发明的技术方案的范围内。
Figure BDA0001808941780000141
Figure BDA0001808941780000151
Figure BDA0001808941780000161
Figure BDA0001808941780000171
Figure BDA0001808941780000181
Figure BDA0001808941780000191
Figure BDA0001808941780000201
Figure BDA0001808941780000211
Figure BDA0001808941780000221
Figure BDA0001808941780000231
Figure BDA0001808941780000241
Figure BDA0001808941780000251
Figure BDA0001808941780000261
Figure BDA0001808941780000271
Figure BDA0001808941780000281
Figure BDA0001808941780000291
Figure BDA0001808941780000301
Figure BDA0001808941780000311
Figure BDA0001808941780000321
Figure BDA0001808941780000331
Figure BDA0001808941780000341
Figure BDA0001808941780000351
Figure BDA0001808941780000361
Figure BDA0001808941780000371
Figure BDA0001808941780000381
Figure BDA0001808941780000391
Figure BDA0001808941780000401
Figure BDA0001808941780000411
Figure BDA0001808941780000421
Figure BDA0001808941780000431
Figure BDA0001808941780000441
Figure BDA0001808941780000451
Figure BDA0001808941780000461
Figure BDA0001808941780000471
Figure BDA0001808941780000481
序列表
<110> 中国科学院上海生命科学研究院
<120> 一种抗体进化方法及其应用
<160> 30
<170> SIPOSequenceListing 1.0
<210> 1
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 2
<211> 738
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
caggtccaac tgcagcagcc tggggctgag cttgtgaagc ctggggcttc agtgaagctg 60
tcctgcaagg cttctggcta caccttcagc agctactgga tgcactgggt gaagcagagg 120
cctggacgag gccttgagtg gattggaagg attgatccta atagtggtgg tactaagtac 180
aatgagaagt tcaagagcaa ggccacactg actgtagaca aaccctccag cacagcctac 240
atgcagctca gcagcctgac atctgaggac tctgcggtct attattgcgc aagatacgat 300
tactacggta gtagctactt tgactactgg ggccaaggca ccactctcac agtctcctca 360
ggtggcggcg gttccggagg tggtggttct ggcggtggtg gcagctccca ggctgttgtg 420
actcaggaat ctgcactcac cacatcacct ggtgaaacag tcacactcac ttgtcgctca 480
agtactgggg ctgttacaac tagtaactat gccaactggg tccaacaaaa accagatcat 540
ttattcactg gtctaatagg tggtaccaac aaccgagctc caggtgttcc tgccagattc 600
tcaggctccc tgattggaaa caaggctgcc ctcaccatca caggggcaca gactgaggat 660
gaggcaatat atttctgtgc tctatggtac agcaaccatt gggtcttcgg gggtggcact 720
aagctaactg tcctaggt 738
<210> 3
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atgaaacatc tgtggttctt ccttctcctg gtggcagcgg cccagccg 48
<210> 4
<211> 720
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gagcccaaat cttgtgacaa aactcacaca tgcccaccgt gcccagcacc tgaactcctg 60
gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 120
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 180
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 240
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 300
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 360
atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 420
gatgagctga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 480
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 540
cccgtgctgg actccgacgg ctccttcttc ctctacagca agctcaccgt ggacaagagc 600
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 660
tacacgcaga agagcctctc cctgtctccg ggtaaatccg gcggctcctc tagaggaggc 720
<210> 5
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ctggtggcag cggcccagcc ggccatgcag gtccaactgc agcagcct 48
<210> 6
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ccagaaccac cacctccgga accgccgcca cctgaggaga ctgtgagagt 50
<210> 7
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tccggaggtg gtggttctgg cggtggtggc agctcccag 39
<210> 8
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gttttgtcac aagatttggg ctctgcggcc gccgaggggg c 41
<210> 9
<211> 1368
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 10
<211> 4104
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120
cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180
gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240
tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300
ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420
aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480
atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660
cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720
ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900
ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960
atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020
cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140
gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200
aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260
gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320
gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380
agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440
gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620
agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680
gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740
tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800
atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860
ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920
cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980
aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040
gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100
agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160
cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220
gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280
atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340
atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400
gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460
gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520
atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580
gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640
aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700
accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760
ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820
actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880
aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940
taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000
taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060
atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120
aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180
cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240
gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300
cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360
gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420
tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480
aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540
tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600
tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660
cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720
cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840
atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900
cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960
cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080
gacctgtctc agctgggagg cgac 4104
<210> 11
<211> 291
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ggcaccgaga ccagccaggt ggcgcccgcc attgaagtta tgtatcctcc tccttaccta 60
gacaatgaga agagcaatgg aaccattatc catgtgaaag ggaaacacct ttgtccaagt 120
cccctatttc ccggaccttc taagcccttt tgggtgctgg tggtggttgg tggagtcctg 180
gcttgctata gcttgctagt aacagtggcc tttattattt tctgggtgag gagtaagagg 240
agcaggctcc tgcacagtga ctacatgaat agagttaggc agggatattc a 291
<210> 12
<211> 150
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gacgcattgg acgattttga tctggatatg ctgggaagtg acgccctcga tgattttgac 60
cttgacatgc ttggttcgga tgcccttgat gactttgacc tcgacatgct cggcagtgac 120
gcccttgatg atttcgacct ggacatgctg 150
<210> 13
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60
gataag 66
<210> 14
<211> 1367
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 14
Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1010 1015 1020
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1025 1030 1035 1040
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile
1045 1050 1055
Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1060 1065 1070
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1075 1080 1085
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1090 1095 1100
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1105 1110 1115 1120
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1125 1130 1135
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1140 1145 1150
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1155 1160 1165
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1170 1175 1180
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1185 1190 1195 1200
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1205 1210 1215
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1250 1255 1260
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1265 1270 1275 1280
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His
1285 1290 1295
Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1300 1305 1310
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1315 1320 1325
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1330 1335 1340
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1345 1350 1355 1360
Leu Ser Gln Leu Gly Gly Asp
1365
<210> 15
<211> 4104
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
atggacaaga agtacagcat cggcctggcc atcggcacca actctgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120
cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180
gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240
tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300
ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420
aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480
atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660
cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggcaac 720
ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900
ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960
atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020
cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140
gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200
aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260
gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320
gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380
agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440
gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620
agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680
gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740
tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800
atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860
ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920
cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980
aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040
gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100
agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160
cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220
gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280
atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340
atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400
gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460
gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccac 2520
atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580
gacaaggccc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640
aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700
accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760
ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820
actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880
aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940
taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000
taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060
atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120
aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180
cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240
gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300
cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360
gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420
tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480
aaagagctgc tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540
tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600
tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660
cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720
cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840
atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900
cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960
cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080
gacctgtctc agctgggagg cgac 4104
<210> 16
<211> 1368
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 16
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 17
<211> 4104
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
atggacaaga agtacagcat cggcctggcc atcggcacca actctgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120
cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180
gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240
tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300
ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420
aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480
atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660
cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720
ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900
ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960
atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020
cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140
gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200
aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260
gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320
gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380
agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440
gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620
agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680
gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740
tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800
atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860
ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920
cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980
aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040
gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100
agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160
cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220
gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280
atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340
atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400
gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460
gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520
atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580
gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640
aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700
accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760
ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820
actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880
aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940
taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000
taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060
atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120
aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180
cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240
gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300
cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360
gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420
tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480
aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540
tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600
tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660
cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720
cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840
atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900
cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960
cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080
gacctgtctc agctgggagg cgac 4104
<210> 18
<211> 212
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
caccgggtct tcgagaagac ctgttttaga gctaggccaa catgaggatc acccatgtct 60
gcagggccta gcaagttaaa ataaggctag tccgttatca acttggccaa catgaggatc 120
acccatgtct gcagggccaa gtggcaccga gtcggtgctt tttttgtttt agagctagaa 180
atagcaagtt aaaataaggc tagtccgttt tt 212
<210> 19
<211> 65
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ggctttatat atcttgtgga aaggacgaaa caccgggtct tcgagaagac ctgttttaga 60
gctag 65
<210> 20
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
attttaactt gctatttcta gctctaaaac aaaaaaagca ccgactcggt g 51
<210> 21
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
cctgcctgaa atcacttttt ttcaggttgg accggtccac catggcttca aactttactc 60
<210> 22
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gtcgaggctg atcagcgagc tctaggaatt aggatccagc ggccgccacc ttc 53
<210> 23
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tccctacacg acgctcttcc gatctnnnnn ncaggagccc actcccaggt cc 52
<210> 24
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
agttcagacg tgtgctcttc cgatctnnnn nngtaggctg tgctggaggg tt 52
<210> 25
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ttccctacac gacgctcttc cgatctcnnn nnnggccaca ctgactgtag acaa 54
<210> 26
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
agttcagacg tgtgctcttc cgatctnnnn nnctgaggag actgtgagag tggtg 55
<210> 27
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
ttccctacac gacgctcttc cgatctnnnn nntaggtgag taagggtgag g 51
<210> 28
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
agttcagacg tgtgctcttc cgatctnnnn nntcatccac ttcaccaccc tatc 54
<210> 29
<211> 102
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt ttgttttaga gctagaaata gc 102
<210> 30
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gagggcagag gaagtctgct aacatgcggt gacgtcgagg agaatcctgg ccca 54

Claims (8)

1.一种抗体进化方法,所述抗体进化方法包含以下步骤:
1)提供单碱基基因编辑系统,所述单碱基基因编辑系统可形成单碱基基因编辑复合体,所述单碱基基因编辑复合体包括dCas9酶、sgRNA、MS2胞嘧啶脱氨酶融合蛋白,所述sgRNA 靶向待进化抗体的可变区基因;
2)利用1)中所述的单碱基基因编辑系统对待进化抗体的可变区基因进行碱基突变,表达突变抗体,获得突变抗体库;所述突变抗体经表面展示系统进行展示;所述表面展示系统包括抗体表面展示载体,所述抗体表面展示载体能用于表达突变抗体基因;将抗体的可变区基因与抗生素抗性基因相连,使得抗体的可变区基因的移码突变或终止密码子突变可影响抗生素抗性基因或营养缺陷互补基因的编码;
3)筛选并富集高亲和力抗体;
所述MS2胞嘧啶脱氨酶融合蛋白中,胞嘧啶脱氨酶选自AID-mono、AID-crystal、AID-act、人Apobec3a、人Apobec3b 、AID-A3c和AID-A3f中的多种;
所述步骤2)还包括:利用1)中所述的单碱基基因编辑系统对获得的突变抗体库进行多轮的碱基突变,获得突变抗体库。
2.如权利要求1所述的抗体进化方法,其特征在于,步骤2)中,所述突变抗体库进行下一轮碱基突变时,先进行筛选与富集。
3.如权利要求1所述的抗体进化方法,其特征在于,所述sgRNA包括靶向待进化抗体的可变区基因的靶向段,以及MS2发夹结构,所述MS2发夹结构用于招募MS2胞嘧啶脱氨酶融合蛋白。
4.如权利要求3所述的抗体进化方法,其特征在于,所述sgRNA包括2个MS2发夹结构。
5.如权利要求1所述的抗体进化方法,其特征在于,所述单碱基基因编辑系统包括DNA构建体,所述DNA构建体中,含有sgRNA编码基因、MS2胞嘧啶脱氨酶融合蛋白的编码基因,dCas9酶的编码基因中的一个或多个。
6.如权利要求5所述的抗体进化方法,其特征在于,所述单碱基基因编辑系统的DNA构建体中,sgRNA编码基因有一种或多种。
7.如权利要求1所述的抗体进化方法,其特征在于,步骤2)中所用的抗体表面展示载体上,在利用单碱基基因编辑系统进行基因突变之前,在抗体表面展示载体上的抗体的可变区基因与抗生素抗性基因中插入t2A肽段编码序列,将抗体的可变区基因与抗生素抗性基因通过t2A肽段编码序列相连。
8.如权利要求1所述的抗体进化方法,其特征在于,所述步骤3)中,筛选并富集高亲和力抗体的方法为利用流式细胞仪进行筛选。
CN201811110388.5A 2018-09-21 2018-09-21 一种抗体进化方法及其应用 Active CN110938658B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811110388.5A CN110938658B (zh) 2018-09-21 2018-09-21 一种抗体进化方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811110388.5A CN110938658B (zh) 2018-09-21 2018-09-21 一种抗体进化方法及其应用

Publications (2)

Publication Number Publication Date
CN110938658A CN110938658A (zh) 2020-03-31
CN110938658B true CN110938658B (zh) 2023-02-07

Family

ID=69905195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811110388.5A Active CN110938658B (zh) 2018-09-21 2018-09-21 一种抗体进化方法及其应用

Country Status (1)

Country Link
CN (1) CN110938658B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106520829A (zh) * 2016-10-17 2017-03-22 扬州大学 一种终止双等位基因转录的方法
CN107522787A (zh) * 2016-06-15 2017-12-29 中国科学院上海生命科学研究院 在细胞内产生点突变的融合蛋白、其制备及用途
CA3034110A1 (en) * 2016-08-17 2018-02-22 Katholieke Universiteit Leuven Drug-target identification by rapid selection of drug resistance mutations
WO2018052247A1 (ko) * 2016-09-13 2018-03-22 주식회사 툴젠 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법
CN108026519A (zh) * 2015-06-17 2018-05-11 波赛达治疗公司 将蛋白质定向至基因组中的特定基因座的组合物和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108026519A (zh) * 2015-06-17 2018-05-11 波赛达治疗公司 将蛋白质定向至基因组中的特定基因座的组合物和方法
CN107522787A (zh) * 2016-06-15 2017-12-29 中国科学院上海生命科学研究院 在细胞内产生点突变的融合蛋白、其制备及用途
CA3034110A1 (en) * 2016-08-17 2018-02-22 Katholieke Universiteit Leuven Drug-target identification by rapid selection of drug resistance mutations
WO2018052247A1 (ko) * 2016-09-13 2018-03-22 주식회사 툴젠 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법
CN106520829A (zh) * 2016-10-17 2017-03-22 扬州大学 一种终止双等位基因转录的方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Derek M. Mason et al..High-throughput antibody engineering in mammalian cells by CRISPR/Cas9-mediated homology-directed mutagenesis.《Nucleic Acids Research》.2018,第46卷(第14期), *
Directed evolution using dCas9-targeted somatic hypermutation in mammalian cells;Gaelen T. Hess et al.;《Nat Methods.》;20161231;第13卷(第12期);第1036–1042页 *
High-throughput antibody engineering in mammalian cells by CRISPR/Cas9-mediated homology-directed mutagenesis;Derek M. Mason et al.;《Nucleic Acids Research》;20180621;第46卷(第14期);第7436-7449页 *
Intrinsic Nucleotide Preference of Diversifying Base Editors Guides Antibody Ex Vivo Affinity Maturation;Liu Daisy Liu et al.;《Cell Reports》;20181023;第25卷;第884-892页 *
Methods and Applications of CRISPR-Mediated Base Editing in Eukaryotic Genomes;Gaelen T. Hess et al.;《Molecular Cell》;20171005;第68卷;第26-43页 *
抗体多样化及相关免疫系统疾病研究进展;刘婷婷等;《中国细胞生物学学报》;20160520;第38卷(第5期);第467-478页 *

Also Published As

Publication number Publication date
CN110938658A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN108473987B (zh) 具有改变的多样性支架结构域的结合成员
JP6073038B2 (ja) 安定化された免疫グロブリン可変ドメイン選別方法及び選別されたドメインの応用
US9102711B2 (en) Methods and materials for targeted mutagenesis
US20070248536A1 (en) Ubiquitin or gamma-crystalline conjugates for use in therapy, diagnosis and chromatography
JP5920835B2 (ja) 無細胞翻訳系でFabを提示しうるポリヌクレオチド構築物ならびにそれを用いたFabの製造方法およびスクリーニング方法
CN112409479B (zh) 人源抗新冠病毒中和性抗体nCoV-121及其应用
KR101438265B1 (ko) Dlk1 특이적 인간 항체 및 이를 포함하는 약학적 조성물
KR20110061629A (ko) 개선된 항체 라이브러리
CN113603775B (zh) 抗人白介素-33单克隆抗体及其应用
JP2015531597A5 (zh)
CN105247050B (zh) 用于文库构建、亲和力结合剂筛选和其表达的整合系统
CN111320687B (zh) 抗h7n9全人源单克隆抗体4e18及其制备方法与应用
WO2014100419A1 (en) Compositions and methods for the identification and isolation of cell-membrane protein specific binding moieties
CN104592390B (zh) 一类双特异重组抗HBsAg抗体、其制备方法及用途
CN111320685B (zh) 抗h7n9全人源单克隆抗体3f12及其制备方法与应用
CN110938658B (zh) 一种抗体进化方法及其应用
CN113195537A (zh) 抗体文库及方法
CN111875704B (zh) 一种egfr抗体及其应用
CN114075282B (zh) Il-5的结合分子及其制备方法和应用
CN111434683B (zh) 抗h7n9全人源单克隆抗体8d11及其制备方法与应用
KR20220026869A (ko) 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리
CN116496392B (zh) 抗新型冠状病毒n蛋白单域抗体、融合蛋白及其编码基因和应用
CN111153994B (zh) 人肿瘤坏死因子的人源单克隆抗体
CN108264555B (zh) 能够结合肺特异x蛋白的抗体或抗体片段及其用途
JP6293829B2 (ja) 安定化された免疫グロブリン可変ドメイン選別方法及び選別されたドメインの応用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200424

Address after: 200031 building 35, No. 320, Yueyang Road, Xuhui District, Shanghai

Applicant after: Center for excellence and innovation of molecular cell science, Chinese Academy of Sciences

Address before: 200031 No. 320, Yueyang Road, Shanghai, Xuhui District

Applicant before: SHANGHAI INSTITUTES FOR BIOLOGICAL SCIENCES, CHINESE ACADEMY OF SCIENCES

GR01 Patent grant
GR01 Patent grant