CN111194221A - 优化的核酸抗体构建体 - Google Patents

优化的核酸抗体构建体 Download PDF

Info

Publication number
CN111194221A
CN111194221A CN201880046347.6A CN201880046347A CN111194221A CN 111194221 A CN111194221 A CN 111194221A CN 201880046347 A CN201880046347 A CN 201880046347A CN 111194221 A CN111194221 A CN 111194221A
Authority
CN
China
Prior art keywords
seq
fold
dmab
acid sequence
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880046347.6A
Other languages
English (en)
Inventor
大卫·韦纳
吉亚贝·古伊宾加
尼尔·库奇
查尔斯·里德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wistar Institute of Anatomy and Biology
Inovio Pharmaceuticals Inc
Original Assignee
Wistar Institute of Anatomy and Biology
Inovio Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wistar Institute of Anatomy and Biology, Inovio Pharmaceuticals Inc filed Critical Wistar Institute of Anatomy and Biology
Publication of CN111194221A publication Critical patent/CN111194221A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • C07K16/1081Togaviridae, e.g. flavivirus, rubella virus, hog cholera virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • C07K16/1027Paramyxoviridae, e.g. respiratory syncytial virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1031Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/505Medicinal preparations containing antigens or antibodies comprising antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/505Medicinal preparations containing antigens or antibodies comprising antibodies
    • A61K2039/507Comprising a combination of two or more separate antibodies
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/54Medicinal preparations containing antigens or antibodies characterised by the route of administration
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/40Immunoglobulins specific features characterized by post-translational modification
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/52Constant or Fc region; Isotype
    • C07K2317/522CH1 domain
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/52Constant or Fc region; Isotype
    • C07K2317/524CH2 domain
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/52Constant or Fc region; Isotype
    • C07K2317/53Hinge
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/565Complementarity determining region [CDR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/567Framework region [FR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/64Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising a combination of variable region and constant region components
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/66Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising a swap of domains, e.g. CH3-CH2, VH-CL or VL-CH1
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/76Antagonist effect on antigen, e.g. neutralization or inhibition of binding
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Virology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Pulmonology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Analytical Chemistry (AREA)

Abstract

本文公开了包括结构修饰的DNA编码抗体(DMAb)的组合物、结构修饰DMAb的方法,以及结构修饰的DMAb的使用方法。

Description

优化的核酸抗体构建体
相关申请的交叉引用
本申请要求于2017年5月10日提交的美国临时专利申请第62/504,448号,于2017年5月10日提交的美国临时专利申请第62/504,460号,于2018年1月31日提交的美国临时专利申请第62/624,320号,和于2018年1月31日提交的美国临时专利申请第62/624,367号的优先权,以上各临时专利申请通过引用以其整体并入于此。
技术领域
本发明涉及优化核酸抗体构建体的方法以及经优化的结构修饰的核酸抗体构建体。本发明所述的组合物提供了诱导免疫应答以及预防性和/或治疗性免疫接种个体抵御抗原的改良方法。
背景技术
免疫球蛋白分子包括两种轻链(L)和两种重链(H),它们通过半胱氨酸残基之间的二硫键(以S-S示出)共价连接。重链的可变结构域(VH)和轻链的可变结构域(VL)促成抗体分子的结合位点。重链的恒定区由三个恒定结构域(CH1、CH2和CH3)和一个(柔性)铰链区构成。轻链也具有恒定结构域(CL)。重链和轻链的可变区包括4个框架区(FRs;FR1、FR2、FR3和FR4)和3个互补决定区(CDRs;CDR1、CDR2和CDR3)。因此,这些是非常复杂的遗传系统,很难在体内进行装配。
靶向单克隆抗体(mAbs)代表了过去25年中最重要的医学治疗进展之一。目前,这种类型的免疫疗法常用于抵御多种自身免疫性疾病、治疗癌症以及传染病。对于恶性肿瘤,将许多目前使用的基于免疫球蛋白(Ig)的疗法与针对肿瘤的细胞毒性化疗方案相结合。这种结合方法显著地提高了总生存率。多种mAb制剂被批准用于针对特定癌症,包括瑞图宣(利妥昔单抗)、靶向CD20以用于治疗非霍奇金氏淋巴瘤和伊匹单抗(Yervoy)的嵌合mAb、以及阻断CTLA-4且已被用于治疗黑色素瘤和其它恶性肿瘤的人mAb。此外,贝伐单抗(阿瓦斯丁)是另一个突出的人源化mAb,其靶向VEGF和肿瘤新血管形成且已用于治疗结直肠癌。也许最广为人知的用于治疗恶性肿瘤的mAb是曲妥珠单抗(赫赛汀),这是一种已被证明在一小部分患者中具有相当大的抗乳腺癌功效的靶向Her2/neu的人源化制剂。此外,许多mAb用于治疗自身免疫疾病和特定的血液紊乱。
除了癌症治疗以外,多克隆Ig的被动转移介导对许多感染性疾病(包括白喉、甲型和乙型肝炎、狂犬病、破伤风、水痘和呼吸道合胞病毒(RSV))的预防功效。事实上,在来不及通过主动接种来产生保护性Ig的情况下,有几种多克隆Ig制剂可以为在疾病流行地区旅行的个体提供临时保护以抵抗特定的传染原。此外,对于具有免疫缺陷的儿童,帕利珠单抗(Synagis)——一种靶向RSV感染的mAb——在临床上已被证明可以预防RSV。
市场上现有的治疗性抗体是人IgG1同种型。这些抗体包括携带结合至抗体恒定区(Fc)的两个N-联双天线复合型寡糖的糖蛋白,其中大多数寡糖被核心岩藻糖基化。它通过Fc与白细胞受体(FcγRs)或补体的相互作用履行抗体依赖性细胞毒性(ADCC)和补体依赖性细胞毒性(CDC)的效应子功能。存在治疗性抗体的体内功效降低的现象(相对于体外),由此需要大剂量的治疗性抗体——有时每周剂量为几百mg。这主要是由血清IgG和用于与自然杀伤(NK)细胞上的FcγRIIIa结合的治疗性抗体之间的竞争造成的。内源性人血清IgG抑制治疗性抗体诱导的ADCC。因此,可以增强非岩藻糖基化治疗性抗体在人类中的功效。与岩藻糖基化人血清IgG相比,非岩藻糖基化治疗性抗体对FcγRIIIa的结合亲和力要高得多,这是克服人类血浆IgG干扰的优选特征。
基于抗体的治疗并非没有风险。其中一个风险就是抗体依赖性增强作用(ADE),当非中和抗病毒蛋白促进病毒进入宿主细胞时,发生抗体依赖性增强作用,从而导致细胞中的感染性增强。一些细胞的表面上不具有病毒得以进入的常见受体。抗病毒蛋白(即抗体)结合一些细胞在质膜中所具有的抗体Fc受体。病毒与抗体另一端的抗原结合位点相结合。该病毒可使用这样的机制来感染人类巨噬细胞,从而使通常轻度的病毒感染变成威胁生命的感染。ADE的最为人所知的实例是在感染了登革热病毒(DENV)的情况下发生的。当先前已被一个血清型的登革热病毒感染的人在数月或数年后被不同血清型感染时,观察到这种现象。在此类案例中,疾病的临床病程更加严重,并且与未发生过ADE的人相比,这些人具有较高的病毒血症。这解释以下观察结果:虽然原发(首次)感染主要引起儿童的轻微疾病(DF),但是无论对于儿童还是成人,继发感染(以后的再感染)更可能与严重疾病(DHF和/或DSS)相关。登革热病毒有四种抗原性不同的血清型(登革热病毒-1至登革热病毒-4)。登革热病毒感染诱导产生中和同型免疫球蛋白G(IgG)抗体,该抗体可终生免疫感染性血清型。登革热病毒感染还产生一定程度的针对另外3种血清型的交叉保护性免疫。除了诱导中和异型抗体以外,登革热病毒感染还可诱导仅部分或根本不中和病毒的异型抗体。这种交叉反应性抗体而非非中和抗体的产生可能是引起更严重的继发感染的原因。一旦进入白细胞,病毒就会在不被发现的情况下复制,最终会产生很高的病毒滴度,从而导致严重的疾病。
mAb疗法的临床影响令人印象深刻。然而,限制该治疗方法的使用和宣传的问题仍然存在。其中一些问题包括这些复杂的生物制剂的生产成本高,这制约它们在更广泛的人群中使用,特别是在它们可能产生巨大影响的发展中国家。例如,靶向埃博拉病毒糖蛋白(GP)的mAb是一种针对埃博拉病毒疾病(EVD)的重要治疗方法。已经证明,单个mAb和mAb调和可以成功地保护小动物和非人类灵长类动物免受致命的埃博拉病毒感染。在确诊为人类EVD病例中,接受防治GP的mAb调和ZMapp疗法后得到良好的恢复,这进一步证实了基于mAb的EVD疗法。然而,高昂的成本,缓慢的进展以及多次高剂量给药(mg/kg)的需求反映了蛋白mAb的递送(尤其是在可能的爆发期)所面临的重大挑战。
再者,对重复施用mAb以获得和维持功效的频繁需求成为物流和患者依从性方面的障碍。需要因与血清IgG竞争而降低或消除治疗性抗体体内低功效的新抗体。需要可消除病毒如EVD、登革热病毒、HIV、RSV及其它病毒的抗体依赖性增强作用的新抗体。需要双特异性抗体、双功能抗体和抗体调和来发挥一些治疗性的或预防性的作用。还需要组合疗法,可以利用本文所述的合成抗体并通过用疫苗(包括基于DNA的疫苗)免疫来免疫刺激宿主系统相结合的疗法。另外,这些抗体制剂的长期稳定性往往是短暂的并且不太理想。
因此,在本领域仍然需要能以安全且成本有效的方式递送至受试者的经优化的合成抗体分子。
发明内容
在一个实施方案中,本发明涉及一种编码结构修饰的DNA编码抗体(DMAb)的核酸序列的生成方法,所述方法包括以下步骤:鉴定第一DMAb的一个或多个CDR区;鉴定第二DMAb的一个或多个CDR区;用第一DMAb的一个或多个CDR区的氨基酸序列替代第二DMAb的一个或多个CDR区的氨基酸序列,以生成结构修饰的DMAb的氨基酸序列;和生成编码结构修饰的DMAb的核酸序列。在一个实施方案中,所述方法进一步包括:优化所述核酸序列。
在一个实施方案中,本发明涉及一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:将第一DMAb的氨基酸序列或氨基酸序列的片段与一个或多个其他DMAb序列的氨基酸序列或氨基酸序列的片段进行序列比对;用一个或多个其他DMAb序列的氨基酸序列的一个或多个氨基酸残基替代第一DMAb的氨基酸序列的一个或多个氨基酸残基,以生成结构修饰的DMAb的氨基酸序列,其中,一个或多个氨基酸残基不是CDR区的残基;和生成编码结构修饰的DMAb的核酸序列。在一个实施方案中,所述方法进一步包括:优化所述核酸序列。
在一个实施方案中,本发明涉及一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:鉴定DMAb的氨基酸残基,所述DMAb的氨基酸残基预测会参与重链的可变结构域和轻链的可变结构域的界面处的相互作用;对鉴定的氨基酸残基进行一个或多个氨基酸取代,其中一个或多个取代预测会改变界面处的等电点和表面电荷的至少之一,从而生成结构修饰的DMAb的氨基酸序列;和生成编码结构修饰的DMAb的核酸序列。在一个实施方案中,所述方法进一步包括:优化所述核酸序列。
在一个实施方案中,本发明涉及一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:从DMAb的氨基酸序列中删除CH结构域和CL结构域中的氨基酸序列;将VH结构域和VL结构域中的氨基酸序列之间的接头的氨基酸序列添加到DMAb的氨基酸序列中以生成结构修饰的DMAb的氨基酸序列;对生成的氨基酸序列进行至少一轮建模;和生成编码结构修饰的DMAb的核苷酸序列。在一个实施方案中,所述方法进一步包括:优化所述核酸序列。
在一个实施方案中,所述建模方法包括接头建模、铰链修饰建模、框架建模和CDR环优化中的至少一种。
在一个实施方案中,所述接头与VH结构域进行C末端连接,与VL结构域进行N末端连接。在一个实施方案中,所述接头与VH结构域进行N末端连接,与VL结构域进行C末端连接。
在一个实施方案中,本发明涉及一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:鉴定第一DMAb的一个或多个CDR区;鉴定第二DMAb的一个或多个CDR区;用第一DMAb的一个或多个CDR区的氨基酸序列替代第二DMAb的一个或多个CDR区的氨基酸序列,以生成结构修饰的DMAb的氨基酸序列;从DMAb的氨基酸序列中删除CH结构域和CL结构域中的氨基酸序列;将VH结构域和VL结构域中的氨基酸序列之间的接头的氨基酸序列添加到DMAb的氨基酸序列中以生成结构修饰的DMAb的氨基酸序列;对生成的氨基酸序列进行至少一轮建模;和生成编码结构修饰的DMAb的核苷酸序列。在一个实施方案中,所述方法进一步包括:优化所述核酸序列。
在一个实施方案中,本发明涉及一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:将第一DMAb的氨基酸序列或氨基酸序列的片段与一个或多个其他DMAb序列的氨基酸序列或氨基酸序列的片段进行序列比对;用一个或多个其他DMAb序列的氨基酸序列的一个或多个氨基酸残基替代第一DMAb的氨基酸序列的一个或多个氨基酸残基,以生成结构修饰的DMAb的氨基酸序列,其中,一个或多个氨基酸残基不是CDR区的残基;从DMAb的氨基酸序列中删除CH结构域和CL结构域中的氨基酸序列;将VH结构域和VL结构域中的氨基酸序列之间的接头的氨基酸序列添加到DMAb的氨基酸序列中以生成结构修饰的DMAb的氨基酸序列;对生成的氨基酸序列进行至少一轮建模;和生成编码结构修饰的DMAb的核酸序列。在一个实施方案中,所述方法进一步包括:优化所述核酸序列。
在一个实施方案中,本发明涉及一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:鉴定DMAb的氨基酸残基,所述DMAb的氨基酸残基预测会参与重链的可变结构域和轻链的可变结构域的界面处的相互作用;对鉴定的氨基酸残基进行一个或多个氨基酸取代,其中一个或多个取代预测会改变界面处的等电点和表面电荷的至少之一,从而生成结构修饰的DMAb的氨基酸序列;从DMAb的氨基酸序列中删除CH结构域和CL结构域中的氨基酸序列;将VH结构域和VL结构域中的氨基酸序列之间的接头的氨基酸序列添加到DMAb的氨基酸序列中以生成结构修饰的DMAb的氨基酸序列;对生成的氨基酸序列进行至少一轮建模;和生成编码结构修饰的DMAb的核酸序列。在一个实施方案中,所述方法进一步包括:优化所述核酸序列。
在一个实施方案中,本发明涉及由使用本发明的方法生成的核酸分子所编码的结构修饰的DMAb。
在一个实施方案中,本发明涉及一种结构修饰的DMAb,其包括来自第一DMAb的一个或多个CDR区和来自第二DMAb的一个或多个恒定区,其中,与相应的未经如此修饰的DMAb相比,结构修饰的DMAb表现出较高的体内表达和较高的结合力中的至少一种。
在一个实施方案中,与如此修饰之前的结构修饰的DMAb的特异性相比,所述结构修饰的DMAb表现出至少相同或更高的抗原结合特异性。
在一个实施方案中,本发明涉及一种结构修饰的DMAb,其包括一个或多个氨基酸取代,其中,与相应的未经如此修饰的DMAb相比,所述结构修饰的DMAb表现出较高的体内表达和较高的结合力中的至少一种。
在一个实施方案中,本发明涉及一种结构修饰的DMAb,其包括CH1、CH2、铰链、VH、接头和VL结构域,其中,与相应的未经如此修饰的DMAb相比,所述结构修饰的DMAb表现出较高的体内表达和较高的结合力中的至少一种。
在一个实施方案中,本发明涉及一种包括核酸分子的组合物,所述核酸分子包含至少一个编码结构修饰的DMAb的核苷酸序列。在一个实施方案中,至少一个结构修饰的DMAb包括选自如下的氨基酸序列:a)占编码序列全长的至少90%的如下氨基酸序列的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ IDNO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115或SEQ ID NO:119;或者b)包含至少60%的如下氨基酸序列的片段:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ IDNO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115或SEQ ID NO:119。
在一个实施方案中,核酸分子包含至少两个核苷酸序列,其中每个核苷酸序列编码一个结构修饰的DMAb。在一个实施方案中,每一个所述至少两个核苷酸序列编码一个结构修饰的DMAb,其包括选自如下的氨基酸序列:a)占编码序列全长的至少90%的如下氨基酸序列的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ IDNO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115或SEQ ID NO:119;或者b)包含至少60%的如下氨基酸序列的片段:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ IDNO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115或SEQ ID NO:119。
在一个实施方案中,核酸分子包括:编码结构修饰的DMAb的核苷酸序列,所述结构修饰的DMAb的核苷酸序列包含选自SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ IDNO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104或SEQ ID NO:106的氨基酸序列;以及编码结构修饰的DMAb的核苷酸序列,其包含氨基酸序列SEQ ID NO:108。
在一个实施方案中,本发明涉及一种治疗患有疾病或紊乱的受试者的方法,所述方法包括:向有需要的受试者施用包含核酸分子的组合物,所述核酸分子包含编码结构修饰的DMAb的核苷酸序列。
附图说明
图1(包括图1A到图1D)示出了可生成的各种结构修饰的DMAb的示例性模型。图1A示出了完整移植物DMAb的示意图。图1B示出了部分移植的示意图。模型DMAb右侧显示了与亲本DMAb(SEQ ID NO:47)相比,修饰的DMAb(SEQ ID NO:48)的FR1区和FR4区中氨基酸的多个修饰。图1C示出了支架修饰的示意图。显示了参与VH-VL界面的残基的侧链,轻链(上)和重链(下)的支架修饰(分别为SEQ ID NO:50和SEQ ID NO:52)中突出显示了修饰的残基,亲本DMAb序列是SEQ ID NO:49和SEQ ID NO:51。图1D示出了显示完整和部分DMAb框架移植的蛋白质带的图像。左上方显示了高表达DMAb的VH-VL(黄色/蓝色)。右上方显示了低表达DMAb的VH-VL(绿/红)。通过将低表达者的CDR移植到高表达者的框架上来产生左下方的新DMAb分子。右下方是通过部分移植产生的新DMAb,用高表达者的氨基酸替代低表达DMAb的VL中的前22个氨基酸。
图2(包括图2A和图2B)示出了示例性实验结果,证明了BDBV223的完整移植和部分移植的效果。图2A示出了示例性实验结果,证明了BDBV223抗体以及完整移植物和部分移植物的表达。图2B示出了示例性实验结果,证明了BDBV223抗体以及完整移植物和部分移植物的EBOV抗原结合。
图3(包括图3A和图3B)示出了示例性实验结果,证明了Z5D2的完整移植和部分移植的效果和Z5D2结构修饰的效果。图3A示出了示例性实验结果,证明了Z5D2抗体以及全部移植物和部分移植物的表达。图3B示出了示例性实验结果,证明了Z5D2抗体以及完整移植物和部分移植物的EBOV抗原结合。
图4示出了低表达DMAb(SEQ ID NO:54至SEQ ID NO:57)的多条轻链与两个经证实的高表达DMAb(SEQ ID NO:58和SEQ ID NO:59)的轻链比对。
图5示出了将完整的VL、非CDR区的VL和图5中每个亲本轻链的FR1和FR4与每个经证实的高表达DMAb进行比较的单位矩阵。
图6示出了显示全长和scFv-Fc修饰的IgG DMAb之间的结构差异的示意图。
图7(包括图7A至图7C)示出了蛋白质建模图像,表明scFv-Fc接头不干扰CDR。图7A示出了scFv-Fc抗体的预测折叠的条带图。显示出VL(红色)、VL CDR(粉红色)、VH(绿色)、VHCDR(紫色)和接头(CPK)。图7B和图7C示出了ScFv-Fc DMAb的空间填充模型的两个旋转视图。
图8(包括图8A至图8D)示出了示例性实验结果,证明DMAb BDBV223的scFv-Fc转化的效果。图8A示出了亲本DMAb和ScFv-Fc修饰的DMAb的表达水平。图8B示出了亲本DMAb和ScFv-Fc修饰的DMAb的血清表达水平。图8C示出了亲本DMAb和ScFv-Fc修饰的DMAb与源自1976年埃博拉病毒爆发株的糖蛋白抗原的抗原结合。图8D示出了亲本DMAb和ScFv-Fc修饰的DMAb与源自2014年埃博拉病毒爆发株的糖蛋白抗原的抗原结合。
图9(包括图9A至图9F)示出了示例性实验结果,证明DMAb Z5D2的scFv-Fc转化的效果。图9A示出了亲本DMAb和经ScFv-Fc修饰21天的DMAb的表达水平。图9B示出了亲本DMAb和ScFv-Fc修饰的DMAb的血清表达水平。图9C示出了亲本DMAb和ScFv-Fc修饰的DMAb与源自1976年埃博拉病毒爆发株的糖蛋白抗原的抗原结合。图9D示出了亲本DMAb和ScFv-Fc修饰的DMAb与源自2014年埃博拉病毒暴发菌株的糖蛋白抗原的抗原结合。图9E示出了亲本DMAb和经ScFv-Fc修饰35天的DMAb的表达水平。图9F示出了亲本DMAb和经ScFv-Fc修饰35天的DMAb的标准化表达水平。
图10(包括图10A至图10E)示出了示例性实验结果,证明DMAb Z1H3的scFv-Fc转化的效果。图10A示出了亲本DMAb和经ScFv-Fc修饰21天的DMAb的表达水平。图10B示出了亲本DMAb和ScFv-Fc修饰的DMAb与源自1976年埃博拉病毒爆发株的糖蛋白抗原的抗原结合。图10C示出了亲本DMAb和ScFv-Fc修饰的DMAb与源自2014年埃博拉病毒爆发株的糖蛋白抗原的抗原结合。图10D示出了亲本DMAb和经ScFv-Fc修饰35天的DMAb的表达水平。图10E示出了亲本DMAb和经ScFv-Fc修饰35天的标准化表达水平。
图11示出了ScFv-Fc建模过程中不同步骤的示例性输出。
图12示出了pGX9256的Fv、VH-VL和VL-VH建模的示例性图像。
图13示出了pGX9290的Fv、VH-VL和VL-VH建模的示例性图像。
图14示出了显示工程化的DMAb被合成为DNA质粒,然后在体外和体内评估抗原结合和表达的流程图。
图15(包括图15A至图15B)示出了示例性实验结果,其证明结构重新格式化的DMAb的中和活性。图15A示出了用于证明第1组EBOMAb-10的中和百分率的示例性实验结果。图15B示出了示例性实验结果,其证明使用了经扎伊尔型埃博拉病毒糖蛋白(EBOV-GP)假型化的慢病毒的第2组(EBOMAb-14)的中和百分率。
图16示出了第1组和第2组结构修饰的DMAb的IC50和IC90的中和活性定量。
图17(包括图17A至图17F)示出了示例性实验结果,证明第1组和第2组结构修饰的DMAb的表达和抗原结合。图17A示出了第1组DMAb的体内时间过程表达。向免疫抑制后的BALB/c小鼠肌内注射170μg编码DMAb的DNA质粒,然后进行电穿孔(IM-EP),35天后评估DMAb的血清水平。图17B示出了第1组DMAb的抗原结合的曲线。评价血清中的DMAb对埃博拉抗原的反应性。图17C示出了采用EBOV-GP假型慢病毒载体进行评估的第1组DMAb的中和曲线。图17D示出了第2组DMAb的体内时间过程表达。向免疫抑制的BALB/c小鼠肌内注射200μg编码DMAb的DNA质粒,然后进行电穿孔(IM-EP),35天后评估DMAb的血清水平。图17E示出了第2组DMAb的抗原结合的曲线。评价血清中的DMAb对埃博拉抗原的反应性。图17F示出了采用EBOV-GP假型慢病毒载体进行评估的第2组DMAb的中和曲线。
图19(包括图19A和图19B)示出了密码子优化的小鼠塞卡DMAb ZK190G1M3LALA的基因优化分析。图19A示出了每个基因优化的DMAb的表达数据。图19B示出了针对每个基因优化的DMAb的抗原结合。这些实验是在体外,即HEK293细胞中进行的。
图20(包括图20A和图20B)示出了基因优化的小鼠寨卡DMAb ZK190G1M3LALA表达和结合的体内分析。图20A示出了每种基因优化的DMAb在第7天的体内表达数据。图20B示出了针对每个基因优化的DMAb的抗原结合。
图21(包括图21A和图21B)示出了由基因优化的ZK185LALA FP2A的密码子所优化的构建体的表达分析。图21A示出了每种基因优化的DMAb在第7天的体内表达数据。图21B示出了HEK293细胞中每个基因优化的DMAb的体外表达数据。
图22(包括图22A和图22B)示出了基因优化的ZK185LALA FP2A的密码子优化的构建体的结合能力的分析。图22A示出了每种基因优化的DMAb在第7天的体内结合活性。图5B示出了HEK293细胞中每个基因优化的DMAb的体外结合活性。
图23(包括图23A和图23B)示出了密码子优化的小鼠寨卡DMAb ZK190G1M3LALA的ScFv-Fc转化的分析。图23A示出了每个ScFv-Fc DMAb的表达数据。图23B示出了每个ScFv-Fc DMAb的抗原结合。这些实验在体内进行。
图24示出了ZK185LALA FP2A密码子优化的DMAb的ScFv-Fc转化构建体的体内表达的分析。
图25示出了DMAb体内递送和蛋白质工程概述的示意图。图25A示出了使用
Figure BDA0002362567380000112
设备通过便利的电穿孔在体内递送DMAb的示意图。转染的心肌细胞表达并分泌蛋白MAb。蛋白MAb进入血液循环。图25A示出了针对scFv-Fc表达使抗RSV抗体工程化的示意图。
图26(包括图26A至图26D)示出了抗RSV DMAb的scFv-Fc表达。图26A示出了证明RSV DMAb的表达动力学的实验结果。图26B示出了证明RSV-DMAb的峰值表达的实验结果。图26C示出了证明支气管肺泡灌洗(BAL)样品中DMAb数量的实验结果。图26D示出了证明RSV-F结合的实验结果。
图27示出了证明抗RSV DMAb中和的实验结果。
图28示出了证明棉鼠中抗RSV-DMAb的实验结果。
图29(包括图29A至图29D)示出了证明人sc-Fv抗RSV在免疫活性小鼠中的峰值表达和函数性的示例性实验结果。在
Figure BDA0002362567380000113
的协助下,将200μg抗RSV dMAb的人sc-Fv递送至balb/c小鼠的腿部肌肉。图29A示出了在治疗后7天蛋白人sc-Fv达到了平均血清水平表达13200ng/ml的示例性实验结果。图29B示出了证明体内表达的人sc-Fv与RSV-F抗原结合的示例性实验结果。图29C示出了示例性实验结果,其证明经治疗的小鼠的血清表现出活的RSV-A病毒中和活性,如通过体外噬斑减少试验来证实,并且平均值为6.9log倒数中和滴度。图29D示出了示例性实验结果,其证明人sc-Fv存在于经治疗的小鼠的肺中,每μg支气管肺泡灌洗液(BAL)的总蛋白中人sc-Fv的平均浓度为1.1ng。
图30示出了示例性实验结果,其证明了人sc-Fv在棉鼠中的维持性表达。在
Figure BDA0002362567380000123
的协助下,将100μg和800μg的人sc-Fv递送至棉鼠的TA肌肉中。7天后达到血清的峰值表达(分别为226ng/ml和1353ng/ml)。
图31(包括图31A和图31B)示出了人sc-Fv在棉鼠中的峰值表达和函数性的示例性实验结果。图31A示出了由
Figure BDA0002362567380000122
辅助递送2.4mg人sc-Fv至棉鼠的腿部肌肉导致在第7天的平均血清表达为7030ng/ml的示例性实验结果。图31B示出了示例性实验结果,其证明了经治疗的棉鼠的血清在体外噬斑减少试验中被中和,结果平均值为5.4log倒数中和滴度。
图32(包括图32A至图32C)示出了将登革热和寨卡scFv-Fc结构重新格式化的分子设计和实验设计的示意图。图32A示出了所使用的设计方法的示意图。针对ScFv-Fc的人dMAb设计策略。VH和VL区通过(G4S)3接头连接并与原型人IgG1铰链和Fc融合。图32B示出了编码质粒(Z-dMAbl-sc和D-dMAbl-sc)的scFv-Fc寨卡和登革热dMAb,以及多价双向启动子构建体(Z/D-dMAbl-sc)的分子组织图。图32C示出了实验设计的流程图,将组合的或在多价盒中的各种dMAb构建体递送至每块胫骨前肌(TA)C57BL/6小鼠,然后电穿孔,在递送DNA后的第7天评估dMAb的表达和抗原结合。
图33示出了证明寨卡病毒与登革热病毒之间的交叉反应性的评估的示例性实验结果。寨卡dMAb与寨卡抗原发生特异性反应。登革热dMAb与登革热病毒1和登革热病毒2抗原发生特异性反应。将编码scFv-FC-dMAb的质粒转染到293T细胞中。转染后的第2天,将含有scFv-Fc蛋白的上清液进行抗原结合。用100μl/孔1μg/ml的寨卡或登革热抗原(登革热病毒1-4)覆盖96孔板。三分之一(1/3)连续稀释的倒数血清稀释度是在96孔板上用预先稀释的血清样品进行的。通过ELISA评估抗原结合。数据表示为平均值OD450±标准误
图34(包括图34A至图34C)示出了scFV-Fc dMAb的体外表达和抗原结合的示例性实验结果。将编码scFv-FC-dMAb的质粒转染到293T细胞中。图34A示出了证明转染后的第2天评估scFv-Fc dMAb的表达及其各自在共转染和多价Z/D-dMAbl-sc构建体中的贡献的示例性实验结果。图34B示出了证明scFv-Fc dMAb结合登革热(登革热病毒1)的能力的示例性实验结果。图34C示出了证明scFv-Fc dMAb结合寨卡抗原的能力的示例性实验结果。
图35(包括图35A至图35C)示出了证明scFv-Fc dMAb的体内表达和抗原结合的示例性实验结果。图35A示出了证明电穿孔(EP)介导的dMAb转染后第7天的scFv-Fc dMAb表达的示例性实验结果。数据显示Z-dMAbl-sc和D-dMAbl-sc的单个dMAb表达,及其各自在相同动物中以调和形式递送时或在相同动物中单独递送至两个不同的肌内部位时的贡献。数据还显示了当在单个多价质粒构建体中表达时,登革热和寨卡scFv-Fc dMAb的贡献。Z-dMAbl-sc组、D-dMAbl-sc组和Z/D-dMAbl-sc组总共递送了100μg编码质粒的dMAb,调和递送组和单独递送组递送了200μg,接着进行EP。治疗后的第7天收集血清用于定量ELISA,以评估C57BL/6小鼠中的scFv-Fc dMAb表达。图35B示出了评估各种构建体鉴定寨卡抗原的能力的ab示例性抗原结合试验。图35C示出了评估各种构建体鉴定登革热抗原能力的示例性抗原结合试验。
具体实施方式
1.定义
除非另有定义,否则本文使用的技术术语和科技术语具有与本领域普通技术人员通常理解的相同的含义。如有冲突,以本文件(包括定义)为准。下文中描述了优选的方法和材料,尽管可在本发明的实施或测试中使用与本文中描述的那些方法和材料类似或等同的方法和材料。本文中提及的所有出版物、专利申请、专利和其它参考文献以引用方式以其整体并入于此。本文中公开的材料、方法以及实施例仅仅是示例性的而非限制性的。
本文所用的术语“包含/包括”、“包括”、“具有”、“有”、“可以”、“含有”及其变形旨在为开放式的过渡短语、术语或词语,不排除其他可能的行为或结构。除非上下文另有明确说明,否则单数形式“一个(a)”、“和(and)”以及“该(the)”包括复数形式。无论是否明确地提出实现方式或要素,本公开还考虑其他实现方式“包含/包括”、“由……组成”和“基本上由……组成”。
“抗体”可指IgG、IgM、IgA、IgD或IgE类的抗体,或片段,片段或其衍生物(包括Fab、F(ab')2、Fd),和单链抗体及其衍生物。该抗体可以是从哺乳动物的血清样品中分离的抗体、多克隆抗体、亲和纯化的抗体或其混合物,抗体对所期望的表位或由其衍生的序列具有足够的结合特异性。
本文可互换使用的“抗体片段”或“抗体的片段”是指包含抗原结合位点或可变区的完整抗体的一部分。所述部分不包含完整抗体Fc区的恒定重链结构域(即CH2、CH3或CH4,具体取决于抗体同种型)。抗体片段的实例包括但不限于Fab片段、Fab'片段、Fab'-SH片段、F(ab')2片段、Fd片段、Fv片段、双功能抗体、单链Fv(scFv)分子、仅含1个轻链可变结构域的单链多肽、含有轻链可变结构域的3个CDR的单链多肽、仅含1个重链可变区的单链多肽和含有重链可变区的3个CDR的单链多肽。
“抗原”是指具有在宿主中产生免疫应答能力的蛋白质。抗原可被抗体鉴定并结合。抗原可源自体内或外部环境。
本文使用的“编码序列”或“编码核酸”可指包含编码本文所述抗体的核苷酸序列的核酸(RNA或DNA分子)。编码序列可进一步包括与调节元件可操作地连接的起始信号和终止信号,所述调节元件包括启动子和能够引导被施用核酸的个体或哺乳动物的细胞表达的聚腺苷酸化信号。编码序列可进一步包括编码信号肽的序列。
本文使用的“互补”或“互补的”可指核酸,所述核酸可意为核酸分子的核苷酸或核苷酸类似物之间的沃森-克里克(Watson-Crick)(例如,A-T/U和C-G)或胡斯坦(Hoogsteen)碱基配对。
本文使用的“恒定电流”用于定义在将电脉冲递送至组织的期间,同一组织或限定所述组织的细胞所接受或经历的电流。电脉冲从本文所述的电穿孔装置传递。由于本文所提供的电穿孔装置具有反馈元件,优选地具有瞬时反馈,因此在电脉冲的整个寿命周期内,该电流在所述组织中保持恒定的安培数。反馈元件可以在整个脉冲持续时间内测量组织(或细胞)的电阻,并使电穿孔设备改变其电能输出(例如,增加电压),从而使同一组织中的电流从一个脉冲到另一个脉冲自始至终在电脉冲过程中保持恒定(以微秒为单位)。在一些实施方案中,反馈元件包括控制器。
本文使用的“电流反馈”或“反馈”可以互换,它们意为所提供的电穿孔装置的主动响应,其包括测量电极之间的组织中的电流并相应地改变由EP装置传递的能量输出,从而使电流保持在一个恒定水平。所述恒定水平是由用户在脉冲序列或电治疗开始之前预设的。所述反馈可以通过电穿孔设备的电穿孔部件(例如,控制器)来实现,因为其中的电路能够连续地监测电极之间的组织中的电流并将所监测的电流(或组织内的电流)与预设电流进行比较,不断地调整能量输出,从而使被监控的电流保持在预设水平。因为反馈回路是模拟闭环反馈,所以它可能是瞬时的。
本文使用的“分散的电流”意为从本文所述的电穿孔装置的各种针电极阵列输送的电流的模式,其中该模式使电穿孔的组织的任何区域上与电穿孔相关的热应力的发生最小化,或优选地,使其消失。
本文使用的“电穿孔”,“电通透”或“电动增强”(“EP”)可互换使用,意指使用跨膜电场脉冲来诱导生物膜中的微观通道(孔)。它们的存在使生物分子(例如质粒、寡核苷酸、siRNA、药物、离子、水等)从细胞膜的一侧穿到另一侧。
本文使用是“内源抗体”是指在受试者中产生的抗体,所述受试者被给予有效剂量的抗原以诱导体液免疫应答。
本文所使用的“反馈机制”可以指由软件或硬件(或固件)执行的过程,该过程接收并比较所需组织的阻抗(在能量脉冲的传递之前、期间和/或之后)与当前值(最好是电流),并调整传递的能量脉冲以达到预设值。反馈机制可以由模拟闭环电路执行。
“片段”意为具有功能即可以结合所需靶标并具有与全长抗体相同的预期作用的抗体的多肽片段。无论位置1处是否有信号肽和/或蛋氨酸,除了在N和/或C末端缺少至少一个氨基酸外,抗体的片段可能与全长100%相同。片段可占特定全长抗体长度的20%或更多、25%或更多、30%或更多、35%或更多、40%或更多、45%或更多、50%或更多、55%或更多、60%或更多、65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多、或99%或更多,不包括任何添加的异源信号肽。所述片段可包括与抗体具有95%或更多、96%或更多、97%或更多、98%或更多或99%或更多相同的多肽的片段,还包括计算同一性百分比时不包括在内的N末端蛋氨酸或异源信号肽。片段可以进一步包括N末端蛋氨酸和/或信号肽,例如免疫球蛋白信号肽等,如IgE或IgG信号肽。N末端蛋氨酸和/或信号肽可以连接至抗体的片段。
无论位置1处是否有编码信号肽和/或蛋氨酸的序列,编码抗体的核酸序列的片段可以与全长100%相同,除了在5'和/或3'末端缺少至少一个核苷酸外。片段可占特定全长编码序列长度的20%或更多、25%或更多、30%或更多、35%或更多、40%或更多、45%或更多、50%或更多、55%或更多、60%或更多、65%或更多、70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多、或99%或更多,不包括任何添加的异源信号肽。所述片段可以包含编码与抗体具有95%或更多、96%或更多、97%或更多、98%或更多或99%或更多相同的多肽的片段,并且还任选地包括在计算同一性百分比时不包括在内的编码N末端蛋氨酸或异源信号肽的序列。片段可进一步包括N末端蛋氨酸和/或信号肽的编码序列,例如免疫球蛋白信号肽等,如IgE或IgG信号肽。编码N末端蛋氨酸和/或信号肽的编码序列可以连接至编码序列的片段。
本文使用的“基因构建体”是指包含编码蛋白质(如抗体)的核苷酸序列的DNA或RNA分子。编码序列包括可操作地连接至调节元件的起始信号和终止信号,所述调节元件包括启动子和能够引导施用核酸分子的个体细胞表达的聚腺苷酸化信号。如本文使用,术语“可表达形式”是指基因构建体,其包括可操作地连接至编码蛋白质的编码序列的必需调节元件,因此当存在于个体细胞中时,将表达该编码序列。
本文使用的“相同”或“同一性”在两个或多个核酸或多肽序列的语境中使用,可以表示所述序列具有在特定区域上相同的残基的特定百分比。所述百分比可以通过以下方法计算:最佳地比对两个序列;比较特定区域上的两个序列;确定两个序列中出现相同残基的位置数以产生匹配位置的数目;用匹配位置的数目除以特定区域的位置总数,并将结果乘以100即可获得序列同一性的百分比。如果两个序列的长度不同,或者匹配时产生一个或多个交错的末端,并且比较的特定区域仅包含单个序列,则单个序列的残基计入算式的分母中而不是分子中。比较DNA和RNA时,胸腺嘧啶(T)和尿嘧啶(U)可以认为是等效的。同一性可以手动操作,也可以使用计算机序列算法(例如BLAST或BLAST 2.0)操作。
当讨论反馈机制时,可以使用本文使用的“阻抗”,也可以根据欧姆定律将其转换为电流值,从而可以与预设电流进行比较。
本文使用的“免疫应答”可以意指响应于一个或多个核酸和/或肽的引入而激活宿主的免疫系统,例如哺乳动物的免疫系统。免疫应答可以是细胞应答或体液应答的形式或这两种形式。
本文使用的“核酸”或“寡核苷酸”或“多核苷酸”可以意指至少两个共价连接在一起的核苷酸。单链的描述也定义了互补链的序列。因此,核酸还涵盖所描述的单链的互补链。核酸的许多变体可与指定核酸具有相同的用途。因此,核酸也包括基本相同的核酸及其互补物。单链提供了可以在严格杂交条件下与靶序列杂交的探针。因此,核酸还包括在严格杂交条件下杂交的探针。
核酸可以是单链核酸或双链核酸,或可含有双链和单链序列的一部分。核酸可以是DNA,既有基因组又有cDNA,RNA或杂交种,其中核酸可以包含脱氧核糖和核糖核苷酸的组合,以及碱基组合,碱基包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤次黄嘌呤、异胞嘧啶和异鸟嘌呤。核酸可以通过化学合成方法或通过重组方法获得。
本文使用的“可操作地连接”意指基因的表达受控于与其空间连接的启动子。启动子可位于在其控制下的基因的5'(上游)或3'(下游)位置。启动子与基因之间的距离约等于该启动子与其在衍生该启动子的基因中控制的基因之间的距离。本领域中已知,可以在不损失启动子功能的情况下适应该距离的变化。
本文使用的“肽”、“蛋白质”或“多肽”可以意指氨基酸的连接序列,可以是天然的、合成的,或天然的或合成的修饰或组合。
本文使用的“启动子”可以意指能够在细胞中赋予、激活或增强核酸表达的合成分子或天然来源的分子。启动子可以包含一个或多个特异性转录调控序列,从而进一步增强表达和/或改变其空间表达和/或时间表达。启动子还可以包含远端的增强子或阻遏子元件,其可以位于距转录起始位点多达数千个碱基对的位置。启动子的来源包括病毒、细菌、真菌、植物、昆虫和动物。启动子可相对于发生表达的细胞、组织或器官,或相对于发生表达的发育阶段,或响应外部刺激(如生理压力、病原体、金属离子或诱导剂等)而既定地或差异性地调节基因成分的表达。启动子的代表性实例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、lac操纵子-启动子、tac启动子、SV40晚期启动子、SV40早期启动子、RSV-LTR启动子,CMV启动子、EF1α启动子、ACTA1启动子、SV40早期启动子或SV 40晚期启动子和CMV IE启动子。
本文使用的“信号肽”和“前导序列”可互换使用,并且是指可以在本文所述蛋白质的氨基末端连接的氨基酸序列。信号肽/前导序列通常指导蛋白质定位。本文使用的信号肽/前导序列优选促进蛋白质从其所产生的细胞的分泌。当从细胞分泌时,信号肽/前导序列通常从剩余的蛋白质(通常称为成熟蛋白质)中裂解出来。信号肽/前导序列连接在蛋白质的N末端。
本文使用的“严格杂交条件”可以意指第一核酸序列(例如探针)与第二核酸序列(例如靶标)杂交的条件,例如在核酸的复杂混合物中等。严格条件依赖于序列,不同情况下的严格条件也会有所不同。严格条件可选为比在界定的离子强度和pH下的特定序列的热熔点(Tm)低约5-10℃。所述Tm是平衡时(因为靶标序列过量存在,在Tm下,50%的探针在平衡状态下被占用),与靶标互补的50%的探针与靶标序列杂交的温度(在界定的离子强度、pH和核酸浓度下)。严格条件可以是盐浓度小于约1.0M钠离子浓度,例如在pH 7.0至8.3下约0.01-1.0M钠离子(或其他盐)浓度,并且短探针(例如,约10-50个核苷酸)时的温度至少约为30℃和长探针(例如,大于约50个核苷酸)时的温度至少约60℃。严格条件也可通过添加去稳定剂如甲酰胺来实现。对于选择性或特异性杂交,阳性信号至少是背景杂交的2至10倍。示例性严格杂交条件包括以下条件:50%甲酰胺、5x SSC和1%SDS、在42℃下孵育,或5xSSC、1%SDS、在65℃下孵育,在65℃下在0.2x SSC和0.1%SDS中洗涤。
本文使用的“受试者”和“患者”可互换使用,并且是指任何脊椎动物,包括但不限于:哺乳动物(例如牛、猪、骆驼、美洲驼、马、山羊、兔、绵羊、仓鼠、豚鼠、猫、狗、大鼠和小鼠、非人类灵长类动物(如猴,例如食蟹猴或恒河猴,黑猩猩等)和人类)。在一些实施方案中,受试者可以是人类或非人类。受试者或患者可能正在接受其他形式的治疗。
本文使用的“基本上互补”可以意指第一序列和第二序列的互补序列在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个核苷酸或氨基酸的区域上具有至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性,或两个序列在严格杂交条件下杂交。
本文使用的“基本上相同”可以指第一氨基酸序列和第二氨基酸序列在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、1100或更多个核苷酸或氨基酸的区域上,或者如果第一序列与第二序列的互补序列基本上互补,则为相对于核酸,是至少60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。
本文使用的“合成抗体”是指由本文所述的重组核酸序列编码并在受试者中产生的抗体。
本文使用的“治疗(treatment)”或“治疗(treating)”可以指通过预防、抑制、阻抑或完全消除疾病来保护受试者免受疾病。预防该疾病涉及在疾病发作前对受试者接种本发明的疫苗。抑制疾病涉及在诱导疾病之后但在其临床表现之前对受试者接种本发明的疫苗。抑制疾病涉及在疾病出现临床表现之后对受试者接种本发明的疫苗。
本文使用的关于核酸的“变体”是指(1)参考核苷酸序列的部分或片段;(2)参考核苷酸序列或其部分的互补序列;(3)与参考核酸或其互补序列基本上相同的核酸;(4)在严格条件下与参考核酸、其互补序列或与其基本上相同的序列进行杂交的核酸。
通过氨基酸的插入、缺失或保守取代而在氨基酸序列上不同但至少保留一种生物活性的肽或多肽相关的“变体”。变体还可以指具有与含有至少保留一种生物活性的氨基酸序列的参考蛋白质基本上相同的氨基酸序列的蛋白质。氨基酸的保守取代,即用具有相似性质(例如,亲水性、带电区域的程度和分布)的不同氨基酸替换氨基酸在本领域中通常被认为涉及微小变化。这些微小变化可以部分地通过考虑氨基酸的亲水指数来鉴定,如本领域所理解的(参见Kyte等人,J.Mol.Biol.157:105-132(1982))。氨基酸的亲水指数是基于其疏水性和电荷的考虑。本领域已知,亲水指数相似的氨基酸可以进行取代并仍保留蛋白质功能。一方面,具有±2的亲水指数的氨基酸被取代。氨基酸的亲水性也可用于呈现导致蛋白质保留生物功能的取代。在肽的背景下考虑氨基酸的亲水性允许计算该肽的最大局部平均亲水性,据报道这是与抗原性和免疫原性非常相关的有用测量。美国专利第4,554,101号通过引用以其整体并入于此。亲水性数值相似的氨基酸的取代可使肽保留生物活性,例如免疫原性,如本领域所理解的。可以使用亲水性数值在彼此的±2之内的氨基酸进行取代。氨基酸的疏水性指数和亲水性数值两者均受该氨基酸的特定侧链的影响。与上述观察结果一致,与生物功能兼容的氨基酸取代应理解为取决于氨基酸,特别是这些氨基酸的侧链的相对相似性,如由疏水性、亲水性、电荷、大小和其它特性所反映。
变体可以是在全基因序列或其片段的全长上基本相同的核酸序列。核酸序列可以是在基因序列的全长或其片段上80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。变体可以是在氨基酸序列的全长或其片段上基本相同的氨基酸序列。氨基酸序列可以是在氨基酸序列的全长或其片段上80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。
本文使用的“载体”是指含有复制起点的核酸序列。载体可以是质粒(包括纳米质粒或小环质粒)、噬菌体、细菌人工染色体或酵母人工染色体。载体可以是DNA或RNA载体。载体可以是自我复制的染色体外载体或整合到宿主染色体的载体。
对于本文引用的数值范围,明确地考虑具有相同精确度的介于其间的数字。例如,对于6至9的范围,除了6和9之外,还考虑了数字7和8;对于范围6.0至7.0,明确考虑数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9和7.0。
2.结构修饰的DMAb
本发明涉及包括结构修饰的DNA编码的合成抗体(DMAb)的组合物、包括编码结构修饰的DMAb的核酸分子的组合物、生成结构修饰的DMAb的方法,以及使用结构修饰的DMAb的方法。
在一个实施方案中,结构修饰的DMAb包含至少一种修饰以增加体内表达、抗原结合、稳定性或其组合。在一个实施方案中,增加被指定为低表达DMab的DMAb的体内表达来进行的。在一个实施方案中,至少一种修饰是通过增加DMAb的体内抗原结合进行的。
在一个实施方案中,本发明所述的用于结构修饰的候选DMAb是表现期望的体内抗原结合但低表达的DMAb。因此,生成期望的DMAb的结构修饰是为了增加该DMAb的表达,以便生成表现期望的体内抗原结合和更高表达水平的DMAb。在一个实施方案中,结构修饰的DMAb包含至少一种修饰,而且与未修饰的DMAb的表达水平相比,这种修饰增加表达。
在一个实施方案中,结构修饰的DMAb包括一种或多种修饰,其增加了未经如此修饰的相应DMAb的表达。在一个实施方案中,修饰包括但不限于完整移植、部分移植、支架修饰、ScFv-Fc转化等。然而,本发明不应限于这些类型的修饰。相反,本发明包括能够增加DMAb的体内表达或抗原结合的任何类型的修饰。在一个实施方案中,本发明涉及编码结构修饰的DMAb的核酸分子。
完整移植物
在一个实施方案中,本发明所述的结构修饰的DMAb是完整移植物DMAb。在一个实施方案中,完整移植涉及一种将编码DMAb的至少一个CDR区的序列转移到不同的DMAb的主链上的方法。例如,在一个实施方案中,完整移植包括:鉴定具有体内低表达的DMAb的至少一个CDR区;和修饰具有体内高表达水平的DMAb的至少一个CDR区,以使其具有低表达的DMAb的所述至少一个CDR序列。
在一个实施方案中,完整移植物DMAb包括DMAb,其中来自一个DMAb的可变重链的至少一个,至少两个或所有三个CDR已被修饰为与来自第二个DMAb可变重链的至少一个,至少两个或所有三个CDR相同。在一个实施方案中,完整移植物DMAb包括DMAb,其中来自一个DMAb的可变重链的至少一个,至少两个或全部三个CDR被修饰为与来自第二个DMAb可变重链的至少一个,至少两个或所有三个CDR至少80%、85%、90%、95%、96%、97%、98%或99%相同。在一个实施方案中,完整移植物DMAb包括DMAb,其中来自一个DMAb的可变轻链的至少一个,至少两个或所有三个CDR已被修饰为与来自第二个DMAb的可变轻链的至少一个,至少两个或所有三个CDR相同。
用于生成本发明所述的完整移植物DMAb的免疫球蛋白支架可以来自任何免疫球蛋白同种型。重链免疫球蛋白同种型包括但不限于IgA(包括IgA1和IgA2)、IgD、IgE、IgG(包括IgG1、IgG2、IgG3和IgG4)以及IgM。轻链免疫球蛋白同种型包括但不限于κ和λ。在一个实施方案中,用作生成完整移植物DMAb基础的DMAb是相同的免疫球蛋白同种型。在一个实施方案中,用作生成完整移植的DMAb基础的DMAb来自不同的免疫球蛋白同种型。
在一个实施方案中,与亲本DMAb相比,本发明的完整移植物DMAb具有修饰的表达、稳定性、半衰期、抗原结合、重链-轻链配对、组织渗透或其组合。
在一个实施方案中,本发明的完整移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的表达。
在一个实施方案中,本发明所述的完整移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的抗原结合。
在一个实施方案中,本发明的完整移植物DMAb具有比亲本DMAb长至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的半衰期。
在一个实施方案中,本发明的完整移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的稳定性。
在一个实施方案中,本发明的完整移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的组织渗透。
在一个实施方案中,本发明的完整移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的重链-轻链配对。
部分移植物
在一个实施方案中,本发明的结构修饰的DMAb是部分移植物DMAb。在一个实施方案中,部分移植涉及一种修饰DMAb的一个或多个FR区或其片段以包含不同的DMAb的一个或多个FR区或其片段的方法。例如,在一个实施方案中,部分移植包括修饰具有体内低表达的一个DMAb的FR区或其片段,使其类似于具有体内高表达的另一个DMAb的FR区或其片段。在一个实施方案中,改变至少一个FR区的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或大于50个残基。在一个实施方案中,改变多个FR区的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或大于50个残基。在一个实施方案中,在彼此非常接近内改变至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或大于20个残基(例如,在30个连续的残基区内改变至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或大于20个残基。)在一个实施方案中,在单个FR内(即在FR1、FR2、FR3或FR4区内)改变至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或大于20个残基。在一个实施方案中,在多个FR内(例如FR1和FR4)改变至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或大于20个残基。在一个示例性的实施方案中,在可变轻链的N-末端改变至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个残基。
作为生成本发明的部分移植物DMAb的基础的DMAb的免疫球蛋白支架可以来自任何免疫球蛋白同种型,包括但不限于IgA(包括IgA1和IgA2)、IgD、IgE、IgG(包括IgG1、IgG2、IgG3和IgG4)、IgM以及κ和λ。在一个实施方案中,作为生成部分移植物DMAb的基础的DMAb是相同的免疫球蛋白同种型。在一个实施方案中,作为生成部分移植物DMAb的基础的DMAb是不同的免疫球蛋白同种型。
在一个实施方案中,与亲本DMAb相比,本发明的部分移植物DMAb具有修饰的表达、稳定性、半衰期、抗原结合、重链-轻链配对、组织渗透或其组合。
在一个实施方案中,本发明的部分移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的表达。
在一个实施方案中,本发明的部分移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的抗原结合。
在一个实施方案中,本发明的部分移植物DMAb具有比亲本DMAb长至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的半衰期。
在一个实施方案中,本发明的部分移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的稳定性。
在一个实施方案中,本发明的部分移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的组织渗透。
在一个实施方案中,本发明的部分移植物DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的重链-轻链配对。
支架修饰
在一个实施方案中,本发明的结构修饰的DMAb是支架修饰的DMAb。在一个实施方案中,支架修饰涉及一种修饰DMAb的至少一个氨基酸残基以增加在VH-VL界面处的稳定作用或有利地改变等电点的方法。可以使用本领域已知的任何预测参与VH-VL相互作用的残基的方法(例如,采用预测VH-VL界面处所涉及的残基的生物信息学方法,如Abhinandan等人,2010,Protein Eng Des Sel,23(9):689-697中所述)来鉴定可根据本发明的方法修饰的残基。在各种实施方案中,支架修饰的DMAb包含一个或多个修饰使非芳族侧链残基改变为芳族侧链残基。在一个实施方案中,支架修饰的DMAb包含一个或多个修饰使VH-VL界面处具有带电侧链的氨基酸改变为具有不带电侧链的氨基酸(例如,赖氨酸(K)到谷氨酰胺(Q)的修饰)。在一个实施方案中,支架修饰的DMAb包含一个或多个修饰使VH-VL界面处具有不带电荷侧链的氨基酸改变为具有疏水性侧链的氨基酸(例如,Q至酪氨酸(Y)的修饰)。在一个实施方案中,支架修饰的DMAb包含一个或多个修饰以将VH-VL界面处的氨基酸改变为具有芳族侧链的氨基酸(例如,Q至酪氨酸(Y)的修饰)。在各种实施方案中,支架修饰的DMAb包含FR2或FR3区内的一个或多个修饰。
本发明的结构修饰的DMAb的免疫球蛋白支架可来自于任何免疫球蛋白同种型,包括但不限于IgA(包括IgA1和IgA2)、IgD、IgE、IgG(包括IgG1、IgG2、IgG3和IgG4)、IgM以及κ和λ。
在一个实施方案中,与亲本DMAb相比,本发明的支架修饰的DMAb具有修饰的表达、稳定性、半衰期、抗原结合、重链-轻链配对、组织渗透或其组合。
在一个实施方案中,本发明的支架修饰的DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的表达。
在一个实施方案中,本发明的支架修饰的DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的抗原结合。
在一个实施方案中,本发明的支架修饰的DMAb具有比亲本DMAb长至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的半衰期。
在一个实施方案中,本发明的支架修饰的DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的稳定性。
在一个实施方案中,本发明的支架修饰的DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的组织渗透。
在一个实施方案中,本发明的支架修饰的DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的重链-轻链配对。
单链Fv-Fc(ScFv-Fc)转化
在一个实施方案中,本发明的结构修饰的DMAb是ScFv-Fc DMAb。在一个实施方案中,ScFv-Fc转化涉及去除CH1和CL区,以及在VH和VL之间添加接头。因此,在一个实施方案中,本发明的结构修饰的DMAb包括由核酸分子编码的DMAb,所述核酸分子缺乏CH1和CL结构域的编码序列,并包括编码VH结构域的序列和编码VL结构域的序列之间的接头的编码序列。在一个实施方案中,ScFv-Fc DMAb处于VH-VL方向,其包括将VH区的C末端连接至VL区的N末端的接头。在一个实施方案中,ScFv-Fc DMAb处于VL-VH方向,其包括将VL区的C末端连接至VH区的N末端的接头。在一个实施方案中,接头包括至少10、11、12、13、14、15、16、17、18、19、20或大于20个氨基酸残基。在一个实施方案中,接头包括(G4S)3接头,其具有GGGGSGGGGSGGGGS(SEQ ID NO:53)的序列。在另一个实施方案中,接头是具有氨基酸序列GSTSGSGKPGSGEGSTKG(SEQ ID NO:109)的Whitlow接头。
本发明的ScFv-Fc DMAb的免疫球蛋白支架可来自于任何免疫球蛋白同种型,包括但不限于IgA(包括IgA1和IgA2)、IgD、IgE、IgG(包括IgG1、IgG2、IgG3和IgG4)、IgM以及κ和λ。
在一个实施方案中,与亲本DMAb相比,本发明的ScFv-Fc转化的抗体具有修饰的表达、稳定性、半衰期、抗原结合、重链-轻链配对、组织渗透或其组合。
在一个实施方案中,本发明的ScFv-Fc DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的表达。
在一个实施方案中,本发明的ScFv-Fc DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的抗原结合。
在一个实施方案中,本发明的ScFv-Fc DMAb具有比亲本DMAb长至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的半衰期。
在一个实施方案中,本发明的ScFv-Fc DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的稳定性。
在一个实施方案中,本发明的ScFv-Fc DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的组织渗透。
在一个实施方案中,本发明的ScFv-Fc DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的重链-轻链配对。
基因优化
在一个实施方案中,本发明的结构修饰的DMAb是基因优化(GO)的DMAb。在一个实施方案中,基因优化涉及一种方法,其中用多元回归算法加权影响转录和翻译的多个参数,例如密码子使用、GC含量、隐蔽剪接位点、mRNA二级结构等,以生成与亲本DMAb相比,具有修饰的表达、稳定性、半衰期、抗原结合或其组合的序列。
在一个实施方案中,本发明的基因优化的DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的表达。
在一个实施方案中,本发明的基因优化的DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的抗原结合。
在一个实施方案中,本发明的基因优化的DMAb具有比亲本DMAb长至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的半衰期。
在一个实施方案中,本发明的基因优化的DMAb具有比亲本DMAb高至少1.1倍、至少1.2倍、倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍、至少8倍、至少8.5倍、至少9倍、至少9.5倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍或大于50倍的稳定性。
编码结构修饰的DMAb的核酸分子
在一个实施方案中,本发明提供了包括编码结构修饰的DMAb的核酸分子的组合物。在各种实施方案中,核酸序列编码结构修饰的DMAb,以设计为具有比亲本DMAb更高的表达、稳定性、半衰期、抗原结合或其组合。在一个实施方案中,核酸序列编码完整移植物DMAb、部分移植物DMA、支架修饰的DMAb、基因优化的DMAb或ScFv-Fc转化的DMAb。
抗埃博拉病毒(Ebola)DMAb
在一个实施方案中,结构修饰的DMAb是抗埃博拉病毒DMAb。在一个实施方案中,编码通过完整移植而进行结构修饰的抗埃博拉病毒DMAb的核酸分子编码具有氨基酸序列SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:16或SEQ ID NO:18的DMAb。在一个实施方案中,通过完整移植而进行结构修饰的抗埃博拉病毒DMAb的核酸分子包括核苷酸序列SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:15或SEQ ID NO:17。
在一个实施方案中,编码通过部分移植而进行结构修饰的抗埃博拉病毒DMAb的核酸分子编码具有氨基酸序列SEQ ID NO:4、SEQ ID NO:14、SEQ ID NO:30或SEQ ID NO:34的DMAb。在一个实施方案中,编码通过部分移植而进行结构修饰的抗埃博拉病毒DMAb的核酸分子包括核苷酸序列SEQ ID NO:3、SEQ ID NO:13、SEQ ID NO:29或SEQ ID NO:33。
在一个实施方案中,编码通过支架修饰而进行结构修饰的抗埃博拉病毒DMAb的核酸分子编码具有氨基酸序列SEQ ID NO:2或SEQ ID NO:12的DMAb。在一个实施方案中,编码通过支架修饰而进行结构修饰的抗埃博拉病毒DMAb的核酸分子包括核苷酸序列SEQ IDNO:2或SEQ ID NO:12。
在一个实施方案中,编码ScFv-Fc修饰的抗埃博拉病毒DMAb的核酸分子编码具有氨基酸序列SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:32或SEQ ID NO:36的DMAb。在一个实施方案中,编码ScFv-Fc修饰的抗埃博拉病毒DMAb的核酸分子包括核苷酸序列SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:32或SEQ ID NO:36。
在一个实施方案中,核酸分子包括编码结构修饰的抗埃博拉病毒DMAb片段的序列。在一个实施方案中,编码结构修饰的DMAb的核酸分子的片段是编码结构修饰的DMAb的可变轻链区或可变重链区。
在一个实施方案中,编码一个或多个结构修饰的抗埃博拉病毒DMAb的核酸分子编码具有氨基酸序列的DMAb,所述氨基酸序列在编码序列的全长上可具有与氨基酸序列SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗埃博拉病毒DMAb的核酸分子包括核苷酸序列,所述核苷酸序列在核酸序列的全长上可具有与核酸序列SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,核酸分子包括编码结构修饰的抗埃博拉病毒DMAb片段的序列。在一个实施方案中,编码结构修饰的抗埃博拉病毒DMAb片段是编码结构修饰的抗埃博拉病毒DMAb的可变轻链区或可变重链区。
在一个实施方案中,编码一个或多个结构修饰的抗埃博拉病毒DMAb的核酸分子包括编码片段的核苷酸序列,所述片段包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的氨基酸序列SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ IDNO:42、SEQ ID NO:44或SEQ ID NO:46。
在一个实施方案中,编码一个或多个结构修饰的抗埃博拉病毒DMAb的核酸分子包括片段,所述片段包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸序列SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ IDNO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQID NO:45。
在一个实施方案中,编码一个或多个结构修饰的抗埃博拉病毒DMAb的核酸分子包括编码氨基酸序列的核苷酸序列,所述氨基酸序列在至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的编码序列上与氨基酸序列SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗埃博拉病毒DMAb的核酸分子包括核苷酸序列,所述核苷酸序列在至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的核酸序列上与核酸序列SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ IDNO:41、SEQ ID NO:43或SEQ ID NO:45具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗埃博拉病毒DMAb的核苷酸序列包括从编码氨基酸序列或氨基酸序列片段的一个或多个DNA序列转录的一个或多个RNA序列,所述氨基酸序列具有与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQID NO:46至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性;所述氨基酸序列的片段具有与SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性。
在一个实施方案中,编码抗埃博拉病毒DMAb的核苷酸序列包括从编码氨基酸序列或氨基酸序列片段的一个或多个DNA序列转录的一个或多个RNA序列,所述氨基酸序列如下:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46;所述氨基酸序列的片段如下:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQID NO:46。
在一个实施方案中,编码抗埃博拉病毒DMAb的核苷酸序列包括从一个或多个DNA序列或DNA序列片段转录的一个或多个RNA序列,所述DNA序列与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性;所述DNA序列的片段与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQID NO:45具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性。
在一个实施方案中,编码抗埃博拉病毒DMAb的核苷酸序列包括从一个或多个DNA序列或DNA序列片段转录的一个或多个RNA序列,所述DNA序列如下:SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ IDNO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45;所述DNA序列的片段如下:SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33,SEQ ID NO:35、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45。
本发明的组合物可以治疗、预防和/或免受与埃博拉病毒感染有关的任何疾病、紊乱或病症。在某些实施方案中,所述组合物可以治疗、预防和/或免受病毒感染。在某些实施方案中,所述组合物可以治疗、预防和/或免受与埃博拉病毒感染有关的病症。
抗寨卡(Zika)的DMAb
在一个实施方案中,结构修饰的DMAb是一种抗寨卡病毒的DMAb。
在一个实施方案中,编码基因优化的抗寨卡病毒DMAb的核酸分子编码具有氨基酸序列SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ IDNO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84或SEQID NO:86的DMAb。在一个实施方案中,编码基因优化的抗寨卡病毒DMAb的核酸分子包括核苷酸序列SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83或SEQ ID NO:85。
在一个实施方案中,编码ScFv-Fc修饰的抗寨卡病毒DMAb的核酸分子编码具有氨基酸序列SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:100、SEQID NO:102、SEQ ID NO:104或SEQ ID NO:106的DMAb。在一个实施方案中,编码ScFv-Fc修饰的DMAb的核酸分子包括核苷酸序列SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ IDNO:95、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103或SEQ ID NO:105。
在一个实施方案中,编码一个或多个结构修饰的抗寨卡病毒DMAb的核酸分子编码具有氨基酸序列的DMAb,所述氨基酸序列在编码序列的全长上与氨基酸序列SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ IDNO:100、SEQ ID NO:102、SEQ ID NO:104或SEQ ID NO:106具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗寨卡病毒DMAb的核酸分子包括核苷酸序列,所述核苷酸序列在核酸序列的全长上与核酸序列SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ IDNO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ IDNO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ IDNO:101、SEQ ID NO:103或SEQ ID NO:105具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,核酸分子包括编码结构修饰的抗寨卡病毒DMAb的片段的序列。在一个实施方案中,编码结构修饰的抗寨卡病毒DMAb的片段是编码结构修饰的抗寨卡病毒DMAb的可变轻链区或可变重链区。
在一个实施方案中,编码一个或多个结构修饰的抗寨卡病毒DMAb的核酸分子包括编码片段的核苷酸序列,所述片段包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的氨基酸序列SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ IDNO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ IDNO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQID NO:104或SEQ ID NO:106。
在一个实施方案中,编码一个或多个结构修饰的抗寨卡病毒DMAb的核酸分子包括片段,所述片段包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸序列SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103或SEQ ID NO:105。
在一个实施方案中,编码一个或多个结构修饰的抗寨卡病毒DMAb的核酸分子包括编码氨基酸序列的核苷酸序列,所述氨基酸序列在至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的编码序列上与氨基酸序列SEQ ID NO:64、SEQID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104或SEQ ID NO:106具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗寨卡病毒DMAb的核酸分子包括核苷酸序列,所述核苷酸序列在至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的核酸序列上与核酸序列SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ IDNO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ IDNO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQID NO:103或SEQ ID NO:105具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗寨卡病毒DMAb的核苷酸序列包括从编码氨基酸序列或氨基酸序列片段的一个或多个DNA序列转录的一个或多个RNA序列,所述氨基酸序列具有与SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104或SEQ ID NO:106至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性;所述氨基酸序列的片段具有与SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ IDNO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQID NO:102、SEQ ID NO:104或SEQ ID NO:106至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性。
在一个实施方案中,编码抗寨卡病毒DMAb的核苷酸序列包括从编码氨基酸序列或氨基酸序列片段的一个或多个DNA序列转录的一个或多个RNA序列,所述氨基酸序列如下:SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104或SEQ ID NO:106;所述氨基酸序列的片段如下:SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ IDNO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104或SEQ ID NO:106。
在一个实施方案中,编码抗寨卡病毒DMAb的核苷酸序列包括从一个或多个DNA序列或其DNA序列片段转录的一个或多个RNA序列,所述DNA序列与SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ IDNO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ IDNO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ IDNO:101、SEQ ID NO:103或SEQ ID NO:105具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性;所述DNA序列的片段与SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ IDNO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ IDNO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ IDNO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103或SEQ ID NO:105具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性。
在一个实施方案中,编码抗寨卡病毒DMAb的核苷酸序列包括从一个或多个DNA序列或DNA序列片段转录的一个或多个RNA序列,所述DNA序列如下:SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ IDNO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ IDNO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ IDNO:101、SEQ ID NO:103或SEQ ID NO:105;所述DNA序列的片段如下:SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ IDNO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ IDNO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ IDNO:101、SEQ ID NO:103或SEQ ID NO:105。
本发明的组合物可以治疗、预防和/或免受与寨卡病毒感染有关的任何疾病、紊乱或病症。在某些实施方案中,所述组合物可以治疗、预防和/或免受病毒感染。在某些实施方案中,所述组合物可以治疗、预防和/或免受与寨卡病毒感染有关的病症。
抗登革热病毒(DENV)的DMAb
在一个实施方案中,结构修饰的DMAb是一种抗登革热病毒的DMAb。
在一个实施方案中,编码ScFv-Fc结构修饰的抗登革热病毒DMAb的核酸分子编码具有氨基酸序列SEQ ID NO:108的DMAb。在一个实施方案中,编码ScFv-Fc结构修饰的DMAb的核酸分子包括核苷酸序列SEQ ID NO:107。
在一个实施方案中,编码一个或多个结构修饰的抗登革热病毒DMAb的核酸分子编码具有氨基酸序列的DMAb,所述氨基酸序列在编码序列的全长上与氨基酸序列SEQ ID NO:108具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗登革热病毒DMAb的核酸分子包括核苷酸序列,所述核苷酸序列在核酸序列的全长上与核酸序列SEQ ID NO:107具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,核酸分子包括编码结构修饰的抗登革热病毒DMAb的片段的序列。在一个实施方案中,编码结构修饰的抗登革热病毒DMAb的片段是编码结构修饰的抗登革热病毒DMAb的可变轻链区或可变重链区。
在一个实施方案中,编码一个或多个结构修饰的抗登革热病毒DMAb的核酸分子包括编码片段的核苷酸序列,所述片段包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的氨基酸序列SEQ ID NO:108。
在一个实施方案中,编码一个或多个结构修饰的抗登革热病毒DMAb的核酸分子包括片段,所述片段包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸序列SEQ ID NO:107。
在一个实施方案中,编码一个或多个结构修饰的抗登革热病毒DMAb的核酸分子包括编码氨基酸序列的核苷酸序列,所述氨基酸序列在至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的编码序列上与氨基酸序列SEQ ID NO:108具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗登革热病毒DMAb的核酸分子包括核苷酸序列,所述核苷酸序列在至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的核酸序列上与核酸序列SEQ ID NO:107具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗登革热病毒DMAb的核苷酸序列包括从编码氨基酸序列或氨基酸序列片段的一个或多个DNA序列转录的一个或多个RNA序列,所述氨基酸序列与SEQ ID NO:108具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性;所述氨基酸序列的片段与SEQ ID NO:108具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性。
在一个实施方案中,编码抗登革热病毒DMAb的核苷酸序列包括从编码氨基酸序列或氨基酸序列片段的一个或多个DNA序列转录的一个或多个RNA序列,所述氨基酸序列如下:SEQ ID NO:108;所述氨基酸序列的片段如下:SEQ ID NO:108。
在一个实施方案中,编码抗登革热病毒DMAb的核苷酸序列包括从一个或多个DNA序列或DNA序列片段转录的一个或多个RNA序列,所述DNA序列与SEQ ID NO:107具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性;所述DNA序列的片段与SEQ ID NO:107具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性。
在一个实施方案中,编码抗登革热病毒DMAb的核苷酸序列包括从一个或多个DNA序列或DNA序列片段转录的一个或多个RNA序列,所述DNA序列如下:SEQ ID NO:107;所述DNA序列的片段如下:SEQ ID NO:107。
本发明的组合物可以治疗、预防和/或免受与登革热病毒感染有关的任何疾病、紊乱或病症。在某些实施方案中,所述组合物可以治疗、预防和/或免受病毒感染。在某些实施方案中,所述组合物可以治疗、预防和/或免受与登革热病毒感染有关的病症。
抗呼吸道合胞病毒(RSV)的DMAb
在一个实施方案中,结构修饰的DMAb是一种抗RSV的DMAb。
在一个实施方案中,编码ScFv-Fc结构修饰的抗RSV DMAb的核酸分子编码具有氨基酸序列SEQ ID NO:113或SEQ ID NO:117的DMAb。在一个实施方案中,编码ScFv-Fc结构修饰的DMAb的核酸分子包括核苷酸序列SEQ ID NO:112或SEQ ID NO:116。
在一个实施方案中,编码基因优化的抗RSV DMAb的核酸分子编码具有氨基酸序列SEQ ID NO:111、SEQ ID NO:115或SEQ ID NO:119的DMAb。在一个实施方案中,编码基因优化的抗RSV DMAb的核酸分子包括核苷酸序列SEQ ID NO:110、SEQ ID NO:114或SEQ ID NO:118。
在一个实施方案中,编码一个或多个结构修饰的抗RSV DMAb的核酸分子编码具有氨基酸序列的DMAb,所述氨基酸序列在编码序列的全长上与氨基酸序列SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117或SEQ ID NO:119具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗RSV DMAb的核酸分子包括核苷酸序列,所述核苷酸序列在核酸序列的全长上与核酸序列SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116或SEQ ID NO:118具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,核酸分子包括编码结构修饰的抗RSV DMAb的片段的序列。在一个实施方案中,编码结构修饰的抗RSV DMAb的核酸序列片段是编码结构修饰的抗RSVDMAb的可变轻链区或可变重链区。
在一个实施方案中,编码一个或多个结构修饰的抗RSV DMAb的核酸分子包括编码片段的核苷酸序列,所述片段包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的氨基酸序列SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117或SEQ ID NO:119。
在一个实施方案中,编码一个或多个结构修饰的抗RSV DMAb的核酸分子包括片段,所述片段包括至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸序列SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116或SEQ ID NO:118。
在一个实施方案中,编码一个或多个结构修饰的抗RSV DMAb的核酸分子包括编码氨基酸序列的核苷酸序列,所述氨基酸序列在至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的编码序列上与氨基酸序列SEQ ID NO:111、SEQ IDNO:113、SEQ ID NO:115、SEQ ID NO:117或SEQ ID NO:119具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗RSV DMAb的核酸分子包括核苷酸序列,所述核苷酸序列在至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的核酸序列上与核酸序列SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116或SEQ ID NO:118具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的同一性。
在一个实施方案中,编码一个或多个结构修饰的抗RSV DMAb的核苷酸序列包括从编码氨基酸序列或氨基酸序列片段的一个或多个DNA序列转录的一个或多个RNA序列,所述氨基酸序列与SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117或SEQ IDNO:119具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性;所述氨基酸序列的片段与SEQ ID NO:111、SEQ IDNO:113、SEQ ID NO:115、SEQ ID NO:117或SEQ ID NO:119具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性。
在一个实施方案中,编码抗RSV DMAb的核苷酸序列包括从编码氨基酸序列或氨基酸序列片段的一个或多个DNA序列转录的一个或多个RNA序列,所述氨基酸序列如下:SEQID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117或SEQ ID NO:119;所述氨基酸序列的片段如下:SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117或SEQID NO:119。
在一个实施方案中,编码抗RSV DMAb的核苷酸序列包括从一个或多个DNA序列或DNA序列片段转录的一个或多个RNA序列,所述DNA序列与SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116或SEQ ID NO:118具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性;所述DNA序列的片段与SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116或SEQ ID NO:118具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性。
在一个实施方案中,编码抗RSV DMAb的核苷酸序列包括从一个或多个DNA序列或DNA序列片段转录的一个或多个RNA序列,所述DNA序列如下:SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116或SEQ ID NO:118;所述DNA序列的片段如下:SEQ IDNO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116或SEQ ID NO:118。
本发明的组合物可以治疗、预防和/或免受与RSV病毒感染有关的任何疾病、紊乱或病症。在某些实施方案中,所述组合物可以治疗、预防和/或免受病毒感染。在某些实施方案中,所述组合物可以治疗、预防和/或免受与RSV病毒感染有关的病症。
3.DNA编码的抗体
如上所述,该组合物可包括重组核酸序列。重组核酸序列可以编码结构修饰的DMAb、DMAb片段、DMAb变体或其组合。下文更详细地描述了抗体。
重组核酸序列可以是异源核酸序列。所述重组核酸序列可以包括至少一种异源核酸序列或一种或多种异源核酸序列。
重组核酸序列可以是优化的核酸序列。这种优化可以增加或改变抗体的免疫原性。优化还可以改善转录和/或翻译。优化可以包括以下一种或多种优化:低GC含量的前导序列以增加转录;mRNA稳定性和密码子优化;添加kozak序列(例如,GCC ACC)以提高翻译;添加编码信号肽的免疫球蛋白(Ig)前导序列;以及在可能的范围内消除顺式作用序列基序(即内部TATA盒)。
a.重组核酸序列构建体
所述重组核酸序列可以包括一个或多个重组核酸序列构建体。重组核酸序列构建体可以包含一个或多个组分,下面将对其进行详细描述。
所述重组核酸序列构建体可包括编码重链多肽、其片段、其变体或其组合的异源核酸序列。所述重组核酸序列构建体可包括编码轻链多肽、其片段、其变体或其组合的异源核酸序列。所述重组核酸序列构建体还可包括编码蛋白酶或肽酶裂解位点的异源核酸序列。所述重组核酸序列构建体可包括一个或多个前导序列,其中每个前导序列编码信号肽。所述重组核酸序列构建体可包括一个或多个启动子、一个或多个内含子、一个或多个转录终止区、一个或多个起始密码子、一个或多个终止密码子,和/或一个或多个聚腺苷酸化信号。所述重组核酸序列构建体还可包括一个或多个接头或标签序列。标签序列可以编码血凝素(HA)标签。
(1)重链多肽
所述重组核酸序列构建体可以包括编码重链多肽、其片段、其变体或其组合的异源核酸。重链多肽可包括可变重链(VH)区和/或至少一个恒定重链(CH)区。所述至少一个恒定重链区可以包括恒定重链区1(CH1)、恒定重链区2(CH2)和恒定重链区3(CH3)和/或铰链区。
在一些实施方案中,重链多肽可包括VH区和CH1区。在其他实施方案中,重链多肽可包括VH区、CH1区、铰链区、CH2区和CH3区。
重链多肽可包括互补决定区(“CDR”)组。CDR组可包含VH区的三个高变区。从重链多肽的N端开始,这些CDR分别由“CDR1”、“CDR2”和“CDR3”表示。重链多肽的CDR1、CDR2和CDR3可有助于抗原的结合或识别。
(2)轻链多肽
重组核酸序列构建体可包括编码轻链多肽、其片段、其变体或其组合的异源核酸序列。轻链多肽可包括可变轻链(VL)区和/或恒定轻链(CL)区。
轻链多肽可包括互补决定区(“CDR”)组。CDR组可包含VL区的三个高变区。从轻链多肽的N端开始,这些CDR分别由“CDR1”、“CDR2”和“CDR3”表示。轻链多肽的CDR1、CDR2和CDR3可有助于抗原的结合或识别。
(3)蛋白酶裂解位点
重组核酸序列构建体可包括编码蛋白酶裂解位点的异源核酸序列。蛋白酶裂解位点可以被蛋白酶或肽酶识别。蛋白酶可以是内肽酶或内切蛋白酶,例如但不限于弗林蛋白酶、弹性蛋白酶、HtrA、钙蛋白酶、胰蛋白酶、胰凝乳蛋白酶、胰蛋白酶和胃蛋白酶。蛋白酶可以是弗林蛋白酶。在其他实施方案中,蛋白酶可以是丝氨酸蛋白酶、苏氨酸蛋白酶、半胱氨酸蛋白酶、天冬氨酸蛋白酶、金属蛋白酶、谷氨酸蛋白酶或任何裂解内部肽键(即不裂解N端或C端的肽键)的蛋白酶。
蛋白酶裂解位点可以包括一个或多个促进或增加裂解效率的氨基酸序列。所述一个或多个氨基酸序列可以促进或增加离散多肽的形成效率或产生效率。所述一个或多个氨基酸序列可以包括2A肽序列。
(4)接头序列
重组核酸序列构建体可包含一个或多个接头序列。接头序列可以在空间上分离或连接本文所述的一种或多种组分。在其他实施方案中,接头序列可以编码在空间上分离或连接两个或更多个多肽的氨基酸序列。在一个实施方案中,接头序列是(G4S)n接头,包括但不限于具有氨基酸序列GGGGSGGGGSGGGGS(SEQ ID NO:53)的(G4S)3接头。在另一个实施方案中,接头是具有氨基酸序列GSTSGSGKPGSGEGSTKG(SEQ ID NO:109)的Whitlow接头。
(5)启动子
所述重组核酸序列构建体可以包括一个或多个启动子。所述一个或多个启动子可以是能够驱动基因表达和调节基因表达的任何启动子。这样的启动子是经由DNA依赖性RNA聚合酶转录所需的顺式作用序列元件。用于指导基因表达的启动子的选择取决于特定的应用。启动子距离重组核酸序列构建体的转录起点的位置与其距离自然环境中的转录起始位点的位置大约相同。然而,可以在不损失启动子功能的情况下适应该距离的变化。
启动子可以可操作地连接至编码重链多肽和/或轻链多肽的异源核酸序列。启动子可以是有效表达真核细胞的启动子。可操作地连接至编码序列的启动子可以是CMV启动子、猿病毒40(SV40)的启动子(如SV40早期启动子、SV40晚期启动子等)、小鼠乳腺肿瘤病毒(MMTV)启动子、人免疫缺陷病毒(HIV)启动子(如牛免疫缺陷病毒(BIV)长末端重复(LTR)启动子等)、莫洛尼病毒启动子、禽白血病病毒(ALV)启动子、巨细胞病毒(CMV)启动子(如CMV即刻早期启动子等)、爱泼斯坦-巴尔病毒(EBV)启动子、或劳斯肉瘤病毒(RSV)启动子。启动子也可以源自于人类基因,例如人类肌动蛋白、人类肌球蛋白、人类血红蛋白、人类肌肉肌酸、人类多角体蛋白或人类金属硫蛋白等的启动子。
启动子可以是组成型启动子或诱导型启动子,只有当宿主细胞接触某些特定的外部刺激时诱导型启动子才会启动转录。如果是多细胞生物,启动子也可以对特定的组织或器官或发育阶段具有特异性。启动子也可以是组织特异性启动子,例如天然或合成的肌肉或皮肤特异性启动子,美国专利申请公开第US20040175727号中描述了此类启动子的实例,其内容以其整体并入本文。
启动子可以与增强子缔合。增强子可位于编码序列的上游。增强子可以是人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或病毒增强子,例如来自CMV、FMDV、RSV或EBV的增强子。美国专利第5,593,972号、第5,962,428号和第WO94/016737号描述了多核苷酸功能增强,其各自内容通过引用全部并入。
(6)内含子
重组核酸序列构建体可包含一个或多个内含子。每个内含子可包括功能性剪接供体位点和功能性剪接受体位点。内含子可以包括剪接的增强子。内含子可以包括有效剪接所需的一个或多个信号。
(7)转录终止区
所述重组核酸序列构建体可包括一个或多个转录终止区。转录终止区可以在编码序列的下游以提供有效的终止。转录终止区可以从与上述启动子相同的基因中获得,或者可以从一种或多种不同的基因中获得。
(8)起始密码子
所述重组核酸序列构建体可以包括一个或多个起始密码子。起始密码子可位于编码序列的上游。起始密码子可以在编码序列的框架内。起始密码子可以与有效翻译起始点所需的一个或多个信号缔合,例如但不限于核糖体结合位点。
(9)终止密码子
所述重组核酸序列构建体可以包括一个或多个终止(termination或stop)密码子。终止密码子可以在编码序列的下游。终止密码子可与编码序列符合读框。终止密码子可以与有效翻译终止所需的一个或多个信号缔合。
(10)聚腺苷酸化信号
所述重组核酸序列构建体可以包括一个或多个聚腺苷酸化信号。聚腺苷酸化信号可以包括有效聚腺苷酸化转录物所需的一个或多个信号。聚腺苷酸化信号位于编码序列的下游。聚腺苷酸化信号可以是SV40聚腺苷酸化信号、LTR聚腺苷酸化信号、牛生长激素(bGH)聚腺苷酸化信号、人生长激素(hGH)聚腺苷酸化信号或人β-球蛋白聚腺苷酸化信号。SV40聚腺苷酸化信号可以是源自于pCEP4质粒(加利福尼亚州圣地亚哥英杰生命科技有限公司(Invitrogen))的聚腺苷酸化信号。
(11)前导序列
所述重组核酸序列构建体可包括一个或多个前导序列。前导序列可以编码信号肽。信号肽可以是免疫球蛋白(Ig)信号肽,例如但不限于IgG信号肽和IgE信号肽。
b.重组核酸序列构建体的排列
如上所述,重组核酸序列可包括一个或多个重组核酸序列构建体,其中每个重组核酸序列构建体可包括一个或多个组分。上文详细描述了一个或多个组件。当一个或多个组件包含在重组核酸序列构建体中时,所述一个或多个组件可以相对于彼此以任何顺序排列。在一些实施方案中,所述一个或多个组件可以按照如下方法在重组核酸序列构建体中排列。
(1)排列1
在一种排列中,第一重组核酸序列构建体可包括编码重链多肽的异源核酸序列,并且第二重组核酸序列构建体可包括编码轻链多肽的异源核酸序列。
可以将所述第一重组核酸序列构建体置于载体中。可以将所述第二重组核酸序列构建体置于第二或单独的载体中。下文更详细地描述了在载体中放置重组核酸序列构建体。
所述第一重组核酸序列构建体还可包括启动子、内含子、转录终止区、起始密码子、终止密码子和/或聚腺苷酸化信号。所述第一重组核酸序列构建体可进一步包括前导序列,其中前导序列位于编码重链多肽的异源核酸序列的上游(或5'位置)。因此,由前导序列编码的信号肽可以通过肽键连接至重链多肽。
所述第二重组核酸序列构建体还可包括启动子、起始密码子、终止密码子和聚腺苷酸化信号。所述第二重组核酸序列构建体可进一步包括前导序列,其中所述前导序列位于编码轻链多肽的异源核酸序列的上游(或5'位置)。因此,由前导序列编码的信号肽可以通过肽键连接至轻链多肽。
因此,排列1的一个实例可以包括编码包含VH和CH1的重链多肽的第一载体(即第一重组核酸序列构建体),以及编码包含VL和CL的轻链多肽的第二载体(即第二重组核酸序列构建体)。排列1的第二个实例可以包括编码包括VH、CH1、铰链区、CH2和CH3的重链多肽的第一载体(即第一重组核酸序列构建体),以及编码包含VL和CL的轻链多肽的第二载体(即第二重组核酸序列构建体)。
(2)排列2
在第二种排列中,重组核酸序列构建体可包括编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列。编码重链多肽的异源核酸序列可位于编码轻链多肽的异源核酸序列的上游(或5'位置)。或者,可以将编码轻链多肽的异源核酸序列置于编码重链多肽的异源核酸序列的上游(或5'位置)。
如下面将更加详细地描述,可以将重组核酸序列构建体置于载体中。
重组核酸序列构建体可包括编码蛋白酶裂解位点和/或接头序列的异源核酸序列。若编码蛋白酶裂解位点的异源核酸序列包含在重组核酸序列构建体中,则编码蛋白酶裂解位点的异源核酸序列可位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。因此,在表达时,蛋白酶裂解位点允许将重链多肽和轻链多肽分离成不同的多肽。在其他实施方案中,若接头序列包含在重组核酸序列构建体中,则接头序列可位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
所述重组核酸序列构建体还可包括启动子、内含子、转录终止区、起始密码子、终止密码子和/或聚腺苷酸化信号。所述重组核酸序列构建体可以包括一个或多个启动子。所述重组核酸序列构建体可包括两个启动子,使得一个启动子可与编码重链多肽的异源核酸序列缔合,并且另一个启动子可与编码轻链多肽的异源核酸序列缔合。在其他实施方案中,所述重组核酸序列构建体可包含一个启动子,该启动子与编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列缔合。
所述重组核酸序列构建体可进一步包括两个前导序列,其中第一前导序列位于编码重链多肽的异源核酸序列的上游(或5'位置),并且第二前导序列位于编码轻链多肽的异源核酸序列的上游(或5'位置)。因此,由第一前导序列编码的第一信号肽可以通过肽键与重链多肽连接,并且由第二前导序列编码的第二信号肽可以通过肽键与轻链多肽连接。
因此,排列2的一个实例可以包括载体(即重组核酸序列构建体),所述载体编码包含VH和CH1的重链多肽以及包含VL和CL的轻链多肽,其中接头序列位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
排列2的第二个实例可以包括载体(即重组核酸序列构建体),所述载体编码包括VH和CH1的重链多肽以及包括VL和CL的轻链多肽,其中编码蛋白酶裂解位点的异源核酸序列位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
排列2的第三个实例可以包括编码重链多肽和编码轻链多肽的载体(即重组核酸序列构建体),所述重链多肽包括VH、CH1、铰链区、CH2和CH3,所述轻链多肽包括VL和CL,其中接头序列位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
2排列的向前实例可以包括编码重链多肽和编码轻链多肽的载体(即重组核酸序列构建体),所述重链多肽包括VH、CH1、铰链区、CH2和CH3,所述轻链多肽包括VL和CL,其中编码蛋白酶裂解位点的异源核酸序列位于编码重链多肽的异源核酸序列和编码轻链多肽的异源核酸序列之间。
(3)ScFv-Fc排列
在ScFv-Fc排列中,重组核酸序列可包括编码重链多肽的VH结构域和编码轻链多肽的VL结构域的序列,进一步地,接头序列位于编码VH结构域和VL结构域的异源核酸序列之间。
ScFv-Fc排列的实例可以包括编码VH、接头、VL、铰链区、CH2和CH3的载体(即重组核酸序列构建体)。VH区和VL区可以通过接头进行N端或C端连接。
c.来自重组核酸序列构建体的表达
如上所述,重组核酸序列构建体可在一种或多种组分中包括编码重链多肽的异源核酸序列和/或编码轻链多肽的异源核酸序列。因此,重组核酸序列构建体可以促进重链多肽和/或轻链多肽的表达。
当使用如上所述的排列1时,第一重组核酸序列构建体可以促进重链多肽的表达,并且第二重组核酸序列构建体可以促进轻链多肽的表达。当使用如上所述的排列2时,重组核酸序列构建体可以促进重链多肽和轻链多肽的表达。
例如,但不限于,在细胞、生物体或哺乳动物中表达时,重链多肽和轻链多肽可组合成合成抗体。特别地,重链多肽和轻链多肽可以彼此相互作用,使得这种组合产生能够结合抗原的合成抗体。在其他实施方案中,重链多肽和轻链多肽可以彼此相互作用,由此,与未按本文所述组合而形成的抗体相比,这种组合形成的合成抗体具有更高的免疫原性。在其他实施方案中,重链多肽和轻链多肽可以彼此相互作用,使得这种组合产生的合成抗体能够引发或诱导针对抗原的免疫应答。
d.载体
上述重组核酸序列构建体可被置于一个或多个载体中。所述一个或多个载体包含复制起点。所述一个或多个载体可以是质粒、噬菌体、细菌人工染色体或酵母人工染色体。所述一个或多个载体可以是自我复制的染色体外载体,也可以是整合到宿主基因组的载体。
载体包括但不限于质粒、表达载体、重组病毒、任何形式的重组“裸DNA”载体等。“载体”包括可以感染、转染、瞬时或永久转导细胞的核酸。将认识到,载体可以是裸核酸或与蛋白质或脂质复合的核酸。载体任选地包括病毒或细菌核酸和/或蛋白质,和/或膜(例如细胞膜、病毒脂质包膜等)。载体包括但不限于DNA片段可以附着并复制的复制子(例如RNA复制子、噬菌体)。因此,载体包括但不限于RNA、自主自我复制的环状或线性DNA或RNA(例如质粒、病毒等,参见例如,美国专利第5,217,879号),并且包括表达和非表达质粒。在一些实施方案中,载体包括线性DNA、酶促DNA或合成DNA。当重组微生物或细胞培养物被形容为为“表达载体”提供寄宿时,它既包括染色体外的环状和线性DNA,也包括掺入宿主染色体的DNA。当载体由宿主细胞维持时,该载体可以在有丝分裂期间作为自主结构被细胞稳定复制,或掺入宿主的基因组内。
一个或多个载体可以是异源表达构建体,通常是用于将特定基因引入靶细胞的质粒。一旦表达载体进入细胞内部,重组核酸序列构建体编码的重链多肽和/或轻链多肽是由细胞转录和翻译机制核糖体复合物产生的。一个或多个载体可以表达大量稳定的信使RNA,并由此表达蛋白质。
(1)表达载体
一个或多个载体可以是环状质粒或线性核酸。环状质粒和线性核酸能够指导特定核苷酸序列在合适的受试者细胞中进行表达。包含重组核酸序列构建体的所述一个或多个载体可能是嵌合载体,这意味着所述重组核酸序列构建体的至少一种组分相对于至少一种其他组分是异源的。
(2)质粒
一个或多个载体可以是质粒。该质粒可用于用重组核酸序列构建体转染细胞。质粒可用于将重组核酸序列构建体引入受试者。质粒也可包括调节序列,它可能很适合在给予质粒的细胞中表达基因。
质粒还可以包括哺乳动物的复制起点,以便在染色体外维持质粒并在细胞中多次拷贝质粒。质粒可以是源自(加利福尼亚州圣地亚哥)英杰生命科技有限公司的pVAX1、pCEP4或pREP4,可以包括爱泼斯坦-巴尔病毒的复制起点和核抗原EBNA-1编码区,其可产生高拷贝数的游离型复制产物而不整合。质粒的主链可以是pAV0242。该质粒可以是复制缺陷型5型腺病毒(Ad5)质粒。
质粒可以是pSE420(加利福尼亚州圣地亚哥英杰生命科技有限公司),可用于在大肠杆菌(E.coli)中生产蛋白质。质粒也可以是pYES2(加利福尼亚州圣地亚哥英杰生命科技有限公司),可用于在酵母的酿酒酵母菌株中生产蛋白质。该质粒还可以是MAXBACTM完整杆状病毒表达系统(加利福尼亚州圣地亚哥英杰生命科技有限公司),可用于在昆虫细胞中生产蛋白质。质粒也可以是pcDNAI或pcDNA3(加利福尼亚州圣地亚哥英杰生命科技有限公司),可用于在哺乳动物细胞,例如,中国仓鼠卵巢(CHO)细胞中产生蛋白质。
(3)RNA
一个或多个载体可以是RNA分子。在一个实施方案中,RNA分子是由本文所述的DNA序列转录而来。例如,在一些实施方案中,RNA分子编码结构修饰的DMAb或其变体或其片段。在一个实施方案中,RNA分子是由编码结构修饰的DMAb或其变体或其片段的DNA分子产生的转录物。因此,在一个实施方案中,本发明提供了编码一个或多个DMAb的RNA分子。RNA可以是正链RNA。因此,在一些实施方案中,RNA分子可以被细胞翻译,而不需要任何中间的复制步骤,例如反转录。可用于本发明的RNA分子可以具有5'帽(例如7-甲基鸟苷),该帽可以增强RNA的体内翻译。可用于本发明的RNA分子的5'核苷酸可以具有5'三磷酸基团,在加帽的RNA中,它可以通过5'-至-5'桥与7-甲基鸟苷连接。RNA分子可以具有3'聚-A尾,也可以在其3'末端附近包含聚-A聚合酶识别序列(例如AAUAAA)。可用于本发明的RNA分子可以是单链RNA。可用于本发明的RNA分子可以包括合成RNA。
(4)环状和线性载体
一个或多个载体可以是环状质粒,环状质粒可通过整合到细胞基因组中而转化成靶细胞或存在于染色体外(例如,具有复制起点的自主复制质粒)。载体可以是pVAX、pcDNA3.0或provax,或能够表达由重组核酸序列构建体编码的重链多肽和/或轻链多肽的任何其他表达载体。
本文还提供了线性核酸或线性表达盒(“LEC”),它能够通过电穿孔而被有效地递送至受试者并表达由重组核酸序列构建体编码的重链多肽和/或轻链多肽。LEC可以是没有任何磷酸骨架的任何线性DNA。LEC可能不包含任何抗生素抗性基因和/或磷酸骨架。LEC可能不包含与所需基因表达无关的其他核酸序列。
LEC可源自能够被线性化的任何质粒。质粒或许能表达由重组核酸序列构建体编码的重链多肽和/或轻链多肽。质粒可以是pNP(波多黎各/34)或pM2(新喀里多尼亚/99)。质粒可以是WLV009、pVAX、pcDNA3.0或provax,或能够表达由重组核酸序列构建体编码的重链多肽和/或轻链多肽的任何其他表达载体。
LEC可以是pcrM2。LEC可以是pcrNP。pcrNP和pcrMR可以分别源自于pNP(波多黎各/34)和pM2(新喀里多尼亚/99)。
(5)双向表达载体
一个或多个载体可以是双向表达载体。双向载体可设计成表达目的蛋白或多肽和报告蛋白,或者可替代地表达来自单个启动子的两种目的蛋白或多肽。该表达可以由组成型活性的双向人巨细胞病毒启动子(PminCMV)驱动。在一个实施方案中,第一目的多肽是DMAb,第二目的多肽是抗原。在一个实施方案中,第一目的多肽是第一DMAb,第二目的多肽是第二DMAb。在一个实施方案中,第一DMAb和第二DMAb中的一个或多个可以是结构修改的DMAb。第二DMAb可与第一DMAb靶向相同的抗原,与第一DMAb靶向同种病毒的不同抗原或不同病毒的抗原。例如,在一个实施方案中,本发明提供了编码抗寨卡病毒结构修饰的DMAb和抗登革热病毒结构修饰的DMAb的组合的多价双向表达载体。在一个实施方案中,双向表达载体包括编码结构修饰的DMAb的核苷酸序列,所述结构修饰的DMAb包括选自SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ IDNO:100、SEQ ID NO:102、SEQ ID NO:104或SEQ ID NO:106的氨基酸序列;以及编码结构修饰的DMAb的核苷酸序列,所述结构修饰的DMAb包括氨基酸序列SEQ ID NO:108。
(6)病毒载体
本文提供了能够将本发明的核酸递送至细胞的病毒载体。表达载体可以病毒载体的形式提供给细胞。病毒载体技术是本领域众所周知的技术,并且被公开,例如Sambrook等人(2001)和Ausubel等人(1997)以及其他病毒学和分子生物学手册。可用作载体的病毒包括但不限于逆转录病毒、腺病毒、腺伴随病毒、疱疹病毒和慢病毒。通常,合适的载体包含在至少一种生物体中起作用的复制起点、启动子序列、合适的限制性核酸内切酶酶切位点和一种或多种选择性标记。(参见,例如,WO01/96584;WO 01/29058;和美国专利第6,326,193号。病毒载体,尤其是逆转录病毒载体,已成为一种将基因导入哺乳动物(例如人细胞)的使用最广泛的方法。病毒载体可以衍生自慢病毒、痘病毒、单纯疱疹病毒I、腺病毒和腺伴随病毒等(参见,例如,美国专利第5,350,674号和第5,585,362号。
(7)载体的制备方法
本文提供了一种制备一个或多个载体的方法,其中所述一个或多个载体中已放置重组核酸序列构建体。在最后的亚克隆步骤之后,可以使用本领域已知的方法将载体用于在大规模发酵罐中接种细胞培养物。
在其他实施方案中,在最后的亚克隆步骤之后,可以将载体与一个或多个电穿孔(EP)装置一起使用。下文更详细地描述了EP装置。
可以使用已知装置和技术的组合来配制或制造一个或多个载体,但是优选地,使用在2008年12月4日公开的WO/2008/148010中描述的质粒制造技术来制造载体。在一些实例中,本文所述的DNA质粒可以按照大于或等于10mg/mL的浓度进行配制。除了在美国序列第60/939792号中描述的设备和协议(包括于2007年7月3日发布的许可专利——美国专利第7,238,522号中描述的设备和协议)之外,载体的制造技术还包括或结合了本领域普通技术人员通常已知的各种设备和协议。以上参考的申请和专利分别为美国序列第60/939,792号和美国专利第7,238,522号,在此以其整体并入。
4.抗体
如上所述,重组核酸序列可以编码结构修饰的DMAb、DMAb片段、DMAb变体或其组合。结构修饰的DMAb可以结合抗原或与抗原反应,下面将对此进行更详细的描述。
结构修饰的DMAb可包括分别插入重链和轻链框架(“FR”)组之间的重链和轻链互补决定区(“CDR”)组,所述FR组为CDR提供支持并限定CDR相对于彼此的空间关系。CDR组可包含重链或轻链V区的三个高变区。从重链或轻链的N端开始,这些区分别表示为“CDR1”、“CDR2”和“CDR3”。因此,抗原结合位点可以包括六个CDR,即来自每一个重链和轻链V区中的CDR组。
蛋白水解酶木瓜蛋白酶优先裂解IgG分子以产生几个片段,其中两个片段(F(ab)片段)各包含一个具有完整抗原结合位点的共价异二聚体。胃蛋白酶能够裂解IgG分子以提供几个片段,包括F(ab’)2片段,该片段包含两个抗原结合位点。因此,抗体可以是Fab或F(ab’)2。Fab可以包括重链多肽和轻链多肽。Fab的重链多肽可包括VH区和CH1区。Fab的轻链可包括VL区和CL区。
结构修饰的DMAb可以是免疫球蛋白(Ig)。例如,Ig可以是IgA、IgM、IgD、IgE和IgG。免疫球蛋白可包括重链多肽和轻链多肽。免疫球蛋白的重链多肽可以包括VH区、CH1区、铰链区、CH2区和CH3区。免疫球蛋白的轻链多肽可包括VL区和CL区。
结构修饰的DMAb可能分别缺少重链和轻链的CH1和CL区。在这样的实施方案中,结构修饰的DMAb可以是单链DMAb,并且包含柔性氨基酸接头序列,该柔性氨基酸接头序列用于将VL区束缚到VH区。结构修饰的DMAb可包含单链,所述单链包括VL区、接头、VH区、铰链区、CH2区和CH3区。VH区和VL区可通过接头进行N端或C端连接。
结构修饰的DMAb可以是多克隆抗体或单克隆抗体。抗体可以是嵌合抗体、单链抗体、亲和力成熟的抗体、人抗体、人源化抗体或完全人抗体。人源化抗体可源自于非人类物种的抗体,所述抗体结合具有一个或多个非人类物种的互补决定区(CDR)和人类免疫球蛋白分子的框架区的所需抗原。
结构修饰的DMAb可以是IgG1抗体、IgG2抗体、IgG3抗体、IgG4抗体、IgA1抗体、IgA2抗体、IgD抗体、IgE抗体或IgM抗体。结构修饰的DMAb可以是IgG1抗体、IgG2抗体、IgG3抗体、IgG4抗体、IgA1抗体、IgA2抗体、IgD抗体、IgE抗体或IgM抗体中的任意一种的嵌合体。在一些实施方案中,抗体铰链结构域被修饰。例如,在一个实施方案中,结构修饰的DMAb在铰链结构域中包括丝氨酸到脯氨酸的氨基酸取代。
结构修饰的DMAb可以是双特异性抗体,这在下文有更详细的描述。该抗体可以是双功能抗体,这在下文也有更详细的描述。
如上所述,当将组合物给予受试者时,所述受试者就会产生抗体。受试者体内的抗体具有半衰期。在一些实施方案中,可以修饰抗体以延长或缩短其在受试者体内的半衰期,下文将更详细地描述这种修饰。
抗体可以被去岩藻糖基化,这在下文有更详细的描述。
抗体可以被修饰以减少或预防与抗原相关的疾病的抗体依赖性增强(ADE),这在下文有更详细的描述。
a.双特异性抗体
重组核酸序列可以编码双特异性结构修饰的DMAb、DMAb片段、DMAb变体或其组合。双特异性抗体可与两种抗原结合或与之反应,例如,下面更详细描述的两种抗原。双特异性抗体可以由本文所述的两种抗体的片段组成,从而允许双特异性抗体与两个所需的靶分子结合或反应,所述靶分子可以包括抗原(其在下文中有更详细的描述)、配体(包括受体的配体)、受体(包括受体上的配体结合位点)、配体-受体复合物以及标志物(包括癌症标志物)。
本发明提供了新的双特异性抗体,其包括与第一靶标特异性结合的第一抗原结合位点和与第二靶标特异性结合的第二抗原结合位点,所述双特异性抗体具有特别有利的性质,例如可生产性、稳定性、结合亲和力、生物学活性、特异性靶向某些T细胞、靶向效率、降低的毒性等。在一些情况下,存在双特异性抗体,其中双特异性抗体以高亲和力结合至第一靶标并且以低亲和力结合至第二靶标。在其他情况下,存在双特异性抗体,其中双特异性抗体以低亲和力结合至第一靶标并以高亲和力结合至第二靶标。在其他情况下,存在双特异性抗体,其中双特异性抗体以期望的亲和力结合至第一靶标并且以期望的亲和力结合至第二靶标。
在一个实施方案中,双特异性抗体是二价抗体,其包括:a)与第一抗原特异性结合的抗体的第一轻链和第一重链,和b)与第二抗原特异性结合的抗体的第二轻链和第二重链。
本发明所述的双特异性抗体分子可具有任何所需特异性的两个结合位点。在一些实施方案中,本发明所述的抗体分子的其中一个结合位点能够结合T细胞特异性受体分子和/或自然杀伤细胞(NK细胞)特异性受体分子。T细胞特异性受体是所谓的“T细胞受体”(TCR),它允许T细胞与另一种被称为抗原呈递细胞或APC的细胞所呈递的表位/抗原结合,并且在出现其他信号的情况下被所述表位/抗原激活并响应所述表位/抗原。已知T细胞受体类似于天然存在的免疫球蛋白的Fab片段。它通常是单价的,包括α链和β链;在一些实施方案中,它包含γ链和δ链(同上)。因此,在一些实施方案中,TCR是TCR(α/β);在一些实施方案中,TCR是TCR(γ/δ)。T细胞受体与CD3 T细胞共受体形成复合物。CD3是一种蛋白质复合物,由四个不同的链组成。在哺乳动物中,复合物包含一条CD3γ链、一条CD36链和两条CD3E链。这些链与被称为T细胞受体(TCR)的分子和ζ链缔合,从而在T淋巴细胞中产生激活信号。因此,在一些实施方案中,T细胞特异性受体是CD3 T细胞共受体。在一些实施方案中,T细胞特异性受体是CD28,CD28是一种也在T细胞上表达的蛋白。CD28可以提供共刺激信号,这是激活T细胞所必需的。CD28在T细胞增殖和存活、细胞因子产生以及T型辅助2型发育中起重要作用。而T细胞特异性受体的另一个实例是CD134,也称为Ox40。CD134/OX40在激活后24至72小时后表达,可用于定义次级共刺激分子。T细胞受体的另一个实例是能够结合抗原呈递细胞(APC)上的4-1BB配体的4-1BB,从而产生针对T细胞的共刺激信号。主要存在于T细胞上的受体的又一个实例是CD5,它也少量地存在于B细胞。受体修饰T细胞功能的另一个实例是CD95,也称为Fas受体,它通过在其他细胞表面表达的Fas-配体介导凋亡信号。据报道,CD95可调节静息T淋巴细胞中TCR/CD3驱动的信号通道。
NK细胞特异性受体分子的一个实例是CD16,一种低亲和力的Fc受体,和NKG2D。存在于T细胞和自然杀伤(NK)细胞表面的受体分子的一个实例是CD2和CD2-超家族的其他成员。CD2能够充当T细胞和NK细胞的共刺激分子。
在一些实施方案中,抗体分子的第一结合位点结合靶抗原,而第二结合位点结合T细胞特异性受体分子和/或自然杀伤(NK)细胞特异性受体分子。
在一些实施方案中,抗体分子的第一结合位点结合靶抗原,所述靶抗原包括但不限于病毒抗原(例如,埃博拉病毒GP聚糖帽、埃博拉病毒GP融合环或埃博拉病毒GP圣杯碱基)或自体抗原(例如,肿瘤抗原),并且第二结合位点结合T细胞特异性受体分子和/或自然杀伤(NK)细胞特异性受体分子。在一些实施方案中,抗体分子的第一结合位点结合靶抗原,并且第二结合位点结合CD3、T细胞受体(TCR)、CD28、CD16、NKG2D、Ox40、4-1BB、CD2、CD5和CD95之一。
在一些实施方案中,抗体分子的第一结合位点结合T细胞特异性受体分子和/或自然杀伤(NK)细胞特异性受体分子,并且第二结合位点结合靶抗原,所述靶抗原包括但不限于病毒抗原(例如,埃博拉病毒GP聚糖帽、埃博拉病毒GP融合环或埃博拉病毒GP圣杯碱基)和自体抗原(例如肿瘤抗原)。在一些实施方案中,抗体的第一结合位点结合T细胞特异性受体分子和/或自然杀伤(NK)细胞特异性受体分子,并且第二结合位点结合靶抗原。在一些实施方案中,抗体的第一结合位点结合CD3、T细胞受体(TCR)、CD28、CD16、NKG2D、Ox40、4-IBB、CD2、CD5和CD95之一,并且第二结合位点结合靶抗原。
b.双功能抗体
重组核酸序列可以编码双功能结构修饰的DMAb、DMAb片段、DMAb变体或其组合。双功能抗体可以与下文所述的抗原结合或反应。双功能抗体也可以被修饰以赋予抗体除了识别抗原和结合抗原之外的其他功能。这种修饰可以包括但不限于与因子H或其片段的偶联。因子H是补体激活的可溶性调节剂,因此可通过补体介导的裂解(CML)促进免疫反应。
c.延长抗体的半衰期
如上所述,可以修饰结构修饰的DMAb以延长或缩短抗体在受试者中的半衰期。该修饰可以延长或缩短抗体在受试者血清中的半衰期。
所述修饰可发生在抗体的恒定区。所述修饰可以是与不包含一个或多个氨基酸取代的抗体的半衰期相比,延长了抗体半衰期的抗体的恒定区的一个或多个氨基酸取代。所述修饰可以是与不包含一个或多个氨基酸取代的抗体的半衰期相比,延长了抗体半衰期的抗体的CH2结构域中的一个或多个氨基酸取代。
在一些实施方案中,所述恒定区的一个或多个氨基酸取代可包括用酪氨酸残基替代恒定区的蛋氨酸残基,用苏氨酸残基替代恒定区的丝氨酸残基,用谷氨酸残基替代恒定区的苏氨酸残基,或其任意组合,从而延长抗体的半衰期。
在其他实施方案中,所述恒定区的一个或多个氨基酸取代可包括用酪氨酸残基替代CH2结构域中的蛋氨酸残基,用苏氨酸残基替代CH2结构域中的丝氨酸残基,用谷氨酸残基替代CH2结构域中的苏氨酸残,或其任意组合,从而延长抗体的半衰期。
d.去岩藻糖基化
重组核酸序列可以编码未被岩藻糖基化的结构修饰的DMAb(即去岩藻糖基化的抗体或非岩藻糖基化的抗体)、DMAb片段、DMAb变体或其组合。岩藻糖基化包括将糖岩藻糖添加至分子,例如,将岩藻糖连接至N-聚糖、O-聚糖和糖脂。因此,在去岩藻糖基化抗体中,岩藻糖未连接至恒定区的碳水化合物链。反过来,与岩藻糖基化的抗体相比,这种缺乏岩藻糖基化的现象可改善FcγRIIIa的结合和抗体导向性细胞介导的细胞毒性(ADCC)活性。因此,在一些实施方案中,与岩藻糖基化抗体相比,非岩藻糖基化抗体可表现出增加的ADCC活性。
可对结构修饰的DMAb进行修饰,以防止或抑制抗体的岩藻糖基化。在一些实施方案中,与未修饰的抗体相比,这种修饰的抗体可表现出增加的ADCC活性。所述修饰可发生在重链、轻链或其组合中。所述修饰可以是重链的一个或多个氨基酸取代、轻链的一个或多个氨基酸取代,或其组合。
e.降低ADE响应
可对结构修饰的DMAb进行修饰,以减少或预防与抗原有关的疾病的抗体依赖性增强(ADE),但仍然中和抗原。例如,可以修饰抗体以减少或预防与登革热病毒有关的疾病的ADE,这将在下面更详细地描述,但仍然中和登革热病毒。
在一些实施方案中,可以修饰抗体以包括减少或预防抗体与FcyRla结合的一个或多个氨基酸取代。所述一个或多个氨基酸取代可存在于抗体的恒定区。所述一个或多个氨基酸取代可包括:在抗体的恒定区中用丙氨酸残基替代亮氨酸残基,即在本文中也称为LA、LA突变或LA取代。所述一个或多个氨基酸取代可包括:在抗体的恒定区中取代两个亮氨酸残基,每个亮氨酸残基均被丙氨酸残基取代,并且在本文中也称为LALA、LALA突变或LALA取代。由于LALA取代的存在可能会预防或阻止抗体与FcyRla结合,因此,修饰的抗体不会增强或引起与抗原相关的疾病的ADE,但修饰的抗体仍会中和抗原。
5.抗原
本发明的结构修饰的DMAb针对抗原或其片段或其变体。抗原可以是核酸序列、氨基酸序列、多糖或其组合。核酸序列可以是DNA、RNA、cDNA、其变体、其片段或其组合。氨基酸序列可以是蛋白质、肽、其变体、其片段或其组合。多糖可以是核酸编码的多糖。
在一个实施方案中,本发明的合成抗体靶向两种或多种抗原。在一个实施方案中,双特异性抗体的至少一种抗原选自本文所述的抗原。在一个实施方案中,两种或多种抗原选自本文所述的抗原。
抗原可源自于多种有机物,例如病毒、寄生虫、细菌、真菌或哺乳动物。抗原可以与自身免疫性疾病、过敏或哮喘缔合。在其他实施方案中,抗原可以与癌症、疱疹、流行性感冒、乙型肝炎、丙型肝炎、人乳头瘤病毒(HPV)或人免疫缺陷病毒(HIV)缔合。
在一些实施方案中,抗原是外源抗原。在一些实施方案中,抗原是自体抗原。
a.外源抗原
在一些实施方案中,抗原是外源抗原。外源抗原是任何非己物质(即起源于受试者外部),当被引入体内时,能够刺激免疫反应。
(1)病毒抗原
外源抗原可以是病毒抗原或其片段或其变体。病毒抗原可以是来自以下家族之一的病毒:腺病毒科、沙粒病毒科、布尼亚病毒科、杯状病毒科、冠状病毒科、丝状病毒科、肝脱氧核糖核酸病毒科、疱疹病毒科、正粘病毒科、乳多空病毒科、副粘病毒科、细小病毒科、微小核糖核酸病毒科、痘病毒科、多瘤病毒科、呼肠病毒科、逆转录病毒科、弹状病毒科或披膜病毒科。病毒抗原可源自于人免疫缺陷病毒(HIV)、基孔肯雅病毒(CHIKV)、登革热病毒、乳头瘤病毒(例如人乳头瘤病毒(HPV))、脊髓灰质炎病毒、肝炎病毒(例如甲型肝炎病毒(HAV))、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)和戊型肝炎病毒(HEV)、天花病毒(大天花病毒和小天花病毒)、牛痘病毒、流感病毒、鼻病毒、马脑炎病毒、风疹病毒、黄热病病毒、诺沃克病毒、甲型肝炎病毒、人T细胞白血病病毒(HTLV-I)、毛细胞白血病病毒(HTLV-II)、加利福尼亚脑炎病毒、汉坦病毒(出血热)、狂犬病病毒、埃博拉热病毒、马尔堡病毒、麻疹病毒、腮腺炎病毒、呼吸道合胞病毒(RSV)、单纯性疱疹1(口腔疱疹)、单纯性疱疹2(生殖器疱疹)、带状疱疹(水痘-带状疱疹,又名水痘)、巨细胞病毒(CMV)(例如人巨细胞病毒)、爱泼斯坦-巴尔病毒(EBV)、黄病毒、口蹄疫病毒、拉沙病毒、沙粒病毒、默克尔细胞多瘤病毒(MCV)或致癌病毒。
(a)人类免疫缺陷病毒(HIV)抗原
病毒抗原可源自于人免疫缺陷病毒(HIV)病毒。在一些实施方案中,HIV抗原可以是A亚型包膜蛋白、B亚型包膜蛋白、C亚型包膜蛋白、D亚型包膜蛋白、B亚型Nef-Rev蛋白、Gag A、B、C或D亚型蛋白、MPol蛋白、或Env A、Env B、Env C、Env D、B Nef-Rev、Gag或其任意组合的核酸或氨基酸序列。
(b)基孔肯雅病毒
病毒抗原可源自于基孔肯雅病毒。基孔肯雅病毒属于披膜病毒科家族的甲病毒属。基孔肯雅病毒是通过被蚊子(例如伊蚊属)叮咬而传播给人类的。
(c)登革热病毒
病毒抗原可源自于登革热病毒。登革热病毒抗原可以是形成病毒颗粒的三种蛋白质或多肽(C、prM和E)之一。登革热病毒抗原可以是与病毒复制有关的七种其他蛋白质或多肽(NS1、NS2a、NS2b、NS3、NS4a、NS4b、NS5)之一。登革热病毒可以是该病毒的五种毒株或血清型之一,包括登革热病毒-1、登革热病毒-2、登革热病毒-3和登革热病毒-4。抗原可以是多种登革热病毒抗原的任何组合。
对登革热病毒具有特异性的示例性结构修饰的DMAb包括但不限于SEQ ID NO:107中列出的结构修饰的DMAb,其编码SEQ ID NO:108。
(d)肝炎抗原
病毒抗原可包括肝炎病毒抗原(即肝炎抗原)或其片段或其变体。肝炎抗原可以是来自甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)和/或戊型肝炎病毒(HEV)中的一种或多种的抗原或免疫原。
肝炎抗原可以是来自HAV的抗原。肝炎抗原可以是HAV衣壳蛋白、HAV非结构蛋白、其片段、其变体或其组合。
肝炎抗原可以是来自HCV的抗原。肝炎抗原可以是HCV核衣壳蛋白(即核心蛋白)、HCV包膜蛋白(例如E1和E2)、HCV非结构蛋白(例如NS1、NS2、NS3、NS4a、NS4b、NS5a和NS5b)、其片段、其变体或其组合。
肝炎抗原可以是来自HDV的抗原。肝炎抗原可以是HDVδ抗原,其片段或其变体。
肝炎抗原可以是来自HEV的抗原。肝炎抗原可以是HEV衣壳蛋白、其片段或其变体。
肝炎抗原可以是来自HBV的抗原。肝炎抗原可以是HBV核心蛋白、HBV表面蛋白、HBVDNA聚合酶、由基因X编码的HBV蛋白、其片段、其变体或其组合。肝炎抗原可以是A基因型HBV核心蛋白、B基因型HBV核心蛋白、C基因型HBV核心蛋白、D基因型HBV核心蛋白、E基因型HBV核心蛋白、F基因型HBV核心蛋白、G基因型HBV核心蛋白、H基因型HBV核心蛋白、A基因型HBV表面蛋白、B基因型HBV表面蛋白、C基因型HBV表面蛋白、D基因型HBV表面蛋白、E基因型HBV表面蛋白、F基因型HBV表面蛋白、G基因型HBV表面蛋白、H基因型HBV表面蛋白、其片段、其变体或其组合。
在一些实施方案中,肝炎抗原可以是来自HBV基因型A、HBV基因型B、HBV基因型C、HBV基因型D、HBV基因型E、HBV基因型F、HBV基因型G或HBV基因型H的抗原。
(e)人乳头瘤病毒(HPV)抗原
病毒抗原可包含源自HPV的抗原。HPV抗原可源自于引起宫颈癌、直肠癌和/或其他癌症的HPV 16型、18型、31型、33型、35型、45型、52型和58型。HPV抗原可源自于HPV 6型和11型,它们会引起生殖器疣并且已知是头颈癌的病因。
HPV抗原可以是每种HPV型的HPV E6或E7结构域。例如,对于HPV 16型(HPV16),HPV16抗原可包括HPV 16E6抗原、HPV 16E7抗原、其片段、其变体或其组合。类似地,HPV抗原可以是HPV 6E6和/或E7、HPV 11E6和/或E7、HPV 18E6和/或E7、HPV 31E6和/或E7、HPV 33E6和/或E7、HPV 52E6和/或E7、或HPV 58E6和/或E7、其片段、其变体或其组合。
(f)RSV抗原
病毒抗原可包含RSV抗原。RSV抗原可以是人RSV融合蛋白(本文也称为“RSV F”、“RSV F蛋白”和“F蛋白”)或其片段或变体。人RSV融合蛋白可以在RSV A和B亚型之间保守。RSV抗原可以是源自RSV Long菌株(基因库AAX23994.1)的RSV F蛋白或其片段或变体。RSV抗原可以是源自RSV A2菌株(基因库AAB59858.1)的RSV F蛋白或其片段或变体。RSV抗原可以是RSV F蛋白的单体、二聚体或三聚体或其片段或变体。
RSV F蛋白可以是融合前形式或融合后形式。RSV F的融合后形式在免疫动物中引起高滴度的中和抗体并保护动物免受RSV攻击。
RSV抗原还可以是人RSV附着糖蛋白(在本文中也称为“RSV G”、“RSV G蛋白”和“G蛋白”)或其片段或变体。人RSV G蛋白在RSV A亚型和B亚型之间有所不同。抗原可以是RSVLong菌株(基因库AAX23993)的RSV G蛋白或其片段或变体。RSV抗原可以是源自于RSV B亚型分离株H5601、RSV B亚型分离株H1068、RSV B亚型分离株H5598、RSV B亚型分离株H1123或其片段或变体的RSV G蛋白。
在其他实施方案中,RSV抗原可以是人RSV非结构蛋白1(“NS1蛋白”)或其片段或变体。例如,RSV抗原可以是源自RSV Long菌株(基因库AAX23987.1)的RSV NS1蛋白或其片段或变体。RSV抗原人也可以是RSV非结构蛋白2(“NS2蛋白”)或其片段或变体。例如,RSV抗原可以是来自RSV Long菌株(基因库AAX23988.1)的RSV NS2蛋白或其片段或变体。RSV抗原还可以是人RSV核衣壳(“N”)蛋白或其片段或变体。例如,RSV抗原可以是源自RSV Long菌株(基因库AAX23989.1)的RSV N蛋白或其片段或变体。RSV抗原可以是人RSV磷酸蛋白(“P”)蛋白或其片段或变体。例如,RSV抗原可以是源自RSV Long菌株(基因库AAX23990.1)的RSV P蛋白或其片段或变体。RSV抗原也可以是人RSV基质蛋白(“M”)蛋白或其片段或变体。例如,RSV抗原可以是源自RSV Long菌株(基因库AAX23991.1)的RSV M蛋白或其片段或变体。
在其他实施方案中,RSV抗原可以是人RSV小疏水(“SH”)蛋白或其片段或变体。例如,RSV抗原可以是源自RSV Long菌株(基因库AAX23992.1)的RSV SH蛋白或其片段或变体。RSV抗原也可以是人RSV基质蛋白2-1(“M2-1”)蛋白或其片段或变体。例如,RSV抗原可以是源自RSV Long菌株(基因库AAX23995.1)的RSV M2-1蛋白或其片段或变体。RSV抗原可以进一步是人RSV基质蛋白2-2(“M2-2”)蛋白或其片段或变体。例如,RSV抗原可以是源自RSVLong菌株(基因库AAX23997.1)的RSV M2-2蛋白或其片段或变体。所述RSV抗原人可以是RSV聚合酶L(“L”)蛋白或其片段或变体。例如,RSV抗原可以是源自RSV Long菌株(基因库AAX23996.1)的RSV L蛋白或其片段或变体。
在又一个实施方案中,RSV抗原可以具有NS1、NS2、N、P、M、SH、M2-1、M2-2或L蛋白的优化的氨基酸序列。RSV抗原可以是人RSV蛋白或重组抗原,例如由人RSV基因组编码的任何一种蛋白。
在其他实施方案中,RSV抗原可以是但不限于源自RSV Long菌株的RSV F蛋白、源自RSV Long菌株的RSV G蛋白、优化的氨基酸RSV G氨基酸序列、RSV Long菌株的人RSV基因组、优化的氨基酸RSV F氨基酸序列、源自RSV Long菌株的RSV NS1蛋白、源自RSV Long菌株的RSV NS2蛋白、源自RSV Long菌株的RSV N蛋白、源自RSV Long菌株的RSV P蛋白、源自RSVLong株的RSV M蛋白、源自RSV Long菌株的RSV SH蛋白、源自RSV Long菌株的RSV M2-1蛋白、源自RSV Long菌株的RSV M2-2蛋白、源自RSV Long菌株的RSV L蛋白、源自RSV B亚型分离株H5601的RSV G蛋白、源自RSV B亚型分离株H1068的RSV G蛋白、源自RSV B亚型分离株H5598的RSV G蛋白、源自RSV B亚型分离株H1123的RSV G蛋白,或其片段,或其变体。
对RSV特异的示例性结构修饰的DMAb包括但不限于SEQ ID NO:110至SEQ ID NO:119中列出的结构修饰的DMAb。
(g)流感抗原
病毒抗原可包含源自流感病毒的抗原。流感抗原是能够在哺乳动物中引发针对一种或多种流感血清型的免疫应答的抗原。抗原可包含全长翻译产物HA0、亚基HA1、亚基HA2、其变体、其片段或其组合。流感血凝素抗原可衍生自多种甲型流感血清型H1、血清型H2病毒株、衍生自不同组的多种甲型流感血清型H1病毒株的杂交序列,或衍生自多种乙型流感病毒株。流感血凝素抗原可源自乙型流感。
流感抗原还可以包含至少一种抗原表位,其可以有效地对抗诱导免疫应答的特定流感免疫原。抗原可以提供完整流感病毒中存在的免疫原性位点和表位的全部数据。所述抗原可源自血凝素抗原序列,所述血凝素抗原序列源自一种血清型的多种甲型流感病毒株,如血清型H1或H2的多种甲型流感病毒株。所述抗原可以是来自组合两个不同血凝素抗原的序列或其部分得到的混合血凝素抗原序列。两种不同的血凝素抗原序列可以各自衍生自一组不同血清素的多种甲型流感病毒株,例如多种血清型H1的甲型流感病毒株。该抗原可以是血凝素抗原序列,该血凝素抗原序列源自多个B型流感病毒株的血凝素抗原序列。
在一些实施方案中,流感抗原可以是H1 HA、H2 HA、H3 HA、H5 HA或BHA抗原。
(h)埃博拉病毒
病毒抗原可源自埃博拉病毒。埃博拉病毒病(EVD)或埃博拉出血热(EHF)包括五种已知埃博拉病毒中的任意四种,其中包括本迪布焦型(Bundibugyo)病毒(BDBV)、埃博拉病毒(EBOV)、苏丹病毒(SUDV)和大森林病毒(TAFV)——其被称为科特迪瓦埃博拉病毒(象牙海岸埃博拉病毒,CIEBOV)。
结构修饰的DMAb可能对埃博拉病毒抗原具有特异性。对埃博拉病毒具有特异性的示例性结构修饰的DMAb包括但不限于SEQ ID NO:1至SEQ ID NO:46中列出的结构修饰的DMAb。
(i)马尔堡马尔堡病毒
病毒抗原可以源自马尔堡马尔堡病毒。马尔堡病毒病(MVD)或马尔堡出血热(EHF)包括五种已知的马尔堡马尔堡病毒中的任意四种,其中包括马尔堡病毒(MARV)和拉文病毒(RAVV)。
可用于诱导抵御马尔堡病毒的多种亚型或血清型的广谱免疫力的马尔堡病毒免疫原。抗原可以源自马尔堡病毒包膜糖蛋白。
(j)寨卡病毒
病毒抗原可源自寨卡病毒。寨卡病是由寨卡病毒感染引起的,可以通过被感染的蚊子叮咬传播给人类,也可以在人类之间进行性传播。寨卡抗原可包括寨卡病毒包膜蛋白、寨卡病毒NS1蛋白或寨卡病毒衣壳蛋白。
结构修饰的DMAb对寨卡病毒抗原具有特异性。对寨卡病毒具有特异性的示例性结构修饰的DMAb包括但不限于SEQ ID NO:63至SEQ ID NO:106中列出的结构修饰的DMAb。
(2)细菌抗原
外源抗原可以是细菌抗原或其片段或变体。细菌可以是下列类群中的任何一种:酸杆菌门、放线菌门、产水菌门、拟杆菌门、嗜热丝菌门、衣原体门、绿菌门、绿弯菌门、产金菌门、蓝细菌门、脱铁杆菌门、异常球菌-栖热菌门、团菌门、迷踪菌门、纤维杆菌门、厚壁菌门、梭杆菌门、芽单胞菌门、黏胶球形菌门、硝化螺菌门、浮霉菌门、变形菌门、螺旋体门、互养菌门、柔膜菌门、热脱硫杆菌门、热孢菌门和疣微菌门。
细菌可以是革兰氏阳性细菌或革兰氏阴性细菌。细菌可以是需氧细菌或厌氧细菌。细菌可以是自养细菌或异养细菌。细菌可以是嗜温性细菌、嗜中性粒细胞、极端微生物、嗜酸菌、嗜碱菌、嗜热菌、嗜冷菌、嗜盐菌或嗜高渗菌。
细菌可以是炭疽细菌、抗生素抗性细菌、引起疾病的细菌、食物中毒细菌、感染细菌、沙门氏菌、葡萄球菌、链球菌或破伤风细菌。该细菌可以是分枝杆菌、破伤风梭菌、鼠疫耶尔森氏菌、炭疽芽孢杆菌、耐甲氧西林的金黄色葡萄球菌(MRSA)或艰难梭菌。细菌可以是结核分枝杆菌。
(a)假单胞菌抗原
细菌抗原可以是假单胞菌抗原。例如,在一个实施方案中,抗原可以是铜绿假单胞菌抗原或其片段或其变体。铜绿假单胞菌抗原可源自毒力因子。与铜绿假单胞菌相关的毒力因子包括但不限于结构成分、酶和毒素。铜绿假单胞菌的毒力因子可以是胞外多糖、粘附素、脂多糖、绿脓素、胞外毒素A、胞外毒素S、细胞毒素、弹性蛋白酶、碱性蛋白酶、磷脂酶C、鼠李糖脂和细菌分泌系统中成分的一种。
在一个实施方案中,假单胞菌抗原是细胞外多糖(例如藻酸盐、Pel和Ps1)。在一个实施方案中,抗原是多糖合成基因座(psl)、其中包含的基因(例如,pslA、pslB、pslC、pslD、pslE、pslF、pslG、pslH、pslI、pslJ、pslK、pslL、pslM、pslN和pslO)、其中编码的蛋白质或酶(例如糖基转移酶、磷酸甘露糖异构酶/GDP-D-甘露糖焦磷酸化酶、转运蛋白、水解酶、聚合酶、乙酰酶、脱氢酶和拓扑异构酶)或由此产生的产物(例如Psl胞外多糖,称为“Psl”)之一。
在一个实施方案中,假单胞菌抗原是细菌分泌系统的组分。已经描述了细菌的六种不同类型的分泌系统(I型至VI型),其中在包括铜绿假单胞菌在内的革兰氏阴性细菌中发现了五种类型(I、II、II、V和VI型)。在一个实施方案中,抗原是基因(例如apr或has基因)或蛋白质(例如AprD、AprE、AprF、HasD、HasE、HasF和HasR)或I型分泌系统的分泌性蛋白(例如AprA、AprX和HasAp)之一。在一个实施方案中,抗原是基因(例如xcpA/pilD、xphA、xqhA、xcpP至Q和xcpR至Z)或蛋白质(例如GspC至M、GspAB、GspN、GspO、GspS、XcpT至XcpX、FppA)或II型分泌系统的分泌性蛋白(例如LasB、LasA、PlcH、PlcN、PlcB、CbpD、ToxA、PmpA、PrpL、LipA、LipC、PhoA、PsAP、LapA)之一。在一个实施方案中,抗原是基因(例如psc、per、pop或exs基因)或蛋白质(例如PscC、PscE至PscF、PscJ、PscN、PscP、PscW、PopB、PopD、PcrH和PcrV)或III型分泌系统的分泌性蛋白(例如ExoS、ExoT、ExoU和ExoY)之一。在一个实施方案中,抗原是III型分泌系统的调节剂(例如ExsA和ExsC)。在一个实施方案中,抗原是基因(例如estA)或蛋白质(例如EstA、CupB3、CupB5和LepB)或V型分泌系统的分泌性蛋白(例如EstA、LepA和CupB5)之一。在一个实施方案中,抗原是基因(例如HSI-I、HSI-II和HSI-III基因)或蛋白质(例如Fha1、ClpV1、VgrG蛋白质或Hcp蛋白质)或VI分泌系统的分泌性蛋白(例如Hcp1)之一。
(b)疏螺旋体抗原
细菌抗原可以是伯氏疏螺旋体属抗原或其片段或变体。伯氏疏螺旋体属抗原可源自伯氏疏螺旋体、卢西塔尼亚疏螺旋体、嘎氏疏螺旋体、比赛蒂疏螺旋体、巴伐利亚疏螺旋体(Borreliella bavariensis)、智利疏螺旋体(Borrelia chilensis)、伽氏疏螺旋体、瓦莱疏螺旋体(Borrelia valaisiana)、斯皮尔曼疏螺旋体(Borrelia spielmanii)和芬兰疏螺旋体(Borrelia finlandensis)中的任何一种。
细菌抗原可以是疏螺旋体属抗原或其片段或其变体。疏螺旋体属抗原可源自允许疏螺旋体属复制或存活的细菌产物。允许疏螺旋体属复制或存活的细菌产物包括但不限于结构成分、酶和毒素。这样的产物可以是脂蛋白、外表面蛋白、脊椎动物宿主中感染性或持久性所需的产物,以及涉及运动性和趋化性的产物之一。
在一个实施方案中,抗原是脂蛋白(例如BptA)。在一个实施方案中,抗原是外表面蛋白(例如OspA、OspB和OspC)。在一个实施方案中,抗原是脊椎动物宿主中感染性或持久性所需的产物(例如PncA、DbpA、DbpB、Bgp、P66和VlsE)。
(c)结核分枝杆菌抗原
细菌抗原可以是结核分枝杆菌抗原(即,TB抗原或TB免疫原),或其片段或变体。TB抗原可源自Ag85家族的TB抗原,例如Ag85A和Ag85B。TB抗原可源自Esx家族的TB抗原,例如EsxA、EsxB、EsxC、EsxD、EsxE、EsxF、EsxH、EsxO、EsxQ、EsxR、EsxS、EsxT、EsxU、EsxV和EsxW。
(3)寄生虫抗原
外源抗原可以是寄生虫抗原,或其片段或变体。寄生虫可以是原生动物、寄生的蠕虫或外寄生物。寄生的蠕虫(如蠕虫)可以是扁虫(如吸虫和绦虫)、棘头虫或蛔虫(如蛲虫)。外寄生物可以是虱子、跳蚤、壁虱和螨虫。
寄生虫可以是引起以下任何一种疾病的任何寄生虫:棘阿米巴角膜炎、阿米巴病、蛔虫病、巴贝西虫病、小袋虫病、浣熊贝蛔虫病(Baylisascariasis)、查加斯病、支睾吸虫病、锥蝇病(Cochliomyia)、隐孢子虫病、裂头绦虫病、麦地那龙线虫病、包虫病、象皮病、挠虫病、肝片吸虫病、姜片虫病、丝虫病、贾第虫病、颚口线虫病、膜壳绦虫病、等孢球虫病、片山热(Katayama fever)、利什曼病、莱姆病、疟疾、后殖吸虫病、蛆病、盘尾丝虫病、虱病、疥疮、血吸虫病、昏睡病、类圆线虫病、绦虫病、弓蛔虫病、弓形体病、旋毛虫病和鞭虫病。
寄生虫可以是棘阿米巴虫、异尖线虫、人蛔虫、马蝇、结肠小袋纤毛虫、臭虫、绦虫类(绦虫)、恙螨、螺旋蝇、痢疾变形虫、肝片吸虫、兰伯氏贾第虫、钩虫、利什曼虫、舌形虫、肝吸虫、罗阿丝虫、并殖吸虫属-肺吸虫、挠虫、恶性疟原虫、血吸虫、粪类圆线虫、螨、绦虫、弓形虫、锥虫、鞭虫或班氏丝虫。
(a)莱姆抗原
外源抗原可以是莱姆病抗原。抗原可以是外表面蛋白A抗原(OspA抗原)或其片段或其变体。抗原可源自引起疟疾的寄生虫。莱姆病是由伯氏疏螺旋体(Borreliaburgdorferi)细菌引起的,并通过受感染的肩突硬蜱(黑脚蜱或鹿蜱)的叮咬传播给人类。
(b)疟疾抗原
外源抗原可以是疟疾抗原(即,PF抗原或PF免疫原),或其片段或变体。抗原可源自引起疟疾的寄生虫。引起疟疾的寄生虫可以是恶性疟原虫。恶性疟原虫抗原可包括环子孢子(CS)抗原。
在一些实施方案中,疟疾抗原可以是恶性疟原虫免疫原CS、LSA1、TRAP、CelTOS和Amal之一。免疫原可以是全长蛋白或全长蛋白的免疫原性片段。
在其他实施方案中,疟疾抗原可以是TRAP,也称为SSP2。在其他实施方案中,疟疾抗原可以是CelTOS,也称为Ag2,是高度保守的疟原虫抗原。在另外的实施方案中,疟疾抗原可以是Amal,这是高度保守的疟原虫抗原。在一些实施方案中,疟疾抗原可以是CS抗原。
在其他实施方案中,疟疾抗原可以是融合蛋白,其包含本文所述的两种或多种PF蛋白的组合。例如,融合蛋白可包含CS免疫原、ConLSA1免疫原、ConTRAP免疫原、ConCelTOS免疫原和ConAmal免疫原中的两种或多种,所述免疫原彼此直接相邻或者通过间隔子或一个或多个氨基酸连接。在一些实施方案中,所述融合蛋白包含两个PF免疫原;在一些实施方案中,所述融合蛋白包含三个PF免疫原;在一些实施方案中,所述融合蛋白包含四个PF免疫原;并且在一些实施方案中,所述融合蛋白包含五个PF免疫原。具有两个PF免疫原的融合蛋白可包括:CS和LSA1;CS和TRAP;CS和CelTOS;CS和Amal;LSAl和TRAP;LSAl和CelTOS;LSAl和Amal;TRAP和CelTOS;TRAP和Amal;或CelTOS和Amal。具有三种PF免疫原的融合蛋白可以包括:CS、LSA1和TRAP;CS、LSAl和CelTOS;CS、LSAl和Amal;LSAl、TRAP和CelTOS;LSAl、TRAP和Amal;或TRAP、CelTOS和Amal。具有四种PF免疫原的融合蛋白可以包括:CS、LSA1、TRAP和CelTOS;CS、LSAl、TRAP和Amal;CS、LSAl、CelTOS和Amal;CS、TRAP、CelTOS和Amal;或LSAl、TRAP、CelTOS和Amal。具有五个PF免疫原的融合蛋白可包括CS或CS-alt、LSA1、TRAP、CelTOS和Amal。
(4)真菌抗原
外源抗原可以是真菌抗原,或其片段或变体。真菌可以是曲霉菌种、皮炎芽生菌、念珠菌(例如白色念珠菌)、球孢子菌、新型隐球菌、加氏隐球菌、皮肤癣菌、镰刀菌属菌种、荚膜组织胞浆菌、毛霉菌、耶氏肺孢子菌、申克孢子丝菌、突脐蠕孢属或枝孢菌。
b.自体抗原
在一些实施方案中,抗原是自体抗原。自体抗原可以是受试者自身身体的能够刺激免疫应答的成分。在一些实施方案中,除非受试者处于疾病状态,例如自身免疫疾病,否则自体抗原不会激发免疫应答。
自体抗原可以包括但不限于细胞因子、抵御诸如上述所列病毒(包括HIV和登革热)的抗体、影响癌症进展或发展的抗原,以及细胞表面受体或跨膜蛋白。
(1)WT-1
自体抗原性抗原可以是Wilm氏肿瘤抑制基因1(WT1)、其片段、其变体或其组合。WT1是一个转录因子,其在N端包含一个富含脯氨酸/谷氨酰胺的DNA结合结构域,且在C端包含四个锌指基序。WT1在泌尿生殖系统的正常发育中发挥作用,并且与许多因素相互作用,例如,一种已知的肿瘤抑制剂p53和经细胞毒性药物治疗后在多个位点裂解WT1的丝氨酸蛋白酶HtrA2。WT1的突变可导致肿瘤或癌症形成,例如,Wilm氏肿瘤或表达WT1的肿瘤。
(2)EGFR
自体抗原可以包括表皮生长因子受体(EGFR)或其片段或变体。EGFR(也称为ErbB-1和HER1)是细胞外蛋白配体的表皮生长因子家族(EGF家族)成员的细胞表面受体。EGFR是ErbB受体家族的成员,该家族包括四个紧密相关的受体酪氨酸激酶:EGFR(ErbB-1)、HER2/c-neu(ErbB-2)、Her 3(ErbB-3)和Her 4(ErbB-4)。影响EGFR表达或活性的突变可能致癌。
抗原可以包括ErbB-2抗原。Erb-2(人类表皮生长因子受体2)也称为Neu、HER2、CD340(分化簇340)或p185,由ERBB2基因编码。已经显示该基因的扩增或过表达在某些侵略性乳腺癌的发生和发展中发挥作用。在大约25-30%的乳腺癌女性中,ERBB2基因发生了遗传改变,导致肿瘤细胞表面上的HER2含量增加。HER2的这种过表达促进细胞快速分裂,因此HER2标志肿瘤细胞。
(3)可卡因
自体抗原可以是可卡因受体抗原。可卡因受体包括多巴胺转运蛋白。
(4)PD-1
自体抗原可包括程序性死亡1(PD-1)。程序性死亡1(PD-1)及其配体PD-L1和PD-L2传递抑制信号,所述抑制信号调节T细胞活化、耐受性和免疫病理之间的平衡。PD-1是一种288个氨基酸大小的细胞表面蛋白分子,包括细胞外IgV结构域、跨膜区和胞内尾巴。
(5)LAG-3
自体抗原可包括淋巴细胞激活基因3(Lag-3,也称为CD223)。LAG-3是Ig超家族的成员,仅在结合MHC-II分子的活化和耐受性T细胞上表达,并且已知会转导抑制信号。与效应或记忆T细胞相比,LAG-3在疲惫的T细胞上明显上调。LAG-3通过抑制T细胞受体诱导的钙通量来负调节T细胞扩增,从而在患癌的情况下控制T细胞记忆库的大小,LAG3在TILs上调,并且对LAG-3的阻断可增强抗肿瘤T细胞免疫应答。在引起CD8 T细胞衰竭的病毒性慢性模型中,LAG-3的阻断可增强CD8T细胞的应答。
(6)GITR
自体抗原可包括糖皮质激素诱导的TNFR相关蛋白(GITR),也称为TNF受体超家族18(TNFRSF 18)。GITR激活向CD4+和CD8+T细胞发送共激活信号,并防止调节性T细胞抑制免疫应答。另外,表达GITR的效应T细胞和调节性T细胞浸润多种肿瘤类型,但是在非造血细胞上几乎没有GITR的表达。这种分布特征意味着表达GITR的细胞可变为集中在肿瘤上。这种活性与分布的结合共同使GITR激活成为治疗多种癌症的有吸引力的方法。抗原结合蛋白既可用于治疗实体瘤也可用于治疗包括白血病在内的血液肿瘤。n除了用于治疗癌症外,在另一个实施方案中,提供的抗原结合蛋白可用于诱导或增强免疫应答以抵御外源抗原,例如各种致病因子上出现的抗原。可产生针对其的免疫应答的致病因子上出现的抗原的实例包括但不限于存在于病毒、寄生虫、细菌和其他微生物上的蛋白质、糖蛋白、脂蛋白和糖脂。
(7)CD40
自体抗原可以包括CD40。CD40是一种55kDa细胞表面抗原,其存在于正常人和肿瘤人B细胞、树突状细胞、其他抗原呈递细胞(APC)、内皮细胞、单核细胞、CD8+T细胞、上皮细胞、某些上皮癌和许多实体瘤(包括肺癌、乳腺癌、卵巢癌和结肠癌)的表面。来自B细胞谱系几种肿瘤的恶性B细胞表达高水平的CD40,并且似乎依赖CD40信号来维持生存和增殖。因此,患有低度和高度B细胞淋巴瘤、B细胞急性淋巴细胞白血病、多发性骨髓瘤、慢性淋巴细胞性白血病和霍奇金病的患者的转化细胞表达CD40。在三分之二的急性粒细胞白血病病例和50%的AIDS相关淋巴瘤中也检测到CD40表达。
(8)OX40
自体抗原可以包括OX40。OX40(也称为CD134)是一种50千道尔顿(KDa)的糖蛋白,并且是肿瘤坏死因子受体超家族(TNFRSF)的成员。据报道,OX40的配体OX40L(也称为TNFSF4、CD252)在内皮细胞、活化的抗原呈递细胞(包括巨噬细胞)、树突状细胞、B细胞和自然杀伤细胞上表达。尽管不希望受到理论的束缚,但是抗原呈递细胞上CD40之间的结合与脂多糖(LPS)一样增加了OX40L表达。经由T细胞抗原受体信号转导后,可以诱导OX40在T细胞上的表达。例如,OX40在炎症部位最近激活的T细胞上表达。CD4和CD8 T细胞在炎症条件下可以上调OX40。
(9)TIM-3
自体抗原可以包括TIM-3。TIM-3是一种跨膜受体,在Thl(T辅助1)CD4-T细胞和分泌IFN-γ的细胞毒性CD8-T细胞上表达。TIM-3通常不在幼稚T细胞上表达,而在活化的效应T细胞上调。TIM-3在调节体内免疫力和耐受性中发挥作用。
(10)4-1BB
自体抗原可以包括4-1BB配体。4-1BB配体是属于TNF超家族的2型跨膜糖蛋白。4-1BB配体可在活化的T淋巴细胞上表达。4-1BB是激活诱导的T细胞共刺激分子。通过4-1BB的信号上调生存基因,增强细胞分裂,诱导细胞因子的产生,并防止T细胞中活化诱导的细胞死亡。
(11)CTLA4
自体抗原可以包括CTLA-4(细胞毒性T淋巴细胞抗原4),也称为CD 152(分化簇152)。CTLA-4是在T细胞表面发现的一种蛋白质受体,其导致细胞对抗原的免疫攻击。抗原可以是CTLA-4的片段(如细胞外V结构域、跨膜结构域和细胞质尾)或其组合。
(12)IL-6
自体抗原可以包括白介素6(IL-6)。IL-6刺激多种疾病的炎症和自身免疫过程,包括但不限于糖尿病、动脉粥样硬化、抑郁症、阿尔茨海默氏病、系统性红斑狼疮、多发性骨髓瘤、癌症、白塞氏病、类风湿性关节炎、败血症、细菌感染、病毒感染、真菌感染等。
(13)CD126
自体抗原可以包括CD126。CD126是IL-6的受体,并且刺激许多疾病的炎症和自身免疫过程,包括但不限于糖尿病、动脉粥样硬化、抑郁症、阿尔茨海默氏病、系统性红斑狼疮、多发性骨髓瘤、癌症、白塞氏病、类风湿性关节炎、败血症、细菌感染、病毒感染、真菌感染等。
(14)MCP-1
自体抗原可包括单核细胞趋化蛋白1(MCP-1)。MCP-1也称为趋化因子(C-C基序)配体2(CCL2)或小型诱导型细胞因子A2。MCP-1是属于CC趋化因子家族的细胞因子。MCP-1将单核细胞、记忆T细胞和树突状细胞募集到由组织损伤或组织感染产生的炎症部位。
(15)β淀粉样蛋白
自体抗原可以包括β淀粉样蛋白(Aβ)或其片段或变体。Αβ抗原可包含Αβ(X-Υ)肽,其中人序列Aβ蛋白的氨基酸位置X到氨基酸Y的氨基酸序列包括X和Y,特别是来自与氨基酸位置1至47相对应的氨基酸序列的氨基酸位置X至氨基酸位置Y的氨基酸序列;人查询序列(SEQ ID NO:62)或其变体。Aβ抗原可包含Aβ(X-Y)多肽的Aβ多肽,其中X可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31或32,Y可以是47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16或15。Aβ多肽可包含其为至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少30、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45或至少46个氨基酸的片段。
(16)IP-10
自体抗原可包括干扰素(IFN)-γ诱导蛋白10(IP-10)。IP-10也称为小诱导细胞因子B10或C-X-C基序趋化因子10(CXCL10)。CXCL10由几种细胞类型(例如单核细胞、内皮细胞和成纤维细胞)分泌,用于响应IFN-γ。
(17)TERT
自体抗原可以包括TERT(端粒酶逆转录酶)。TERT是一种端粒酶逆转录酶,可在端粒末端合成一个TTAGGG标签,以防止由于染色体缩短而导致的细胞死亡。具有TERT异常高表达的过度增殖细胞可通过免疫疗法进行靶向。最近的研究表明,在用TERT基因转染的树突状细胞中TERT表达可以诱导CD8+细胞毒性T细胞并以抗原特异性方式引发CD4+T细胞。
(18)酪氨酸酶
自体抗原可包括酪氨酸酶(Tyr)。Tyr是用于通过以下方式进行免疫介导清除的重要靶标,既(1)通过B细胞应答以诱导体液免疫来生成阻断单核细胞趋化蛋白1(MCP-1)产生的抗体,从而阻止髓样来源的抑制细胞(MDSC)并抑制肿瘤的生长;(2)增加细胞毒性T淋巴细胞,例如CD8+(CTL),以攻击和杀死肿瘤细胞;(3)增加T辅助细胞应答;(4)通过IFN-γ和TFN-α或其组合来增加炎症反应。
酪氨酸酶是一种可以在动植物组织中发现的含铜酶。在苯酚(如酪氨酸)的氧化作用下,酪氨酸酶催化黑色素和其他色素的产生。黑色素瘤中,酪氨酸酶可以变得不受调节,导致黑色素合成增加。酪氨酸酶也是识别黑色素瘤受试者中的细胞毒性T细胞的靶标。因此,酪氨酸酶是可以与黑色素瘤缔合的抗原。
抗原可以包含蛋白质表位,使得蛋白质表位作为特别有效的免疫原,诱导抵御所述免疫原的抗Tyr免疫应答。Tyr抗原可包含全长翻译产物、其变体、其片段或其组合。
Tyr抗原可包含共有蛋白。Tyr抗原诱导抗原特异性T细胞和高滴度抗体应答,两者均全身性地抵御所有的癌细胞和肿瘤细胞。正因如此,包含Tyr共有抗原的疫苗提供了针对肿瘤形成的保护性免疫应答。因此,任何用户都可以设计本发明的免疫原性组合物以包括Tyr抗原,从而提供抵御肿瘤形成、肿瘤转移和肿瘤生长的广谱免疫力。蛋白质可包含与Tyr抗原同源的序列、Tyr抗原的片段和具有与Tyr抗原的片段同源的序列的蛋白质。
(19)NY-ESO-1
自体抗原可包括NY-ESO-1。NY-ESO-1是一种在多种癌症中表达的肿瘤-睾丸抗原,它可以诱导细胞免疫和体液免疫两者。基因表达研究表明,在黏液型和圆细胞型脂肪肉瘤中,NY-ESO-1、CTAG1B的基因上调。
(20)MAGE
自体抗原可以包括MAGE(黑素瘤相关抗原)。MAGE抗原可包括MAGE-A4(黑素瘤相关抗原4)。NY-ESO-1是在多种癌症中表达的肿瘤-睾丸抗原,其中它可以诱导细胞免疫和体液免疫两者。基因表达研究表明,在黏液型和圆细胞型脂肪肉瘤中,NY-ESO-1、CTAG1B的基因上调。
MAGE-A4在各种组织学类型如胃肠癌、食道癌和肺癌中的雄性生殖细胞和肿瘤细胞中表达。MAGE-A4结合癌蛋白Gankyrin。这种MAGE-A4特异性结合是由其C端介导的。研究表明,外源性MAGE-A4可以部分抑制体外过表达Gankyrin的细胞的黏附非依赖性生长,并抑制裸鼠中从这些细胞迁移的肿瘤的形成。这种抑制作用依赖于MAGE-A4和Gankyrin之间的结合,这表明Gankyrin和MAGE-A4之间的相互作用抑制Gankyrin介导的癌变。MAGE在肿瘤组织中的表达可能不是原因,而是肿瘤发生的结果,并且MAGE基因通过靶向早期肿瘤细胞进行破坏而参与了免疫过程。
黑色素瘤相关抗原4蛋白(MAGEA4)可参与胚胎发育以及肿瘤转化和/或进展。MAGEA4通常在睾丸和胎盘中表达。但是,MAGEA4可以在许多不同类型的肿瘤中表达,例如黑色素瘤、头颈部鳞状细胞癌、肺癌和乳腺癌。因此,MAGEA4可以是与多种肿瘤相关的抗原。
MAGEA4抗原可诱导抗原特异性T细胞和/或高滴度抗体应答,从而诱导或引发针对表达该抗原的癌症或肿瘤或对其具有反应性的免疫应答。在一些实施方案中,诱导或引发的免疫应答可以是细胞免疫应答、体液免疫应答或细胞免疫应答和体液免疫应答。在一些实施方案中,诱导或引起的细胞免疫应答可以包括干扰素-γ(IFN-γ)和/或肿瘤坏死因子α(TNF-α)的诱导或分泌。在其他实施方案中,诱导或引发的免疫应答可以减少或抑制促进表达抗原的肿瘤或癌症生长的一种或多种免疫抑制因子,例如但不限于下调MHC呈递的因子、上调抗原特异性调节性T细胞(Tregs)的因子、PD-L1、FasL、细胞因子(如IL-10和TFG-β)、肿瘤相关巨噬细胞、肿瘤相关成纤维细胞。
MAGEA4抗原可包含蛋白质表位,使它们特别有效地作为可诱导抗MAGEA4免疫应答的免疫原。MAGEA4抗原可包含全长翻译产物,其变体、其片段或其组合。
(21)FSHR
自体抗原可以包括FSHR(促卵泡激素受体)。FSHR是一种在女性卵巢颗粒细胞中选择性表达的抗原(Simoni等人,《内分泌评论(Endocr Rev.)》,1997年第18期:739-773),并在卵巢内皮中低表达(Vannier等人,《生物化学(Biochemistry)》,1996年第35期:1358-1366)。最重要的是,这种表面抗原在50-70%的卵巢癌中表达。
(22)肿瘤微环境抗原
自体抗原可以包括肿瘤微环境抗原。在肿瘤微环境中过表达的几种蛋白质包括但不限于:成纤维细胞活化蛋白(FAP)、血小板衍生生长因子受体β(PDGFR-β)和磷脂酰肌醇蛋白聚糖-1(GPC1)。FAP是一种具有明胶酶和肽酶活性的膜结合酶,在超过90%的人类癌中,癌症相关成纤维细胞中的FAP被上调。PDGFR-β是一种细胞表面酪氨酸激酶受体,在许多生物过程的调控中起作用,包括胚胎发育、血管生成、细胞增殖和分化。GPC1是一种富含癌细胞的细胞表面蛋白聚糖。
(23)PRAME
自体抗原可以包括PRAME(在肿瘤中优先表达的黑色素瘤抗原)。PRAME是在人类中由PRAME基因编码的蛋白质。该基因编码一种抗原,所述抗原主要在人黑素瘤中表达,并被细胞毒性T淋巴细胞识别。除睾丸外,它在正常组织中不表达。该基因还在急性白血病中表达。对于该基因,已经观察到了五种编码相同蛋白质的选择性剪接的转录变体。蛋白质可以包含与PRAME抗原同源的序列、PRAME抗原的片段和具有与PRAME抗原的片段同源的序列的蛋白质。
(24)前列腺抗原
自体抗原可以包括前列腺抗原,例如前列腺特异性膜抗原(PSMA)、PSA抗原、STEAP抗原、PSCA抗原、前列腺酸磷酸酶(PAP)抗原和其他已知的前列腺肿瘤抗原。PSMA也称为谷氨酸羧肽酶II(GCPII)、N-乙酰基-L-天冬氨酰-L-谷氨酸肽酶I(NAALADase I)、NAAG肽酶或叶酸水解酶(FOLH)。PMSA是前列腺癌细胞高度表达的不可或缺的膜蛋白。
在一些实施方案中,编码针对PSMA的抗体(抗PSMA抗体)的重组核酸序列可以是包括排列2中的重组核酸序列构建体的重组核酸序列。
在其他实施方案中,重组核酸序列编码的抗PSMA抗体可以如本文所述进行修饰。一种所述修饰是去岩藻糖基化的抗体,如实施例中所示,与市售抗体相比,其表现出增加的ADCC活性。所述修饰可发生在重链、轻链或其组合中。所述修饰可以是重链中的一个或多个氨基酸取代、轻链中的一个或多个氨基酸取代或其组合。
(25)肿瘤抗原
自体抗原可以包括肿瘤抗原。在本发明的上下文中,“肿瘤抗原”或“过度增殖性紊乱抗原”或“过度增殖性紊乱相关的抗原”是指具体的过度增殖性紊乱(如癌症)所共有的抗原。本文讨论的抗原只是通过举例说明而包括在内。这份列表并非是唯一的列表,更多的实施例对本领域技术人员来说是显而易见的。
肿瘤抗原是由肿瘤细胞产生的蛋白质,其引起免疫应答,特别是T细胞介导的免疫应答。本发明的抗原结合部分的选择将取决于待治疗的癌症的具体类型。肿瘤抗原是本领域众所周知的,并且肿瘤抗原包括:例如,神经胶质瘤相关抗原、癌胚抗原(CEA)、β-人绒毛膜促性腺激素、甲胎蛋白(AFP)、凝集素反应性AFP、甲状腺球蛋白、RAGE-1、MN-CAIX、人类端粒酶逆转录酶、RU1、RU2(AS)、肠羧基酯酶、狗hsp 70-2、M-CSF、蛋白酶、前列腺特异性抗原(PSA)、PAP、NY-ESO-1、LAGE-1a、p53、Prostein、PSMA、Her2/neu,存活蛋白和端粒酶、前列腺癌肿瘤抗原-1(PCTA-1)、MAGE、ELF2M、嗜中性弹性蛋白酶、ephrinB2、CD22、胰岛素生长因子(IGF)-I、IGF-II、IGF-I受体和间皮素。
在一个实施方案中,肿瘤抗原包含恶性肿瘤相关的一种或多种癌症抗原表位。恶性肿瘤表达多种可以充当免疫攻击的靶抗原的蛋白。这些分子包括但不限于组织特异性抗原,例如黑色素瘤中的MART-1、酪氨酸酶和GP 100,以及前列腺癌中的前列腺酸磷酸酶(PAP)和前列腺特异性抗原(PSA)。其他靶分子属于转化相关分子组,例如致癌基因HER-2/Neu/ErbB-2。另一组靶抗原是癌胎抗原,例如癌胚抗原(CEA)。在B细胞淋巴瘤中,肿瘤特异性独特型免疫球蛋白构成了真正的肿瘤特异性免疫球蛋白抗原,该抗原是单个肿瘤所独有的。B细胞分化抗原(例如CD19、CD20和CD37)是B细胞淋巴瘤中靶抗原的其他候选物。有些抗原(CEA、HER-2、CD19、CD20、独特型)已用作单克隆抗体被动免疫疗法的靶标,但成功率有限。
本发明中提及的肿瘤抗原的类型也可以是肿瘤特异性抗原(TSA)或肿瘤相关抗原(TAA)。TSA是肿瘤细胞特有的,不会在体内其他细胞上发生。TAA相关抗原不是肿瘤细胞特有的,它也可以在无法诱导对该抗原的免疫耐受状态的条件下在正常细胞上表达。抗原在肿瘤上的表达可以在使免疫系统对抗原作出应答的条件下发生。TAA可以是在胎儿发育过程中免疫系统不成熟且无法应答时在正常细胞上表达的抗原,也可以是正常细胞上以极低的水平存在但在肿瘤细胞上以高得多的水平表达的抗原。
TSA或TAA抗原的非限制性实例包括:分化抗原,例如MART-1/MelanA(MART-1)、gp100(Pmel 17)、酪氨酸酶、TRP-1、TRP-2和肿瘤特异性多谱系抗原(如MAGE-1、MAGE-3、BAGE、GAGE-1、GAGE-2、p15);过度表达的胚胎抗原,例如CEA;过度表达的癌基因和突变的肿瘤抑制基因,例如p53、Ras、HER-2/neu;染色体易位导致的独特肿瘤抗原,如BCR-ABL、E2A-PRL、H4-RET、IGH-IGK、MYL-RAR;以及病毒抗原,例如爱泼斯坦-巴尔病毒抗原EBVA和人乳头瘤病毒(HPV)抗原E6和E7。其他蛋白类的大抗原包括TSP-180、MAGE-4、MAGE-5、MAGE-6、RAGE、NY-ESO、pl85erbB2、pl80erbB-3、c-met、nm-23H1、PSA、TAG-72、CA 19-9、CA 72-4、CAM17.1、NuMa、K-ras、β-连环蛋白、CDK4、Mum-1、p 15、p 16、43-9F、5T4、791Tgp72、甲胎蛋白、β-HCG、BCA225、BTAA、CA 125、CA 15-3\CA27.29\BCAA、CA 195、CA242、CA-50、CAM43、CD68\P1、CO-029、FGF-5、G250、Ga733\EpCAM、HTgp-175、M344、MA-50、MG7-Ag、MOV18、NB/70K、NY-CO-1、RCAS1、SDCCAG16、TA-90\Mac-2结合蛋白\亲环蛋白C-相关蛋白、TAAL6、TAG72、TLP和TPS。
c.其他抗原
在一些实施方案中,抗原是除外源抗原和/或自体抗原以外的抗原。其他示例性抗原包括但不限于:
(a)HIV-1VRC01
另一种抗原可以是HIV-1VRC01。HIV-1VCR01是针对HIV的中和CD4结合位点抗体。HIV-1VCR01接触HIV-1的部分,包括gp120环D、CD4结合环和HIV-1的V5区。
(b)HIV-1PG9
另一种抗原可以是HIV-1PG9。HIV-1PG9是聚糖依赖性人类抗体的不断扩增的家族的创始成员,该抗体优先结合HIV(HIV-1)包膜(Env)糖蛋白(gp)三聚体并广泛中和该病毒。
(c)HIV-1 4E10
另一种抗原可以是HIV-1 4E10。HIV-1 4E10是中和性抗HIV抗体。HIV-1 4E10针对线性表位,该线性表位映射在HIV-1的近膜端外部区(MPER),所述区位于gp41胞外域的C末端。
(d)DV-SF1
另一种抗原可以是DV-SF1。DV-SF1是一种中和抗体,其与四种登革热病毒血清型的包膜蛋白结合。
(e)DV-SF2
另一种抗原可以是DV-SF2。DV-SF2是与登革热病毒表位结合的中和抗体。DV-SF2对登革热病毒4血清型具有特异性。
(f)DV-SF3
另一种抗原可以是DV-SF3。DV-SF3是一种中和抗体,其与登革热病毒包膜蛋白的EDIII A链结合。
6.核酸疫苗
含核酸分子的组合物可单独或组合给予有需要的受试者,以促进工程化DNA编码的合成抗体的体内表达和形成,所述核酸分子包含编码结构修饰的DMAb的核苷酸序列、其片段、其变体或其组合。
在一个实施方案中,本发明的组合物可以与在哺乳动物中引发针对抗原的免疫应答的组合物组合施用。在一个实施方案中,本发明的组合物可以与编码一种或多种抗原的核酸组合施用。在一个实施方案中,第一组合物包含DNA疫苗。
在一个实施方案中,本发明的组合包括编码至少两个结构修饰的dMAb的至少两个核酸分子,其中每个dMAb靶向不同的抗原。例如,在一个实施方案中,每个dMAb靶向单一病毒的不同病毒抗原。在另一个实施方案中,每个dMAb靶向不同病毒的病毒抗原。在另一个实施方案中,每种dMAb靶向不同的自体抗原。
在一个实施方案中,本发明的组合疫苗包括编码至少两个结构修饰的dMAb的至少2个、至少3个、至少4个、至少5个、至少6个或超过6个核酸分子,其中每个dMAb靶向不同的抗原。抗原可以是核酸序列、氨基酸序列、多糖或其组合。核酸序列可以是DNA、RNA、cDNA、其变体、其片段或其组合。氨基酸序列可以是蛋白质、肽、其变体、其片段或其组合。多糖可以是核酸编码的多糖。
在一个实施方案中,本发明的免疫原性组合物包含编码至少两个结构修饰的dMAb的至少两个核酸分子,其中每个dMAb靶向不同的抗原,其中每个抗原是不同病毒的抗原。在一个实施方案中,本发明的组合疫苗包含至少3个、至少4个、至少5个、至少6个或超过6个核酸分子,所述核酸分子编码至少2个、至少3个、至少4个、至少5个、至少6或超过6个dMAb,其中编码的dMAB靶向来自至少2种、至少3种、至少4种、至少5种、至少6种或超过6种不同病毒的抗原。
本发明涉及一种组合物,其包括编码结构修饰的DMAb、其片段、其变体或其组合的重组核酸序列。当将组合物施用于有需要的受试者时,可导致在受试者中产生结构修饰的DMAb。合成抗体可以结合受试者体内的靶分子(即抗原)。这种结合可以中和抗原,阻止另一分子例如蛋白或核酸对抗原的识别,并引发或诱导对抗原的免疫应答。
结构修饰的DMAb可以治疗、预防和/或抵御给予所述组合物的受试者的疾病。通过结合抗原,结构修饰的DMAb可以治疗、预防和/或抵御给予所述组合物的受试者的疾病。结构修饰的DMAb可以在给予所述组合物的受试者中促进疾病的生存率。在一个实施方案中,与患有疾病但未施用结构修饰的DMAb的受试者的预期生存率相比,所述结构修饰的DMAb可提高所述疾病在该受试者中的生存率。在各种实施方案中,与不施用所述组合物的预期生存率相比,结构修饰的DMAb可使施用组合物的受试者的疾病生存率增加至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%或大于100%。在一个实施方案中,与未施用结构修饰的DMAb的受试者的预期抵御能力相比,结构修饰的DMAb可增强对受试者中疾病的抵御能力。在各种实施方案中,与不施用所述组合物的预期抵御能力相比,结构修饰的DMAb可使施用所述组合物的受试者的疾病抵御能力增强至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
所述组合物可导致受试者在将组合物给予受试者后的至少约1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、20小时、25小时、30小时、35小时、40小时、45小时、50小时或60小时内产生结构修饰的DMAb。所述组合物可导致受试者在将组合物给予受试者后的至少约1天、2天、3天、4天、5天、6天、7天、8天、9天或10天内产生合成抗体。所述组合物可导致受试者在将组合物给予受试者后的至少约1小时至约6天、约1小时至约5天、约1小时至约4天、约1小时至约3天、约1小时至约2天、约1小时至约1天、约1小时至约72小时、约1小时至约60小时、约1小时至约48小时、约1小时至约36小时、约1小时至约24小时、约1小时至约12小时或约1小时至约6小时内产生结构修饰的DMAb。
当给予有需要的受试者时,所述组合物可使结构修饰的DMAb的产生比给予抗原以诱导体液免疫应答的受试者的内源性抗体的产生更快。所述组合物可使结构修饰的DMAb的产生比给予抗原以诱导体液免疫应答的受试者的内源性抗体的产生提前至少约1天、2天、3天、4天、5天、6天、7天、8天、9天或10天。
在一个实施方案中,所述方法涉及:含编码结构修饰的DMAb的核酸分子的第一组合物与含编码第二结构修饰的DMAb的核酸分子的第二组合物组合施用。第一组合物和第二组合物可以同时或以任何顺序施用。在一个实施方案中,在不同的注射部位同时施用第一组合物和第二组合物。
在一个实施方案中,所述方法涉及:施用含编码两个或更多个结构修饰的DMAb的一种或多种核酸分子的单一组合物。在这样的实施方案中,两个或更多个DMAb可以在单个核酸分子上或在分离的核酸分子上编码,所述分离的核酸分子组合成单一组合物进行施用。
在一个实施方案中,所述方法涉及:编码一个或多个结构修饰的DMAb的一种或多种核酸分子与能够在哺乳动物中产生针对抗原的免疫应答的核酸疫苗组合施用。在一个实施方案中,核酸疫苗包含至少一种能够在哺乳动物中表达共有抗原的核酸分子和药学上可接受的赋形剂。在一个实施方案中,所述核酸分子包含与编码共有抗原的编码序列可操作地连接的启动子。
在一些实施方案中,所述核酸分子包括编码抗原的编码序列。在一些实施方案中,核酸分子包括编码序列,所述编码序列编码可操作地连接至编码序列的N末端的IgE前导序列的抗原。
核酸分子可以进一步包括连接至编码序列的C末端的聚腺苷酸化序列。在一个实施方案中,核酸分子是密码子优化的。
在一些实施方案中,药学上可接受的赋形剂是佐剂。在一个实施方案中,佐剂选自由IL-12和IL-15组成的群组。在一些实施方案中,药学上可接受的赋形剂是转染促进剂。在一个实施方案中,转染促进剂是聚阴离子、聚阳离子或脂质,更优选地,是聚-L-谷氨酸盐。在一个实施方案中,聚-L-谷氨酸盐的浓度小于6mg/ml。在一个实施方案中,核酸疫苗的总核酸浓度为1mg/ml或更高。
在一些实施方案中,核酸疫苗包含多个独特的DNA质粒,其中每个所述多个独特的DNA质粒编码包含共有抗原的多肽。
在本发明的一些实施方案中,核酸疫苗可以进一步包含佐剂。在一些实施方案中,佐剂选自由以下组成的群组:α-干扰素、γ-干扰素、血小板衍生生长因子(PDGF)、TNFα、ΤNPβ、GM-CSF、表皮生长因子(EGF)、皮肤T细胞吸引趋化因子(CTACK)、上皮胸腺表达的趋化因子(TECK)、粘膜相关上皮趋化因子(MEC)、IL-12、IL-15、MHC、CD80、CD86(包括IL-15,信号序列已删除且任选地包含IgE的信号肽)。可能是有用的佐剂的其他基因包括编码:MCP-1、MIP-1-ɑ、MIP-1p、IL-8、RANTES、L-选择素、P-选择素、E-选择素、CD34、GlyCAM-1、MadCAM-1、LFA-1、VLA-1、Mac-1、pl50.95、PECAM、ICAM-1、ICAM-2、ICAM-3、CD2、LFA-3、M-CSF、G-CSF、IL-4、IL-18的突变形式、CD40、CD40L、血管生长因子、成纤维细胞生长因子、IL-7、神经生长因子、血管内皮生长因子、Fas、TNF受体、Flt、Apo-1、p55、WSL-1、DR3、TRAMP、Apo-3、AIR、LARD、NGRF、DR4、DR5、KILLER、TRAIL-R2、TRICK2、DR6、细胞凋亡蛋白酶ICE、Fos、c-jun、Sp-1、Ap-1、Ap-2、p38、p65Rel、MyD88、IRAK、TRAF6、IkB、非活性NIK、SAP K、SAP-1、JNK、干扰素反应基因、NFkB、Bax、TRAIL、TRAILrec、TRAILrecDRC5、TRAIL-R3、TRAIL-R4、RANK、RANK配体、Ox40、Ox40配体、NKG2D、MICA、MICB、NKG2A、NKG2B、NKG2C、NKG2E、NKG2F、TAP1、TAP2及其功能片段的基因。在一些优选的实施方案中,佐剂选自IL-12、IL-15、CTACK、TECK或MEC。
在一些实施方案中,在哺乳动物中引起针对共有抗原的免疫应答的方法包括:诱导粘膜免疫应答法。这样的方法包括:将CTACK蛋白、TECK蛋白、MEC蛋白及其功能片段或其可表达编码序列中的一种或多种与上述含共有抗原的DNA质粒组合给予哺乳动物。CTACK蛋白、TECK蛋白、MEC蛋白及其功能片段中的一种或多种可以在施用本文提供的核酸疫苗之前、同时或之后施用。在一些实施方案中,将编码一种或多种选自由CTACK、TECK、MEC及其功能片段的蛋白的分离的核酸分子给予哺乳动物。
本发明的组合物可以具有有效组合物所需的特征,例如:安全,以至于所述组合物不会引起疾病或死亡;免受疾病;便于施用,几乎没有副作用,生物学稳定性和剂量成本低。
如上所述,所述组合物可以包含免疫原性组合物,例如疫苗,其包含一种或多种抗原。疫苗可用于预防多种抗原,从而治疗、预防和/或抵御抗原类病状。疫苗可显著地诱导接种疫苗的受试者的免疫应答,从而抵御和治疗抗原感染。
疫苗可以是DNA疫苗、肽疫苗或DNA和肽疫苗的组合。DNA疫苗可以包括编码抗原的核酸序列。核酸序列可以是DNA、RNA、cDNA、其变体、其片段或其组合。核酸序列还可包括编码通过肽键与抗原连接的接头序列、前导序列或标签序列的其他序列。肽疫苗可包括抗原肽、抗原蛋白、其变体、其片段或其组合。组合DNA和肽疫苗可以包括上述编码抗原和抗原性肽或蛋白质的核酸序列,其中抗原性肽或蛋白质和编码的抗原具有相同的氨基酸序列。
疫苗可以在接种疫苗的受试者中诱导体液免疫应答。诱导的体液免疫应答对该抗原具有特异性。诱导的体液免疫应答可以与抗原反应。在接种疫苗的受试者中可按照以下倍数诱导体液免疫应答:约1.5倍至约16倍、约2倍至约12倍或约3倍至约10倍。在接种疫苗的受试者中可按照以下倍数诱导体液免疫应答:至少约1.5倍、至少约2.0倍、至少约2.5倍、至少约3.0倍、至少约3.5倍、至少约4.0倍、至少约4.5倍、至少约5.0倍、至少约5.5倍、至少约6.0倍、至少约6.5倍、至少约7.0倍、至少约7.5倍、至少约8.0倍、至少约8.5倍、至少约9.0倍、至少约9.5倍、至少约10.0倍、至少约10.5倍、至少约11.0倍、至少约11.5倍、至少约12.0倍、至少约12.5倍、至少约13.0倍、至少约13.5倍、至少约14.0倍、至少约14.5倍、至少约15.0倍、至少约15.5倍或至少约16.0倍。
与未接种疫苗的受试者相比,由疫苗诱导的体液免疫应答可包括:与接种疫苗的受试者相关的中和抗体水平提高。中和抗体对抗原具有特异性。中和抗体可与抗原反应。中和抗体可以为接种疫苗的受试者提供针对感染及其相关病状的保护和/或治疗。
与未接种疫苗的受试者相比,由疫苗诱导的体液免疫应答可以包括:与接种疫苗的受试者相关的IgG抗体水平提高。这些IgG抗体对抗原具有特异性。这些IgG抗体可与抗原反应。优选地,体液应答对抗原的两种或多种菌株具有交叉反应性。与未接种疫苗的受试者相比,接种疫苗的受试者相关的IgG抗体水平可以提高约1.5倍至约16倍、约2倍至约12倍或约3倍至约10倍。与未接种疫苗的受试者相比,接种疫苗的受试者相关的IgG抗体水平可以提高至少约1.5倍、至少约2.0倍、至少约2.5倍、至少约3.0倍、至少约3.5倍、至少约4.0倍、至少约4.5倍、至少约5.0倍、至少约5.5倍、至少约6.0倍、至少约6.5倍、至少约7.0倍、至少约7.5倍、至少约8.0倍、至少约8.5倍、至少约9.0倍、至少约9.5倍、至少约10.0倍、至少约10.5倍、至少约11.0倍、至少约11.5倍、至少约12.0倍、至少约12.5倍、至少约13.0倍、至少约13.5倍、至少约14.0倍、至少约14.5倍、至少约15.0倍、至少约15.5倍或至少约16.0倍。
疫苗可以在施用疫苗的受试者中诱导细胞免疫应答。诱导的细胞免疫应答对该抗原可以具有特异性。诱导的细胞免疫应答可对抗原起反应。优选地,细胞应答对抗原的两种或多种菌株具有交叉反应性。诱导的细胞免疫应答可以包括引起CD8+T细胞应答。引起的CD8+T细胞应答可与抗原反应。引起的CD8+T细胞应答可以是多官能的。诱导的细胞免疫应答可以包括引发CD8+T细胞应答,其中CD8+T细胞产生干扰素-γ(IFN-γ)、肿瘤坏死因子α(TNF-a)、白介素2(IL-2),或IFN-γ和TNF-α的组合。
诱导的细胞免疫应答可以包括:与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD8+T细胞应答增强。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD8+T细胞应答增强约2倍至约30倍、约3倍至约25倍或约4倍至约20倍。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD8+T细胞应答增强至少约1.5倍、至少约2.0倍、至少约3.0倍、至少约4.0倍、至少约5.0倍、至少约6.0倍、至少约6.5倍、至少约7.0倍、至少约7.5倍、至少约8.0倍、至少约8.5倍、至少约9.0倍、至少约9.5倍、至少约10.0倍、至少约10.5倍、至少约11.0倍、至少约11.5倍、至少约12.0倍、至少约12.5倍、至少约13.0倍、至少约13.5倍、至少约14.0倍、至少约14.5倍、至少约15.0倍、至少约16.0倍、至少约17.0倍、至少约18.0倍、至少约19.0倍、至少约20.0倍、至少约21.0倍、至少约22.0倍、至少约23.0倍、至少约24.0倍、至少约25.0倍、至少约26.0倍、至少约27.0倍、至少约28.0倍、至少约29.0倍或至少约30.0倍。
诱导的细胞免疫应答可以包括:增加CD3+CD8+T细胞产生IFN-γ的频率。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD3+CD8+IFN-γ+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍或20倍。
诱导的细胞免疫应答可包括:增加CD3+CD8+T细胞产生TNF-α的频率。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD3+CD8+TNF-α+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍或14倍。
诱导的细胞免疫应答可以包括:增加CD3+CD8+T细胞产生IL-2的频率。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD3+CD8+IL-2+T细胞的频率可以增加至少约0.5倍、1.0倍、1.5倍、2.0倍、2.5倍、3.0倍、3.5倍、4.0倍、4.5倍或5.0倍。
诱导的细胞免疫应答可以包括:增加CD3+CD8+T细胞产生IFN-γ和TNF-α的频率。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD3+CD8+IFN-γ+TNF-α+T细胞的频率可以增加至少约25倍、30倍、35倍、40倍、45倍、50倍、55倍、60倍、65倍、70倍、75倍、80倍、85倍、90倍、95倍、100倍、110倍、120倍、130倍、140倍、150倍、160倍、170倍或180倍。
由疫苗诱导的细胞免疫应答可以包括:引起CD4+T细胞应答。引起的CD4+T细胞应答可与所需抗原反应。引起的CD4+T细胞应答可以是多功能的。诱导的细胞免疫应答可以包括引起CD4+T细胞应答,其中CD4+T细胞产生IFN-γ、TNF-α、IL-2或IFN-γ和TNF-α的组合。
诱导的细胞免疫应答可以包括:增加CD3+CD4+T细胞产生IFN-γ的频率。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD3+CD4+IFN-γ+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍或20倍。
诱导的细胞免疫应答可以包括:增加CD3+CD4+T细胞产生TNF-α的频率。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD3+CD4+TNF-α+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、21倍或22倍。
诱导的细胞免疫应答可以包括:增加CD3+CD4+T细胞产生IL-2的频率。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD3+CD4+IL-2+T细胞的频率可以增加至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、21倍、22倍、23倍、24倍、25倍、26倍、27倍、28倍、29倍、30倍、31倍、32倍、33倍、34倍、35倍、36倍、37倍、38倍、39倍、40倍、45倍、50倍、55倍或60倍。
诱导的细胞免疫应答可以包括:增加CD3+CD4+T细胞产生IFN-γ和TNF-α的频率。与未接种疫苗的受试者相比,接种疫苗的受试者相关的CD3+CD4+IFN-γ+TNF-α+的频率可以增加至少约2倍、2.5倍、3.0倍、3.5倍、4.0倍、4.5倍、5.0倍、5.5倍、6.0倍、6.5倍、7.0倍、7.5倍、8.0倍、8.5倍、9.0倍、9.5倍、10.0倍、10.5倍、11.0倍、11.5倍、12.0倍、12.5倍、13.0倍、13.5倍、14.0倍、14.5倍、15.0倍、15.5倍、16.0倍、16.5倍、17.0倍、17.5倍、18.0倍、18.5倍、19.0倍、19.5倍、20.0倍、21倍、22倍、23倍、24倍、25倍、26倍、27倍、28倍、29倍、30倍、31倍、32倍、33倍、34倍或35倍。
本发明的疫苗可以具有有效疫苗所需的特征,例如:安全,因此疫苗本身不会引起疾病或死亡;防止因接触活病原体(如病毒或细菌)而引起的疾病;诱导中和抗体以防止细胞的发明;诱导针对细胞内病原体的保护性T细胞;并且便于接种,几乎没有副作用,生物学稳定和剂量成本低。
当注射不同的组织例如肌肉或皮肤时,疫苗可进一步诱导免疫反应。当通过电穿孔或注射或皮下或肌内注射时,疫苗可进一步诱导免疫应答。
疫苗构建体和质粒
疫苗可包括编码一种或多种抗原的核酸构建体或质粒。所述核酸构建体或质粒可以包括或含有一个或多个异源核酸序列。本文提供了基因构建体,其可以包含编码抗原的核酸序列。基因构建体可以作为功能性染色体外分子存在于细胞中。基因构建体可以是线性微型染色体,包括着丝粒、端粒或质粒或粘粒。基因构建体可以包括或含有一个或多个异源核酸序列。
基因构建体可以是以任何顺序表达抗原的质粒形式。
基因构建体也可以是重组病毒载体基因组的一部分,所述重组病毒载体包括重组腺病毒、重组腺病毒相关病毒和重组牛痘。所述基因构建体可以是减毒活微生物或在细胞中生长的重组微生物载体的基因材料的一部分。
基因构建体可包含用于核酸编码序列的基因表达的调节元件。调节元件可以是启动子、增强子、起始密码子、终止密码子或聚腺苷酸化信号。
核酸序列可以构成基因构建体,所述基因构建体可以是载体。所述载体能够在哺乳动物的细胞中以在哺乳动物中引起免疫应答的有效量表达抗原。载体可以是重组载体。载体可以包含编码抗原的异源核酸。载体可以是质粒。载体可用于通过用编码抗原的核酸转染细胞,在发生抗原表达的条件下培养并维持转化的宿主细胞。
可以在稳定性和高水平表达方面对编码序列进行优化。在一些情况下,选用密码子来减少RNA的二级结构形成,例如由于分子内键合而形成的二级结构。
载体可以包含编码抗原的异源核酸,并且可以进一步包含处于一个或多个癌抗原编码序列上游的起始密码子和处于所述抗原编码序列下游的终止密码子。起始密码子和终止密码子可与抗原的编码序列符合读框。载体还可包含可操作地连接至抗原的编码序列的启动子。可操作地连接至抗原的编码序列的启动子可以是猿猴病毒40(SV40)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、人免疫缺陷病毒(HIV)启动子(如牛免疫缺陷病毒(BIV)长末端重复(LTR)启动子等)、莫洛尼病毒启动子、禽白血病病毒(ALV)启动子、巨细胞病毒(CMV)启动子(如CMV即刻早期启动子)、爱泼斯坦-巴尔病毒(EBV)启动子或劳斯肉瘤病毒(RSV)启动子。所述启动子也可以是源自人类基因,例如人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或人金属硫蛋白的启动子。所述启动子也可以是组织特异性启动子,例如天然或合成的肌肉或皮肤特异性启动子。此类启动子的实例描述于美国专利申请公开第US20040175727号,其内容以其全文并入本文。
载体还可以包含聚腺苷酸化信号,其可以在抗原的编码序列的下游。聚腺苷酸化信号可以是SV40聚腺苷酸化信号、LTR聚腺苷酸化信号、牛生长激素(bGH)聚腺苷酸化信号、人生长激素(hGH)聚腺苷酸化信号或人β-球蛋白聚腺苷酸化信号。SV40聚腺苷酸化信号可以是来自pCEP4载体(加利福尼亚州圣地亚哥英杰生命科技有限公司)的聚腺苷酸化信号。
载体还可以包含抗原上游的增强子。增强子对DNA表达是必需的。增强子可以是人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或病毒增强子,例如来自CMV、HA、RSV或EBV的增强子。美国专利第5,593,972号、第5,962,428号和第WO94/016737号记载了多核苷酸功能增强,其各自的内容通过引用以其整体并入。
载体还可以包含哺乳动物的复制起点,以便在染色体外维持载体并在细胞中多次拷贝载体。载体可以是来自英杰生命科技有限公司(加利福尼亚州圣地亚哥)的pVAX1、pCEP4或pREP4,其可包含爱泼斯坦-巴尔病毒的复制起点和核抗原EBNA-1编码区,其可产生高拷贝数的游离型复制产物而不整合。载体可以是具有变化的pVAX1或pVax1变体,例如本文所述的变体质粒。变体pVax1质粒是一种2998个碱基对大小的骨架载体质粒pVAX1(加利福尼亚州卡尔巴斯德英杰生命科技有限公司)的变体。CMV启动子位于第137-724位碱基。T7启动子/引发位点位于第664-683位碱基。多个克隆位点位于第696-811位碱基。牛GH聚腺苷酸化信号位于第829-1053位碱基。卡那霉素抗性基因位于第1226-2020位碱基。pUC起点位于第2320-2993位碱基。
基于可从英杰生命科技有限公司获得的pVAX1的序列,在用作本文所述的质粒1-6的主链的pVAX1的序列中发现以下突变:
在CMV启动子中,C>G241
在牛生长激素聚腺苷酸化信号(bGHpolyA)的下游,C>T1942主链
在卡那霉素基因的下游,A>-2876主链
在pUC复制起点(Ori)高拷贝数突变(参见《核酸研究》(1985)),C>T3277
在RNASeH位点上游的pUC Ori末端,G>C 3753
在CMV启动子上游的主链上,碱基对2、3和4从ACT变成CTG。
载体的主链可以是pAV0242。所述载体可以是复制缺陷型5型腺病毒(Ad5)载体。
载体还可以包含调节序列,其很适合在给予载体的哺乳动物或人细胞中表达基因。本文公开的一种或多种癌抗原序列可以包含密码子,其可以允许编码序列在宿主细胞中更有效地转录。
载体可以是pSE420(加利福尼亚州圣地亚哥英杰生命科技有限公司),可用于在大肠杆菌(E.coli)中生产蛋白质。所述载体也可以是pYES2(加利福尼亚州圣地亚哥英杰生命科技有限公司),可用于在酵母的酿酒酵母菌株中生产蛋白质。所述载体也可以是MAXBACTM完整杆状病毒表达系统(加利福尼亚州圣地亚哥英杰生命科技有限公司),可用于在昆虫细胞中生产蛋白质。所述载体也可以是pcDNA I或pcDNA3(加利福尼亚州圣地亚哥英杰生命科技有限公司),可用于在哺乳动物细胞,例如,中国仓鼠卵巢(CHO)细胞中产生蛋白质。载体可以是通过常规技术和可供使用的原始资料生产蛋白质的表达载体或表达系统,所述原始资料包括山姆布鲁克(Sambrook)等人的《分子克隆和实验手册(第二版)》,冷泉港(1989),该文献通过引用以其整体并入。
7.赋形剂和组合物的其他成分
组合物可进一步包括药学上可接受的赋形剂。药学上可接受的赋形剂可以是功能分子,例如媒介物、载体或稀释剂。药学上可接受的赋形剂可以是转染促进剂,其可以包括表面活性剂(如免疫刺激复合物(ISCOMS))、弗氏不完全佐剂、LPS类似物(包括单磷酰脂质A)、胞壁肽、醌类似物、囊泡(如角鲨烯和角鲨烯)、透明质酸、脂质、脂质体、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米颗粒,或其他已知的转染促进剂。
转染促进剂是聚阴离子、聚阳离子(包括聚-L-谷氨酸盐(LGS))或脂质。转染促进剂是聚-L-谷氨酸盐,并且聚-L-谷氨酸盐可以小于6mg/ml的浓度存在于组合物中。转染促进剂还可以包括表面活性剂(如免疫刺激复合物(ISCOMS))、弗氏不完全佐剂、LPS类似物(包括单磷酰脂质A)、胞壁肽、醌类似物、囊泡(如角鲨烯和角鲨烯),透明质酸也可以与组合物一起施用。所述组合物还可包含转染促进剂,例如脂质、脂质体(包括卵磷脂脂质体或本领域已知的其他脂质体,作为DNA-脂质体混合物(参见例如W09324640))、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米颗粒或其他已知的转染促进剂。转染促进剂是聚阴离子、聚阳离子(包括聚-L-谷氨酸盐(LGS))或脂质。疫苗中转染剂的浓度小于4mg/ml、小于2mg/ml、小于1mg/ml、小于0.750mg/ml、小于0.500mg/ml、小于0.250mg/ml、小于0.100mg/ml、小于0.050mg/ml或小于0.010mg/ml。
所述组合物可以进一步包含基因促进剂。
所述组合物可以包含的DNA的量为:约1ng至100mg;约1μg至约10mg;或优选地,约0.1μg至约10mg;或更优选地,约1mg至约2mg。在一些优选的实施方案中,本发明所述的组合物包含约5ng至约1000μg的DNA。在一些优选的实施方案中,组合物可以含有约10ng至约800μg的DNA。在一些优选的实施方案中,组合物可以含有约0.1至约500μg的DNA。在一些优选的实施方案中,组合物可以含有约1至约350μg的DNA。在一些优选的实施方案中,组合物可含有约25至约250μg,约100至约200μg,约1ng至100mg;约1μg至约10mg;约0.1μg至约10mg;约1mg至约2mg,约5ng至约1000μg,约10ng至约800μg,约0.1至约500μg,约1至约350μg,约25至约250μg,约100到约200μg的DNA。
可根据所使用的给药方式来配制组合物。注射用药物组合物可以是无菌、无热原和不含颗粒。可以使用等渗制剂或溶液。等渗添加剂可以包括氯化钠、葡萄糖、甘露醇、山梨糖醇和乳糖。所述组合物可以包含血管收缩剂。等渗溶液可包括磷酸盐缓冲盐水。所述组合物可进一步包含稳定剂,所述稳定剂包括明胶和白蛋白。稳定剂可以使制剂在室温或环境温度下长时间保持稳定,稳定剂包括LGS或聚阳离子或聚阴离子。
8.生成编码结构修饰的DMAb的核酸分子的方法
有多种工程策略可用于获得本发明的工程化的DMAb。
DMAb的完整移植
在一个实施方案中,结构修饰的DMAb是通过完整移植产生的。在一个实施方案中,完整移植的方法包括:将亲本DMAb的可变轻链和可变重链的CDR区转移到较高表达DMAb的框架上。在一个实施方案中,编码结构修饰的DMAb的核酸序列是由完整移植物DMAb的氨基酸序列产生。
在一个实施方案中,核酸序列被优化。优化可以包括以下一种或多种优化:添加低GC含量的前导序列以增加转录;mRNA稳定性和密码子优化;添加kozak序列(例如,GCC ACC)以提高翻译;添加IRES序列以增加翻译;添加WPRE序列以增加转录;添加编码信号肽的免疫球蛋白(Ig)前导序列;以及在可能的范围内消除顺式作用序列基序(即内部TATA盒)。
在一个实施方案中,生成一种核酸分子,其包含编码结构修饰的DMAb的优化的核酸序列。生成核酸分子的任何方法均可用于生成编码本发明的结构修饰的DMAb的核酸分子。生成包含特定核苷酸序列的核酸分子的方法是本领域公知的。
DMAb的部分移植
在一个实施方案中,结构修饰的DMAb是通过部分移植产生的。在一个实施方案中,部分移植的方法包括:潜在修饰的结构匹配和比较建模中的一种或多种。在一个实施方案中,亲本DMAb VL结构域序列与一个或多个经验证的高度表达的支架VL序列的VL结构域进行匹配。在一个实施方案中,对多个潜在的部分移植物序列进行比较建模,所述多个潜在的部分移植物序列包含:通过VL结构域的结构叠加预测的突变。在一个实施方案中,比较建模的方法包括:能量最小化分析、界面分析、序列特性预测和拉曼图(Ramachandran)分析中的至少一种。一种候选的部分移植物DMAb是具有良好预测特性(例如,稳定性提高)的DMAb。
在一个实施方案中,编码结构修饰的DMAb的核酸序列是由所预测的部分移植物DMAb的氨基酸序列产生。在一个实施方案中,编码结构修饰的DMAb的核酸序列得到进一步优化,并且生成了包含优化的编码结构修饰的DMAb的核酸序列的核酸分子。
支架修饰
在一个实施方案中,结构修饰的DMAb是通过支架修饰产生的。在一个实施方案中,支架修饰的方法包括:使亲本DMAb的氨基酸序列发生一个或多个特定氨基酸变化,以生成本发明的结构修饰的DMAb。在一个实施方案中,与亲本DMAb相比,特定氨基酸变化改善了结构修饰的DMAb的稳定性、重链和轻链界面以及分泌中的至少一种。在一个实施方案中,与亲本DMAb相比,特定氨基酸变化降低了可变链界面处的DMAb的聚集、结构修饰的DMAb的Pi相互作用、等电点和拉曼图分析。在一个实施方案中,进行一种或多种特定氨基酸变化以导致等电点修饰、VH-VL界面相互作用的改变或其组合。
在一个实施方案中,编码结构修饰的DMAb的核酸序列是由修饰的氨基酸序列产生。在一个实施方案中,编码结构修饰的DMAb的核酸序列得到进一步优化,并生成了包含优化的编码结构修饰的DMAb的核酸序列的核酸分子。
ScFv-Fc结构修饰的DMAb
在一个实施方案中,显示低表达的亲本DMAb经历一轮或多轮的scFv建模。在各种实施方案中,ScFv建模包括:接头建模、铰链修饰建模、框架建模和CDR环优化中的至少一种。在各种实施方案中,以VH-接头-VL和VL-接头-VH格式中的至少一种对DMAb序列进行建模。在一个实施方案中,用各种输入序列进行多轮建模,直至预测到变体,其中接头不遮蔽CDR或最小限度地影响CDR。例如,在一个实施方案中,所预测的变体的接头预计会遮蔽一个或多个CDR,因此使用新的接头序列进行另一轮的ScFv建模。在一个实施方案中,新的接头可以比先前建模的接头更长、更短或具有不同的氨基酸序列。在一个实施方案中,在进行一轮或多轮ScFv建模之后,对预测的结构进行分析以确定预测的DMAb是否是进一步发育用的候选物。例如,在一个实施方案中,对接头融合位点附近的区域进行RMSD分析。在一个实施方案中,选择由接头对CDR的模糊度最小的预测的DMAb作为候选DMAb。在一个实施方案中,选择在接头融合位点附近具有低预测RMSD的预测DMAb作为候选DMAb。
在一个实施方案中,优化了编码候选变体的核酸分子。在一个实施方案中,对分别编码每个VH、接头和VL序列的核苷酸序列进行优化(即,核苷酸序列的模块化优化)。在一个实施方案中,对编码VH-接头-VL的核苷酸序列作为单个核苷酸序列进行优化。在一个实施方案中,对编码VL-接头-VH的核苷酸序列作为单个核苷酸序列进行优化。
在一个实施方案中,生成一种编码结构修饰的DMAb的核酸分子。在一个实施方案中,核酸分子包含编码结构修饰的DMAb的优化的核酸序列。
在一个实施方案中,接着,将结构修饰的DMAb的表达水平和抗原结合与亲本DMAb的表达水平和抗原结合进行比较。在一个实施方案中,结构修饰的DMAb的表达高于亲本DMAb的表达并且仍然显示抗原结合,然后进一步测试结构修饰的DMAb在受试者中的体内表达和产生免疫应答的能力。
9.生成合成抗体的方法
本发明还涉及一种生成合成抗体的方法。所述方法可以包括:通过使用下文更详细描述的递送方法将组合物给予有需要的受试者。因此,在将组合物给予受试者时,在受试者中或体内生成合成抗体。
所述方法还可以包括:将组合物导入一个或多个细胞中。因此,合成抗体可以在一个或多个细胞中生成或产生。所述方法可以进一步包括:将组合物导入一种或多种组织中,例如但不限于皮肤和肌肉。因此,合成抗体可以在一种或多种组织中生成或产生。
10.鉴定或筛选抗体的方法
本发明进一步涉及鉴定或筛选与上述抗原反应或结合的上述抗体的方法。鉴定或筛选抗体的方法可以使用本领域技术人员已知的方法中的抗原来鉴定或筛选抗体。这样的方法包括但不限于从文库(例如,噬菌体展示文库)中选择抗体和免疫接种的动物,然后分离和/或纯化抗体。
11.递送组合物的方法
本发明还涉及将组合物递送至有需要的受试者的方法。递送方法可包括:将组合物给予受试者。给药可以包括但不限于:通过和不通过体内电穿孔注射DNA、脂质体介导的递送和纳米颗粒促进的递送。
接受被递送的组合物的哺乳动物可以是人、灵长类、非人灵长类、奶牛、牛、绵羊、山羊、羚羊、野牛、水牛、野牛、牛科动物、鹿、刺猬、大象、美洲驼、羊驼、小鼠、大鼠和鸡。
组合物可以通过不同途径施用,包括口服、肠胃外给药、舌下给药、经皮给药、直肠给药、经粘膜给药、局部给药、吸入药剂、口腔含化给药、胸膜内给药、静脉内注射、动脉注射、腹膜注射、皮下给药、肌内给药、鼻腔给药、鞘内注射和关节内注射或其组合。关于兽用,可根据正常兽医实践将组合物作为适当可接受的制剂给药。兽医可容易地确定最适合特定动物的给药方案和给药途径。所述组合物可以通过传统的注射器、无针注射装置、“微粒轰击枪”或其他物理方法例如电穿孔(“EP”)、“流体力学方法”或超声来给予。
a.电穿孔
可以使用电穿孔装置来实现通过电穿孔的组合物的施用,所述电穿孔装置可以被构造成将能量脉冲输送至哺乳动物的期望的组织,所述能量脉冲能有效地使可逆孔在细胞膜中形成,并且优选地,所述能量脉冲是一个恒定电流,其类似于用户输入的预设电流。电穿孔装置可以包括电穿孔部件和电极组件或手柄组件。电穿孔部件可包括电穿孔装置的各种元件中的一个或多个并与其结合,包括:控制器、电流波形发生器、阻抗测试仪、波形记录器、输入元件、状态报告元件、通信端口、存储元件、电源和电源开关。可以使用体内电穿孔装置,例如CELLECTRAEP系统(宾夕法尼亚州普利茅斯会议市的Inovio制药公司)或Elgen电穿孔器(宾夕法尼亚州普利茅斯会议市的Inovio制药公司)来完成电穿孔,以促进质粒转染细胞。
电穿孔组件可以用作电穿孔装置的一个元件,而其他元件是与电穿孔组件连通的独立元件(或组件)。电穿孔组件不仅仅用作电穿孔设备的一个元件,它还可与电穿孔设备中与电穿孔组件分开的其他元件连通。作为一种机电或机械装置的一部分而存在的电穿孔装置的元件可以不受限制,因为这些元件可以用作一个装置或用作彼此连通的独立元件。电穿孔部件能够向所需组织输送能量脉冲,所述能量脉冲产生恒定电流并且包括反馈机制。电极组件可包括在空间排列上具有多个电极的电极阵列,其中电极组件接收来自电穿孔组件的能量脉冲并通过电极将其输送到期望的组织。所述多个电极中的至少一个在能量脉冲的输送期间是中性的,并且测量期望的组织中的阻抗,将阻抗输送至电穿孔组件。反馈机制可以接收测得的阻抗,并且可以调节由电穿孔组件输送的能量脉冲以维持恒定电流。
多个电极可以以分散的方式输送能量脉冲。多个电极可以在编程的序列下通过控制电极以分散的方式输送能量脉冲,并且用户将编程的序列输入到电穿孔组件中。编程的序列可包括:依次输送多个脉冲,其中所述多个脉冲中的每个由至少两个有源电极与一个测量阻抗的中性电极一起输送,并且其中所述多个脉冲中的后续脉冲由至少两个有源电极中不同的一个有源电极与一个测量阻抗的中性电极一起输送。
反馈机制可以通过硬件或软件来执行。反馈机制可以由模拟闭环电路执行。每50μs、20μs、10μs或1μs发生一次反馈,但优选是实时反馈或瞬时反馈(即,由确定应答时间的可用技术所确定的基本瞬时)。中性电极可测量所需组织中的阻抗并将阻抗输送至反馈机制,并且反馈机制对所述阻抗作出应答并调节能量脉冲以将恒定电流维持在类似于预设电流的值。反馈机制可以在输送能量脉冲期间连续且瞬时地保持恒定电流。
有利于递送本发明的组合物的电穿孔装置和电穿孔方法的实例包括:Draghia-Akli等人提交的美国专利第7,245,963号和Smith等人提交的美国专利公开第2005/0052630号中记载的电穿孔装置和电穿孔方法,其内容通过引用以其整体并入于此。可用于促进组合物递送的其他电穿孔装置和电穿孔方法包括:在2007年10月17日提交的共同未决且共同拥有的美国专利申请序列第11/874072号中提供的电穿孔装置和电穿孔方法,其根据美国法典35 119(e)要求分别于2006年10月17日和2007年10月10日提交的美国临时申请序列第60/852,149号和第60/978,982号的优先权,以上各临时专利申请通过引用以其整体并入于此。
Draghia-Akli等人的美国专利第7,245,963号记载了模块化电极系统及其在促进将生物分子导入体内或植物中选定的组织的细胞中的用途。模块化电极系统可包括多个针状电极;皮下注射针;使可编程恒流脉冲控制器电连接至多个针状电极的电连接器;和电源。操作员可以抓住安装在支撑结构上的多个针状电极,然后将其牢固地插入体内或植物中选定的组织,接着通过皮下注射针将生物分子输送到选定的组织中。可编程恒流脉冲控制器被激活,并且恒流电脉冲被施加到多个针状电极。施加的恒流电脉冲有助于将生物分子导入到多个电极之间的细胞中。美国专利第7,245,963的全部内容通过引用并入于此。
Smith等人提交的美国专利公开第2005/0052630记载了一种可用于有效地促进生物分子导入体内或植物中选定的组织的细胞中的电穿孔装置,该电穿孔装置包括电动装置(“EKD装置”),其操作由软件或固件指定。EKD设备根据用户的控制及输入的脉冲参数在阵列的电极之间产生一系列可编程的恒流脉冲图案,并且允许储存及获取电流波形数据。该电穿孔装置还包括一种可替换的具有针状电极阵列的电极盘、注射针的中央注射通道以及可移除的引导盘。美国专利公开第2005/0052630号的全部内容通过引用并入于此。
在美国专利第7,245,963号和美国专利公开第2005/0052630号中记载的电极阵列和方法不仅可适用于深层渗透到诸如肌肉的组织中,而且可适用于深层渗透到其他组织或器官中。由于电极阵列的配置,注射针(用于递送选择的生物分子)也完全插入到靶器官中,并且在电极预先划定的区域内垂直于靶组织进行注射。美国专利第7,245,963号和美国专利公开第2005/005263号中记载的电极优选长度为20mm,规格为21Ga。
另外,在涉及电穿孔设备及其用途的一些实施方案中,考虑以下专利中记载的电穿孔设备:1993年12月28日授权的美国专利5,273,525、2000年8月29日授权的美国专利6,110,161、2001年7月17日授权的美国专利6,261,281和2005年10月25日授权的美国专利6,958,060以及2005年9月6日授权的美国专利6,939,862。此外,本文考虑以下专利中涉及主题的专利:2004年2月24日授权的美国专利6,697,669,其涉及使用多种设备中的任意一种设备来递送DNA,和2008年2月5日授权的美国专利7,328,064,其涉及注射DNA的方法。以上专利通过引用以其整体并入于此。
12.治疗方法
本文还提供了通过在有需要的受试者中生成结构修饰的DMAb来治疗、抵御和/或预防所述受试者的疾病的方法。所述方法可以包括:将组合物给予受试者。可以使用上述递送方法将组合物给予受试者。
在受试者体内生成结构修饰的DMAb之后,合成抗体可与抗原结合或反应。这种结合可以中和抗原,阻止另一种分子例如蛋白质或核酸识别抗原,并引发或诱导对该抗原的免疫应答,从而治疗、抵御和/或预防与受试者体内的抗原相关的疾病。
可以提供递送疫苗或接种疫苗的方法以诱导治疗性和预防性免疫应答。疫苗接种过程可以在哺乳动物中产生针对抗原的免疫应答。疫苗可递送至个体以调节哺乳动物的免疫系统的活性并增强免疫应答。疫苗的递送可以是作为在细胞中表达并递送至细胞表面的核酸分子的共有抗原的转染,所述免疫系统在细胞表面识别并诱导细胞应答、体液应答、或细胞和体液应答。通过对哺乳动物接种如上所述的疫苗,疫苗的递送可用于在哺乳动物中诱导或引发针对抗原的免疫应答。
组合物的剂量按活性成分计可以为1μg至10mg/kg体重/时间,并且按活性成分计可以为20μg至10mg/kg体重/时间。可以每1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31天给予一次组合物。用于有效治疗的组合物剂量的数量可以是1、2、3、4、5、6、7、8、9或10。
该组合物可以包含一种或多种、2种或更多种、3种或更多种、4种或更多种、5种或更多种、6种或更多种、7种或更多种、8种或更多种、9种或更多种、或10种或更多种编码抗原的DNA疫苗。所述组合物可以包含1个或多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、或10个或更多个结构修饰的DMAb或其片段。
DNA疫苗和编码结构修饰的DMAb的核酸分子可以同时或在不同时间施用。在一个实施方案中,同时接种DNA疫苗和施用编码结构修饰的DMAb的核酸分子。在一实施方案中,先接种DNA疫苗,再施用编码结构修饰的DMAb的核酸分子。在一个实施方案中,先施用编码结构修饰的DMAb的核酸分子,再接种DNA疫苗。
在某些实施方案中,施用编码结构修饰的DMAb的核酸分子之后的1天或多天、2天或更多天、3天或更多天、4天或更多天、5天或更多天、6天或更多天、7天或更多天、8天或更多天、9天或更多天、10天或更多天、11天或更多天、12天或更多天、13天或更多天或14天或更多天再接种DNA疫苗。在某些实施方案中,施用编码结构修饰的DMAb的核酸分子之后的1周或多周、2周或更多周、3周或更多周、4周或更多周、5周或更多周、6周或更多周、7周或更多周、8周或更多周、或9周或更多周再接种DNA疫苗。在某些实施方案中,施用编码结构修饰的DMAb的核酸分子之后的1个月或多个月、2个月或更多个月、3个月或更多个月、4个月或更多个月、5个月或更多个月、6个月或更多个月、7个月或更多个月、8个月或更多个月、9个月或更多个月、10个月或更多个月、11个月或更多个月、或12个月或更多个月再接种DNA疫苗。
在某些实施方案中,接种DNA疫苗之后的1天或多天、2天或更多天、3天或更多天、4天或更多天、5天或更多天、6天或更多天、7天或更多天、8天或更多天、9天或更多天、10天或更多天、11天或更多天、12天或更多天、13天或更多天或14天或更多天再施用编码结构修饰的DMAb的核酸分子。在某些实施方案中,接种DNA疫苗之后的1周或多周、2周或更多周、3周或更多周、4周或更多周、5周或更多周、6周或更多周、7周或更多周、8周或更多周、9周或更多周、或10周或更多周再施用编码结构修饰的DMAb的核酸分子。在某些实施方案中,接种DNA疫苗之后的1个月或多个月、2个月或更多个月、3个月或更多个月、4个月或更多个月、5个月或更多个月、6个月或更多个月、7个月或更多个月、8个月或更多个月、9个月或更多个月、10个月或更多个月、11个月或更多个月、或12个月或更多个月再施用编码结构修饰的DMAb的核酸分子。
在某些实施方案中,编码结构修饰的DMAb的核酸分子和DNA疫苗施用一次。在某些实施方案中,编码结构修饰的DMAb的核酸分子和/或DNA疫苗施用不止一次。在某些实施方案中,施用编码结构修饰的DMAb的核酸分子和DNA疫苗提供持久的和全身性的免疫应答。
13.与抗生素组合使用
本发明还提供了通过给予结构修饰的DMAb和治疗性抗生素剂的组合来治疗、抵御和/或预防有需要的受试者的疾病的方法。
可使用任何合适的方法来施用结构修饰的DMAb和抗生素剂,使得受试者中同时存在结构修饰的DMAb和抗生素剂的组合。在一个实施方案中,该方法可包括:通过上文详细描述的任何一种方法来施用包含编码本发明的结构修饰的DMAb的核酸分子的第一组合物,以及在施用合成抗体之后少于1天、少于2天、少于3天、少于4天、少于5天、少于6天、少于7天、少于8天、少于9天或少于10天施用包含抗生素剂的第二组合物。在一个实施方案中,该方法可以包括:通过上文详细描述的任何一种方法来施用包含编码本发明的结构修饰的DMAb的核酸分子的第一组合物,以及在施用合成抗体之后超过1天、超过2天、超过3天、超过4天、超过5天、超过6天、超过7天、超过8天、超过9天或超过10天施用包含抗生素剂的第二组合物。在一个实施方案中,该方法可以包括:通过上文详细描述的任何一种方法来在施用抗生素剂之后少于1天、少于2天、少于3天、少于4天、少于5天、少于6天、少于7天、少于8天、少于9天或少于10天施用包含抗生素剂的第一组合物且施用包含编码本发明的结构修饰的DMAb的核酸分子的第二组合物。在一个实施方案中,该方法可以包括:通过上文详细描述的任何一种方法来在施用抗生素剂之后超过1天、超过2天、超过3天、超过4天、超过5天、超过6天、超过7天、超过8天、超过9天或超过10天施用包含抗生素剂的第一组合物且施用包含编码本发明的结构修饰的DMAb的核酸分子的第二组合物。在一个实施方案中,该方法可包括:通过上文详细描述的任何一种方法来施用包含编码本发明的结构修饰的DMAb的核酸分子的第一组合物,同时施用包含抗生素剂的第二组合物。在一个实施方案中,该方法可包括:施用包含编码本发明的结构修饰的DMAb的核酸分子和抗生素剂的单一组合物。
可与本发明的合成抗体组合使用的抗生素的非限制性实例包括:氨基糖苷类(如庆大霉素、阿米卡星、妥布霉素);喹诺酮类(如环丙沙星、左氧氟沙星);头孢菌素(如头孢他啶、头孢吡肟、头孢哌酮、头孢匹罗、头孢吡普);抗假单胞菌青霉素:羧青霉素(如羧苄青霉素和羟基噻吩青霉素)和脲基青霉素(如美洛西林、阿洛西林和哌拉西林);碳青霉烯(如美罗培南、亚胺培南、多尼培南);多粘菌素(如多粘菌素B和粘菌素);以及单环β-内酰胺类(如氨曲南)。
本发明包括多个方面,通过以下非限制性实施例进行说明。
14.实施例
下面通过实施例进一步说明本发明。应当理解,这些实施例是本发明的优选实施方案,仅仅作为示例。根据上述讨论和这些实施例,本领域技术人员可以确定本发明的基本特征,并且在不脱离本发明的精神和范围的情况下,可以对本发明进行各种更改和修改以使其适应各种用途和条件。因此,除了本文示出和描述的修改之外,根据上文的描述,本发明的各种修改对于本领域技术人员来说是显而易见的。这些修改旨在落入所附权利要求的范围内。
实施例1:移植和支架修饰
DNA载体编码的单克隆抗体(DMAb)提供了通过使用电穿孔(EP)转染骨骼肌来生成体内mAb的手段。前期研究已证明,DMAb可以达到较高的血清水平,并在流感和假单胞菌鼠攻击模型中显示出与纯化的mAb相当的保护作用。为了临床应用的目的,通过优化配方、给药、核苷酸和氨基酸,集中精力进一步提高DMAb的体内表达水平。已经开发出多种利用框架移植的DMAb抗体修饰策略,以增加DMAb的体内表达水平而不牺牲原始mAb克隆的生物学性。
图1提供了用于生成优化的DMAB的多种策略的概述。策略包括完整支架移植、部分支架移植和支架修饰(多点突变)。
完整支架移植包括将具有不期望的性能的CDR从一个Fv区(VH或VL)移至具有所需性能的另一个Fv的框架上。该方法有点类似于抗体人源化中使用的方法。因为Fv的选择有限,所以使得理想的CDR放置遇到挑战。表达可以受到正面影响,但如果支架不完全相容,则结合可能受到负面影响。
部分支架移植包括改变支架的选定区域,目的是增加折叠稳定性。避免太靠近CDR的区,以使CDR扰动最小化。通常改变可变轻链的N末端的前20个以内的残基以模拟具有高表达的DMAb的序列。
支架修饰包括进行一系列预测的多重突变,以增加VH-VL界面处的稳定作用或有利地改变等电点。一般实施约3-4个单个氨基酸改变以提高稳定性。
下面描述方法。
在一个治疗位点先向BALB/c小鼠(n=8)肌内注射100μg编码DMAb的DNA质粒,然后进行电穿孔(IM-EP)。在第7天,通过ELISA定量DMAb的血清水平。在第7天,通过ELISA评估血清DMAb的结合。
对BDBV223和Z5D2抗体进行了部分移植、完整移植和支架修饰(如表1所详细列出)。
表1.工程化DMAb
DMAb类型 名称 说明
原始 pGX9228 埃博拉病毒BDBV223
原始 pGX9224 埃博拉病毒Z5D2
部分移植物 pGX9292 埃博拉病毒Z5D2部分移植物
完整移植物 pGX9293 埃博拉病毒Z5D2移植到MERSYTE_1
完整移植物 pGX9294 埃博拉病毒Z5D2移植到MERSYTE_2
完整移植物 pGX9295 埃博拉病毒Z5D2移植到V2L2
部分移植物 pGX9297 埃博拉病毒BDBV223部分移植物
完整移植物 pGX9298 埃博拉病毒BDBV223移植到MERSYTE
完整移植物 pGX9299 埃博拉病毒BDBV223移植到V2L2
现在描述结果。
生成多个构建体并通过ELISA进行体内表达的筛选。部分移植方法由以下组成:用高表达DMAb的一部分替代弱表达子的可变轻链框架区的一部分。新的部分移植构建体显示出比原始DMAb增加大约一个对数,同时保持结合。
BDBV223的部分移植产生具有增强的表达和维持性结合的优化的抗体(图2)。相反,将BDBV223完整移植到V2L2上增强表达,但会导致抗原结合丧失(图2)。对于Z5D2抗体,观察到相似的结果。Z5D2的部分移植产生了具有增强的表达和维持性结合的优化的抗体,而Z5D2的完整移植则导致抗原结合丧失(图3)。图4提供了完整移植、部分移植和支架修饰对由三种不同的亲本DMAb序列修饰的结构修饰的DMAb的表达和抗原结合的影响的概要。
实施例2:部分移植物设计
将两个高表达DMAB(pGX9232和pGX9214)与pGX9256(1A2)和pGX9290(EBV114)的DMAB轻链对齐(图4)。
计算具有和不具有CDR的同一性矩阵。结果如图5所示。仅用FR1(取决于第一个Cys残基)和FR4也产生了比对矩阵。FR1矩阵模式的模式与VL矩阵和无CDR的矩阵相同。仅基于10个残基(不包括末端R)的FR4矩阵呈现出不同的模式,但整体上高度相似。在不受任何特定理论的约束下,假设相似分数越高越好。工程化部分移植物的序列是:
>pGX9256_(232)_L(SEQ ID NO:58)
>pGX9290_(232)_L(SEQ ID NO:59)
>pGX9256_(214)_L(SEQ ID NO:60)
>pGX9290_(214)_L(SEQ ID NO:61)。
实施例3:scFv-Fc转化
单链Fv-Fc(scFv-Fc)转化是去除CH1和CL区域,并在VH和VL之间添加接头。转化促进重链-轻链配对和组织渗透。通过添加接头将DMAb从全长抗体转化为scFv-Fc(如图6和图7所示)。
现在描述方法。
在一个治疗位点先向BALB/c小鼠(n=5)肌内注射100μg编码scFv-Fc DMAb的DNA质粒,然后进行电穿孔(IM-EP)。在给药后35天的过程中收集血清。
用编码scFv-Fc DMAb的DNA质粒转染293T细胞。使用蛋白A从细胞上清液中纯化scFv-Fc DMAb,并使用两种来自不同埃博拉病毒爆发株,即1976年的Mayinga株或2014年Guinea株的扎伊尔型埃博拉病毒糖蛋白(GP)的相同抗原通过ELISA分析它们的归一化结合亲和力。
表2.scFv-Fc工程化DMAb
DMAb类型 名称 说明
原始 pGX9224 埃博拉病毒Z5D2
原始 pGX9225 埃博拉病毒Z1H3
原始 pGX9228 埃博拉病毒BDBV223
scFV-Fc pGX9330 埃博拉病毒Z5D2 scFv-Fc
scFV-Fc pGX9331 埃博拉病毒Z1H3 scFv-Fc
scFV-Fc pGX9332 埃博拉病毒BDBV223 scFv-Fc
现在描述结果。
BDBV223的scFv-Fc转化导致抗原结合力降低(图8)。Z5D2的scFv-Fc转化导致表达增加和抗原结合增强(图9)。Z1H3的scFv-Fc转化导致表达增加,但对抗原结合没有影响(图10)。
实施例4:scFv-Fc设计
有几种可能的工程方法,但是尽管有其他要求,该领域中的许多出版物往往都是根据系统而定的。目前正在dMAb空间中测试的用于设计的几种新方法可能为scFv-Fc空间提供思路。
进行建模和分析以鉴定与增强的结合和/或表达相关的scFv DMAb的结构特征。使用(G4S)3接头通过两种形式(VH-VL和VL-VH)对Fv和scFv进行建模。生成了15组模型,每组包括多个模型。评分方法和结构检查用于评估每个步骤中的模型构建。图11描绘了建模过程中不同步骤的示例性输出,其中包括框架建模和CDR环优化。评价前20个接头的构象。产生主链的均方根偏差(RMSD),并注意接头附近的区。
接头
选择具有GGGGSGGGGSGGGGS(SEQ ID NO:53)序列的(G4S)3接头用于研究。
现在描述结果。
对五个不同的亲本DMAb进行了预测性ScFv-Fc建模。每个DMAb在两个方向上建模:VH-接头-VL和VL-接头-VH。图12和图13显示了ScFv-Fc DMAb的空间填充模型,该模型用于预测接头是否可能遮蔽CDR或干扰CDR。
表3提供了用于鉴定候选DMAb以进一步开发的决策图标的概要。
Figure BDA0002362567380001021
基于这些结果的建议如表3所示。在某些情况下,对于独立最小化的模型,RMSD在正常误差范围内。在某些情况下,尤其是在构象之间不存在强信号的情况下,选择一种构象而不是另一种构象(VH-VL和VL-VH)可能没有好处。在其他情况下,建模表明一种构象可能比另一种构象能成为更好的候选物。RMSD是用于形成建议的简单、一致的度量方法,但是除RMSD之外的其他标准也可以提供有用信息。
如此处所用的接头评估可以检测畸变问题,但它不能容易地检测与V结构域缔合有关的问题,所述问题取决于缔合中的灵活性或中间体并且需要更大的迁移率来缔合(例如,“熵因素”)。
实施例5:用于编码抗埃博拉病毒病(EVD)抗体的合成DNA质粒的治疗基因转移的结构重组和蛋白质工程策略的功能评估
埃博拉病毒病(EVD)引起人类严重的出血热,并具有较高的死亡率。迄今为止,2013年至2015年发生在西非的埃博拉疫情是最近发病史中最致命、持续时间最长的疫情。如此大规模爆发带来的挑战突出显示了对有效EVD抗病毒疗法和疫苗的需求。尽管最近发现EVD疫苗对人类有效,但疫苗的保护通常不是即时的,并且在针对EVD急性病例的治疗环境中无益。需要转移单克隆抗体(mAb)以赋予即时保护性免疫的被动免疫策略已成功应用于包括EVD在内的传染病环境中。然而,抗体的施用存在概念上和方法上的障碍,包括抗体的体外生产和优化、在体内的剂量以及最终在制造过程中产生的成本。从这个角度来看,体内递送编码抗体的DNA质粒为单克隆抗体(mAb)的施用提供了一种新颖、安全且经济高效的方法。
业已证明,编码针对多种病原体的单克隆抗体(DMAb)的DNA在小鼠体内的电穿孔(EP)介导的基因递送。目前的研究描述了两种靶向埃博拉病毒糖蛋白(EBOV-GP)(即EBOMAb-10和EBOMAb-14)的DMAb;还描述了工程化修饰的功能影响,所述工程化修饰由以下组成:将免疫球蛋白(Ig)重组为单链抗体(scFv-Fc)以及在上述DMAb结构框架内进行支架移植。EBOMAb-10和EBOMAb-14以未经修饰和经修饰形式的EP介导的基因转移导致小鼠血清中分泌功能性抗体,其通过ELISA进行的EBOV-GP抗原结合和EBOV-GP假型病毒试验中的病毒中和进行评估。这些结构变化对体外和表达表面糖蛋白的活细胞中的EBOV-GP结合以及病毒中和具有不同的影响。综上所述,此处描述的数据为开发编码单克隆抗体(DMAb)的合成DNA质粒提供了概念框架,该单克隆抗体具有增强的针对新兴疾病(如EVD)的治疗能力。该研究还提供了评估DMAb结构操作手法的功能范式,并总体上支持进一步的体内动物试验,以安全且经济高效的方式将基于DNA的被动免疫方法转化为临床应用。
现在描述方法。
图14提供了这些研究中使用的方法的流程图。用于生成ScFv-Fc DMAb的DMAb设计策略包括:1)接头设计;2)VH-VL定向;和3)铰链-CH2-CH3的选择。对亲本DMAb进行部分移植、ScFv-Fc转化或部分移植与ScFv-Fc转化的组合。
在这些研究中分析了两组DMAb。第1组由EBOMAb-10 DMAb组成:EBOMAb-10-IgG(对照)、EBOMAb-10-2(ScFv-Fc修饰的DMAb)、EBOMAb-10-3-IgG部分移植物和EBOMAb-10-4ScFv-Fc部分移植物。第2组由EBOMAb-14 DMAb组成:EBOMAb-14-IgG(对照)、EBOMAb-14-2(ScFv-Fc修饰的DMAb)、EBOMAb-14-3-IgG部分移植物和EBOMAb-14-4ScFv-Fc部分移植物。这些研究中使用的序列如表4所示。
表4.
名称 说明 ASGCT代码
pGX9256 埃博拉病毒5.6.1A2 EBOMAb-10
pGX9346 1A2_scFv_Fc EBOMAb-10-2
pGX9356 1A2_全长_部分移植物 EBOMAb-10-3
pGX9357 1A2_scFv_Fc_部分移植物 EBOMAb-10-4
pGX9290 埃博拉病毒EBV114 EBOMAb-14
pGX9345 EBV114_scFv_Fc EBOMAb-14-2
pGX9362 EBV114_全长_部分移植物 EBOMAb-14-3
pGX9363 EBV114_scFv_Fc_部分移植物 EBOMAb-14-4
现在描述结果。
评价结构修饰的DMAb的中和活性。所有结构重组的DMAb均与其亲本对照DMAb相当(图15)。对IC50和IC90的评估显示,ScFv-Fc DMAb的IC90高于对照DMAb的IC90,而部分移植修饰的DMAb的IC90则低于对照的IC90(图16)。与对照DMAb相比,第2组DMAb显示出增强的表达,并且抗原结合稍微增加或等同于对照的抗原结合(图17)。
在大多数情况下,结构修饰的DMAb可以在小鼠中高水平表达,而没有实质的功能损失(即抗原结合和抑制效力)。对于EBOMAbl0-3和EBOMAb-14-3,结构修饰导致在小鼠中的表达增强和抑制效力增强,通过IC50和IC90计算得出抑制效力。
数据提供了概念验证,即DMAb是一种可延展的工具,可以对其进行工程化以实现更高的表达和更高的治疗效果。
表5提供了利用框架突变、完整移植物、部分移植物和scFv-Fc转化的示例性埃博拉病毒DMAb质粒构建体的列表。
表5.
Figure BDA0002362567380001041
Figure BDA0002362567380001051
实施例6:探索基因优化和scFv-Fc重组作为增加抗寨卡病毒的DNA编码的单克隆抗体(DMAb)的体内表达水平的策略
有两种抗体修饰策略用来生成抗寨卡病毒的修饰的DMAb:基因优化和scFv-Fc重组(图1)。
基因优化方法包括:选择两个全长寨卡DMAb序列并通过六种不同算法进行优化。用专有的多元回归算法加权影响转录和翻译的多个参数,例如密码子使用、GC含量、隐蔽剪接位点、mRNA二级结构等。然而,许多参考的数据是使用体外表达系统生成的。为了找到最适合寨卡DMAb体内表达的算法,在一个治疗位点先向BALB/c小鼠(n=5)肌内注射100μg质粒DNA,然后进行电穿孔。在第7天,通过ELISA定量DMAb的血清水平和归一化结合。关于ZKDMAB-1,算法1的最高表达为18ug/ml(图19和图20)。关于ZKDMAB-2,算法2的最高表达为3.5ug/ml(图21)。一致地,通过算法6优化的两个DMAb均表现出最低的体内表达或无表达。在大多数情况下,通过ELISA保留了结合,但是发现几种算法中ZKDMAB-1的结合下降,这表明核苷酸序列可能会影响蛋白折叠或表达的DMAb的构象(图19、图20和图22)。
另外,测试单链Fv-Fc(scFv-Fc)的转化。ScFv-Fc转化是去除CH1和CL区,并在VH和VL之间添加接头。转化促进重链-轻链配对和组织渗透。通过添加接头,DMAb从全长抗体转化为scFv-Fc(如图1所示)。
选择两个寨卡DMAb并从中生成多个构建体。所述构建体因接头分子的选择和VH-VL的方向而有所不同。与原始DMAb相比,将DMAb从全长抗体转化为scFv-Fc导致小鼠表达增加多达6倍。关于ZKDMAB-1,所测的四种形式的表达范围从16ug/ml下降到8ug/ml,并倾向于使(G4S)3接头沿VH-VL方向。使用VL-VH方向的(G4S)3接头,ZKDMAB-2的最高表达达到12ug/ml。重要的是,对大多数DMAb进行的修饰保留了抗原结合。这些变化提高了体内表达水平,而没有牺牲原始mAb克隆的生物学特性(图23和图24)。这些数据证明了在设计用于基因治疗用途的DMAb时,基因和蛋白质调节的明显优点。
表6.工程化的抗寨卡DMAb:GO=基因优化;190=ZK190-G1M3-LALA;185=ZK185.LALA.弗林蛋白酶-p2a
Figure BDA0002362567380001061
Figure BDA0002362567380001071
实施例7:抗寨卡病毒(ZIKV)和登革热病毒(DENV)感染的多价scFv-Fc DNA编码的单克隆抗体(DMAb)平台的评估
这项研究描述了分别靶向寨卡病毒和登革热病毒的两个单链片段可变-Fc(scFv-Fc)DMAb(即Z-DMAbl-sc和D-DMAbl-sc)的工程化,还描述了另外一个DMAb的工程化,该DMAb以多价双向启动子格式(Z/D-DMAbl-sc)编码Z-DMAbl-sc和D-DMAbl-sc。采用小鼠模型,将
Figure BDA0002362567380001072
技术用于肌内递送Z-DMAbl-sc和D-DMAbl-sc的各种调和组合以及单独配制的多价Z/D-DMAbl-sc。每一个所述scFv-Fc DMAb的EP介导的基因转移均导致小鼠血清中分泌功能性scFv-Fc,其通过ELISA和病毒抗原结合试验进行评估。据观察,在单个多价双向启动子构建体(Z/D-DMAbl-sc)中表达时,Z-DMAbl-sc和D-DMAbl-sc的scFv-Fc表达比在两个所述DNA质粒构建体共同配制成单一制剂或分别递送至两个单独的肌肉部位时的scFv-Fc表达更高。此外,分析这些各种共制剂和多价组合对中和表型的影响。总之,这些数据为采用多价scFv-Fc DMAb平台提供了证据,所述平台可被证明更能抵抗多种病原体(如寨卡病毒和登革热病毒)的感染,这些病原体在交叉流行区普遍存在。
表7.工程化抗登革热病毒DMAb:
序列号 序列类型 DMAb类型 名称 说明
107 核苷酸 scFv_Fc pGX93141 DVSF3 LALAscFv-FcVH.G4S3.VL
108 氨基酸 scFv_Fc pGX93141 DVSF3 LALAscFv-FcVH.G4S3.VL
实施例8:抗呼吸道合胞病毒(RSV)的体内表达的DNA类单克隆抗体(dMAb)的功能表征
尽管已经表明mAb可有效抵抗许多传染病,但其仍然不能被广泛使用。有限的体内半衰期意味着需要多次给药才能维持免疫力,而且开发、生产和冷链分配涉及的成本高、过程复杂,且缺乏可用于本领域的合适给药方法,这也阻碍了它们在全球使用。作为响应,正在开发基于体内抗体基因递送的新策略,其中一个平台是dMAb,一种合成质粒DNA编码的mAb。将编码人mAb的DNA序列插入质粒。如图1B所示,dMAb质粒被直接递送至肌肉组织,并且体内电穿孔增强了肌细胞的细胞摄取。转染的肌细胞产生并分泌mAb。mAb进入血液循环并可以对全身起作用。在概念验证研究中,dMAb在临床前动物模型中抵御各种传染性疾病(包括流感、假单胞菌、寨卡病毒和埃博拉病毒)。这里将描述靶向RSV的dMAb的临床前开发。RSV-dMAb可给予高危人群,以便在整个季节中预防因RSV感染引起的严重并发症。由于表达得以维持,首次给予dMAb将覆盖整个RSV季节,因此可能无需再次给予dMAb。
对编码DNA质粒的抗RSV sc-Fv进行工程化(图25A),与全长人IgG相比,其体内表达谱得到改善。为了进一步增强全身表达,采用了一种优化的给药方案。优化的制剂通过修饰靶组织的细胞外基质来增强质粒DNA的分散。电穿孔增加了靶细胞对DNA分子的细胞摄取。从处理过的小鼠的血清中证实了体内表达的人sc-Fv在体外结合RSV-融合蛋白(RSV-F)抗原和中和RSV-A活病毒的功能。除了血清水平表达之外,还在肺(即天然RSV感染的位置)检测到体内表达的人sc-Fv。然后将剂量和给药方法应用于棉鼠,即RSV预防性发展的标准临床前模型。
体内递送该dMAb导致小鼠血清中抗体的强健的全身性水平(图26和图29A)。重组帕利珠单抗(Pavilizumab)的匹配水平为感染RSV后的下呼吸道疾病提供了保护。棉鼠是模拟人类疾病的黄金标准,在感染RSV后的棉鼠中,在给药后长达60天的时间里观察到dMAb的持续血清表达(图30);在肺灌洗样品中也检测到该抗体,这证明了有效的生物学分布(图26C和图29D)。此外,携带RSV-F dMAb的动物的血清在抗原结合和中和活病毒方面具有功能活性(图27、图29B、图29C和图31B)。设计实验以进行棉鼠的体内活病毒攻击。由于对非适应性人RSV的高度易感性和在人体中显示出许多感染病理学特征,因此认为棉鼠是RSV疫苗临床前开发的选择模型。
这些结果表明,抗RSV的人sc-Fv dMAb可能是在整个RSV季节重复注射蛋白-mAb的有效替代方案。RSV-dMAb有可能克服与被动免疫相关的一些障碍。
表8.RSV DMAb质粒
Figure BDA0002362567380001091
表9.工程化抗-RSV DMAb
序列号 序列类型 DMAb类型 名称
110 核苷酸 GO pGX9368
111 氨基酸 GO pGX9368
112 核苷酸 scFv-Fc pGX9369
113 氨基酸 scFv-Fc pGX9369
114 核苷酸 GO pGX9370
115 氨基酸 GO pGX9370
116 核苷酸 scFv-Fc pGX9371
117 氨基酸 scFv-Fc pGX9371
118 核苷酸 GO pGX9283
119 氨基酸 GO pGX9283
实施例9:抗寨卡病毒(ZIKV)和登革热病毒(DENV)感染的多价scFv-Fc DNA编码的单克隆抗体(dMAbTM)平台
寨卡病毒(ZIKV)和登革热病毒(DENV)是由蚊子传播的黄病毒,其引起轻度到重度病状,从轻度皮疹到严重的器官衰竭,甚至可能导致死亡。此外,寨卡病毒感染,尤其是在怀孕期间被寨卡病毒感染,会引起自然流产或严重的新生儿发育缺陷,包括小头畸形症和认知障碍,可能给个体和社会造成负担。以前公开的临床前模型已经为使用中和单克隆抗体(mAb)作为抗寨卡病毒和登革热病毒感染的治疗性干预的基础奠定了理论基础。尽管mAb的给药作为传染性疾病的预防和治疗方法均具有广阔的前景,但大规模地给药蛋白mAb在概念上和方法上存在一些障碍,特别是对于数百万潜在地具有感染寨卡病毒和/或登革热病毒的风险的人群。治疗这些疾病的一种替代方法是基于骨骼肌中编码单克隆抗体(dMAb)的质粒的表达,从而导致在血清中体内产生和分泌mAb。为了试图设计一种更加通用的dMAb平台并扩大病原体覆盖范围,对两种分别靶向寨卡病毒和登革热病毒的单链片段可变-Fc(scFv-Fcs)dMAb(即Z-dMAbl-sc和D-dMAbl-sc)进行工程化(图32),还对另外一个DMAb进行工程化,该DMAb以多价双向启动子格式(Z/D-dMAbl-sc)编码Z-dMAbl-sc和D-dMAbl-sc(图32和表10)。采用小鼠模型,将
Figure BDA0002362567380001102
技术用于肌内递送编码Z-dMAbl-sc和D-dMAbl-sc的质粒DNA的各种调和组合以及单独配制的编码Z/D-dMAbl-sc dMAb的多价质粒DNA。每一个所述scFv-Fc DMAb的EP介导的基因转移均导致小鼠血清中分泌功能性scFv-Fc,其通过ELISA和病毒抗原结合试验进行评估(图33)。据观察,在单个多价双向启动子构建体(Z/D-dMAbl-sc)中表达时,Z-dMAbl-sc和D-dMAbl-sc的scFv-Fc表达与在两个所述DNA质粒构建体共同配制成单一制剂或分别递送至两个单独的肌肉部位时的scFv-Fc表达不一样(图34)。此外,分析这些各种共制剂和多价组合是如何影响中和表型(图35)。多价scFv-Fc dMAb平台允许产生两种功能性scFv-Fc dMAb(Z-dMAbl-sc和D-dMAbl-sc)。调和/混合scFv-Fc寨卡/登革热dMAb似乎有益于登革热dMAbl-sc的表达。此外,双向启动子平台中的寨卡/登革热dMAb的分子工程化似乎显著受益于登革热dMAb的表达,而寨卡的表达无明显差异。
总之,这些数据为多价scFv-Fc DMAb平台提供了证据,所述平台可能被证明更能抵抗多种病原体(如寨卡病毒和登革热病毒)的感染,这些病原体在交叉流行区普遍存在。
表10.结构修饰的DMAb序列
Figure BDA0002362567380001101
应当理解,以上的详细说明书和随附的实施例仅用于说明目的,不应被认为是对本发明范围的限制,本发明的范围仅由所附权利要求及其等同物限定。
对所公开的实施方案的各种改变和修改对于本领域技术人员将是显而易见的。可以在不违背本发明的精神和范围的情况下进行这样的改变和修改,包括但不限于对本发明的化学结构、取代基、衍生物、中间体、合成体、组合物、制剂或使用方法的改变和修改。
序列表
<110> 大卫·韦纳
吉亚贝·古伊宾加
尼尔·库奇
查尔斯·里德
<120> 优化的核酸抗体构建体
<130> 206194-0014-00-WO.607261
<150> US 62/504,448
<151> 2017-05-10
<150> US 62/624,320
<151> 2018-01-31
<150> US 62/504,460
<151> 2017-05-10
<150> US 62/624,367
<151> 2018-01-31
<160> 128
<170> PatentIn 3.5版
<210> 1
<211> 2193
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9291,修饰的埃博拉病毒Z5D2
<400> 1
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcagag 60
gtgcagctgc aggagagcgg accaggcctg gtgcggccca gccagtccct gtctctgacc 120
tgcacagtga ccggctacag catcacatcc gattatgcct ggaactggat caggcagttc 180
cctggctaca agatcgagtg gctgggctat atcacaaaca ccggcagcac cggctttaat 240
ccatctctga agagccggat ctccatcaca agagacacct ccaagaatca gttctttctg 300
cagctgatct ctgtgaccac agaggataca gcaacctacc actgcgccag aggcctggca 360
tattggggac agggcacact ggtgaccgtg agctccgcct ctaccaaggg accaagcgtg 420
tttccactgg caccttctag caagagcaca tccggcggca ccgccgccct gggatgtctg 480
gtgaaggact acttccctga gccagtgacc gtgtcttgga acagcggcgc cctgacatcc 540
ggagtgcaca cctttccagc cgtgctgcag tcctctggcc tgtacagcct gagctccgtg 600
gtgaccgtgc cctctagctc cctgggcaca cagacctata tctgcaacgt gaatcacaag 660
ccctctaata caaaggtgga caagaaggtg gagcctaaga gctgtgataa gacacacacc 720
tgccctccct gtccagcacc tgagctgctg ggcggcccaa gcgtgttcct gtttccaccc 780
aagcccaagg acaccctgat gatctccagg acacctgagg tgacctgcgt ggtggtggac 840
gtgtctcacg aggaccccga ggtgaagttc aactggtacg tggatggcgt ggaggtgcac 900
aatgccaaga ccaagccacg ggaggagcag tacaactcca cctatagagt ggtgtctgtg 960
ctgacagtgc tgcaccagga ctggctgaac ggcaaggagt ataagtgcaa ggtgtccaat 1020
aaggccctgc cagcccccat cgagaagacc atcagcaagg caaagggaca gccaagggag 1080
ccacaggtgt acacactgcc tccaagccgc gacgagctga ccaagaacca ggtgtccctg 1140
acatgtctgg tgaagggctt ctatccatct gatatcgccg tggagtggga gagcaatggc 1200
cagcccgaga acaattacaa gaccacaccc cctgtgctgg actccgatgg ctctttcttt 1260
ctgtattcca agctgaccgt ggataagtct cgctggcagc agggcaacgt gttttcttgc 1320
agcgtgatgc acgaggccct gcacaatcac tacacccaga agtccctgtc tctgagccct 1380
ggcaagaggg gaaggaagcg gagatccggc tctggagcca caaacttctc cctgctgaag 1440
caggcaggcg acgtggagga gaatcctgga ccaatggtgc tgcagaccca ggtgtttatc 1500
agcctgctgc tgtggatctc cggcgcctac ggcgatgtgg tgctgacaca gacccctctg 1560
acactgagcg tgaccatcgg ccagccagcc agcatctcct gtaactctag ccagtctctg 1620
ctggacagcg atggcaagac ctacctgaat tggctgctgc agaggcctgg ccagtcccca 1680
aagcgcctga tctatctggt gtccaagctg gactctggcg tgacagatga gttcaccggc 1740
tctggcagcg gcacagactt taccctgaag atcagccgcg tggaggccga ggatctgggc 1800
atctactatt gctggcaggg cacacactct cccttcacct ttggcagcgg cacaaagctg 1860
gagatcaaga ccgtggccgc ccctagcgtg ttcatctttc caccctccga cgagcagctg 1920
aagagcggca cagcctccgt ggtgtgcctg ctgaacaatt tctacccccg ggaggccaag 1980
gtgcagtgga aggtggataa cgccctgcag agcggcaatt cccaggagtc tgtgaccgag 2040
caggacagca aggattccac atattccctg tctaacacac tgaccctgtc caaggccgac 2100
tacgagaagc acaaggtgta tgcatgcgag gtgacccacc agggcctgtc ctctcctgtg 2160
acaaagagct ttaatcgggg cgagtgttga taa 2193
<210> 2
<211> 729
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9291,修饰的埃博拉病毒Z5D2
<400> 2
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Arg
20 25 30
Pro Ser Gln Ser Leu Ser Leu Thr Cys Thr Val Thr Gly Tyr Ser Ile
35 40 45
Thr Ser Asp Tyr Ala Trp Asn Trp Ile Arg Gln Phe Pro Gly Tyr Lys
50 55 60
Ile Glu Trp Leu Gly Tyr Ile Thr Asn Thr Gly Ser Thr Gly Phe Asn
65 70 75 80
Pro Ser Leu Lys Ser Arg Ile Ser Ile Thr Arg Asp Thr Ser Lys Asn
85 90 95
Gln Phe Phe Leu Gln Leu Ile Ser Val Thr Thr Glu Asp Thr Ala Thr
100 105 110
Tyr His Cys Ala Arg Gly Leu Ala Tyr Trp Gly Gln Gly Thr Leu Val
115 120 125
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
130 135 140
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
145 150 155 160
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
165 170 175
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
180 185 190
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
195 200 205
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
210 215 220
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
225 230 235 240
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
245 250 255
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
260 265 270
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
275 280 285
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
290 295 300
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
305 310 315 320
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
325 330 335
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
340 345 350
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
355 360 365
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
370 375 380
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
385 390 395 400
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
405 410 415
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
420 425 430
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
435 440 445
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly
450 455 460
Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
465 470 475 480
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr
485 490 495
Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Asp
500 505 510
Val Val Leu Thr Gln Thr Pro Leu Thr Leu Ser Val Thr Ile Gly Gln
515 520 525
Pro Ala Ser Ile Ser Cys Asn Ser Ser Gln Ser Leu Leu Asp Ser Asp
530 535 540
Gly Lys Thr Tyr Leu Asn Trp Leu Leu Gln Arg Pro Gly Gln Ser Pro
545 550 555 560
Lys Arg Leu Ile Tyr Leu Val Ser Lys Leu Asp Ser Gly Val Thr Asp
565 570 575
Glu Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile Ser
580 585 590
Arg Val Glu Ala Glu Asp Leu Gly Ile Tyr Tyr Cys Trp Gln Gly Thr
595 600 605
His Ser Pro Phe Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys Thr
610 615 620
Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu
625 630 635 640
Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro
645 650 655
Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly
660 665 670
Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr
675 680 685
Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His
690 695 700
Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val
705 710 715 720
Thr Lys Ser Phe Asn Arg Gly Glu Cys
725
<210> 3
<211> 2196
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9292,埃博拉病毒Z5D2部分移植物
<400> 3
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcagag 60
gtgcagctgc aggagtccgg accaggcctg gtgcgcccta gccagtccct gtctctgacc 120
tgcacagtga ccggctacag catcacatcc gattatgcct ggaactggat cagacagttc 180
cctggcaata agctggagtg gctgggctac atcacaaaca ccggcagcac cggctttaat 240
ccatctctga agagccggat ctccatcaca agagacacct ccaagaacca gttctttctg 300
cagctgatct ctgtgaccac agaggataca gcaacctacc actgcgccag aggcctggca 360
tattggggac agggcacact ggtgaccgtg agctccgcct ctaccaaggg accaagcgtg 420
tttccactgg caccttctag caagagcaca tccggcggca ccgccgccct gggatgtctg 480
gtgaaggact acttccctga gccagtgacc gtgtcttgga acagcggcgc cctgacatcc 540
ggagtgcaca cctttccagc cgtgctgcag tcctctggcc tgtacagcct gagctccgtg 600
gtgaccgtgc cttctagctc cctgggcaca cagacctata tctgcaacgt gaatcacaag 660
ccctctaata caaaggtgga caagaaggtg gagcctaaga gctgtgataa gacacacacc 720
tgccctccct gtccagcacc tgagctgctg ggcggccctt ccgtgttcct gtttccaccc 780
aagccaaagg acaccctgat gatctccagg acacctgagg tgacctgcgt ggtggtggac 840
gtgtctcacg aggaccccga ggtgaagttc aactggtacg tggatggcgt ggaggtgcac 900
aatgccaaga ccaagccacg ggaggagcag tacaattcca cctatagagt ggtgtctgtg 960
ctgacagtgc tgcaccagga ttggctgaac ggcaaggagt ataagtgcaa ggtgagcaat 1020
aaggccctgc cagcccccat cgagaagacc atctccaagg caaagggaca gccaagggag 1080
ccacaggtgt acacactgcc tccaagccgc gacgagctga ctaagaacca ggtgtccctg 1140
acatgtctgg tgaagggctt ctatccatct gatatcgccg tggagtggga gagcaatggc 1200
cagcccgaga acaattacaa gaccacaccc cctgtgctgg actccgatgg ctctttcttt 1260
ctgtattcca agctgaccgt ggacaagtct cgctggcagc agggcaacgt gttttcttgc 1320
agcgtgatgc acgaggccct gcacaatcac tacacccaga agtccctgtc tctgagccct 1380
ggcaagaggg gaaggaagcg gagatccggc tctggagcca caaacttcag cctgctgaag 1440
caggccggcg atgtggagga gaatcctggc ccaatggtgc tgcagaccca ggtgtttatc 1500
agcctgctgc tgtggatctc cggcgcctat ggcgagacaa ccctgacaca gtctccaggc 1560
accctgagcc tgtccccagg agagagggcc accctgagct gtaagtctag ccagtctctg 1620
ctggacagcg atggcaagac atacctgaac tggctgctgc agaggcctgg acagtcccca 1680
aagcgcctga tctatctggt gtccaagctg gactctggcg tgacagatcg gttcaccggc 1740
tctggcagcg gcacagactt taccctgaag atcagcagag tggaggccga ggatctgggc 1800
gtgtactatt gctggcaggg cacacactct ccattcacct ttggcagcgg cacaaagctg 1860
gagatcaaga gaaccgtggc cgcccccagc gtgttcatct ttccaccctc cgacgagcag 1920
ctgaagagcg gcacagcctc cgtggtgtgc ctgctgaaca atttctaccc cagggaggcc 1980
aaggtgcagt ggaaggtgga taacgccctg cagagcggca attcccagga gtctgtgacc 2040
gagcaggaca gcaaggattc cacatattcc ctgtctaaca cactgaccct gtccaaggcc 2100
gactacgaga agcacaaggt gtatgcatgc gaggtgaccc accagggcct gtcctctcct 2160
gtgacaaaga gctttaatcg gggcgagtgt tgataa 2196
<210> 4
<211> 730
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9292,埃博拉病毒Z5D2部分移植物
<400> 4
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Arg
20 25 30
Pro Ser Gln Ser Leu Ser Leu Thr Cys Thr Val Thr Gly Tyr Ser Ile
35 40 45
Thr Ser Asp Tyr Ala Trp Asn Trp Ile Arg Gln Phe Pro Gly Asn Lys
50 55 60
Leu Glu Trp Leu Gly Tyr Ile Thr Asn Thr Gly Ser Thr Gly Phe Asn
65 70 75 80
Pro Ser Leu Lys Ser Arg Ile Ser Ile Thr Arg Asp Thr Ser Lys Asn
85 90 95
Gln Phe Phe Leu Gln Leu Ile Ser Val Thr Thr Glu Asp Thr Ala Thr
100 105 110
Tyr His Cys Ala Arg Gly Leu Ala Tyr Trp Gly Gln Gly Thr Leu Val
115 120 125
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
130 135 140
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
145 150 155 160
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
165 170 175
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
180 185 190
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
195 200 205
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
210 215 220
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
225 230 235 240
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
245 250 255
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
260 265 270
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
275 280 285
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
290 295 300
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
305 310 315 320
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
325 330 335
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
340 345 350
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
355 360 365
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
370 375 380
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
385 390 395 400
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
405 410 415
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
420 425 430
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
435 440 445
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly
450 455 460
Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
465 470 475 480
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr
485 490 495
Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu
500 505 510
Thr Thr Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu
515 520 525
Arg Ala Thr Leu Ser Cys Lys Ser Ser Gln Ser Leu Leu Asp Ser Asp
530 535 540
Gly Lys Thr Tyr Leu Asn Trp Leu Leu Gln Arg Pro Gly Gln Ser Pro
545 550 555 560
Lys Arg Leu Ile Tyr Leu Val Ser Lys Leu Asp Ser Gly Val Thr Asp
565 570 575
Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile Ser
580 585 590
Arg Val Glu Ala Glu Asp Leu Gly Val Tyr Tyr Cys Trp Gln Gly Thr
595 600 605
His Ser Pro Phe Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys Arg
610 615 620
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
625 630 635 640
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
645 650 655
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
660 665 670
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
675 680 685
Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
690 695 700
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
705 710 715 720
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 5
<211> 2196
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9293,埃博拉病毒Z5D2移植到MERSYTE_1
<400> 5
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgcagctgg tgcagtctgg agccgaggtg aagaagccag gcagctccgt gaaggtgtcc 120
tgcaaggcct ccggctactc tatcacaagc gattatgcca tcagctgggt gcggcaggca 180
ccaggacagg gcctggagtg gatgggcggc atcaccaaca caggctccac caattacgcc 240
cagaagttcc agggcagagt gaccatcaca gccgacacct ccacatctac cgcctatatg 300
gagctgtcta gcctgcggag cgaggatacc gccgtgtact attgcgccag aggcctggca 360
tactggggac agggcaccac agtgaccgtg tcctctgcct ccacaaaggg accaagcgtg 420
ttcccactgg cacctagctc caagagcaca tccggcggca ccgccgccct gggatgtctg 480
gtgaaggact atttccctga gccagtgacc gtgtcctgga actctggcgc cctgacaagc 540
ggagtgcaca cctttccagc cgtgctgcag tctagcggcc tgtactccct gtcctctgtg 600
gtgaccgtgc ctagctcctc tctgggcaca cagacctata tctgcaacgt gaatcacaag 660
ccttccaata caaaggtgga caagaaggtg gagccaaagt cttgtgataa gacacacacc 720
tgccctccct gtccagcacc tgagctgctg ggcggcccaa gcgtgttcct gtttccaccc 780
aagcccaagg acacactgta catcacccgg gagccagagg tgacctgcgt ggtggtggac 840
gtgtcccacg aggaccccga ggtgaagttc aactggtacg tggatggcgt ggaggtgcac 900
aatgccaaga ccaagcctcg ggaggagcag tacaactcta cctatagagt ggtgagcgtg 960
ctgacagtgc tgcaccagga ctggctgaac ggcaaggagt acaagtgcaa ggtgagcaat 1020
aaggccctgc cagcccccat cgagaagacc atctccaagg caaagggaca gccaagggag 1080
ccacaggtgt acacactgcc tccaagccgc gacgagctga ccaagaacca ggtgtccctg 1140
acatgtctgg tgaagggctt ctatccctcc gatatcgccg tggagtggga gtctaatggc 1200
cagcctgaga acaattacaa gaccacaccc cctgtgctgg acagcgatgg ctccttcttt 1260
ctgtatagca agctgaccgt ggacaagtcc cggtggcagc agggcaacgt gttttcttgc 1320
agcgtgatgc acgaggccct gcacaatcac tacacccaga agtccctgtc tctgagccca 1380
ggcaagaggg gaaggaagcg gagatccggc tctggagcca caaacttcag cctgctgaag 1440
caggccggcg atgtggagga gaatcctggc ccaatggtgc tgcagaccca ggtgtttatc 1500
tccctgctgc tgtggatctc tggcgcctac ggcgagacaa ccctgacaca gtccccaggc 1560
accctgagcc tgtcccctgg agagagggcc accctgtctt gtagagcctc tcagagcctg 1620
ctggacagcg atggcaagac atacatcgcc tggtatcagc agaagcctgg ccaggcccca 1680
agactgctga tgttcctggt gagcacaagg gccaccggca tccctgaccg cttctccggc 1740
tctggcagcg gcacagactt caccctgaac atcagctccc tggagcctga ggactttgcc 1800
gtgtactatt gctggcaggg cacacacagc ccattcacct ttggccaggg cacaaagctg 1860
gagatcaaga ggaccgtggc cgcccctagc gtgttcatct ttccacccag cgacgagcag 1920
ctgaagtctg gcacagccag cgtggtgtgc ctgctgaaca atttctaccc acgcgaggcc 1980
aaggtgcagt ggaaggtgga taacgccctg cagtctggca atagccagga gtccgtgacc 2040
gagcaggact ctaaggatag cacatattcc ctgtctagca cactgaccct gagcaaggcc 2100
gattacgaga agcacaaggt gtatgcatgc gaggtgaccc accagggcct gaggagcccc 2160
gtgacaaagt cctttaatcg cggcgagtgt tgataa 2196
<210> 6
<211> 730
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9293,埃博拉病毒Z5D2移植到MERSYTE_1
<400> 6
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Ser Ile
35 40 45
Thr Ser Asp Tyr Ala Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly
50 55 60
Leu Glu Trp Met Gly Gly Ile Thr Asn Thr Gly Ser Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Gly Arg Val Thr Ile Thr Ala Asp Thr Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Gly Leu Ala Tyr Trp Gly Gln Gly Thr Thr Val
115 120 125
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
130 135 140
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
145 150 155 160
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
165 170 175
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
180 185 190
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
195 200 205
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
210 215 220
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
225 230 235 240
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
245 250 255
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Tyr Ile Thr Arg Glu Pro
260 265 270
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
275 280 285
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
290 295 300
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
305 310 315 320
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
325 330 335
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
340 345 350
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
355 360 365
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
370 375 380
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
385 390 395 400
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
405 410 415
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
420 425 430
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
435 440 445
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly
450 455 460
Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
465 470 475 480
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr
485 490 495
Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu
500 505 510
Thr Thr Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu
515 520 525
Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Leu Leu Asp Ser Asp
530 535 540
Gly Lys Thr Tyr Ile Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro
545 550 555 560
Arg Leu Leu Met Phe Leu Val Ser Thr Arg Ala Thr Gly Ile Pro Asp
565 570 575
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Asn Ile Ser
580 585 590
Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Trp Gln Gly Thr
595 600 605
His Ser Pro Phe Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys Arg
610 615 620
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
625 630 635 640
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
645 650 655
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
660 665 670
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
675 680 685
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
690 695 700
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro
705 710 715 720
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 7
<211> 2196
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9294,埃博拉病毒Z5D2移植到MERSYTE_2
<400> 7
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgcagctgg tgcagtctgg agccgaggtg aagaagccag gcagctccgt gaaggtgtcc 120
tgcaaggcct ccggctactc tatcacaagc gattatgcct ggagctgggt gcggcaggca 180
ccaggacagg gcctggagtg gatgggcggc atcaccaaca caggctccac caattacgcc 240
cagaagttcc agggcagagt gaccatcaca gccgacacct ccacatctac cgcctatatg 300
gagctgtcta gcctgcggag cgaggatacc gccgtgtact attgcgccag aggcctggca 360
tactggggac agggcaccac agtgaccgtg tcctctgcct ccacaaaggg accaagcgtg 420
ttcccactgg cacctagctc caagagcaca tccggcggca ccgccgccct gggatgtctg 480
gtgaaggact atttccctga gccagtgacc gtgtcctgga actctggcgc cctgacaagc 540
ggagtgcaca cctttccagc cgtgctgcag tctagcggcc tgtactccct gtcctctgtg 600
gtgaccgtgc ctagctcctc tctgggcaca cagacctata tctgcaacgt gaatcacaag 660
ccttccaata caaaggtgga caagaaggtg gagccaaagt cttgtgataa gacacacacc 720
tgccctccct gtccagcacc tgagctgctg ggcggcccaa gcgtgttcct gtttccaccc 780
aagcccaagg acacactgta catcacccgg gagccagagg tgacctgcgt ggtggtggac 840
gtgtcccacg aggaccccga ggtgaagttc aactggtacg tggatggcgt ggaggtgcac 900
aatgccaaga ccaagcctcg ggaggagcag tacaactcta cctatagagt ggtgagcgtg 960
ctgacagtgc tgcaccagga ctggctgaac ggcaaggagt acaagtgcaa ggtgagcaat 1020
aaggccctgc cagcccccat cgagaagacc atctccaagg caaagggaca gccaagggag 1080
ccacaggtgt acacactgcc tccaagccgc gacgagctga ccaagaacca ggtgtccctg 1140
acatgtctgg tgaagggctt ctatccctcc gatatcgccg tggagtggga gtctaatggc 1200
cagcctgaga acaattacaa gaccacaccc cctgtgctgg acagcgatgg ctccttcttt 1260
ctgtatagca agctgaccgt ggacaagtcc cggtggcagc agggcaacgt gttttcttgc 1320
agcgtgatgc acgaggccct gcacaatcac tacacccaga agtccctgtc tctgagccca 1380
ggcaagaggg gaaggaagcg gagatccggc tctggagcca caaacttcag cctgctgaag 1440
caggccggcg atgtggagga gaatcctggc ccaatggtgc tgcagaccca ggtgtttatc 1500
tccctgctgc tgtggatctc tggcgcctac ggcgagacaa ccctgacaca gtccccaggc 1560
accctgagcc tgtcccctgg agagagggcc accctgtctt gtagagcctc tcagagcctg 1620
ctggacagcg atggcaagac atacatcgcc tggtatcagc agaagcctgg ccaggcccca 1680
agactgctga tgttcctggt gagcacaagg gccaccggca tccctgaccg cttctccggc 1740
tctggcagcg gcacagactt caccctgaac atcagctccc tggagcctga ggactttgcc 1800
gtgtactatt gctggcaggg cacacacagc ccattcacct ttggccaggg cacaaagctg 1860
gagatcaaga ggaccgtggc cgcccctagc gtgttcatct ttccacccag cgacgagcag 1920
ctgaagtctg gcacagccag cgtggtgtgc ctgctgaaca atttctaccc acgcgaggcc 1980
aaggtgcagt ggaaggtgga taacgccctg cagtctggca atagccagga gtccgtgacc 2040
gagcaggact ctaaggatag cacatattcc ctgtctagca cactgaccct gagcaaggcc 2100
gattacgaga agcacaaggt gtatgcatgc gaggtgaccc accagggcct gaggagcccc 2160
gtgacaaagt cctttaatcg cggcgagtgt tgataa 2196
<210> 8
<211> 730
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9294,埃博拉病毒Z5D2移植到MERSYTE_2
<400> 8
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Ser Ile
35 40 45
Thr Ser Asp Tyr Ala Trp Ser Trp Val Arg Gln Ala Pro Gly Gln Gly
50 55 60
Leu Glu Trp Met Gly Gly Ile Thr Asn Thr Gly Ser Thr Asn Tyr Ala
65 70 75 80
Gln Lys Phe Gln Gly Arg Val Thr Ile Thr Ala Asp Thr Ser Thr Ser
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Gly Leu Ala Tyr Trp Gly Gln Gly Thr Thr Val
115 120 125
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
130 135 140
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
145 150 155 160
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
165 170 175
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
180 185 190
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
195 200 205
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
210 215 220
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
225 230 235 240
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
245 250 255
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Tyr Ile Thr Arg Glu Pro
260 265 270
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
275 280 285
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
290 295 300
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
305 310 315 320
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
325 330 335
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
340 345 350
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
355 360 365
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
370 375 380
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
385 390 395 400
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
405 410 415
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
420 425 430
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
435 440 445
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly
450 455 460
Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
465 470 475 480
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr
485 490 495
Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu
500 505 510
Thr Thr Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu
515 520 525
Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Leu Leu Asp Ser Asp
530 535 540
Gly Lys Thr Tyr Ile Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro
545 550 555 560
Arg Leu Leu Met Phe Leu Val Ser Thr Arg Ala Thr Gly Ile Pro Asp
565 570 575
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Asn Ile Ser
580 585 590
Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Trp Gln Gly Thr
595 600 605
His Ser Pro Phe Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys Arg
610 615 620
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
625 630 635 640
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
645 650 655
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
660 665 670
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
675 680 685
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
690 695 700
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Arg Ser Pro
705 710 715 720
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 9
<211> 2196
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9295,埃博拉病毒Z5D2移植到V2L2
<400> 9
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcagag 60
gtgcagctgc tggagagcgg cggcggcctg gtgcagcccg gcggctctct gaggctgagc 120
tgcgccgcct ctggctacag catcacctcc gattatgcaa tgaactgggt gcgccaggca 180
cctggcaagg gcctggagtg ggtgtctgcc atcaccaata caggcagcac cggctacaca 240
gacgatgtga agggccggtt cacaatctcc agagacaact ctaagaatac cctgtatctg 300
cagatgaact ccctgagggc cgaggatacc gccgtgtact attgcgcccg cggcctggca 360
tactggggac agggcaccac agtgacagtg agctccgcct ctaccaaggg accaagcgtg 420
tttccactgg caccttctag caagtctacc agcggcggca cagccgccct gggatgtctg 480
gtgaaggact atttccctga gccagtgacc gtgtcttgga acagcggcgc cctgaccagc 540
ggagtgcaca catttcctgc cgtgctgcag tcctctggcc tgtactccct gagctccgtg 600
gtgaccgtgc catctagctc cctgggcacc cagacatata tctgcaacgt gaatcacaag 660
ccaagcaata caaaggtgga caagaaggtg gagcccaagt cctgtgataa gacccacaca 720
tgccctccct gtccagcacc tgagctgctg ggcggcccaa gcgtgttcct gtttccaccc 780
aagcctaagg acaccctgat gatctctcgg acccccgagg tgacatgcgt ggtggtggac 840
gtgagccacg aggaccccga ggtgaagttt aactggtacg tggatggcgt ggaggtgcac 900
aatgccaaga ccaagccccg ggaggagcag tacaactcca catatagagt ggtgtctgtg 960
ctgaccgtgc tgcaccagga ctggctgaac ggcaaggagt ataagtgcaa ggtgtccaat 1020
aaggccctgc cagcccccat cgagaagaca atctctaagg caaagggaca gccacgggag 1080
ccacaggtgt acaccctgcc tccatccaga gacgagctga caaagaacca ggtgtctctg 1140
acctgtctgg tgaagggctt ctatccttct gatatcgccg tggagtggga gagcaatggc 1200
cagccagaga acaattacaa gaccacaccc cctgtgctgg actccgatgg ctctttcttt 1260
ctgtattcca agctgaccgt ggataagtct aggtggcagc agggcaacgt gttttcctgc 1320
tctgtgatgc acgaggccct gcacaatcac tacacccaga agagcctgtc cctgtctcct 1380
ggcaagaggg gaaggaagcg gagaagcggc tccggagcca caaacttcag cctgctgaag 1440
caggcaggcg acgtggagga gaatcctgga ccaatggtgc tgcagaccca ggtgtttatc 1500
agcctgctgc tgtggatctc cggagcatac ggagccatcc agatgacaca gagcccttct 1560
agcctgtctg ccagcgtggg cgatagggtg accatcacat gtcgcgcctc ccagtctctg 1620
ctggactccg atggcaagac ctacctgggc tggtatcagc agaagcctgg caaggcccca 1680
aagctgctga tctacctggt gagcacactg cagtccggag tgccatctcg cttcagcggc 1740
tccggctctg gaaccgactt taccctgaca atctcctctc tgcagccaga ggatttcgcc 1800
acatactatt gctggcaggg cacccactcc cccttcacat ttggccaggg caccaaggtg 1860
gagatcaaga ggaccgtggc agcaccaagc gtgttcatct ttccaccctc cgacgagcag 1920
ctgaagagcg gcacagcctc cgtggtgtgc ctgctgaaca acttctaccc cagagaggcc 1980
aaggtgcagt ggaaggtgga taacgccctg cagagcggca attcccagga gtctgtgaca 2040
gagcaggaca gcaaggattc cacctatagc ctgtccaaca ccctgacact gagcaaggcc 2100
gactacgaga agcacaaggt gtatgcctgc gaggtgacac accagggcct gagctccccc 2160
gtgaccaagt ccttcaatag aggcgagtgt tgataa 2196
<210> 10
<211> 730
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9295,埃博拉病毒Z5D2移植到V2L2
<400> 10
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Ser Ile
35 40 45
Thr Ser Asp Tyr Ala Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly
50 55 60
Leu Glu Trp Val Ser Ala Ile Thr Asn Thr Gly Ser Thr Gly Tyr Thr
65 70 75 80
Asp Asp Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Gly Leu Ala Tyr Trp Gly Gln Gly Thr Thr Val
115 120 125
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
130 135 140
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
145 150 155 160
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
165 170 175
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
180 185 190
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
195 200 205
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
210 215 220
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
225 230 235 240
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
245 250 255
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
260 265 270
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
275 280 285
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
290 295 300
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
305 310 315 320
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
325 330 335
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
340 345 350
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
355 360 365
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
370 375 380
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
385 390 395 400
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
405 410 415
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
420 425 430
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
435 440 445
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly
450 455 460
Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
465 470 475 480
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr
485 490 495
Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Ala
500 505 510
Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp
515 520 525
Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Leu Leu Asp Ser Asp
530 535 540
Gly Lys Thr Tyr Leu Gly Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro
545 550 555 560
Lys Leu Leu Ile Tyr Leu Val Ser Thr Leu Gln Ser Gly Val Pro Ser
565 570 575
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser
580 585 590
Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Trp Gln Gly Thr
595 600 605
His Ser Pro Phe Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
610 615 620
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
625 630 635 640
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
645 650 655
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
660 665 670
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
675 680 685
Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
690 695 700
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
705 710 715 720
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 11
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9296,修饰的埃博拉病毒ZBDBV223
<400> 11
atggattgga cctggagaat cctgttcctg gtggcagcag caacaggaac ccacgcacag 60
gtgcagctgc agcagtgggg cgccggcctg ctgaagccaa gcgagacact gtccctgaca 120
tgcgccgtgt acggcggcag ctttaccaca acctattgga attggatcag gcagccccct 180
ggcaagggcc tggagtggat cggcgaggtg aactactctg gcaacgccaa ttataaccca 240
agcctgcagg gaagggtggc aatctctgtg gacacaagca agaatcagtt ctctctgcag 300
ctgaacagcg tgaccgccgc cgatacagcc atctactatt gcaccagccg gatcagaagc 360
cacatcgcct actcctggaa gggctgggtg tggggcaagg gcacaaccgt gaccgtgagc 420
tccgcctcca caaagggacc aagcgtgttc ccactggcac cctctagcaa gagcacctcc 480
ggcggcacag ccgccctggg ctgtctggtg aaggattatt tccccgagcc tgtgaccgtg 540
agctggaatt ccggcgccct gaccagcgga gtgcacacat ttccagccgt gctgcagtcc 600
tctggcctgt actccctgag ctccgtggtg accgtgccct ctagctccct gggcacacag 660
acctatatct gcaatgtgaa ccacaagccc tctaacacaa aggtggacaa gaaggtggag 720
cctaagagct gtgataagac acacacctgc ccaccctgtc cagcaccaga gctgctgggc 780
ggccctagcg tgttcctgtt tcctccaaag ccaaaggata ccctgatgat ctcccgcacc 840
cctgaggtga catgcgtggt ggtggacgtg tctcacgagg accccgaggt gaagttcaat 900
tggtacgtgg acggcgtgga ggtgcacaac gccaagacca agcctaggga ggagcagtac 960
aatagcacct atcgcgtggt gtccgtgctg acagtgctgc accaggactg gctgaatggc 1020
aaggagtata agtgcaaggt gagcaacaag gccctgcctg ccccaatcga gaagaccatc 1080
tccaaggcaa agggacagcc tcgggagcca caggtgtaca cactgccccc tagcagagac 1140
gagctgacca agaatcaggt gtccctgaca tgtctggtga agggcttcta tccatccgat 1200
atcgccgtgg agtgggagtc taacggccag cccgagaaca attacaagac aaccccaccc 1260
gtgctggact ctgatggcag cttctttctg tattccaagc tgaccgtgga taagtctcgg 1320
tggcagcagg gcaacgtgtt cagctgcagc gtgatgcacg aggccctgca caaccactac 1380
acccagaagt ccctgtctct gagcccaggc aagcggggca gaaagcggag atccggctct 1440
ggcgccacaa atttcagcct gctgaagcag gcaggcgacg tggaggagaa cccaggacct 1500
atggtgctgc agacccaggt gtttatctct ctgctgctgt ggatcagcgg cgcctacggc 1560
gagatcgtga tgacccagag cccaggcaca ctgagcctgt ccccaggaga gcaggccacc 1620
ctgtcctgta gggcctctca gagcgtgccc cgcaactaca tcggctggtg gcagcagaca 1680
ccaggacagg cccctcggct gctgatctat ggagcctcta gccgggccgc aggattccct 1740
gacagatttt ccggctctgg cagcggcacc gatttcacac tgaccatcac agacctggag 1800
cccgaggatt ttgccatgta ctattgccac cagtacgaca gactgcctta taccttcggc 1860
cagggcacaa agctggagat caagaccgtg gccgccccta gcgtgttcat ctttcctcca 1920
tccgatgagc agctgaagag cggcacagcc tccgtggtgt gcctgctgaa caacttctac 1980
ccaagggagg ccaaggtgca gtggaaggtg gacaatgccc tgcagtccgg caactctcag 2040
gagagcgtga ccgagcagga ctccaaggat tctacatatt ccctgtctaa taccctgaca 2100
ctgagcaagg ccgactacga gaagcacaag gtgtatgcat gcgaggtgac ccaccagggc 2160
ctgtcctctc ctgtgacaaa gtccttcaac agaggcgagt gttgataa 2208
<210> 12
<211> 734
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9296,修饰的埃博拉病毒ZBDBV223
<400> 12
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Gln Gln Trp Gly Ala Gly Leu Leu Lys
20 25 30
Pro Ser Glu Thr Leu Ser Leu Thr Cys Ala Val Tyr Gly Gly Ser Phe
35 40 45
Thr Thr Thr Tyr Trp Asn Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
50 55 60
Glu Trp Ile Gly Glu Val Asn Tyr Ser Gly Asn Ala Asn Tyr Asn Pro
65 70 75 80
Ser Leu Gln Gly Arg Val Ala Ile Ser Val Asp Thr Ser Lys Asn Gln
85 90 95
Phe Ser Leu Gln Leu Asn Ser Val Thr Ala Ala Asp Thr Ala Ile Tyr
100 105 110
Tyr Cys Thr Ser Arg Ile Arg Ser His Ile Ala Tyr Ser Trp Lys Gly
115 120 125
Trp Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
130 135 140
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser
145 150 155 160
Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
165 170 175
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
180 185 190
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
195 200 205
Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys
210 215 220
Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu
225 230 235 240
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
245 250 255
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
260 265 270
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
275 280 285
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
290 295 300
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
305 310 315 320
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
325 330 335
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
340 345 350
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
355 360 365
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
370 375 380
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
385 390 395 400
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
405 410 415
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
420 425 430
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
435 440 445
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
450 455 460
Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser
465 470 475 480
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
485 490 495
Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu
500 505 510
Leu Trp Ile Ser Gly Ala Tyr Gly Glu Ile Val Met Thr Gln Ser Pro
515 520 525
Gly Thr Leu Ser Leu Ser Pro Gly Glu Gln Ala Thr Leu Ser Cys Arg
530 535 540
Ala Ser Gln Ser Val Pro Arg Asn Tyr Ile Gly Trp Trp Gln Gln Thr
545 550 555 560
Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg Ala
565 570 575
Ala Gly Phe Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
580 585 590
Thr Leu Thr Ile Thr Asp Leu Glu Pro Glu Asp Phe Ala Met Tyr Tyr
595 600 605
Cys His Gln Tyr Asp Arg Leu Pro Tyr Thr Phe Gly Gln Gly Thr Lys
610 615 620
Leu Glu Ile Lys Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro
625 630 635 640
Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu
645 650 655
Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn
660 665 670
Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser
675 680 685
Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala
690 695 700
Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly
705 710 715 720
Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 13
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9297,埃博拉病毒ZBDBV223部分移植物
<400> 13
atggactgga cctggagaat cctgttcctg gtggcagcag caacaggaac ccacgcacag 60
gtgcagctgc agcagtgggg cgccggcctg ctgaagccaa gcgagacact gtccctgaca 120
tgcgccgtgt acggcggcag ctttaccaca acctattgga attggatcag acagccccct 180
ggcaagggcc tggagtggat cggcgaggtg aactactctg gcaacgccaa ttataacccc 240
agcctgaagg gcagggtggc catctctgtg gacacaagca agaatcagtt ctctctgcgc 300
ctgaacagcg tgaccgcagc agatacagcc atctactatt gcaccagccg gatcagaagc 360
cacatcgcct actcctggaa gggcgacgtg tggggcaagg gcacaaccgt gaccgtgagc 420
tccgcctcca caaagggacc aagcgtgttc ccactggcac cctctagcaa gagcacctcc 480
ggcggcacag ccgccctggg ctgtctggtg aaggattatt tccccgagcc tgtgaccgtg 540
agctggaatt ccggcgccct gaccagcgga gtgcacacat ttccagccgt gctgcagtcc 600
tctggcctgt actccctgag ctccgtggtg accgtgccct ctagctccct gggcacacag 660
acctatatct gcaatgtgaa ccacaagccc tctaacacaa aggtggacaa gaaggtggag 720
cctaagagct gtgataagac acacacctgc ccaccctgtc cagcaccaga gctgctgggc 780
ggccctagcg tgttcctgtt tcctccaaag ccaaaggaca ccctgatgat ctcccggacc 840
cctgaggtga catgcgtggt ggtggacgtg tctcacgagg accccgaggt gaagttcaat 900
tggtacgtgg atggcgtgga ggtgcacaac gccaagacca agcctaggga ggagcagtac 960
aatagcacct atcgcgtggt gtccgtgctg acagtgctgc accaggattg gctgaatggc 1020
aaggagtata agtgcaaggt gagcaacaag gccctgcctg ccccaatcga gaagaccatc 1080
tccaaggcaa agggacagcc tcgggagcca caggtgtaca cactgccccc tagcagagac 1140
gagctgacca agaatcaggt gtccctgaca tgtctggtga agggcttcta tccatccgat 1200
atcgccgtgg agtgggagtc taacggccag cccgagaaca attacaagac aaccccaccc 1260
gtgctggact ctgatggcag cttctttctg tattccaagc tgaccgtgga caagtctaga 1320
tggcagcagg gcaacgtgtt cagctgcagc gtgatgcacg aggccctgca caaccactac 1380
acccagaagt ccctgtctct gagcccaggc aagcggggca gaaagcggag atccggctct 1440
ggcgccacaa atttcagcct gctgaagcag gcaggcgatg tggaggagaa cccaggacct 1500
atggtgctgc agacccaggt gtttatctct ctgctgctgt ggatcagcgg agcatacgga 1560
gagacaaccc tgacccagag cccaggcaca ctgagcctgt ccccaggaga gagggccacc 1620
ctgtcctgta gggcatctca gagcgtgcca cggaactaca tcggatggtt ccagcagaag 1680
ccaggacagg cccctagact gctgatctat ggagcctcta gccgggccgc aggattccct 1740
gacagatttt ccggctctgg cagcggcacc gatttcacac tgaccatcac aaggctggag 1800
cccgaggact ttgccatgta ctattgccac cagtacgata ggctgcctta taccttcggc 1860
cagggcacaa agctggagat caagaggacc gtggcagcac ctagcgtgtt catctttcct 1920
ccatccgacg agcagctgaa gagcggcaca gcctccgtgg tgtgcctgct gaacaacttc 1980
tacccacgcg aggccaaggt gcagtggaag gtggataatg ccctgcagtc cggcaactct 2040
caggagagcg tgaccgagca ggactccaag gattctacat attccctgtc taataccctg 2100
acactgagca aggccgacta cgagaagcac aaggtgtatg catgcgaggt gacccaccag 2160
ggcctgtcct ctcctgtgac aaagtccttt aacaggggcg agtgttgata a 2211
<210> 14
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9297,埃博拉病毒ZBDBV223部分移植物
<400> 14
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Gln Gln Trp Gly Ala Gly Leu Leu Lys
20 25 30
Pro Ser Glu Thr Leu Ser Leu Thr Cys Ala Val Tyr Gly Gly Ser Phe
35 40 45
Thr Thr Thr Tyr Trp Asn Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
50 55 60
Glu Trp Ile Gly Glu Val Asn Tyr Ser Gly Asn Ala Asn Tyr Asn Pro
65 70 75 80
Ser Leu Lys Gly Arg Val Ala Ile Ser Val Asp Thr Ser Lys Asn Gln
85 90 95
Phe Ser Leu Arg Leu Asn Ser Val Thr Ala Ala Asp Thr Ala Ile Tyr
100 105 110
Tyr Cys Thr Ser Arg Ile Arg Ser His Ile Ala Tyr Ser Trp Lys Gly
115 120 125
Asp Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
130 135 140
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser
145 150 155 160
Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
165 170 175
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
180 185 190
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
195 200 205
Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys
210 215 220
Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu
225 230 235 240
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
245 250 255
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
260 265 270
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
275 280 285
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
290 295 300
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
305 310 315 320
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
325 330 335
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
340 345 350
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
355 360 365
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
370 375 380
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
385 390 395 400
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
405 410 415
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
420 425 430
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
435 440 445
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
450 455 460
Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser
465 470 475 480
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
485 490 495
Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu
500 505 510
Leu Trp Ile Ser Gly Ala Tyr Gly Glu Thr Thr Leu Thr Gln Ser Pro
515 520 525
Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg
530 535 540
Ala Ser Gln Ser Val Pro Arg Asn Tyr Ile Gly Trp Phe Gln Gln Lys
545 550 555 560
Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg Ala
565 570 575
Ala Gly Phe Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
580 585 590
Thr Leu Thr Ile Thr Arg Leu Glu Pro Glu Asp Phe Ala Met Tyr Tyr
595 600 605
Cys His Gln Tyr Asp Arg Leu Pro Tyr Thr Phe Gly Gln Gly Thr Lys
610 615 620
Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
625 630 635 640
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
645 650 655
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp
660 665 670
Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp
675 680 685
Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys
690 695 700
Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
705 710 715 720
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730 735
<210> 15
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9298,埃博拉病毒ZBDBV223移植到MERSYTE
<400> 15
atggactgga cctggagaat cctgttcctg gtggcagcag caacaggaac ccacgcacag 60
gtgcagctgg tgcagagcgg agccgaggtg aagaagccag gcagctccgt gaaggtgtcc 120
tgcaaggcca gcggcggctc cttcaccaca acctacatct cttgggtgcg ccaggcacca 180
ggacagggcc tggagtggat gggcggcgtg aactacagcg gcaacgccaa ttatgcccag 240
aagtttcagg gccgggtgac aatcaccgcc gacacaagca cctccacagc ctacatggag 300
ctgtctagcc tgagaagcga ggataccgcc gtgtactatt gcaccagccg gatcagaagc 360
cacatcgcct attcctggaa gggcgacgtg tggggacagg gaacaaccgt gaccgtgtcc 420
tctgcctcca caaagggacc aagcgtgttc ccactggcac ctagctccaa gtctaccagc 480
ggcggcacag ccgccctggg atgtctggtg aaggattact tccctgagcc agtgaccgtg 540
tcttggaaca gcggcgccct gaccagcgga gtgcacacat ttcccgccgt gctgcagtct 600
agcggcctgt actccctgtc ctctgtggtg accgtgccta gctcctctct gggcacccag 660
acatatatct gcaacgtgaa tcacaagcct tctaatacaa aggtggacaa gaaggtggag 720
ccaaagagct gtgataagac ccacacatgc cctccctgtc cagcacctga gctgctgggc 780
ggcccaagcg tgttcctgtt tccacccaag cccaaggaca ccctgtacat cacacgggag 840
ccagaggtga cctgcgtggt ggtggacgtg tcccacgagg accccgaggt gaagttcaac 900
tggtacgtgg atggcgtgga ggtgcacaat gccaagacca agccaaggga ggagcagtac 960
aattctacct atcgcgtggt gagcgtgctg acagtgctgc accaggattg gctgaacggc 1020
aaggagtaca agtgcaaggt gtccaataag gccctgccag cccccatcga gaagaccatc 1080
tctaaggcaa agggacagcc aagggagcca caggtgtaca cactgcctcc aagccgcgac 1140
gagctgacca agaaccaggt gtccctgaca tgtctggtga agggcttcta tccctccgat 1200
atcgccgtgg agtgggagtc taatggccag cctgagaaca attacaagac aacccctccc 1260
gtgctggact ccgatggctc tttctttctg tatagcaagc tgaccgtgga caagtccaga 1320
tggcagcagg gcaacgtgtt ttcctgctct gtgatgcacg aggccctgca caatcactac 1380
acccagaaga gcctgtccct gtctcctggc aagaggggaa gaaagcggag aagcggctcc 1440
ggcgccacaa acttcagcct gctgaagcag gccggcgatg tggaggagaa tcctggccca 1500
atggtgctgc agacccaggt gtttatctcc ctgctgctgt ggatctctgg cgcctatgga 1560
gagacaaccc tgacccagag cccaggcaca ctgtctctga gccctggaga gagggccacc 1620
ctgtcctgta gggcatccca gtctgtgcca cggaactaca tcgcctggta tcagcagaag 1680
cctggccagg ccccaagact gctgatgttc ggagccagct cccgggccgc aggcatccct 1740
gacagattca gcggctccgg ctctggaacc gacttcaccc tgaacatctc tagcctggag 1800
cctgaggact tcgccgtgta ctattgccac cagtacgata ggctgccata tacctttggc 1860
cagggcacaa agctggagat caagaggacc gtggcagcac ctagcgtgtt catctttcca 1920
cccagcgacg agcagctgaa gtctggcaca gccagcgtgg tgtgcctgct gaacaatttc 1980
tacccaaggg aggccaaggt gcagtggaag gtggataacg ccctgcagag cggcaattcc 2040
caggagtctg tgaccgagca ggacagcaag gattccacat attctctgtc ctctaccctg 2100
acactgtcca aggccgacta cgagaagcac aaggtgtatg catgcgaggt gacccaccag 2160
ggcctgcgga gccccgtgac aaagtccttt aacagaggcg agtgttgata a 2211
<210> 16
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9298,埃博拉病毒ZBDBV223移植到MERSYTE
<400> 16
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Ser Phe
35 40 45
Thr Thr Thr Tyr Ile Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu
50 55 60
Glu Trp Met Gly Gly Val Asn Tyr Ser Gly Asn Ala Asn Tyr Ala Gln
65 70 75 80
Lys Phe Gln Gly Arg Val Thr Ile Thr Ala Asp Thr Ser Thr Ser Thr
85 90 95
Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr
100 105 110
Tyr Cys Thr Ser Arg Ile Arg Ser His Ile Ala Tyr Ser Trp Lys Gly
115 120 125
Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
130 135 140
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser
145 150 155 160
Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
165 170 175
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
180 185 190
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
195 200 205
Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys
210 215 220
Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu
225 230 235 240
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
245 250 255
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
260 265 270
Asp Thr Leu Tyr Ile Thr Arg Glu Pro Glu Val Thr Cys Val Val Val
275 280 285
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
290 295 300
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
305 310 315 320
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
325 330 335
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
340 345 350
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
355 360 365
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
370 375 380
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
385 390 395 400
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
405 410 415
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
420 425 430
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
435 440 445
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
450 455 460
Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser
465 470 475 480
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
485 490 495
Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu
500 505 510
Leu Trp Ile Ser Gly Ala Tyr Gly Glu Thr Thr Leu Thr Gln Ser Pro
515 520 525
Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg
530 535 540
Ala Ser Gln Ser Val Pro Arg Asn Tyr Ile Ala Trp Tyr Gln Gln Lys
545 550 555 560
Pro Gly Gln Ala Pro Arg Leu Leu Met Phe Gly Ala Ser Ser Arg Ala
565 570 575
Ala Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
580 585 590
Thr Leu Asn Ile Ser Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr
595 600 605
Cys His Gln Tyr Asp Arg Leu Pro Tyr Thr Phe Gly Gln Gly Thr Lys
610 615 620
Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
625 630 635 640
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
645 650 655
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp
660 665 670
Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp
675 680 685
Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys
690 695 700
Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
705 710 715 720
Gly Leu Arg Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730 735
<210> 17
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9299,埃博拉病毒ZBDBV223移植到V2L2
<400> 17
atggactgga cctggagaat cctgttcctg gtggcagcag caacaggaac ccacgcagag 60
gtgcagctgc tggagagcgg cggcggcctg gtgcagccag gcggctccct gaggctgtct 120
tgcgcagcat ctggcggcag cttcaccaca acctacatga actgggtgcg ccaggcacca 180
ggcaagggcc tggagtgggt gagcgccgtg aactattccg gcaatgccta ctatacagac 240
gatgtgaagg gccggtttac catcagcgtg gacacatcca agaacaccct gtacctgcag 300
atgaattccc tgagagccga ggatacagcc gtgtactatt gcaccagccg gatcagaagc 360
cacatcgcct atagctggaa gggcgacgtg tggggacagg gaacaaccgt gacagtgagc 420
tccgcctcta ccaagggccc aagcgtgttt cccctggccc cttctagcaa gtctacaagc 480
ggcggcaccg ccgccctggg atgtctggtg aaggattact tccctgagcc agtgaccgtg 540
tcctggaact ctggcgccct gacatccggc gtgcacacct ttcctgccgt gctgcagtcc 600
tctggcctgt acagcctgag ctccgtggtg accgtgccat ctagctccct gggcacacag 660
acctatatct gcaacgtgaa tcacaagcca tccaatacaa aggtggacaa gaaggtggag 720
cccaagtctt gtgataagac acacacctgc cctccctgtc cagcacctga gctgctgggc 780
ggcccaagcg tgttcctgtt tccacccaag cctaaggaca ccctgatgat cagcaggaca 840
cccgaggtga cctgcgtggt ggtggacgtg tcccacgagg accccgaggt gaagttcaac 900
tggtacgtgg atggcgtgga ggtgcacaat gccaagacca agcctcggga ggagcagtac 960
aactccacat atagagtggt gtctgtgctg accgtgctgc accaggactg gctgaacggc 1020
aaggagtata agtgcaaggt gtctaataag gccctgccag cccccatcga gaagacaatc 1080
agcaaggcaa agggacagcc aagggagcca caggtgtaca ccctgcctcc atctcgcgac 1140
gagctgacaa agaaccaggt gagcctgacc tgtctggtga agggcttcta tcctagcgat 1200
atcgccgtgg agtgggagtc caatggccag ccagagaaca attacaagac aacccctccc 1260
gtgctggaca gcgatggctc cttctttctg tattctaagc tgaccgtgga taagagccgc 1320
tggcagcagg gcaacgtgtt ttcctgctct gtgatgcacg aggccctgca caatcactac 1380
acccagaaga gcctgtccct gtctccaggc aagaggggaa gaaagcggag aagcggctcc 1440
ggagcaacca acttctccct gctgaagcag gcaggcgacg tggaggagaa tcctggacca 1500
atggtgctgc agacccaggt gtttatcagc ctgctgctgt ggatctccgg agcatacgga 1560
gccatccaga tgacacagag cccctctagc ctgtctgcca gcgtgggcga tagggtgaca 1620
atcacctgtc gcgcctccca gtctgtgcct aggaattacc tgggctggta tcagcagaag 1680
cctggcaagg ccccaaagct gctgatctac ggagcatcca cactgcagtc tggagtgcct 1740
agccgcttca gcggctccgg ctctggaacc gactttacac tgaccatctc ctctctgcag 1800
ccagaggact tcgccacata ctattgccac cagtacgatc ggctgcccta tacatttggc 1860
cagggcacca aggtggagat caagagaacc gtggccgccc cttccgtgtt catctttcca 1920
ccctctgacg agcagctgaa gtccggcaca gcctctgtgg tgtgcctgct gaacaatttc 1980
tacccacggg aggccaaggt gcagtggaag gtggataacg ccctgcagtc tggcaatagc 2040
caggagtccg tgacagagca ggactctaag gatagcacct atagcctgtc caacacactg 2100
accctgtcca aggccgatta cgagaagcac aaggtgtatg cctgcgaggt gacacaccag 2160
ggcctgagct cccccgtgac caagagcttt aatagaggcg agtgttgata a 2211
<210> 18
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9299,埃博拉病毒ZBDBV223移植到V2L2
<400> 18
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Gly Ser Phe
35 40 45
Thr Thr Thr Tyr Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ser Ala Val Asn Tyr Ser Gly Asn Ala Tyr Tyr Thr Asp
65 70 75 80
Asp Val Lys Gly Arg Phe Thr Ile Ser Val Asp Thr Ser Lys Asn Thr
85 90 95
Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr
100 105 110
Tyr Cys Thr Ser Arg Ile Arg Ser His Ile Ala Tyr Ser Trp Lys Gly
115 120 125
Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
130 135 140
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser
145 150 155 160
Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
165 170 175
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
180 185 190
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
195 200 205
Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys
210 215 220
Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu
225 230 235 240
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
245 250 255
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
260 265 270
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
275 280 285
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
290 295 300
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
305 310 315 320
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
325 330 335
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
340 345 350
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
355 360 365
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
370 375 380
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
385 390 395 400
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
405 410 415
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
420 425 430
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
435 440 445
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
450 455 460
Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser
465 470 475 480
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
485 490 495
Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu
500 505 510
Leu Trp Ile Ser Gly Ala Tyr Gly Ala Ile Gln Met Thr Gln Ser Pro
515 520 525
Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg
530 535 540
Ala Ser Gln Ser Val Pro Arg Asn Tyr Leu Gly Trp Tyr Gln Gln Lys
545 550 555 560
Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Gly Ala Ser Thr Leu Gln
565 570 575
Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
580 585 590
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr
595 600 605
Cys His Gln Tyr Asp Arg Leu Pro Tyr Thr Phe Gly Gln Gly Thr Lys
610 615 620
Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
625 630 635 640
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
645 650 655
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp
660 665 670
Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp
675 680 685
Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys
690 695 700
Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
705 710 715 720
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730 735
<210> 19
<211> 1476
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9330,埃博拉病毒Z5D2 scFv-Fc
<400> 19
atggtgctgc agacccaggt gttcatttcc ctgctgctgt ggattagcgg agcctatgga 60
gatgtcgtgc tgacccagac cccactgacc ctgagcgtga ccatcggcca gccagcctcc 120
atctcttgca agtccagcca gtccctgctg gattctgacg gcaagaccta cctgaattgg 180
ctgctgcaga gacctggcca gagccctaag cggctgatct atctggtgtc taagctggat 240
tctggcgtga ccgatagatt caccggctcc ggctctggca ccgactttac cctgaagatc 300
tccagggtgg aggccgagga tctgggcgtg tattactgtt ggcagggcac ccactccccc 360
tttacattcg gcagcggcac aaagctggag atcaagggcg gcggcggctc cggcggcggc 420
ggctctggcg gcggcggctc tgaggtgcag ctgcaggaga gcggcccagg cctggtgcgc 480
ccatcccaga gcctgtctct gacatgtacc gtgacaggct acagcatcac atccgattac 540
gcctggaact ggatcagaca gttcccaggc aacaagctgg agtggctggg ctatatcacc 600
aacaccggct ctacaggctt caacccttcc ctgaagtcca gaatctctat cacccgcgat 660
acatccaaga accagttctt tctgcagctg atcagcgtga ccacagagga taccgccaca 720
tatcactgtg ccagaggcct ggcctactgg ggccagggca ccctggtgac cgtgtcctct 780
gagcccaagt cctgtgataa gacccacacc tgcccacctt gtcccgcccc agagctgctg 840
ggcggcccca gcgtgttcct gtttcctcca aagcccaagg acaccctgat gatcagcagg 900
acaccagagg tgacatgcgt ggtggtggac gtgtctcacg aggacccaga ggtgaagttc 960
aactggtacg tggatggcgt ggaggtgcac aacgccaaga ccaagccacg ggaggagcag 1020
tacaacagca cctacagagt ggtgtccgtg ctgaccgtgc tgcaccagga ttggctgaac 1080
ggcaaggagt acaagtgtaa ggtgtctaac aaggccctgc ccgccccaat cgagaagacc 1140
atctccaagg ccaagggcca gcctagggag ccacaggtgt atacactgcc accctctaga 1200
gatgagctga caaagaatca ggtgtccctg acatgcctgg tgaagggctt ctatccatcc 1260
gacatcgccg tggagtggga gagcaatggc cagccagaga ataactacaa gaccacacca 1320
cctgtgctgg attccgacgg ctctttcttc ctgtactcca agctgaccgt ggataagtcc 1380
aggtggcagc agggcaacgt gttttcttgc agcgtcatgc acgaagcact gcacaaccat 1440
tacactcaga agagcctgtc actgtcacct tgataa 1476
<210> 20
<211> 490
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9330,埃博拉病毒Z5D2 scFv-Fc
<400> 20
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Asp Val Val Leu Thr Gln Thr Pro Leu Thr Leu Ser
20 25 30
Val Thr Ile Gly Gln Pro Ala Ser Ile Ser Cys Lys Ser Ser Gln Ser
35 40 45
Leu Leu Asp Ser Asp Gly Lys Thr Tyr Leu Asn Trp Leu Leu Gln Arg
50 55 60
Pro Gly Gln Ser Pro Lys Arg Leu Ile Tyr Leu Val Ser Lys Leu Asp
65 70 75 80
Ser Gly Val Thr Asp Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe
85 90 95
Thr Leu Lys Ile Ser Arg Val Glu Ala Glu Asp Leu Gly Val Tyr Tyr
100 105 110
Cys Trp Gln Gly Thr His Ser Pro Phe Thr Phe Gly Ser Gly Thr Lys
115 120 125
Leu Glu Ile Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
130 135 140
Gly Gly Ser Glu Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Arg
145 150 155 160
Pro Ser Gln Ser Leu Ser Leu Thr Cys Thr Val Thr Gly Tyr Ser Ile
165 170 175
Thr Ser Asp Tyr Ala Trp Asn Trp Ile Arg Gln Phe Pro Gly Asn Lys
180 185 190
Leu Glu Trp Leu Gly Tyr Ile Thr Asn Thr Gly Ser Thr Gly Phe Asn
195 200 205
Pro Ser Leu Lys Ser Arg Ile Ser Ile Thr Arg Asp Thr Ser Lys Asn
210 215 220
Gln Phe Phe Leu Gln Leu Ile Ser Val Thr Thr Glu Asp Thr Ala Thr
225 230 235 240
Tyr His Cys Ala Arg Gly Leu Ala Tyr Trp Gly Gln Gly Thr Leu Val
245 250 255
Thr Val Ser Ser Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
260 265 270
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
275 280 285
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
290 295 300
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
305 310 315 320
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
325 330 335
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
340 345 350
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
355 360 365
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
370 375 380
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
385 390 395 400
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
405 410 415
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
420 425 430
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
435 440 445
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
450 455 460
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
465 470 475 480
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
485 490
<210> 21
<211> 1488
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9331,埃博拉病毒Z1H3 scFv-Fc
<400> 21
atggactgga cctggagaat cctgttcctg gtcgccgccg ctactgggac tcacgccgaa 60
gtgcagctgc agcagagtgg agccgagctg gtgaagccag gcgccagcgt gaagctgtcc 120
tgcacagcct ccggctttaa catcaaggat acctacatcc actgggtgaa gcagggccct 180
gagcagggcc tggagtggat cggcaggatc gatcccgcca acggcaatac aaagtacgat 240
ccaaagtttc agggcaaggc caccatcaca gccgacacct ctagcaatac agcctatctg 300
cagctgtctg gcctgacatc cgaggataca gccgtgtact attgtgcccg ggagtctaga 360
atcagcacaa tgctgaccac aggctacttt gactactggg gccagggcac caccctgacc 420
gtgagcagcg gcggcggcgg ctctggcggc ggcggctccg gcggcggcgg cagccagatc 480
gtgctgaccc agtccccagc catcatgagc gcctccccag gcgagaaggt gaccatgacc 540
tgctccgcct ctagctccgt gtcttatatg tactggtatc agcagaagcc aggctcctct 600
ccaagactgc tgatctatga taccagcaat ctggcctctg gcgtgccagt gagattctct 660
ggcagcggct ccggcaccag ctactccctg acaatcagca ggatggaggc cgaggatgcc 720
gccacatact attgccagca gtggtcttcc tatccctaca cctttggcgg cggcacaaag 780
ctggagatca aggagcctaa gtcctgcgat aagacccaca cctgtcctcc ctgcccagcc 840
cccgagctgc tgggcggccc atccgtgttt ctgttccctc caaagcccaa ggataccctg 900
atgatctccc ggacaccaga ggtgacatgc gtggtggtgg atgtgagcca cgaggaccca 960
gaggtgaagt tcaactggta cgtggatggc gtggaggtgc acaatgccaa gaccaagcca 1020
agagaggagc agtacaacag cacatacagg gtggtgtctg tgctgacagt gctgcaccag 1080
gactggctga atggcaagga gtataagtgc aaggtgtcca ataaggccct gcctgcccct 1140
atcgagaaga ccatctccaa ggccaagggc cagcccaggg agccacaggt gtataccctg 1200
cctcccagcc gggatgagct gacaaagaac caggtgtccc tgacatgtct ggtgaagggc 1260
ttctacccta gcgatatcgc cgtggagtgg gagtccaacg gccagccaga gaacaattat 1320
aagacaaccc cacctgtgct ggattccgac ggcagcttct ttctgtattc caagctgaca 1380
gtggacaaga gcaggtggca gcagggcaac gtgtttagct gctccgtcat gcacgaagcc 1440
ctgcacaacc actacaccca gaagtcactg agcctgtcac cttgataa 1488
<210> 22
<211> 494
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9331,埃博拉病毒Z1H3 scFv-Fc
<400> 22
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Lys
20 25 30
Pro Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile
35 40 45
Lys Asp Thr Tyr Ile His Trp Val Lys Gln Gly Pro Glu Gln Gly Leu
50 55 60
Glu Trp Ile Gly Arg Ile Asp Pro Ala Asn Gly Asn Thr Lys Tyr Asp
65 70 75 80
Pro Lys Phe Gln Gly Lys Ala Thr Ile Thr Ala Asp Thr Ser Ser Asn
85 90 95
Thr Ala Tyr Leu Gln Leu Ser Gly Leu Thr Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Glu Ser Arg Ile Ser Thr Met Leu Thr Thr Gly
115 120 125
Tyr Phe Asp Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Gly
130 135 140
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ile
145 150 155 160
Val Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly Glu Lys
165 170 175
Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val Ser Tyr Met Tyr Trp
180 185 190
Tyr Gln Gln Lys Pro Gly Ser Ser Pro Arg Leu Leu Ile Tyr Asp Thr
195 200 205
Ser Asn Leu Ala Ser Gly Val Pro Val Arg Phe Ser Gly Ser Gly Ser
210 215 220
Gly Thr Ser Tyr Ser Leu Thr Ile Ser Arg Met Glu Ala Glu Asp Ala
225 230 235 240
Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Ser Tyr Pro Tyr Thr Phe Gly
245 250 255
Gly Gly Thr Lys Leu Glu Ile Lys Glu Pro Lys Ser Cys Asp Lys Thr
260 265 270
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
275 280 285
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
290 295 300
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
305 310 315 320
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
325 330 335
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
340 345 350
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
355 360 365
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
370 375 380
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
385 390 395 400
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
405 410 415
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
420 425 430
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
435 440 445
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
450 455 460
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
465 470 475 480
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
485 490
<210> 23
<211> 1488
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9332,埃博拉病毒ZBDBV223 scFv-Fc
<400> 23
atggattgga cttggaggat tctgtttctg gtcgccgccg ctacagggac tcacgctcag 60
gtgcagctgc agcagtgggg agccgggctg ctgaagccat ctgagaccct gtctctgaca 120
tgcgccgtgt acggcggctc cttcacaacc acctactgga actggatcag acagccaccc 180
ggcaagggcc tggagtggat cggcgaggtg aactacagcg gcaatgccaa ctacaatccc 240
tccctgaagg gcagggtggc catctccgtg gatacatcca agaaccagtt ttccctgcgg 300
ctgaatagcg tgacagccgc cgacaccgcc atctattact gcacaagccg gatcagaagc 360
cacatcgcct actcttggaa gggcgacgtg tggggcaagg gcacaaccgt gacagtgtcc 420
tctggcggcg gcggctccgg cggcggcggc agcggcggcg gcggcagcga gatcgtgatg 480
acccagtccc caggcacact gagcctgtcc ccaggcgaga gagccaccct gagctgtagg 540
gcctctcagt ccgtgccaag gaactatatc ggctggtttc agcagaagcc aggccaggcc 600
cctagactgc tgatctatgg cgccagctcc agagccgccg gcttccccga taggttttct 660
ggctccggct ctggcaccga cttcacactg accatcacaa gactggagcc agaggacttt 720
gccatgtatt actgccacca gtatgatcgg ctgccataca ccttcggcca gggcaccaag 780
ctggagatca aggagccaaa gagctgtgac aagacccaca cctgccctcc ctgcccagcc 840
ccagagctgc tgggcggccc atccgtgttc ctgttcccac caaagcccaa ggacaccctg 900
atgatctccc gcacaccaga ggtgacctgc gtggtggtgg acgtgtctca cgaggaccca 960
gaggtgaagt ttaactggta cgtggacggc gtggaggtgc acaacgccaa gacaaagccc 1020
agagaggagc agtacaattc cacatacaga gtggtgtctg tgctgacagt gctgcaccag 1080
gattggctga acggcaagga gtataagtgc aaggtgtcta acaaggccct gcccgcccca 1140
atcgagaaga caatcagcaa ggccaagggc cagccaagag agccccaggt gtataccctg 1200
cctccatcta gagacgagct gaccaagaat caggtgtccc tgacatgtct ggtgaagggc 1260
ttctacccta gcgacatcgc cgtggagtgg gagtccaatg gccagccaga gaataactac 1320
aagaccaccc ctccagtgct ggattctgac ggcagctttt tcctgtattc taagctgacc 1380
gtggacaaga gcagatggca gcagggcaac gtgttttcct gcagcgtcat gcacgaagcc 1440
ctgcacaacc attacaccca gaagagcctg tcactgagcc cctgataa 1488
<210> 24
<211> 494
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9332,埃博拉病毒ZBDBV223 scFv-Fc
<400> 24
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Gln Gln Trp Gly Ala Gly Leu Leu Lys
20 25 30
Pro Ser Glu Thr Leu Ser Leu Thr Cys Ala Val Tyr Gly Gly Ser Phe
35 40 45
Thr Thr Thr Tyr Trp Asn Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
50 55 60
Glu Trp Ile Gly Glu Val Asn Tyr Ser Gly Asn Ala Asn Tyr Asn Pro
65 70 75 80
Ser Leu Lys Gly Arg Val Ala Ile Ser Val Asp Thr Ser Lys Asn Gln
85 90 95
Phe Ser Leu Arg Leu Asn Ser Val Thr Ala Ala Asp Thr Ala Ile Tyr
100 105 110
Tyr Cys Thr Ser Arg Ile Arg Ser His Ile Ala Tyr Ser Trp Lys Gly
115 120 125
Asp Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly
130 135 140
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Ile Val Met
145 150 155 160
Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr
165 170 175
Leu Ser Cys Arg Ala Ser Gln Ser Val Pro Arg Asn Tyr Ile Gly Trp
180 185 190
Phe Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala
195 200 205
Ser Ser Arg Ala Ala Gly Phe Pro Asp Arg Phe Ser Gly Ser Gly Ser
210 215 220
Gly Thr Asp Phe Thr Leu Thr Ile Thr Arg Leu Glu Pro Glu Asp Phe
225 230 235 240
Ala Met Tyr Tyr Cys His Gln Tyr Asp Arg Leu Pro Tyr Thr Phe Gly
245 250 255
Gln Gly Thr Lys Leu Glu Ile Lys Glu Pro Lys Ser Cys Asp Lys Thr
260 265 270
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
275 280 285
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
290 295 300
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
305 310 315 320
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
325 330 335
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
340 345 350
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
355 360 365
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
370 375 380
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
385 390 395 400
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
405 410 415
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
420 425 430
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
435 440 445
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
450 455 460
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
465 470 475 480
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
485 490
<210> 25
<211> 1482
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9345,EBV114_scFv-Fc
<400> 25
atggactgga cctggagaat cctgttcctg gtcgccgccg ctactgggac tcacgccgaa 60
gtgcagctgg tcgaatctgg gggaggcctg atccagccag gcggctccct gaggctgtct 120
tgcgccgcct ctggcttcgc cctgagaatg tacgatatgc actgggtgcg gcagacaatc 180
gacaagagac tggagtgggt gtctgccgtg ggcccaagcg gcgacaccta ttacgccgac 240
tctgtgaagg gccggttcgc cgtgtctaga gagaatgcca agaactccct gagcctgcag 300
atgaacagcc tgacagccgg cgacaccgcc atctattact gcgtgagaag cgacaggggc 360
gtggccggcc tgttcgattc ctggggccag ggcatcctgg tgacagtgtc cagcggcggc 420
ggcggctctg gcggcggcgg ctccggcggc ggcggcagcg atatccagat gacccagagc 480
ccctcctccc tgagcgcctc cgtgggcgac agaatcacaa tcacctgtag agcctcccag 540
gcctttgata attacgtggc ctggtatcag cagcggccag gcaaggtgcc aaagctgctg 600
atcagcgccg cctctgccct gcacgccggc gtgccaagca gattctctgg ctctggctcc 660
ggcacccact tcacactgac catctctagc ctgcagcccg aggatgtggc cacctattac 720
tgccagaact acaattccgc cccactgaca tttggcggcg gcacaaaggt ggagatcaag 780
gagccaaagt cttgcgacaa gacccacacc tgtccaccct gccccgcccc agagctgctg 840
ggcggccctt ccgtgttcct gtttccccca aagcctaagg ataccctgat gatctccagg 900
acacccgagg tgacatgcgt ggtggtggat gtgagccacg aggacccaga ggtgaagttc 960
aattggtacg tggacggcgt ggaggtgcac aatgccaaga caaagcctag agaggagcag 1020
tataactcca cctatagggt ggtgtccgtg ctgacagtgc tgcaccagga ttggctgaac 1080
ggcaaggagt acaagtgcaa ggtgtccaat aaggccctgc ccgcccctat cgagaagaca 1140
atctctaagg ccaagggcca gccaagagag ccacaggtgt acaccctgcc accctccaga 1200
gacgagctga caaagaacca ggtgtccctg acatgtctgg tgaagggctt ctatccctcc 1260
gatatcgccg tggagtggga gtctaatggc cagcccgaga acaattacaa gacaacccca 1320
cctgtgctgg actccgacgg cagctttttc ctgtactcca agctgaccgt ggataagtcc 1380
cggtggcagc agggcaacgt gttttcctgc tccgtgatgc acgaagcact gcacaaccac 1440
tacactcaga aaagcctgtc cctgtcacct ggcaaatgat aa 1482
<210> 26
<211> 492
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9345,EBV114_scFv-Fc
<400> 26
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Gln
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Leu
35 40 45
Arg Met Tyr Asp Met His Trp Val Arg Gln Thr Ile Asp Lys Arg Leu
50 55 60
Glu Trp Val Ser Ala Val Gly Pro Ser Gly Asp Thr Tyr Tyr Ala Asp
65 70 75 80
Ser Val Lys Gly Arg Phe Ala Val Ser Arg Glu Asn Ala Lys Asn Ser
85 90 95
Leu Ser Leu Gln Met Asn Ser Leu Thr Ala Gly Asp Thr Ala Ile Tyr
100 105 110
Tyr Cys Val Arg Ser Asp Arg Gly Val Ala Gly Leu Phe Asp Ser Trp
115 120 125
Gly Gln Gly Ile Leu Val Thr Val Ser Ser Gly Gly Gly Gly Ser Gly
130 135 140
Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Gln Met Thr Gln Ser
145 150 155 160
Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Ile Thr Ile Thr Cys
165 170 175
Arg Ala Ser Gln Ala Phe Asp Asn Tyr Val Ala Trp Tyr Gln Gln Arg
180 185 190
Pro Gly Lys Val Pro Lys Leu Leu Ile Ser Ala Ala Ser Ala Leu His
195 200 205
Ala Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr His Phe
210 215 220
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr
225 230 235 240
Cys Gln Asn Tyr Asn Ser Ala Pro Leu Thr Phe Gly Gly Gly Thr Lys
245 250 255
Val Glu Ile Lys Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
260 265 270
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
275 280 285
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
290 295 300
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
305 310 315 320
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
325 330 335
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
340 345 350
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
355 360 365
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
370 375 380
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
385 390 395 400
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
405 410 415
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
420 425 430
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
435 440 445
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
450 455 460
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
465 470 475 480
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
485 490
<210> 27
<211> 1512
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9346,1A2_scFv-Fc
<400> 27
atggtgctgc agacccaggt gttcatctct ctgctgctgt ggatctctgg cgcctatggc 60
gatatcgtga tgacccagtc ccctagaagc ctgtccgtga cacccggcga gcctgccagc 120
atctcctgca gatcctctca gagcctgctg cacaggaatg gctacaacta cctggactgg 180
tatctgcaga agcctggcca gtcccctcag ctgctgatct atctgggctc taatcgcgcc 240
agcggcgtgc ctgacaggtt ctccggcagc ggctctggca ccgacttcac actgaagatc 300
agcagagtgg aggccgagga cgtgggcgtg tactattgta tgcaggccct gcagacccct 360
tcctggacat tcggccaggg caccaaggtg gagatcaagg gcggcggcgg ctccggcggc 420
ggcggctctg gcggcggcgg ctccgaggtg cagctggtgg agtctggcgg cggcctgatc 480
cagccaggcg gctccctgag actgtcttgc gccgcctctg gcttcgccgt gaggtccaac 540
tacctgtctt gggtgcgcca ggcccctggc aagggcctgg agtgggtgtc tctgatctac 600
tccggcggcc tgacagccta cgccgattcc gtggagggcc ggttcacaat ctccagagac 660
aattccaaga acaccctgta cctgcagatg aactccctga gagtggagga tacagccctg 720
tattactgtg ccagagtggc cagctccgcc ggcacattct attacggcat ggacgtgtgg 780
ggccagggca caaccgtgac cgtgtcttcc gagcctaagt cctgtgacaa gacccacacc 840
tgtccaccct gtcctgcccc agagctgctg ggcggcccat ccgtgttcct gttccctcca 900
aagcccaagg atacactgat gatctctagg acccctgagg tgacctgcgt ggtggtggat 960
gtgagccacg aggaccctga ggtgaagttt aactggtacg tggatggcgt ggaggtgcac 1020
aatgccaaga caaagccaag agaggagcag tacaattcta catacagagt ggtgtctgtg 1080
ctgacagtgc tgcaccagga ctggctgaat ggcaaggagt acaagtgcaa ggtgtccaac 1140
aaggccctgc cagcccctat cgagaagacc atctccaagg ccaagggcca gccccgggag 1200
ccacaggtgt ataccctgcc accaagcaga gatgagctga ccaagaatca ggtgtccctg 1260
acatgtctgg tgaagggctt ctatcccagc gatatcgccg tggagtggga gagcaacggc 1320
cagcctgaga ataactacaa gaccacacca cctgtgctgg attccgatgg cagcttcttt 1380
ctgtattcca agctgaccgt ggacaagtcc agatggcagc agggcaacgt gttcagctgc 1440
tccgtgatgc acgaggccct gcacaatcac tacacccaga agtctctgtc cctgtctcct 1500
ggcaagtgat aa 1512
<210> 28
<211> 502
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9346,1A2_scFv-Fc
<400> 28
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Asp Ile Val Met Thr Gln Ser Pro Arg Ser Leu Ser
20 25 30
Val Thr Pro Gly Glu Pro Ala Ser Ile Ser Cys Arg Ser Ser Gln Ser
35 40 45
Leu Leu His Arg Asn Gly Tyr Asn Tyr Leu Asp Trp Tyr Leu Gln Lys
50 55 60
Pro Gly Gln Ser Pro Gln Leu Leu Ile Tyr Leu Gly Ser Asn Arg Ala
65 70 75 80
Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
85 90 95
Thr Leu Lys Ile Ser Arg Val Glu Ala Glu Asp Val Gly Val Tyr Tyr
100 105 110
Cys Met Gln Ala Leu Gln Thr Pro Ser Trp Thr Phe Gly Gln Gly Thr
115 120 125
Lys Val Glu Ile Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
130 135 140
Gly Gly Gly Ser Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile
145 150 155 160
Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala
165 170 175
Val Arg Ser Asn Tyr Leu Ser Trp Val Arg Gln Ala Pro Gly Lys Gly
180 185 190
Leu Glu Trp Val Ser Leu Ile Tyr Ser Gly Gly Leu Thr Ala Tyr Ala
195 200 205
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
210 215 220
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Leu
225 230 235 240
Tyr Tyr Cys Ala Arg Val Ala Ser Ser Ala Gly Thr Phe Tyr Tyr Gly
245 250 255
Met Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Glu Pro
260 265 270
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
275 280 285
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
290 295 300
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
305 310 315 320
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
325 330 335
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
340 345 350
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
355 360 365
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
370 375 380
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
385 390 395 400
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
405 410 415
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
420 425 430
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
435 440 445
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
450 455 460
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
465 470 475 480
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
485 490 495
Ser Leu Ser Pro Gly Lys
500
<210> 29
<211> 2226
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9356,1A2_全长_部分移植物
<400> 29
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcagag 60
gtgcagctgg tggagagcgg cggcggcctg atccagcccg gcggctctct gaggctgagc 120
tgcgcagcat ccggatttgc cgtgaggtct aactacctga gctgggtgcg ccaggcacct 180
ggcaagggcc tggagtgggt gtccctgatc tactctggcg gcctgaccgc atatgcagac 240
tccgtggagg gccggttcac catcagcaga gataactcca agaatacact gtatctgcag 300
atgaatagcc tgagggtgga ggacaccgcc ctgtactatt gcgcccgcgt ggccagctcc 360
gccggcacat tctactatgg catggacgtg tggggccagg gcaccacagt gaccgtgtct 420
agcgccagca caaagggacc atccgtgttt ccactggcac cttcctctaa gtccacctct 480
ggcggcacag ccgccctggg ctgtctggtg aaggactact tccctgagcc agtgaccgtg 540
tcttggaaca gcggcgccct gacctctgga gtgcacacat ttccagccgt gctgcagagc 600
tccggcctgt acagcctgtc tagcgtggtg accgtgccct cctctagcct gggcacccag 660
acatatatct gcaacgtgaa tcacaagcca tctaatacaa aggtggacaa gaaggtggag 720
cccaagagct gtgataagac ccacacatgc cctccctgtc cagcacctga gctgctgggc 780
ggcccaagcg tgttcctgtt tccacccaag cctaaggaca ccctgatgat ctccaggacc 840
cccgaggtga catgcgtggt ggtggacgtg tctcacgagg accccgaggt gaagtttaac 900
tggtacgtgg atggcgtgga ggtgcacaat gccaagacca agccccggga ggagcagtac 960
aactctacct atagagtggt gagcgtgctg acagtgctgc accaggattg gctgaacggc 1020
aaggagtata agtgcaaggt gagcaataag gccctgccag cccccatcga gaagaccatc 1080
tccaaggcaa agggacagcc acgggagcca caggtgtaca cactgcctcc aagcagagac 1140
gagctgacca agaaccaggt gtccctgaca tgtctggtga agggcttcta tccttccgat 1200
atcgccgtgg agtgggagtc taatggccag ccagagaaca attacaagac cacaccccct 1260
gtgctggact ccgatggctc tttctttctg tatagcaagc tgaccgtgga caagtcccgg 1320
tggcagcagg gcaacgtgtt tagctgctcc gtgatgcacg aggccctgca caatcactac 1380
acccagaagt ctctgagcct gtcccctggc aagaggggaa ggaagcggag atctggcagc 1440
ggagccacaa acttctccct gctgaagcag gccggcgatg tggaggagaa tcctggccca 1500
atggtgctgc agacccaggt gtttatctcc ctgctgctgt ggatctctgg cgcctacggc 1560
gccatccaga tgacacagag cccatcctct ctgtccgcct ctgtgggcga cagggtgacc 1620
atcacatgtc gcagctccca gtccctgctg cacagaaacg gctacaatta tctggattgg 1680
tacctgcaga agcctggcca gagcccacag ctgctgatct atctgggctc taacagggca 1740
agcggagtgc cagacagatt cagcggctcc ggctctggaa ccgacttcac cctgaagatc 1800
tcccgggtgg aggcagagga cgtgggcgtg tactattgca tgcaggccct gcagacccct 1860
agctggacat tcggccaggg caccaaggtg gagatcaaga gaacagtggc cgccccaagc 1920
gtgttcatct ttccacccag cgacgagcag ctgaagtccg gcaccgcctc tgtggtgtgc 1980
ctgctgaaca acttctaccc tagggaggcc aaggtgcagt ggaaggtgga taacgccctg 2040
cagagcggca attcccagga gtctgtgacc gagcaggaca gcaaggattc cacatatagc 2100
ctgtccaaca ccctgacact gtccaaggcc gattacgaga agcacaaggt gtatgcctgc 2160
gaggtgaccc accagggcct gtctagccca gtgacaaaga gcttcaatcg cggcgagtgt 2220
tgataa 2226
<210> 30
<211> 740
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9356,1A2_全长_部分移植物
<400> 30
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Gln
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Val
35 40 45
Arg Ser Asn Tyr Leu Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ser Leu Ile Tyr Ser Gly Gly Leu Thr Ala Tyr Ala Asp
65 70 75 80
Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr
85 90 95
Leu Tyr Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Leu Tyr
100 105 110
Tyr Cys Ala Arg Val Ala Ser Ser Ala Gly Thr Phe Tyr Tyr Gly Met
115 120 125
Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
130 135 140
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser
145 150 155 160
Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
165 170 175
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
180 185 190
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
195 200 205
Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys
210 215 220
Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu
225 230 235 240
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
245 250 255
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
260 265 270
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
275 280 285
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
290 295 300
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
305 310 315 320
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
325 330 335
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
340 345 350
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
355 360 365
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
370 375 380
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
385 390 395 400
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
405 410 415
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
420 425 430
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
435 440 445
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
450 455 460
Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser
465 470 475 480
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
485 490 495
Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu
500 505 510
Leu Trp Ile Ser Gly Ala Tyr Gly Ala Ile Gln Met Thr Gln Ser Pro
515 520 525
Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg
530 535 540
Ser Ser Gln Ser Leu Leu His Arg Asn Gly Tyr Asn Tyr Leu Asp Trp
545 550 555 560
Tyr Leu Gln Lys Pro Gly Gln Ser Pro Gln Leu Leu Ile Tyr Leu Gly
565 570 575
Ser Asn Arg Ala Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Gly Ser
580 585 590
Gly Thr Asp Phe Thr Leu Lys Ile Ser Arg Val Glu Ala Glu Asp Val
595 600 605
Gly Val Tyr Tyr Cys Met Gln Ala Leu Gln Thr Pro Ser Trp Thr Phe
610 615 620
Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser
625 630 635 640
Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala
645 650 655
Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val
660 665 670
Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser
675 680 685
Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr
690 695 700
Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys
705 710 715 720
Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn
725 730 735
Arg Gly Glu Cys
740
<210> 31
<211> 1512
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9357,1A2_scFv-Fc_部分移植物
<400> 31
atggtgctgc agacccaggt gttcatctct ctgctgctgt ggatctctgg cgcctatggc 60
gctatccaga tgacccagtc cccttcaagc ctgtccgcct ctgtgggcga cagggtgaca 120
atcacctgca gatcctctca gagcctgctg cacaggaatg gctacaacta cctggactgg 180
tatctgcaga agcctggcca gtcccctcag ctgctgatct atctgggctc taatcgcgcc 240
agcggcgtgc ctgacaggtt ctccggcagc ggctctggca ccgacttcac actgaagatc 300
agcagagtgg aggccgagga cgtgggcgtg tactattgta tgcaggccct gcagacccct 360
tcctggacat tcggccaggg caccaaggtg gagatcaagg gcggcggcgg ctccggcggc 420
ggcggctctg gcggcggcgg ctccgaggtg cagctggtgg agtctggcgg cggcctgatc 480
cagccaggcg gctccctgag actgtcttgc gccgcctctg gcttcgccgt gaggtccaac 540
tacctgtctt gggtgcgcca ggcccctggc aagggcctgg agtgggtgtc tctgatctac 600
tccggcggcc tgacagccta cgccgattcc gtggagggcc ggttcacaat ctccagagac 660
aattccaaga acaccctgta cctgcagatg aactccctga gagtggagga tacagccctg 720
tattactgtg ccagagtggc cagctccgcc ggcacattct attacggcat ggacgtgtgg 780
ggccagggca caaccgtgac cgtgtcttcc gagcctaagt cctgtgacaa gacccacacc 840
tgtccaccct gtcctgcccc agagctgctg ggcggcccat ccgtgttcct gttccctcca 900
aagcccaagg atacactgat gatctctagg acccctgagg tgacctgcgt ggtggtggat 960
gtgagccacg aggaccctga ggtgaagttt aactggtacg tggatggcgt ggaggtgcac 1020
aatgccaaga caaagccaag agaggagcag tacaattcta catacagagt ggtgtctgtg 1080
ctgacagtgc tgcaccagga ctggctgaat ggcaaggagt acaagtgcaa ggtgtccaac 1140
aaggccctgc cagcccctat cgagaagacc atctccaagg ccaagggcca gccccgggag 1200
ccacaggtgt ataccctgcc accaagcaga gatgagctga ccaagaatca ggtgtccctg 1260
acatgtctgg tgaagggctt ctatcccagc gatatcgccg tggagtggga gagcaacggc 1320
cagcctgaga ataactacaa gaccacacca cctgtgctgg attccgatgg cagcttcttt 1380
ctgtattcca agctgaccgt ggacaagtcc agatggcagc agggcaacgt gttcagctgc 1440
tccgtgatgc acgaggccct gcacaatcac tacacccaga agtctctgtc cctgtctcct 1500
ggcaagtgat aa 1512
<210> 32
<211> 502
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9357,1A2_scFv-Fc_部分移植物
<400> 32
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Ala Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser
20 25 30
Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ser Ser Gln Ser
35 40 45
Leu Leu His Arg Asn Gly Tyr Asn Tyr Leu Asp Trp Tyr Leu Gln Lys
50 55 60
Pro Gly Gln Ser Pro Gln Leu Leu Ile Tyr Leu Gly Ser Asn Arg Ala
65 70 75 80
Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
85 90 95
Thr Leu Lys Ile Ser Arg Val Glu Ala Glu Asp Val Gly Val Tyr Tyr
100 105 110
Cys Met Gln Ala Leu Gln Thr Pro Ser Trp Thr Phe Gly Gln Gly Thr
115 120 125
Lys Val Glu Ile Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
130 135 140
Gly Gly Gly Ser Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile
145 150 155 160
Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala
165 170 175
Val Arg Ser Asn Tyr Leu Ser Trp Val Arg Gln Ala Pro Gly Lys Gly
180 185 190
Leu Glu Trp Val Ser Leu Ile Tyr Ser Gly Gly Leu Thr Ala Tyr Ala
195 200 205
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
210 215 220
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Leu
225 230 235 240
Tyr Tyr Cys Ala Arg Val Ala Ser Ser Ala Gly Thr Phe Tyr Tyr Gly
245 250 255
Met Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Glu Pro
260 265 270
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
275 280 285
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
290 295 300
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
305 310 315 320
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
325 330 335
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
340 345 350
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
355 360 365
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
370 375 380
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
385 390 395 400
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
405 410 415
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
420 425 430
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
435 440 445
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
450 455 460
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
465 470 475 480
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
485 490 495
Ser Leu Ser Pro Gly Lys
500
<210> 33
<211> 2199
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9362,EBV114_全长_部分移植物
<400> 33
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcagag 60
gtgcagctgg tggagagcgg cggcggcctg atccagccag gcggctccct gaggctgtct 120
tgcgcagcaa gcggatttgc actgaggatg tacgacatgc actgggtgcg gcagaccatc 180
gataagagac tggagtgggt gagcgccgtg ggaccatccg gcgacacata ctatgccgat 240
agcgtgaagg gcaggttcgc cgtgtcccgc gagaacgcca agaattctct gagcctgcag 300
atgaacagcc tgaccgccgg cgacacagcc atctactatt gcgtgcggtc cgacagaggc 360
gtggcaggcc tgttcgattc ttggggccag ggcatcctgg tgaccgtgag ctccgcctct 420
acaaagggac caagcgtgtt tccactggca ccttctagca agtccacctc tggcggcaca 480
gccgccctgg gctgtctggt gaaggattac ttccctgagc cagtgaccgt gtcttggaac 540
agcggcgccc tgacctctgg agtgcacaca tttcctgccg tgctgcagtc ctctggcctg 600
tacagcctga gctccgtggt gaccgtgcca tctagctccc tgggcaccca gacatatatc 660
tgcaacgtga atcacaagcc atctaataca aaggtggaca agaaggtgga gcccaagagc 720
tgtgataaga cccacacatg ccctccctgt ccagcacctg agctgctggg cggcccatcc 780
gtgttcctgt ttccacccaa gcctaaggac accctgatga tctccaggac ccccgaggtg 840
acatgcgtgg tggtggacgt gtctcacgag gaccccgagg tgaagttcaa ctggtacgtg 900
gatggcgtgg aggtgcacaa tgccaagacc aagccccggg aggagcagta caattccacc 960
tatagagtgg tgtctgtgct gacagtgctg caccaggact ggctgaacgg caaggagtat 1020
aagtgcaagg tgagcaataa ggccctgcca gcccccatcg agaagaccat ctccaaggca 1080
aagggacagc cacgggagcc acaggtgtac acactgcctc caagcagaga cgagctgacc 1140
aagaaccagg tgtccctgac atgtctggtg aagggcttct atccttctga tatcgccgtg 1200
gagtgggaga gcaatggcca gccagagaac aattacaaga ccacaccccc tgtgctggac 1260
tccgatggct ctttctttct gtattctaag ctgaccgtgg acaagagccg ctggcagcag 1320
ggcaacgtgt ttagctgctc cgtgatgcac gaggccctgc acaatcacta cacccagaag 1380
tctctgagcc tgtcccctgg caagagggga aggaagcgga gatctggcag cggagccaca 1440
aacttcagcc tgctgaagca ggccggcgat gtggaggaga atcctggccc aatggtgctg 1500
cagacccagg tgtttatcag cctgctgctg tggatctccg gcgcctatgg cgccatccag 1560
atgacacagt ccccttctag cctgtccgcc tctgtgggcg acagggtgac catcacatgt 1620
cgcgccagcc aggccttcga taactacgtg gcctggtatc agcagaggcc tggcaaggtg 1680
ccaaagctgc tgatcagcgc cgcatccgcc ctgcacgcag gagtgccatc ccgcttcagc 1740
ggctccggct ctggaaccca ctttaccctg acaatctcct ctctgcagcc agaggacgtg 1800
gccacatact attgccagaa ctacaatagc gcacccctga ccttcggggg cgggacaaag 1860
gtggagatca agaggaccgt ggcagcacca tccgtgttca tctttccacc ctctgacgag 1920
cagctgaagt ccggcacagc ctctgtggtg tgcctgctga acaacttcta ccctagagag 1980
gccaaggtgc agtggaaggt ggataacgcc ctgcagtctg gcaatagcca ggagtccgtg 2040
accgagcagg actctaagga tagcacatat agcctgtcca acaccctgac actgtccaag 2100
gccgattacg agaagcacaa ggtgtatgca tgcgaggtga cccaccaggg cctgagctcc 2160
ccagtgacaa agagctttaa tagaggcgag tgttgataa 2199
<210> 34
<211> 731
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9362,EBV114_全长_部分移植物
<400> 34
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Gln
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Leu
35 40 45
Arg Met Tyr Asp Met His Trp Val Arg Gln Thr Ile Asp Lys Arg Leu
50 55 60
Glu Trp Val Ser Ala Val Gly Pro Ser Gly Asp Thr Tyr Tyr Ala Asp
65 70 75 80
Ser Val Lys Gly Arg Phe Ala Val Ser Arg Glu Asn Ala Lys Asn Ser
85 90 95
Leu Ser Leu Gln Met Asn Ser Leu Thr Ala Gly Asp Thr Ala Ile Tyr
100 105 110
Tyr Cys Val Arg Ser Asp Arg Gly Val Ala Gly Leu Phe Asp Ser Trp
115 120 125
Gly Gln Gly Ile Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
130 135 140
Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr
145 150 155 160
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
165 170 175
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
180 185 190
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
195 200 205
Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn
210 215 220
His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser
225 230 235 240
Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
245 250 255
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
260 265 270
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
275 280 285
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
290 295 300
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
305 310 315 320
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
325 330 335
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
340 345 350
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
355 360 365
Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val
370 375 380
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
385 390 395 400
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
405 410 415
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr
420 425 430
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
435 440 445
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
450 455 460
Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr
465 470 475 480
Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly
485 490 495
Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile
500 505 510
Ser Gly Ala Tyr Gly Ala Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
515 520 525
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
530 535 540
Ala Phe Asp Asn Tyr Val Ala Trp Tyr Gln Gln Arg Pro Gly Lys Val
545 550 555 560
Pro Lys Leu Leu Ile Ser Ala Ala Ser Ala Leu His Ala Gly Val Pro
565 570 575
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr His Phe Thr Leu Thr Ile
580 585 590
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr
595 600 605
Asn Ser Ala Pro Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys
610 615 620
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
625 630 635 640
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
645 650 655
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
660 665 670
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
675 680 685
Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
690 695 700
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
705 710 715 720
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 35
<211> 1485
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9363,EBV114_scFv-Fc_部分移植物
<400> 35
atggtgctgc agactcaggt gtttatttca ctgctgctgt ggatttcagg agcctatgga 60
gctattcaga tgactcagag cccaagcagc ctgtctgcct ccgtgggcga tagagtgaca 120
atcacctgta gagccagcca ggccttcgac aattacgtgg cctggtacca gcagagaccc 180
ggcaaggtgc caaagctgct gatcagcgcc gcctccgccc tgcacgccgg cgtgccttct 240
cgcttttccg gcagcggcag cggcacccac tttaccctga caatctccag cctgcagcct 300
gaggatgtgg ccacctacta ttgtcagaat tacaactctg ccccactgac cttcggcggc 360
ggcaccaagg tggagatcaa gggcggcggc ggcagcggcg gcggcggctc cggcggcggc 420
ggctctgagg tgcagctggt ggagtctggc ggcggcctga tccagcccgg cggctctctg 480
aggctgtcct gcgccgcctc cggctttgcc ctgcggatgt atgacatgca ctgggtgcgc 540
cagacaatcg acaagagact ggagtgggtg tctgccgtgg gcccttccgg cgatacctac 600
tatgccgata gcgtgaaggg cagatttgcc gtgagcagag agaacgccaa gaactctctg 660
agcctgcaga tgaacagcct gaccgccggc gatacagcca tctactattg cgtgagaagc 720
gacagaggcg tggccggcct gttcgactct tggggccagg gcatcctggt gacagtgtcc 780
agcgagccta agtcttgcga taagacccac acctgtcccc cttgcccagc ccctgagctg 840
ctgggcggcc ccagcgtgtt cctgttccca cctaagccta aggatacact gatgatctcc 900
aggacaccag aggtgacatg cgtggtggtg gacgtgtccc acgaggaccc tgaggtgaag 960
ttcaactggt acgtggatgg cgtggaggtg cacaacgcca agacaaagcc cagggaggag 1020
cagtacaaca gcacctatag agtggtgtcc gtgctgacag tgctgcacca ggattggctg 1080
aatggcaagg agtacaagtg caaggtgtcc aacaaggccc tgcccgcccc tatcgagaag 1140
accatctcca aggccaaggg ccagcctaga gagccccagg tgtataccct gcctccctct 1200
agggatgagc tgacaaagaa ccaggtgtcc ctgacctgtc tggtgaaggg cttctatcca 1260
agcgatatcg ccgtggagtg ggagtctaac ggccagcccg agaataacta caagacaacc 1320
cctccagtgc tggacagcga tggctccttc tttctgtaca gcaagctgac cgtggacaag 1380
tccaggtggc agcagggcaa cgtgtttagc tgttccgtga tgcacgaagc cctgcacaac 1440
cactacactc agaagtcact gtcactgtct cctgggaagt gataa 1485
<210> 36
<211> 493
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9363,EBV114_scFv-Fc_部分移植物
<400> 36
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Ala Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser
20 25 30
Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ala
35 40 45
Phe Asp Asn Tyr Val Ala Trp Tyr Gln Gln Arg Pro Gly Lys Val Pro
50 55 60
Lys Leu Leu Ile Ser Ala Ala Ser Ala Leu His Ala Gly Val Pro Ser
65 70 75 80
Arg Phe Ser Gly Ser Gly Ser Gly Thr His Phe Thr Leu Thr Ile Ser
85 90 95
Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn
100 105 110
Ser Ala Pro Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Gly
115 120 125
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Val
130 135 140
Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Gln Pro Gly Gly Ser Leu
145 150 155 160
Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Leu Arg Met Tyr Asp Met
165 170 175
His Trp Val Arg Gln Thr Ile Asp Lys Arg Leu Glu Trp Val Ser Ala
180 185 190
Val Gly Pro Ser Gly Asp Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg
195 200 205
Phe Ala Val Ser Arg Glu Asn Ala Lys Asn Ser Leu Ser Leu Gln Met
210 215 220
Asn Ser Leu Thr Ala Gly Asp Thr Ala Ile Tyr Tyr Cys Val Arg Ser
225 230 235 240
Asp Arg Gly Val Ala Gly Leu Phe Asp Ser Trp Gly Gln Gly Ile Leu
245 250 255
Val Thr Val Ser Ser Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys
260 265 270
Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu
275 280 285
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
290 295 300
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys
305 310 315 320
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
325 330 335
Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu
340 345 350
Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
355 360 365
Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
370 375 380
Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
385 390 395 400
Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
405 410 415
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
420 425 430
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly
435 440 445
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
450 455 460
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
465 470 475 480
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
485 490
<210> 37
<211> 2193
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9224,埃博拉病毒Z5D2
<400> 37
atggattgga cttggaggat tctgtttctg gtcgccgccg ctactgggac acacgccgag 60
gtgcagctgc aggagagtgg gcctggactg gtgcgaccca gccagtccct gtctctgaca 120
tgcactgtga ccggctacag tatcacatca gactatgcct ggaactggat tcgccagttc 180
ccaggcaata agctggaatg gctgggatac atcacaaaca ctggcagcac cgggtttaat 240
cccagcctga agtcccgaat ctctattaca agggacactt ctaaaaacca gttctttctg 300
cagctgatta gtgtgaccac agaggatacc gcaacatacc actgcgcccg gggactggct 360
tattggggac aggggaccct ggtcacagtg agctccgcta gtacaaaggg gccttcagtg 420
ttccccctgg caccttctag taaaagtaca tcaggcggaa ctgccgctct gggctgtctg 480
gtgaaggatt acttccctga gccagtcacc gtgagttgga actcaggagc actgacctcc 540
ggggtccata catttcccgc cgtgctgcag tcaagcggcc tgtactctct gtcctctgtg 600
gtcactgtgc ctagttcaag cctgggaact cagacctata tctgcaacgt gaatcacaag 660
cctagcaata ccaaagtcga caagaaagtg gaaccaaaga gctgtgataa aacacatact 720
tgcccacctt gtccagcacc tgagctgctg ggaggaccaa gcgtgttcct gtttccaccc 780
aagcctaaag acacactgat gatctcccgc accccagaag tcacatgtgt ggtcgtggac 840
gtgtctcacg aggaccccga agtcaagttc aactggtacg tggatggcgt cgaggtgcat 900
aatgctaaga ccaaaccacg cgaggaacag tacaacagca catatcgagt cgtgtccgtc 960
ctgactgtgc tgcaccagga ctggctgaac ggcaaggagt ataagtgcaa agtgagcaat 1020
aaggctctgc cagcacccat cgagaaaaca attagcaagg caaaaggaca gccaagggaa 1080
ccccaggtgt acactctgcc tccatccaga gacgagctga ctaagaacca ggtctctctg 1140
acctgtctgg tgaaaggatt ctatcccagc gatatcgccg tggagtggga atccaatggg 1200
cagcctgaaa acaattacaa gactaccccc cctgtgctgg acagcgatgg gtccttcttt 1260
ctgtattcca agctgaccgt ggataaatct cggtggcagc agggcaacgt ctttagctgc 1320
tccgtgatgc atgaggccct gcacaatcat tacacacaga agtctctgag tctgtcacct 1380
ggcaagcggg gacgcaaaag gagaagcggc tccggagcaa ctaacttcag cctgctgaaa 1440
caggccgggg acgtggagga aaatcctggc ccaatggtcc tgcagaccca ggtgtttatc 1500
tctctgctgc tgtggattag tggggcctat ggcgatgtcg tgctgaccca gacaccactg 1560
actctgagcg tgaccatcgg acagcccgct tctattagtt gtaagtcctc tcagtctctg 1620
ctggacagtg atggcaaaac ctacctgaac tggctgctgc agagacctgg acagtcccca 1680
aagcggctga tctatctggt ctcaaaactg gacagcggcg tgacagatcg gttcactggg 1740
tcaggcagcg gaactgactt taccctgaag atttctcgcg tcgaggctga agatctggga 1800
gtgtactatt gctggcaggg gactcactca cctttcacct ttgggagcgg cacaaagctg 1860
gaaatcaaaa ccgtcgcagc cccaagtgtg ttcatttttc caccctcaga cgagcagctg 1920
aagtccggga cagcatctgt cgtgtgtctg ctgaacaatt tctaccctag ggaggctaag 1980
gtccagtgga aagtggataa cgcactgcag tctggcaata gtcaggagtc agtgaccgaa 2040
caggacagca aggattccac atattccctg tctaacactc tgaccctgag caaagccgac 2100
tacgagaagc acaaagtcta tgcttgcgaa gtgactcatc aggggctgag ttcaccagtg 2160
accaagagct ttaatagagg cgagtgttga taa 2193
<210> 38
<211> 729
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9224,埃博拉病毒Z5D2
<400> 38
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Arg
20 25 30
Pro Ser Gln Ser Leu Ser Leu Thr Cys Thr Val Thr Gly Tyr Ser Ile
35 40 45
Thr Ser Asp Tyr Ala Trp Asn Trp Ile Arg Gln Phe Pro Gly Asn Lys
50 55 60
Leu Glu Trp Leu Gly Tyr Ile Thr Asn Thr Gly Ser Thr Gly Phe Asn
65 70 75 80
Pro Ser Leu Lys Ser Arg Ile Ser Ile Thr Arg Asp Thr Ser Lys Asn
85 90 95
Gln Phe Phe Leu Gln Leu Ile Ser Val Thr Thr Glu Asp Thr Ala Thr
100 105 110
Tyr His Cys Ala Arg Gly Leu Ala Tyr Trp Gly Gln Gly Thr Leu Val
115 120 125
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
130 135 140
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
145 150 155 160
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
165 170 175
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
180 185 190
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
195 200 205
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
210 215 220
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
225 230 235 240
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
245 250 255
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
260 265 270
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
275 280 285
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
290 295 300
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
305 310 315 320
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
325 330 335
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
340 345 350
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
355 360 365
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
370 375 380
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
385 390 395 400
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
405 410 415
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
420 425 430
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
435 440 445
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly
450 455 460
Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
465 470 475 480
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr
485 490 495
Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Asp
500 505 510
Val Val Leu Thr Gln Thr Pro Leu Thr Leu Ser Val Thr Ile Gly Gln
515 520 525
Pro Ala Ser Ile Ser Cys Lys Ser Ser Gln Ser Leu Leu Asp Ser Asp
530 535 540
Gly Lys Thr Tyr Leu Asn Trp Leu Leu Gln Arg Pro Gly Gln Ser Pro
545 550 555 560
Lys Arg Leu Ile Tyr Leu Val Ser Lys Leu Asp Ser Gly Val Thr Asp
565 570 575
Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile Ser
580 585 590
Arg Val Glu Ala Glu Asp Leu Gly Val Tyr Tyr Cys Trp Gln Gly Thr
595 600 605
His Ser Pro Phe Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys Thr
610 615 620
Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu
625 630 635 640
Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro
645 650 655
Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly
660 665 670
Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr
675 680 685
Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His
690 695 700
Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val
705 710 715 720
Thr Lys Ser Phe Asn Arg Gly Glu Cys
725
<210> 39
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9225,埃博拉病毒Z1H3
<400> 39
atggattgga catggagaat cctgttcctg gtcgccgccg ctactgggac acacgccgaa 60
gtgcagctgc agcagagtgg agccgagctg gtcaaacctg gggcatccgt gaagctgtct 120
tgcactgcca gtggcttcaa catcaaagac acctacattc actgggtgaa gcagggccca 180
gagcagggac tggaatggat cggacggatt gacccagcaa acgggaatac caagtatgat 240
cccaaatttc aggggaaggc aaccatcaca gccgacacaa gctccaatac tgcctacctg 300
cagctgtcag gcctgaccag cgaggataca gccgtgtact attgcgccag ggagagcagg 360
atttccacca tgctgaccac aggatatttc gactactggg gacaggggac taccctgacc 420
gtctctagtg ccagcacaaa agggccttcc gtgtttcccc tggctccttc aagcaagtct 480
actagtggag gaaccgcagc tctgggatgt ctggtgaagg attacttccc tgagccagtc 540
accgtgtctt ggaacagtgg ggctctgacc tccggcgtcc acacatttcc agcagtgctg 600
cagtcctctg ggctgtattc tctgagttca gtggtcaccg tgcccagctc ctctctgggc 660
actcagacct acatctgcaa cgtgaatcac aaaccctcca atacaaaggt cgacaagaaa 720
gtggaaccta aatcttgtga taagacacat acttgcccac cttgtccagc acctgagctg 780
ctgggaggac ctagcgtgtt cctgtttcca cccaagccaa aagacaccct gatgatcagc 840
cgcacacctg aagtcacttg tgtggtcgtg gacgtgtccc acgaggaccc cgaagtcaag 900
ttcaactggt acgtggatgg cgtcgaggtg cataatgcca agacaaaacc cagagaggaa 960
cagtataact ctacataccg ggtcgtgagt gtcctgactg tgctgcacca ggattggctg 1020
aacggcaagg agtacaagtg caaagtgtct aacaaggccc tgccagctcc catcgagaag 1080
accattagca aggccaaagg acagccacgc gaaccccagg tgtatacact gcctcccagc 1140
agggacgagc tgactaaaaa ccaggtcagc ctgacctgtc tggtgaaggg cttctaccca 1200
agcgatatcg ctgtggagtg ggaatccaat ggacagcccg aaaacaatta taagacaact 1260
ccccctgtgc tggactcaga tggcagcttc tttctgtaca gtaaactgac cgtggacaag 1320
tcaagatggc agcagggaaa cgtcttttca tgcagcgtga tgcatgaggc cctgcacaat 1380
cattatactc agaagtccct gtctctgagt ccagggaaac ggggccgcaa gaggagatca 1440
ggcagcggag ctacaaactt cagcctgctg aagcaggcag gcgatgtgga ggaaaatcct 1500
ggaccaatgg tcctgcagac tcaggtgttt atctcactgc tgctgtggat tagcggagcc 1560
tacggacaga tcgtgctgac ccagtcccca gctattatgt ccgcatctcc tggcgagaaa 1620
gtgaccatga catgttccgc tagttcaagc gtgtcttaca tgtattggta ccagcagaag 1680
cctggcagca gcccaaggct gctgatctat gacacctcca acctggcttc tggggtcccc 1740
gtgagattca gtgggtcagg cagcggaact tcctactctc tgaccatttc ccggatggag 1800
gcagaagatg cagccacata ctattgccag cagtggagtt catatcccta cacatttgga 1860
gggggcacta aactggaaat caagacagtc gctgcacctt ctgtgttcat ttttccaccc 1920
agtgacgagc agctgaagag tggcactgcc tcagtcgtgt gtctgctgaa caatttctat 1980
ccccgcgagg ccaaagtcca gtggaaggtg gataacgctc tgcagtccgg caattctcag 2040
gagagtgtga ccgaacagga ctcaaaagat agcacataca gtctgtcaaa cactctgacc 2100
ctgagcaagg cagactatga gaagcacaaa gtctacgcct gcgaagtgac acatcaggga 2160
ctgagctccc ctgtgactaa gtcctttaat cgaggggagt gttgataa 2208
<210> 40
<211> 734
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9225,埃博拉病毒Z1H3
<400> 40
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Lys
20 25 30
Pro Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile
35 40 45
Lys Asp Thr Tyr Ile His Trp Val Lys Gln Gly Pro Glu Gln Gly Leu
50 55 60
Glu Trp Ile Gly Arg Ile Asp Pro Ala Asn Gly Asn Thr Lys Tyr Asp
65 70 75 80
Pro Lys Phe Gln Gly Lys Ala Thr Ile Thr Ala Asp Thr Ser Ser Asn
85 90 95
Thr Ala Tyr Leu Gln Leu Ser Gly Leu Thr Ser Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Glu Ser Arg Ile Ser Thr Met Leu Thr Thr Gly
115 120 125
Tyr Phe Asp Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala
130 135 140
Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser
145 150 155 160
Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe
165 170 175
Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly
180 185 190
Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu
195 200 205
Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr
210 215 220
Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys
225 230 235 240
Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro
245 250 255
Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
260 265 270
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
275 280 285
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
290 295 300
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
305 310 315 320
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His
325 330 335
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
340 345 350
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
355 360 365
Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu
370 375 380
Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro
385 390 395 400
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
405 410 415
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
420 425 430
Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
435 440 445
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
450 455 460
Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser
465 470 475 480
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
485 490 495
Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser
500 505 510
Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Gln Ile Val Leu Thr Gln
515 520 525
Ser Pro Ala Ile Met Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr
530 535 540
Cys Ser Ala Ser Ser Ser Val Ser Tyr Met Tyr Trp Tyr Gln Gln Lys
545 550 555 560
Pro Gly Ser Ser Pro Arg Leu Leu Ile Tyr Asp Thr Ser Asn Leu Ala
565 570 575
Ser Gly Val Pro Val Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr
580 585 590
Ser Leu Thr Ile Ser Arg Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr
595 600 605
Cys Gln Gln Trp Ser Ser Tyr Pro Tyr Thr Phe Gly Gly Gly Thr Lys
610 615 620
Leu Glu Ile Lys Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro
625 630 635 640
Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu
645 650 655
Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn
660 665 670
Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser
675 680 685
Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala
690 695 700
Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly
705 710 715 720
Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 41
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9228,埃博拉病毒ZBDBV223
<400> 41
atggattgga cttggagaat tctgtttctg gtggccgccg ctacaggaac tcacgctcag 60
gtgcagctgc agcagtgggg agccgggctg ctgaagccaa gcgagacact gtccctgact 120
tgcgccgtgt acggcggaag cttcaccaca acttattgga attggatcag gcagccccct 180
ggcaagggac tggagtggat tggggaagtg aactacagcg gcaacgctaa ttataacccc 240
tccctgaagg gccgagtcgc aatctctgtg gacactagta aaaatcagtt tagtctgagg 300
ctgaactcag tgaccgccgc tgatacagca atctactatt gcaccagcag gatcaggagc 360
cacattgcct actcctggaa gggagacgtg tgggggaaag gcaccacagt caccgtgagc 420
tccgccagca caaagggacc atccgtgttc ccactggctc cctctagtaa aagtacttca 480
gggggcaccg cagccctggg atgtctggtg aaggattact tccccgagcc tgtcaccgtg 540
tcctggaatt ctggcgcact gacctctgga gtccatacat ttccagccgt gctgcagtca 600
agcgggctgt acagcctgtc ctctgtggtc accgtcccca gttcaagcct gggcacacag 660
acttatatct gcaatgtgaa ccacaagccc tctaacacaa aagtcgacaa gaaagtggaa 720
cctaagagct gtgataaaac ccatacatgc ccaccctgtc cagcaccaga gctgctggga 780
gggcctagcg tgttcctgtt tcctccaaag ccaaaagaca cactgatgat tagcaggaca 840
cctgaagtca cttgcgtggt cgtggacgtg tcccacgagg accccgaagt caagtttaat 900
tggtacgtgg atggcgtcga ggtgcataac gctaagacca aacctaggga ggaacagtac 960
aactctacat atagagtcgt gagtgtcctg actgtgctgc accaggactg gctgaatggg 1020
aaggagtata agtgcaaagt gtctaacaag gcactgcctg ccccaatcga gaaaactatt 1080
agcaaggcta aaggccagcc tcgggaacca caggtgtaca ccctgccccc tagccgcgac 1140
gagctgacta agaatcaggt ctccctgacc tgtctggtga aaggcttcta tccatctgat 1200
atcgcagtgg agtgggaaag taacggacag cccgaaaaca attacaagac taccccaccc 1260
gtcctggaca gtgatggctc attctttctg tattccaagc tgaccgtgga caaatctaga 1320
tggcagcagg gaaatgtctt tagctgctcc gtgatgcacg aggccctgca caaccattac 1380
actcagaagt ctctgagtct gtcaccaggg aagcgaggca ggaaaaggag aagcggcagc 1440
ggggcaacca atttctctct gctgaaacag gccggagatg tggaggaaaa ccccgggcct 1500
atggtcctgc agacacaggt gtttatctca ctgctgctgt ggattagcgg agcctacggg 1560
gaaatcgtga tgactcagag cccaggcacc ctgtctctga gtcccggaga gagagctaca 1620
ctgtcctgtc gggcatcaca gagcgtgccc agaaattaca tcggatggtt ccagcagaag 1680
ccaggacagg cccctcggct gctgatctac ggagcttcct ctcgcgctgc agggttccct 1740
gaccgatttt ccggctctgg aagtgggacc gatttcactc tgaccatcac acgcctggag 1800
cccgaagact ttgccatgta ctattgccac cagtacgatc gactgcctta tacattcggc 1860
cagggaacta agctggaaat caaaacagtc gccgctccta gcgtgttcat ctttcctcca 1920
tcagacgagc agctgaagtc cggaactgct tctgtggtgt gcctgctgaa caacttctac 1980
ccacgcgaag ctaaggtcca gtggaaagtg gataatgcac tgcagagcgg caactcccag 2040
gagtctgtga ccgaacagga cagtaaggat tcaacatatt cactgagcaa cactctgacc 2100
ctgtccaaag ccgactacga gaagcataaa gtgtatgctt gcgaggtcac ccaccagggg 2160
ctgtcatctc cagtcactaa gtccttcaat agaggcgaat gttgataa 2208
<210> 42
<211> 734
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9228,埃博拉病毒ZBDBV223
<400> 42
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Gln Gln Trp Gly Ala Gly Leu Leu Lys
20 25 30
Pro Ser Glu Thr Leu Ser Leu Thr Cys Ala Val Tyr Gly Gly Ser Phe
35 40 45
Thr Thr Thr Tyr Trp Asn Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
50 55 60
Glu Trp Ile Gly Glu Val Asn Tyr Ser Gly Asn Ala Asn Tyr Asn Pro
65 70 75 80
Ser Leu Lys Gly Arg Val Ala Ile Ser Val Asp Thr Ser Lys Asn Gln
85 90 95
Phe Ser Leu Arg Leu Asn Ser Val Thr Ala Ala Asp Thr Ala Ile Tyr
100 105 110
Tyr Cys Thr Ser Arg Ile Arg Ser His Ile Ala Tyr Ser Trp Lys Gly
115 120 125
Asp Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
130 135 140
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser
145 150 155 160
Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
165 170 175
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
180 185 190
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
195 200 205
Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys
210 215 220
Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu
225 230 235 240
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
245 250 255
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
260 265 270
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
275 280 285
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
290 295 300
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
305 310 315 320
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
325 330 335
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
340 345 350
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
355 360 365
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
370 375 380
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
385 390 395 400
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
405 410 415
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
420 425 430
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
435 440 445
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
450 455 460
Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser
465 470 475 480
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
485 490 495
Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu
500 505 510
Leu Trp Ile Ser Gly Ala Tyr Gly Glu Ile Val Met Thr Gln Ser Pro
515 520 525
Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg
530 535 540
Ala Ser Gln Ser Val Pro Arg Asn Tyr Ile Gly Trp Phe Gln Gln Lys
545 550 555 560
Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg Ala
565 570 575
Ala Gly Phe Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
580 585 590
Thr Leu Thr Ile Thr Arg Leu Glu Pro Glu Asp Phe Ala Met Tyr Tyr
595 600 605
Cys His Gln Tyr Asp Arg Leu Pro Tyr Thr Phe Gly Gln Gly Thr Lys
610 615 620
Leu Glu Ile Lys Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro
625 630 635 640
Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu
645 650 655
Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn
660 665 670
Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser
675 680 685
Lys Asp Ser Thr Tyr Ser Leu Ser Asn Thr Leu Thr Leu Ser Lys Ala
690 695 700
Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly
705 710 715 720
Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 43
<211> 2223
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9256,1A2
<400> 43
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcagag 60
gtgcagctgg tggagagcgg cggcggcctg atccagccag gcggcagcct gaggctgtcc 120
tgcgcagcat ctggatttgc cgtgaggagc aactacctgt cctgggtgag acaggcacca 180
ggcaagggac tggagtgggt gtctctgatc tacagcggcg gcctgaccgc atatgcagac 240
agcgtggagg gcaggttcac catctccaga gataactcta agaatacact gtatctgcag 300
atgaattccc tgcgggtgga ggacaccgcc ctgtactatt gcgcccgcgt ggccagctcc 360
gccggcacat tctactatgg catggacgtg tggggccagg gcaccacagt gaccgtgtct 420
agcgcctcca caaagggacc aagcgtgttc ccactggcac cttcctctaa gtccacctct 480
ggcggcacag ccgccctggg ctgtctggtg aaggattact tccctgagcc agtgaccgtg 540
tcttggaaca gcggcgccct gaccagcgga gtgcacacat ttcctgccgt gctgcagagc 600
tccggcctgt actccctgtc tagcgtggtg accgtgccat cctctagcct gggcacccag 660
acatatatct gcaacgtgaa tcacaagcct agcaatacaa aggtggacaa gaaggtggag 720
ccaaagtcct gtgataagac ccacacatgc cctccctgtc cagcacctga gctgctgggc 780
ggcccaagcg tgttcctgtt tccacccaag cccaaggaca cactgatgat ctctaggacc 840
ccagaggtga catgcgtggt ggtggacgtg agccacgagg accccgaggt gaagtttaac 900
tggtacgtgg atggcgtgga ggtgcacaat gccaagacca agccaaggga ggagcagtac 960
aacagcacct atagagtggt gtccgtgctg acagtgctgc accaggactg gctgaacggc 1020
aaggagtata agtgcaaggt gtccaataag gccctgccag cccccatcga gaagaccatc 1080
tctaaggcaa agggacagcc aagggagcca caggtgtaca cactgcctcc atccagagac 1140
gagctgacca agaaccaggt gtctctgaca tgtctggtga agggcttcta tccctctgat 1200
atcgccgtgg agtgggagag caatggccag cctgagaaca attacaagac cacaccccct 1260
gtgctggact ccgatggctc tttctttctg tattccaagc tgaccgtgga taagtctcgg 1320
tggcagcagg gcaacgtgtt tagctgctcc gtgatgcacg aggccctgca caatcactac 1380
acccagaagt ctctgagcct gtcccctggc aagaggggaa ggaagaggag atctggcagc 1440
ggcgccacaa acttcagcct gctgaagcag gcaggcgacg tggaggagaa tcctggacca 1500
atggtgctgc agacccaggt gtttatctct ctgctgctgt ggatcagcgg cgcctacggc 1560
gatatcgtga tgacccagtc ccctcgctcc ctgtctgtga cacctggcga gccagccagc 1620
atctcctgtc ggtcctctca gtctctgctg caccgcaacg gctacaatta tctggactgg 1680
tacctgcaga agcccggcca gtcccctcag ctgctgatct atctgggcag caacagggca 1740
tccggagtgc cagaccgctt ctctggcagc ggctccggaa ccgacttcac cctgaagatc 1800
agcagggtgg aggccgagga tgtgggcgtg tactattgca tgcaggccct gcagaccccc 1860
tcctggacat tcggccaggg caccaaggtg gagatcaaga cagtggccgc ccctagcgtg 1920
ttcatctttc caccctccga cgagcagctg aagtctggca ccgccagcgt ggtgtgcctg 1980
ctgaacaact tctaccccag agaggccaag gtgcagtgga aggtggataa cgccctgcag 2040
agcggcaatt cccaggagtc tgtgaccgag caggacagca aggattccac atattctctg 2100
agctccaccc tgacactgag caaggccgac tacgagaagc acaaggtgta tgcctgcgag 2160
gtgacccacc agggcctgtc tagccctgtg acaaagtcct tcaacagagg cgagtgttga 2220
taa 2223
<210> 44
<211> 739
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9256,1A2
<400> 44
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Gln
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Val
35 40 45
Arg Ser Asn Tyr Leu Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ser Leu Ile Tyr Ser Gly Gly Leu Thr Ala Tyr Ala Asp
65 70 75 80
Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr
85 90 95
Leu Tyr Leu Gln Met Asn Ser Leu Arg Val Glu Asp Thr Ala Leu Tyr
100 105 110
Tyr Cys Ala Arg Val Ala Ser Ser Ala Gly Thr Phe Tyr Tyr Gly Met
115 120 125
Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
130 135 140
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser
145 150 155 160
Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
165 170 175
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
180 185 190
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
195 200 205
Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys
210 215 220
Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu
225 230 235 240
Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
245 250 255
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
260 265 270
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
275 280 285
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
290 295 300
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
305 310 315 320
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
325 330 335
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
340 345 350
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
355 360 365
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
370 375 380
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
385 390 395 400
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
405 410 415
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
420 425 430
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
435 440 445
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
450 455 460
Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser
465 470 475 480
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
485 490 495
Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu
500 505 510
Leu Trp Ile Ser Gly Ala Tyr Gly Asp Ile Val Met Thr Gln Ser Pro
515 520 525
Arg Ser Leu Ser Val Thr Pro Gly Glu Pro Ala Ser Ile Ser Cys Arg
530 535 540
Ser Ser Gln Ser Leu Leu His Arg Asn Gly Tyr Asn Tyr Leu Asp Trp
545 550 555 560
Tyr Leu Gln Lys Pro Gly Gln Ser Pro Gln Leu Leu Ile Tyr Leu Gly
565 570 575
Ser Asn Arg Ala Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Gly Ser
580 585 590
Gly Thr Asp Phe Thr Leu Lys Ile Ser Arg Val Glu Ala Glu Asp Val
595 600 605
Gly Val Tyr Tyr Cys Met Gln Ala Leu Gln Thr Pro Ser Trp Thr Phe
610 615 620
Gly Gln Gly Thr Lys Val Glu Ile Lys Thr Val Ala Ala Pro Ser Val
625 630 635 640
Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser
645 650 655
Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln
660 665 670
Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val
675 680 685
Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu
690 695 700
Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu
705 710 715 720
Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg
725 730 735
Gly Glu Cys
<210> 45
<211> 2196
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9290,EBV114
<400> 45
atggactgga catggagaat cctgttcctg gtcgccgccg ctactgggac tcacgccgag 60
gtgcagctgg tcgaaagtgg agggggactg atccagccag gcggaagcct gcgactgtcc 120
tgcgcagctt ctggattcgc actgcgcatg tacgacatgc actgggtgcg ccagacaatt 180
gataagcgac tggaatgggt cagcgccgtg ggaccatccg gggacactta ctatgctgat 240
tctgtgaagg ggagatttgc tgtcagtcgg gagaacgcaa aaaattctct gagtctgcag 300
atgaactctc tgaccgcagg cgacacagcc atctactatt gcgtgcgatc cgacaggggc 360
gtcgcaggac tgttcgattc ttggggccag ggaattctgg tcacagtgag ctccgcctct 420
actaagggac caagcgtgtt cccactggct ccttctagta aatcaactag cgggggcacc 480
gcagccctgg gatgtctggt gaaggattac ttccctgagc cagtcaccgt gagttggaac 540
tcaggcgcac tgaccagcgg agtgcataca tttcctgccg tcctgcagtc aagcggcctg 600
tactccctgt cctctgtggt cacagtgcca agttcaagcc tgggaactca gacctatatc 660
tgcaacgtga atcacaagcc atctaatact aaagtcgaca agaaagtgga acccaagagc 720
tgtgataaaa cacatacttg ccctccctgt ccagcacctg agctgctggg agggccaagc 780
gtgttcctgt ttccacccaa gcctaaagac accctgatga ttagccggac acccgaagtg 840
acttgcgtgg tcgtggacgt gagccacgag gaccccgaag tgaagttcaa ctggtacgtg 900
gatggcgtcg aggtgcataa tgctaagaca aaaccccggg aggaacagta caattcaact 960
tatcgcgtcg tgagcgtcct gaccgtgctg caccaggact ggctgaacgg aaaggagtat 1020
aagtgcaaag tgtctaataa ggcactgcca gcccccatcg agaaaaccat tagcaaggcc 1080
aaagggcagc caagggaacc ccaggtgtac acactgcctc caagtagaga cgagctgacc 1140
aagaaccagg tgtccctgac atgtctggtc aaaggattct atccttcaga tatcgctgtg 1200
gagtgggaaa gcaatgggca gccagaaaac aattacaaga ccacaccccc tgtgctggac 1260
agcgatggca gcttcttcct gtatagtaag ctgaccgtgg ataaatcaag gtggcagcag 1320
gggaacgtct tttcctgctc tgtgatgcat gaggccctgc acaatcatta cacccagaag 1380
agtctgtcac tgagccctgg gaagcgagga cgaaaaagga gatccgggtc tggcgccaca 1440
aacttcagcc tgctgaagca ggctggggac gtggaggaaa atcctggccc aatggtcctg 1500
cagacccagg tgtttatctc cctgctgctg tggatttctg gagcatatgg ggatatccag 1560
atgacacagt ctccttcctc tctgagtgct tcagtgggcg acaggatcac cattacatgt 1620
agagctagcc aggcattcga taactacgtg gcctggtatc agcagcggcc tgggaaggtg 1680
ccaaaactgc tgatctctgc tgcaagtgcc ctgcacgctg gagtgccaag ccgcttcagc 1740
ggcagcgggt ctggaactca cttcaccctg accattagtt cactgcagcc agaggacgtg 1800
gctacctact attgccagaa ctacaattcc gcacccctga ctttcggcgg agggaccaag 1860
gtcgaaatca aaactgtggc cgctcccagc gtcttcattt ttccaccctc cgacgagcag 1920
ctgaagagtg gcaccgcctc agtggtgtgc ctgctgaaca acttctaccc tagagaagca 1980
aaggtccagt ggaaagtgga taacgccctg cagtcaggaa atagccagga gtccgtgaca 2040
gaacaggact ctaaggatag tacttattca ctgagctcca cactgactct gtccaaagct 2100
gactacgaga agcacaaagt gtatgcatgc gaagtgaccc accagggact gagcagcccc 2160
gtgaccaaga gctttaatag aggagaatgt tgataa 2196
<210> 46
<211> 730
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9290,EBV114
<400> 46
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Gln
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Leu
35 40 45
Arg Met Tyr Asp Met His Trp Val Arg Gln Thr Ile Asp Lys Arg Leu
50 55 60
Glu Trp Val Ser Ala Val Gly Pro Ser Gly Asp Thr Tyr Tyr Ala Asp
65 70 75 80
Ser Val Lys Gly Arg Phe Ala Val Ser Arg Glu Asn Ala Lys Asn Ser
85 90 95
Leu Ser Leu Gln Met Asn Ser Leu Thr Ala Gly Asp Thr Ala Ile Tyr
100 105 110
Tyr Cys Val Arg Ser Asp Arg Gly Val Ala Gly Leu Phe Asp Ser Trp
115 120 125
Gly Gln Gly Ile Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
130 135 140
Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr
145 150 155 160
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
165 170 175
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
180 185 190
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
195 200 205
Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn
210 215 220
His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser
225 230 235 240
Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
245 250 255
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
260 265 270
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
275 280 285
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
290 295 300
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
305 310 315 320
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
325 330 335
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
340 345 350
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
355 360 365
Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val
370 375 380
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
385 390 395 400
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
405 410 415
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr
420 425 430
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
435 440 445
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
450 455 460
Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr
465 470 475 480
Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly
485 490 495
Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile
500 505 510
Ser Gly Ala Tyr Gly Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
515 520 525
Ser Ala Ser Val Gly Asp Arg Ile Thr Ile Thr Cys Arg Ala Ser Gln
530 535 540
Ala Phe Asp Asn Tyr Val Ala Trp Tyr Gln Gln Arg Pro Gly Lys Val
545 550 555 560
Pro Lys Leu Leu Ile Ser Ala Ala Ser Ala Leu His Ala Gly Val Pro
565 570 575
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr His Phe Thr Leu Thr Ile
580 585 590
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr
595 600 605
Asn Ser Ala Pro Leu Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys
610 615 620
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
625 630 635 640
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
645 650 655
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
660 665 670
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
675 680 685
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
690 695 700
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
705 710 715 720
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 47
<211> 108
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 47
Glu Thr Thr Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Glu Asn Ile Tyr Ser Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Gln Gly Lys Ser Pro Gln Leu Leu Val
35 40 45
Tyr Asn Ala Lys Thr Leu Ile Glu Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Gln Phe Ser Leu Lys Ile Asn Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Gly Ser Tyr Phe Cys Gln His His Phe Gly Thr Pro Phe
85 90 95
Thr Phe Gly Ser Gly Thr Lys Leu Glu Ile Lys Arg
100 105
<210> 48
<211> 107
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 48
Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Glu Thr Val Thr Ile Thr Cys Arg Ala Ser Glu Asn Ile Tyr Ser Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Gln Gly Lys Ser Pro Gln Leu Leu Val
35 40 45
Tyr Asn Ala Lys Thr Leu Ile Glu Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Gln Phe Ser Leu Lys Ile Asn Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Gly Ser Tyr Phe Cys Gln His His Phe Gly Thr Pro Phe
85 90 95
Thr Phe Gly Ser Gly Thr Glu Leu Glu Ile Lys
100 105
<210> 49
<211> 107
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 49
Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Glu Thr Val Thr Ile Thr Cys Arg Ala Ser Glu Asn Ile Tyr Ser Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Gln Gly Lys Ser Pro Gln Leu Leu Val
35 40 45
Tyr Asn Ala Lys Thr Leu Ile Glu Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Gln Phe Ser Leu Lys Ile Asn Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Gly Ser Tyr Phe Cys Gln His His Phe Gly Thr Pro Phe
85 90 95
Thr Phe Gly Ser Gly Thr Glu Leu Glu Ile Lys
100 105
<210> 50
<211> 107
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 50
Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Glu Thr Val Thr Ile Thr Cys Asn Ala Ser Glu Asn Ile Tyr Ser Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Gln Gly Gln Ser Pro Gln Leu Leu Val
35 40 45
Tyr Asn Ala Lys Thr Leu Ile Glu Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Gln Phe Ser Leu Lys Ile Asn Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Gly Ser Tyr Trp Cys Gln His His Phe Gly Thr Pro Phe
85 90 95
Thr Phe Gly Ser Gly Thr Glu Leu Glu Ile Lys
100 105
<210> 51
<211> 119
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 51
Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Glu Met Pro Gly Ala
1 5 10 15
Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Ser Ser Phe Thr Gly Phe
20 25 30
Ser Met Asn Trp Val Lys Gln Ser Asn Gly Lys Ser Leu Glu Trp Ile
35 40 45
Gly Asn Ile Asp Thr Tyr Tyr Gly Gly Thr Thr Tyr Asn Gln Lys Phe
50 55 60
Lys Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr
65 70 75 80
Met Gln Leu Lys Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Ser Ala Tyr Tyr Gly Ser Thr Phe Ala Tyr Trp Gly Gln Gly
100 105 110
Thr Leu Val Thr Val Ser Ser
115
<210> 52
<211> 119
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 52
Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Glu Met Pro Gly Ala
1 5 10 15
Ser Val Lys Ile Ser Cys Gln Ala Ser Gly Ser Ser Phe Thr Gly Phe
20 25 30
Ser Met Asn Trp Val Lys Tyr Ser Asn Gly Lys Ser Leu Glu Trp Ile
35 40 45
Gly Asn Ile Asp Thr Tyr Tyr Gly Gly Thr Thr Tyr Asn Gln Lys Phe
50 55 60
Lys Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr
65 70 75 80
Met Gln Leu Gln Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Ser Ala Tyr Tyr Gly Ser Thr Phe Ala Tyr Trp Gly Gln Gly
100 105 110
Thr Leu Val Thr Val Ser Ser
115
<210> 53
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 53
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 54
<211> 113
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 54
Asp Ile Val Met Thr Gln Ser Pro Arg Ser Leu Ser Val Thr Pro Gly
1 5 10 15
Glu Pro Ala Ser Ile Ser Cys Arg Ala Ser Gln Ser Leu Leu His Arg
20 25 30
Asn Gly Tyr Asn Tyr Leu Asp Trp Tyr Leu Gln Lys Pro Gly Gln Ser
35 40 45
Pro Gln Leu Leu Ile Tyr Leu Gly Ser Asn Arg Ala Ser Gly Val Pro
50 55 60
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile
65 70 75 80
Ser Arg Val Glu Ala Glu Asp Val Gly Val Tyr Tyr Cys Met Gln Ala
85 90 95
Leu Gln Thr Pro Ser Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile
100 105 110
Lys
<210> 55
<211> 107
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 55
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Ile Thr Ile Thr Cys Arg Ala Ser Gln Ala Phe Asp Asn Tyr
20 25 30
Val Ala Trp Tyr Gln Gln Arg Pro Gly Lys Val Pro Lys Leu Leu Ile
35 40 45
Ser Ala Ala Ser Ala Leu His Ala Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr His Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Ser Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys
100 105
<210> 56
<211> 108
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 56
Glu Thr Thr Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
20 25 30
Ile Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Met
35 40 45
Phe Asp Ser Ser Thr Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Asn Ile Ser Ser Leu Glu Pro
65 70 75 80
Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Ser Ser Ser Pro Tyr
85 90 95
Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys Arg
100 105
<210> 57
<211> 108
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 57
Ala Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg Asn Asp
20 25 30
Leu Gly Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ser Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln Asp Tyr Asn Tyr Pro Trp
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
100 105
<210> 58
<211> 114
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 58
Glu Thr Thr Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ser Ser Gln Ser Leu Leu His Arg
20 25 30
Asn Gly Tyr Asn Tyr Leu Asp Trp Tyr Leu Gln Lys Pro Gly Gln Ser
35 40 45
Pro Gln Leu Leu Ile Tyr Leu Gly Ser Asn Arg Ala Ser Gly Val Pro
50 55 60
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile
65 70 75 80
Ser Arg Val Glu Ala Glu Asp Val Gly Val Tyr Tyr Cys Met Gln Ala
85 90 95
Leu Gln Thr Pro Ser Trp Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile
100 105 110
Lys Arg
<210> 59
<211> 108
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 59
Glu Thr Thr Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ala Phe Asp Asn Tyr
20 25 30
Val Ala Trp Tyr Gln Gln Arg Pro Gly Lys Val Pro Lys Leu Leu Ile
35 40 45
Ser Ala Ala Ser Ala Leu His Ala Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr His Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Ser Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg
100 105
<210> 60
<211> 114
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 60
Ala Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ser Ser Gln Ser Leu Leu His Arg
20 25 30
Asn Gly Tyr Asn Tyr Leu Asp Trp Tyr Leu Gln Lys Pro Gly Gln Ser
35 40 45
Pro Gln Leu Leu Ile Tyr Leu Gly Ser Asn Arg Ala Ser Gly Val Pro
50 55 60
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile
65 70 75 80
Ser Arg Val Glu Ala Glu Asp Val Gly Val Tyr Tyr Cys Met Gln Ala
85 90 95
Leu Gln Thr Pro Ser Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile
100 105 110
Lys Arg
<210> 61
<211> 108
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 61
Ala Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ala Phe Asp Asn Tyr
20 25 30
Val Ala Trp Tyr Gln Gln Arg Pro Gly Lys Val Pro Lys Leu Leu Ile
35 40 45
Ser Ala Ala Ser Ala Leu His Ala Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr His Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Ser Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg
100 105
<210> 62
<211> 47
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 62
Asp Ala Glu Phe Arg His Asp Ser Gly Tyr Glu Val His His Gln Lys
1 5 10 15
Leu Val Phe Phe Ala Glu Asp Val Gly Ser Asn Lys Gly Ala Ile Ile
20 25 30
Gly Leu Met Val Gly Gly Val Val Ile Ala Thr Val Ile Val Ile
35 40 45
<210> 63
<211> 2235
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD211,190-FP2A-小鼠-GeneArt
<400> 63
atggattgga cttggagaat cctgttcctg gtggccgctg ctacaggcac acatgctcag 60
gtgcagctgg ttgaaagcgg aggcggagtt gtgcagcctg gcagatctct gagactgtct 120
tgtgccgcca gcggcttcac cttctctaag tacggaatgc actgggtccg acaggcccct 180
ggaaaaggac tggaatgggt cgccgtgatc agctacgagg gcagcaacaa gtactacgcc 240
gacagcgtga agggcagatt caccatcagc agagacaaca gcaagaacac cctgtacctg 300
cagatgaaca gcctgagagc cgaggacacc gccgtgtact actgtgctaa gagcggcacc 360
cagtactacg acaccaccgg ctacgagtac agaggcctgg aatactttgg ctactggggc 420
cagggaaccc tggtcacagt tagctctgct agcacaaagg gccccagcgt tttcccactg 480
gctcctagct ctaagagcac atctggcgga acagctgctc tgggctgtct ggtcaaggac 540
tactttcctg agcctgtgac cgtgtcctgg aactctggtg ctctgacaag cggcgtgcac 600
acatttccag ctgtgctgca gtctagcggc ctgtactctc tgtctagcgt cgtgacagtg 660
cctagcagct ctctgggaac ccagacctac atctgcaacg tgaaccacaa gcctagcaac 720
accaaggtgg acaagagagt ggaacccaag agctgcgaca agacccacac ctgtcctcca 780
tgtcctgctc cagaagctgc aggcggaccc tctgtgttcc tgtttcctcc aaagcctaag 840
gacaccctga tgatcagcag aacccctgaa gtgacctgcg tggtggtgga tgtgtctcac 900
gaggaccccg aagtgaagtt caattggtac gtggacggcg tggaagtgca caacgccaag 960
accaagccta gagaggaaca gtacaacagc acctacagag tggtgtccgt gctgacagtg 1020
ctgcaccagg attggctgaa cggcaaagag tacaagtgca aggtgtccaa caaggccctg 1080
cctgctccta tcgaaaagac catctccaag gctaagggcc agcctaggga accccaggtt 1140
tacacactgc ctccaagcag agaagagatg accaagaacc aggtgtccct gacctgcctc 1200
gtgaagggat tctacccttc cgatatcgcc gtggaatggg agtctaacgg ccagccagag 1260
aacaactaca agacaacccc tcctgtgctg gacagcgacg gctcattctt cctgtacagc 1320
aagctgaccg tggacaagtc cagatggcag cagggcaacg tgttcagctg ttctgtgatg 1380
cacgaggccc tgcacaacca ctacacccag aagtctctgt ctctgagccc cggcaagcgc 1440
ggcagaaaga gaagatctgg aagcggcgcc accaacttca gtctgctgaa acaggctggc 1500
gacgtggaag agaaccctgg acctatggtg ctgcagaccc aggtgttcat tagcctgctg 1560
ctgtggatct ctggcgccta tggcgagatc gtgctgaccc agtctcctgg cacattgagc 1620
ctgtctccag gcgagagagc cacactgagc tgtagagcct ctcagagcgt gtcctctagc 1680
tacctggcct ggtatcagca aaagagaggc caggctccta gactgctgat ctacgacgcc 1740
tcttccagag ccacaggcat ccctgataga ttcagcggct ctggcagcgg caccgacttc 1800
acactgacca tctctagact ggaacccgag gatttcgctg tgtactattg ccagcagtac 1860
ggcagatcca gatggacctt tggacagggc acaaaggtgg aaatcaagag aaccgtggcc 1920
gctcctagcg tgttcatctt tccaccaagc gacgagcagc tgaagtctgg cacagcttct 1980
gtcgtgtgcc tgctgaacaa cttctacccc agagaagcca aggtgcagtg gaaggtcgac 2040
aacgctctgc agtccggcaa cagccaagag agcgtgacag agcaggactc caaggacagc 2100
acatactccc tgagcagcac cctgacactg agcaaggccg actacgaaaa gcacaaggtg 2160
tacgcctgcg aagtgacaca ccagggactg agcagccctg tgaccaagtc tttcaacaga 2220
ggcgagtgct gatga 2235
<210> 64
<211> 743
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD211,190-FP2A-小鼠-GeneArt
<400> 64
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
145 150 155 160
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
165 170 175
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
180 185 190
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
195 200 205
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
210 215 220
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
225 230 235 240
Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His
245 250 255
Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val
260 265 270
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
275 280 285
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
290 295 300
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
305 310 315 320
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
325 330 335
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
340 345 350
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
355 360 365
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
370 375 380
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
385 390 395 400
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
405 410 415
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
420 425 430
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
435 440 445
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
450 455 460
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg
465 470 475 480
Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu
485 490 495
Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln
500 505 510
Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly
515 520 525
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
530 535 540
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
545 550 555 560
Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala Pro Arg Leu Leu
565 570 575
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
580 585 590
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
595 600 605
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Arg
610 615 620
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
625 630 635 640
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
645 650 655
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
660 665 670
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
675 680 685
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
690 695 700
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
705 710 715 720
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
725 730 735
Ser Phe Asn Arg Gly Glu Cys
740
<210> 65
<211> 2235
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD212,190-FP2A-小鼠-Synbio
<400> 65
atggactgga cttggagaat cctgttcctg gtggcagcag ctacaggaac acacgctcag 60
gtgcagctgg tggaatcagg aggaggagtg gtgcagccag gcagaagcct gagactgtct 120
tgcgccgcta gcggcttcac attcagcaag tacggcatgc attgggtccg acaggctcca 180
ggaaagggac tggagtgggt ggccgtgatt agctacgagg gcagcaacaa gtactacgcc 240
gacagcgtga agggcaggtt caccatcagc cgggacaaca gcaagaacac cctgtacctg 300
cagatgaaca gcctgagggc cgaggatacc gccgtgtact attgcgccaa gagcggaacc 360
cagtactacg acaccaccgg ctacgagtac aggggactgg agtacttcgg ctattggggc 420
cagggaacac tggtgaccgt gtctagcgct agcaccaagg gacctagcgt gttccctctg 480
gccccttcta gcaagtctac cagcggagga acagccgctc tgggttgtct ggtgaaggac 540
tacttcccag agcccgtgac cgtgtcttgg aatagcggag ctctgaccag cggagtgcac 600
acattcccag cagtgctgca gagcagcgga ctgtactctc tgagcagcgt ggtgaccgtg 660
ccttcttcta gcctgggcac ccagacctac atctgcaacg tgaaccacaa gcccagcaac 720
accaaggtgg acaagagggt ggagcccaag tcttgcgaca agacccacac ctgtccccct 780
tgtccagctc cagaagcagc aggaggacct agcgtgttcc tgttccctcc caagcccaag 840
gacaccctga tgatcagccg gaccccagaa gtgacttgcg tggtggtgga cgtgtctcac 900
gaggaccccg aggtcaagtt caattggtac gtggacggag tggaggtgca caacgctaag 960
accaagccca gggaggagca gtacaacagc acctacaggg tggtgtccgt gctgacagtg 1020
ctgcaccagg attggctgaa cggcaaggag tacaagtgca aggtgtccaa caaggctctg 1080
ccagccccca tcgagaagac catcagcaag gctaagggac agcctaggga acctcaggtg 1140
tacaccctgc ctcctagcag ggaggagatg accaagaacc aggtgtccct gacttgcctc 1200
gtgaagggct tctaccctag cgacatcgcc gtggagtggg aatctaacgg ccagccagag 1260
aacaactaca agaccacccc cccagtgctg gacagcgacg gcagcttctt cctgtacagc 1320
aagctgaccg tggacaagag ccgttggcag cagggcaacg tgttctcttg cagcgtgatg 1380
cacgaggccc tgcacaacca ctacacccag aagagcctga gcctgagccc aggaaagagg 1440
ggcagaaaga gaagaagcgg aagcggcgct accaacttca gcctgctgaa gcaggccgga 1500
gacgtggagg agaatccagg acccatggtg ctgcagaccc aggtgttcat cagcctcctc 1560
ctgtggatca gcggagctta cggcgagatc gtgctgacac agagcccagg aaccctgtct 1620
ctgtctccag gagagagagc caccctgtct tgcagagcta gccagagcgt gtctagcagc 1680
tacctggctt ggtaccagca gaagaggggc caggctccta gactgctgat ctacgacgcc 1740
agctctagag ccaccggaat ccccgacaga ttcagcggaa gcggaagcgg aaccgacttc 1800
accctgacca tcagcagact ggagccagag gacttcgccg tctactactg ccagcagtac 1860
ggcagatctc gttggacctt cggacaggga accaaggtgg agatcaagcg gaccgtggca 1920
gcccctagcg tgttcatctt ccctcctagc gacgagcagc tgaagagcgg aacagctagc 1980
gtcgtctgcc tgctgaacaa cttctacccc agggaggcca aggtccagtg gaaggtcgat 2040
aacgccctgc agagcggaaa ctctcaggag agcgtgaccg agcaggactc taaggacagc 2100
acctacagcc tgagcagcac actgaccctg agcaaggccg actacgagaa gcacaaggtg 2160
tacgcttgcg aagtgaccca ccagggactg tctagccccg tgaccaagag cttcaaccgg 2220
ggcgagtgtt gataa 2235
<210> 66
<211> 743
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD212,190-FP2A-小鼠-Synbio
<400> 66
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
145 150 155 160
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
165 170 175
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
180 185 190
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
195 200 205
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
210 215 220
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
225 230 235 240
Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His
245 250 255
Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val
260 265 270
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
275 280 285
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
290 295 300
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
305 310 315 320
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
325 330 335
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
340 345 350
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
355 360 365
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
370 375 380
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
385 390 395 400
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
405 410 415
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
420 425 430
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
435 440 445
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
450 455 460
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg
465 470 475 480
Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu
485 490 495
Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln
500 505 510
Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly
515 520 525
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
530 535 540
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
545 550 555 560
Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala Pro Arg Leu Leu
565 570 575
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
580 585 590
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
595 600 605
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Arg
610 615 620
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
625 630 635 640
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
645 650 655
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
660 665 670
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
675 680 685
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
690 695 700
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
705 710 715 720
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
725 730 735
Ser Phe Asn Arg Gly Glu Cys
740
<210> 67
<211> 2235
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD213,190-FP2A-小鼠-Genewiz
<400> 67
atggactgga cctggagaat cctgttcctc gtcgctgccg ctacaggcac ccatgcccag 60
gtgcagctgg tggaaagcgg cggaggcgtc gtgcagcctg gaaggagcct gagactgagc 120
tgcgccgcct ccggcttcac cttctccaaa tacggcatgc actgggtgag gcaggccccc 180
ggcaagggcc tggagtgggt cgctgtgatc agctacgaag gcagcaacaa gtactacgcc 240
gacagcgtca agggcaggtt caccatctcc agagacaact ccaagaatac actgtacctg 300
cagatgaaca gcctgagggc tgaggacacc gctgtgtact actgcgccaa gagcggcacc 360
cagtactatg ataccaccgg ctatgagtac aggggcctgg aatacttcgg atattggggc 420
cagggcaccc tggtgacagt gagctccgct agcacaaagg gacccagcgt gttccctctc 480
gctcccagct ccaagtccac aagcggcgga acagccgctc tgggctgcct cgtgaaagac 540
tatttccctg agcccgtgac agtcagctgg aattccggcg ccctgacaag cggcgtccat 600
accttccctg ccgtcctcca aagctccggc ctgtactccc tgtcctccgt ggtcacagtg 660
cccagctcct ccctgggaac ccagacctac atttgcaacg tcaatcacaa gcccagcaac 720
accaaggtcg acaaaagggt cgaacccaag agctgcgaca aaacccacac ctgtcctccc 780
tgccctgctc ctgaagccgc tggaggacct agcgtgttcc tctttcctcc taagcccaag 840
gacaccctga tgatctccag gacccctgag gtgacctgtg tggtcgtgga cgtgagccac 900
gaagatcccg aggtcaagtt caactggtac gtggacggcg tcgaagtgca caatgccaaa 960
accaagccca gagaggagca atacaactcc acctacagag tggtgtccgt gctcacagtg 1020
ctgcaccagg actggctgaa tggcaaagag tacaagtgta aagtcagcaa taaggctctg 1080
cccgctccta ttgagaaaac catcagcaag gctaaaggac agcccaggga gccccaggtg 1140
tacacactgc ctcccagcag ggaggagatg acaaagaatc aggtgtccct gacatgcctg 1200
gtgaagggat tctacccctc cgatatcgct gtcgagtggg agtccaacgg ccaacccgaa 1260
aacaactata agaccacacc ccccgtcctc gattccgacg gctccttctt tctgtattcc 1320
aagctgaccg tggacaagtc caggtggcag cagggcaacg tcttctcctg tagcgtgatg 1380
cacgaggctc tgcacaatca ctacacccag aaaagcctgt ccctgagccc tggcaagaga 1440
ggcaggaaga gaagatccgg aagcggagcc acaaacttct ccctgctgaa gcaggccgga 1500
gacgtcgaag agaaccctgg ccccatggtc ctgcagacac aggtgttcat ttccctgctg 1560
ctgtggatct ccggagccta cggcgagatc gtcctcaccc agagccctgg cacactgtcc 1620
ctgagccctg gcgagagagc caccctgtcc tgtagagcca gccaaagcgt ctccagcagc 1680
tatctggcct ggtaccagca gaagaggggc caagctccca gactcctgat ctatgacgct 1740
tcctccaggg ctaccggcat ccccgatagg tttagcggca gcggcagcgg caccgatttc 1800
accctcacaa tctccaggct ggagcctgag gactttgctg tgtattactg ccagcagtac 1860
ggcaggagca ggtggacctt cggacaggga accaaggtgg agatcaaaag gaccgtcgct 1920
gctcccagcg tcttcatctt cccccccagc gatgagcagc tgaagtccgg cacagctagc 1980
gtcgtgtgcc tcctgaacaa tttctatccc agagaggcca aagtccagtg gaaggtggat 2040
aacgccctgc agagcggaaa cagccaagaa tccgtcaccg aacaggacag caaggacagc 2100
acctacagcc tctcctccac actcaccctc agcaaagccg actacgagaa gcacaaggtg 2160
tacgcttgcg aggtgaccca ccagggcctg agctcccctg tgaccaagag cttcaatagg 2220
ggcgagtgct gataa 2235
<210> 68
<211> 743
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD213,190-FP2A-小鼠-Genewiz
<400> 68
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
145 150 155 160
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
165 170 175
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
180 185 190
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
195 200 205
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
210 215 220
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
225 230 235 240
Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His
245 250 255
Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val
260 265 270
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
275 280 285
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
290 295 300
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
305 310 315 320
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
325 330 335
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
340 345 350
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
355 360 365
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
370 375 380
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
385 390 395 400
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
405 410 415
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
420 425 430
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
435 440 445
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
450 455 460
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg
465 470 475 480
Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu
485 490 495
Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln
500 505 510
Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly
515 520 525
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
530 535 540
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
545 550 555 560
Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala Pro Arg Leu Leu
565 570 575
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
580 585 590
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
595 600 605
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Arg
610 615 620
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
625 630 635 640
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
645 650 655
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
660 665 670
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
675 680 685
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
690 695 700
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
705 710 715 720
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
725 730 735
Ser Phe Asn Arg Gly Glu Cys
740
<210> 69
<211> 2235
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD214,190-FP2A-小鼠-Blue heron
<400> 69
atggactgga cctggcgaat tctgttcttg gttgcagcag cgactggtac acacgctcag 60
gtccagctgg tcgaatctgg gggcggcgtg gtacagccag ggagatcact gaggctgagt 120
tgcgctgcat ccggcttcac cttctccaaa tacggcatgc attgggtgcg gcaagctccc 180
gggaaaggct tggaatgggt ggccgtaatt tcatacgaag ggtctaacaa gtattacgcc 240
gattctgtca agggccgctt tacaataagc cgcgataata gcaaaaacac gctttacctg 300
cagatgaact ctctgagagc agaggacact gctgtgtatt actgtgctaa atctgggacg 360
cagtactatg atacaactgg atacgagtac agaggcctcg aatacttcgg atactggggt 420
cagggaacac tggtcacggt tagtagcgcc tccactaagg gtccttcagt cttccccctg 480
gcacccagta gtaaatccac ctccggcggt actgcagctc ttggttgcct cgtgaaagac 540
tacttccctg aaccagtgac cgtctcctgg aactccggtg cactcaccag cggcgtacat 600
acattcccag ctgtgttgca aagttctggt ctgtatagct tgtcttccgt ggtgactgtc 660
cccagctcca gcctggggac ccaaacttac atttgtaatg tcaaccacaa gccgtctaat 720
acaaaggtgg acaagcgggt tgagccaaag agctgcgaca aaacgcacac ctgcccacct 780
tgccccgccc cagaagccgc ggggggaccc tcagtattcc tgttcccccc caagcccaag 840
gacactttga tgattagtcg cactcctgag gtcacctgcg tagtagtcga cgtgagccat 900
gaagatcctg aagtgaagtt taactggtac gtcgacggag tggaggtcca taacgccaaa 960
accaagccgc gcgaagaaca atacaactca acctacaggg tggtctctgt gcttacagtc 1020
ctccatcagg actggctcaa cggcaaagaa tacaagtgta aggtctccaa caaggcgctg 1080
cccgcgccca tcgagaagac aatcagcaag gccaaaggcc agcccaggga gccccaggtg 1140
tatactctgc cacccagtcg agaggagatg acaaaaaatc aagtgtccct cacatgcttg 1200
gtaaagggtt tctatccgtc tgacatagcc gtggagtggg agtctaatgg ccaaccagaa 1260
aacaactata agactacacc tcccgtcctt gactctgacg gcagcttttt tctttactcc 1320
aaacttacag tcgataagag tcggtggcag caaggtaatg tgttcagctg cagcgttatg 1380
cacgaagcgc tgcacaatca ctacacgcag aagtccttga gtctgtctcc cggaaaacgg 1440
ggccgcaagc ggcgcagtgg ctcaggggcc acaaatttct cactcctcaa acaggctggc 1500
gacgtggagg aaaaccccgg gccaatggtg ctgcagaccc aagtcttcat aagcttgttg 1560
ctttggattt ccggggccta cggagaaatc gttctcactc agtctccagg cacactctca 1620
ctgtcacctg gagagcgcgc taccctcagt tgcagagcaa gtcaaagcgt gagctcttcc 1680
taccttgctt ggtaccaaca gaagagaggt caggccccgc gcttgctgat ctatgatgct 1740
tcatcccggg cgactggtat ccccgaccga ttctccggct ccggcagcgg taccgatttt 1800
actttgacta ttagccgcct tgaacctgag gacttcgccg tctactactg tcagcagtac 1860
ggaagaagcc gatggacatt cgggcagggt accaaggtag agatcaagcg gactgtggca 1920
gccccatctg tgtttatctt ccctcctagc gatgaacaac ttaagtccgg aactgcctcc 1980
gtagtatgcc ttctgaacaa tttttatcca cgcgaggcaa aggtgcagtg gaaagtggac 2040
aacgcccttc agtctggcaa ttcccaggaa agcgtcacag aacaggatag caaggactca 2100
acctactccc tctccagtac tctgacattg tccaaagccg attatgaaaa gcacaaagtg 2160
tatgcctgcg aagtaacaca ccaagggctg tcatctccag taaccaagag cttcaaccgc 2220
ggtgagtgtt gatga 2235
<210> 70
<211> 743
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD214,190-FP2A-小鼠-Blue heron
<400> 70
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
145 150 155 160
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
165 170 175
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
180 185 190
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
195 200 205
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
210 215 220
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
225 230 235 240
Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His
245 250 255
Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val
260 265 270
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
275 280 285
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
290 295 300
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
305 310 315 320
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
325 330 335
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
340 345 350
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
355 360 365
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
370 375 380
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
385 390 395 400
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
405 410 415
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
420 425 430
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
435 440 445
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
450 455 460
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg
465 470 475 480
Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu
485 490 495
Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln
500 505 510
Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly
515 520 525
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
530 535 540
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
545 550 555 560
Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala Pro Arg Leu Leu
565 570 575
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
580 585 590
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
595 600 605
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Arg
610 615 620
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
625 630 635 640
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
645 650 655
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
660 665 670
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
675 680 685
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
690 695 700
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
705 710 715 720
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
725 730 735
Ser Phe Asn Arg Gly Glu Cys
740
<210> 71
<211> 2235
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD215,190-FP2A-哺乳动物-DNA2.0
<400> 71
atggactgga cctggcgcat cctgtttctc gtcgctgccg ccactggtac ccatgcccag 60
gtgcaactgg tggagtccgg tggcggagtg gtgcaaccgg gtcgcagcct gagactctca 120
tgcgccgcct caggcttcac cttctcgaag tacgggatgc actgggtcag acaggctccc 180
gggaaaggcc tggaatgggt ggccgtcatc tcgtacgagg gctcaaacaa gtactatgcc 240
gattccgtga agggacggtt caccatctcc cgggacaaca gcaagaacac cctgtacctc 300
caaatgaaca gcctgagggc cgaggacact gcagtgtact actgcgccaa gtcgggcact 360
cagtactacg acaccacggg atacgagtac aggggactcg aatacttcgg atactggggc 420
cagggcacac tcgtgaccgt cagctccgcc tccactaagg gaccttcagt gttccctctg 480
gcgccatcct ccaagtcgac cagcggtgga actgcagccc tgggatgtct cgtgaaggac 540
tacttccctg aacctgtcac cgtgtcctgg aacagcggag cactgacctc cggggtccac 600
actttccccg cggtgttgca gagctccggc ctgtactccc tgtcgtccgt cgtgacagtg 660
ccgtccagct cgttggggac ccagacttac atctgcaacg tgaaccacaa gccgtccaac 720
actaaagtgg acaaacgggt ggaacccaag tcgtgtgaca agactcatac ttgtccgcca 780
tgtcccgctc ctgaagcggc gggaggacct tccgtgttcc tcttcccccc gaagcctaag 840
gacaccctca tgattagcag gaccccggaa gtgacctgtg tcgtggtcga cgtgtcacac 900
gaggaccccg aagtgaagtt taattggtac gtggacggcg tcgaagtgca caacgccaag 960
accaagccac gcgaagaaca gtacaactcc acctaccggg tggtgtccgt gcttactgtg 1020
ctccatcagg actggctcaa cggaaaggag tacaagtgca aagtgtccaa caaagcgctc 1080
ccggctccta ttgaaaagac gatttccaag gccaagggac agcctcggga acctcaggtc 1140
tacaccctgc ctccttcgcg cgaggagatg accaagaatc aggtgtccct gacttgcctg 1200
gtcaagggat tctatccatc cgacatcgcc gtggagtggg agtccaacgg ccagccggaa 1260
aacaactaca agaccacccc acccgtcctg gacagcgacg ggtccttctt cctgtactca 1320
aagctgactg tggataagtc ccgctggcaa cagggcaacg tgttctcctg ctccgtgatg 1380
cacgaggccc tgcacaacca ctacacccag aagtcgctta gcctctcgcc gggcaaacga 1440
ggaagaaagc gccggtccgg atcaggagcg actaacttct ccctcctgaa gcaggccggg 1500
gatgtggagg aaaatccagg acccatggtg ctgcaaaccc aggtgttcat cagcctcctc 1560
ctgtggatct ccggagccta cggcgaaatt gtgctgaccc agtcccctgg gaccctgtcc 1620
ctgtcccccg gagagagagc caccctttcc tgccgggcat cgcagagcgt cagctccagc 1680
tatctggcct ggtaccagca aaagcgcgga caagctccga gactgctgat ctacgatgcc 1740
tcatcacgcg ccaccggaat cccggatagg ttctcaggat cgggctccgg tactgatttc 1800
accctgacca tcagccggct ggaacctgag gacttcgctg tgtattactg ccagcagtac 1860
ggccggtcca gatggacttt cggacagggc actaaggtcg aaatcaagcg gactgtcgct 1920
gcaccgagcg tgttcatttt cccaccctcc gacgagcagc ttaagagcgg aactgcttcc 1980
gtggtgtgcc ttctgaacaa tttctacccc cgggaagcca aggtccagtg gaaggtcgac 2040
aacgccctgc aatccgggaa ctcccaagaa tccgtcaccg aacaggactc caaggacagc 2100
acctactccc tctcatctac cctgaccctg tctaaggccg actacgagaa gcataaggtc 2160
tacgcctgcg aagtgacaca ccaaggcctt tcttcccccg tgaccaaatc cttcaaccgc 2220
ggagagtgct gataa 2235
<210> 72
<211> 743
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD215,190-FP2A-哺乳动物-DNA2.0
<400> 72
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
145 150 155 160
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
165 170 175
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
180 185 190
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
195 200 205
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
210 215 220
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
225 230 235 240
Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His
245 250 255
Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val
260 265 270
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
275 280 285
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
290 295 300
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
305 310 315 320
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
325 330 335
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
340 345 350
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
355 360 365
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
370 375 380
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
385 390 395 400
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
405 410 415
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
420 425 430
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
435 440 445
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
450 455 460
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg
465 470 475 480
Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu
485 490 495
Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln
500 505 510
Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly
515 520 525
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
530 535 540
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
545 550 555 560
Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala Pro Arg Leu Leu
565 570 575
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
580 585 590
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
595 600 605
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Arg
610 615 620
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
625 630 635 640
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
645 650 655
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
660 665 670
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
675 680 685
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
690 695 700
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
705 710 715 720
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
725 730 735
Ser Phe Asn Arg Gly Glu Cys
740
<210> 73
<211> 2235
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD216,190-FP2A-小鼠-Genscript
<400> 73
atggactgga cttggcgcat cctctttctc gtcgcagccg caactggaac tcacgctcag 60
gtgcagctcg tcgaatcagg gggaggggtg gtgcagccag gcaggagcct gaggctgagc 120
tgcgctgctt ccggcttcac cttttccaag tacggaatgc actgggtgag gcaggctcct 180
ggcaagggac tggagtgggt ggctgtgatc tcttacgagg gcagcaacaa gtactacgcc 240
gatagcgtga agggaaggtt caccatctcc agagacaact ctaagaacac actgtacctg 300
cagatgaact ccctgagggc cgaggatacc gccgtgtact actgcgctaa gtctggcaca 360
cagtactacg acaccacagg atacgagtac agaggcctgg agtacttcgg atactggggc 420
cagggaaccc tggtgacagt gagctccgcc tctacaaagg gccccagcgt gtttcccctg 480
gctccttcta gcaagagcac ctccggcgga acagccgctc tgggatgtct ggtgaaggac 540
tacttccctg agccagtgac cgtgtcctgg aactctggcg ccctgacctc tggagtgcac 600
acatttcctg ctgtgctgca gtcctctggc ctgtacagcc tgagctccgt ggtgaccgtg 660
ccatctagct ccctgggaac ccagacatac atctgcaacg tgaaccacaa gccatccaac 720
acaaaggtgg acaagagggt ggagcccaag tcttgtgata agacccacac atgccctccc 780
tgtccagctc ctgaggctgc tggcggacca tccgtgttcc tgtttccacc caagcctaag 840
gatacactga tgatcagcag aacccccgag gtgacatgcg tggtggtgga cgtgtcccac 900
gaggaccccg aggtgaagtt caactggtac gtggacggcg tggaggtgca caacgccaag 960
accaagccta gggaggagca gtacaactcc acctacagag tggtgtctgt gctgacagtg 1020
ctgcaccagg attggctgaa cggcaaggag tacaagtgca aggtgtctaa caaggccctg 1080
ccagctccca tcgagaagac catcagcaag gctaagggac agccacggga gccacaggtg 1140
tacacactgc ctccatctcg cgaggagatg accaagaacc aggtgagcct gacatgtctg 1200
gtgaagggct tctaccctag cgatatcgct gtggagtggg agtccaacgg acagccagag 1260
aacaactaca agaccacacc ccctgtgctg gacagcgatg gctccttctt tctgtactct 1320
aagctgaccg tggacaagag ccggtggcag cagggaaacg tgttttcttg cagcgtgatg 1380
cacgaggccc tgcacaacca ctacacccag aagtccctgt ctctgagccc tggaaagagg 1440
ggaaggaaga ggagatccgg ctctggagcc acaaacttct ccctgctgaa gcaggctggc 1500
gacgtggagg agaaccctgg accaatggtg ctgcagaccc aggtgtttat cagcctgctg 1560
ctgtggatct ccggagccta cggcgagatc gtgctgaccc agagccctgg cacactgagc 1620
ctgtccccag gagagagggc caccctgtcc tgtagagctt ctcagagcgt gtctagctcc 1680
tacctggctt ggtaccagca gaagagggga caggctccac gcctgctgat ctacgacgcc 1740
tctagccggg ctaccggaat ccccgatcgc ttctccggct ctggaagcgg cacagacttt 1800
accctgacaa tctcccggct ggagccagag gatttcgccg tgtactactg ccagcagtac 1860
ggcaggagca gatggacctt tggacagggc acaaaggtgg agatcaagcg caccgtggcc 1920
gctccatccg tgttcatctt tccaccctct gatgagcagc tgaagagcgg cacagcttcc 1980
gtggtgtgcc tgctgaacaa cttctacccc agggaggcca aggtgcagtg gaaggtggac 2040
aacgctctgc agtctggcaa cagccaggag tccgtgaccg agcaggactc taaggatagc 2100
acatactccc tgtcctctac cctgacactg agcaaggccg actacgagaa gcacaaggtg 2160
tacgcttgcg aagtgaccca ccaggggctg agcagtccag tgacaaagtc cttcaataga 2220
ggggaatgct gataa 2235
<210> 74
<211> 743
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD216,190-FP2A-小鼠-Genscript
<400> 74
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
145 150 155 160
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
165 170 175
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
180 185 190
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
195 200 205
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
210 215 220
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
225 230 235 240
Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His
245 250 255
Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val
260 265 270
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
275 280 285
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
290 295 300
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
305 310 315 320
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
325 330 335
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
340 345 350
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
355 360 365
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
370 375 380
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
385 390 395 400
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
405 410 415
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
420 425 430
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
435 440 445
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
450 455 460
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg
465 470 475 480
Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu
485 490 495
Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln
500 505 510
Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly
515 520 525
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
530 535 540
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
545 550 555 560
Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala Pro Arg Leu Leu
565 570 575
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
580 585 590
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
595 600 605
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Arg
610 615 620
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
625 630 635 640
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
645 650 655
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
660 665 670
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
675 680 685
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
690 695 700
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
705 710 715 720
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
725 730 735
Ser Phe Asn Arg Gly Glu Cys
740
<210> 75
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD225,185-小鼠-GeneArt
<400> 75
atggactgga cttggagaat cctgttcctg gtggccgctg ctacaggcac acatgctgaa 60
gtgcagctgg tgcagtctgg cgccgaagtg aagaaacctg gcgagagcct gagaatcagc 120
tgcaaaggca gcggctacag cttcaccagc tactggatca cctgggtccg acagatgcct 180
ggcaaaggcc tggaatggat ggccaagttc gaccctagcg acagccagac caactacagc 240
cctagctttc agggccacgt gaccatcagc gtggacaaga gcatcagcac agcctacctg 300
cagtggtcta gcctgaaggc cagcgacacc gccatgtact actgcgccag aagatactgc 360
agcagcagct cctgctacgt ggacaactgg ggacagggca ccctggtcac aatcttctct 420
gcctctacaa agggccccag cgtgttccct ctggctccta gctctaagag cacatctggc 480
ggaacagctg ctctgggctg tctggtcaag gactactttc ctgagcctgt gaccgtgtcc 540
tggaactctg gtgctctgac aagcggcgtg cacacatttc cagcagtgct gcagtctagc 600
ggcctgtact ctctgtctag cgtggtcaca gtgcctagca gcagcctggg aacccagacc 660
tacatctgca acgtgaacca caagcctagc aacaccaagg tcgacaagaa ggtggaaccc 720
aagagctgcg acaagaccca cacctgtcct ccatgtcctg ctccagaagc tgctggcgga 780
ccctctgtgt tcctgtttcc tccaaagcct aaggacaccc tgatgatcag cagaacccct 840
gaagtgacct gcgtggtggt ggatgtgtct cacgaggacc cagaagtgaa gttcaattgg 900
tacgtggacg gcgtggaagt gcacaacgcc aagaccaagc ctagagagga acagtacaac 960
agcacctaca gagtggtgtc cgtgctgacc gtgctgcacc aggattggct gaacggcaaa 1020
gagtacaagt gcaaggtgtc caacaaggcc ctgcctgctc ctatcgaaaa gaccatctcc 1080
aaggctaagg gccagccaag agaaccccag gtgtacacac tgcctccaag cagggacgag 1140
ctgaccaaga atcaggtgtc cctgacctgc ctcgtgaagg gcttctaccc ttccgatatc 1200
gccgtggaat gggagtctaa cggacagccc gagaacaact acaagacaac ccctcctgtg 1260
ctggacagcg acggctcatt cttcctgtac agcaagctga cagtggacaa gtccagatgg 1320
cagcagggca acgtgttcag ctgttctgtg atgcacgagg ccctgcacaa ccactacaca 1380
cagaagtccc tgtctctgag ccccggcaag aggggcagaa agagaagatc tggcagcggc 1440
gccacaaact tcagtctgct gaaacaggct ggcgacgtgg aagagaatcc cggacctatg 1500
gtgctgcaga cacaggtgtt catcagcctg ctgctgtgga tctctggcgc ctacggaagc 1560
agctatgagc tgacacagcc tcctagcgtg tccgtgtctc ctggccagac cgccagaatc 1620
acatgtagcg gagatgccct gcctaacaag ttcgcctact ggtacaggca gaagtccgga 1680
caggctcccg tgctggtcat ctacgaggac aacaagaggc ctagcggcat ccctgagaga 1740
ttcagcggct ctagctctgg caccatggcc acactgacaa tcagtggcgc tcaggtggaa 1800
gatgaggccg actaccactg ttacagcacc gacagcagct ctaaccctct gggagtgttt 1860
ggcggcggaa caaagcttac agtgctgggc caacctaagg ctgccccttc tgtgacactg 1920
ttcccaccta gctctgagga actgcaggct aacaaggcca cactcgtgtg cctgatcagc 1980
gatttctacc ctggcgctgt gacagtggct tggaaggctg atagctctcc tgtgaaggcc 2040
ggcgtcgaga caacaacacc tagcaagcag agcaacaaca aatacgccgc cagctcctat 2100
ctgagcctga cacctgagca gtggaagtcc cacagatcct acagctgcca agtgacccac 2160
gagggcagca ccgtggaaaa gactgtggct cctaccgagt gctcctgatg a 2211
<210> 76
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD225,185-小鼠-GeneArt
<400> 76
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly
465 470 475 480
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
485 490 495
Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu
500 505 510
Trp Ile Ser Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro
515 520 525
Ser Val Ser Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly
530 535 540
Asp Ala Leu Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly
545 550 555 560
Gln Ala Pro Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly
565 570 575
Ile Pro Glu Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu
580 585 590
Thr Ile Ser Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr
595 600 605
Ser Thr Asp Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr
610 615 620
Lys Leu Thr Val Leu Gly Gln Pro Lys Ala Ala Pro Ser Val Thr Leu
625 630 635 640
Phe Pro Pro Ser Ser Glu Glu Leu Gln Ala Asn Lys Ala Thr Leu Val
645 650 655
Cys Leu Ile Ser Asp Phe Tyr Pro Gly Ala Val Thr Val Ala Trp Lys
660 665 670
Ala Asp Ser Ser Pro Val Lys Ala Gly Val Glu Thr Thr Thr Pro Ser
675 680 685
Lys Gln Ser Asn Asn Lys Tyr Ala Ala Ser Ser Tyr Leu Ser Leu Thr
690 695 700
Pro Glu Gln Trp Lys Ser His Arg Ser Tyr Ser Cys Gln Val Thr His
705 710 715 720
Glu Gly Ser Thr Val Glu Lys Thr Val Ala Pro Thr Glu Cys Ser
725 730 735
<210> 77
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD227,185-小鼠-Synbio
<400> 77
atggactgga cttggagaat cctgttcctg gtggcagccg ctacaggaac acacgcagaa 60
gtgcagctgg tgcagagcgg agcagaagtg aagaagccag gcgagagcct gcggatctct 120
tgcaagggaa gcggctacag cttcaccagc tactggatca cttgggtgcg ccagatgcca 180
ggcaagggac tggagtggat ggccaagttc gaccctagcg acagccagac caactacagc 240
cctagcttcc agggccacgt gacaatcagc gtggacaaga gcatcagcac cgcctacctc 300
cagtggtcta gcctgaaggc cagcgatacc gccatgtact attgcgcccg gcggtattgc 360
agcagcagct cttgctacgt ggacaattgg ggccagggaa cactggtgac catcttcagc 420
gccagcacca agggacctag cgtgtttcct ctggcccctt ctagcaagag cacaagcgga 480
ggaacagccg ctctgggctg tctggtgaaa gactacttcc ccgagccagt gaccgtgtct 540
tggaactcag gagccctgac aagcggagtg cacacatttc cagccgtgct gcagagcagc 600
ggactgtact ctctgagcag cgtggtgacc gtgccttctt cttctctggg cacccagacc 660
tacatctgca acgtgaacca caagcccagc aacaccaagg tggacaagaa ggtggagccc 720
aagtcttgcg acaagaccca cacttgcccc ccttgtccag ctccagaagc agcaggagga 780
cctagcgtgt tcctgttccc tcctaagccc aaggacaccc tgatgatcag ccggacccca 840
gaagtgactt gcgtggtggt ggacgtgtcc cacgaagacc ccgaggtcaa gttcaattgg 900
tacgtggacg gagtggaggt gcacaacgct aagaccaagc ccagggagga gcagtacaac 960
agcacctaca gggtggtgtc cgtgctgaca gtgctgcacc aggattggct gaacggcaag 1020
gagtacaagt gcaaggtgtc caacaaggcc ctgccagctc ccatcgagaa gaccatcagc 1080
aaggccaagg gacagcctag agagcctcag gtgtacaccc tgcctccttc tagggacgag 1140
ctgaccaaga accaggtgtc cctgacttgc ctcgtgaagg gcttctaccc cagcgacatc 1200
gcagtggagt gggaaagcaa cggtcagcca gagaacaact acaagaccac ccccccagtg 1260
ctggacagcg acggcagctt cttcctgtac agcaagctga ccgtggacaa aagccgctgg 1320
cagcagggca acgtgttctc ttgcagcgtg atgcacgagg ccctgcacaa ccactacacc 1380
cagaagagcc tgtctctgag cccaggcaag aggggcagaa agagaagaag cggcagcgga 1440
gccaccaact tcagcctgct gaagcaggca ggagacgtgg aggagaaccc aggacctatg 1500
gtgctgcaga cccaggtgtt catcagcctc ctgctgtgga tcagcggagc ttacggaagc 1560
agctacgagc tgacacagcc tcctagcgtg tccgtgtctc caggacagac cgccagaatc 1620
acttgtagcg gcgacgccct gcctaacaag ttcgcctatt ggtaccggca gaagagcgga 1680
caggctccag tgctggtcat ctacgaggac aacaagaggc ctagcggcat cccagagagg 1740
ttcagcggat ctagcagcgg cacaatggcc acactgacca tcagcggagc tcaggtggag 1800
gacgaggccg actaccattg ctacagcacc gacagcagct ctaacccact gggcgtgttc 1860
ggaggaggaa caaagctgac cgtgctggga cagcctaagg cagctcctag cgtgacactg 1920
ttccctcctt ctagcgagga gctgcaggct aacaaggcca cactcgtctg cctgatcagc 1980
gacttctatc caggcgccgt gacagtggct tggaaggccg atagcagccc agtgaaagcc 2040
ggagtggaga caaccacccc tagcaagcag agcaacaaca agtacgccgc cagcagctac 2100
ctgagcctga caccagagca gtggaagagc cacaggagct actcttgcca ggtcacccac 2160
gagggaagca cagtggagaa gacagtggcc cctacagagt gctcctgata a 2211
<210> 78
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD227,185-小鼠-Synbio
<400> 78
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly
465 470 475 480
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
485 490 495
Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu
500 505 510
Trp Ile Ser Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro
515 520 525
Ser Val Ser Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly
530 535 540
Asp Ala Leu Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly
545 550 555 560
Gln Ala Pro Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly
565 570 575
Ile Pro Glu Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu
580 585 590
Thr Ile Ser Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr
595 600 605
Ser Thr Asp Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr
610 615 620
Lys Leu Thr Val Leu Gly Gln Pro Lys Ala Ala Pro Ser Val Thr Leu
625 630 635 640
Phe Pro Pro Ser Ser Glu Glu Leu Gln Ala Asn Lys Ala Thr Leu Val
645 650 655
Cys Leu Ile Ser Asp Phe Tyr Pro Gly Ala Val Thr Val Ala Trp Lys
660 665 670
Ala Asp Ser Ser Pro Val Lys Ala Gly Val Glu Thr Thr Thr Pro Ser
675 680 685
Lys Gln Ser Asn Asn Lys Tyr Ala Ala Ser Ser Tyr Leu Ser Leu Thr
690 695 700
Pro Glu Gln Trp Lys Ser His Arg Ser Tyr Ser Cys Gln Val Thr His
705 710 715 720
Glu Gly Ser Thr Val Glu Lys Thr Val Ala Pro Thr Glu Cys Ser
725 730 735
<210> 79
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD229,185-小鼠-GeneWiz
<400> 79
atggactgga catggagaat cctcttcctg gtggccgccg ctaccggcac acatgctgag 60
gtgcagctgg tgcagtccgg cgctgaagtg aagaaacccg gagagagcct gagaatctcc 120
tgtaaaggct ccggctacag cttcacctcc tactggatta cctgggtgag acagatgccc 180
ggcaaaggac tggagtggat ggccaagttc gatccctccg acagccagac caactacagc 240
cccagctttc agggacatgt gaccatcagc gtggataaga gcatctccac cgcttatctg 300
cagtggagca gcctcaaggc cagcgatacc gccatgtact actgcgccag gaggtattgc 360
tccagctcca gctgctacgt cgacaactgg ggccagggaa cactggtcac aatcttctcc 420
gcctccacca agggcccctc cgtgtttcct ctggctccta gcagcaagtc cacctccgga 480
ggaacagctg ccctcggctg cctcgtgaaa gactacttcc ccgagcccgt gaccgtgtcc 540
tggaactccg gagccctgac ctccggagtc cataccttcc ctgccgtgct ccagagcagc 600
ggcctctaca gcctgagctc cgtggtgacc gtcccttcca gcagcctggg cacccagaca 660
tatatctgca acgtgaacca taagcctagc aacacaaagg tggacaagaa ggtcgaaccc 720
aagagctgtg acaagaccca cacctgtcct ccttgtcccg cccctgaagc tgctggcgga 780
cctagcgtgt tcctgttccc tcctaagccc aaggacaccc tcatgatctc cagaacccct 840
gaagtgacct gcgtggtcgt ggacgtgagc cacgaggacc ccgaggtcaa gttcaattgg 900
tatgtggacg gcgtcgaggt gcacaatgcc aagaccaaac ccagagagga gcaatacaac 960
agcacctaca gagtggtgtc cgtgctgaca gtgctgcacc aggattggct caatggcaag 1020
gagtacaaat gcaaagtgtc caacaaggcc ctgcccgctc ccatcgaaaa gacaatcagc 1080
aaggccaagg gccagcccag ggaacctcag gtctataccc tccctcccag cagggatgag 1140
ctcaccaaga accaagtgtc cctgacctgt ctggtcaaag gattctaccc ctccgatatt 1200
gctgtcgagt gggagagcaa cggccagccc gaaaacaact acaagacaac ccctcctgtg 1260
ctggatagcg acggttcttt cttcctgtac tccaagctca cagtggacaa atccaggtgg 1320
cagcagggca acgtgttctc ctgctccgtc atgcatgagg ccctgcacaa ccactatacc 1380
cagaagtccc tgtccctgag ccccggaaaa agaggcagaa aaagaaggtc cggctccggc 1440
gccacaaact tctccctgct gaagcaggct ggcgacgtgg aggagaaccc cggccctatg 1500
gtcctccaga cccaggtgtt tattagcctg ctgctgtgga tcagcggcgc ctatggcagc 1560
tcctacgaac tgacacagcc ccctagcgtg agcgtgagcc ctggacagac cgccagaatt 1620
acctgcagcg gcgatgccct gcccaacaag tttgcttact ggtacaggca gaaatccggc 1680
caagcccctg tgctggtcat ttacgaggac aacaagaggc ccagcggcat tcctgagagg 1740
ttcagcggca gcagcagcgg aaccatggcc accctgacaa tcagcggcgc ccaagtggaa 1800
gacgaggctg actaccactg ttacagcaca gactcctcct ccaatcctct cggcgtgttc 1860
ggcggcggca caaaactgac agtgctcgga cagcctaagg ccgcccctag cgtgacactg 1920
tttcctcctt cctccgagga actgcaggcc aacaaggcca cactggtgtg tctgatctcc 1980
gacttctacc ccggcgctgt gaccgtggct tggaaggccg attccagccc cgtgaaggct 2040
ggcgtcgaga ccacaacccc cagcaagcag agcaacaaca agtatgctgc ctcctcctac 2100
ctgtccctca cacccgaaca gtggaagagc cataggtcct acagctgcca ggtgacacac 2160
gaaggcagca cagtggaaaa gaccgtggcc cctaccgaat gctcctgata a 2211
<210> 80
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD229,185-小鼠-GeneWiz
<400> 80
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly
465 470 475 480
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
485 490 495
Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu
500 505 510
Trp Ile Ser Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro
515 520 525
Ser Val Ser Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly
530 535 540
Asp Ala Leu Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly
545 550 555 560
Gln Ala Pro Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly
565 570 575
Ile Pro Glu Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu
580 585 590
Thr Ile Ser Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr
595 600 605
Ser Thr Asp Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr
610 615 620
Lys Leu Thr Val Leu Gly Gln Pro Lys Ala Ala Pro Ser Val Thr Leu
625 630 635 640
Phe Pro Pro Ser Ser Glu Glu Leu Gln Ala Asn Lys Ala Thr Leu Val
645 650 655
Cys Leu Ile Ser Asp Phe Tyr Pro Gly Ala Val Thr Val Ala Trp Lys
660 665 670
Ala Asp Ser Ser Pro Val Lys Ala Gly Val Glu Thr Thr Thr Pro Ser
675 680 685
Lys Gln Ser Asn Asn Lys Tyr Ala Ala Ser Ser Tyr Leu Ser Leu Thr
690 695 700
Pro Glu Gln Trp Lys Ser His Arg Ser Tyr Ser Cys Gln Val Thr His
705 710 715 720
Glu Gly Ser Thr Val Glu Lys Thr Val Ala Pro Thr Glu Cys Ser
725 730 735
<210> 81
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD231,185-小鼠-GenScript
<400> 81
atggattgga catggaggat tctgtttctg gtcgccgccg ctactggaac tcacgccgaa 60
gtgcagctgg tgcagtcagg agccgaagtg aagaagccag gcgagagcct gcggatctcc 120
tgtaagggaa gcggctactc ctttacatct tactggatca cctgggtgcg ccagatgcca 180
ggaaagggcc tggagtggat ggccaagttc gacccttctg atagccagac aaactactcc 240
ccatcttttc agggccacgt gacaatcagc gtggacaaga gcatctccac cgcctacctg 300
cagtggagct ccctgaaggc ctccgatacc gctatgtact actgcgctag gagatactgt 360
tctagctcct cttgctacgt ggacaactgg ggacagggca cactggtgac catcttctct 420
gccagcacaa agggacccag cgtgtttcca ctggctccca gctccaagtc cacatctggc 480
ggaaccgccg ctctgggatg tctggtgaag gattacttcc ccgagcctgt gaccgtgagc 540
tggaactccg gagccctgac aagcggcgtg cacacctttc ccgctgtgct gcagtctagc 600
ggactgtact ccctgtcctc tgtggtgaca gtgcctagct cctctctggg cacacagacc 660
tacatctgta acgtgaacca caagccttcc aacaccaagg tggacaagaa ggtggagcca 720
aagtcttgcg ataagacaca cacctgccct ccctgtccag ctccagaggc tgctggcgga 780
ccatccgtgt tcctgtttcc acccaagcct aaggacaccc tgatgatcag caggacacca 840
gaggtgacct gcgtggtggt ggacgtgtcc cacgaggacc ccgaggtgaa gttcaactgg 900
tacgtggatg gcgtggaggt gcacaacgcc aagacaaagc caagggagga gcagtacaac 960
tctacataca gagtggtgag cgtgctgacc gtgctgcacc aggactggct gaacggaaag 1020
gagtacaagt gtaaggtgtc taacaaggcc ctgcctgctc caatcgagaa gacaatcagc 1080
aaggctaagg gacagcctcg ggagccacag gtgtacaccc tgcctccatc tcgcgacgag 1140
ctgacaaaga accaggtgag cctgacctgc ctggtgaagg gcttctaccc ctccgatatc 1200
gctgtggagt gggagtctaa cggccagcct gagaacaact acaagaccac accccctgtg 1260
ctggactctg atggaagctt ctttctgtac agcaagctga ccgtggacaa gtccagatgg 1320
cagcagggca acgtgttcag ctgttccgtg atgcacgagg ccctgcacaa ccactacaca 1380
cagaagtctc tgagcctgtc ccctggaaag aggggaagaa agcggcgctc tggaagcgga 1440
gccaccaact ttagcctgct gaagcaggct ggagatgtgg aggagaaccc cggccctatg 1500
gtgctgcaga cacaggtgtt catctccctg ctgctgtgga tctctggagc ctacggcagc 1560
tcctacgagc tgacccagcc accctccgtg tctgtgagcc ctggacagac agctaggatc 1620
acctgctctg gcgacgccct gccaaacaag tttgcttact ggtacagaca gaagtccgga 1680
caggcccccg tgctggtcat ctacgaggat aacaagcggc cctctggcat ccctgagagg 1740
ttcagcggat ctagctccgg cacaatggct acactgacca tctccggagc tcaggtggag 1800
gacgaggctg attaccactg ttactctacc gactctagct ccaaccctct gggagtgttc 1860
ggcggaggca caaagctgac cgtgctggga cagccaaagg ctgctccaag cgtgaccctg 1920
tttcctccat ctagcgagga gctgcaggcc aacaaggcta cactggtgtg cctgatctcc 1980
gacttctacc ctggagctgt gaccgtggct tggaaggctg attcctctcc agtgaaggct 2040
ggcgtggaga caacaacccc ctccaagcag tctaacaaca agtacgccgc tagctcctac 2100
ctgagcctga ccccagagca gtggaagtcc caccggtcct actcttgcca ggtcactcac 2160
gaaggaagca ctgtggaaaa aactgtcgcc cctaccgaat gttcttgata a 2211
<210> 82
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD231,185-小鼠-GenScript
<400> 82
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly
465 470 475 480
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
485 490 495
Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu
500 505 510
Trp Ile Ser Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro
515 520 525
Ser Val Ser Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly
530 535 540
Asp Ala Leu Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly
545 550 555 560
Gln Ala Pro Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly
565 570 575
Ile Pro Glu Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu
580 585 590
Thr Ile Ser Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr
595 600 605
Ser Thr Asp Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr
610 615 620
Lys Leu Thr Val Leu Gly Gln Pro Lys Ala Ala Pro Ser Val Thr Leu
625 630 635 640
Phe Pro Pro Ser Ser Glu Glu Leu Gln Ala Asn Lys Ala Thr Leu Val
645 650 655
Cys Leu Ile Ser Asp Phe Tyr Pro Gly Ala Val Thr Val Ala Trp Lys
660 665 670
Ala Asp Ser Ser Pro Val Lys Ala Gly Val Glu Thr Thr Thr Pro Ser
675 680 685
Lys Gln Ser Asn Asn Lys Tyr Ala Ala Ser Ser Tyr Leu Ser Leu Thr
690 695 700
Pro Glu Gln Trp Lys Ser His Arg Ser Tyr Ser Cys Gln Val Thr His
705 710 715 720
Glu Gly Ser Thr Val Glu Lys Thr Val Ala Pro Thr Glu Cys Ser
725 730 735
<210> 83
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD233,185-小鼠-Blue Heron
<400> 83
atggactgga cctggaggat actgtttctg gtggctgccg caaccggaac acatgccgaa 60
gtacagctgg ttcagtctgg agcggaggtc aagaagcccg gggaaagtct gaggatctct 120
tgcaaggggt caggttatag tttcacaagt tattggatca cttgggtcag acaaatgccg 180
gggaagggac tggagtggat ggctaagttt gatccctccg attctcagac taattactcc 240
ccgtcatttc agggtcatgt gactatcagc gtcgataaat ctatttcaac tgcctacctg 300
caatggagca gcttgaaggc ttccgatacc gccatgtatt actgtgcacg gaggtattgt 360
tccagctcct cttgttacgt ggataactgg gggcagggga cattggtaac gattttttca 420
gcttctacaa agggcccctc tgtctttcct ctcgctcctt ctagcaaatc cacttctggg 480
ggaaccgctg cactgggatg cctcgtgaaa gactacttcc ccgaacccgt gaccgtgtca 540
tggaactcag gtgcccttac cagcggagtc cacacgttcc cggctgtgct tcagagttcc 600
ggtctgtatt ccctctcctc tgtggtgacg gtgccctcca gctcactggg aacgcagaca 660
tatatctgta acgtgaacca caaaccctcc aataccaagg tcgacaagaa ggtggagccg 720
aaatcctgtg ataagaccca tacctgtcct ccatgccccg ccccagaagc agctggagga 780
ccctctgtgt tcttgtttcc ccccaaaccg aaagatactt tgatgatctc ccggacccca 840
gaagtcacgt gtgtagtggt cgatgttagt catgaagacc ccgaagtgaa attcaactgg 900
tacgtagacg gcgtggaggt ccataatgct aagacgaagc cacgagaaga acagtataat 960
tccacctacc gggttgtcag cgtgcttacc gttttgcatc aggattggtt gaatggaaag 1020
gaatacaaat gcaaggtgtc caataaggcc ctgcccgctc ctatcgagaa gacaattagt 1080
aaggcaaaag gccaacctcg cgagccccag gtgtataccc tccctccctc cagggacgaa 1140
ctgacaaaga accaagtgag cctgacatgt ctggtcaagg gattttatcc ttcagatatc 1200
gctgtggagt gggaaagcaa tggccagcca gaaaacaact acaaaacaac tccgcccgtc 1260
ctggactctg acggttcctt tttcctgtac tctaagctga ctgtggataa gtcaagatgg 1320
cagcagggga atgtgttttc ttgtagcgtt atgcacgagg ctctgcacaa ccattatacg 1380
cagaagagtt tgagcctgag tcctggtaaa aggggccgga aacgcaggtc tggatctggg 1440
gctactaact tcagcctttt gaaacaagcc ggggatgtgg aggaaaaccc agggcccatg 1500
gtcctgcaga ctcaggtttt tatcagtctg ctgctctgga tttcaggcgc ttacggtagc 1560
agctacgagc tgacccagcc cccttcagtg tccgtctcac caggacagac cgcgaggatc 1620
acttgcagtg gggatgccct gccgaataag tttgcgtatt ggtacagaca aaagtccggt 1680
caggcaccag tcctggtgat ttatgaagac aacaagcgac caagcggcat ccctgagcgc 1740
ttctccggtt ccagcagcgg gaccatggcc acactgacaa tcagtggggc ccaggtcgag 1800
gacgaggccg actaccactg ctattctacc gatagctctt caaatccatt gggagtgttt 1860
ggcggtggaa caaaactcac cgtgctgggg cagccaaagg cagctccaag tgtcactctt 1920
tttccaccta gcagtgaaga gctccaggcc aacaaagcaa ccctggtgtg tcttatcagc 1980
gatttttacc ctggggcggt gacagtggcc tggaaagccg attccagccc cgtgaaagcc 2040
ggtgtcgaaa ccactactcc tagcaagcag agcaacaata aatatgccgc gagttcctac 2100
ctgagcctta ctccagagca gtggaagtca caccggtcct atagttgtca ggttacacac 2160
gaaggaagta ctgttgaaaa gactgttgct ccgacagaat gcagctgata a 2211
<210> 84
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD233,185-小鼠-Blue Heron
<400> 84
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly
465 470 475 480
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
485 490 495
Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu
500 505 510
Trp Ile Ser Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro
515 520 525
Ser Val Ser Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly
530 535 540
Asp Ala Leu Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly
545 550 555 560
Gln Ala Pro Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly
565 570 575
Ile Pro Glu Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu
580 585 590
Thr Ile Ser Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr
595 600 605
Ser Thr Asp Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr
610 615 620
Lys Leu Thr Val Leu Gly Gln Pro Lys Ala Ala Pro Ser Val Thr Leu
625 630 635 640
Phe Pro Pro Ser Ser Glu Glu Leu Gln Ala Asn Lys Ala Thr Leu Val
645 650 655
Cys Leu Ile Ser Asp Phe Tyr Pro Gly Ala Val Thr Val Ala Trp Lys
660 665 670
Ala Asp Ser Ser Pro Val Lys Ala Gly Val Glu Thr Thr Thr Pro Ser
675 680 685
Lys Gln Ser Asn Asn Lys Tyr Ala Ala Ser Ser Tyr Leu Ser Leu Thr
690 695 700
Pro Glu Gln Trp Lys Ser His Arg Ser Tyr Ser Cys Gln Val Thr His
705 710 715 720
Glu Gly Ser Thr Val Glu Lys Thr Val Ala Pro Thr Glu Cys Ser
725 730 735
<210> 85
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD234,185-哺乳动物-DNA2.0
<400> 85
atggactgga cttggcggat tttgttcctg gtggcggcgg ctactggaac tcatgcagaa 60
gtgcagcttg tgcagtccgg cgctgaagtc aagaagcctg gagagtccct gagaatcagc 120
tgcaagggca gcggctactc cttcacctcg tactggatca cttgggtcag acaaatgccg 180
ggaaagggac tggaatggat ggctaaattc gacccgtcgg acagccagac taactacagc 240
ccgtcgttcc aaggacatgt caccatctcc gtggacaaat cgatcagcac cgcgtacctc 300
cagtggagct cactcaaagc atccgacacc gcgatgtact actgcgcccg ccgctactgc 360
tcgtcctcgt cctgctacgt ggacaattgg ggacagggta ctcttgtgac aatcttctcc 420
gcctccacca agggcccctc agtgttcccc ctggcaccat cctctaagtc cacctccgga 480
ggcaccgccg ccttgggttg cctggtcaag gactacttcc cggaacctgt gaccgtgtcc 540
tggaacagcg gggcactgac ctccggcgtg catacttttc ccgccgtcct gcaatcttcc 600
ggcctgtact cactgtcatc agtggtcacc gtgccctcgt cctccctggg cacccagact 660
tacatctgta acgtgaacca taagccctcc aacaccaaag tggacaagaa agtggagcca 720
aagtcgtgtg acaagactca cacttgcccg ccgtgcccgg ccccggaagc cgccggtgga 780
ccgagcgtgt ttctcttccc acccaagccg aaggataccc tgatgatttc gcggacccct 840
gaagtgacct gtgtggtggt cgacgtgtcc cacgaggacc ccgaagtcaa gttcaattgg 900
tacgtggacg gtgtcgaagt gcacaacgcc aagacgaagc ctcgcgagga acagtacaac 960
agcacttacc gggtcgtgtc cgtcctcacc gtgctgcacc aagattggct caacgggaag 1020
gagtacaagt gcaaagtgtc aaataaggcc ctgccggccc cgattgaaaa gaccattagc 1080
aaggccaagg gacagcctag ggaacctcaa gtgtacacgc tgcccccgtc gcgggacgag 1140
ctgaccaaga accaagtgtc gctgacttgc cttgtgaagg gattctaccc gtccgacatt 1200
gccgtggagt gggagtccaa cggacagccc gaaaacaact acaagaccac ccctcctgtg 1260
ctggactctg atggatcatt cttcctttac tcgaaactca ccgtggacaa gtcccgctgg 1320
caacagggaa acgtgttcag ctgctccgtg atgcacgagg ccctgcacaa ccactatacc 1380
cagaagtccc tgtcactgag ccccgggaag cgcggcagga agcggagaag cggaagcgga 1440
gctacaaact tttcgctgct gaagcaggcc ggcgatgtgg aagaaaaccc agggcctatg 1500
gtgctgcaga ctcaagtgtt tatctccctg ctcctgtgga tctccggagc gtatgggtcc 1560
agctacgagc tcacccagcc tccttccgtg tcggtgtcac caggacagac cgcccggatt 1620
acctgttccg gggatgccct ccccaacaag ttcgcctact ggtaccgcca gaagtccggc 1680
caggctccag tgcttgtgat ctacgaggac aacaagcggc cttctggcat ccccgagcgg 1740
ttctccgggt cctcctccgg caccatggca accctgacca tctcgggagc tcaggtcgaa 1800
gatgaagccg actatcactg ctactcgacc gatagctcct caaacccgtt gggggtcttt 1860
ggcggaggaa ccaagctgac tgtgctggga cagccgaagg ccgcgccgtc cgtcaccctg 1920
ttcccgccga gcagcgagga actccaggcc aacaaggcca ctctcgtgtg cctgatttcc 1980
gacttctacc ctggtgccgt gactgtggcg tggaaggccg actcgtcgcc ggtcaaggcc 2040
ggcgtggaga ctaccacccc gtcaaaacag agcaacaata agtacgccgc ctcctcctat 2100
ttgtcactga ctcccgagca gtggaagtcc caccggtcct actcatgcca agtcacccat 2160
gaagggtcca ccgtggaaaa gactgtggcc cccactgagt gttcgtaatg a 2211
<210> 86
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pRD234,185-哺乳动物-DNA2.0
<400> 86
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly
465 470 475 480
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
485 490 495
Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu
500 505 510
Trp Ile Ser Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro
515 520 525
Ser Val Ser Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly
530 535 540
Asp Ala Leu Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly
545 550 555 560
Gln Ala Pro Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly
565 570 575
Ile Pro Glu Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu
580 585 590
Thr Ile Ser Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr
595 600 605
Ser Thr Asp Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr
610 615 620
Lys Leu Thr Val Leu Gly Gln Pro Lys Ala Ala Pro Ser Val Thr Leu
625 630 635 640
Phe Pro Pro Ser Ser Glu Glu Leu Gln Ala Asn Lys Ala Thr Leu Val
645 650 655
Cys Leu Ile Ser Asp Phe Tyr Pro Gly Ala Val Thr Val Ala Trp Lys
660 665 670
Ala Asp Ser Ser Pro Val Lys Ala Gly Val Glu Thr Thr Thr Pro Ser
675 680 685
Lys Gln Ser Asn Asn Lys Tyr Ala Ala Ser Ser Tyr Leu Ser Leu Thr
690 695 700
Pro Glu Gln Trp Lys Ser His Arg Ser Tyr Ser Cys Gln Val Thr His
705 710 715 720
Glu Gly Ser Thr Val Glu Lys Thr Val Ala Pro Thr Glu Cys Ser
725 730 735
<210> 87
<211> 2235
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9382,190
<400> 87
atggattgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgcagctgg tggagagcgg cggcggcgtg gtgcagccag gccggtccct gaggctgtct 120
tgcgcagcaa gcggcttcac ctttagcaag tacggaatgc actgggtgag acaggcacct 180
ggcaagggcc tggagtgggt ggccgtgatc tcctatgagg gctctaacaa gtactatgcc 240
gattccgtga agggcaggtt taccatcagc agagacaact ccaagaatac actgtacctg 300
cagatgaata gcctgagggc cgaggatacc gccgtgtact attgcgccaa gtccggcaca 360
cagtactatg acaccacagg ctacgagtat agaggcctgg agtacttcgg ctattggggc 420
cagggcaccc tggtgacagt gagctccgcc tccacaaagg gaccaagcgt gttcccactg 480
gcaccttcta gcaagtctac cagcggcggc acagccgccc tgggatgtct ggtgaaggat 540
tacttccctg agccagtgac cgtgagctgg aactccggcg ccctgacctc cggagtgcac 600
acatttcctg ccgtgctgca gtcctctggc ctgtactctc tgagctccgt ggtgaccgtg 660
ccatctagct ccctgggcac ccagacatat atctgcaacg tgaatcacaa gccaagcaat 720
acaaaggtgg acaagagggt ggagcccaag tcctgtgata agacccacac atgccctccc 780
tgtccagcac ctgaggcagc cggcggccca agcgtgttcc tgtttccacc caagcctaag 840
gatacactga tgatctctag aacccccgag gtgacatgcg tggtggtgga cgtgagccac 900
gaggaccccg aggtgaagtt caactggtac gtggacggcg tggaggtgca caatgccaag 960
accaagccca gggaggagca gtacaacagc acctatagag tggtgtccgt gctgacagtg 1020
ctgcaccagg actggctgaa cggcaaggag tataagtgca aggtgtccaa taaggccctg 1080
ccagccccca tcgagaagac catctctaag gcaaagggac agccacggga gccacaggtg 1140
tacacactgc ctccatcccg cgaggagatg accaagaacc aggtgtctct gacatgtctg 1200
gtgaagggct tctatccttc tgatatcgcc gtggagtggg agagcaatgg ccagccagag 1260
aacaattaca agaccacacc ccctgtgctg gactctgatg gcagcttctt tctgtattcc 1320
aagctgaccg tggacaagtc taggtggcag cagggcaacg tgttttcctg ctctgtgatg 1380
cacgaggccc tgcacaatca ctacacccag aagagcctgt ccctgtctcc tggcaagagg 1440
ggaaggaaga ggagaagcgg ctccggcgcc acaaacttca gcctgctgaa gcaggcaggc 1500
gacgtggagg agaatcctgg accaatggtg ctgcagaccc aggtgtttat ctctctgctg 1560
ctgtggatca gcggagcata cggagagatc gtgctgaccc agtctcctgg cacactgtct 1620
ctgagcccag gagagagggc caccctgagc tgtagagcct cccagagcgt gagcagcagc 1680
tacctggcct ggtatcagca gaagagggga caggccccac gcctgctgat ctacgacgcc 1740
tctagccggg ccaccggcat ccccgatcgc ttcagcggct ccggctctgg cacagacttt 1800
accctgacaa tctcccggct ggagcctgag gatttcgccg tgtactattg ccagcagtat 1860
ggcaggagca gatggacctt tggccagggc acaaaggtgg agatcaagag gaccgtggca 1920
gcaccaagcg tgttcatctt tccaccctcc gatgagcagc tgaagtctgg cacagccagc 1980
gtggtgtgcc tgctgaacaa tttctacccc agggaggcca aggtgcagtg gaaggtggac 2040
aacgccctgc agtccggcaa ttctcaggag agcgtgaccg agcaggactc caaggattct 2100
acatatagcc tgtcctctac cctgacactg tccaaggccg actacgagaa gcacaaggtg 2160
tatgcatgcg aggtgaccca ccagggcctg agctccccag tgacaaagag ctttaaccgc 2220
ggcgagtgtt gataa 2235
<210> 88
<211> 743
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX9382,190
<400> 88
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
145 150 155 160
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
165 170 175
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
180 185 190
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
195 200 205
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
210 215 220
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
225 230 235 240
Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His
245 250 255
Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val
260 265 270
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
275 280 285
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
290 295 300
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
305 310 315 320
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
325 330 335
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
340 345 350
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
355 360 365
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
370 375 380
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
385 390 395 400
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
405 410 415
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
420 425 430
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
435 440 445
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
450 455 460
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg
465 470 475 480
Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu
485 490 495
Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln
500 505 510
Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly
515 520 525
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
530 535 540
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
545 550 555 560
Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala Pro Arg Leu Leu
565 570 575
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
580 585 590
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
595 600 605
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Arg
610 615 620
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
625 630 635 640
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
645 650 655
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
660 665 670
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
675 680 685
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
690 695 700
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
705 710 715 720
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
725 730 735
Ser Phe Asn Arg Gly Glu Cys
740
<210> 89
<211> 1518
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93100,190.scFv_Fc.VH.G4S3.VL
<400> 89
atggattgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgcagctgg tggagagcgg cggcggcgtg gtgcagccag gccggtccct gaggctgtct 120
tgcgcagcaa gcggcttcac ctttagcaag tacggaatgc actgggtgag acaggcacct 180
ggcaagggcc tggagtgggt ggccgtgatc tcctatgagg gctctaacaa gtactatgcc 240
gattccgtga agggcaggtt taccatcagc agagacaact ccaagaatac actgtacctg 300
cagatgaata gcctgagggc cgaggatacc gccgtgtact attgcgccaa gtccggcaca 360
cagtactatg acaccacagg ctacgagtat agaggcctgg agtacttcgg ctattggggc 420
cagggcaccc tggtgacagt gagctccggc ggcggcggct ccggcggcgg cggcagcggc 480
ggcggcggca gcgagatcgt gctgacccag tctcctggca cactgtctct gagcccagga 540
gagagggcca ccctgagctg tagagcctcc cagagcgtga gcagcagcta cctggcctgg 600
tatcagcaga agaggggaca ggccccacgc ctgctgatct acgacgcctc tagccgggcc 660
accggcatcc ccgatcgctt cagcggctcc ggctctggca cagactttac cctgacaatc 720
tcccggctgg agcctgagga tttcgccgtg tactattgcc agcagtatgg caggagcaga 780
tggacctttg gccagggcac aaaggtggag atcaaggagc ccaagtcctg tgataagacc 840
cacacatgcc ctccctgtcc agcacctgag gcagccggcg gcccaagcgt gttcctgttt 900
ccacccaagc ctaaggatac actgatgatc tctagaaccc ccgaggtgac atgcgtggtg 960
gtggacgtga gccacgagga ccccgaggtg aagttcaact ggtacgtgga cggcgtggag 1020
gtgcacaatg ccaagaccaa gcccagggag gagcagtaca acagcaccta tagagtggtg 1080
tccgtgctga cagtgctgca ccaggactgg ctgaacggca aggagtataa gtgcaaggtg 1140
tccaataagg ccctgccagc ccccatcgag aagaccatct ctaaggcaaa gggacagcca 1200
cgggagccac aggtgtacac actgcctcca tcccgcgagg agatgaccaa gaaccaggtg 1260
tctctgacat gtctggtgaa gggcttctat ccttctgata tcgccgtgga gtgggagagc 1320
aatggccagc cagagaacaa ttacaagacc acaccccctg tgctggactc tgatggcagc 1380
ttctttctgt attccaagct gaccgtggac aagtctaggt ggcagcaggg caacgtgttt 1440
tcctgctctg tgatgcacga ggccctgcac aatcactaca cccagaagag cctgtccctg 1500
tctcctggca agtgataa 1518
<210> 90
<211> 504
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93100,190.scFv_Fc.VH.G4S3.VL
<400> 90
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
145 150 155 160
Gly Gly Gly Ser Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser
165 170 175
Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser
180 185 190
Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala
195 200 205
Pro Arg Leu Leu Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro
210 215 220
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
225 230 235 240
Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr
245 250 255
Gly Arg Ser Arg Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
260 265 270
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
275 280 285
Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
290 295 300
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
305 310 315 320
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
325 330 335
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
340 345 350
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
355 360 365
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
370 375 380
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
385 390 395 400
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr
405 410 415
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
420 425 430
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
435 440 445
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
450 455 460
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
465 470 475 480
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
485 490 495
Ser Leu Ser Leu Ser Pro Gly Lys
500
<210> 91
<211> 1521
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93101,190.scFv_Fc.VL.G4S3.VH
<400> 91
atggtgctgc agacccaggt gtttatctct ctgctgctgt ggatcagcgg agcatacgga 60
gagatcgtgc tgacccagtc tcctggcaca ctgtctctga gcccaggaga gagggccacc 120
ctgagctgta gagcctccca gagcgtgagc agcagctacc tggcctggta tcagcagaag 180
aggggacagg ccccacgcct gctgatctac gacgcctcta gccgggccac cggcatcccc 240
gatcgcttca gcggctccgg ctctggcaca gactttaccc tgacaatctc ccggctggag 300
cctgaggatt tcgccgtgta ctattgccag cagtatggca ggagcagatg gacctttggc 360
cagggcacaa aggtggagat caagggcggc ggcggctccg gcggcggcgg cagcggcggc 420
ggcggcagcc aggtgcagct ggtggagagc ggcggcggcg tggtgcagcc aggccggtcc 480
ctgaggctgt cttgcgcagc aagcggcttc acctttagca agtacggaat gcactgggtg 540
agacaggcac ctggcaaggg cctggagtgg gtggccgtga tctcctatga gggctctaac 600
aagtactatg ccgattccgt gaagggcagg tttaccatca gcagagacaa ctccaagaat 660
acactgtacc tgcagatgaa tagcctgagg gccgaggata ccgccgtgta ctattgcgcc 720
aagtccggca cacagtacta tgacaccaca ggctacgagt atagaggcct ggagtacttc 780
ggctattggg gccagggcac cctggtgaca gtgagctccg agcccaagtc ctgtgataag 840
acccacacat gccctccctg tccagcacct gaggcagccg gcggcccaag cgtgttcctg 900
tttccaccca agcctaagga tacactgatg atctctagaa cccccgaggt gacatgcgtg 960
gtggtggacg tgagccacga ggaccccgag gtgaagttca actggtacgt ggacggcgtg 1020
gaggtgcaca atgccaagac caagcccagg gaggagcagt acaacagcac ctatagagtg 1080
gtgtccgtgc tgacagtgct gcaccaggac tggctgaacg gcaaggagta taagtgcaag 1140
gtgtccaata aggccctgcc agcccccatc gagaagacca tctctaaggc aaagggacag 1200
ccacgggagc cacaggtgta cacactgcct ccatcccgcg aggagatgac caagaaccag 1260
gtgtctctga catgtctggt gaagggcttc tatccttctg atatcgccgt ggagtgggag 1320
agcaatggcc agccagagaa caattacaag accacacccc ctgtgctgga ctctgatggc 1380
agcttctttc tgtattccaa gctgaccgtg gacaagtcta ggtggcagca gggcaacgtg 1440
ttttcctgct ctgtgatgca cgaggccctg cacaatcact acacccagaa gagcctgtcc 1500
ctgtctcctg gcaagtgata a 1521
<210> 92
<211> 505
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93101,190.scFv_Fc.VL.G4S3.VH
<400> 92
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser
20 25 30
Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser
35 40 45
Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala
50 55 60
Pro Arg Leu Leu Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro
65 70 75 80
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
85 90 95
Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr
100 105 110
Gly Arg Ser Arg Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
115 120 125
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln
130 135 140
Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg Ser
145 150 155 160
Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Lys Tyr Gly
165 170 175
Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ala
180 185 190
Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val Lys
195 200 205
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu
210 215 220
Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala
225 230 235 240
Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr Glu Tyr Arg Gly
245 250 255
Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser
260 265 270
Ser Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro
275 280 285
Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
290 295 300
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
305 310 315 320
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
325 330 335
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
340 345 350
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His
355 360 365
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
370 375 380
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
385 390 395 400
Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met
405 410 415
Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro
420 425 430
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
435 440 445
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
450 455 460
Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
465 470 475 480
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
485 490 495
Lys Ser Leu Ser Leu Ser Pro Gly Lys
500 505
<210> 93
<211> 1527
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93102,190.scFv_Fc VH.Whitlow.VL
<400> 93
atggattgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgcagctgg tggagagcgg cggcggcgtg gtgcagccag gccggtccct gaggctgtct 120
tgcgcagcaa gcggcttcac ctttagcaag tacggaatgc actgggtgag acaggcacct 180
ggcaagggcc tggagtgggt ggccgtgatc tcctatgagg gctctaacaa gtactatgcc 240
gattccgtga agggcaggtt taccatcagc agagacaact ccaagaatac actgtacctg 300
cagatgaata gcctgagggc cgaggatacc gccgtgtact attgcgccaa gtccggcaca 360
cagtactatg acaccacagg ctacgagtat agaggcctgg agtacttcgg ctattggggc 420
cagggcaccc tggtgacagt gagctccggc agcacctctg gctccggcaa gcccggctct 480
ggcgagggca gcaccaaggg cgagatcgtg ctgacccagt ctcctggcac actgtctctg 540
agcccaggag agagggccac cctgagctgt agagcctccc agagcgtgag cagcagctac 600
ctggcctggt atcagcagaa gaggggacag gccccacgcc tgctgatcta cgacgcctct 660
agccgggcca ccggcatccc cgatcgcttc agcggctccg gctctggcac agactttacc 720
ctgacaatct cccggctgga gcctgaggat ttcgccgtgt actattgcca gcagtatggc 780
aggagcagat ggacctttgg ccagggcaca aaggtggaga tcaaggagcc caagtcctgt 840
gataagaccc acacatgccc tccctgtcca gcacctgagg cagccggcgg cccaagcgtg 900
ttcctgtttc cacccaagcc taaggataca ctgatgatct ctagaacccc cgaggtgaca 960
tgcgtggtgg tggacgtgag ccacgaggac cccgaggtga agttcaactg gtacgtggac 1020
ggcgtggagg tgcacaatgc caagaccaag cccagggagg agcagtacaa cagcacctat 1080
agagtggtgt ccgtgctgac agtgctgcac caggactggc tgaacggcaa ggagtataag 1140
tgcaaggtgt ccaataaggc cctgccagcc cccatcgaga agaccatctc taaggcaaag 1200
ggacagccac gggagccaca ggtgtacaca ctgcctccat cccgcgagga gatgaccaag 1260
aaccaggtgt ctctgacatg tctggtgaag ggcttctatc cttctgatat cgccgtggag 1320
tgggagagca atggccagcc agagaacaat tacaagacca caccccctgt gctggactct 1380
gatggcagct tctttctgta ttccaagctg accgtggaca agtctaggtg gcagcagggc 1440
aacgtgtttt cctgctctgt gatgcacgag gccctgcaca atcactacac ccagaagagc 1500
ctgtccctgt ctcctggcaa gtgataa 1527
<210> 94
<211> 507
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93102,190.scFv_Fc VH.Whitlow.VL
<400> 94
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr
115 120 125
Glu Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu
130 135 140
Val Thr Val Ser Ser Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser
145 150 155 160
Gly Glu Gly Ser Thr Lys Gly Glu Ile Val Leu Thr Gln Ser Pro Gly
165 170 175
Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala
180 185 190
Ser Gln Ser Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln Lys Arg
195 200 205
Gly Gln Ala Pro Arg Leu Leu Ile Tyr Asp Ala Ser Ser Arg Ala Thr
210 215 220
Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr
225 230 235 240
Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys
245 250 255
Gln Gln Tyr Gly Arg Ser Arg Trp Thr Phe Gly Gln Gly Thr Lys Val
260 265 270
Glu Ile Lys Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
275 280 285
Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro
290 295 300
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
305 310 315 320
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
325 330 335
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
340 345 350
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
355 360 365
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
370 375 380
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
385 390 395 400
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
405 410 415
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
420 425 430
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
435 440 445
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
450 455 460
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
465 470 475 480
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
485 490 495
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
500 505
<210> 95
<211> 1530
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93103,190.scFv_Fc.VL.Whitlow.VH
<400> 95
atggtgctgc agacccaggt gtttatctct ctgctgctgt ggatcagcgg agcatacgga 60
gagatcgtgc tgacccagtc tcctggcaca ctgtctctga gcccaggaga gagggccacc 120
ctgagctgta gagcctccca gagcgtgagc agcagctacc tggcctggta tcagcagaag 180
aggggacagg ccccacgcct gctgatctac gacgcctcta gccgggccac cggcatcccc 240
gatcgcttca gcggctccgg ctctggcaca gactttaccc tgacaatctc ccggctggag 300
cctgaggatt tcgccgtgta ctattgccag cagtatggca ggagcagatg gacctttggc 360
cagggcacaa aggtggagat caagggcagc acctctggct ccggcaagcc cggctctggc 420
gagggcagca ccaagggcca ggtgcagctg gtggagagcg gcggcggcgt ggtgcagcca 480
ggccggtccc tgaggctgtc ttgcgcagca agcggcttca cctttagcaa gtacggaatg 540
cactgggtga gacaggcacc tggcaagggc ctggagtggg tggccgtgat ctcctatgag 600
ggctctaaca agtactatgc cgattccgtg aagggcaggt ttaccatcag cagagacaac 660
tccaagaata cactgtacct gcagatgaat agcctgaggg ccgaggatac cgccgtgtac 720
tattgcgcca agtccggcac acagtactat gacaccacag gctacgagta tagaggcctg 780
gagtacttcg gctattgggg ccagggcacc ctggtgacag tgagctccga gcccaagtcc 840
tgtgataaga cccacacatg ccctccctgt ccagcacctg aggcagccgg cggcccaagc 900
gtgttcctgt ttccacccaa gcctaaggat acactgatga tctctagaac ccccgaggtg 960
acatgcgtgg tggtggacgt gagccacgag gaccccgagg tgaagttcaa ctggtacgtg 1020
gacggcgtgg aggtgcacaa tgccaagacc aagcccaggg aggagcagta caacagcacc 1080
tatagagtgg tgtccgtgct gacagtgctg caccaggact ggctgaacgg caaggagtat 1140
aagtgcaagg tgtccaataa ggccctgcca gcccccatcg agaagaccat ctctaaggca 1200
aagggacagc cacgggagcc acaggtgtac acactgcctc catcccgcga ggagatgacc 1260
aagaaccagg tgtctctgac atgtctggtg aagggcttct atccttctga tatcgccgtg 1320
gagtgggaga gcaatggcca gccagagaac aattacaaga ccacaccccc tgtgctggac 1380
tctgatggca gcttctttct gtattccaag ctgaccgtgg acaagtctag gtggcagcag 1440
ggcaacgtgt tttcctgctc tgtgatgcac gaggccctgc acaatcacta cacccagaag 1500
agcctgtccc tgtctcctgg caagtgataa 1530
<210> 96
<211> 508
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93103,190.scFv_Fc.VL.Whitlow.VH
<400> 96
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser
20 25 30
Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser
35 40 45
Val Ser Ser Ser Tyr Leu Ala Trp Tyr Gln Gln Lys Arg Gly Gln Ala
50 55 60
Pro Arg Leu Leu Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro
65 70 75 80
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
85 90 95
Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr
100 105 110
Gly Arg Ser Arg Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
115 120 125
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
130 135 140
Lys Gly Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro
145 150 155 160
Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser
165 170 175
Lys Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu
180 185 190
Trp Val Ala Val Ile Ser Tyr Glu Gly Ser Asn Lys Tyr Tyr Ala Asp
195 200 205
Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr
210 215 220
Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr
225 230 235 240
Tyr Cys Ala Lys Ser Gly Thr Gln Tyr Tyr Asp Thr Thr Gly Tyr Glu
245 250 255
Tyr Arg Gly Leu Glu Tyr Phe Gly Tyr Trp Gly Gln Gly Thr Leu Val
260 265 270
Thr Val Ser Ser Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
275 280 285
Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe
290 295 300
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
305 310 315 320
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
325 330 335
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
340 345 350
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
355 360 365
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
370 375 380
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
385 390 395 400
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
405 410 415
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
420 425 430
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
435 440 445
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
450 455 460
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
465 470 475 480
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
485 490 495
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
500 505
<210> 97
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93134,185
<400> 97
atggactgga cttggagaat cctgttcctg gtcgccgcag caaccgggac ccacgccgag 60
gtgcagctgg tgcagagcgg ggcagaagtg aagaagccag gcgagagcct gcggatctcc 120
tgtaagggca gcggctactc ctttacatct tattggatca cctgggtgcg ccagatgcca 180
ggcaagggcc tggagtggat ggccaagttc gacccttctg atagccagac aaactactcc 240
ccatcttttc agggccacgt gacaatcagc gtggacaaga gcatctccac cgcctatctg 300
cagtggagct ccctgaaggc ctccgatacc gccatgtact attgcgccag gagatactgt 360
tctagctcct cttgctatgt ggacaattgg ggccagggca cactggtgac catcttctct 420
gccagcacaa agggaccaag cgtgtttcca ctggcaccca gctccaagtc cacatctggc 480
ggcaccgccg ccctgggatg tctggtgaag gattacttcc ccgagcctgt gaccgtgagc 540
tggaactccg gcgccctgac aagcggagtg cacacctttc cagccgtgct gcagtctagc 600
ggcctgtact ccctgtcctc tgtggtgaca gtgcctagct cctctctggg cacacagacc 660
tatatctgta acgtgaatca caagccttcc aataccaagg tggacaagaa ggtggagcca 720
aagtcttgcg ataagacaca cacctgccct ccctgtccag caccagaggc agccggcgga 780
ccatccgtgt tcctgtttcc acccaagcct aaggacaccc tgatgatcag caggacacca 840
gaggtgacct gcgtggtggt ggacgtgtcc cacgaggacc ccgaggtgaa gttcaactgg 900
tacgtggatg gcgtggaggt gcacaatgcc aagacaaagc caagggagga gcagtacaac 960
tctacatata gagtggtgag cgtgctgacc gtgctgcacc aggactggct gaacggcaag 1020
gagtataagt gtaaggtgtc taataaggcc ctgcctgccc caatcgagaa gacaatcagc 1080
aaggcaaagg gacagcctcg ggagccacag gtgtacaccc tgcctccatc tcgcgacgag 1140
ctgacaaaga accaggtgag cctgacctgc ctggtgaagg gcttttatcc ctccgatatc 1200
gccgtggagt gggagtctaa tggccagcct gagaacaatt acaagaccac accccctgtg 1260
ctggactctg atggcagctt ctttctgtat agcaagctga ccgtggacaa gtcccggtgg 1320
cagcagggca acgtgttcag ctgttccgtg atgcacgagg ccctgcacaa tcactacaca 1380
cagaagtctc tgagcctgtc ccctggcaag aggggaagaa agcggcgctc tggcagcgga 1440
gcaaccaact ttagcctgct gaagcaggca ggcgatgtgg aggagaatcc aggacctatg 1500
gtgctgcaga cacaggtgtt catctccctg ctgctgtgga tctctggcgc ctacggcagc 1560
tcctatgagc tgacccagcc accctccgtg tctgtgagcc ctggccagac agcaaggatc 1620
acctgcagcg gcgacgcact gccaaacaag tttgcctact ggtatagaca gaagtccgga 1680
caggcacccg tgctggtcat ctacgaggat aataagcggc cctctggcat ccctgagagg 1740
ttcagcggct ctagctccgg cacaatggcc acactgacca tctccggagc acaggtggag 1800
gacgaggcag attaccactg ttattctacc gactctagct ccaaccctct gggcgtgttc 1860
ggcggcggaa caaagctgac cgtgctggga cagccaaagg cagcaccaag cgtgaccctg 1920
tttcctccat ctagcgagga gctgcaggcc aataaggcca cactggtgtg cctgatctcc 1980
gacttctacc ctggagcagt gaccgtggca tggaaggccg attcctctcc agtgaaggcc 2040
ggcgtggaga caacaacccc ctccaagcag tctaacaata agtacgccgc cagctcctat 2100
ctgagcctga ccccagagca gtggaagtcc cacaggtcct attcttgtca ggtcacccat 2160
gaaggctcaa cagtggagaa aacagtcgcc cctacagaat gctcatgata a 2211
<210> 98
<211> 735
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93134,185
<400> 98
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly
465 470 475 480
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
485 490 495
Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu
500 505 510
Trp Ile Ser Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro
515 520 525
Ser Val Ser Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly
530 535 540
Asp Ala Leu Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly
545 550 555 560
Gln Ala Pro Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly
565 570 575
Ile Pro Glu Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu
580 585 590
Thr Ile Ser Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr
595 600 605
Ser Thr Asp Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr
610 615 620
Lys Leu Thr Val Leu Gly Gln Pro Lys Ala Ala Pro Ser Val Thr Leu
625 630 635 640
Phe Pro Pro Ser Ser Glu Glu Leu Gln Ala Asn Lys Ala Thr Leu Val
645 650 655
Cys Leu Ile Ser Asp Phe Tyr Pro Gly Ala Val Thr Val Ala Trp Lys
660 665 670
Ala Asp Ser Ser Pro Val Lys Ala Gly Val Glu Thr Thr Thr Pro Ser
675 680 685
Lys Gln Ser Asn Asn Lys Tyr Ala Ala Ser Ser Tyr Leu Ser Leu Thr
690 695 700
Pro Glu Gln Trp Lys Ser His Arg Ser Tyr Ser Cys Gln Val Thr His
705 710 715 720
Glu Gly Ser Thr Val Glu Lys Thr Val Ala Pro Thr Glu Cys Ser
725 730 735
<210> 99
<211> 1497
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93129,185.scFv_Fc.VH.G4S3.VL
<400> 99
atggattgga catggagaat cctgttcctg gtcgccgccg caactgggac ccacgccgaa 60
gtgcagctgg tgcagtctgg agccgaagtg aagaagccag gcgagtctct gagaatcagc 120
tgcaagggca gcggctactc tttcacatcc tactggatca cctgggtgcg ccagatgcca 180
ggcaagggcc tggagtggat ggccaagttc gacccatctg atagccagac aaactacagc 240
ccctccttcc agggccacgt gacaatctcc gtggacaagt ccatcagcac agcctatctg 300
cagtggtctt ccctgaaggc ctctgacacc gccatgtact attgcgcccg gagatattgc 360
agctcttcca gctgttacgt ggacaactgg ggccagggca ccctggtgac aatcttctct 420
ggcggcggcg gctctggcgg cggcggcagc ggcggcggcg gctccagctc ctatgagctg 480
acccagcccc catccgtgag cgtgtctcca ggccagacag cccggatcac atgtagcggc 540
gacgccctgc ctaataagtt tgcctactgg tacaggcaga agagcggcca ggccccagtg 600
ctggtaatct acgaggacaa caagcgccca tctggcatcc ccgagagatt ttctggctct 660
tccagcggca ccatggccac cctgacaatc tccggcgccc aggtggagga tgaggccgat 720
tatcactgct acagcacaga ttccagctcc aatcccctgg gcgtgtttgg cggcggcacc 780
aagctgaccg tgctggagcc aaagagctcc gataagaccc acacctgtcc accttgcccc 840
gccccagagg ccgccggcgg cccaagcgtg ttcctgttcc cacctaagcc caaggacacc 900
ctgatgatct ccagaacccc tgaggtgaca tgcgtggtgg tggacgtgtc tcacgaggac 960
ccagaggtga agttcaactg gtatgtggac ggcgtggagg tgcacaacgc caagacaaag 1020
cctagagagg agcagtacaa cagcacctac agagtggtgt ctgtgctgac agtgctgcac 1080
caggactggc tgaacggcaa ggagtacaag tgtaaggtgt ccaataaggc cctgccagcc 1140
cctatcgaga agaccatctc taaggccaag ggccagccaa gagagccaca ggtgtatacc 1200
ctgccaccct ctagagacga gctgacaaag aaccaggtgt ctctgacatg tctggtgaag 1260
ggcttctacc cctctgatat cgccgtggag tgggagtcta atggccagcc agagaataac 1320
tacaagacca caccacctgt gctggactcc gatggcagct ttttcctgta cagcaagctg 1380
acagtggata agtccagatg gcagcagggc aacgtgttta gctgctccgt gatgcacgaa 1440
gcactgcaca accactacac ccagaagtcc ctgagcctgt cacccggcaa gtgataa 1497
<210> 100
<211> 497
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93129,185.scFv_Fc.VH.G4S3.VL
<400> 100
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Ser Tyr Glu Leu
145 150 155 160
Thr Gln Pro Pro Ser Val Ser Val Ser Pro Gly Gln Thr Ala Arg Ile
165 170 175
Thr Cys Ser Gly Asp Ala Leu Pro Asn Lys Phe Ala Tyr Trp Tyr Arg
180 185 190
Gln Lys Ser Gly Gln Ala Pro Val Leu Val Ile Tyr Glu Asp Asn Lys
195 200 205
Arg Pro Ser Gly Ile Pro Glu Arg Phe Ser Gly Ser Ser Ser Gly Thr
210 215 220
Met Ala Thr Leu Thr Ile Ser Gly Ala Gln Val Glu Asp Glu Ala Asp
225 230 235 240
Tyr His Cys Tyr Ser Thr Asp Ser Ser Ser Asn Pro Leu Gly Val Phe
245 250 255
Gly Gly Gly Thr Lys Leu Thr Val Leu Glu Pro Lys Ser Ser Asp Lys
260 265 270
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro
275 280 285
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
290 295 300
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
305 310 315 320
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
325 330 335
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
340 345 350
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
355 360 365
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
370 375 380
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
385 390 395 400
Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr
405 410 415
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
420 425 430
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
435 440 445
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
450 455 460
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
465 470 475 480
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
485 490 495
Lys
<210> 101
<211> 1500
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93130,185.scFv_Fc.VL.G4S3.VH
<400> 101
atggtcctgc agactcaggt gtttatttca ctgctgctgt ggatttccgg cgcttatggg 60
tcatcttacg aactgactca gcctccttcc gtgagcgtgt ctccaggcca gacagccaga 120
atcacatgct ccggcgacgc cctgccaaac aagtttgcct actggtatag gcagaagtcc 180
ggccaggccc cagtgctggt aatctatgag gacaacaagc ggccaagcgg catcccagag 240
cggtttagcg gctccagctc tggcaccatg gccaccctga caatctccgg cgcccaggtg 300
gaggatgagg ccgattatca ctgttactcc acagatagct cctccaatcc actgggcgtg 360
ttcggcggcg gcaccaagct gaccgtgctg ggcggcggcg gctccggcgg cggcggctct 420
ggcggcggcg gctccgaggt gcagctggtg cagtctggcg ccgaggtgaa gaagccaggc 480
gagtccctgc gcatcagctg caagggctct ggctatagct tcacaagcta ctggatcacc 540
tgggtgcggc agatgccagg caagggcctg gagtggatgg ccaagtttga cccctctgat 600
agccagacca attactctcc cagcttccag ggccacgtga caatcagcgt ggacaagtcc 660
atcagcacag cctacctgca gtggtctagc ctgaaggcca gcgatacagc catgtattat 720
tgcgcccgga gatactgttc cagctctagc tgttacgtgg acaattgggg ccagggcaca 780
ctggtgacaa tcttttccga gccaaagtct tccgataaga cccacacctg tccaccctgt 840
cctgccccag aggccgccgg cggccccagc gtgttcctgt ttcctccaaa gcccaaggac 900
accctgatga tctccagaac accagaggtg acctgcgtgg tggtggacgt gtctcacgag 960
gacccagagg tgaagtttaa ctggtacgtg gacggcgtgg aggtgcacaa cgccaagaca 1020
aagcctagag aggagcagta caatagcacc tacagagtgg tgtctgtgct gacagtgctg 1080
caccaggatt ggctgaacgg caaggagtac aagtgtaagg tgtccaataa ggccctgccc 1140
gcccctatcg agaagaccat ctctaaggcc aagggccagc ctagagagcc acaggtgtat 1200
acactgcccc catccaggga cgagctgacc aagaaccagg tgtccctgac atgtctggtg 1260
aagggctttt accctagcga tatcgccgtg gagtgggagt ctaacggcca gcctgagaat 1320
aactacaaga ccacaccacc tgtgctggac tctgacggca gctttttcct gtacagcaag 1380
ctgacagtgg acaagagcag gtggcagcag ggcaacgtgt tcagctgctc cgtgatgcac 1440
gaagcactgc acaaccacta cactcagaaa tccctgtcac tgtcccctgg aaaatgataa 1500
<210> 102
<211> 498
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93130,185.scFv_Fc.VL.G4S3.VH
<400> 102
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro Ser Val Ser
20 25 30
Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly Asp Ala Leu
35 40 45
Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly Gln Ala Pro
50 55 60
Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly Ile Pro Glu
65 70 75 80
Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu Thr Ile Ser
85 90 95
Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr Ser Thr Asp
100 105 110
Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr Lys Leu Thr
115 120 125
Val Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
130 135 140
Ser Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly
145 150 155 160
Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe Thr Ser
165 170 175
Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu Glu Trp
180 185 190
Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser Pro Ser
195 200 205
Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser Thr Ala
210 215 220
Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met Tyr Tyr
225 230 235 240
Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp Asn Trp
245 250 255
Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Glu Pro Lys Ser Ser Asp
260 265 270
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly
275 280 285
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
290 295 300
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu
305 310 315 320
Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
325 330 335
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
340 345 350
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
355 360 365
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
370 375 380
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
385 390 395 400
Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu
405 410 415
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
420 425 430
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
435 440 445
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp
450 455 460
Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
465 470 475 480
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
485 490 495
Gly Lys
<210> 103
<211> 1506
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93131,185.scFv_Fc VH.Whitlow.VL
<400> 103
atggactgga catggagaat cctgttcctg gtcgccgccg ctaccgggac ccacgcagaa 60
gtgcagctgg tgcagagtgg agccgaagtg aagaagccag gcgagtctct gagaatcagc 120
tgcaagggca gcggctattc ctttacaagc tactggatca cctgggtgcg gcagatgccc 180
ggcaagggcc tggagtggat ggccaagttc gatccatccg atagccagac caattacagc 240
ccttctttcc agggccacgt gacaatctcc gtggacaagt ccatcagcac agcctacctg 300
cagtggtcct ctctgaaggc cagcgacacc gccatgtact actgtgcccg gagatattgc 360
tcctcttcca gctgctatgt ggacaattgg ggccagggca ccctggtgac catcttcagc 420
ggctctacaa gcggctctgg caagccaggc tctggcgagg gctctaccaa gggctccagc 480
tatgagctga cccagcctcc atccgtgagc gtgtccccag gccagacagc cagaatcacc 540
tgtagcggcg acgccctgcc taacaagttt gcctactggt ataggcagaa gtctggccag 600
gcccctgtgc tggtaatcta cgaggataac aagaggccat ccggcatccc tgagagattt 660
tctggctcct ctagcggcac catggccacc ctgacaatct ctggcgccca ggtggaggat 720
gaggccgact accactgcta ctccacagac tcttccagca accctctggg cgtgttcggc 780
ggcggcacca agctgacagt gctggagccc aagagctctg acaagaccca cacctgccct 840
ccatgtccag ccccagaggc cgccggcggc ccaagcgtgt tcctgtttcc acctaagcca 900
aaggacaccc tgatgatctc tcggacccca gaggtgacat gcgtggtggt ggacgtgtcc 960
cacgaggacc ctgaggtgaa gtttaattgg tatgtggatg gcgtggaggt gcacaatgcc 1020
aagaccaagc cacgggagga gcagtataac agcacctaca gagtggtgtc tgtgctgacc 1080
gtgctgcacc aggactggct gaacggcaag gagtacaagt gtaaggtgtc caacaaggcc 1140
ctgcccgccc ctatcgagaa gaccatctct aaggccaagg gccagccaag agagccacag 1200
gtgtataccc tgccaccctc cagagatgag ctgacaaaga atcaggtgtc tctgacctgt 1260
ctggtgaagg gcttctaccc aagcgatatc gccgtggagt gggagtctaa cggccagcct 1320
gagaacaact ataagaccac acctcccgtg ctggattccg acggctcttt cttcctgtac 1380
agcaagctga ccgtggataa gagcagatgg cagcagggca acgtgttctc ctgtagcgtg 1440
atgcacgaag cactgcacaa ccattacacc cagaagtccc tgagcctgag ccctggcaaa 1500
tgataa 1506
<210> 104
<211> 500
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93131,185.scFv_Fc VH.Whitlow.VL
<400> 104
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser Phe
35 40 45
Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr Ser
65 70 75 80
Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val Asp
115 120 125
Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Gly Ser Thr Ser
130 135 140
Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr Lys Gly Ser Ser
145 150 155 160
Tyr Glu Leu Thr Gln Pro Pro Ser Val Ser Val Ser Pro Gly Gln Thr
165 170 175
Ala Arg Ile Thr Cys Ser Gly Asp Ala Leu Pro Asn Lys Phe Ala Tyr
180 185 190
Trp Tyr Arg Gln Lys Ser Gly Gln Ala Pro Val Leu Val Ile Tyr Glu
195 200 205
Asp Asn Lys Arg Pro Ser Gly Ile Pro Glu Arg Phe Ser Gly Ser Ser
210 215 220
Ser Gly Thr Met Ala Thr Leu Thr Ile Ser Gly Ala Gln Val Glu Asp
225 230 235 240
Glu Ala Asp Tyr His Cys Tyr Ser Thr Asp Ser Ser Ser Asn Pro Leu
245 250 255
Gly Val Phe Gly Gly Gly Thr Lys Leu Thr Val Leu Glu Pro Lys Ser
260 265 270
Ser Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala
275 280 285
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
290 295 300
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
305 310 315 320
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
325 330 335
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
340 345 350
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
355 360 365
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
370 375 380
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
385 390 395 400
Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val
405 410 415
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
420 425 430
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
435 440 445
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr
450 455 460
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
465 470 475 480
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
485 490 495
Ser Pro Gly Lys
500
<210> 105
<211> 1509
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93132,185.scFv_Fc.VL.Whitlow.VH
<400> 105
atggtcctgc agactcaggt gtttatttca ctgctgctgt ggatttccgg ggcatacggg 60
tcctcatacg aactgactca gcctcccagc gtgtccgtgt ctcctggcca gaccgccagg 120
atcacctgca gcggcgatgc cctgccaaac aagttcgcct attggtacag gcagaagtcc 180
ggccaggccc cagtgctggt aatctacgag gacaataagc ggccttctgg catccctgag 240
aggttcagcg gctcttcctc tggcacaatg gccacactga ccatctctgg cgcccaggtg 300
gaggatgagg ccgactacca ctgctacagc accgattcct ctagcaatcc tctgggcgtg 360
tttggcggcg gcaccaagct gacagtgctg ggctccacct ctggctccgg caagccaggc 420
tctggcgagg gctctacaaa gggcgaggtg cagctggtgc agtccggcgc cgaggtgaag 480
aagcctggcg agtctctgcg gatcagctgc aagggcagcg gctactcctt cacctcttac 540
tggatcacct gggtgcggca gatgccaggc aagggcctgg agtggatggc caagttcgac 600
cctagcgaca gccagaccaa ctacagccct tcttttcagg gccacgtgac aatcagcgtg 660
gataagtcta tctccaccgc ctatctgcag tggagctccc tgaaggcctc tgataccgcc 720
atgtattact gcgccagacg ctactgttct agcagctcct gctatgtgga caactggggc 780
cagggcacac tggtgaccat cttcagcgag cctaagagct ccgataagac ccacacctgc 840
cctccctgcc cagcccccga ggccgccggc ggcccatccg tgtttctgtt ccctccaaag 900
cccaaggata ccctgatgat cagccgcacc cctgaggtga catgcgtggt ggtggacgtg 960
tctcacgagg acccagaggt gaagttcaac tggtacgtgg atggcgtgga ggtgcacaat 1020
gccaagacca agcccagaga ggagcagtac aattccacct acagagtggt gtctgtgctg 1080
accgtgctgc accaggattg gctgaacggc aaggagtaca agtgtaaggt gtccaataag 1140
gccctgccag cccccatcga gaagaccatc agcaaggcca agggccagcc aagagagcct 1200
caggtgtata ccctgccccc atctcgggac gagctgacca agaaccaggt gtccctgaca 1260
tgtctggtga agggctttta tccatccgac atcgccgtgg agtgggagag caatggccag 1320
cccgagaaca attacaagac aacccctcca gtgctggata gcgacggctc ctttttcctg 1380
tattccaagc tgaccgtgga taagtccaga tggcagcagg gcaacgtgtt ctcctgctct 1440
gtgatgcacg aagccctgca caaccattac acccagaaat ccctgtccct gtcccccgga 1500
aaatgataa 1509
<210> 106
<211> 501
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93132,185.scFv_Fc.VL.Whitlow.VH
<400> 106
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Ser Ser Tyr Glu Leu Thr Gln Pro Pro Ser Val Ser
20 25 30
Val Ser Pro Gly Gln Thr Ala Arg Ile Thr Cys Ser Gly Asp Ala Leu
35 40 45
Pro Asn Lys Phe Ala Tyr Trp Tyr Arg Gln Lys Ser Gly Gln Ala Pro
50 55 60
Val Leu Val Ile Tyr Glu Asp Asn Lys Arg Pro Ser Gly Ile Pro Glu
65 70 75 80
Arg Phe Ser Gly Ser Ser Ser Gly Thr Met Ala Thr Leu Thr Ile Ser
85 90 95
Gly Ala Gln Val Glu Asp Glu Ala Asp Tyr His Cys Tyr Ser Thr Asp
100 105 110
Ser Ser Ser Asn Pro Leu Gly Val Phe Gly Gly Gly Thr Lys Leu Thr
115 120 125
Val Leu Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly
130 135 140
Ser Thr Lys Gly Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys
145 150 155 160
Lys Pro Gly Glu Ser Leu Arg Ile Ser Cys Lys Gly Ser Gly Tyr Ser
165 170 175
Phe Thr Ser Tyr Trp Ile Thr Trp Val Arg Gln Met Pro Gly Lys Gly
180 185 190
Leu Glu Trp Met Ala Lys Phe Asp Pro Ser Asp Ser Gln Thr Asn Tyr
195 200 205
Ser Pro Ser Phe Gln Gly His Val Thr Ile Ser Val Asp Lys Ser Ile
210 215 220
Ser Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala
225 230 235 240
Met Tyr Tyr Cys Ala Arg Arg Tyr Cys Ser Ser Ser Ser Cys Tyr Val
245 250 255
Asp Asn Trp Gly Gln Gly Thr Leu Val Thr Ile Phe Ser Glu Pro Lys
260 265 270
Ser Ser Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala
275 280 285
Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
290 295 300
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
305 310 315 320
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val
325 330 335
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser
340 345 350
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
355 360 365
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
370 375 380
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
385 390 395 400
Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln
405 410 415
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
420 425 430
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
435 440 445
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu
450 455 460
Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser
465 470 475 480
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
485 490 495
Leu Ser Pro Gly Lys
500
<210> 107
<211> 1497
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX93141,DVSF3 LALA scFv-Fc VH.G4S3.VL
<400> 107
atggactgga cttggagaat cctgtttctg gtcgcagcag ccactggaac ccacgccgag 60
gtgcagctgg tcgagagcgg gggaggcctg gtgcagccag gcagatccct gaggctgtct 120
tgtgccgcct ctggcttcac atttgatgac tacgccatgt tctgggtgcg gcaggcccca 180
ggcaagggcc tggagtggat ctccggcatc agctggaact ctgccaccat cggctatgcc 240
gactccgtga agggcaggtt caccatctcc cgggacaatg ccaagaagtc tctggacctg 300
cagatgaaca gcctgagacc cgacgatacc gccctgtact attgtgccaa gggcggccca 360
agaggcctgc agctgctgtc ctcttgggtg gattactggg gccagggcac cctggtgaca 420
gtgtcttccg gcggcggcgg ctctggcggc ggcggcagcg gcggcggcgg ctccgatatc 480
cagatgaccc agtctccctc ttccctgagc gcctccgtgg gcgatcgggt gacaatcacc 540
tgcagagcca gccaggatat ccggagatac ctgaactggt accagcagag gcctggcaga 600
gtgccacagc tgctgatcta caccacatcc accctgcagt ctggcgtgcc aagcagattt 660
tccggcagcg gctccgtgac agacttcacc ctgacaatct ccagcctgca gccagaggat 720
ttcggcacat attactgcca gcagagctac tccccacctc acacctttgg ccagggcaca 780
aagctggaga tcaaggagcc caagtcttcc gacaagaccc acacctgtcc accttgtccc 840
gccccagagg ccgccggcgg ccctagcgtg tttctgttcc ctccaaagcc taaggatacc 900
ctgatgatct ccagaacccc agaggtgaca tgcgtggtgg tggacgtgtc tcacgaggac 960
cccgaggtga agtttaactg gtacgtggat ggcgtggagg tgcacaatgc caagaccaag 1020
ccaagggagg agcagtacaa cagcacctac agagtggtgt ccgtgctgac agtgctgcac 1080
caggactggc tgaatggcaa ggagtataag tgcaaggtgt ccaacaaggc cctgccagcc 1140
cccatcgaga agaccatcag caaggccaag ggccagccta gggagccaca ggtgtacacc 1200
ctgccaccct ccagagacga gctgacaaag aatcaggtgt ctctgacatg cctggtgaag 1260
ggcttctacc cttccgacat cgccgtggag tgggagtcta acggccagcc cgagaacaat 1320
tacaagacca caccacctgt gctggactcc gatggcagct tcttcctgta tagcaagctg 1380
accgtggata agtctagatg gcagcagggc aacgtgttct cctgttccgt gatgcacgaa 1440
gcactgcaca accactacac tcagaagagc ctgtccctgt cccctggaaa atgataa 1497
<210> 108
<211> 497
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,pGX93141,DVSF3 LALA scFv-Fc VH.G4S3.VL
<400> 108
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Asp Asp Tyr Ala Met Phe Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Ile Ser Gly Ile Ser Trp Asn Ser Ala Thr Ile Gly Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Lys
85 90 95
Ser Leu Asp Leu Gln Met Asn Ser Leu Arg Pro Asp Asp Thr Ala Leu
100 105 110
Tyr Tyr Cys Ala Lys Gly Gly Pro Arg Gly Leu Gln Leu Leu Ser Ser
115 120 125
Trp Val Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly
130 135 140
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile
145 150 155 160
Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg
165 170 175
Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Ile Arg Arg Tyr Leu Asn
180 185 190
Trp Tyr Gln Gln Arg Pro Gly Arg Val Pro Gln Leu Leu Ile Tyr Thr
195 200 205
Thr Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly
210 215 220
Ser Val Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp
225 230 235 240
Phe Gly Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Pro Pro His Thr Phe
245 250 255
Gly Gln Gly Thr Lys Leu Glu Ile Lys Glu Pro Lys Ser Ser Asp Lys
260 265 270
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro
275 280 285
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
290 295 300
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
305 310 315 320
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
325 330 335
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
340 345 350
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
355 360 365
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
370 375 380
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
385 390 395 400
Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr
405 410 415
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
420 425 430
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
435 440 445
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
450 455 460
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
465 470 475 480
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
485 490 495
Lys
<210> 109
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 109
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
1 5 10 15
Lys Gly
<210> 110
<211> 2199
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,基因优化的抗-RSV,pGX9368
<400> 110
atggactgga catggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgaccctga gagagtccgg accagccctg gtgaagccaa cccagacact gaccctgaca 120
tgcaccttct ccggcttttc tctgagcacc tccggcatgt ctgtgggatg gatcaggcag 180
ccccctggca aggccctgga gtggctggcc gacatctggt gggacgataa gaaggattac 240
aaccctagcc tgaagtcccg cctgacaatc agcaaggaca cctccaagaa ccaggtggtg 300
ctgaaggtga caaatatgga cccagccgat acagccacct actattgcgc ccggagcatg 360
atcaccaatt ggtatttcga cgtgtggggc gccggaacca cagtgacagt gagctccgcc 420
tccaccaagg gaccaagcgt gttcccactg gcaccctcta gcaagtctac aagcggcggc 480
accgccgccc tgggatgtct ggtgaaggac tacttccccg agcctgtgac cgtgtcttgg 540
aacagcggcg ccctgacatc cggagtgcac acctttccag ccgtgctgca gtcctctggc 600
ctgtacagcc tgagctccgt ggtgacagtg ccctctagct ccctgggcac acagacctat 660
atctgcaacg tgaatcacaa gccctctaat accaaggtgg acaagaaggt ggagcctaag 720
agctgtgata agacacacac ctgcccaccc tgtccagcac cagagctgct gggcggccct 780
agcgtgttcc tgtttcctcc aaagccaaag gacaccctga tgatctccag aacacctgag 840
gtgacctgcg tggtggtgga cgtgtctcac gaggaccccg aggtgaagtt caactggtac 900
gtggatggcg tggaggtgca caatgccaag accaagcctc gggaggagca gtacaacagc 960
acatatagag tggtgtccgt gctgaccgtg ctgcaccagg attggctgaa cggcaaggag 1020
tataagtgca aggtgtccaa taaggccctg cctgccccaa tcgagaagac aatcagcaag 1080
gccaagggcc agcctaggga gccacaggtg tacaccctgc cccctagccg cgacgagctg 1140
acaaagaacc aggtgtccct gacctgtctg gtgaagggct tctatccatc tgatatcgcc 1200
gtggagtggg agagcaatgg ccagcccgag aacaattaca agaccacacc acccgtgctg 1260
gactccgatg gctctttctt tctgtattcc aagctgaccg tggacaagtc taggtggcag 1320
cagggcaacg tgttttcctg ttctgtgatg cacgaggccc tgcacaatca ctacacacag 1380
aagagcctgt ccctgtctcc aggcaagagg ggaaggaagc ggagaagcgg ctccggagca 1440
accaacttct ccctgctgaa gcaggcaggc gatgtggagg agaatccagg acctatggtg 1500
ctgcagaccc aggtgtttat ctctctgctg ctgtggatca gcggcgccta cggcgacatc 1560
cagatgacac agtctccaag caccctgtcc gcctctgtgg gcgatagggt gacaatcacc 1620
tgcaagtgtc agctgagcgt gggctacatg cactggtatc agcagaagcc cggcaaggcc 1680
cctaagctgc tgatctacga cacctctaag ctggcaagcg gagtgccctc ccgcttcagc 1740
ggctccggct ctggaacaga gtttacactg accatctcta gcctgcagcc cgacgatttc 1800
gccacctact attgctttca gggcagcggc tatcccttca ccttcggcgg cggcaccaag 1860
ctggagatca agcggacagt ggccgccccc agcgtgttca tctttcctcc atccgacgag 1920
cagctgaagt ctggcaccgc cagcgtggtg tgcctgctga acaatttcta ccctagagag 1980
gccaaggtgc agtggaaggt ggataacgcc ctgcagagcg gcaattccca ggagtctgtg 2040
acagagcagg acagcaagga ttccacctat tctctgtcct ctacactgac cctgtccaag 2100
gccgattacg agaagcacaa ggtgtatgcc tgcgaggtga cacaccaggg cctgagctcc 2160
cctgtgacca agagctttaa cagaggcgag tgttgataa 2199
<210> 111
<211> 731
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,基因优化的抗-RSV,pGX9368
<400> 111
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Thr Leu Arg Glu Ser Gly Pro Ala Leu Val Lys
20 25 30
Pro Thr Gln Thr Leu Thr Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu
35 40 45
Ser Thr Ser Gly Met Ser Val Gly Trp Ile Arg Gln Pro Pro Gly Lys
50 55 60
Ala Leu Glu Trp Leu Ala Asp Ile Trp Trp Asp Asp Lys Lys Asp Tyr
65 70 75 80
Asn Pro Ser Leu Lys Ser Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys
85 90 95
Asn Gln Val Val Leu Lys Val Thr Asn Met Asp Pro Ala Asp Thr Ala
100 105 110
Thr Tyr Tyr Cys Ala Arg Ser Met Ile Thr Asn Trp Tyr Phe Asp Val
115 120 125
Trp Gly Ala Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys Gly
130 135 140
Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly
145 150 155 160
Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val
165 170 175
Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe
180 185 190
Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val
195 200 205
Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val
210 215 220
Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys
225 230 235 240
Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu
245 250 255
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
260 265 270
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
275 280 285
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val
290 295 300
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser
305 310 315 320
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
325 330 335
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
340 345 350
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
355 360 365
Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln
370 375 380
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
385 390 395 400
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
405 410 415
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu
420 425 430
Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser
435 440 445
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
450 455 460
Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala
465 470 475 480
Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
485 490 495
Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp
500 505 510
Ile Ser Gly Ala Tyr Gly Asp Ile Gln Met Thr Gln Ser Pro Ser Thr
515 520 525
Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Cys Gln
530 535 540
Leu Ser Val Gly Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Lys Ala
545 550 555 560
Pro Lys Leu Leu Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro
565 570 575
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile
580 585 590
Ser Ser Leu Gln Pro Asp Asp Phe Ala Thr Tyr Tyr Cys Phe Gln Gly
595 600 605
Ser Gly Tyr Pro Phe Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
610 615 620
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
625 630 635 640
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
645 650 655
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
660 665 670
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
675 680 685
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
690 695 700
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
705 710 715 720
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210> 112
<211> 1485
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,scFv-Fc 抗-RSV,pGX9369
<400> 112
atggtgctgc agacccaggt gtttatttca ctgctgctgt ggatttcagg agcctacggg 60
gacattcaga tgacccagag cccttcaaca ctgtccgcca gcgtgggcga cagagtgaca 120
atcacctgta agtgccagct gagcgtgggc tatatgcact ggtatcagca gaagcctggc 180
aaggccccaa agctgctgat ctatgacacc agcaagctgg cctctggcgt gccatccaga 240
ttctccggct ctggcagcgg caccgagttt acactgacca tctccagcct gcagccagat 300
gacttcgcca cctactattg cttccagggc agcggctatc ccttcacctt tggcggcggc 360
acaaagctgg agatcaaggg cggcggcggc tccggcggcg gcggctctgg cggcggcggc 420
tctcaggtga ccctgagaga gtccggccca gccctggtga agccaaccca gaccctgaca 480
ctgacatgca ccttctccgg cttcagcctg tccaccagcg gcatgtccgt gggctggatc 540
aggcagcccc caggcaaggc cctggagtgg ctggccgata tctggtggga cgataagaag 600
gactacaacc cctccctgaa gagcagactg accatcagca aggataccag caagaaccag 660
gtggtgctga aggtgacaaa tatggaccca gccgataccg ccacatacta ctgtgccaga 720
tccatgatca caaattggta cttcgacgtg tggggcgccg gcacaaccgt gacagtgagc 780
tctgagccaa agtcctgcga caagacccac acctgtcctc cttgtccagc ccccgagctg 840
ctgggcggcc caagcgtgtt cctgtttccc cctaagccaa aggataccct gatgatctcc 900
agaaccccag aggtgacatg cgtggtggtg gacgtgagcc acgaggaccc cgaggtgaag 960
ttcaattggt acgtggatgg cgtggaggtg cacaatgcca agaccaagcc aagagaggag 1020
cagtataact ctacatatcg cgtggtgtcc gtgctgacag tgctgcacca ggactggctg 1080
aatggcaagg agtacaagtg caaggtgtcc aataaggccc tgccagcccc tatcgagaag 1140
acaatctcca aggccaaggg ccagcccaga gagccacagg tgtatacact gccaccctcc 1200
agagatgagc tgacaaagaa tcaggtgtcc ctgacatgtc tggtgaaggg cttttatccc 1260
tccgatatcg ccgtggagtg ggagtctaat ggccagcccg agaataacta taagacaacc 1320
cctccagtgc tggactccga tggctccttt ttcctgtatt ccaagctgac cgtggataag 1380
agcaggtggc agcagggcaa cgtgttctct tgttccgtga tgcacgaagc actgcacaac 1440
cactacaccc agaagtcact gtcactgtca ccaggaaaat gataa 1485
<210> 113
<211> 493
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,scFv-Fc 抗-RSV,pGX9369
<400> 113
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Asp Ile Gln Met Thr Gln Ser Pro Ser Thr Leu Ser
20 25 30
Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Cys Gln Leu Ser
35 40 45
Val Gly Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys
50 55 60
Leu Leu Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ser Arg
65 70 75 80
Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser
85 90 95
Leu Gln Pro Asp Asp Phe Ala Thr Tyr Tyr Cys Phe Gln Gly Ser Gly
100 105 110
Tyr Pro Phe Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Gly Gly
115 120 125
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Val Thr
130 135 140
Leu Arg Glu Ser Gly Pro Ala Leu Val Lys Pro Thr Gln Thr Leu Thr
145 150 155 160
Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu Ser Thr Ser Gly Met Ser
165 170 175
Val Gly Trp Ile Arg Gln Pro Pro Gly Lys Ala Leu Glu Trp Leu Ala
180 185 190
Asp Ile Trp Trp Asp Asp Lys Lys Asp Tyr Asn Pro Ser Leu Lys Ser
195 200 205
Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys Asn Gln Val Val Leu Lys
210 215 220
Val Thr Asn Met Asp Pro Ala Asp Thr Ala Thr Tyr Tyr Cys Ala Arg
225 230 235 240
Ser Met Ile Thr Asn Trp Tyr Phe Asp Val Trp Gly Ala Gly Thr Thr
245 250 255
Val Thr Val Ser Ser Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys
260 265 270
Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu
275 280 285
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
290 295 300
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys
305 310 315 320
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
325 330 335
Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu
340 345 350
Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
355 360 365
Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
370 375 380
Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
385 390 395 400
Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
405 410 415
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
420 425 430
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly
435 440 445
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
450 455 460
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
465 470 475 480
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
485 490
<210> 114
<211> 2199
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,基因优化的抗-RSV,pGX9370
<400> 114
atggactgga cctggagaat cctgttcctg gtggcagcag caaccggaac acacgcacag 60
gtgacactga gggagagcgg acctgccctg gtgaagccaa cccagacact gaccctgaca 120
tgcaccttct ctggcttttc cctgtctacc agcggcatga gcgtgggatg gatcaggcag 180
ccccctggca aggccctgga gtggctggcc gacatctggt gggacgataa gaaggattac 240
aacccctctc tgaagagccg cctgaccatc agcaaggata catccaagaa ccaggtggtg 300
ctgaaggtga ccaatatgga ccctgccgat acagccacct actattgtgc ccggagcatg 360
atcaccaatt ggtactttga cgtgtggggc gccggcacca cagtgacagt gagctccgcc 420
aagaccacag ccccttccgt gtatcctctg gccccagtgt gcggcgatac cacaggctct 480
agcgtgaccc tgggctgtct ggtgaagggc tacttcccag agcccgtgac actgacctgg 540
aactccggct ctctgtcctc tggcgtgcac acctttccag ccgtgctgca gagcgacctg 600
tacacactga gctcctctgt gacagtgacc agctccacct ggccaagcca gtccatcaca 660
tgcaacgtgg cccaccccgc ctctagcacc aaggtggata agaagatcga gcccagaggc 720
cctacaatca agccctgtcc accctgcaag tgtcctgccc caaatctgct gggcggccct 780
tccgtgttca tctttcctcc aaagatcaag gacgtgctga tgatctctct gagccctatc 840
gtgacctgcg tggtggtgga cgtgtccgag gacgatccag atgtgcagat ctcttggttc 900
gtgaacaatg tggaggtgca caccgcccag acacagaccc accgggagga ttataacagc 960
acactgagag tggtgtccgc cctgccaatc cagcaccagg actggatgag cggcaaggag 1020
tttaagtgca aggtgaacaa taaggatctg cccgccccta tcgagcggac catctccaag 1080
cccaagggct ctgtgagagc ccctcaggtg tacgtgctgc cccctccaga ggaggagatg 1140
accaagaagc aggtgacact gacctgtatg gtgacagact tcatgcctga ggatatctac 1200
gtggagtgga ccaacaatgg caagacagag ctgaactata agaataccga gccagtgctg 1260
gactccgatg gctcttactt tatgtatagc aagctgaggg tggagaagaa gaactgggtg 1320
gagcgcaatt cctattcttg tagcgtggtg cacgagggcc tgcacaatca ccacaccaca 1380
aagtccttct ctagaacccc aggcaagagg ggaaggaagc ggagaagcgg ctccggagcc 1440
acaaactttt ccctgctgaa gcaggcaggc gacgtggagg agaatccagg acccatggtg 1500
ctgcagaccc aggtgttcat ctctctgctg ctgtggatca gcggcgccta cggcgacatc 1560
cagatgaccc agtctcccag cacactgtcc gcctctgtgg gcgatcgggt gacaatcacc 1620
tgcaagtgtc agctgtccgt gggctacatg cactggtatc agcagaagcc aggcaaggcc 1680
cccaagctgc tgatctatga cacctctaag ctggccagcg gcgtgccttc cagattcagc 1740
ggctccggct ctggcaccga gtttacactg accatctcct ctctgcagcc agacgatttc 1800
gccacatact attgctttca gggcagcgga taccccttca ccttcggcgg cggcacaaag 1860
ctggagatca agagggccga tgccgcccca accgtgtcca tcttccctcc cagcagcgag 1920
cagctgacat ctggcggcgc cagcgtggtg tgcttcctga acaacttcta ccccaaggac 1980
atcaacgtga agtggaagat cgatggcagc gagcgccaga acggcgtgct gaattcctgg 2040
accgaccagg atagcaagga ctccacatac tctatgtcta gcacactgac cctgacaaag 2100
gatgagtacg agcggcacaa ttcctatacc tgcgaggcca cacacaagac cagcacatcc 2160
cctatcgtga agtcttttaa cagaaatgag tgttgataa 2199
<210> 115
<211> 731
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,基因优化的抗-RSV,pGX9370
<400> 115
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Thr Leu Arg Glu Ser Gly Pro Ala Leu Val Lys
20 25 30
Pro Thr Gln Thr Leu Thr Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu
35 40 45
Ser Thr Ser Gly Met Ser Val Gly Trp Ile Arg Gln Pro Pro Gly Lys
50 55 60
Ala Leu Glu Trp Leu Ala Asp Ile Trp Trp Asp Asp Lys Lys Asp Tyr
65 70 75 80
Asn Pro Ser Leu Lys Ser Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys
85 90 95
Asn Gln Val Val Leu Lys Val Thr Asn Met Asp Pro Ala Asp Thr Ala
100 105 110
Thr Tyr Tyr Cys Ala Arg Ser Met Ile Thr Asn Trp Tyr Phe Asp Val
115 120 125
Trp Gly Ala Gly Thr Thr Val Thr Val Ser Ser Ala Lys Thr Thr Ala
130 135 140
Pro Ser Val Tyr Pro Leu Ala Pro Val Cys Gly Asp Thr Thr Gly Ser
145 150 155 160
Ser Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Phe Pro Glu Pro Val
165 170 175
Thr Leu Thr Trp Asn Ser Gly Ser Leu Ser Ser Gly Val His Thr Phe
180 185 190
Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu Ser Ser Ser Val Thr
195 200 205
Val Thr Ser Ser Thr Trp Pro Ser Gln Ser Ile Thr Cys Asn Val Ala
210 215 220
His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys Ile Glu Pro Arg Gly
225 230 235 240
Pro Thr Ile Lys Pro Cys Pro Pro Cys Lys Cys Pro Ala Pro Asn Leu
245 250 255
Leu Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys Ile Lys Asp Val
260 265 270
Leu Met Ile Ser Leu Ser Pro Ile Val Thr Cys Val Val Val Asp Val
275 280 285
Ser Glu Asp Asp Pro Asp Val Gln Ile Ser Trp Phe Val Asn Asn Val
290 295 300
Glu Val His Thr Ala Gln Thr Gln Thr His Arg Glu Asp Tyr Asn Ser
305 310 315 320
Thr Leu Arg Val Val Ser Ala Leu Pro Ile Gln His Gln Asp Trp Met
325 330 335
Ser Gly Lys Glu Phe Lys Cys Lys Val Asn Asn Lys Asp Leu Pro Ala
340 345 350
Pro Ile Glu Arg Thr Ile Ser Lys Pro Lys Gly Ser Val Arg Ala Pro
355 360 365
Gln Val Tyr Val Leu Pro Pro Pro Glu Glu Glu Met Thr Lys Lys Gln
370 375 380
Val Thr Leu Thr Cys Met Val Thr Asp Phe Met Pro Glu Asp Ile Tyr
385 390 395 400
Val Glu Trp Thr Asn Asn Gly Lys Thr Glu Leu Asn Tyr Lys Asn Thr
405 410 415
Glu Pro Val Leu Asp Ser Asp Gly Ser Tyr Phe Met Tyr Ser Lys Leu
420 425 430
Arg Val Glu Lys Lys Asn Trp Val Glu Arg Asn Ser Tyr Ser Cys Ser
435 440 445
Val Val His Glu Gly Leu His Asn His His Thr Thr Lys Ser Phe Ser
450 455 460
Arg Thr Pro Gly Lys Arg Gly Arg Lys Arg Arg Ser Gly Ser Gly Ala
465 470 475 480
Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
485 490 495
Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp
500 505 510
Ile Ser Gly Ala Tyr Gly Asp Ile Gln Met Thr Gln Ser Pro Ser Thr
515 520 525
Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Cys Gln
530 535 540
Leu Ser Val Gly Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Lys Ala
545 550 555 560
Pro Lys Leu Leu Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro
565 570 575
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile
580 585 590
Ser Ser Leu Gln Pro Asp Asp Phe Ala Thr Tyr Tyr Cys Phe Gln Gly
595 600 605
Ser Gly Tyr Pro Phe Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
610 615 620
Arg Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro Pro Ser Ser Glu
625 630 635 640
Gln Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe Leu Asn Asn Phe
645 650 655
Tyr Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp Gly Ser Glu Arg
660 665 670
Gln Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp Ser Lys Asp Ser
675 680 685
Thr Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys Asp Glu Tyr Glu
690 695 700
Arg His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys Thr Ser Thr Ser
705 710 715 720
Pro Ile Val Lys Ser Phe Asn Arg Asn Glu Cys
725 730
<210> 116
<211> 1488
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,scFv-Fc 抗-RSV,pGX9371
<400> 116
atggtgctgc agactcaggt gtttatttca ctgctgctgt ggatttccgg cgcttacggc 60
gacattcaga tgacccagag cccctccaca ctgagcgcct ccgtgggcga cagagtgaca 120
atcacatgca agtgtcagct gtctgtgggc tatatgcact ggtatcagca gaagcccggc 180
aaggccccaa agctgctgat ctatgacacc tctaagctgg cctctggcgt gccaagcaga 240
ttctccggca gcggctccgg caccgagttc accctgacaa tctcctctct gcagccagac 300
gatttcgcca catactactg ctttcagggc tccggctacc cattcacatt tggcggcggc 360
acaaagctgg agatcaaggg cggcggcggc tccggcggcg gcggctctgg cggcggcggc 420
tctcaggtga cactgcggga gtccggccca gccctggtga agccaaccca gacactgaca 480
ctgacctgta cattttccgg cttctctctg tccaccagcg gcatgagcgt gggctggatc 540
agacagcccc ctggcaaggc cctggagtgg ctggccgata tctggtggga cgataagaag 600
gactacaatc cttccctgaa gtctagactg accatctcca aggatacctc caagaatcag 660
gtggtgctga aggtgaccaa catggaccct gccgatacag ccacctatta ctgcgccaga 720
agcatgatca ccaactggta ctttgacgtg tggggcgccg gcacaaccgt gacagtgtct 780
tccgagccta gaggcccaac catcaagcca tgcccaccct gtaagtgtcc cgccccaaac 840
ctgctgggcg gcccatccgt gttcatcttt ccccctaaga tcaaggacgt gctgatgatc 900
agcctgagcc caatcgtgac atgcgtggtg gtggacgtgt ccgaggatga cccagatgtg 960
cagatctctt ggttcgtgaa taacgtggag gtgcacaccg cccagaccca gacccacaga 1020
gaggattaca attccacact gagagtggtg tccgccctgc ctatccagca ccaggattgg 1080
atgagcggca aggagtttaa gtgcaaggtg aacaataagg acctgcccgc cccaatcgag 1140
agaaccatct ccaagccaaa gggctctgtg agggccccac aggtgtacgt gctgcctcct 1200
ccagaggagg agatgacaaa gaagcaggtg acactgacct gcatggtgac cgacttcatg 1260
cccgaggaca tctacgtgga gtggacaaac aatggcaaga cagagctgaa ctataagaac 1320
accgagccag tgctggattc cgacggctct tacttcatgt actccaagct gagagtggag 1380
aagaagaact gggtggagcg gaatagctac tcctgttccg tggtccacga agggctgcat 1440
aaccaccaca ccactaagtc attttcaaga accccaggca aatgataa 1488
<210> 117
<211> 494
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,scFv-Fc 抗-RSV,pGX9371
<400> 117
Met Val Leu Gln Thr Gln Val Phe Ile Ser Leu Leu Leu Trp Ile Ser
1 5 10 15
Gly Ala Tyr Gly Asp Ile Gln Met Thr Gln Ser Pro Ser Thr Leu Ser
20 25 30
Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Cys Gln Leu Ser
35 40 45
Val Gly Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys
50 55 60
Leu Leu Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ser Arg
65 70 75 80
Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser
85 90 95
Leu Gln Pro Asp Asp Phe Ala Thr Tyr Tyr Cys Phe Gln Gly Ser Gly
100 105 110
Tyr Pro Phe Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Gly Gly
115 120 125
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Val Thr
130 135 140
Leu Arg Glu Ser Gly Pro Ala Leu Val Lys Pro Thr Gln Thr Leu Thr
145 150 155 160
Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu Ser Thr Ser Gly Met Ser
165 170 175
Val Gly Trp Ile Arg Gln Pro Pro Gly Lys Ala Leu Glu Trp Leu Ala
180 185 190
Asp Ile Trp Trp Asp Asp Lys Lys Asp Tyr Asn Pro Ser Leu Lys Ser
195 200 205
Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys Asn Gln Val Val Leu Lys
210 215 220
Val Thr Asn Met Asp Pro Ala Asp Thr Ala Thr Tyr Tyr Cys Ala Arg
225 230 235 240
Ser Met Ile Thr Asn Trp Tyr Phe Asp Val Trp Gly Ala Gly Thr Thr
245 250 255
Val Thr Val Ser Ser Glu Pro Arg Gly Pro Thr Ile Lys Pro Cys Pro
260 265 270
Pro Cys Lys Cys Pro Ala Pro Asn Leu Leu Gly Gly Pro Ser Val Phe
275 280 285
Ile Phe Pro Pro Lys Ile Lys Asp Val Leu Met Ile Ser Leu Ser Pro
290 295 300
Ile Val Thr Cys Val Val Val Asp Val Ser Glu Asp Asp Pro Asp Val
305 310 315 320
Gln Ile Ser Trp Phe Val Asn Asn Val Glu Val His Thr Ala Gln Thr
325 330 335
Gln Thr His Arg Glu Asp Tyr Asn Ser Thr Leu Arg Val Val Ser Ala
340 345 350
Leu Pro Ile Gln His Gln Asp Trp Met Ser Gly Lys Glu Phe Lys Cys
355 360 365
Lys Val Asn Asn Lys Asp Leu Pro Ala Pro Ile Glu Arg Thr Ile Ser
370 375 380
Lys Pro Lys Gly Ser Val Arg Ala Pro Gln Val Tyr Val Leu Pro Pro
385 390 395 400
Pro Glu Glu Glu Met Thr Lys Lys Gln Val Thr Leu Thr Cys Met Val
405 410 415
Thr Asp Phe Met Pro Glu Asp Ile Tyr Val Glu Trp Thr Asn Asn Gly
420 425 430
Lys Thr Glu Leu Asn Tyr Lys Asn Thr Glu Pro Val Leu Asp Ser Asp
435 440 445
Gly Ser Tyr Phe Met Tyr Ser Lys Leu Arg Val Glu Lys Lys Asn Trp
450 455 460
Val Glu Arg Asn Ser Tyr Ser Cys Ser Val Val His Glu Gly Leu His
465 470 475 480
Asn His His Thr Thr Lys Ser Phe Ser Arg Thr Pro Gly Lys
485 490
<210> 118
<211> 2220
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,基因优化的抗-RSV,pGX9283
<400> 118
atggactgga cttggagaat cctgttcctg gtcgccgccg caactgggac tcatgctcag 60
gtgcagctgg tgcagagcgg ggcagaggtg aagaagccag gcagctccgt gaaggtgtct 120
tgcaaggcaa gcggcggctc tctgagcacc tacggcatcc actgggtgag gcaggcacca 180
ggacagggcc tggagtgggt gggcggcgtg atgaccgtgt acggcaagac cacatatggc 240
cagaacttcc agggcagggt gacaatcgcc gtggaccgct ctaccaatac agcctacatg 300
gagctgtcta gcctgaccag cgacgatacc ggcacatact attgcgccac cgactcttac 360
tacgtgtgga caggcagcta tccccctcca ttcgatctgt ggggccaggg caccctggtg 420
acagtgtcct ctgcctctac aaagggacca agcgtgtttc cactggcacc tagctccaag 480
tccacctctg gcggcacagc cgccctgggc tgtctggtga aggattactt ccctgagcca 540
gtgaccgtgt cctggaactc tggcgccctg accagcggag tgcacacatt tcccgccgtg 600
ctgcagtcta gcggcctgta ctccctgtcc tctgtggtga ccgtgcctag ctcctctctg 660
ggcacccaga catatatctg caacgtgaat cacaagccta gcaatacaaa ggtggacaag 720
aaggtggagc caaagtcctg tgataagacc cacacatgcc ctccctgtcc agcacctgag 780
ctgctgggcg gcccaagcgt gttcctgttt ccacccaagc ccaaggacac cctgatgatc 840
tccagaaccc cagaggtgac atgcgtggtg gtggacgtgt ctcacgagga ccccgaggtg 900
aagtttaact ggtacgtgga tggcgtggag gtgcacaatg ccaagaccaa gccccgggag 960
gagcagtaca actccaccta tagagtggtg tctgtgctga cagtgctgca ccaggactgg 1020
ctgaacggca aggagtataa gtgcaaggtg agcaataagg ccctgccagc ccccatcgag 1080
aagaccatct ccaaggcaaa gggacagcca agggagccac aggtgtacac actgcctcca 1140
tcccgcgacg agctgaccaa gaaccaggtg tctctgacat gtctggtgaa gggcttctat 1200
ccctctgata tcgccgtgga gtgggagagc aatggccagc ctgagaacaa ttacaagacc 1260
acaccccctg tgctggacag cgatggctcc ttctttctgt attccaagct gaccgtggac 1320
aagtctcggt ggcagcaggg caacgtgttt agctgctccg tgatgcacga ggccctgcac 1380
aatcactaca cccagaagtc tctgagcctg tccccaggca agaggggaag aaagcggaga 1440
tctggcagcg gcgccacaaa cttcagcctg ctgaagcagg ccggcgatgt ggaggagaat 1500
cctggcccaa tggtgctgca gacccaggtg tttatcagcc tgctgctgtg gatctccgga 1560
gcatacggag agatcgtgct gacccagaca ccaggaaccc agtccctgtc tcctggacag 1620
tccgccacac tgtcttgtag agccagccac tccgtgggca atgactacct ggcctggtat 1680
cagcagaagc ctggacagag cccacggctg ctgatccacg gagcatacag gagggactcc 1740
ggcatccctg atagattcat cggctctggc agcggcaccg actttaccct gacaatcgat 1800
agcctggagc ctgacgattg cgccgtgtac tattgtcagc agtatggctc ctggccactg 1860
accttcggcg gcggcacaaa ggtggacatc aagaggaccg tggccgcccc tagcgtgttc 1920
atctttccac cctccgatga gcagctgaag agcggcacag cctccgtggt gtgcctgctg 1980
aacaacttct acccacgcga ggccaaggtg cagtggaagg tggacaacgc cctgcagtct 2040
ggcaatagcc aggagtccgt gaccgagcag gactctaagg atagcacata ttccctgagc 2100
tccaccctga cactgtccaa ggccgattac gagaagcaca aggtgtatgc ctgtgaggtc 2160
acccaccagg gactgtcttc acccgtcaca aaatccttca ataggggaga atgctgataa 2220
<210> 119
<211> 738
<212> PRT
<213> 人工序列
<220>
<223> 化学合成,基因优化的抗-RSV,pGX9283
<400> 119
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 15
Thr His Ala Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Ser Leu
35 40 45
Ser Thr Tyr Gly Ile His Trp Val Arg Gln Ala Pro Gly Gln Gly Leu
50 55 60
Glu Trp Val Gly Gly Val Met Thr Val Tyr Gly Lys Thr Thr Tyr Gly
65 70 75 80
Gln Asn Phe Gln Gly Arg Val Thr Ile Ala Val Asp Arg Ser Thr Asn
85 90 95
Thr Ala Tyr Met Glu Leu Ser Ser Leu Thr Ser Asp Asp Thr Gly Thr
100 105 110
Tyr Tyr Cys Ala Thr Asp Ser Tyr Tyr Val Trp Thr Gly Ser Tyr Pro
115 120 125
Pro Pro Phe Asp Leu Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser
130 135 140
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
145 150 155 160
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
165 170 175
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
180 185 190
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
195 200 205
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
210 215 220
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
225 230 235 240
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
245 250 255
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
260 265 270
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
275 280 285
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
290 295 300
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
305 310 315 320
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
325 330 335
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
340 345 350
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
355 360 365
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
370 375 380
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
385 390 395 400
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
405 410 415
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
420 425 430
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
435 440 445
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
450 455 460
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Arg Gly Arg Lys Arg Arg
465 470 475 480
Ser Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
485 490 495
Val Glu Glu Asn Pro Gly Pro Met Val Leu Gln Thr Gln Val Phe Ile
500 505 510
Ser Leu Leu Leu Trp Ile Ser Gly Ala Tyr Gly Glu Ile Val Leu Thr
515 520 525
Gln Thr Pro Gly Thr Gln Ser Leu Ser Pro Gly Gln Ser Ala Thr Leu
530 535 540
Ser Cys Arg Ala Ser His Ser Val Gly Asn Asp Tyr Leu Ala Trp Tyr
545 550 555 560
Gln Gln Lys Pro Gly Gln Ser Pro Arg Leu Leu Ile His Gly Ala Tyr
565 570 575
Arg Arg Asp Ser Gly Ile Pro Asp Arg Phe Ile Gly Ser Gly Ser Gly
580 585 590
Thr Asp Phe Thr Leu Thr Ile Asp Ser Leu Glu Pro Asp Asp Cys Ala
595 600 605
Val Tyr Tyr Cys Gln Gln Tyr Gly Ser Trp Pro Leu Thr Phe Gly Gly
610 615 620
Gly Thr Lys Val Asp Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe
625 630 635 640
Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val
645 650 655
Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp
660 665 670
Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr
675 680 685
Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr
690 695 700
Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val
705 710 715 720
Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly
725 730 735
Glu Cys
<210> 120
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 化学合成
<400> 120
Ala Met Glu Lys Ile Val Ile Leu
1 5
<210> 121
<211> 5153
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9368完整的质粒序列
<400> 121
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagcttggt 720
accgagctcg gatccgccac catggactgg acatggagaa tcctgttcct ggtggcagca 780
gcaaccggaa cacacgcaca ggtgaccctg agagagtccg gaccagccct ggtgaagcca 840
acccagacac tgaccctgac atgcaccttc tccggctttt ctctgagcac ctccggcatg 900
tctgtgggat ggatcaggca gccccctggc aaggccctgg agtggctggc cgacatctgg 960
tgggacgata agaaggatta caaccctagc ctgaagtccc gcctgacaat cagcaaggac 1020
acctccaaga accaggtggt gctgaaggtg acaaatatgg acccagccga tacagccacc 1080
tactattgcg cccggagcat gatcaccaat tggtatttcg acgtgtgggg cgccggaacc 1140
acagtgacag tgagctccgc ctccaccaag ggaccaagcg tgttcccact ggcaccctct 1200
agcaagtcta caagcggcgg caccgccgcc ctgggatgtc tggtgaagga ctacttcccc 1260
gagcctgtga ccgtgtcttg gaacagcggc gccctgacat ccggagtgca cacctttcca 1320
gccgtgctgc agtcctctgg cctgtacagc ctgagctccg tggtgacagt gccctctagc 1380
tccctgggca cacagaccta tatctgcaac gtgaatcaca agccctctaa taccaaggtg 1440
gacaagaagg tggagcctaa gagctgtgat aagacacaca cctgcccacc ctgtccagca 1500
ccagagctgc tgggcggccc tagcgtgttc ctgtttcctc caaagccaaa ggacaccctg 1560
atgatctcca gaacacctga ggtgacctgc gtggtggtgg acgtgtctca cgaggacccc 1620
gaggtgaagt tcaactggta cgtggatggc gtggaggtgc acaatgccaa gaccaagcct 1680
cgggaggagc agtacaacag cacatataga gtggtgtccg tgctgaccgt gctgcaccag 1740
gattggctga acggcaagga gtataagtgc aaggtgtcca ataaggccct gcctgcccca 1800
atcgagaaga caatcagcaa ggccaagggc cagcctaggg agccacaggt gtacaccctg 1860
ccccctagcc gcgacgagct gacaaagaac caggtgtccc tgacctgtct ggtgaagggc 1920
ttctatccat ctgatatcgc cgtggagtgg gagagcaatg gccagcccga gaacaattac 1980
aagaccacac cacccgtgct ggactccgat ggctctttct ttctgtattc caagctgacc 2040
gtggacaagt ctaggtggca gcagggcaac gtgttttcct gttctgtgat gcacgaggcc 2100
ctgcacaatc actacacaca gaagagcctg tccctgtctc caggcaagag gggaaggaag 2160
cggagaagcg gctccggagc aaccaacttc tccctgctga agcaggcagg cgatgtggag 2220
gagaatccag gacctatggt gctgcagacc caggtgttta tctctctgct gctgtggatc 2280
agcggcgcct acggcgacat ccagatgaca cagtctccaa gcaccctgtc cgcctctgtg 2340
ggcgataggg tgacaatcac ctgcaagtgt cagctgagcg tgggctacat gcactggtat 2400
cagcagaagc ccggcaaggc ccctaagctg ctgatctacg acacctctaa gctggcaagc 2460
ggagtgccct cccgcttcag cggctccggc tctggaacag agtttacact gaccatctct 2520
agcctgcagc ccgacgattt cgccacctac tattgctttc agggcagcgg ctatcccttc 2580
accttcggcg gcggcaccaa gctggagatc aagcggacag tggccgcccc cagcgtgttc 2640
atctttcctc catccgacga gcagctgaag tctggcaccg ccagcgtggt gtgcctgctg 2700
aacaatttct accctagaga ggccaaggtg cagtggaagg tggataacgc cctgcagagc 2760
ggcaattccc aggagtctgt gacagagcag gacagcaagg attccaccta ttctctgtcc 2820
tctacactga ccctgtccaa ggccgattac gagaagcaca aggtgtatgc ctgcgaggtg 2880
acacaccagg gcctgagctc ccctgtgacc aagagcttta acagaggcga gtgttgataa 2940
ctcgagtcta gagggcccgt ttaaacccgc tgatcagcct cgactgtgcc ttctagttgc 3000
cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 3060
actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 3120
attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 3180
catgctgggg atgcggtggg ctctatggct tctactgggc ggttttatgg acagcaagcg 3240
aaccggaatt gccagctggg gcgccctctg gtaaggttgg gaagccctgc aaagtaaact 3300
ggatggcttt cttgccgcca aggatctgat ggcgcagggg atcaagctct gatcaagaga 3360
caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg 3420
cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 3480
ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 3540
ccggtgccct gaatgaactg caagacgagg cagcgcggct atcgtggctg gccacgacgg 3600
gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 3660
tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 3720
ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 3780
accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 3840
atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 3900
tcaaggcgag catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc 3960
cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg 4020
tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 4080
gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 4140
tcgccttcta tcgccttctt gacgagttct tctgaattat taacgcttac aatttcctga 4200
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatcagg tggcactttt 4260
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 4320
ccgctcatga gacaataacc ctgataaatg cttcaataat agcacgtgct aaaacttcat 4380
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 4440
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 4500
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 4560
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 4620
agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc 4680
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 4740
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 4800
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 4860
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 4920
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 4980
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 5040
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 5100
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctt 5153
<210> 122
<211> 4439
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9369完整的质粒序列
<400> 122
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagcttggt 720
accgagctcg gatccgccac catggtgctg cagacccagg tgtttatttc actgctgctg 780
tggatttcag gagcctacgg ggacattcag atgacccaga gcccttcaac actgtccgcc 840
agcgtgggcg acagagtgac aatcacctgt aagtgccagc tgagcgtggg ctatatgcac 900
tggtatcagc agaagcctgg caaggcccca aagctgctga tctatgacac cagcaagctg 960
gcctctggcg tgccatccag attctccggc tctggcagcg gcaccgagtt tacactgacc 1020
atctccagcc tgcagccaga tgacttcgcc acctactatt gcttccaggg cagcggctat 1080
cccttcacct ttggcggcgg cacaaagctg gagatcaagg gcggcggcgg ctccggcggc 1140
ggcggctctg gcggcggcgg ctctcaggtg accctgagag agtccggccc agccctggtg 1200
aagccaaccc agaccctgac actgacatgc accttctccg gcttcagcct gtccaccagc 1260
ggcatgtccg tgggctggat caggcagccc ccaggcaagg ccctggagtg gctggccgat 1320
atctggtggg acgataagaa ggactacaac ccctccctga agagcagact gaccatcagc 1380
aaggatacca gcaagaacca ggtggtgctg aaggtgacaa atatggaccc agccgatacc 1440
gccacatact actgtgccag atccatgatc acaaattggt acttcgacgt gtggggcgcc 1500
ggcacaaccg tgacagtgag ctctgagcca aagtcctgcg acaagaccca cacctgtcct 1560
ccttgtccag cccccgagct gctgggcggc ccaagcgtgt tcctgtttcc ccctaagcca 1620
aaggataccc tgatgatctc cagaacccca gaggtgacat gcgtggtggt ggacgtgagc 1680
cacgaggacc ccgaggtgaa gttcaattgg tacgtggatg gcgtggaggt gcacaatgcc 1740
aagaccaagc caagagagga gcagtataac tctacatatc gcgtggtgtc cgtgctgaca 1800
gtgctgcacc aggactggct gaatggcaag gagtacaagt gcaaggtgtc caataaggcc 1860
ctgccagccc ctatcgagaa gacaatctcc aaggccaagg gccagcccag agagccacag 1920
gtgtatacac tgccaccctc cagagatgag ctgacaaaga atcaggtgtc cctgacatgt 1980
ctggtgaagg gcttttatcc ctccgatatc gccgtggagt gggagtctaa tggccagccc 2040
gagaataact ataagacaac ccctccagtg ctggactccg atggctcctt tttcctgtat 2100
tccaagctga ccgtggataa gagcaggtgg cagcagggca acgtgttctc ttgttccgtg 2160
atgcacgaag cactgcacaa ccactacacc cagaagtcac tgtcactgtc accaggaaaa 2220
tgataactcg agtctagagg gcccgtttaa acccgctgat cagcctcgac tgtgccttct 2280
agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 2340
actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 2400
cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 2460
agcaggcatg ctggggatgc ggtgggctct atggcttcta ctgggcggtt ttatggacag 2520
caagcgaacc ggaattgcca gctggggcgc cctctggtaa ggttgggaag ccctgcaaag 2580
taaactggat ggctttcttg ccgccaagga tctgatggcg caggggatca agctctgatc 2640
aagagacagg atgaggatcg tttcgcatga ttgaacaaga tggattgcac gcaggttctc 2700
cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 2760
ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg 2820
acctgtccgg tgccctgaat gaactgcaag acgaggcagc gcggctatcg tggctggcca 2880
cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc 2940
tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga 3000
aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc 3060
cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc 3120
ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg 3180
ccaggctcaa ggcgagcatg cccgacggcg aggatctcgt cgtgacccat ggcgatgcct 3240
gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc 3300
tgggtgtggc ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc 3360
ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc 3420
agcgcatcgc cttctatcgc cttcttgacg agttcttctg aattattaac gcttacaatt 3480
tcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atcaggtggc 3540
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 3600
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatagca cgtgctaaaa 3660
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 3720
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 3780
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 3840
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 3900
ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta gttaggccac 3960
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 4020
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 4080
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 4140
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 4200
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 4260
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 4320
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 4380
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttctt 4439
<210> 123
<211> 5153
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9370完整的质粒序列
<400> 123
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagcttggt 720
accgagctcg gatccgccac catggactgg acctggagaa tcctgttcct ggtggcagca 780
gcaaccggaa cacacgcaca ggtgacactg agggagagcg gacctgccct ggtgaagcca 840
acccagacac tgaccctgac atgcaccttc tctggctttt ccctgtctac cagcggcatg 900
agcgtgggat ggatcaggca gccccctggc aaggccctgg agtggctggc cgacatctgg 960
tgggacgata agaaggatta caacccctct ctgaagagcc gcctgaccat cagcaaggat 1020
acatccaaga accaggtggt gctgaaggtg accaatatgg accctgccga tacagccacc 1080
tactattgtg cccggagcat gatcaccaat tggtactttg acgtgtgggg cgccggcacc 1140
acagtgacag tgagctccgc caagaccaca gccccttccg tgtatcctct ggccccagtg 1200
tgcggcgata ccacaggctc tagcgtgacc ctgggctgtc tggtgaaggg ctacttccca 1260
gagcccgtga cactgacctg gaactccggc tctctgtcct ctggcgtgca cacctttcca 1320
gccgtgctgc agagcgacct gtacacactg agctcctctg tgacagtgac cagctccacc 1380
tggccaagcc agtccatcac atgcaacgtg gcccaccccg cctctagcac caaggtggat 1440
aagaagatcg agcccagagg ccctacaatc aagccctgtc caccctgcaa gtgtcctgcc 1500
ccaaatctgc tgggcggccc ttccgtgttc atctttcctc caaagatcaa ggacgtgctg 1560
atgatctctc tgagccctat cgtgacctgc gtggtggtgg acgtgtccga ggacgatcca 1620
gatgtgcaga tctcttggtt cgtgaacaat gtggaggtgc acaccgccca gacacagacc 1680
caccgggagg attataacag cacactgaga gtggtgtccg ccctgccaat ccagcaccag 1740
gactggatga gcggcaagga gtttaagtgc aaggtgaaca ataaggatct gcccgcccct 1800
atcgagcgga ccatctccaa gcccaagggc tctgtgagag cccctcaggt gtacgtgctg 1860
ccccctccag aggaggagat gaccaagaag caggtgacac tgacctgtat ggtgacagac 1920
ttcatgcctg aggatatcta cgtggagtgg accaacaatg gcaagacaga gctgaactat 1980
aagaataccg agccagtgct ggactccgat ggctcttact ttatgtatag caagctgagg 2040
gtggagaaga agaactgggt ggagcgcaat tcctattctt gtagcgtggt gcacgagggc 2100
ctgcacaatc accacaccac aaagtccttc tctagaaccc caggcaagag gggaaggaag 2160
cggagaagcg gctccggagc cacaaacttt tccctgctga agcaggcagg cgacgtggag 2220
gagaatccag gacccatggt gctgcagacc caggtgttca tctctctgct gctgtggatc 2280
agcggcgcct acggcgacat ccagatgacc cagtctccca gcacactgtc cgcctctgtg 2340
ggcgatcggg tgacaatcac ctgcaagtgt cagctgtccg tgggctacat gcactggtat 2400
cagcagaagc caggcaaggc ccccaagctg ctgatctatg acacctctaa gctggccagc 2460
ggcgtgcctt ccagattcag cggctccggc tctggcaccg agtttacact gaccatctcc 2520
tctctgcagc cagacgattt cgccacatac tattgctttc agggcagcgg ataccccttc 2580
accttcggcg gcggcacaaa gctggagatc aagagggccg atgccgcccc aaccgtgtcc 2640
atcttccctc ccagcagcga gcagctgaca tctggcggcg ccagcgtggt gtgcttcctg 2700
aacaacttct accccaagga catcaacgtg aagtggaaga tcgatggcag cgagcgccag 2760
aacggcgtgc tgaattcctg gaccgaccag gatagcaagg actccacata ctctatgtct 2820
agcacactga ccctgacaaa ggatgagtac gagcggcaca attcctatac ctgcgaggcc 2880
acacacaaga ccagcacatc ccctatcgtg aagtctttta acagaaatga gtgttgataa 2940
ctcgagtcta gagggcccgt ttaaacccgc tgatcagcct cgactgtgcc ttctagttgc 3000
cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 3060
actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 3120
attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 3180
catgctgggg atgcggtggg ctctatggct tctactgggc ggttttatgg acagcaagcg 3240
aaccggaatt gccagctggg gcgccctctg gtaaggttgg gaagccctgc aaagtaaact 3300
ggatggcttt cttgccgcca aggatctgat ggcgcagggg atcaagctct gatcaagaga 3360
caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg 3420
cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg 3480
ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt 3540
ccggtgccct gaatgaactg caagacgagg cagcgcggct atcgtggctg gccacgacgg 3600
gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat 3660
tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 3720
ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 3780
accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 3840
atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 3900
tcaaggcgag catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc 3960
cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg 4020
tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 4080
gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 4140
tcgccttcta tcgccttctt gacgagttct tctgaattat taacgcttac aatttcctga 4200
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatcagg tggcactttt 4260
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 4320
ccgctcatga gacaataacc ctgataaatg cttcaataat agcacgtgct aaaacttcat 4380
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 4440
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 4500
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 4560
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 4620
agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc 4680
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 4740
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 4800
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 4860
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 4920
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 4980
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 5040
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 5100
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctt 5153
<210> 124
<211> 4442
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX371完整的质粒序列
<400> 124
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagcttggt 720
accgagctcg gatccgccac catggtgctg cagactcagg tgtttatttc actgctgctg 780
tggatttccg gcgcttacgg cgacattcag atgacccaga gcccctccac actgagcgcc 840
tccgtgggcg acagagtgac aatcacatgc aagtgtcagc tgtctgtggg ctatatgcac 900
tggtatcagc agaagcccgg caaggcccca aagctgctga tctatgacac ctctaagctg 960
gcctctggcg tgccaagcag attctccggc agcggctccg gcaccgagtt caccctgaca 1020
atctcctctc tgcagccaga cgatttcgcc acatactact gctttcaggg ctccggctac 1080
ccattcacat ttggcggcgg cacaaagctg gagatcaagg gcggcggcgg ctccggcggc 1140
ggcggctctg gcggcggcgg ctctcaggtg acactgcggg agtccggccc agccctggtg 1200
aagccaaccc agacactgac actgacctgt acattttccg gcttctctct gtccaccagc 1260
ggcatgagcg tgggctggat cagacagccc cctggcaagg ccctggagtg gctggccgat 1320
atctggtggg acgataagaa ggactacaat ccttccctga agtctagact gaccatctcc 1380
aaggatacct ccaagaatca ggtggtgctg aaggtgacca acatggaccc tgccgataca 1440
gccacctatt actgcgccag aagcatgatc accaactggt actttgacgt gtggggcgcc 1500
ggcacaaccg tgacagtgtc ttccgagcct agaggcccaa ccatcaagcc atgcccaccc 1560
tgtaagtgtc ccgccccaaa cctgctgggc ggcccatccg tgttcatctt tccccctaag 1620
atcaaggacg tgctgatgat cagcctgagc ccaatcgtga catgcgtggt ggtggacgtg 1680
tccgaggatg acccagatgt gcagatctct tggttcgtga ataacgtgga ggtgcacacc 1740
gcccagaccc agacccacag agaggattac aattccacac tgagagtggt gtccgccctg 1800
cctatccagc accaggattg gatgagcggc aaggagttta agtgcaaggt gaacaataag 1860
gacctgcccg ccccaatcga gagaaccatc tccaagccaa agggctctgt gagggcccca 1920
caggtgtacg tgctgcctcc tccagaggag gagatgacaa agaagcaggt gacactgacc 1980
tgcatggtga ccgacttcat gcccgaggac atctacgtgg agtggacaaa caatggcaag 2040
acagagctga actataagaa caccgagcca gtgctggatt ccgacggctc ttacttcatg 2100
tactccaagc tgagagtgga gaagaagaac tgggtggagc ggaatagcta ctcctgttcc 2160
gtggtccacg aagggctgca taaccaccac accactaagt cattttcaag aaccccaggc 2220
aaatgataac tcgagtctag agggcccgtt taaacccgct gatcagcctc gactgtgcct 2280
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 2340
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 2400
tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 2460
aatagcaggc atgctgggga tgcggtgggc tctatggctt ctactgggcg gttttatgga 2520
cagcaagcga accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca 2580
aagtaaactg gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagctctg 2640
atcaagagac aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggtt 2700
ctccggccgc ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcggct 2760
gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga 2820
ccgacctgtc cggtgccctg aatgaactgc aagacgaggc agcgcggcta tcgtggctgg 2880
ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact 2940
ggctgctatt gggcgaagtg ccggggcagg atctcctgtc atctcacctt gctcctgccg 3000
agaaagtatc catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct 3060
gcccattcga ccaccaagcg aaacatcgca tcgagcgagc acgtactcgg atggaagccg 3120
gtcttgtcga tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt 3180
tcgccaggct caaggcgagc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg 3240
cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc 3300
ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctgaag 3360
agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt 3420
cgcagcgcat cgccttctat cgccttcttg acgagttctt ctgaattatt aacgcttaca 3480
atttcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatcaggt 3540
ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca 3600
aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata gcacgtgcta 3660
aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc 3720
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 3780
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 3840
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 3900
actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 3960
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 4020
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 4080
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 4140
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 4200
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 4260
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 4320
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 4380
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 4440
tt 4442
<210> 125
<211> 5174
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX9283完整的质粒序列
<400> 125
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagcttggt 720
accgagctcg gatccgccac catggactgg acttggagaa tcctgttcct ggtcgccgcc 780
gcaactggga ctcatgctca ggtgcagctg gtgcagagcg gggcagaggt gaagaagcca 840
ggcagctccg tgaaggtgtc ttgcaaggca agcggcggct ctctgagcac ctacggcatc 900
cactgggtga ggcaggcacc aggacagggc ctggagtggg tgggcggcgt gatgaccgtg 960
tacggcaaga ccacatatgg ccagaacttc cagggcaggg tgacaatcgc cgtggaccgc 1020
tctaccaata cagcctacat ggagctgtct agcctgacca gcgacgatac cggcacatac 1080
tattgcgcca ccgactctta ctacgtgtgg acaggcagct atccccctcc attcgatctg 1140
tggggccagg gcaccctggt gacagtgtcc tctgcctcta caaagggacc aagcgtgttt 1200
ccactggcac ctagctccaa gtccacctct ggcggcacag ccgccctggg ctgtctggtg 1260
aaggattact tccctgagcc agtgaccgtg tcctggaact ctggcgccct gaccagcgga 1320
gtgcacacat ttcccgccgt gctgcagtct agcggcctgt actccctgtc ctctgtggtg 1380
accgtgccta gctcctctct gggcacccag acatatatct gcaacgtgaa tcacaagcct 1440
agcaatacaa aggtggacaa gaaggtggag ccaaagtcct gtgataagac ccacacatgc 1500
cctccctgtc cagcacctga gctgctgggc ggcccaagcg tgttcctgtt tccacccaag 1560
cccaaggaca ccctgatgat ctccagaacc ccagaggtga catgcgtggt ggtggacgtg 1620
tctcacgagg accccgaggt gaagtttaac tggtacgtgg atggcgtgga ggtgcacaat 1680
gccaagacca agccccggga ggagcagtac aactccacct atagagtggt gtctgtgctg 1740
acagtgctgc accaggactg gctgaacggc aaggagtata agtgcaaggt gagcaataag 1800
gccctgccag cccccatcga gaagaccatc tccaaggcaa agggacagcc aagggagcca 1860
caggtgtaca cactgcctcc atcccgcgac gagctgacca agaaccaggt gtctctgaca 1920
tgtctggtga agggcttcta tccctctgat atcgccgtgg agtgggagag caatggccag 1980
cctgagaaca attacaagac cacaccccct gtgctggaca gcgatggctc cttctttctg 2040
tattccaagc tgaccgtgga caagtctcgg tggcagcagg gcaacgtgtt tagctgctcc 2100
gtgatgcacg aggccctgca caatcactac acccagaagt ctctgagcct gtccccaggc 2160
aagaggggaa gaaagcggag atctggcagc ggcgccacaa acttcagcct gctgaagcag 2220
gccggcgatg tggaggagaa tcctggccca atggtgctgc agacccaggt gtttatcagc 2280
ctgctgctgt ggatctccgg agcatacgga gagatcgtgc tgacccagac accaggaacc 2340
cagtccctgt ctcctggaca gtccgccaca ctgtcttgta gagccagcca ctccgtgggc 2400
aatgactacc tggcctggta tcagcagaag cctggacaga gcccacggct gctgatccac 2460
ggagcataca ggagggactc cggcatccct gatagattca tcggctctgg cagcggcacc 2520
gactttaccc tgacaatcga tagcctggag cctgacgatt gcgccgtgta ctattgtcag 2580
cagtatggct cctggccact gaccttcggc ggcggcacaa aggtggacat caagaggacc 2640
gtggccgccc ctagcgtgtt catctttcca ccctccgatg agcagctgaa gagcggcaca 2700
gcctccgtgg tgtgcctgct gaacaacttc tacccacgcg aggccaaggt gcagtggaag 2760
gtggacaacg ccctgcagtc tggcaatagc caggagtccg tgaccgagca ggactctaag 2820
gatagcacat attccctgag ctccaccctg acactgtcca aggccgatta cgagaagcac 2880
aaggtgtatg cctgtgaggt cacccaccag ggactgtctt cacccgtcac aaaatccttc 2940
aataggggag aatgctgata actcgagtct agagggcccg tttaaacccg ctgatcagcc 3000
tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 3060
accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 3120
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 3180
gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctactggg 3240
cggttttatg gacagcaagc gaaccggaat tgccagctgg ggcgccctct ggtaaggttg 3300
ggaagccctg caaagtaaac tggatggctt tcttgccgcc aaggatctga tggcgcaggg 3360
gatcaagctc tgatcaagag acaggatgag gatcgtttcg catgattgaa caagatggat 3420
tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac 3480
agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc 3540
tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaagacgag gcagcgcggc 3600
tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag 3660
cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc 3720
ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg 3780
atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc 3840
ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc 3900
cagccgaact gttcgccagg ctcaaggcga gcatgcccga cggcgaggat ctcgtcgtga 3960
cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca 4020
tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg 4080
atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg 4140
ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgaatta 4200
ttaacgctta caatttcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 4260
accgcatcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 4320
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 4380
tagcacgtgc taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat 4440
aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 4500
gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 4560
acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 4620
tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag 4680
ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 4740
atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 4800
agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 4860
cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 4920
agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 4980
acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 5040
gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 5100
ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 5160
gctcacatgt tctt 5174
<210> 126
<211> 6990
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pRD245完整的质粒序列
<400> 126
gctgcttcgc gatgtacggg ccagatatac gcttaccaca tttgtagagg ttttacttgc 60
tttaaaaaac ctcccacatc tccccctgaa cctgaaacat aaaatgaatg caattgttgt 120
tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt 180
cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt 240
atcttatcat gtctgtcagt cagtcacttg ccaggtgaca gtgacagtga cttctgagtg 300
taatggttgt gcagtgcctc gtgcatcacg ctgcaggaga acacgttgcc ctgctgccac 360
cggctcttat ccactgtcag cttgctgtac aggaaaaagg agccatcaga atccagcacg 420
ggtggtgtgg tcttgtagtt gttctctggc tggccattgc tctcccactc cacggcgatg 480
tcgctagggt aaaagccctt caccagacag gtcagagaca cctggttctt ggtcagctca 540
tctctgcttg gaggcagggt atacacctga ggctctcttg gctggccctt ggccttggag 600
atggtcttct cgataggggc tggcagggcc ttattggaca ccttgcactt gtactccttg 660
ccgttcagcc aatcctggtg cagcactgtc agcacggaca ccactctgta ggtggagttg 720
tactgctcct ctctgggctt tgtcttggca ttgtgcacct ccacgccgtc cacgtaccag 780
ttgaacttca cctcggggtc ctcgtggctc acatccacca ccacgcaggt cacctctggt 840
gttctggaga tcatcagggt gtccttaggc tttggtggaa acaggaacac ggatgggccg 900
ccggcggcct ctggggcggg gcatggagga catgtgtggg tcttatcgct ggacttaggc 960
tccttgatct ccagctttgt gccctggcca aaggtgtgag gtggggaata gctctgctgg 1020
caatagtagg tgccgaagtc ctctggctgc aggctagaga tggtcagtgt gaagtctgtc 1080
acagagccgc tgccagaaaa ccgggatggc acgccagact gcagggtgct tgtggtgtag 1140
atcagcagct gaggcactct gcctggtctc tgctggtacc agttcaggta gcgtctgatg 1200
tcctggctgg ctctgcaggt gattgtcacc ctgtcgccca cgctggcgga cagagaagat 1260
ggggactggg tcatctggat gtcggagccg ccgccgccgc tgccgccgcc gccagagccg 1320
ccgccgccgg aagacacggt caccagtgtg ccctggcccc aatagtccac ccaggagctc 1380
agcagctgca ggcctctggg gccgcccttg gcgcagtagt acagggcggt atcgtcaggt 1440
ctcagggagt tcatctgcag gtccagggac ttcttggcgt tatccctgct gatggtgaat 1500
ctgcccttca cggagtcggc gtagccgatt gtggcggagt tccaagagat gccgctgatc 1560
cactccaggc ccttgcctgg ggcctgccgc acccaaaaca tggcgtaatc gtcgaatgta 1620
aagccgctgg cggcacagga cagtctcagg cttctgcctg gctgcaccag cccgcctccg 1680
ctttcgacca gctggacctc tgcgtgagtg ccggtggctg ctgcgaccag gaacaggatg 1740
cgccaagtcc aatccatggt ggcggctccg agctctgtgg agagaaaggc aaagtggatg 1800
tcagtaagac caataggtgc ctatcagaaa cgcaagagtc ttctctgtct cgacaagccc 1860
agtttctatt ggtctcctta aacctgtctt gtaaccttga tacttacctg cccagtgcct 1920
cacgaccaac ttctgtagct taatcggccg ccagcttatc ggtaccgtta tcagatcggc 1980
ttcgagggga ggctggatcg gtcccggtgt cttctatgga ggtcaaaaca gcgtggatgg 2040
cgtctccagg cgatctgacg gttcactaaa cgagctctgc ttatatagac ctcccaccgt 2100
acacgcctac cgcccatttg cgtcaatggg gcggagttgt tacgacattt tggaaagtcc 2160
cgttgatttt ggtgccaaaa caaactccca ttgacgtcaa tggggtggag acttggaaat 2220
ccccgtgagt caaaccgcta tccacgccca ttgatgtact gccaaaaccg catcaccatc 2280
aatattggcc attagccata ttattcattg gttatatagc ataaatcaat attggctatt 2340
ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa 2400
tatgaccgcc atgttggcat tgattattga ctagttatta atagtaatca attacggggt 2460
cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc 2520
ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 2580
taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc 2640
acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg 2700
gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc 2760
agtacatcta cgtattagtc atcgctatta ccacatggtc tttcctattg acgtcatatg 2820
ggcggtccta ttgacgtata tggcgcctcc cccattgacg tcaattacgg taaatggccc 2880
gcctggctca atgcccattg acgtcaatag gaccacccac cattgacgtc aatgggatgg 2940
ctcattgccc attcatatcc gttctcacgc cccctattga cgtcaatgac ggtaaatggc 3000
ccacttggca gtacatcaat atctattaat agtaacttgg caagtacatt actattggaa 3060
gtacgccagg gtacattggc agtactccca ttgacgtcaa tggcggtaaa tggcccgcga 3120
tggctgccaa gtacatcccc attgacgtca atggggaggg gcaatgacgc aaatgggcgt 3180
tccattgacg taaatgggcg gtaggcgtgc ctaacgggag gtctatataa gcaatgctcg 3240
tttagggaac cgccattctg cctggggacg tcggaggagc agctcggagc cgccaccatg 3300
gactggactt ggcgcattct gtttctggtc gcagccgcta ctggaaccca cgctcaggtg 3360
cagctggtcg aatcaggagg aggggtggtg cagccaggca gatccctgag actgtcttgc 3420
gccgccagcg gcttcacatt ctccaagtac ggcatgcact gggtgcggca ggcccccggc 3480
aagggcctgg agtgggtggc cgtgatctct tacgagggca gcaacaagta ctatgccgac 3540
tctgtgaagg gcagattcac aatcagcaga gacaatagca agaacaccct gtacctgcag 3600
atgaactccc tgagagccga ggacaccgcc gtgtactatt gcgccaagtc cggcacccag 3660
tactatgaca ccacaggcta cgagtataga ggcctggagt actttggcta ttggggccag 3720
ggcacactgg tgacagtgtc ctctggcggc ggcggctccg gcggcggcgg cagcggcggc 3780
ggcggctctg agatcgtgct gacacagagc ccaggcacac tgtccctgag cccaggcgag 3840
agagccacac tgtcctgtag agcctctcag tccgtgagct cctcttacct ggcctggtat 3900
cagcagaaga gaggccaggc ccccagactg ctgatctatg acgcctccag cagagccaca 3960
ggcatccctg atcggttctc tggcagcggc tccggcaccg atttcaccct gacaatctct 4020
agactggagc ctgaggactt tgccgtgtac tactgccagc agtatggcag atctcggtgg 4080
acatttggcc agggcaccaa ggtggagatc aaggagccaa agagctgtga caagacccac 4140
acctgtccac cctgcccagc ccctgaggcc gccggcggcc ctagcgtgtt cctgttccca 4200
cctaagccca aggacaccct gatgatcagc cggacacctg aggtgacctg cgtggtggtg 4260
gacgtgagcc acgaggaccc tgaggtgaag ttcaactggt atgtggatgg cgtggaggtg 4320
cacaacgcca agacaaagcc cagagaggag cagtacaatt ccacctacag agtggtgtcc 4380
gtgctgaccg tgctgcacca ggactggctg aatggcaagg agtacaagtg caaggtgtcc 4440
aacaaggccc tgcccgcccc aatcgagaag accatcagca aggccaaggg ccagcccaga 4500
gagccacagg tgtataccct gcctccatcc agagaggaga tgaccaagaa tcaggtgtct 4560
ctgacctgtc tggtgaaggg cttctatcca agcgatatcg ccgtggagtg ggagtccaat 4620
ggccagcctg agaataatta caagaccaca ccccctgtgc tggatagcga tggctccttc 4680
tttctgtact ccaagctgac cgtggacaag tccagatggc agcagggcaa cgtgttttcc 4740
tgctctgtga tgcatgaagc cctgcataac cattacaccc agaaatccct gtccctgagc 4800
cccggaaaat gactgactga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4860
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4920
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4980
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 5040
tatggcttct actgggcggt tttatggaca gcaagcgaac cggaattgcc agctggggcg 5100
ccctctggta aggttgggaa gccctgcaaa gtaaactgga tggctttctt gccgccaagg 5160
atctgatggc gcaggggatc aagctctgat caagagacag gatgaggatc gtttcgcatg 5220
attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag gctattcggc 5280
tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg 5340
caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa tgaactgcaa 5400
gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc agctgtgctc 5460
gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc ggggcaggat 5520
ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga tgcaatgcgg 5580
cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa acatcgcatc 5640
gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct ggacgaagag 5700
catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgagcat gcccgacggc 5760
gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt ggaaaatggc 5820
cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata 5880
gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga ccgcttcctc 5940
gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg ccttcttgac 6000
gagttcttct gaattattaa cgcttacaat ttcctgatgc ggtattttct ccttacgcat 6060
ctgtgcggta tttcacaccg catcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 6120
tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6180
ataaatgctt caataatagc acgtgctaaa acttcatttt taatttaaaa ggatctaggt 6240
gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg 6300
agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 6360
aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 6420
agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 6480
tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 6540
atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 6600
taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 6660
gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 6720
gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 6780
aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta 6840
tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 6900
gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc 6960
cttttgctgg ccttttgctc acatgttctt 6990
<210> 127
<211> 4472
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX 93100完整的质粒序列
<400> 127
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagcttggt 720
accgagctcg gatccgccac catggattgg acctggagaa tcctgttcct ggtggcagca 780
gcaaccggaa cacacgcaca ggtgcagctg gtggagagcg gcggcggcgt ggtgcagcca 840
ggccggtccc tgaggctgtc ttgcgcagca agcggcttca cctttagcaa gtacggaatg 900
cactgggtga gacaggcacc tggcaagggc ctggagtggg tggccgtgat ctcctatgag 960
ggctctaaca agtactatgc cgattccgtg aagggcaggt ttaccatcag cagagacaac 1020
tccaagaata cactgtacct gcagatgaat agcctgaggg ccgaggatac cgccgtgtac 1080
tattgcgcca agtccggcac acagtactat gacaccacag gctacgagta tagaggcctg 1140
gagtacttcg gctattgggg ccagggcacc ctggtgacag tgagctccgg cggcggcggc 1200
tccggcggcg gcggcagcgg cggcggcggc agcgagatcg tgctgaccca gtctcctggc 1260
acactgtctc tgagcccagg agagagggcc accctgagct gtagagcctc ccagagcgtg 1320
agcagcagct acctggcctg gtatcagcag aagaggggac aggccccacg cctgctgatc 1380
tacgacgcct ctagccgggc caccggcatc cccgatcgct tcagcggctc cggctctggc 1440
acagacttta ccctgacaat ctcccggctg gagcctgagg atttcgccgt gtactattgc 1500
cagcagtatg gcaggagcag atggaccttt ggccagggca caaaggtgga gatcaaggag 1560
cccaagtcct gtgataagac ccacacatgc cctccctgtc cagcacctga ggcagccggc 1620
ggcccaagcg tgttcctgtt tccacccaag cctaaggata cactgatgat ctctagaacc 1680
cccgaggtga catgcgtggt ggtggacgtg agccacgagg accccgaggt gaagttcaac 1740
tggtacgtgg acggcgtgga ggtgcacaat gccaagacca agcccaggga ggagcagtac 1800
aacagcacct atagagtggt gtccgtgctg acagtgctgc accaggactg gctgaacggc 1860
aaggagtata agtgcaaggt gtccaataag gccctgccag cccccatcga gaagaccatc 1920
tctaaggcaa agggacagcc acgggagcca caggtgtaca cactgcctcc atcccgcgag 1980
gagatgacca agaaccaggt gtctctgaca tgtctggtga agggcttcta tccttctgat 2040
atcgccgtgg agtgggagag caatggccag ccagagaaca attacaagac cacaccccct 2100
gtgctggact ctgatggcag cttctttctg tattccaagc tgaccgtgga caagtctagg 2160
tggcagcagg gcaacgtgtt ttcctgctct gtgatgcacg aggccctgca caatcactac 2220
acccagaaga gcctgtccct gtctcctggc aagtgataac tcgagtctag agggcccgtt 2280
taaacccgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 2340
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 2400
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 2460
caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 2520
tctatggctt ctactgggcg gttttatgga cagcaagcga accggaattg ccagctgggg 2580
cgccctctgg taaggttggg aagccctgca aagtaaactg gatggctttc ttgccgccaa 2640
ggatctgatg gcgcagggga tcaagctctg atcaagagac aggatgagga tcgtttcgca 2700
tgattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg 2760
gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag 2820
cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc 2880
aagacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc 2940
tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg 3000
atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc 3060
ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca 3120
tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag 3180
agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgagc atgcccgacg 3240
gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg 3300
gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca 3360
tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc 3420
tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg 3480
acgagttctt ctgaattatt aacgcttaca atttcctgat gcggtatttt ctccttacgc 3540
atctgtgcgg tatttcacac cgcatcaggt ggcacttttc ggggaaatgt gcgcggaacc 3600
cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc 3660
tgataaatgc ttcaataata gcacgtgcta aaacttcatt tttaatttaa aaggatctag 3720
gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac 3780
tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 3840
gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 3900
caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 3960
actgttcttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 4020
acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 4080
cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 4140
gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 4200
cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 4260
gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 4320
tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 4380
tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 4440
gccttttgct ggccttttgc tcacatgttc tt 4472
<210> 128
<211> 4451
<212> DNA
<213> 人工序列
<220>
<223> 化学合成,pGX 93141完整的质粒序列
<400> 128
gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagcttggt 720
accgagctcg gatccgccac catggactgg acttggagaa tcctgtttct ggtcgcagca 780
gccactggaa cccacgccga ggtgcagctg gtcgagagcg ggggaggcct ggtgcagcca 840
ggcagatccc tgaggctgtc ttgtgccgcc tctggcttca catttgatga ctacgccatg 900
ttctgggtgc ggcaggcccc aggcaagggc ctggagtgga tctccggcat cagctggaac 960
tctgccacca tcggctatgc cgactccgtg aagggcaggt tcaccatctc ccgggacaat 1020
gccaagaagt ctctggacct gcagatgaac agcctgagac ccgacgatac cgccctgtac 1080
tattgtgcca agggcggccc aagaggcctg cagctgctgt cctcttgggt ggattactgg 1140
ggccagggca ccctggtgac agtgtcttcc ggcggcggcg gctctggcgg cggcggcagc 1200
ggcggcggcg gctccgatat ccagatgacc cagtctccct cttccctgag cgcctccgtg 1260
ggcgatcggg tgacaatcac ctgcagagcc agccaggata tccggagata cctgaactgg 1320
taccagcaga ggcctggcag agtgccacag ctgctgatct acaccacatc caccctgcag 1380
tctggcgtgc caagcagatt ttccggcagc ggctccgtga cagacttcac cctgacaatc 1440
tccagcctgc agccagagga tttcggcaca tattactgcc agcagagcta ctccccacct 1500
cacacctttg gccagggcac aaagctggag atcaaggagc ccaagtcttc cgacaagacc 1560
cacacctgtc caccttgtcc cgccccagag gccgccggcg gccctagcgt gtttctgttc 1620
cctccaaagc ctaaggatac cctgatgatc tccagaaccc cagaggtgac atgcgtggtg 1680
gtggacgtgt ctcacgagga ccccgaggtg aagtttaact ggtacgtgga tggcgtggag 1740
gtgcacaatg ccaagaccaa gccaagggag gagcagtaca acagcaccta cagagtggtg 1800
tccgtgctga cagtgctgca ccaggactgg ctgaatggca aggagtataa gtgcaaggtg 1860
tccaacaagg ccctgccagc ccccatcgag aagaccatca gcaaggccaa gggccagcct 1920
agggagccac aggtgtacac cctgccaccc tccagagacg agctgacaaa gaatcaggtg 1980
tctctgacat gcctggtgaa gggcttctac ccttccgaca tcgccgtgga gtgggagtct 2040
aacggccagc ccgagaacaa ttacaagacc acaccacctg tgctggactc cgatggcagc 2100
ttcttcctgt atagcaagct gaccgtggat aagtctagat ggcagcaggg caacgtgttc 2160
tcctgttccg tgatgcacga agcactgcac aaccactaca ctcagaagag cctgtccctg 2220
tcccctggaa aatgataact cgagtctaga gggcccgttt aaacccgctg atcagcctcg 2280
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 2340
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 2400
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 2460
tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tactgggcgg 2520
ttttatggac agcaagcgaa ccggaattgc cagctggggc gccctctggt aaggttggga 2580
agccctgcaa agtaaactgg atggctttct tgccgccaag gatctgatgg cgcaggggat 2640
caagctctga tcaagagaca ggatgaggat cgtttcgcat gattgaacaa gatggattgc 2700
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 2760
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 2820
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca agacgaggca gcgcggctat 2880
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 2940
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 3000
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 3060
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 3120
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 3180
ccgaactgtt cgccaggctc aaggcgagca tgcccgacgg cgaggatctc gtcgtgaccc 3240
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 3300
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 3360
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 3420
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaattatta 3480
acgcttacaa tttcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc 3540
gcatcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa 3600
atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatag 3660
cacgtgctaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat 3720
ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 3780
aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 3840
aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 3900
ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg 3960
tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 4020
ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 4080
cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 4140
agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 4200
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 4260
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 4320
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 4380
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 4440
cacatgttct t 4451

Claims (21)

1.一种生成编码结构修饰的DNA编码抗体(DMAb)的核酸序列的方法,所述方法包括以下步骤:
a)鉴定第一DMAb的一个或多个CDR区;
b)鉴定第二DMAb的一个或多个CDR区;
c)用第一DMAb的一个或多个CDR区的氨基酸序列替代第二DMAb的一个或多个CDR区的氨基酸序列,以生成结构修饰的DMAb的氨基酸序列;和
d)生成编码结构修饰的DMAb的核酸序列。
2.根据权利要求1所述的方法,进一步包括:优化所述核酸序列。
3.一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:
a)将第一DMAb的氨基酸序列或氨基酸序列的片段与一个或多个其他DMAb序列的氨基酸序列或氨基酸序列的片段进行序列比对;
b)用一个或多个其他DMAb序列的氨基酸序列的一个或多个氨基酸残基替代所述第一DMAb的氨基酸序列的一个或多个氨基酸残基,以生成结构修饰的DMAb的氨基酸序列,其中,所述一个或多个氨基酸残基不是CDR区的残基;和
d)生成编码结构修饰的DMAb的核酸序列。
4.根据权利要求3所述的方法,进一步包括:优化所述核酸序列。
5.一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:
a)鉴定DMAb的氨基酸残基,所述氨基酸残基预测参与可变重链结构域和可变轻链结构域的界面处的相互作用;
b)对鉴定的所述氨基酸残基进行一个或多个氨基酸取代,其中一个或多个取代预测改变所述界面处的等电点和表面电荷的至少之一,从而生成结构修饰的DMAb的氨基酸序列;和
d)生成编码结构修饰的DMAb的核酸序列。
6.根据权利要求5所述的方法,进一步包括:优化所述核酸序列。
7.一种生成编码结构修饰的DMAb的核酸序列的方法,所述方法包括以下步骤:
a)从DMAb的氨基酸序列中删除CH和CL结构域的氨基酸序列;
b)将VH结构域和VL结构域的氨基酸序列之间的接头的氨基酸序列添加到DMAb的氨基酸序列中以生成结构修饰的DMAb的氨基酸序列;
c)对生成的氨基酸序列进行至少一轮建模;和
d)生成编码结构修饰的DMAb的核苷酸序列。
8.根据权利要求7所述的方法,进一步包括:优化所述核酸序列。
9.根据权利要求7所述的方法,其中所述建模的方法包括接头建模、铰链修饰建模、框架建模和CDR环优化中的至少一种。
10.根据权利要求7所述的方法,其中所述接头与所述VH结构域进行C末端连接,与所述VL结构域进行N末端连接。
11.根据权利要求7所述的方法,其中所述接头与所述VH结构域进行N末端连接,与所述VL结构域进行C末端连接。
12.根据权利要求1至5中任一项所述的方法,进一步包括以下步骤:
a)从DMAb的氨基酸序列中删除CH和CL结构域的氨基酸序列;
b)将VH结构域和VL结构域的氨基酸序列之间的接头的氨基酸序列添加到DMAb的氨基酸序列中以生成结构修饰的DMAb的氨基酸序列;和
c)对生成的氨基酸序列进行至少一轮建模。
13.一种权利要求1至12中任一项所述的方法的核酸分子所编码的结构修饰的DMAb。
14.一种结构修饰的DMAb,其包括来自第一DMAb的一个或多个CDR区和来自第二DMAb的一个或多个恒定区,其中,与相应的未经如此修饰的DMAb相比,所述结构修饰的DMAb表现出较高的体内表达和较高的结合中的至少一种。
15.根据权利要求14所述的结构修饰的DMAb,其中与如此修饰之前的结构修饰的DMAb的特异性相比,所述结构修饰的DMAb表现出至少相同或更高的抗原结合特异性。
16.一种结构修饰的DMAb,其包括一个或多个氨基酸取代,其中,与相应的未经如此修饰的DMAb相比,所述结构修饰的DMAb表现出较高的体内表达和较高的结合中的至少一种。
17.一种结构修饰的DMAb,其包括CH1、CH2、铰链、VH、接头和VL结构域,其中,与相应的未经如此修饰的DMAb相比,所述结构修饰的DMAb表现出较高的体内表达和较高的结合中的至少一种。
18.一种包括核酸分子的组合物,所述核酸分子包含至少一个编码权利要求13至17中任一项所述的结构修饰的DMAb的核苷酸序列。
19.根据权利要求18所述的组合物,其中至少一个结构修饰的DMAb包括选自由以下各项组成的群组中的氨基酸序列:
a)其编码序列全长的至少90%选自由以下各项组成的群组中的氨基酸序列的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ IDNO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115和SEQ ID NO:119;和
b)包含至少60%的选自由以下各项组成的群组中的氨基酸序列的片段:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ IDNO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ IDNO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115和SEQ ID NO:119。
20.根据权利要求18所述的组合物,其中所述核酸分子包含至少两个核苷酸序列,其中每个核苷酸序列编码结构修饰的DMAb。
21.一种治疗患有疾病或紊乱的受试者的方法,所述方法包括:向有需要的受试者施用至少一种权利要求18所述的组合物。
CN201880046347.6A 2017-05-10 2018-05-10 优化的核酸抗体构建体 Pending CN111194221A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201762504460P 2017-05-10 2017-05-10
US201762504448P 2017-05-10 2017-05-10
US62/504,460 2017-05-10
US62/504,448 2017-05-10
US201862624320P 2018-01-31 2018-01-31
US201862624367P 2018-01-31 2018-01-31
US62/624,320 2018-01-31
US62/624,367 2018-01-31
PCT/US2018/032023 WO2018209055A1 (en) 2017-05-10 2018-05-10 Optimized nucleic acid antibody constructs

Publications (1)

Publication Number Publication Date
CN111194221A true CN111194221A (zh) 2020-05-22

Family

ID=64105692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880046347.6A Pending CN111194221A (zh) 2017-05-10 2018-05-10 优化的核酸抗体构建体

Country Status (10)

Country Link
US (1) US12054537B2 (zh)
EP (1) EP3621640A4 (zh)
JP (2) JP2020519285A (zh)
KR (2) KR102455340B1 (zh)
CN (1) CN111194221A (zh)
AU (1) AU2018265261A1 (zh)
BR (1) BR112019023540A2 (zh)
CA (1) CA3063051A1 (zh)
MX (1) MX2019013370A (zh)
WO (1) WO2018209055A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110167584A (zh) * 2016-11-07 2019-08-23 威斯塔解剖学和生物学研究所 用于针对莱姆病的dna抗体构建体
CN113939533A (zh) * 2020-06-18 2022-01-14 深圳迈瑞生物医疗电子股份有限公司 抗可溶性cd14亚型抗体、试剂盒及其应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4137158A1 (en) 2015-08-07 2023-02-22 Imaginab, Inc. Antigen binding constructs to target molecules
US11230592B2 (en) * 2017-09-27 2022-01-25 The Wistar Institute Of Anatomy And Biology DNA antibody constructs for use against middle east respiratory syndrome coronavirus
US20230302120A1 (en) * 2020-08-11 2023-09-28 The Board Of Regents Of The University Of Texas System Proteins, polynucleotides, and methods for treating coronavirus infection
WO2023069341A2 (en) * 2021-10-20 2023-04-27 Memorial Sloan Kettering Cancer Center Anti-tshr multi-specific antibodies and uses thereof
WO2023077061A1 (en) * 2021-10-28 2023-05-04 David Weiner Bispecific immune cell engagers targeting hiv and methods of use thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009134027A2 (en) * 2008-04-30 2009-11-05 Ajou University Industry-Academic Cooperation Foundation Anti-nucleic acid antibody inducing cell death of cancer cells and composition for preventing or treating cancers comprising the same

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8928874D0 (en) * 1989-12-21 1990-02-28 Celltech Ltd Humanised antibodies
US5858725A (en) * 1990-10-10 1999-01-12 Glaxo Wellcome Inc. Preparation of chimaeric antibodies using the recombinant PCR strategy
US6261787B1 (en) * 1996-06-03 2001-07-17 Case Western Reserve University Bifunctional molecules for delivery of therapeutics
PT2662091T (pt) * 2006-12-01 2018-12-03 Novartis Ag Anticorpos anti-p-selectina e métodos para os utilizar no tratamento de doenças inflamatórias
US8324350B2 (en) * 2006-12-29 2012-12-04 Abbott Laboratories Dual-specific IL-1α/IL-1β antibodies
BRPI1005984A2 (pt) * 2009-02-23 2016-10-04 Glenmark Pharmaceuticals Sa anticorpo humanizado ou fragmento do mesmo que se liga ao cd19 humano, acido nucleico isolado, vetor, célula hospedeira, método para produzir um anticorpo humanizado ou fragmento do mesmo que se liga à cd12 humano, composição, imunoconjugado, uso de um anticorpo humanizado ou fragmento do mesmo, artigo de manufatura e kit
JP5717624B2 (ja) 2009-03-19 2015-05-13 中外製薬株式会社 抗体定常領域改変体
TWI671315B (zh) * 2011-03-28 2019-09-11 法商賽諾菲公司 具有交叉結合區定向之雙重可變區類抗體結合蛋白
EP3699286A1 (en) * 2011-04-20 2020-08-26 The Trustees of the University of Pennsylvania Regimens and compositions for aav-mediated passive immunization of airborne pathogens
JP6571527B2 (ja) * 2012-11-21 2019-09-04 ウーハン ワイゼットワイ バイオファルマ カンパニー リミテッドWuhan Yzy Biopharma Co., Ltd. 二重特異性抗体
EP3080159A4 (en) 2013-12-13 2017-08-02 The Trustees Of The University Of Pennsylvania Dna antibody constructs and method of using same
US10160795B2 (en) * 2014-11-14 2018-12-25 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Neutralizing antibodies to Ebola virus glycoprotein and their use
US20180237502A1 (en) * 2015-03-11 2018-08-23 Integrated Biotherapeutics, Inc. Pan-ebola and pan-filovirus protective epitopes, antibodies, and antibody cocktails
JP6980659B2 (ja) 2015-08-31 2021-12-15 ヘリックスミス カンパニー, リミテッド 抗シアリルtnキメラ抗原受容体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009134027A2 (en) * 2008-04-30 2009-11-05 Ajou University Industry-Academic Cooperation Foundation Anti-nucleic acid antibody inducing cell death of cancer cells and composition for preventing or treating cancers comprising the same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110167584A (zh) * 2016-11-07 2019-08-23 威斯塔解剖学和生物学研究所 用于针对莱姆病的dna抗体构建体
CN110167584B (zh) * 2016-11-07 2024-06-07 威斯塔解剖学和生物学研究所 用于针对莱姆病的dna抗体构建体
CN113939533A (zh) * 2020-06-18 2022-01-14 深圳迈瑞生物医疗电子股份有限公司 抗可溶性cd14亚型抗体、试剂盒及其应用

Also Published As

Publication number Publication date
KR20200014780A (ko) 2020-02-11
MX2019013370A (es) 2020-08-03
AU2018265261A1 (en) 2019-12-05
US12054537B2 (en) 2024-08-06
EP3621640A1 (en) 2020-03-18
JP2020519285A (ja) 2020-07-02
EP3621640A4 (en) 2021-06-30
JP2023121765A (ja) 2023-08-31
WO2018209055A1 (en) 2018-11-15
KR20220147684A (ko) 2022-11-03
BR112019023540A2 (pt) 2020-05-26
US20210188947A1 (en) 2021-06-24
KR102455340B1 (ko) 2022-10-18
CA3063051A1 (en) 2018-11-15

Similar Documents

Publication Publication Date Title
KR102455340B1 (ko) 최적화된 핵산 항체 작제물
AU2020201853B2 (en) DNA antibody constructs and method of using same
AU2016202122B2 (en) Nucleic acid molecules encoding novel herpes antigens, vaccine comprising the same, and methods of use thereof
KR102154225B1 (ko) Aav sflt-1을 사용한 amd의 치료
KR20200032174A (ko) 강화된 키메라 항원 수용체 및 이의 용도
KR20210030973A (ko) 조작된 면역자극성 박테리아 균주 및 이의 용도
KR20200064980A (ko) 종양 세포에서 면역 조절제 및 항-암 치료제를 생산하도록 프로그램된 미생물
KR20230012070A (ko) Dna 항체 작제물 및 이의 사용 방법
CN107427566B (zh) Dna抗体构建体及其使用方法
KR20160079854A (ko) 변형된 조혈 줄기/선조 및 비-t 효과기 세포 및 이의 용도
JP2009511623A (ja) レンチウイルスベクターベースのワクチン
TW202237826A (zh) 基因編輯的自然殺手細胞
CN113474458A (zh) 靶向癌症抗原的dna编码的双特异性t细胞连接子以及在癌症治疗中的使用方法
KR20150056611A (ko) B형 간염 바이러스 코어 단백질 및 표면 항원 단백질 및 이를 포함하는 백신
SG175682A1 (en) Selection of human monoclonal antibodies by mammalian cell display
KR20230041028A (ko) SARS-CoV-2 면역원성 조성물, 백신 및 방법
US10792357B2 (en) Optimized HIV envelope gene and expression thereof
KR20230019450A (ko) 캡슐화된 rna 레플리콘 및 사용 방법
KR20240022575A (ko) 아머링된 키메라 수용체 및 이의 사용 방법
CN116782928A (zh) 能够将抗原递送至mhc-ii途径并在宿主中诱导cd4+和cd8+t细胞应答的慢病毒载体
CN111936513A (zh) 用于抗呼吸道合胞病毒的核酸抗体构筑体
CN117120085A (zh) Sars-cov-2免疫原性组合物、疫苗和方法
CN116970083A (zh) 结合Trop2的抗体或Trop2抗原结合片段以及抗Trop2CAR和应用
CN115867295A (zh) 用于靶向hpv感染细胞的组合物和方法
CN116744966A (zh) Dna编码的用于抵抗sars-cov-2的抗体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination