CN109689947A - 具有降低的组合冗余度和优化的环长度分布的hc-cdr3-专一文库 - Google Patents

具有降低的组合冗余度和优化的环长度分布的hc-cdr3-专一文库 Download PDF

Info

Publication number
CN109689947A
CN109689947A CN201780054632.8A CN201780054632A CN109689947A CN 109689947 A CN109689947 A CN 109689947A CN 201780054632 A CN201780054632 A CN 201780054632A CN 109689947 A CN109689947 A CN 109689947A
Authority
CN
China
Prior art keywords
cdr3
library
kabat
antibody
ring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780054632.8A
Other languages
English (en)
Other versions
CN109689947B (zh
Inventor
A·拉姆
C·施泰因屈勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Italfarmaco SpA
Original Assignee
Italfarmaco SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Italfarmaco SpA filed Critical Italfarmaco SpA
Publication of CN109689947A publication Critical patent/CN109689947A/zh
Application granted granted Critical
Publication of CN109689947B publication Critical patent/CN109689947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1037Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/005Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies constructed by phage libraries
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/52Constant or Fc region; Isotype
    • C07K2317/526CH3 domain
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/565Complementarity determining region [CDR]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Virology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Saccharide Compounds (AREA)

Abstract

本发明提供了一种载体文库,其包含不同长度的人HC‑CDR3区,其中所述文库的多样性仅集中于HC‑CDR3区,已经优化了多样性从而使得短HC‑CDR3环的冗余度降低,并且已经提高了更长环长度的HC‑CDR3区变体的覆盖度。将本发明的文库展示在噬菌体上用于进行针对靶标抗原的选择。

Description

具有降低的组合冗余度和优化的环长度分布的HC-CDR3-专一 文库
本发明提供了一种载体文库,其包含不同长度的人HC-CDR3区,其中所述文库的多样性仅集中于HC-CDR3区,已经优化了多样性从而使得短HC-CDR3环的冗余度降低,并且已经提高了更长环长度的HC-CDR3区变体的覆盖度。将本发明的文库展示在噬菌体上用于进行针对靶标抗原的选择。
背景技术
尽管最近开发了体内发现平台来提供完全的人抗体(Green,2014),但重组抗体文库仍然代表着一种重要的补充方法,特别是对于由于抗原性质而在体内尝试失败或不可能进行尝试的困难靶标。已经以各种布局和形式描述了重组抗体文库(Mondon等人,2008)。文库通常以组合方式构建,在多达六个环区(即互补决定区(CDR))内随机连续组合更复杂的变异。最大的变异通常引入重链(HC)可变结构域的CDR3区(HC-CDR3),其是天然抗体中存在的最可变且重要的CDR区段(Tonegawa,1983;Chothia等人,1989)。
对于HC-CDR3区,在重组抗体文库中实施的环长度分布(文库中存在的每个环长度的百分比)通常反映在天然抗体中所观察到的,即分布显示近似钟形分布,最大值在长度为12的HC-CDR3环附近(Zemlin等人,2003)。除了少数例外(例如Fellouse等人,2007;Mahon等人,2013),重组抗体文库被设计成遵循(近似)这种钟形分布。当以组合方式产生高复杂度(总复杂度为109到1010或更高)的文库时,这具有重要的后果。相对于来自长HC-CDR3环的变体,来自较短HC-CDR3环的变体将过量呈现(实际上所有变体存在或甚至存在多次),因为来自长HC-CDR3环的变体仅存在所有可能变体中的很小一部分。使用恒定长度分布的HC-CDR3环长度(所有HC-CDR3长度在文库中以相等比例存在)进一步提高了较短HC-CDR3环的冗余度(与天然抗体观察到的钟形分布相比,它们的百分比更高),略微提高了长HC-CDR3环的可能变体的总覆盖度,并降低了中等长度HC-CDR3环的覆盖度。
已被批准作为治疗剂或临床开发的抗体总数稳步增加。对ChEMBL数据库(https://www.ebi.ac.uk/chembl/)的调查显示,其HC-CDR3长度分布在HC-CDR3长度10处具有明显的最大值,不同于天然人抗体以及小鼠抗体中观察到的平滑钟形长度分布。因此,在旨在分离治疗性抗体候选物的文库中,长度为10的HC-CDR3环尤其得到很好地表示。具有较短HC-CDR3环的抗体可能得到良好呈现并且显示较低的聚集倾向,这是成功进行产品开发的重要特征。
虽然在各种情况下产生了HC-CDR3-专一(only)文库(Barbas等人,1992;Braunagel等人,1997;Pini等人,1998;Hoet等人,2005;Silacci等人,2005;Mahon等人,2013;US 2006/0257937A1),许多重组抗体文库不仅在HC-CDR3区中引入多样性,在五个其它CDR区中的一个或多个中也引入多样性(例如Knappik等人,2000;Prassler等人)。然后,在文库克隆过程中,通常以具有最低总体多样性的CDR区开始,以完全随机的方式组合各种CDR区中存在的多样性。除了短HC-CDR3环(其中可能存在一定的冗余度并且可能存在重复)外,每个HC-CDR3区变体必须被认为是独特的,仅在文库中出现一次。因此,每个HC-CDR3环变体与来自其它CDR区的变体的完全随机组合进行“关联”,而没有相容性的任何结构或功能选择。与其它CDR区由种系序列或单一共有序列来呈现的情况相比(例如对于轻链CDR3区),将特定HC-CDR3变体与来自其它(一至五个)CDR区的随机选择变体进行组合,并没有优势。因此,与具有额外多样性的文库相比,HC-CDR3-专一文库应该表现良好或甚至更好。唯一的例外是短HC-CDR3环,由于冗余度(在文库中存在多于一个拷贝的变体),仅可探索其它CDR中非常有限数量的变异组合,即相同的HC-CDR3变体将出现多次,每次与其它CDR区中的变体进行不同组合。然而,为了使HC-CDR3变体仅与这些组合中的10种组合,HC-CDR3区的复制水平也必须在10左右。即使对于短HC-CDR3环而言,这也意味着文库中该环长度的分数增加10倍,对于大多数HC-CDR3环长度而言这是不切实际的。例如,具有代表总文库百分之几的特定长度的HC-CDR3环,需要以相对高的两位数百分比分数存在,以便有效地探索文库中存在的额外多样性(例如在LC-CDR3中)。虽然对于单个HC-CDR3环长度已难以实现,但是不可能产生这样的文库,即其中来自所有HC-CDR3环长度的变体与另一个CDR区中甚至有限数量的变体有效组合。在一文献中(Mahon等人,2013),比较了HC-CDR3-专一文库的性能与相应的HC-CDR3-和-LC-CDR3文库。HC-CDR3-专一文库显示出优异的性质;然而,作者并没有完全理解有利于HC-CDR3-专一文库的“组合效应”,而是将HC-CDR3文库的更好性能归因于HC-CDR3-和-LC-CDR3文库中LC-CDR3和HC-CDR3多样性间可能的结构不相容性。
使用标准简并寡核苷酸(例如Philibert等人,2007)(其仅允许大致表示所需的氨基酸分布并产生不需要的Cys和终止密码子)、或通过在其中通过编码氨基酸的三聚体嵌段混合物而引入多样性的寡核苷酸(Braunagel等人,1997;Knappik等人,2000;Prassler等人,2013;Mahon等人,2013;专利申请US2006/0257937A1、EP1979378B1),产生了重组抗体文库,其中HC-CDR3多样性设计是基于天然抗体中观察到的定位(position-wise)氨基酸频率。
然而,这些实例中没有一个能够理解组合效应,该组合效应涉及到实际存在于文库中针对特定HC-CDR3长度的不同变体数量,和文库设计所限定的理论上可能变体数量相比,其代表总文库的特定分数。在存在钟形“天然样”HC-CDR3环长度分布的情况下,组合效应导致短HC-CDR3环的变体的过度呈现,而对于更长的HC-CDR3环覆盖度非常小。US2006/0257937A1仅描述了覆盖HC-CDR3环长度的有限范围(8、10、13、14、15、17、18、19)的文库设计,并且HC-CDR3环位置处的氨基酸组成对应着19种不同氨基酸的固定等摩尔混合物或限制在特定位置上较少氨基酸的固定混合物,对于所有HC-CDR3环长度不加区别。EP1979378B1描述了一种文库设计,其中HC-CDR3环长度被分成三个变化的长度范围,每个范围具有确定的氨基酸组成(称为多样性因子)。对于各种HC-CDR3环位置的特定长度范围内,代表所有HC-CDR3环氨基酸组成的多样性因子包括Kabat位置95至102。对于HC-CDR3内的每个位置或位置范围,多样性因子指定特定的氨基酸子集频率,而所有剩余的氨基酸(除Cys外)都以固定频率包括在内,但101和102位置除外,其中仅存在子集氨基酸。因此,该设计产生了大量理论上可能的变体,因为在几乎所有HC-CDR3环位置和所有HC-CDR3环长度上存在具有不同频率的所有氨基酸(除了Cys)。甚至对于中等长度的HC-CDR3环(例如长度9、10、11),总复杂度1010文库中存在的变体实际数量仅代表根据设计的所有可能变体的一部分。
已经产生了掺入合成CDR3多样性的重组人抗体文库,其总复杂度高达约1012(Knappik等人,2000,Prassler等人,2011)并且在实际应用中已经证明成功(针对特定靶标选择抗体),也可能是因为它们的规模庞大(sheer size)。然而,产生这种规模的文库需要非常大的努力,并且经济成本还高。
因此,需要设计具有优化特性的人抗体文库,即选择良好候选克隆以使得进一步开发成治疗性抗体的概率高,其可以用可接受的实验努力和可接受的经济成本得以产生。
附图说明
图1:环长度为5至20的重链CDR3区的Kabat编号方案。指示了HC-CDR3区,并且作为HC-CDR3区的一部分的残基以灰色阴影表示。在HC-CDR3区之前和之后的Kabat位置92、93、94和103、104,分别报告了最常见的氨基酸(CAR和WG)。
图2:在天然抗体中观察到的HC-CDR3环长度的分布。
图3:单链支架的序列,包括替代HC-CDR3区的填充物元件。用PstI/StyI消化除去填充物并允许插入含有HC-CDR3多样性的寡核苷酸。独特的限制性位点在序列中用下划线表示。还显示了可变轻链的CDR1和CDR3区的位置。
图4:显示插入含有HC-CDR3多样性的寡核苷酸后,单链支架的重链的示意图。
图5:编码密码子的三聚体嵌段的表,用于在含有HC-CDR3多样性的寡核苷酸中在具有多于一个氨基酸的位置处产生多样性。
图6:噬菌粒载体基础载体_VH3_VK1_v22的示意图。
图7:表示具有独特限制性位点的噬菌粒载体基础载体_VH3_VK1_v22的示意图。
图8:批准的或临床开发的治疗性抗体的HC-CDR3序列和HC-CDR3环长度。
图9:批准的或临床开发的治疗性抗体和天然抗体中HC-CDR3环长度分布的比较。在4至19的长度范围内,天然抗体的百分比值已重新归一化(至总计100%)。
图10:批准的或临床开发的治疗性抗体、天然抗体中HC-CDR3环长度分布、以及在优化的文库设计中环长度分布的比较。在5至19的长度范围内,天然抗体的百分比值已经重新归一化(至总计100%)。
图11:对于环长度15,编码HC-CDR3多样性的寡核苷酸。对于存在多于一个氨基酸的位置,显示了三聚体嵌段的混合物,其包括各三聚体嵌段的相对频率。含有PstI或StyI限制性位点的寡核苷酸部分用灰色表示。
图12(A-D):从文库中分离BSA特异性M13-scFv克隆。
A)进行三轮筛选,相对富集表示为输入/输出比(总t.u.×105);B)通过针对BSA和几种不相关抗原的噬菌体ELISA,测试多克隆噬菌体混合物的特异性(由I-III轮选择洗脱的噬菌体组成的子文库):C)从III轮分离的单个克隆针对BSA的ELISA测定;虚线表示用于确定特异性的计算截止值(OD=0.133);D)通过噬菌体ELISA,针对BSA和几种不相关抗原测试12个阳性克隆的特异性。
图13(A-D):从文库中分离卵清蛋白(OVA)特异性M13-scFv克隆。
A)进行三轮筛选,相对富集表示为输入/输出比(总t.u.×105);B)通过针对OVA和几种不相关抗原的噬菌体ELISA,测试多克隆噬菌体混合物的特异性(由I-III轮选择洗脱的噬菌体组成的子文库):C)从III轮分离的单个克隆针对OVA的ELISA测定;虚线表示用于确定特异性的计算截止值(OD=0.166);D)通过噬菌体ELISA,针对OVA和几种不相关抗原测试10个阳性克隆的特异性。
图14(A-D):从文库中分离Dsg1特异性M13-scFv克隆。
A)进行三轮筛选,相对富集表示为输入/输出比(总t.u.×105);B)通过针对市售Dsg1预包被孔和几种不相关抗原的噬菌体ELISA,测试多克隆噬菌体混合物的特异性(由I-III轮选择洗脱的噬菌体组成的子文库):C)从III轮分离的单个克隆针对Dsg1预包被孔的ELISA测定;虚线表示用于确定特异性的计算截止值(OD=0.102);D)通过噬菌体ELISA,针对Dsg1和几种不相关抗原测试10个阳性克隆的特异性。
图15(A-D):从文库中分离FGFR4特异性M13-scFv克隆。
A)进行三轮筛选,相对富集表示为输入/输出比(总t.u.×105);B)通过针对FGFR-4和几种不相关抗原的噬菌体ELISA,测试多克隆噬菌体混合物的特异性(由I-III轮选择洗脱的噬菌体组成的子文库):C)从III轮分离的单个克隆针对FGFR-4的ELISA测定;虚线表示用于确定特异性的计算截止值(OD=0.134);D)通过噬菌体ELISA,针对FGFR-4和几种不相关抗原测试20个阳性克隆的特异性。
定义
除非另外定义,否则本文使用的领域所有术语、符号和其它科学术语旨在具有本公开所属领域的技术人员通常理解的含义。在一些情况下,为了清楚和/或为了参考,而在本文中定义了具有通常理解的含义的术语;因此,本文中包含这些定义不应被解释为代表与本领域通常理解的有实质性差异。
在本文中术语“文库复杂度”是指文库中存在的变体的总数,和HC-CDR3的环长度无关。
在本文中术语“多样性”是指在一个或多个位置存在多于一个氨基酸。
在本文中术语“冗余度”是指针对具有限定长度的HC-CDR3环的变体在文库内得以呈现的平均次数。
对于术语“HC-CDR3-专一文库”,我们是指一种文库,其仅具有HC-CDR3区以及HC-CDR3区之前Kabat位置94内的变异,而没有其它五个CDR区(HC-CDR1、HC-CDR2、LC-CDR1、LC-CDR2和LC-CDR3)内的变异。
如本文所用的术语“抗体片段”或“功能片段”包括任何抗原结合片段,例如Fab、F(ab')2、Fab'、Fv、scFv、包含Fc部分的单链、纳米抗体和其它抗体,比如具有除可变框架区之外的支架的结构。术语“功能片段”包括但不限于任何保留了结合目标抗原的能力的抗体部分。
本文的术语“种系”是指从亲本传递给后代的编码抗体或其功能片段的核酸序列。
在本文中术语“可变重链和可变轻链组合”或“VH/VL组合”是指一种可变重链和一种可变轻链的组合。抗体或抗体功能片段包含至少一个与可变轻链结合的可变重链,其形成抗原结合区。
术语“可变结构域”、轻链可变结构域(VL)或重链可变结构域(VH)在本文中是指免疫球蛋白的区,其与抗原接触并含有三个称为“互补决定区”或“CDR”的高变区(Kabat,1983;Chothia&Lesk,1987)。
本文中HC-CDR3和LC-CDR3分别指重链可变和轻链可变结构域的第三互补决定区。
在本文中术语“Kabat命名法”是指由Kabat 1983定义的VL或VH结构域的残基编号方案,并且图1中示意性地显示了VH结构域CDR3区。VH结构域和HC-CDR3环的残基编号在整个本公开内容中指Kabat命名法。
在本文中术语“变体”是指抗体或抗体片段,其氨基酸序列区别于文库中所有其它抗体或抗体片段的氨基酸序列。
在本文中术语“密码子优化的”或“密码子优化”是指以这样的方式改变的核苷酸序列:编码的氨基酸序列保持相同,而编码单个氨基酸的密码子已经以这样的方式改变以优化编码的蛋白在特定宿主(例如细菌细胞)中的表达。
本文使用的术语“文库”包括但不限于噬菌体展示、核糖体展示、细菌展示、酵母展示和哺乳动物展示文库。本发明的优选实施方案利用噬菌体展示文库。
所用的术语“展示载体”包括这样的DNA序列,其在宿主细胞中(例如用其转化的细菌宿主细胞)具有指导染色体外重组DNA分子进行复制和维持的能力。这种DNA序列是本领域熟知的。
根据本发明,展示载体可以是例如源自fd、M13或fl丝状噬菌体类别(class)的噬菌体载体或噬菌粒载体。这种载体能够促进丝状噬菌体表面上的蛋白展示。
在本文中术语“抗体相关的肽”是指含有源自抗体的结构性结构域的肽,并且可以包含一个或多个共价连接的、二硫键连接的或结合成复合物的抗体结构域。
如本文所用的术语“遗传包装”是指可复制的遗传展示包装,其中颗粒在其表面上展示多肽。包装可以是噬菌体,其表面展示抗原结合结构域。当抗原结合结构域对应于抗体相关的肽时,这种类型的包装被称为噬菌体抗体。
发明描述
本发明提供了一种具有优化特性的不同人抗体HC-CDR3区的集合,其中通过这样的方法设计多样性:以期望的总文库复杂度,该方法允许文库中HC-CDR3环长度分布的变异以及在各HC-CDR3环的各位置上氨基酸多样性的变异。
特别地,本发明产生具有优化特性的人抗体文库,所述优化特性在于:通过优化HC-CDR3环长度分布而降低组合冗余度(存在重复变体),采用可接受的实验努力和低经济成本而获得。
通过将多样性仅限制于HC-CDR3环和HC-CDR3区之前的位置,令人惊讶地实现了所述优点,从而对于所有HC-CDR3环长度而言将冗余度降低至可接受的水平(小于2),HC-CDR3环长度9至11的变体在文库中尤其得到良好呈现。
因此,本发明文库的优点在于,尤其良好地呈现在批准的治疗性抗体或临床开发的抗体中经常观察到的HC-CDR3环长度。
应用实施例4中公开的文库设计优化方法,可以针对每个HC-CDR3环长度调整冗余度的期望阈值(存在重复的变体)。
同时,对于每个HC-CDR3环长度的覆盖度(针对特定HC-CDR3环长度在文库中实际存在的所有可能变体的分数),可以在文库的总复杂度所规定的限度内针对一个或多个特定感兴趣HC-CDR3环长度进行优化。
因此,本发明的一个目的是产生一种总复杂度为C的载体或遗传包装的文库,其展示和表达或包含抗体相关的肽、多肽或蛋白的多样化家族成员,并且共同展示和表达或包含抗体家族的至少部分多样性,其中所述载体或遗传包装包含DNA序列,所述DNA序列编码具有以下序列的HC-CDR3区和HC-CDR3区之前的位置:
ZX1YnX3X4X5
其中:
C=1.3x1010
Z对应于Kabat位置94;
X1对应于Kabat位置95;
n是3至11的整数;
Y对应于HC Kabat位置96至98(n=3)、或HC Kabat位置96至99(n=4)、或HC Kabat位置96至100(n=5)、或HC Kabat位置96至100a(n=6)、或HC Kabat位置96至100b(n=7)、或HC Kabat位置96至100c(n=8)、或HC Kabat位置96至100d(n=9)、或HC Kabat位置96至100e(n=10)或HC Kabat位置96至100f(n=11);
X3对应于HC Kabat位置99(n=3)、或HC Kabat位置100(n=4)、或HC Kabat位置100a(n=5)、或HC Kabat位置100b(n=6)、或HC Kabat位置100c(n=7)、或HC Kabat位置100d(n=8)、或HC Kabat位置100e(n=9)、或HC Kabat位置100f(n=10)、或HC Kabat位置100g(n=11);
X4对应于HC Kabat位置101;
X5对应于HC Kabat位置102;
其特征在于,根据表2C中给出的值,每个ZX1YnX3X4X5区的百分比分数p(L)(L=n+4)存在于所述文库中;
并且根据表3A-3I公开的相对频率,对于每个长度为L=n+4的HC-CDR3区,位置Z、X1、X2、X3、X4、X5和Yn(n=3至11)被限定的氨基酸占据。
在优选的实施方案中,所述抗体相关的肽、多肽或蛋白来自人。
在另一个实施方案中,所述抗体相关的肽、多肽或蛋白来自猫或狗。
在本发明的载体或遗传包装的文库的另一个优选实施方案中,HC-CDR3环的长度范围为9至11。在本发明的一个实施方案中,抗体相关的肽、多肽或蛋白是抗体或其片段,其选自:包含一个或多个恒定结构域的抗体、单链抗体、FAB片段、仅有重链的抗体或仅有可变重链的结构域。
优选地,所述抗体或其片段是单链抗体。
在另一个实施方案中,根据本发明的抗体相关的肽、多肽或蛋白包含人抗体种系可变区段。
在本发明的另一个实施方案中,仅将所述HC-CDR3区引入恒定单链支架中,其特征在于人重链和轻链种系可变结构域,其中轻链CDR3区的长度为9。
所述序列表示在天然人抗体中轻链CDR3九个位置中的每一处最常观察到的那些氨基酸。
在单链支架中使用种系可变结构域序列是有利的,因为这些序列不含有体细胞突变,因此预期免疫原性较低,从而降低在人受试者的临床试验期间随后观察到人抗人抗体反应的可能性。
在本发明的一个优选实施方案中,抗体相关的肽、多肽或蛋白包含含有人种系序列的人抗体VK1轻链可变结构域、和含有人种系序列的人抗体VH3重链可变结构域。
优选地,所述VK1κ轻链可变结构域含有人种系序列SEQ ID N.3和SEQ ID N.4,轻链CDR3区含有序列SEQ ID N.5,VH3重链可变结构域含有人种系序列SEQ ID N.1和SEQ IDN.2。
在根据本发明的载体或遗传包装的文库的另一个优选实施方案中,包含人种系序列的VH3重链可变结构域采用SEQ ID N.6的接头,与包含人种系序列的人抗体VK1κ轻链可变结构域连接。
根据进一步的实施方案,用于产生本发明文库的基础载体具有SEQ ID N.8。
在另一个实施方案中,根据本发明的载体或遗传包装的文库用于选择针对靶标抗原的抗体。
优选地,在噬菌体上展示所述文库以针对靶标抗原进行选择。
根据本发明,载体或遗传包装的文库具有限制于HC-CDR3区和HC-CDR3之前位置的多样性。
现在将通过以下实施例更全面地描述包含HC-CDR3多样性的文库和本发明的方法。不过应该注意,这些实施例是以说明性而非限制性的方式给出的。
实施例
实施例1.分析来自天然抗体可变结构域的序列和长度变异
从NCBI SRA档案SRR400158下载HC-CDR3环区的高通量新一代测序数据(Ippolito等人2012),并根据Kabat命名法(图1)检查编码的HC-CDR3环的长度和氨基酸组成(图2)。HC-CDR3环长度分布在环长度12处具有最大值(图2)。在表1a-1i中显示了来自天然抗体的HC-CDR3环长度7至15中每个环位置处的氨基酸组成。
表1a.在天然抗体中长度为7的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
表1b.在天然抗体中长度为8的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
表1c.在天然抗体中长度为9的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
表1d.在天然抗体中长度为10的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
表1e.在天然抗体中长度为11的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
表1f.在天然抗体中长度为12的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
表1g.在天然抗体中长度为13的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
表1h.在天然抗体中长度为14的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
表1i.在天然抗体中长度为15的HC-CDR3环的氨基酸组成。在每个环位置(顶行,Kabat命名,HC-CDR3位置以灰色表示)下方,显示了该位置处每个氨基酸观察到的百分比频率。观察到的频率小于0.05%的氨基酸未显示。
实施例2.种系VH-接头-VL单链支架的设计
已成功产生基于单链抗体的噬菌体展示的抗体文库用于大范围的文库布局(Mondon等人,2008),因此选择该形式作为向其中插入HC-CDR3多样性的抗体形式。VH3/VK1可变结构域配对是天然抗体中最常观察到的VH/VL组合之一(Huang等人,1996;de Wildt等人,1999;DeKosky等人,2013)。其也在天然可变结构域的重组单链抗体文库中高频率观察到(Glanville等人,2010),具有良好的热稳定性并且也得到有效表达(Ewert等人,JMB2003)。对于VH3/VK1单链支架的组装,选择人种系抗体序列,因为种系序列具有有利的性质,例如缺乏体细胞突变(其在治疗性抗体中存在时可能引起免疫原性)以及对存在多样性HC-CDR3区的内在耐受性。从翻译的Genbank种系序列M99660(SEQ ID 1)和翻译的Genbank种系序列J00256(J4片段)(SEQ ID 2)组装重链可变结构域支架氨基酸序列。在支架中,包含少量侧翼氨基酸的HC-CDR3区由含有独特EcoRV位点的填充物片段来呈现,所述位点允许在文库克隆期间除去未切割的载体(图3)。填充物片段在其5′末端含有PstI位点,在其3′末端含有StyI位点,允许在文库产生期间切除片段并克隆编码HC-CDR3多样性的寡核苷酸(图4)。选择PstI(CTGCAG)和StyI(CCWWGG),是因为仅有少数编码密码子的三聚体嵌段(trimerblock)的组合(图5)能够产生PstI和StyI识别位点,其中所述三聚体嵌段用于合成编码HC-CDR3多样性的寡核苷酸。因此,随后将His和Gln三聚体嵌段(CAT和CAG)排除在编码HC-CDR3多样性的寡核苷酸的设计之外。轻链可变结构域氨基酸支架序列由翻译的Genbank种系序列X93627(SEQ ID 3)和Genbank种系序列J00242(VK-1J1片段)(SEQ ID 4)组装而成。选择LC-CDR3环的长度为9个氨基酸,这是天然抗体VH3/VK1重链/轻链组合中最常观察到的长度(DeKosky等人,2013)。LC-CDR3环的氨基酸序列由VH3/VK1组合中长度为9的LC-CDR3环中最常观察到的氨基酸呈现(SEQ ID 5)。在LC-CDR3环的氨基酸序列中,来自编码Trp的VK-1J1片段的起始密码子(TGG)被CTG(Leu)取代,在具有VH3/VK1组合的天然抗体中CTG是长度为9的LC-CDR3环在该位置中最常见的氨基酸(DeKosky等人,2013)。在轻链LC-CDR1和LC-CDR3区的上游和下游引入额外独特限制性位点(图3)。然后通过连接GGGGSGGGGSGGGGS接头(SEQ ID 6)将单链支架组装成VH/VL单链拓扑结构(图3),通过选择替代密码子除去不需要的限制性位点,并且得到的核苷酸序列经密码子优化用于在大肠杆菌中表达(SEQ ID 7)。
实施例3.设计和产生展示载体基础载体(BaseVector)_VH3_VK1_v22,其允许产生单链HC-CDR3-专一文库
用于文库构建的噬菌体展示载体基于pCANTAB6载体,这是一种pCANTAB5载体的衍生物(McCafferty等人,1994)。从Genbank条目U14321开始重新构建pCANTAB6的序列,引入McCafferty等人1994所述的修饰。pCANTAB6的scFv克隆位点被取代为包含填充物区段的VH3-接头-VK1单链支架(图6)。引入一些单碱基取代以除去不需要的限制性位点并恢复下面列出的复制起点序列,从而产生基础载体_VH3_VK1_v22的序列(SEQ ID 8)。
展示载体基础载体_VH3_VK1_v22的组成:
位置1至2334:来自U14321,具有以下修饰:
320C->T除去XhoI位点
617G->C除去PvuI位点
1379T->C使复制起始序列与其它噬菌粒载体相同
2328C->G除去StyI位点
位置2335至3366:VH3-接头-VK1单链支架(SEQ ID 7)。
位置3367至3447:连接轻链可变结构域C末端与pIII蛋白的区段,如McCafferty等人1994所示。
位置3448至5540:来自U14321,具有以下修饰:
4029G->A除去BamHI位点
4788A->C除去PvuI位点。
在图6中显示具有插入的单链支架的基础载体_VH3_VK1_v22的示意性布局。用PstI和StyI切除填充物区,允许克隆编码HC-CDR3多样性的寡核苷酸。额外的独特限制性位点允许切除完整的单链抗体、单个可变轻链或重链或在可变轻链结构域中引入额外的多样性(图7)。然后通过标准方法合成和组装基础载体_VH3_VK1_v22(Genscript公司)。
实施例4.优化HC-CDR3环的长度分布和优化每个HC-CDR3环中定位氨基酸多样性
将His和Gln排除在HC-CDR3多样性设计之外,以排除His和Gln三聚体嵌段在HC-CDR3环内产生PstI和StyI位点。这种排除是可接受的,因为天然抗体HC-CDR3序列的组成显示通常仅以很小的频率观察到His和Gln(表1a-1i)。在任何HC-CDR3环的位置排除Cys,以避免通过未配对的Cys残基形成分子间二硫键。在任何位置也排除易氧化的Met。除位置101之前的位置外,Met通常仅以非常低的频率存在于天然HC-CDR3序列中(表1a-1i)。位置101始终固定为Asp。
使用spreadsheet application(电子表格应用程序),优化环长度7至15的H C-CDR3环多样性(环长度分布和定位氨基酸变异性)的设计。在该应用程序中,针对每个HC-CDR3环长度,可以调整文库中每个HC-CDR3环长度的百分比分数和每个HC-CDR3位置(还包括HC-CDR3环之前的位置94)的变异性(不同氨基酸的数量)。然后,应用程序为每个HC-CDR3环长度计算理论上可能的变体数量、实际存在的克隆数量(=特定HC-CDR3环长度的百分比分数×文库的总复杂度)、实际存在的所有理论上可能变体的分数的泊松估计、根据泊松估计存在的不同变体的实际数量和冗余度(每个变体平均出现的次数)。
泊松估计:1-e(-1*N/M)
其中
N=复杂度C的文库中长度为L的HC-CDR3环的克隆数
M=对于在每个环位置具有特定氨基酸组成的长度为L的HC-CDR3环,理论上可能的变体数量。
最初,除了位置101和102(分别为5和8个不同的氨基酸),每个HC-CDR3环位置上不同氨基酸的数量设定为16(除了Cys、Gln、His和Met之外的所有氨基酸),每个HC-CDR3环长度的初始百分比分数是在环长度7至15的天然抗体中观察到的HC-CDR3环长度分布,重新归一化至100%。在该配置中,较短的HC-CDR3环被过度呈现,而对于长度10至15的HC-CDR3环,小于存在于文库中的理论上可能变体的1%(表2A)。对于在治疗性抗体或临床开发抗体中富集的长度为10的HC-CDR3环,所有可能变体中的仅仅很小一部分实际存在于文库中(图8-9)。
表2A.总复杂度为1.3×1010的HC-CDR3-专一文库的设计方案,其中HC-CDR3环长度分布与天然氨基酸相似,在高变位置具有16个不同的氨基酸,在位置101具有5个不同的氨基酸,且在位置102具有8个不同的氨基酸。被认为是高变的位置具有下划线所示不同氨基酸的数量。Kabat位置94没有变化。
在高变位置将不同氨基酸的数量从16降低到8而产生文库,其中长度高达11的HC-CDR3环得以良好呈现,然而同时冗余度(变体出现的平均次数)显著增加(表2B)。
表2B.总复杂度为1.3×1010的HC-CDR3-专一文库的设计方案,其中HC-CDR3环长度分布与天然氨基酸相似,在高变位置具有8个不同的氨基酸,在位置101具有恒定氨基酸,且在位置102具有8个不同的氨基酸。被认为是高变的位置具有下划线所示不同氨基酸的数量。Kabat位置94没有变化。
调整HC-CDR3环长度分布的百分比值,针对HC-CDR3环长度7到11在位置94引入额外的变异性,对于较长的HC-CDR3环逐渐减少高变位置上存在的不同氨基酸的数量,并减少位置102和位置101之前的位置上不同氨基酸的数量,提供了具有有利性质的文库设计(表2C)。对于短HC-CDR3环,冗余度显著降低,对于环长度9至11的变体覆盖度高,并且较长HC-CDR3环也相对良好地呈现(表2C)。图10显示优化的HC-CDR3环长度分布,以及天然抗体与已批准的或在临床开发中的治疗性抗体中观察到的HC-CDR3环长度分布。
表2C.总复杂度为1.3×1010的HC-CDR3-专一文库的设计方案,其具有优化的HC-CDR3环长度分布、以及Kabat位置94和各HC-CDR3环每个位置上优化的变异性。被认为是高变的位置具有下划线所示不同氨基酸的数量。
实施例5.根据优化的文库设计来设计寡核苷酸
基于表2C中所示的优化文库设计汇编每个HC-CDR3环长度的氨基酸组成。在每个位置针对每个HC-CDR3环长度,表2C中存在的氨基酸数量选自:根据表1a-1i在天然抗体中对于HC-CDR3环长度和位置最常见的氨基酸,百分比值重新归一化至100。根据优化的文库设计,HC-CDR3长度7至15的氨基酸组成和百分比频率示于表3A-3I中。例如,对于HC-CDR3环长度7,表2C表示在位置94应存在3种不同的氨基酸。长度为7的天然HC-CDR3环中最常观察到的3个氨基酸是Arg 63.4%、Ser 8.9%和Thr 7.3%(表1a)。重新归一化至100%,这些氨基酸的百分比值变为Arg 79.6%、Ser 11.2%和Thr 9.2%。
表3A.对于长度为L=7的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。为了增加总体变异性,也针对HC-CDR3环长度7进行了HC-CDR3环之前的位置94的变化。
表3B.对于长度为L=8的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。为了增加总体变异性,也针对HC-CDR3环长度8进行了HC-CDR3环之前的位置94的变化。
表3C.对于长度为L=9的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。为了增加总体变异性,也针对HC-CDR3环长度9进行了HC-CDR3环之前的位置94的变化。
表3D.对于长度为L=10的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。为了增加总体变异性,也针对HC-CDR3环长度10进行了HC-CDR3环之前的位置94的变化。
表3E.对于长度为L=11的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。为了增加总体变异性,也针对HC-CDR3环长度11进行了HC-CDR3环之前的位置94的变化。
表3F.对于长度为L=12的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。
表3G.对于长度为L=13的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。
表3H.对于长度为L=14的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。
表3I.对于长度为L=15的HC-CDR3环优化的文库氨基酸组成。对于每个位置,一起显示存在的不同氨基酸与它们的相对频率。
然后基于表3A-I中的值,设计每个HC-CDR3环长度的寡核苷酸。在具有多于一个氨基酸的位置处,选择来自图5的相应三聚体嵌段,并按照所需百分比分数将其作为混合物包含在设计中。使用编码完整密码子的三聚体嵌段是有利的,因为它们允许在每个HC-CDR3环的每个位置产生表3A-1中所示的氨基酸组成和频率,而不产生与标准简并寡核苷酸的情况一样的不期望的终止密码子或包含不需要的氨基酸。相反,寡核苷酸的恒定部分(仅存在1个氨基酸的位置或克隆所需的部分)设计为通过标准寡核苷酸合成进行合成。针对HC-CDR3环长度15的寡核苷酸设计显示在图11中。使用表3A-I中给出的值以等同的方式设计针对其它HC-CDR3环长度的寡核苷酸。由EllaBiotech使用其三聚体嵌段技术合成寡核苷酸。
实施例6.通过将含有HC-CDR3多样性的寡核苷酸插入基础载体_VH3_VK1_22来产生文库多样性
在第一步中,使用引物Sty_rev_1(SEQ ID 9)和Herculase Il-Fusion DNA聚合酶(Agilent cat#600679)以及以下条件,对编码HC-CDR3环多样性的单链寡核苷酸进行引物延伸(产生双链寡核苷酸):在98℃下变性35秒、在47℃下退火15秒、在47℃和65℃下分别对编码环长度7至11和12至15的寡核苷酸延伸15秒。然后,使用引物PstI_正向_1(SEQ ID 10)和Sty_反向_2(SEQ ID 11)以及Herculase II-Fusion DNA聚合酶(Agilent cat#600679)按照下列条件扩增所得的双链寡核苷酸:在95℃变性15秒、在52℃退火15秒、在72℃延伸15秒,重复16个循环。
扩增后,通过Qiaquick核苷酸除去试剂盒(Qiagen Cat#28304)纯化寡核苷酸,用PstI/StyI限制酶消化,并按照1:6的插入物:载体比,对于每个HC-CDR3环长度分别连接到PstI/StyI消化的噬菌粒载体中(转化效率在5×107/108克隆/μg的范围)。然后将得到的连接产物转化到XL1blue-MRF'电感受态细胞中(50μl细胞中50ng载体),接种到23×23cm2XTY琼脂生物测定平板上,并在37℃下过夜(o/n)生长。第二天从2XTYAG/甘油17%的平板中收获细胞,并储存在-80℃。为了获得所需的HC-CDR3环长度分布和1.3×10^10的总体文库复杂度,定期检查转化效率,重复克隆收获循环,直至达到所需的HC-CDR3环长度分布和复杂度。将来自所有单个收获循环的克隆汇集在一起,然后产生最终的文库。
为了制备噬菌体形式的文库,将6ml汇集的细菌接种在4L的2XTY/氨苄青霉素/2%葡萄糖中,起始OD600=0.1,总共8.4×1010个细菌,代表了文库复杂度的约6.5倍。一旦达到OD600=0.5,以MOI=10用M13K07辅助噬菌体对细胞进行超感染,将介质更换为2XTY/氨苄青霉素/卡那霉素,并将细胞在30℃下过夜(o/n)振荡孵育。将得到的细胞培养物离心,并将含有噬菌体文库的上清液进行两次PEG沉淀步骤(加入20%PEG8000/NaCl 2.5M,体积的3/10),然后在1×TE中重悬噬菌体,用于在CsCl梯度上进一步纯化步骤。然后从梯度中收集噬菌体群体,并针对2L 1×TE过夜透析以消除CsCl,通过TU、pfu和PP/ml确定制剂中噬菌体的浓度,并储存在TBE 1×、15%甘油、0.02%NaN3中。
实施例7.鉴定牛血清白蛋白(BSA)的选择性结合物
在选择的几个步骤中,标准的封闭缓冲液由2%的乳制成,因此含有大量的牛白蛋白,我们推断这种可溶性BSA可以与塑料上包被的靶标重组BSA蛋白竞争选择。因此,为了在该靶标上选择噬菌体,使用含有1%酪蛋白的封闭缓冲试剂(Roche),而非标准封闭缓冲液。另外,为了避免选择针对NaN3(存在于用于包被的BSA溶液中)的特定噬菌体,使用含有0.02%NaN3的封闭缓冲试剂,使得可能对NaN3特异的噬菌体保留在溶液中并被洗掉。
对于该靶标,将来自文库的2.1×1012TU(噬菌体)与包被在免疫管上纯化的BSA一起孵育,最终体积为3ml,浓度为50μg/ml(第1轮),并在下面的两轮选择中分别按比例缩小至30和15μg/ml。
输入/输出比代表特异性克隆富集的量度,事实上它在第一轮选择中通常非常高,并且在随后的轮中迅速减少,此时从前一轮中洗脱的噬菌体群体逐渐富集为特定的噬菌体。对于该靶标,输入/输出比表明从第1轮到第3轮筛选中可能富集的特异性克隆(图12A)。通过噬菌体ELISA对BSA和几种不相关的抗原测试多克隆噬菌体。抗BSA M13-scFv克隆存在于选择的第2轮和第3轮中(图12B)。与包被在孔上的商业生产抗原(BP180和胶原VII)的非特异性结合,可能是由于制造商使用的封闭试剂(MBL)含有BSA(图12B)。在第3轮选择中抗BSA克隆的百分比是89中的50(56%)(图12C)。分析的所有12个阳性克隆都对BSA具有特异性(图12D)。
实施例8.鉴定卵清蛋白(OVA)的选择性结合物
对于该靶标,通过用浓度50μg/ml的OVA包被免疫管(第1轮),从9.3×1012TU中选择阳性噬菌体作为总克隆,并在下面的两轮选择中分别按比例缩小至30和10μg/ml。输入/输出比代表从第1轮到第2和第3轮筛选中可能富集的特异性克隆(图13A)。通过噬菌体ELISA对OVA和几种不相关的抗原测试多克隆噬菌体。抗OVA M13-scFv克隆存在于选择的第II轮和第III轮中,和其它抗原没有任何非特异性结合(图13B)。在第3轮选择中抗OVA克隆的百分比是94中的81(86%)(图13C)。10个阳性克隆的分析显示其全部对OVA具有特异性(图13D)。
实施例9.鉴定桥粒芯糖蛋白1(Dsg1)的选择性结合物
通过使用10个Dsg1预包被孔(MBL ELISA试剂盒)和1600μl含文库缓冲液中的9.3×1012TU(160μl/孔),进行文库选择。包被抗原的浓度未知。输入/输出比表明从第1轮到第3轮筛选可能富集的特异性克隆(图14A)。通过噬菌体ELISA对Dsg1预包被的孔和几种不相关的抗原测试多克隆噬菌体。除Dsg3和Dsg3衍生的构建体(EC1-2)外,抗-Dsg1M13-scFv存在于第2轮和第3轮选择中,与其它抗原没有任何非特异性结合(图14B)。检测到的交叉反应性可能是由于Dsg1和3之间的高序列同源性。第3轮选择中抗-Dsg1克隆的百分比是94中的86(91%)(图14C)。8个阳性克隆的分析显示其全部对Dsg1具有特异性(图14D)。
实施例10.鉴定成纤维细胞生长因子受体4(FGFR4)的选择性结合物
在浓度为10μg/ml的FGFR-4包被的10个微孔板孔中,通过使用1600μl文库(160μl/孔),进行文库选择。在包被相同浓度的FGFR-4的孔上进行所有三轮选择。由于FGFR-4重组蛋白是与人IgG1FC融合的嵌合蛋白,并且为了减少选择的抗FC噬菌体的量,使用与FC融合的不同重组蛋白(8μg/ml Dsg3-FC)进行第一轮。输入/输出比表明从第1轮到第3轮筛选可能富集的特异性克隆(图15A)。通过噬菌体ELISA对FGFR-4和几种不相关的抗原测试多克隆噬菌体。抗FGFR-4M13-scFv克隆存在于选择的第2轮和第3轮中,与其它抗原没有任何非特异性结合(图15B)。值得注意的是,与Dsg3-FC的竞争性选择并未消除所有抗FC噬菌体。事实上,多克隆混合物与FGFR-4和Dsg3-FC都反应(图15B)。第3轮选择中抗FGFR-4-FC克隆的百分比为77中的72(94%)(图15C)。分析的20个阳性克隆与FGFR-4结合,4个也与Dsg3-FC弱反应(图15D)。
因此,与Dsg3-FC的竞争性生物筛选成功地减少了抗FC克隆的量。
表4总结了来自四个靶标选择的结果。
表4–针对四个不同验证靶标的文库筛选结果的总结。A)针对每个靶标阳性选择的噬菌体数量和百分比;B)针对特定靶标或其它不相关的重组蛋白在结合方面的特异性,以及针对每个靶标发现的不同序列的数量(参见下文)。
A
B
抗原 阳性克隆# 序列克隆 不同序列的# 序列组#
BSA 50 5 1 1
OVA 81 10 10 4
DSG1 86 8 5 3
FGFR-4 72 10 3 3
对于所有四个靶标抗原,选择方法成功产生了大量克隆;重要的是,克隆以高特异性识别靶标抗原。
实施例11.鉴定所选噬菌体的HC-CDR3DNA序列
如表4的B部分所报道的,对每个靶标的一些克隆进行测序,并如表5所示分析和比对序列(见下文)。
在BSA的情况下,对5个克隆进行测序,并且它们全部显示相同的HC-CDR3序列。相反,测序的所有10个OVA阳性克隆都是独特的克隆,并且对应于至少四个不同的克隆家族。同样在Dsg1的情况下,对8个阳性克隆进行测序,并且所有阳性克隆都是特异性的,并且8个中的5个是独特的,具有三个不同的克隆家族。
最后,对10个FGFR-4特异性克隆进行测序,显示7个具有相同的序列。鉴定了三种不同的克隆家族。
通过噬菌体ELISA确定M13-scFv克隆(cl.33)对其靶标FGFR-4的亲和力,发现其在纳摩尔范围内(8.7×10-8M)。该值有利地与辉瑞公司(Mahon等人,J.Mol:Biol.405,1712,2013)报道的值相媲美,他们发现用其HC-CDR3-专一文库选择的噬菌体亲和力在105和457nM之间。
表5.通过选择分离的克隆子集的序列分析。对于每个靶标,对5至10个克隆进行测序。
结论
从所得到的结果中,文库设计成功地用于所有四种测试的靶标抗原。除了获得高靶标特异性(表4),文库还为每个靶标提供了多种不同的克隆序列家族。重要的是,获得的结果也很好地反映了文库的基本设计原理,其中大多数序列的HC-CDR3长度为11。此外,大量的只有少数(通常只有1个)不同氨基酸的所选克隆的存在,证实了针对最重要的HC-CDR3长度9至11(如设计中所实施的),文库为所有HC-CDR3环变体提供了大的覆盖度。
参考文献
-Barbas CF 3rd,Bain JD,Hoekstra DM,Lerner RA.Semisyntheticcombinatorial antibody libraries:a chemical solution to the diversityproblem.Proc Natl Acad Sci U S A.1992 May 15;89(10):4457-61.
-Braunagel M,Little M.Construction of a semisynthetic antibodylibrary using trinucleotide oligos.Nucleic Acids Res.1997 Nov 15;25(22):4690-1.
-Chothia C,Lesk AM.Canonical structures for the hypervariable regionsof immunoglobulins.J Mol Biol.1987 Aug 20;196(4):901-17.
-DeKosky BJ,Ippolito GC,Deschner RP,Lavinder JJ,Wine Y,Rawlings BM,Varadarajan N,Giesecke C,T,Andrews SF,Wilson PC,Hunicke-Smith SP,Willson CG,Ellington AD,Georgiou G.:High-throughput sequencing of the pairedhuman immunoglobulin heavy and light chain repertoire.Nat Biotechnol.2013Feb;31(2):166-9.
-de Wildt RM1,Hoet RM,van Venrooij WJ,Tomlinson IM,Winter G.Analysisof heavy and light chain pairings indicates that receptor editing shapes thehuman antibody repertoire.J Mol Biol.1999 Jan 22;285(3):895-901.
-Ewert S1,Huber T,Honegger A,Plückthun A.Biophysical properties ofhuman antibody variable domains.Mol Biol.2003 Jan 17;325(3):531-53.
-Fellouse FA,Esaki K,Birtalan S,Raptis D,Cancasci VJ,Koide A,JhuraniP,Vasser M,Wiesmann C,Kossiakoff AA,Koide S,Sidhu SS.High-throughputgeneration of synthetic antibodies from highly functional minimalist phage-displayed libraries.J Mol Biol.2007 Nov 2;373(4):924-40.
-Glanville J1,Zhai W,Berka J,Telman D,Huerta G,Mehta GR,Ni I,Mei L,Sundar PD,Day GM,Cox D,Rajpal A,Pons J.Precise determination of the diversityof a combinatorial antibody library gives insight into the humanimmunoglobulin repertoire.Proc Natl Acad Sci U S A.2009 Dec 1;106(48):20216-21.
-Green LL.Transgenic mouse strains as platforms for the successfuldiscovery and development of human therapeutic monoclonal antibodies.CurrDrug Discov Technol.2014 Mar;11(1):74-84.
-Hoet RM,Cohen EH,Kent RB,Rookey K,Schoonbroodt S,Hogan S,Rem L,FransN,Daukandt M,Pieters H,van Hegelsom R,Neer NC,Nastri HG,Rondon IJ,Leeds JA,Hufton SE,Huang L,Kashin I,Devlin M,Kuang G,Steukers M,Viswanathan M,NixonAE,Sexton DJ,Hoogenboom HR,Ladner RC.Generation of high-affinity humanantibodies by combining donor-derived and synthetic complementarity-determining-region diversity.Nat Biotechnol.2005 Mar;23(3):344-8.
-Huang,S.C.,Jiang,R.,Glas,A.M.&Milner,E.C.Non-stochastic utilizationof Ig V region genes in unselected human peripheral B cells.Mol.Immunol.199633,553-560.
-Ippolito GC1,Hoi KH,Reddy ST,Carroll SM,Ge X,Rogosch T,Zemlin M,Shultz LD,Ellington AD,Vandenberg CL,Georgiou G.Antibody repertoires inhumanized NOD-scid-IL2Rγ(null)mice and human B cells reveals human-likediversification and tolerance checkpoints in the mouse.PLoS One.2012;7(4):e35497.
-Kabat EA.Sequence of proteins of immunological interest.Bethesda:National Institute of Health;1991,Vol.1.Fifth Ed.
-Knappik A,Ge L,Honegger A,Pack P,Fischer M,Wellnhofer G,Hoess A,J,Plückthun A,B.Fully synthetic human combinatorial antibodylibraries(HuCAL)based on modular consensus frameworks and CDRs randomizedwith trinucleotides.J Mol Biol.2000 Feb 11;296(1):57-86.
-Mahon CM,Lambert MA,Glanville J,Wade JM,Fennell BJ,Krebs MR,Armellino D,Yang S,Liu X,O'Sullivan CM,Autin B,Oficjalska K,Bloom L,PaulsenJ,Gill D,Damelin M,Cunningham O,Finlay WJ.:Comprehensive interrogation of aminimalist synthetic CDR-H3 library and its ability to generate antibodieswith therapeutic potential.J Mol Biol.2013 May 27;425(10):1712-30.
-McCafferty J1,Fitzgerald KJ,Earnshaw J,Chiswell DJ,Link J,Smith R,Kenten J.Selection and rapid purification of murine antibody fragments thatbind a transition-state analog by phage display.Appl BiochemBiotechnol.1994May-Jun;47(2-3):157-71
-Mondon P,Dubreuil O,Bouayadi K,Kharrat H.Human antibody libraries:arace to engineer and explore a larger diversity.Front Biosci.2008 Jan 1;13:1117-29.
-Pini A,Viti F,Santucci A,Carnemolla B,Zardi L,Neri P,Neri D.Designand use of a phage display library.Human antibodies with subnanomolaraffinity against a marker of angiogenesis eluted from a two-dimensional gel.JBiol Chem.1998 Aug 21;273(34):21769-76.
-Philibert P,Stoessel A,Wang W,Sibler AP,Bec N,Larroque C,Saven JG,Courtête J,Weiss E,Martineau P.:A focused antibody library for selectingscFvs expressed at high levels in the cytoplasm.BMC Biotechnol.2007 Nov 22;7:81.
-Prassler J,Thiel S,Pracht C,Polzer A,Peters S,Bauer M,S,Stark Y,J,Popp A,Urlinger S,Enzelberger M.HuCAL PLATINUM,a synthetic Fablibrary optimized for sequence diversity and superior performance inmammalian expression systems.J Mol Biol.2011 Oct 14;413(1):261-78.
-Silacci,M.,Brack,S.,Schirru,G.,Marlind,J.,Ettorre,A.,Merlo,A.,Viti,F.,Neri,D.:Design,construction,and characterization of a large synthetichuman antibody phage display library.Proteomics.2005 Jun;5(9):2340-50.
-Tonegawa S.Somatic generation of antibody diversity.Nature.1983 Apr14;302(5909):575-81.
-Zemlin M,Klinger M,Link J,Zemlin C,Bauer K,Engler JA,Schroeder HWJr,Kirkham PM.:Expressed murine and human CDR-H3 intervals of equal lengthexhibit distinct repertoires that differ in their amino acid composition andpredicted range of structures.J Mol Biol.2003 Dec 5;334(4):733-49。
序列表
<110> 意大发马克股份公司
<120> 抗体文库
<160> 11
<170> BiSSAP 1.2
<210> 1
<211> 97
<212> PRT
<213> 人(Homo sapiens)
<220>
<223> 重链VH3翻译的种系区段V3-23
<400> 1
Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr
20 25 30
Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ala Ile Ser Gly Ser Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala
<210> 2
<211> 11
<212> PRT
<213> 人(Homo sapiens)
<220>
<223>重链翻译的J4种系区段
<400> 2
Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser
1 5 10
<210> 3
<211> 88
<212> PRT
<213> 人(Homo sapiens)
<220>
<223> Kappa轻链VK1翻译的人种系区段
<400> 3
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser Tyr
20 25 30
Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys
85
<210> 4
<211> 11
<212> PRT
<213> 人(Homo sapiens)
<220>
<223> Kappa轻链VK1翻译的种系区段J1
<400> 4
Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
1 5 10
<210> 5
<211> 9
<212> PRT
<213> 人(Homo sapiens)
<220>
<223> Kappa轻链CDR3
<400> 5
Gln Gln Ser Tyr Ser Thr Pro Leu Thr
1 5
<210> 6
<211> 15
<212> PRT
<213> 人(Homo sapiens)
<220>
<223> VH/VL接头
<400> 6
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 7
<211> 1032
<212> DNA
<213> 人(Homo sapiens)
<220>
<221> source
<222> 1..1032
<223> /mol_type="未指定DNA"
/note="包括填充物的支架"
/organism="人(Homo sapiens)"
<400> 7
gaagttcagc tgctggaatc tggtggtggt ctggttcagc cgggtggttc tctgcgtctg 60
tcttgcgctg cttctggttt caccttctct tcttacgcta tgtcttgggt tcgtcaggct 120
ccgggtaaag gtctggaatg ggtttctgct atctctggtt ctggtggttc tacctactac 180
gctgactctg ttaaaggtcg tttcaccatc tctcgtgaca actctaaaaa caccctgtac 240
ctgcaaatga actctctgcg tgctgaagac actgcagggc actaaatatg taacacactc 300
aatatcaaca tgacctcaaa cacaggctct tacaaaggta gaagaaattt tagttatgga 360
aaattgagct atgctaattg ttcccatagt ggaagtttga actgaagtcg tgcgcagaac 420
atcaagggca gtagaaactt tctatatcac gcaaggacat cgatatcgaa gcccgtaccg 480
tgagaacttt ttcagtacgg caaagtatac taggcctatt gcccttttcg taacttgtgc 540
gtattctctt tcatcactgt tcacaaccag taccttgtcc tcaaaaggtc atcacgttta 600
tttaaattcc cattcgaaag gcatacatcg tagtgccaag gcacactcgt taccgtctca 660
agtggtggcg gaggatccgg aggaggtggc tctggaggtg gcggttcaga catccagatg 720
acccagtctc cgtcttctct gtctgctagc gttggcgatc gtgttaccat cacctgccgt 780
gcttctcagt ctatctcttc ttacctgaac tggtatcagc agaaacccgg gaaagctccg 840
aaactgctga tctacgctgc ttcttctctt cagtctggtg ttccgtctcg tttctctggt 900
tctggttctg gcaccgactt caccctgacc atctcgagcc ttcagccgga agacttcgct 960
acctactact gccagcagtc ttactctacc ccgctgacct tcggtcaggg taccaaagtt 1020
gaaatcaaac gt 1032
<210> 8
<211> 5540
<212> DNA
<213> 人(Homo sapiens)
<220>
<221> source
<222> 1..5540
<223> /mol_type="其他DNA"
/note="基础载体VH3_VK1_v22"
/organism="人(Homo sapiens)"
<400> 8
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgcc cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaaccatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcataca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agcattgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctt tggagccttt tttttggaga ttttcaacgt gaaaaaatta 2280
ttattcgcaa ttcctttagt tgttcctttc tatgcggccc agccggcgat ggccgaagtt 2340
cagctgctgg aatctggtgg tggtctggtt cagccgggtg gttctctgcg tctgtcttgc 2400
gctgcttctg gtttcacctt ctcttcttac gctatgtctt gggttcgtca ggctccgggt 2460
aaaggtctgg aatgggtttc tgctatctct ggttctggtg gttctaccta ctacgctgac 2520
tctgttaaag gtcgtttcac catctctcgt gacaactcta aaaacaccct gtacctgcaa 2580
atgaactctc tgcgtgctga agacactgca gggcactaaa tatgtaacac actcaatatc 2640
aacatgacct caaacacagg ctcttacaaa ggtagaagaa attttagtta tggaaaattg 2700
agctatgcta attgttccca tagtggaagt ttgaactgaa gtcgtgcgca gaacatcaag 2760
ggcagtagaa actttctata tcacgcaagg acatcgatat cgaagcccgt accgtgagaa 2820
ctttttcagt acggcaaagt atactaggcc tattgccctt ttcgtaactt gtgcgtattc 2880
tctttcatca ctgttcacaa ccagtacctt gtcctcaaaa ggtcatcacg tttatttaaa 2940
ttcccattcg aaaggcatac atcgtagtgc caaggcacac tcgttaccgt ctcaagtggt 3000
ggcggaggat ccggaggagg tggctctgga ggtggcggtt cagacatcca gatgacccag 3060
tctccgtctt ctctgtctgc tagcgttggc gatcgtgtta ccatcacctg ccgtgcttct 3120
cagtctatct cttcttacct gaactggtat cagcagaaac ccgggaaagc tccgaaactg 3180
ctgatctacg ctgcttcttc tcttcagtct ggtgttccgt ctcgtttctc tggttctggt 3240
tctggcaccg acttcaccct gaccatctcg agccttcagc cggaagactt cgctacctac 3300
tactgccagc agtcttactc taccccgctg accttcggtc agggtaccaa agttgaaatc 3360
aaacgtgcgg ccgcacatca tcatcaccat cacggggccg cagaacaaaa actcatctca 3420
gaagaggatc tgaatggggc cgcatagact gttgaaagtt gtttagcaaa acctcataca 3480
gaaaattcat ttactaacgt ctggaaagac gacaaaactt tagatcgtta cgctaactat 3540
gagggctgtc tgtggaatgc tacaggcgtt gtggtttgta ctggtgacga aactcagtgt 3600
tacggtacat gggttcctat tgggcttgct atccctgaaa atgagggtgg tggctctgag 3660
ggtggcggtt ctgagggtgg cggttctgag ggtggcggta ctaaacctcc tgagtacggt 3720
gatacaccta ttccgggcta tacttatatc aaccctctcg acggcactta tccgcctggt 3780
actgagcaaa accccgctaa tcctaatcct tctcttgagg agtctcagcc tcttaatact 3840
ttcatgtttc agaataatag gttccgaaat aggcagggtg cattaactgt ttatacgggc 3900
actgttactc aaggcactga ccccgttaaa acttattacc agtacactcc tgtatcatca 3960
aaagccatgt atgacgctta ctggaacggt aaattcagag actgcgcttt ccattctggc 4020
tttaatgaag atccattcgt ttgtgaatat caaggccaat cgtctgacct gcctcaacct 4080
cctgtcaatg ctggcggcgg ctctggtggt ggttctggtg gcggctctga gggtggcggc 4140
tctgagggtg gcggttctga gggtggcggc tctgagggtg gcggttccgg tggcggctcc 4200
ggttccggtg attttgatta tgaaaaaatg gcaaacgcta ataagggggc tatgaccgaa 4260
aatgccgatg aaaacgcgct acagtctgac gctaaaggca aacttgattc tgtcgctact 4320
gattacggtg ctgctatcga tggtttcatt ggtgacgttt ccggccttgc taatggtaat 4380
ggtgctactg gtgattttgc tggctctaat tcccaaatgg ctcaagtcgg tgacggtgat 4440
aattcacctt taatgaataa tttccgtcaa tatttacctt ctttgcctca gtcggttgaa 4500
tgtcgccctt atgtctttgg cgctggtaaa ccatatgaat tttctattga ttgtgacaaa 4560
ataaacttat tccgtggtgt ctttgcgttt cttttatatg ttgccacctt tatgtatgta 4620
ttttcgacgt ttgctaacat actgcgtaat aaggagtctt aataagaatt cactggccgt 4680
cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc caacttaatc gccttgcagc 4740
acatccccct ttcgccagct ggcgtaatag cgaagaggcc cgcaccgctc gcccttccca 4800
acagttgcgc agcctgaatg gcgaatggcg cctgatgcgg tattttctcc ttacgcatct 4860
gtgcggtatt tcacaccgca tataaattgt aaacgttaat attttgttaa aattcgcgtt 4920
aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta 4980
taaatcaaaa gaatagcccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc 5040
actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg 5100
cccactacgt gaaccatcac ccaaatcaag ttttttgggg tcgaggtgcc gtaaagcact 5160
aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt 5220
ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc 5280
ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgta 5340
ctatggttgc tttgacgggt gcagtctcag tacaatctgc tctgatgccg catagttaag 5400
ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 5460
atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 5520
gtcatcaccg aaacgcgcga 5540
<210> 9
<211> 15
<212> DNA
<213> 人(Homo sapiens)
<220>
<221> source
<222> 1..15
<223> /mol_type="其他DNA"
/note="Sty_反向_1"
/organism="人(Homo sapiens)"
<400> 9
ccgaccttgg cccca 15
<210> 10
<211> 27
<212> DNA
<213> 人(Homo sapiens)
<220>
<221> source
<222> 1..27
<223> /mol_type="其他DNA"
/note="PstI_正向 _1引物"
/organism="人(Homo sapiens)"
<400> 10
cgaaaagcac ctgcagtgta ttactgc 27
<210> 11
<211> 19
<212> DNA
<213> 人(Homo sapiens)
<220>
<221> source
<222> 1..19
<223> /mol_type="其他DNA"
/note="Sty_反向_2引物"
/organism="人(Homo sapiens)"
<400> 11
ctgaccgacc tgggcccca 19

Claims (10)

1.一种总复杂度为C的载体或遗传包装的文库,其展示和表达或包含抗体相关的肽、多肽或蛋白的多样化家族成员,并且共同展示和表达或包含抗体家族的至少部分多样性,其中所述载体或遗传包装包含多样的DNA序列,所述DNA序列编码具有以下序列的HC-CDR3区和HC-CDR3区之前的位置:
ZX1YnX3X4X5
其中:
C=1.3x1010
Z对应于Kabat位置94;
X1对应于Kabat位置95;
n是3至11的整数;
Y对应于HC Kabat位置96至98(n=3)、或HC Kabat位置96至99(n=4)、或HC Kabat位置96至100(n=5)、或HC Kabat位置96至100a(n=6)、或HC Kabat位置96至100b(n=7)、或HCKabat位置96至100c(n=8)、或HC Kabat位置96至100d(n=9)、或HC Kabat位置96至100e(n=10)或HC Kabat位置96至100f(n=11);
X3对应于HC Kabat位置99(n=3)、或HC Kabat位置100(n=4)、或HC Kabat位置100a(n=5)、或HC Kabat位置100b(n=6)、或HC Kabat位置100c(n=7)、或HC Kabat位置100d(n=8)、或HC Kabat位置100e(n=9)、或HC Kabat位置100f(n=10)、或HC Kabat位置100g(n=11);
X4对应于HC Kabat位置101;
X5对应于HC Kabat位置102;
其特征在于,根据表2C中给出的值,每个ZX1YnX3X4X5区的百分比分数p(L)(L=n+4)存在于文库中;
并且根据表3A-3I公开的相对频率,对于每个长度为L=n+4的HC-CDR3区,位置Z、X1、X2、X3、X4、X5和Yn(n=3至11)被限定的氨基酸占据。
2.根据权利要求1所述的载体或遗传包装的文库,其中所述抗体相关的肽、多肽或蛋白是抗体或其片段,其选自包含一个或多个恒定结构域的抗体、单链抗体、FAB片段、仅有重链的抗体或仅有可变重链的结构域。
3.根据前述权利要求中任一项所述的载体或遗传包装的文库,其中所述抗体相关的肽、多肽和蛋白包含人抗体种系可变区段。
4.根据前述权利要求中任一项所述的载体或遗传包装的文库,其中所述抗体相关的肽、多肽和蛋白包含含有人种系序列的人抗体VK1轻链可变结构域、和含有人种系序列的人抗体VH3重链可变结构域。
5.根据权利要求4所述的载体或遗传包装的文库,其中VK1κ轻链可变结构域含有人种系序列SEQ ID N.3和SEQ ID N.4,轻链CDR3区含有序列SEQ ID N.5,以及VH3重链可变结构域含有人种系序列SEQ ID N.1和SEQ ID N.2。
6.根据权利要求4所述的载体或遗传包装的文库,其特征在于包含人种系序列的VH3重链可变结构域通过SEQ ID N.6的接头与包含人种系序列的人抗体VK1κ轻链可变结构域连接。
7.根据前述权利要求中任一项所述的载体或遗传包装的文库,其特征在于用于产生所述文库的基础载体具有SEQ ID 8。
8.根据前述权利要求中任一项所述的载体或遗传包装的文库,其用于针对靶标抗原进行选择。
9.根据权利要求8所述的载体或遗传包装的文库,其特征在于所述文库展示在噬菌体上用于针对靶标抗原进行选择。
10.根据权利要求1至9中任一项所述的载体或遗传包装的文库,其特征在于所述文库具有限于HC-CDR3区和HC-CDR3之前位置的多样性。
CN201780054632.8A 2016-09-08 2017-09-06 具有降低的组合冗余度和优化的环长度分布的hc-cdr3-专一文库 Active CN109689947B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16187884.8A EP3293293A1 (en) 2016-09-08 2016-09-08 Hc-cdr3-only libraries with reduced combinatorial redundancy and optimized loop length distribution
EP16187884.8 2016-09-08
PCT/EP2017/072315 WO2018046525A1 (en) 2016-09-08 2017-09-06 Hc-cdr3-only libraries with reduced combinatorial redundancy and optimized loop length distribution

Publications (2)

Publication Number Publication Date
CN109689947A true CN109689947A (zh) 2019-04-26
CN109689947B CN109689947B (zh) 2022-06-21

Family

ID=56889022

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780054632.8A Active CN109689947B (zh) 2016-09-08 2017-09-06 具有降低的组合冗余度和优化的环长度分布的hc-cdr3-专一文库

Country Status (19)

Country Link
US (1) US10745696B2 (zh)
EP (2) EP3293293A1 (zh)
JP (1) JP6974909B2 (zh)
KR (1) KR102281476B1 (zh)
CN (1) CN109689947B (zh)
AU (1) AU2017323432C1 (zh)
CA (1) CA3035435A1 (zh)
DK (1) DK3510187T3 (zh)
ES (1) ES2966283T3 (zh)
FI (1) FI3510187T3 (zh)
HR (1) HRP20231434T1 (zh)
HU (1) HUE063973T2 (zh)
IL (1) IL265146B (zh)
LT (1) LT3510187T (zh)
PL (1) PL3510187T3 (zh)
PT (1) PT3510187T (zh)
RU (1) RU2745452C2 (zh)
SI (1) SI3510187T1 (zh)
WO (1) WO2018046525A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109160948B (zh) * 2018-09-21 2021-07-16 成都阿帕克生物科技有限公司 一种乙肝表面抗原纳米抗体及核酸分子和应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101389655A (zh) * 2005-12-20 2009-03-18 莫佛塞斯公司 新的hcdr3区域集合及其应用
WO2009114815A1 (en) * 2008-03-13 2009-09-17 Dyax Corp Libraries of genetic packages comprising novel hc cdr3 designs
CN101548034A (zh) * 2006-10-02 2009-09-30 航道生物技术有限责任公司 多样性合成肽和多肽文库的设计和构建
WO2009132287A2 (en) * 2008-04-24 2009-10-29 Dyax Corp. Libraries of genetic packages comprising novel hc cdr1, cdr2, and cdr3 and novel lc cdr1, cdr2, and cdr3 designs
US20110082054A1 (en) * 2009-09-14 2011-04-07 Dyax Corp. Libraries of genetic packages comprising novel hc cdr3 designs

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2316940B1 (en) 2000-12-18 2013-07-24 Dyax Corp. Focused libraries of genetic packages
WO2005012531A2 (en) * 2003-08-01 2005-02-10 Genentech, Inc. Antibody cdr polypeptide sequences with restricted diversity
BRPI0513135A (pt) * 2004-07-06 2008-04-29 Bioren Inc bibliotecas de polinucleotìdeos, método de produção das mesmas, método de identificação de um polinucleotìdeo, região de ligação, meio adequado para uso em um, dispositivo eletrÈnico e dispositivo
US7226460B2 (en) 2004-08-02 2007-06-05 Karl Storz Endovision, Inc. Surgical instrument attachment system
EP2193146B1 (en) * 2007-09-14 2016-05-25 Adimab, LLC Rationally designed, synthetic antibody libraries and uses therefor
MX2011000041A (es) * 2008-07-02 2011-05-23 Emergent Product Dev Seattle Proteinas antagonistas del factor-alfa de necrosis tumoral (tnf-alfa), de union a multiples objetivos.
WO2016114567A1 (ko) * 2015-01-13 2016-07-21 이화여자대학교 산학협력단 신규 항체 라이브러리 제조방법 및 이로부터 제조된 라이브러리

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101389655A (zh) * 2005-12-20 2009-03-18 莫佛塞斯公司 新的hcdr3区域集合及其应用
CN101548034A (zh) * 2006-10-02 2009-09-30 航道生物技术有限责任公司 多样性合成肽和多肽文库的设计和构建
WO2009114815A1 (en) * 2008-03-13 2009-09-17 Dyax Corp Libraries of genetic packages comprising novel hc cdr3 designs
WO2009132287A2 (en) * 2008-04-24 2009-10-29 Dyax Corp. Libraries of genetic packages comprising novel hc cdr1, cdr2, and cdr3 and novel lc cdr1, cdr2, and cdr3 designs
US20110082054A1 (en) * 2009-09-14 2011-04-07 Dyax Corp. Libraries of genetic packages comprising novel hc cdr3 designs

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ACHIM KNAPPIK等: "Fully synthetic human combinatorial antibody libraries (HuCAL) based on modular consensus frameworks and CDRs randomized with trinucleotides", 《J MOL BIOL》 *
JOSEF PRASSLER等: "HuCAL PLATINUM, a synthetic Fab library optimized for sequence diversity and superior performance in mammalian expression systems", 《J MOL BIOL》 *
PATRICK MIQUEU等: "Statistical analysis of CDR3 length distributions for the assessment of T and B cell repertoire biases", 《MOLECULAR IMMUNOLOGY》 *
戴和平: "抗体库的起源、发展及应用前景", 《生物工程学报》 *
董志伟等编: "二、抗体分子的功能区结构", 《抗体工程(第二版)》 *

Also Published As

Publication number Publication date
AU2017323432A1 (en) 2019-03-21
DK3510187T3 (da) 2023-11-20
WO2018046525A1 (en) 2018-03-15
HRP20231434T1 (hr) 2024-03-01
LT3510187T (lt) 2023-11-10
KR20190044650A (ko) 2019-04-30
EP3510187B1 (en) 2023-09-06
PT3510187T (pt) 2023-11-03
US10745696B2 (en) 2020-08-18
JP2019528712A (ja) 2019-10-17
EP3293293A1 (en) 2018-03-14
RU2019109949A (ru) 2020-10-09
IL265146B (en) 2020-09-30
HUE063973T2 (hu) 2024-02-28
PL3510187T3 (pl) 2024-01-22
FI3510187T3 (fi) 2023-10-31
KR102281476B1 (ko) 2021-07-28
ES2966283T3 (es) 2024-04-19
RU2019109949A3 (zh) 2021-01-21
JP6974909B2 (ja) 2021-12-01
RU2745452C2 (ru) 2021-03-25
CN109689947B (zh) 2022-06-21
US20190211326A1 (en) 2019-07-11
CA3035435A1 (en) 2018-03-15
EP3510187A1 (en) 2019-07-17
SI3510187T1 (sl) 2023-12-29
AU2017323432B2 (en) 2020-08-13
AU2017323432C1 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
US6472147B1 (en) Methods for display of heterodimeric proteins on filamentous phage using pVII and pIX, compositions, vectors and combinatorial libraries
US20210388339A1 (en) Method for engineering immunoglobulins
CA2722409C (en) Libraries of genetic packages comprising novel hc cdr1, cdr2, and cdr3 and novel lc cdr1, cdr2, and cdr3 designs
US11926926B2 (en) Libraries of genetic packages comprising novel HC CDR3 designs
US6495321B1 (en) Method for in vitro molecular evolution of protein function
JP5149476B2 (ja) ペプチドの多種多様なファミリーのメンバーとしての、遺伝的パッケージの提示ライブラリーを構築する方法
CA2518944C (en) Inhibitors of extracellular hsp90
CN107793479B (zh) 一种抗cd19抗体及其制备方法和用途
CN107793480A (zh) 一种抗cd19抗体及其制备方法和用途
CA2715297A1 (en) Improved methods for producing specific binding pairs
CA2773564A1 (en) Libraries of genetic packages comprising novel hc cdr3 designs
CN108949721A (zh) 表达磷脂酶d的重组菌株及应用
WO1995034664A1 (en) Method of detecting ligand interactions
KR102281476B1 (ko) 감소된 조합 중복성 및 최적화된 루프 길이 분포를 갖는 hc-cdr3-단독 라이브러리
KR101654890B1 (ko) 면역글로불린 g에 대한 리피바디 및 그 용도
CN110857320A (zh) 能够结合诺如病毒的抗体、使用其的复合材料、检测装置和方法
KR20210053932A (ko) 사람 백혈구 항원에 의해 제공된 무작위화된 펩타이드 라이브러리
KR101806129B1 (ko) 인간 scFv 항체 파지 표면제시 라이브러리를 이용한 식물 바이러스 항체 생산 방법
KR101572219B1 (ko) 반복모듈을 포함하는 리피바디 단백질의 개량방법
DK2516702T3 (en) PROTEIN DISPLAY
CN110857321A (zh) 能够结合诺如病毒的抗体、使用其的复合材料、检测装置和方法
CN114317584B (zh) 新型转座子突变株文库的构建系统、新型转座子突变文库和应用
CN111118049B (zh) 质粒载体及其应用
CN106978445A (zh) CRISPER‑Cas9系统介导的山羊EDAR基因敲除的方法
CN108504656A (zh) 启动子增强系统及其在细菌中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: A. Ram

Inventor after: C. Steinqueller

Inventor after: G. Filocamo

Inventor before: A. Ram

Inventor before: C. Steinqueller

GR01 Patent grant
GR01 Patent grant