CN115667532A - 具有共有轻链免疫球蛋白基因座的经遗传修饰的非人动物 - Google Patents

具有共有轻链免疫球蛋白基因座的经遗传修饰的非人动物 Download PDF

Info

Publication number
CN115667532A
CN115667532A CN202180039972.XA CN202180039972A CN115667532A CN 115667532 A CN115667532 A CN 115667532A CN 202180039972 A CN202180039972 A CN 202180039972A CN 115667532 A CN115667532 A CN 115667532A
Authority
CN
China
Prior art keywords
human
animal
genes
gene
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180039972.XA
Other languages
English (en)
Inventor
张雅博
陆辉
赵会珍
姚佳维
杨毅
沈月雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baccetus Beijing Pharmaceutical Technology Co ltd
Original Assignee
Baccetus Beijing Pharmaceutical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baccetus Beijing Pharmaceutical Technology Co ltd filed Critical Baccetus Beijing Pharmaceutical Technology Co ltd
Publication of CN115667532A publication Critical patent/CN115667532A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2881Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against CD71
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/40Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against enzymes
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/01Animal expressing industrially exogenous proteins
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/02Animal zootechnically ameliorated
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Environmental Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Zoology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biotechnology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

提供了具有人源化轻链免疫球蛋白基因座的经遗传修饰的动物,其中内源性轻链免疫球蛋白基因座包含有限数量的人IGKV和IGKJ基因;从所述动物获得的细胞;以及将所述动物暴露于抗原的方法。

Description

具有共有轻链免疫球蛋白基因座的经遗传修饰的非人动物
优先权声明
本申请要求于2020年6月02日提交的PCT申请号PCT/CN 2020/094000、以及于2021年4月07日提交的PCT申请号PCT/CN 2021/085839的权益。前述全部内容通过引用并入本文。
技术领域
本公开涉及具有人源化轻链免疫球蛋白基因座和/或人源化重链免疫球蛋白基因座的经遗传修饰的动物和细胞。
背景技术
抗体是结合特异性抗原的免疫蛋白。通常,抗体对靶标具有特异性,具有介导免疫效应子机制的能力,并且在血清中具有长的半衰期。此类性质使抗体成为强大的治疗剂。单克隆抗体在治疗上用于治疗多种病症,包括癌症、传染性疾病、自身免疫性疾病以及炎性疾病。许多新型抗体形式已经被提出用于多种治疗目的。例如,双特异性抗体可以与两个不同的靶标或者靶标上两个不同的表位结合,产生优于单克隆抗体作用的累加作用或协同作用。然而,由于错配问题,制造双特异性抗体具有挑战性。
此外,这些治疗性抗体通常是人抗体或人源化抗体。人抗体或人源化抗体可通过啮齿动物抗体(例如,小鼠抗体)的人源化或通过使用噬菌体文库来产生。通过这些方法产生的抗体通常具有次优的结合亲和力和生物物理属性,造成制造方面的困难和较差的药代动力学。特别地,人源化过程可能给结合亲和力带来不利影响,并将免疫原性表位引入抗体,并且使用噬菌体文库发现的抗体显示免疫球蛋白重链和轻链的有限多样性和非天然配对。经常需要迭代和耗时的实验来改善性质。并且在一些情况下,这些抗体还会使患者产生免疫原性。
需要产生人源化抗体的有效且具有成本效益的方法,并且特别需要生成用于多种治疗目的的人源化双特异性抗体的平台。
发明内容
本公开涉及具有人源化重链和轻链免疫球蛋白基因座的经遗传修饰的动物和细胞。在一些实施方案中,经遗传修饰的动物在内源性轻链免疫球蛋白基因座处具有一组有限数量的人IGKV和IGKJ基因。在一方面,如本文所述的经遗传修饰的动物可以产生免疫球蛋白轻链可变结构域,所述免疫球蛋白轻链可变结构域可以与相当多样化的重链可变结构域家族配对,包括例如亲和力成熟的或体细胞突变的可变结构域。
在一方面,本公开提供了经遗传修饰的非人动物,经遗传修饰的非人动物在内源性轻链免疫球蛋白基因座处包含外源性轻链可变区基因序列。在一些实施方案中,所述外源性轻链可变区基因序列包含不超过三个人IGKV基因和不超过两个人IGKJ基因。在一些实施方案中,所述不超过三个人IGKV基因和所述不超过两个人IGKJ基因都可操作性地连接至内源性轻链恒定结构域基因。
在一些实施方案中,所述不超过三个人IGKV基因选自表1,并且所述不超过两个人IGKJ基因选自表2。
在一些实施方案中,所述外源性轻链可变区基因序列包含一个人IGKV基因和一个人IGKJ基因。
在一些实施方案中,所述外源性轻链可变区基因序列进一步包含人IGKJ 3'-UTR序列。在一些实施方案中,所述动物的一个或多个细胞中的所述外源性轻链可变区基因序列可发生体细胞超变。
在一些实施方案中,所述体细胞超变可导致所述动物的一个或多个细胞中的轻链可变区中多达一个、两个或三个氨基酸变化。
在一些实施方案中,外源性轻链可变区基因序列包含一个人IGKV基因和一个人IGKJ基因。在一些实施方案中,所述人IGKV基因选自由IGKV3-20、IGKV3-11和IGKV1-39组成的组。在一些实施方案中,所述人IGKV基因和所述人IGKJ基因可操作性地连接。在一些实施方案中,所述人IGKV基因是IGKV3-11。在一些实施方案中,所述人IGKJ基因选自由IGKJ1和IGKJ4组成的组。在一些实施方案中,所述人IGKV基因是IGKV1-39,并且所述人IGKJ基因是IGKJ4。在一些实施方案中,所述人IGKV基因是IGKV3-11,并且所述人IGKJ基因是IGKJ1。在一些实施方案中,所述人IGKV基因是IGKV3-20,并且所述人IGKJ基因是IGKJ1。在一些实施方案中,所述动物进一步包含可操作性地连接至所述人IGKV基因的启动子序列。在一些实施方案中,所述启动子序列在所述人IGKV基因的2500bp或3000bp内。在一些实施方案中,所述启动子是IGKV3-20启动子、IGKV3-11启动子或IGKV1-39启动子。
在一些实施方案中,所述动物包含在动物的内源性轻链免疫球蛋白基因座中的破坏。在一些实施方案中,所述动物是小鼠,并且所述动物的内源性轻链免疫球蛋白基因座中的破坏包括表3中的一个或多个小鼠IGKV基因和表4中的一个或多个小鼠IGKJ基因的缺失。在一些实施方案中,所述动物是小鼠,并且所述动物的内源性轻链免疫球蛋白基因座中的破坏包括从小鼠IGKV2-137开始至小鼠IGKJ5的序列的缺失。
在一些实施方案中,所述动物包含内源性IGKC。在一些实施方案中,所述动物进一步包含相对于所述内源性IGKC的κ内含子型增强子5'和/或κ3'增强子。
在一些实施方案中,所述人轻链可变区是重排序列。
在一些实施方案中,所述动物相对于所述轻链免疫球蛋白基因座是纯合的。在一些实施方案中,所述动物相对于所述轻链免疫球蛋白基因座是杂合的。在一些实施方案中,所述动物包含在动物的内源性λ轻链免疫球蛋白基因座中的破坏。
在一些实施方案中,所述动物是啮齿动物(例如,小鼠)。
在一些实施方案中,所述动物在内源性重链免疫球蛋白基因座上进一步包含一个或多个人IGHV基因、一个或多个人IGHD基因和一个或多个人IGHJ基因。在一些实施方案中,人IGHV基因、人IGHD基因和人IGHJ基因可操作性地连接,并且可进行VDJ重排。
在一些实施方案中,所述动物包含选自表5的至少150个人IGHV基因、选自表6的至少20个人IGHD基因和选自表7的至少5个人IGHJ基因。在一些实施方案中,所述动物包含在人受试者的人14号染色体上的内源性重链免疫球蛋白基因座上的所有人IGHV基因、所有人IGHD基因和所有人IGHJ基因。在一些实施方案中,所述动物包含在人细胞的人14号染色体的内源性重链免疫球蛋白基因座上的所有人IGHV基因、所有人IGHD基因和所有人IGHJ基因。在一些实施方案中,所述动物包含源自人重链免疫球蛋白基因座的未修饰的人序列。在一些实施方案中,所述未修饰的人序列至少为800kb。
在一些实施方案中,所述动物包含源自人重链免疫球蛋白基因座的从人IGHV(III)-82开始至人IGHV1-2的未修饰的人序列。在一些实施方案中,所述动物包含源自人重链免疫球蛋白基因座的从人IGHV(III)-82开始至人IGHV6-1的未修饰的人序列。在一些实施方案中,所述动物包含源自人重链免疫球蛋白基因座的从人IGHD1-1开始至人IGHJ6的未修饰的人序列。在一些实施方案中,所述动物包含源自人重链免疫球蛋白基因座的从人IGHV(III)-82开始至人IGHJ6的未修饰的人序列。在一些实施方案中,所述动物包含IGHV(III)-82、IGHV7-81、IGHV4-80、IGHV3-79、IGHV(II)-78-1、IGHV5-78、IGHV7-77、IGHV(III)-76-1、IGHV3-76、IGHV3-75和IGHV(II)-74-1。在一些实施方案中,所述动物包含IGHV5-10-1和IGHV3-64D。
在一些实施方案中,所述动物在内源性重链免疫球蛋白基因座上进一步包含:包含一个或多个人IGHV基因的第一序列;包含内源性序列的第二序列;以及包含一个或多个人IGHD基因和一个或多个人IGHJ基因的第三序列。在一些实施方案中,所述第一序列、第二序列和第三序列可操作性地连接。
在一些实施方案中,所述第一序列包含选自表5的至少150个人IGHV基因。在一些实施方案中,所述第一序列包含选自表6的至少20个人IGHD基因。在一些实施方案中,所述第一序列是源自人重链免疫球蛋白基因座的未修饰的序列。在一些实施方案中,所述第一序列至少为800kb。在一些实施方案中,所述第二序列包含至少3kb的内源性序列。在一些实施方案中,所述第三序列包含选自表6的至少20个人IGHD基因和选自表7的至少5个人IGHJ基因。
在一些实施方案中,所述第三序列包含表6中的所有人IGHD基因和表7中的所有人IGHJ基因。在一些实施方案中,所述第三序列是源自人重链免疫球蛋白基因座的未修饰的序列。在一些实施方案中,所述第三序列至少为50kb。在一些实施方案中,所述动物包含在所述动物的内源性重链免疫球蛋白基因座中的破坏。
在一些实施方案中,所述动物是小鼠,并且所述动物的内源性重链免疫球蛋白基因座中的破坏包含表8中的一个或多个小鼠IGHV基因、表9中的一个或多个小鼠IGHD基因和表10中的一个或多个小鼠IGHJ基因的缺失。在一些实施方案中,所述动物是小鼠,并且所述动物的内源性重链免疫球蛋白基因座中的破坏包括从小鼠IGHV1-85开始至小鼠IGHJ4的序列的缺失。在一些实施方案中,所述动物包含一个或多个内源性IGHM、IGHδ、IGHG3、IGHG1、IGHG2b、IGHG2a、IGHE和IGHA基因。
在一些实施方案中,所述动物相对于所述重链免疫球蛋白基因座是纯合的。在一些实施方案中,所述动物相对于所述重链免疫球蛋白基因座是杂合的。
在一方面,本公开提供一种经遗传修饰的非人动物,其基因组包含内源性轻链免疫球蛋白基因座,所述内源性轻链免疫球蛋白基因座包含:一个或多个内源性IGKV被一个或多个选自表1的人IGKV基因取代;以及一个或多个内源性IGKJ基因被一个或多个选自表2的人IGKJ基因取代。在一些实施方案中,所述人IGKV基因和所述人IGKJ基因可操作性地连接至内源性IGKC基因。
在一些实施方案中,所述一个或多个人IGKV基因选自由IGKV3-20、IGKV3-11和IGKV1-39组成的组。在一些实施方案中,所述人IGKV基因是IGKV3-11。在一些实施方案中,所述一个或多个人IGKJ基因选自由IGKJ1和IGKJ4组成的组。在一些实施方案中,所述动物进一步包含人IGKJ 3'-UTR序列的插入。在一些实施方案中,所述人IGKV基因是IGKV1-39,并且所述人IGKJ基因是IGKJ4。在一些实施方案中,所述人IGKV基因是IGKV3-11,并且所述人IGKJ基因是IGKJ1。在一些实施方案中,所述人IGKV基因是IGKV3-20,并且所述人IGKJ基因是IGKJ1。在一些实施方案中,所有内源性IGKV基因都取代为所述一个或多个人IGKV基因。在一些实施方案中,所有内源性IGKJ基因都取代为所述一个或多个人IGKJ基因。
在一些实施方案中,所述动物进一步包含在所述人IGKV基因之前的启动子序列。在一些实施方案中,所述启动子序列在所述人IGKV基因的3000bp内。在一些实施方案中,所述动物在所述内源性IGKC的5'进一步包含κ内含子型增强子。在一些实施方案中,所述动物进一步包含κ3'增强子。
在一些实施方案中,所述动物的基因组进一步包含内源性重链免疫球蛋白基因座,所述内源性重链免疫球蛋白基因座包含:一个或多个内源性IGHV、内源性IGHD和内源性IGHJ基因被一个或多个人IGHV、人IGHD和人IGHJ基因取代。在一些实施方案中,所述一个或多个人IGHV、人IGHD和人IGHJ基因可操作性地连接至内源性IGHM、IGHδ、IGHG、IGHE和IGHA基因的一个或多个。在一些实施方案中,所述一个或多个内源性IGHV、内源性IGHD和内源性IGHJ基因被取代为表5中的至少150个人IGHV基因、表6中的至少20个人IGHD基因和表7中的至少5个人IGHJ基因。
在一些实施方案中,所述动物是小鼠,并且表8中的至少180个小鼠IGHV基因、表9中的所有小鼠IGHD基因和表10中的所有小鼠IGHJ基因被取代。
在一些实施方案中,所述动物缺乏能够重排和形成编码内源性重链可变结构域(例如,小鼠重链可变结构域)的核酸序列的内源性免疫球蛋白重链可变区基因座。在一些实施方案中,所述动物缺乏能够重排和形成编码内源性轻链可变结构域(例如,小鼠轻链可变结构域)的核酸序列的内源性免疫球蛋白轻链可变区基因座。
在一些实施方案中,所述动物可产生人源化抗体。在一些实施方案中,所述抗体包含由所述IGKV基因和IGKJ基因编码的轻链可变区。
在一方面,本公开提供从如本文所述的动物获得的细胞。在一些实施方案中,所述细胞是表达嵌合免疫球蛋白轻链的B细胞,所述嵌合免疫球蛋白轻链包含由人IGKV基因和人IGKJ基因编码的免疫球蛋白轻链可变结构域,所述人IGKV基因选自由IGKV3-20、IGKV3-11和IGKV1-39组成的组,并且所述人IGKJ基因选自由IGKJ1和IGKJ4组成的组。在一些实施方案中,所述免疫球蛋白轻链可变结构域可操作性地连接至非人轻链恒定区。
在一些实施方案中,B细胞表达嵌合免疫球蛋白重链,所述嵌合免疫球蛋白重链包含免疫球蛋白重链可变结构域,所述免疫球蛋白重链可变结构域源自一个或多个人IGHV基因、一个或多个人IGHD基因和一个或多个人IGHJ基因的重排。在一些实施方案中,所述免疫球蛋白重链可变结构域可操作性地连接至非人重链恒定区。
在一些实施方案中,所述细胞是胚胎干(ES)细胞。
在一方面,本公开提供了一种制备与抗原特异性结合的嵌合抗体的方法,所述方法包括将如本文所述的动物暴露于抗原;从所述动物收集的细胞产生杂交瘤;以及收集由所述杂交瘤产生的所述嵌合抗体。
在一些实施方案中,所述方法进一步包括对所述杂交瘤的基因组进行测序。
在一方面,本公开提供了一种制备与抗原特异性结合的抗体的方法,所述方法包括将如本文所述的动物暴露于抗原;对细胞中编码人重链和轻链免疫球蛋白可变区的核酸进行测序,所述细胞表达与所述抗原特异性结合的嵌合抗体;以及在细胞中将编码所述人重链免疫球蛋白可变区的所述核酸与编码人重链免疫球蛋白恒定区的核酸可操作性地连接,以及将编码所述人轻链免疫球蛋白可变区的所述核酸与编码人轻链免疫球蛋白恒定区的核酸可操作性地连接。
在一方面,本公开提供一种制备与抗原特异性结合的抗体的方法,所述方法包括在表达与所述抗原特异性结合的嵌合抗体的细胞中获得编码人重链和轻链免疫球蛋白可变区的核酸序列,其中通过将如本文所述的动物暴露于所述抗原获得所述细胞;将编码所述人重链免疫球蛋白可变区的所述核酸与编码人重链免疫球蛋白恒定区的核酸可操作性地连接,以及将编码所述人轻链免疫球蛋白可变区的核酸与编码人轻链免疫球蛋白恒定区的核酸可操作性地连接;以及在细胞中表达所述核酸,从而获得所述抗体。
在一方面,本公开提供了一种获得编码与抗原特异性结合的抗体结合结构域的核酸的方法,所述方法包括将如本文所述的动物暴露于抗原;以及对细胞中编码人重链和轻链免疫球蛋白可变区的核酸进行测序,所述细胞表达与所述抗原特异性结合的嵌合抗体。
在一方面,本公开提供了获得样品的方法,所述方法包括将如本文所述的动物暴露于所述抗原;以及从所述动物收集所述样品。在一些实施方案中,所述样品是脾组织、脾细胞或B细胞。
在一方面,本公开提供了一种制备双特异性抗体的方法,所述方法包括:在细胞中表达编码包含人VL的轻链多肽的核酸序列、编码包含第一人VH的第一重链多肽的核酸序列和编码包含第二人VH的第二重链多肽的核酸序列,其中,编码所述第一VH的序列是从如本文所述的动物暴露于第一抗原后获得的,并且编码所述第二VH的序列是从所述动物或不同的动物暴露于第二抗原后获得的。
在一些实施方案中,所述第一VH和所述VL形成对所述第一抗原特异性结合的第一抗原结合位点。在一些实施方案中,所述第二VH和所述VL形成对所述第二抗原特异性结合的第二抗原结合位点。
在一方面,本公开提供了包含人轻链可变区的抗体或其抗原结合片段,所述人轻链可变区具有与SEQ ID NO:38、39或40至少90%、95%或98%相同的序列。
在一方面,本公开提供了多个抗体或其抗原结合片段,其中每个抗体或其抗原结合片段包含人轻链可变区,所述人轻链可变区具有与SEQ ID NO:38、39或40至少90%、95%或98%相同的序列。
在一方面,本公开提供了一种制备与目标蛋白特异性结合的抗体的方法,所述方法包括:将如本文所述的动物暴露于目标蛋白,其中所述动物不表达与所述目标蛋白同源的内源性蛋白;以及对细胞中编码人重链和轻链免疫球蛋白可变区的核酸进行测序,所述细胞表达与所述目标蛋白特异性结合的抗体。
在一些实施方案中,编码所述内源性蛋白的基因在所述动物体内被破坏。在一些实施方案中,编码所述内源性蛋白的所述基因被敲除。
在一些实施方案中,所述内源性蛋白与所述目标蛋白至少有80%、90%、95%同源。在一些实施方案中,所述内源性蛋白与所述目标蛋白至少有80%、90%或95%相同。
在一些实施方案中,所述目标蛋白是人蛋白。在一些实施方案中,所述目标蛋白是PD-1、CTLA-4、LAG-3、BTLA、PD-L1、CD27、CD28、CD47、CD137、CD154、TIGIT、TIM-3、GITR、SIRPa或OX40。
除非另有定义,否则本文使用的所有技术术语和科学术语具有与本发明所属领域之内的普通技术人员通常所理解的相同的含义。本文描述了用于在本发明中使用的方法及材料;还可使用本领域已知的其他合适方法及材料。材料、方法及实施例仅为说明性而不旨在限制。本文所提及的所有出版物、专利申请、专利、序列、数据库条目及其他参考文献均通过引用以其全文并入本文。在出现冲突情况下,以本说明书(包括定义)为准。
根据以下具体实施方式以及附图和权利要求书,本发明的其他特征和优点将变得明显。
附图说明
图1A是将人免疫球蛋白基因引入小鼠基因组的方法的流程图。
图1B是用人免疫球蛋白重链可变区取代小鼠免疫球蛋白重链可变区的概述。
图2A示出了顶部使用的人κ链V区基因。
图2B示出了顶部使用的人κ链J区基因。
图3A是示出小鼠轻链免疫球蛋白基因座的示意图。
图3B是用重排人IGKV和IGKJ基因取代小鼠免疫球蛋白轻链可变区基因的概述。
图4是示出κ轻链基因人源化的靶向策略的示意图。
图5A是示出野生型(WT)和hVH/hcVL杂合的小鼠体重的直方图。
图5B是示出野生型(WT)和hVH/hcVL杂合的小鼠肝脏重量的直方图。
图5C是示出野生型(WT)和hVH/hcVL杂合的小鼠胸腺重量的直方图。
图5D是示出野生型(WT)和hVH/hcVL杂合的小鼠脾重量的直方图。
图5E是示出野生型(WT)和hVH/hcVL杂合的小鼠肺重量的直方图。
图5F是示出野生型(WT)和hVH/hcVL杂合的小鼠心脏重量的直方图。
图5G是示出野生型(WT)和hVH/hcVL杂合的小鼠肾重量的直方图。
图6A是示出了流式细胞术进行的血液免疫细胞百分比的直方图。血液免疫细胞来自野生型或hVH/hcVL小鼠。
图6B是示出了流式细胞术进行的脾脏中免疫细胞百分比的直方图。免疫细胞来自野生型或hVH/hcVL小鼠。
图7是示出了流式细胞术进行的淋巴结免疫细胞百分比的直方图。淋巴结免疫细胞来自野生型或hVH/hcVL小鼠。
图8A示出了骨髓B细胞中原B细胞(B220CD43IgM)、前B细胞(B220CD43IgM)和未成熟B细胞(B220CD43IgM)群的百分比。骨髓B细胞来自野生型或hVH/hcVL小鼠。
图8B示出了骨髓B细胞中浆细胞(B220IgM-IgD-CD138+)和记忆B细胞(B220+IgM+IgD-CD38+)群的百分比。骨髓B细胞来自野生型或hVH/hcVL小鼠。
图9示出了脾B细胞中过渡1型(T1,B220+IgM+IgD-),过渡2型(T2,B220+IgM+IgD+)和成熟B细胞(M,B220+IgMIgD+)群的百分比。脾B细胞来自野生型或hVH/hcVL小鼠。
图10A示出了脾B细胞中浆细胞(B220IgM-IgD-CD138+)群的百分比。脾B细胞来自野生型或hVH/hcVL小鼠。
图10B示出了脾B细胞中记忆B细胞(B220+IgM+IgD-CD38+)群的百分比。脾B细胞来自野生型或hVH/hcVL小鼠。
图10C示出了脾B细胞中边缘区B细胞(MZ,B220+CD21+CD23-)和滤泡B细胞(F0,B220+CD21CD23+)群的百分比。脾B细胞来自野生型或hVH/hcVL小鼠。
图11A示出了由野生型雌性小鼠中的mB220标记的脾B细胞的流式细胞术结果。
图11B示出了由hVH/hcVL雌性小鼠中的mB220标记的脾B细胞的流式细胞术结果。
图11C示出了由野生型雄性小鼠中的mB220标记的脾B细胞的流式细胞术结果。
图11D示出了由hVH/hcVL雄性小鼠中的mB220标记的脾B细胞的流式细胞术结果。
图11E示出了由野生型雌性小鼠中的mIgGκ-FITC和mIgGλ-PE标记的脾B细胞的流式细胞术结果。
图11F示出了由hVH/hcVL雌性小鼠中的mIgGκ-FITC和mIgGλ-PE标记的脾B细胞的流式细胞术结果。
图11G示出了由野生型雄性小鼠中的mIgGκ-FITC和mIgGλ-PE标记的脾B细胞的流式细胞术结果。
图11H示出了由hVH/hcVL雄性小鼠中的mIgGκ-FITC和mIgGλ-PE标记的脾B细胞的流式细胞术结果。
图11I是示出了mIgGλ-PE标记的B细胞(mIgGλ)和mIgGκ-FITC标记的脾B细胞(mIgGκ)的百分比的直方图。
图12A示出了淋巴结B细胞中过渡1型(T1,B220+IgM+IgD-),过渡2型(T2,B220+IgM+IgD+)和成熟B细胞(M,B220+IgMIgD+)群的百分比。淋巴结B细胞来自野生型或hVH/hcVL小鼠。
图12B示出了淋巴结B细胞中浆细胞(B220IgM-IgD-CD138+)和记忆B细胞(B220+IgM+IgD-CD38+)群的百分比。淋巴结B细胞来自野生型或hVH/hcVL小鼠。
图13A示出了由野生型雌性小鼠中的mB220标记的淋巴结B细胞的流式细胞术结果。
图13B示出了由hVH/hcVL雌性小鼠中的mB220标记的淋巴结B细胞的流式细胞术结果。
图13C示出了由野生型雄性小鼠中的mB220标记的淋巴结B细胞的流式细胞术结果。
图13D示出了由hVH/hcVL雄性小鼠中的mB220标记的淋巴结B细胞的流式细胞术结果。
图13E示出了由野生型雌性小鼠中的mIgGκ-FITC和mIgGλ-PE标记的淋巴结B细胞的流式细胞术结果。
图13F示出了由hVH/hcVL雌性小鼠中的mIgGκ-FITC和mIgGλ-PE标记的淋巴结B细胞的流式细胞术结果。
图13G示出了由野生型雄性小鼠中的mIgGκ-FITC和mIgGλ-PE标记的淋巴结B细胞的流式细胞术结果。
图13H示出了由hVH/hcVL雄性小鼠中的mIgGκ-FITC和mIgGλ-PE标记的淋巴结B细胞的流式细胞术结果。
图13I是示出了mIgGλ-PE标记的B细胞(mIgGλ)和mIgGκ-FITC标记的淋巴结B细胞(mIgGκ)的百分比的直方图。
图13J示出了野生型(WT)或抗原免疫前hVH/hcVL小鼠中的血清免疫球蛋白(Ig)亚型的浓度。Ig亚型浓度通过ELISA测定。
图14是突出显示轻链免疫球蛋白基因座的人2号染色体的示意图(未按比例绘制)。VHK代表IGKV基因簇的区段,JHK代表IGKJ基因簇的区段,并且CHK代表IGKC基因。
图15示出了人远端Vκ簇IGKV基因的列表和人近端Vκ簇IGKV基因的列表。
图16是示出了14号染色体(14q32.33)上的人免疫球蛋白重链(IGH)基因座的示意图。
图17是示出了12号染色体(12F2)(品系C57BL/6)上的小鼠(Mus musculus)IGH基因座的示意图。
图18是示出了2号染色体(2p11.2)上的人免疫球蛋白κ链(IGK)基因座的示意图。
图19是示出了6号染色体(6C1)上的小鼠(Mus musculus)IGK基因座的示意图。
图20列出了人重链免疫球蛋白基因座(IGH)的IMGT谱系。
图21列出了小鼠IGH的IMGT谱系。
图22列出了人κ链免疫球蛋白基因座(IGK)的IMGT谱系。
图23列出了小鼠IGK的IMGT谱系。
图24示出了在野生型和hVHH/H/hcVLK/+小鼠中使用第一测试抗原进行三次免疫后的抗原特异性抗体效价。
图25示出了在野生型和hVHH/H/hcVLK/+小鼠中使用第二测试抗原进行三次免疫后的抗原特异性抗体效价。
图26A示出了在hVHH/H/hcVLK/+小鼠中IGHV利用率(频率>1%)。
图26B示出了在hVHH/H/hcVLK/+小鼠中IGHV利用率(频率<1%)。
图26C示出了在hVHH/H/hcVLK/+小鼠中IGHD利用率。
图26D示出了在hVHH/H/hcVLK/+小鼠中IGHJ利用率。
图26E示出了在hVHH/H/hcVLK/K小鼠中IGHV利用率(频率>1%)。
图26F示出了在hVHH/H/hcVLK/K小鼠中IGHV利用率(频率<1%)。
图26G示出了在hVHH/H/hcVLK/K小鼠中IGHJ利用率。
图27A是示出了来自hVHH/H/hcVLK/+小鼠的重链CDR3氨基酸长度分布的直方图。
图27B是示出了来自hVHH/H/hcVLK/K小鼠的重链CDR3氨基酸长度分布的直方图。
图28A示出了在hVHH/H/hcVLK/+小鼠中重链CDR3(CDR3长度等于17个氨基酸)上的氨基酸频率。
图28B示出了在hVHH/H/hcVLK/+小鼠中重链CDR3(CDR3长度等于19个氨基酸)上的氨基酸频率。
图28C示出了在hVHH/H/hcVLK/+小鼠中重链CDR3(CDR3长度等于21个氨基酸)上的氨基酸频率。
图28D示出了在hVHH/H/hcVLK/K小鼠中重链CDR3(CDR3长度等于17个氨基酸)上的氨基酸频率。
图29示出了在hVHH/H/hcVLK/+小鼠中具有不同长度的CDR3上含有多个半胱氨酸残基、一个半胱氨酸残基和两个半胱氨酸残基的重链CDR3的频率。
图30A示出了在hVHH/H/hcVLK/+小鼠中如在重排人IGKV3-11/J1序列中编码的氨基酸(AA)体细胞超变比。
图30B示出了在hVHH/H/hcVLK/+小鼠中重排人IGKV3-11/J1序列中的DNA体细胞超变比。
图30C示出了在hVHH/H/hcVLK/K小鼠中重排人IGKV3-11/J1序列中的DNA体细胞超变比。
图31示出了15个人抗抗原A抗体的表位聚类结果。
图32列出了本公开中所描述的序列。
图33A示出了抗体靶抗原D的V-D-J重组分析在hVHH/H/hcVLK/K小鼠中进行的重链多样性。
图33B示出了抗体靶抗原E的V-D-J重组分析在hVHH/H/hcVLK/K小鼠中进行的重链多样性。
图34A-34B示出了抗体靶抗原D的缔合速率(kon)和解离速率(koff)分布。
图34C-34D示出了抗体靶抗原E的缔合速率(kon)和解离速率(koff)分布。
图35A示出了抗体靶抗原D的结合亲和力(KD)分布。
图35B示出了抗体靶抗原E的结合亲和力(KD)分布。
具体实施方式
单克隆抗体通常包含两个重链,其中每个重链单体与相同的轻链相关联。由于单克隆抗体的靶特异性,所述单克隆抗体通常可以与单个靶标结合。然而,在药物开发中,需要能够结合两种不同抗原或表位的抗体。例如,CD3特异性抗体通常与多种肿瘤相关抗原特异性抗体配对,产生治疗癌症的双特异性抗体。双特异性抗体结合两种不同抗原或表位的能力提供了广泛的临床应用。迄今为止,至少有两种双特异性抗体上市,并且大量双特异性抗体正在进行临床试验。
双特异性抗体通常有两个不同的重链和两个不同的轻链。在单个宿主细胞中产生它们是具有挑战性的,因为两个重链和两个轻链的随机配对导致10种不同的IgG物种的表达,其中只有一种是目标格式。已经提出了杵臼结构修饰重链。对轻链也已经提出了一些其他的修饰。然而,这些另外的修饰可能会对生物化学和/或生物物理性质、血清半衰期和/或稳定性造成不利影响,从而导致疗效差、不稳定和高免疫原性。需要一种不过度依赖抗体工程改造的方法来制备双特异性抗体。
本公开涉及具有人源化轻链免疫球蛋白基因座(例如,κ链基因座)和/或人源化重链免疫球蛋白基因座的经遗传修饰的动物和细胞。在一方面,人源化轻链免疫球蛋白基因座具有一组有限数量的IGKV基因和IGKJ基因。所述经遗传工程改造的动物,通过生物体内漫长而复杂的抗体选择过程,在将人重链可变结构域的多样化集合与有限数量的人轻链可变结构域选项配对时,做出生物学上适当的选择。所述动物被工程改造为呈现有限数量的人轻链可变结构域选项与广泛的人重链可变结构域选项相结合。在免疫原的挑战下,动物开发免疫原的抗体,主要或完全受其谱系的轻链选项的数量限制。
在各种实施方案中,在经遗传修饰的动物中产生的抗体具有可与相同或基本相同的轻链相结合的重链。这在制备双特异性抗体时特别有用。例如,此类动物可以用第一抗原免疫以产生B细胞,所述B细胞表达与第一抗原特异性结合的抗体。所述动物(或具有相同修饰的动物)可以用第二抗原免疫以产生B细胞,所述B细胞表达与第二抗原特异性结合的抗体。VH可以从第一B细胞和第二B细胞中克隆出来。两个VH可以与相同的轻链VL配对以制备双特异性抗体。因此,不需要通过抗体工程改造(例如,对序列引入修饰)将一个轻链与一个特定的重链相关联。这可以大大提高双特异性抗体开发的成功率。事实上,如本文所述的抗体或序列可以进一步相互结合以制备多特异性抗体。
为了获得有限谱系的轻链可变结构域选项,所述动物被工程改造为限制其产生具有天然多样性的动物轻链可变结构域的能力。然后,内源性动物基因座可以由选择的外源性合适的人轻链可变区基因序列修饰,可操作性地连接至内源性动物轻链恒定结构域,使得重排的外源性人可变区基因序列可以编码重排的嵌合轻链(人可变的内源性恒定),或者可以对具有有限多样性的未重排的外源性人可变区基因序列进行重排和重组以编码重排的嵌合轻链。
本文描述的经遗传修饰的动物可以具有一些其他优势。例如,在一些情况下,本文描述的经遗传修饰的动物具有完整的人重链可变区基因和重排的人轻链可变区基因(例如,人IGKV1-39/IGKJ4)。此外,因为人免疫球蛋白基因座上的整个重链可变区(没有修饰或具有有限的修饰)被引入动物基因组,这些基因可以以与发生在人身上的非常相似的方式进行VDJ重组。另外,由于有效的VDJ重组,抗体产生可以非常有效,并且具有与正常速率相似的速率。
如本文所用,术语“抗体”是指包含通过二硫键相互连接的四条多肽链:两条重(H)链和两条轻(L)链的免疫球蛋白分子。每条重链包含重链可变(VH)结构域和重链恒定区(CH)。每条轻链包含轻链可变(VL)结构域和轻链恒定区(CL)。VH和VL结构域可被进一步细分为散布有称为框架区(FR)的更保守的区域的高变区(称为互补决定区(CDR))。每个VH和VL包含三个CDR和四个FR,从氨基端至羧基端按以下顺序排列:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4(重链CDR可缩写为HCDR1、HCDR2和HCDR3;轻链CDR可缩写为LCDR1、LCDR2和LCDR3)。术语“高亲和力”抗体是指相对于其靶表位的KD约为10-8M或更低(例如,约为或低于1×10-8M、1×10-9M、1×10-10M或1×10-11M)的抗体。在一些实施方案中,KD可通过表面等离子体共振,例如,BIACORETM,或ELISA来测量。
如本文所用,术语“抗原结合片段”是指全长抗体的一部分,其中抗体的所述部分能够特异性结合抗原。在一些实施方案中,抗原结合片段含有至少一个可变结构域(例如,重链的可变结构域或轻链的可变结构域)。抗体片段的非限制性实施例包括例如Fab、Fab’、F(ab’)2和Fv片段。
如本文所用,术语“人抗体”是指由存在于人体内的核酸(例如,重排的人免疫球蛋白重链或轻链基因座)编码的抗体。在一些实施方案中,人抗体从人收集或在人细胞培养物(例如,人杂交瘤细胞)中产生。在一些实施方案中,人抗体在非人细胞(例如,小鼠或仓鼠细胞系)中产生。在一些实施方案中,人抗体在细菌或酵母细胞中产生。在一些实施方案中,人抗体在含有未重排或重排的人免疫球蛋白基因座(例如,重链或轻链人免疫球蛋白基因座)的转基因非人动物(例如,小鼠)中产生。
如本文所用,术语“嵌合抗体”是指含有在至少两种不同抗体(例如,来自两种不同哺乳动物物种的抗体,例如人和小鼠的抗体)中存在的序列的抗体。嵌合抗体的非限制性实施例是含有人抗体的可变结构域序列(例如,轻链和/或重链可变结构域序列的所有或部分)和非人抗体的恒定结构域的抗体。嵌合抗体的另外的实施例描述于本文中并且是本领域已知的。
如本文所用,术语“人源化抗体”是指含有源自非人(例如,小鼠)免疫球蛋白的序列,并且含有源自人免疫球蛋白的序列的非人抗体。
如本文所用,术语“受试者”和“患者”在整个说明书中可互换使用,并用于描述动物、人或非人。本公开涵盖了兽医和非兽医应用。人患者可以是成年人或未成年人(例如,18岁以下的人)。除人外,患者包括但不限于小鼠、大鼠、仓鼠、豚鼠、兔、雪貂、猫、狗和灵长类动物。包括例如非人灵长类动物(例如猴、黑猩猩、大猩猩等)、啮齿动物(例如大鼠、小鼠、沙鼠、仓鼠、雪貂、兔)、兔形目动物、猪(例如小猪、微型猪)、马、犬、猫科动物、牛科动物及其他家养动物、农场动物和动物园动物。
如本文所用,当提及抗体时,短语“与……特异性结合”和“特异性结合……”是指抗体与其靶分子相互作用,优选与其他分子相互作用,因为所述相互作用取决于靶分子上特定结构(即,抗原决定簇或表位)的存在;换句话说,试剂通常识别并结合包括特定结构的分子,而不是所有分子。可以将特异性结合靶分子的抗体称为靶特异性抗体。
如本文所用,术语“多肽”、“肽”和“蛋白质”可互换使用,是指具有至少两个氨基酸的任何长度的氨基酸聚合物。
如本文所用,术语“多核苷酸”、“核酸分子”和“核酸序列”在本文中可互换地使用,是指具有至少两个核苷酸的任何长度的核苷酸聚合物,并且包括但不限于DNA、RNA、DNA/RNA杂合体及其修饰。
如本文所用,术语“未修饰的人序列”是指源自人受试者、人细胞、培养的人细胞或人细胞系的序列,其中所述序列与人受试者、人细胞、培养的人细胞或人细胞系的遗传序列相同。
如本文所用,术语“双特异性抗体”包含能够选择性结合两个或更多个表位的抗体。双特异性抗体通常包含两条不相同的重链,每条重链特异性结合不同的表位—要么在两个不同的分子上(例如,在两个不同的免疫原上的不同表位),要么在同一个分子上(例如,在同一个免疫原上的不同表位)。由双特异性抗体特异结合的表位可以在相同或不同的靶标上(例如,在相同或不同的蛋白质上)。例如,通过结合重链,可以制备双特异性抗体,其中所述重链识别相同免疫原的不同表位。例如,编码重链可变序列的核酸序列可以融合到编码相同或不同重链恒定区的核酸序列上,其中所述重链可变序列识别相同免疫原的不同表位,并且可以在表达免疫球蛋白轻链的细胞中表达此类序列。一个典型的双特异性抗体有两个重链,每个重链有三个重链CDR,紧随其后的是(N端至C端)CH1结构域、铰链、CH2结构域和CH3结构域和免疫球蛋白轻链,所述免疫球蛋白轻链不赋予表位结合特异性但可以与每个重链相关联,或可以与每一个重链相关联并且可以结合由重链表位结合区结合的一个或多个表位,或者可以与每个重链相关联并且使一个或两个重链与一个或两个表位结合。
如本文所用,术语“共有轻链抗体”是指具有两个或更多个相同轻链的抗体。在一些实施方案中,共有轻链抗体是共有轻链双特异性抗体。
限制性κ轻链免疫球蛋白基因座
κ链免疫球蛋白基因座(也称为IGK或免疫球蛋白κ基因座)是染色体(例如,2号人染色体)上含有人抗体(或免疫球蛋白)轻链基因的区域。类似地,免疫球蛋白轻链基因也可进行一系列重排,导致成熟免疫球蛋白轻链核酸(例如,κ链)的产生。
V区段(也称为IGKV基因)和J区段(也称为IGKJ基因)的连接产生了连续的外显子,外显子编码整个轻链可变结构域。在未重排的DNA中,V基因区段(或IGKV基因簇)位于离C区相对较远的位置。J基因区段(或IGKJ基因簇)位于C区附近。V区段与J基因区段的连接也使V基因接近C区序列。重排的V区的J基因区段仅通过一个内含子与C区序列分开。为了产生完整的免疫球蛋白轻链信使RNA,转录后通过RNA剪接将V区外显子连接至C区序列。
人轻链免疫球蛋白基因座位于人2号染色体上。表1列出了IGKV基因及其在此基因座中的相对顺序。人IGKV基因有几个不同的组,包含IGKV1基因(包含始于IGKV1的所有IGKV基因,也称为VκI)、IGKV2基因(包含始于IGKV2的所有IGKV基因,也称为VκII)、IGKV3基因(包含始于IGKV3的所有IGKV基因,也称为VκIII)、IGKV4基因(包含始于IGKV4的所有IGKV基因,也称为VκIV)、IGKV5基因(包含始于IGKV5的所有IGKV基因,也称为VκV)、IGKV6基因(包含始于IGKV6的所有IGKV基因,也称为VκVI)和IGKV7基因(包含始于IGKV7的所有IGKV基因,也称为VκVII)。
人2号染色体中的这些IGKV基因也形成两个簇,近端的Vκ簇和远端的Vκ簇(图14)。两个簇中的序列相似,但不相同。所述序列的此大区段复制发生在人谱系从与其他大型类人猿最近的共同祖先开始分化的时候。图15概述了每个簇中的相关IGKV基因。
表1.人2号染色体上的IGKV基因列表
Figure BDA0003978200570000181
Figure BDA0003978200570000191
表2列出了在人2号染色体上的所有IGKJ基因及其相对顺序。编码轻链免疫球蛋白恒定结构域的免疫球蛋白κ恒定区(IGKC)基因位于IGKV和IGKJ基因之后。这些基因和这些基因的顺序也示于图18和图22中。
表2.人2号染色体上的IGKJ基因列表
基因名称 顺序 基因名称 顺序
IGKJ1 77 IGKJ4 80
IGKJ2 78 IGKJ5 81
IGKJ3 79
小鼠轻链免疫球蛋白基因座位于小鼠6号染色体上。表3列出了IGKV基因及其在此基因座中的相对顺序。
表3.小鼠6号染色体上的IGKV基因列表
Figure BDA0003978200570000192
Figure BDA0003978200570000201
Figure BDA0003978200570000211
Gm9728和Amd-ps2也位于此基因座中。Gm9728的相对顺序是4,并且Amd-ps2的相对顺序是134。表4列出了在小鼠6号染色体上的所有IGKJ基因及其相对顺序。编码轻链免疫球蛋白恒定结构域的IGKC基因位于IGKV和IGKJ基因之后。这些基因和这些基因的顺序也示于图19和图23中。
表4.小鼠6号染色体上的IGKJ基因列表
基因名称 顺序 基因名称 顺序
IGKJ1 166 IGKJ4 169
IGKJ2 167 IGKJ5 170
IGKJ3 168
本公开提供了包含一个、两个、三个或不超过三个人IGKV基因和一个、两个、三个或不超过三个人IGKJ基因的经遗传修饰的非人动物。在一些实施方案中,所述人IGKV基因和人IGKJ基因位于内源性轻链免疫球蛋白基因座中。在一些实施方案中,所述人IGKV基因和人IGKJ基因是重排序列。在一些实施方案中,它们是非重排序列。
在一些实施方案中,所述人IGKV基因选自表1中的任何一个IGKV基因。在一些实施方案中,所述人IGKJ基因选自表2中的任何一个IGKJ基因。
在一些实施方案中,所述动物只包含一个人IGKV基因和一个人IGKJ基因。在一些实施方案中,所述IGKV基因选自表1中的任何一个IGKV基因。在一些实施方案中,所述IGKJ基因选自表2中的任何一个IGKJ基因。
在一些实施方案中,所述动物包含选自IGKV3-20、IGKV1-39、IGKV1D-39、IGKV3-11、IGKV3-15和IGKV4-1的人IGKV基因。在一些实施方案中,所述动物包含选自IGKJ1、IGKJ2和IGKJ4的人IGKJ基因。
在一些实施方案中,所述动物包含选自IGKV3-20、IGKV3-11、IGKV3-15、IGKV1-39、IGKV1D-39和IGKV1-12、IGKV1D-12的人IGKV基因。在一些实施方案中,所述动物包含选自IGKJ1、IGKJ4和IGKJ2的人IGKJ基因。
在一些实施方案中,所述动物包含选自IGKV3-20、IGKV3-11和IGKV1-39的人IGKV基因。在一些实施方案中,所述动物包含选自IGKJ1和IGKJ4的人IGKJ基因。
在一些实施方案中,所述动物包含人IGKV基因的第一核苷酸之前的启动子序列。在一些实施方案中,所述启动子序列在或大约在人IGKV基因之前的100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3500、4000、4500或5000bp内/上。在一些实施方案中,所述启动子是人IGKV3-20启动子、人IGKV1-39启动子或人IGKV3-11启动子。在一些实施方案中,所述启动子序列与SEQ ID NO:35的核苷酸1-2000、SEQ ID NO:36的核苷酸1-2000或SEQ ID NO:37的核苷酸1-2000至少80%、85%、90%、95%、96%、97%、98%、99%或100%相同。
在一些实施方案中,所述动物包含人IGKJ基因的最后一个核苷酸之后的辅助序列。在一些实施方案中,所述辅助序列包含小鼠IGKJ 3'-UTR序列或人IGKJ 3’UTR序列。在一些实施方案中,所述序列与SEQ ID NO:6或SEQ ID NO:7至少80%、85%、90%、95%、96%、97%、98%、99%或100%相同。
在各种实施方案中,一个或多个适当的增强子可以保留在动物中。例如,在修饰κ基因座以用人κ可变区基因区段取代内源性κ可变区基因区段时,κ内含子型增强子和κ3'增强子在功能上被维持或不受干扰。在一些实施方案中,修饰的κ基因座可经受体细胞超变。在一些实施方案中,体细胞超变的程度与野生型κ基因座大致相同或相似。在一些实施方案中,抗体中至少50%、60%、70%、80%、90%或95%的人轻链可变区(抗原免疫之前或之后)具有至少1个体细胞突变。在一些实施方案中,抗体中至少50%、60%、70%、80%、90%或95%的人轻链可变区(抗原免疫之前或之后)具有至少2个体细胞突变。在一些实施方案中,抗体中至少50%、60%、70%、80%、90%或95%的人轻链可变区(抗原免疫之前或之后)具有至少3个体细胞突变。
在一些实施方案中,所述动物包含内源性IGKC。在一些实施方案中,所述IGKV基因和/或IGKJ基因与IGKC基因(例如,内源性IGKC基因)可操作性地连接在一起。
在一些实施方案中,IGKV基因和IGKJ基因可操作性地连接在一起。
在一些实施方案中,所述动物包含内源性IGKC。在一些实施方案中,IGKV基因和/或IGKJ基因可操作性地连接在一起。VJ重组可以发生在这些基因之间,并产生功能性抗体。在一些实施方案中,IGKV基因和IGKJ基因在内源性κ链免疫球蛋白基因座处重排。
在一些实施方案中,所述动物包含在动物的内源性轻链免疫球蛋白基因座中的破坏。在一些实施方案中,所述动物的内源性轻链免疫球蛋白基因座中的破坏包括一个或多个内源性IGKV基因和一个或多个内源性IGKJ基因的缺失。
在一些实施方案中,所述动物是小鼠。所述动物的内源性轻链免疫球蛋白基因座中的破坏包括至少或约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、151个、152个、153个、154个、155个、156个、157个、158个、159个、160个、161个、162个或163个小鼠IGKV基因(例如,如表3所示的基因)的缺失。在一些实施方案中,所述破坏包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGKV2-137、IGKV1-136、IGKV1-135、IGKV14-134-1、IGKV17-134、IGKV1-133、IGKV1-132、IGKV1-131、IGKV14-130和IGKV9-129的小鼠IGKV基因的缺失。在一些实施方案中,所述小鼠仍然包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGKV2-137、IGKV1-136、IGKV1-135、IGKV14-134-1、IGKV17-134、IGKV1-133、IGKV1-132、IGKV1-131、IGKV14-130和IGKV9-129的小鼠IGKV基因。
在一些实施方案中,所述破坏包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGKV3-10、IGKV3-9、IGKV3-8、IGKV3-7、IGKV3-6、IGKV3-5、IGKV3-4、IGKV3-3、IGKV3-2和IGKV3-1的小鼠IGKV基因的缺失。在一些实施方案中,所述小鼠仍然包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGKV3-10、IGKV3-9、IGKV3-8、IGKV3-7、IGKV3-6、IGKV3-5、IGKV3-4、IGKV3-3、IGKV3-2和IGKV3-1的小鼠IGKV基因。
在一些实施方案中,所述破坏包括约或至少1个、2个、3个、4个或5个选自IGKJ1、IGKJ2、IGKJ3、IGKJ4和IGKJ5的小鼠IGKJ基因的缺失。在一些实施方案中,所述小鼠仍然包含约或至少1个、2个、3个、4个或5个选自IGKJ1、IGKJ2、IGKJ3、IGKJ4和IGKJ5的小鼠IGKJ基因(例如,IGKJ5)。
在一些实施方案中,所述动物的内源性κ轻链免疫球蛋白基因座中的破坏包含约或至少500kb、600kb、700kb、800kb、900kb、1000kb、1500kb、2000kb、2500kb、3000kb或3500kb的内源性序列的缺失。
在一些实施方案中,所述缺失的序列从IGKV2-137开始至IGKJ4,从IGKV1-136开始至IGKJ4,从IGKV1-135开始至IGKJ4,从IGKV2-137开始至IGKJ5,从IGKV1-136开始至IGKJ5,或者从IGKV1-135开始至IGKJ5(例如,从IGKV2-137开始至IGKJ5)。
在一些实施方案中,所述动物包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个序列,所述序列与人轻链免疫球蛋白基因座中的序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。在一些实施方案中,所述序列的长度约为或至少为2kb或3kb。在一些实施方案中,所述序列的长度不超过4kb。
在一些实施方案中,动物包含一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)重排的人IGKV/IGKJ序列。在一些实施方案中,重排的人IGKV/IGKJ序列与SEQ ID NO:35(例如,SEQ ID NO:35的核苷酸2001-2512)至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。在一些实施方案中,重排的人IGKV/IGKJ序列与SEQ ID NO:36(例如,SEQ ID NO:36的核苷酸2001-2551)至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。在一些实施方案中,重排的人IGKV/IGKJ序列与SEQ ID NO:37(例如,SEQ ID NO:37的核苷酸2001-2572)至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。
在一些实施方案中,重排的人IGKV/IGKJ序列的长度约为或至少为500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4500或5000bp。在一些实施方案中,重排的人IGKV/IGKJ序列小于1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000或3100bp。
在一些实施方案中,动物可以产生免疫球蛋白(例如,IgG),所述免疫球蛋白包含与SEQ ID NO:38至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的轻链可变区。在一些实施方案中,动物可以产生免疫球蛋白(例如,IgG),所述免疫球蛋白包含与SEQ ID NO:39至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的轻链可变区。在一些实施方案中,动物可以产生免疫球蛋白(例如,IgG),所述免疫球蛋白包含与SEQ ID NO:40至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的轻链可变区。在一些实施方案中,与SEQ ID NO:38、39或40相比,轻链可变区可以具有1、2、3、4或5个突变。在一些实施方案中,轻链恒定结构域具有与SEQ ID NO:41至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的序列。
在一些实施方案中,所述动物可具有一个、两个、三个、四个、五个、六个、七个、八个、九个或十个未修饰的人序列。在一些实施方案中,未修饰的人序列的长度约为或至少为0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100kb。
在一些实施方案中,轻链可变区具有SEQ ID NO:38序列,其具有0、1或2个突变。在一些实施方案中,轻链可变区具有SEQ ID NO:39序列,其具有0、1或2个突变。在一些实施方案中,轻链可变区具有SEQ ID NO:40序列,其具有0、1或2个突变。
此外,在一些情况下,整个小鼠IGKV基因和IGKJ基因(均为非假基因)被敲除,并且轻链可变区将不具有任何由源自小鼠的序列编码的序列,从而使人中的免疫原性最小化。在各种实施方案中,轻链可变区能够体细胞突变。
经遗传修饰的重链免疫球蛋白基因座
重链免疫球蛋白基因座(也称为IGH或免疫球蛋白重链基因座)是染色体(例如,人14号染色体)上含有人抗体(或免疫球蛋白)重链基因的区域。
此区域代表重链基因座的种系组织。基因座包括V(可变的)、D(多样性)、J(连接)和C(恒定)区段。V区中的基因形成V基因簇(也称为IGHV基因簇)。D区中的基因形成D基因簇(也称为IGHD基因簇)。J区中的基因形成J基因簇(也称为IGHJ基因簇)。
在B细胞发育过程中,DNA水平上的重组事件将单个D区段(也称为IGHD基因)与J区段(也称为IGHJ基因)连接起来;此部分重排的D-J区的融合的D-J外显子然后被连接至V区段(也称为IGHV基因)。然后含有融合的V-D-J外显子的重排的V-D-J区被转录并在RNA水平上融合至IGHM恒定区;此转录物编码μ重链。在发育的后期,B细胞产生V-D-J-Cμ-Cδ前信使RNA,所述RNA被选择性剪接以编码μ或δ重链。淋巴结中的成熟B细胞经历转换重组,使得融合的V-D-J基因区段接近IGHG、IGHA或IGHE基因区段之一,并且每个细胞表达γ、α或ε重链。许多不同的IGHV基因与几个IGHJ基因的潜在重组提供了广泛的抗原识别。额外的多样性是通过连接多样性获得的,连接多样性是由末端脱氧核苷酸转移酶随机添加核苷酸和体细胞超变产生的,这发生在脾和淋巴结的B细胞成熟过程中。已知几个V、D、J和C区段不能编码蛋白,并且被认为是假基因区段(通常简称为假基因)。
人重链免疫球蛋白基因座位于人14号染色体上。表5列出了IGHV基因及其在此基因座中的相对顺序。
表5.人14号染色体上的IGHV基因列表
Figure BDA0003978200570000271
Figure BDA0003978200570000281
RPS8P1、ADAM6和KIAA0125也位于此基因座上。RPS8P1的相对顺序为160,ADAM6的相对顺序为161,并且KIAA0125的相对顺序为164。表6列出了在人14号染色体上的所有IGHD基因及其相对顺序。表7列出了在人14号染色体上的所有IGHJ基因及其相对顺序。免疫球蛋白恒定结构域的基因位于IGHV、IGHD和IGHJ基因之后。这些基因包含(如以下顺序所示):免疫球蛋白重链恒定μ(IGHM)、免疫球蛋白重链恒定δ(IGHδ)、免疫球蛋白重链恒定γ3(IGHG3)、免疫球蛋白重链恒定γ1(IGHG1)、免疫球蛋白重链恒定εP1(假基因)(IGHEP1)、免疫球蛋白重链恒定α1(IGHA1)、免疫球蛋白重链恒定γP(非功能性)(IGHGP)、免疫球蛋白重链恒定γ2(IGHG2)、免疫球蛋白重链恒定γ4(IGHG4)、免疫球蛋白重链恒定ε(IGHE)和免疫球蛋白重链恒定α2(IGHA2)。这些基因和这些基因的顺序也示于图16和图20中。
表6.人14号染色体上的IGHD基因列表
基因名称 顺序 基因名称 顺序 基因名称 顺序 基因名称 顺序
IGHD1-1 165 IGHD2-8 172 IGHD2-15 179 IGHD3-22 186
IGHD2-2 166 IGHD3-9 173 IGHD3-16 180 IGHD4-23 187
IGHD3-3 167 IGHD3-10 174 IGHD4-17 181 IGHD5-24 188
IGHD4-4 168 IGHD4-11 175 IGHD5-18 182 IGHD6-25 189
IGHD5-5 169 IGHD5-12 176 IGHD6-19 183 IGHD1-26 190
IGHD6-6 170 IGHD6-13 177 IGHD1-20 184 *
IGHD1-7 171 IGHD1-14 178 IGHD2-21 185 IGHD7-27 192
表7.人14号染色体上的IGHJ基因列表
基因名称 顺序 基因名称 顺序
IGHJ1P 191 IGHJ4 197
IGHJ1 193 IGHJ5 198
IGHJ2 194 IGHJ3P 199
IGHJ2P 195 IGHJ6 200
IGHJ3 196
小鼠重链免疫球蛋白基因座位于小鼠12号染色体上。表8列出了IGHV基因及其在此基因座中的相对顺序。
表8.小鼠12号染色体上的IGHV基因列表
Figure BDA0003978200570000291
Figure BDA0003978200570000301
Figure BDA0003978200570000311
表9列出了在小鼠12号染色体上的所有IGHD基因及其相对顺序。表10列出了在小鼠12号染色体上的所有IGHJ基因及其相对顺序。免疫球蛋白恒定结构域的基因在IGHV、IGHD和IGHJ基因之后。这些基因包含(如以下顺序所示):免疫球蛋白重链恒定μ(IGHM)、免疫球蛋白重链恒定δ(IGHδ)、免疫球蛋白重链恒定γ3(IGHG3)、免疫球蛋白重链恒定γ1(IGHG1)、免疫球蛋白重链恒定γ2b(IGHG2b)、免疫球蛋白重链恒定γ2a(IGHG2a)、免疫球蛋白重链恒定ε(IGHE)和免疫球蛋白重链恒定α(IGHA)基因。这些基因和这些基因的顺序也示于图17和图21中。
表9.小鼠12号染色体上的IGHD基因列表
Figure BDA0003978200570000312
Figure BDA0003978200570000321
表10.小鼠12号染色体上的IGHJ基因列表
基因名称 顺序 基因名称 顺序
IGHJ1 203 IGHJ3 205
IGHJ2 204 IGHJ4 206
本公开提供了经遗传修饰的非人动物,所述经遗传修饰的非人动物包含一个或多个人IGHV基因、一个或多个人IGHD基因和/或一个或多个人IGHJ基因。
所述经遗传修饰的动物可通过将人免疫球蛋白基因引入非人动物的基因组中以产生能够表达人源化抗体或嵌合抗体的动物来制备。图1A示出了制备人源化小鼠的方法。在一些实施方案中,所述方法首先涉及修饰人染色体上的人免疫球蛋白区域。然后将经修饰的人染色体引入小鼠受体细胞。然后通过直接取代(例如,在一步取代中)将人免疫球蛋白可变区引入小鼠基因组的相应区域。然后筛选受体细胞,优选不含有人染色体的细胞。然后将细胞注射到囊胚中以制备嵌合动物(例如,小鼠)。可以进行后续育种以获得含有完整人源化免疫球蛋白基因座的动物。
在一些实施方案中,所述人IGHV基因、人IGHD基因和人IGHJ基因可操作性地连接在一起,并且可进行VDJ重排。在一些实施方案中,所述人IGHV基因、人IGHD基因和人IGHJ基因位于内源性重链免疫球蛋白基因座上。
在一些实施方案中,所述动物包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、151个、152个、153个、154个、155个、156个、157个、158个、159个、160个或161个人IGHV基因(例如,如表5所示的基因)。
在一些实施方案中,所述动物包含1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGHV(III)-82、IGHV7-81、IGHV4-80、IGHV3-79、IGHV(II)-78-1、IGHV5-78、IGHV7-77、IGHV(III)-76-1、IGHV3-76和IGHV3-75的基因。
在一些实施方案中,所述动物包含1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGHV(III)-5-2、IGHV(III)-5-1、IGHV2-5、IGHV7-4-1、IGHV4-4、IGHV1-3、IGHV(III)-2-1、IGHV1-2、IGHV(II)-1-1和IGHV6-1的基因。
在一些实施方案中,所述动物包含未修饰的人序列,所述未修饰的人序列包含起始于选自IGHV(III)-82、IGHV7-81、IGHV4-80、IGHV3-79、IGHV(II)-78-1、IGHV5-78、IGHV7-77、IGHV(III)-76-1、IGHV3-76和IGHV3-75的基因并终止于选自IGHV(III)-5-2、IGHV(III)-5-1、IGHV2-5、IGHV7-4-1、IGHV4-4、IGHV1-3、IGHV(III)-2-1、IGHV1-2、IGHV(II)-1-1和IGHV6-1的基因的序列。在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHV(III)-82开始至人IGHV1-2的部分。在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHV(III)-82开始至人IGHV(II)-1-1的部分。在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHV(III)-82开始至人IGHV-6-1的部分。
在一些实施方案中,所述动物包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个或27个人IGHD基因(例如,如表6所示的基因)。在一些实施方案中,所述动物包含1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGHD1-1、IGHD2-2、IGHD3-3、IGHD4-4、IGHD5-5、IGHD4-23、IGHD5-24、IGHD6-25、IGHD1-26和IGHD7-27的基因。
在一些实施方案中,所述动物包含约或至少1个、2个、3个、4个、5个、6个、7个、8个或9个人IGHJ基因(例如,如表7所示的基因)。在一些实施方案中,所述动物包括1个、2个、3个、4个、5个、6个、7个、8个或9个选自IGHJ1P、IGHJ1、IGHJ2、IGHJ2P、IGHJ3、IGHJ4、IGHJ5、IGHJ3P和IGHJ6的人IGHJ基因。
在一些实施方案中,所述动物包含未修饰的人序列,所述未修饰的人序列包含始于选自IGHD1-1、IGHD2-2、IGHD3-3、IGHD4-4、IGHD5-5、IGHD4-23、IGHD5-24、IGHD6-25、IGHD1-26和IGHD7-27的基因并终止于选自IGHJ1P、IGHJ1、IGHJ2、IGHJ2P、IGHJ3、IGHJ4、IGHJ5、IGHJ3P和IGHJ6的基因的序列。在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHD1-1开始至人IGHJ6的部分。
在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从IGHD1-1开始至人IGHD7-27的部分。
在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHJ1P开始至人IGHJ6的部分。在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHJ1开始至人IGHJ6的部分。
在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHV(III)-82开始至人IGHJ6的部分。
在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHV1-2开始至人IGHJ6的部分。在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHV(II)-1-1开始至人IGHJ6的部分。在一些实施方案中,所述未修饰的人序列源自人重链免疫球蛋白基因座的从人IGHV6-1开始至人IGHJ6的部分。
在一些实施方案中,所述动物可具有一个、两个、三个、四个、五个、六个、七个、八个、九个或十个未修饰的人序列。在一些实施方案中,所述未修饰的人序列的长度约为或至少为10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kb或1000kb。
在一些实施方案中,所述动物包含一个或多个选自由免疫球蛋白重链恒定μ(IGHM)、免疫球蛋白重链恒定δ(IGHδ)、免疫球蛋白重链恒定γ3(IGHG3)、免疫球蛋白重链恒定γ1(IGHG1)、免疫球蛋白重链恒定γ2b(IGHG2b)、免疫球蛋白重链恒定γ2a(IGHG2a)、免疫球蛋白重链恒定ε(IGHE)和免疫球蛋白重链恒定α(IGHA)基因组成的组的内源性基因。在一些实施方案中,这些内源性基因可操作性地连接在一起。在一些实施方案中,这些内源性基因具有与在野生型动物中相同的顺序。在一些实施方案中,同种型转换(免疫球蛋白类转换)可在动物中发生。
在一些实施方案中,所述IGHV基因、IGHD基因和/或IGHJ基因可操作性地连接在一起。VDJ重组可发生在这些基因之间,并产生功能性抗体。在一些实施方案中,这些基因以与人重链免疫球蛋白基因座中的顺序相似的顺序排列。此排列提供了多种有利方面,例如,这些基因的排列允许产生具有与人中的重链可变结构域的多样性非常相似的多样性的重链可变结构域。由于一些随机序列可在VDJ重组过程中被插入到序列中,因此在一些实施方案中,无修饰或只有最小修饰的完整人抗体谱系可以降低非人序列在VDJ重组过程中被插入的可能性。
在一些实施方案中,所述IGHV基因、IGHD基因和/或IGHJ基因与一个或多个选自IGHM、IGHδ、IGHG3、IGHG1、IGHG2b、IGHG2a、IGHE和IGHA基因的基因(例如,所有基因)可操作性地连接在一起。
在一些实施方案中,所述动物包含在所述动物的内源性重链免疫球蛋白基因座中的破坏。在一些实施方案中,所述动物的内源性重链免疫球蛋白基因座中的破坏包括一个或多个内源性IGHV基因、一个或多个内源性IGHD基因和一个或多个内源性IGHJ基因的缺失。
在一些实施方案中,所述动物是小鼠。所述动物的内源性重链免疫球蛋白基因座中的破坏包括至少或约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、160个、170个、171个、172个、173个、174个、175个、176个、177个、178个、179个、180个、181个或182个小鼠IGHV基因(例如,如表8中所示的基因)的缺失。在一些实施方案中,所述破坏包括约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGHV1-86、IGHV1-85、IGHV1-84、IGHV1-83、IGHV1-82、IGHV1-81、IGHV1-80、IGHV1-79、IGHV1-78和IGHV1-77的小鼠IGHV基因的缺失。在一些实施方案中,所述小鼠仍然包括约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGHV1-86、IGHV1-85、IGHV1-84、IGHV1-83、IGHV1-82、IGHV1-81、IGHV1-80、IGHV1-79、IGHV1-78和IGHV1-77(例如,IGHV1-86)的小鼠IGHV基因。
在一些实施方案中,所述破坏包括约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGHV5-6、IGHV5-5、IGHV2-3、IGHV6-1、IGHV5-4、IGHV5-3、IGHV2-2、IGHV5-2、IGHV2-1和IGHV5-1的小鼠IGHV基因的缺失。在一些实施方案中,所述小鼠仍然包括约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGHV5-6、IGHV5-5、IGHV2-3、IGHV6-1、IGHV5-4、IGHV5-3、IGHV2-2、IGHV5-2、IGHV2-1和IGHV5-1的小鼠IGHV基因的缺失。
在一些实施方案中,所述动物的内源性重链免疫球蛋白基因座中的破坏包括至少或约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个小鼠IGHD基因(例如,如表9所示的基因)的缺失。在一些实施方案中,所述破坏包括约或至少1个、2个、3个、4个、5个、6个、7个、8个、9或10个选自IGHD5-1、IGHD3-1、IGHD1-1、IGHD6-1、IGHD2-3、IGHD2-7、IGHD2-8、IGHD5-6、IGHD3-2和IGHD4-1的小鼠IGHD基因的缺失。在一些实施方案中,所述小鼠仍然包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个选自IGHD5-1、IGHD3-1、IGHD1-1、IGHD6-1、IGHD2-3、IGHD2-7、IGHD2-8、IGHD5-6、IGHD3-2和IGHD4-1的小鼠IGHD基因。
在一些实施方案中,所述破坏包括约或至少1、2、3或4个选自IGHJ1、IGHJ2、IGHJ3和IGHJ4的小鼠IGHJ基因的缺失。在一些实施方案中,所述小鼠仍包含约或至少1个、2个、3个或4个选自IGHJ1、IGHJ2、IGHJ3和IGHJ4的小鼠IGHJ基因。
在一些实施方案中,所述动物的内源性重链免疫球蛋白基因座中的破坏包括约或至少500kb、600kb、700kb、800kb、900kb、1000kb、1500kb、2000kb、2500kb或3000kb的内源性序列的缺失。
在一些实施方案中,所述缺失的序列始于IGHV1-86至IGHJ4,始于IGHV1-85至IGHJ4,始于IGHV1-84至IGHJ4,始于IGHV1-83至IGHJ4,或者始于IGHV1-82至IGHJ4(例如,始于IGHV1-85至IGHJ4)。
在一些实施方案中,所述动物包含约或至少1个、2个、3个、4个、5个、6个、7个、8个、9个或10个序列,所述序列与人重链免疫球蛋白基因座中的序列至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同。在一些实施方案中,所述序列的长度约为或至少为10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kb、1000kb、1500kb、2000kb、2500kb、3000kb或3500kb。在一些实施方案中,所述序列从人IGHV(III)-82开始至IGHV1-2。在一些实施方案中,所述序列从人IGHV7-81开始至IGHV1-2。在一些实施方案中,所述序列从人IGHV(II)-1-1开始至IGHVJ6。在一些实施方案中,所述序列从人IGHV6-1开始至IGHVJ6。
所述人IGHV基因、人IGHD基因和人IGHJ基因可操作性地连接在一起,并且可进行VDJ重排。在一些实施方案中,所述经修饰的小鼠具有完整的人IGHV、IGHD和IGHJ基因谱系(例如,包含所有人IGHV、IGHD和IGHJ基因中的非假基因)。因此,所述经修饰的小鼠可产生完整的人抗体谱系。
在一些实施方案中,可以(例如,在重排序列之间以>1%的频率)检测到IGHV3-15、IGHV1-18、IGHV3-21、IGHV5-51、IGHV3-74、IGHV3-30-3、IGHV3-43、IGHV1-24、IGHV3-7、IGHV4-4、IGHV3-53、IGHV4-59、IGHV6-1、IGHV3-23、IGHV3-33、IGHV3-30、IGHV3-48、IGHV4-39、IGHV4-34或IGHV3-66的使用。在一些实施方案中,可以(例如,在重排序列之间以<1%的频率)检测到IGHV3-38-3、IGHV1-58、IGHV4-38-2、IGHV4-61、IGHV3-NL1、IGHV2-26、IGHV1-2、IGHV7-4-1、IGHV4-28、IGHV3-64、IGHV3-49、IGHV5-10-1、IGHV3-72、IGHV2-5、IGHV2-70、IGHV1-46、IGHV1-3、IGHV3-11、IGHV3-13、IGHV3-20、IGHV3-64D、IGHV1-69、IGHV3-73、IGHV4-30-2、IGHV4-31或IGHV4-30-4的使用。
在一些实施方案中,可以(例如,在重排序列之间以>1%的频率)检测到IGHD5-24、IGHD2-8、IGHD6-25、IGHD1-14、IGHD4-23、IGHD3-16、IGHD1-20、IGHD2-15、IGHD2-21、IGHD1-1、IGHD5-12、IGHD3-22、IGHD7-27、IGHD4-11、IGHD3-9、IGHD3-3、IGHD2-2、IGHD5-18、IGHD4-17、IGHD3-10、IGHD6-6、IGHD1-26、IGHD1-7、IGHD6-19或IGHD6-13的使用。
在一些实施方案中,可以(例如,在重排序列之间以>1%的频率)检测到IGHJ1、IGHJ2、IGHJ3、IGHJ4、IGHJ5或IGHJ6的使用。
在一些实施方案中,可以(例如,在重排序列之间以>1%的频率)检测到IGHV1-24、IGHV4-30-2、IGHV1-18、IGHV3-43、IGHV4-30-4、IGHV5-51、IGHV3-21、IGHV4-31、IGHV3-7、IGHV3-30-3、IGHV3-53、IGHV4-4、IGHV3-74、IGHV3-66、IGHV3-33、IGHV3-23、IGHV6-1、IGHV3-30、IGHV4-34、IGHV3-48、IGHV4-59或IGHV4-39的使用。
在一些实施方案中,可以(例如,在重排序列之间以<1%的频率)检测到IGHV3-25、IGHV4-38-2、IGHV7-4-1、IGHV3-NL1、IGHV4-61、IGHV1-58、IGHV2-26、IGHV3-72、IGHV5-10-1、IGHV1-46、IGHV3-49、IGHV2-70、IGHV1-2、IGHV3-64、IGHV4-28、IGHV3-20、IGHV1-3、IGHV3-13、IGHV3-73、IGHV3-11、IGHV3-64D、IGHV1-69、IGHV2-5或IGHV3-15的使用。
另外,因为内源性IGHV、IGHD、IGHJ、IGKV和IGKJ基因与人基因之间可发生V(D)J重组,如果内源性IGHV、IGHD、IGHJ、IGKV和IGKJ基因被整合到重排的重链VDJ区段或重排的轻链VJ区段中,则由所述抗体谱系产生的抗体很可能在人中具有免疫原性表位。所述免疫原性可导致抗药物抗体的产生且可具有活性。此处,在一些实施方案中,所述内源性IGHV、IGHD、IGHJ、IGKV和IGKJ基因已经被有效缺失。在一些情况下,整个小鼠IGHV基因、IGHD基因和IGHJ基因(例如,包括所有非假基因)被敲除,并且重链可变区将不具有由源自小鼠的序列编码的任何序列。
由所述抗体谱系产生的抗体在人体内不太可能具有免疫原性。因此,抗体更适合用作人的治疗剂。因此,经遗传修饰的动物为产生人源化抗体提供了有利的平台。经遗传修饰的λ轻链免疫球蛋白基因座
λ链免疫球蛋白基因座(也称为IGL或免疫球蛋白λ基因座)是染色体(例如,人22号染色体)上含有人抗体(或免疫球蛋白)轻链基因的区域。类似地,免疫球蛋白轻链基因也可进行一系列重排,导致成熟免疫球蛋白轻链核酸(例如,λ链)的产生。在健康的人个体中,血清中的总κ与λ的比率大致为2:1(测量完整的完全抗体),或者如果测量游离轻链,则比率为1:1.5。在小鼠中,总κ与λ的比率大致为9:1。
在一些实施方案中,所述动物包含人λ链免疫球蛋白基因座。
在一些实施方案中,所述动物包含在动物的内源性λ轻链免疫球蛋白基因座中的破坏。在一些实施方案中,所述动物的内源性轻链免疫球蛋白基因座中的破坏包括一个或多个内源性IGLV基因、一个或多个内源性IGLJ基因和/或一个或多个免疫球蛋白λ恒定(IGLC)基因(例如,IGLC1、IGLC2、IGLC3和IGLC4)的缺失。
所述小鼠λ轻链免疫球蛋白基因座(IGL基因座)位于小鼠16号染色体上。表11列出了IGLV、IGLJ和IGLC基因及其在此基因座上的相对顺序。
表11.小鼠IGL基因座上的基因列表
Figure BDA0003978200570000391
所述动物的内源性λ轻链免疫球蛋白基因座中的破坏包括至少或约1、2、3、4、5、6、7、8、9、10、11或12个小鼠IGLV、IGLJ和IGLC基因(例如,如表11所示的基因)的缺失。在一些实施方案中,所述缺失包含约或至少1个、2个、3个或4个选自IGLC1、IGLC2、IGLC3和IGLC4的小鼠IGLC基因。在一些实施方案中,所述破坏包括约或至少1个、2个或3个选自IGLV1、IGLV2和IGLV3的小鼠IGLV基因的缺失。在一些实施方案中,所述破坏包含约或至少1个、2个、3个、4个或5个选自IGLJ1、IGLJ2、IGLJ3、IGLJ3P和IGLJ4的小鼠IGLJ基因的缺失。
在一些实施方案中,所述动物的内源性λ轻链免疫球蛋白基因座中的破坏包含约或至少10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb、110kb、120kb、130kb、140kb、150kb、160kb、170kb、180kb、190kb、200kb、210kb、220kb、230kb、240kb、250kb、260kb、270kb、280kb、290kb、300kb、350kb、400kb、450kb、500kb或1000kb的核苷酸的缺失。在一些实施方案中,所述动物的内源性λ轻链免疫球蛋白基因中没有破坏。
在一些实施方案中,所述缺失的序列从IGLV2开始至IGLC1、从IGLV3开始至IGLC1或从IGLJ2开始至IGLC1。
关于经遗传修饰的动物和经遗传修饰的重链免疫球蛋白基因座的详细描述可参见例如PCT/CN 2020/075698,将其通过引用以其全文并入本文。
经遗传修饰的动物
在一方面,本公开提供了经遗传修饰的非人动物,所述经遗传修饰的非人动物包含人源化轻链免疫球蛋白基因座和/或人源化重链免疫球蛋白基因座。人源化轻链免疫球蛋白基因座包含一组有限数量的人IGKV基因和/或人IGKJ基因。在一些实施方案中,这些基因位于内源性免疫球蛋白基因座中。
在一些实施方案中,所述动物包含人λ链免疫球蛋白基因座。在一些实施方案中,所述动物包含在动物的内源性λ轻链免疫球蛋白基因座中的破坏。在一些实施方案中,所述动物在动物的内源性λ轻链免疫球蛋白基因座中没有破坏。
所述经遗传修饰的非人动物可以是各种动物,例如小鼠、大鼠、兔子、猪、牛(例如,母牛、公牛、水牛)、鹿、绵羊、山羊、鸡、猫、狗、雪貂、灵长类动物(例如,狨猴、恒河猴)。对于其中不容易获得合适的可经遗传修饰的胚胎干(ES)细胞的非人动物,可采用其他方法制备包含遗传修饰的非人动物。此类方法包括,例如,修饰非ES细胞基因组(例如,成纤维细胞或诱导多能细胞),并采用核移植将经修饰的基因组转移到合适的细胞,例如卵母细胞,并在合适的条件下在非人动物中孕育经修饰的细胞(例如,经修饰的卵母细胞),以形成胚胎。这些方法在本领域中是已知的,并且在例如Nagy等人“Manipulating the Mouse Embryo:ALaboratory Manual(第3版),”Cold Spring Harbor Laboratory Press,2003(其通过引用整体并入本文)中进行了描述。因此,在各种实施方案中,人V、D和/或J区段可以可操作性地连接至非人动物(例如,啮齿动物,小鼠、大鼠、仓鼠)恒定区基因序列。在B细胞发育过程中,这些重排的人V、D和/或J区段连接至非人动物免疫球蛋白恒定区。
在一方面,所述动物是哺乳动物,例如,双足总科或鼠总科的哺乳动物。在一些实施方案中,所述经遗传修饰的动物是啮齿动物。啮齿动物可选自小鼠、大鼠和仓鼠。在一些实施方案中,所述经遗传修饰的动物来自选自丽仓鼠科(Calomyscidae)(例如,鼠样仓鼠)、仓鼠科(Cricetidae)(例如,仓鼠、新世界(New World)大鼠和小鼠、田鼠)、鼠科(小鼠和大鼠、沙鼠、多刺小鼠(spiny mice)、鬚毛大鼠(crested rat)、马岛鼠科(Nesomyidae)(攀爬小鼠(climbing mice)、岩石小鼠(rock mice)、白尾大鼠、马达加斯加大鼠和小鼠)、刺山鼠科(Platacanthomyidae)(例如,多刺睡鼠(spiny dormice)和齡鼠科(Spalacidae)(例如,鼹鼠、竹鼠和鼢鼠)的科。在一些实施方案中,所述经遗传修饰的啮齿动物选自小鼠或大鼠(鼠科)、沙鼠、多刺小鼠和鬚毛大鼠。在一些实施方案中,所述非人动物是小鼠。
在一些实施方案中,所述动物是C57背景的小鼠(例如,选自C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL品系)。在一些实施方案中,所述小鼠是选自为129P1、129P2、129P3、129X1、129S1(例如,129S1/SV、129S1/SvIm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1、129T2的品系组成的组的129品系。这些小鼠描述于,例如,Festing等人,Revised nomenclature for strain 129mice,Mammalian Genome 10:836(1999);Auerbach等人,Establishment and Chimera Analysisof 129/SvEv-and C57BL/6-Derived Mouse Embryonic Stem Cell Lines(2000),这两篇文献通过引用整体并入本文。在一些实施方案中,所述经遗传修饰的小鼠是129品系与C57BL/6品系的杂交品系。在一些实施方案中,所述小鼠是129品系的杂交品系,或BL/6品系的杂交品系。在一些实施方案中,所述小鼠是BALB品系,例如BALB/c品系。在一些实施方案中,所述小鼠是BALB品系和另一种品系的杂交品系。在一些实施方案中,小鼠来自杂交品系(例如,50% BALB/c-50%12954/Sv;或50% C57BL/6-50%129)。
在一些实施方案中,所述动物是大鼠。大鼠可选自Wistar大鼠、LEA品系、SpragueDawley品系、Fischer品系、F344、F6和Dark Agouti。在一些实施方案中,所述大鼠品系是选自由Wistar、LEA、Sprague Dawley、Fischer、F344、F6和Dark Agouti组成的组的两个或更多个品系的杂交品系。
所述动物可具有一种或多种其他遗传修饰和/或其他修饰,所述修饰适合于制备人源化动物的特定目的。
包含内源性非人免疫球蛋白基因座的修饰的经遗传修饰的非人动物。在一些实施方案中,所述修饰可包含编码人蛋白的至少一部分(例如,与人重链可变结构域或轻链可变结构域序列至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%或99%相同)的人核酸序列。尽管还提供了可包含本文所述修饰的经遗传修饰的细胞(例如,ES细胞、体细胞),但在许多实施方案中,所述经遗传修饰的非人动物包含在动物种系中的内源性基因座的修饰。
经遗传修饰的动物可表达来自内源性小鼠基因座的人源化抗体和/或嵌合抗体,其中一个或多个内源性小鼠免疫球蛋白基因已经被人免疫球蛋白基因和/或核苷酸序列取代,所述核苷酸序列与人免疫球蛋白基因序列(例如,IGHV、IGHD、IGHJ、IGKV和/或IGKJ基因)至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%或99%相同。在各种实施方案中,内源性非人免疫球蛋白基因座被完整地或部分地修饰以包含人核酸序列。
可对上述非人哺乳动物进行遗传、分子和行为分析。本公开还涉及由本公开提供的非人哺乳动物与相同基因型或其他基因型交配产生的后代。非人哺乳动物可以是本领域已知的任何非人动物,并且可用于如本文所述的方法中。优选的非人哺乳动物是哺乳动物(例如,啮齿动物)。在一些实施方案中,非人哺乳动物是小鼠。
本公开还提供了源自非人哺乳动物或其后代的细胞系或原代细胞培养物。基于细胞培养物的模型可以例如通过以下方法制备。细胞培养物可通过从非人哺乳动物中分离而获得,或者细胞可从使用相同构建体和标准细胞转染技术建立的细胞培养物中获得。含有编码人或人源化免疫球蛋白的DNA序列的遗传构建体的整合情况可通过多种方法检测。
有许多分析方法可用于检测外源性DNA或对基因组DNA的修饰,包括核酸水平上的方法(包括使用逆转录聚合酶链式反应(RT-PCR)或Southern印迹和原位杂交的mRNA定量方法)和蛋白质水平上的方法(包括组织化学、免疫印迹分析和体外结合研究)。另外,目标基因的表达水平可通过本领域技术人员熟知的ELISA技术进行定量。许多标准分析方法可用于完成定量测量。例如,转录水平可使用RT-PCR和杂交方法来测量,所述杂交方法包含核糖核酸酶保护、Southern印迹分析、RNA点分析(RNAdot analysis)(RNAdot)分析。免疫组织化学着色、流式细胞术、蛋白质印迹分析也可用于评估人蛋白或人源化蛋白的存在。
抗体和抗原结合片段
本公开提供了通过如本文所述的方法产生的抗体及其抗原结合片段(例如,人源化抗体或嵌合抗体)。
通常,抗体(也称为免疫球蛋白)由轻链和重链两类多肽链组成。本公开的非限制性抗体可以是包含两条重链和两条轻链的完整的四种免疫球蛋白链抗体。抗体的重链可以是任何同种型或亚类,所述同种型包括IgM、IgG、IgE、IgA或IgD,所述亚类包括IgG1、IgG2、IgG2a、IgG2b、IgG3、IgG4、IgE1、IgE2等。轻链可以是κ轻链或λ轻链。抗体可以包含轻链的两个相同拷贝和重链的两个相同拷贝。各自含有一个可变结构域(或可变区,VH)和多个恒定结构域(或恒定区)的这两条重链在其恒定结构域内经由二硫键彼此结合,以形成抗体的“柄”。各自含有一个可变结构域(或可变区,VL)和一个恒定结构域(或恒定区)的这两条轻链分别经由二硫键结合一条重链。每个轻链的可变区和与其结合的重链的可变区配对。轻链和重链的可变区都含有夹在更保守的框架区(FR)之间的三个高变区。
这些高变区(称为互补决定区(CDR))形成了包含抗体主要抗原结合表面的环。四个框架区主要采用β-折叠构象,并且CDR形成连接β-折叠结构的环,并且在一些情况下所述环形成β-折叠结构的一部分。每个链中的CDR通过框架区紧密靠近,并且与来自另一个链的CDR一起形成了抗原结合区。
通过分析抗体的氨基酸序列来鉴定所述抗体的CDR区的方法是熟知的,并且CDR的许多定义是常用的。Kabat定义是基于序列可变性,而Chothia定义是基于结构环区域的位置。这些方法和定义描述于:例如Martin,“Protein sequence and structure analysisof antibody variable domains”,Antibody Engineering,Springer BerlinHeidelberg,2001.422-439;Abhinandan等人“Analysis and improvements to Kabat andstructurally correct numbering of antibody variable domains”Molecularimmunology 45.14(2008):3832-3839;Wu,T.T.和Kabat,E.A.(1970)J.Exp.Med.132:211-250;Martin等人,Methods Enzymol.203:121-53(1991);Morea等人,Biophys Chem.68(1-3):9-16(1997年10月);Morea等人,J Mol Biol.275(2):269-94(1998年1月);Chothia等人,Nature342(6252):877-83(1989年12月);Ponomarenko和Bourne,BMC StructuralBiology 7:64(2007);将各个文献通过引用以其全文并入本文。
CDR对于识别抗原表位很重要。如本文所用,“表位”是能够被抗体的抗原结合结构域特异性结合的靶分子的最小部分。表位的最小尺寸可能为约三、四、五、六或七个氨基酸,但这些氨基酸不是必须位于抗原一级结构的连续线性序列中,因为表位可能取决于基于抗原的二级和三级结构的抗原的三维构型。
在一些实施方案中,抗体是完整的免疫球蛋白分子(例如,IgG1、IgG2a、IgG2b、IgG3、IgG4、IgM、IgD、IgE、IgA)。IgG亚类(IgG1、IgG2、IgG3和IgG4)是高度保守的,不同之处在于其恒定区,尤其是其铰链和上部CH2结构域。IgG亚类的序列和差异是本领域已知的,并且描述于:例如Vidarsson等人,“IgG subclasses and allotypes:from structure toeffector functions.”Frontiers in immunology 5(2014);Irani等人“Molecularproperties of human IgG subclasses and their implications for designingtherapeutic monoclonal antibodies against infectious diseases.”Molecularimmunology67.2(2015):171-182;Shakib,Farouk,编辑The human IgG subclasses:molecular analysis of structure,function and regulation。Elsevier,2016;将各个文献通过引用以其全文并入本文。
抗体还可以是源自任何物种(例如人、啮齿动物、小鼠、大鼠、骆驼科动物)的免疫球蛋白分子。本文披露的抗体还包括但不限于多克隆抗体、单克隆抗体、单特异性抗体、多特异性抗体、以及包括与另一个多肽融合的免疫球蛋白结合结构域的嵌合抗体。术语“抗原结合结构域”或“抗原结合片段”是保留完整抗体的特异性结合活性的抗体部分,即抗体能够与完整抗体的靶分子上的表位特异性结合的任何部分。其包括例如Fab、Fab'、F(ab')2和这些片段的变体。因此,在一些实施方案中,抗体或其抗原结合片段可以是例如scFv、Fv、Fd、dAb、双特异性抗体、双特异性scFv、双抗体、线性抗体、单链抗体分子、由抗体片段形成的多特异性抗体、以及包括作为抗体结合结构域或与其同源的结合结构域的任何多肽。抗原结合结构域的非限制性实施例包括例如完整抗体的重链和/或轻链CDR、完整抗体的重链和/或轻链可变区、完整抗体的全长重链或轻链或来自完整抗体的重链或轻链的单独CDR。
在一些实施方案中,抗原结合片段可以形成嵌合抗原受体(CAR)的一部分。在一些实施方案中,嵌合抗原受体是如本文所述的单链可变片段(scFv)与CD3-ζ跨膜结构域和内结构域融合的融合物。
在一些实施方案中,scFV具有一个重链可变结构域和一个轻链可变结构域。在一些实施方案中,scFV具有两个重链可变结构域和两个轻链可变结构域。在一些实施方案中,scFV具有两个抗原结合区,并且所述两个抗原结合区可以结合各自的靶抗原。
通过本文所述方法产生的抗体及其抗原结合片段(例如,人源化抗体或嵌合抗体)具有各种有利方面。在一些实施方案中,不需要进一步优化来获得期望的性质(例如,结合亲和力、热稳定性和/或有限聚集)。
在一些实施方式中,抗体(或其抗原结合片段)特异性结合靶标,其中解离速率(koff)小于0.1s-1、小于0.01s-1、小于0.001s-1、小于0.0001s-1或小于0.00001s-1。在一些实施方案中,解离速率(koff)大于0.01s-1、大于0.001s-1、大于0.0001s-1、大于0.00001s-1或大于0.000001s-1。在一些实施方案中,这些抗体的大部分(例如,>50%、>60%、>70%或>80%)的koff在1×10-2/S和1×10-3/S之间。
在一些实施方案中,缔合速率(kon)大于1x 102/Ms、大于1x 103/Ms、大于1x104/Ms、大于1x 105/Ms或大于1x 106/Ms。在一些实施方案中,缔合速率(kon)小于1x 105/Ms、小于1x 106/Ms或小于1x 107/Ms。在一些实施方案中,这些抗体的大部分(例如,>50%、>60%、>70%或>80%)的kon在1×105/Ms和1×106/Ms之间。
亲和力可从动力学速率常数的商(KD=koff/kon)中推导出来。在一些实施方案中,KD小于1x 10-6M、小于1x 10-7M、小于1x 10-8M、小于1x 10-9M或小于1x10-10M。在一些实施方案中,KD小于50nM、40nM、30nM、20nM、15nM、10nM、9nM、8nM、7nM、6nM、5nM、4nM、3nM、2nM或1nM。在一些实施方案中,KD大于1x 10-7M,大于1x 10-8M,大于1x 10-9M,大于1x 10-10M,大于1x 10-11M,或大于1x 10-12M。在一些实施方案中,抗体与KD小于或等于约0.9nM、0.8nM、0.7nM、0.6nM、0.5nM、0.4nM、0.3nM、0.2nM或0.1nM的靶标结合。在一些实施方案中,这些抗体的大部分(例如,>50%、>60%、>70%或>80%)的KD在0.10nM和100.00nM之间(例如,1nM和100nM之间)。
在一些实施方案中,如本文所述的动物产生的抗体的重链CDR3长度中位数为13-15个氨基酸。在一些实施方案中,这些抗体的大部分(例如,>50%、>60%、>70%或>80%)的重链CDR3长度在9至18个氨基酸之间,或在10至17个氨基酸之间。
在一些实施方案中,如本文所述的动物产生的抗体中,只有不到30%、20%或15%的重链CDR3具有半胱氨酸残基(例如,一个半胱氨酸残基或两个半胱氨酸残基)。在一些实施方案中,重链CDR3具有不超过21个氨基酸残基。
在一些实施方案中,确定了热稳定性。如本文所述的抗体或抗原结合片段可以具有大于60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃的Tm。
因为IgG可被描述为多结构域蛋白,所以熔解曲线有时显示两个转变或三个转变,具有第一变性温度Tm D1和第二变性温度Tm D2,以及任选地第三变性温度TmD3。
在一些实施方案中,如本文所述的抗体或抗原结合片段具有大于60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃的Tm D1。在一些实施方案中,如本文所述的抗体或抗原结合片段具有大于60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃的Tm D2。在一些实施方案中,如本文所述的抗体或抗原结合片段具有大于60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃的Tm D3。
在一些实施方案中,Tm、Tm D1、Tm D2、Tm D3小于60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃。
在一些实施方案中,当温度小于60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃时,如本文所述的抗体或抗原结合片段不形成聚集。
制备经遗传修饰的动物的方法
所述经遗传修饰的动物可通过将人免疫球蛋白基因引入非人动物的基因组中以产生能够表达人源化抗体或嵌合抗体的动物来制备。图1A示出了制备人源化动物的方法。在一些实施方案中,所述方法首先涉及修饰人染色体上的人免疫球蛋白基因座。然后将经修饰的人染色体引入小鼠受体细胞。然后通过直接取代将人免疫球蛋白可变区引入小鼠基因组的相应区域。然后,筛选受体细胞。在一些实施方案中,细胞不含有人染色体。然后将细胞注射到囊胚中,以制备嵌合小鼠。可以进行后续育种以获得含有完整人源化免疫球蛋白基因座的小鼠。
其他几种技术也可用于制备经遗传修饰的动物,包含例如非同源性末端连接(NHEJ)、同源性重组(HR)、锌指核酸酶(ZFN)、基于转录激活因子样效应子的核酸酶(TALEN)和规律成族间隔短回文重复序列(CRISPR)-Cas系统。在一些实施方案中,使用同源性重组。在一些实施方案中,将CRISPR-Cas9基因组编辑用于产生经遗传修饰的动物。这些基因组编辑技术中的许多基因组编辑技术在本领域中是已知的,并且描述于例如Yin等人,“Delivery technologies for genome editing,”Nature Reviews Drug Discovery 16.6(2017):387-399,所述文献通过引用整体并入本文。还提供了许多其他方法,并且所述方法可用于基因组编辑,例如,将经遗传修饰的细胞核显微注射到去核卵母细胞中,并将去核卵母细胞与另一种经遗传修饰的细胞融合。
遗传修饰过程可涉及通过同源性重组用人序列取代内源性序列。在一些实施方案中,靶位点上游和下游的切割(例如,通过锌指核酸酶、TALEN或CRISPR)可导致DNA双链断裂,并将同源性重组用于采用人序列取代内源性序列。
在一些实施方案中,用于制备经遗传修饰的人源化动物的方法可包括在内源性基因座(或位点)处用人序列的相应区域取代核酸(例如,V、D、J区域或V、J区域)的步骤。所述序列可包含IGHV、IGHD、IGHJ、IGKV和/或IGKJ基因的区域(例如,一部分或整个区域)。在一些实施方案中,取代由同源性重组介导。在一些实施方案中,取代由Cre重组酶介导。
在一些实施方案中,小鼠轻链免疫球蛋白基因座的修饰可以直接进行。在一些实施方案中,将载体直接用于取代整个小鼠轻链免疫球蛋白可变区。在一些实施方案中,可在V区的上游、以及J区与C区之间插入载体。
在一些实施方案中,小鼠轻链免疫球蛋白基因座的修饰可以通过超过一个步骤进行。在一些实施方案中,第一载体可以用于取代整个小鼠轻链免疫球蛋白可变区。在一些实施方案中,载体包含一个或多个选择标志物。在一些实施方案中,选择标志物为显性选择标志物(例如,新霉素抗性基因或Neo)。在一些实施方案中,选择标志物为阴性选择标志物(例如,白喉毒素受体基因或DTR)。在一些实施方案中,第一载体含有一个或多个显性选择标志物和/或一个或多个阴性选择标志物。如本文所述的,在一些实施方案中,第二载体可用于进一步取代包含一个或多个选择标志物的区域。
图4示出了将内源性小鼠轻链免疫球蛋白可变区取代为人轻链可变区(例如,重排或未重排的人轻链可变区序列)的靶向策略。例如,人轻链可变区可以包含从IGKV3-20、IGKV3-11和IGKV1-39中选择的人IGKV基因;以及从IGKJ1和IGKJ4中选择的人IGKJ基因。在一些实施方案中,整个小鼠轻链可变区被包含Neo和DTR选择标志物基因的第一载体所取代。在一些实施方案中,第二载体具有从5'到3'的以下一个或多个:插入位点上游的DNA同源臂序列(5'同源臂);人IGKV基因第一核苷酸之前的启动子序列(例如,在人IGKV基因之前至少或约2000bp);人IGKV基因(例如,IGKV3-20、IGKV3-11或IGKV1-39);人IGKJ基因(例如,IGKJ1或IGKJ4);辅助序列(例如,polyA序列、WPRE序列或3'UTR序列);以及插入位点下游的DNA同源臂序列(3'同源臂)。
可将这些载体整合到细胞的基因组中,并且可通过药物抗性标志物或其组合(例如,博莱霉素(Zeocin)、G418和/或嘌呤霉素)来选择细胞。在一些实施方案中,表达了PB转座酶,并且转座酶靶序列之间的遗传元件可以被删除。
在一些实施方案中,这些载体被整合到已被修饰的人染色体中。在第一载体和第二载体被整合到基因组中之前,可以首先修饰人染色体。在一些实施方案中,可根据需要在染色体的不同位置添加一个或多个另外的载体。在一些实施方案中,在C区与着丝粒之间添加载体。
人染色体可获自人细胞系、癌细胞、原代细胞培养物和/或人成纤维细胞。在一些实施方案中,将第一载体引入人细胞,然后将所述细胞与受体细胞融合。然后将经修饰的染色体分离并引入到另一种合适的受体细胞中。选择具有所期望的抗性的细胞以获得仅含有一条人染色体的细胞。然后,将第二载体引入细胞,并且通过抗性选择细胞。然后,如果需要,可以引入第三载体和/或第四载体。受体细胞可以是哺乳动物细胞、人细胞或小鼠细胞。在一些实施方案中,受体细胞是CHO细胞,或优选为A9细胞。在一些实施方案中,用荧光标记经修饰的染色体并分离所述染色体。并且通过染色体显微注射将经修饰的染色体注射到受体细胞中。在一些实施方案中,诱导供体细胞多核化它们的染色体。然后,迫使这些细胞核穿过细胞膜,以形成微细胞,可将所述微细胞与受体细胞融合。在一些实施方案中,还可使用微细胞介导的染色体转移。染色体操作技术描述于例如CN 1200014 A、CN 109837307 A、US 20120093785A1和US 2009253902;Kuroiwa等人“Manipulation of humanminichromosomes to carry greater than megabase-sized chromosome inserts.”Nature Biotechnology 18.10(2000):1086-1090;中国专利CN 1717483 A;Paulis,Marianna.“Chromosome Transfer Via Cell Fusion.”Methods in Molecular Biology738(2011):57;Genes,Chromosomes&Cancer 14:126127(1995);Tomizuka等人“Functionalexpression and germline atransmission of a human chromosome fragment inchimaeric mice.”Nature Genetics 16.2(1997):133-143;Somatic Cell and MolecularGenetics,第13卷,第3期,1987,第279-284页;其中每一篇均通过引用整体并入本文。
还可将LoxP识别序列添加到人染色体(例如,人2、14、22号染色体)。还可用Cre酶处理细胞,导致loxP位点的重组,从而去除基因组DNA序列。在一些实施方案中,自发的染色体断裂也可用于去除基因组DNA序列。
小鼠免疫球蛋白可变区可通过取代方式(例如,同源性重组或Cre介导的重组)被人免疫球蛋白可变区取代。在一些实施方案中,Cre重组可用于介导取代。在一些实施方案中,载体可将LoxP识别序列添加到人染色体中。可对小鼠染色体进行类似的修饰,其中可将两个LoxP识别序列添加到染色体上。例如,Cre重组酶可介导用人染色体上的V、J区取代小鼠染色体上的V、J区,或者用人染色体上的V、D、J区取代小鼠染色体上的V、D、J区。
可进一步筛选细胞中不具有人染色体的细胞(例如,通过DT)。在一些情况下,未经DT筛选的细胞可含有重组人染色体片段,但这些片段很小,并且在小鼠细胞中不稳定(例如,Shinohara等人(2000)Chromosome Research,8:713-725),并且在细胞增殖过程中会自然消失。在一些实施方案中,经修饰的人染色体的大片段缺失,例如通过Cre介导的删除或通过自发的染色体断裂。
5’末端同源臂和/或3’末端同源臂可具有期望的长度以促进同源性重组。在一些实施方案中,同源臂约为或至少为1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb或50kb(例如,约为3kb)。在一些实施方案中,同源臂小于1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb或50kb。
在一些实施方案中,载体还可任选地包含报告蛋白,例如萤光素酶(例如,Gluc)或荧光蛋白(例如,EGFP、BFP等)。
这些修饰可在各种细胞中进行。在一些实施方案中,细胞是干细胞、胚胎干细胞或受精卵细胞。
本公开还提供了用于建立人源化动物模型的方法,所述方法包括以下步骤:
(a)基于本文所述的方法提供细胞(例如,受精卵细胞);
(b)在液体培养基中培养细胞;
(c)将培养的细胞移植到受体雌性非人哺乳动物的输卵管或子宫中,使细胞在雌性非人哺乳动物的子宫中发育;
(d)在步骤(c)中鉴定怀孕雌性的后代经遗传修饰的人源化非人哺乳动物中的种系传播。
在一些实施方案中,前述方法中的非人哺乳动物是小鼠(例如,C57小鼠、BALB/c小鼠或C57BL/6小鼠)。
在一些实施方案中,步骤(c)中的非人哺乳动物是伪怀孕(或假怀孕)的雌性动物。
在一些实施方案中,用于上述方法的受精卵是C57BL/6受精卵。也可用于如本文所述的方法的其他受精卵包括但不限于FVB/N受精卵、BALB/c受精卵、DBA/1受精卵和DBA/2受精卵。
受精卵可来自任何非人动物,例如,如本文所述的任何非人动物。在一些实施方案中,受精卵细胞源自啮齿动物。可通过DNA的显微注射将基因构建体引入受精卵。例如,通过在显微注射后培养受精卵,可将培养的受精卵转移到假怀孕的非人动物中,然后所述动物生产非人哺乳动物,从而产生上述方法中提及的非人哺乳动物。
还提供了包含如本文所述的核苷酸序列的细胞、组织和动物(例如,小鼠),以及表达来自内源性非人基因座的人源化或嵌合抗体的细胞、组织和动物(例如,小鼠)。
本公开还提供了多种靶向载体(例如,用于制备经遗传修饰的动物的载体)。在一些实施方案中,载体可包含:a)与待改变区域的5’末端同源的DNA片段(5’同源臂);b)包含期望的遗传元件(例如,LoxP识别位点、药物抗性基因和/或报告基因等)的序列;和c)与待改变的区域的3’末端同源的第二DNA片段(3’同源臂)。本公开还涉及包含如本文所述的靶向载体的细胞。
在一些实施方案中,所述细胞中的基因是杂合的。在一些实施方案中,所述细胞中的基因是纯合的。
在一些实施方案中,所述非人哺乳动物细胞是小鼠细胞。在一些实施方案中,所述细胞是受精卵细胞。
本公开还涉及产生具有两个或更多个人或嵌合基因的经遗传修饰的动物模型的方法。所述动物可包含一个或多个人或人源化免疫球蛋白基因座和编码另外的人或嵌合蛋白的序列。在一些实施方案中,所述另外的人或嵌合蛋白可以是程序性细胞死亡蛋白1(PD-1)、细胞毒性T淋巴细胞相关蛋白4(CTLA-4)、淋巴细胞激活3(LAG-3)、B和T淋巴细胞相关(BTLA)、程序性细胞死亡1配体1(PD-L1)、CD27、CD28、CD47、CD137、CD154、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、T细胞免疫球蛋白和含有粘蛋白结构域3(TIM-3)、糖皮质激素诱导的TNFR相关的蛋白(GITR)或TNF受体超家族成员4(TNFRSF4或OX40)。
产生具有另外的人或嵌合基因(例如,人源化基因)的经遗传修饰的动物模型的方法可包括以下步骤:
(a)使用如本文所述的方法获得经遗传修饰的非人动物;
(b)将所述经遗传修饰的非人动物与另一种经遗传修饰的非人动物交配,然后筛选后代以获得具有两个或更多个人或嵌合基因的经遗传修饰的非人动物。
在一些实施方案中,在所述方法的步骤(b)中,可将所述经遗传修饰的动物与具有人或嵌合PD-1、CTLA-4、LAG-3、BTLA、PD-L1、CD27、CD28、CD47、CD137、CD154、TIGIT、TIM-3、GITR、SIRPa或OX40的经遗传修饰的非人动物交配。例如,在PCT/CN 2017/090320、PCT/CN2017/099577、PCT/CN 2017/099575、PCT/CN 2017/099576、PCT/CN 2017/099574、PCT/CN2017/106024、PCT/CN 2017/110494、PCT/CN 2017/110435、PCT/CN 2017/120388、PCT/CN2018/081628、PCT/CN 2018/081629中描述了这些经遗传修饰的非人动物中的一些;其中每一篇都通过引用整体并入本文。
本公开进一步涉及生成敲除动物的方法。在一些实施方案中,如果动物(例如,小鼠)表达与目标抗原非常相似的蛋白,则可能难以在动物中引发免疫反应。这是因为在免疫细胞发育过程中,识别与自身来源肽结合的MHC分子的B细胞和T细胞被从免疫细胞的谱系中删除。在这些情况下,可进一步修饰经遗传工程改造的动物。可敲除动物中相应的基因,然后将动物暴露于目标抗原。因为动物对基因产物不进行阴性选择,所以动物可以产生可以容易与靶标特异性结合的抗体。因此,在一些实施方案中,本公开还提供了敲除经遗传修饰的动物中目标基因的方法。在一些实施方案中,基因可以通过各种已知的基因编辑技术敲除,例如,CRISPR-Cas系统、TALEN或ZFN。在一些实施方案中,经遗传修饰的动物可以与另一种目标基因已被敲除的动物交配。一旦有敲除表型的动物被创造出来,所述动物就可以暴露于目标抗原以产生抗体(例如,具有共有轻链的抗体)。在一些实施方案中,所述目标抗原是人蛋白。在一些实施方案中,所述目标抗原是PD-1、CTLA-4、LAG-3、BTLA、PD-L1、CD27、CD28、CD47、CD137、CD154、TIGIT、TIM-3、GITR、SIRPa或OX40。
在一些实施方案中,所述经遗传修饰的动物可具有人ADAM6基因、内源性ADAM6基因或经修饰的ADAM6基因(例如,在其内源性基因座)。ADAM6蛋白是ADAM蛋白家族的一员,其中ADAM是解整合素和金属蛋白酶的首字母缩写。通常在人IGHV基因IGHV 1-2与IGHV 6-1之间发现的人ADAM6基因是假基因(图16)。在小鼠中,存在两个ADAM6基因,即ADAM6a和ADAM6b。它们位于小鼠IGHV与IGHD基因簇之间的基因间区域。小鼠ADAM6a位于小鼠IGHV5-1与小鼠IGHD5-1之间。小鼠ADAM6b位于小鼠IGHD3-1与小鼠IGHD1-1之间。因此,在一些实施方案中,所述经遗传修饰的动物可具有人ADAM6基因。在一些实施方案中,所述经遗传修饰的动物不具有内源性ADAM6基因。
在一些实施方案中,所述经遗传修饰的动物是小鼠。在一些实施方案中,所述小鼠被修饰成包括编码ADAM6蛋白(例如,ADAM6a或ADAM6b)的核苷酸序列。在一些实施方案中,所述序列被放置在任何合适的位置。其可被置于基因间区域,或者基因组中任何合适的位置。在一些实施方案中,所述核酸编码与小鼠ADAM6a基因(例如,NC_000078.6的113539230-113547024)或小鼠ADAM6b基因(例如,NC_000078.6的113486188-113492125)至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的序列。在一些实施方案中,所述核酸另外包括ADAM6a基因和ADAM6b基因的调控元件(例如,启动子)。
在一些实施方案中,功能性小鼠ADAM6基因座可置于人IGHV基因簇的中间。在一些实施方案中,小鼠ADAM6基因座位于两个人IGHV基因之间。在一些实施方案中,人VH1-2与人VH(II)-1-1之间的人ADAM6假基因用小鼠ADAM6基因座取代。在一些实施方案中,在动物基因组中,ADAM6a基因和ADAM6b基因位于人IGHV1-2与人VH(II)-1-1之间。在一些实施方案中,小鼠ADAM6序列在人基因序列中的位置可接近人ADAM6假基因的位置,或者可接近小鼠ADAM6序列的位置(例如,在V-D基因间区域内)。在一些实施方案中,经遗传修饰的小鼠具有人源化重链免疫球蛋白基因座。在一些实施方案中,小鼠ADAM6a和小鼠ADAM6b位于人IGHV1-2与IGHV6-1基因之间。将小鼠ADAM6a和小鼠ADAM6b置于人IGHV1-2与IGHV6-1基因之间可能具有多种有利方面。例如,因为这些基因在相同的基因座取代了人ADAM6基因,所以人ADAM6基因的取代对VDJ重组的影响有限,并且小鼠ADAM6a和小鼠ADAM6b基因也可以正常发挥作用(如在与内源性基因座相似的位置中)。
因此,在一方面,本公开提供了经遗传修饰的动物,所述经遗传修饰的动物在内源性重链免疫球蛋白基因座处包含:包含一个或多个人IGHV基因的第一序列;包含ADAM6基因的第二序列;以及包含一个或多个人IGHD基因和一个或多个人IGHJ基因的第三序列。在一些实施方案中,所述第一序列、第二序列和第三序列可操作性地连接。
在一些实施方案中,所述第一序列包含表5中除IGHV2-10、IGHV3-9、IGHV1-8、IGHV(II)-1-1和IGHV6-1外的所有人IGHV基因。在一些实施方案中,所述第一序列包含表5中除IGHV5-10-1和IGHV3-64D、IGHV(II)-1-1和IGHV6-1外的所有人IGHV基因。在一些实施方案中,所述第一序列包含IGHV5-10-1和IGHV3-64D。在一些实施方案中,所述第一序列是源自人重链免疫球蛋白基因座的未修饰的序列。
在一些实施方案中,所述第二序列包含小鼠ADAM6a基因和小鼠ADAM6b基因之一或两者。在一些实施方案中,所述动物是能育的雄性小鼠。在一些实施方案中,所述第二序列不具有小鼠ADAM6a基因或小鼠ADAM6b基因。
在一些实施方案中,所述第三序列包含表6中的所有人IGHD基因和表7中的所有人IGHJ基因。在一些实施方案中,所述第三序列包含人IGHV6-1。在一些实施方案中,所述第三序列包含人IGHV(II)-1-1。在一些实施方案中,所述第三序列是源自人重链免疫球蛋白基因座的未修饰的序列。
在一些实施方案中,AMAM6a和/或ADAM6b是内源性序列。在一些实施方案中,AMAM6a和/或ADAM6b不被取代,和/或位于其内源性或天然位置。在一些实施方案中,重链可变区基因座中小鼠IGHV1-2之前的小鼠IGHV基因被人IGHV基因取代。在一些实施方案中,重链可变区基因座中小鼠IGHV6-1之后的小鼠IGHV、IGHD和IGHJ基因被一个或多个人IGHV基因、IGHD和/或IGHJ基因取代。
因此,在一些实施方案中,可用人IGHV、IGHD和IGHJ基因取代小鼠IGHV、IGHD和IGHJ基因一次以上。在第一步中,用人IGHV基因取代在ADAM6a的5’侧选定数量的小鼠IGHV基因(例如,表8中的所有小鼠IGHV基因)。在第二步中,用人IGHD和人IGHJ基因取代ADAM6b的3’侧的选定数量的小鼠IGHD和IGHJ基因(例如,表9中除IGHD5-1和IGHD3-1外的所有小鼠IGHD基因和表10中的所有IGHJ基因)。取代可通过同源性重组或Cre介导的重组来进行。
在一些实施方案中,所述小鼠不具有小鼠ADAM6a或ADAM6b基因。在一些实施方案中,所述小鼠具有人ADAM6基因。
可使用各种方法来增强小鼠的生育力。在一些实施方案中,可将具有超数排卵的雌性小鼠用于交配。在一些实施方案中,可使用体外授精。可通过将血清促性腺激素和绒膜促性腺激素(例如,人或小鼠CG)注射到成熟的雌性小鼠中来诱导超数排卵。可处死成熟的雄性小鼠,并且分离其附睾尾。将附睾尾的导管切开以释放精子。接下来,可以处死超数排卵的成熟雌性小鼠并分离输卵管。卵丘-卵母细胞复合体(COC)可以从输卵管释放出来。接下来,可将精子悬浮液加入到COC并孵育以用于授精。可除去只含有一个原核的致病卵母细胞。孵育后,可将2细胞期的胚胎转移到受体雌性。增强小鼠生育力的方法是本领域已知的。
本公开还提供了核酸序列,所述核酸序列与如本文所述的任何核苷酸序列至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同,并且提供了氨基酸序列,所述氨基酸序列与如本文所述的任何氨基酸序列至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同。
在一些实施方案中,本公开涉及编码如本文所述的任何肽的核苷酸序列,或涉及由如本文所述的任何核苷酸序列编码的任何氨基酸序列。在一些实施方案中,核酸序列小于10、20、30、40、50、60、70、80、90、100、110、120、130、150、200、250、300、350、400、500或600个核苷酸。在一些实施方案中,所述氨基酸序列小于5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350或400个氨基酸残基。
在一些实施方案中,氨基酸序列(i)包含氨基酸序列;或(ii)由氨基酸序列组成,其中所述氨基酸序列是如本文所述的序列中的任一个。
在一些实施方案中,所述核酸序列(i)包含核酸序列;或(ii)由核酸序列组成,其中所述核酸序列是如本文所述的序列中的任一个。
为了确定两个氨基酸序列或两个核酸序列的同一性百分比,出于最佳比较目的对序列进行配对(例如,在第一氨基酸和第二氨基酸或第一核酸序列和第二核酸序列的一者或二者中引入缺口以用于最佳比对,并且出于比较目的,非同源序列可以忽略)。然后比较对应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与第二序列中的对应位置相同的氨基酸残基或核苷酸占据时,所述分子在所述位置处是相同的。将缺口的数量和每个缺口的长度考虑在内,两个序列之间的同一性百分比是所述序列共享的相同位置的数量的函数,需要引入所述缺口以进行所述两个序列的最佳比对。出于图示的目的,两个序列的比较和两个序列之间同一性百分数的确定可以通过例如使用具有缺口罚分12、缺口延伸罚分4、以及移码缺口罚分5的Blosum 62评分矩阵实现。
具有类似理化性质(同源性百分比)的保守残基如亮氨酸和异亮氨酸的百分比也可用于测量序列相似性。具有相似的理化性质的氨基酸残基的家族已在本领域中定义。这些家族包括例如具有以下侧链的氨基酸:碱性侧链(例如,赖氨酸、精氨酸、组氨酸),酸性侧链(例如,天冬氨酸、谷氨酸),不带电的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸),非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸),β-分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。在许多情况下,同源性百分比高于同一性百分比。因此,本公开还提供了与如本文所述的任何氨基酸序列至少具有1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同源性百分比的氨基酸序列,或编码这些氨基酸序列的核酸。
使用经遗传修饰的动物的方法
所述经遗传修饰的动物可用于产生能与靶标特异性结合的人源化抗体或嵌合抗体。在一些实施方案中,可使用多克隆和单克隆抗体制备物的标准技术,将靶标(例如,蛋白或蛋白的片段)用作免疫原以在这些动物中产生抗体。在一些实施方案中,将所述经遗传修饰的动物在允许所述动物产生特异于选定的抗原的抗体的条件下暴露于所述抗原一段时间。
可以通过多次注射(例如皮下或腹腔注射)抗原肽或蛋白质而在动物中产生多克隆抗体。在一些实施方案中,将抗原肽或蛋白质与至少一种佐剂一起注射。在一些实施方案中,可以将抗原肽或蛋白质与待免疫物种中具有免疫原性的药剂缀合。可以向动物注射抗原肽或蛋白质超过一次(例如两次、三次或四次)。
可以使用全长多肽或蛋白质;或者可替代地,其抗原肽片段可以用作免疫原。蛋白质的抗原肽包含氨基酸序列的至少8个(例如,至少10个、15个、20个或30个)氨基酸残基,并且涵盖蛋白质的表位,使得产生的针对所述肽的抗体与所述蛋白质形成特异性免疫复合物。
免疫原通常用于通过免疫合适的受试者(例如,如本文所述的经遗传修饰的动物)来制备抗体。合适的免疫原性制剂可以含有例如重组表达的多肽或化学合成的多肽(例如,蛋白的片段)。所述制剂可以进一步包含佐剂,例如弗氏完全或不完全佐剂或类似的免疫刺激剂。
如上所述,可以通过用多肽或其抗原肽(例如,蛋白的一部分)作为免疫原来免疫合适的受试者以制备多克隆抗体。可以通过标准技术(例如使用固定化的多肽或肽的酶联免疫吸附测定(ELISA))监测经免疫的受试者的抗体效价随时间的变化。如果需要,可以将抗体分子从哺乳动物(例如,从血液)分离,并通过熟知的技术(例如,蛋白A或蛋白G色谱法)进一步纯化以获得IgG部分。在免疫后的合适时间,例如当特异性抗体效价最高时,产生抗体的细胞可以从受试者获得并通过以下标准技术用于制备单克隆抗体:例如最初由Kohler等人(Nature 256:495-497,1975)描述的杂交瘤技术、人B细胞杂交瘤技术(Kozbor等人,Immunol.Today 4:72,1983)、EBV杂交瘤技术(Cole等人,Monoclonal Antibodies andCancer Therapy,Alan R.Liss,Inc.,第77-96页,1985)或三源杂交瘤(trioma)技术。用于产生杂交瘤的技术是熟知的(通常参见Current Protocols in Immunology,1994,Coligan等人(编辑),John Wiley&Sons,Inc.,纽约,NY)。产生单克隆抗体的杂交瘤细胞通过例如使用标准ELISA测定法筛选杂交瘤培养上清液的结合目标多肽或表位的抗体的方式来检测。
在一方面,本公开提供了包含内源性免疫球蛋白重链基因座的修饰的小鼠,其中所述小鼠产生包含可操作性地连接至重链恒定区基因序列的重排免疫球蛋白序列的B细胞。在一些实施方案中,可操作性地连接至所述重链恒定区基因序列的所述重排免疫球蛋白序列包含人重链V、D和/或J序列。在一些实施方案中,所述重链恒定区基因序列包含选自CH1、铰链、CH2、CH3及其组合组成的组的人或小鼠重链序列。
在一方面,本公开提供了包含内源性免疫球蛋白轻链(例如,κ或λ)基因座的修饰的小鼠,其中所述小鼠产生包含可操作性地连接至轻链恒定区基因序列的重排免疫球蛋白序列的B细胞。在一些实施方案中,可操作性地连接至所述轻链恒定区基因序列的所述重排免疫球蛋白序列包含人轻链V和/或J序列。在一些实施方案中,所述轻链恒定区基因序列包含人或小鼠轻链恒定区。
所述小鼠B细胞或脾细胞可包含例如可操作性地连接至小鼠免疫球蛋白恒定区基因的重排非小鼠免疫球蛋白可变基因序列。确定编码人重链可变区和人轻链可变区的序列。所述序列可通过例如对目标杂交瘤或B细胞进行测序来确定。在一些实施方案中,使用单个B细胞筛选。其可筛选天然抗体谱系而无需杂交瘤融合和组合展示。例如,可将B细胞与一小组DNA条形编码的抗原混合,使得通过单细胞测序方案回收单个B细胞的一个或多个抗原条形码和B细胞受体(BCR)序列。
可以例如通过将编码人重链可变区的序列可操作性地连接至编码人重链恒定区的序列,和/或将编码人轻链可变区的序列可操作性地连接至编码人轻链恒定区的序列,进一步修饰抗体以获得人源化抗体或人抗体。
本公开还提供了制备抗体、核酸、细胞、组织(例如,脾组织)的方法。在一些实施方案中,所述方法包括将如本文所述的动物暴露于抗原。可从动物获得抗体(例如,嵌合抗体)、编码抗体的核酸、细胞和/或组织(例如,脾组织)。在一些实施方案中,编码人重链和轻链免疫球蛋白可变区的核酸可以例如通过测序来确定。在一些实施方案中,可将编码人重链免疫球蛋白可变区的核酸与编码人重链免疫球蛋白恒定区的核酸可操作性地连接。在一些实施方案中,可将编码人轻链免疫球蛋白可变区的核酸与编码人轻链免疫球蛋白恒定区的核酸可操作性地连接。在一些实施方案中,培养含有如本文所述的核酸的细胞并收集抗体。
在一些实施方案中,小鼠免疫球蛋白V、D、J基因(例如,小鼠IGHV、IGHD、IGHJ、IGKV或IGKJ基因)对重链和/或轻链可变区序列没有贡献。在一些实施方案中,由动物产生的重链和/或轻链可变区序列完全是人的,并且完全由人免疫球蛋白V、D、J基因(例如,人IGHV、IGHD、IGHJ、IGKV和IGKJ基因)贡献。
可以通过将适当的核苷酸变化引入编码本文所述的人抗体、人源化抗体或嵌合抗体或其抗原结合片段的DNA中或通过肽合成来制备本文所述的抗体或抗原结合片段的变体。此类变体包括例如组成抗体的抗原结合位点或抗原结合结构域的氨基酸序列内残基的缺失、插入或取代。在此类变体的群体中,一些抗体或抗原结合片段将对靶蛋白具有增加的亲和力。可以对缺失、插入和/或组合进行任意组合,以获得对靶标具有增加的结合亲和力的抗体或其抗原结合片段。引入到抗体或抗原结合片段中的氨基酸变化还可以改变新的翻译后修饰或将新的翻译后修饰引入抗体或抗原结合片段中,例如改变(例如,增加或减少)糖基化位点的数量、改变糖基化位点的类型(例如,改变氨基酸序列,使得细胞中存在的酶连接不同的糖)或引入新的糖基化位点。
本文披露的抗体可以源自任何动物物种,包括哺乳动物。天然抗体的非限制性实施例包括源自以下的抗体:人、灵长类动物(例如猴和猿)、牛、猪、马、绵羊、骆驼科动物(例如骆驼和美洲驼)、鸡、山羊和啮齿动物(例如大鼠、小鼠、仓鼠和兔),包括遗传工程改造以产生人抗体的转基因啮齿动物。
人和人源化抗体包括具有来源于人种系免疫球蛋白序列的可变区和恒定区(或具有与源自人种系免疫球蛋白序列的氨基酸序列相同的氨基酸序列)的抗体。人抗体可以包括不是由人种系免疫球蛋白序列编码的氨基酸残基(例如,通过体外随机诱变或位点特异性诱变或通过体内体细胞突变而引入的突变),例如在CDR中。
可以对抗体或抗原结合片段进行另外的修饰。例如,可以将一个或多个半胱氨酸残基引入Fc区,从而允许在此区域中形成链间二硫键。由此产生的同二聚体抗体可以具有任何增加的体外和/或体内半衰期。还可以使用如例如Wolff等人(Cancer Res.53:2560-2565,1993)描述的异双功能交联接头来制备具有增加的体外和/或体内半衰期的同二聚体抗体。或者,可以将具有两个Fc区的抗体进行工程改造(参见例如,Stevenson等人,Anti-Cancer Drug Design 3:219-230,1989)。
在一些实施方案中,可以对抗体或其抗原结合片段进行共价修饰。这些共价修饰可以通过化学合成或酶促合成或通过酶促裂解或化学切割来进行。抗体或抗体片段的其他类型的共价修饰通过使抗体或片段的靶向氨基酸残基与能够与选定侧链或N-末端或C-末端残基反应的有机衍生剂进行反应而引入分子中。
用共有轻链制备双特异性抗体的方法
本公开提供了经遗传工程改造的动物,所述经遗传工程改造的动物表达了可与多种重链相关联的有限谱系的轻链。在各种实施方案中,内源性κ轻链可变区基因被删除并取代为单个、两个、三个、四个或五个人轻链可变区基因,可操作性地连接至内源性κ恒定区基因。在各种实施方案中,所述动物还包含非功能性λ轻链基因座,或其缺失或使所述基因座无法制作λ轻链的缺失。
在一些实施方案中,动物包含轻链可变区基因座,所述轻链可变区基因座缺少内源性轻链可变基因并包含重排的人V/J序列,可操作性地连接至内源性恒定区,并且其中所述基因座表达包含连接至内源性恒定区的人V/J序列的轻链。
在各种实施方案中,当用目标抗原免疫时,经遗传工程改造的动物产生B细胞,所述B细胞表现出人免疫球蛋白重链可变区的多种重排,所述多种重排用有限数量(例如,1、2、3、4、5个)的重排轻链进行表达和运转,包括其中一条或两条轻链包含人轻链可变区的实施方案,所述人轻链可变区包含例如1至5个体细胞突变。在一些实施方案中,至少50%、60%、70%、80%、90%或95%的人轻链可变区具有至少1个体细胞突变。在一些实施方案中,至少50%、60%、70%、80%、90%或95%的人轻链可变区具有至少2个体细胞突变。在一些实施方案中,至少50%、60%、70%、80%、90%或95%的人轻链可变区具有至少3个体细胞突变。
在一些实施方案中,体细胞超变率相对较低。在一些实施方案中,不超过30%或40%的人轻链可变区有一个或多个体细胞突变。在一些实施方案中,不超过20%的人轻链可变区有两个或更多个体细胞突变。
在一些实施方案中,如本文所述的动物可以用第一免疫原免疫以产生B细胞,所述B细胞表达与第一表位特异性结合的抗体。所述动物可以用第二免疫原免疫以产生B细胞,所述B细胞表达与第二表位特异性结合的抗体。重链可变区可以从B细胞克隆到用于转染细胞的载体上,以表达融合为人重链恒定区的重排人重链可变区,以及融合为人轻链恒定区的共有轻链可变区。
在一些实施方案中,本文所述的方法设计用于制备双特异性抗体。可通过将一对抗体分子之间的界面工程改造以使从重组细胞培养物中回收的异二聚体的百分比最大化来制备双特异性抗体。例如,界面可以含有抗体恒定结构域的CH3结构域的至少一部分。在此方法中,来自第一抗体分子界面的一个或多个小氨基酸侧链被较大的侧链(例如,酪氨酸或色氨酸)取代。通过用较小的氨基酸侧链(例如丙氨酸或苏氨酸)取代大氨基酸侧链,在第二抗体分子的界面上产生与一个或多个大侧链相同或相似大小的补偿“腔”。这提供了用于增加异二聚体相对于其他不需要的终产物如同二聚体的产量的机制。此方法描述于例如WO96/27011中,其通过引用以其全文并入。
在一些实施方案中,可以使用杵臼结构(KIH)技术,所述技术涉及到工程改造CH3结构域,在每个重链上创建一个“杵(knob)”或一个“臼(hole)”,以促进异二聚体化。KIH技术在例如Xu、Yiren等人所著的“Production of bispecific antibodies in‘knobs-into-holes’using a cell-free expression system”MAbs.第7卷,第1期,Taylor和Francis,2015中描述,将其通过引用以其全文并入本文。在一些实施方案中,一个重链具有T366W和/或S354C(杵)取代(EU编号),并且另一个重链具有Y349C、T366S、L368A和/或Y407V(臼)取代(EU编号)。在一些实施方案中,一个重链具有以下取代的一个或多个:Y349C和T366W(EU编号)。另一个重链可以具有以下取代的一个或多个:E356C、T366S、L368A和Y407V(EU编号)。在一些实施方案中,一个重链具有T366Y(杵)取代,并且另一个重链具有这些取代的一个两个或三个:T366S、L368A、Y407V(臼)。
此外,阴离子交换色谱法可用于纯化双特异性抗体。阴离子交换色谱法是一种基于利用含有正电荷基团如二乙基-氨基乙基(DEAE)的离子交换树脂作为电荷,分离物质的方法。在溶液中,树脂涂覆有带正电的反离子(阳离子)。阴离子交换树脂会与带负电荷的分子结合,取代反离子。阴离子交换色谱法可用于基于它们的等电点(pI)纯化蛋白。等电点被定义为蛋白不带净电荷的pH。当pH>pI时,蛋白带净负电荷,并且当pH<pI时,蛋白带净正电荷。因此,在一些实施方案中,可以将不同的氨基酸取代引入到两个重链中,因此包含两个臂(Arm)A的同二聚体的pI和包含两个臂B的同二聚体的pI是不同的。如本文所用,双特异性抗体中的术语“臂”是指双特异性抗体中特异性结合特定抗原(或表位)的抗原结合位点。具有臂A和臂B的双特异性抗体的pI将介于同二聚体的两个pI之间。因此,两个同二聚体和双特异性抗体可以在不同的pH条件下释放。本公开表明,可以在重链上引入一些氨基酸残基取代基来调节pI。因此,在一些实施方案中,VH中Kabat编号位83处的氨基酸残基为赖氨酸、精氨酸或组氨酸。在一些实施方案中,VH中位于1、6、43、81和105(Kabat编号)的一个或多个位置的氨基酸残基是天冬氨酸或谷氨酸。在一些实施方案中,位于13和105(Kabat编号)的一个或多个位置的氨基酸残基是天冬氨酸或谷氨酸。在一些实施方案中,位于13和42(Kabat编号)的一个或多个位置的氨基酸残基是赖氨酸、精氨酸、组氨酸或甘氨酸。
实施例
实施例1:概述
进行了将人免疫球蛋白基因引入小鼠基因组中以产生表达人源化抗体的小鼠的实验。图1A示出了制备人源化小鼠的方法。所述方法首先涉及修饰人染色体上的人免疫球蛋白区域。然后将经修饰的人染色体引入小鼠受体细胞。
通过直接取代(例如,同源性重组或Cre介导的重组)用人免疫球蛋白可变区取代了小鼠免疫球蛋白可变区。在一些情况下,可通过逐步的方法将人免疫球蛋白可变区引入小鼠基因组。然后,筛选正确取代的受体细胞。然后将细胞注射到囊胚中以制备嵌合小鼠。随后进行育种以获得含有人或人源化免疫球蛋白可变区的小鼠。
因为小鼠重链基因和两个轻链基因分别位于12、6和16号染色体上,所以可以分别制备含有人重链可变区或人轻链可变区的小鼠。然后可将这些小鼠相互交配以获得既能表达人重链可变结构域又能表达人共有轻链可变结构域的小鼠。
实施例2:小鼠重链免疫球蛋白基因座的修饰
重链免疫球蛋白基因座位于小鼠12号染色体上。在重链免疫球蛋白基因座的可变区两侧引入了两个重组位点。
还进行了实验以产生经修饰的人染色体。在重链免疫球蛋白基因座的可变区两侧引入了两个重组位点。然后将经修饰的人染色体引入小鼠细胞。然后筛选细胞。只选择仅含有一条人染色体的细胞。然后Cre重组酶介导用人染色体上的V、D、J区对小鼠染色体上的V、D、J区的取代(图1B)。
通过显微注射将阳性克隆细胞注射到BALB/c小鼠的囊胚中。根据例如A.Nagy等人,“Manipulating the Mouse Embryo:A Laboratory Manual(第3版),”Cold SpringHarbor Laboratory Press,2003中描述的方法进行胚胎显微注射。然后将注射的受精卵转移到培养基中进行短时间培养,然后移植到受体小鼠的输卵管中以产生经遗传修饰的人源化小鼠(F0代)。然后将小鼠与背景为C57BL/6的小鼠交配。对从小鼠尾部获得的DNA进行PCR分析。将小鼠进一步与具有BALB/c背景的小鼠杂交数次(例如,至少5次),以获得具有BALB/c背景的人源化重链免疫球蛋白基因座杂合的小鼠。
然后将杂合的小鼠相互交配以获得纯合的小鼠。如何制备人源化重链免疫球蛋白基因座纯合的小鼠的详细描述见2020年2月18日提交的PCT/CN 2020/075698,将其通过引用以其全文并入本文。
实施例3:轻链VJ区的序列设计
分析了人轻链可变区序列在各种抗体中的应用。
(1)从IMGT/GeneFrequency数据库收集数据。数据统计分析显示利用率最高的5个κ轻链V区基因为:IGKV3-20、IGKV1-39/IGKV1D-39、IGKV3-11、IGKV3-15、IGKV4-1。利用率最高的3个κ轻链J区基因为:IGKJ1、IGKJ2、IGKJ4。
表12
Figure BDA0003978200570000631
Figure BDA0003978200570000641
Figure BDA0003978200570000651
2)分析110个抗体分子的轻链遗传信息。从IMGT/mAb-DB数据库收集序列信息。统计分析表明最高的5个κ轻链V区基因为IGKV3-20、IGKV3-11、IGKV3-15、IGKV1-39/IGKV1D-39和IGKV1-12/IGKV1D-12;并且利用率最高的3个κ轻链J区基因为IGKJ1、IGKJ4和IGKJ2(图2A-2B)。
在分析的基础上,选择了三个人轻链V区(IGKV3-20、IGKV3-11和IGKV1-39)和两个人轻链J区(IGKJ1和IGKJ4)作为人源化轻链免疫球蛋白基因座。
实施例4:重排轻链小鼠的制备
小鼠轻链免疫球蛋白基因座位于小鼠6号染色体上。图3A是示出小鼠轻链免疫球蛋白基因座的示意图。野生型小鼠的整个小鼠VJ区可以用重排的人轻链VJ区序列取代(图3B)。或者,所述过程可以分步骤进行,即可以先敲除小鼠VJ区(例如,用含有Neo和DTR的序列取代VJ区),然后可以插入含有重排的人轻链VJ区的序列。
例如,小鼠6号染色体通过敲除κ轻链免疫球蛋白基因座可变区的整个序列进行了修饰。构建三个不同重排的人轻链VJ序列,然后插入小鼠6号染色体κ链VJ区。
人源化策略示意图如图4所示。构建了三个公用共有序列特征的同源性重组靶向载体,即,每个同源性重组靶向载体都具有上下游同源臂序列和重排的人轻链VJ序列。对于每个载体,有区别地选择重排的人VJ序列。三个载体分别含有重排的人IGKV1-39/J4、IGKV3-11/J1和IGKV3-20/J1序列,其中IGKV1-39(SEQ ID NO:1)与NCBI登录号NC_000002.12的核苷酸序列89319625-89320099相同;IGKV3-11(SEQ ID NO:2)与NCBI登录号NC_000002.12的核苷酸序列89027171-89027684相同;IGKV3-20(SEQ ID NO:3)与NCBI登录号NC_000002.12的核苷酸序列89142574-89143108相同;IgKJ1(SEQ ID NO:4)与NCBI登录号NC_000002.12的核苷酸序列88861886-88861923相同;IgKJ4(SEQ ID NO:5)与NCBI登录号NC_000002.12的核苷酸序列88860886-88860923相同。
此外,每个重排的人轻链VJ序列还含有轻链V区基因的人V启动子序列。启动子序列在V区基因前约2000bp。
此外,在每个重排的人VJ序列之后,可以有一个单独的辅助序列,例如,在人轻链VJ区域后面,有一个小鼠3'UTR序列(SEQ ID NO:6),或人3'UTR序列(SEQ ID NO:7)。
通过基因编辑将三种载体引入细胞,并且通过DT筛选选择细胞。阳性克隆经PCR和Southern印迹鉴定。使用以下引物进行PCR测定:
表13
Figure BDA0003978200570000661
Figure BDA0003978200570000671
在表13中,L-GT-F位于5'同源臂上;R-GT-R位于3'同源臂上;L-GT-R和R-GT-F位于重排的人轻链VJ序列上;m-5'loxp-L-GT-F、m-5'loxp-R-GT-R、m-3'lox-L-GT-F和m-3'lox-R-GT-R引物位于人源化重链染色体上。
使用以下探针进行Southern印迹测定:
表14
Figure BDA0003978200570000672
Figure BDA0003978200570000681
在表14中,5'探针位于5'同源臂的外侧;3'探针位于3'同源臂的外侧;IGKV1-39探针、IGKV3-11探针和IGKV3-20探针位于人源化片段上。
通过显微注射将阳性克隆细胞注射到BALB/c小鼠的囊胚中。根据例如A.Nagy等人,“Manipulating the Mouse Embryo:A Laboratory Manual(第3版),”Cold SpringHarbor Laboratory Press,2003中描述的方法进行胚胎显微注射。然后将注射的受精卵转移到培养基中进行短时间培养,然后移植到受体小鼠的输卵管中以产生经遗传修饰的人源化小鼠(F0代)。选择嵌合小鼠与重链基因人源化纯合的小鼠交配,产生F1代小鼠。对F1代小鼠尾部获得的DNA进行PCR和southern分析,以确定是否获得阳性杂合的小鼠。
实施例5:共有轻链表达
通过测序分析小鼠中轻链可变区的mRNA序列。选择未免疫(未暴露于特定抗原)的人源化小鼠(杂合的人源化重链和杂合的重排轻链),并且从眼眶采血中提取RNA。使用5’RACE试剂盒(SMARTer RACE 5’/3’试剂盒,Takara Bio USA,Inc.,目录号634858)进行逆转录以获得cDNA。用5'RACE试剂盒的IGKC-R引物和UPM引物扩增获得的cDNA。然后对重链可变区序列片段进行测序。IGKC-R引物序列为5'-CTAACACTCATTCCTGTTGAAGCTCTTGAC-3'(SEQID NO:34)。将测序结果与NCBI Ig Blast工具进行比较以鉴定人免疫球蛋白序列,以鉴定人Vκ和Jκ区域基因的使用情况。结果表明,三种小鼠(随机选择)的577个克隆中,89%表达人Vκ和Jκ,并且每只小鼠中人Vκ和Jκ的比例超过60%。这表明内源性K链可变区基因座完全被人免疫球蛋白轻链序列的重排序列取代后,人Vκ和Jκ基因在人源化小鼠中高效、显性表达。相反,在杂合的小鼠中,野生型κ链不表达或表达水平较低。
表15
Figure BDA0003978200570000682
Figure BDA0003978200570000691
实施例6:hVH/hcVL小鼠中的B细胞发育
F1代小鼠相互交配。用纯合的人源化重链免疫球蛋白基因座和杂合的人源化共有轻链免疫球蛋白基因座(人源化VHH/H/cVLK/+小鼠,简称hVHH/H/hcVLK/+小鼠)检测B细胞发育。具有人源化VH基因座(杂合的或纯合的)和共有轻链免疫球蛋白基因座(杂合的或纯合的)的小鼠也称为hVH/hcVL小鼠。进行实验以比较免疫前hVHH/H/hcVLK/+小鼠和野生型小鼠的免疫系统。测量野生型和hVH/hcVL杂合的小鼠的体重和一些器官,如脾脏、胸腺、肝、心脏、肺和肾(图5A-5G),的重量。野生型和hVH/hcVL杂合的小鼠的平均体重和器官(脾脏、胸腺、肝、心脏、肺和肾)重量无显著差异。
执行流式细胞术分析野生型和hVH/hcVL杂合的小鼠的血液(图6A)、脾脏(图6B)和淋巴结(图7)中的淋巴细胞数量和分布。结果表明,在hVH/hcVL杂合的小鼠中,血液中、脾脏和淋巴结中的B细胞、T细胞、NK细胞、CD4+T细胞和CD8+T细胞的百分比与野生型小鼠几乎完全相同。结果中,白细胞包含:B细胞(例如,特征为CD45+、CD19+、TCR-)、T细胞和天然杀伤(NK)细胞(例如,特征为CD45+、TCR-和NK1.1+)。T细胞的进一步特征为CD45+、CD19-、TCR+。CD4+T细胞(CD4)的特征为CD45+、CD19-、TCR+、CD4+、CD8-。以及CD8+T细胞(CD8)的特征为CD45+、CD19-、TCR+、CD4-、CD8+。流式细胞术分析中仅包含完整的单个活的白细胞。
图8A显示了骨髓中处于不同发育阶段的B细胞的百分比。通过流式细胞术分析骨髓中的B细胞祖细胞。基于B220和CD43的表达水平,骨髓中的B细胞祖细胞可分为3个细胞群:前B细胞(特征为B220CD43IgM)、前B细胞(特征为B220CD43IgM)和未成熟B细胞(特征为B220CD43IgM)。野生型小鼠与hVH/hcVL小鼠之间未观察到显著差异。此外,还通过流式细胞术评估了骨髓中的B细胞发育,以对浆细胞(B220IgM-IgD-CD138+)和记忆B细胞(B220+IgM+IgD-CD38+)进行选择性着色(图8B)。在野生型小鼠与hVH/hcVL小鼠之间没有观察到显著差异。
图9显示了不同发育阶段的B细胞百分比。脾中B细胞的发育阶段分为T1(过渡1型B细胞,特征为B220+IgM+IgD-)、T2(过渡2型B细胞,特征为B220+IgM+IgD+)和成熟B细胞(特征为B220+IgMIgD+)。在野生型小鼠与hVH/hcVL小鼠之间没有观察到显著差异。
还通过流式细胞术评估了脾中B细胞发育,以对浆细胞(B220IgM-IgD-CD138+)和记忆B细胞(B220+IgM+IgD-CD38+)进行选择性着色(图10A-10B)。在野生型小鼠与hVH/hcVL小鼠之间没有观察到显著差异。另外,还在脾边缘区(边缘区B细胞,MZ-B,特征为B220+CD21+CD23-)和滤泡区(滤泡B细胞,称为FO-B,特征为B220+CD21CD23+)评估了B细胞的发育。图10C显示脾边缘区(MZ-B)和滤泡区(FO-B)的脾B细胞的百分比。野生型小鼠与hVH/hcVL小鼠之间未观察到显著差异。
用流式细胞术评估脾中B细胞的轻链利用率。首先用mB220(Pacific BlueTM抗小鼠/人CD45R/B220 Antibody,BioLegend,Cat#103227)选择性标记B细胞,然后用mIgGκ-FITC(FITC抗小鼠Ig轻链κAntibody,BioLegend,Cat#409509)和mIgG lambda-PE(PE抗小鼠Ig轻链λAntibody,BioLegend,Cat#407307)标记B细胞。野生型小鼠与hVH/hcVL小鼠之间未观察到显著差异。结果表明,人源化不影响hVH/hcVL杂合的小鼠脾中κ链和λ链的表达量(图11A-11I)。
图12A显示了不同发育阶段的B细胞百分比。淋巴结中B细胞的发育阶段分为T1(过渡1型B细胞,特征为B220+IgM+IgD-)、T2(过渡2型B细胞,特征为B220+IgM+IgD+)和成熟B细胞(特征为B220+IgMIgD+)。在野生型小鼠与hVH/hcVL小鼠之间没有观察到显著差异。还通过流式细胞术评估了淋巴结中B细胞发育,以对浆细胞(B220IgM-IgD-CD138+)和记忆B细胞(B220+IgM+IgD-CD38+)进行选择性着色(图12B)。在野生型小鼠与hVH/hcVL小鼠之间没有观察到显著差异。
用流式细胞术评估淋巴结B细胞的轻链利用率。B细胞先用mB220选择性标记,然后用mIgGκ-FITC和mIgGλ-PE标记。野生型小鼠与hVH/hcVL小鼠之间未观察到显著差异。结果表明,人源化不影响hVH/hcVL杂合的小鼠脾中κ链和λ链的表达量(图13A-13I)。
执行实验以评估hVHH/H/hcVLK/K小鼠的B细胞发育。野生型和hVHH/H/hcVLK/K小鼠之间在B细胞发育和平均免疫器官(例如,脾)重量方面无显著差异。如图13J所示,在抗原免疫前,用ELISA法定量测定hVHH/H/hcVLK/K和野生型小鼠的血清中不同免疫球蛋白(Ig)亚型。没有观察到显著差异。
在另一个类似的实验中,分析了hVHH/H/hcVLK/K小鼠和野生型小鼠免疫前后的Ig亚型。没有发现显著差异(图13H)。
实施例7:hVH/hcVL小鼠中的抗体产生
执行实验以评价hVH/hcVL小鼠B细胞是否正常发育。测定免疫hVH/hcVL小鼠和野生型小鼠血清中抗原特异性抗体效价。
两种不同抗原分别免疫hVHH/H/hcVLK/+小鼠和野生型(C57BL/6)小鼠共3次。在第一次免疫中,注射完全弗氏佐剂(CFA)和20ug抗原。两周后,注射不完全弗氏佐剂(IFA)和20ug抗原。两周后,小鼠被注射20ug抗原和IFA。第三次免疫后约1周,采血,并且采用ELISA法分析野生型小鼠和hVH/hcVL小鼠的抗原特异性抗体效价。hVHH/H/hcVLK/+小鼠主要表达具有人源化共有轻链可变区的抗体。
如下进行ELISA。将his标记的抗原在1×PBS中稀释至0.5μg/ml,并以0.1ml/孔加入96孔板,然后在37℃孵育2小时。孵育后,每孔用300μl 1×PBST洗涤3次,然后用250μl 1×PBS加5%脱脂牛奶在37℃封闭1小时。然后每孔用300μl 1×PBST洗涤2次。hVH/hcVL小鼠或野生型小鼠的血清样品先用1×PBS按1:500、1:2000、1:8000、1:32000、1:128000、1:512000或1:2048000稀释,然后加入到96孔板。未免疫小鼠的血清样品也以1:500稀释后加入到板作为空白对照。稀释后的血清样品(120μl/孔)在37℃下在96孔板中孵育1小时。孵育后,板用300μl/孔的1×PBST洗涤5次。然后板用0.1ml/孔的1:20000稀释的山羊抗小鼠IgGFc(HRP)在37℃下孵育1小时。孵育后,板用300μl/孔的1×PBST洗涤5次。接着,在每孔中加入0.1ml的TMB显影液,并且板在室温下置于黑暗中保存10分钟,然后在每孔中加入0.1ml的停止液。OD450和OD570用读板机测量,并且图24-25中的标准OD值计算为:标准OD值=OD450-OD570。
第三次免疫后的抗原特异性抗体效价结果分别如图24和图25所示。结果表明,hVH/hcVL小鼠可以产生与抗原特异性结合的抗体,并且野生型小鼠与hVH/hcVL小鼠的免疫反应相似。特别地,血清抗体效价与野生型的相似。
实施例8:hVH/hcVL小鼠中的抗体产生
用TFR1和Ova分别免疫hVHH/H/hcVLK/K小鼠和野生型小鼠(每组3只)。然后使用
Figure BDA0003978200570000721
光流体系统分离能够产生抗原特异性单克隆抗体的浆细胞。阳性细胞的数量如下所示。
表16
小鼠 抗原 阳性细胞的数目
WT小鼠 TFR1 197
hVH<sup>H/H</sup>/hcVL<sup>K/K</sup>小鼠 TFR1 220
WT小鼠 Ova 356
hVH<sup>H/H</sup>/hcVL<sup>K/K</sup>小鼠 Ova 448
抗原A是肿瘤坏死因子受体超家族的一员。抗原A用于hVHH/H/hcVLK/K小鼠免疫。获得42种人共有轻链抗体(IGKV3-11/J1)。将这些抗体的VH和VL加入到人IgG1恒定区,以获得人抗体。然后利用Biacore确定42种针对抗原A产生的人共有轻链抗体(IGKV3-11/J1)的亲和力。
将纯化的抗抗原A抗体稀释至1μg/ml,然后以10μL/min注射到Biacore 8K生物传感器中约50秒,以达到期望的蛋白质密度(例如,约50个响应单位(RU))。然后以30μL/min的速度注射浓度为200nM的His标记的抗原A,持续120秒。监测解离600秒。在每种甘氨酸滴定(pH 2.0,30μL/min,持续30秒)的最后一次注射后芯片再生。
通过使用Biacore 8K评估软件3.0将数据整体拟合为1:1朗缪尔(Langmuir)结合模型(Karlsson,R.Roos,H.Fagerstam,L.Petersson,B.,1994.Methods Enzymology 6.99-110),从而同时获得缔合速率(kon)和解离速率(koff)。从动力学速率常数的商推导亲和力(KD=koff/kon)。
如本领域普通技术人员理解的,对每种测试的抗体进行相同的方法,其中将参数(例如抗体浓度)做适当调整。结果表明,除A-1C5-IgG1、A-1D10-IgG1和A-1E1-IgG1外,这些抗体的结合亲和力均达到甚至超过10-8M,说明所述方法能够成功生成对抗原具有高结合亲和力的抗体。
表17
Figure BDA0003978200570000731
Figure BDA0003978200570000741
表位相关性分析
通过表面等离子体共振(SPR)竞争实验分析表位的相对位置。共使用15种单克隆抗体来研究对彼此的结合抑制(阻断)作用:A-1B10-IgG1、A-1D7-IgG1、A-1C8-IgG1、A-1F2-IgG1、A-H6L6-IgG1、A-1F9-IgG1、A-1B1-IgG1、A-1D12-IgG1、A-1E7-IgG1、A-1A7-IgG1、A-1B8-IgG1、A-H7L7-IgG1、A-1E12-IgG1、A-H3L3-IgG1和A-H8L8-IgG1。另一种抗抗原A的抗体也作为PC(阳性对照)。
HBS-EP+缓冲液(10mM 4-(2-羟乙基)-1-哌嗪乙磺酸(HEPES)、150mM NaCl、3mM乙二胺四乙酸(EDTA)和0.05% P20,pH 7.4)在整个实验过程中由HBS-EP+缓冲液(10×)稀释用作运行缓冲液。将抗His抗体通过氨基偶联固定在S系列传感器芯片CM5的表面上,以产生抗His芯片(即CM5-Anti-His-Channel 1,8-Chip)。然后,注射1M乙醇胺(pH 8.5)以阻断芯片表面剩余的活性羧基,随后使用HBS-EP+缓冲液平衡2小时。将具有His标签的重组抗原A蛋白(1μg/ml)以10μL/min注射到Biacore 8K生物传感器中50秒,并在抗His芯片上捕获以达到期望的蛋白质密度(即200RU)。将一对抗体(每个200nM)以30μL/min连续注射到芯片中。第一次注射的抗体(分析物1)的结合时间为250秒,然后第二抗体(分析物2)的结合时间为250秒。在每个分析循环中注入抗体后,将芯片用甘氨酸缓冲液(pH 1.7;30μL/min,持续30秒)再生两次。当每种单克隆抗体与另一种抗体配对时,每对单克隆抗体进行相同的实验步骤以获得结合抑制数据。
使用Biacore Insight评估软件获得每种抗体的结合值。为了量化一种抗体与另一种抗体结合的干扰,计算结合率以比较每对抗体。结合率定义为第二抗体(分析物2)的结合值除以第一抗体(分析物1)的结合值。统计软件也用于簇分析。分析表位相关性并将15种人抗抗原A抗体分类为4个表位簇(图31)。综上所述,A-1B10-IgG1、A-1D7-IgG1、A-1C8-IgG1和A-1F2-IgG1具有相同或重叠的表位;A-1B1-IgG1和A-1D12-IgG1具有相同或重叠的表位;A-1B8-IgG1、A-H7L7-IgG1和A-1E12-IgG1具有相同或重叠的表位;A-H3L3-IgG1和A-H8L8-IgG1具有相同或重叠的表位。结果表明,hVHH/H/hcVLK/K小鼠可产生靶向多种表位的抗体。
热稳定性测量
采用QuantStudioTM 5实时PCR系统,用Protein Thermal ShiftTM染色试剂盒测量17种人抗抗原A抗体的热稳定性。
根据制造商的方案进行实验。反应分两步连续进行。具体来说,第一步在25℃下以每秒1.6℃的速度进行,持续2分钟,并且第二步在99℃下以每秒0.05℃的速度进行,持续2分钟。确定各抗抗原A抗体的熔化温度(Tm),如下表所示。
表18
蛋白质 Tm(℃)
A-1A7-IgG1 69.6
A-1B10-IgG1 71.2
A-1B1-IgG1 68.9
A-1B8-IgG1 74.2
A-1C8-IgG1 73.6
A-1D12-IgG1 70.0
A-1D7-IgG1 72.8
A-1E12-IgG1 76.6
A-1E7-IgG1 73.5
A-1F2-IgG1 73.1
A-1F9-IgG1 72.3
A-H3L3-IgG1 73.9
A-H6L6-IgG1 68.7
A-H7L7-IgG1 76.7
A-H8L8-IgG1 76.7
A-1E1-IgG1 75.8
A-1E4-IgG1 70.8
结果表明,人抗抗原A抗体的Tm值在70℃以上或70℃左右,并且这些抗体具有热稳定性。
实施例9:hVH/hcVL小鼠中的抗体产生
抗原B是II型跨膜丝氨酸蛋白酶。抗原B用于hVHH/H/hcVLK/K小鼠(IGKV3-11/J1)免疫。然后利用Biacore检测8种针对抗原B产生的人共有轻链抗体(IGKV3-11/J1)的亲和力。
表19
抗体 Ka(1/Ms) kd(1/s) KD(M)
B-3E10-hIgG1 1.2E+05 9.8E-06 8.1E-11
B-3E4-hIgG1 2.0E+05 6.2E-05 3.1E-10
B-1H9-hIgG1 1.8E+05 1.2E-04 6.9E-10
B-1G2-hIgG1 2.9E+05 3.1E-04 1.1E-09
B-1A1-hIgG1 1.9E+05 2.8E-04 1.5E-09
B-1E10-hIgG1 1.5E+05 2.7E-04 1.8E-09
B-2D12-hIgG1 3.5E+04 5.3E-08 1.5E-12
B-3D1-hIgG1 3.1E+04 3.4E-07 1.1E-11
实施例10.阻断抗原C配体与抗原C的结合
抗原C是抗原激活T细胞上的一种抑制性受体,在诱导和维持对自身的免疫耐受性中起着至关重要的作用。进行阻断测定以确定129个抗人抗原C抗体是否可以阻断人抗原C与其配体之间的结合。这些抗体由hVHH/H/hcVLK/K小鼠产生。
从CHO-S上清液中收集抗抗原C抗体。将用人抗原C配体瞬时转染的30μl的CHO细胞(约1×105)添加到板中的每个孔中。收集上清液中的抗体(约20-200ug/ML),然后稀释10倍和100倍。4℃下,每孔以每孔30μl加入滴定抗体(每孔30μl)和Bitoin标记的人抗原C(每孔30μl,每孔终浓度为1μg/ml)。具有Bitoin标记的人抗原C和抗体的细胞在4℃下孵育30分钟。
用磷酸盐缓冲盐水(PBS)洗涤两次后,在每孔中加入50μl Alexa
Figure BDA0003978200570000771
647标记的链霉亲和素(AF647链霉亲和素,Jackson Immuno research,Cat#016-600-084),以1:1000稀释,并且在4℃下孵育15分钟,然后用PBS洗涤。通过流式细胞术(Thermo Attune NX)确定AF647的信号。流式细胞术分析中含有链霉亲和素信号的抗体占被测细胞百分比的结果汇总如下表。随着抗体浓度的降低,阻断率降低,说明这些抗体能够阻断抗原C与其配体之间的结合。
表20
Figure BDA0003978200570000781
Figure BDA0003978200570000791
Figure BDA0003978200570000801
Figure BDA0003978200570000811
选择23个抗体,用流式细胞术确定与小鼠抗原C、猴抗原C和犬抗原C的交叉反应性。结果如下所示。
表21
Figure BDA0003978200570000821
实施例11:hVH/hcVL小鼠抗体多样性及结合亲和力分布
抗原D和抗原E是I型跨膜受体蛋白。抗原D和抗原E分别用于hVHH/H/hcVLK/K小鼠(IGKV3-11/J1)免疫。然后使用
Figure BDA0003978200570000822
光流体系统去分离能够产生抗原特异性单克隆抗体的浆细胞。
从浆细胞中提取RNA后,将RNA逆转录成cDNA并测序。在抗原D组中,共获得1166个抗体重链可变区序列。在抗原E组中,共获得1290个重链可变区抗体序列。确定了这些抗体重链序列的人种系基因。结果示于图33A-33B中。其中,所有抗体的V区基因共涉及VH1-VH5的5个亚群(包含IGHV1、IGHV2、IGHV3、IGHV4、IGHV5;见图33A-33B中所示的X轴)。D区基因共涉及DH1-DH6的6个亚群(包含IGHD1、IGHD2、IGHD3、IGHD4、IGHD5和IGHD6;见图33A-33B中所示的左Y轴)。J区基因共涉及JH1-JH6的6个亚群(包含IGHJ1、IGHJ2、IGHJ3、IGHJ4、IGHJ5和IGHJ6;见图33A-33B中所示的右Y轴)。结果表明,抗抗原D和抗原E产生的抗体重链的V\D\J多样性很高。这说明在人源化共有轻小鼠中,抗体重链的多样性不受影响。
然后使用Biacore来确定这些抗体的亲和力。通过将数据拟合为1:1朗缪尔(Langmuir)结合模型(Karlsson,R.Roos,H.Fagerstam,L.Petersson,B.,1994.MethodsEnzymology 6.99-110),从而获得缔合速率(kon)和解离速率(koff)。从动力学速率常数的商推导亲和力(KD=koff/kon)。分析KD小于1×10-8M的抗体。这些抗体包含805个抗抗原D的人共有轻链抗体和1026个抗抗原E的人共有轻链抗体。提供抗体结合亲和力(KD)、kon和koff值,并基于KD进行排序。进行统计学分析。KD、kon和koff的分布如图34-35所示。
图34A-34B为抗抗原D抗体的kon和koff率分布。图34C-34D为抗抗原E抗体的kon和koff率分布。图35为抗体结合亲和力分布,可见这些抗体的kon率主要集中在1×105/Ms和1×106/Ms之间,koff主要集中在1×10-2/S和1×10-3/S之间,并且结合亲和力(KD)主要集中在0.10nM-100.00nM之间。这些结果与源自自然免疫反应的抗体一致。数据表明,hVHH/H/hcVLK/K小鼠可产生对多种抗原具有高亲和力的抗体。
实施例12:hVHH/H/hcVLK/+小鼠中种系使用分析
选择具有纯合的人源化重链免疫球蛋白基因座和杂合的人源化共有轻链免疫球蛋白基因座(人源化VHH/H/cVLK/+小鼠,或表示为hVHH/H/hcVLK/+小鼠)的转基因小鼠用于种系使用分析。hVHH/H/hcVLK/+小鼠具有重排的人IGKV3-11/J1序列。在抗原免疫前,RNA从小鼠脾细胞提取。将提取的RNA进行逆转录,并且用PCR扩增免疫球蛋白重链可变区。更具体地说,采用上游引物,即cDNA端(RACE)引物的5'快速扩增,和靶向IgM编码基因的区下游的下游引物用于进行PCR扩增。对扩增的PCR产物进行纯化,并通过下一代测序(NGS)确定未免疫的hVHH/H/hcVLK/+小鼠的种系使用情况。共获得131847个有效读数。
分析了未免疫的hVHH/H/hcVLK/+小鼠中重链IGHV、IGHD和IGHJ的使用情况。结果示于图26A-26D中。检测到46个IGHV基因(包含2个假基因)的转录物。另外,检测到25个IGHD基因和6个IGHJ基因的转录物。例如,如图26D所示,IGHJ3、IGHJ4、IGHJ5和IGHJ6在未免疫的hVHH/H/hcVLK/+小鼠中频繁使用,而IGHJ1和IGHJ2较少使用。所述IGHJ种系使用模式与文献报道的人IGHJ种系在人中的使用情况一致。
检测了纯合的未免疫的hVHH/H/hcVLK/K小鼠中重链IGHV和IGHD的使用情况。共获得123188个有效读数。结果示于图26E-26G中。检测到46个IGHV基因(包含2个假基因:IGHV1-NL1和IGHV3-38-3)的转录物。检测结果与杂合的小鼠的结果相似。
表22
Figure BDA0003978200570000841
重链CDR3长度分布由来自未免疫的hVHH/H/hcVLK/+小鼠(n=1)的脾细胞的免疫谱系的NGS测序确定。如图27A所示,CDR3的中位长度为约13-15个氨基酸。纯合的未免疫的hVHH/H/hcVLK/K小鼠的结果如图27B所示。所述结果也与人免疫系统中人重链CDR3的中位长度一致。
也分析了重链CDR3(HCDR3)的每个位置处的氨基酸类型(图28A-28C、28D)。这些模式与人HCDR3中的氨基酸组成相似。
半胱氨酸残基可形成二硫键。人HCDR3可含有一个半胱氨酸残基或两个半胱氨酸残基,而小鼠HCDR3通常不含有半胱氨酸。图29中的结果显示了含有半胱氨酸残基的hVHH/H/hcVLK/+小鼠的HCDR3频率,并且所述频率随着HCDR3长度的增加而增加。此结果与人外周血单核细胞(PBMC)中HCDR3的多样性一致。结果表明,VDJ重组在hVH/hcVL小鼠中工作正常。
实施例13:hVHH/H/hcVLK/+小鼠中体细胞超变分析
选择重排人IGKV3-11/J1序列的hVHH/H/hcVLK/+小鼠进行体细胞超变分析。在抗原免疫前,RNA从小鼠脾细胞提取。将提取的RNA反向转录为cDNA,并且使用针对人IGKV3-11和IGJ1的引物PCR扩增重排的人IGKV3-11/J1区。扩增的PCR产物进行下一代测序(NGS)。获得48326条有效读数并使用IMGT/HighV-QUEST工具进行分析。如图30A-30B所示,结果表明体细胞超变可以发生在重排的人轻链区,但大多数体细胞超变限于一个或两个氨基酸的变化。纯合的未免疫的hVHH/H/hcVLK/K小鼠的结果如图30C所示。获得48541条有效读数并使用IMGT/HighV-QUEST工具进行分析。与杂合的小鼠的结果类似,大多数体细胞突变仅限于1-2个核苷酸的变化,因此仅限于1-2个氨基酸的变化。这说明在hVHH/H/hcVLK/K小鼠中,体细胞超变率相对较低,并且约为1-2个核苷酸(或氨基酸)的变化。
其他实施方案
应当理解,虽然已经结合具体实施方式对本发明进行了描述,但前面的描述旨在说明而非限制本发明的范围,本发明的范围由所附的权利要求书的范围限定。其他方面、优点以及修改在以下权利要求的范围内。
SEQUENCE LISTING
<110> 百奥赛图(北京)医药科技股份有限公司
<120> 具有共有轻链免疫球蛋白基因座的经遗传修饰的非人动物
<130> IDC220393
<150> PCT/CN2020/094000
<151> 2020-06-02
<150> PCT/CN2021/085839
<151> 2021-04-07
<160> 41
<170> PatentIn version 3.5
<210> 1
<211> 477
<212> DNA
<213> Artificial Sequence
<220>
<223> IGKV1-39
<400> 1
atggacatga gggtccccgc tcagctcctg gggctcctgc tactctggct ccgaggtaag 60
gatggagaac actaggaatt tactcagcca gtgtgctcag tactgactgg aacttcaggg 120
aagttctctg ataacatgat taatagtaag aatatttgtt tttatgtttc caatctcagg 180
tgccagatgt gacatccaga tgacccagtc tccatcctcc ctgtctgcat ctgtaggaga 240
cagagtcacc atcacttgcc gggcaagtca gagcattagc agctatttaa attggtatca 300
gcagaaacca gggaaagccc ctaagctcct gatctatgct gcatccagtt tgcaaagtgg 360
ggtcccatca aggttcagtg gcagtggatc tgggacagat ttcactctca ccatcagcag 420
tctgcaacct gaagattttg caacttacta ctgtcaacag agttacagta cccctcc 477
<210> 2
<211> 516
<212> DNA
<213> Artificial Sequence
<220>
<223> IGKV3-11
<400> 2
atggaagccc cagctcagct tctcttcctc ctgctactct ggctcccagg tgaggggaac 60
atgaggtggt tttgcacatt agtgaaaact cttgccacct ctgctcagca agaaatataa 120
ttaaaattca aagtatatca acaattttgg ctctactcaa agacagttgg tttgatcttg 180
attacatgag tgcatttctg ttttatttcc aatttcagat accaccggag aaattgtgtt 240
gacacagtct ccagccaccc tgtctttgtc tccaggggaa agagccaccc tctcctgcag 300
ggccagtcag agtgttagca gctacttagc ctggtaccaa cagaaacctg gccaggctcc 360
caggctcctc atctatgatg catccaacag ggccactggc atcccagcca ggttcagtgg 420
cagtgggtct gggacagact tcactctcac catcagcagc ctagagcctg aagattttgc 480
agtttattac tgtcagcagc gtagcaactg gcctcc 516
<210> 3
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> IGKV3-20
<400> 3
atggaaaccc cagcgcagct tctcttcctc ctgctactct ggctcccagg tgaggggaac 60
atgggatggt tttgcatgtc agtgaaaacc ctctcaagtc ctgttacctg gcaactctgc 120
tcagtcaata caataattaa agctcaatat aaagcaataa ttctggctct tctgggaaga 180
caatgggttt gatttagatt acatgggtga cttttctgtt ttatttccaa tctcagatac 240
caccggagaa attgtgttga cgcagtctcc aggcaccctg tctttgtctc caggggaaag 300
agccaccctc tcctgcaggg ccagtcagag tgttagcagc agctacttag cctggtacca 360
gcagaaacct ggccaggctc ccaggctcct catctatggt gcatccagca gggccactgg 420
catcccagac aggttcagtg gcagtgggtc tgggacagac ttcactctca ccatcagcag 480
actggagcct gaagattttg cagtgtatta ctgtcagcag tatggtagct cacctcc 537
<210> 4
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> IGKJ1
<400> 4
gtggacgttc ggccaaggga ccaaggtgga aatcaaac 38
<210> 5
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> IGKJ4
<400> 5
gctcactttc ggcggaggga ccaaggtgga gatcaaac 38
<210> 6
<211> 1189
<212> DNA
<213> Mus musculus
<400> 6
gtaagtacac ttttctcatc tttttttatg tgtaagacac aggttttcat gttaggagtt 60
aaagtcagtt cagaaaatct tgagaaaatg gagagggctc attatcagtt gacgtggcat 120
acagtgtcag attttctgtt tatcaagcta gtgagattag gggcaaaaag aggctttagt 180
tgagaggaaa gtaattaata ctatggtcac catccaagag attggatcgg agaataagca 240
tgagtagtta ttgagatctg ggtctgactg caggtagcgt ggtcttctag acgtttaagt 300
gggagatttg gaggggatga ggaatgaagg aacttcagga tagaaaaggg ctgaagtcaa 360
gttcagctcc taaaatggat gtgggagcaa actttgaaga taaactgaat gacccagagg 420
atgaaacagc gcagatcaaa gaggggcctg gagctctgag aagagaagga gactcatccg 480
tgttgagttt ccacaagtac tgtcttgagt tttgcaataa aagtgggata gcagagttga 540
gtgagccgta ggctgagttc tctcttttgt ctcctaagtt tttatgacta caaaaatcag 600
tagtatgtcc tgaaataatc attaagctgt ttgaaagtat gactgcttgc catgtagata 660
ccatggcttg ctgaataatc agaagaggtg tgactcttat tctaaaattt gtcacaaaat 720
gtcaaaatga gagactctgt aggaacgagt ccttgacaga cagctcaagg ggtttttttc 780
ctttgtctca tttctacatg aaagtaaatt tgaaatgatc ttttttatta taagagtaga 840
aatacagttg ggtttgaact atatgtttta atggccacgg ttttgtaaga catttggtcc 900
tttgttttcc cagttattac tcgattgtaa ttttatatcg ccagcaatgg actgaaacgg 960
tccgcaacct cttctttaca actgggtgac ctcgcggctg tgccagccat ttggcgttca 1020
ccctgccgct aagggccatg tgaacccccg cggtagcatc ccttgctccg cgtggaccac 1080
tttcctgagg cacagtgata ggaacagagc cactaatctg aagagaacag agatgtgaca 1140
gactacacta atgtgagaaa aacaaggaaa gggtgactta ttggagatt 1189
<210> 7
<211> 500
<212> DNA
<213> Homo sapiens
<400> 7
gtaagtaatt tttcactatt gtcttctgaa atttgggtct gatggccagt attgactttt 60
agaggcttaa ataggagttt ggtaaagatt ggtaaatgag ggcatttaag atttgccatg 120
ggttgcaaaa gttaaactca gcttcaaaaa tggatttgga gaaaaaaaga ttaaattgct 180
ctaaactgaa tgacacaaag taaaaaaaaa aagtgtaact aaaaaggaac ccttgtattt 240
ctaaggagca aaagtaaatt tatttttgtt cactcttgcc aaatattgta ttggttgttg 300
ctgattatgc atgatacaga aaagtggaaa aatacatttt ttagtctttc tcccttttgt 360
ttgataaatt attttgtcag acaacaataa aaatcaatag cacgccctaa gaaaaatcag 420
ggaaaagtga agtgtaccta tttgctatgt agaagaggca gcttacttga aaatcagcag 480
caatgttgtt tttagagtct 500
<210> 8
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 8
tcacacacta cagcttccac cacaa 25
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 9
tgggcgcgcc agactctaaa 20
<210> 10
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 10
tgggtctgat ggccagtatt gact 24
<210> 11
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 11
ggcctggaaa actcagctat ccttt 25
<210> 12
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 12
gccaaggaat ttaaaagggg attgaaagca a 31
<210> 13
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 13
agggagggaa tggaatgagg gtgat 25
<210> 14
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 14
ccatgtgacc cattcgagtg tcctg 25
<210> 15
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 15
cttaccattt gcggtgcctg gtttc 25
<210> 16
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 16
tcacacacta cagcttccac cacaa 25
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 17
tgggcgcgcc agactctaaa 20
<210> 18
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 18
tgggtctgat ggccagtatt gact 24
<210> 19
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 19
ggcctggaaa actcagctat ccttt 25
<210> 20
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 20
tcacacacta cagcttccac cacaa 25
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 21
tgggcgcgcc agactctaaa 20
<210> 22
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 22
tgggtctgat ggccagtatt gact 24
<210> 23
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 23
ggcctggaaa actcagctat ccttt 25
<210> 24
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 24
agacttgatg gtgtggagtg gggta 25
<210> 25
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 25
tgggccctgt actttgcttg aacat 25
<210> 26
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 26
tgatgggtca accatgttcc tgtgg 25
<210> 27
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 27
tcagccattg cttctgcttt ctcct 25
<210> 28
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 28
gaaaagtggc tttgatggtg caggg 25
<210> 29
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 29
tgcccatttt tctgcccttg ggtat 25
<210> 30
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 30
aggcattcct tatgccagtc agcat 25
<210> 31
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 31
tttcccatgt cctgctgctt tcctt 25
<210> 32
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 32
catttaggga gctgactggg cacaa 25
<210> 33
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 33
tctgggtcct aactgagcag ctctt 25
<210> 34
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 34
ctaacactca ttcctgttga agctcttgac 30
<210> 35
<211> 3012
<212> DNA
<213> Artificial Sequence
<220>
<223> Rearranged human IGKV1-39+J4 nucleic acid sequence
<400> 35
gcaggcagca tatttataat gcacagtaaa cactaggagg aaacaaggca gtgagagagg 60
aaagagagca gcgataccga aaatgtcctc agcgagaagc taccacagag gatgaatgga 120
gatcaagccc acgtggaaac atgggaaaat gtctcagtat ttttccacct aagaagggag 180
ggagatgggg tatgtataca cctccctgtc ctcactgatt gagggctttc cgagaggatg 240
ctcattccag gtgctgtgat aggccatgtg tacaggcagg gctgccttct ccagcttcag 300
atagagcagt gaggaaaaga tatggccatg gggggtcagc agaagtacag caaagggaaa 360
agggaaaggg tagcaagagt gacaactata ttcacccccc ccacacacac acacacacac 420
acgaaattgt gtattgcaat ccagaactgc ttctctctga acctaaatct tagcaagcag 480
tttaccagta actgcccttg aaattcaggc ccctggaaag gagcaggggg ttgtgtacag 540
gctataccac agcagtctgc ccacccttag tgatgcatga gtaatgctcc ctggactccc 600
caggttctag tcttctcatg tcgatgtagt tgattccact tcccttgctg cacaaccagg 660
ctgggatgcc tgggcagagg cagacatgtg aggtataggg gttcaaatct gtttccaagt 720
tttatccagc ttcaaagcat ttctccgtgt acatgagcgg tggcttgaca ggagatggag 780
actctctttc ctggatgtga ggcaaggagg caggcgtctg agtcaggatg atgtccctac 840
tcactgctaa agagaaaagt ggctttgatg gtgcagggca gggaaatgca ctgagtggtc 900
gccaccctca cagaagagaa agtgttcact gacctggcct ttccccaggg cctctccctc 960
ccattgcttt ccagaaagcc atgatttttg agagccacac ctgaacactc acaaacatta 1020
tggtgggaaa agcagatcag agcattaggc aagttgcatt accttggcct tcttcctttg 1080
gagacaattg atgtggggtt ctagattgac ccagagtttc aagtttatcc tgattcaggc 1140
ttcaacagct ggaggaagaa acagagatgt tttttgaagt aaacagatct agcattacta 1200
atcaaccctt catactgatg acctatggga aataataccc aagggcagaa aaatgggcag 1260
aataagggga gccccaaacc aagacgaagc tgctgcccat tgagaccctg ggtattacag 1320
agacctatag ctctggataa tggaagatct atgagtggca caggcgctga ggaatcacag 1380
catcattatc gtgcatctgc agggaattgc ttgtaaatat actggtaatt acaaatgttt 1440
aaggtcacta caaatacttt ggagtgtatt aaatatgctt ctgataaaga ctgtttttct 1500
cacatgaaac aatgggaacc atgtgacaat cacagaggtg ttgttactat agcaaaaggg 1560
attgttactc tccacatccc tttaagtaac ttgaaggcct gatagaccca ccctctaaga 1620
cttcattaga cattccctac gaatggttat actctcctgt atactcccaa tacaactcta 1680
aaatatatta ttccatatag tccttaggtt tgtattaaag tttgactttt ttccttcaaa 1740
atatctcttg tcacaacagc ggctctagag agaaatacat tccctccagg caaatctatg 1800
ctgcgctggt ctgacctggg accctgggga cattgcccct gtgctgagtt actaagatga 1860
gccagccctg cagctgtgct cagcctgccc catgccctgc tgattgattt gcatgttcca 1920
gagcacagcc ccctgccctg aagacttttt tatgggctgg tcgcaccctg tgcaggagtc 1980
agtctcagtc aggacacagc atggacatga gggtccccgc tcagctcctg gggctcctgc 2040
tactctggct ccgaggtaag gatggagaac actaggaatt tactcagcca gtgtgctcag 2100
tactgactgg aacttcaggg aagttctctg ataacatgat taatagtaag aatatttgtt 2160
tttatgtttc caatctcagg tgccagatgt gacatccaga tgacccagtc tccatcctcc 2220
ctgtctgcat ctgtaggaga cagagtcacc atcacttgcc gggcaagtca gagcattagc 2280
agctatttaa attggtatca gcagaaacca gggaaagccc ctaagctcct gatctatgct 2340
gcatccagtt tgcaaagtgg ggtcccatca aggttcagtg gcagtggatc tgggacagat 2400
ttcactctca ccatcagcag tctgcaacct gaagattttg caacttacta ctgtcaacag 2460
agttacagta cccctctcac tttcggcgga gggaccaagg tggagatcaa acgtaagtaa 2520
tttttcacta ttgtcttctg aaatttgggt ctgatggcca gtattgactt ttagaggctt 2580
aaataggagt ttggtaaaga ttggtaaatg agggcattta agatttgcca tgggttgcaa 2640
aagttaaact cagcttcaaa aatggatttg gagaaaaaaa gattaaattg ctctaaactg 2700
aatgacacaa agtaaaaaaa aaaagtgtaa ctaaaaagga acccttgtat ttctaaggag 2760
caaaagtaaa tttatttttg ttcactcttg ccaaatattg tattggttgt tgctgattat 2820
gcatgataca gaaaagtgga aaaatacatt ttttagtctt tctccctttt gtttgataaa 2880
ttattttgtc agacaacaat aaaaatcaat agcacgccct aagaaaaatc agggaaaagt 2940
gaagtgtacc tatttgctat gtagaagagg cagcttactt gaaaatcagc agcaatgttg 3000
tttttagagt ct 3012
<210> 36
<211> 3051
<212> DNA
<213> Artificial Sequence
<220>
<223> Rearranged human IGKV3-11+J1 nucleic acid sequence
<400> 36
caggagtgag cctggtttga tgcctctctc cccaacacga tagaagtgtg gcacaaatct 60
ttgaaaaatt cagtttcccc gtggcaacaa caactacctg ggactgaaaa cttcttccct 120
cgctctagtc ctttcttcta cacccacttc cacctcatct gtgactcata caatacttgt 180
caggaaagat tctggaaaaa gcaaagagac ttccttagag gtgtcagaga ttcctgtacc 240
agcatctgtc catctctaga gggggttgtg agtatgagga agagcagagc ttgtcaatct 300
tctacttgct ttcactccca ctgtatttcc taacaacagc aaccagagca acagccatat 360
catcacagga cgaacctctc ctacttccaa ggcttttatt tcagtaaatc tgctctacct 420
ctatctcagg cagctagaag ttttgatact catacaaata ctactgcagc tttctgttca 480
taattggaaa agtagacaag actcagtgta atgcaggcat tccttatgcc agtcagcatt 540
cagtttttgg atcatcattg cacacatata cccaccatgt gtctaatata tatgtaaaaa 600
tccatgaagc aagagtcata atagctagca tttgatattg tattgtattt tcctcttata 660
tcatcttctc cttttcgtcc ttaaaaaaaa tctgttcaag tcagtctaaa ttaattattg 720
gatgataagt agataaaatc ttttatttga taacacattg acccaatgaa tatgtttctt 780
tgcaagacat agtcctcact tccaagataa caagcctgac aaaattatac tggagcaagt 840
ccacaagtaa tgatggtagc ttttccttat tgtcagtcct ggggcaaaaa taagacaaaa 900
gataacaagg tagactaaag attatgtaag aaagaaggaa agcagcagga catgggaaac 960
tttcatagga taacattttg ataatggatg atgagaatta atgcgttaga cagagatggg 1020
cgggaatgat tgaaggtctg agcattttag cacagattaa gaccaaatca ttaggatttt 1080
aagagttgtg tacagttagt gaagaaaaag ccctagaatt taatttgact gttgataaaa 1140
cattcttgga ttagattgaa gactcttttc tgtgccaagt aagtatattt atgataatga 1200
tgatgactgt agtgctaaat atttaatcaa taaaaacaaa aataattgcc gcatacataa 1260
tgtcctgagt actactgtaa atgttttatc ttattttctt taaactgtct acagcactgt 1320
aaggtaggca ccagtattgt cacagttaca cagatatgga aactgagaca cagggaagtt 1380
aagttagttg gtcaatttca agcaatcggc aagccatgga gcatctatgt cagggctgcc 1440
aggacatgtg actgtaaaca gaagttttaa ctttttaact caaagagggt atgtgtctgg 1500
gttaatggaa agtttcagga ccctcagaaa acattactaa caagcaaatg aaaggtgtat 1560
ctggaagatt aagttctaac agactcctca tttccatcga tccaataatg cacttaggga 1620
gatgactggg catattgagg ataggaagag agaaatgaaa acacagcctt ttatattgtt 1680
cttaacaggc ttgtgccaaa catcatctgg gtgaatttag gtgattgagg agaagaaaga 1740
cataggaatg aaattctctg agcacaaggg agaagttcta cactcagact gagccaacag 1800
acttttctgg cctgacaacc agggtggcgc aggatgctca gtgcagagag gaagaagcag 1860
gtggtctctg cagctggaag ctcagctccc acccagctgc tttgcatgtc cctcccagct 1920
gccctacctt ccagagccca tatcaatgcc tgtgtcagag ccctggggag gaactgctca 1980
gttaggaccc agagggaacc atggaagccc cagctcagct tctcttcctc ctgctactct 2040
ggctcccagg tgaggggaac atgaggtggt tttgcacatt agtgaaaact cttgccacct 2100
ctgctcagca agaaatataa ttaaaattca aagtatatca acaattttgg ctctactcaa 2160
agacagttgg tttgatcttg attacatgag tgcatttctg ttttatttcc aatttcagat 2220
accaccggag aaattgtgtt gacacagtct ccagccaccc tgtctttgtc tccaggggaa 2280
agagccaccc tctcctgcag ggccagtcag agtgttagca gctacttagc ctggtaccaa 2340
cagaaacctg gccaggctcc caggctcctc atctatgatg catccaacag ggccactggc 2400
atcccagcca ggttcagtgg cagtgggtct gggacagact tcactctcac catcagcagc 2460
ctagagcctg aagattttgc agtttattac tgtcagcagc gtagcaactg gcctccgacg 2520
ttcggccaag ggaccaaggt ggaaatcaaa cgtaagtaat ttttcactat tgtcttctga 2580
aatttgggtc tgatggccag tattgacttt tagaggctta aataggagtt tggtaaagat 2640
tggtaaatga gggcatttaa gatttgccat gggttgcaaa agttaaactc agcttcaaaa 2700
atggatttgg agaaaaaaag attaaattgc tctaaactga atgacacaaa gtaaaaaaaa 2760
aaagtgtaac taaaaaggaa cccttgtatt tctaaggagc aaaagtaaat ttatttttgt 2820
tcactcttgc caaatattgt attggttgtt gctgattatg catgatacag aaaagtggaa 2880
aaatacattt tttagtcttt ctcccttttg tttgataaat tattttgtca gacaacaata 2940
aaaatcaata gcacgcccta agaaaaatca gggaaaagtg aagtgtacct atttgctatg 3000
tagaagaggc agcttacttg aaaatcagca gcaatgttgt ttttagagtc t 3051
<210> 37
<211> 3072
<212> DNA
<213> Artificial Sequence
<220>
<223> Rearranged human IGK V3-20+J1 nucleic acid sequence
<400> 37
agccagtgga tgactatttt ctttcctgag actgataatg gtcattccac ccaatggtcc 60
aaactacatg cagtggtaat ggtcatgcag gcctttctgc cacctcttgc tatattttta 120
ccaactcatg ggccactgcc aacagtctag ctatctgatc aggaaaatag caaccgagtg 180
actggactat taaagcatcc cctctgtgga gaaaaggact atggcaacag cttgccacct 240
ataagagaca aatatgtcac tcagctggat gctgggtcta ccatgaccac ccttgagatg 300
aacttatgcc atgtttttgg atgcccactg agactttgct ttgaccaagg aaagttcttt 360
actgcccaaa tgacgtcaat ggacacactc tcatgggaca tgatggattt tccatacacc 420
ttgttatcca aaggccaatg gatctattta atgctagaac agctgactca cacggcaact 480
gaagagtgta catcagggca acctgctagt agagtggtac cccatctgac tacagcaatt 540
ggacattaaa cactgcactg cagagcaagg gaaagacggc acggaggtgc aggttgaaaa 600
acactgagtt gagtgaggaa gaagttgggc aaggccagtt tcctgataga gctgccactg 660
tgaaatccca aactcagtgt ttccaatcat ttttttcctt ttatagtgat gttcttgggg 720
gtgttgcagt ttaggccacc atgataaccc agacaggcct cctaactcta attggatgga 780
atgattcccc tgggtgcctt ctatgggttc cacaggatca agaaatatca gggtgttaat 840
ttccttctgc tggtaggagg gtcatctgat tcctccatta gggtggatga cgttatcaga 900
catgtcaatt ttctacagta cttgacctgc cttctagaac tggacaaccg agggtgaaag 960
gactggatca agcaacaatg gcaatgggtg cccaaagagg tagtagtctc agaacaggga 1020
gagacagact gagtccctcc actaactcag cccaacacct gtggatgagt aggggatgcc 1080
tgagatcctg gggtggatgg gaggtggggc actgatctgt caatctgctt tttcttcaag 1140
gatcaggcag cagagaccca gaagcttcat gtctttgtaa ggctcttcca agccaacaca 1200
gataatttga caaaacactg tatctgcatc ccagacctca ccctgtcaca gactgaagtg 1260
gttgtttcat cctactaagg gtaaactata ccagctatac agaataaaaa gactggatag 1320
tttagaggat cacccaagaa atagttcttt gcctgcatgg acaaaaccat cttctgtctt 1380
tagggaaatg gtatcactac cctgaggatt tggagcccag gtctcactta tctgtgcagt 1440
tgtgaaagtc ctcacaccca cagtgctgag gttaattgaa tgttactctt ttaatttctg 1500
caaagaatga gacagcttct ggaccctcag gaaagatcac taacaagtaa atacaagtat 1560
atccggaaga taaagttgta atagactctt cctttcaacc tgatccatca tgcatttagg 1620
gagctgactg ggcacaagtt ggagcagaaa gagaaaaatg aaaccacagc cttctatttt 1680
gtttctaaca gacttgtacc aaacattctg tggctcaatc taggtgatgg tgagacaaga 1740
ggacacaggg gttaaattct gtggccgcag gggagaagtt ctaccctcag actgagccaa 1800
cggccttttc tggcctgatc acctgggcat gggctgctga gagcagaaag gggaggcaga 1860
ttgtctctgc agctgcaagc ccagcacccg ccccagctgc tttgcatgtc cctcccagcc 1920
gccctgcagt ccagagccca tatcaatgcc tgggtcagag ctctggagaa gagctgctca 1980
gttaggaccc agagggaacc atggaaaccc cagcgcagct tctcttcctc ctgctactct 2040
ggctcccagg tgaggggaac atgggatggt tttgcatgtc agtgaaaacc ctctcaagtc 2100
ctgttacctg gcaactctgc tcagtcaata caataattaa agctcaatat aaagcaataa 2160
ttctggctct tctgggaaga caatgggttt gatttagatt acatgggtga cttttctgtt 2220
ttatttccaa tctcagatac caccggagaa attgtgttga cgcagtctcc aggcaccctg 2280
tctttgtctc caggggaaag agccaccctc tcctgcaggg ccagtcagag tgttagcagc 2340
agctacttag cctggtacca gcagaaacct ggccaggctc ccaggctcct catctatggt 2400
gcatccagca gggccactgg catcccagac aggttcagtg gcagtgggtc tgggacagac 2460
ttcactctca ccatcagcag actggagcct gaagattttg cagtgtatta ctgtcagcag 2520
tatggtagct caccttggac gttcggccaa gggaccaagg tggaaatcaa acgtaagtaa 2580
tttttcacta ttgtcttctg aaatttgggt ctgatggcca gtattgactt ttagaggctt 2640
aaataggagt ttggtaaaga ttggtaaatg agggcattta agatttgcca tgggttgcaa 2700
aagttaaact cagcttcaaa aatggatttg gagaaaaaaa gattaaattg ctctaaactg 2760
aatgacacaa agtaaaaaaa aaaagtgtaa ctaaaaagga acccttgtat ttctaaggag 2820
caaaagtaaa tttatttttg ttcactcttg ccaaatattg tattggttgt tgctgattat 2880
gcatgataca gaaaagtgga aaaatacatt ttttagtctt tctccctttt gtttgataaa 2940
ttattttgtc agacaacaat aaaaatcaat agcacgccct aagaaaaatc agggaaaagt 3000
gaagtgtacc tatttgctat gtagaagagg cagcttactt gaaaatcagc agcaatgttg 3060
tttttagagt ct 3072
<210> 38
<211> 107
<212> PRT
<213> Artificial Sequence
<220>
<223> common light chain VL encoded by human IGKV1-39/IGKJ4
<400> 38
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser Tyr
20 25 30
Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys
100 105
<210> 39
<211> 107
<212> PRT
<213> Artificial Sequence
<220>
<223> common light chain VL encoded by human IGKV3-11/IGKJ1
<400> 39
Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile
35 40 45
Tyr Asp Ala Ser Asn Arg Ala Thr Gly Ile Pro Ala Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Glu Pro
65 70 75 80
Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Arg Ser Asn Trp Pro Pro
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
100 105
<210> 40
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> common light chain VL encoded by human IGKV3-20/IGKJ1
<400> 40
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ser
20 25 30
Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu
35 40 45
Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
50 55 60
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
65 70 75 80
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Ser Ser Pro
85 90 95
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
100 105
<210> 41
<211> 107
<212> PRT
<213> Mus musculus
<400> 41
Arg Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro Pro Ser Ser Glu
1 5 10 15
Gln Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe Leu Asn Asn Phe
20 25 30
Tyr Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp Gly Ser Glu Arg
35 40 45
Gln Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp Ser Lys Asp Ser
50 55 60
Thr Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys Asp Glu Tyr Glu
65 70 75 80
Arg His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys Thr Ser Thr Ser
85 90 95
Pro Ile Val Lys Ser Phe Asn Arg Asn Glu Cys
100 105

Claims (92)

1.一种经遗传修饰的非人动物,所述经遗传修饰的非人动物在内源性轻链免疫球蛋白基因座处包含外源性轻链可变区基因序列,其中所述外源性轻链可变区基因序列包含不超过三个人IGKV基因和不超过两个人IGKJ基因,其中所述不超过三个人IGKV基因和所述不超过两个人IGKJ基因可操作性地连接至内源性轻链恒定结构域基因。
2.根据权利要求1所述的动物,其中所述不超过三个人IGKV基因选自表1,并且所述不超过两个人IGKJ基因选自表2。
3.根据权利要求1或2所述的动物,其中所述外源性轻链可变区基因序列包含一个人IGKV基因和一个人IGKJ基因。
4.根据权利要求1-3中任一项所述的动物,其中所述外源性轻链可变区基因序列进一步包含人IGKJ 3'-UTR序列。
5.根据权利要求1-4中任一项所述的动物,其中所述动物的一个或多个细胞中的所述外源性轻链可变区基因可发生体细胞超变。
6.根据权利要求5所述的动物,其中所述体细胞超变可导致所述动物的所述一个或多个细胞的轻链可变区中多达一个、两个或三个氨基酸变化。
7.根据权利要求1-6中任一项所述的动物,其中所述外源性轻链可变区基因序列包含一个人IGKV基因和一个人IGKJ基因,其中所述人IGKV基因选自由IGKV3-20、IGKV3-11和IGKV1-39组成的组,其中所述人IGKV基因和所述人IGKJ基因可操作性地连接。
8.根据权利要求7所述的动物,其中所述人IGKV基因是IGKV3-11。
9.根据权利要求7-8中任一项所述的动物,其中所述人IGKJ基因选自由IGKJ1和IGKJ4组成的组。
10.根据权利要求1-9中任一项所述的动物,其中所述人IGKV基因是IGKV1-39,所述人IGKJ基因是IGKJ4。
11.根据权利要求1-9中任一项所述的动物,其中所述人IGKV基因是IGKV3-11,所述人IGKJ基因是IGKJ1。
12.根据权利要求1-9中任一项所述的动物,其中所述人IGKV基因是IGKV3-20,所述人IGKJ基因是IGKJ1。
13.根据权利要求1-12中任一项所述的动物,其中所述动物进一步包含可操作性地连接至所述人IGKV基因的启动子序列,其中所述启动子序列在所述人IGKV基因的2500bp或3000bp内。
14.根据权利要求13所述的动物,其中所述启动子是IGKV3-20启动子、IGKV3-11启动子或IGKV1-39启动子。
15.根据权利要求1-14中任一项所述的动物,其中所述动物包含在所述动物的内源性轻链免疫球蛋白基因座中的破坏。
16.根据权利要求15所述的动物,其中所述动物是小鼠,并且所述动物的内源性轻链免疫球蛋白基因座中的破坏包含表3中的一个或多个小鼠IGKV基因和表4中的一个或多个小鼠IGKJ基因的缺失。
17.根据权利要求16所述的动物,其中所述动物是小鼠,并且所述动物的内源性轻链免疫球蛋白基因座中的破坏包含从小鼠IGKV2-137开始至小鼠IGKJ5的序列的缺失。
18.根据权利要求1-17中任一项所述的动物,其中所述动物包含内源性IGKC。
19.根据权利要求1-18中任一项所述的动物,其中所述动物进一步包含相对于所述内源性IGKC的κ内含子型增强子5'和/或κ3'增强子。
20.根据权利要求1-19中任一项所述的动物,其中所述人轻链可变区是重排序列。
21.根据权利要求1-20中任一项所述的动物,其中所述动物相对于所述轻链免疫球蛋白基因座是纯合的。
22.根据权利要求1-20中任一项所述的动物,其中所述动物相对于所述轻链免疫球蛋白基因座是杂合的。
23.根据权利要求1-22中任一项所述的动物,其中所述动物包含在所述动物的内源性λ轻链免疫球蛋白基因座中的破坏。
24.根据权利要求1-23中任一项所述的动物,其中所述动物是啮齿动物(例如,小鼠)。
25.根据权利要求1-24中任一项所述的动物,其中所述动物在内源性重链免疫球蛋白基因座处进一步包含一个或多个人IGHV基因、一个或多个人IGHD基因和一个或多个人IGHJ基因,其中所述人IGHV基因、所述人IGHD基因和所述人IGHJ基因可操作性地连接并且可进行VDJ重排。
26.根据权利要求25所述的动物,其中所述动物包含选自表5的至少150个人IGHV基因、选自表6的至少20个人IGHD基因和选自表7的至少5个人IGHJ基因。
27.根据权利要求25所述的动物,其中所述动物在人受试者的人14号染色体的所述内源性重链免疫球蛋白基因座处包含所有人IGHV基因、所有人IGHD基因和所有人IGHJ基因。
28.根据权利要求25所述的动物,其中所述动物在人细胞的人14号染色体的所述内源性重链免疫球蛋白基因座处包含所有人IGHV基因、所有人IGHD基因和所有人IGHJ基因。
29.根据权利要求25-28中任一项所述的动物,其中所述动物包含源自人重链免疫球蛋白基因座的未修饰的人序列,其中所述未修饰的人序列至少为800kb。
30.根据权利要求25-29中任一项所述的动物,其中所述动物包含源自从人IGHV(III)-82开始至人IGHV1-2的人重链免疫球蛋白基因座的未修饰的人序列。
31.根据权利要求25-29中任一项所述的动物,其中所述动物包含源自从人IGHV(III)-82开始至人IGHV6-1的人重链免疫球蛋白基因座的未修饰的人序列。
32.根据权利要求25-31中任一项所述的动物,其中所述动物包含源自从人IGHD1-1开始至人IGHJ6的人重链免疫球蛋白基因座的未修饰的人序列。
33.根据权利要求25-29中任一项所述的动物,其中所述动物包含源自从人IGHV(III)-82开始至人IGHJ6的人重链免疫球蛋白基因座的未修饰的人序列。
34.根据权利要求1-24中任一项所述的动物,所述动物在内源性重链免疫球蛋白基因座处进一步包含:
包含一个或多个人IGHV基因的第一序列;
包含内源性序列的第二序列;以及
包含一个或多个人IGHD基因和一个或多个人IGHJ基因的第三序列,
其中所述第一序列、所述第二序列和所述第三序列可操作性地连接。
35.根据权利要求34所述的动物,其中所述第一序列包含选自表5的至少150个人IGHV基因。
36.根据权利要求34或35所述的动物,其中所述第一序列包含选自表6的至少20个人IGHD基因。
37.根据权利要求34-36中任一项所述的动物,其中所述第一序列是源自人重链免疫球蛋白基因座的未修饰的序列。
38.根据权利要求34-37中任一项所述的动物,其中所述第一序列至少为800kb。
39.根据权利要求34-38中任一项所述的动物,其中所述第二序列包含至少为3kb的内源性序列。
40.根据权利要求34-39中任一项所述的动物,其中所述第三序列包含选自表6的至少20个人IGHD基因和选自表7的至少5个人IGHJ基因。
41.根据权利要求34-39中任一项所述的动物,其中所述第三序列包含表6中的所有人IGHD基因和表7中的所有人IGHJ基因。
42.根据权利要求34-41中任一项所述的动物,其中所述第三序列是源自人重链免疫球蛋白基因座的未修饰的序列。
43.根据权利要求34-42中任一项所述的动物,其中所述第三序列至少为50kb。
44.根据权利要求25-43中任一项所述的动物,其中所述动物包含在所述动物的内源性重链免疫球蛋白基因座中的破坏。
45.根据权利要求44所述的动物,其中所述动物是小鼠,并且所述动物的内源性重链免疫球蛋白基因座中的破坏包含表8中的一个或多个小鼠IGHV基因、表9中的一个或多个小鼠IGHD基因和表10中的一个或多个小鼠IGHJ基因的缺失。
46.根据权利要求44所述的动物,其中所述动物是小鼠,并且所述动物的内源性重链免疫球蛋白基因座的破坏包含从小鼠IGHV1-85开始至小鼠IGHJ4的序列的缺失。
47.根据权利要求1-46中任一项所述的动物,其中所述动物包含一个或多个内源性IGHM、IGHδ、IGHG3、IGHG1、IGHG2b、IGHG2a、IGHE和IGHA基因。
48.根据权利要求1-47中任一项所述的动物,其中所述动物相对于所述重链免疫球蛋白基因座是纯合的。
49.根据权利要求1-47中任一项所述的动物,其中所述动物相对于所述重链免疫球蛋白基因座是杂合的。
50.一种经遗传修饰的非人动物,其基因组包含内源性轻链免疫球蛋白基因座,所述内源性轻链免疫球蛋白基因座包含:
一个或多个内源性IGKV被一个或多个选自表1的人IGKV基因取代;以及
一个或多个内源性IGKJ基因被一个或多个选自表2的人IGKJ基因取代,
其中所述人IGKV基因和所述人IGKJ基因可操作性地连接至内源性IGKC基因。
51.根据权利要求50所述的动物,其中所述一个或多个人IGKV基因选自由IGKV3-20、IGKV3-11和IGKV1-39组成的组。
52.根据权利要求51所述的动物,其中所述人IGKV基因是IGKV3-11。
53.根据权利要求50-52中任一项所述的动物,其中所述一个或多个人IGKJ基因选自由IGKJ1和IGKJ4组成的组。
54.根据权利要求50-53中任一项所述的动物,其中所述动物进一步包含人IGKJ3'-UTR序列的插入。
55.根据权利要求50-54中任一项所述的动物,其中所述人IGKV基因是IGKV1-39,所述人IGKJ基因是IGKJ4。
56.根据权利要求50-54中任一项所述的动物,其中所述人IGKV基因是IGKV3-11,所述人IGKJ基因是IGKJ1。
57.根据权利要求50-54中任一项所述的动物,其中所述人IGKV基因是IGKV3-20,所述人IGKJ基因是IGKJ1。
58.根据权利要求50-57中任一项所述的动物,其中所有内源性IGKV基因都被所述一个或多个人IGKV基因取代。
59.根据权利要求50-58中任一项所述的动物,其中所有内源性IGKJ基因都被所述一个或多个人IGKJ基因取代。
60.根据权利要求50-59中任一项所述的动物,其中所述动物进一步包含在所述人IGKV基因之前的启动子序列,其中所述启动子序列在所述人IGKV基因的3000bp内。
61.根据权利要求50-60中任一项所述的动物,其中所述动物在所述内源性IGKC的5’处进一步包含κ内含子型增强子。
62.根据权利要求50-61中任一项所述的动物,其中所述动物进一步包含κ3'增强子。
63.根据权利要求50-62中任一项所述的动物,其基因组进一步包含内源性重链免疫球蛋白基因座,所述内源性重链免疫球蛋白基因座包含:一个或多个内源性IGHV、内源性IGHD和内源性IGHJ基因被一个或多个人IGHV、人IGHD和人IGHJ基因取代,其中所述一个或多个人IGHV、人IGHD和人IGHJ基因可操作性地连接至内源性IGHM、IGHδ、IGHG、IGHE和IGHA基因中的一个或多个。
64.根据权利要求63所述的动物,其中所述一个或多个内源性IGHV、内源性IGHD和内源性IGHJ基因被表5中的至少150个人IGHV基因、表6中的至少20个人IGHD基因和表7中的至少5个人IGHJ基因取代。
65.根据权利要求63或64所述的动物,其中所述动物为小鼠,并且表8中的至少180个小鼠IGHV基因、表9中的所有小鼠IGHD基因、以及表10中的所有小鼠IGHJ基因都被取代。
66.根据权利要求1-65中任一项所述的动物,其中所述动物缺乏能够重排和形成编码内源性重链可变结构域(例如,小鼠重链可变结构域)的核酸序列的内源性免疫球蛋白重链可变区基因座。
67.根据权利要求1-66中任一项所述的动物,其中所述动物缺乏能够重排和形成编码内源性轻链可变结构域(例如,小鼠轻链可变结构域)的核酸序列的内源性免疫球蛋白轻链可变区基因座。
68.根据权利要求1-67中任一项所述的动物,其中所述动物可产生人源化抗体。
69.根据权利要求68所述的动物,其中所述抗体包含由所述IGKV基因和IGKJ基因编码的轻链可变区。
70.一种获得自根据权利要求1-69中任一项所述的动物的细胞。
71.根据权利要求70所述的细胞,其中所述细胞是表达嵌合免疫球蛋白轻链的B细胞,所述嵌合免疫球蛋白轻链包含由人IGKV基因和人IGKJ基因编码的免疫球蛋白轻链可变结构域,所述人IGKV基因选自由IGKV3-20、IGKV3-11和IGKV1-39组成的组,所述人IGKJ基因选自由IGKJ1和IGKJ4组成的组;其中所述免疫球蛋白轻链可变结构域可操作性地连接至非人轻链恒定区。
72.根据权利要求70或71所述的细胞,其中所述B细胞表达嵌合免疫球蛋白重链,所述嵌合免疫球蛋白重链包含免疫球蛋白重链可变结构域,所述免疫球蛋白重链可变结构域源自一个或多个人IGHV基因、一个或多个人IGHD基因和一个或多个人IGHJ基因的重排,其中所述免疫球蛋白重链可变结构域可操作性地连接至非人重链恒定区。
73.根据权利要求70-72中任一项所述的细胞,其中所述细胞是胚胎干(ES)细胞。
74.一种制备与抗原特异性结合的嵌合抗体的方法,所述方法包括
将根据权利要求1-69中任一项所述的动物暴露于所述抗原;
从所述动物收集的细胞产生杂交瘤;以及
收集由所述杂交瘤产生的所述嵌合抗体。
75.根据权利要求74所述的方法,其中所述方法进一步包括对所述杂交瘤的基因组进行测序。
76.一种制备与抗原特异性结合的抗体的方法,所述方法包括将根据权利要求1-69中任一项所述的动物暴露于所述抗原;
对细胞中编码人重链和轻链免疫球蛋白可变区的核酸进行测序,所述细胞表达与所述抗原特异性结合的嵌合抗体;以及
在细胞中将编码所述人重链免疫球蛋白可变区的所述核酸与编码人重链免疫球蛋白恒定区的核酸可操作性地连接,以及将编码所述人轻链免疫球蛋白可变区的所述核酸与编码人轻链免疫球蛋白恒定区的核酸可操作性地连接。
77.一种制备与抗原特异性结合的抗体的方法,所述方法包括在细胞中获得编码人重链和轻链免疫球蛋白可变区的核酸序列,所述细胞表达与所述抗原特异性结合的嵌合抗体,其中所述细胞通过将根据权利要求1-69中任一项所述的动物暴露于所述抗原而获得;
将编码所述人重链免疫球蛋白可变区的所述核酸与编码人重链免疫球蛋白恒定区的核酸可操作性地连接,以及将编码所述人轻链免疫球蛋白可变区的核酸与编码人轻链免疫球蛋白恒定区的核酸可操作性地连接;以及
在细胞中表达所述核酸,从而获得所述抗体。
78.一种获得编码与抗原特异性结合的抗体结合结构域的核酸的方法,所述方法包括:
将根据权利要求1-69中任一项所述的动物暴露于所述抗原;以及
对细胞中编码人重链和轻链免疫球蛋白可变区的核酸进行测序,所述细胞表达与所述抗原特异性结合的嵌合抗体。
79.一种获得样品的方法,所述方法包括
将根据权利要求1-69中任一项所述的动物暴露于所述抗原;以及
从所述动物收集所述样品。
80.根据权利要求79所述的方法,其中所述样品是脾组织、脾细胞或B细胞。
81.一种制备双特异性抗体的方法,所述方法包括
在细胞中表达编码包含人VL的轻链多肽的核酸序列、编码包含第一人VH的第一重链多肽的核酸序列和编码包含第二人VH的第二重链多肽的核酸序列,
其中编码所述第一VH的所述序列是从根据权利要求1-69中任一项所述的动物暴露于第一抗原后获得的,编码所述第二VH的所述序列是从所述动物或不同的动物暴露于第二抗原后获得的。
82.根据权利要求81所述的方法,其中所述第一VH和所述VL形成与所述第一抗原特异性结合的第一抗原结合位点。
83.根据权利要求81或82所述的方法,其中所述第二VH和所述VL形成与所述第二抗原特异性结合的第二抗原结合位点。
84.一种包含人轻链可变区的抗体或其抗原结合片段,所述人轻链可变区具有与SEQID NO:38、39或40至少90%、95%或98%相同的序列。
85.多个抗体或其抗原结合片段,其中每个抗体或其抗原结合片段包含人轻链可变区,所述人轻链可变区具有与SEQ ID NO:38、39或40至少90%、95%或98%相同的序列。
86.一种制备与目标蛋白特异性结合的抗体的方法,所述方法包括:
将根据权利要求1-69中任一项所述的动物暴露于所述目标蛋白,其中所述动物不表达与所述目标蛋白同源的内源性蛋白;以及
对细胞中编码人重链和轻链免疫球蛋白可变区的核酸进行测序,所述细胞表达与所述目标蛋白特异性结合的抗体。
87.根据权利要求86所述的方法,其中编码所述内源性蛋白的基因在所述动物体内被破坏。
88.根据权利要求87所述的方法,其中编码所述内源性蛋白的所述基因被敲除。
89.根据权利要求86-88中任一项所述的方法,其中所述内源性蛋白与所述目标蛋白至少有80%、90%、95%同源。
90.根据权利要求86-88中任一项所述的方法,其中所述内源性蛋白与所述目标蛋白至少有80%、90%或95%相同。
91.根据权利要求86-90中任一项所述的方法,其中所述目标蛋白是人蛋白。
92.根据权利要求86-91中任一项所述的方法,其中所述目标蛋白是PD-1、CTLA-4、LAG-3、BTLA、PD-L1、CD27、CD28、CD47、CD137、CD154、TIGIT、TIM-3、GITR、SIRPa或OX40。
CN202180039972.XA 2020-06-02 2021-06-01 具有共有轻链免疫球蛋白基因座的经遗传修饰的非人动物 Pending CN115667532A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CNPCT/CN2020/094000 2020-06-02
CN2020094000 2020-06-02
CN2021085839 2021-04-07
CNPCT/CN2021/085839 2021-04-07
PCT/CN2021/097652 WO2021244522A1 (en) 2020-06-02 2021-06-01 Genetically modified non-human animals with common light chain immunoglobulin locus

Publications (1)

Publication Number Publication Date
CN115667532A true CN115667532A (zh) 2023-01-31

Family

ID=78830108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180039972.XA Pending CN115667532A (zh) 2020-06-02 2021-06-01 具有共有轻链免疫球蛋白基因座的经遗传修饰的非人动物

Country Status (9)

Country Link
US (1) US20230128645A1 (zh)
EP (1) EP4158034A1 (zh)
JP (1) JP2023529846A (zh)
KR (1) KR20230018439A (zh)
CN (1) CN115667532A (zh)
AU (1) AU2021283564A1 (zh)
CA (1) CA3182925A1 (zh)
IL (1) IL298632A (zh)
WO (1) WO2021244522A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3125380A1 (en) 2019-02-18 2020-08-27 Biocytogen Pharmaceuticals (Beijing) Co., Ltd. Genetically modified non-human animals with humanized immunoglobulin locus
WO2023192936A2 (en) * 2022-03-30 2023-10-05 Fred Hutchinson Cancer Center Systems and methods to produce b cells that express selected antibodies and gene products

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050266008A1 (en) * 2004-03-29 2005-12-01 Medarex, Inc. Human anti-IRTA-5 antibodies
US20130185821A1 (en) * 2010-02-08 2013-07-18 Regeneron Pharmaceuticals, Inc. Common Light Chain Mouse
ES2603559T5 (es) * 2010-02-08 2021-02-22 Regeneron Pharma Cadena ligera común de ratón
CN107090471A (zh) * 2012-03-06 2017-08-25 瑞泽恩制药公司 共同轻链小鼠
SI2840892T1 (en) * 2013-02-20 2018-08-31 Regeneron Pharmaceuticals, Inc. Animals other than humans with modified immunoglobulin heavy chain sequences

Also Published As

Publication number Publication date
CA3182925A1 (en) 2021-12-09
KR20230018439A (ko) 2023-02-07
AU2021283564A1 (en) 2022-12-08
WO2021244522A1 (en) 2021-12-09
US20230128645A1 (en) 2023-04-27
EP4158034A1 (en) 2023-04-05
IL298632A (en) 2023-01-01
JP2023529846A (ja) 2023-07-12

Similar Documents

Publication Publication Date Title
JP6574802B2 (ja) ヒスチジン操作された軽鎖抗体およびこれを作製するための遺伝子改変された非ヒト動物
JP6522557B2 (ja) 共通の軽鎖を有する抗体を発現する非ヒト動物
KR101829691B1 (ko) 일반적인 경쇄 마우스
KR102295842B1 (ko) 제한된 면역글로불린 경쇄 레퍼토리를 발현하는 마우스
CN105861548B (zh) Adam6小鼠
AU2014323527B2 (en) Histidine engineered light chain antibodies and genetically modified non-human animals for generating the same
KR20140136462A (ko) 공통 경쇄 마우스
US20150250151A1 (en) Histidine Engineered Light Chain Antibodies and Genetically Modified Non-Human Animals for Generating the Same
CN112400022B (zh) 具有人源化免疫球蛋白基因座的经遗传修饰的非人动物
KR20150126863A (ko) 공통 경쇄 마우스
US20230128645A1 (en) Genetically modified non-human animals with common light chain immunoglobulin locus
US20220090125A1 (en) Transgenic mouse expressing common human light chain
WO2023179620A1 (en) Genetically modified non-human animals with humanized immunoglobulin and mhc loci

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40081064

Country of ref document: HK