TW202332770A - 大尺寸染色體轉移方法及使用該方法產生的經修飾的染色體和生物體 - Google Patents

大尺寸染色體轉移方法及使用該方法產生的經修飾的染色體和生物體 Download PDF

Info

Publication number
TW202332770A
TW202332770A TW111136154A TW111136154A TW202332770A TW 202332770 A TW202332770 A TW 202332770A TW 111136154 A TW111136154 A TW 111136154A TW 111136154 A TW111136154 A TW 111136154A TW 202332770 A TW202332770 A TW 202332770A
Authority
TW
Taiwan
Prior art keywords
sequence
cells
chromosome
mouse
cell
Prior art date
Application number
TW111136154A
Other languages
English (en)
Inventor
張繼偉
魏喻
Original Assignee
大陸商上海伊米諾康生物科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商上海伊米諾康生物科技有限公司 filed Critical 大陸商上海伊米諾康生物科技有限公司
Publication of TW202332770A publication Critical patent/TW202332770A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0603Embryonic cells ; Embryoid bodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • C12N5/12Fused cells, e.g. hybridomas
    • C12N5/16Animal cells
    • C12N5/166Animal cells resulting from interspecies fusion
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8518Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Environmental Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Mycology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Developmental Biology & Embryology (AREA)
  • Gynecology & Obstetrics (AREA)
  • Reproductive Health (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本揭露關於使用雙鏈斷裂修復途徑和同源性定向修復在染色體之間轉移大序列片段和產生染色體重排的方法。本揭露還關於藉由這些方法產生的染色體,以及包含這些染色體的細胞和基因轉殖動物。

Description

大尺寸染色體轉移方法及使用該方法產生的經修飾的染色體和生物體
藉由引用併入序列表
本申請包含序列表,該序列表已藉由EFS網站以ASCII格式提交,並據此藉由引用以其整體併入。
本揭露關於使用雙鏈斷裂修復途徑和同源性定向修復在染色體之間轉移大序列片段和產生染色體重排的方法。
基因或染色體的大片段的操縱是用於基礎和轉譯研究以及療法開發的有力工具。人基因的大小範圍為數百個鹼基至至少2,300千鹼基(KB),人染色體的大小範圍為38兆鹼基對(MB)至近250MB。因此,對大基因、跨越多個基因的區域和部分染色體的有效研究需要操作大的序列片段。然而,大片段操作仍然是基因編輯領域最重要的挑戰之一。本揭露提供了用於操作大序列的方法。
本揭露提供了產生工程化的染色體的方法,其包括:(a)提供細胞,其包含含有靶序列的靶染色體和含有模板序列的模板染色體;(b)使細胞與(i)第一核酸分子和(ii)第二核酸分子接觸,該第一核酸分子從5’至3’包含5’ㄆ、至少一個第一標記和3’同源臂,該5’同源臂含有靶序列5’末端上游的核苷酸序列,該3’同源臂含有模板序列5’末端上游的核苷酸序列;該第二核酸分子從5’至3’包含5’同源臂、至少一個第二標記和3’同源臂,該5’同源臂含有模板序列3’末端下游的核苷酸序列,該3’同源臂含有靶序列3’末端下游的核苷酸序列;(c)在靶序列處或其兩側,以及在模板序列的5’和3’末端產生雙鏈斷裂,從而將模板序列以及第一和第二標記插入靶染色體中;以及(d)選擇表達第一和第二標記的一個或多個細胞。
在一些實施方案中,在插入模板序列後,第一標記位於模板序列的5’末端,第二標記位於模板序列的3’末端。
在一些實施方案中,第一和第二核酸分子的5’和3’同源臂的長度介於約20與2,000個鹼基對(bp)之間,介於約50bp與1,500bp之間,介於約100bp與1,400bp之間,介於約150bp與1,300bp之間,介於約200bp與1,200bp之間,介於約300bp與1,100bp之間,介於約400bp與1,000bp之間,或介於約500bp與900bp之間,或介於約600bp與800bp之間。在一些實施方案中,第一和第二核酸分子的5’和3’同源臂的長度介於約400bp與1,500bp之間,介於約500bp與1,300bp之間,或介於約600bp與1,000bp之間。在一些實施 方案中,第一和第二核酸分子的5’和3’同源臂的長度介於約600bp與1,000bp之間。
在一些實施方案中,模板序列的長度為至少25千鹼基對(KB)、至少50KB、至少100KB、至少200KB、至少400KB、至少500KB、至少600KB、至少700KB、至少800KB、至少900KB、至少1兆鹼基對(MB)、至少2MB、至少3MB、至少4MB、至少5MB、至少6MB、至少7MB、至少8MB、至少9MB、至少10MB、至少15MB、至少20MB、至少25MB、至少30MB、至少40MB、至少50MB、至少60MB、至少70MB、至少80MB、至少90MB、至少100MB、至少120MB、至少140MB、至少160MB、至少180MB、至少200MB、至少220MB或至少250MB。在一些實施方案中,模板序列的長度介於50KB與250MB之間、50KB與100MB之間、50KB與50MB之間、50KB與20MB之間、50KB與10MB之間、50KB與5MB之間、50KB與3MB之間、50KB與2MB之間、50KB與1MB之間、100KB與200MB之間、100KB與100MB之間、100KB與50MB之間、100KB與20MB之間、100KB與10MB之間、100KB與5MB之間、100KB與3MB之間、100KB與2MB之間、100KB與1MB之間、100KB與500KB之間、200KB與100MB之間、200KB與50MB之間、200KB與20MB之間、200KB與10MB之間、200KB與5MB之間、200KB與3MB之間、200KB與2MB之間、200KB與1MB之間、200KB與500KB之間、500KB與100MB之間、500KB與50MB之間、500KB與20MB之間、500KB與10MB之間、500KB與5MB之間、500KB與3MB之間、500KB與2MB之間、500KB與1MB之間、1MB與100MB之間、1MB與50MB之間、1MB與20MB之間、1MB與10MB之 間、1MB與5MB之間、1MB與3MB之間、1MB與2MB之間、3MB與100MB之間、3MB與50MB之間、3MB與20MB之間、3MB與10MB之間、3MB與5MB之間、5MB與100MB之間、5MB與50MB之間、5MB與20MB之間、5MB與10MB之間、10MB與100MB之間、10MB與50MB之間或在10MB與20MB之間。在一些實施方案中,模板序列的長度介於200KB與50MB之間、介於1MB與20MB之間、介於1MB與10MB之間、介於1MB與5MB之間、介於1MB與3MB之間、介於3MB與20MB之間、介於3MB與10MB之間、介於3MB與7MB之間或介於3MB與5MB之間。
在一些實施方案中,在(c)處產生雙鏈斷裂包括使用CRISPR/Cas內切核酸酶和一種或多種引導核酸(gNA)、一種或多種鋅指核酸酶、一種或多種轉錄激活子樣效應因子核酸酶(TALEN)或一種或多種CRE重組酶來誘導雙鏈斷裂。在一些實施方案中,CRISPR/Cas內切核酸酶包括CasI、CasIB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、CasX、CasY、Cpf1(Cas12a)、Cas12b、Cas13a、CsyI、Csy2、Csy3、CseI、Cse2、CscI、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、CmrI、Cmr3、Cmr4、Cmr5、Cmr6、CsbI、Csb2、Csb3、Csx17、CsxI4、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、CsfI、Csf2、Csf3、Csf4、Cms1、C2c1、C2c2或C2c3或其同源物、直系同源物(orthologs)或經修飾的形式。在一些實施方案中,CRISPR/Cas內切核酸酶包括Cas9、Cpf1(Cas12a)、Cas12b、CasX、CasY、C2c1或C2c3或其同源物、直系同源物或經修飾的形式。在一些實施方案中,CRISPR/Cas內切核酸酶包括Cas9。在一些實施方案中,gNA包括單引導RNA(sgRNA)。
在一些實施方案中,靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、靶序列和第二核酸分子的3’同源臂序列。在一些實施方案中,模板染色體從5’至3’包含第一核酸分子的3’同源臂序列、模板序列和第二核酸分子的5’同源臂序列。
在一些實施方案中,靶序列包含至少1個基因、至少2個基因、至少3個基因、至少5個基因、至少10個基因、至少20個基因、至少30個基因、至少40個基因、至少50個基因、至少100個基因或至少200個基因。在一些實施方案中,靶序列包含與模板序列的一個或多個基因同源的一個或多個基因。
在一些實施方案中,模板序列包含天然存在的序列。在一些實施方案中,模板序列包含至少1個基因、至少2個基因、至少3個基因、至少5個基因、至少10個基因、至少20個基因、至少30個基因、至少40個基因、至少50個基因、至少100個基因或至少200個基因。在一些實施方案中,模板序列包含對天然存在的序列的一個或多個修飾。在一些實施方案中,模板序列包含人工序列。在一些實施方案中,人工序列包含編碼一種或多種抗體或其抗原結合片段的序列。在一些實施方案中,一種或多種抗體或其抗原結合片段包含scFv、雙特異性抗體或多特異性抗體。
在一些實施方案中,藉由插入模板序列來刪除靶序列。在一些實施方案中,(a)靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、第一sgRNA靶序列、靶序列、第二sgRNA靶序列和第二核酸分子的3’同源臂序列;以及(b)模板染色體從5’至3’包含第三sgRNA靶序列、第一種核酸分子的3’同源臂序列、模板序列、第二核酸分子的5’同源臂序列和第四sgRNA靶序列。在一些實 施方案中,產生雙鏈斷裂包括將細胞與CRISPR/Cas內切核酸酶以及第一、第二、第三和第四sgRNA接觸。在一些實施方案中,第一、第二、第三和第四sgRNA包含對第一、第二、第三和第四sgRNA靶序列特異的靶向序列。
在一些實施方案中,將細胞與CRISPR/Cas內切核酸酶和sgRNA接觸包括用一種或多種編碼CRISPR/Cas內切核酸酶和sgRNA的核酸分子轉染細胞。
在一些實施方案中,插入模板序列包括刪除極少靶序列的序列或不刪除靶序列的序列。在一些實施方案中,插入模板序列破壞了靶序列的一種或多種功能。在一些實施方案中,插入模板序列破壞了靶序列中的基因。在一些實施方案中,(a)靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、第一sgRNA靶序列和第二核酸分子的3’同源臂序列;以及(b)模板染色體從5’至3’包含第二sgRNA靶序列、第一核酸分子的3’同源臂序列、模板序列、第二核酸分子的5’同源臂序列和第三sgRNA靶序列。在一些實施方案中,產生雙鏈斷裂包括將細胞與CRISPR/Cas內切核酸酶以及第一、第二和第三sgRNA接觸。在一些實施方案中,第一、第二和第三sgRNA包含對第一、第二和第三sgRNA靶序列特異的靶向序列。在一些實施方案中,將細胞與CRISPR/Cas內切核酸酶和sgRNA接觸包括用一種或多種編碼CRISPR/Cas內切核酸酶和sgRNA的核酸分子轉染細胞。
在一些實施方案中,第一或第二標記包含與能夠在細胞中表達螢光蛋白的啟動子可操作地連接的螢光蛋白。在一些實施方案中,螢光蛋白包括綠色螢光蛋白(GFP)、黃色螢光蛋白(YFP)、紅色螢光蛋白(RFP)、青色螢光蛋白(CFP)、藍色螢光蛋白(BFP)、dsRed、mCherry或tdTomato。在一些實施方案中, 螢光蛋白包括GFP。在一些實施方案中,第一標記還包括選擇標記。在一些實施方案中,第二標記還包括選擇標記。在一些實施方案中,選擇性標記選自由以下組成的組:二氫葉酸還原酶(DHFR)、穀胺醯胺合酶(GS)、嘌呤黴素乙醯轉移酶、殺稻瘟素脫胺酶、組胺醇脫氫酶、潮黴素磷酸轉移酶(hph)、博來黴素抗性基因和胺基糖苷磷酸轉移酶(新黴素抗性)。在一些實施方案中,第一和第二標記不是相同的選擇標記。在一些實施方案中,第一標記包含與能夠在細胞中表達GFP的啟動子和嘌呤黴素乙醯轉移酶可操作地連接的GFP,並且第二標記包含潮黴素磷酸轉移酶。
在一些實施方案中,該方法還包括(e)在步驟(d)之後刪除第一或第二標記的全部或一部分。在一些實施方案中,刪除第一或第二標記包括用CRISPR/Cas內切核酸酶和gNA誘導刪除,該gNA包含對編碼標記的序列特異的靶向序列。
在一些實施方案中,細胞包括雜交細胞、胚胎雜交幹細胞(EHS)或受精卵。在一些實施方案中,藉由融合來自選自由以下組成的組的任何兩個物種的ES細胞來產生EHS細胞:小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞和猴。在一些實施方案中,藉由將人胚胎幹細胞與來自非人物種的胚胎幹細胞融合來產生EHS細胞。在一些實施方案中,非人物種是小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞或猴。在一些實施方案中,藉由融合來自選自由以下組成的組的任何兩種不同物種的EH細胞來產生EHS細胞:小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞和猴。在一些實施方案中,融合包括電融合、病毒誘導融合或化學誘導融合。
在一些實施方案中,細胞包括雜交細胞。在一些實施方案中,產生雜交細胞包括:(a)產生微核人細胞(micronucleated human cell);和(b)將微核人細胞與來自非人物種的細胞融合,從而產生雜交細胞。在一些實施方案中,藉由在足以誘導微核化的條件下將人細胞暴露於秋水仙胺(colcemid)並使用離心收集微核細胞來產生微核人細胞。在一些實施方案中,非人物種是小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞或猴。在一些實施方案中,來自非人物種的細胞是ES細胞,並且雜交細胞是EHS細胞。
在一些實施方案中,靶序列包含編碼免疫球蛋白或T細胞受體亞單位的基因。在一些實施方案中,靶染色體包括小鼠第12號染色體,模板染色體包括人第14號染色體。在一些實施方案中,靶序列包含小鼠Igh可變區序列。在一些實施方案中,小鼠Igh可變區序列包含編碼小鼠VH、DH和JH1-6基因區片段的序列和間插非編碼序列。在一些實施方案中,模板序列包含人IGH可變區序列。在一些實施方案中,人IGH可變區序列包含編碼人VH、DH和JH1-6基因區段的序列和間插非編碼序列。在一些實施方案中,靶序列包含小鼠Igl可變區序列。在一些實施方案中,靶序列包含小鼠Igk可變區序列。在一些實施方案中,模板序列包含人IGL可變區序列。在一些實施方案中,模板序列包含人IGK可變區序列。在一些實施方案中,小鼠Igk可變區序列包含編碼小鼠Vk和Jk1-5基因區段的序列和間插非編碼序列。在一些實施方案中,模板序列包含人IGK可變區序列。在一些實施方案中,人IGK可變區序列包含編碼人Vk和Jk1-5基因區段的序列和間插非編碼序列。
在一些實施方案中,該方法還包括從步驟(d)中選擇的細胞中回收工程化的染色體。在一些實施方案中,回收工程化的染色體包括在足以誘導微核化的條件下將細胞暴露於秋水仙胺,以及使用離心收集微核細胞。
在一些實施方案中,第一和第二核酸分子是質粒。
本揭露提供了藉由本揭露的方法產生的工程化的染色體。
在一些實施方案中,工程化的染色體是包含替代小鼠Igh可變區的人IGH可變區的序列的小鼠第12號染色體。在一些實施方案中,小鼠Igh可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。在一些實施方案中,人IGH可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。在一些實施方案中,工程化的染色體是包含人IGK可變區的序列替代小鼠Igk可變區的小鼠第6號染色體。在一些實施方案中,小鼠Igk可變區序列包含編碼小鼠Vk和Jk1-5基因區段的序列和間插非編碼序列。在一些實施方案中,模板序列包含人IGK可變區序列。在一些實施方案中,人IGK可變區序列包含編碼人Vk和Jk1-5基因區段的序列和間插非編碼序列。
本揭露提供了包含本揭露的工程化的染色體的細胞。
在一些實施方案中,細胞能夠與小鼠ES細胞雜交。在一些實施方案中,細胞是胚胎幹(ES)細胞、胚胎雜交幹(EHS)細胞或合子細胞。在一些實施方案中,EHS細胞是人與小鼠ES細胞的雜交體。在一些實施方案中,ES細胞是小鼠ES細胞。在一些實施方案中,細胞是微核細胞。
本揭露提供了包括產生小鼠胚胎幹細胞的方法,其包括:(a)將包含藉由本揭露的法中的任一方法產生的工程化的染色體的微核細胞與小鼠ES細胞融合,其中,(i)小鼠Es細胞包含與工程化的染色體同源的染色體,該同源染 色體包含與能夠在ES細胞中表達螢光蛋白的啟動子可操作地連接的第一螢光蛋白,以及(ii)至少一個亞群的微核細胞包含工程化的染色體,並且其中工程化的染色體包含不同於第一螢光蛋白的第二螢光蛋白,第二螢光蛋白與能夠在ES細胞中表達螢光蛋白的啟動子可操作地連接;(b)選擇表達第一和第二螢光蛋白的ES細胞;(c)培養步驟(c)中選擇的ES細胞,直至至少一個亞群的ES細胞丟失同源染色體;以及(d)選擇表達第二種螢光蛋白但不表達第一種螢光蛋白的ES細胞。
在一些實施方案中,在步驟(c)中培養細胞包括培養細胞至少5天、至少7天、至少10天或至少14天。在一些實施方案中,在步驟(b)和(d)中選擇細胞包括螢光激活細胞分選(FACS)。
本揭露提供了藉由本揭露的方法產生的小鼠ES細胞。
本揭露提供了由本揭露的小鼠ES細胞產生的基因轉殖小鼠。
在一些實施方案中,產生基因轉殖小鼠包括將ES細胞注射到二倍體胚泡中,從ES細胞向去核小鼠胚胎進行核轉移,或四倍體胚胎互補。在一些實施方案中,小鼠第12號染色體包含替代小鼠Igh可變區的人IGH可變區的序列。在一些實施方案中,小鼠Igh可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。在一些實施方案中,人IGH可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。在一些實施方案中,小鼠第6號染色體包含替代小鼠Igk可變區的人IGK可變區的序列。在一些實施方案中,小鼠Igk可變區序列包含編碼小鼠Vk和Jk1-5基因區段的序列和間插非編碼序列。在一些實施方案中,模板序列包含人IGK可變區序列。在一些實施方案中,人IGK可變區序列包含編碼人Vk和Jk1-5基因區段的序列和間插非編碼序列。
本揭露提供了產生抗體的方法,其包括:(a)用抗原攻擊本揭露基因轉殖小鼠,由此基因轉殖小鼠產生多種抗體,該抗體包含來自人IGH可變區的人V、D和J區段;以及(b)分離對抗原特異的抗體。
本揭露提供了產生抗體的方法,其包括:(a)用抗原攻擊本發明的基因轉殖小鼠,由此基因轉殖小鼠產生多種抗體,該抗體包含來自人IGKIGL可變區的人V和J區段;以及(b)分離對抗原特異的抗體。
本揭露提供了衍生自由本揭露的基因轉殖小鼠產生的抗體的抗體。在一些實施方案中,抗體包含單鏈可變區段(scFv)、雙特異性抗體或多特異性抗體。
本揭露提供了產生染色體重排的方法,其包括:(a)提供細胞,其包含含有靶位置的靶染色體和含有模板序列的模板染色體;(b)將細胞與核酸分子接觸,該核酸分子從5’至3’包含5’同源臂和3’同源臂,該5’同源臂含有靶位置5’末端上游的核苷酸序列,該3’同源臂含有模板序列5’末端上游的核苷酸序列;(c)在靶位置上和模板序列的5’末端產生雙鏈斷裂,從而將標記插入5’同源臂序列3’的靶染色體,隨後插入模板序列,從而產生染色體重排;以及(d)選擇表達該標記的一個或多個細胞。
在一些實施方案中,核酸分子的5’和3’同源臂的長度介於約20bp與2,000bp之間,介於約50bp與1,500bp之間,介於約100bp和1,400bp之間,介於約150bp和1,300bp之間,介於約200bp和1,200bp之間,介於約300bp和1,100bp之間,介於約400bp與1,000bp之間,或介於約500bp與900bp之間,或介於約600bp與800bp之間。在一些實施方案中,核酸分子的5’和3’同源臂的長度介於約400bp與1,500bp之間,長度介於約500bp與1,300bp之 間,或長度介於約600b與1,000bp之間。在一些實施方案中,核酸分子的5’和3’同源臂的長度介於約600bp與1,000bp之間。
在一些實施方案中,在(c)中產生雙鏈斷裂包括使用CRISPR/Cas內切核酸酶和至少一種sgRNA、一種或多種鋅指核酸酶、一種或多種轉錄激活子樣效應因子核酸酶(TALEN)或一種或多種CRE重組酶來誘導雙鏈斷裂。在一些實施方案中,CRISPR/Cas內切核酸酶包括CasI、CasIB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、CasX、CasY、Cas12a(Cpf1)、Cas12b、Cas13a、CsyI、Csy2、Csy3、CseI、Cse2、CscI、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、CmrI、Cmr3、Cmr4、Cmr5、Cmr6、CsbI、Csb2、Csb3、Csx17、CsxI4、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、CsfI、Csf2、Csf3、Csf4、Cms1、C2c1、C2c2或C2c3或其同源物、直系同源物、或經修飾的形式。在一些實施方案中,CRISPR/Cas內切核酸酶包括Cas9、Cpf1、CasX、CasY、C2c1或C2c3或其同源物、直系同源物、或經修飾的形式。在一些實施方案中,CRISPR/Cas內切核酸酶包括Cas9。在一些實施方案中,產生雙鏈斷裂包括將細胞與CRISPR/Cas內切核酸酶、至少第一gNA和第二gNA接觸,該第一gNA包含對靶位置特異的靶向序列,使得CRISPR/Cas內切核酸酶切割靶位置,該第二gNA包含對模板序列5’末端特異的靶向序列。在一些實施方案中,將細胞與CRISPR/Cas內切核酸酶和sgRNA接觸包括用一種或多種編碼CRISPR/Cas內切核酸酶和sgRNA的核酸分子轉染細胞。在一些實施方案中,一種或多種核酸分子是質粒。
在一些實施方案中,標記包含與能夠在細胞中表達螢光蛋白的啟動子可操作連接的螢光蛋白。在一些實施方案中,螢光蛋白包括GFP、YFP、 RFP、CFP、BFP、dsRed、mCherry或tdTomato。在一些實施方案中,標記還包括選擇標記。在一些實施方案中,選擇標記選自由以下組成的組:二氫葉酸還原酶(DHFR)、穀胺醯胺合酶(GS)、嘌呤黴素乙醯轉移酶、殺稻瘟素脫胺酶、組胺醇脫氫酶、潮黴素磷酸轉移酶(hph)、博來黴素抗性基因和胺基糖苷磷酸轉移酶(新黴素抗性)。
在一些實施方案中,細胞包括胚胎幹(ES)細胞。
在一些實施方案中,核酸分子是質粒。
本揭露提供了包含藉由本揭露的方法產生的染色體重排的細胞。在一些實施方案中,細胞是小鼠ES細胞。
本揭露提供了基因轉殖小鼠,其來自藉由本揭露的方法產生的小鼠ES細胞。
藉由參考以下闡述說明性實施方案的詳細描述和附圖,將獲得對本揭露的特徵和有利方面的更好理解,其中,
圖1是從上至下顯示小鼠免疫球蛋白重鏈複合物(Igh)、人Igh和其中可變結構域(VH、DH和JH1-6)已經人源化的小鼠Igh的圖解。Chro:染色體。
圖2是顯示工程化的小鼠與人胚胎幹(ES)細胞藉由電融合進行的雜交的圖解。小鼠ES細胞表達標記新黴素,人ES細胞表達mCherry。胚胎雜交幹細胞(融合瘤細胞)對G418具有抗性,並對mCherry呈陽性。
圖3A是顯示三對PCR引子(如箭頭所示)在人Igh基因VH、DH和JH1-6區中的放置的圖解,該引子用於對胚胎雜交幹細胞(EHS)進行基因分型。
圖3B是顯示12個胚胎雜交幹細胞(EHS)株的PCR結果的示例性凝膠,該株使用圖3A所示的引子進行了基因分型。
圖4A及圖4B是顯示藉由HDR介導的染色體重排(HCMR)HDR:同源性定向修復在EHS細胞(圖4A)中建立工程化的人源化染色體的流程的圖解。用以下質粒共轉染EHS細胞:5’HMCR質粒,其含有與小鼠Igh基因的5’同源的5’臂、與人Igh基因的5’同源的3’臂和pCMV-EGFP-polyA-PGK-嘌呤黴素-polyA盒;3’HMCR質粒,其含有與人Igh可變基因座的3’末端同源的5’臂、與小鼠Igh可變基因座的3’末端同源的3’臂和PGK-潮黴素-polyA盒;和4種含有靶向小鼠Igh和人Igh的5’和3’可變結構域的Cas9和sgRNA的質粒,如由(
Figure 111136154-A0202-12-0014-52
)所示的。或者(圖4B)藉由CRE-Loxp介導的染色體重排(CMCR):四種質粒被設計成介導CMCR過程。小鼠Igh 5’(pCMV-GFP-BGH PolyA-Loxp)和3’(BGH polyA-Loxp-511-潮黴素-BGH polyA-PGK-BSD-BGH PolyA)質粒被設計成分別插入小鼠Igh可變基因座的5’和3’末端。同時,人IGH5’(BGH polyA-Loxp-Puro-BGH PolyA-PGK-新黴素-BGH polyA)和3’(pCMV-BGP-BGH polyA-PGK-Loxp-511)質粒被設計成分別插入人IGH可變基因座的5’和3’末端。Crewas被轉染到成功整合的EHS細胞中用於CMCR。
圖5A是顯示用於驗證工程化的人染色體的PCR引子(如箭頭所示)的放置的圖解。
圖5B顯示了使用圖5A所示的4對引子的PCR結果。顯示了192個單株的結果。
圖6是顯示在小鼠ES細胞中用工程化的人染色體替換小鼠染色體的圖解。藉由暴露於秋水仙胺對攜帶用GFP標記的工程化的人染色體的EHS 細胞真行微粉,藉由離心收集微細胞,並將其與小鼠ES細胞電融合,在該小鼠ES細胞中相應的小鼠染色體已用mCherry標記。藉由螢光激活細胞分選(FACS)分離GFP+mCherry+細胞。然後培養細胞,藉由FACS分離已經丟失小鼠染色體的GFP+mCherry-細胞。
圖7A顯示了用於驗證Igh人源化小鼠的PCR引子(如箭頭所示)的放置。
圖7B顯示了使用圖7A所示的7對引子對示例性Igh人源化小鼠的PCR結果。
圖8A顯示了Igh人源化小鼠的螢光原位雜交(FISH)結果。
圖8B顯示了Igh人源化小鼠的G-顯帶核型分析。
圖9A顯示了Igh人源化小鼠的IGH-V的全基因組測序(WGS)分析。顯示了位於人Igh的VH區的每個可變(V)基因區段的WGS序列的拷貝數。
圖9B顯示了Igh人源化小鼠的IGH-D和IGH-J的WGS分析。顯示了位於人Igh的DH和JH1-6區上的每個多樣性(D)基因區段和6個連接(J)區段的WGS序列的拷貝數。
圖10顯示了小鼠Igk基因的可變結構域的人源化。
圖11A-圖11B顯示了Igk人源化小鼠的PCR驗證結果。圖11A顯示了用於PCR實驗的設計引子的位置。圖11B,使用圖A中列出的5對引子對於Igk人源化小鼠的PCR結果。
圖12顯示了Igk人源化小鼠的WGS分析結果。WGS序列中位於人IGK基因的VK和Jk區段上的每個抗體基因的拷貝數。
本揭露提供了用於工程化染色體的方法,其包括在染色體之間轉移大的序列片段。使用本文公開的方法,可將至少5兆對(MB)的序列從非無色體(achromosomal)模板轉移到靶染色體上。本文公開的方法也可用於產生染色體重排,諸如倒位和易位。本文還提供了藉由本揭露的方法產生的工程化的染色體,以及包含這些工程化的染色體的細胞和動物,以及使用它們的方法。
操縱基因或染色體的大片段為基礎和轉譯研究以及療法的發展帶來了巨大的希望。遺傳人源化是最流行的應用之一,其中模型生物諸如小鼠的基因被其人對應物所替代。例如,攜帶人源化Ig基因的小鼠為在小鼠背景中產生人抗體提供了強大的平臺。然而,大片段操作仍然是基因編輯領域最重要的挑戰之一,因為無法獲得能夠攜帶高達百萬鹼基對(MB)的染色體大片段的遞送載體。常規遞送載體,諸如腺相關病毒載體或其它病毒載體的有效載荷受到載體所源自的病毒基因組大小的限制。
本文公開的方法允許染色體間大序列的高效原位置換。這些方法被稱為跨物種大規模片段原位替換技術(Massive fragment Across Species In situ Replacement Technolog)(MASIRT),可用於在單個編輯步驟中替換大部分染色體,在某些情況下可替換高達兆鹼基對(MB)的序列。這些方法可用於高效地在物種之間或單個物種的染色體之間轉移大序列。在一個實例中,MASIRT用於獲得針對小鼠Igh基因的可變結構域人源化的小鼠。人和小鼠在抗體基因的排列和表達方面表現出高度的相似性,並且在這些物種之間重鏈的基因組結構也是相似的。因此,使用MASIRT將約3MB的含有所有VH、DH和JH基因區段的小 鼠基因組序列替換為約1Mb的含有等同人基因片段的連續人基因組序列,獲得了人源化小鼠Igh基因。
與僅作用於胚胎幹細胞的其它方法不同,本揭露的方法可有利地用於替換受精卵中的大序列。胚胎幹細胞系通常不適用於除小鼠以外的物種。相反,許多哺乳動物可獲得受精卵,因此本揭露的方法可用於獲得具有人源化的基因或基因片段的動物,諸如兔或牛。另外,本文公開的方法可用於一次替換大的序列片段,例如高達至少5MB的序列,約為本領域已知的其它方法所使用的方法的五倍。這提高了效率,並且減少了產生具有人源化基因的物所需的時間和成本。例如,僅用3輪替換就可產生Igh人源化小鼠。另一個有利方面是,當用於小鼠時,每次替換只需要1-3個月,這只是本領域已知的其它方法所需時間量的一半或三分之一。
定義
染色體是包含生物體的全部或部分遺傳物質的長DNA分子。大多數真核生物染色體包括稱為組蛋白的包裝蛋白,其在伴侶蛋白的幫助下,與DNA分子結合並壓縮其以保持其完整性。真核生物染色體由與蛋白質締合的長線性DNA分子組成,形成稱為染色質的蛋白質和DNA的緊密複合物。每條染色體都有一個著絲粒,著絲粒上伸出一條或兩條臂。染色體的臂終止於端粒,該端粒是與特化蛋白質締合的重複核苷酸序列的區域,其保護染色體DNA的末端區域免於進行性降解,並藉由防止DNA修復系統將DNA鏈的最末端誤認為雙鏈斷裂來確保線性染色體的完整性。
“基因”包括編碼基因產物(例如蛋白質或非編碼RNA)的DNA區域,以及調控基因產物產生的所有DNA區域,無論此類調控序列是否與編碼和 /或轉錄序列相鄰。因此,基因可包括調控元件序列,包括但不一定限於啟動子序列、終止子、轉譯調控序列諸如核糖體結合位點和內部核糖體進入位點、增強子、沉默子、隔離子(insulator)、邊界元件、複製起點、基質附著位點和基因座控制區。編碼序列在轉錄或轉錄和轉譯時編碼基因產物。本揭露的編碼序列可包含片段,並且不需要包含全長開放閱讀框架。基因可包括被轉錄的鏈以及含有反密碼子的互補鏈。基因還可包括外顯子(其可包括蛋白質編碼序列和非轉譯區)以及內含子(其藉由剪接而被從最終的RNA產物中除去)。
本文使用的術語“啟動子”可以指位於編碼重組產物的DNA序列鄰近的DNA序列。啟動子較佳與相鄰的DNA序列有效連接。與不存在啟動子時表達的量相比,啟動子通常增加從DNA序列表達的蛋白質或RNA產物的量。來自一種生物體的啟動子可用於增強從源自另一種生物體的DNA序列的蛋白質表達。例如,脊椎動物啟動子可用於在脊椎動物中表達水母GFP。此外,一個啟動子元件可增加串聯連接的多個DNA序列表達的重組產物的量。因此,一個啟動子元件可增強一種或多種重組產物的表達。多個啟動子元件是所屬技術領域具有通常知識者熟知的。
本文使用的術語“增強子”可指位於編碼蛋白質或RNA產物的DNA序列鄰近的DNA序列,或者位於編碼蛋白質或RNA產物的DNA序列的遠端的DNA序列。增強子元件通常位於啟動子元件的上游,但也可位於編碼DNA序列的下游或內部,諸如內含子內。在一些情況下,增強子可位於距離其所調控表達的基因數千鹼基或甚至數十或數百千鹼基處。增強子元件可使從DNA序列表達的蛋白質或RNA產物的量增加超過由啟動子元件提供的增加的表達。所屬技術領域具有通常知識者很容易獲得多種增強子元件。
如本文中所用,術語“外源染色體”或“外源序列”是指相對於動物基因組的外來染色體或外來序列。例如,在小鼠細胞(其中除一條人染色體外,所有染色體都是小鼠染色體)中,人染色體是外源染色體。類似地,在其中一部分小鼠序列已被人序列替代的小鼠染色體中,人序列被稱為外源序列。類似地,“內源的”是指源自生物體的染色體或序列,諸如上文所述的小鼠染色體或序列。
如本文中所用,術語“同源重組”是指一種類型的遺傳重組,其中核苷酸序列在稱為同源序列或同源臂的兩個相似或相同的DNA分子之間交換。同源重組通常涉及以下基本步驟:在兩條DNA鏈上發生雙鏈斷裂(DSB)後,DSB的5’末端周圍的DNA區段在稱為切除的過程中被切掉。在隨後的鏈侵入步驟中,斷裂的DNA分子的懸突3’端“侵入”未斷裂的相似或相同(或同源)的DNA分子,例如同源臂。在鏈侵入後,進一步的事件順序可以遵循兩條途徑-DSBR(雙鏈斷裂修復)途徑或SDSA(合成依賴性鏈退火)途徑中的任一途徑。
如本文中所用,“DNA修復途徑”是指允許細胞響應於DNA損傷,諸如DNA中的單鏈或雙鏈斷裂的檢測而維持基因組完整性功能的細胞機制。取決於DNA損傷的類型和程度,以及細胞週期階段,DNA修復途徑可包括但不限於以下途徑,諸如切除、規範同源定向修復(規範HDR)、同源重組(HR)、替代同源定向修復(alt-HDR)、雙鏈斷裂修復(DSBR)、單鏈退火(SSA)、合成依賴性鏈退火(SDSA)、斷裂誘導的複製(BIR)、替代末端連接(alt-EJ)、微同源性介導的末端連接(MMEJ)、DNA合成依賴性微同源性介導的末端連接(SD-MMEJ)、非同源末端連接(NHEJ)途徑,諸如規範非同源末端連接(C-NHEJ)修復、替代非同源末端連接(A-NHEJ)途徑、跨損傷DNA合成(TLS)修復、鹼基切除修復(BER)、核苷酸切除修復(NER)、錯配修復(MMR)、DNA損傷應答(DDR)、平末端連接、 單鏈斷裂修復(SSBR)、鏈間交聯修復(ICL)和範科尼貧血途徑(Fanconi Anemia pathway)(FA)。
如本文中所用,同源定向修復(HDR)是指使用同源核酸(例如,姊妹染色單體或外源核酸)修復DNA損傷的過程。在正常細胞中,HDR通常涉及一系列步驟,諸如識別斷裂、穩定斷裂、切除、穩定單鏈DNA、形成DNA交叉中間體、拆分交叉中間體和連接。
如本文中所用,“同源物”是指執行相同生物學功能的一組蛋白質中的蛋白質,例如屬於相同蛋白質家族並提供共同性狀或執行相同或相似生物功能的蛋白質。同源物由同源基因表達。同源基因是編碼與由第二基因編碼的蛋白具有相同或相似生物功能的蛋白質的基因。同源基因可藉由物種形成事件(直系同源物)或藉由遺傳複製事件(旁系同源物)產生。“直系同源物”是指不同物種中藉由物種形成從共同的祖先基因進化而來的一組同源基因。正常情況下,直系同源物在進化過程中保持相同的功能。“旁系同源物”是指同一物種中由於基因複製而彼此趨異的一組同源基因。因此,同源基因可來自相同或不同的生物體。同源基因包括自然產生的等位基因和人工產生的變體。同源蛋白質之間的同一性百分比將取決於蛋白質的來源,以及蛋白質所源自的物種趨異的程度。來自親緣關係更近的物種(例如,諸如人和小鼠的兩種哺乳動物)的同源蛋白質通常比來自親緣關係更遠的物種(例如,雞和小鼠)的蛋白質更相似。當最佳比對時,同源蛋白質在蛋白質全長上通常具有至少約40%的同一性、約50%的同一性、約60%的同一性,在某一情況下具有至少約70%,例如約80%,甚至至少約90%的同一性。在其它情況下,例如當比較來自高度趨異的物種的蛋白質時,同源蛋白質在保守蛋白質結構域(諸如DNA結合結構域)的長度上將具有至少約40%的同一 性、約50%的同一性、約60%的同一性、約70%的同一性、約80的%同一性或約90%的同一性。
藉由例如手動或藉由使用基於計算機的工具比較DNA或胺基酸序列來鑑定同源基因或蛋白質,該基於計算機的工具使用已知的基於同源性的搜索算法,諸如通常已知的並被稱為BLAST、FASTA和Smith-Waterman的那些搜索算法。局部序列比對程序(例如BLAST)可用於搜索序列數據庫以尋找相似的序列,並且匯總期望值(summary Expectation value)(E值)用於測量序列鹼基相似性。因為對於特定生物體而言,具有最佳E值的蛋白質命中可能不一定是直系同源物,即具有相同的功能,或者是唯一的直系同源物,所以可使用互逆查詢(reciprocal query)來過濾具有顯著E值的命中序列,用於直系同源物鑑定。互逆查詢需要針對來自基礎生物的胺基酸序列數據庫搜索與查詢蛋白質序列相似的顯著命中。當互逆查詢的最佳命中是查詢蛋白質本身或在物種形成後由複製的基因編碼的蛋白質時,命中可以被識別為直系同源物。
如本文中所用,“同一性百分比”意指兩個最佳比對的DNA或蛋白質區段在整個組分(例如核苷酸序列或胺基酸序列)的比對窗口中不變的程度。測試序列和參考序列的比對片段的“同一性分數”是兩個比對區段的序列所共有的相同成分的數量除以比對窗口上參考區段中序列成分的總數,該比對窗口是完整測試序列或完整參考序列中的較小者。“同一性百分比”(“同一性%”)是同一性分數乘以100。這種最佳比對被理解成被認為是DNA序列的局部比對。對於蛋白質比對,蛋白質序列的局部比對應該允許引入缺口以實現最佳比對。可在不包括由比對本身引入的缺口的比對長度上計算同一性百分比。
如本文中所用,“特異於”當用於指核苷酸序列諸如引導RNA的同源臂或靶向序列時,是指與另一核苷酸序列或另一核苷酸序列的反向互補序列相同或基本相同的序列。“特異於”另一序列的序列能夠藉由沃爾森-克裡克鹼基配對與另一序列或其反向互補序列雜交。因此,所屬技術領域具有通常知識者將理解,對另一序列特異的序列與另一序列或其反向互補序列高度相似,但不需要完全相同。例如,與另一序列具有至少80%、至少85%、至少90%、至少95%、至少97%或至少99%同一性的序列,如果其能夠與另一序列雜交,仍然對該序列具有特異性。作為另一個實例,根據靶向序列中錯配的位置,引導核酸靶序列可包含1個、2個、3個或更多個與靶序列的錯配,並且如果其能夠將包含gNA和核酸內切酶的核糖核蛋白複合物靶向到靶序列,則其仍然對靶序列具有特異性。
如本文中所用,“選擇”是指使用本領域已知的任何方法分開兩個不同產物的群體。當其應用於細胞、染色體或序列時,可基於標記諸如選擇標記進行選擇。選擇表達選擇標記的細胞包括在選擇性培養基中培養包括表達標記的細胞和不表達標記的細胞的混合細胞群,從而殺死不表達標記的細胞或抑制其生長。藉由將包含標記的序列或染色體置於細胞內並應用選擇性方案,可以類似地選擇它們。類似地,可以基於檢測標記(如螢光蛋白)進行選擇。可使用本領域已知的方法,諸如螢光激活細胞分選術(FACS),基於檢測標記,從混合細胞群中物理去除表達檢測標記的細胞。可選地,或者另外地,可選地,可以稀釋混合細胞群,使得可以分離培養單細胞,並且測定源自分離的細胞的株的一種或多種性狀諸如標記的存在。
如本文中所用,“源自”是指分子實體例如核酸或蛋白質的來源或起源。分子實體的來源可以是天然存在的、重組的、未純化的或純化的分子實體。例如,源自第二多肽的多肽可包含與第二蛋白質的胺基酸序列相同或基本相似,例如與其具有超過50%的同源性的胺基酸序列。所來源的分子實體,例如核酸或蛋白質,可包含一個或多個修飾,例如一個或多個胺基酸或核苷酸變化。
“分離自”是指從其來源或起源純化、取出或分離的分子實體。
“天然存在的”序列是在自然界中存在的至少一種物種中發現的序列。
“人工序列”是指自然界中不存在的序列。人工序列可與天然序列類似,但相對於天然存在的序列含有一個或多個改變。可選地,人工序列可能與任何天然存在的序列幾乎沒有或沒有相似性。嵌合或重組序列是一類人工序列,其中來自不同來源的兩個序列,或從未發現彼此相鄰的兩個序列,被可操作地連接在一起。
“有效連接的(Operatively linked)”或“可操作地連接的(operably linked)”是指遺傳元件的並置,其中元件處於允許它們以預期方式操作的關係中。例如,如果啟動子有助於啟動編碼序列的轉錄,則啟動子與編碼區有效連接。只要保持這種功能關係,啟動子與編碼區之間可以存在間插殘基。
本文使用以下分類來指代幹細胞。就發育階段而言,最具多能性和最早的是“胚胎幹(ES)細胞”或“ES細胞”。ES細胞可以是新鮮來源的原代細胞,或來自ES細胞系。來自體細胞組織(除生殖細胞組織外的每種組織)的所有其它幹細胞被概括地定義為“體細胞幹細胞”,但通常可能被稱為以下任何或所有細胞:“成體幹細胞”、“成熟幹細胞”、“祖細胞”、“祖幹細胞”、“前體細胞”和“前體 幹細胞”。另一類非胚胎幹細胞被定義為“生殖系幹細胞”。最後,本文將非幹細胞描述為“成熟細胞”,但也稱為“分化細胞”、“成熟分化細胞”、“終末分化細胞”和“體細胞”。成熟細胞也可以是源自組織或永生細胞系或腫瘤來源細胞系的原代分離細胞。本發明還包括“成熟細胞的前體形式”,其包括不符合幹細胞或成熟細胞的常用科學定義的所有細胞。可在體外長時間培養ES細胞,並且在將其插入/注射到正常胚泡的腔中之前,誘導其恢復胚胎發育的正常程序,以分化成成年動物的所有細胞類型,包括生殖細胞。
如本文中所用,“雜交細胞”是指含有來自兩個基因組的元件的細胞。所屬技術領域具有通常知識者將會理解,雜交細胞可包含來自不同來源的兩個完整或接近完整的基因組。雜交細胞可含有來自不同來源的兩個完整或接近完整的基因組。可選地,雜交細胞可含有一種來源的完整基因組,和來自第二來源的僅幾條染色體、一條染色體或一條染色體的一部分。含有上述兩個極端之間的兩個基因組的元件的任何混合物的細胞仍被認為是雜交細胞。雜種中的兩個基因組可來自不同的個體,同一物種的不同品系或不同的物種。雜交細胞可藉由本領域已知的任何方法產生。這些技術包括但不限於細胞融合和微細胞介導的染色體轉移(MMCT),該微細胞介導的染色體轉移即將少量染色體從一個細胞轉移到另一個細胞。
如本文中所用,“雜交胚胎幹(EHS)”細胞是指具有胚胎幹細胞特性的雜交細胞。EHS細胞可藉由來自兩個不同物種的ES細胞的融合產生,或者藉由MMCT介導的染色體從一個物種的細胞到另一個物種的幹細胞的染色體轉移產生。
本文所用的“癌症”是指特徵在於本領域已知的不受調控的細胞生長或複製的疾病、疾患、性狀、基因型或表型。癌症包括實體瘤和液體瘤。示例性癌症包括但不限於白血病、乳腺癌、骨癌、腦癌、頭頸癌、視網膜癌、食道癌、胃癌、多發性骨髓瘤、卵巢癌、子宮癌、甲狀腺癌、睾丸癌、子宮內膜癌、黑色素瘤、結直腸癌、肺癌、膀胱癌、前列腺癌、肺癌(包括小細胞和非小細胞肺癌兩者)、胰腺癌、肉瘤、宮頸癌、頭頸癌和皮膚癌。
本說明書中提及的所有出版物、專利和專利申請藉由引用併入本文,其程度如同每個單獨出版物、專利或專利申請具體地和單獨地表示為藉由引用併入。
工程化染色體的方法
本揭露提供了使用模板染色體、靶染色體、一種或多種核酸分子諸如載體或質粒以及同源定向修復來工程化染色體的方法。核酸酶用於產生雙鏈斷裂,其位於模板染色體中模板序列的側翼,並位於靶序列的側翼或靶染色體中的靶位置。一種或多種包含標記和同源臂的核酸分子用於指導用模板序列替換靶序列,在靶位置插入模板序列,或藉由在雙鏈斷裂位點連接靶標與模板序列來產生染色體重排,該同源臂包含靶染色體和模板染色體的序列。
在一些實施方案中,該方法包括用模板序列替換靶序列,即藉由插入模板序列來刪除靶序列。
在一些實施方案中,該方法包括用模板序列替換靶序列。任何合適的模板序列和任何合適的靶序列都可用於本文所述的方法。例如,該方法可用於用同源人序列替換模式生物的部分染色體,從而使該部分模式生物的基因組人源化。或者,可在靶位置插入大序列,而幾乎沒有或沒有靶序列的缺失。
在一些實施方案中,本揭露提供了產生工程化的染色體的方法,其包括:(a)提供細胞,其包含含有靶序列的靶染色體和含有模板序列的模板染色體;(b)使細胞與(i)第一核酸分子和(ii)第二核酸分子接觸,該第一核酸分子從5’至3’包含5’同源臂、至少第一標記和3’同源臂,該5’同源臂含有靶序列5’末端上游的核苷酸序列,該3’同源臂含有模板序列5’末端上游的核苷酸序列;該第二核酸分子從5’至3’包含5’同源臂、至少第二標記和3’同源臂,該5’同源臂含有模板序列3’末端下游的核苷酸序列,該3’同源臂含有靶序列3’末端下游的核苷酸序列;(c)在靶序列的任一側或兩側以及模板序列的5’和3’末端產生雙鏈斷裂,從而將模板序列以及第一和第二標記插入靶染色體中;以及(d)選擇表達第一和第二標記的一個或多個細胞。在一些實施方案中,第一和/或第二核酸分子是質粒。對於本文所述方法的一些實施方案,模板序列、靶序列以及第一和第二核酸分子的同源臂的排列如圖4A-圖4B所示。在一些實施方案中,在插入模板序列後,第一標記位於模板序列的5’末端,第二標記位於模板序列的3’末端。例如,藉由本文所述方法產生的工程化的染色體在插入模板序列和刪除靶序列後,從5’至3’包括靶序列上游的靶染色體序列、第一標記、模板序列、第二標記和靶序列下游的靶染色體序列。
熟練的技術人員將理解許多長度的模板序列適用於本文所述的方法。合適的模板序列可以小到數百個鹼基對,或者包含染色體的大部分,因此長度可達數百兆對。在本文所述方法的一些實施方案中,模板序列的長度為至少25KB、至少50KB、至少100KB、至少200KB、至少400KB、至少500KB、至少600KB、至少700KB、至少800KB、至少900KB、至少1MB、至少2MB、至少3MB、至少4MB、至少5MB、至少10MB、至少15MB、至少20 MB、至少50MB、至少100MB、至少150MB、至少200MB或至少250MB。在一些實施方案中,模板序列的長度介於在50KB與250MB之間、介於100KB與200MB之間、介於200KB與50MB之間、介於500KB與50MB之間、介於1MB與100MB之間、介於1MB與10MB之間、介於1MB與5MB之間、介於1MB與3MB之間、介於5MB與50MB之間、介於5MB與10MB之間、介於3MB與10MB之間或介於5MB與50MB之間。
在本文所述方法的一些實施方案中,模板染色體從5’至3’包含第一核酸分子的3’同源臂序列、模板序列和第二核酸分子的5’同源臂序列。在一些實施方案中,模板染色體從5’至3’包含第一核酸分子的3’同源臂序列、第三核酸內切酶位點、模板序列、第四核酸內切酶位點和第二核酸分子的5’同源臂序列。
熟練的技術人員將理解許多長度的靶序列適用於本文所述的方法。合適的靶序列可以小到用於產生雙鏈斷裂的核酸內切酶位點(靶位置),或者包含染色體的大部分,因此長度可達數百兆對。在本文所述方法的一些實施方案中,靶序列的長度為至少25KB、至少50KB、至少100KB、至少200KB、至少400KB、至少500KB、至少600KB、至少700KB、至少800KB、至少900KB、至少1MB、至少2MB、至少3MB、至少4MB、至少5MB、至少10MB、至少15MB、至少20MB、至少50MB、至少100MB、至少150MB、至少200MB或至少250MB。在一些實施方案中,靶序列的長度介於50KB與250MB之間、100KB與200MB之間、200KB與50MB之間、500KB與50MB之間、1MB與100MB之間、1MB與10MB之間、1MB與5MB之間、1MB與3 MB之間、5MB與50MB之間、5MB與10MB之間、3MB與10MB之間或5MB與50MB之間。
在本文所述方法的一些實施方案中,靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、靶序列和第二核酸分子的3’同源臂序列。在一些實施方案中,靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、第一核酸內切酶位點、靶序列、第二核酸內切酶位點和第二核酸分子的3’同源臂序列。
在一些實施方案中,本文所述方法中使用的核酸分子是DNA分子。在一些實施方案中,本文所述方法中使用的核酸分子是環狀的,例如質粒。可選地,可使用另外的核酸內切酶位點來線性化本揭露的核酸分子。示例性核酸內切酶位點包括但不限於限制性核酸內切酶,以及本文所述的CRISPR/Cas核酸內切酶、ZFN和TALEN。熟練的技術人員能夠將合適的核酸內切酶位點摻入核酸分子中,例如鄰近或靠近核酸分子的任一或兩個同源臂。熟練的技術人員能夠將合適的CRE重組酶位點整合到核酸分子中。
在一些實施方案中,藉由插入模板序列刪除靶序列,並且藉由CRISPR/Cas核糖核蛋白在模板和靶序列的任一側切割模板和靶染色體。在一些實施方案中,(a)靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、第一sgRNA靶序列、靶序列、第二sgRNA靶序列和第二核酸分子的3’同源臂序列,以及(b)模板染色體從5’至3’包含第三sgRNA靶序列、第一核酸分子的3’同源臂序列、模板序列、第二核酸分子的5’同源臂序列和第四個sgRNA靶序列。在一些實施方案中,第一、第二、第三和第四sgRNA包含不同的靶向序列。例如,第一sgRNA包含特異於靶染色體上的第一sgRNA靶序列的靶向序列,第二sgRNA包含特異於靶染色體上的第二sgRNA靶序列的靶向序列,第三sgRNA 包含特異於模板染色體上的第三sgRNA靶序列的靶向序列,第四sgRNA包含特異於靶染色體上的第四sgRNA靶序列的靶向序列。可選地,一個或多個sgRNA靶序列和相應的sgRNA靶向序列可以是相同的序列。
在一些實施方案中,插入模板序列包括刪除極少靶序列的序列或不刪除靶序列的序列。所屬技術領域具有通常知識者將理解,在雙鏈斷裂修復的許多機制中,涉及斷裂末端的切除,因此將在本文所述的核酸內切酶位點周圍產生缺失。例如,可藉由本文所述的方法產生靶位置周圍或靶序列側翼的核酸內切酶位點周圍約5bp、10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp或50bp的缺失。
在一些實施方案(例如,其中藉由本文所述的方法幾乎未刪除靶序列或未刪除靶序列的那些實施方案)中,(a)靶染色體從5'至3'包含第一核酸分子的5'同源臂序列、第一sgRNA靶序列和第二核酸分子的3'同源臂序列;以及(b)模板染色體從5'至3'包含第二sgRNA靶序列、第一核酸分子的3'同源臂序列、模板序列、第二核酸分子的5'同源臂序列和第三sgRNA靶序列。在一些實施方案中,第一、第二和第三sgRNA包含不同的靶向序列。例如,第一sgRNA包含對靶染色體上的第一sgRNA靶序列特異的靶向序列,第二sgRNA包含對靶染色體上的第二sgRNA靶序列特異的靶向序列,第三sgRNA包含對模板染色體上的第三sgRNA靶序列特異的靶向序列。
在一些實施方案中,插入模板序列破壞了靶序列的一種或多種功能。例如,將模板序列插入基因的編碼序列可以藉由產生過早終止密碼子、蛋白質編碼序列中的突變、異常剪接產物等來阻止正確基因產物的表達。類似地,將模板序列插入基因的調控序列,諸如增強子或啟動子,可以阻止基因表達。
在一些實施方案中,本揭露的方法包括在插入靶序列後刪除第一和/或第二標記。可藉由本領域已知的任何合適的方法刪除標記例如,可將包含工程化的染色體的細胞與CRISPR/Cas核糖核蛋白接觸,該CRISPR/Cas核糖核蛋白包含對編碼標記的序列特異的gNA靶向序列,從而誘導標記序列的全部或部分缺失。
本揭露的方法可用於產生染色體重排,諸如倒位和易位。許多染色體重排在人疾病或病症諸如癌症中起作用。在模式生物(諸如小鼠)中重建此類重排可以促進對這些疾病或病症的研究。所涉及的染色體畸變為所屬技術領域具有通常知識者所知,並描述於可在mitelmandatabase.isb-cgc.org/獲得的Mitelman數據庫中。關於與人疾病相關的染色體畸變的更多信息也可在rarediseases.info.nih.gov/diseases/diseases-by-category/36/chromosome-disorders上獲得。
因此,本揭露提供了產生染色體重排的方法,其包括:(a)提供細胞,其包含含有靶位置的靶染色體和含有模板序列的模板染色體;(b)將細胞與核酸分子接觸,該核酸分子從5’至3’包含5’同源臂和3’同源臂,該5’同源臂包含靶位置5’末端上游的核苷酸序列,該3’同源臂包含模板序列5’末端上游的核苷酸序列;(c)在靶位置上和模板序列的5’末端產生雙鏈斷裂,從而將標記插入5’同源臂序列3’的靶染色體,隨後插入模板序列,從而產生染色體重排;以及(c)選擇表達該標記的一個或多個細胞。可選地,該方法包括(a)提供細胞,其包含含有靶位置的靶染色體和含有模板序列的模板染色體;(b)將細胞與核酸分子接觸,該核酸分子從5’至3’包含5’同源臂、標記和3’同源臂,該5’同源臂包含模板序列3’末端下游核苷酸序列,該3’同源臂包含靶序列3’末端下游核苷酸序列;(c) 在靶位置上和模板序列的3’末端產生雙鏈斷裂,從而將標記插入5’同源臂序列3’的靶染色體,隨後插入模板序列,從而產生染色體重排;以及(c)選擇表達該標記的一個或多個細胞。在一些實施方案中,產生雙鏈斷裂包括將細胞與CRISPR/Cas內切核酸酶、至少第一gNA和第二gNA接觸,該第一gNA包含對靶位置特異的靶向序列,使得CRISPR/Cas內切核酸酶切割靶位置,該第二gNA包含對模板序列5’末端特異的靶向序列。在一些實施方案中,產生雙鏈斷裂包括將細胞與CRISPR/Cas內切核酸酶、至少第一gNA和第二gNA接觸,該第一gNA包含對靶位置特異的靶向序列,使得CRISPR/Cas內切核酸酶切割靶位置,該第二gNA包含對模板序列3’末端特異的靶向序列。在一些實施方案中,核酸分子包括DNA。在一些實施方案中,核酸分子包括質粒。
本領域已知的合適方法可用於在靶染色體和模板染色體中產生雙鏈斷裂。這尤其可藉由選擇用於指導HDR介導的染色體重排的核酸分子(例如,質粒)的同源臂序列來實現,該核酸分子與靶染色體和模板染色體上的核酸內切酶位點重疊或包含該核酸內切酶位點。在一些實施方案中,在(c)中產生雙鏈斷裂包括使用CRISPR/Cas核酸內切酶和一種或多種引導核酸(gNA)、一種或多種鋅指核酸酶、一種或多種轉錄激活子樣效應因子核酸酶(TALEN)或一種或多種CRE重組酶來誘導雙鏈斷裂。例如,Cre重組酶誘導兩個LoxP位點之間的染色體區域的倒位,由此模板序列以及第一和第二標記被插入到靶染色體中。在一些實施方案中,CRISPR/Cas核酸內切酶包括CasI、CasIB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、CasX、CasY、Cas12a(Cpf1)、Cas13a、CsyI、Csy2、Csy3、CseI、Cse2、CscI、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、CmrI、Cmr3、Cmr4、Cmr5、Cmr6、CsbI、Csb2、Csb3、Csx17、 CsxI4、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、CsfI、Csf2、Csf3、Csf4、Cms1、C2c1、C2c2或C2c3或其同源物、直系同源物或經修飾的形式。在一些實施方案中,CRISPR/Cas核酸內切酶包括Cas9、Cas12a(Cpf1)、Cas13a、CasX、CasY、C2c1或C2c3。在一些實施方案中,CRISPR/Cas內切核酸酶包括Cas9。在一些實施方案中,gNA包括單引導RNA(sgRNA)。
本領域已知的任何合適的方法都可用於將細胞與本文所述的核酸內切酶接觸。例如,包含核酸內切酶和編碼gRNA的序列(對於CRISPR/Cas核酸內切酶而言)的核酸分子(例如,質粒等)可用於轉染細胞。可選地,可藉由電穿孔、脂轉染、轉導等將核酸內切酶或編碼核酸內切酶的核酸分子引入細胞。
用於實施本文所述方法的細胞可以是本領域已知的任何合適的細胞。在一些實施方案中,細胞包括胚胎幹(ES)細胞。在一些實施方案中,細胞包括胚胎雜交幹(EHS)細胞。EHS細胞可藉由融合來自兩個不同物種(例如人和小鼠、人和大鼠,或小鼠和猴)的ES細胞來產生。本領域已知的所有融合方法都被設想為在本揭露的範圍內,包括但不限於電融合、病毒誘導融合和化學誘導融合。在一些實施方案中,該方法包括將人EH細胞與選自由以下組成的組的EH細胞融合:小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞和猴。在一些實施方案中,該方法包將來自任何兩種不同物種的EH細胞融合,該物種選自由以下組成的組:小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞和猴。
在一些實施方案中,細胞包括受精卵。如本文中所用,術語“受精卵”是指由兩個配子(例如哺乳動物的卵子和精子)之間的受精事件形成的真核 細胞。單細胞、2細胞、4細胞、8細胞或更進階段的受精卵可適用於本文所述的方法。
如本文所述產生工程化的染色體後,可使用任何合適的方法來回收工程化的染色體。在一些實施方案中,回收本揭露的工程化的染色體包括微細胞介導的染色體轉移(MMCT)。藉由將包含工程化的染色體的微核細胞與靶細胞諸如ES細胞融合,將回收的染色體轉移到任何適合下游應用的細胞類型中。下面更詳細地描述這些方法。
模板染色體
本揭露提供了用於本文所述方法的包含模板序列的模板染色體。
如本文中所用,“模板染色體”是指含有“模板序列”的染色體。模板序列是指使用本揭露的方法引入靶染色體或靶位置的序列。
模板染色體可從任何合適的來源分離或獲得。在一些實施方案中,模板染色體來自真核生物。在一些實施方案中,真核生物是脊椎動物,諸如鳥類、爬行動物或哺乳動物。在一些實施方案中,模板染色體來自小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞。在一些實施方案中,模板染色體來自人。
在一些實施方案中,模板染色體是外源染色體,模板序列是外源序列。例如,靶染色體是小鼠染色體,模板染色體和相應的模板序列來自非小鼠物種,諸如人。
在一些實施方案中,模板染色體是內源染色體,模板序列是內源序列。例如,模板染色體是小鼠染色體,而靶染色體是第二不同的小鼠染色體。
在一些實施方案中,模板染色體是人工染色體。
在一些實施方案中,模板染色體是天然存在的染色體。
在一些實施方案中,模板染色體包含對天然存在的染色體的一個或多個修飾。修飾尤其包括序列的插入、缺失和重排。插入模板染色體的序列的實例尤其包括標記、啟動子、cDNA序列、非編碼序列等。
在一些實施方案中,模板染色體包含位於模板序列5’的核酸內切酶位點。在一些實施方案中,模板染色體包含位於模板序列3’的核酸內切酶位點。在一些實施方案中,核酸內切酶位點緊鄰模板序列。在一些實施方案中,核酸內切酶位點位於模板序列附近。
在一些實施方案中,模板染色體在模板序列的任一側包含核酸內切酶位點。例如,模板染色體包含位於模板序列5’的第一核酸內切酶位點和位於模板序列3’的第二核酸內切酶位點。在一些實施方案中,第一和第二核酸內切酶位點都被同一核酸內切酶識別和切割。例如,第一和第二核酸內切酶位點均包含相同的DNA序列,其被同一核酸內切酶識別。在一些實施方案中,第一核酸內切酶位點被第一核酸內切酶切割,第二核酸內切酶位點被第二核酸內切酶切割。例如,第一和第二內切核酸酶位點包含由兩種不同的鋅指核酸酶(ZFN)識別的不同DNA序列,或由包含含有不同靶向序列的引導核酸(gNA)的CRISPR/Cas核糖核蛋白複合物識別的兩種不同的CRISPR/Cas靶序列。在一些實施方案中,第一和/或第二核酸內切酶位點緊鄰模板序列。在一些實施方案中,第一和/或第二核酸內切酶位點位於模板序列附近。
在模板序列的5個鹼基對(bp)內、10bp內、15bp內、20bp內、30bp內、40bp內、50bp內、70bp內、80bp內、90bp內、100bp內、120bp 內、140bp內、160bp內、180bp內、200bp內、250bp內、300bp內、400bp內或500bp內的序列可被認為靠近模板序列。
在一些實施方案中,模板染色體包含用於促進同源定向修復的核酸分子的同源臂的一個或多個序列。在一些實施方案中,模板染色體包含位於模板序列5’末端或模板序列5’末端附近的同源臂序列。在一些實施方案中,同源臂位於模板序列的上游,即模板序列的5’。在一些實施方案中,模板染色體從5’至3’包含核酸內切酶位點、同源臂序列和模板序列。在一些實施方案中,模板染色體包含位於模板序列3’末端或模板序列5’末端附近的同源臂序列。在一些實施方案中,同源臂位於模板序列的下游,即模板序列的3’。在一些實施方案中,模板染色體從5’至3’包含模板序列、同源臂序列和核酸內切酶位點。在一些實施方案中,同源臂序列位於核酸內切酶位點與模板序列之間。
在一些實施方案中,模板染色體包含位於模板序列5’或其附近的第一同源臂序列,和位於模板序列3’或其附近的第二同源臂序列,即,模板染色體包含模板序列上游和下游的同源臂。在一些實施方案中,第一同源臂是第一核酸分子的3’同源臂,該第一核酸分子從5’至3’包含含有靶序列的5'末端上游的核苷酸序列的5’同源臂、至少第一標記的序列和第一同源臂序列。在一些實施方案中,第二同源臂是第二核酸分子的5’同源臂,該第二核酸分子從5’至3’包含第二同源臂序列、至少第二標記的序列和包含靶序列3’末端下游的核苷酸序列的3’同源臂。在一些實施方案中,模板染色體從5’至3’包含第一核酸內切酶位點、第一同源臂序列、模板序列、第二同源臂序列和第二核酸內切酶位點。
在一些實施方案中,第一和/或第二同源臂序列緊鄰第一和/或第二核酸內切酶位點。在一些實施方案中,第一同源臂序列緊鄰第一核酸內切酶位 點,第二同源臂序列緊鄰第二核酸內切酶位點,其中第一同源臂位於第一核酸內切酶位點與模板序列之間,第二同源臂位於模板序列與第二模板序列之間。在一些實施方案中,第一同源臂位於第一核酸內切酶位點與模板序列之間,第二同源臂位於模板序列與第二模板序列之間。
在一些實施方案中,第一和/或第二同源臂序列位於模板序列附近。在模板序列的0bp內、5個鹼基對(bp)內、10bp內、15bp內、20bp內、30bp內、40bp內、50bp內、70bp內、80bp內、90bp內、100bp內、120bp內、140bp內、160bp內、180bp內、200bp內或250bp內的同源臂可被認為靠近模板序列。
在一些實施方案中,模板染色體從5’至3’包含第一核酸內切酶位點、第一同源臂、模板序列、第二同源臂和第二核酸內切酶位點。
在一些實施方案中,模板染色體的第一和/或第二同源序列的長度介於約20bp與2,000bp之間、介於約50bp與1,500bp之間、介於約100bp與1,400bp之間、介於約150bp與1,300bp之間、介於約200bp與1,200bp之間、介於約300bp與1,100bp之間、介於約400bp與1,000bp之間或介於約500bp與900bp之間,或介於約600bp bp與1,200bp之間。在一些實施方案中,模板染色體的同源序列長度介於約400bp與1,500bp之間。在一些實施方案中,模板染色體的同源序列長度介於約500bp與1,300bp之間。在一些實施方案中,模板染色體的同源序列長度介於約600bp與1,000bp之間。
模板序列
模板染色體包含模板序列,並且在本文所述的工程化的染色體和方法中充當模板序列的來源。模板序列可位於模板染色體上任何合適的位置。例 如,不希望受理論所束縛,模板序列可位於模板染色體上以常染色質為特徵的區域。
可從任何合適的來源分離或衍生模板序列。在一些實施方案中,模板序列包含內源序列,例如對於模板染色體是內源的序列,或對於產生靶染色體的物種是內源的序列。在一些實施方案中,模板序列是外源序列。例如,模板序列來自對於產生靶染色體的物種是外源的序列。在一些實施方案中,模板序列包含天然存在的序列。在一些實施方案中,模板序列包含對天然存在的序列的一個或多個修飾。修飾尤其包括序列諸如人工序列或標記的插入、缺失和重排。在一些實施方案中,模板序列包含人工序列。在一些實施方案中,模板序列包括天然存在的序列和人工序列。示例性人工序列尤其包括標記、cDNA序列、啟動子和重組序列。示例性標記包括但不限於下表3中公開的選擇標記,以及可檢測的標記,諸如綠色螢光蛋白(GFP)、mCherry等。
在一些實施方案中,模板序列來自真核生物。在一些實施方案中,真核生物是脊椎動物,諸如鳥類、爬行動物或哺乳動物。在一些實施方案中,模板序列包含小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞序列。在一些實施方案中,模板序列包含人序列。
在一些實施方案中,模板序列的長度為至少25KB、至少50KB、至少100KB、至少200KB、至少400KB、至少500KB、至少600KB、至少700KB、至少800KB、至少900KB、至少1MB、至少2MB、至少3MB、至少4MB、至少5MB、至少6MB、至少7MB、至少8MB、至少9MB、至少10MB、至少15MB、至少20MB、至少25MB、至少30MB、至少40MB、至少50MB、至少60MB、至少70MB、至少80MB、至少90MB、至少100 MB、至少120MB、至少140MB、至少160MB、至少180MB、至少200MB、至少220MB或至少250MB。在一些實施方案中,模板序列的長度為至少50KB、至少100KB、至少200KB、至少500KB、至少700KB、至少1MB、至少2MB、至少3MB、至少4MB、至少5MB、至少6MB、至少7MB、至少8MB、至少9MB、至少10MB、至少20MB、至少30MB、至少40MB或至少50MB。在一些實施方案中,模板序列的長度至少為1MB。在一些實施方案中,模板序列的長度至少為2MB。在一些實施方案中,模板序列的長度至少為3MB。在一些實施方案中,模板序列的長度至少為4MB。在一些實施方案中,模板序列的長度至少為5MB。在一些實施方案中,模板序列的長度至少為10MB。在一些實施方案中,模板序列的長度至少為20MB。
在一些實施方案中,模板序列的長度介於50KB與250MB之間、介於50KB與100MB之間、介於50KB與50MB之間、介於50KB與20MB之間、介於50KB與10MB之間、介於50KB與5MB之間、介於50KB與3MB之間、介於50KB與2MB之間、介於50KB與1MB之間、介於100KB與200MB之間、介於100KB與100MB之間、介於100KB與50MB之間、介於100KB與20MB之間、介於100KB與10MB之間、介於100KB與5MB之間、介於100KB與3MB之間、介於100KB與2MB之間、介於100KB與1MB之間、介於100KB與500KB之間、介於200KB與100MB之間、介於200KB與50MB之間、介於200KB與20MB之間、介於200KB與10MB之間、介於200KB與5MB之間、介於200KB與3MB之間、介於200KB與2MB之間、介於200KB與1MB之間、介於200KB與500KB之間、介於500KB與100MB之間、介於500KB與50MB之間、介於500KB與20MB之 間、介於500KB與10MB之間、介於500KB與5MB之間、介於500KB與3MB之間、介於500KB與2MB之間、介於500KB與1MB之間、介於1MB與100MB之間、介於1MB與50MB之間、介於1MB與20MB之間、介於1MB與10MB之間、介於1MB與5MB之間、介於1MB與3MB之間、介於1MB與2MB之間、介於3MB與100MB之間、介於3MB與50MB之間、介於3MB與20MB之間、介於3MB與10MB之間、介於3MB與5MB之間、介於5MB與100MB之間、介於5MB與50MB之間、介於5MB與20MB之間、介於5MB與10MB之間、介於10MB與100MB之間、介於10MB與50MB之間或介於10MB與20Mb之間。在一些實施方案中,模板序列的長度介於50KB與250MB之間。在一些實施方案中,模板序列的長度介於500KB與200MB之間。在一些實施方案中,模板序列的長度介於200KB與50MB之間、介於1MB與20MB之間、介於1MB與10MB之間、介於1MB與5MB之間、介於1MB與3MB之間、介於3MB與20MB之間、介於3MB與10MB之間、介於3MB與7MB之間或介於3MB與5MB之間。在一些實施方案中,模板序列的長度介於1MB與10MB之間。在一些實施方案中,模板序列的長度介於1MB與5MB之間。在一些實施方案中,模板序列的長度介於3MB與5MB之間。
在一些實施方案中,模板序列包含一個或多個基因的序列。在一些實施方案中,模板序列包含多個基因的序列。在一些實施方案中,模板序列包含至少2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、60個、70個、80個、90個、100個、 150個、200個、250個、300個、350個、400個、450個、500個、600個、700個、800個、900個、1000個、1500個或2000個基因的序列。
在一些實施方案中,模板序列包含人序列,諸如一個或多個人基因的序列。在一些實施方案中,模板序列包含人基因的子序列。在一些實施方案中,模板序列包含人基因的子序列和人工序列,諸如標記或融合蛋白。在一些實施方案中,模板序列包含一個或多個人基因的序列和人工序列。
在一些實施方案中,模板序列包含人基因的序列。設想所有人基因都在本揭露的範圍內。不希望受理論所束縛,將參與疾病發病機理的或作為潛在治療靶標的人基因轉移到模式生物諸如小鼠中,可以促進對疾病的研究和合適療法的開發。
包含在模板序列中的示例性基因包括但不限於免疫球蛋白基因、T細胞受體(TCR)基因、免疫檢驗點基因、細胞因子、趨化因子、受體、轉錄因子、細胞骨架基因、細胞週期檢查基因、癌基因以及與發育、免疫學或神經生物學相關的基因。示例性免疫檢查點基因包括BTLA、CTLA-4、TIM-3、PD-1和PD-L1。示例性細胞因子包括白細胞介素(CTNF、IL-16、IL-1B、IL-6、IL-12、IL-17F、IL-2、IL-3、IL-9、IL-12B、IL18BP、IL-21、IL33、瘦素、IL-13、IL1A、IL-23、IL-4)、干擾素(IFNA10、IFN-α7、IFNa4Fc、IFNβ、IFNα4、IFNγ、IFNα5、IFNω)和腫瘤壞死因子(TNFs,例如BAFF、TNFβ、CD30配體、TNFα、CD40配體、TNFSF10、CD27配體)。示例性趨化因子包括CXC、CC CX3C和C家族趨化因子。示例性受體包括G蛋白偶聯受體、配體門控離子通道(離子型受體)、激酶連接的受體和相關受體以及核受體。示例性轉錄因子包括但不限於螺旋-轉角-螺旋轉錄因子(例如Oct-1)、螺旋-環-螺旋轉錄因子(例如E2A)、鋅指轉錄因子 (例如糖皮質激素受體、GATA蛋白)、鹼性蛋白-亮胺酸拉鍊轉錄因子(例如環AMP應答元件結合因子(CREB)和激活蛋任1(AP-1))和β-折疊基序轉錄因子(例如核因子-κB(NF-κB))。示例性細胞週期調節基因包括但不限於細胞週期蛋白、細胞週期蛋白依賴性激酶和細胞週期檢查點基因。
在一些實施方案中,模板序列包含癌基因或腫瘤抑制基因。適合包含在模板序列中的示例性癌基因和腫瘤抑制基因列於下表1中。
表1. 癌基因和腫瘤抑制因子
Figure 111136154-A0202-12-0041-47
Figure 111136154-A0202-12-0042-3
Figure 111136154-A0202-12-0043-4
Figure 111136154-A0202-12-0044-5
在一些實施方案中,模板序列包含與遺傳疾病或病症相關的人基因的序列。在一些實施方案中,模板序列包含與遺傳疾病或病症相關的人染色體區域的序列。與疾病或病症相關的基因和染色體區域的非限制性實例示於下表2中。
表2.遺傳疾病或病症,以及相關的基因或基因組區域
Figure 111136154-A0202-12-0045-48
Figure 111136154-A0202-12-0046-7
Figure 111136154-A0202-12-0047-8
Figure 111136154-A0202-12-0048-9
在一些實施方案中,模板序列包含免疫球蛋白序列。表面免疫球蛋白和分泌型免疫球蛋白都被認為在本發明的範圍內。免疫球蛋白識別外來抗原並啟動免疫反應。在人中,每個免疫球蛋白分子由兩條相同的重鏈和兩條相同的輕鏈組成,該重鏈由14號染色體上的IGH基因座編碼,該輕鏈由2號染色體上的免疫球蛋白κ基因座(IGK)和22號染色體上的免疫球蛋白λ基因座(IGL)編碼。IGH基因座包括V(可變)區、D(多樣性)區、J(連接)區和C(恆定)區。V、D和J區各自含有多個不同的基因區段,在本文中統稱為IGH可變區。在B細胞發育期間,DNA水平上的重組事件將單個D區段與J區段連接;然後將這個部分重排的D-J區的融合D-J外顯子與V區段連接。然後轉錄包含融合的V-D-J外顯子的重排的V-D-J區,並藉由RNA剪接將其與恆定區融合。該轉錄物編碼μ重鏈。在發育晚期,B細胞產生V-D-J-Cμ-Cδ前信使RNA,其被選擇性剪接成編碼μ或δ重鏈。淋巴結中的成熟B細胞經歷轉換重組(switch recombination),使得融合的V-D-J基因區段接近IGHG、IGHA或IGHE基因區 段之一,並且每個細胞表達γ、α或ε重鏈。許多不同的V區段與幾個J區段的潛在重組提供了廣泛的抗原識別。額外的多樣性是藉由連接多樣性獲得的,連接多樣性是由末端脫氧核糖核苷轉移酶隨機添加核苷酸和體細胞超突變產生的。每個輕鏈由兩個串聯的免疫球蛋白結構域、恆定結構域(CL)和可變結構域(VL)組成。對於輕鏈,V結構域由兩個獨立的DNA區段編碼。第一區段被稱為V基因區段,因為其編碼大部分V結構域。第二區段編碼V結構域的剩餘部分,並被稱為連接或J基因區段。像重鏈一樣,輕鏈經過重排將V區段連接到J基因區段,並使V基因靠近恆定區序列,然後僅由內含子分開。IGHV、IGHD、IGHJ、IGHG或IGHA中任一種的IGH序列,或其任意組合,被認為是在本揭露的模板序列的範圍內。IGK或IGL或其組合的輕鏈序列被認為在本揭露的模板序列的範圍內。
在一些實施方案中,工程化的染色體包括其中一個或多個非編碼序列可能已被引入該染色體的小鼠染色體。例如,一個或多個能夠調節抗體產生、成熟和/或多樣化的非編碼序列可能已被引入該染色體中。例如,一個或多個能夠調節抗體多樣化的非編碼序列可能已被引入該染色體中。例如,一個或多個能夠調節抗體類別轉換的非編碼序列可能已被引入該染色體。例如,轉換區內的一個或多個非編碼序列可能已被引入該染色體中。例如,當一個或多個非編碼序列已被引入該染色體時,類別轉換重組、體細胞超突變和/或激活誘導的胞苷脫胺酶可被調節。例如,當一個或多個非編碼序列被引入該染色體時,Ig序列庫的多樣性可被調節。例如,重鏈、κ輕鏈和λ輕鏈基因座上含有重排基因的約2kb的可變區,和/或重鏈基因座上含有大量富含G:C的DNA區段的約4kb的轉換區可能已被引入該染色體中。
在一些實施方案中,模板序列包含人IGH序列。人IGH跨越人基因組的GRCh38.p13裝配體的14號染色體的核苷酸位置105,586,437至106,879,844。所屬技術領域具有通常知識者將會理解,具有5’和3’邊界的人IGH序列是合適的模板序列,該邊界偏離上文所述的那些例如至少100bp、500bp、1,000bp、2,000bp、5,000bp、10,000bp或更多。
在一些實施方案中,模板序列包含人IGH可變區序列。在一些實施方案中,人IGH可變區序列包含編碼人VH、DH和JH1-6基因區段的序列和間插非編碼序列。在一些實施方案中,人IGH可變區序列包含人基因組的GRCh38.p13裝配體的14號染色體的核苷酸位置105,862,994至106,811,028。在一些實施方案中,人IGH可變區序列包含人基因組的GRCh38.p13裝配體的14號染色體的核苷酸位置105,862,994至106,811,028,從5’末端、3’末端或兩端減去至少約50bp、100bp、500bp、1,000bp、2,000bp、5,000bp、7,000bp、10,000bp、15,000bp、20,000bp或50,000bp。在一些實施方案中,人IGH可變區序列包含人基因組的GRCh38.p13組裝體的14號染色體的核苷酸位置105,862,994至106,811,028,以及在5’末端、3’末端或兩端的至少約50bp、100bp、500bp、1,000bp、2,000bp、5,000bp、7,000bp、10,000bp、15,000bp、20,000bp或50,000bp的額外側翼序列。在一些實施方案中,人IGH可變區序列包含人基因組的GRCh38.p13裝配體的14號染色體的核苷酸位置105,862,994至106,811,028,以及對其的一個或多個修飾。示例性修飾包括但不限於缺失(諸如一個或多個V、D或J區段的缺失)、插入(諸如標記的插入)、重排或其組合。
在一些實施方案中,模板序列包含T細胞受體亞單位(TCR)的序列。T細胞受體(TCR)是在T細胞或T淋巴細胞表面發現的蛋白質複合物,[1]其 負責將抗原片段識別為與主要組織相容性複合物(MHC)分子結合的肽。TCR包含二硫鍵連接的膜結合異二聚體蛋白,在大多數情況下其由高度可變的α和β鏈組成,該α和β鏈作為與不變CD3鏈分子(CD3δ、CD3ε、CD3γ和CD3ζ)的複合物的一部分表達。表達這兩條鏈的T細胞被稱為α:β(或αβ)T細胞。少數T細胞表達由可變γ和σ鏈形成的替代受體,稱為γσ T細胞。TCR發育藉由淋巴細胞特異性基因重組過程發生,該過程從大量潛在區段組裝成最終序列,這藉由胸腺中的T細胞中的TCR基因區段的重組發生。TCRα基因座包含可變(V)和連接(J)基因區段(Vβ和Jβ),而TCRβ基因座除了Vα和Jα區段之外還包含D基因區段。因此,α鏈由VJ重組產生,β鏈參與VDJ重組。這與γδTCR的開發類似,其中TCRγ鏈參與VJ重組,TCRδ基因由VDJ重組產生。TCR α鏈基因座由46個可變區段、8個連接區段和恆定區組成。TCR β鏈基因座由48個可變區段、繼之以兩個多樣性區段、12個連接區段和兩個恆定區組成。包含本文所述的任何TCR亞單位的序列、其子序列或其組合的模板序列被認為在本揭露的範圍內。在一些實施方案中,模板序列包含TCRα鏈可變區序列(由T細胞受體α基因座或TRA編碼)、TCRβ鏈可變區序列(由T細胞受體β基因座或TRB編碼)、TCRγ可變區序列(由T細胞受體γ基因座或TRG編碼)或TCRδ可變區序列(由T細胞受體δ基因座或TRD編碼)。
在一些實施方案中,模板序列包含編碼抗體或抗原結合片段的序列。
如本文中所用,術語“抗體”是指與特定抗原特異性結合或與特定抗原發生免疫反應的免疫球蛋白分子,包括多株抗體、單株抗體、基因工程抗體和以其它方式修飾的抗體形式,包括但不限於嵌合抗體、人源化抗體、雜綴合抗 體(heteroconjugate antibody)(例如,雙-三-和四-特異性抗體、雙鏈抗體、三鏈抗體和四鏈抗體),以及抗體的抗原結合片段,包括例如Fab'、F(ab')2、Fab、Fv、rlgG和scFv片段。除非另有說明,否則術語“單株抗體”(mAb)意味著包括完整分子,以及能夠與靶蛋白特異性結合的抗體片段(包括,例如,Fab和F(ab')2片段)。如本文中所用,Fab和F(ab’)2片段是指缺少完整抗體的Fc片段的抗體片段。本文描述了這些抗體片段的實例。
如本文中所用,術語“抗原結合片段”是指保留了與靶抗原特異性結合的能力的抗體的一個或多個片段。抗體的抗原結合功能可藉由全長抗體的片段來實現。抗體片段可以是例如Fab、F(ab')2、scFv、雙鏈抗體、三鏈抗體、親和體(affibody)、奈米抗體、適體或結構域抗體。抗體的術語“抗原結合片段”所包含的結合片段的實例包括但不限於:(i)Fab片段,由VL、VH、CL和CH1結構域組成的單價片段;(ii)F(ab')2片段,含有在鉸鏈區藉由二硫鍵連接兩個Fab片段的二價片段;(iii)由VH和CH1結構域組成的Fd片段;(iv)由抗體單臂的VL和VH結構域組成的Fv片段,(v)包括VH和VL結構域的dAb;(vi)由VH結構域組成的dAb片段(參見,例如,Ward等人,Nature 341:544-546,1989);(vii)由VH或VL域組成的dAb;(viii)分離的互補決定區(CDR);和(ix)兩個或更多個(例如,兩個、三個、四個、五個或六個)分離的CDR的組合,該CDR可以視需要地藉由合成接頭連接。此外,儘管Fv片段的兩個結構域VL和VH是由獨立的基因編碼的,但是它們可以使用重組方法藉由接頭連接,該接頭使它們能夠成為單個蛋白鏈,其中VL和VH區配對形成單價分子(稱為單鏈Fv(scFv));參見,例如,Bird等人,Science 242:423-426,1988 and Huston等人,Proc.Natl.Acad.Sci.USA 85:5879-5883,1988)。可使用所屬技術領域具有通常知識 者已知的常規技術獲得這些抗體片段,並且可以以與完整抗體相同的方式篩選該片段的實用性。抗原結合片段可藉由重組DNA技術、對完整免疫球蛋白的酶促或化學切割,或者在某些情況下,藉由本領域已知的化學肽合成方法來產生。
如本文中所用,術語“互補決定區”(CDR)是指在抗體的輕鏈和重鏈可變結構域中都存在的高變區。可變結構域的更高度保守的部分被稱為框架區(FR)。描述抗體高變區的胺基酸位置可以變化,這取決於上下文和本領域已知的各種定義。可變結構域內的一些位置可被視為雜交高變位置,因為這些位置在一組標準下可被視為在高變區內,而在另一組標準下被視為在高變區外。這些位置中的一個或多個也可存在於延伸的高變區中。本文描述的抗體可在這些雜合高變位置上包含修飾。天然重鏈和輕鏈的可變結構域各自包含藉由三個CDR連接的四個主要採用β-折疊構型的框架區,該CDR形成連接β-折疊結構的環,在某些情況下形成β-折疊結構的一部分。每條鏈中的CDR藉由框架區以FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4的順序緊密結合在一起,並且與來自另一條抗體鏈的CDR一起促成抗體的靶結合部位的形成(參見Kabat等人,Sequences of Proteins of Immunological Interest,National Institute of Health,Bethesda,Md.,1987)。如本文中所用,除非另有說明,否則根據Kabat等人的免疫球蛋白胺基酸殘基編號系統進行免疫球蛋白胺基酸殘基的編號。
在一些實施方案中,抗體或抗原結合片段包括人抗體或抗原結合片段。在一些實施方案中,對抗體或抗原結合片段進行人源化。
所屬技術領域具有通常知識者將理解,模板序列還可包括在特定組織、細胞類型或生物體中表達基因(諸如抗體)所必需的序列。此類序列包括但不限於啟動子、增強子、非轉譯序列諸如信使RNA(mRNA)的5’和3’非轉譯區、 多腺苷酸化(polyA)序列、內含子、內部核糖體進入位點(IRES)等。合適序列的選擇對所屬技術領域具有通常知識者來說是顯而易見的。
在一些實施方案中,模板序列包含啟動子。在一些實施方案中,啟動子包含內源啟動子,即啟動子是通常與包含在模板序列中的基因相關的啟動子。在一些實施方案中,啟動子不是內源啟動子,例如,從模板序列中與啟動子可操作地連接的基因之外的另一個基因或生物中分離或衍生的啟動子。例如,模板序列包含編碼抗體或抗原結合片段的序列,該序列與不是免疫球蛋白啟動子的啟動子可操作地連接。在一些實施方案中,啟動子是組成型啟動子、誘導型啟動子或組織特異性啟動子。在一些實施方案中,啟動子分離自或衍生自哺乳動物基因,例如在淋巴細胞中表達的基因。
可用於表達模板序列的基因的示例性啟動子包括但不限於SV40早期啟動子區、勞斯肉瘤病毒的3’長末端重複序列中包含的啟動子、金屬硫蛋白基因的調控序列、四環素(Tet)啟動子、來自酵母或其它真菌的啟動子元件諸如Gal啟動子、ADC(乙醇脫氫酶)啟動子、PGK(磷酸甘油激酶)啟動子、鹼性磷酸酶啟動子和下列動物轉錄控制區,該轉錄控制區表現出組織特異性並已被用於基因轉殖動物:在胰腺腺泡細胞中有活性的彈性蛋白酶I基因控制區;在胰腺β細胞中有活性的胰島素基因控制區、在淋巴樣細胞中有活性的免疫球蛋白基因控制區、在睾丸細胞、乳腺細胞、淋巴樣細胞和肥大細胞中有活性的小鼠乳腺腫瘤病毒控制區、在肝臟中有活性的白蛋白基因控制區、在肝臟中有活性的甲胎蛋白基因控制區、在肝臟中有活性的α1-抗胰蛋白酶基因控制區、在髓樣細胞中有活性的β-珠蛋白基因控制區、在大腦少突膠質細胞中有活性的髓鞘鹼性蛋白基因控制區、在骨骼肌中有活性的肌球蛋白輕鏈-2基因控制區、在神經元細胞中 有活性的神經元特異性烯醇化酶(NSE)、在神經元細胞中有活性的腦源性神經營養因子(BDNF)基因控制區、在星形膠質細胞中有活性的神經膠質原纖維酸性蛋白質(GFAP)啟動子,以及在下丘腦中有活性的促性腺激素激素基釋放因控制區。
靶染色體
本揭露提供了用於本文所述方法的包含靶序列的靶染色體。
如本文中所用,“靶染色體”是指含有“靶序列”的染色體,或者,在其中藉由插入模板序列沒有明顯刪除靶序列的情況下,是指“靶位置”。靶序列是指藉由使用本文所述方法插入模板序列而刪除的靶染色體序列。靶位置是指靶染色體中模板序列被插入(用於插入)或與其連接(用於染色體易位或重排)的位置。
靶染色體可從任何合適的來源分離或衍生。在一些實施方案中,靶染色體來自真核生物。在一些實施方案中,真核生物是脊椎動物,諸如鳥類、爬行動物或哺乳動物。在一些實施方案中,靶染色體來自小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞。在一些實施方案中,靶染色體來自小鼠。在一些實施方案中,靶染色體來自大鼠。在一些實施方案中,靶染色體來自猴子。
在一些實施方案中,模板染色體和靶染色體來自不同物種。例如,模板染色體來自人,靶染色體來自小鼠。在一些實施方案中,模板染色體和靶染色體來自同一物種。
在一些實施方案中,靶染色體是人工染色體。
在一些實施方案中,靶染色體是天然存在的染色體。
在一些實施方案中,靶染色體包含對天然存在的染色體的一個或多個修飾。修飾尤其包括序列的插入、缺失和重排。插入靶染色體中的序列的實例尤其包括標記、啟動子、cDNA序列、非編碼序列等。合適的標記包括選擇標記,諸如表3中公開的那些,以及可檢測的標記,諸如GFP、mCherry等。
在一些實施方案中,靶染色體包含位於模板序列5’的核酸內切酶位點。在一些實施方案中,靶染色體包含位於靶序列3’的核酸內切酶位點。在一些實施方案中,核酸內切酶位點緊鄰靶序列。在一些實施方案中,核酸內切酶位點位於靶序列附近。
在一些實施方案中,靶染色體在靶序列的任一側包含核酸內切酶位點。例如,靶染色體包含位於靶序列5’的第一核酸內切酶位點和位於靶序列3’的第二核酸內切酶位點。在一些實施方案中,第一和第二核酸內切酶位點都被同一核酸內切酶識別和切割。例如,第一和第二核酸內切酶位點均包含相同的DNA序列,其被同一核酸內切酶識別。在一些實施方案中,第一核酸內切酶位點被第一核酸內切酶切割,第二核酸內切酶位點被第二核酸內切酶切割。例如,第一和第二內切核酸酶位點包含由兩種不同的鋅指核酸酶(ZFN)識別的不同DNA序列,或由包含含有不同靶向序列的引導核酸(gNA)的CRISPR/Cas核糖核蛋白複合物識別的兩種不同的CRISPR/Cas靶序列。在一些實施方案中,第一和/或第二核酸內切酶位點緊鄰靶序列。在一些實施方案中,第一和/或第二核酸內切酶位點位於靶序列附近。
模板序列的5個鹼基對(bp)內、10bp內、15bp內、20bp內、30bp內、40bp內、50bp內、70bp內、80bp內、90bp內、100bp內、120bp內、 140bp內、160bp內、180bp內、200bp內、250bp內、300bp內、400bp內或500bp內的核酸內切酶位點被認為靠近靶序列。
在一些實施方案中,靶染色體包含用於促進同源定向修復的核酸分子同源臂的一個或多個序列。在一些實施方案中,靶染色體包含位於靶序列5’的同源臂序列。在一些實施方案中,靶染色體從5’至3’包含同源臂序列、核酸內切酶位點和靶序列。在一些實施方案中,靶染色體包含位於靶序列3’的同源臂序列。在一些實施方案中,靶染色體從5’至3’包含靶序列、核酸內切酶位點和同源臂序列。在一些實施方案中,核酸內切酶位點位於同源臂序列與靶序列之間。
在一些實施方案中,靶染色體包含靶序列的5’第一同源臂序列和靶序列的3’第二同源臂序列。即,靶染色體在靶序列的上游和下游都包含同源臂。在一些實施方案中,第一同源臂是第一核酸分子的5’同源臂,該第一核酸分子從5’至3’包含第一同源臂、至少第一標記的序列和包含模板序列5’末端上游的核苷酸序列的3’同源臂。在一些實施方案中,第二同源臂是第二核酸分子的3’同源臂,該第二核酸分子從5’至3’包含含有模板序列3’末端下游的核苷酸序列的5’同源臂、至少第二標記的序列和第二同源臂。在一些實施方案中,靶染色體從5’至3’包含第一同源臂序列、第一核酸內切酶位點、靶序列、第二核酸內切酶位點和第二同源臂序列。
在一些實施方案中,靶染色體的第一和/或第二同源臂序列緊鄰第一和/或第二核酸內切酶位點。在一些實施方案中,第一同源臂序列緊鄰第一核酸內切酶位點,第二同源臂序列緊鄰第二核酸內切酶位點,其中第一核酸內切 酶位點位於第一同源臂與靶序列之間,第二核酸內切酶位點位於靶序列與第二同源臂之間。
在一些實施方案中,第一和/或第二同源臂序列位於靶序列附近。位於靶序列的5bp內、10bp內、15bp內、20bp內、30bp內、40bp內、50bp內、70bp內、80bp內、90bp內、100bp內、120bp內、140bp內、160bp內、180bp內、200bp內或250bp內的核酸內切酶位點可被認為靠近靶序列。
在一些實施方案中,靶染色體從5’至3’包含第一同源臂、第一核酸內切酶位點、靶序列、第二核酸內切酶位點和第二同源臂。
在一些實施方案中,當插入模板序列時,幾乎沒有或沒有靶染色體序列被刪除,並且靶序列在本文中可互換地稱為“靶位點”或“靶位置”。所屬技術領域具有通常知識者將理解,在這些情況下,同源臂和核酸內切酶位點的排列類似於上文所述的那些排列,除了同源臂在靶位置處位於核酸內切酶位點的側翼,而不是靶序列本身的側翼為核酸內切酶位點。在一些實施方案中,靶染色體從5’至3’包含第一同源臂的序列、核酸內切酶位點和第二同源臂的序列。在一些實施方案中,第一同源臂是第一核酸分子的5’同源臂,該第一核酸分子從5’至3’包含第一同源臂、至少第一標記的序列和包含模板序列5’末端上游的核苷酸序列的3’同源臂。在一些實施方案中,第二同源臂是第二核酸分子的3’同源臂,該第二核酸分子從5’至3’包含含有模板序列3’末端下游的核苷酸序列的5’同源臂、至少第二標記的序列和第二同源臂。
在一些實施方案中,模板序列與靶序列連接產生染色體重排或易位。在一些實施方案中,靶染色體從5’至到3’包含靶染色體同源臂序列和核酸內切酶位點。在一些實施方案中,靶染色體同源臂包含核酸分子的5’同源臂,該 核酸分子從5’至3’包含靶序列同源臂、至少一個標記和包含模板序列5’末端上游的核苷酸序列的3’同源臂。在一些實施方案中,靶染色體從5’至3’包含核酸內切酶位點和靶染色體同源臂序列。在一些實施方案中,靶染色體同源臂包含核酸分子的3’同源臂,該核酸分子從5’至3’包含含有模板序列3’末端下游的核苷酸序列的5’同源臂、至少第一標記和靶序列同源臂。
在一些實施方案中,靶染色體的第一和/或第二同源臂序列的長度介於約20bp與2,000bp之間、介於約50bp與1,500bp之間、介於約100bp與1,400bp之間、介於約150bp與1,300bp之間、介於約200bp與1,200bp之間、介於約300bp與1,100bp之間、介於約400bp與1,000bp之間或介於約500bp與900bp或介於約600bp與800bp之間。在一些實施方案中,靶染色體的同源序列的長度介於約400bp與1,500bp之間。在一些實施方案中,靶染色體的同源序列的長度介於約500bp與1,300bp之間。在一些實施方案中,靶染色體的同源序列的長度在約600bp與1,000bp之間。
靶序列或靶位置
靶染色體包含其中插入了模板序列的靶序列或位置,或藉由本文所述方法將模板序列與其連接的靶序列或位置。靶序列可位於靶染色體上任何合適的位置。
靶序列可從任何合適的來源分離或衍生。在一些實施方案中,靶序列和模板序列來自不同的物種。例如,模板序列來自人,而靶序列來自小鼠。在一些實施方案中,靶序列和模板序列來自同一物種。
在一些實施方案中,靶序列包括天然存在的序列。在一些實施方案中,靶序列包含一個或多個對天然存在的序列的修飾。修飾尤其包括序列諸如 人工序列或標記的插入、缺失和重排。在一些實施方案中,靶序列包括人工序列。在一些實施方案中,靶序列包括天然存在的序列和人工序列。示例性人工序列尤其包括標記、cDNA序列、啟動子和重組序列。示例性標記包括但不限於下表3中公開的選擇標記,以及可檢測的標記,諸如綠色螢光蛋白(GFP)、mCherry等。
在一些實施方案中,靶序列來自真核生物。在一些實施方案中,真核生物是脊椎動物,諸如鳥類、爬行動物或哺乳動物。在一些實施方案中,模板序列包含小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞序列。在一些實施方案中,靶序列包含小鼠序列。在一些實施方案中,靶序列包含大鼠序列。在一些實施方案中,靶序列包含猴子序列。
在一些實施方案中,靶序列的長度為至少25KB、至少50KB、至少100KB、至少200KB、至少400KB、至少500KB、至少600KB、至少700KB、至少800KB、至少900KB、至少1MB、至少2MB、至少3MB、至少4MB、至少5MB、至少6MB、至少7MB、至少8MB、至少9MB、至少10MB、至少15MB、至少20MB、至少25MB、至少30MB、至少40MB、至少50MB、至少60MB、至少70MB、至少80MB、至少90MB、至少100MB、至少120MB、至少140MB、至少160MB、至少180MB、至少200MB、至少220MB或至少250MB。在一些實施方案中,靶序列的長度為至少50KB、至少100KB、至少200KB、至少500KB、至少700KB、至少1MB、至少2MB、至少3MB、至少4MB、至少5MB、至少6MB、至少7MB、至少8MB、至少9MB、至少10MB、至少20MB、至少30MB、至少40MB或至少50MB。在一些實施方案中,靶序列的長度為至少1MB。在一些實施方案中,靶序列的長度為至少2MB。在一些實施方案中,靶序列的長度為至少3MB。在一些實 施方案中,靶序列的長度為至少4MB。在一些實施方案中,目標序列的長度至少為5MB。在一些實施方案中,靶序列的長度為至少10MB。在一些實施方案中,靶序列的長度為至少20MB。
在一些實施方案中,靶序列的長度介於50KB與250MB之間、介於50KB與100MB之間、介於50KB與50MB之間、介於50KB與20MB之間、介於50KB與10MB之間、介於50KB與5MB之間、介於50KB與3MB之間、介於50KB與2MB之間、介於50KB與1MB之間、介於100KB與200MB之間、介於100KB與100MB之間、介於100KB與50MB之間、介於100KB與20MB之間、介於100KB與10MB之間、介於100KB與5MB之間、介於100KB與3MB之間、介於100KB與2MB之間、介於100KB與1MB之間、介於100KB與500KB之間、介於200KB與100MB之間、介於200KB與50MB之間、介於200KB與20MB之間、介於200KB與10MB之間、介於200KB與5MB之間、介於200KB與3MB之間、介於200KB與2MB之間、介於200KB與1MB之間、介於200KB與500KB之間、介於500KB與100MB之間、介於500KB與50MB之間、介於500KB與20MB之間、介於500KB與10MB之間、介於500KB與5MB之間、介於500KB與3MB之間、介於500KB與2MB之間、介於500KB與1MB之間、介於1MB與100MB之間、介於1MB與50MB之間、介於1MB與20MB之間、介於1MB與10MB之間、介於1MB與5MB之間、介於1MB與3MB之間、介於1MB與2MB之間、介於3MB與100MB之間、介於3MB與50MB之間、介於3MB與20MB之間、介於3MB與10MB之間、介於3MB與5MB之間、介於5MB與100MB之間、介於5MB與50MB之間、介於5MB與20MB之間、介 於5MB與10MB之間、介於10MB與100MB之間、介於10MB與50MB之間或介於10MB與20MB之間。在一些實施方案中,靶序列的長度介於200KB與50MB之間、介於1MB與20MB之間、介於1MB與10MB之間、介於1MB與5MB之間、介於1MB與3MB之間、介於3MB與20MB之間、介於3MB與10Mb之間、介於3MB與7MB之間或介於3MB與5MB之間。在一些實施方案中,靶序列的長度介於1MB與10MB之間。在一些實施方案中,靶序列的長度介於1MB與5MB之間。在一些實施方案中,靶序列的長度介於3MB與5MB之間。
在一些實施方案中,靶序列包含一個或多個基因的序列。在一些實施方案中,靶序列包含多個基因的序列。在一些實施方案中,靶序列包含至少2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個、25個、30個、35個、40個、45個、50個、60個、70個、80個、90個、100個、150個、200個、250個、300個、350個、400個、450個、500個、600個、700個、800個、900個、1000個、1500個或2000個基因的序列。
在一些實施方案中,靶序列包含與模板序列同源的序列。例如,模板染色體是包含人模板序列的人染色體,該人模板序列包含上文表1和表2中描述的一個或多個基因,而靶染色體是包含小鼠靶序列的小鼠染色體,並且小鼠靶序列包含與人模板序列同源的小鼠序列。作為另外的實例,模板染色體是包含人IGH序列的人染色體,而靶染色體是小鼠染色體,並且靶序列包含同源小鼠Igh序列。作為又一另外的實例,模板染色體是包含人TCR序列的人染色體,而靶染色體是小鼠染色體,並且靶序列包含同源小鼠TCR序列。
在一些實施方案中,靶染色體來自小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞,並且靶序列包含模板序列的小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞同源物。
在一些實施方案中,靶序列包含小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞基因的序列。所有小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞的基因都被認為在本揭露的範圍內。不希望受理論束縛,將參與疾病發病機理的或作為潛在治療靶標的人基因轉移到模式生物諸例如小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、猴或雞,可以促進對疾病的研究和合適療法的開發。在一些實施方案中,靶序列包含與人模板序列同源的小鼠序列。在一些實施方案中,靶序列包含與人模板序列同源的大鼠序列。在一些實施方案中,靶序列包含與人模板序列同源的猴序列。
在一些實施方案中,靶序列包含免疫球蛋白序列,諸如小鼠免疫球蛋白序列。在一些實施方案中,靶序列包含小鼠Igh序列。小鼠Igh跨越小鼠基因組的GRCm39裝配體的12號染色體的核苷酸位置1112,947,269至116,248,693。所屬技術領域具有通常知識者將會理解,具有5’和3’邊界的小鼠Igh序列是合適的模板序列,該邊界偏離上文所述的那些,例如至少100bp、500bp、1,000bp、2,000bp、5,000bp、10,000bp或更多。
在一些實施方案中,靶序列包含小鼠Igh可變區序列。在一些實施方案中,小鼠Igh可變區序列包含編碼VH、DH和JH1-6基因區段的小鼠同源物的序列和間插非編碼序列。在一些實施方案中,小鼠Igh可變區序列包含小鼠基因組的GRCm39裝配體的12號染色體的核苷酸位置113,391,842至 115,973,952。在一些實施方案中,小鼠Igh可變區序列包含小鼠基因組的GRCm39裝配體的12號染色體的核苷酸位置113,391,842至115,973,952,從5’末端、3’末端或兩端減去至少約50bp、100bp、500bp、1,000bp、2,000bp、5,000bp、7,000bp、10,000bp、15,000bp、20,000bp或50,000bp。在一些實施方案中,人IGH可變區序列包含小鼠基因組的GRCm39裝配體的12號染色體的核苷酸位置113,391,842至115,973,952,以及在5’末端、3’末端或兩端的至少約50bp、100bp、500bp、1,000bp、2,000bp、5,000bp、7,000bp、10,000bp、15,000bp、20,000bp或50,000bp的額外側翼序列。在一些實施方案中,小鼠Igh可變區序列包含小鼠基因組的GRCm39裝配體的12號染色體的核苷酸位置113,391,842至115,973,952,以及對其的一個或多個修飾。示例性修飾包括但不限於缺失(諸如一個或多個V、D或J區段的缺失)、插入(諸如標記的插入)、重排或其組合。在一些實施方案中,靶序列包含小鼠Igl可變區序列。在一些實施方案中,靶序列包含小鼠Igk可變區序列。在一些實施方案中,模板序列包含人IGL可變區序列。在一些實施方案中,模板序列包含人IGK可變區序列。
在一些實施方案(例如其中藉由本文所述方法幾乎不刪除或不刪除靶染色體序列的那些實施方案)中,靶染色體包含靶位置。靶位置是模板序列插入的位置,或者是模板序列與其連接的位置。靶染色體上的任何位置都可以是合適的位置。在一些實施方案中,靶位置包含用於在靶位置產生雙鏈斷裂的核酸內切酶位點。
工程化的染色體
本揭露提供了藉由本文所述方法產生的工程化的染色體。
在一些實施方案中,工程化的染色體包括含有一個或多個人源化序列的小鼠染色體。在一些實施方案中,人源化序列包含一個或多個與人的疾病或病症相關的基因,諸如與遺傳疾病或病症相關的基因,或癌基因。在一些實施方案中,工程化的染色體包括含有一個或多個人源化序列的大鼠染色體。在一些實施方案中,工程化的染色體包括含有一個或多個人源化序列的猴染色體。
在一些實施方案中,工程化的染色體包括其中一個或多個免疫球蛋白序列已被人源化的小鼠染色體。在一些實施方案中,免疫球蛋白序列包含IGH序列,諸如IGH可變區。在一些實施方案中,工程化的染色體包含小鼠12號染色體,其中小鼠Igh可變區已被來自14號染色體的人IGH可變區替換。在一些實施方案中,小鼠Igh可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。在一些實施方案中,人IGH可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。在一些實施方案中,工程化的染色體包含小鼠12號染色體,其中大致包含小鼠基因組的GRCm39裝配體的12號染色體的113,391,842至115,973,952的核苷酸序列的小鼠Igh可變區已被大致包含人基因組的GRCh38.p13裝配體的14號染色體的105,862,994至106,811,028的核苷酸序列的人IGH可變區替換。在一些實施方案中,工程化的染色體是小鼠6號染色體,其包含替代小鼠Igk可變區的人IGK可變區的序列。在一些實施方案中,小鼠Igk可變區序列包含編碼小鼠Vk和Jk1-5基因區段的序列和間插非編碼序列。在一些實施方案中,模板序列包含人IGK可變區序列。在一些實施方案中,人IGK可變區序列包含編碼人Vk和Jk1-5基因區段的序列和間插非編碼序列。
核酸分子、質粒和載體
本揭露提供了用於本文所述方法的核酸分子。核酸分子,有時被稱為多核苷酸,是指組成單個分子的連接的核苷酸的鏈。本揭露的核酸分子可以是脫氧核糖核酸(DNA)或核糖核酸(RNA)。本發明的示例性核酸分子包含特異於或鄰近靶序列和模板序列的同源臂,以便有利於模板序列插入靶序列,或藉由雙鏈斷裂修復連接模板與靶序列。
本揭露提供了包含對靶染色體和模板染色體特異的同源臂的核酸分子,其促進了本文所述的HDR介導的染色體重排。在一些實施方案中,核酸分子從5’至3’包含5’同源臂、至少第一標記和3’同源臂,該5’同源臂含有靶序列5’末端上游的核苷酸序列,該3’同源臂含有模板序列5’末端上游的核苷酸序列。在一些實施方案中,核酸分子從5’至3’包含5’同源臂、至少第二標記和3’同源臂,該5’同源臂含有模板序列3’末端下游的核苷酸序列,該3’同源臂含有靶序列3’末端下游的核苷酸序列。
本揭露提供了包含本文所述核酸分子的載體。根據本揭露,載體是能夠轉運與其連接的其它核酸的核酸分子。例如,質粒是一種類型的載體。載體序列尤其包括從宿主細胞諸如細菌中產生載體所必需的序列,諸如複製起點和選擇標記。
在一些實施方案中,載體是質粒。在一些實施方案中,質粒從5’至3’包含5’同源臂、至少第一標記和3’同源臂,該5’同源臂含有靶序列5’末端上游的核苷酸序列,該3’同源臂包含模板序列5’末端上游的核苷酸序列。在一些實施方案中,質粒從5’至3’包含5’同源臂、至少第二種標記和3’同源臂,該5’同源臂包含模板序列3’末端下游的核苷酸序列,該3’同源臂包含靶序列3’末端下游的核苷酸序列。
在一些實施方案中,載體包含位於模板序列5’末端或其附近的同源臂序列。在一些實施方案中,同源臂位於模板序列的上游,即模板序列的5’。在一些實施方案中,載體包含位於模板序列3’末端或其附近的同源臂序列。在一些實施方案中,同源臂位於模板序列的下游,即模板序列的3’。在一些實施方案中,載體中模板同源臂的序列與模板序列中同源臂的序列相同或基本相同。
在一些實施方案中,載體包含位於靶序列或位置5’(即靶序列或位置的上游)的同源臂序列。在一些實施方案中,載體包含位於靶序列或位置3’(即靶序列或位置的下游)的同源臂序列。
熟練的技術人員將理解,在載體中的同源臂序列與模板染色體或靶染色體中的等同序列之間可存在一定程度的錯配,並且載體仍將促進來自載體的模板染色體或靶染色體中雙鏈斷裂的修復。例如,與模板染色體中的等同序列具有至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性或至少99%同一性的載體同源臂序列將適用於本揭露的方法。
在一些實施方案中,本文所述的核酸分子、質粒或載體包含一個或多個核酸內切酶位點。
在一些實施方案中,本揭露提供了(i)第一核酸分子,其從5’至3’包含5’同源臂、至少第一標記和3’同源臂,該5’同源臂含有靶序列5’末端上游的核苷酸序列,該3’同源臂含有模板序列5’末端上游的核苷酸序列;和(ii)第二核酸分子,其從5’至3’包含5’同源臂、至少第二標記和3’同源臂,該5’同源臂含有模板序列3’末端下游的核苷酸序列,該3’同源臂含有靶序列3’末端下游的核苷酸序列。在一些實施方案中,第一和第二核酸分子是質粒。在一些實施方案中,第一核酸分子從5’至3’包含含有靶序列5’末端上游的核苷酸序列的5’同源 臂、第一核酸內切酶位點、至少第一標記、第二核酸內切酶位點和含有模板序列5’末端上游的核苷酸序列的3’同源臂,其中第一和第二核酸內切酶位點與同源臂重疊,使得核酸分子上的第一和第二核酸內切酶位點以及模板染色體和靶染色體上的相應核酸內切酶位點被相同的核酸內切酶切割。在一些實施方案中,第二核酸分子從5’至3’包含含有模板序列3’末端下游的核苷酸序列的5’同源臂、第三核酸內切酶位點、至少第二標記、第四核酸內切酶位點、含有靶序列3’末端下游的核苷酸序列的3’同源臂,其中第二和第三核酸內切酶位點與同源臂重疊,使得核酸分子上的第三和第四核酸內切酶位點以及模板染色體和靶染色體上的相應核酸內切酶位點被相同的核酸內切酶切割。在一些實施方案中,第一和第二標記不是相同的標記。在一些實施方案中,第一核酸分子上的第一標記包括選擇標記和可檢測標記的組合。在一些實施方案中,第一標記包括eGFP和嘌呤黴素抗性。在一些實施方案中,第二標記包括選擇標記。在一些實施方案中,第二標記包括潮黴素抗性。
在一些實施方案中,核酸分子上的同源臂序列對應於位於模板序列、靶序列或靶位置附近的序列。模板序列、靶序列或靶位置的0bp、5個鹼基對(bp)內、10bp內、15bp內、20bp內、30bp內、40bp內、50bp內、70bp內、80bp內、90bp內、100bp內、120bp內、140bp內、160bp內、180bp內、200bp內或250bp內的同源臂可被認為是靠近該序列。
在一些實施方案中,對應於模板或靶染色體序列的核酸分子同源序列的長度介於約20bp與2,000bp之間、介於約50bp與1,500bp之間、介於約100bp與1,400bp之間、介於約150bp與1,300bp之間、介於約200bp與1,200bp之間、介於約300bp與1,100bp之間、介於約400bp與1,000bp之間, 或介於約500bp與900bp之間,或介於在約600bp與800bp之間。在一些實施方案中,核酸分子同源序列的長度介於約400bp與1,500bp之間。在一些實施方案中,核酸分子同源序列的長度介於約500bp與1,300bp之間。在一些實施方案中,核酸分子同源序列的長度介於約600bp與1,000bp之間。
在一些實施方案中,核酸分子包含適於在哺乳動物細胞中表達的標記。在一些實施方案中,標記位於核酸分子的同源臂之間,由此標記被插入到靶序列中。在一些實施方案中,標記是選擇標記。合適的選定標記包括二氫葉酸還原酶(DHFR)、穀胺醯胺合酶(GS)、嘌呤黴素乙醯轉移酶、殺稻瘟素脫胺酶、組胺醇脫氫酶、潮黴素磷酸轉移酶(hph)、博來黴素抗性基因、胺基糖苷酶磷酸轉移酶(新黴素抗性基因),並在下表3中進一步詳細描述。
在一些實施方案中,標記包括可檢測的標記(或報告分子)。可檢測標記包括但不限於介導發光反應的酶(luxA、luxB、luxAB、luc、rue、nluc)、介導比色反應的酶(lacZ、HRP)和螢光蛋白,諸如綠色螢光蛋白(GFP)、eGFP、黃色螢光蛋白(YFP)、紅色螢光蛋白(RFP)、青色螢光蛋白(CFP)、藍色螢光蛋白(BFP)、dsRed、mCherry、tdTomato、近紅外螢光蛋白等。合適的可檢測標記的選擇是所屬技術領域具有通常知識者已知的。
可使用本領域已知的任何合適的啟動子(包括但不限於巨細胞病毒早期(CMV)啟動子、PGK啟動子和EF1a啟動子)來表達標記。
表3. 選擇標記
Figure 111136154-A0202-12-0069-49
Figure 111136154-A0202-12-0070-12
在一些實施方案(例如其中使用兩種核酸分子(具有第一標記的第一核酸分子和具有第二標記的第二核酸分子)的方法的那些實施方案)中,第一種或第二種標記包含與能夠在細胞中表達螢光蛋白的啟動子可操作地連接的螢光蛋白。在一些實施方案中,螢光蛋白包括綠色螢光蛋白(GFP)。在一些實施方案中,第一標記還包括選擇標記。在一些實施方案中,第二標記還包括選擇標記。在一些實施方案中,選擇標記選自由以下組成的組:二氫葉酸還原酶(DHFR)、穀胺醯胺合酶(GS)、嘌呤黴素乙醯轉移酶、殺稻瘟菌素脫胺酶、組胺醇脫氫酶、潮黴素磷酸轉移酶(hph)、博來黴素抗性基因和胺基糖苷磷酸轉移酶。在一些實施方案中,第一和第二標記不是相同的選擇標記。在一些實施方案中,第一標記包含與能夠在細胞中表達GFP的啟動子和嘌呤黴素乙醯轉移酶可操作地連接的GFP,並且第二種標記包含潮黴素磷酸轉移酶
產生雙鏈斷裂的方法
本文提供了在模板染色體和靶染色體中產生雙鏈斷裂的方法。本文提供的方法使用用於在細胞環境中進行雙鏈斷裂修復的修復途徑來促進大序列在染色體之間的轉移。
本領域已知的在DNA序列中產生雙鏈斷裂的任何方法,以及修復這些雙鏈斷裂的任何修復途徑,都被認為在本揭露的範圍內。
在一些實施方案中,模板染色體和靶染色體中的雙鏈斷裂是使用一種或多種核酸內切酶產生的。在一些實施方案中,核酸內切酶還切割一種或多種包含本文所述方法中使用的同源臂的核酸分子。在一些實施方案中,一種或多種核酸內切酶選自由以下組成的組:CRISPR/Cas核酸內切酶和一種或多種引導核酸(gNA)、一種或多種鋅指核酸酶(ZFN)或一種或多種轉錄激活子樣效應因子核酸酶(TALEN)。在一些實施方案中,使用一種或多種CRE重組酶產生模板染色體和靶染色體中的雙鏈斷裂,以產生染色體重排。
不同的分子能夠將雙鏈和/或單鏈斷裂引入基因組核酸。本揭露的核酸酶包括但不限於歸巢核酸內切酶、限制性內切酶、鋅指核酸酶或鋅指切口酶、大範圍核酸酶或大範圍切口酶(meganickases)、轉錄激活子樣效應因子(TALE)核酸酶引導的,特別是核酸引導的核酸酶或切口酶,諸如RNA引導的核酸酶、DNA引導的核酸酶、megaTAL核酸酶、BurrH核酸酶、其修飾或嵌合形式或變體及其組合。RNA引導的核酸酶或RNA引導的切口酶視需要地是基於CRISPR的系統的一部分。
核酸酶能夠切割核酸的單體之間的磷酸二酯鍵。許多核酸酶藉由識別損傷位點並將它們從周圍的DNA上切割下來而參與DNA修復。這些酶可以是複合物的一部分。核酸內切酶是作用於靶分子中心區域的核酸酶。脫氧核糖核酸酶作用於DNA。許多參與DNA修復的核酸酶不是序列特異性的。然而,在本說明書中,序列特異性核酸酶是較佳的。在一些實施方案中,一種或多種序列特異性核酸酶對靶基因組中相當大的核苷酸串(諸如10個或更多個核苷酸,或15個、20個、25個、30個、35個、40個、45個或甚至50個或更多個核苷酸)是特異性的,靶基因組中作為靶序列的5-50個、10-50個、15-50個、15-40個、 15-30個的範圍是較佳的。這種“識別序列”越大,基因組中的靶位點就越少,核酸酶在基因組中形成的切割就越特異,因此切割變成位點特異性的。位點特異性核酸酶通常在基因組中具有少於10個、5個、4個、3個、2個或僅僅一個(1)靶位點。已被工程化用於改變一個或多個基因組核酸(包括藉由切割特定的基因組靶序列)的核酸酶在本文中被稱為工程化的核酸酶。基於CRISPR的系統是一種類型的工程化的核酸酶。然而,這種工程化的核酸酶可基於本文所述的任何核酸酶。
識別大於12個鹼基對的序列的核酸內切酶被稱為大範圍核酸酶。大範圍核酸酶/-切口酶是以大識別位點(例如12至40個鹼基對,諸如20至40個或30至40個鹼基對的雙鏈DNA序列)為特徵的內切脫氧核糖核酸酶;因此,這個位點在任何給定的基因組中可能只出現一次。
“歸巢核酸內切酶”是大範圍核酸酶的一種形式,是具有大的不對稱識別位點和通常嵌入內含子或內含肽的編碼序列的雙鏈DNA酶。歸巢核酸內切酶識別位點在基因組中極其罕見,使得它們在非常少的位置切割,有時在基因組中的單一位置切割(WO2004067736,也參見美國專利第8,697,395 B2號)。
鋅指核酸酶/-切口酶(ZFN)是藉由將鋅指DNA結合結構域與DNA切割結構域融合而產生的人工限制性內切酶。鋅指結構域可被工程化以靶向特定的所需DNA序列。
RNA引導的核酸酶/-切口酶,特別是核酸內切酶包括例如Cas9或Cpf1。已對CRISPR系統進行了詳細描述。任何基於CRISPR的系統都是本揭露的一部分。在使用另外的一種或多種RNA引導的核酸內切酶的情況下,可 使用合適的引導RNA、sgRNA或crRNA或其它合適的RNA序列,其與RNA引導的核酸內切酶相互作用並靶向基因組核酸中的基因組靶位點。
如本文中所用,術語“CRISPR相關蛋白”或“CRISPR/Cas”蛋白是指與在某些細菌(諸如化膿性鏈球菌(Streptococcus pyogenes)和其它細菌)中發現的CRISPR(成簇的規則間隔的短回文重複序列)II型適應性免疫系統相關的核酸引導的DNA核酸內切酶。CRISPR/Cas蛋白,諸如Cas9,不限於在細菌中發現的野生型(wt)蛋白。包含對野生型CRISPR/Cas序列的突變或其衍生物的CRISPR/Cas蛋白被認為在本揭露的範圍內。來自化膿性鏈球菌的原始II型CRISPR系統包含Cas9蛋白和由兩種RNA:成熟CRISPR RNA(crRNA)和部分互補的反式作用RNA(tracrRNA)組成的引導RNA。Cas9將外源DNA解旋並檢查與引導RNA的20個鹼基對間隔區互補的位點。Cas9靶向已經被簡化,並且大多數基於Cas的系統已被工程化成僅需要一個或兩個嵌合引導RNA或單個引導RNA(chiRNA,通常也簡稱為引導RNA或gRNA或sgRNA),其由crRNA和tracrRNA的融合產生。可以根據需要對間隔區進行工程化。
如本文中所用,術語“Cas9編碼序列”是指能夠被轉錄和/或轉譯(根據在宿主細胞/宿主哺乳動物中有功能的遺傳密碼)以產生Cas9蛋白的多核苷酸。Cas9編碼序列可以是DNA(諸如質粒)或RNA(諸如mRNA)。
如本文中所用,術語CRISPR/Cas核糖核蛋白是指由CRISPR/Cas蛋白和相關引導核酸組成的蛋白質/核酸複合物。例如,Cas9核糖核蛋白是指與其相關引導RNA複合的Cas9。
在一些實施方案中,核酸酶是RNA引導的核酸酶。用於本揭露的RNA引導的核酸酶(包括核酸引導的核酸酶)的非限制性實例包括但不限於 CasI、CasIB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、CasX、CasY、Cas12a(Cpf1)、Cas12b、Cas13a、CsyI、Csy2、Csy3、CseI、Cse2、CscI、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、CmrI、Cmr3、Cmr4、Cmr5、Cmr6、CsbI、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、CsfI、Csf2、Csf3、Csf4、Cms1、C2c1、C2c2、C2c3或其同源物、直系同源物或經修飾的形式。
“megaTAL核酸酶/-切口酶”是指包含工程化的TALE DNA結合結構域的工程化的核酸酶和工程化的大範圍核酸酶或工程化的歸巢核酸內切酶。TALE DNA結合結構域可被設計用於結合基因組中核酸序列的幾乎任何基因座處的DNA,並且如果這種DNA結合結構域與工程化的大範圍核酸酶融合,則切割靶序列。例如,megaTAL核酸酶的說明性實例和TALE DNA結合結構域的設計由Boissel等人(MegaTALs:a rare-cleaving nuclease architecture for therapeutic genome engineering(2013),Nucleic Acids Research 42(4):2591-2601)和本文引用的參考文獻公開,所有這些文獻均藉由引用以其整體併入本文。megaTAL核酸酶視需要地包含一個或多個接頭和/或額外的功能結構域,例如C末端結構域(CTD)多肽、N末端結構域(NTD)多肽、展示5-3’核酸外切酶或3-5’核酸外切酶的末端加工酶促結構域、或其它非核酸酶結構域,例如解旋酶結構域。
轉錄激活子樣效應因子(TALE)核酸酶/-切口酶是限制性內切酶,其可被工程化以切割特定的DNA序列。轉錄激活子樣效應因子(TALE)可被工程化以與幾乎任何所需的DNA序列結合,因此當與DNA切割結構域結合時,DNA可在特定的位置被切割。
“TALE DNA結合結構域”是轉錄激活子樣效應因子(TALE或TAL-效應子)的DNA結合部分,其模擬植物轉錄激活子來操縱植物轉錄組。在一些實施方案中考慮的TALE DNA結合結構域是從頭工程化的或來自天然存在的TALE,包括但不限於來自野油菜黃單胞菌瘡痂致病變種(Xanthomonas campestris pv.vesicatoria)、加得那黃單胞菌(Xanthomonas gardneri)、半透明黃單胞菌(Xanthomonas translucens)、地毯草黃單胞菌(Xanthomonas axonopodis)、穿孔黃單胞菌(Xanthomonas perforans)、苜蓿葉斑病黃單胞菌(Xanthomonas alfalfa)、柑桔潰瘍病菌(Xanthomonas citri)、辣椒瘡痂病菌(Xanthomonas euvesicatoria)和水稻黃單胞菌(Xanthomonas oryzae)的AvrBs3、以及來自青枯雷爾氏菌(Ralstonia solanacearum)的brg11和hpx17。用於衍生和設計DNA結合結構域的TALE蛋白的說明性實例公開於美國專利第9,017,967號和其中引用的參考文獻中,所有這些文獻藉由引用以其整體併入本文。
“BurrH-核酸酶”是指具有核酸酶活性的融合蛋白,其包含模塊化鹼基/鹼基特異性核酸結合結構域(MBBBD)。這些結構域源自細菌胞內共生體發根伯克霍爾德菌(Burkholderia Rhizoxinica)的蛋白質或從海洋生物中鑑定的其它類似蛋白質。藉由將這些結合結構域的不同模塊組合在一起,模塊化鹼基/鹼基結合結構域可被工程化為具有與特定核酸序列的結合特性,諸如DNA結合結構域。因此,可將這種工程化的MBBBD與核酸酶催化結構域融合,以在基因組中核酸序列的幾乎任何位點切割DNA。在WO 2014/018601和US2015225465 A1以及其中引用的參考文獻中公開了BurrH-核酸酶和MBBBD設計的說明性實例,所有這些文獻藉由引用以其整體併入本文。
本揭露的相關方面提供了適合在細胞中產生CRISPR/Cas介導的雙鏈斷裂(DSB)的核酸分子,諸如載體。在一些實施方案中,載體包含編碼CRISPR/Cas蛋白例如Cas9的序列和引導核酸(Cas9單一引導RNA,或sgRNA)的序列(其與適合它們在細胞中表達的啟動子可操作地連接)以及諸如複製起點和選擇標記等其它載體成分。在一些實施方案中,細胞是本文所述的胚胎幹細胞或胚胎雜交幹細胞。
根據本揭露,藉由由核酸內切酶產生的雙鏈斷裂(DSB)促進同源重組。在一些實施方案中,核酸內切酶包含CRISPR/Cas9和一種或多種單一指導RNA(簡稱“sgRNA”或“gRNA”)。所屬技術領域具有通常知識者將能夠選擇引導RNA,其具有靶位於模板序列和靶序列的側翼,或位於靶位置上的靶向序列,如上文針對核酸內切酶位點所述。
在一些實施方案中,可藉由引入核酸分子(諸如一種或多種編碼CRISPR/Cas蛋白的載體或編碼序列)以及一種或多種sgRNA來引入酶。在一些實施方案中,編碼CRISPR/Cas蛋白的載體或編碼序列是CRISPR/Cas mRNA。在一些實施方案中,編碼CRISPR/Cas蛋白的載體或編碼序列是載體諸如質粒,其包含編碼CRISPR/Cas蛋白和gRNA的DNA序列。在一些實施方案中,CRISPR/Cas蛋白是Cas9。
在某些實施方案中,可將分離的CRISPR/Cas蛋白直接引入細胞(例如,受精卵或ES細胞,藉由顯微注射或電穿孔)。CRISPR/Cas蛋白可呈CRISPR/Cas核糖核蛋白的形式,其為CRISPR/Cas蛋白/gNA(引導核酸)複合物。或者CRISPR/Cas蛋白可以不含任何gNA,使得將CRISPR/Cas蛋白和一種或多種gNA共引入受精卵或ES細胞,以允許在細胞內原位形成CRISPR/Cas蛋白 /gNA複合物。在一些實施方案中,CRISPR/Cas蛋白和gNA由載體編碼,該載體藉由轉染、電穿孔或轉導引入細胞。在一些實施方案中,CRISPR/Cas蛋白是Cas9。
為了在本揭露的方法中用作核酸內切酶,CRISPR/Cas蛋白需要與gRNA形成功能複合物。
根據一些實施方案,使用多個gNA,每個gNA靶向特定的CRISPR/Cas切割位點。例如,可使用四種gNA,兩種具有對模板序列的任一側上的gNA靶序列特異的靶向序列,兩種具有對靶序列的任一側上的gNA靶序列特異的靶向序列。可選地,可使用三種gNA,一種具有對靶位置上的gNA靶序列特異的靶向序列,兩種具有對模板序列的任一側上的gNA靶序列特異的靶向序列。作為又一個實例,可使用兩種gNA,一種具有對與模板序列相鄰的gNA靶序列特異性的靶向序列,一種具有對與靶序列相鄰的gNA靶序列特異的靶向序列。
較佳地,不依賴於用於產生DSB的gNA的數量,在某些實施方案中,基於它們與模板和靶序列的5’和3’末端或靶位置的接近程度,獨立地選擇每種gNA。
可使用公知的原則或在線工具,基於用戶輸入(諸如靶基因組和序列類型)進行gNA的選擇和設計。一般來說,對於Cas9,gRNA是短的合成RNA,由Cas9結合所必需的“支架”序列和用戶定義的約20個核苷酸的“間隔區”或“靶向”序列組成,該間隔區或靶向序列定義了要被靶向序列結合或修飾的基因組靶標。為簡單起見,“gRNA靶向Cas9切割位點”是指gRNA的間隔區或靶向序列被設計成與基因組靶序列結合並在切割位點切割其的事實。
根據本揭露的引導核酸(包括gRNA和gDNA)的長度可以是10個核苷酸以上的任何多個核苷酸,包括10-50個核苷酸、10-40個、10-30個、10-20個、15-25個、16-24個、17-23個、18-22個、19-21個和20個核苷酸。
較佳地,靶向序列足夠獨特,使得理論上其與獨特的(與基因組的其餘部分相比)基因組靶序列結合。靶標應該緊鄰前間隔序列鄰近基序(或“PAM”序列)的上游(或5’)存在。PAM序列對於靶結合是絕對必要的,確切的序列取決於Cas9的種類。在最廣泛使用的化膿性鏈球菌Cas9中,PAM序列是5'-NGG-3'(“N”表示4種標準核苷酸中的任一種)。不同物種中其它Cas9的其它PAM序列是本領域已知的。參見下表4中列出的示例性PAM序列。
表4. PAM序列
Figure 111136154-A0202-12-0078-50
Cas9-gRNA複合物將結合具有PAM的任何靶基因組序列,但是如果在gRNA間隔區與靶基因組序列之間存在足夠的同源性,則Cas9僅切割靶基因組序列。Cas9介導的DNA切割的最終結果是靶基因組序列內位於PAM序列上游約3-4個核苷酸的切割位點的雙鏈斷裂(DSB)。
在一些實施方案中,雙鏈斷裂在靶序列上或兩側產生。例如,在其中靶染色體包含靶位置(諸如在模板序列將被插入其中而幾乎沒有或沒有靶染色體的缺失的位置)的那些實施方案中,那麼雙鏈斷裂在靶位置上產生。示例性靶位置包含本文所述的任何核酸酶的切割位點。作為另外的實例,在其中靶染色體包含靶序列(諸如將因模板序列的插入而被替換或刪除的序列)的那些實施方案中,那麼雙鏈斷裂在靶序列的任一側(即,靶序列的5’和3’)產生。
在某些實施方案中,任何選擇的核酸內切酶的切割位點(例如gNA靶向序列)在靶序列或位置的約10bp、約20bp、約30bp、約50bp、約70bp、約100bp、約200bp、約300bp、約400bp或約500bp內。
在某些實施方案中,任何選擇的核酸內切酶的切割位點(例如gNA靶向序列)在模板序列的約100bp、約200bp、約300bp、約400bp、約500bp、約600bp、約700bp、約800bp、約900bp、約1,000bp、約1,100bp、約1,200bp、約1,300bp、約1,400bp、約1,500bp、約1,600bp、約1,700bp、約1,800bp、約1,900bp或約2,000內。
在一些實施方案中,雙鏈斷裂藉由至少一種DNA修復途徑來修復,該DNA修復途徑選自由以下組成的組:切除、錯配修復(MMR)、核苷酸切除修復(NER)、鹼基切除修復(BER)、規範非同源末端連接(規範NHEJ)、替代非同源末端連接(ALT-NHEJ)、規範同源定向修復(規範HDR)、替代同源定向修復(ALT-HDR)、微同源性介導的末端連接(MMEJ)、平末端連接、合成依賴性微同源性介導的末端連接、單鏈退火(SSA)、霍利迪連接模型(Holliday junction model)或雙鏈斷裂修復(DSBR)、合成依賴性鏈退火(SDSA)、單鏈斷裂修復(SSBR)、跨損傷合成修復(TLS)和鏈間交聯修復(ICL)以及DNA/RNA加工。
工程化的染色體的回收
本揭露提供了回收本文所述的工程化的染色體,並將該工程化的染色體轉移至適於下游應用的細胞環境中的方法。在一些實施方案中,回收本文所述的工程化的染色體包括微細胞介導的染色體轉移(MMCT)。
微細胞介導的染色體轉移(MMCT)是將從供體細胞製備的微細胞與受體細胞融合的技術。藉由這種技術,供體細胞中的特定(外源)DNA(例如,染色體)可被轉移到受體細胞中。通常藉由用秋水仙胺處理供體細胞來製備微細胞,儘管也可以使用其它方法,並且該方法也被認為在本揭露的範圍內。
示例性MMCT方案包括在足以誘導微核化的條件下,在包含至少一種微核誘導劑的細胞培養基中培養包含工程化的染色體的細胞,從而產生微核細胞,並收集微核細胞。示例性微核誘導劑包括但不限於微管聚合抑制劑、微管解聚抑制劑和紡錘體檢查點抑制劑。本領域已知的示例性微核誘導劑包括但不限於秋水仙胺、秋水仙鹼、長春新鹼或其組合。例如,可用0.05μg/mL至0.25μg/mL處理細胞以誘導微核化。
微核細胞可使用本領域已知的任何合適的方法包括離心和過濾來回收。
因此,本揭露提供了包括回收工程化的染色體的方法,該方法包括在足以誘導微核化的條件下將細胞暴露於秋水仙胺,並使用離心收集微核細胞。
在一些實施方案中,工程化的染色體包含一種或多種標記,例如當用模板序列工程化染色體時引入的選擇標記或可檢測的標記。這些標記可用 於追蹤工程化的染色體,並在與上述微核細胞融合後選擇包含工程化的染色體的細胞。
因此,本揭露提供了產生胚胎幹細胞的方法,其包括:(a)將包含藉由本揭露的方法產生的工程化的染色體的微核細胞與ES細胞融合,其中(i)Es細胞包含與工程化的染色體同源的染色體,該同源染色體包含與能夠在ES細胞中表達螢光蛋白的啟動子可操作地連接的第一螢光蛋白,以及(ii)至少一個亞群的微核細胞包含工程化的染色體,並且其中該工程化的染色體包含不同於第一螢光蛋白的第二螢光蛋白,第二螢光蛋白與能夠在ES細胞中表達螢光蛋白的啟動子可操作地連接;(b)選擇表達第一和第二螢光蛋白兩者的ES細胞;(c)培養步驟(c)中選擇的ES細胞,直至至少一個亞群的ES細胞丟失同源染色體;以及(d)選擇表達第二螢光蛋白但不表達第一種螢光蛋白的ES細胞。在一些實施方案中,ES細胞是小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞或猴ES細胞。在一些實施方案中,ES細胞是小鼠ES細胞。在一些實施方案中,ES細胞是大鼠ES細胞。在一些實施方案中,ES細胞是猴ES細胞。
雖然上文所述的產生胚胎幹細胞的方法使用兩種不同的螢光蛋白作為標記,但所屬技術領域具有通常知識者將會理解,只要工程化的染色體和同源染色體上的標記不同,其它標記也可以是合適的。例如,可使用本文所述的兩種不同的選擇標記,以及兩種不同的表面分子,該表面分子可被標記的抗體識別,或者綴合於選擇標記諸如金顆粒,這允許藉由離心進行選擇。作為另外的實例,除了作為標記的螢光蛋白之外,嘌呤黴素和潮黴素/胸苷激酶(TK)標記也可用於該步驟中的陽性-陰性選擇。當胸苷激酶在特定的胸苷類似物存在的情況下表達時,這些類似物被轉化為殺死細胞的毒性化合物。例如,將嘌呤黴素抗性標 記和潮黴素/TK標記敲入兩條染色體的相同位置,並藉由在嘌呤黴素和潮黴素中培養來選擇雙陽性單株。培養幾天後,使用嘌呤黴素和胸苷激酶來選擇已丟失了一個染色體拷貝的株,該染色體攜帶有潮黴素/TK標記。
在一些實施方案中,產生胚胎幹細胞的方法包括(a)將包含藉由本揭露的方法產生的工程化的染色體的微核細胞與ES細胞融合,其中(i)Es細胞包含與工程化的染色體同源的染色體,該同源染色體包含第一標記,以及(ii)至少一個亞群的微核細胞包含工程化的染色體,並且其中工程化的染色體包含不同於第一標記的第二標記;(b)選擇表達第一和第二標記兩者的ES細胞;(c)培養步驟(c)中選擇的ES細胞,直至至少一個亞群的ES細胞丟失同源染色體;以及(d)選擇表達第二標記但不表達第一標記的ES細胞。
可使用任何合適的方法將微核細胞與ES細胞融合。融合方法尤其包括電融合、病毒誘導融合和化學誘導融合,例如藉由向細胞中加入PEG1000。
考慮到藉由上述回收工程化的染色體的方法產生的三體性的固有不穩定性,培養藉由與微核細胞融合產生的細胞至少5天、至少7天、至少10天或至少14天的時間可足以獲得已經丟失了對應於工程化的染色體的同源染色體的細胞。或者,可使用採用負選擇標記例如位於同源染色體上的標記的選擇方案,當該標記暴露於選擇方案時,其表達殺死細胞。在一些實施方案中,在步驟(b)和(d)中選擇細胞包括螢光激活細胞分選(FACS)。例如,細胞可以是FAC分選的細胞,其表達用於標記工程化的染色體的第二螢光蛋白,但不表達用於標記同源染色體的第一螢光蛋白。
細胞
本發明提供了用於本揭露的方法的細胞。在一些實施方案中,細胞包括胚胎幹(ES)細胞、雜交胚胎幹(EHS)細胞或受精卵細胞。本揭露還提供了包含藉由本揭露的方法產生的工程化的染色體的細胞。本揭露提供了分離、融合和培養本文所述細胞的方法。
因此,本揭露提供了融合細胞以產生本文所述的EHS細胞的方法。藉由化學、生物學和物理手段,細胞融合已經成為可能。這些技術的實例分別包括聚乙二醇(PEG)融合、融合型病毒融合(fusagenic virus fusion)和電融合。
用於本揭露的方法中的ES細胞可從多種來源獲得,並且可以是原代分離的ES細胞或者人工或天然產生的ES細胞系。還可在細胞融合以產生本揭露的EHS細胞之前或之後,或者在本文所述方法之前或之後,首先對ES細胞進行遺傳修飾,以引入有用的性狀,諸如一種或多種標記的表達。
一種常用的技術是使用例如PEG的化學融合。這項技術在產生融合瘤方面特別成功。藉由將細胞暴露在強電場中非常短的時間,可以提高融合概率。在暴露於電場之前,可以使用化學劑在懸浮液中實現所需類型的細胞對(即兩種類型的EH細胞)的連合(linkage)和接近。
細胞的電融合包括將細胞緊密地聚集在一起,並將它們暴露在交變電場中。在適當的條件下,細胞被推到一起,細胞膜融合,然後形成融合細胞或雜交細胞。細胞的電融合和用於進行電融合的裝置描述於例如美國專利第4,441,972號、第4,578,168號和第5,283,194號、國際專利申請第PCT/AU92/00473號中。通常,該方法包括選擇細胞並將它們放置在採用來用作細胞融合室的充滿流體的室中。單個細胞對可參與融合過程,即單細胞融合,或者大量融合可在兩個群體中發生,每個群體包含兩個或多個細胞。大量融合(Bulk fusion)可以是其 中涉及約2至約1000個細胞的小型大量融合(mini-bulk fusion),或其中涉及超過約1000個細胞的大型大量融合(macro-bulk fusion)。可藉由化學手段(諸如在PEG存在的情況下)、生物手段(諸如在融合病毒存在的情況下)或藉由電手段(即電融合)來促進融合。融合也可包括這些技術的組合。還可用細胞因子諸如白細胞介素3(IL-3)處理細胞以促進融合。
細胞融合後,獲得融合的細胞(融合細胞(fusate cell))或另外地稱為雜合細胞,其包含至少兩個細胞的細胞核,該細胞核被包裹在來自參與融合的細胞的融合脂質雙層中。細胞核融合,產生染色體數目異常的雜交細胞,其可能是四倍體或含有更少或更多的染色體。雜交細胞在適當的培養條件下具有分裂和增殖的能力。
在一些實施方案中,藉由電融合產生EHS細胞。例如,人與小鼠、人與大鼠或人與猴的ES細胞可藉由電融合來融合。在一些實施方案中,來自兩個不同物種的兩種EHS細胞經歷電融合以產生EHS細胞,該物種選自由以下組成的組:人、小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞和猴。
通常,一旦發生融合,在合適的富培養基中回收所得的雜交細胞,然後將其在培養中擴增用於本揭露的方法。恢復培養基應包含允許在融合應激後細胞融合物恢復的因子。這種補充劑可包含高百分比(例如20%)的胎牛血清。
藉由細胞融合產生的雜交細胞可包含獨特的細胞表面標記,其可用於選擇這些細胞、監測融合事件。
在一些實施方案中,本揭露的細胞包含一種或多種遺傳修飾,諸如本文所述的標記的引入。遺傳修飾可藉由本領域已知的任何合適的方法進行。例如,可藉由轉染、轉導、電穿孔、脂轉染等來修飾細胞。
本文所用的轉染是指將核酸(包括裸核酸或純化的核酸或攜帶特定核酸的載體)引入細胞,特別是真核細胞,包括哺乳動物細胞。在本揭露的說明書中可以使用任何已知的轉染方法。這些方法中的一些包括增強生物膜的通透性以將核酸帶入細胞。突出的實例是電穿孔、微孔化(microporation)和脂轉染。該方法可單獨使用,或者可由聲能、電磁能和熱能、化學滲透增強劑、壓力等支持,用於選擇性地提高核酸進入宿主細胞的流通率(flux rate)。其它轉染方法也在本揭露的範圍內,諸如基於載體的轉染,包括脂轉染或基於病毒(也稱為轉導)和化學的轉染。然而,可使用任何將核酸帶入細胞內的方法。瞬時轉染的細胞將在短時間內攜帶/表達轉染的RNA/DNA,並且不會將其傳遞下去。穩定轉染的細胞將持續表達轉染的DNA並將其傳遞下去:外源核酸已整合到細胞的基因組中。
許多病毒已被用作基因轉移載體或作為製備基因轉移載體的基礎,包括乳多空病毒、腺病毒、痘苗病毒、腺相關病毒、慢病毒、辛德比斯和塞姆利基森林病毒以及禽源和人源的逆轉錄病毒。
基因轉移的化學技術(包括磷酸鈣共沉澱)、機械技術(例如顯微注射)、藉由脂質體的膜融合介導的轉移和直接DNA攝取以及受體介導的DNA轉移。病毒介導的基因轉移可與使用脂質體遞送的直接體內基因轉移相結合,允許將病毒載體導向特定細胞。或者,可將逆轉錄病毒載體生產細胞系注射到特定組織中。生產細胞的注射將提供載體顆粒的連續來源。
本揭露提供了培養本揭露的細胞的方法。在本文所述的實施方案中設想了許多幹細胞培養基培養或生長環境,包括成分明確的培養基、條件培養基、無飼養細胞培養基、無血清培養基等。如本文中所用,術語其“生長環境”等同物是未分化或分化的幹細胞(例如,胚胎幹細胞)將在其中進行體外增殖的環境。環境的特徵包括在其中培養細胞的培養基和支持結構(諸如固體表面上的基質)(如果存在的話)。培養或維持細胞的方法也描述於PCT/US2007/062755、美國申請號11/993,399和美國申請號11/875,057中。
基礎細胞培養基在本領域中是已知的,並且是可商購獲得的。示例性基礎細胞培養基包括但不限於基於DMEM、CMRL或RPMI的培養基。
本揭露的細胞培養方法中使用的細胞培養基可含血清,或者不含血清。細胞培養基還可包含一種或多種補充劑或本領域已知的其它培養基組分,諸如B27補充劑、胰島素、葡萄糖、諸如EGF和FGF等生長因子以及細胞因子。
術語“飼養細胞”是指在體外生長並向培養基中分泌至少一種因子的細胞培養物,其可用於在培養物中支持另一種目標細胞的生長。如本文中所用,“飼養細胞層”可與術語“飼養細胞”互換使用飼養細胞可包含單層,其中飼養細胞在生長在彼此頂部之前以完整的層覆蓋培養皿的表面,或者可包含成簇的細胞。在較佳實施方案中,飼養細胞包含貼壁單層。
類似地,其中在不使用飼養細胞的情況下,在確定的條件或培養系統中生長ES或EHS細胞培養物或聚集體懸浮培養物(aggregate suspension culture)的實施方案是“無飼養細胞的”。美國專利第6,800,480號中也描述了無飼養細胞方法。在一些實施方案中,可將ES或ESH細胞在二維或三維環境中培 養。在美國專利第6,800,480號中,藉由培養成纖維細胞,原位裂解成纖維細胞,然後洗滌裂解後剩餘的部分來製備細胞外基質。可選地,在美國專利第6,800,480號中,細胞外基質也可從分離的基質組分或選自以下物質的組分的組合來製備:膠原蛋白、胎盤基質、纖連蛋白、層黏連蛋白、分區蛋白(merosin)、生腱蛋白、硫酸肝素、硫酸軟骨素、硫酸皮膚素、聚集蛋白聚糖、雙糖鏈蛋白聚糖(biglycan)、凝血酶敏感蛋白、玻連蛋白和核心蛋白聚糖。
在一些實施方案中,培養方法或培養系統不含動物來源的產品。在其它實施方案中,培養方法是無異源物(xeno-free)的。
本揭露考慮將包含本文所述工程化的染色體的ES細胞分化成不同的細胞類型,以用於各種下游應用。可使用多種策略在體外誘導ES細胞分化成多種細胞類型,通常涉及用外源生物化學組成物補充細胞培養基,該組成物指導重演內源發育細胞信號並指導細胞特異性分化。在Vazin和Freed,Restor Neurol Neurosci(2010)28(4):589-603(其內容藉由引用併入本文)中論述了分化ES細胞的策略。
例如,可在某些補充生長因子存在的情況下進一步培養ES或EHS細胞群,以獲得已經或將發育成不同細胞譜系,或者可被選擇性逆轉以能夠發育成不同細胞譜系的細胞群。術語“補充生長因子”以其最廣泛的含義使用,是指有效促進ES細胞生長、維持細胞存活、刺激細胞分化和/或刺激細胞分化逆轉的物質。另外,補充生長因子可以是由飼養細胞分泌到其培養基中的物質。這些物質包括但不限於細胞因子、趨化因子、小分子、中和抗體和蛋白質。生長因子也可包括細胞間信號傳導多肽,其控制細胞的發育和維持以及組織的形式和功能。在較佳實施方案中,補充生長因子選自由以下組成的組:鋼細胞因子 (SCF)、制瘤素M(OSM)、睫狀神經營養因子(CNTF)、與可溶性白細胞介素-6受體(IL-6R)組合的白細胞介素-6(IL-6)、成纖維細胞生長因子(FGF)、骨形態發生蛋白(BMP)、腫瘤壞死因子(TNF)和粒細胞巨噬細胞集落刺激因子(GM-CSF)。
幹細胞向各種多能細胞和/或分化細胞的進展可藉由確定特定細胞類型的特徵性基因或基因標記相較於第二基因或對照基因(例如,管家基因)的表達的相對表達來監測。在一些過程中,藉由檢測標記的存在或不存在來確定某些標記的表達。可選地,某些標記的表達可藉由測量標記在細胞培養物或細胞群的細胞中存在的水平來確定。在此類過程中,標記表達的測量可以是定性的或定量的。定量由標記基因產生的標記的表達的一種方法是藉由使用定量PCR(Q-PCR)。進行Q-PCR的方法是本領域公知的。本領域已知的其它方法也可用於定量標記基因表達。例如,標記基因產物的表達可藉由使用對目標標記基因產物特異的抗體來檢測。
基因轉殖動物
本揭露提供了包含本揭露的工程化的染色體的基因轉殖動物(例如基因轉殖小鼠)及其製備方法。
從包含本文所述的工程化的染色體的ES細胞或受精卵細胞製備基因轉殖動物的合適方法的選擇將取決於動物,並且是所屬技術領域具有通常知識者已知的。
在示例性方法中,將包含工程化的染色體的ES細胞整合到胚泡發育階段的胚胎中,然後將其植入懷孕或假孕的雌性中並足月分娩。結果是嵌合體動物。如果ES細胞產生生殖細胞,則動物的後代將是完全基因轉殖的,並攜帶工程化的染色體。
在一些實施方案中,基因轉殖動物是小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞或猴。
在一些實施方案中,基因轉殖動物是小鼠。在一些實施方案中,產生基因轉殖小鼠包括將ES細胞注射到二倍體胚泡中,從該ES細胞核轉移到去核小鼠胚胎,或四倍體胚胎互補。
在一些實施方案中,該方法還包括將ES細胞或受精卵轉移至假孕雌性體內。在小鼠中,藉由將處於自然發情期的6-8週齡雌性小鼠與輸精管切除的雄性小鼠交配,為假孕雌性小鼠做好準備。可從培養物中取出當天處理轉移到假孕雌性的受精卵,並置於預溫熱的合適培養基(諸如M2培養基)中,並且藉由輸卵管轉移至交配後0.5天的假孕雌性(例如9-11週齡)中。
一旦使用本揭露的方法將工程化的染色體插入宿主哺乳動物,就可在所得的基因轉殖動物(例如,小鼠)或其後代中驗證工程化的染色體的存在。這種驗證通常包括對可能攜帶工程化的染色體的動物的一次或多次基因分型、連接序列的聚合酶鏈式反應擴增、某些DNA片段(例如,模板序列)的直接測序和遺傳作圖。此類技術在本領域是公知的。
本揭露提供了包含本揭露的工程化的染色體的基因轉殖小鼠。在一些實施方案中,基因轉殖小鼠包含一種或多種已被人源化的基因,例如表1和表2中描述的基因中的任一種。在一些實施方案中,動物模型包含不止一種人源化基因(例如1個、2個、5個、10個、20個、50個、100個或更多個基因)。在一些實施方案中,基因轉殖小鼠包含已被人源化的免疫球蛋白基因的全部或部分。在一些實施方案中,基因轉殖小鼠包含已被人源化的TCR亞單位基因的全部或部分。
在本揭露的基因轉殖小鼠的一些實施方案中,小鼠12號染色體包含替代小鼠Igh可變區的人IGH可變區的序列。在一些實施方案中,小鼠Igh可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。在一些實施方案中,人IGH可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。在一些實施方案中,工程化的染色體是小鼠6號染色體,其包含替代小鼠Igk可變區的人IGK可變區序列。在一些實施方案中,小鼠Igk可變區序列包含編碼小鼠Vk和Jk1-5基因區段的序列和間插非編碼序列。在一些實施方案中,模板序列包含人IGK可變區序列。在一些實施方案中,人IGK可變區序列包含編碼人Vk和Jk1-5基因區段的序列和間插非編碼序列。
應用
包含本文所述的工程化的染色體的細胞和基因轉殖動物的下游應用被認為在本揭露的範圍內。
示例性下游應用包括使用針對一種或多種人基因人源化的動物模型(例如,小鼠、大鼠或猴)對人疾病和病症的動物模型進行基礎和應用研究。表1和表2中描述了示例性但非限制性的基因,可藉由用人同源物替換模型動物同源物對該基因進行人源化。與染色體異常(易位、倒位等)相關的人疾病的動物模型也可使用本文所述的方法來製備。任何需要對大於300kB的片段進行大規模染色體重排的動物模型,例如杜氏肉營養不良症(DMD)人源化小鼠疾病模型,或者需要大規模插入或替換多達數百個基因的陣列的動物模型都被認為在本揭露的範圍內。
在一些實施方案(例如其中動物的Igh可變區已被人源化的那些實施方案)中,本揭露的基因轉殖動物可用於產生人源化抗體。例如,此類動物 可產生具有人抗體或人源化抗體的特定B細胞。在一些實施方案(例如其中動物的IgkIgl可變區已被人源化的那些實施方案)中,本揭露的基因轉殖動物可用於產生人源化抗體。
在一些實施方案(例如其中包含抗體或其抗原片段的模板序列已被插入靶染色體的那些實施方案)中,本揭露的基因轉殖動物可用於產生抗體或抗原結合片段。例如,基因轉殖動物可用於產生單鏈可變片段(scFv)、奈米抗體、雙特異性抗體和多特異性抗體等。此類抗體可用於研究或治療目的。
示例性下游應用包括其中工程化的染色體未被整合到基因轉殖動物中的應用。相反,作為一個實例,包含工程化的染色體的ES細胞分化成另一種細胞類型,其可用於研究或治療目的。
試劑盒
本揭露提供了包含本文所述核酸分子的試劑盒。在一些實施方案中,核酸分子是載體,諸如質粒。
在本揭露的試劑盒的一些實施方案中,試劑盒包括用於本文所述方法的細胞,例如已被冷凍保存的EHS細胞。在一些實施方案中,試劑盒包括核酸分子和視需要的細胞的使用說明。
實施例
實施例1:胚胎雜交幹(EHS)細胞的建立
這項研究的總體目標是獲得針對IghIgk基因的可變結構域人源化的小鼠。人和小鼠在抗體基因的排列和表達方面表現出高度的相似性,並且重鏈的基因組組織在人和小鼠中也相似。因此,小鼠IghIgk基因可變結構域 的人源化形式可藉由將含有所有VH、DH和JH基因區段的約3MB小鼠基因組序列替換為含有等同人基因片段的大約1MB的連續人基因組序列來獲得(圖1)。
產生人源化小鼠Igh基因的第一步是藉由將小鼠胚胎幹(ES)細胞與人ES細胞融合以產生具有小鼠和人Igh基因的細胞,來產生小鼠胚胎雜交幹(EHS)細胞。
根據電融合儀器製造商提供的標準方法,藉由電融合將在PGK啟動子控制下表達新黴素抗性基因的工程化的小鼠細胞和與在CAG啟動子控制下表達mCherry標記的工程化的人ES細胞融合。將雜交EHS細胞在含有G418的小鼠ES細胞培養基中培養7天,根據mCherry的表達水平藉由螢光激活細胞分選術(FACS)分選存活的細胞(圖2)。將陽性細胞在含有G418的小鼠ES細胞培養基中連續培養,並將單細胞株分離到單獨的孔中用於生長。接下來,提取每個單細胞株的基因組DNA用於基因分型。具體而言,將人免疫球蛋白重鏈(IGH)的V、D、J區的三對引子(圖3A)用於進行PCR以確認EHS株中存在靶向序列(圖3B)。只有具有所有三個所需區域的株被保留用於進一步的實驗。
實施例2:工程化人源化染色體
2.1.藉由HDR介導的染色體重排(HMCR)建立EHC
為了獲得針對其Igh基因的可變結構域人源化的小鼠胚胎雜交幹(EHS)細胞,藉由HDR介導的染色體重排(HMCR;圖4A)用人4號染色體上的人IGH基因的約1MB可變結構域替換小鼠12號染色體上的Igh基因的約3MB可變結構域。
兩種質粒被設計成介導HMCR過程,並示於圖4A中。5’HMCR質粒被設計來介導用其人對應物替換小鼠Igh基因的5’末端,而3’HMCR質粒 介導用其人對應物替換小鼠Igh基因的3’末端。5’HMCR質粒包含與小鼠Igh基因5’末端同源的5’臂、與人IGH基因5’同源的3’臂和插入兩個同源臂之間的CMV-EGFP-polyA-PGK-嘌呤黴素-poly的盒。類似地,3’HMCR質粒包含與人IGH可變基因座的3’同源的5’臂、與小鼠Igh可變基因座的3’同源的3’臂和插入在兩個同源臂之間的PGK-潮黴素-polyA盒(見圖4A)。同源臂的長度介於600bp與1000bp之間。同時,還設計了四種質粒,該質粒含有Cas9和靶向小鼠和人中的Igh可變結構域的5’和3’末端的sgRNA(見圖4A,表7中提供了sgRNA靶向序列)。使用標準方法將這六種質粒作為環狀質粒共轉染到實施例1中獲得的EHS細胞中,並將所得細胞在含有嘌呤黴素和潮黴素的小鼠ES細胞培養基中培養7天。挑選存活的GFP陽性單一株用於進一步培養。
進行基因分型以鑑定具有成功HMCR的所需單一株。為了進行基因分型,如圖5A所示,設計了四對PCR引子。對於第一對引子,正向引子設計在小鼠Igh5’HMCR質粒的5’同源臂的上游,反向引子位於CMV啟動子區域內(圖5A)。對於第二對引子,正向引子在5’HMCR質粒的嘌呤黴素基因內,反向引子在人IGH的5’同源臂的下游,在人IGH序列內(圖5A)。對於第三對引子,正向引子位於人IGH可變區3’的同源臂的上游,反向引子位於3’HMCR質粒的PGK啟動子區中(圖5A)。對於最後一對引子,正向引子位於3’HMCR質粒的潮黴素基因中,反向引子位於3’HMCR質粒的3’同源序列的下游,在小鼠Igh可變結構域內(圖5A)。用每種引子對對每個株進行PCR擴增,並且只有對所有四個基因分型測試都顯示陽性PCR產物的株被保留用於進一步的實驗。在該步驟的196個分離的株中,6個被鑑定為對於所有4個PCR擴增子呈陽性(圖5B)。
為了促進人IGH基因在具有成功HMCR的EHS細胞中的表達,藉由同源定向修復(HDR)(圖4A)將3’選擇標記從陽性株的基因組中刪除,儘管也可以使用非同源末端連接(NHEJ)、微同源性介導的末端連接(MMEJ)和同源介導的末端連接(HMEJ)方法。上述方法成功地建立了工程化的人源化染色體(EHC),該染色體在EHS細胞中藉由HMCR用等價的人區域替換了小鼠12號染色體上的小鼠Igh基因的包含VH、DH和JH1-6基因區段的可變結構域。
下面的表5和表6提供了用於介導HMCR過程的質粒序列。
表5.用於利用相應的人區域對小鼠Igh可變區進行HMCR介導的替換的示例性5’質粒序列
Figure 111136154-A0202-12-0094-16
Figure 111136154-A0202-12-0095-17
Figure 111136154-A0202-12-0096-18
表6.用於利用相應的人區域對小鼠Igh可變區進行HMCR介導的替換的示例性3’質粒序列
Figure 111136154-A0202-12-0097-20
Figure 111136154-A0202-12-0098-21
Figure 111136154-A0202-12-0099-22
表7. sgRNA序列
Figure 111136154-A0202-12-0099-23
在表7中,提供了具有位於sgRNA靶向序列的非靶鏈3’的PAM序列(NGG)的sgRNA序列。不具有PAM的相應sgRNA靶向序列以SEQ ID NOS:14-17提供。
2.2.藉由CRE-Loxp介導的染色體重排(CMCR)建立EHC
為了獲得針對它們的Igh基因的可變結構域人源化的小鼠EHS細胞,藉由CRE-Loxp介導的染色體重排(CMCR;圖4B)用人14號染色體上的IGH基因的約1Mb可變結構域替換小鼠12號染色體上的Igh基因的約3MB可變結構域。設計了四種質粒來介導CMCR過程。小鼠Igh5’(pCMV-GFP-BGH PolyA-Loxp)和3’(BGH polyA-Loxp-511-潮黴素-BGH polyA-PGK-BSD-BGH PolyA)質粒被設計成分別插入小鼠Igh可變基因座的5’和3’末端。同時,人IGH 5’(BGH polyA-Loxp-Puro-BGH PolyA-PGK-新黴素-BGH PolyA)和3’(pCMV-BGP-BGH PolyA-PGK-Loxp-511)質粒被設計成分別插入人IGH可變基因座的5’ 和3’末端(圖5)。將轉染後的EHS細胞在含有BSD和新黴素的小鼠ES細胞培養基中培養7天。挑選存活的GFP-和BFP-雙陽性細胞用於進一步培養。進行基因分型以鑑定成功整合上述質粒的所需單個株。將Cre轉染到成功整合的EHS細胞中以用於CMCR,並且成功重排的細胞可在含有嘌呤黴素和潮黴素的培養基中存活。然後將存活的細胞放在袋中進行基因分型。為了促進人IGH基因在具有成功的CMCR的EHS細胞中的表達,接著從基因組中刪除3’選擇標記(圖5)。按照上述過程,藉由在EHS細胞中進行CMCR,成功地建立了工程化的人源化染色體(EHC;針對它們的可變結構域對小鼠12號染色體的Igh基因進行了人源化)。
實施例3:藉由微細胞介導的染色體轉移在小鼠胚胎幹細胞中進行染色體置換
如實施例1和2該獲得了具有工程化的人源化染色體(EHC)的EHS細胞,然後藉由微細胞介導的染色體轉移(MMCT)將EHC轉移至小鼠ES細胞,以建立針對Igh基因可變結構域人源化的小鼠ES細胞。
將攜帶EHC的EHS細胞在37℃下用0.2μg/ml秋水仙胺處理48小時。延長的有絲分裂停滯誘導微細胞的形成,藉由離心收集該微細胞(圖6)。同時,獲得在12號染色體上表達mCherry螢光標記的小鼠ES細胞(圖6)。是藉由將CMV-mCherry-polyA的盒插入小鼠12號染色體的一個拷貝中獲得了這些細胞。
接下來,藉由電融合將微細胞與小鼠ES細胞雜交,並且藉由FACS使用GFP+和mCherry+標記對所得細胞進行分選,以獲得為GFP+和mCherry+的小鼠ES細胞。GFP+表明EHC被成功轉移到小鼠ES細胞中,而 mCherry+標記表明細胞也攜帶mCherry+12號染色體。將陽性細胞在小鼠ES細胞培養基中連續培養2週,藉由FACS分選mCherry-和GFP+小鼠ES細胞(即丟失了標記有mCherry+的額外12號染色體的細胞),並培養7天。將單個株分離到單獨的孔中用於生長和核型分析,保留具有正確核型的株。結果是針對其Igh基因的可變區而人源化的小鼠ES細胞。
實施例4:產生Igh人源化小鼠
根據標準程序,將實施例3中獲得的針對其Igh基因可變區人源化的小鼠ES細胞注射入B6D2F1(C57BL/6 X DBA2)小鼠品系的胚泡中。或者,核移植或四倍體胚胎互補也可用於產生人源化小鼠。
在交配後2.5天(dpc),將注射的胚泡轉移到假孕ICR雌性的子宮中。藉由螢光立體顯微鏡下GFP的表達水平鑑定Igh人源化小鼠,並進一步分析GFP+小鼠。
接下來,設計了一系列PCR實驗來驗證Igh人源化小鼠。第一組PCR實驗被設計成驗證人IGH可變區的完整性。設計了針對人IGH可變區的不同區域的五對引子(見圖7A,箭頭表示PCR引子1-10)。Igh人源化小鼠顯示所有五個PCR引子對的陽性PCR產物(圖7B)。我們還設計了人IGH可變區上游和下游的引子(圖7A),對於我們的Igh人源化小鼠的任一個PCR實驗都未觀察到產物,而HEK293T顯示PCR產物的正確條帶(圖7B)。
Igh人源化小鼠的尾部分離成纖維細胞,並將其用於進行螢光原位雜交(FISH)。FISH結果顯示Igh人源化小鼠的12號染色體含有人14號染色體的片段(圖8A),表明人IGH基因的可變結構域成功地原位插入小鼠的12號染色體。
還進行了G-顯帶核型分析,以排除任何異常染色體(圖8B)。
還提取了Igh人源化小鼠的基因組DNA,並對其進行全基因組測序(WGS)分析。將WGS序列映射到包含所有小鼠染色體和人14號染色體的參考基因組上。人IGH基因的所有可變結構域(VH、DH和JH基因區段)都被全基因組序列讀數覆蓋。另外,在其它基因組區域中未發現脫靶編輯(圖9A-圖9B)。
實施例5:生產Igk人源化小鼠
應用MASIRT獲得針對其Igk基因可變結構域人源化的小鼠(圖10)。使用與上文針對Igh基因所述的方法相似的方法,我們也獲得了Igk人源化小鼠。為了驗證Igk人源化小鼠,我們首先進行PCR實驗來驗證人IGK可變區的完整性。在人IGK可變區的不同位基因座上設計了五對引子(圖11A),獲得的Igk人源化小鼠在所有五次實驗中都顯示出陽性PCR產物(圖11B)。還設計了人IGK可變區上游和下游的引子(圖11A),對於獲得的Igk人源化小鼠的任一PCR實驗都沒有觀察到產物,而HEK293T顯示PCR產物的正確條帶(圖11B)。最後,還提取了Igk人源化小鼠的基因組DNA並進行全基因組測序(WGS)分析。
表8. 用於利用相應的人區域對小鼠Igk可變區進行HMCR介導的替換的示例性5’質粒序列
Figure 111136154-A0202-12-0102-24
Figure 111136154-A0202-12-0103-25
Figure 111136154-A0202-12-0104-26
Figure 111136154-A0202-12-0105-27
表9.用於利用相應的人區域對小鼠Igk可變區進行HMCR介導的替換的示例性3’質粒序列
Figure 111136154-A0202-12-0105-28
Figure 111136154-A0202-12-0106-29
Figure 111136154-A0202-12-0107-30
表10. 用於利用相應的人區域替換小鼠Igk可變區的sgRNA序列
Figure 111136154-A0202-12-0107-31
在表10中,提供了具有位於sgRNA靶向序列的非靶鏈3’上的PAM序列(NGG)的sgRNA序列。不具有PAM的相應sgRNA靶向序列以SEQ ID NOS:28-31提供。
繪製了包含小鼠的所有染色體和人的2號染色體的參考基因組的全基因組序列。這表明人IGK基因的所有可變結構域(VH和JH基因區段)都被全基因組序列覆蓋。此外,在其它基因組區域沒有發現脫靶編輯(圖12)。
TW202332770A_111136154_SEQL.xml

Claims (105)

  1. 一種產生工程化的染色體的方法,其包括:
    a.提供包含含有靶序列的靶染色體和含有模板序列的模板染色體的細胞;
    b.將該細胞與以下序列接觸:
    i.第一核酸分子,其從5’至3’包含5’同源臂、至少一個第一標記和3’同源臂,該5’同源臂含有該靶序列5’末端上游的核苷酸序列,該3’同源臂含有該模板序列5’末端上游的核苷酸序列;和
    ii.第二核酸分子,其從5’至3’包含5’同源臂、至少一個第二標記和3’同源臂,該5’同源臂含有該靶序列3’末端下游的核苷酸序列,該3’同源臂含有該模板序列3’末端下游的核苷酸序列;
    c.在該靶序列處或其兩側,以及在該模板序列的5’和3’末端產生雙鏈斷裂,從而將該模板序列和該第一和第二標記插入該靶染色體中;以及
    d.選擇表達該第一和第二標記的一個或多個細胞。
  2. 如請求項1所述的方法,其中在插入該模板序列後,該第一標記位於該模板序列的5’末端,並且該第二標記位於該模板序列的3’末端。
  3. 如請求項1或2所述的方法,其中該第一和第二核酸分子的該5’和3’同源臂的長度介於約20bp與2,000bp之間、介於約50bp與1,500bp之間、介於約100bp與1,400bp之間、介於約150bp與1,300bp之間、介於約200bp與1,200bp之間、介於約300bp與1,100bp之間、介於約400bp與1,000bp、或介於約500bp與900bp之間或介於約600bp與800bp之間。
  4. 如請求項1或2所述的方法,其中該第一和第二核酸分子的該5’和3’同源臂的長度介於約400bp與1,500bp之間、介於約500和1,300bp之間或介於約600和1,000bp之間。
  5. 如請求項1或2所述的方法,其中該第一和第二核酸分子的該5’和3’同源臂的長度介於約600bp與1,000bp之間。
  6. 如請求項1至5中任一項所述的方法,其中該模板序列的長度為至少25千鹼基對(KB)、至少50KB、至少約100KB、至少約200KB、至少約400KB、至少約500KB、至少約600KB、至少約700KB、至少約800KB、至少約900KB、至少約1兆鹼基對(MB)、至少約2MB、至少約3MB、至少約4MB、至少約5MB、至少約6MB、至少約7MB、至少約8MB、至少約9MB、至少約10MB、至少約15MB、至少約20MB、至少約25MB、至少約30MB、至少約40MB、至少約50MB、至少約60MB、至少約70MB、至少約80MB、至少約90MB、至少約100MB、至少約120MB、至少約140MB、至少約 160MB、至少約180MB、至少約200MB、至少約220MB或至少250MB。
  7. 如請求項1至5中任一項所述的方法,其中該模板序列的長度介於50KB與250MB之間、介於50KB與100MB之間、介於50KB與50MB之間、介於50KB與20MB之間、介於50KB與10MB之間、介於50KB與5MB之間、介於50KB與3MB之間、介於50KB與2MB之間、介於50KB與1MB之間、介於100KB與200MB之間、介於100KB與100MB之間、介於100KB與50MB之間、介於100KB與20MB之間、介於100KB與10MB之間、介於100KB與5MB之間、介於100KB與3MB之間、介於100KB與2MB之間、介於100KB與1MB之間、介於100KB與500KB之間、介於200KB與100MB之間、介於200KB與50MB之間、介於200KB與20MB之間、介於200KB與10MB之間、介於200KB與5MB之間、介於200KB與3MB之間、介於200KB與2MB之間、介於200KB與1MB之間、介於200KB與500KB之間、介於500KB與100MB之間、介於500KB與50MB之間、介於500KB與20MB之間、介於500KB與10MB之間、介於500KB與5MB之間、介於500KB與3MB之間、介於500KB與2MB之間、介於500KB與1MB之間、介於1MB與100MB之間、介於1MB與50MB之間、介於1MB與20MB之間、介於1MB與10MB之間、介於1MB與5MB之間、介於1MB與3MB之間、介於1MB與2MB之間、介於3MB與100MB之間、 介於3MB與50MB之間、介於3MB與20MB之間、介於3MB與10MB之間、介於3MB與5MB之間、介於5MB與100MB之間、介於5MB與50MB之間、介於5MB與20MB之間、介於5MB與10MB之間、介於10MB與100MB之間、介於10MB與50MB之間或介於10MB與20MB之間。
  8. 如請求項1至5中任一項所述的方法,其中該模板序列的長度介於200KB與50MB之間、介於1MB與20MB之間、介於1MB與10MB之間、介於1MB與5MB之間、介於1MB與3MB之間、介於3MB與20MB之間、介於3MB與10MB之間、介於3MB與7MB之間或介於3MB與5MB之間。
  9. 如請求項1至8中任一項所述的方法,其中在(c)中產生該雙鏈斷裂包括使用CRISPR/Cas核酸內切酶和一種或多種引導核酸(gNA)、一種或多種鋅指核酸酶、一種或多種轉錄激活子樣效應因子核酸酶(TALEN)或一種或多種CRE重組酶來誘導該雙鏈斷裂。
  10. 如請求項9所述的方法,其中該CRISPR/Cas核酸內切酶包括CasI、CasIB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、CasX、CasY、Cas12a(Cpf1)、Cas12b、Cas13a、CsyI、Csy2、Csy3、CseI、Cse2、CscI、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、CmrI、Cmr3、Cmr4、Cmr5、Cmr6、CsbI、Csb2、Csb3、Csx17、CsxI4、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、CsfI、 Csf2、Csf3、Csf4、Cms1、C2c1、C2c2或C2c3或其同源物、直系同源物或經修飾的形式。
  11. 如請求項9所述的方法,其中該CRISPR/Cas核酸內切酶包括Cas9、Cpf1、CasX、CasY、C2c1、C2c3或其同源物、直系同源物(ortholog)或經修飾的形式。
  12. 如請求項9所述的方法,其中該CRISPR/Cas核酸內切酶包括Cas9。
  13. 如請求項10至12中任一項所述的方法,其中該gNA包括單一引導RNA(sgRNA)。
  14. 如請求項1至13中任一項所述的方法,其中該靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、靶序列和第二核酸分子的3’同源臂序列。
  15. 如請求項1至14中任一項所述的方法,其中該模板染色體從5’至3’包含第一核酸分子的3’同源臂序列、模板序列和第二核酸分子的5’同源臂序列。
  16. 如請求項1至15中任一項所述的方法,其中該靶序列包含至少1個基因、至少2個基因、至少3個基因、至少5個基因、至少10個基因、至少20個基因、至少30個基因、至少40個基因、至少50個基因、至少100個基因或至少200個基因。
  17. 如請求項1至16中任一項所述的方法,其中該靶序列包含與該模板序列的一個或多個基因同源的一個或多個基因。
  18. 如請求項1至17中任一項所述的方法,其中該模板序列包含天然存在的序列。
  19. 如請求項18所述的方法,其中該模板序列包含對該天然存在的序列的一個或多個修飾。
  20. 如請求項18所述的方法,其中該模板序列包含至少1個基因、至少2個基因、至少3個基因、至少5個基因、至少10個基因、至少20個基因、至少30個基因、至少40個基因、至少50個基因、至少100個基因或至少200個基因。
  21. 如請求項1至17中任一項所述的方法,其中該模板序列包含人工序列。
  22. 如請求項21所述的方法,其中該人工序列包含編碼一種或多種抗體或其抗原結合片段的序列。
  23. 如請求項22所述的方法,其中該一種或多種抗體或其抗原結合片段包括scFv、雙特異性抗體或多特異性抗體。
  24. 如請求項1至23中任一項所述的方法,其中藉由插入該模板序列來刪除該靶序列。
  25. 如請求項24所述的方法,其中,
    a.該靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、第一sgRNA靶序列、該靶序列、第二sgRNA靶序列和第二核酸分子的3’同源臂序列;以及
    b.該模板染色體從5’至3’包含第三種sgRNA靶序列、第一核酸分子的3’同源臂序列、該模板序列、第二種核酸分子的5’同源臂序列和第四sgRNA靶序列。
  26. 如請求項25所述的方法,其中產生該雙鏈斷裂包括將該細胞與CRISPR/Cas核酸內切酶以及該第一、第二、第三和第四sgRNA接觸。
  27. 如請求項26所述的方法,其中該第一、第二、第三和第四sgRNA包含對該第一、第二、第三和第四sgRNA靶序列特異的靶向序列。
  28. 如請求項26所述的方法,其中將該細胞與CRISPR/Cas核酸內切酶和sgRNA接觸包括用一種或多種編碼該CRISPR/Cas核酸內切酶和該sgRNA的核酸分子轉染該細胞。
  29. 如請求項1至23中任一項所述的方法,其中插入該模板序列包括幾乎不刪除或不刪除該靶序列的序列。
  30. 如請求項29所述的方法,其中插入該模板序列破壞了該靶序列的一種或多種功能。
  31. 如請求項29或30所述的方法,其中插入該模板序列破壞了該靶序列中的基因。
  32. 如請求項29至31中任一項所述的方法,其中
    a.該靶染色體從5’至3’包含第一核酸分子的5’同源臂序列、第一sgRNA靶序列和第二核酸分子的3’同源臂序列;以及
    b.該模板染色體從5’至3’包含第二sgRNA靶序列、第一核酸分子的3’同源臂序列、模板序列、第二核酸分子的5’同源臂序列和第三sgRNA靶序列。
  33. 如請求項32所述的方法,其中產生該雙鏈斷裂包括將該細胞與CRISPR/Cas核酸內切酶以及第一、第二和第三sgRNA接觸。
  34. 如請求項33所述的方法,其中該第一、第二和第三sgRNA包含對該第一、第二和第三sgRNA靶序列特異的靶向序列。
  35. 如請求項34或35所述的方法,其中使該細胞與該CRISPR/Cas核酸內切酶和該sgRNA接觸包括用編碼該CRISPR/Cas核酸內切酶和該sgRNA的一種或多種核酸分子轉染該細胞。
  36. 如請求項1至35中任一項所述的方法,其中該第一或第二標記包括螢光蛋白,該螢光蛋白與能夠在該細胞中表達該螢光蛋白的啟動子可操作地連接。
  37. 如請求項36所述的方法,其中該螢光蛋白包括綠色螢光蛋白(GFP)、黃色螢光蛋白(YFP)、紅色螢光蛋白(RFP)、青色螢光蛋白(CFP)、藍色螢光蛋白(BFP)、dsRed、mCherry或tdTomato。
  38. 如請求項36所述的方法,其中該螢光蛋白包括GFP。
  39. 如請求項1至38中任一項所述的方法,其中該第一標記還包括選擇標記。
  40. 如請求項1至39中任一項所述的方法,其中該第二標記還包括選擇標記。
  41. 請求項39或40所述的方法,其中該選擇標記選自由以下組成的組:二氫葉酸還原酶(DHFR)、穀胺醯胺合酶(GS)、嘌呤黴素乙醯轉移酶、殺稻瘟素脫胺酶、組胺醇脫氫酶、潮黴素磷酸轉移酶(hph)、博來黴素抗性基因和胺基糖苷磷酸轉移酶(新黴素抗性)。
  42. 如請求項39至41中任一項所述的方法,其中該第一和第二標記不是相同的選擇標記。
  43. 如請求項1至42中任一項所述的方法,其中該第一標記包含GFP和嘌呤黴素乙醯轉移酶,該GFP與能夠在該細胞中表達GFP的啟動子可操作地連接,並且該第二標記包含潮黴素磷酸轉移酶
  44. 如請求項1至43中任一項所述的方法,該方法還包括(e)在步驟(d)之後刪除該第一或第二標記的全部或部分。
  45. 如請求項44所述的方法,其中刪除該第一或第二標記包括用CRISPR/Cas核酸內切酶和gNA誘導刪除,該gNA包含對編碼該標記的序列特異的靶向序列。
  46. 如請求項1至45中任一項所述的方法,其中該細胞包括雜交細胞、胚胎雜交幹(EHS)細胞或受精卵。
  47. 如請求項46所述的方法,其中藉由融合來自任何兩個物種的ES細胞來產生該EHS細胞,該物種選自由以下組成的組:小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞和猴。
  48. 如請求項46所述的方法,其中藉由將人胚胎幹細胞與來自非人物種的胚胎幹細胞融合來產生該EHS細胞。
  49. 如請求項48所述的方法,其中該非人物種是小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞或猴。
  50. 如請求項46所述的方法,其中藉由融合來自任何兩個不同物種的ES細胞來產生該EHS細胞,該物種選自由以下組成的組:小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞和猴。
  51. 如請求項46所述的方法,其中產生該雜交細胞包括:
    a.產生微核人細胞;以及
    b.將該微核人細胞與來自非人物種的細胞融合,從而產生雜交細胞。
  52. 如請求項51所述的方法,其中藉由在足以誘導微核化的條件下將人細胞暴露於秋水仙胺,並使用離心收集該微核細胞來產生該微核人細胞。
  53. 如請求項51或52所述的方法,其中該非人物種是小鼠、大鼠、兔、豚鼠、倉鼠、綿羊、山羊、驢、牛、馬、駱駝、雞或猴。
  54. 如請求項51至53中任一項所述的方法,其中來自該非人物種的該細胞為ES細胞,且該雜交細胞為EHS細胞。
  55. 如請求項47至50中任一項所述的方法,其中該融合包括電融合、病毒誘導融合或化學誘導融合。
  56. 如請求項1至55中任一項所述的方法,其中該靶序列包含編碼免疫球蛋白或T細胞受體亞單位的基因。
  57. 如請求項1至56中任一項所述的方法,其中該靶染色體包含小鼠12號染色體,且該模板染色體包含人14號染色體,或其中該靶染色體包含小鼠6號染色體,且該模板染色體包含人2染色體2。
  58. 如請求項57所述的方法,其中該靶序列包含小鼠Igh可變區序列、小鼠Igk可變區序列和/或小鼠Igl可變區序列。
  59. 如請求項58所述的方法,其中該小鼠Igh可變區序列包含編碼小鼠VH、DH和JH1至6基因區段的序列和間插非編碼序列。
  60. 如請求項57至59中任一項所述的方法,其中該模板序列包含人IGH可變區序列、人IGK可變區序列和/或人IGL可變區序列。
  61. 如請求項60所述的方法,其中該人IGH可變區序列包含編碼人VH、DH和JH1至6基因區段的序列和間插非編碼序列。
  62. 如請求項1至61中任一項所述的方法,該方法還包括從在步驟(d)中選擇的細胞回收該工程化的染色體。
  63. 如請求項62所述的方法,其中回收該工程化的染色體包括在足以誘導微核化的條件下將該細胞暴露於秋水仙胺,並使用離心收集微核細胞。
  64. 如請求項1至63中任一項所述的方法,其中該第一和第二核酸分子是質粒。
  65. 一種工程化的染色體,其藉由如請求項1至64中任一項所述的方法產生。
  66. 如請求項65所述的工程化的染色體,其中該工程化的染色體是小鼠12號染色體,其包含替代小鼠Igh可變區的人IGH可變區序列,或其中該工程化的染色體是小鼠6號染色體,其包含替代小鼠Igk可變區的人IGK可變區序列。
  67. 如請求項66所述的工程化的染色體,其中該小鼠Igh可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。
  68. 如請求項66或67所述的工程化的染色體,其中該人IGH可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。
  69. 一種細胞,其包含如請求項64至68中任一項所述的工程化的染色體。
  70. 如請求項69所述的細胞,其中該細胞能夠與小鼠ES細胞雜交。
  71. 如請求項69所述的細胞,其中該細胞是胚胎幹(ES)細胞、胚胎雜交幹(EHS)細胞或受精卵。
  72. 如請求項68所述的方法,其中該細胞是微核細胞。
  73. 如請求項72所述的細胞,其中該EHS細胞是人與小鼠ES細胞的雜交體。
  74. 如請求項72所述的細胞,其中該ES細胞是小鼠ES細胞。
  75. 一種產生小鼠胚胎幹細胞的方法,該方法包括:
    a.將包含藉由如請求項1至64中任一項所述的方法產生的該工程化的染色體的微核細胞與小鼠ES細胞融合,其中,
    i.該小鼠ES細胞包含與該工程化的染色體同源的染色體,該同源染色體包含與能夠在該ES細胞中表達該螢光蛋白的啟動子可操作地連接的第一螢光蛋白,以及
    ii.至少一個亞群的該微核細胞包含工程化的染色體,並且其中該工程化的染色體包含不同於該第一螢光蛋白的第二螢光蛋白,該第二螢光蛋白與能夠在該ES細胞中表達該螢光蛋白的啟動子可操作地連接;
    b.選擇表達該第一和第二螢光蛋白的ES細胞;
    c.培養步驟(c[y1])中選擇的該ES細胞,直至至少一個亞組的該ES細胞丟失該同源染色體;以及
    d.選擇表達該第二螢光蛋白但不表達該第一螢光蛋白的ES細胞。
  76. 如請求項75所述的方法,其中在步驟(c)中培養該細胞包括將該細胞培養至少5天、至少7天、至少10天或至少14天。
  77. 如請求項75或76所述的方法,其中在步驟(b)和(d)選擇該細胞包括螢光激活細胞分選(FACS)。
  78. 一種小鼠ES細胞,其藉由如請求項75至77中任一項所述的方法產生。
  79. 一種基因轉殖小鼠,其由藉由如請求項75至78中任一項所述的方法產生的小鼠ES細胞產生。
  80. 如請求項79所述的基因轉殖小鼠,其中產生該基因轉殖小鼠包括將該ES細胞注射到二倍體胚泡中,從該ES細胞核轉移到去核小鼠胚胎,或四倍體胚胎互補。
  81. 如請求項79或80所述的基因轉殖小鼠,其中小鼠12號染色體包含替代小鼠Igh可變區的人IGH可變區序列,或者其中小鼠6號染色體包含替代小鼠Igk可變區的人IGK可變區序列。
  82. 如請求項81所述的基因轉殖小鼠,其中該小鼠Igh可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。
  83. 如請求項81或82所述的基因轉殖小鼠,其中該人IGH可變區包含VH、DH和JH1-6基因區段和間插非編碼序列。
  84. 一種產生抗體的方法,其包括:
    a.用抗原攻擊如請求項80至83中任一項所述的基因轉殖小鼠,由此該基因轉殖小鼠產生多種抗體,該抗體包含來自該人IGH可變區的人V、D和J區段;以及
    b.分離對抗原特異的抗體。
  85. 一種抗體,其源自藉由如請求項84所述的方法產生的抗體。
  86. 如請求項85所述的抗體,其中該抗體包含單鏈可變片段(scFv)、雙特異性抗體或多特異性抗體。
  87. 一種產生染色體重排的方法,該方法包括:
    a.提供細胞,其包含含有靶位置的靶染色體和含有模板序列的模板染色體;
    b.將該細胞與核酸分子接觸,該核酸分子從5’至3’包含含有該靶位置5’末端上游的核苷酸序列的5’同源臂、標記和含有該模板序列5’末端上游的核苷酸序列的3’同源臂;
    c.在該靶位置上和該模板序列的5’末端產生雙鏈斷裂,從而將該標記插入該5’同源臂序列3’的該靶染色體,隨後插入該模板序列,從而產生染色體重排;以及
    d.選擇表達該標記的一個或多個細胞。
  88. 如請求項87所述的方法,其中該核酸分子的該5’和3’同源臂的長度介於約20bp與2,000bp之間,介於約50bp與1,500bp之間,介於約100bp和1,400bp之間,介於約150bp和1,300bp之間,介於約200bp和1,200bp之間,介於約300bp和1,100bp之間,介於約400bp與1,000bp之間,或介於約500bp與900bp之間,或介於約600bp與800bp之間。
  89. 如請求項87所述的方法,其中該核酸分子的該5’和3’同源臂的長度介於約400bp與1,500bp之間,介於約500bp與1,300bp之間或介於約600bp與1,000bp之間。
  90. 如請求項87所述的方法,其中該核酸分子的該5’和3’同源臂的長度介於約600bp與1,000bp之間。
  91. 如請求項87至90中任一項所述的方法,其中在(c)中產生該雙鏈斷裂包括使用CRISPR/Cas核酸內切酶和至少一種sgRNA、一種或多種鋅指核酸酶、一種或多種轉錄激活子樣效應因子核酸酶(TALEN)或一種或多種CRE重組酶來誘導該雙鏈斷裂。
  92. 如請求項91所述的方法,其中該CRISPR/Cas核酸內切酶包括CasI、CasIB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、CasX、CasY、Cas12a(Cpf1)、Cas12b、Cas13a、CsyI、Csy2、Csy3、CseI、Cse2、CscI、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、CmrI、Cmr3、Cmr4、Cmr5、Cmr6、CsbI、Csb2、Csb3、Csx17、CsxI4、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、CsfI、Csf2、Csf3、Csf4、Cms1、C2c1、C2c2或C2c3或其同源物、直系同源物、或經修飾的形式。
  93. 如請求項91所述的方法,其中該CRISPR/Cas核酸內切酶包括Cas9、Cpf1、CasX、CasY、C2c1、C2c3或其同源物、直系同源物或經修飾的形式。
  94. 如請求項91所述的方法,其中該CRISPR/Cas核酸內切酶包括Cas9。
  95. 如請求項91至93中任一項所述的方法,其中產生該雙鏈斷裂包括將該細胞與CRISPR/Cas核酸內切酶、至少第一gNA和 第二gNA接觸,該第一gNA包含對該靶位置特異的靶向序列,使得該CRISPR/Cas核酸內切酶切割該靶位置,該第二gNA包含對該模板序列5’末端特異的靶向序列。
  96. 如請求項95所述的方法,其中將該細胞與CRISPR/Cas核酸內切酶和sgRNA接觸包括用一種或多種編碼該CRISPR/Cas核酸內切酶和該sgRNA的核酸分子轉染該細胞。
  97. 如請求項87至96中任一項所述的方法,其中該標記包含與能夠在該細胞中表達該螢光蛋白的啟動子可操作地連接的螢光蛋白。
  98. 如請求項97所述的方法,其中該螢光蛋白包括GFP、YFP、RFP、CFP、BFP、dsRed、mCherry或tdTomato。
  99. 如請求項87至98中任一項所述的方法,其中該標記還包括選擇標記。
  100. 如請求項99所述的方法,其中該選擇標記選自由以下組成的組:二氫葉酸還原酶(DHFR)、穀胺醯胺合酶(GS)、嘌呤黴素乙醯轉移酶、殺稻瘟素脫胺酶、組胺醇脫氫酶、潮黴素磷酸轉移酶(hph)、博來黴素抗性基因和胺基糖苷磷酸轉移酶(新黴素抗性)。
  101. 如請求項87至100中任一項所述的方法,其中該細胞包括胚胎幹(ES)細胞。
  102. 如請求項87至101中任一項所述的方法,其中該核酸分子是質粒。
  103. 一種細胞,其包含如請求項87至101中任一項所述的染色體重排。
  104. 如請求項103所述的細胞,其中該細胞是小鼠ES細胞。
  105. 一種基因轉殖小鼠,其來自由如請求項103或104所述的細胞產生的小鼠ES細胞。
TW111136154A 2021-09-24 2022-09-23 大尺寸染色體轉移方法及使用該方法產生的經修飾的染色體和生物體 TW202332770A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2021120126 2021-09-24
WOPCT/CN2021/120126 2021-09-24

Publications (1)

Publication Number Publication Date
TW202332770A true TW202332770A (zh) 2023-08-16

Family

ID=85720116

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111136154A TW202332770A (zh) 2021-09-24 2022-09-23 大尺寸染色體轉移方法及使用該方法產生的經修飾的染色體和生物體

Country Status (5)

Country Link
CN (1) CN117795078A (zh)
AU (1) AU2022350732A1 (zh)
CA (1) CA3222922A1 (zh)
TW (1) TW202332770A (zh)
WO (1) WO2023046038A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101892221A (zh) * 2010-06-30 2010-11-24 苏州神洲基因有限公司 染色体的无痕迹修饰方法
CN103215295B (zh) * 2013-04-11 2015-04-22 西北农林科技大学 一种β-酪蛋白位点定点整合Lys基因的打靶载体及其构建的细胞
LT3152312T (lt) * 2014-06-06 2020-04-27 Regeneron Pharmaceuticals, Inc. Tikslinio lokuso modifikavimo būdai ir kompozicijos
WO2016025759A1 (en) * 2014-08-14 2016-02-18 Shen Yuelei Dna knock-in system
US20200029538A1 (en) * 2016-11-28 2020-01-30 Osaka University Genome editing method
WO2019018534A1 (en) * 2017-07-18 2019-01-24 The Board Of Trustees Of Leland Stanford Junior University GENOME EDITION WITHOUT SCARCE THROUGH TWO-STEP APPROVED REPAIR BY HOMOLOGY
US20190225989A1 (en) * 2018-01-19 2019-07-25 Institute of Hematology and Blood Disease Hospital, CAMS & PUMC Gene knockin method and kit for gene knockin

Also Published As

Publication number Publication date
CN117795078A (zh) 2024-03-29
WO2023046038A1 (en) 2023-03-30
AU2022350732A1 (en) 2024-04-18
CA3222922A1 (en) 2023-03-30
WO2023046038A9 (en) 2023-04-27

Similar Documents

Publication Publication Date Title
AU2019202160B2 (en) Methods and compositions for the targeted modification of a genome
US20210301301A1 (en) Targeted modification of rat genome
JP6700306B2 (ja) 受精前の卵細胞、受精卵、及び標的遺伝子の改変方法
US20200017882A1 (en) Engineering of humanized car t-cell and platelets by genetic complementation
JP6480647B1 (ja) Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット
CN109536526B (zh) 核酸酶介导的使用大靶向载体的靶向
US20160186208A1 (en) Methods of Mutating, Modifying or Modulating Nucleic Acid in a Cell or Nonhuman Mammal
JP2017513510A (ja) ブタにおける多重遺伝子編集
US11388892B2 (en) Method for preparing CKO/KI animal model by using CAS9 technology
WO2019206236A1 (zh) 通过Tild-CRISPR实现高效精确的靶向整合
US11913015B2 (en) Embryonic cell cultures and methods of using the same
TW202332770A (zh) 大尺寸染色體轉移方法及使用該方法產生的經修飾的染色體和生物體
KR20240069672A (ko) 대규모 염색체 전달 방법 및 이를 이용한 변형 염색체 및 유기체
WO2021200768A1 (ja) ヒト染色体の分散方法、単離方法、およびその動物胚への移植方法
WO2023176982A1 (ja) Mhc遺伝子群ヒト化動物
TW201840849A (zh) 編輯核酸序列之組成物及方法
CN113574175A (zh) 基因敲入方法、基因敲入细胞制作方法、基因敲入细胞、癌变风险评价方法、癌细胞制造方法和用于在它们中使用的试剂盒
NZ721985B2 (en) Methods and compositions for the targeted modification of a genome