CN115176005A - 用于治疗血红蛋白病的组合物和方法 - Google Patents

用于治疗血红蛋白病的组合物和方法 Download PDF

Info

Publication number
CN115176005A
CN115176005A CN202080086828.7A CN202080086828A CN115176005A CN 115176005 A CN115176005 A CN 115176005A CN 202080086828 A CN202080086828 A CN 202080086828A CN 115176005 A CN115176005 A CN 115176005A
Authority
CN
China
Prior art keywords
cell
cells
population
molecule
grna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080086828.7A
Other languages
English (en)
Inventor
M·贝卢
J·布拉德纳
J·S·柯布
C·鲁斯
F·西格洛特
S·C·史蒂文森
P·汀
S·波纳齐
A·塞尔尼延科
N·达莱斯
J·R·克里根
P·拉穆
H·A·马利克
N·M-F·汤姆森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novartis AG
Original Assignee
Novartis AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novartis AG filed Critical Novartis AG
Publication of CN115176005A publication Critical patent/CN115176005A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本发明涉及用于治疗血红蛋白病的组合物和方法。

Description

用于治疗血红蛋白病的组合物和方法
序列表
本申请包含按ASCII格式以电子方式提交并特此通过引用以其全文并入的序列表。创建于2020年12月16日的所述ASCII副本名为PAT058744-WO-PCT_SL.txt且大小为1,094,185字节。
优先权要求
本申请要求于2019年12月18日提交的美国临时申请号62/950,025和62/950,048的优先权权益,其各自的披露内容通过引用以其全文并入本文。
背景技术
CRISPR(成簇规律间隔短回文重复序列)在细菌中作为适应性免疫系统进化以抵御病毒攻击。在暴露于病毒时,病毒DNA的短区段被整合到细菌基因组的CRISPR基因座中。RNA从包含病毒序列的CRISPR基因座的部分转录。该RNA(其含有与病毒基因组互补的序列)介导Cas9蛋白靶向病毒基因组中的序列。Cas9蛋白切割病毒靶标并由此使其沉默。
最近,CRISPR/Cas系统已经适用于真核细胞中的基因组编辑。位点特异性单链断裂(SSB)或双链断裂(DSB)的引入允许通过例如非同源末端连接(NHEJ)或同源定向修复(HDR)来改变靶序列。
发明内容
不受理论束缚,本发明部分基于WIZ基因表达/蛋白活性与血红蛋白F(HbF)产生之间的联系的出人意料的发现。如实例和附图所示,敲低或敲除细胞中的WIZ基因或WIZ蛋白(通过本文所述的各种模式/组合物)显著增加了这些细胞中的HbF诱导,从而治疗HbF相关病症和障碍(例如,血红蛋白病,例如,镰状细胞疾病和β地中海贫血)。本发明还部分基于以下发现:CRISPR系统(例如Cas9 CRISPR系统,例如如本文所述)可用于例如如本文所述在例如WIZ基因处修饰细胞(例如造血干细胞和祖细胞(HSPC))以例如在经修饰的细胞的后代中(例如在红细胞后代中)增加胎儿血红蛋白(HbF)表达和/或降低β珠蛋白(例如具有致病性突变的β珠蛋白基因)的表达,并且经修饰的(例如经修饰的HSPC)细胞可用于治疗血红蛋白病,例如镰状细胞疾病和β地中海贫血。在一个方面,本文出人意料地显示,将基因编辑系统(例如,如本文所述的CRISPR系统)引入细胞(例如,HSPC)产生经修饰的HSPC(例如,包含一个或多个插入/缺失(indel)的HSPC,例如如本文所述),所述基因编辑系统靶向WIZ基因,所述经修饰的HSPC能够有效地植入生物体中,长期存在于植入的生物体中并且分化,包括分化为具有增加的胎儿血红蛋白表达的红细胞。另外,这些经修饰的HSPC能够离体培养,例如,在干细胞扩增剂(例如本文所述)的存在下在使其扩增和增殖同时保持干细胞性的条件下。当将基因编辑系统(例如,如本文所述的CRISPR系统)引入衍生自镰状细胞疾病患者的HPSC时,经修饰的细胞及其后代(例如,红系细胞后代)出人意料地显示不仅胎儿血红蛋白的上调,而且与未经修饰的细胞群相比,镰状细胞β球蛋白显著减少,并且镰状细胞数量显著减少,并且正常红细胞数量增加。
因此,在一方面,本发明提供了包含一种或多种(例如一种)如本文所述的gRNA分子的CRISPR系统(例如Cas CRISPR系统,例如Cas9CRISPR系统,例如酿脓链球菌Cas9CRISPR系统)。本文所述的任何gRNA分子均可用于此类系统以及本文所述的方法和细胞中。
在一方面,本发明提供了包括tracr和crRNA的gRNA分子,其中crRNA包括与WIZ基因(例如人WIZ基因)的靶序列互补的靶向结构域。在实施例中,WIZ基因包括位于Chr19:15419978-15451624、-链、hg38或其片段或其变体的基因组核酸序列。
在实施例中,靶向结构域包括以下,例如由以下组成:SEQ ID NO:1至SEQ ID NO:3106中的任一个(参见例如表1-3)。在实施例中,gRNA分子包括靶向结构域,该靶向结构域包括以上任何序列的片段(例如由其组成)。
在本文所述的任何方面和实施例中,该gRNA分子可以进一步具有本文所述的区域和/或特性。在实施例中,gRNA分子包括本文所述的任何靶向结构域的片段。在实施例中,靶向结构域包括任何一个所列举的靶向结构域序列的17、18、19或20个连续核酸,例如由其组成。在实施例中,任何一个所列举的靶向结构域序列的17、18、19、或20个连续核酸是布置于所列举的靶向结构域序列的3’端的17、18、19、或20个连续核酸。在其他实施例中,任何一个所列举的靶向结构域序列的17、18、19、或20个连续核酸是布置于所列举的靶向结构域序列的5'端的17、18、19、或20个连续核酸。在其他实施例中,任何一个所列举的靶向结构域序列的17、18、19、或20个连续核酸不包含所列举的靶向结构域序列的5'或3'核酸。在实施例中,靶向结构域由所列举的靶向结构域序列组成。
在一方面,包括在本文描述的任何方面和实施例中,crRNA部分和tracr部分杂交形成包括SEQ ID NO:3110或3111的标志杆。在一方面,包括在本文描述的任何方面和实施例中,该标志杆进一步包含位于标志杆的crRNA部分的3'的第一标志杆延伸部,其中所述第一标志杆延伸部包含SEQ ID NO:3112。在一方面,包括在本文描述的任何方面和实施例中,该标志杆进一步包含位于标志杆的crRNA部分的3’的第二标志杆延伸部和(如果存在)第一标志杆延伸部,其中所述第二标志杆延伸部包含SEQ ID NO:3113。
在一方面,包括在本文描述的任何方面和实施例中,该tracr包括SEQ ID NO:3152或SEQ ID NO:3153。在一方面,包括在任何前述方面和实施例中,该tracr包括SEQ ID NO:3160,任选地在3'端进一步包括另外的1、2、3、4、5、6或7个尿嘧啶(U)核苷酸。在一方面,包括在本文描述的任何方面和实施例中,该crRNA从5'至3’包括,[靶向结构域]-:a)SEQ IDNO:3110;b)SEQ ID NO:3111;c)SEQ ID NO:3127;d)SEQ ID NO:3128;e)SEQ ID NO:3129;f)SEQ ID NO:3130;或g)SEQ ID NO:3154。
在一方面,包括在任何前述方面和实施例中,该tracr从5’至3’包括:a)SEQ IDNO:3115;b)SEQ ID NO:3116;c)SEQ ID NO:3131;d)SEQ ID NO:3132;e)SEQ ID NO:3152;f)SEQ ID NO:3153;g)SEQ ID NO:232;h)SEQ ID NO:3155;i)(SEQ ID NO:3156;j)SEQ IDNO:3157;k)以上a)至j)中的任一个,在3'端进一步包含至少1、2、3、4、5、6或7个尿嘧啶(U)核苷酸,例如1、2、3、4、5、6或7个尿嘧啶(U)核苷酸;l)以上a)至k)中的任一个,在3'端进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸,例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸;或m)以上a)至l)中的任一个,在5'端(例如在5’末端)进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸,例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸。
在一方面,包括在本文描述的任何方面和实施例中,靶向结构域和tracr被布置于分开的核酸分子上。在一方面,包括在本文所述的任何方面和实施例中,该靶向结构域和该tracr被布置于分开的核酸分子上,并且其中包括该靶向结构域的核酸分子包括任选地紧邻该靶向结构域的3’布置的SEQ ID NO:3129,并且包括该tracr的核酸分子包括SEQ IDNO:3152,例如由其组成。在一方面,包括在任何前述方面和实施例中,该标志杆的crRNA部分包括SEQ ID NO:3129或SEQ ID NO:3130。在一方面,包括在任何前述方面和实施例中,该tracr包含SEQ ID NO:3115或3116和任选的布置于SEQ ID NO:3115或3116的5’的第一tracr延伸部,如果存在第一标志杆延伸部的话,所述第一tracr延伸部包含SEQ ID NO:3117。
在一方面,包括在任何前述方面和实施例中,靶向结构域和tracr被布置于单个核酸分子上,例如其中tracr被布置于靶向结构域的3'。在一方面,gRNA分子包括布置于该靶向结构域的3'且布置于该tracr的5'的环。在实施例中,环包括SEQ ID NO:3114。在一方面,包括在任何前述方面和实施例中,该gRNA分子从5'至3’包括,[靶向结构域]-:(a)SEQ IDNO:3123;(b)SEQ ID NO:3124;(c)SEQ ID NO:3125;(d)SEQ ID NO:3126;(e)SEQ ID NO:3159;或(f)以上(a)至(e)中的任一个,在3'端进一步包含1、2、3、4、5、6或7个尿嘧啶(U)核苷酸。
在一方面,包括在任何前述方面和实施例中,该靶向结构域和该tracr被布置于单个核酸分子上,并且其中所述核酸分子包括所述靶向结构域和任选地紧邻所述靶向结构域的3’布置的SEQ ID NO:3159,例如由其组成。
在一方面,包括在任何上述方面和实施例中,包括gRNA分子的一种或任选地多于一种的核酸分子包括:
a)在所述一种或多种核酸分子的3'端的一个或多个,例如三个硫代磷酸酯修饰;
b)在所述一种或多种核酸分子的5'端的一个或多个,例如三个硫代磷酸酯修饰;
c)在所述一种或多种核酸分子的3'端的一个或多个,例如三个2'-O-甲基修饰;
d)在所述一种或多种核酸分子的5'端的一个或多个,例如三个2'-O-甲基修饰;
e)在所述一种或多种核酸分子的相对于末端的第4个、相对于末端的第3个和相对于末端的第2个3'残基的每个处的2’O-甲基修饰;
f)在所述一种或多种核酸分子的相对于末端的第4个、相对于末端的第3个和相对于末端的第2个5'残基的每个处的2’O-甲基修饰;或
f)其任何组合。
在一方面,包括在任何前述方面和实施例中,本发明提供gRNA分子,其中:
当将包括该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时,在与该gRNA分子的靶向结构域互补的靶序列处或附近形成插入/缺失。
在一方面,包括在任何上述方面和实施例中,本发明提供了一种gRNA分子,其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞群中时,在该群的至少约15%,例如至少约17%、例如至少约20%、例如至少约30%、例如至少约40%、例如至少约50%、例如至少约55%、例如至少约60%、例如至少约70%、例如至少约75%的细胞中,在与gRNA分子的靶向结构域互补的靶序列处或附近形成插入/缺失。在一方面,包括在任何上述方面和实施例中,插入/缺失包括WIZ基因区的至少一个核苷酸。在实施例中,群体的至少约15%的细胞包括插入/缺失,该插入/缺失包括WIZ基因区的至少一个核苷酸。在实施例中,插入/缺失通过下一代测序(NGS)测量。
在一方面,包括在任何上述方面和实施例中,本发明提供了一种gRNA分子,其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时,胎儿血红蛋白在所述细胞或其后代,例如其红系细胞后代,例如其红细胞后代中的表达增加。在实施例中,当将包括gRNA分子的CRISPR系统(例如,如本文所述的RNP)引入细胞群中时,所述群或其后代的群(例如其红系细胞后代,例如,其红细胞后代)中F细胞的百分比增加至少约15%、例如至少约17%、例如至少约20%、例如至少约25%、例如至少约30%、例如至少约35%、例如至少约40%(相对于未引入gRNA分子的细胞群或其后代的群(例如其红系细胞后代,例如,其红细胞后代)中的F细胞百分比)。在实施例中,所述细胞或其后代,例如其红系细胞后代,例如其红细胞后代产生每个细胞至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。
在一方面,包括在任何前述方面和实施例中,本发明提供了一种gRNA分子,其中当将包括该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时,在所述细胞中不形成脱靶插入/缺失,例如,在WIZ基因区外(例如,在基因内,例如基因的编码区)没有形成脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测。
在一方面,包括在任何前述方面和实施例中,本发明提供gRNA分子,其中当将包括gRNA分子的CRISPR系统(例如,如本文所述的RNP)引入细胞群时,在细胞群的超过约5%、例如超过约1%、例如超过约0.1%、例如超过约0.01%的细胞中检测不到脱靶插入/缺失,例如在WIZ基因之外(例如,在基因内,例如基因的编码区)检测不到脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测。
在一方面,包括任何前述方面和实施例,细胞是(或细胞群包括)哺乳动物、灵长类动物或人细胞,例如,是人细胞,例如,细胞是(或细胞群包括)HSPC,例如HSPC是CD34+,例如,HSPC是CD34+CD90+。在实施例中,该细胞相对于待施用所述细胞的患者是自体的。在其他实施例中,该细胞相对于待施用所述细胞的患者是同种异体的。
在一方面,本文所述的gRNA分子,基因组编辑系统(例如,CRISPR系统)和/或方法涉及细胞(例如,如本文所述),其包括或产生以下一种或多种性质:
(a)本文所述的细胞群的至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的细胞包含在与本文所述的gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;
(b)本文所述的细胞(例如细胞群)能够分化成红系细胞谱系的分化的细胞(例如红细胞),并且其中所述分化的细胞例如相对于未经改变的细胞(例如细胞群)表现出增加的胎儿血红蛋白水平;
(c)本文所述的细胞群能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群例如相对于未经改变的细胞群具有增加的F细胞百分比(例如,F细胞百分比高至少约15%、高至少约20%、高至少约25%、高至少约30%、或高至少约40%);
(d)本文所述的细胞能够分化成分化的细胞,例如红系细胞谱系细胞(例如红细胞),并且其中所述分化的细胞(例如,分化的细胞群)产生每个细胞至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白;
(e)在本文所述的细胞中不形成脱靶插入/缺失,例如,在WIZ基因区之外(例如,在基因内,例如,基因的编码区)不形成脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测;
(f)在本文所述的细胞群的超过约5%、例如超过约1%、例如超过约0.1%、例如超过约0.01%的细胞中检测不到脱靶插入/缺失,例如在WIZ基因区之外(例如,在基因内,例如基因的编码区)检测不到脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测;
(g)任选地通过检测与SEQ ID NO:1至SEQ ID NO:3106中任一个的gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失而检测,本文所述的细胞或其后代在其被移植的患者中在移植后超过16周、超过20周或超过24周时是可被检测的,例如,在骨髓中可被检测到或在外周血中可被检测到,任选地其中该插入/缺失是大缺失indel;
(h)本文所述的细胞群能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群例如相对于未经改变的细胞群包括降低的镰状细胞百分比(例如,镰状细胞百分比低至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%);和/或
(i)本文所述的细胞或细胞群能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群包括细胞,这些细胞相对于未经改变的细胞群产生降低的镰状血红蛋白(HbS)水平(例如,水平低至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%)。
一方面,本发明提供组合物,该组合物包括:
1)一种或多种本文所述的例如任何前述gRNA方面和实施例的gRNA分子(包括第一gRNA分子)、和Cas9分子(例如本文所述);
2)一种或多种本文所述的例如任何前述gRNA方面和实施例的gRNA分子(包括第一gRNA分子)、和包含编码Cas9分子的核苷酸序列(例如本文所述)的核酸;
3)核酸,其包含一个或多个核苷酸序列,每个核苷酸序列编码一种本文所述的例如任何前述gRNA方面和实施例的gRNA分子(包括第一gRNA分子)、和Cas9分子(例如本文所述);
4)包含一个或多个核苷酸序列(每个核苷酸序列编码一种本文所述的例如任何前述gRNA方面和实施例的gRNA分子(包括第一gRNA分子)、和Cas9分子(例如本文所述))的核酸,和编码Cas9分子的核酸(例如本文所述);或
5)以上1)至4)中的任一个、和模板核酸;或
6)以上1)至4)中的任一个、和包含编码模板核酸的核苷酸序列的核酸。
在一方面,本发明提供了组合物,该组合物包括本文所述的例如任何前述gRNA方面和实施例的第一gRNA分子,进一步包括例如本文所述的Cas9分子,例如,其中Cas9分子是活性的或无活性的酿脓链球菌Cas9,例如,其中Cas9分子包括SEQ ID NO:3133。在一些方面,Cas9分子包括以下,例如,由以下组成:(a)SEQ ID NO:3161;(b)SEQ ID NO:3162;(c)SEQ ID NO:3163;(d)SEQ ID NO:3164;(e)SEQ ID NO:3165;(f)SEQ ID NO:3166;(g)SEQID NO:3167;(h)SEQ ID NO:3168;(i)SEQ ID NO:3169;(j)SEQ ID NO:3170;(k)SEQ IDNO:3171或(l)SEQ ID NO:3172。
在一方面,包括在任何前述组合物方面和实施例中,第一gRNA分子和Cas9分子存在于核糖核蛋白复合物(RNP)中。
在一方面,包括在任何前述组合物方面和实施例中,本发明提供了进一步包括第二gRNA分子的组合物;第二gRNA分子和第三gRNA分子;或第二gRNA分子、任选地第三gRNA分子、以及任选地第四gRNA分子,其中第二gRNA分子、任选的第三gRNA分子和任选的第四gRNA分子是本文所述的gRNA分子,例如是任何前述gRNA分子方面和实施例的gRNA分子,并且其中该组合物的每种gRNA分子与不同的靶序列互补。在实施例中,第一gRNA分子、第二gRNA分子、任选的第三gRNA分子和任选的第四gRNA分子中的两种或更多种与同一基因或区内的靶序列互补。在实施例中,第一gRNA分子、第二gRNA分子、任选的第三gRNA分子和任选的第四gRNA分子与相隔不多于6000个核苷酸、不多于5000个核苷酸、不多于500个核苷酸、不多于400个核苷酸、不多于300个核苷酸、不多于200个核苷酸、不多于100个核苷酸、不多于90个核苷酸、不多于80个核苷酸、不多于70个核苷酸、不多于60个核苷酸、不多于50个核苷酸、不多于40个核苷酸、不多于30个核苷酸、不多于20个核苷酸、或不多于10个核苷酸的靶序列互补。在一方面,包括在任何前述组合物方面和实施例中,该组合物包括第一gRNA分子和第二gRNA分子(例如,由其组成),其中该第一gRNA分子和第二gRNA分子是:(a)独立选择并与不同的靶序列互补;(b)独立地选自表1的gRNA分子,并且与不同的靶序列互补;c)独立地选自表2的gRNA分子,并且与不同的靶序列互补;或(d)独立地选自表3的gRNA分子,并且与不同的靶序列互补,或(f)独立地选自任何前述方面和实施例的gRNA分子,并且与不同的靶序列互补。
在一方面,包括在任何上述组合物方面和实施例中,该组合物包括第一gRNA分子和第二gRNA分子,其中:
a)第一gRNA分子与靶序列互补,该靶序列包括以下中的至少1个核苷酸(例如,包括20个连续核苷酸):Chr19:15419978-15451624,-链,hg38;
b)第二gRNA分子与靶序列互补,该靶序列包括以下中的至少1个核苷酸(例如,包含20个连续核苷酸):Chr19:15419978-15451624,-链,hg38。
在一方面,就组合物的gRNA分子组成部分而言,该组合物由第一gRNA分子和第二gRNA分子组成。
在一方面,包括在任何前述组合物方面和实施例中,每个所述gRNA分子处于具有例如本文所述的Cas9分子的核糖核蛋白复合物(RNP)中。
在一方面,包括在任何上述组合物方面和实施例中,本该组合物包括模板核酸,其中该模板核酸包含与第一gRNA的靶序列处或附近的核苷酸对应的核苷酸。在实施例中,该模板核酸包含编码以下的核酸:人WIZ基因或其片段。
在一方面,包括在任何前述组合物方面和实施例中,该组合物被配制在适于电穿孔的介质中。
在一方面,包括在任何前述组合物方面和实施例中,所述组合物的每个所述gRNA分子在具有本文所述的Cas9分子的RNP中,并且其中所述RNP中的每一个的浓度小于约10uM,例如小于约3uM、例如小于约1uM、例如小于约0.5uM、例如小于约0.3uM、例如小于约0.1uM。在实施例中,RNP的浓度为约1uM。在实施例中,RNP的浓度为约2uM。在实施例中,所述浓度是包含细胞的组合物中RNP的浓度,例如,如本文所述,任选地其中包含细胞和RNP的组合物适合于电穿孔。
一方面,本发明提供了编码一种或多种本文所述的例如任何前述gRNA分子方面和实施例的gRNA分子的核酸序列。在实施例中,该核酸包括与编码一种或多种gRNA分子的序列可操作地连接的启动子,例如,启动子是由RNA聚合酶II或RNA聚合酶III识别的启动子,或者例如,启动子是U6启动子或HI启动子。
在一方面,包括在任何上述核酸方面和实施例中,该核酸进一步编码Cas9分子,例如,Cas9分子,其包括以下中任一个,例如由以下中任一个组成:SEQ ID NO:3133,(a)SEQID NO:3161;(b)SEQ ID NO:3162;(c)SEQ ID NO:3163;(d)SEQ ID NO:3164;(e)SEQ IDNO:3165;(f)SEQ ID NO:3166;(g)SEQ ID NO:3167;(h)SEQ ID NO:3168;(i)SEQ ID NO:3169;(j)SEQ ID NO:3170;(k)SEQ ID NO:3171或(l)SEQ ID NO:3172。在实施例中,所述核酸包含与编码Cas9分子的序列可操作地连接的启动子,例如EF-1启动子、CMV IE基因启动子、EF-1α启动子、泛素C启动子或磷酸甘油酸激酶(PGK)启动子。
在一方面,本文提供的包括载体,该载体包含任何前述核酸方面和实施例的核酸。在实施例中,该载体选自由以下组成的组:慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、质粒、微环、纳米质粒和RNA载体。
在一方面,本文提供的包括在细胞内的靶序列处或附近改变所述细胞(例如细胞群)(例如改变核酸的结构(例如序列))的方法,该方法包括使所述细胞(例如细胞群)与以下进行接触(例如向所述细胞(例如细胞群)中引入):
1)一种或多种本文所述(例如任何前述gRNA分子方面和实施例)的gRNA分子、和Cas9分子(例如本文所述);
2)一种或多种本文所述(例如任何前述gRNA分子方面和实施例)的gRNA分子、和包含编码Cas9分子的核苷酸序列(例如本文所述)的核酸;
3)核酸,其包含一个或多个核苷酸序列,每个核苷酸序列编码一种本文所述的(例如任何前述gRNA分子方面和实施例所述的)gRNA分子、和Cas9分子(例如本文所述);
4)包含一个或多个核苷酸序列(每个核苷酸序列编码一种本文所述的(例如任何前述gRNA分子方面和实施例所述的)gRNA分子)的核酸和包含例如本文所述的编码Cas9分子的核苷酸序列的核酸;
5)以上1)至4)中的任一个、和模板核酸;
6)以上1)至4)中的任一个、和包含编码模板核酸的核苷酸序列的核酸;
7)本文所述的组合物,例如任何前述组合物方面和实施例的组合物;或
8)本文描述的载体,例如任何前述载体方面和实施例的载体。
在一方面,包括在任何前述方法方面和实施例中,该gRNA分子或编码该gRNA分子的核酸、以及该Cas9分子或编码该Cas9分子的核酸被配制在单一组合物中。在另一个方面,该gRNA分子或编码gRNA分子的核酸以及该Cas9分子或编码Cas9分子的核酸被配制在多于一个组合物中。在一方面,同时或顺序地递送多于一个组合物。
在本文所述方法的一个方面,包括在任何前述方法方面和实施例中,细胞是动物细胞,例如,细胞是哺乳动物、灵长类动物或人细胞,例如细胞是造血干细胞或祖细胞(HSPC)(例如HSPC群),例如细胞是CD34+细胞,例如细胞是CD34+CD90+细胞。在本文所述方法的实施例中,将该细胞布置于包含已富集CD34+细胞的细胞群的组合物中。在本文所述方法的实施例中,该细胞(例如细胞群)已自骨髓、动员的外周血或脐带血分离。在本文所述方法的实施例中,对于待施用所述细胞的患者,所述细胞是自体的或同种异体的,例如是自体的。
在本文所述方法的一个方面,包括在任何前述方法方面和实施例中,a)改变导致在与该一种或多种gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;或b)改变导致缺失,包括WIZ基因区中与一种或多种gRNA分子的靶向结构域互补(例如,与gRNA靶向结构域至少90%互补,例如,与gRNA靶向结构域完全互补)的序列,例如基本上所有的序列gRNA靶向结构域)。在该方法的方面,该插入/缺失是小于约40个核苷酸,例如小于30个核苷酸、例如小于20个核苷酸、例如小于10个核苷酸的插入或缺失,例如是单核苷酸缺失。
在本文所述方法的一个方面,包括在任何前述方法方面和实施例中,该方法产生细胞群,其中该群的至少约15%,例如至少约17%、例如至少约20%、例如至少约30%、例如至少约40%、例如至少约50%、例如至少约55%、例如至少约60%、例如至少约70%、例如至少约75%已被改变,例如包括插入/缺失。
在本文所述方法的一个方面,包括在任何前述方法方面和实施例中,改变产生如下细胞(例如细胞群),该细胞(例如细胞群)能够分化成红系细胞谱系的分化的细胞(例如红细胞),并且其中所述分化的细胞例如相对于未经改变的细胞(例如细胞群)表现出增加的胎儿血红蛋白水平。
在本文所述方法的一个方面,包括在任何前述方法方面和实施例中,改变产生如下细胞群,该细胞群能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群例如相对于未经改变的细胞群具有增加的F细胞百分比(例如,F细胞百分比高至少约15%、高至少约20%、高至少约25%、高至少约30%、或高至少约40%)。
在本文所述方法的一个方面,包括在任何前述方法方面和实施例中,改变产生如下细胞,该细胞能够分化成分化的细胞,例如红系细胞谱系细胞(例如红细胞),并且其中所述分化的细胞产生每个细胞至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。
在一方面,本发明提供了通过本文所述的方法例如任何前述方法方面和实施例的方法改变的细胞。
在一方面,本发明提供了可通过本文所述的方法例如任何前述方法方面和实施例的方法获得的细胞。
在一方面,本发明提供了一种细胞,该细胞包含本文所述、例如任何前述gRNA分子方面或实施例的第一gRNA分子,或本文所述、例如任何前述组合物方面或实施例的组合物,本文所述、例如任何前述核酸方面或实施例的核酸,或本文所述、例如任何前述载体方面或实施例的载体。
在本文所述的细胞的一个方面,包括在任何上述细胞方面和实施例中,所述细胞还包括例如本文所述的Cas9分子,例如,包括以下中任一个的Cas9分子:SEQ ID NO:3133、(a)SEQ ID NO:3161;(b)SEQ ID NO:3162;(c)SEQ ID NO:3163;(d)SEQ ID NO:3164;(e)SEQ ID NO:3165;(f)SEQ ID NO:3166;(g)SEQ ID NO:3167;(h)SEQ ID NO:3168;(i)SEQID NO:3169;(j)SEQ ID NO:3170;(k)SEQ ID NO:3171或(l)SEQ ID NO:3172。
在本文所述细胞的一个方面,包括在任何前述细胞方面和实施例中,该细胞包括、已包括或将包括本文所述、例如任何前述gRNA分子方面或实施例的第二gRNA分子,或编码所述gRNA分子的核酸,其中第一gRNA分子和第二gRNA分子包含不相同的靶向结构域。
在本文所述细胞的一个方面,包括在任何前述细胞方面和实施例中,相对于未经修饰以包括gRNA分子的相同细胞类型的细胞或其后代,所述细胞或其后代(例如其红系细胞后代,例如其红细胞后代)中的胎儿血红蛋白的表达增加。
在本文所述细胞的一个方面,包括在任何上述细胞方面和实施例中,该细胞能够分化成分化的细胞,例如红系细胞谱系细胞(例如红细胞),并且其中所述分化的细胞例如相对于未经修饰以包括gRNA分子的相同类型的细胞表现出增加的胎儿血红蛋白水平。
在本文所述细胞的一个方面,包括在任何前述细胞方面和实施例中,例如相对于未经修饰以包括gRNA分子的相同类型的分化的细胞,该分化的细胞(例如红系细胞谱系细胞,例如红细胞)产生至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。
在本文所述细胞的一个方面,包括在任何前述细胞方面和实施例中,细胞已经与干细胞扩增剂接触,例如,离体接触,例如,干细胞扩增剂选自:a)(1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺;b)甲基4-(3-哌啶-1-基丙基氨基)-9H-嘧啶并[4,5-b]吲哚-7-甲酸酯;c)4-(2-(2-(苯并[b]噻吩-3-基)-9-异丙基-9H-嘌呤-6-基氨基)乙基)苯酚;d)(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇;或e)其组合(例如,(1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺和(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)。在实施例中,干细胞扩增剂是(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。
在本文所述的细胞的一个方面,包括在任何前述细胞方面和实施例中,该细胞包括:a)与本文所述例如任何前述gRNA分子方面或实施例的gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;或b)缺失,其包括WIZ基因区中与本文描述(例如任何前述gRNA分子方面或实施例描述)的gRNA分子的靶向结构域互补(例如,与gRNA靶向结构域至少90%互补,例如与gRNA靶向结构域完全互补)的序列,例如,基本上所有序列。在一方面,该插入/缺失是小于约40个核苷酸,例如小于30个核苷酸、例如小于20个核苷酸、例如小于10个核苷酸的插入或缺失,例如该插入/缺失是单核苷酸缺失。
在本文所述细胞的一个方面,包括在任何上述细胞方面和实施例中,该细胞是动物细胞,例如该细胞是哺乳动物细胞、灵长类动物细胞或人细胞。在一方面,该细胞是造血干细胞或祖细胞(HSPC)(例如HSPC群),例如该细胞是CD34+细胞,例如该细胞是CD34+CD90+细胞。在实施例中,该细胞(例如细胞群)已自骨髓、动员的外周血或脐带血分离。在实施例中,该细胞相对于待施用所述细胞的患者是自体的。在实施例中,该细胞相对于待施用所述细胞的患者是同种异体的。
一方面,本发明提供了本文所述的细胞群,例如包括本文所述细胞(例如任何上述细胞方面和实施例的细胞)的细胞群。在一些方面,本发明提供细胞群,其中细胞群的至少约50%、例如至少约60%、例如至少约70%、例如至少约80%、例如至少约90%(例如至少约95%、至少约96%、至少约97%、至少约98%或至少约99%)的细胞是本文所述的细胞,例如,任何上述细胞方面和实施例的细胞。在一些方面,细胞群(例如,细胞群的细胞)能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群例如相对于相同类型的未经修饰的细胞群具有增加的F细胞百分比(例如,F细胞百分比高至少约15%、高至少约17%、高至少约20%、高至少约25%、高至少约30%、或高至少约40%)。在一些方面,该分化的细胞群的F细胞产生每个细胞平均至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。
在一方面,包括在任何前述细胞群方面和实施例中,本发明提供细胞群,该细胞群包括:1)至少1e6个CD34+细胞/kg待施用所述细胞的患者体重;2)至少2e6个CD34+细胞/kg待施用所述细胞的患者体重;3)至少3e6个CD34+细胞/kg待施用所述细胞的患者体重;4)至少4e6个CD34+细胞/kg待施用所述细胞的患者体重;或5)从2e6至10e6个CD34+细胞/kg待施用细胞的患者体重。在实施例中,该群的至少约40%,例如至少约50%(例如,至少约60%、至少约70%、至少约80%、或至少约90%)的细胞是CD34+细胞。在实施例中,该群的至少约5%,例如至少约10%,例如至少约15%、例如至少约20%、例如至少约30%的细胞是CD34+CD90+细胞。在实施例中,细胞群衍生自脐带血、外周血(例如,动员的外周血)或骨髓,例如衍生自骨髓。在实施例中,该细胞群包含哺乳动物细胞,例如人细胞,例如由其组成。在实施例中,该细胞群相对于待将其施用至的患者是自体的。在其他实施例中,该细胞群相对于待将其施用至的患者是同种异体的。
一方面,本发明提供了组合物,该组合物包括本文所述的细胞,例如任何前述细胞方面和实施例的细胞,或本文所述的细胞群,例如任何前述细胞群方面和实施例的细胞群。在一方面,该组合物包含药学上可接受的介质,例如适于冷冻保存的药学上可接受的介质。
在一方面,本发明提供治疗血红蛋白病的方法,该方法包括向患者施用本文所述的细胞(例如任何前述细胞方面和实施例的细胞),本文所述的细胞群(例如任何前述细胞群方面和实施例的细胞群),或本文所述的组合物(例如任何前述组合物方面和实施例的组合物)。
一方面,本发明提供增加哺乳动物中胎儿血红蛋白表达的方法,该方法包括向患者施用本文所述的细胞(例如任何前述细胞方面和实施例的细胞),本文所述的细胞群(例如任何前述细胞群方面和实施例的细胞群),或本文所述的组合物(例如任何前述组合物方面和实施例的组合物)。在一些方面,血红蛋白病是β-地中海贫血。在一些方面,血红蛋白病是镰状细胞疾病。
在一方面,本发明提供制备细胞(例如细胞群)的方法,该方法包括:
(a)提供细胞(例如细胞群)(例如HSPC(例如HSPC群));
(b)在包含干细胞扩增剂的细胞培养基中离体培养所述细胞(例如,所述细胞群);并且
(c)向所述细胞中引入第一gRNA分子,例如本文所述的第一gRNA分子,例如任何前述gRNA分子方面和实施例的第一gRNA分子;编码第一gRNA分子的核酸分子;本文所述的组合物,例如任何前述组合物方面和实施例的组合物;或本文描述的载体,例如任何前述方面和实施例的载体。在该方法的各方面中,在步骤(c)的所述引入之后,所述细胞(例如细胞群)能够分化成分化的细胞(例如分化的细胞群),例如红系细胞谱系细胞(例如红系细胞谱系细胞群),例如红细胞(例如红细胞群),并且其中所述分化的细胞(例如分化的细胞群)例如相对于未经受步骤(c)的相同细胞产生增加的胎儿血红蛋白。在该方法的方面,干细胞扩增剂是:a)(1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺;b)甲基4-(3-哌啶-1-基丙基氨基)-9H-嘧啶并[4,5-b]吲哚-7-甲酸酯;c)4-(2-(2-(苯并[b]噻吩-3-基)-9-异丙基-9H-嘌呤-6-基氨基)乙基)苯酚;d)(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇;或e)其组合(例如,(1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺和(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)。在实施例中,干细胞扩增剂是(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在一些方面中,细胞培养基包括血小板生成素(Tpo)、Flt3配体(Flt-3L)和人干细胞因子(SCF)。在一些方面,细胞培养基还包括人白细胞介素-6(IL-6)。在一些方面,细胞培养基包含各自浓度范围从约10ng/mL至约1000ng/mL,例如各自浓度为约50ng/mL,例如各自浓度为50ng/mL的血小板生成素(Tpo)、Flt3配体(Flt-3L)和人干细胞因子(SCF)。在一些方面,细胞培养基包含浓度范围从约10ng/mL至约1000ng/mL,例如浓度为约50ng/mL,例如浓度为50ng/mL的人白细胞介素-6(IL-6)。在一些方面,细胞培养基包括浓度范围为约1nM至约1mM的干细胞扩增剂,例如,浓度范围为约1uM至约100nM的干细胞扩增剂,例如,浓度范围为约500nM至约750nM的干细胞扩增剂。在一些方面,细胞培养基包括浓度为约500nM的干细胞扩增剂,例如浓度为500nM干细胞扩增剂。在一些方面,细胞培养基包括浓度为约750nM的干细胞扩增剂,例如浓度为750nM干细胞扩增剂。
在制备细胞(例如,细胞群)的方法的方面,步骤(b)的培养包括在步骤(c)的引入之前的培养期,例如,在步骤(c)的引入之前的培养期为至少12小时,例如为约1天至约12天的时间段,例如为约1天至约6天的时间段,例如为约1天至约3天的时间段,例如为约1天至约2天的时间段,或为约2天的时间段。在制备细胞(例如,细胞群)的方法的方面,包括在该方法的任何前述方面和实施例中,步骤(b)的培养包括在步骤(c)的引入之后的培养期,例如,在步骤(c)的引入之后的培养期为至少12小时,例如为约1天至约12天的时间段,例如为约1天至约6天的时间段,例如为约2天至约4天的时间段,例如为约2天的时间段或为约3天的时间段或为约4天的时间段。在制备细胞(例如,细胞群)的方法的方面,包括在该方法的任何前述方面和实施例中,细胞群例如相对于未根据步骤(b)培养的细胞扩增至少4倍,例如至少5倍、例如至少10倍。
在制备细胞(例如,细胞群)的方法的方面,包括在该方法的任何前述方面和实施例中,步骤(c)的引入包括电穿孔。在一些方面,电穿孔包括1至5个脉冲,例如1个脉冲,并且其中每个脉冲处于范围从700伏至2000伏的脉冲电压下,并且具有范围从10ms至100ms的脉冲持续时间。在一些方面,电穿孔包括1个脉冲例如由1个脉冲组成。在一些方面,脉冲(或多于一个脉冲)电压范围为1500至1900伏,例如1700伏。在一些方面,一个脉冲或多于一个脉冲的脉冲持续时间在10ms到40ms的范围内,例如是20ms。
在制备细胞(例如,细胞群)的方法的方面,包括在该方法的任何前述方面和实施例中,步骤(a)中提供的细胞(例如细胞群)是人细胞(例如人细胞群)。在制备细胞(例如,细胞群)的方法的方面,包括在该方法的任何前述方面和实施例中,步骤(a)中提供的细胞(例如细胞群)自骨髓、外周血(例如动员的外周血)或脐带血分离。在制备细胞(例如,细胞群)的方法的方面,包括在该方法的任何前述方面和实施例中,步骤(a)中提供的细胞(例如细胞群)自骨髓分离,例如自患有血红蛋白病的患者的骨髓分离。
在制备细胞(例如细胞群)的方法中,包括在该方法的任何前述方面和方法的实施例中,步骤(a)中提供的细胞群富含CD34+细胞。
在制备细胞(例如,细胞群)的方法的方面,包括在该方法的任何前述方面和实施例中,继步骤(c)的引入之后,将该细胞(例如细胞群)冷冻保存。
在制备细胞(例如,细胞群)的方法的方面,包括在该方法的任何前述方面和实施例中,继步骤(c)的引入之后,该细胞(例如细胞群)包括:a)与该第一gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;或b)缺失,其包括WIZ基因区中与第一gRNA分子的靶向结构域互补(例如,与gRNA靶向结构域至少90%互补,例如,与gRNA靶向结构域完全互补)的序列,例如基本上所有的序列gRNA靶向结构域)。
在制备细胞(例如,细胞群)的方法中,包括在该方法的任何前述方面和实施例中,在步骤(c)的引入之后,细胞群的至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的细胞包括在与第一gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失。
在一方面,本发明提供细胞(例如,细胞群),其可通过本文所述(例如,在任何上述制备细胞的方法方面和实施例中所述)的制备细胞(例如,细胞群)的方法获得。
在一方面,本发明提供治疗人患者的血红蛋白病的方法,该方法包括向人患者施用包含本文所述细胞(例如任何前述细胞方面和实施例的细胞)的组合物;或本文所述的细胞群(例如任何前述细胞群方面和实施例的细胞群)。在一些方面,血红蛋白病是β-地中海贫血。在一些方面,血红蛋白病是镰状细胞疾病。
在一方面,本发明提供增加人患者中胎儿血红蛋白表达的方法,该方法包括向人患者施用包含本文所述细胞(例如任何前述细胞方面和实施例的细胞)的组合物;或本文所述的细胞群(例如任何前述细胞群方面和实施例的细胞群)。在一些方面,人患者具有β-地中海贫血。在一些方面,人患者患有镰状细胞疾病。
在治疗血红蛋白病的方法或增加胎儿血红蛋白表达的方法的方面,向人患者施用包含至少约1e6个细胞(例如,如本文所述的细胞)的组合物/千克人患者体重,例如至少约1e6个CD34+细胞(例如,如本文所述的细胞)/千克人患者体重。在治疗血红蛋白病的方法或增加胎儿血红蛋白表达的方法的方面,向人患者施用包含至少约2e6个细胞(例如,如本文所述的细胞)的组合物/千克人患者体重,例如至少约2e6个CD34+细胞(例如,如本文所述的细胞)/千克人患者体重。在治疗血红蛋白病的方法或增加胎儿血红蛋白表达的方法的方面,向人患者施用包含约2e6个细胞(例如,如本文所述的细胞)的组合物/千克人患者体重,例如约2e6个CD34+细胞(例如,如本文所述的细胞)/千克人患者体重。在治疗血红蛋白病的方法或增加胎儿血红蛋白表达的方法的方面,向人患者施用包含至少约3e6个细胞(例如,如本文所述的细胞)的组合物/千克人患者体重,例如至少约3e6个CD34+细胞(例如,如本文所述的细胞)/千克人患者体重。在治疗血红蛋白病的方法或增加胎儿血红蛋白表达的方法的方面,向人患者施用包含约3e6个细胞(例如,如本文所述的细胞)的组合物/千克人患者体重,例如约3e6个CD34+细胞(例如,如本文所述的细胞)/千克人患者体重。在治疗血红蛋白病的方法或增加胎儿血红蛋白表达的方法的方面,向人患者施用包含约2e6至约10e6个细胞(例如,如本文所述的细胞)的组合物/千克人患者体重,例如约2e6至约10e6个CD34+细胞(例如,如本文所述的细胞)/千克人患者体重。
本文还提供了治疗血红蛋白病和通过向患者施用细胞或细胞群或含有本文所述的此类细胞或细胞群的组合物或降低WIZ基因表达和/或WIZ蛋白活性的组合物的方法。在一些方面,降低WIZ基因表达和/或WIZ蛋白活性的组合物包含小分子化合物(例如,WIZ降解剂)、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。在一些方面,血红蛋白病是β-地中海贫血或镰状细胞疾病。
本文还提供了治疗血红蛋白病和通过向患者施用细胞或细胞群或含有本文所述的此类细胞或细胞群的组合物或降低WIZ基因表达和/或WIZ蛋白活性的组合物来增加哺乳动物中胎儿血红蛋白表达的方法。在一些方面,降低WIZ基因表达和/或WIZ蛋白活性的组合物包含小分子化合物(例如,WIZ降解剂)、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。
在一方面,本发明提供:本文所述的gRNA分子,例如任何上述gRNA分子方面和实施例的gRNA分子;本文所述的组合物,例如任何上述组合物方面和实施例的组合物,本文所述的核酸,例如任何上述核酸方面和实施例的核酸;本文描述的载体,例如任何前述载体方面和实施例的载体;本文所述的细胞,例如任何前述细胞方面和实施例的细胞;或本文所述的细胞群,例如任何上述细胞群方面和实施例的细胞群,或降低WIZ基因表达和/或WIZ蛋白活性方面和实施例的组合物,用作药物。在一些方面,降低WIZ基因表达和/或WIZ蛋白活性的组合物包含小分子化合物(例如,WIZ降解剂)、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。
在一方面,本发明提供:本文所述的gRNA分子,例如任何上述gRNA分子方面和实施例的gRNA分子;本文所述的组合物,例如任何上述组合物方面和实施例的组合物,本文所述的核酸,例如任何上述核酸方面和实施例的核酸;本文描述的载体,例如任何前述载体方面和实施例的载体;本文所述的细胞,例如任何前述细胞方面和实施例的细胞;或本文所述的细胞群,例如任何上述细胞群方面和实施例的细胞群,或降低WIZ基因表达和/或WIZ蛋白活性方面和实施例的组合物,用于制造药物。在一些方面,降低WIZ基因表达和/或WIZ蛋白活性的组合物包含小分子化合物(例如,WIZ降解剂)、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。
在一方面,本发明提供:本文所述的gRNA分子,例如任何上述gRNA分子方面和实施例的gRNA分子;本文所述的组合物,例如任何上述组合物方面和实施例的组合物,本文所述的核酸,例如任何上述核酸方面和实施例的核酸;本文描述的载体,例如任何前述载体方面和实施例的载体;本文所述的细胞,例如任何前述细胞方面和实施例的细胞;或本文所述的细胞群,例如任何上述细胞群方面和实施例的细胞群,或降低WIZ基因表达和/或WIZ蛋白活性方面和实施例的组合物,用于治疗疾病。在一些方面,降低WIZ基因表达和/或WIZ蛋白活性的组合物包含小分子化合物(例如,WIZ降解剂)、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。
在一方面,本发明提供:本文所述的gRNA分子,例如任何上述gRNA分子方面和实施例的gRNA分子;本文所述的组合物,例如任何上述组合物方面和实施例的组合物,本文所述的核酸,例如任何上述核酸方面和实施例的核酸;本文描述的载体,例如任何前述载体方面和实施例的载体;本文所述的细胞,例如任何前述细胞方面和实施例的细胞;或本文所述的细胞群,例如任何上述细胞群方面和实施例的细胞群,或降低WIZ基因表达和/或WIZ蛋白活性方面和实施例的组合物,用于治疗疾病,其中该疾病是血红蛋白病,例如β-地中海贫血或镰状细胞疾病。在一些方面,降低WIZ基因表达和/或WIZ蛋白活性的组合物包含小分子化合物(例如,WIZ降解剂)、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。
附图说明
图1A来自WIZ KO细胞的差异表达基因与加扰gRNA对照相比的火山图。每个点代表一个基因。HBG1/2基因与靶向WIZ基因的WIZ_6和WIZ_18gRNA差异性地上调。
图1B由于shRNA介导的WIZ在人动员的外周血CD34+源性红系细胞中的缺失而导致的HbF+细胞的频率。
图1C由于CRISPR/Cas9介导的WIZ在人动员的外周血CD34+源性红系细胞中的缺失而导致的HbF+细胞的频率。
缩写
ACN 乙腈
AcOH 乙酸
AMO 抗微小RNA寡核苷酸
aq. 水性的
ASO 反义寡核苷酸
Boc2O 二碳酸二叔丁酯
br 宽峰
BSA 牛血清白蛋白
Cas9 CRISPR相关蛋白9
CRISPR 成簇的规则间隔短回文重复序列
crRNA CRISPR RNA
d 双重峰
DCE 1,2-二氯乙烷
DCM 二氯甲烷
dd 双重双重峰
ddd 双重双重双重峰
ddq 双重双重四重峰
ddt 双重双重三重峰
DIPEA N,N-二异丙基乙胺
DIPEA (DIEA)二异丙基乙胺
DMA N,N-二甲基乙酰胺
DMAP 4-二甲基氨基吡啶
DME 1,2-二甲氧基乙烷
DMEM 杜尔贝科改良伊格尔培养基
DMF N,N-二甲基甲酰胺
DMSO 二甲亚砜
DMSO 二甲亚砜
dq 双四重峰
dt 双三重峰
dtbbpy 4,4′-二-叔丁基-2,2′-二吡啶基
dtd 双重三重双重峰
DTT 二硫苏糖醇
EC50 半数最大有效浓度
EDTA 乙二胺四乙酸
eGFP 增强的绿色荧光蛋白
ELSD 蒸发光散射检测器
Et2O 乙醚
Et3N 三乙胺
EtOAc 乙酸乙酯
EtOH 乙醇
FACS 荧光激活细胞分选
FBS 胎牛血清
FITC 荧光素
Flt3L Fms相关的酪氨酸激酶3配体,Flt3L
g 克
g/min 克/分钟
h或hr 小时
HbF 胎儿血红蛋白
HCl 氯化氢
HEPES (4-(2-羟基乙基)-1-哌嗪乙磺酸)
hept 七重峰
HPLC 高效液相色谱法
HRMS 高分辨质谱法
IC50 半数最大抑制浓度
IMDM 伊斯科夫改良的杜尔贝科培养基(Iscove’s modified Dulbecco’s medium)
IPA(iPrOH) 异丙醇
Ir[(dF(CF3)ppy)2dtbbpy]PF6 [4,4′-双(1,1-二甲基乙基)-2,2′-二吡啶-N1,N1′]双[3,5-二氟-2-[5-(三氟甲基)-2-吡啶基-N]苯基-C]铱(III)六氟磷酸盐
KCl 氯化钾
LCMS 液相色谱质谱法
m 多重峰
M 摩尔
MeCN 乙腈
MeOH 甲醇
mg 毫克
MHz 兆赫
min 分钟
mL 毫升
mmol 毫摩尔
mPB 动员的外周血
MS 质谱法
MsCl 甲磺酰氯(CH3SO2Cl)
MsOH 甲烷磺酸(CH3SO3H)
Na2SO4 硫酸钠
NaBH(OAc)3 三乙酰氧基硼氢化钠
NaHCO3 碳酸氢钠
NMR 核磁共振
on 过夜
PBS 磷酸盐缓冲盐水
PdCl2(dppf)·DCM 与二氯甲烷复合的[1,1'-双(二苯基膦基)二茂铁]二氯钯(II)
q 四重峰
qd 四重双重峰
quint 五重峰
quintd 五重双重峰
rbf 圆底烧瓶
rhEPO 重组人红细胞生成素
rhIL-3 重组人白细胞介素-3
rhIL-6 重组人白细胞介素-6
rhSCF 重组人干细胞因子
rhTPO 重组人血小板生成素
RNP 核糖核蛋白
Rt 保留时间
rt或r.t. 室温
s 单峰
SEM 2-(三甲基甲硅烷基)乙氧基甲基
shRNA 短发夹RNA
t 三重峰
td 三双重峰
tdd 三重双重双重峰
TEA(NEt3) 三乙胺
TFA 三氟乙酸
TfOH 三氟甲磺酸
THF 四氢呋喃
TLC 薄层色谱法
TMP 2,2,6,6-四甲基哌啶
tracrRNA 反式激活crRNA
Ts 甲苯磺酰基
tt 三重三重峰
ttd 三重三重双重峰
μW或uW 微波
UPLC 超高效液相色谱法
WIZ 含有宽间隔的锌指的蛋白
具体实施方式
定义
术语“CRISPR系统”、“Cas系统”或“CRISPR/Cas系统”是指包含RNA指导的核酸酶或其他效应分子和gRNA分子的一组分子,它们一起对于指导和实现由RNA指导的核酸酶或其他效应分子在靶序列处对核酸的修饰是必需且足够的。在一个实施例中,CRISPR系统包含gRNA和Cas蛋白(例如Cas9蛋白)。包含Cas9或经修饰的Cas9分子的此类系统在本文中称为“Cas9系统”或“CRISPR/Cas9系统”。在一个实例中,gRNA分子和Cas分子可以复合,以形成核糖核蛋白(RNP)复合物。
术语“指导RNA”、“指导RNA分子”、“gRNA分子”或“gRNA”可互换使用,并且是指促进将RNA指导的核酸酶或其他效应分子(通常与gRNA分子复合)特异性指导到靶序列上的一组核酸分子。在一些实施例中,通过将gRNA的部分与DNA杂交(例如通过gRNA靶向结构域)以及通过将gRNA分子的部分与RNA指导的核酸酶或其他效应分子结合(例如,至少通过gRNAtracr)来实现所述指导。在实施例中,gRNA分子由单个连续的多核苷酸分子组成,在本文中称为“单指导RNA”或“sgRNA”等。在其他实施例中,gRNA分子由多个,通常是两个多核苷酸分子组成,这些多核苷酸分子本身能够缔合,通常通过杂交,在本文中称为“双指导RNA”或“dgRNA”等。gRNA分子在下面更详细地描述,但通常包含靶向结构域和tracr。在实施例中,靶向结构域和tracr被布置于单个多核苷酸上。在其他实施例中,靶向结构域和tracr被布置于分开的多核苷酸上。
术语“靶向结构域”(当所述术语与gRNA结合使用时)是gRNA分子的部分,其识别靶序列(例如细胞核酸内的靶序列,例如在基因内),例如与其互补。
术语“crRNA”(当所述术语与gRNA分子结合使用时)是gRNA分子的部分,其包含靶向结构域和与tracr相互作用以形成标志杆区域的区域。
术语“靶序列”是指与gRNA靶向结构域互补,例如完全互补的核酸序列。在实施例中,靶序列被布置于基因组DNA上。在一个实施例中,靶序列与由具有核酸酶或其他效应子活性的蛋白质识别的前间区邻近基序(PAM)序列(例如由Cas9识别的PAM序列)相邻(在DNA的相同链上或在DNA的互补链上)。在实施例中,靶序列是影响珠蛋白基因表达,例如影响β珠蛋白或胎儿血红蛋白(HbF)表达的基因或基因座内的靶序列。在实施例中,靶序列是WIZ基因区内的靶序列。
如在本文中与gRNA分子结合使用的术语“标志杆(flagpole)”是指gRNA的部分,其中crRNA和tracr彼此结合或杂交。
如在本文中与gRNA分子结合使用的术语“tracr”是指gRNA的与核酸酶或其他效应分子结合的部分。在实施例中,tracr包含与Cas9特异性结合的核酸序列。在实施例中,tracr包含形成标志杆的部分的核酸序列。
术语“Cas9”或“Cas9分子”是指来自细菌II型CRISPR/Cas系统的负责DNA切割的酶。Cas9还包括野生型蛋白质及其功能性和非功能性突变体。在实施例中,Cas9为酿脓链球菌的Cas9。
如与核酸结合使用的术语“互补”是指碱基A与T或U和G与C的配对。术语互补是指完全互补的核酸分子,即整个参考序列中的形式A与T或U对和G与C对,以及至少80%、85%、90%、95%、99%互补的分子。
如与同源定向修复或同源重组结合使用的“模板核酸”是指通过CRISPR系统供体序列插入修饰位点以在切割位点处进行基因修复(插入)的核酸。
“插入/缺失(indel)”(当所述术语在本文中使用时)是指相对于参考核酸包含一个或多个核苷酸插入、一个或多个核苷酸缺失、或核苷酸插入和缺失的组合的核酸,其在暴露于包含gRNA分子的组合物(例如CRISPR系统)之后产生。插入/缺失可以通过在暴露于包含gRNA分子的组合物之后对核酸进行测序来确定,例如通过NGS。关于插入/缺失的位点,如果插入/缺失包含参考位点的约10、9、8、7、6、5、4、3、2或1个核苷酸内的至少一个插入或缺失,或者插入/缺失与所述参考位点的部分或全部重叠(例如,包含至少一个与gRNA分子例如本文所述的gRNA分子的靶向结构域互补的位点的10、9、8、7、6、5、4、3、2或1个核苷酸重叠的插入或缺失,或至少一个在gRNA分子例如本文所述的gRNA分子的靶向结构域互补的位点的10、9、8、7、6、5、4、3、2或1个核苷酸内的插入或缺失),则称插入/缺失位于参考位点(例如,与gRNA分子的靶向结构域互补的位点)“处或附近”。在实施例中,插入/缺失是大缺失,例如,包含大于约1kb、大于约2kb、大于约3kb、大于约4kb、大于约5kb、大于约6kb、或大于约10kb的核酸。在实施例中,大缺失的5'端,3'端或5'和3'端均置于本文所述的gRNA分子的靶序列处或附近。在实施例中,大缺失包括位于例如本文所述的gRNA分子的在WIZ基因区内的靶序列之间的约4.9kb DNA。
“插入/缺失模式(indel pattern)”(当所述术语在本文中使用时)是指在暴露于包含gRNA分子的组合物之后产生的一组插入/缺失。在一个实施例中,依据出现频率,插入/缺失模式由前三个插入/缺失组成。在一个实施例中,依据出现频率,插入/缺失模式由前五个插入/缺失组成。在一个实施例中,插入/缺失模式由相对于所有测序读数以大于约1%的频率存在的插入/缺失组成。在一个实施例中,插入/缺失模式由相对于所有测序读数以大于约5%的频率存在的插入/缺失组成。在一个实施例中,插入/缺失模式由相对于插入/缺失测序读数(即,不是由未经修饰的参考核酸序列组成的那些读数)的总数以大于约10%的频率存在的插入/缺失组成。在一个实施例中,插入/缺失模式包含前五个最常观察到的插入/缺失中的任何3个。插入/缺失模式可以例如通过本文所述的方法,例如通过对暴露于gRNA分子的细胞群中的细胞进行测序来确定。
“脱靶插入/缺失”(当该术语在本文中使用时)是指在除了gRNA分子的靶向结构域的靶序列以外的位点处或附近的插入/缺失。相对于gRNA的靶向结构域的序列,此类位点可以包含例如1、2、3、4、5个或更多个错配核苷酸。在示例性实施例中,使用经由计算机模拟预测的脱靶位点的靶向测序或通过本领域已知的插入方法来检测此类位点。关于本文所述的gRNA,脱靶插入/缺失的实例是在WIZ基因区外部的序列处形成的插入/缺失。在示例性实施例中,脱靶插入/缺失在基因的序列中形成,例如在基因的编码序列内。
术语“一个/种(a/an)”是指一个/种或多于一个/种(即,至少一个/种)该冠词的语法宾语。通过举例,“一个元件”意指一个元件或多于一个元件。
除非另有指示,否则术语“和/或”表示“和”或者“或”。
当指可测量的值如量、时距等时,术语“约”意在涵盖与规定值±20%或在一些情况下±10%、或在一些情况下±5%、或在一些情况下±1%、或在一些情况下±0.1%的变化,因为此类变化适于执行所披露的方法。
术语“抗原”或“Ag”是指引起免疫应答的分子。免疫应答可以涉及抗体产生或特定免疫活性细胞的活化或两者。技术人员将理解实际上包括所有蛋白质或肽的任何大分子都可以充当抗原。此外,抗原可以衍生自重组或基因组DNA。技术人员将理解包含编码引发免疫应答的蛋白质的核苷酸序列或部分核苷酸序列的任何DNA都因此编码“抗原”(当该术语在本文中使用时)。此外,本领域技术人员将理解抗原不需要仅由基因的全长核苷酸序列编码。显而易见的是,本发明包括但不限于使用多于一种基因的部分核苷酸序列,并且这些核苷酸序列以各种组合排列以编码引发所希望的免疫应答的多肽。另外,技术人员将理解抗原根本不需要由“基因”编码。显而易见的是,抗原可以合成或可以衍生自生物样品,或者可以是除多肽外的大分子。这种生物样品可以包括但不限于组织样品、细胞或具有其他生物组分的流体。
术语“自体的”是指源自与后来再将其引入到其中的同一个体的任何材料。
术语“同种异体的”是指源自与引入材料的个体相同的物种的不同动物的任何材料。当一个或多个基因座处的基因不相同时,称两个或更多个个体彼此是同种异体的。在一些方面,来自相同物种的个体的同种异体材料可以在遗传上充分不同以抗原性地相互作用。
术语“异种的”是指源自不同物种的动物的移植物。
“源自”(当该术语在本文中使用时)表示第一分子和第二分子之间的关系。它通常是指第一分子和第二分子之间的结构相似性,并不暗示或包括对衍生自第二分子的第一分子的过程或来源的限制。
术语“编码”是指多核苷酸(如基因、cDNA或mRNA)中特定核苷酸序列用作在生物过程中用于合成具有确定核苷酸序列(例如,rRNA、tRNA和mRNA)或确定氨基酸序列的其他聚合物和大分子的模板的固有特性,以及由此产生的生物学特性。因此,如果与基因对应的mRNA的转录和翻译在细胞或其他生物系统中产生蛋白质,则该基因、cDNA或RNA编码该蛋白质。编码链(其核苷酸序列与mRNA序列相同并且通常在序列表中提供)和非编码链(用作基因或cDNA转录的模板)都可以称为编码蛋白质或者该基因或cDNA的其他产物。
除非另外说明,否则“编码氨基酸序列的核苷酸序列”包括彼此呈简并形式且编码相同氨基酸序列的所有核苷酸序列。短语编码蛋白质或RNA的核苷酸序列还可以包含内含子,其程度为编码该蛋白质的核苷酸序列可以在某些形式中含有一个或多个内含子。
术语“有效量”和“治疗有效量”在本文中可互换使用,是指如本文所述的化合物、配制品、材料或组合物的量,其有效实现特定生物学结果,例如,酶或蛋白活性的减小或抑制或减轻症状、缓解病症、减缓或延迟疾病进展或预防疾病等。在一个实施例中,术语“治疗有效量”是指本披露内容的化合物的以下量,当向受试者施用时,所述量有效地:(1)至少部分地缓解、预防和/或改善(i)由WIZ介导、或(ii)与WIZ活性相关、或(iii)以WIZ的活性(正常或异常)为特征的病症或障碍或疾病;(2)降低或抑制WIZ的活性;或(3)降低或抑制WIZ基因和/或蛋白的表达水平。在另一个实施例中,术语“治疗有效量”是指本披露的化合物的以下量,当施用至细胞、或组织、或非细胞生物材料、或介质时,所述量有效地至少部分地降低或抑制WIZ的活性;或至少部分地降低或抑制WIZ基因和/或蛋白质的表达水平。
如本文所用,术语“抑制(inhibit、inhibition或inhibiting)”是指减少或抑制给定的病症、症状、或障碍、或疾病,或生物活性或过程或分子的基础活性的显著降低,或基因和/或目的蛋白质的基线表达水平降低。
术语“内源的”是指来自生物体、细胞、组织或系统或在其内部产生的任何材料。
术语“外源的”是指从生物体、细胞、组织或系统引入或在其外部产生的任何材料。
术语“表达”是指由启动子驱动的特定核苷酸序列的转录和/或翻译。
术语“转移载体”是指包含分离的核酸并且可用于向细胞内部递送所述分离的核酸的物质组合物。许多载体在本领域中是已知的,包括但不限于线性多核苷酸、与离子化合物或两亲化合物相关的多核苷酸、质粒、以及病毒。因此,术语“转移载体”包括自主复制的质粒或病毒。该术语还应当解释为进一步包括促进将核酸转移到细胞中的非质粒和非病毒化合物,例如像聚赖氨酸化合物、脂质体等。病毒转移载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体、慢病毒载体等。
术语“表达载体”是指包含重组多核苷酸的载体,所述重组多核苷酸包含与有待表达的核苷酸序列可操作地连接的表达控制序列。表达载体包含足够的用于表达的顺式作用元件;用于表达的其他元件可以由宿主细胞提供或在体外表达系统中提供。表达载体包括本领域已知的所有表达载体,包括掺入重组多核苷酸的粘粒、质粒(例如,裸露的或包含在脂质体中)和病毒(例如,慢病毒、逆转录病毒、腺病毒和腺相关病毒)。
术语“同源的”或“同一性”是指两个聚合分子之间(例如,两个核酸分子(如两个DNA分子或两个RNA分子)之间、或两个多肽分子之间)的亚基序列同一性。当这两个分子中的亚基位置被相同的单体亚基占据时;例如,如果两个DNA分子中的每一个中的位置被腺嘌呤占据,则它们在该位置是同源的或相同的。两个序列之间的同源性是匹配位置或同源位置的数量的直接函数;例如,如果两个序列中一半的位置(例如,长度为十个亚基的聚合物中的五个位置)是同源的,则这两个序列是50%同源的;如果90%的位置(例如,10个中的9个)是匹配的或同源的,则这两个序列是90%同源的。
术语“分离的”意指从天然状态改变的或去除的。例如,天然存在于活体动物中的核酸或肽不是“分离的”,但是与其天然状态的共存材料部分或完全分开的相同核酸或肽是“分离的”。分离的核酸或蛋白质能以基本上纯化的形式存在,或者可以存在于非天然环境(例如像,宿主细胞)中。
术语“可操作地连接”或“转录控制”是指调控序列和异源核酸序列之间的导致后者的表达的功能性连接。例如,当第一核酸序列被放置成与第二核酸序列有功能关系时,该第一核酸序列与该第二核酸序列可操作地连接。例如,如果启动子影响编码序列的转录或表达,则该启动子与该编码序列可操作地连接。可操作地连接的DNA序列可以彼此邻接,并且例如在需要连接两个蛋白质编码区的情况下,它们处于同一阅读框中。
术语“肠胃外”施用免疫原性组合物包括例如皮下(s.c.)、静脉内(i.v.)、肌肉内(i.m.)、或胸骨内注射、肿瘤内或输注技术。
术语“核酸”或“多核苷酸”是指单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非特别限定,否则该术语涵盖含有已知的天然核苷酸类似物的核酸,这些核酸具有与参考核酸类似的结合特性并且以与天然存在的核苷酸类似的方式进行代谢。除非另外指出,否则特定的核酸序列还隐含地涵盖其保守修饰的变体(例如,简并密码子取代)、等位基因、直向同源物、SNP和互补序列以及明确指明的序列。具体地,简并密码子取代可以通过产生如下序列而获得,在这些序列中,一个或多个所选的(或全部)密码子的第三位被混合碱基和/或脱氧肌苷残基取代(Batzer等人,Nucleic Acid Res.[核酸研究]19:5081(1991);Ohtsuka等人,J.Biol.Chem.[生物化学杂志]260:2605-2608(1985);和Rossolini等人,Mol.Cell.Probes[分子与细胞探针]8:91-98(1994))。
术语“肽”、“多肽”和“蛋白质”可互换地使用,并且是指包含由肽键共价连接的氨基酸残基的化合物。蛋白质或肽必须含有至少两个氨基酸,并且对可构成蛋白质或肽序列的氨基酸的最大数量没有限制。多肽包括包含由肽键彼此相连的两个或更多个氨基酸的任何肽或蛋白质。如本文所用,该术语是指短链,例如其在本领域中通常也称为肽、寡肽和寡聚体;并且还是指较长的链,其在本领域中通常称为蛋白质,存在有很多类型的蛋白质。“多肽”包括例如生物活性片段、基本上同源的多肽、寡肽、同源二聚体、异源二聚体、多肽的变体、经修饰的多肽、衍生物、类似物、融合蛋白等。多肽包括天然肽、重组肽、或其组合。
术语“启动子”是指启动多核苷酸序列的特异性转录所需的由细胞合成机器或引入的合成机器所识别的DNA序列。
术语“启动子/调控序列”是指表达与启动子/调控序列可操作地连接的基因产物所需的核酸序列。在一些情况下,该序列可以是核心启动子序列,并且在其他情况下,该序列还可以包含增强子序列和表达基因产物所需的其他调节元件。启动子/调控序列可以是例如以组织特异性方式表达基因产物的启动子/调控序列。
术语“组成型”启动子是指当与编码或指定基因产物的多核苷酸可操作地连接时,在细胞的大多数或全部生理条件下致使基因产物在细胞中产生的核苷酸序列。
术语“诱导型”启动子是指当与编码或指定基因产物的多核苷酸可操作地连接时,基本上仅在对应于启动子的诱导物存在于细胞中时才致使基因产物在细胞中产生的核苷酸序列。
术语“组织特异性”启动子是指当与编码或由基因指定的多核苷酸可操作地连接时,基本上仅在细胞是对应于启动子的组织类型的细胞时才致使基因产物在细胞中产生的核苷酸序列。
如本文所用,“调节剂”或“降解剂”意指例如本披露的化合物,所述化合物有效调节、减少、或降低特异性蛋白(例如WIZ)的水平或降解特异性蛋白(例如WIZ)。可以通过将用本披露的化合物处理后剩余的特异性蛋白(例如WIZ)的量与用本披露的化合物处理前测量的存在的特异性蛋白(例如WIZ)的初始量或水平进行比较来测量降解的特异性蛋白(例如WIZ)的量。
如本文所用,“选择性调节剂”、“选择性降解剂”、或“选择性化合物”意指例如本披露的化合物,所述化合物有效调节、减少、或降低特异性蛋白(例如WIZ)的水平或降解特异性蛋白(例如WIZ)(比任何其他蛋白质更大程度)。例如,可以通过将化合物调节、减少或降低特异性蛋白(例如WIZ)的水平或降解特异性蛋白的能力与该化合物调节、减少或降低其他蛋白质水平或降解其他蛋白质的能力进行比较,鉴定“选择性调节剂”、“选择性降解剂”、或“选择性化合物”。在一些实施例中,可以通过测量化合物的EC50或IC50鉴定选择性。降解可以通过介导E3连接酶(例如包含蛋白Cereblon的E3-连接酶复合物)来实现。
如在本文中与信使RNA(mRNA)结合使用,5'帽(也称为RNA帽、RNA 7-甲基鸟苷帽或RNA m7G帽)是已经在转录开始后不久添加到真核信使RNA的“前”端或5'端的经修饰的鸟嘌呤核苷酸。5'帽由与第一转录核苷酸连接的末端基团组成。它的存在对于被核糖体识别和被保护免于RNA酶至关重要。帽添加与转录偶联,并且共转录地发生,使得每个都影响另一个。在转录开始后不久,合成的mRNA的5'端被与RNA聚合酶相关的帽合成复合物结合。这种酶复合物催化mRNA加帽所需的化学反应。合成作为多步生物化学反应进行。可以修饰加帽部分以调制mRNA的功能,如其稳定性或翻译效率。
如本文所用,“体外转录的RNA”或“IVT RNA”是指已在体外合成的RNA,优选mRNA。通常,体外转录的RNA由体外转录载体产生。体外转录载体包含用于产生体外转录的RNA的模板。
如本文所用,“聚(A)”是通过聚腺苷酸化与mRNA附接的一系列腺苷。在用于瞬时表达的构建体的优选实施例中,聚A为50个与5000个之间(SEQ ID NO:3118),优选大于64个,更优选大于100个,最优选大于300个或400个。聚(A)序列可以被化学修饰或酶促修饰以调制mRNA功能,如定位、稳定性或翻译效率。
如本文所用,“聚腺苷酸化”是指聚腺苷酰基部分或其经修饰的变体与信使RNA分子的共价连接。在真核生物中,大多数信使RNA(mRNA)分子在3'端被聚腺苷酸化。3'多聚(A)尾是通过酶(聚腺苷酸聚合酶)的作用添加到前mRNA上的腺嘌呤核苷酸(通常数百个)的长序列。在高等真核生物中,将多聚(A)尾添加到含有特定序列(聚腺苷酸化信号)的转录物上。多聚(A)尾和与其结合的蛋白质有助于保护mRNA免于被外切核酸酶降解。聚腺苷酸化对于转录终止、从细胞核输出mRNA以及翻译也是重要的。聚腺苷酸化在DNA转录成RNA后立即在细胞核中发生,但另外也可稍后在细胞质中发生。在转录已经终止后,通过与RNA聚合酶缔合的内切核酸酶复合物的作用切割mRNA链。切割位点通常被表征为切割位点附近存在碱基序列AAUAAA。在mRNA被切割后,腺苷残基被添加到切割位点处的游离3'端上。
如本文所用,“瞬时”是指非整合转基因的持续数小时、数天或数周的表达,其中表达的时间段小于在整合到基因组中或包含在宿主细胞中的稳定质粒复制子内的情况下基因的表达的时间段。
如本文所用,术语“治疗(treat、treatment和treating)”是指减少或缓解病症例如血红蛋白病的进展、严重性和/或持续时间,或者缓解病症例如血红蛋白病的一种或多种症状(优选地,一种或多种可辨别的症状),这由施用一种或多种疗法(例如一种或多种治疗剂,如本发明的gRNA分子、CRISPR系统或经修饰的细胞)引起。在具体的实施例中,术语“治疗(treat、treatment和treating)”是指改善血红蛋白病病症的至少一种可测量的物理参数,这是患者无法辨别的。在其他实施例中,术语“治疗(treat、treatment和treating)”是指通过例如稳定可辨别的症状来物理地,通过例如稳定物理参数来生理地,或通过两者,抑制病症的进展。在其他实施例中,术语“治疗(treat、treatment和treating)”是指减少或稳定血红蛋白病例如镰状细胞疾病病或β-地中海贫血的症状。
如本文所使用的,术语任何疾病或障碍的“预防(prevent、preventing或prevention)”是指疾病或障碍的预防性治疗;或延迟疾病或障碍的发作或进展。
如本文所用,“HbF依赖性疾病或障碍”意指任何直接地或间接地受HbF蛋白水平的调节影响的疾病或障碍。此类疾病或障碍的优选实例是血红蛋白病,例如镰状细胞疾病或地中海贫血(例如β-地中海贫血)。
如本文所用,如果受试者将在生物学上、在医学上或在生活质量上从治疗中获益,则这样的受试者是“需要”这种治疗的。
术语“信号转导途径”是指在多种信号转导分子之间的生物化学关系,这些信号转导分子在信号从细胞的部分传递至细胞的另一部分中发挥作用。短语“细胞表面受体”包括能够接收信号并且传递信号跨过细胞膜的分子以及分子复合物。
术语“受试者”旨在包括可以在其中引发免疫应答的活生物体(例如,哺乳动物、人)。优选地,术语“受试者”是指灵长类动物(例如,人(男性或女性))、狗、兔、豚鼠、猪、大鼠和小鼠。在某些实施例中,受试者是灵长类动物。在又其他实施例中,受试者是人。
术语“基本上纯化的”细胞是指本质上不含其他细胞类型的细胞。基本上纯化的细胞还指已经与其天然存在状态下正常相关的其他细胞类型分离的细胞。在一些情况下,基本上纯化的细胞群是指同质的细胞群。在其他情况下,该术语仅指已经与其天然状态下天然相关的细胞分离的细胞。在一些方面,在体外培养细胞。在其他方面,不在体外培养细胞。
如本文所用的术语“治疗剂”意指治疗。通过减少、抑制、缓解或根除疾病状态来获得治疗效果。
如本文所用的术语“预防”意指对疾病或疾病状态的预防或保护性治疗。
术语“转染的”或“转化的”或“转导的”是指将外源核酸和/或蛋白质转移或引入宿主细胞中的过程。“转染的”或“转化的”或“转导的”细胞是已经使用外源核酸和/或蛋白质转染、转化或转导的细胞。细胞包括原代主体细胞及其后代。
术语“特异性结合”是指识别并结合样品中存在的结合配偶体(例如蛋白质或核酸)的分子,但该分子基本上不识别或结合样品中的其他分子。
术语“生物当量”是指产生与参考剂量或参考量的参考化合物产生的效果相当的效果所需的除参考化合物之外的试剂的量。
如本文所用的“难治性”是指对治疗无响应的疾病,例如血红蛋白病。在实施例中,难治性血红蛋白病可以在治疗开始之前或治疗开始时对治疗具有抗性。在其他实施例中,难治性血红蛋白病可能在治疗期间变得有抗性。难治性血红蛋白病也称为抗性血红蛋白病。
如本文所用的“复发”是指疾病(例如血红蛋白病)或疾病的体征和症状(如改善期之后,例如在疗法(例如血红蛋白病疗法)的先前治疗后的血红蛋白病)的回返。
范围:贯穿本披露内容,能以范围形式呈现本发明的各个方面。应该理解的是,范围形式的描述仅仅是为了方便以及简洁,不应该被理解为对本发明范围的不灵活的限制。因此,范围的描述应当被认为是具有确切披露的所有可能的子范围以及该范围内的单独数值。例如,范围如从1至6的描述应当被认为是具有确切披露的子范围,如从1至3、从1至4、从1至5、从2至4、从2至6、从3至6等,以及该范围内的单独数字,例如1、2、2.7、3、4、5、5.3、和6。作为另一个实例,范围如95%-99%同一性包括具有95%、96%、97%、98%或99%同一性,并且包括如96%-99%、96%-98%、96%-97%、97%-99%、97%-98%和98%-99%同一性的子范围。无论范围的宽度如何,这都适用。
术语“WIZ”是指含有宽间隔的锌指的蛋白或其转录活性(例如与WIZ相比在至少50%、80%、90%、95%、96%、97%、98%、99%或100%的活性之内)的变体或同源物,以及编码所述蛋白质的基因,以及所有内含子和外显子以及其调节区域,例如启动子和增强子。该基因编码锌指蛋白。WIZ也称为锌指蛋白803、ZNF803、宽间隔锌指基序、WIZ锌指。该术语涵盖WIZ的所有同种型和剪接变体。编码WIZ的人基因被映射到染色体位置第19号染色体:15,419,980-15,449,951(由Ensembl提供)。人和鼠氨基酸和核酸序列可以在公共数据库如GenBank、UniProt和Swiss-Prot中找到,并且人WIZ的基因组序列可以在GenBank中的NC_000019.10找到。WIZ基因是指这个基因组位置,包括所有内含子和外显子。WIZ有多种已知的同种型。在一些实施例中,与天然存在的WIZ蛋白相比,变体或同源物跨整个序列或序列的一部分(例如50、100、150或200个连续氨基酸部分)具有至少90%、95%、96%、97%、98%、99%或100%氨基酸序列同一性。示例性WIZ转录物变体及其基因组坐标显示在表4中。
表4.WIZ转录变体的基因组坐标。
Figure BDA0003693276070000411
Figure BDA0003693276070000421
Figure BDA0003693276070000431
Figure BDA0003693276070000441
Figure BDA0003693276070000451
在实施例中,示例性WIZ转录物变体及其核苷酸序列如下表5所示。
表5.WIZ转录物变体组成。
Figure BDA0003693276070000452
Figure BDA0003693276070000461
Figure BDA0003693276070000471
Figure BDA0003693276070000481
人WIZ的同种型1的肽序列是:
Figure BDA0003693276070000482
Figure BDA0003693276070000491
SEQ ID NO:3173(UniProt标识符:O95785-1)。
其他WIZ蛋白同种型的序列提供于:
同种型2:UniProt O95785-2
同种型3:UniProt O95785-3
同种型4:UniProt O95785-4。
可替代地,WIZ蛋白的同种型具有NCBI参考序列NP_067064.2、NP_001317324.2、NP_001358518.1、NP_001358532.2、XP_005260064.1、XP_005260062.1、XP_005260063.1、XP_005260065.1、XP_005260068.1、XP_006722891.1、XP_005260067.1、XP_011526465.1或XP_024307397.1的氨基酸序列。
如本文所用,人WIZ蛋白还涵盖在其全长上与本文披露的WIZ同种型具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的蛋白质,其中此类蛋白质仍然具有WIZ的至少一种功能。
与核酸结合使用的术语“互补”是指碱基配对,A与T或U,以及G与C。术语互补是指完全互补的核酸分子,即整个参考序列中的形式A与T或U对和G与C对,以及至少80%、85%、90%、95%、99%互补的分子。
术语“造血干细胞和祖细胞”或“HSPC”可互换使用,并且是指包含造血干细胞(“HSC”)和造血祖细胞(“HPC”)两者的细胞群。此类细胞被表征为例如CD34+。在示例性实施例中,HSPC自骨髓分离。在其他示例性实施例中,HSPC自外周血分离。在其他示例性实施例中,HSPC自脐带血分离。在一个实施例中,HSPC被表征为CD34+/CD38-/CD90+/CD45RA-。在实施例中,HSPC被表征为CD34+/CD90+/CD49f+细胞。在实施例中,HSPC被表征为CD34+细胞。在实施例中,HSPC被表征为CD34+/CD90+细胞。在实施例中,HSPC被表征为CD34+/CD90+/CD45RA-细胞。
如本文所用的“干细胞扩增剂”是指相对于不存在所述试剂的相同细胞类型,使细胞(例如HSPC、HSC和/或HPC)以更快的速率增殖(例如数量增加)的化合物。在一个示例性方面,干细胞扩增剂是芳烃受体途径的拮抗剂。下面提供了干细胞扩增剂的其他实例。在实施例中,离体完成增殖,例如数量增加。
“植入(engraftment或engraft)”是指将细胞或组织(例如HSPC群)掺入受者(例如哺乳动物或人受试者)的体内。在一个实例中,植入包括植入的细胞在受者中的生长、扩增和/或分化。在一个实例中,HSPC的植入包括所述HSPC在受者体内分化并生长成红系细胞。
如本文所用的术语“造血祖细胞”(HPC)是指原始造血细胞,其具有有限的自我更新能力和取决于造血等级内的放置的多谱系分化(例如,髓样、淋巴样)、单谱系分化(例如,髓样或淋巴样)或细胞类型限制性分化(例如,类红细胞祖细胞)的潜能(Doulatov等人,Cell Stem Cell[细胞干细胞]2012)。
如本文所用的“造血干细胞”(HSC)是指未成熟的血细胞,其具有自我更新和分化成更成熟的血细胞的能力,这些更成熟的血细胞包括粒细胞(例如,早幼粒细胞、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞)、红细胞(例如,网织红细胞、红细胞)、凝血细胞(例如,原巨核细胞、血小板生成型巨核细胞、血小板)和单核细胞(例如,单核细胞、巨噬细胞)。在整个说明书中,HSC可互换地描述为干细胞。本领域已知此类细胞可以包括或可以不包括CD34+细胞。CD34+细胞是表达CD34细胞表面标志物的未成熟细胞。据信CD34+细胞包括具有以上定义的干细胞特性的细胞亚群。本领域众所周知,HSC是多能细胞,其可以产生原始祖细胞(例如,多能祖细胞)和/或定向于特定造血谱系的祖细胞(例如,淋巴样祖细胞)。定向于特定造血谱系的干细胞可以属于T细胞谱系、B细胞谱系、树突细胞谱系、朗格汉斯细胞谱系和/或淋巴组织特异性巨噬细胞谱系。此外,HSC还指长期HSC(LT-HSC)和短期HSC(ST-HSC)。ST-HSC比LT-HSC更活跃且更具增殖性。然而,LT-HSC具有无限的自我更新(即,它们在整个成年期存活),而ST-HSC具有有限的自我更新(即,它们仅存活有限的时间段)。任何这些HSC都可以用于本文所述的任何方法中。任选地,ST-HSC是有用的,因为它们具高度增殖性,因此快速增加HSC及其后代的数量。造血干细胞任选地获得自血液制品。血液制品包括从体内或含有造血来源的细胞的身体器官获得的产品。此类来源包括未分级的骨髓、脐带、外周血(例如动员的外周血,例如用动员剂如G-CSF或
Figure BDA0003693276070000511
(AMD3100),或G-CSF和
Figure BDA0003693276070000512
(AMD3100)的组合动员的外周血)、肝脏、胸腺、淋巴和脾。所有上述粗制或未分级的血液制品都能以本领域技术人员已知的方法富集具有造血干细胞特征的细胞。在一个实施例中,HSC被表征为CD34+/CD38-/CD90+/CD45RA-。在实施例中,HSC被表征为CD34+/CD90+/CD49f+细胞。在实施例中,HSC被表征为CD34+细胞。在实施例中,HSC被表征为CD34+/CD90+细胞。在实施例中,HSC被表征为CD34+/CD90+/CD45RA-细胞。
细胞背景下的“扩增(expansion或expand)”是指来自细胞(其可以相同或不同)的初始细胞群的特有的一种或多种细胞类型的数量增加。用于扩增的初始细胞可能与产自扩增的细胞不同。
“细胞群”是指从生物来源(例如血液制品或组织)分离并且源自多于一种细胞的真核哺乳动物(优选人)细胞。
当在细胞群背景下使用时,“富集”是指基于一种或多种标志物(例如CD34+)的存在而选择的细胞群。
术语“CD34+细胞”是指在其表面表达CD34标志物的细胞。可以使用例如流式细胞术和荧光标记的抗CD34抗体来检测和计数CD34+细胞。
“富集CD34+细胞”意指已经基于CD34标志物的存在选择细胞群。因此,选择方法之后细胞群中CD34+细胞的百分比高于基于CD34标志物的选择步骤之前初始细胞群中CD34+细胞的百分比。例如,CD34+细胞可代表富含CD34+细胞的细胞群中至少50%、60%、70%、80%或至少90%的细胞。
术语“F细胞”和“F-细胞”是指含有和/或产生(例如表达)胎儿血红蛋白的细胞,通常是红细胞(例如红细胞)。例如,F-细胞是含有或产生可检测水平的胎儿血红蛋白的细胞。例如,F-细胞是含有或产生至少5皮克胎儿血红蛋白的细胞。在另一个实例中,F-细胞是含有或产生至少6皮克胎儿血红蛋白的细胞。在另一个实例中,F-细胞是含有或产生至少7皮克胎儿血红蛋白的细胞。在另一个实例中,F-细胞是含有或产生至少8皮克胎儿血红蛋白的细胞。在另一个实例中,F-细胞是含有或产生至少9皮克胎儿血红蛋白的细胞。在另一个实例中,F-细胞是含有或产生至少10皮克胎儿血红蛋白的细胞。可以使用本文所述的测定法或通过本领域已知的其他方法,例如使用抗胎儿血红蛋白检测试剂的流式细胞术、高效液相色谱法、质谱法或酶联免疫吸附测定法来测量胎儿血红蛋白的水平。
“抑制剂”是抑制细胞功能(例如复制)的肽、siRNA(例如shRNA、miRNA、snoRNA)、gRNA、化合物或小分子,所述抑制是例如通过结合,部分或完全阻断刺激,减少、防止或延迟来抑制激活,或灭活,脱敏,或下调蛋白活性所需的信号转导、基因表达或酶促活性。“WIZ抑制剂”是指与没有这种物质的那些水平相比,导致WIZ基因或WIZ蛋白的可检测的较低表达或WIZ蛋白的较低活性水平的物质。在一些实施例中,WIZ抑制剂是小分子化合物(例如,可以靶向WIZ进行降解的小分子化合物,也称为“WIZ降解剂”)。在一些实施例中,WIZ抑制剂是抗WIZ shRNA。在一些实施例中,WIZ抑制剂是抗WIZ siRNA。在一些实施例中,WIZ抑制剂是抗WIZ ASO。在一些实施例中,WIZ抑制剂是抗WIZ AMO。在一些实施例中,WIZ抑制剂是抗WIZ反义核酸。在一些实施例中,WIZ抑制剂是本文所述的组合物或细胞或细胞群(其包含本文所述的gRNA分子)。
如本文所指的“反义核酸”是与特定靶核酸(例如可翻译成蛋白质的mRNA)的至少一部分互补并且能够减少靶核酸的转录(例如来自DNA的mRNA)或减少靶核酸(例如mRNA)的翻译或改变转录物剪接(例如单链吗啉代寡核苷酸)的核酸(例如DNA或RNA分子)。参见,例如,Weintraub,Scientific American[科学美国人],262:40(1990)。通常,合成反义核酸(例如寡核苷酸)的长度通常在15到25个碱基之间。因此,反义核酸能够与靶核酸(例如靶mRNA)杂交(例如选择性杂交)。在实施例中,反义核酸在严格杂交条件下与靶核酸序列(例如mRNA)杂交。在实施例中,反义核酸在中等严格杂交条件下与靶核酸(例如mRNA)杂交。反义核酸可以包含天然存在的核苷酸或经修饰的核苷酸,例如硫代磷酸酯、甲基膦酸酯和α-异头糖-磷酸骨架修饰的核苷酸。
在细胞中,反义核酸与相应的mRNA杂交,形成双链分子。反义核酸干扰mRNA的翻译,因为细胞不会翻译双链mRNA。使用反义方法抑制基因的体外翻译是本领域众所周知的(Marcus-Sakura,Anal.Biochem.[分析生物化学],172:289,(1988))。此外,可以使用直接与DNA结合的反义分子。反义核酸可以是单链或双链核酸。反义核酸的非限制性实例包括siRNA(包括其衍生物或前体,例如核苷酸类似物)、短发夹RNA(shRNA)、微小RNA(miRNA)、saRNA(小激活RNA)和小核仁RNA(snoRNA)或其某些衍生物或前体。
“siRNA”是指形成双链RNA的核酸,当siRNA与基因或靶基因在同一细胞中存在(例如表达)时该双链RNA具有降低或抑制基因或靶基因表达的能力。siRNA通常为约5至约100个核苷酸长度,更通常为约10至约50个核苷酸长度,更通常为约15至约30个核苷酸长度,最通常为约20-30个碱基核苷酸长度,或约20-25或约24-29个核苷酸长度,例如20、21、22、23、24、25、26、27、28、29或30个核苷酸长度。siRNA分子和产生它们的方法描述于例如Bass,2001,Nature[自然],411,428-429;Elbashir等人,2001,Nature[自然],411,494-498;WO00/44895;WO 01/36646;WO 99/32619;WO 00/01846;WO 01/29058;WO 99/07409;以及WO00/44914。转录dsRNA或siRNA(例如,作为发夹双链体)的DNA分子也提供RNAi。用于转录dsRNA的DNA分子在美国专利号6,573,099和美国专利申请公开号2002/0160393和2003/0027783,以及Tuschl和Borkhardt,Molecular Interventions[分子介入],2:158(2002)中披露。
在siRNA的双链RNA中,与特定靶核酸(例如靶核酸序列)例如mRNA分子(例如靶mRNA分子)的至少一部分至少部分地互补的链称为反义链(或引导链;并且另一条称为有义链(或过客链)。过客链被降解,引导链被整合到RNA诱导的沉默复合体(RISC)中。
短发夹RNA或小发夹RNA(shRNA/发夹载体)是具有紧密发夹转角的人工RNA分子,可用于通过RNA干扰(RNAi)沉默靶基因表达。
反义寡核苷酸(ASO)是与所选序列互补的单链DNA或RNA。在反义RNA的情况下,它们在称为杂交的过程中通过与某些信使RNA链结合来阻止其蛋白质翻译。反义寡核苷酸可用于靶向特定的互补(编码或非编码)RNA。如果发生结合,这种杂合体可以被RNA酶H降解。
抗miRNA寡核苷酸(也称为AMO)是指合成设计的分子(例如寡核苷酸),其用于中和细胞中的微小RNA(miRNA)功能以获得所需的应答。
术语“miRNA”按照其简单的普通含义使用,是指能够在转录后调节基因表达的小的非编码RNA分子。在一个实施例中,miRNA是与靶基因具有实质或完全同一性的核酸。在实施例中,miRNA通过与互补细胞mRNA相互作用从而干扰互补mRNA的表达来抑制基因表达。通常,miRNA的长度至少约为15-50个核苷酸(例如,miRNA的每个互补序列的长度为15-50个核苷酸,并且miRNA的长度约为15-50个碱基对)。在其他实施例中,长度为20-30个碱基核苷酸,优选长度为约20-25或约24-29个核苷酸,例如长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸。
“核酸”是指单链、双链或多链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物,或其互补物。术语“多核苷酸”或“寡核苷酸”是指核苷酸的线性序列。术语“核苷酸”通常是指多核苷酸的单个单元,即单体。核苷酸可以是核糖核苷酸、脱氧核糖核苷酸或其经修饰形式。本文考虑的多核苷酸的实例包括单链和双链DNA、单链和双链RNA(包括siRNA)以及具有单链和双链DNA和RNA混合物的杂合分子。核酸可以是线性的或分支的。例如,核酸可以是核苷酸的线性链,或者核酸可以是分支的,例如,使得核酸包含一个或多个核苷酸臂或分支。任选地,分支的核酸被重复分支以形成更高级的结构,例如树枝状聚合物等。
该术语还涵盖含有已知核苷酸类似物或经修饰的骨架残基或连接的核酸,这些核酸是合成的、天然存在的和非天然存在的,具有与参考核酸类似的结合特性,并且以类似于参考核苷酸的方式代谢。此类类似物的实例包括但不限于磷酸二酯衍生物,包括例如氨基磷酸酯、二氨基磷酸酯、硫代磷酸酯(也称为硫逐磷酸酯)、二硫代磷酸酯、膦酰基羧酸、膦酰基羧酸酯、膦酰基乙酸、膦酰基甲酸、膦酸甲酯、膦酸硼或O-甲基亚磷酰胺连接(参见Eckstein,Oligonucleotides and Analogues:A Practical Approach[寡核苷酸和类似物:一种实用方法],牛津大学出版社);和肽核酸骨架和连接。其他类似物核酸包括那些具有正主链的核酸;非离子主链、经修饰的糖和非核糖主链(例如磷酰二胺吗啉代寡核苷酸或锁核酸(LNA)),包括美国专利号5,235,033和5,034,506以及ASC Symposium Series 580,Carbohydrate Modifications in Antisense Research[研讨会系列580,反义研究中的碳水化合物修饰],Sanghui&Cook编辑第6章和第7章中描述的那些。含有一种或多种碳环糖的核酸也包括在核酸的一种定义中。出于多种原因,可以对核糖-磷酸骨架进行修饰,例如,增加此类分子在生理环境中的稳定性和半衰期或作为生物芯片上的探针。可以制备天然存在的核酸和类似物的混合物;可替代地,可以制备不同核酸类似物的混合物,以及天然存在的核酸和类似物的混合物。在实施例中,DNA中的核苷酸间连接是磷酸二酯、磷酸二酯衍生物或两者的组合。
除非另有说明,否则所有基因组或染色体坐标均根据hg38。
本文所述的gRNA分子、组合物和方法涉及使用CRISPR/Cas9系统在真核细胞中进行基因组编辑。具体地,本文所述的gRNA分子、组合物和方法涉及珠蛋白水平的调节,并且可用于例如调节珠蛋白基因和蛋白质的表达和生产。这些gRNA分子、组合物和方法可用于治疗血红蛋白病。
I.gRNA分子
gRNA分子可具有许多结构域,如下文更全面描述的,然而,gRNA分子通常包含至少一个crRNA结构域(包含靶向结构域)和tracr。用作CRISPR系统的组分的本发明的gRNA分子可用于在靶位点处或附近修饰(例如,修饰序列)DNA。此类修饰包括缺失和或插入,这些缺失和或插入导致例如包含靶位点的基因的功能产物的表达降低或消除。下面更全面地描述了这些用途和另外的用途。
在一个实施例中,单分子或sgRNA优选从5'至3'包含:crRNA(其含有与靶序列互补的靶向结构域和形成标志杆的部分的区(即crRNA标志杆区));环;和tracr(其含有与crRNA标志杆区互补的结构域、和另外结合核酸酶或其他效应分子(例如Cas分子,例如Cas9分子)的结构域);并且可以采用以下形式(从5'至3'):
[靶向结构域]-[crRNA标志杆区]-[任选的第一标志杆延伸部]-[环]-[任选的第一tracr延伸部]-[tracr标志杆区]-[tracr核酸酶结合结构域]。
在实施例中,tracr核酸酶结合结构域结合Cas蛋白,例如Cas9蛋白。
在一个实施例中,双分子或dgRNA包含两种多核苷酸;第一种,优选从5'至3':crRNA(其含有与靶序列互补的靶向结构域和形成标志杆的部分的区);和第二种,优选从5'至3':tracr(其含有与crRNA标志杆区互补的结构域、和另外结合核酸酶或其他效应分子(例如Cas分子,例如Cas9分子)的结构域);并且可以采用以下形式(从5'至3'):
多核苷酸1(crRNA):[靶向结构域]-[crRNA标志杆区]-[任选的第一标志杆延伸部]-[任选的第二标志杆延伸部]
多核苷酸2(tracr):[任选的第一tracr延伸部]-[tracr标志杆区]-[tracr核酸酶结合结构域]
在实施例中,tracr核酸酶结合结构域结合Cas蛋白,例如Cas9蛋白。
在一些方面,靶向结构域包含本文所述的靶向结构域序列或由其组成,例如,表1-表3中所述的靶向结构域,或包含表1-表3中所述的靶向结构域序列的17、18、19、或20个(优选20个)连续核苷酸或由其组成的靶向结构域。
在一些方面,标志杆(例如crRNA标志杆区域)从5'至3'包含:GUUUUAGAGCUA(SEQID NO:3110)。
在一些方面,标志杆(例如crRNA标志杆区域)从5'至3'包含:GUUUAAGAGCUA(SEQID NO:3111)。
在一些方面,环从5'至3'包含:GAAA(SEQ ID NO:3114)。
在一些方面,tracr从5'至3'包含:UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:3115),并且优选地在包含SEQ ID NO:3110的gRNA分子中使用。
在一些方面,tracr从5'至3'包含:UAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:3116),并且优选地在包含SEQ ID NO:3111的gRNA分子中使用。
在一些方面,gRNA还可以在3'端包含另外的U核酸。例如,gRNA可以在3'端包含另外的1、2、3、4、5、6、7、8、9或10个U核酸(SEQ ID NO:3177)。在一个实施例中,gRNA在3'端包含另外的4个U核酸。在dgRNA的情况下,dgRNA的一种或多种多核苷酸(例如,包含靶向结构域的多核苷酸和包含tracr的多核苷酸)可以在3'端包含另外的U核酸。例如,dgRNA的情况,dgRNA的一种或多种多核苷酸(例如,包含靶向结构域的多核苷酸和包含tracr的多核苷酸)可以在3'端包含另外的1、2、3、4、5、6、7、8、9或10个U核酸(SEQ ID NO:3177)。在一个实施例中,在dgRNA的情况下,dgRNA的一种或多种多核苷酸(例如,包含靶向结构域的多核苷酸和包含tracr的多核苷酸)在3'端包含另外的4个U核酸。在dgRNA的一个实施例中,只有包含tracr的多核苷酸包含另外的一个或多个U核酸,例如4个U核酸。在dgRNA的一个实施例中,只有包含靶向结构域的多核苷酸包含另外的一个或多个U核酸。在dgRNA的一个实施例中,包含靶向结构域的多核苷酸和包含tracr的多核苷酸两者都包含另外的U核酸,例如4个U核酸。
在一些方面,gRNA还可以在3'端包含另外的A核酸。例如,gRNA可以在3'端包含另外的1、2、3、4、5、6、7、8、9或10个A核酸(SEQ ID NO:3178)。在一个实施例中,gRNA在3'端包含另外的4个A核酸。在dgRNA的情况下,dgRNA的一种或多种多核苷酸(例如,包含靶向结构域的多核苷酸和包含tracr的多核苷酸)可以在3'端包含另外的A核酸。例如,dgRNA的情况,dgRNA的一种或多种多核苷酸(例如,包含靶向结构域的多核苷酸和包含tracr的多核苷酸)可以在3'端包含另外的1、2、3、4、5、6、7、8、9或10个A核酸(SEQ ID NO:3178)。在一个实施例中,在dgRNA的情况下,dgRNA的一种或多种多核苷酸(例如,包含靶向结构域的多核苷酸和包含tracr的多核苷酸)在3'端包含另外的4个A核酸。在dgRNA的一个实施例中,只有包含tracr的多核苷酸包含另外的一个或多个A核酸,例如4个A核酸。在dgRNA的一个实施例中,只有包含靶向结构域的多核苷酸包含另外的一个或多个A核酸。在dgRNA的一个实施例中,包含靶向结构域的多核苷酸和包含tracr的多核苷酸两者都包含另外的U核酸,例如4个A核酸。
在实施例中,gRNA分子的一种或多种多核苷酸可以在5'端包含帽。
在一个实施例中,单分子或sgRNA优选从5'至3'包含:crRNA(其含有与靶序列互补的靶向结构域);crRNA标志杆区;第一标志杆延伸部;环;第一tracr延伸部(其含有与第一标志杆延伸部的至少一部分互补的结构域);和tracr(其含有与crRNA标志杆区互补的结构域、和另外结合Cas9分子的结构域)。在一些方面,靶向结构域包含本文所述的靶向结构域序列,例如,表1-表3中所述的靶向结构域,或包含表1-表3中所述的靶向结构域序列的17、18、19、或20个(优选20个)连续核苷酸(例如表1-表3中所述的靶向结构域序列的3’17、18、19、或20个(优选20个)连续核苷酸)或由其组成的靶向结构域。
在包含第一标志杆延伸部和/或第一tracr延伸部的方面,标志杆、环和tracr序列可以如上所述。通常,可以采用任何第一标志杆延伸部和第一tracr延伸部,其条件是它们是互补的。在实施例中,第一标志杆延伸部和第一tracr延伸部由3、4、5、6、7、8、9、10个或更多个互补核苷酸组成。
在一些方面,第一标志杆延伸部从5'至3'包含:UGCUG(SEQ ID NO:3112)。在一些方面,第一标志杆延伸部由SEQ ID NO:3112组成。
在一些方面,第一tracr延伸部从5'至3'包含:CAGCA(SEQ ID NO:3117)。在一些方面,第一tracr延伸部由SEQ ID NO:3117组成。
在一个实施例中,dgRNA包含两种核酸分子。在一些方面,dgRNA包含第一核酸,该第一核酸优选从5'至3'含有:与靶序列互补的靶向结构域;crRNA标志杆区;任选地第一标志杆延伸部;和任选地第二标志杆延伸部;以及第二核酸(在本文中其可称为tracr,并且包含至少一个结合Cas分子(例如Cas9分子)的结构域),该第二核酸优选从5'至3'包含:任选地第一tracr延伸部;和tracr(其含有与crRNA标志杆区互补的结构域、和另外结合Cas(例如Cas9)分子的结构域)。第二核酸可以另外在3'端(例如,tracr的3')包含另外的U核酸。例如,tracr可以在3'端(例如,tracr的3')包含另外的1、2、3、4、5、6、7、8、9或10个U核酸(SEQID NO:3177)。第二核酸可以另外地或替代地在3'端(例如,tracr的3')包含另外的A核酸。例如,tracr可以在3'端(例如,tracr的3')包含另外的1、2、3、4、5、6、7、8、9或10个A核酸(SEQ ID NO:3178)。在一些方面,靶向结构域包含本文所述的靶向结构域序列,例如,表1-表3中所述的靶向结构域,或包含表1-表3中所述的靶向结构域序列的17、18、19、或20个(优选20个)连续核苷酸或由其组成的靶向结构域。
在涉及dgRNA的方面,crRNA标志杆区、任选的第一标志杆延伸部、任选的第一tracr延伸部和tracr序列可以如上所述。
在一些方面,任选的第二标志杆延伸部从5'至3'包含:UUUUG(SEQ ID NO:3113)。
在实施例中,gRNA分子的3'1、2、3、4或5个核苷酸,5'1、2、3、4或5个核苷酸,或3'和5'1、2、3、4或5个核苷酸(并且在dgRNA分子的情况下,为包含靶向结构域的多核苷酸和/或包含tracr的多核苷酸)是经修饰的核酸,如在下面部分XIII中更全面描述的。
这些结构域将在下面简要讨论:
1)靶向结构域:
关于靶向结构域的选择的指导可以例如在以下中找到:Fu Y等人NAT BIOTECHNOL[自然生物技术]2014(doi:10.1038/nbt.2808)和Sternberg SH等人NATURE[自然]2014(doi:10.1038/naturel3011)。
靶向结构域包含与靶核酸上的靶序列互补,例如至少80%、85%、90%、95%或99%互补,例如完全互补的核苷酸序列。靶向结构域是RNA分子的部分,因此将包含碱基尿嘧啶(U),而编码gRNA分子的任何DNA将包含碱基胸腺嘧啶(T)。尽管不希望受理论束缚,但据信靶向结构域与靶序列的互补性有助于gRNA分子/Cas9分子复合物与靶核酸相互作用的特异性。应理解,在靶向结构域和靶序列对中,靶向结构域中的尿嘧啶碱基将与靶序列中的腺嘌呤碱基配对。
在一个实施例中,靶向结构域的长度是5至50,例如10至40、例如10至30、例如15至30、例如15至25个核苷酸。在一个实施例中,靶向结构域的长度是15、16、17、18、19、20、21、22、23、24或25个核苷酸。在一个实施例中,靶向结构域的长度是16个核苷酸。在一个实施例中,靶向结构域的长度是17个核苷酸。在一个实施例中,靶向结构域的长度是18个核苷酸。在一个实施例中,靶向结构域的长度是19个核苷酸。在一个实施例中,靶向结构域的长度是20个核苷酸。在实施例中,上述的16、17、18、19或20个核苷酸包含来自表1-表3中所述的靶向结构域的5'-16、17、18、19、或20个核苷酸。在实施例中,上述的16、17、18、19或20个核苷酸包含来自表1-表3中所述的靶向结构域的3'-16、17、18、19、或20个核苷酸。
不受理论束缚,据信布置于靶向结构域的3'端的靶向结构域的8、9、10、11或12个核酸对于靶向靶序列是重要的,因此可以称为靶向结构域的“核心”区域。在一个实施例中,核心结构域与靶序列完全互补。
与靶向结构域互补的靶核酸链在本文中称为靶序列。在一些方面,靶序列被布置于染色体上,例如,是基因内的靶标。在一些方面,靶序列被布置于基因的外显子内。在一些方面,靶序列被布置于基因的内含子内。在一些方面,靶序列包含或接近(例如,在10、20、30、40、50、100、200、300、400、500、或1000个核酸内)目的基因的调节元件的结合位点,例如,启动子或转录因子结合位点。结构域的一些或全部核苷酸可以具有修饰,例如本文部分XIII中找到的修饰。
2)crRNA标志杆区:
标志杆含有来自crRNA和tracr两者的部分。crRNA标志杆区与tracr的部分互补,并且在一个实施例中,与tracr的部分具有足够的互补性,以在至少一些生理条件(例如,正常生理条件)下形成双链区。在一个实施例中,crRNA标志杆区的长度是5至30个核苷酸。在一个实施例中,crRNA标志杆区的长度是5至25个核苷酸。crRNA标志杆区可以与来自细菌CRISPR阵列的重复序列的天然存在的部分具有同源性,或者衍生自来自细菌CRISPR阵列的重复序列的天然存在的部分。在一个实施例中,其与本文披露的crRNA标志杆区(例如酿脓链球菌或嗜热链球菌crRNA标志杆区)具有至少50%的同源性。
在一个实施例中,标志杆(例如crRNA标志杆区)包含SEQ ID NO:3110。在一个实施例中,标志杆(例如crRNA标志杆区)包含与SEQ ID NO:3110具有至少50%、60%、70%、80%、85%、90%、95%或99%同源性的序列。在一个实施例中,标志杆(例如crRNA标志杆区)包含SEQ ID NO:3110的至少5、6、7、8、9、10或11个核苷酸。在一个实施例中,标志杆(例如crRNA标志杆区)包含SEQ ID NO:3111。在一个实施例中,标志杆包含与SEQ ID NO:3111具有至少50%、60%、70%、80%、85%、90%、95%或99%同源性的序列。在一个实施例中,标志杆(例如crRNA标志杆区)包含SEQ ID NO:3111的至少5、6、7、8、9、10或11个核苷酸。
结构域的一些或全部核苷酸可以具有修饰,例如本文部分XIII中描述的修饰。
3)第一标志杆延伸部
当使用包含第一tracr延伸部的tracr时,crRNA可以包含第一标志杆延伸部。通常,可以采用任何第一标志杆延伸部和第一tracr延伸部,其条件是它们是互补的。在实施例中,第一标志杆延伸部和第一tracr延伸部由3、4、5、6、7、8、9、10个或更多个互补核苷酸组成。
第一标志杆延伸部可以包含与第一tracr延伸部的核苷酸互补,例如80%、85%、90%、95%或99%互补,例如完全互补的核苷酸。在一些方面,与第一tracr延伸部的互补核苷酸杂交的第一标志杆延伸部核苷酸是连续的。在一些方面,与第一tracr延伸部的互补核苷酸杂交的第一标志杆延伸部核苷酸是不连续的,例如,包含由不与第一tracr延伸部的核苷酸碱基配对的核苷酸分开的两个或更多个杂交区。在一些方面,第一标志杆延伸部包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸。在一些方面,第一标志杆延伸部从5'至3'包含:UGCUG(SEQ ID NO:3112)。在一些方面,第一标志杆延伸部由SEQ ID NO:3112组成。在一些方面,第一标志杆延伸部包含与SEQ ID NO:3112具有至少80%、85%、90%、95%或99%同源性的核酸。
第一tracr延伸部的一些或全部核苷酸可以具有修饰,例如本文部分XIII中找到的修饰。
3)环
环用于将crRNA标志杆区(或任选地第一标志杆延伸部,当存在时)与sgRNA的tracr(或任选地第一tracr延伸部,当存在时)连接。环可以共价地或非共价地连接crRNA标志杆区和tracr。在一个实施例中,连接是共价的。在一个实施例中,环共价偶联crRNA标志杆区和tracr。在一个实施例中,环共价偶联第一标志杆延伸部和第一tracr延伸部。在一个实施例中,环是或包含插入在crRNA标志杆区与tracr的与crRNA标志杆区杂交的结构域之间的共价键。通常,环包含一个或多个,例如2、3、4、5、6、7、8、9或10个核苷酸。
在dgRNA分子中,这两种分子可以借助于crRNA的至少一部分(例如crRNA标志杆区)和tracr的至少一部分(例如tracr的与crRNA标志杆区互补的结构域)之间的杂交而关联。
多种环适合用于在sgRNA中使用。环可以由共价键组成,或者短至一个或几个核苷酸,例如长度为1、2、3、4或5个核苷酸。在一个实施例中,环的长度是2、3、4、5、6、7、8、9、10、15、20、或25个或更多个核苷酸。在一个实施例中,环的长度是2至50、2至40、2至30、2至20、2至10、或2至5个核苷酸。在一个实施例中,环与天然存在的序列具有同源性,或者衍生自天然存在的序列。在一个实施例中,环与本文披露的环具有至少50%的同源性。在一个实施例中,环包含SEQ ID NO:3114。
结构域的一些或全部核苷酸可以具有修饰,例如本文部分XIII中描述的修饰。
4)第二标志杆延伸部
在一个实施例中,dgRNA可以包含另外的序列(在crRNA标志杆区的3')、或(当存在时)第一标志杆延伸部,在本文中称为第二标志杆延伸部。在一个实施例中,第二标志杆延伸部的长度是2-10、2-9、2-8、2-7、2-6、2-5、或2-4个核苷酸。在一个实施例中,第二标志杆延伸部的长度是2、3、4、5、6、7、8、9或10个或更多个核苷酸。在一个实施例中,第二标志杆延伸部包含SEQ ID NO:3113。
5)Tracr:
tracr是核酸酶(例如Cas9)结合所需的核酸序列。不受理论束缚,据信每种Cas9种类与特定的tracr序列相关。tracr序列用于sgRNA和dgRNA系统两者中。在一个实施例中,tracr包含来自或衍生自酿脓链球菌tracr的序列。在一些方面,tracr具有与crRNA的标志杆部分杂交的部分,例如,与crRNA标志杆区具有足够的互补性,以在至少一些生理条件下形成双链区(在本文中有时称为tracr标志杆区或与crRNA标志杆区互补的tracr结构域)。在实施例中,tracr的与crRNA标志杆区杂交的结构域包含与crRNA标志杆区的互补核苷酸杂交的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些方面,与crRNA标志杆区的互补核苷酸杂交的tracr核苷酸是连续的。在一些方面,与crRNA标志杆区的互补核苷酸杂交的tracr核苷酸是不连续的,例如,包含由不与crRNA标志杆区的核苷酸碱基配对的核苷酸分开的两个或更多个杂交区。在一些方面,tracr的与crRNA标志杆区域杂交的部分从5'至3'包含:UAGCAAGUUAAAA(SEQ ID NO:3119)。在一些方面,tracr的与crRNA标志杆区域杂交的部分从5'至3'包含:UAGCAAGUUUAAA(SEQ ID NO:3120)。在实施例中,与crRNA标志杆区杂交的序列被布置于tracr上,在tracr的另外结合核酸酶(例如Cas分子,例如Cas9分子)的序列的5'-。
tracr进一步包含另外结合核酸酶(例如Cas分子,例如Cas9分子)的结构域。不受理论束缚,据信来自不同物种的Cas9结合不同的tracr序列。在一些方面,tracr包含与酿脓链球菌Cas9分子结合的序列。在一些方面,tracr包含与本文披露的Cas9分子结合的序列。在一些方面,另外结合Cas9分子的结构域从5'至3'包含:UAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:3121)。在一些方面,另外结合Cas9分子的结构域从5'至3'包含:UAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:3122)。
在一些实施例中,tracr包含SEQ ID NO:3115。在一些实施例中,tracr包含SEQ IDNO:3116。
tracr的一些或全部核苷酸可以具有修饰,例如本文部分XIII中找到的修饰。在实施例中,gRNA(例如,sgRNA、或dgRNA的tracr和/或crRNA),例如任何上述gRNA或gRNA组分,在gRNA的5'端、3'端或5'和3'两端包含反向脱碱基残基。在实施例中,gRNA(例如,sgRNA、或dgRNA的tracr和/或crRNA),例如任何上述gRNA或gRNA组分,包含在多核苷酸的5'端残基之间的一个或多个硫代磷酸酯键,例如前两个5'残基之间、前三个5'残基中的每一个之间、前四个5'残基中的每一个之间或前五个5'残基中的每一个之间的硫代磷酸酯键。在实施例中,gRNA或gRNA组分可以替代地或另外地包含在多核苷酸的3'端残基之间的一个或多个硫代磷酸酯键,例如前两个3'残基之间、前三个3'残基中的每一个之间、前四个3'残基中的每一个之间或前五个3'残基中的每一个之间的硫代磷酸酯键。在一个实施例中,gRNA(例如,sgRNA、或dgRNA的tracr和/或crRNA),例如任何上述gRNA或gRNA组分,包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在5'端的三个硫代磷酸酯键,例如由其组成)和在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在3'端的三个硫代磷酸酯键,例如由其组成)。在一个实施例中,任何上述硫代磷酸酯修饰与多核苷酸的5'端、3'端或5'和3'两端的反向脱碱基残基组合。在此类实施例中,反向脱碱基核苷酸可通过磷酸酯键或硫代磷酸酯键与5'和/或3'核苷酸连接。在实施例中,gRNA(例如,sgRNA、或dgRNA的tracr和/或crRNA),例如任何上述gRNA或gRNA组分,包含一个或多个含有2'O-甲基修饰的核苷酸。在实施例中,5'残基中的前1、2、3个或更多个中的每一个包含2'O-甲基修饰。在实施例中,3'残基中的前1、2、3个或更多个中的每一个包含2'O-甲基修饰。在实施例中,相对于末端的第4个、相对于末端的第3个、和相对于末端的第2个3'残基包含2'O-甲基修饰。在实施例中,5'残基中的前1、2、3个或更多个中的每一个包含2'O-甲基修饰,并且3'残基中的前1、2、3个或更多个中的每一个包含2'O-甲基修饰。在一个实施例中,5'残基中的前3个中的每一个包含2'O-甲基修饰,并且3'残基中的前3个中的每一个包含2'O-甲基修饰。在实施例中,5'残基中的前3个中的每一个包含2'O-甲基修饰,并且相对于末端的第4个、相对于末端的第3个、和相对于末端的第2个3'残基包含2'O-甲基修饰。在实施例中,任何例如如上所述的2'O-甲基修饰可以与例如如上所述的一种或多种硫代磷酸酯修饰、和/或例如如上所述的一种或多种倒置脱碱基修饰组合。在一个实施例中,gRNA(例如,sgRNA、或dgRNA的tracr和/或crRNA),例如任何上述gRNA或gRNA组分,包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的5'端的三个硫代磷酸酯键,例如由其组成)、在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的3'端的三个硫代磷酸酯键,例如由其组成)、在前三个5'残基中的每一个处的2'O-甲基修饰、以及在前三个3'残基中的每一个处的2'O-甲基修饰,例如由其组成。在一个实施例中,gRNA(例如,sgRNA、或dgRNA的tracr和/或crRNA),例如任何上述gRNA或gRNA组分,包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的5'端的三个硫代磷酸酯键,例如由其组成),在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的3'端的三个硫代磷酸酯键,例如由其组成),在前三个5'残基中的每一个处的2'O-甲基修饰,以及在相对于末端的第4个、相对于末端的第3个和相对于末端的第2个3'残基中的每一个处的2'O-甲基修饰,例如由其组成。
在一个实施例中,gRNA(例如,sgRNA、或dgRNA的tracr和/或crRNA),例如任何上述gRNA或gRNA组分,包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的5'端的三个硫代磷酸酯键,例如由其组成)、在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的3'端的三个硫代磷酸酯键,例如由其组成)、在前三个5'残基中的每一个处的2'O-甲基修饰、在前三个3'残基中的每一个处的2'O-甲基修饰、以及在5'和3'端中每一个处的另外的反向脱碱基残基,例如由其组成。
在一个实施例中,gRNA(例如,sgRNA、或dgRNA的tracr和/或crRNA),例如任何上述gRNA或gRNA组分,包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的5'端的三个硫代磷酸酯键,例如由其组成),在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的3'端的三个硫代磷酸酯键,例如由其组成),在前三个5'残基中的每一个处的2'O-甲基修饰,以及在相对于末端的第4个、相对于末端的第3个和相对于末端的第2个3'残基中的每一个处的2'O-甲基修饰,以及在5'和3'端中每一个处的另外的反向脱碱基残基,例如由其组成。
在一个实施例中,gRNA是dgRNA并且包含以下,例如由以下组成:
crRNA:
mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAU*mG*mC*mU(SEQ ID NO:3179),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键,N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基);以及
tracr:
AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:3152)(任选地在5'和/或3'末端具有反向脱碱基残基)。
在一个实施例中,gRNA是dgRNA并且包含以下,例如由以下组成:
crRNA:
mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAU*mG*mC*mU(SEQ ID NO:3179),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键,N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基);以及
tracr:
mA*mA*mC*AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU*mU*mU*mU(SEQ ID NO:3174),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键,N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)。
在一个实施例中,gRNA是dgRNA并且包含以下,例如由以下组成:
crRNA:
mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:3180),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键,N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基);以及
tracr:
AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:3152)(任选地在5'和/或3'末端具有反向脱碱基残基)。
在一个实施例中,gRNA是dgRNA并且包含以下,例如由以下组成:
crRNA:
mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:3180),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键,N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基);以及
tracr:
mA*mA*mC*AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU*mU*mU*mU(SEQ ID NO:3174),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键(任选地在5'和/或3'末端具有反向脱碱基残基)。
在一个实施例中,gRNA是dgRNA并且包含以下,例如由以下组成:
crRNA:
NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:3181),其中N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基);以及
tracr:
mA*mA*mC*AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU*mU*mU*mU(SEQ ID NO:3174),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键(任选地在5'和/或3'末端具有反向脱碱基残基)。
在一个实施例中,gRNA是sgRNA并且包含以下,例如由以下组成:
NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:3182),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键,N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)。
在一个实施例中,gRNA是sgRNA并且包含以下,例如由以下组成:
mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:3183),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键,N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)。
在一个实施例中,gRNA是sgRNA并且包含以下,例如由以下组成:
mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:3184),其中m表示具有2'O-甲基修饰的碱基,*表示硫代磷酸酯键,N表示靶向结构域的残基,例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)。
6)第一Tracr延伸部
在gRNA包含第一标志杆延伸部的情况下,tracr可以包含第一tracr延伸部。第一tracr延伸部可以包含与第一标志杆延伸部的核苷酸互补,例如80%、85%、90%、95%或99%互补,例如完全互补的核苷酸。在一些方面,与第一标志杆延伸部的互补核苷酸杂交的第一tracr延伸部核苷酸是连续的。在一些方面,与第一标志杆延伸部的互补核苷酸杂交的第一tracr延伸部核苷酸是不连续的,例如,包含由不与第一标志杆延伸部的核苷酸碱基配对的核苷酸分开的两个或更多个杂交区。在一些方面,第一tracr延伸部包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸。在一些方面,第一tracr延伸部包含SEQ ID NO:3117。在一些方面,第一tracr延伸部包含与SEQ ID NO:3117具有至少80%、85%、90%、95%或99%同源性的核酸。
第一tracr延伸部的一些或全部核苷酸可以具有修饰,例如本文部分XIII中找到的修饰。
在一些实施例中,sgRNA从5'至3'可以包含布置于靶向结构域的3'的:
a)
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:3123);
b)
GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:3124);
c)
GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:3125);
d)
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:3126);
e)以上a)至d)中的任一个,在3'端进一步包含至少1、2、3、4、5、6或7个尿嘧啶(U)核苷酸,例如1、2、3、4、5、6或7个尿嘧啶(U)核苷酸;
f)以上a)至d)中的任一个,在3'端进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸,例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸;或
或g)以上a)至f)中的任一个,在5'端(例如在5'末端,例如靶向结构域的5')进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸,例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸。在实施例中,以上a)至g)中的任一个直接布置在靶向结构域的3'。
在一个实施例中,本发明的sgRNA从5'至3'包含以下,例如由以下组成:[靶向结构域]-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:3159)。
在一个实施例中,本发明的sgRNA从5'至3'包含以下,例如由以下组成:[靶向结构域]-GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:3155)。
在一些实施例中,dgRNA可以包含:
crRNA,其从5'至3'包含优选地直接布置于靶向结构域的3'的:
a)GUUUUAGAGCUA(SEQ ID NO:3110);
b)GUUUAAGAGCUA(SEQ ID NO:3111);
c)GUUUUAGAGCUAUGCUG(SEQ ID NO:3127);
d)GUUUAAGAGCUAUGCUG(SEQ ID NO:3128);
e)GUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:3129);
f)GUUUAAGAGCUAUGCUGUUUUG(SEQ ID NO:3130);或
g)GUUUUAGAGCUAUGCU(SEQ ID NO:3154):
和tracr,其从5'至3'包含:
a)
UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ IDNO:3115);
b)
UAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ IDNO:3116);
c)
CAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQID NO:3131);
d)
CAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQID NO:3200);
e)
AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:3152);
f)
AACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:3153);
g)
AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:3160)
h)
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:3155);
i)
AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:3156);
j)
GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:3157);
k)以上a)至j)中的任一个,在3'端进一步包含至少1、2、3、4、5、6或7个尿嘧啶(U)核苷酸,例如1、2、3、4、5、6或7个尿嘧啶(U)核苷酸;
l)以上a)至j)中的任一个,在3'端进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸,例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸;或
m)以上a)至l)中的任一个,在5'端(例如在5’末端)进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸,例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸。
在一个实施例中,以上k)的序列包含3'序列UUUUUU,例如,如果U6启动子用于转录的话。在一个实施例中,以上k)的序列包含3'序列UUUU,例如,如果HI启动子用于转录的话。在一个实施例中,以上k)的序列包含可变数目的3'U,例如取决于所使用的pol-III启动子的终止信号。在一个实施例中,以上k)的序列包含衍生自DNA模板的可变3'序列,如果使用T7启动子的话。在一个实施例中,以上k)的序列包含衍生自DNA模板的可变3'序列,例如,如果体外转录用于产生RNA分子的话。在一个实施例中,以上k)的序列包含衍生自DNA模板的可变3'序列,例如,如果pol-II启动子用于驱动转录的话。
在一个实施例中,crRNA包含靶向结构域和布置于靶向结构域的3'(例如,直接布置于靶向结构域的3')的序列,例如由其组成,该序列包含SEQ ID NO:3129,例如由其组成;并且tracr包含以下,例如由以下组成:AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:3152)。
在一个实施例中,crRNA包含靶向结构域和布置于靶向结构域的3'(例如,直接布置于靶向结构域的3')的序列,例如由其组成,该序列包含SEQ ID NO:3130,例如由其组成;并且tracr包含以下,例如由以下组成:AACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:3153)。
在一个实施例中,crRNA包含靶向结构域和布置于靶向结构域的3'(例如,直接布置于靶向结构域的3')的序列,例如由其组成,该序列包含GUUUUAGAGCUAUGCU(SEQ ID NO:3154),例如由其组成;并且tracr包含以下,例如由以下组成:GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:3155)。
在一个实施例中,crRNA包含靶向结构域和布置于靶向结构域的3'(例如,直接布置于靶向结构域的3')的序列,例如由其组成,该序列包含GUUUUAGAGCUAUGCU(SEQ ID NO:3154),例如由其组成;并且tracr包含以下,例如由以下组成:AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:3156)。
在一个实施例中,crRNA包含靶向结构域和布置于靶向结构域的3'(例如,直接布置于靶向结构域的3')的序列,例如由其组成,该序列包含GUUUUAGAGCUAUGCUGUUUUG(SEQID NO:3129),例如由其组成;并且tracr包含以下,例如由以下组成:GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ IDNO:3157)。
II.针对WIZ基因的gRNA靶向结构域
表1-表3(在文件末尾)中提供了针对WIZ基因区的靶向结构域,用于本发明的gRNA分子,以及用于本发明的各个方面,例如,改变珠蛋白基因的表达,例如胎儿血红蛋白基因或血红蛋白β基因。
III.用于设计gRNA的方法
本文描述了用于设计gRNA的方法,包括用于选择、设计和验证靶序列的方法。本文还提供了示例性靶向结构域。本文讨论的靶向结构域可以掺入本文所述的gRNA中。
用于选择和验证靶序列以及脱靶分析的方法描述于例如Mali等人,2013SCIENCE[科学]339(6121):823-826;Hsu等人,2013NAT BIOTECHNOL[自然生物技术],31(9):827-32;Fu等人,2014NAT BIOTECHNOL[自然生物技术],doi:10.1038/nbt.2808。PubMed PM ID:24463574;Heigwer等人,2014NAT METHODS[自然方法]ll(2):122-3.doi:10.1038/nmeth.2812。PubMed PMID:24481216;Bae等人,2014BIOINFORMATICS[生物信息学]PubMedPMID:24463181;Xiao A等人,2014BIOINFORMATICS[生物信息学]PubMed PMID:24389662。
例如,软件工具可用于优化对用户靶序列内gRNA的选择,例如以最小化整个基因组中的总脱靶活性。脱靶活性可能不是切割。对于每种可能的gRNA选择,例如使用酿脓链球菌Cas9,该工具可以鉴别整个基因组中含有多达一定数量(例如,1、2、3、4、5、6、7、8、9或10个)的错配碱基对的所有脱靶序列(例如前述的NAG或NGG PAM)。可以例如使用实验衍生的加权方案来预测每个脱靶序列处的切割效率。然后根据其预测的总脱靶切割对每种可能的gRNA进行排列;排名靠前的gRNA代表可能具有最大中靶切割和最少脱靶切割的gRNA。其他功能(例如,用于CRISPR构建的自动化试剂设计、用于中靶Surveyor测定的引物设计、以及用于经由下一代测序对脱靶切割进行高通量检测和定量的引物设计)也可以被包括在该工具中。候选gRNA分子可以通过本领域已知的方法或如本文所述的进行评估。
虽然软件算法可用于生成潜在gRNA分子的初始列表,但切割效率和特异性不一定反映预测值,并且gRNA分子通常需要在特定细胞系(例如原代人细胞系,例如人HSPC,例如人CD34+细胞)中筛选,以确定例如切割效率、插入/缺失形成、切割特异性和所需表型的变化。可以通过本文所述的方法测定这些特性。
IV.Cas分子
Cas9分子
在优选的实施例中,Cas分子是Cas9分子。多种物种的Cas9分子可用于本文描述的方法和组合物中。尽管酿脓链球菌Cas9分子是本文大部分披露内容的主题,但也可以使用衍生自或基于本文列出的其他物种的Cas9蛋白的Cas9分子。换句话说,其他Cas9分子(例如嗜热链球菌、金黄色葡萄球菌和/或脑膜炎奈瑟氏菌Cas9分子)可用于本文描述的系统、方法和组合物中。另外的Cas9物种包括:燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)、产琥珀酸放线杆菌(Actinobacillussuccinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属物种、cycliphilusdenitrificans、少食氨基酸单胞菌(Aminomonas paucivorans)、蜡样芽饱杆菌(Bacilluscereus)、史密斯氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌、拟杆菌属物种、Blastopirellula marina、慢生根瘤菌属物种、侧孢短芽孢杆菌(Brevibacilluslatemsporus)、结肠弯曲菌(Campylobacter coli)、空肠弯曲菌(Campylobacter jejuni)、拉德弯曲菌(Campylobacter lad)、Candidatus Puniceispirillum、解纤维梭菌(Clostridiu cellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒杆菌(Corynebacterium accolens)、白喉棒杆菌(Corynebacterium diphtheria)、马氏棒杆菌(Corynebacterium matruchotii)、Dinoroseobacter sliibae、细长真杆菌(Eubacteriumdolichum)、γ变形杆菌、固氮葡糖醋杆菌(Gluconacetobacler diazotrophicus)、副流感嗜血杆菌(Haemophilus parainfluenzae)、生痰嗜血杆菌(Haemophilus sputorum)、加拿大螺杆菌(Helicobacter canadensis)、同性恋螺杆菌(Helicobacter cinaedi)、鼬鼠螺杆菌(Helicobacter mustelae)、多营养泥杆菌(Ilyobacter polytropus)、金氏金氏菌(Kingella kingae)、卷曲乳杆菌(Lactobacillus crispatus)、伊氏李斯特菌(Listeriaivanovii)、单核细胞增生李斯特菌(Listeria monocytogenes)、李斯特氏菌科细菌、甲基孢囊菌属物种、甲基弯菌(Methylosinus trichosporium)、羞怯动弯杆菌(Mobiluncusmulieris)、杆菌状奈瑟氏菌(Neisseria bacilliformis)、灰色奈瑟氏菌(Neisseriacinerea)、浅黄奈瑟氏菌(Neisseria flavescens)、乳糖奈瑟氏菌(Neisserialactamica)、奈瑟氏菌属物种、瓦茨瓦尔西奈瑟氏菌(Neisseria wadsworthii)、亚硝化单胞菌属物种、Parvibaculum lavamentivorans、多杀巴斯德菌(Pasteurella multocida)、琥珀酸考拉杆菌(Phascolarctobacterium succinatutens)、丁香罗尔斯通菌(Ralstoniasyzygii)、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属物种、穆氏西蒙斯氏菌(Simonsiella muelleri)、鞘氨醇单胞菌属物种、维尼芽孢乳杆菌(Sporolactobacillus vineae)、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属物种、罕见小球菌属物种(Subdoligranulum sp.)、Tislrella mobilis、密螺旋体属物种、或Verminephrobacter eiseniae。
Cas9分子(当该术语在本文中使用时)是指可与gRNA分子(例如,tracr的结构域的序列)相互作用,并且与gRNA分子一起定位(例如,靶向或归巢)于包含靶序列和PAM序列的位点的分子。
在一个实施例中,Cas9分子能够切割靶核酸分子,其在本文中可称为活性Cas9分子。在一个实施例中,活性Cas9分子包含一种或多种以下活性:切口酶活性,即切割核酸分子的单链(例如非互补链或互补链)的能力;双链核酸酶活性,即切割双链核酸的两条链并产生双链断裂的能力,其在一个实施例中是在两种切口酶活性的存在下;内切核酸酶活性;外切核酸酶活性;以及解旋酶活性,即解开双链核酸的螺旋结构的能力。
在一个实施例中,酶促活性Cas9分子切割两条DNA链并导致双链断裂。在一个实施例中,Cas9分子仅切割一条链,例如与gRNA杂交的链、或和与gRNA杂交的链互补的链。在一个实施例中,活性Cas9分子包含与HNH样结构域相关的切割活性。在一个实施例中,活性Cas9分子包含与N末端RuvC样结构域相关的切割活性。在一个实施例中,活性Cas9分子包含与HNH样结构域相关的切割活性和与N末端RuvC样结构域相关的切割活性。在一个实施例中,活性Cas9分子包含有活性或有切割能力的HNH样结构域和无活性或无切割能力的N末端RuvC样结构域。在一个实施例中,活性Cas9分子包含无活性或无切割能力的HNH样结构域和有活性或有切割能力的N末端RuvC样结构域。
在一个实施例中,活性Cas9分子与靶核酸相互作用并切割靶核酸的能力是PAM序列依赖性的。PAM序列是靶核酸中的序列。在一个实施例中,靶核酸的切割发生在PAM序列的上游。来自不同细菌物种的活性Cas9分子可以识别不同的序列基序(例如PAM序列)。在一个实施例中,酿脓链球菌的活性Cas9分子识别序列基序NGG并指导靶核酸序列的在所述序列上游1至10个(例如3至5个)碱基对的切割。参见例如,Mali等人,SCIENCE[科学]2013;339(6121):823-826。在一个实施例中,嗜热链球菌的活性Cas9分子识别序列基序NGGNG和NNAGAAW(W=A或T)并指导核心靶核酸序列的在这些序列上游1至10个(例如3至5个)碱基对的切割。参见例如,Horvath等人,SCIENCE[科学]2010;327(5962):167-170;以及Deveau等人,JBACTERIOL[细菌学杂志]2008;190(4):1390-1400。在一个实施例中,来自变形链球菌(S.mutans)的活性Cas9分子识别序列基序NGG或NAAR(R-A或G)并指导核心靶核酸序列的在该序列上游1至10个(例如3至5个)碱基对的切割。参见例如,Deveau等人,J BACTERIOL[细菌学杂志]2008;190(4):1390-1400。
在一个实施例中,金黄色葡萄球菌的活性Cas9分子识别序列基序NNGRR(R=A或G)并指导靶核酸序列的在该序列上游1至10个(例如3至5个)碱基对的切割。参见例如,Ran F.等人,NATURE[自然],第520卷,2015,第186-191页。在一个实施例中,脑膜炎奈瑟氏菌的活性Cas9分子识别序列基序NNNNGATT并指导靶核酸序列的在该序列上游1至10个(例如3至5个)碱基对的切割。参见例如,Hou等人,PNAS EARLY EDITION[美国国家科学院院刊早期版本]2013,1-6。可以例如使用Jinek等人,SCIENCE[科学]2012,337:816中描述的转化测定来确定Cas9分子识别PAM序列的能力。
一些Cas9分子具有与gRNA分子相互作用并且与gRNA分子协力归巢(例如,靶向或定位)至核心靶结构域的能力,但不能切割靶核酸,或者不能以有效速率切割。没有或基本上没有切割活性的Cas9分子在本文中可称为无活性Cas9(酶促失活的Cas9)、死Cas9或dCas9分子。例如,如通过本文所述的测定所测量的,无活性Cas9分子可以缺乏切割活性或具有基本上更小的切割活性,例如小于参考Cas9分子的切割活性的20%、10%、5%、1%或0.1%。
示例性天然存在的Cas9分子描述于Chylinski等人,RNA Biology[RNA生物学]2013;10:5,727-737中。此类Cas9分子包括簇1细菌家族、簇2细菌家族、簇3细菌家族、簇4细菌家族、簇5细菌家族、簇6细菌家族、簇7细菌家族、簇8细菌家族、簇9细菌家族、簇10细菌家族、簇11细菌家族、簇12细菌家族、簇13细菌家族、簇14细菌家族、簇15细菌家族、簇16细菌家族、簇17细菌家族、簇18细菌家族、簇19细菌家族、簇20细菌家族、簇21细菌家族、簇22细菌家族、簇23细菌家族、簇24细菌家族、簇25细菌家族、簇26细菌家族、簇27细菌家族、簇28细菌家族、簇29细菌家族、簇30细菌家族、簇31细菌家族、簇32细菌家族、簇33细菌家族、簇34细菌家族、簇35细菌家族、簇36细菌家族、簇37细菌家族、簇38细菌家族、簇39细菌家族、簇40细菌家族、簇41细菌家族、簇42细菌家族、簇43细菌家族、簇44细菌家族、簇45细菌家族、簇46细菌家族、簇47细菌家族、簇48细菌家族、簇49细菌家族、簇50细菌家族、簇51细菌家族、簇52细菌家族、簇53细菌家族、簇54细菌家族、簇55细菌家族、簇56细菌家族、簇57细菌家族、簇58细菌家族、簇59细菌家族、簇60细菌家族、簇61细菌家族、簇62细菌家族、簇63细菌家族、簇64细菌家族、簇65细菌家族、簇66细菌家族、簇67细菌家族、簇68细菌家族、簇69细菌家族、簇70细菌家族、簇71细菌家族、簇72细菌家族、簇73细菌家族、簇74细菌家族、簇75细菌家族、簇76细菌家族、簇77细菌家族、或簇78细菌家族的Cas9分子。
示例性天然存在的Cas9分子包括簇1细菌家族的Cas9分子。实例包括以下的Cas9分子:酿脓链球菌(例如,菌株SF370、MGAS 10270、MGAS 10750、MGAS2096、MGAS315、MGAS5005、MGAS6180、MGAS9429、NZ131和SSI-1)、嗜热链球菌(例如,菌株LMD-9)、假豕链球菌(S.pseudoporcinus)(例如,菌株SPIN 20026)、变形链球菌(例如,菌株UA 159、NN2025)、猴链球菌(S.macacae)(例如,菌株NCTC1 1558)、解没食子酸链球菌(S.gallolylicus)(例如,菌株UCN34、ATCC BAA-2069)、马链球菌(S.equines)(例如,菌株ATCC9812、MGCS 124)、停乳链球菌(S.dysgalactiae)(例如,菌株GGS 124)、牛链球菌(S.bovis)(例如,菌株ATCC700338)、S.cmginosus(例如,菌株F021 1)、无乳链球菌(S.agalactia)(例如,菌株NEM316、A909)、单核细胞增多性李斯特菌(例如,菌株F6854)、无害李斯特菌(L.innocua,例如,菌株Clip l 1262)、意大利肠球菌(Enterococcus italicus)(例如,菌株DSM 15952)、或屎肠球菌(Enterococcus faecium)(例如,菌株1,231、408)。另外的示例性Cas9分子是脑膜炎奈瑟氏菌的Cas9分子(Hou等人PNAS Early Edition[美国国家科学院院刊早期版本]2013,1-6)和金黄色葡萄球菌Cas9分子。
在一个实施例中,Cas9分子(例如活性Cas9分子或无活性Cas9分子)包含与以下具有60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同源性的氨基酸序列;当与以下相比时,相差不超过1%、2%、5%、10%、15%、20%、30%或40%的氨基酸残基的氨基酸序列;与以下相差至少1、2、5、10或20个氨基酸但相差不超过100、80、70、60、50、40或30个氨基酸的氨基酸序列;或与以下相同的氨基酸序列:本文描述的任何Cas9分子序列或天然存在的Cas9分子序列,例如来自本文所列物种的或描述于Chylinski等人,RNABiology[RNA生物学]2013,10:5,′I2′I-Τ,1;Hou等人PNAS Early Edition[美国国家科学院院刊早期版本]2013,1-6中的Cas9分子。
在一个实施例中,Cas9分子包含与酿脓链球菌Cas9具有60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同源性的氨基酸序列;当与酿脓链球菌Cas9相比时,相差不超过1%、2%、5%、10%、15%、20%、30%或40%的氨基酸残基的氨基酸序列;与酿脓链球菌Cas9相差至少1、2、5、10或20个氨基酸但相差不超过100、80、70、60、50、40或30个氨基酸的氨基酸序列;或与酿脓链球菌Cas9相同的氨基酸序列酿脓链球菌Cas9(NCBI参考序列:WP_010922251.1;SEQ ID NO:3133)。
在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含对带正电荷的氨基酸(例如赖氨酸、精氨酸或组氨酸)的一个或多个突变,这些突变在所述位置引入不带电荷或非极性氨基酸(例如丙氨酸)。在实施例中,突变是对于Cas9的nt沟中的一个或多个带正电荷的氨基酸而言的。在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含在SEQ ID NO:3133的位置855处的突变,例如在SEQ ID NO:3133的位置855处突变为不带电荷的氨基酸,例如丙氨酸。在实施例中,Cas9分子仅在SEQ ID NO:3133的位置855处相对于SEQ ID NO:3133具有突变,例如突变为不带电荷的氨基酸,例如丙氨酸。在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含在SEQ ID NO:3133的位置810处的突变、位置1003处的突变、和/或位置1060处的突变,例如在SEQ ID NO:3133的位置810、位置1003、和/或位置1060处突变为丙氨酸。在实施例中,Cas9分子仅在SEQID NO:3133的位置810、位置1003、和位置1060处相对于SEQ ID NO:3133具有突变,例如,其中每个突变是突变为不带电荷的氨基酸,例如丙氨酸。在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含在SEQ ID NO:3133的位置848处的突变、位置1003处的突变、和/或位置1060处的突变,例如在SEQ ID NO:3133的位置848、位置1003、和/或位置1060处突变为丙氨酸。在实施例中,Cas9分子仅在SEQ ID NO:3133的位置848、位置1003、和位置1060处相对于SEQ ID NO:3133具有突变,例如,其中每个突变是突变为不带电荷的氨基酸,例如丙氨酸。在实施例中,Cas9分子是如在Slaymaker等人,Science Express[科学快讯]中描述的Cas9分子,该文献可于2015年12月1日在Science DOI:10.1126/science.aad5227。
在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含一个或多个突变。在实施例中,Cas9变体包含在SEQ ID NO:3133的位置80处的突变,例如,包含SEQID NO:3133的位置80处的亮氨酸(即,包含具有C80L突变的SEQ ID NO:3133,例如由其组成)。在实施例中,Cas9变体包含在SEQ ID NO:3133的位置574处的突变,例如,包含SEQ IDNO:3133的位置574处的谷氨酸(即,包含具有C574E突变的SEQ ID NO:3133,例如由其组成)。在实施例中,Cas9变体包含在SEQ ID NO:3133的位置80处的突变和位置574处的突变,例如,包含SEQ ID NO:3133的位置80处的亮氨酸和SEQ ID NO:3133的位置574处的谷氨酸(即,包含具有C80L突变和C574E突变的SEQ ID NO:3133,例如由其组成)。不受理论束缚,据信此类突变改善了Cas9分子的溶解特性。
在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含一个或多个突变。在实施例中,Cas9变体包含在SEQ ID NO:3133的位置147处的突变,例如,包含SEQ ID NO:3133的位置147处的酪氨酸(即,包含具有D147Y突变的SEQ ID NO:3133,例如由其组成)。在实施例中,Cas9变体包含在SEQ ID NO:3133的位置411处的突变,例如,包含SEQID NO:3133的位置411处的苏氨酸(即,包含具有P411T突变的SEQ ID NO:3133,例如由其组成)。在实施例中,Cas9变体包含在SEQ ID NO:3133的位置147处的突变和位置411处的突变,例如,包含SEQ ID NO:3133的位置147处的酪氨酸和SEQ ID NO:3133的位置411处的苏氨酸(即,包含具有D147Y突变和P411T突变的SEQ ID NO:3133,例如由其组成)。不受理论束缚,据信此类突变改善了Cas9分子例如在酵母中的靶向效率。
在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含一个或多个突变。在实施例中,Cas9变体包含在SEQ ID NO:3133的位置1135处的突变,例如,包含SEQ ID NO:3133的位置1135处的谷氨酸(即,包含具有D1135E突变的SEQ ID NO:3133,例如由其组成)。不受理论束缚,据信此类突变改善了Cas9分子对NGG PAM序列相对于NAG PAM序列的选择性。
在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含一个或多个突变,这些突变在某些位置引入不带电荷或非极性氨基酸(例如丙氨酸)。在实施例中,Cas9分子是SEQ ID NO:3133的酿脓链球菌Cas9变体,其包含在SEQ ID NO:3133的位置497处的突变、位置661处的突变、位置695处的突变和/或位置926处的突变,例如在SEQ ID NO:3133的位置497、位置661、位置695和/或位置926处突变为丙氨酸。在实施例中,Cas9分子仅在SEQ ID NO:3133的位置497、位置661、位置695和位置926处相对于SEQ ID NO:3133具有突变,例如,其中每个突变是突变为不带电荷的氨基酸,例如丙氨酸。不受理论束缚,据信此类突变减少了Cas9分子在脱靶位点的切割。
应当理解,本文所述的对于Cas9分子而言的突变可以组合,并且可以与本文所述的任何融合或其他修饰组合,并且在本文所述的测定中测试了Cas9分子。
各种类型的Cas分子可用于实践本文披露的发明。在一些实施例中,使用II型Cas系统的Cas分子。在其他实施例中,使用其他Cas系统的Cas分子。例如,可以使用I型或III型Cas分子。示例性Cas分子(和Cas系统)例如描述于Haft等人,PLoS COMPUTATIONAL BIOLOGY[科学公共图书馆计算生物学]2005,1(6):e60以及Makarova等人,NATURE REVIEWMICROBIOLOGY[自然微生物学评论]201 1,9:467-477中,将这两篇参考文献的内容通过引用以其全文并入本文。
在一个实施例中,Cas9分子包含一种或多种以下活性:切口酶活性;双链切割活性(例如,内切核酸酶和/或外切核酸酶活性);解旋酶活性;或与gRNA分子一起定位至靶核酸的能力。
改变的Cas9分子
天然存在的Cas9分子具有许多特性,包括:切口酶活性;核酸酶活性(例如,内切核酸酶和/或外切核酸酶活性);解旋酶活性;与gRNA分子功能上相关的能力;以及靶向(或定位于)核酸上的位点的能力(例如,PAM识别和特异性)。在一个实施例中,Cas9分子可以包括这些特性的全部或子集。在典型的实施例中,Cas9分子具有与gRNA分子相互作用,并且与gRNA分子一起定位于核酸中的位点的能力。其他活性(例如PAM特异性、切割活性或解旋酶活性)可在Cas9分子中更广泛地变化。
具有所需特性的Cas9分子能以多种方式制造,例如通过改变亲本(例如天然存在的Cas9分子)以提供具有所需特性的经改变的Cas9分子。例如,可以引入相对于亲本Cas9分子的一个或多个突变或差异。此类突变和差异包括:取代(例如,保守取代或非必需氨基酸的取代);插入;或缺失。在一个实施例中,Cas9分子相对于参考Cas9分子可以包含一个或多个突变或差异,例如至少1、2、3、4、5、10、15、20、30、40或50个突变但少于200、100或80个突变。
在一个实施例中,一个或多个突变对Cas9活性(例如本文所述的Cas9活性)没有实质性影响。在一个实施例中,一个或多个突变对Cas9活性(例如本文所述的Cas9活性)具有实质性影响。在一个实施例中,示例性活性包括PAM特异性、切割活性和解旋酶活性中的一种或多种。一个或多个突变可以例如存在于以下中:一个或多个RuvC样结构域,例如N末端RuvC样结构域;HNH样结构域;RuvC样结构域和HNH样结构域外的区。在一些实施例中,一个或多个突变存在于N末端RuvC样结构域中。在一些实施例中,一个或多个突变存在于HNH样结构域中。在一些实施例中,突变存在于N末端RuvC样结构域和HNH样结构域两者中。
例如可以通过评估突变是否是保守的或通过部分III中所述的方法,来评估或预测特定序列(例如取代)是否可以影响一种或多种活性,如靶向活性、切割活性等。在一个实施例中,如在Cas9分子的背景下使用的“非必需”氨基酸残基是可以从Cas9分子(例如天然存在的Cas9分子,例如活性Cas9分子)的野生型序列改变而不消除或更优选地基本上不改变Cas9活性(例如切割活性)的残基,而改变“必需”氨基酸残基则导致活性(例如切割活性)的显著丧失。
具有经改变的PAM识别或不识别PAM的Cas9分子
天然存在的Cas9分子可以识别特定的PAM序列,例如以上针对酿脓链球菌、嗜热链球菌、变形链球菌、金黄色葡萄球菌和脑膜炎奈瑟氏菌所述的PAM识别序列。
在一个实施例中,Cas9分子具有与天然存在的Cas9分子相同的PAM特异性。在其他实施例中,Cas9分子具有与天然存在的Cas9分子无关的PAM特异性,或与和其具有最接近的序列同源性的天然存在的Cas9分子无关的PAM特异性。例如,可以改变天然存在的Cas9分子,例如以改变PAM识别,例如以改变Cas9分子识别的PAM序列以减少脱靶位点和/或改善特异性;或消除PAM识别要求。在一个实施例中,可以改变Cas9分子,例如以增加PAM识别序列的长度和/或将Cas9特异性提高至高水平的同一性以减少脱靶位点和增加特异性。在一个实施例中,PAM识别序列的长度在长度上是至少4、5、6、7、8、9、10或15个氨基酸。可以使用定向进化来产生识别不同PAM序列和/或具有降低的脱靶活性的Cas9分子。可用于Cas9分子的定向进化的示例性方法和系统描述于例如Esvelt等人,Nature[自然]2011,472(7344):499-503中。可以例如通过本文所述的方法来评估候选Cas9分子。
非切割和经修饰的切割Cas9分子
在一个实施例中,Cas9分子包含不同于天然存在的Cas9分子(例如不同于具有最接近同源性的天然存在的Cas9分子)的切割特性。例如,Cas9分子可以不同于天然存在的Cas9分子(例如酿脓链球菌的Cas9分子),如下能力可以被消除:例如,与天然存在的Cas9分子(例如酿脓链球菌的Cas9分子)相比,其调节(例如降低或增加)双链断裂的切割的能力(内切核酸酶和/或外切核酸酶活性);例如,与天然存在的Cas9分子(例如酿脓链球菌的Cas9分子)相比,其调节(例如降低或增加)核酸单链(例如核酸分子的非互补链或核酸分子的互补链)的切割的能力(切口酶活性);或者切割核酸分子(例如双链或单链核酸分子)的能力。
经修饰的切割活性Cas9分子
在一个实施例中,活性Cas9分子包含一种或多种以下活性:与N末端RuvC样结构域相关的切割活性;与HNH样结构域相关的切割活性;与HNH结构域相关的切割活性和与N末端RuvC样结构域相关的切割活性。
在一个实施例中,Cas9分子是Cas9切口酶,例如仅切割DNA单链。在一个实施例中,Cas9切口酶包含在SEQ ID NO:3133的位置10处的突变和/或位置840处的突变,例如包含对SEQ ID NO:3133的D10A和/或H840A突变。
非切割无活性Cas9分子
在一个实施例中,经改变的Cas9分子是无活性Cas9分子,其不切割核酸分子(双链或单链核酸分子)或以显著较小的效率(例如小于20%、10%、5%、1%或0.1%的参考Cas9分子的切割活性,例如如通过本文所述的测定所测量的)切割核酸分子。参考Cas9分子可以是天然存在的未经修饰的Cas9分子,例如天然存在的Cas9分子,如酿脓链球菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟氏菌的Cas9分子。在一个实施例中,参考Cas9分子是具有最接近的序列同一性或同源性的天然存在的Cas9分子。在一个实施例中,无活性Cas9分子缺乏显著的与N末端RuvC样结构域相关的切割活性和与HNH样结构域相关的切割活性。
在一个实施例中,Cas9分子是dCas9(Tsai等人(2014),Nat.Biotech.[自然生物技术]32:569-577)。
催化失活的Cas9分子可以与转录阻遏物融合。无活性Cas9融合蛋白与gRNA复合并定位于由gRNA靶向结构域指定的DNA序列,但与有活性Cas9不同,它不会切割靶DNA。效应结构域(如转录阻遏结构域)与无活性Cas9的融合使得能够将效应子募集至由gRNA指定的任何DNA位点。将Cas9融合蛋白位点特异性靶向于基因的启动子区可以阻断或影响聚合酶与启动子区的结合,例如,Cas9与转录因子(例如转录激活因子)融合和/或转录增强子与核酸结合以增加或抑制转录激活。可替代地,将Cas9与转录阻遏物的融合物位点特异性靶向于基因的启动子区可用于降低转录激活。
可与无活性Cas9分子融合的转录阻遏物或转录阻遏物结构域可以包括ruppel相关盒(KRAB或SKD)、Mad mSIN3相互作用结构域(SID)或ERF阻遏物结构域(ERD)。
在另一个实施例中,无活性Cas9分子可以与修饰染色质的蛋白质融合。例如,无活性Cas9分子可以与以下融合:异染色质蛋白1(HPl)、组蛋白赖氨酸甲基转移酶(例如SUV39H1、SUV39H2、G9A、ESET/SETDB l、Pr-SET7/8、SUV4-20H 1,RIZ1)、组蛋白赖氨酸脱甲基酶(例如LSD1/BHC1 10、SpLsdl/Sw、l/Safl 10、Su(var)3-3、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、Rph l、JARID1A/RBP2、JARI DIB/PLU-I、JAR1D 1C/SMCX、JARID1 D/SMCY、Lid、Jhn2、Jmj2)、组蛋白赖氨酸脱乙酰酶(例如HDAC1、HDAC2、HDAC3、HDAC8、Rpd3、Hos l、Cir6、HDAC4、HDAC5、HDAC7、HDAC9、Hdal、Cir3、SIRT 1、SIRT2、Sir2、Hst l、Hst2、Hst3、Hst4、HDAC 11)以及DNA甲基化酶(DNMT1,DNMT2a/DMNT3b/MET1)。无活性Cas9-染色质修饰分子融合蛋白可用于改变染色质状态以减少靶基因的表达。
异源序列(例如转录阻遏物结构域)可以与无活性Cas9蛋白的N末端或C末端融合。在一个替代性实施例中,异源序列(例如转录阻遏物结构域)可以与无活性Cas9蛋白的内部部分(即,N末端或C末端以外的部分)融合。
可以例如通过本文部分III中所述的方法来评估Cas9分子/gRNA分子复合物结合并切割靶核酸的能力。Cas9分子(例如,有活性Cas9或无活性Cas9,单独或处于与gRNA分子的复合物中)的活性还可以通过本领域熟知的方法来评估,包括基因表达测定和基于染色质的测定,例如染色质免疫沉淀法(ChiP)和染色质体内测定(CiA)。
其他Cas9分子融合物
在实施例中,Cas9分子(例如酿脓链球菌的Cas9)可以另外包含一个或多个赋予额外活性的氨基酸序列。
在一些方面,Cas9分子可以包含一个或多个核定位序列(NLS),如至少1、2、3、4、5、6、7、8、9、10个或更多个NLS。在一些实施例中,Cas9分子包含在氨基末端或其附近的至少1、2、3、4、5、6、7、8、9、10个或更多个NLS,在羧基末端或其附近的至少1、2、3、4、5、6、7、8、9、10个或更多个NLS,或这些的组合(例如在氨基末端的一个或多个NLS以及在羧基末端的一个或多个NLS)。当存在多于一个NLS时,每一个可以被选择为不依赖于其他NLS,使得单一NLS可以存在于多于一个拷贝中和/或与存在于一个或多个拷贝中的一个或多个其他NLS组合。在一些实施例中,当NLS的最近的氨基酸是在从N末端或C末端沿着多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个或更多个氨基酸内时,NLS可以被认为靠近N末端或C末端。通常,NLS由暴露于蛋白质表面上的带正电荷的赖氨酸或精氨酸的一个或多个短序列组成,但其他类型的NLS是已知的。NLS的非限制性实例包括NLS序列,该NLS序列包含或衍生自:SV40病毒大T抗原的NLS,其具有氨基酸序列PKKKRKV(SEQ ID NO:3134);来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:3135)的核质蛋白二分NLS);c-myc NLS,其具有氨基酸序列PAAKRVKLD(SEQ ID NO:3136)或RQRRNELKRSP(SEQ ID NO:3137);hRNPA1 M9 NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:3138);来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:3139);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:3140)和PPKKARED(SEQ ID NO:3141);人p53的序列PQPKKKPL(SEQ ID NO:3142);小鼠c-ab1 IV的序列SALIKKKKKMAP(SEQ ID NO:3143);流感病毒NS1的序列DRLRR(SEQ ID NO:3144)和PKQKKRK(SEQ ID NO:3145);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:3146);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ IDNO:3147);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:3148);以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:3149)。其他合适的NLS序列在本领域中是已知的(例如,Sorokin,Biochemistry[生物化学](莫斯科)(2007)72:13,1439-1457;Lange J Biol Chem.[生物化学杂志](2007)282:8,5101-5)。
在一个实施例中,Cas9分子(例如酿脓链球菌Cas9分子)包含SV40的NLS序列,例如布置于Cas9分子的N末端。在一个实施例中,Cas9分子(例如酿脓链球菌Cas9分子)包含布置于Cas9分子的N末端的SV40的NLS序列和布置于Cas9分子的C末端的SV40的NLS序列。在一个实施例中,Cas9分子(例如酿脓链球菌Cas9分子)包含布置于Cas9分子的N末端的SV40的NLS序列和布置于Cas9分子的C末端的核质蛋白的NLS序列。在任何上述实施例中,分子可以另外包含标签,例如His标签,例如His(6)标签(SEQ ID NO:3175)或His(8)标签(SEQ ID NO:3176),例如在N末端或C末端。
在一些方面,Cas9分子可以包含一个或多个允许特异性识别Cas9分子的氨基酸序列,例如标签。在一个实施例中,标签是组氨酸标签,例如包含至少3、4、5、6、7、8、9、10个或更多个组氨酸氨基酸的组氨酸标签。在实施例中,组氨酸标签是His6标签(六个组氨酸)(SEQ ID NO:3175)。在其他实施例中,组氨酸标签是His8标签(八个组氨酸)(SEQ ID NO:3176)。在实施例中,组氨酸标签可以通过接头与Cas9分子的一个或多个其他部分分开。在实施例中,接头是GGS。这种融合物的一个实例是Cas9分子iProt106520。
在一些方面,Cas9分子可以包含被蛋白酶识别的一个或多个氨基酸序列(例如,包含蛋白酶切割位点)。在实施例中,切割位点是烟草蚀纹病毒(TEV)切割位点,例如包含序列ENLYFQG(SEQ ID NO:3158)。在一些方面,蛋白酶切割位点(例如TEV切割位点)被布置于标签(例如His标签,例如His6(SEQ ID NO:3175)或His8标签(SEQ ID NO:3176))与Cas9分子的其余部分之间。不受理论束缚,据信这种引入将允许使用标签用于例如Cas9分子的纯化,然后继而进行切割,因此标签不会干扰Cas9分子功能。
在实施例中,Cas9分子(例如如本文所述的Cas9分子)包含N末端NLS和C末端NLS(例如,从N末端至C末端包含NLS-Cas9-NLS),例如其中每个NLS是SV40 NLS(PKKKRKV(SEQID NO:3134))。在实施例中,Cas9分子(例如如本文所述的Cas9分子)包含N末端NLS、C末端NLS、以及C末端His6标签(SEQ ID NO:3175)(例如,从N末端至C末端包含NLS-Cas9-NLS-His标签),例如其中每个NLS是SV40NLS(PKKKRKV(SEQ ID NO:3134))。在实施例中,Cas9分子(例如如本文所述的Cas9分子)包含N末端His标签(例如His6标签(SEQ ID NO:3175)))、N末端NLS、以及C末端NLS(例如,从N末端至C末端包含His标签-NLS-Cas9-NLS),例如其中每个NLS是SV40 NLS(PKKKRKV(SEQ ID NO:3134))。在实施例中,Cas9分子(例如如本文所述的Cas9分子)包含C末端NLS和N末端His标签(例如His6标签(SEQ ID NO:3175))(例如,从N末端至C末端包含His标签-Cas9-NLS),例如其中每个NLS是SV40 NLS(PKKKRKV(SEQ ID NO:3134))。在实施例中,Cas9分子(例如如本文所述的Cas9分子)包含N末端NLS和C末端His标签(例如His6标签(SEQ ID NO:3175))(例如,从N末端至C末端包含NLS-Cas9-His标签),例如其中每个NLS是SV40 NLS(PKKKRKV(SEQ ID NO:3134))。在实施例中,Cas9分子(例如如本文所述的Cas9分子)包含N末端His标签(例如,His8标签(SEQ ID NO:3176))、N末端切割结构域(例如,烟草蚀纹病毒(TEV)切割结构域(例如,包含序列ENLYFQG(SEQ ID NO:3158)))、N末端NLS(例如,SV40 NLS;SEQ ID NO:3134)、以及C末端NLS(例如,SV40 NLS;SEQ ID NO:3134)(例如,从N末端至C末端包含His tag-TEV-NLS-Cas9-NLS)。在任何上述实施例中,Cas9具有SEQ ID NO:3133的序列。可替代地,在任何上述实施例中,Cas9具有SEQ ID NO:3133的Cas9变体的序列,例如如本文所述。在任何上述实施例中,Cas9分子包含His标签与该分子的另一部分之间的接头,例如GGS接头。下面提供了上述示例性Cas9分子的氨基酸序列。
iProt105026(也称为iProt106154、iProt106331、iProt106545和PID426303,这取决于蛋白质的制备)(SEQ ID NO:3161):
Figure BDA0003693276070000911
Figure BDA0003693276070000921
iProt106518(SEQ ID NO:3162):
Figure BDA0003693276070000922
Figure BDA0003693276070000931
iProt106519(SEQ ID NO:3163):
Figure BDA0003693276070000932
Figure BDA0003693276070000941
iProt106520(SEQ ID NO:3164):
Figure BDA0003693276070000942
Figure BDA0003693276070000951
iProt106521(SEQ ID NO:3165):
Figure BDA0003693276070000952
Figure BDA0003693276070000961
iProt106522(SEQ ID NO:3166):
Figure BDA0003693276070000962
Figure BDA0003693276070000971
iProt106658(SEQ ID NO:3167):
Figure BDA0003693276070000972
Figure BDA0003693276070000981
iProt106745(SEQ ID NO:3168):
Figure BDA0003693276070000982
Figure BDA0003693276070000991
iProt106746(SEQ ID NO:3169):
Figure BDA0003693276070000992
iProt106747(SEQ ID NO:3170):
Figure BDA0003693276070001001
iProt106884(SEQ ID NO:3171):
Figure BDA0003693276070001002
Figure BDA0003693276070001011
iProt 20109496(SEQ ID NO:3172)
MAPKKKRKVDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRILYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIEEFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADHHHHHH
编码Cas9分子的核酸
本文提供了编码Cas9分子(例如有活性Cas9分子或无活性Cas9分子)的核酸。
编码Cas9分子的示例性核酸描述于Cong等人,SCIENCE[科学]2013,399(6121):819-823;Wang等人,CELL[细胞]2013,153(4):910-918;Mali等人,SCIENCE[科学]2013,399(6121):823-826;Jinek等人,SCIENCE[科学]2012,337(6096):816-821中。
在一个实施例中,编码Cas9分子的核酸可以是合成的核酸序列。例如,合成的核酸分子可以是化学修饰的,例如如部分XIII中所述。在一个实施例中,Cas9 mRNA具有一种或多种(例如全部)以下特性:其被加帽、聚腺苷酸化、被5-甲基胞苷和/或假尿苷取代。
另外地或可替代地,合成的核酸序列可以是密码子优化的,例如,至少一个非常见密码子或较不常见密码子已被常见密码子替代。例如,合成核酸可以指导经优化的信使mRNA(例如被优化用于在哺乳动物表达系统(例如本文所述)中表达)的合成。
下面提供了编码酿脓链球菌的Cas9分子的示例性密码子优化的核酸序列。
ATGGATAAAAAGTACAGCATCGGGCTGGACATCGGTACAAACTCAGTGGGGTGGGCCGTGATTACGGACGAGTACAAGGTACCCTCCAAAAAATTTAAAGTGCTGGGTAACACGGACAGACACTCTATAAAGAAAAATCTTATTGGAGCCTTGCTGTTCGACTCAGGCGAGACAGCCGAAGCCACAAGGTTGAAGCGGACCGCCAGGAGGCGGTATACCAGGAGAAAGAACCGCATATGCTACCTGCAAGAAATCTTCAGTAACGAGATGGCAAAGGTTGACGATAGCTTTTTCCATCGCCTGGAAGAATCCTTTCTTGTTGAGGAAGACAAGAAGCACGAACGGCACCCCATCTTTGGCAATATTGTCGACGAAGTGGCATATCACGAAAAGTACCCGACTATCTACCACCTCAGGAAGAAGCTGGTGGACTCTACCGATAAGGCGGACCTCAGACTTATTTATTTGGCACTCGCCCACATGATTAAATTTAGAGGACATTTCTTGATCGAGGGCGACCTGAACCCGGACAACAGTGACGTCGATAAGCTGTTCATCCAACTTGTGCAGACCTACAATCAACTGTTCGAAGAAAACCCTATAAATGCTTCAGGAGTCGACGCTAAAGCAATCCTGTCCGCGCGCCTCTCAAAATCTAGAAGACTTGAGAATCTGATTGCTCAGTTGCCCGGGGAAAAGAAAAATGGATTGTTTGGCAACCTGATCGCCCTCAGTCTCGGACTGACCCCAAATTTCAAAAGTAACTTCGACCTGGCCGAAGACGCTAAGCTCCAGCTGTCCAAGGACACATACGATGACGACCTCGACAATCTGCTGGCCCAGATTGGGGATCAGTACGCCGATCTCTTTTTGGCAGCAAAGAACCTGTCCGACGCCATCCTGTTGAGCGATATCTTGAGAGTGAACACCGAAATTACTAAAGCACCCCTTAGCGCATCTATGATCAAGCGGTACGACGAGCATCATCAGGATCTGACCCTGCTGAAGGCTCTTGTGAGGCAACAGCTCCCCGAAAAATACAAGGAAATCTTCTTTGACCAGAGCAAAAACGGCTACGCTGGCTATATAGATGGTGGGGCCAGTCAGGAGGAATTCTATAAATTCATCAAGCCCATTCTCGAGAAAATGGACGGCACAGAGGAGTTGCTGGTCAAACTTAACAGGGAGGACCTGCTGCGGAAGCAGCGGACCTTTGACAACGGGTCTATCCCCCACCAGATTCATCTGGGCGAACTGCACGCAATCCTGAGGAGGCAGGAGGATTTTTATCCTTTTCTTAAAGATAACCGCGAGAAAATAGAAAAGATTCTTACATTCAGGATCCCGTACTACGTGGGACCTCTCGCCCGGGGCAATTCACGGTTTGCCTGGATGACAAGGAAGTCAGAGGAGACTATTACACCTTGGAACTTCGAAGAAGTGGTGGACAAGGGTGCATCTGCCCAGTCTTTCATCGAGCGGATGACAAATTTTGACAAGAACCTCCCTAATGAGAAGGTGCTGCCCAAACATTCTCTGCTCTACGAGTACTTTACCGTCTACAATGAACTGACTAAAGTCAAGTACGTCACCGAGGGAATGAGGAAGCCGGCATTCCTTAGTGGAGAACAGAAGAAGGCGATTGTAGACCTGTTGTTCAAGACCAACAGGAAGGTGACTGTGAAGCAACTTAAAGAAGACTACTTTAAGAAGATCGAATGTTTTGACAGTGTGGAAATTTCAGGGGTTGAAGACCGCTTCAATGCGTCATTGGGGACTTACCATGATCTTCTCAAGATCATAAAGGACAAAGACTTCCTGGACAACGAAGAAAATGAGGATATTCTCGAAGACATCGTCCTCACCCTGACCCTGTTCGAAGACAGGGAAATGATAGAAGAGCGCTTGAAAACCTATGCCCACCTCTTCGACGATAAAGTTATGAAGCAGCTGAAGCGCAGGAGATACACAGGATGGGGAAGATTGTCAAGGAAGCTGATCAATGGAATTAGGGATAAACAGAGTGGCAAGACCATACTGGATTTCCTCAAATCTGATGGCTTCGCCAATAGGAACTTCATGCAACTGATTCACGATGACTCTCTTACCTTCAAGGAGGACATTCAAAAGGCTCAGGTGAGCGGGCAGGGAGACTCCCTTCATGAACACATCGCGAATTTGGCAGGTTCCCCCGCTATTAAAAAGGGCATCCTTCAAACTGTCAAGGTGGTGGATGAATTGGTCAAGGTAATGGGCAGACATAAGCCAGAAAATATTGTGATCGAGATGGCCCGCGAAAACCAGACCACACAGAAGGGCCAGAAAAATAGTAGAGAGCGGATGAAGAGGATCGAGGAGGGCATCAAAGAGCTGGGATCTCAGATTCTCAAAGAACACCCCGTAGAAAACACACAGCTGCAGAACGAAAAATTGTACTTGTACTATCTGCAGAACGGCAGAGACATGTACGTCGACCAAGAACTTGATATTAATAGACTGTCCGACTATGACGTAGACCATATCGTGCCCCAGTCCTTCCTGAAGGACGACTCCATTGATAACAAAGTCTTGACAAGAAGCGACAAGAACAGGGGTAAAAGTGATAATGTGCCTAGCGAGGAGGTGGTGAAAAAAATGAAGAACTACTGGCGACAGCTGCTTAATGCAAAGCTCATTACACAACGGAAGTTCGATAATCTGACGAAAGCAGAGAGAGGTGGCTTGTCTGAGTTGGACAAGGCAGGGTTTATTAAGCGGCAGCTGGTGGAAACTAGGCAGATCACAAAGCACGTGGCGCAGATTTTGGACAGCCGGATGAACACAAAATACGACGAAAATGATAAACTGATACGAGAGGTCAAAGTTATCACGCTGAAAAGCAAGCTGGTGTCCGATTTTCGGAAAGACTTCCAGTTCTACAAAGTTCGCGAGATTAATAACTACCATCATGCTCACGATGCGTACCTGAACGCTGTTGTCGGGACCGCCTTGATAAAGAAGTACCCAAAGCTGGAATCCGAGTTCGTATACGGGGATTACAAAGTGTACGATGTGAGGAAAATGATAGCCAAGTCCGAGCAGGAGATTGGAAAGGCCACAGCTAAGTACTTCTTTTATTCTAACATCATGAATTTTTTTAAGACGGAAATTACCCTGGCCAACGGAGAGATCAGAAAGCGGCCCCTTATAGAGACAAATGGTGAAACAGGTGAAATCGTCTGGGATAAGGGCAGGGATTTCGCTACTGTGAGGAAGGTGCTGAGTATGCCACAGGTAAATATCGTGAAAAAAACCGAAGTACAGACCGGAGGATTTTCCAAGGAAAGCATTTTGCCTAAAAGAAACTCAGACAAGCTCATCGCCCGCAAGAAAGATTGGGACCCTAAGAAATACGGGGGATTTGACTCACCCACCGTAGCCTATTCTGTGCTGGTGGTAGCTAAGGTGGAAAAAGGAAAGTCTAAGAAGCTGAAGTCCGTGAAGGAACTCTTGGGAATCACTATCATGGAAAGATCATCCTTTGAAAAGAACCCTATCGATTTCCTGGAGGCTAAGGGTTACAAGGAGGTCAAGAAAGACCTCATCATTAAACTGCCAAAATACTCTCTCTTCGAGCTGGAAAATGGCAGGAAGAGAATGTTGGCCAGCGCCGGAGAGCTGCAAAAGGGAAACGAGCTTGCTCTGCCCTCCAAATATGTTAATTTTCTCTATCTCGCTTCCCACTATGAAAAGCTGAAAGGGTCTCCCGAAGATAACGAGCAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTATCTGGATGAAATAATCGAACAAATAAGCGAGTTCAGCAAAAGGGTTATCCTGGCGGATGCTAATTTGGACAAAGTACTGTCTGCTTATAACAAGCACCGGGATAAGCCTATTAGGGAACAAGCCGAGAATATAATTCACCTCTTTACACTCACGAATCTCGGAGCCCCCGCCGCCTTCAAATACTTTGATACGACTATCGACCGGAAACGGTATACCAGTACCAAAGAGGTCCTCGATGCCACCCTCATCCACCAGTCAATTACTGGCCTGTACGAAACACGGATCGACCTCTCTCAACTGGGCGGCGACTAG
(SEQ ID NO:3150)
下面提供了编码包含SEQ ID NO:3172的Cas9分子的示例性密码子优化的核酸序列;
ATGGCTCCGAAGAAAAAGCGTAAAGTGGATAAAAAATACAGCATTGGTCTGGACATTGGCACGAACTCAGTGGGTTGGGCGGTCATCACGGATGAATATAAGGTCCCGTCAAAAAAGTTCAAAGTGCTGGGCAACACCGATCGCCATTCGATTAAAAAGAATCTGATCGGCGCGCTGCTGTTTGATAGCGGTGAAACCGCGGAAGCAACGCGTCTGAAACGTACCGCACGTCGCCGTTACACGCGCCGTAAAAATCGTATTCTGTATCTGCAGGAAATCTTTAGCAACGAAATGGCGAAAGTTGATGACTCATTTTTCCACCGCCTGGAAGAATCGTTTCTGGTCGAAGAAGACAAAAAGCATGAACGTCACCCGATTTTCGGTAATATCGTTGATGAAGTCGCGTACCATGAAAAATATCCGACGATTTACCATCTGCGTAAAAAACTGGTGGATTCAACCGACAAAGCCGATCTGCGCCTGATTTACCTGGCACTGGCTCATATGATCAAATTTCGTGGCCACTTCCTGATTGAAGGTGACCTGAACCCGGATAACTCTGACGTTGATAAGCTGTTCATCCAGCTGGTCCAAACCTATAATCAGCTGTTCGAAGAAAACCCGATCAATGCAAGTGGCGTTGATGCGAAGGCCATTCTGTCCGCTCGCCTGAGTAAATCCCGCCGTCTGGAAAACCTGATTGCACAACTGCCGGGCGAAAAGAAAAACGGCCTGTTTGGTAATCTGATCGCTCTGTCACTGGGTCTGACGCCGAACTTTAAATCGAATTTCGACCTGGCAGAAGATGCTAAGCTGCAGCTGAGCAAAGATACCTACGATGACGATCTGGACAACCTGCTGGCGCAAATTGGTGACCAGTATGCCGACCTGTTTCTGGCGGCCAAAAATCTGTCAGATGCCATTCTGCTGTCGGACATCCTGCGCGTGAACACCGAAATCACGAAAGCGCCGCTGTCAGCCTCGATGATTAAACGCTACGATGAACATCACCAGGACCTGACCCTGCTGAAAGCACTGGTTCGTCAGCAACTGCCGGAAAAGTACAAGGAAATTTTCTTTGACCAATCTAAGAACGGCTATGCAGGTTACATCGATGGCGGTGCTAGTCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAAATGGATGGCACGGAAGAACTGCTGGTGAAACTGAATCGTGAAGATCTGCTGCGTAAACAACGCACCTTTGACAACGGCAGCATTCCGCATCAGATCCACCTGGGTGAACTGCATGCGATTCTGCGCCGTCAGGAAGATTTTTATCCGTTCCTGAAAGACAACCGTGAAAAAATTGAAAAGATCCTGACGTTTCGCATCCCGTATTACGTTGGCCCGCTGGCGCGTGGTAATAGCCGCTTCGCCTGGATGACCCGCAAATCTGAAGAAACCATTACGCCGTGGAACTTTGAAGAAGTGGTTGATAAAGGTGCAAGCGCTCAGTCTTTTATCGAACGTATGACCAATTTCGATAAAAACCTGCCGAATGAAAAGGTCCTGCCGAAACATAGCCTGCTGTATGAATACTTTACCGTGTACAACGAACTGACGAAAGTGAAGTATGTTACCGAAGGCATGCGCAAACCGGCGTTTCTGTCTGGTGAACAGAAAAAAGCCATTGTGGATCTGCTGTTCAAGACCAATCGTAAAGTTACGGTCAAACAGCTGAAGGAAGATTACTTCAAAAAGATCGAAGAATTCGACAGCGTGGAAATTTCTGGCGTTGAAGATCGTTTCAACGCCAGTCTGGGTACCTATCATGACCTGCTGAAGATCATCAAGGACAAGGATTTTCTGGATAACGAAGAAAATGAAGACATTCTGGAAGATATCGTGCTGACCCTGACGCTGTTCGAAGATCGTGAAATGATTGAAGAACGCCTGAAAACGTACGCACACCTGTTTGACGATAAAGTTATGAAGCAGCTGAAACGCCGTCGCTATACCGGCTGGGGTCGTCTGTCTCGCAAACTGATTAATGGCATCCGCGATAAGCAAAGTGGTAAAACGATTCTGGATTTCCTGAAATCCGACGGCTTTGCCAACCGTAATTTCATGCAGCTGATCCATGACGATAGTCTGACCTTTAAGGAAGACATTCAGAAAGCACAAGTGTCAGGCCAGGGTGATTCGCTGCATGAACACATTGCGAACCTGGCCGGCTCCCCGGCTATTAAAAAGGGTATCCTGCAGACCGTCAAAGTCGTGGATGAACTGGTGAAGGTTATGGGCCGTCACAAACCGGAAAACATTGTGATCGAAATGGCGCGCGAAAATCAGACCACGCAAAAGGGTCAGAAAAACTCACGTGAACGCATGAAGCGCATTGAAGAAGGCATCAAAGAACTGGGTTCGCAGATTCTGAAAGAACATCCGGTTGAAAACACCCAGCTGCAAAATGAAAAACTGTACCTGTATTACCTGCAAAATGGCCGTGACATGTATGTCGATCAGGAACTGGACATCAACCGCCTGAGCGACTATGATGTCGACCACATTGTGCCGCAGAGCTTTCTGAAGGACGATTCTATCGATAATAAAGTGCTGACCCGTTCTGATAAGAACCGCGGTAAAAGCGACAATGTTCCGTCTGAAGAAGTTGTCAAAAAGATGAAGAACTACTGGCGTCAACTGCTGAATGCGAAGCTGATTACGCAGCGTAAATTCGATAACCTGACCAAGGCGGAACGCGGCGGTCTGAGTGAACTGGATAAGGCCGGCTTTATCAAACGTCAACTGGTGGAAACCCGCCAGATTACGAAACATGTTGCCCAGATCCTGGATTCCCGCATGAACACGAAATATGACGAAAATGATAAGCTGATTCGTGAAGTCAAAGTGATCACCCTGAAGAGTAAGCTGGTGTCCGATTTCCGTAAGGACTTTCAGTTCTACAAAGTTCGCGAAATTAACAATTACCATCACGCACACGATGCTTATCTGAATGCAGTGGTTGGCACCGCTCTGATCAAAAAGTATCCGAAACTGGAAAGCGAATTTGTGTATGGTGATTACAAAGTCTATGACGTGCGCAAGATGATTGCGAAAAGTGAACAGGAAATCGGCAAGGCGACCGCCAAGTACTTTTTCTATTCCAACATCATGAACTTTTTCAAGACCGAAATCACGCTGGCAAATGGCGAAATTCGTAAACGCCCGCTGATCGAAACCAACGGCGAAACGGGTGAAATTGTGTGGGATAAAGGTCGTGACTTCGCGACCGTTCGCAAAGTCCTGTCAATGCCGCAAGTGAATATCGTTAAAAAGACCGAAGTTCAGACGGGCGGTTTTAGTAAAGAATCCATCCTGCCGAAGCGTAACTCGGATAAACTGATTGCGCGCAAAAAGGATTGGGACCCGAAAAAGTACGGCGGTTTTGATAGTCCGACCGTTGCATATTCCGTCCTGGTCGTGGCTAAAGTTGAAAAAGGCAAGAGTAAAAAGCTGAAGTCCGTCAAAGAACTGCTGGGTATTACCATCATGGAACGTAGCTCTTTTGAAAAGAACCCGATTGACTTCCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGATCTGATTATCAAGCTGCCGAAATATTCGCTGTTCGAACTGGAAAACGGTCGTAAACGCATGCTGGCAAGCGCTGGCGAACTGCAGAAGGGTAATGAACTGGCACTGCCGTCTAAATATGTGAACTTTCTGTACCTGGCTAGCCATTATGAAAAACTGAAGGGTTCTCCGGAAGATAACGAACAGAAGCAACTGTTCGTTGAACAACATAAACACTACCTGGATGAAATCATCGAACAGATCTCAGAATTCTCGAAACGCGTCATTCTGGCGGATGCCAATCTGGACAAAGTGCTGAGCGCGTATAACAAGCATCGTGATAAACCGATTCGCGAACAGGCCGAAAATATTATCCACCTGTTTACCCTGACGAACCTGGGCGCACCGGCAGCTTTTAAATACTTCGATACCACGATCGACCGTAAGCGCTATACCAGCACGAAAGAAGTTCTGGATGCTACCCTGATTCATCAGTCAATCACCGGTCTGTATGAAACGCGTATTGACCTGAGCCAACTGGGCGGTGATAGCCGTGCCGACCATCACCATCACCATCACTAATAG(SEQ IDNO:3151)
如果以上Cas9序列在C末端与肽或多肽融合(例如,无活性Cas9在C末端与转录阻遏物融合),则应理解终止密码子将被除去。
本文还提供了用于产生Cas9分子例如本文所述的Cas9分子的核酸/载体和细胞。多肽分子的重组产生可以使用技术人员已知的技术完成。本文描述了分子和用于重组产生多肽分子(例如Cas9分子,例如,如本文所述)的方法。如本文所述,“重组”分子和产生包括通过重组方法制备、表达、产生或分离的所有多肽(例如,如本文所述的Cas9分子),例如从对于编码目的分子的核酸是转基因或转染色体的动物(例如小鼠)分离的多肽,由其制备的杂交瘤,从被转化以表达分子的宿主细胞例如从转染瘤中分离的分子,从重组组合文库分离的分子,和通过涉及将编码分子(或其部分)的基因的全部或一部分剪接到其他DNA序列的任何其他方法制备、表达、产生或分离的分子。重组产生可以来自宿主细胞,例如,包含编码本文所述分子(例如Cas9分子,例如本文所述的Cas9分子)的核酸的宿主细胞。
本文提供了编码分子(例如,Cas9分子和/或gRNA分子)的核酸分子,例如,如本文所述的。具体提供的是包含如下序列的核酸分子,该序列编码SEQ ID NO:3161至SEQ IDNO:3172中任一个,或编码SEQ ID NO:3161至SEQ ID NO:3172中任一个的片段,或编码与SEQ ID NO:3161至SEQ ID NO:3172中的任一个具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同源性的多肽。
本文提供了包含任何上述核酸分子的载体,例如,如本文所述的载体。在实施例中,所述核酸分子与启动子可操作地连接,例如在导入载体的宿主细胞中可操作的启动子。
本文提供了包含一种或多种本文所述核酸分子和/或载体的宿主细胞。在实施例中,宿主细胞是原核宿主细胞。在实施例中,宿主细胞是真核宿主细胞。在实施例中,宿主细胞是酵母或大肠杆菌细胞。在实施例中,宿主细胞是哺乳动物细胞,例如人细胞。此类宿主细胞可用于产生本文所述的重组分子,例如Cas9或gRNA分子(例如,如本文所述)。
其他Cas分子
任何Cas9变体或II类CRISPR内切核酸酶均可用于本文所述的任何组合物和方法。
术语“Cas9变体”是指蛋白,其与野生型Cas9蛋白相比在整个序列或序列的功能部分(例如,50、100、150或200个连续氨基酸的部分)具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%氨基酸序列同一性并且与野生型Cas9蛋白相比具有一个或多个增加其与PAM结合特异性的突变。示例性Cas9变体列于下表6中。
表6.
Figure BDA0003693276070001091
如本文所指的“Cpf1”或“Cpf1蛋白”或“Cas12a”包括Cpf1(CxxC指蛋白1)内切核酸酶的任何重组或天然存在形式或其保持Cpf1内切核酸酶活性的变体或同源物(例如与Cpf1相比,在至少50%、80%、90%、95%、96%、97%、98%、99%或100%活性范围内)。在一些方面,与天然存在的Cpf1蛋白相比,变体或同源物跨整个序列或序列的一部分(例如50、100、150或200个连续氨基酸部分)具有至少90%、95%、96%、97%、98%、99%或100%氨基酸序列同一性。在实施例中,Cpf1蛋白与由UniProt参考号Q9P0U4鉴定的蛋白或与其具有实质同一性的变体或同源物基本上相同。
术语“II类CRISPR内切核酸酶”是指具有与Cas9相似的内切核酸酶活性并参与II类CRISPR系统的内切核酸酶。II类CRISPR系统的实例是来自酿脓链球菌SF370的II型CRISPR基因座,它包含具有四个基因Cas9、Cas1、Cas2和Csn1的簇,以及两个非编码RNA元件tracrRNA和由短段非重复序列(间隔子,每个约30bp)间隔的重复序列(正向重复)的特征阵列。在该系统中,靶向DNA双链断裂(DSB)可以在四个连续步骤中产生。首先,两种非编码RNA,前crRNA阵列和tracrRNA,可以从CRISPR基因座转录。其次,tracrRNA可以与前crRNA的正向重复序列杂交,然后前crRNA被加工成包含单个间隔子序列的成熟crRNA。第三,成熟crRNA:tracrRNA复合物可以通过crRNA的间隔子区和前间隔子DNA之间的异双链形成将Cas9引导至由前间隔子和相应的PAM组成的DNA靶标。最后,Cas9可以介导PAM上游靶DNA的切割,从而在前间隔子内产生DSB。
V.候选分子的功能分析
候选Cas9分子、候选gRNA分子、候选Cas9分子/gRNA分子复合物可以通过本领域已知的方法或如本文所述的进行评估。例如,用于评估Cas9分子的内切核酸酶活性的示例性方法描述于例如Jinek等人,SCIENCE[科学]2012;337(6096):8 16-821中。
VI.模板核酸(用于引入核酸)
如本文所用的术语“模板核酸”或“供体模板”是指有待在已经被本发明的CRISPR系统修饰(例如切割)的靶序列处或附近插入的核酸。在一个实施例中,在靶序列处或附近的核酸序列被修饰为通常在一个或多个切割位点处或附近具有模板核酸的一些或全部序列。在一个实施例中,模板核酸是单链的。在一个替代性实施例中,模板核酸是双链的。在一个实施例中,模板核酸是DNA,例如双链DNA。在一个替代性实施例中,模板核酸是单链DNA。
在实施例中,模板核酸包含编码珠蛋白(例如β珠蛋白)的序列,例如包含β珠蛋白基因。在一个实施例中,由该核酸编码的β珠蛋白包含一个或多个突变,例如抗镰状化突变。在一个实施例中,由该核酸编码的β珠蛋白包含突变T87Q。在一个实施例中,由该核酸编码的β珠蛋白包含突变G16D。在一个实施例中,由该核酸编码的β珠蛋白包含突变E22A。在一个实施例中,β珠蛋白基因包含突变G16D、E22A和T87Q。在实施例中,模板核酸进一步包含一种或多种调节元件,例如启动子(例如人β珠蛋白启动子)、3'增强子、和/或珠蛋白基因座控制区域的至少一部分(例如,一个或多个DNA酶I超敏感性位点(例如,人珠蛋白基因座的HS2、HS3和/或HS4))。
在其他实施例中,模板核酸包含编码γ珠蛋白的序列,例如包含γ珠蛋白基因。在实施例中,模板核酸包含编码多于一个拷贝的γ珠蛋白的序列,例如包含两个或更多个(例如两个)γ珠蛋白基因序列。在实施例中,模板核酸进一步包含一种或多种调节元件,例如启动子和/或增强子。
在一个实施例中,模板核酸通过参与同源定向修复事件来改变靶位置的结构。在一个实施例中,模板核酸改变靶位置的序列。在一个实施例中,模板核酸使得经修饰的或非天然发生的碱基掺入靶核酸中。
可以使用本文讨论的方法之一校正本文所述的基因或途径中的突变。在一个实施例中,使用模板核酸通过同源定向修复(HDR)来校正本文所述的基因或途径中的突变。在一个实施例中,使用模板核酸通过同源重组(HR)来校正本文所述的基因或途径中的突变。在一个实施例中,使用模板核酸通过非同源末端连接(NHEJ)修复来校正本文所述的基因或途径中的突变。在其他实施例中,编码目的分子的核酸可以插入在由本发明的CRISPR系统修饰的位点处或附近。在实施例中,模板核酸包含调节元件,例如一种或多种启动子和/或增强子,其可操作地连接至编码目的分子的核酸序列,例如如本文所述。
HDR或HR修复和模板核酸
如本文所述,核酸酶诱导的同源定向修复(HDR)或同源重组(HR)可用于改变靶序列并校正(例如,修复或编辑)基因组中的突变。尽管不希望受理论束缚,但据信通过基于供体模板或模板核酸的修复发生靶序列的改变。例如,供体模板或模板核酸提供靶序列的改变。预期质粒供体或线性双链模板可用作同源重组的模板。进一步预期单链供体模板可用作通过靶序列和供体模板之间的同源定向修复的替代方法(例如,单链退火)来改变靶序列的模板。供体模板实现的对靶序列的改变可取决于经由Cas9分子的切割。经由Cas9的切割可以包括双链断裂、一个单链断裂或两个单链断裂。
在一个实施例中,可以通过单个双链断裂或两个单链断裂来校正突变。在一个实施例中,可以通过提供模板和CRISPR/Cas9系统来校正突变,该CRISPR/Cas9系统产生(1)一个双链断裂,(2)两个单链断裂,(3)两个双链断裂,其中断裂发生在靶序列的每一侧,(4)一个双链断裂和两个单链断裂,其中双链断裂和两个单链断裂发生在靶序列的每一侧,(5)四个单链断裂,其中一对单链断裂发生在靶序列的每一侧,或(6)一个单链断裂。
双链断裂介导的校正
在一个实施例中,双链切割受Cas9分子影响,该Cas9分子具有与HNH样结构域相关的切割活性和与RuvC样结构域(例如N末端RuvC样结构域)相关的切割活性,例如野生型Cas9。此类实施例仅需要单个gRNA。
单链断裂介导的校正
在其他实施例中,两个单链断裂或缺口受Cas9分子影响,该Cas9分子具有切口酶活性,例如与HNH样结构域相关的切割活性或与N末端RuvC样结构域相关的切割活性。此类实施例需要两种gRNA,一种用于放置每个单链断裂。在一个实施例中,具有切口酶活性的Cas9分子切割与gRNA杂交的链,但不切割和与gRNA杂交的链互补的链。在一个实施例中,具有切口酶活性的Cas9分子不切割与gRNA杂交的链,而是切割和与gRNA杂交的链互补的链。
在一个实施例中,切口酶具有HNH活性,例如,使具有RuvC活性的Cas9分子(例如在D10处具有突变(例如D10A突变)的Cas9分子)失活。D10A使RuvC失活;因此,Cas9切口酶(仅)具有HNH活性并且将切割与gRNA杂交的链(例如,互补链,其上没有NGG PAM)。在其他实施例中,具有H840(例如H840A)突变的Cas9分子可用作切口酶。H840A使HNH失活;因此,Cas9切口酶(仅)具有RuvC活性并切割非互补链(例如,具有NGG PAM并且其序列与gRNA相同的链)。
在切口酶和两种gRNA用于定位两个单链切口的一个实施例中,一个切口位于靶核酸的+链上,并且一个切口位于-链上。PAM面向外。可以选择gRNA使得gRNA被约0-50、0-100或0-200个核苷酸分开。在一个实施例中,在与两种gRNA的靶向结构域互补的靶序列之间没有重叠。在一个实施例中,gRNA不重叠并且被多达50、100或200个核苷酸分开。在一个实施例中,使用两种gRNA可以增加特异性,例如通过降低脱靶结合(Ran等人,CELL[细胞]2013)。
在一个实施例中,单个切口可用于诱导HDR。本文预期单个切口可用于增加在给定切割位点处的HDR、HR或NHEJ的比率。
双链断裂或单链断裂相对于靶位置的放置
双链断裂或一条链中的单链断裂应该足够靠近靶位置,使得校正发生。在一个实施例中,距离不超过50、100、200、300、350或400个核苷酸。虽然不希望受理论束缚,但据信断裂应该足够靠近靶位置,使得断裂在末端切除过程中经受外切核酸酶介导的移除的区内。如果靶位置与断裂之间的距离太大,则突变可能不被包含在末端切除中,并且因此可能不被校正,因为供体序列仅可以用于校正末端切除区内的序列。
在gRNA(单分子(或嵌合)或模块化gRNA)和Cas9核酸酶诱导双链断裂以诱导HDR-或HR-介导的校正的一个实施例中,切割位点是在离靶位置的0-200bp之间(例如,0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、75至100bp)。在一个实施例中,切割位点是在离靶位置的0-100bp之间(例如0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。
在与Cas9切口酶复合的两种gRNA(独立地,单分子(或嵌合)或模块化gRNA)诱导两个单链断裂以诱导HDR介导的校正的一个实施例中,更接近的切口是在离靶位置的0-200bp之间(例如,0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、75至100bp),并且这两个切口将彼此理想地在25-55bp内(例如,25至50、25至45、25至40、25至35、25至30、30至55、30至50、30至45、30至40、30至35、35至55、35至50、35至45、35至40、40至55、40至50、40至45bp)并且离彼此不超过100bp(例如,离彼此不超过90、80、70、60、50、40、30、20、10或5bp)。在一个实施例中,切割位点是在离靶位置的0-100bp之间(例如0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。
在一个实施例中,两种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成将双链断裂定位在靶位置的两侧。在一个替代性实施例中,三种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成将双链断裂(即,一种gRNA与Cas9核酸酶复合)和两个单链断裂或成对的单链断裂(即,两种gRNA与Cas9切口酶复合)定位在靶位置的任一侧(例如,第一gRNA用于靶向靶位置的上游(即5'),并且第二gRNA用于靶向靶位置的下游(即3'))。在另一个实施例中,四种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成在靶位置的任一侧产生两对单链断裂(即,两对两种gRNA与Cas9切口酶复合)(例如,第一gRNA用于靶向靶位置的上游(即5'),并且第二gRNA用于靶向靶位置的下游(即3'))。一个或多个双链断裂或成对的两个单链切口的较近者将理想地在靶位置的0-500bp内(例如,离靶位置不超过450、400、350、300、250、200、150、100、50或25bp)。当使用切口酶时,成对的两个切口彼此在25-55bp内(例如,在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、或40至45bp之间)并且离彼此不超过100bp(例如,不超过90、80、70、60、50、40、30、20或10bp)。
在一个实施例中,两种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成将双链断裂定位在靶位置的两侧。在一个替代性实施例中,三种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成将双链断裂(即,一种gRNA与Cas9核酸酶复合)和两个单链断裂或成对的单链断裂(即,两种gRNA与Cas9切口酶复合)定位在两个靶序列上(例如,第一gRNA用于靶向插入位点的上游(即5')靶序列,并且第二gRNA用于靶向插入位点的下游(即3')靶序列)。在另一个实施例中,四种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成在插入位点的任一侧产生两对单链断裂(即,两对两种gRNA与Cas9切口酶复合)(例如,第一gRNA用于靶向本文所述的上游(即5')靶序列,并且第二gRNA用于靶向本文所述的下游(即3')靶序列)。一个或多个双链断裂或成对的两个单链切口的较近者将理想地在靶位置的0-500bp内(例如,离靶位置不超过450、400、350、300、250、200、150、100、50或25bp)。当使用切口酶时,成对的两个切口彼此在25-55bp内(例如,在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、或40至45bp之间)并且离彼此不超过100bp(例如,不超过90、80、70、60、50、40、30、20或10bp)。
同源臂的长度
同源臂应该至少延伸至其中可以发生末端切除的区,例如为了允许切除的单链突出端查找供体模板内的互补区。总长度可能受参数诸如质粒大小或病毒包装限制的限制。在一个实施例中,同源臂不延伸到重复元件(例如,ALU重复、LINE重复)中。模板可以具有两个相同或不同长度的同源臂。
示例性同源臂长度包括至少25、50、100、250、500、750或1000个核苷酸。
如本文所用,靶位置是指通过Cas9分子依赖性过程修饰的靶核酸(例如,染色体)上的位点。例如,靶位置可以是进行靶核酸的经修饰的Cas9分子切割和模板核酸指导的修饰(例如校正)的靶位置。在一个实施例中,靶位置可以是靶核酸上的两个核苷酸(例如相邻核苷酸)之间的、向其中添加一个或多个核苷酸的位点。靶位置可以包含通过模板核酸改变(例如校正)的一个或多个核苷酸。在一个实施例中,靶位置处于靶序列(例如与gRNA结合的序列)内。在一个实施例中,靶位置处于靶序列(例如与gRNA结合的序列)的上游或下游。
通常,模板序列与靶序列一起经历断裂介导或催化的重组。在一个实施例中,模板核酸包含对应于靶序列上的位点的序列,该位点被Cas9介导的切割事件切割。在一个实施例中,模板核酸包含对应于两者(靶序列上的在第一Cas9介导的事件中被切割的第一位点和靶序列上的在第二Cas9介导的事件中被切割的第二位点)的序列。
在一个实施例中,模板核酸可以包含使得翻译序列的编码序列中发生改变的序列,例如使得蛋白质产物中的一个氨基酸取代为另一个氨基酸,例如使得突变型等位基因转化为野生型等位基因,野生型等位基因转化为突变型等位基因,和/或引入终止密码子、插入氨基酸氨基、缺失氨基酸残基、或无义突变的序列。
在其他实施例中,模板核酸可以包含使得非编码序列中发生改变,例如外显子中或5'或3'非翻译区或非转录区中发生改变的序列。此类改变包括控制元件(例如启动子、增强子)中的改变,以及顺式作用或反式作用控制元件中的改变。
模板核酸可以包含当整合时导致以下的序列:
降低正控制元件的活性;
增加正控制元件的活性;
降低负控制元件的活性;
增加负控制元件的活性;
减少基因的表达;
增加基因的表达;
增加对病症或疾病的抗性;
增加对病毒进入的抗性;
校正突变或改变不需要的氨基酸残基;
赋予、增加、消除或减少基因产物的生物学特性,例如增加酶的酶活性,或增加基因产物与另一个分子相互作用的能力。
模板核酸可以包含导致以下的序列:
靶序列的1、2、3、4、5、6、7、8、9、10、11、12个或更多个核苷酸的序列中发生变化。
在一个实施例中,模板核酸的长度是20+/-10、30+/-10、40+/-10、50+/-10、60+/-10、70+/-10、80+/-10、90+/-10、100+/-10、110+/-10、120+/-10、130+/-10、140+/-10、150+/-10、160+/-10、170+/-10、180+/-10、190+/-10、200+/-10、210+/-10、220+/-10、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-2000、2000-3000个或多于3000个核苷酸。
模板核酸包含以下组分:
[5'同源臂]-[插入序列]-[3'同源臂]。
同源臂提供了重组到染色体中,这可以用替换序列替代不希望的元件,例如突变或特征。在一个实施例中,同源臂侧接最远的切割位点。
在一个实施例中,5'同源臂的3'端是靠近替换序列的5'端的位置。在一个实施例中,5'同源臂可以从替换序列的5'端延伸至少10、20、30、40、50、60、70、80、90、100、120、150、180、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸5'。
在一个实施例中,3'同源臂的5'端是靠近替换序列的3'端的位置。在一个实施例中,3'同源臂可以从替换序列的3'端延伸至少10、20、30、40、50、60、70、80、90、100、120、150、180、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸3'。
本文预期可以缩短一个或两个同源臂以避免包含某些序列重复元件,例如Alu重复、LINE元件。例如,可以缩短5'同源臂以避免序列重复元件。在其他实施例中,可以缩短3'同源臂以避免序列重复元件。在一些实施例中,可以缩短5'同源臂和3'同源臂两者以避免包含某些序列重复元件。
本文预期用于校正突变的模板核酸可以被设计为用作单链寡核苷酸(ssODN)。当使用ssODN时,5'同源臂和3'同源臂的长度可以在高达约200个碱基对(bp)的范围内,例如长度为至少25、50、75、100、125、150、175或200bp。对于ssODN也考虑了更长的同源臂,因为寡核苷酸合成的改进仍继续进行。
用于基因靶向的NHEJ方法
如本文所述,核酸酶诱导的非同源末端连接(NHEJ)可以用于靶基因特异性敲除。核酸酶诱导的NHEJ还可以用于去除(例如缺失)目的基因中的序列。
尽管不希望受理论束缚,但据信,在一个实施例中,与本文所述的方法相关的基因组改变依赖于核酸酶诱导的NHEJ和NHEJ修复途径的易错性质。NHEJ通过使两个末端连接在一起来修复DNA中的双链断裂;然而,通常,只要两个相容末端在恰好它们通过双键断裂形成时被完美连接,原始序列就被恢复。在末端重新连接之前,双键断裂的DNA末端常常是酶加工的受试者,酶加工在一条或两条链处产生核苷酸的添加或去除。这使得NHEJ修复位点处的DNA序列中存在插入和/或缺失(indel)突变。这些突变中的三分之二可以改变阅读框并且因此产生非功能蛋白。另外,维持阅读框但插入或缺失大量的序列的突变可以破坏蛋白质的功能。这是基因座依赖性的,因为关键功能结构域中的突变可能比蛋白质的非关键区中的突变耐受性低。
由NHEJ产生的插入/缺失突变在性质上是不可预测的;然而,在给定的断裂位点处,某些插入/缺失序列是有利的并且是以群来过度表示的。缺失的长度可以广泛地变化;最常见是在1-50bp范围内,但是它们可以轻易达到大于100-200bp。插入往往是较短的并且常常包含紧密围绕断裂位点的序列的短的重复。然而,有可能获得大的插入,并且在这些情况下,插入的序列常常被跟踪至基因组的其他区或跟踪至细胞中存在的质粒DNA。
因为NHEJ是诱变的方法,所以其还可以用于缺失小序列基序,只要不需要产生特定的最终序列。如果双链断裂被靶向靠近短的靶序列,则由NHEJ修复导致的缺失突变常常跨越并且因此去除不想要的核苷酸。对于较大的DNA区段的缺失,引入两个双链断裂(序列的每侧上一个双链断裂)可以在末端之间产生NHEJ,其中去除了整个间插序列。这两种方法都可以用于缺失特定DNA序列;然而,NHEJ的易错性质仍可能在修复位点产生插入/缺失突变。
双链切割Cas9分子和单链或切口酶Cas9分子均可用于本文所述的方法和组合物中以产生NHEJ介导的插入/缺失。靶向基因(例如编码区,例如目的基因的早期编码区)的NHEJ介导的插入/缺失可以用于敲除目的基因(即消除其表达)。例如,目的基因的早期编码区包含紧跟着转录起始位点的序列,在编码序列的第一外显子内,或在转录起始位点的500bp内(例如,小于500、450、400、350、300、250、200、150、100或50bp)。
双链或单链断裂相对于靶位置的放置
在gRNA和Cas9核酸酶产生双链断裂以诱导NHEJ介导的插入/缺失的一个实施例中,gRNA(例如单分子(或嵌合)或模块化gRNA分子)被配置成将一个双链断裂定位成与靶位置的核苷酸紧邻。在一个实施例中,切割位点是在离靶位置的0-500bp之间(例如,离靶位置小于500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。
在与Cas9切口酶复合的两种gRNA诱导两个单链断裂以诱导NHEJ介导的插入/缺失的一个实施例中,两种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成定位两个单链断裂以提供NHEJ修复靶位置的核苷酸。在一个实施例中,gRNA被配置成将切口定位在不同链上的相同位置或彼此的几个核苷酸内,基本上模拟双链断裂。在一个实施例中,较近的切口在离靶位置的0-30bp之间(例如,离靶位置小于30、25、20、1、10、9、8、7、6、5、4、3、2或1bp),并且这两个切口彼此在25-55bp内(例如,在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、或40至45bp之间)并且离彼此不超过100bp(例如,不超过90、80、70、60、50、40、30、20或10bp)。在一个实施例中,gRNA被配置成将单链断裂放置在靶位置的核苷酸的任一侧。
双链切割Cas9分子和单链或切口酶Cas9分子均可用于本文所述的方法和组合物中以产生靶位置的两侧的断裂。可以在靶位置的两侧产生双链断裂或成对的单链断裂以去除两个切口之间的核酸序列(例如,使两个断裂之间的区缺失)。在一个实施例中,两种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成将双链断裂定位在靶位置的两侧(例如,第一gRNA用于靶向本文所述的基因或途径中的突变的上游(即5'),并且第二gRNA用于靶向本文所述的基因或途径中的突变的下游(即3'))。在一个替代性实施例中,三种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成将双链断裂(即,一种gRNA与Cas9核酸酶复合)和两个单链断裂或成对的单链断裂(即,两种gRNA与Cas9切口酶复合)定位在靶位置的任一侧(例如,第一gRNA用于靶向本文所述的基因或途径中的突变的上游(即5'),并且第二gRNA用于靶向本文所述的基因或途径中的突变的下游(即3'))。在另一个实施例中,四种gRNA(例如独立地,单分子(或嵌合)或模块化gRNA)被配置成在靶位置的任一侧产生两对单链断裂(即,两对两种gRNA与Cas9切口酶复合)(例如,第一gRNA用于靶向本文所述的基因或途径中的突变的上游(即5'),并且第二gRNA用于靶向本文所述的基因或途径中的突变的下游(即3'))。一个或多个双链断裂或成对的两个单链切口的较近者将理想地在靶位置的0-500bp内(例如,离靶位置不超过450、400、350、300、250、200、150、100、50或25bp)。当使用切口酶时,成对的两个切口彼此在25-55bp内(例如,在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、或40至45bp之间)并且离彼此不超过100bp(例如,不超过90、80、70、60、50、40、30、20或10bp)。
在其他实施例中,可以通过微同源末端连接(MMEJ)来介导模板核酸的插入。参见例如,Saksuma等人,“MMEJ-assisted gene knock-in using TALENs and CRISPR-Cas9with the PITCh systems.[使用TALEN以及CRISPR-Cas9与PITCh系统进行的MMEJ辅助基因敲入]”Nature Protocols[自然试验方案]11,118-133(2016)doi:10.1038/nprot.2015.140,2015年12月17日在线发表,将其内容通过引用以其全文并入。
VII.包含多于一种gRNA分子的系统
尽管不意在受理论束缚,但本文已令人惊讶地显示,靶向紧邻连续核酸的两个靶序列(例如,通过两种gRNA分子/Cas9分子复合物,其各自在其对应的靶序列处或附近诱导单链或双链断裂)诱导位于这两个靶序列之间的核酸序列(或至少80%、85%、90%、95%、96%、97%、98%、99%的核酸序列)的切除(例如,缺失)。在一些方面,本披露提供了两种或更多种gRNA分子的用途,这些gRNA分子包含靶向靶序列的靶向结构域,这些靶序列紧邻连续核酸,这些连续核酸是例如染色体,例如基因或基因座,包括其内含子、外显子和调节元件。该用途可以例如通过将两种或更多种gRNA分子与一种或多种Cas9分子(或编码两种或更多种gRNA分子和/或一种或多种Cas9分子的核酸)一起引入细胞中而实现。
在一些方面,两种或更多种gRNA分子的靶序列被定位成在连续核酸上相隔至少5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、或15,000个核苷酸,但在连续核酸上相隔不超过25,000个核苷酸。在一个实施例中,靶序列被定位成相隔约4000至约6000个核苷酸。在一个实施例中,靶序列被定位成相隔约4000个核苷酸。在一个实施例中,靶序列被定位成相隔约5000个核苷酸。在一个实施例中,靶序列被定位成相隔约6000个核苷酸。
在一些方面,所述多种gRNA分子各自靶向相同基因或基因座内的序列。在另一方面,所述多种gRNA分子各自靶向2种或更多种不同基因或基因座内的序列。
在一些方面,本发明提供了包含多种(例如2种或更多种,例如2种)本发明的gRNA分子的组合物和细胞,其中所述多种gRNA分子靶向相隔小于15,000、小于14,000、小于13,000、小于12,000、小于11,000、小于10,000、小于9,000、小于8,000、小于7,000、小于6,000、小于5,000、小于4,000、小于3,000、小于2,000、小于1,000、小于900、小于800、小于700、小于600、小于500、小于400、小于300、小于200、小于100、小于90、小于80、小于70、小于60、小于50、小于40、或小于30个核苷酸的序列。在一个实施例中,靶序列在双链体核酸的同一条链上。在一个实施例中,靶序列在双链体核酸的不同链上。
在一个实施例中,本发明提供了一种用于切除(例如,缺失)布置于两个gRNA结合位点之间的核酸的方法,这两个gRNA结合位点被布置成在双链体核酸的相同或不同链上相隔小于25,000、小于20,000、小于15,000、小于14,000、小于13,000、小于12,000、小于11,000、小于10,000、小于9,000、小于8,000、小于7,000、小于6,000、小于5,000、小于4,000、小于3,000、小于2,000、小于1,000、小于900、小于800、小于700、小于600、小于500、小于400、小于300、小于200、小于100、小于90、小于80、小于70、小于60、小于50、小于40或小于30个核苷酸。在一个实施例中,该方法提供了布置于与每个gRNA结合位点相关的PAM位点之间的超过50%、超过60%、超过70%、超过80%、超过85%、超过86%、超过87%、超过88%、超过89%、超过90%、超过91%、超过92%、超过93%、超过94%、超过95%、超过96%、超过97%、超过98%、超过99%或100%的核苷酸的缺失。在实施例中,缺失进一步包含在与每个gRNA结合位点相关的一个或多个PAM位点内的一个或多个核苷酸。在实施例中,缺失进一步包含在与每个gRNA结合位点相关的PAM位点之间的区外的一个或多个核苷酸。
在一方面,两种或更多种gRNA分子包含靶向靶序列的靶向结构域,这些靶序列侧接基因调节元件(例如启动子结合位点、增强子区或阻遏物区),使得间插序列(或间插序列的部分)的切除引起目的基因的上调或下调。在其他构建体中,两种或更多种gRNA分子包含靶向基因侧翼序列的靶向结构域,使得间插序列(或其部分)的切除导致目的基因的缺失。
在一个实施例中,所述两种或更多种gRNA分子各自包括靶向结构域,该靶向结构域包含例如表1、例如表2或例如表3的靶向结构域序列,例如由其组成。在实施例中,所述两种或更多种gRNA分子各自包含靶向结构域,该靶向结构域包含gRNA分子的靶向结构域,例如由其组成,该gRNA分子通过本文所述方法导致来自由所述gRNA离体编辑的HSPC的分化的红细胞群中(例如,在编辑后第7天)F细胞的数量上调至少15%。在一些方面,两种或更多种gRNA分子包含与同一基因或区(例如WIZ基因区)中的序列互补的靶向结构域。在一些方面,两种或更多种gRNA分子包含与不同基因或区(例如WIZ内含子区中一种和WIZ外显子区中一种)的序列互补的靶向结构域。
在一方面,两种或更多种gRNA分子包含靶向靶序列的靶向结构域,这些靶序列侧接基因调节元件(例如启动子结合位点、增强子区或阻遏物区),使得间插序列(或间插序列的部分)的切除引起目的基因的上调或下调。在另一个方面,两种或更多种gRNA分子包含靶向基因侧翼序列的靶向结构域,使得间插序列(或间插序列的一部分)的切除导致目的基因的缺失。举例来说,两个或更多个gRNA分子包含靶向WIZ基因侧翼的靶序列的靶向结构域,使得WIZ基因被切除。
在一个实施例中,两种或更多种gRNA分子包含靶向结构域,这些靶向结构域包含选自表1的靶向结构域,例如由其组成。
在一些方面,两种或更多种gRNA分子包含靶向结构域,该靶向结构域包含表2中列出的靶向结构域序列,例如由其组成。在一些方面,两种或更多种gRNA分子包含靶向结构域,该靶向结构域包含表3中列出的gRNA的靶向结构域序列,例如由其组成。
VIII.gRNA的特性
本文还出人意料地显示,单个gRNA分子可以在一个以上的基因座(例如,具有高序列同源性的基因座)中具有靶序列,并且当这样的基因座存在于同一染色体上时,例如,在少于约15,000个核苷酸内、少于约14,000个核苷酸内、少于约13,000个核苷酸内、少于约12,000个核苷酸内、少于约11,000个核苷酸内、少于约10,000个核苷酸内、少于约9,000个核苷酸内、少于约8,000个核苷酸内、少于约7,000个核苷酸内、少于约6,000个核苷酸内、少于约5,000个核苷酸内、少于约4,000个核苷酸内、或少于约3,000个核苷酸内(例如,相隔约4,000至约6,000个核苷酸),这样的gRNA分子可导致间插序列(或其部分)的切除,从而产生有益效果,例如,从修饰的HSPC(如本文所述)分化的红系细胞中胎儿血红蛋白的上调。因此,在一方面,本发明提供了在两个基因座上具有靶序列的gRNA分子,例如,在同一染色体上的基因座,例如,该gRNA分子在WIZ内含子区和WIZ外显子区具有靶序列(例如如表1-3中所述)。不受理论的束缚,可以认为这样的gRNA可能导致在多于一个位置(例如,在两个区的每个区中的靶序列处)切割基因组,并且随后的修复可能导致缺失间插核酸序列。同样,不受理论的限制,所述间插序列的缺失可能对一种或多种蛋白质的表达或功能具有期望的作用。
不受理论束缚,据信一些插入/缺失模式可能比其他插入/缺失模式更有利。例如,主要包括导致“移码突变”的插入和/或缺失(例如,1-或2-碱基对插入或缺失,或任何插入或缺失,其中n/3不是整数(其中n=插入或缺失中核苷酸的数量))的插入/缺失可能有益于减少或消除功能蛋白的表达。同样,插入/缺失主要包括“大缺失”(缺失超过10、11、12、13、14、15、20、25或30个核苷酸,例如,超过1kb、超过2kb、超过3kb、超过5kb、或超过10kb,例如,包含设置在例如如本文所述的gRNA的第一和第二结合位点之间的序列)也可以有益于例如去除关键调节序列(例如启动子结合位点),或改变基因座的结构或功能,这可能类似地对功能蛋白的表达具有影响。虽然令人惊讶地发现由给定的gRNA/CRISPR系统诱导的插入/缺失模式对于给定的细胞类型、gRNA和CRISPR系统一致地重现,如本文所述,但是在引入gRNA/CRISPR系统后,在给定的细胞中并不是任何单个插入/缺失结构会必然地产生。
因此,本发明提供了gRNA分子,这些gRNA分子产生有益的插入/缺失模式或结构,例如具有主要由大缺失构成的插入/缺失模式或结构。如本文所述,可以通过NGS评估在测试细胞(例如,HEK293细胞)中或在目的细胞(例如,HSPC细胞)中由候选gRNA分子产生的插入/缺失模式或结构来选择此类gRNA分子。如实施例中所示,已发现gRNA分子,当其被引入所需细胞群时,导致细胞群包含显著分数的在gRNA的靶序列处或附近具有大缺失的细胞。在一些情况下,大缺失型插入/缺失形成率高达75%、80%、85%、90%或更高。因此,本发明提供了包含至少约40%(例如,至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、或至少约99%)的在本文所述的gRNA分子的靶位点处或附近具有大缺失(例如如本文所述)的细胞的细胞群。本发明还提供了包含至少约50%(例如,至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、或至少约99%)的在本文所述的gRNA分子的靶位点处或附近具有大缺失(例如如本文所述)的细胞的细胞群。
因此,本发明提供了选择用于本发明的治疗方法的gRNA分子的方法,这些方法包括:1)向目的靶标提供多种gRNA分子,2)评估通过使用所述gRNA分子产生的插入/缺失模式或结构,3)选择形成插入/缺失模式或结构的gRNA分子,这些插入/缺失模式或结构主要由移码突变、大缺失或其组合构成,和4)在本发明的方法中使用所述选择的gRNA。
因此,本发明提供了选择用于本发明的治疗方法的gRNA分子的方法,这些方法包括:1)向目的靶标提供多种gRNA分子,例如,其在多于一个位置具有靶序列2)评估通过使用所述gRNA分子产生的插入/缺失模式或结构,3)选择gRNA分子,该gRNA分子在例如暴露于所述gRNA分子的细胞群的至少约25%或更多细胞中形成包含位于两个靶序列之间的核酸序列的序列切除,和4)在本发明的方法中使用所述选择的gRNA分子。
本发明进一步提供了改变细胞的方法和经改变的细胞,其中在该细胞类型中用给定gRNA/CRISPR系统不断地产生特定的插入/缺失模式。使用本文所述的gRNA/CRISPR系统观察到的插入/缺失模式(包括最常发生的前5个插入/缺失)可以使用实例的方法确定,并且例如在实例中披露。如实例中所示,产生细胞群,其中显著分数的细胞包含前5个插入/缺失中的一个(例如,以下细胞群,其中前5个插入/缺失中的一个存在于该群的超过30%、超过40%、超过50%、超过60%或更多的细胞中)。因此,本发明提供了包含用给定gRNA/CRISPR系统观察到的前5个插入/缺失中的任何一个的插入/缺失的细胞,例如HSPC(如本文所述)。此外,本发明提供了当通过例如NGS评估时包含高百分比的包含本文针对给定gRNA/CRISPR系统所述的前5个插入/缺失中的一个的细胞的细胞群,例如HSPC(如本文所述)。当与插入/缺失模式分析结合使用时,“高百分比”是指该群的至少约50%(例如,至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、或至少约99%)的包含本文针对给定gRNA/CRISPR系统所述的前5个插入/缺失中的一个的细胞。在其他实施例中,该细胞群包含至少约25%(例如从约25%至约60%、例如从约25%至约50%、例如从约25%至约40%、例如从约25%至约35%)的具有本文针对给定gRNA/CRISPR系统所述的前5个插入/缺失中的一个的细胞。
还发现某些gRNA分子不会在靶细胞类型的基因组内的脱靶序列(例如,WIZ基因区外的脱靶序列)处产生插入/缺失,或者相对于靶位点处的插入/缺失产生频率以非常低的频率(例如,群内<5%的细胞)在脱靶位点(例如,WIZ区外的脱靶序列)处产生插入/缺失。因此,本发明提供了gRNA分子和CRISPR系统,其在靶细胞类型中不表现出脱靶插入/缺失形成,或者其产生小于5%的脱靶插入/缺失形成频率,例如,在WIZ基因区外的任何脱靶位点处的插入/缺失频率小于5%。在实施例中,本发明提供了gRNA分子和CRISPR系统,它们在靶细胞类型中不表现出任何脱靶插入/缺失形成。因此,本发明进一步提供了如下细胞(例如细胞群,例如HSPC,例如如本文所述),该细胞在本文所述的gRNA分子的靶位点处或附近包含插入/缺失(例如,移码插入/缺失,或由给定gRNA/CRISPR系统产生的前5个插入/缺失中的任何一个,例如如本文所述),但在gRNA分子的任何脱靶位点处不包含插入/缺失(例如在WIZ基因区之外的任何脱靶位点的插入/缺失)。在其他实施例中,本发明进一步提供了如下细胞群(例如HSPC,例如如本文所述),该细胞群包含至少20%、例如至少30%、例如至少40%、例如至少50%、例如至少60%、例如至少70%、例如至少75的在本文所述的gRNA分子的靶位点处或附近具有插入/缺失(例如移码插入/缺失,或由给定gRNA/CRISPR系统产生的前5个插入/缺失中的任何一个,例如如本文所述)的细胞,但包含小于5%,例如小于4%、小于3%、小于2%或小于1%的在gRNA分子的任何脱靶位点处包含插入/缺失(例如在WIZ基因区之外的任何脱靶位点的插入/缺失)的细胞。在其他实施例中,本发明进一步提供了如下细胞群(例如HSPC,例如如本文所述),该细胞群包含至少20%、例如至少30%、例如至少40%、例如至少50%、例如至少60%、例如至少70%、例如至少75%、例如至少80%、例如至少90%、例如至少95%的在WIZ基因区(例如,在与gRNA的靶序列至少90%同源的序列处或附近)中具有插入/缺失的细胞,但包含小于5%,例如小于4%、小于3%、小于2%或小于1%的在WIZ基因区之外的任何脱靶位点处或附近包含插入/缺失的细胞。在实施例中,脱靶插入/缺失是在基因序列内形成,例如在基因的编码序列内形成。在实施例中,在目的细胞中(例如,如本文所述)中在基因的序列内(例如在基因的编码序列内)没有形成脱靶插入/缺失。
IX.递送/构建体
能以各种形式递送、配制或施用这些组分,例如Cas9分子或gRNA分子、或两者。作为非限制性实例,可以配制(在一种或多种组合物中)、直接递送或施用gRNA分子和Cas9分子到需要基因组编辑事件的细胞中。可替代地,可以配制(在一种或多种组合物中)、递送或施用编码一种或多种组分(例如Cas9分子或gRNA分子、或两者)的核酸。在一方面,gRNA分子作为编码gRNA分子的DNA提供,并且Cas9分子作为编码Cas9分子的DNA提供。在一个实施例中,gRNA分子和Cas9分子在分开的核酸分子上编码。在一个实施例中,gRNA分子和Cas9分子在同一核酸分子上编码。在一方面,gRNA分子作为RNA提供,并且Cas9分子作为编码Cas9分子的DNA提供。在一个实施例中,提供具有例如如本文所述的一种或多种修饰的gRNA分子。在一方面,gRNA分子作为RNA提供,并且Cas9分子作为编码Cas9分子的mRNA提供。在一方面,gRNA分子作为RNA提供,并且Cas9分子作为蛋白质提供。在一个实施例中,gRNA和Cas9分子作为核糖核蛋白复合物(RNP)提供。在一方面,gRNA分子作为编码gRNA分子的DNA提供,并且Cas9分子作为蛋白质提供。
递送(例如RNP的递送(例如,递送至如本文所述的HSPC细胞中))可以通过例如电穿孔(例如如本领域已知的)或使得细胞膜可渗透核酸和/或多肽分子的其他方法来实现。在实施例中,使用4D-核转染仪(龙沙公司(Lonza)),例如使用4D-核转染仪(龙沙公司)上的程序CM-137,通过电穿孔来递送如本文所述的CRISPR系统,例如RNP。在实施例中,使用从约800伏至约2000伏,例如从约1000伏至约1800伏、例如从约1200伏至约1800伏、例如从约1400伏至约1800伏、例如从约1600伏至约1800伏、例如约1700伏的电压,例如在1700伏的电压下,通过电穿孔来递送如本文所述的CRISPR系统,例如RNP。在实施例中,脉冲宽度/长度为从约10ms至约50ms,例如从约10ms至约40ms、例如从约10ms至约30ms、例如从约15ms至约25ms、例如约20ms、例如20ms。在实施例中,使用1、2、3、4、5个或更多个(例如2个、例如1个)脉冲。在一个实施例中,使用约1700伏(例如1700伏)的电压、约20ms(例如20ms)的脉冲宽度,使用单个(1个)脉冲,通过电穿孔来递送如本文所述的CRISPR系统,例如RNP。在实施例中,使用氖电穿孔仪来完成电穿孔。用于使膜可渗透的另外的技术在本领域中是已知的,并且包括例如细胞挤压(例如,如WO 2015/023982和WO 2013/059343中所述,将其内容通过引用以其全文特此并入)、纳米针(例如,如Chiappini等人,Nat.Mat.[天然材料],14;532-39或US 2014/0295558中所述,将其内容通过引用以其全文特此并入)和纳米管(例如,如Xie,ACS Nano[ACS纳米],7(5);4351-58中所述,将其内容通过引用以其全文特此并入)。
当递送以DNA编码的组分时,DNA将通常包含控制区(例如包含启动子)以实现表达。Cas9分子序列的有用启动子包括CMV、EF-1α、MSCV、PGK、CAG控制启动子。gRNA的有用启动子包括H1、EF-1a和U6启动子。可以选择具有相似或不同强度的启动子来调整组分的表达。编码Cas9分子的序列可以包含核定位信号(NLS),例如SV40 NLS。在一个实施例中,Cas9分子或gRNA分子的启动子可以独立地是可诱导的、组织特异性的或细胞特异性的。
Cas9分子和或gRNA分子的基于DNA的递送
编码Cas9分子和/或gRNA分子的DNA可以通过本领域已知的方法或如本文所述的给予受试者或递送到细胞中。例如,编码Cas9和/或编码gRNA的DNA可以例如通过载体(例如病毒或非病毒载体)、基于非载体的方法(例如使用裸DNA或DNA复合物)、或其组合来递送。
在一些实施例中,编码Cas9和/或编码gRNA的DNA通过载体(例如,病毒载体/病毒、质粒、微环或纳米质粒)来递送。
载体可以包含编码Cas9分子和/或gRNA分子的序列。载体还可以包含例如与Cas9分子序列融合的编码信号肽(例如,用于核定位、核仁定位、线粒体定位)的序列。例如,载体可以包含与编码Cas9分子的序列融合的一个或多个核定位序列(例如,来自SV40)。
一个或多个调节/控制元件(例如启动子、增强子、内含子、聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、2A序列以及剪接受体或供体)可以被包含在载体中。在一些实施例中,启动子被RNA聚合酶II识别(例如,CMV启动子)。在其他实施例中,启动子被RNA聚合酶III识别(例如,U6启动子)。在一些实施例中,启动子是调节型启动子(例如,诱导型启动子)。在其他实施例中,启动子是组成型启动子。在一些实施例中,启动子是组织特异性启动子。在一些实施例中,启动子是病毒启动子。在其他实施例中,启动子是非病毒启动子。
在一些实施例中,载体或递送媒介物是微环。在一些实施例中,载体或递送媒介物是纳米质粒。
在一些实施例中,载体或递送媒介物是病毒载体(例如,用于产生重组病毒)。在一些实施例中,病毒是DNA病毒(例如,dsDNA或ssDNA病毒)。在其他实施例中,病毒是RNA病毒(例如,ssRNA病毒)。
示例性病毒载体/病毒包括例如逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。病毒载体技术在本领域中是熟知的,并且例如描述于Sambrook等人,2012,MOLECULAR CLONING:A LABORATORY MANUAL[分子克隆:实验室手册],第1-4卷,Cold Spring Harbor Press,NY[纽约冷泉港出版社]中,以及其他病毒学和分子生物学手册中。
在一些实施例中,病毒感染正在分裂的细胞。在其他实施例中,病毒感染不分裂的细胞。在一些实施例中,病毒感染正在分裂和不分裂的细胞两者。在一些实施例中,病毒可以整合到宿主基因组中。在一些实施例中,病毒被工程化成例如在人体内具有降低的免疫力。在一些实施例中,病毒是有复制能力的。在其他实施例中,病毒是复制缺陷型的,例如,另外轮次的病毒粒子复制和/或包装所必需的基因的一个或多个编码区被其他基因替代或缺失。在一些实施例中,病毒引起Cas9分子和/或gRNA分子的瞬时表达。在其他实施例中,病毒导致Cas9分子和/或gRNA分子的持久(例如,至少1周、2周、1个月、2个月、3个月、6个月、9个月、1年、2年)或永久表达。病毒的包装容量可以变化,例如,从至少约4kb到至少约30kb,例如至少约5kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、或50kb。
在一些实施例中,编码Cas9和/或gRNA的DNA通过重组逆转录病毒来递送。在一些实施例中,逆转录病毒(例如,莫洛尼鼠白血病病毒)包含逆转录酶,例如,其允许整合到宿主基因组中。在一些实施例中,逆转录病毒是有复制能力的。在其他实施例中,逆转录病毒是复制缺陷型的,例如,另外轮次的病毒粒子复制和包装所必需的基因的一个或多个编码区被其他基因替代或缺失。
在一些实施例中,编码Cas9和/或gRNA的DNA通过重组慢病毒来递送。例如,慢病毒是复制缺陷型的,例如,不包含病毒复制所需的一种或多种基因。
在一些实施例中,编码Cas9和/或gRNA的DNA通过重组腺病毒来递送。在一些实施例中,腺病毒被工程化成在人体内具有降低的免疫力。
在一些实施例中,编码Cas9和/或gRNA的DNA通过重组AAV来递送。在一些实施例中,AAV可以将其基因组整合到宿主细胞(例如如本文所述的靶细胞)的基因组中。在一些实施例中,AAV是自身互补的腺相关病毒(scAAV),例如包装两条链的scAAV,这两条链一起退火以形成双链DNA。可以在所披露的方法中使用的AAV血清型包括例如AAVl、AAV2、经修饰的AAV2(例如在Y444F、Y500F、Y730F和/或S662V处的修饰)、AAV3、经修饰的AAV3(例如在Y705F、Y731F和/或T492V)、AAV4、AAV5、AAV6、经修饰的AAV6(例如在S663V和/或T492V处的修饰)、AAV8。AAV 8.2、AAV9、AAV rh 10以及假型AAV(如AAV2/8、AAV2/5和AAV2/6)也可用于所披露的方法中。
在一些实施例中,编码Cas9和/或gRNA的DNA通过杂合病毒(例如本文所述的一种或多种病毒的杂合体)来递送。
包装细胞用于形成能够感染宿主细胞或靶细胞的病毒颗粒。这种细胞包括可以包装腺病毒的293细胞,以及可以包装逆转录病毒的ψ2细胞或PA317细胞。通常通过将核酸载体包装到病毒颗粒中的生产者细胞系来产生基因疗法中使用的病毒载体。载体通常含有包装并且随后整合到宿主细胞或靶细胞(如果合适的话)中所需的最小病毒序列,其中其他病毒序列被编码有待表达的蛋白质的表达盒替代。例如,基因疗法中使用的AAV载体通常仅具有来自AAV基因组的反向末端重复(ITR)序列,这些序列是在宿主细胞或靶细胞中包装和基因表达所需的。失去的病毒功能是由包装细胞系反向供应的。自此以后,病毒DNA被包装在细胞系中,该细胞系含有编码其他AAV基因即rep和cap但缺乏ITR序列的辅助质粒。该细胞系还被作为辅助者的腺病毒感染。辅助病毒促进AAV载体复制和来自辅助质粒的AAV基因表达。辅助质粒由于缺乏ITR序列而未大量包装。腺病毒的污染可以通过例如进行腺病毒比AAV更敏感的热处理来减少。
在一个实施例中,病毒载体具有细胞类型和/或组织类型识别的能力。例如,病毒载体可以被不同的/替代的病毒包膜糖蛋白假型化;被细胞类型特异性受体工程化(例如,进行病毒包膜糖蛋白的遗传修饰以掺入靶向配体(如肽配体)、单链抗体、生长因子);和/或被工程化成拥有具有双重特异性的分子桥,其一端识别病毒糖蛋白并且另一端识别靶细胞表面的部分(例如,配体-受体、单克隆抗体、抗生物素蛋白-生物素以及化学缀合)。
在一个实施例中,病毒载体实现细胞类型特异性表达。例如,可以构建组织特异性启动子以限制转基因(Cas9和gRNA)仅在靶细胞中表达。载体的特异性还可以通过转基因表达的微小RNA依赖性控制来介导。在一个实施例中,病毒载体具有增加的病毒载体和靶细胞膜的融合效率。例如,可以掺入融合蛋白(如有融合能力的血凝素(HA))以增加病毒摄取到细胞中。在一个实施例中,病毒载体具有核定位的能力。例如,需要细胞壁分解(在细胞分裂期间)并因此不会感染非分裂细胞的病毒可以被改变以在病毒的基质蛋白中掺入核定位肽,从而能够转导非增殖细胞。
在一些实施例中,编码Cas9和/或gRNA的DNA通过基于非载体的方法(例如,使用裸DNA或DNA复合物)来递送。例如,DNA可以例如通过有机改性的二氧化硅或硅酸盐(Ormosil)、电穿孔、基因枪、声致穿孔、磁转染、脂质介导的转染、树枝状聚合物、无机纳米颗粒、磷酸钙、或其组合来递送。
在一些实施例中,编码Cas9和/或gRNA的DNA通过载体和基于非载体的方法的组合来递送。例如,病毒体包含与灭活病毒(例如,HIV或流感病毒)组合的脂质体,其可导致例如在呼吸道上皮细胞中的比单独的病毒或脂质体方法更有效的基因转移。
在一个实施例中,递送媒介物是非病毒载体。在一个实施例中,非病毒载体是无机纳米颗粒(例如,附着于纳米颗粒表面的有效负载上)。示例性无机纳米颗粒包括例如磁性纳米颗粒(例如,Fe lvln02)或二氧化硅。纳米颗粒的外表面可以与允许有效负载的附着(例如,缀合或截留)的带正电荷的聚合物(例如,聚乙烯亚胺、聚赖氨酸、聚丝氨酸)缀合。在一个实施例中,非病毒载体是有机纳米颗粒(例如,将有效负载截留在纳米颗粒内)。示例性有机纳米颗粒包括例如SNALP脂质体,这些SNALP脂质体含有阳离子脂质和中性辅助脂质以及涂有脂质涂层的核酸复合物,这些中性辅助脂质涂有聚乙二醇(PEG)和鱼精蛋白。
用于转移CRISPR系统或编码CRISPR系统或其组分的核酸(例如载体)的示例性脂质和/或聚合物包括例如WO 2011/076807、WO2014/136086、WO 2005/060697、WO 2014/140211、WO 2012/031046、WO 2013/103467、WO 2013/006825、WO 2012/006378、WO 2015/095340、和WO 2015/095346中描述的那些,将前述各项的内容通过引用以其全文特此并入。在一个实施例中,媒介物具有靶向修饰以增加纳米颗粒和脂质体(例如细胞特异性抗原、单克隆抗体、单链抗体、适体、聚合物、糖和细胞穿透肽)的靶细胞摄取。在一个实施例中,媒介物使用促融合肽/聚合物和内体去稳定化肽/聚合物。在一个实施例中,媒介物经历酸触发的构象变化(例如,以加速运载物(cargo)的内体逃逸)。在一个实施例中,使用刺激可切割的聚合物,例如用于在细胞区室中释放。例如,可以使用在还原性细胞环境中裂解的基于二硫化物的阳离子聚合物。
在一个实施例中,递送媒介物是生物学非病毒递送媒介物。在一个实施例中,媒介物是减毒细菌(例如,天然或人工工程化为侵入性但减毒以预防发病机理和表达转基因(例如,单核细胞增生李斯特菌、某些沙门氏菌属菌株、长双歧杆菌和经修饰的大肠杆菌)、具有营养性和组织特异性向性以靶向特定组织的细菌、具有经修饰的表面蛋白以改变靶组织特异性的细菌。在一个实施例中,媒介物是经遗传修饰的噬菌体(例如,具有大包装容量、较低免疫原性,含有哺乳动物质粒维持序列并掺入有靶向配体的工程化噬菌体)。在一个实施例中,媒介物是哺乳动物病毒样颗粒。例如,可以产生经修饰的病毒颗粒(例如,通过纯化“空”颗粒,然后用所需运载物离体组装病毒)。媒介物还可以被工程化成掺入靶向配体以改变靶组织特异性。在一个实施例中,媒介物是生物脂质体。例如,生物脂质体是衍生自人细胞的基于磷脂的颗粒(例如,红细胞血影,其是衍生自受试者的分解成球状结构的红细胞(例如,组织靶向可以通过附着各种组织特异性配体或细胞特异性配体来实现)),或分泌性外来体-受试者(即患者)衍生的内吞起源的膜结合纳米囊泡(30-100nm)(例如,可以从各种细胞类型产生,因此可以被细胞吸收而不需要靶向配体)。
在一个实施例中,递送除Cas系统的组分(例如本文所述的Cas9分子组分和/或gRNA分子组分)之外的一种或多种核酸分子(例如DNA分子)。在一个实施例中,在与递送Cas系统的一种或多种组分的同时递送核酸分子。在一个实施例中,在递送Cas9系统的一种或多种组分之前或之后(例如,少于约30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周或4周)递送核酸分子。在一个实施例中,通过与递送Cas9系统的一种或多种组分(例如Cas9分子组分和/或gRNA分子组分)不同的方式递送核酸分子。核酸分子可以通过本文所述的任何递送方法来递送。例如,核酸分子可以通过病毒载体(例如整合缺陷型慢病毒)来递送,并且Cas9分子组分和/或gRNA分子组分可以通过电穿孔来递送,例如,使得可以减少由核酸(例如DNA)引起的毒性。在一个实施例中,核酸分子编码治疗性蛋白,例如本文所述的蛋白质。在一个实施例中,核酸分子编码RNA分子,例如本文所述的RNA分子。
编码Cas9分子的RNA的递送
编码Cas9分子(例如,有活性Cas9分子、无活性Cas9分子或无活性Cas9融合蛋白)和/或gRNA分子的RNA可以通过本领域已知的方法或如本文所述的递送至细胞(例如本文所述的靶细胞)中。例如,编码Cas9和/或编码gRNA的RNA可以例如通过显微注射、电穿孔、脂质介导的转染、肽介导的递送或其组合来递送。
作为蛋白质的Cas9分子的递送
Cas9分子(例如,有活性Cas9分子、无活性Cas9分子或无活性Cas9融合蛋白)可以通过本领域已知的方法或如本文所述的递送到细胞中。例如,Cas9蛋白分子可以例如通过显微注射、电穿孔、脂质介导的转染、肽介导的递送、细胞挤压或磨蚀(例如,通过纳米针)或其组合来递送。递送可以伴随有编码gRNA的DNA或伴随有gRNA,例如通过在核糖核蛋白复合物(RNP)中预复合gRNA和Cas9蛋白。
在一方面,例如如本文所述的Cas9分子作为蛋白质来递送,并且gRNA分子作为一种或多种RNA(例如,如本文所述的dgRNA或sgRNA)来递送。在实施例中,Cas9蛋白在递送至细胞之前与gRNA分子复合,例如如本文所述,作为核糖核蛋白复合物(“RNP”)。在实施例中,可以通过任何本领域已知的方法(例如电穿孔)将RNP递送到细胞(例如本文所述)中。如本文所述,并且不受理论束缚,可以优选的是使用例如如本文所述的gRNA分子和Cas9分子,它们导致靶细胞中的靶序列处的高%编辑(例如,>85%、>90%、>95%、>98%或>99%),即使当递送至细胞的RNP浓度降低时。同样,不受理论束缚,递送包含gRNA分子的降低浓度或低浓度的RNP(其在靶细胞中的靶序列处产生高%编辑(包括在低RNP浓度下))可以是有益的,因为它可以降低脱靶编辑事件的频率和数量。在一方面,在使用低浓度或降低浓度的RNP的情况下,可以使用以下示例性程序来产生具有dgRNA分子的RNP:
1.提供高浓度(例如,比待递送至细胞的最终RNP浓度高的浓度)的在溶液中的Cas9分子和tracr,并允许这两种组分平衡;
2.提供crRNA分子,并且允许这些组分平衡(从而形成RNP的高浓度溶液);
3.将RNP溶液稀释至所需浓度;
4.将所述所需浓度的所述RNP递送至靶细胞,例如通过电穿孔。
可以修改以上程序以与sgRNA分子一起使用,通过省略以上步骤2,并且在步骤1中,提供高浓度的在溶液中的Cas9分子和sgRNA分子,并允许这些组分平衡。在实施例中,Cas9分子和每个gRNA组分以1:2的比率(Cas9:gRNA)在溶液中提供,例如Cas9:gRNA分子的摩尔比为1:2。在使用dgRNA分子的情况下,比率(例如摩尔比)是1:2:2(Cas9:tracr:crRNA)。在实施例中,RNP以20uM或更高的浓度,例如从约20uM至约50uM的浓度形成。在实施例中,RNP以10uM或更高的浓度,例如从约10uM至约30uM的浓度形成。在实施例中,在包含靶细胞(例如本文所述)的溶液中将RNP稀释至10uM或更低的终浓度(例如,从约0.01uM至约10uM的浓度)以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中将RNP稀释至3uM或更低的终浓度(例如,从约0.01uM至约3uM的浓度)以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中将RNP稀释至1uM或更低的终浓度(例如,从约0.01uM至约1uM的浓度)以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中将RNP稀释至0.3uM或更低的终浓度(例如,从约0.01uM至约0.3uM的浓度)以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中以约3uM的终浓度提供RNP以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中以约2uM的终浓度提供RNP以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中以约1uM的终浓度提供RNP以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中以约0.3uM的终浓度提供RNP以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中以约0.1uM的终浓度提供RNP以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中以约0.05uM的终浓度提供RNP以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中以约0.03uM的终浓度提供RNP以递送至所述靶细胞。在实施例中,在包含靶细胞(例如本文所述)的溶液中以约0.01uM的终浓度提供RNP以递送至所述靶细胞。在实施例中,RNP被配制在适于电穿孔的介质中。在实施例中,例如如本文所述,通过电穿孔,例如使用本文所述的电穿孔条件,将RNP递送至细胞,例如HSPC细胞。
在一些方面,通过机械扰动细胞将基因编辑系统的组分(例如,CRISPR系统)和/或编码基因编辑系统(例如,CRISPR系统)的一种或多种组分的核酸引入细胞中,例如通过使所述细胞通过约束细胞的孔或通道。这种扰动可以在包含基因编辑系统的组分(例如,CRISPR系统)和/或编码基因编辑系统(例如,CRISPR系统)的一种或多种组分的核酸的溶液中完成,例如如本文所述。在实施例中,使用TRIAMF系统完成扰动,例如,如本文例如在实例中和PCT专利申请PCT/US17/54110中(通过引用以其全文并入)所述。
组分的双模式递送或差别递送
Cas系统的组分(例如Cas9分子组分和gRNA分子组分)的单独递送,并且更具体地通过不同模式的组分递送,可以例如通过改善组织特异性和安全性来增强性能。
在一个实施例中,Cas9分子和gRNA分子通过不同的模式递送,或者有时在本文中称为差别模式。如本文所用,不同模式或差别模式是指赋予主题组分分子(例如Cas9分子、gRNA分子或模板核酸)不同的药效学或药代动力学特性的递送模式。例如,递送模式可导致不同的组织分布、不同的半衰期或不同的时间分布,例如在所选择的区室、组织或器官中。
一些递送模式(例如,通过例如通过自主复制或插入到细胞核酸中而在细胞中或在细胞后代中持续存在的核酸载体的递送)导致组分的更持久的表达和存在。
X.治疗方法
不受理论束缚,本发明部分基于WIZ基因表达/蛋白活性与血红蛋白F(HbF)产生之间的联系的出人意料的发现。如实例和附图所示,敲低或敲除细胞中的WIZ基因或WIZ蛋白(通过本文所述的各种模式/组合物)显著增加了这些细胞中的HbF诱导,从而治疗HbF相关病症和障碍(例如,血红蛋白病,例如,镰状细胞疾病和β地中海贫血)。
本文所述的Cas9系统(例如,一种或多种gRNA分子和一种或多种Cas9分子)可用于治疗哺乳动物(例如人)的疾病。术语“治疗(treat、treated、treating和treatment)”包括向细胞施用cas9系统(例如一种或多种gRNA分子和一种或多种cas9分子),以预防或延迟疾病的症状、并发症或生物化学指标的发作,缓解症状,或阻止或抑制疾病、病状或病症的进一步发展。治疗还可以包括施用一种或多种(例如,一群)细胞,例如HSPC,这些细胞已经通过引入本发明的gRNA分子(或多于一种gRNA分子)、或者通过引入如本文所述的CRISPR系统、或通过制备本文所述细胞的任何方法修饰,以预防或延迟疾病的症状、并发症或生物化学指标的发作,缓解症状,或阻止或抑制疾病、病状或病症的进一步发展。治疗可以是预防性的(以预防或延迟疾病的发作,或以防止其临床或亚临床症状的显现)或在疾病显现后对症状的治疗性抑制或缓解。可以通过本文所述的治疗措施来测量治疗。因此,本发明的“治疗”方法还包括向受试者施用通过将cas9系统(例如,一种或多种gRNA分子和一种或多种Cas9分子)引入细胞而改变的所述细胞,以治愈疾病或病状、降低其严重性、或改善其一种或多种症状,以延长受试者的健康或存活超过在不存在这种治疗的情况下预期的健康或存活。例如,“治疗”包括将受试者的疾病症状缓解至少5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多。
包含含有本文(例如表1中)所述的靶向结构域的gRNA分子的Cas9系统以及方法和细胞(例如,如本文所述)可用于治疗血红蛋白病。
递送时机
在一个实施例中,递送除Cas系统的组分(例如本文所述的Cas9分子组分和/或gRNA分子组分)之外的一种或多种核酸分子(例如DNA分子)。在一个实施例中,在与递送Cas系统的一种或多种组分的同时递送核酸分子。在一个实施例中,在递送Cas系统的一种或多种组分之前或之后(例如,少于约30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周或4周)递送核酸分子。在一个实施例中,通过与递送Cas系统的一种或多种组分(例如Cas9分子组分和/或gRNA分子组分)不同的方式递送核酸分子。核酸分子可以通过本文所述的任何递送方法来递送。例如,核酸分子可以通过病毒载体(例如整合缺陷型慢病毒)来递送,并且Cas9分子组分和/或gRNA分子组分可以通过电穿孔来递送,例如,使得可以减少由核酸(例如DNA)引起的毒性。在一个实施例中,核酸分子编码治疗性蛋白,例如本文所述的蛋白质。在一个实施例中,核酸分子编码RNA分子,例如本文所述的RNA分子。
组分的双模式递送或差别递送
Cas系统的组分(例如Cas9分子组分和gRNA分子组分)的单独递送,并且更具体地通过不同模式的组分递送,可以例如通过改善组织特异性和安全性来增强性能。在一个实施例中,Cas9分子和gRNA分子通过不同的模式递送,或者有时在本文中称为差别模式。如本文所用,不同模式或差别模式是指赋予主题组分分子(例如Cas9分子、gRNA分子、模板核酸或有效负载)不同的药效学或药代动力学特性的递送模式。例如,递送模式可导致不同的组织分布、不同的半衰期或不同的时间分布,例如在所选择的区室、组织或器官中。
一些递送模式(例如,通过例如通过自主复制或插入到细胞核酸中而在细胞中或在细胞后代中持续存在的核酸载体的递送)导致组分的更持久的表达和存在。实例包括病毒(例如腺相关病毒或慢病毒)递送。
通过举例,这些组分(例如Cas9分子和gRNA分子)可以通过如下模式递送,这些模式在所递送的组分在身体中或在特定的区室、组织或器官中的所得半衰期或持久性方面有所不同。在一个实施例中,可以通过此类模式递送gRNA分子。Cas9分子组分可以通过如下模式递送,该模式导致其持久性较差或较少暴露于身体或者特定区室或组织或器官。
更一般地,在一个实施例中,第一递送模式用于递送第一组分,并且第二递送模式用于递送第二组分。第一递送模式赋予第一药效学或药代动力学特性。第一药效学特性可以是例如组分或编码该组分的核酸在体内、区室、组织或器官中的分布、持久性或暴露。第二递送模式赋予第二药效学或药代动力学特性。第二药效学特性可以是例如组分或编码该组分的核酸在体内、区室、组织或器官中的分布、持久性或暴露。
在一个实施例中,第一药效学或药代动力学特性(例如分布、持久性或暴露)比第二药效学或药代动力学特性更受限制。
在一个实施例中,选择第一递送模式以优化(例如最小化)药效学或药代动力学特性,例如分布、持久性或暴露。
在一个实施例中,选择第二递送模式以优化(例如最大化)药效学或药代动力学特性,例如分布、持久性或暴露。
在一个实施例中,第一递送模式包含使用相对持久的元件,例如核酸,例如质粒或病毒载体,例如AAV或慢病毒。因为此类载体是相对持久的,所以从它们转录的产物将是相对持久的。
在一个实施例中,第二递送模式包含相对瞬时的元件,例如RNA或蛋白质。
在一个实施例中,第一组分包含gRNA,并且递送模式是相对持久的,例如,gRNA从质粒或病毒载体(例如AAV或慢病毒)转录。这些基因的转录几乎没有生理后果,因为这些基因不编码蛋白质产物,并且gRNA不能孤立地起作用。第二组分Cas9分子以瞬时方式递送,例如作为mRNA或作为蛋白质,确保完整的Cas9分子/gRNA分子复合物仅在短时间内存在并具有活性。
此外,这些组分能以不同的分子形式或用不同递送载体来递送,这些递送载体彼此互补以增强安全性和组织特异性。
使用差别递送模式可以提高性能,即安全性和疗效。例如,可以降低最终脱靶修饰的可能性。通过较不持久的模式递送免疫原性组分(例如Cas9分子)可以降低免疫原性,因为来自细菌衍生的Cas酶的肽通过MHC分子展示在细胞表面上。两部分的递送系统可以缓解这些缺点。
差别递送模式可以用于将组分递送到不相同但重叠的靶区。在靶区的重叠区之外,使形成活性复合物最小化。因此,在一个实施例中,通过产生第一空间(例如组织)分布的第一递送模式来递送第一组分,例如gRNA分子。通过产生第二空间(例如组织)分布的第二递送模式来递送第二组分,例如Cas9分子。在一个实施例中,第一模式包含选自脂质体、纳米颗粒(例如聚合纳米颗粒)和核酸(例如病毒载体)的第一元件。第二模式包含选自该组的第二元件。在一个实施例中,第一递送模式包含第一靶向元件,例如细胞特异性受体或抗体,并且第二递送模式不包含该元件。在一个实施例中,第二递送模式包含第二靶向元件,例如第二细胞特异性受体或第二抗体。
当Cas9分子在病毒递送载体、脂质体或聚合纳米颗粒中递送时,当可能期望仅靶向单个组织时,存在递送至多个组织和在多个组织中有治疗活性的可能性。两部分的递送系统可以解决这一挑战并提高组织特异性。如果gRNA分子和Cas9分子被包装在具有不相同但重叠的组织向性的分开的递送载体中,则全功能复合物仅在这两种载体均靶向的组织中形成。
候选Cas分子(例如Cas9分子)、候选gRNA分子、候选Cas9分子/gRNA分子复合物、以及候选CRISPR系统可以通过本领域已知的方法或如本文所述的进行评估。例如,用于评估Cas9分子的内切核酸酶活性的示例性方法描述于例如Jinek等人,SCIENCE[科学]2012;337(6096):8 16-821中。
血红蛋白病
血红蛋白病涵盖许多遗传起源的贫血,其中红细胞(RBC)的产生减少和/或破坏增加(溶血)。这些还包括遗传缺陷,其导致异常血红蛋白的产生,还伴随维持氧浓度的能力受损。一些此类病症涉及不能产生足够量的正常β-球蛋白,而其他病症涉及完全不能产生正常β-球蛋白。这些与β-球蛋白相关的病症通常称为β-血红蛋白病。例如,β-地中海贫血是由β-球蛋白基因表达的部分或完全缺陷(其导致有缺陷的HbA或缺乏HbA)引起的。镰状细胞性贫血是由β-球蛋白结构基因的点突变(其导致异常(镰状)血红蛋白(HbS)的产生)引起的。HbS易于聚合,特别是在脱氧条件下。HbS RBC比正常RBC更脆弱,并更容易经历溶血,最终导致贫血。
在一个实施例中,使用本文所述的Cas9分子和gRNA分子来靶向血红蛋白病相关基因。示例性靶标包括例如与γ-球蛋白基因的控制相关的基因。在一个实施例中,靶标是非缺失型HPFH区。
胎儿血红蛋白(也为血红蛋白F或HbF或α2γ2)是两个成人α-珠蛋白多肽和两个胎儿β样γ-珠蛋白多肽的四聚体。HbF是人胎儿在子宫中发育的后七个月期间和在新生儿直至大约6个月大期间的主要氧转运蛋白。在功能上,胎儿血红蛋白与成人血红蛋白的最大差异在于它能够以比成人形式更大的亲和力结合氧,从而使发育中的胎儿更好地从母亲的血流中获取氧。
在新生儿中,到出生后约6个月时胎儿血红蛋白几乎完全被成人血红蛋白替代。在成人中,胎儿血红蛋白的产生可以在药理学上重新激活,这可用于治疗诸如血红蛋白病等疾病。例如,在某些患有血红蛋白病的患者中,更高水平的γ-球蛋白表达可以部分地补偿有缺陷或受损的β-球蛋白基因产生,这可以改善这些疾病的临床严重性。增加的HbF水平或F-细胞(含有HbF的红细胞)数量可以改善血红蛋白病(例如重型β-地中海贫血和镰状细胞性贫血)的疾病严重性。
镰状细胞疾病
镰状细胞疾病是一组影响血红蛋白的病症。患有这种病症的人具有非典型血红蛋白分子(血红蛋白S),其可以使红细胞变形成镰状或新月形。这种病症的典型特征包括少量的红细胞(贫血)、反复感染和疼痛的周期性发作。
HBB基因中的突变导致镰状细胞疾病。HBB基因提供了制备β-球蛋白的指令。各种形式的β-球蛋白由HBB基因中的不同突变产生。一种特定的HBB基因突变产生一种称为血红蛋白S(HbS)的β-球蛋白的异常形式。HBB基因中的其他突变导致β-球蛋白的另外的异常形式,如血红蛋白C(HbC)和血红蛋白E(HbE)。HBB基因突变还可以导致异常低水平的β-球蛋白,即β地中海贫血。
在患有镰状细胞疾病的人中,血红蛋白中的至少一个β-球蛋白亚基被血红蛋白S替代。在镰状细胞性贫血(其是镰状细胞疾病的常见形式)中,血红蛋白S替代血红蛋白中的两个β-球蛋白亚基。在其他类型的镰状细胞疾病中,血红蛋白中只有一个β-珠蛋白亚基被血红蛋白S取代。另一个β-珠蛋白亚基被不同的异常变体取代,例如血红蛋白C。例如,患有镰状血红蛋白C(HbSC)病的人的血红蛋白分子含有血红蛋白S和血红蛋白C,而不是β-珠蛋白。如果产生血红蛋白S和β地中海贫血的突变同时发生,则个体患有血红蛋白S-β地中海贫血(HbSBetaThal)疾病。
β地中海贫血
β地中海贫血是一种减少血红蛋白产生的血液病症。在患有β地中海贫血的人中,低水平的血红蛋白导致身体的许多部位缺氧。受影响的个体也缺乏红细胞(贫血),这可能导致皮肤苍白、虚弱、疲劳和更严重的并发症。患有β地中海贫血的人发生异常血凝块的风险增加。
根据症状的严重性将β地中海贫血分类为两种类型:重型地中海贫血(也称为库利氏贫血)和中间型地中海贫血。在这两种类型中,重型地中海贫血更为严重。
HBB基因中的突变导致β地中海贫血。HBB基因提供了制备β-球蛋白的指令。HBB基因中的一些突变阻止了任何β-珠蛋白的产生。β-球蛋白的缺乏被称为β-0(B°)地中海贫血。其他HBB基因突变允许产生一些但量减少的β-球蛋白,即β-加(B+)地中海贫血。患有这两种类型的人被诊断为重型地中海贫血和中间型地中海贫血。
在一个实施例中,靶向第一基因或基因座的Cas9分子/gRNA分子复合物用于治疗以第二基因(例如第二基因中的突变)为特征的病症。通过举例,例如通过编辑或有效负载递送,靶向第一基因可以补偿或抑制来自第二基因(例如突变的第二基因)的影响的进一步损害。在一个实施例中,受试者携带的第一基因的一个或多个等位基因不是该病症的成因。
在一方面,本发明涉及治疗需要增加的胎儿血红蛋白(HbF)的哺乳动物(例如人)。
在一方面,本发明涉及治疗已被诊断患有血红蛋白病或有发生血红蛋白病风险的哺乳动物(例如人)。
在一方面,血红蛋白病是β-血红蛋白病。在一方面,血红蛋白病是镰状细胞疾病。在一方面,血红蛋白病是β地中海贫血。
治疗血红蛋白病的方法
在另一方面,本发明提供了治疗方法。在一些方面,本发明的gRNA分子、CRISPR系统和/或细胞用于治疗有需要的患者。在一些方面,患者是哺乳动物,例如人。在一些方面,患者患有血红蛋白病。在实施例中,患者患有镰状细胞疾病。在实施例中,患者患有β地中海贫血。
在一方面,该治疗方法包括向哺乳动物(例如人)施用本文所述的一种或多种gRNA分子(例如,包含表1中所述的靶向结构域的一种或多种gRNA分子)和本文所述的一种或多种cas9分子。
在一方面,该治疗方法包括向哺乳动物施用细胞群,其中该细胞群是来自哺乳动物(例如人)的细胞群,该哺乳动物(例如人)已施用本文所述的一种或多种gRNA分子(例如,包含表1中所述的靶向结构域的一种或多种gRNA分子)和本文所述的一种或多种cas9分子(例如本文所述的CRISPR系统)。在一个实施例中,将一种或多种gRNA分子或CRISPR系统施用至细胞是在体内完成的。在一个实施例中,将一种或多种gRNA分子或CRISPR系统施用至细胞是离体完成的。
在一方面,该治疗方法包括向哺乳动物(例如人)施用有效量的包含如下细胞或所述细胞后代的细胞群,这些细胞包含或曾经包含本文所述的一种或多种gRNA分子(例如,包含表1中所述的靶向结构域的一种或多种gRNA分子)和本文所述的一种或多种cas9分子。在一个实施例中,细胞对于哺乳动物是同种异体的。在一个实施例中,细胞对于哺乳动物是自体的。在一个实施例中,从哺乳动物收获细胞,离体操作,并返回到哺乳动物中。
在一些方面,包含或曾经包含本文所述的一种或多种gRNA分子(例如包含表1中所述的靶向结构域的一种或多种gRNA分子)和本文所述的一种或多种cas9分子的细胞或所述细胞的后代包含干细胞或祖细胞。在一方面,干细胞是造血干细胞。在一方面,祖细胞是造血祖细胞。在一方面,细胞包含造血干细胞和造血祖细胞两者,例如是HSPC。在一方面,细胞包含CD34+细胞,例如由其组成。在一方面,细胞基本上不含CD34-细胞。在一方面,细胞包含CD34+/CD90+干细胞,例如由其组成。在一方面,细胞包含CD34+/CD90-细胞,例如由其组成。在一方面,细胞是包含一种或多种以上所述或本文所述的细胞类型的群。
在一个实施例中,本披露提供了一种用于治疗有需要的哺乳动物(例如人)的血红蛋白病(例如镰状细胞疾病或β-地中海贫血)的方法,或一种用于增加有需要的哺乳动物(例如人)中的胎儿血红蛋白表达的方法,该方法包括:
a)提供(例如收获或分离)来自哺乳动物的HSPC(例如CD34+细胞)群;
b)离体提供所述细胞(例如在细胞培养基中),任选地在有效量的组合物存在下,该组合物包含至少一种干细胞扩增剂,借此所述HSPC(例如CD34+细胞)群扩增至比未处理的群更大的程度;
c)使HSPC(例如CD34+细胞)群接触有效量的:组合物,该组合物包含含有本文所述的靶向结构域(例如表1中所述的靶向结构域)的至少一种gRNA分子或编码所述gRNA分子的核酸以及至少一种cas9分子(例如本文所述)或编码所述cas9分子的核酸,例如如本文所述的一种或多种RNP,例如具有本文所述的CRISPR系统;
d)在该群的至少一部分细胞(例如该群的至少一部分HSPC,例如CD34+细胞)中引起至少一种修饰,借此例如,当所述HSPC分化成红系细胞谱系细胞(例如红细胞)时,胎儿血红蛋白表达增加,例如相对于未根据步骤c)接触的细胞;以及
f)将包含所述经修饰的HSPC(例如CD34+细胞)的细胞群返回到哺乳动物中。
在一方面,HSPC对于它们返回的哺乳动物是同种异体的。在一方面,HSPC对于它们返回的哺乳动物是自体的。在一些方面,HSPC自骨髓分离。在一些方面,HSPC自外周血,例如动员的外周血分离。在一些方面,动员的外周血自已施用G-CSF的受试者分离。在一些方面,动员的外周血自已施用除G-CSF以外的动员剂例如
Figure BDA0003693276070001471
(AMD3100)的受试者分离。在其他方面,动员的外周血从已经给予G-CSF和
Figure BDA0003693276070001472
(AMD3100)的组合的受试者中分离。在一些方面,HSPC自脐带血分离。在实施例中,细胞衍生自血红蛋白病患者,例如患有镰状细胞疾病的患者或患有地中海贫血例如β-地中海贫血的患者。
在该方法的另外的实施例中,该方法进一步包括在提供HSPC(例如CD34+细胞)群(例如来自上述来源)后,富集HSPC(例如CD34+细胞)的细胞群的步骤。在该方法的实施例中,在所述富集后,该细胞群(例如HSPC)基本上不含CD34-细胞。
在实施例中,返回到哺乳动物中的细胞群包含至少70%的活细胞。在实施例中,返回到哺乳动物中的细胞群包含至少75%的活细胞。在实施例中,返回到哺乳动物中的细胞群包含至少80%的活细胞。在实施例中,返回到哺乳动物中的细胞群包含至少85%的活细胞。在实施例中,返回到哺乳动物中的细胞群包含至少90%的活细胞。在实施例中,返回到哺乳动物中的细胞群包含至少95%的活细胞。在实施例中,返回到哺乳动物中的细胞群包含至少99%的活细胞。可以通过针对细胞活力标志物(例如如本领域已知的)将细胞群的代表性部分进行染色来确定活力。
在另一个实施例中,本披露提供了一种用于治疗有需要的哺乳动物(例如人)的血红蛋白病(例如镰状细胞疾病或β-地中海贫血)的方法,或一种用于增加有需要的哺乳动物(例如人)中的胎儿血红蛋白表达的方法,该方法包括以下步骤:
a)提供(例如收获或分离)哺乳动物的HSPC(例如CD34+细胞)群,例如来自哺乳动物的骨髓;
b)从步骤a)的细胞群分离CD34+细胞;
c)离体提供所述CD34+细胞,并且例如在细胞培养基中、在有效量的组合物存在下培养所述细胞,该组合物包含至少一种干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为约0.5至约0.75微摩尔的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,借此所述CD34+细胞群扩增至比未处理的群更大的程度;
c)向CD34+细胞群的细胞中引入有效量的:组合物,该组合物包含例如如本文所述的Cas9分子和例如如本文所述的gRNA分子,例如任选地其中Cas9分子和gRNA分子处于例如如本文所述的RNP的形式,并且任选地其中所述RNP引入所述细胞中是通过例如如本文所述的电穿孔进行的;
e)在该群的至少一部分细胞(例如该群的至少一部分HSPC,例如CD34+细胞)中引起至少一种遗传修饰,借此在与步骤d)中引入的gRNA的靶向结构域互补的基因组位点处或附近产生例如如本文所述的插入/缺失;
f)任选地,另外在所述引入之后,例如在细胞培养基中、在有效量的组合物存在下培养所述细胞,该组合物包含至少一种干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为约0.5至约0.75微摩尔的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,使得细胞扩增至少2倍,例如至少4倍、例如至少5倍;
g)冷冻保存所述细胞;并且
h)将细胞返回到哺乳动物中,其中,
返回到哺乳动物中的细胞包含如下细胞:1)保持分化成红系细胞谱系细胞(例如红细胞)的能力;2)当分化成红细胞时,例如相对于未被步骤e)的gRNA修饰的细胞产生增加水平的胎儿血红蛋白,例如产生每个细胞至少6皮克的胎儿血红蛋白。
在一方面,HSPC对于它们返回的哺乳动物是同种异体的。在一方面,HSPC对于它们返回的哺乳动物是自体的。在一些方面,HSPC自骨髓分离。在一些方面,HSPC自外周血,例如动员的外周血分离。在一些方面,动员的外周血自已施用G-CSF的受试者分离。在一些方面,动员的外周血自已施用除G-CSF以外的动员剂例如
Figure BDA0003693276070001491
(AMD3100)的受试者分离。在其他方面,动员的外周血从已经给予G-CSF和
Figure BDA0003693276070001492
(AMD3100)的组合的受试者中分离。在一些方面,HSPC自脐带血分离。在实施例中,细胞衍生自血红蛋白病患者,例如患有镰状细胞疾病的患者或患有地中海贫血例如β-地中海贫血的患者。
在以上方法的实施例中,所述步骤b)产生基本上不含CD34-细胞的细胞群。
在该方法的另外的实施例中,该方法进一步包括在提供HSPC(例如CD34+细胞)群(例如来自上述来源)后,该细胞群富含HSPC(例如CD34+细胞)。
在这些方法的一个另外的实施例中,具有分化增加的胎儿血红蛋白表达能力的经修饰的HSPC(例如CD34+干细胞)群在重新引入哺乳动物中之前被冷冻保存并储存。在实施例中,将具有分化成红系细胞谱系细胞(例如红细胞)的能力和/或当分化成红系细胞谱系细胞(例如红细胞)时产生增加的胎儿血红蛋白水平的冷冻保存的HSPC群解冻,然后重新引入哺乳动物中。在这些方法的一个另外的实施例中,该方法包括化学疗法和/或放射疗法以去除或减少哺乳动物中的内源性造血祖细胞或干细胞。在这些方法的一个另外的实施例中,该方法不包括用以去除或减少哺乳动物中的内源性造血祖细胞或干细胞的化学疗法和/或放射疗法的步骤。在这些方法的一个另外的实施例中,该方法包括化学疗法和/或放射疗法以部分地减少哺乳动物中内源性造血祖细胞或干细胞(例如,部分淋巴细胞耗竭)。在实施例中,在将经修饰的HSPC重新引入哺乳动物中之前,用完全淋巴耗竭剂量的白消安治疗患者。在实施例中,在将经修饰的HSPC重新引入哺乳动物中之前,用部分淋巴耗竭剂量的白消安治疗患者。在实施例中,用HSC靶向型抗体-药物缀合物治疗患者以进行调理。在实施例中,此类HSC靶向型抗体-药物缀合物可以在WO 2018071871中找到,其内容通过引用并入本文。
在实施例中,使细胞与RNP接触,该RNP包含例如如本文所述的、与针对WIZ的gRNA(例如,如本文所述(例如,包含表1-表3中列出的靶向结构域))复合的Cas9分子。
在实施例中,干细胞扩增剂是化合物1。在实施例中,干细胞扩增剂是化合物2。在实施例中,干细胞扩增剂是化合物3。在实施例中,干细胞扩增剂是(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在实施例中,干细胞扩增剂是(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇并且以2-0.1微摩尔,例如1-0.25微摩尔、例如0.75-0.5微摩尔的浓度存在。在实施例中,干细胞扩增剂是WO 2010/059401中所述的分子(例如,WO 2010/059401的实例1中所述的分子)。
在实施例中,在使细胞与例如本文所述的CRISPR系统接触的步骤之前,将细胞(例如HSPC,例如如本文所述)离体培养约1小时至约15天的时间段,例如约12小时至约12天的时间段、例如约12小时至4天的时间段、例如约1天至约4天的时间段、例如约1天至约2天的时间段、例如约1天的时间段或约2天的时间段。在实施例中,所述接触步骤之前的所述培养是在组合物(例如,细胞培养基)中,该组合物包含例如本文所述的干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为约0.25uM至约1uM的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇、例如浓度为约0.75-0.5微摩尔的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在实施例中,在使细胞与例如本文所述的CRISPR系统接触的步骤之后,将细胞例如在细胞培养基中离体培养不超过约1天的时间段,例如不超过约18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、或1小时,该细胞培养基包含例如本文所述的干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为约0.25uM至约1uM的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇、例如浓度为约0.75-0.5微摩尔的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在其他实施例中,在使细胞与例如本文所述的CRISPR系统接触的步骤之后,将细胞在细胞培养基中离体培养约1小时至约15天的时间段,例如约12小时至约10天的时间段、例如约1天至约10天的时间段、例如约1天至约5天的时间段、例如约1天至约4天的时间段、例如约2天至约4天的时间段、例如约2天、约3天或约4天的时间段,例如,该细胞培养基包含例如本文所述的干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为约0.25uM至约1uM的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇、例如浓度为约0.75-0.5微摩尔的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在实施例中,将细胞离体培养(例如,在所述接触步骤之前培养和/或在所述接触步骤之后培养)约1小时至约20天的时间段,例如约6-12天的时间段,例如约6天、约7天、约8天、约9天、约10天、约11天或约12天的时间段。
在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约1百万个细胞(例如,至少约1百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约2百万个细胞(例如,至少约2百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约3百万个细胞(例如,至少约3百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约4百万个细胞(例如,至少约4百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约5百万个细胞(例如,至少约5百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约6百万个细胞(例如,至少约6百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少1百万个细胞(例如,至少1百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少2百万个细胞(例如,至少2百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少3百万个细胞(例如,至少3百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少4百万个细胞(例如,至少4百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少5百万个细胞(例如,至少5百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少6百万个细胞(例如,至少6百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约1百万个细胞(例如,约1百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约2百万个细胞(例如,约2百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约3百万个细胞(例如,约3百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约4百万个细胞(例如,约4百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约5百万个细胞(例如,约5百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约6百万个细胞(例如,约6百万个CD34+细胞)。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含约2x106个细胞(例如约2x106个CD34+细胞)/每kg患者体重。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含至少约2x106个细胞(例如约2x106个CD34+细胞)/每kg患者体重。在实施例中,包含返回到哺乳动物中的经修饰的HSPC的细胞群包含2x106个细胞(例如约2x106个CD34+细胞)/每kg患者体重至10x106个细胞(例如约2x106个CD34+细胞)/每kg患者体重。在实施例中,将包含经修饰的细胞的细胞输注到患者体内。在实施例中,在将包含经修饰的HSPC的细胞输注到患者体内之前,用淋巴耗竭疗法治疗患者,例如用白消安治疗,例如用完全淋巴耗竭的白消安方案治疗,或者例如用降低强度的白消安淋巴耗竭方案。
在实施例中,任何上述方法导致患者具有至少80%的其循环的CD34+细胞,例如在将细胞重新引入哺乳动物中后如至少15天,例如至少20天、至少30天、至少40天、至少50天或至少60天所测量的,这些循环的CD34+细胞包含在与该方法中使用的gRNA分子的靶向结构域互补的基因组位点处或附近的插入/缺失。不受理论束缚,本文出人意料地发现,当基因编辑系统(例如CRISPR系统,例如如本文所述的包含靶向WIZ基因区的gRNA分子的CRISPR系统)引入HSPC并将这些细胞移植到生物体中时观察到插入/缺失和插入/缺失模式(包括大缺失),某些gRNA产生包含插入/缺失和插入/缺失模式(包括大插入/缺失)的细胞,这些插入/缺失和插入/缺失模式(包括大插入/缺失)在生物体中在编辑的细胞群及其后代中是可检测的,并且持续超过8周、12周、16周或20周。不受理论束缚,包含在引入生物体(例如,患者)后在可检测细胞群内持续例如超过16周或超过20周的插入/缺失模式或特定插入/缺失(包括大缺失)的细胞群相比于引入生物体或患者后失去一个或多个插入/缺失(包括大缺失)的细胞(或其后代)能有益于产生疾病或病症的长期改善,例如本文描述的疾病或病症(例如,血红蛋白病,例如镰状细胞疾病或地中海贫血)。在实施例中,持续的插入/缺失或插入/缺失模式与上调的胎儿血红蛋白相关(例如,在所述细胞的红系细胞后代中)。因此,在实施例中,本披露提供细胞群,例如,如本文所述的HSPC,其包含一个或多个插入/缺失(包括大缺失),该一个或多个插入/缺失在引入生物体(例如患者)后持续存在(例如,保持可检测,例如,在细胞群或其后代中)于血液和/或骨髓中超过8周、超过12周,超过16周或超过20周。
在实施例中,任何上述方法导致患者具有至少20%的其骨髓CD34+细胞,例如在将细胞重新引入哺乳动物中后如至少15天,例如至少20天、至少30天、至少40天、至少50天或至少60天所测量的,这些骨髓CD34+细胞包含在与该方法中使用的gRNA分子的靶向结构域互补的基因组位点处或附近的插入/缺失。
在实施例中,重新引入哺乳动物中的HSPC能够在体内分化成类红细胞谱系细胞,例如红细胞,并且所述分化的细胞表现出增加的胎儿血红蛋白水平,例如,产生每个细胞至少6皮克的胎儿血红蛋白,例如,每个细胞至少7皮克的胎儿血红蛋白,每个细胞至少8皮克的胎儿血红蛋白,每个细胞至少9皮克的胎儿血红蛋白,每个细胞至少10皮克的胎儿血红蛋白,例如每个细胞约9至约10皮克之间的胎儿血红蛋白,例如使得哺乳动物的血红蛋白病被治疗。
应当理解,当细胞被表征为具有增加的胎儿血红蛋白时,其包括其中该细胞的后代(例如分化的后代)表现出增加的胎儿血红蛋白的实施例。例如,在本文所述的方法中,经改变或经修饰的CD34+细胞(或细胞群)可能不表达增加的胎儿血红蛋白,但当分化成红系细胞谱系细胞(例如红细胞)时,细胞表达增加的胎儿血红蛋白,例如在类似条件下相对于未经修饰或未经改变的细胞增加的胎儿血红蛋白。
XI.培养方法和制备细胞的方法
本披露提供了培养细胞(例如HSPC,例如造血干细胞,例如用本文所述的gRNA分子修饰或待修饰的CD34+细胞)的方法。
DNA修复途径抑制剂
不受理论束缚,据信由给定gRNA分子在特定靶序列处产生的插入/缺失模式是细胞内每种活性DNA修复机制(例如,非同源末端连接、微同源介导的末端连接等)的产物。不受理论束缚,据信通过使待编辑的细胞与不产生所需插入/缺失的DNA修复途径的抑制剂接触,可以选择或富集特别有利的插入/缺失。因此,本发明的gRNA分子、CRISPR系统、方法和其他方面可以与此类抑制剂组合进行。此类抑制剂的实例包括例如在WO 2014/130955中所述的抑制剂,将其内容通过引用以其全文特此并入。在实施例中,抑制剂是DNAPKc抑制剂,例如NU7441。
干细胞扩增剂
在一方面,本发明涉及用一种或多种试剂培养细胞,例如HSPC,例如用本文所述的gRNA分子修饰或待修饰的CD34+细胞,该一种或多种试剂导致相对于未用该试剂处理的细胞扩增速率增加、扩增水平增加、或移植增加。此类试剂在本文中称为干细胞扩增剂。
在一方面,导致相对于未用试剂(例如干细胞扩增剂)处理的细胞扩增速率增加或扩增水平增加的一种或多种药剂包含作为芳烃受体(AHR)途径的拮抗剂的药剂。在一些方面,干细胞扩增剂是WO2013/110198中披露的化合物或WO 2010/059401中披露的化合物,将其内容通过引用以其全文而并入。
在一方面,导致相对于未用试剂处理的细胞扩增速率增加或扩增水平增加的一种或多种试剂是嘧啶并[4,5-b]吲哚衍生物,例如,如WO2013/110198中所披露的,将其内容通过引用以其全文特此并入。在一个实施例中,试剂是化合物1((1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺):
化合物1
Figure BDA0003693276070001561
在另一方面,试剂是化合物2(4-(3-哌啶-1-基丙基氨基)-9H-嘧啶并[4,5-b]吲哚-7-甲酸甲酯):
化合物2:
Figure BDA0003693276070001562
在另一方面,导致相对于未用试剂处理的细胞扩增速率增加或扩增水平增加的一种或多种试剂是WO 2010/059401中披露的试剂,将其内容通过引用以其全文特此并入。
在一个实施例中,干细胞扩增剂是化合物3:4-(2-(2-(苯并[b]噻吩-3-基)-9-异丙基-9H-嘌呤-6-基氨基)乙基)苯酚,即是来自WO 2010/059401中的实例1的化合物,其具有以下结构:
化合物3:
Figure BDA0003693276070001571
在另一方面,干细胞扩增剂是(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇((S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,即是根据WO2010/059401的化合物157S,其具有以下结构:
(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇:
Figure BDA0003693276070001572
在实施例中,在将CRISPR系统(例如,本发明的gRNA分子和/或Cas9分子)引入所述HSPC中之前,使HSPC群与干细胞扩增剂(例如化合物1、化合物2、化合物3、(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇或其组合(例如化合物1和(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇的组合)接触。在实施例中,在将CRISPR系统(例如,本发明的gRNA分子和/或Cas9分子)引入所述HSPC中之后,使HSPC群与干细胞扩增剂(例如化合物1、化合物2、化合物3、(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇或其组合(例如化合物1和(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇的组合)接触。在实施例中,在将CRISPR系统(例如,本发明的gRNA分子和/或Cas9分子)引入所述HSPC中之前和之后,均使HSPC群与干细胞扩增剂(例如化合物1、化合物2、化合物3、(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇或其组合(例如化合物1和(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇的组合)接触。
在实施例中,干细胞扩增剂以有效量存在以增加HSPC的扩增水平,相对于在相同培养基中但不存在干细胞扩增剂情况下的HSPC。在实施例中,干细胞扩增剂以范围从约0.01至约10uM,例如从约0.1uM至约1uM的浓度存在。在实施例中,干细胞扩增剂以约1uM、约950nM、约900nM、约850nM、约800nM、约750nM、约700nM、约650nM、约600nM、约550nM、约500nM、约450nM、约400nM、约350nM、约300nM、约250nM、约200nM、约150nM、约100nM、约50nM、约25nM、或约10nM的浓度存在于细胞培养基中。在实施例中,干细胞扩增剂以范围从约500nM至约750nM的浓度存在。
在实施例中,干细胞扩增剂是(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇,其以范围从约0.01至约10微摩尔(uM)的浓度存在于细胞培养基中。在实施例中,干细胞扩增剂是(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇,其以范围从约0.1至约1微摩尔(uM)的浓度存在于细胞培养基中。在实施例中,干细胞扩增剂是(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇,其以约0.75微摩尔(uM)的浓度存在于细胞培养基中。在实施例中,干细胞扩增剂是(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇,其以约0.5微摩尔(uM)的浓度存在于细胞培养基中。在任何前述的实施例中,细胞培养基另外包含化合物1。
在实施例中,干细胞扩增剂是化合物1和(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇的混合物。
在实施例中,使本发明的细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增2至10,000倍,例如CD34+细胞扩增2-1000倍、例如CD34+细胞扩增2-100倍、例如CD34+细胞扩增20-200倍。如本文所述,与一种或多种干细胞扩增剂的接触可以在细胞与例如如本文所述的CRISPR系统接触之前,在细胞与例如如本文所述的CRISPR系统接触之后,或其组合。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子(例如(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少2倍,例如在靶位点处或附近包含插入/缺失的CD34+细胞,该靶位点与引入所述细胞中的CRISPR/Cas9系统的gRNA的靶向结构域具有互补性。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子(例如(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少4倍,例如在靶位点处或附近包含插入/缺失的CD34+细胞,该靶位点与引入所述细胞中的CRISPR/Cas9系统的gRNA的靶向结构域具有互补性。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子(例如(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少5倍,例如在靶位点处或附近包含插入/缺失的CD34+细胞,该靶位点与引入所述细胞中的CRISPR/Cas9系统的gRNA的靶向结构域具有互补性。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少10倍。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少20倍。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少30倍。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少40倍。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少50倍。在一个实施例中,使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触,以引起CD34+细胞扩增至少60倍。在实施例中,使细胞与一种或多种干细胞扩增剂接触约1-60天的时间段,例如约1-50天、例如约1-40天、例如约1-30天、例如约1-20天、例如约1-10天、例如约7天、例如约1-5天、例如约2-5天、例如约2-4天、例如约2天、或例如约4天。
在实施例中,在使细胞与例如本文所述的CRISPR系统接触的步骤之前,将细胞(例如HSPC,例如如本文所述)离体培养约1小时至约10天的时间段,例如约12小时至约5天的时间段、例如约12小时至4天的时间段、例如约1天至约4天的时间段、例如约1天至约2天的时间段、例如约1天的时间段或约2天的时间段。在实施例中,所述接触步骤之前的所述培养是在组合物(例如,细胞培养基)中,该组合物包含例如本文所述的干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为约0.25uM至约1uM的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇、例如浓度为约0.75-0.5微摩尔的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在实施例中,在使细胞与例如本文所述的CRISPR系统接触的步骤之后,将细胞例如在细胞培养基中离体培养不超过约1天的时间段,例如不超过约18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、或1小时,该细胞培养基包含例如本文所述的干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为约0.25uM至约1uM的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇、例如浓度为约0.75-0.5微摩尔的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在其他实施例中,在使细胞与例如本文所述的CRISPR系统接触的步骤之后,将细胞在细胞培养基中离体培养约1小时至约14天的时间段,例如约12小时至约10天的时间段、例如约1天至约10天的时间段、例如约1天至约5天的时间段、例如约1天至约4天的时间段、例如约2天至约4天的时间段、例如约2天、约3天或约4天的时间段,例如,该细胞培养基包含例如本文所述的干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为约0.25uM至约1uM的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇、例如浓度为约0.75-0.5微摩尔的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。
在实施例中,细胞培养基是化学成分确定的培养基。在实施例中,细胞培养基可以另外含有例如StemSpan SFEM(干细胞技术公司(StemCell Technologies);目录号09650)。在实施例中,细胞培养基可以替代地或另外地含有例如HSC Brew GMP(美天旎公司(Miltenyi))。在实施例中,细胞培养基不含血清。在实施例中,培养基可以补充有血小板生成素(TPO)、人Flt3配体(Flt-3L)、人干细胞因子(SCF)、人白细胞介素-6、L-谷氨酰胺、和/或青霉素/链霉素。在实施例中,培养基补充有血小板生成素(TPO)、人Flt3配体(Flt-3L)、人干细胞因子(SCF)、人白细胞介素-6和L-谷氨酰胺。在其他实施例中,培养基补充有血小板生成素(TPO)、人Flt3配体(Flt-3L)、人干细胞因子(SCF)和人白细胞介素-6。在其他实施例中,培养基补充有血小板生成素(TPO)、人Flt3配体(Flt-3L)和人干细胞因子(SCF),但不补充人白细胞介素-6。在其他实施例中,培养基补充有人Flt3配体(Flt-3L)、人干细胞因子(SCF),但不补充人血小板生成素(TPO)或人白细胞介素-6。当存在于培养基中时,血小板生成素(TPO)、人Flt3配体(Flt-3L)、人干细胞因子(SCF)、人白细胞介素-6和/或L-谷氨酰胺各自以范围从约1ng/mL至约1000ng/mL的浓度,例如范围从约10ng/mL至约500ng/mL的浓度、例如范围从约10ng/mL至约100ng/mL的浓度、例如范围从约25ng/mL至约75ng/mL的浓度、例如约50ng/mL的浓度存在。在实施例中,每种补充的组分的浓度相同。在其他实施例中,每种补充的组分的浓度不同。在一个实施例中,培养基包含StemSpan SFEM(干细胞技术公司;目录号09650)、50ng/mL的血小板生成素(Tpo)、50ng/mL的人Flt3配体(Flt-3L)、50ng/mL的人干细胞因子(SCF)、以及50ng/mL的人白细胞介素-6(IL-6)。在一个实施例中,培养基包含StemSpan SFEM(干细胞技术公司;目录号09650)、50ng/mL的血小板生成素(Tpo)、50ng/mL的人Flt3配体(Flt-3L)、以及50ng/mL的人干细胞因子(SCF),并且不包含IL-6。在实施例中,培养基还包含干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为0.75μM的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在实施例中,培养基还包含干细胞扩增剂,例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇,例如浓度为0.5μM的(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇。在实施例中,培养基进一步包含1%L-谷氨酰胺和2%青霉素/链霉素。在实施例中,细胞培养基不含血清。
XII.组合疗法
本披露预期了本文所述的gRNA分子、或用本文所述的gRNA分子修饰的细胞(例如造血干细胞,例如CD34+细胞)与一种或多种其他治疗方式和/或药剂的组合的用途。因此,除了使用gRNA分子或用本文所述的gRNA分子修饰的细胞之外,还可以向受试者施用一种或多种用于治疗血红蛋白病的“标准”疗法。
用于治疗血红蛋白病的一种或多种另外的疗法可以包括例如另外的干细胞移植,例如造血干细胞移植。干细胞移植可以是同种异体的或自体的。
用于治疗血红蛋白病的一种或多种另外的疗法可以包括例如输血和/或铁螯合(例如去除)疗法。已知的铁螯合剂包括例如去铁胺和地拉罗司。
用于治疗血红蛋白病的一种或多种另外的疗法可以包括例如叶酸补充剂或羟基脲(例如5-羟基脲)。用于治疗血红蛋白病的一种或多种另外的疗法可以是羟基脲。在实施例中,羟基脲能以例如每天10mg/kg-35mg/kg,例如每天10mg/kg-20mg/kg的剂量施用。在实施例中,羟基脲能以每天10mg/kg的剂量施用。在实施例中,羟基脲能以每天10mg/kg的剂量施用。在实施例中,羟基脲能以每天20mg/kg的剂量施用。在实施例中,羟基脲在本发明的细胞(或细胞群)(例如CD34+细胞(或细胞群))之前和/或之后施用,例如如本文所述。
一种或多种另外的治疗剂可以包括例如抗p-选择素抗体,例如SelG1(Selexys公司)。p-选择素抗体描述于例如PCT公开WO1993/021956、PCT公开WO 1995/034324、PCT公开WO 2005/100402、PCT公开WO 2008/069999、美国专利申请公开US 2011/0293617、美国专利号5800815、美国专利号6667036、美国专利号8945565、美国专利号8377440以及美国专利号9068001中,将其各自内容以其全文并入本文。
一种或多种另外的药剂可以包括例如上调胎儿血红蛋白的小分子。此类分子的实例包括TN1(例如,如Nam,T.等人,ChemMedChem[药物化学]2011,6,777-780,DOI:10.1002/cmdc.201000505所述,通过引用并入本文)。
一种或多种另外的疗法还可以包括辐射或本领域已知的其他骨髓消融疗法。这种疗法的一个实例是白消安。可以在将本发明的细胞引入受试者中之前进行这种另外的治疗。在一个实施例中,本文所述的治疗方法(例如,包括施用通过本文所述的方法修饰(例如用本文所述的CRISPR系统修饰,例如以增加HbF产生)的细胞(例如HSPC)的治疗方法),该方法不包括骨髓消融步骤。在实施例中,这些方法包括部分骨髓消融步骤。
本文所述的疗法(例如,包括施用HSPC(例如使用本文所述的CRISPR系统修饰的HSPC)群)也可以与另外的治疗剂组合。在一个实施例中,另外的治疗剂是HDAC抑制剂,例如帕比司他。在一个实施例中,另外的治疗剂是PCT公开号WO 2014/150256中所述的化合物,例如WO 2014/150256的表1中所述的化合物,例如GBT440。HDAC抑制剂的其他实例包括例如辛二酰苯胺异羟肟酸(SAHA)。一种或多种另外的药剂可以包括例如DNA甲基化抑制剂。已经显示此类药剂增加具有降低的BCL11a活性的细胞中的HbF诱导(例如,Jian Xu等人,Science[科学]334,993(2011);DOI:0.1126/science.1211053,通过引用并入本文)。其他HDAC抑制剂包括本领域已知的任何HDAC抑制剂,例如曲古抑菌素A、HC毒素、DACI-2、FK228、DACI-14、depudicin、DACI-16、tubacin、NK57、MAZ1536、NK125、Scriptaid、Pyroxamide、MS-275、ITF-2357、MCG-D0103、CRA-024781、CI-994和LBH589(参见例如,Bradner JE等人,PNAS[美国国家科学院院刊],2010(第107卷:28),12617-12622,通过引用以其全文并入本文)。
本文所述的gRNA分子、或用本文所述的gRNA分子修饰的细胞(例如造血干细胞,例如CD34+细胞)以及共治疗剂或共同疗法可以在相同的配制品中或分开地施用。在分开施用的情况下,本文所述的gRNA分子或用本文所述的gRNA分子修饰的细胞可以在共治疗剂或共同疗法之前、之后或同时施用。一种药剂可以在另一药剂之前或之后以数分钟至数周范围的间隔施用。在将两种或更多种不同种类的治疗剂分开施用于受试者的实施例中,通常将确保在每次递送的时间之间没有超过显著的时间段,使得这些不同种类的药剂将仍能够对靶组织或细胞发挥有利的组合作用。
XIII.经修饰的核苷、核苷酸和核酸
经修饰的核苷和经修饰的核苷酸可以存在于核酸中,例如特别是gRNA,但也可以存在于其他形式的RNA中,例如mRNA、RNAi或siRNA。如本文所述,“核苷”定义为含有五碳糖分子(戊糖或核糖)或其衍生物和有机碱(嘌呤或嘧啶)或其衍生物的化合物。如本文所述,“核苷酸”定义为进一步包含磷酸基团的核苷。
经修饰的核苷和核苷酸可以包含以下一种或多种:
(i)改变(例如替代)磷酸二酯主链连接中的一个或两个非连接磷酸氧和/或一个或多个连接磷酸氧;
(ii)改变(例如替代)核糖的成分,例如核糖上的2'羟基;
(iii)用“去磷酸”接头大规模替代磷酸部分;
(iv)修饰或替代天然存在的核碱基,包括用非标准核碱基;
(v)替代或修饰核糖-磷酸主链;
(vi)修饰寡核苷酸的3'端或5'端,例如去除、修饰或替代末端磷酸基团或部分、帽或接头的缀合;并且
(vii)修饰或替代糖。
可以组合以上列出的修饰以提供可以具有两种、三种、四种或更多种修饰的经修饰的核苷和核苷酸。例如,经修饰的核苷或核苷酸可以具有经修饰的糖和经修饰的核碱基。在一个实施例中,gRNA的每个碱基被修饰,例如所有碱基都具有经修饰的磷酸基团,例如所有碱基都是硫代磷酸酯基团。在一个实施例中,单分子或模块化gRNA分子的全部或基本上全部的磷酸基团被硫代磷酸酯基团替代。在实施例中,gRNA的五个3'末端碱基中的一个或多个和/或五个5'末端碱基中的一个或多个被硫代磷酸酯基团修饰。
在一个实施例中,经修饰的核苷酸(例如具有如本文所述的修饰的核苷酸)可以掺入核酸(例如“经修饰的核酸”)中。在一些实施例中,经修饰的核酸包含一个、两个、三个或更多个经修饰的核苷酸。在一些实施例中,经修饰的核酸中的至少5%(例如,至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、或约100%)的位置是经修饰的核苷酸。
未经修饰的核酸可能易于被例如细胞核酸酶降解。例如,核酸酶可以水解核酸磷酸二酯键。因此,在一方面,本文所述的经修饰的核酸可以含有一个或多个经修饰的核苷或核苷酸,例如以引入对核酸酶的稳定性。
在一些实施例中,当在体内和离体地引入细胞群中时,本文所述的经修饰的核苷、经修饰的核苷酸和经修饰的核酸可以表现出降低的先天性免疫应答。术语“先天性免疫应答”包括对外源核酸(包括通常为病毒或细菌来源的单链核酸)的细胞应答,其涉及诱导细胞因子(特别是干扰素)表达和释放、以及细胞死亡。在一些实施例中,本文所述的经修饰的核苷、经修饰的核苷酸和经修饰的核酸可以破坏大沟相互作用配偶体与核酸的结合。在一些实施例中,当在体内和离体地引入细胞群中时,本文所述的经修饰的核苷、经修饰的核苷酸和经修饰的核酸可以表现出降低的先天性免疫应答,并且还破坏大沟相互作用配偶体与核酸的结合。
化学基团的定义
如本文所用,“烷基”意在指直链或支链的饱和烃基。示例性烷基基团包括甲基(Me)、乙基(Et)、丙基(例如正丙基和异丙基)、丁基(例如正丁基、异丁基、叔丁基)、戊基(例如正戊基、异戊基、新戊基)等。烷基基团可以含有从1至约20、从2至约20、从1至约12、从1至约8、从1至约6、从1至约4、或从1至约3个碳原子。
如本文所用,“芳基”是指单环或多环(例如,具有2、3或4个稠环)芳族烃,例如像苯基、萘基、蒽基、菲基、茚满基、茚基等。在一些实施例中,芳基基团具有从6至约20个碳原子。
如本文所用,“烯基”是指含有至少一个双键的脂肪族基团。如本文所用,“炔基”是指含有2-12个碳原子并且其特征在于具有一个或多个三键的直链或支链烃链。炔基基团的实例包括但不限于乙炔基、炔丙基和3-己炔基。
如本文所用,“芳基烷基”或“芳烷基”是指烷基氢原子被芳基基团替代的烷基部分。芳烷基包括多于一个氢原子已经被芳基基团替代的基团。“芳基烷基”或“芳烷基”的实例包括苄基、2-苯基乙基、3-苯基丙基、9-芴基、二苯甲基和三苯甲基基团。
如本文所用,“环烷基”是指具有3至12个碳的环状、二环、三环或多环非芳族烃基团。环烷基部分的实例包括但不限于环丙基、环戊基和环己基。
如本文所用,“杂环基”是指杂环系统的单价基团。代表性的杂环基包括但不限于四氢呋喃基、四氢噻吩基、吡咯烷基、吡咯烷酮基、哌啶基、吡咯啉基、哌嗪基、二噁烷基、二氧戊环基、二氮杂卓基、氧氮杂卓基、硫杂卓基和吗啉基。
如本文所用,“杂芳基”是指杂芳族环系统的单价基团。杂芳基部分的实例包括但不限于咪唑基、噁唑基、噻唑基、三唑基、吡咯基、呋喃基、吲哚基、苯硫基、吡唑基、吡啶基、吡嗪基、哒嗪基、嘧啶基、吲嗪基、嘌呤基、萘啶基、喹啉基和蝶啶基。
式(I)的化合物中化学基团的定义
一般而言,对于包含两种或更多种亚基团的基团,最后提及的基团为基团连接点,例如“烷基芳基”意指式烷基-芳基-的单价基团,而“芳基烷基”意指式芳基-烷基-的单价基团。
在R3c或R4是芳基烷基-O-的式(I)的实施例中,这意指具有式芳基-烷基-O-或-O-烷基-芳基的单价O基团。
此外,使用表示单价基团的术语而其中二价基团是合适的,则应理解为表示相应的二价基团,反之亦然。除非另有说明,否则假定术语对照的常规定义和常规的稳定原子的原子价,并在全部式和基团中体现。
术语“取代的”意指特定的基团或部分带有一个或多个合适的取代基,其中取代基可以在一个或多个位置处与特定的基团或部分连接。例如,被环烷基取代的芳基可以指示环烷基通过键与芳基的一个原子连接或通过与芳基稠合且共享两个或更多个共同原子。
因此,式(I)的化合物中的术语“C1-C10烷基”是指仅由碳和氢原子组成的烃链基团,不含不饱和度,具有从一到十个碳原子,并通过单键连接到分子的其余部分。术语“C1-C3烷基”、“C1-C4烷基”、“C1-C6烷基”、“C1-C8烷基”应相应地进行解释。
如本文所用,术语“C1-C6烷氧基”是指具有式-ORa的基团,其中Ra是如上一般定义的C1-C6烷基基团。
“炔基”意指含有2-12个碳原子的直链或支链不饱和的烃。“炔基”基团在链中含有至少一个三键。术语“C2-C4炔基”应相应地进行解释。炔基基团的实例包括乙炔基、炔丙基、正丁炔基、异丁炔基、戊炔基或己炔基。炔基基团可以是未取代的或取代的。
“C2-C4炔基”的优选实例包括但不限于乙炔基、丙-1-炔基、丙-2-炔基和丁-2-炔基。
如本文所用,术语“C1-C6卤代烷基”是指被如本文所定义的一个或多个卤代基团取代的如以上所定义的C1-C6烷基基团。C1-C6卤代烷基的实例包括但不限于三氟甲基、二氟甲基、氟甲基、三氯甲基、1,1-二氟乙基、2,2-二氟乙基、2,2,2-三氟乙基、2-氟丙基、3,3-二氟丙基和1-氟甲基-2-氟乙基、1,3-二溴丙-2-基、3-溴-2-氟丙基和1,4,4-三氟丁-2-基。
如本文所用,术语“C1-C6卤代烷氧基”意指被一个或多个卤代基团取代的如本文所定义的C1-C6烷氧基基团。C1-C6卤代烷氧基基团的实例包括但不限于三氟甲氧基、二氟甲氧基、氟甲氧基、三氯甲氧基、1,1-二氟乙氧基、2,2-二氟乙氧基、2,2,2-三氟乙氧基、1-氟甲基-2-氟乙氧基、五氟乙氧基、2-氟丙氧基、3,3-二氟丙氧基和3-二溴丙氧基。例如,C1-C6卤代烷氧基的一个或多个卤代基团是氟。例如,C1-C6卤代烷氧基选自三氟甲氧基、二氟甲氧基、氟甲氧基、1,1-二氟乙氧基、2,2-二氟乙氧基、2,2,2-三氟乙氧基、1-氟甲基-2-氟乙氧基和五氟乙氧基。
术语“卤素”或“卤代”意指氟、氯、溴、或碘。
如本文所用,术语“环烷基”意指含有3-18个碳原子的单环或多环饱和或部分不饱和碳环,其中在环碳之间没有共用的离域π电子(芳香性)。术语“C3-C8环烷基”和“C3-C6环烷基”应相应地进行解释。术语多环涵盖桥接(例如降莰烷(norbomane))、稠合(例如十氢化萘)和螺环环烷基。例如,环烷基,例如C3-C8环烷基是3至8个碳原子的单环或桥接烃基团。
C3-C8环烷基的实例包括但不限于环丙基、环丁基、环戊基、环己基、双环[1.1.1]戊基、双环[2.1.1]己基、双环[2.1.1]庚基和双环[2.2.2]辛基。
术语“芳基”意指单环、双环或多环碳环芳族环。芳基的实例包括但不限于苯基、萘基(例如萘-1-基、萘-2-基)、蒽基(例如蒽-1-基、蒽-9-基)、菲基(例如菲-1-基、菲-9-基)等。芳基还旨在包括被碳环芳族环取代的单环、双环或多环碳环芳族环。代表性实例是联苯(例如联苯-2-基、联苯-3-基、联苯-4-基)、苯基萘基(例如1-苯基萘-2-基、2-苯基萘-1-基)等。芳基还旨在包括具有至少一个不饱和部分(例如苯并部分)的部分饱和双环或多环碳环。代表性实例是茚满基(例如茚满-1-基、茚满-5-基)、茚基(例如茚-1-基、茚-5-基)、1,2,3,4-四氢萘基(例如1,2,3,4-四氢萘-1-基、1,2,3,4-四氢萘-2-基、1,2,3,4-四氢萘-6-基)、1,2-二氢萘基(例如1,2-二氢萘-1-基、1,2-二氢萘-4-基、1,2-二氢萘-6-基)、芴基(例如芴-1-基、芴-4-基、芴-9-基)等。芳基还旨在包括含有一个或两个桥的部分饱和双环或多环碳环芳族环。代表性实例是苯并降莰基(例如苯并降莰-3-基、苯并降莰-6-基)、1,4-桥亚乙基-1,2,3,4-四氢萘基(例如1,4-桥亚乙基-1,2,3,4-四氢萘-2-基、1,4-桥亚乙基-1,2,3,4-四氢萘-10-基)等。术语“C6-C10芳基”应相应地进行解释。
式(I)的化合物中的芳基(例如,C6-C10芳基)的实例包括但不限于茚基(例如茚-1-基、茚-5-基)、苯基(C6H5)、萘基(C10H7)(例如萘-1-基、萘-2-基)、茚满基(例如茚满-1-基、茚满-5-基)和四氢萘基(例如1,2,3,4-四氢萘基)。
如本文所用,术语“C6-C10芳基C1-C6烷基”是指具有式-Ra-C6-C10芳基的单价基团,其中Ra是如上一般定义的C1-C6烷基基团。C6-C10芳基C1-C6烷基的实例包括但不限于C1烷基-C6H5(苄基)、C1烷基-C10H7、-CH(CH3)-C6H5、-C(CH3)2-C6H5和-(CH2)2-6-C6H5
术语“杂环基”意指含有碳和至少一个选自氧、氮和硫(O、N和S)的杂原子的饱和的或部分饱和的单环或多环的环,并且其中在环碳或杂原子之间没有共用的离域π电子(芳香性)。术语“4至6元杂环基”和“4至11元杂环基”应相应地进行解释。杂环基环结构可以被一个或多个取代基取代。取代基本身可以是任选地取代的。杂环基可以经由碳原子或杂原子键合。术语多环涵盖桥接、稠合和螺环杂环基。
杂环基环的实例包括但不限于氧杂环丁烷基、氮杂环丁烷基、四氢呋喃基、四氢吡喃基、吡咯烷基、噁唑啉基、异噁唑啉基、噁唑烷基、噻唑烷基、吡喃基、硫代吡喃基、四氢吡喃基、二噁啉基、哌啶基、吗啉基、硫代吗啉基、硫代吗啉基S-氧化物、硫代吗啉基S-二氧化物、哌嗪基、氮杂
Figure BDA0003693276070001701
基、氧杂
Figure BDA0003693276070001702
基、二氮杂
Figure BDA0003693276070001703
基、托品烷基、噁唑烷酮基、1,4-二噁烷基、二氢呋喃基、1,3-二氧戊环基、咪唑烷基、二氢异噁唑啉基、吡咯啉基、吡唑啉基、氧氮杂
Figure BDA0003693276070001704
基、二硫戊环基、同托品烷基(homotropanyl)、二氢吡喃基(例如3,6-二氢-2H-吡喃基)、氧杂螺庚烷基(例如2-氧杂螺[3.3]庚烷-6-基)等。
如本文所用,术语“杂芳基”如本文所用旨在包括含有选自氧、氮和硫(O、N和S)的一个或多个杂原子的单环杂环芳族环。代表性实例是吡咯基、呋喃基、噻吩基、噁唑基、噻唑基、咪唑基、吡唑基、异噻唑基、异噁唑基、三唑基(例如1,2,4-三唑基)、噁二唑基(例如1,2,3-噁二唑基、1,2,4-噁二唑基、1,2,5-噁二唑基、1,3,4-噁二唑基)、噻二唑基(例如1,2,3-噻二唑基、1,2,4-噻二唑基、1,2,5-噻二唑基、1,3,4-噻二唑基)、四唑基、吡喃基、吡啶基、哒嗪基、嘧啶基、吡嗪基、1,2,3-三嗪基、1,2,4-三嗪基、1,3,5-三嗪基、噻二嗪基、氮杂
Figure BDA0003693276070001705
基、吖癸因基(azecinyl)等。
杂芳基还旨在包括含有选自氧、氮和硫(O、N和S)的一个或多个杂原子的双环杂环芳族环。代表性实例是吲哚基、异吲哚基、苯并呋喃基、苯并噻吩基、吲唑基、苯并吡喃基、苯并咪唑基、苯并噻唑基、苯并异噻唑基、苯并噁唑基、苯并异噁唑基、苯并噁嗪基、苯并三唑基、萘啶基、酞嗪基、蝶啶基、嘌呤基、喹唑啉基、噌啉基、喹啉基、异喹啉基、喹唑啉基、噁唑并吡啶基、异噁唑并吡啶基、吡咯并吡啶基、呋喃并吡啶基、噻吩并吡啶基、咪唑并吡啶基、咪唑并嘧啶基、吡唑并吡啶基、吡唑并嘧啶基、吡唑并三嗪基、三唑并吡啶基、三唑并嘧啶基、咪唑并噻唑基、三唑并吡啶基、三唑并嘧啶基等。
杂芳基还旨在包括含有选自氧、氮和硫(O、N和S)的一个或多个杂原子的多环杂环芳族环。代表性实例是咔唑基、吩噁嗪基、吩嗪基、吖啶基、吩噻嗪基、咔啉基、菲咯啉基等。
杂芳基还旨在包括含有选自氧、氮和硫(O、N和S)的一个或多个杂原子的部分饱和单环、双环或多环杂环基。代表性实例是咪唑啉基、二氢吲哚基、二氢苯并呋喃基、二氢苯并噻吩基、二氢苯并吡喃基、二氢吡啶并噁嗪基、二氢苯并二噁英基(例如2,3-二氢苯并[b][1,4]二噁英基)、苯并间二氧杂环戊烯基(例如苯并[d][1,3]间二氧杂环戊烯)、二氢苯并噁嗪基(例如3,4-二氢-2H-苯并[b][1,4]噁嗪)、四氢吲唑基、四氢苯并咪唑基、四氢咪唑并[4,5-c]吡啶基、四氢喹啉基、四氢异喹啉基、四氢喹喔啉基等。
杂芳基环结构可以被一个或多个取代基取代。取代基本身可以是任选地取代的。杂芳基环可以经由碳原子或杂原子键合。
术语“5-10元杂芳基”应相应地进行解释。
5-10元杂芳基的实例包括但不限于吲哚基、咪唑并吡啶基、异喹啉基、苯并噁唑酮基、吡啶基、嘧啶基、吡啶酮基、苯并三唑基、哒嗪基、吡唑并三嗪基、吲唑基、苯并咪唑基、喹啉基、三唑基(例如1,2,4-三唑基)、吡唑基、噻唑基、噁唑基、异噁唑基、吡咯基、噁二唑基(例如1,2,3-噁二唑基、1,2,4-噁二唑基、1,2,5-噁二唑基、1,3,4-噁二唑基)、咪唑基、吡咯并吡啶基、四氢吲唑基、喹喔啉基、噻二唑基(例如1,2,3-噻二唑基、1,2,4-噻二唑基、1,2,5-噻二唑基、1,3,4-噻二唑基)、吡嗪基、噁唑并吡啶基、吡唑并嘧啶基、苯并噁唑基、二氢吲哚基、异噁唑并吡啶基、二氢吡啶并噁嗪基、四唑基、二氢苯并二噁英基(例如2,3-二氢苯并[b][1,4]二噁英基)、苯并间二氧杂环戊烯基(例如苯并[d][1,3]间二氧杂环戊烯)和二氢苯并噁嗪基(例如3,4-二氢-2H-苯并[b][1,4]噁嗪)。
如本文所用,术语“氧代”是指基团=O。
如本文所用,术语“二(C1-C6烷基)氨基C1-C6烷基”是指具有式-Ra1-N(Ra2)-Ra2的基团,其中Ra1是如上所定义的C1-C6烷基基团并且每个Ra2是如上所定义的可以相同或不同的C1-C6烷基。氮原子可以与任一烷基中的任何碳原子键合。实例包括但不限于(C1烷基-NR6aR6b)、(C1烷基-CH2-NR6aR6b)、(-(CH2)3-NR6aR6b)、(-(CH2)4-NR6aR6b)、(-(CH2)5-NR6aR6b)和(-(CH2)6-NR6aR6b),其中R6a和R6b如本文所定义。
如本文所用,术语“二(C1-C6烷基)氨基”是指具有式-N(Ra1)-Ra1的氨基基团,其中每个Ra1是如上所定义的可以相同或不同的C1-C6烷基基团。
“氰基”或“-CN”意指具有通过三键连接氮原子和碳原子的取代基,例如C≡N。
如本文所用,术语“任选地取代的”包括未经取代的或经取代的。
如本文所用,
Figure BDA0003693276070001721
表示与分子的其他部分的附接点。
如本文所用,本披露的化合物或通用方案1至4任一项中的任何中间体及其子式中的术语氮保护基团(PG)是指应保护有关的官能团免于不希望的二次反应(例如酰化、醚化、酯化、氧化、溶剂分解和类似反应)的基团。可以在脱保护条件下将其去除。取决于所使用的保护基团,技术人员通过参考已知方法将知道如何去除保护基团以获得游离胺NH2基团。这些方法包括参考有机化学教科书和文献方法,例如J.F.W.McOmie,"Protective Groups inOrganic Chemistry[有机化学中的保护基团]",Plenum Press[Plenum出版社],伦敦和纽约1973;T.W.Greene和P.G.M.Wuts,"Greene's Protective Groups in OrganicSynthesis[格林有机合成中的保护基团]",第四版,Wiley[威利出版社],纽约2007;在"ThePeptides[肽]";第3卷(编辑:E.Gross和J.Meienhofer),Academic Press[学术出版社],伦敦和纽约1981;P.J.Kocienski,"Protecting Groups[保护基团]",第三版,Georg ThiemeVerlag[格奥尔格蒂梅出版社],斯图加特和纽约2005;以及在"Methoden der organischenChemie"(Methods of Organic Chemistry)[有机化学方法],Houben Weyl,第4版,第15卷/I,Georg Thieme Verlag[格奥尔格蒂梅出版社],斯图加特1974。
优选的氮保护基团通常包括:C1-C6烷基(例如叔丁基),例如C1-C4烷基,C1-C2烷基,或C1烷基,其被以下各项单取代、二取代或三取代:三烷基甲硅烷基-C1-C7烷氧基(例如三甲基甲硅烷基乙氧基)、芳基(例如苯基)或杂环基团(例如苄基、枯基、二苯甲基、吡咯烷基、三苯甲基、吡咯烷基甲基、1-甲基-1,1-二甲基苄基、(苯基)甲基苯),其中芳基环或杂环基团未经取代或被一个或多个(例如两个或三个)例如选自由以下组成的组的残基取代:C1-C7烷基、羟基、C1-C7烷氧基(例如对甲氧基苄基(PMB))、C2-C8-烷酰基-氧基、卤素、硝基、氰基、和CF3、芳基-C1-C2-烷氧基羰基(例如苯基-C1-C2-烷氧基羰基(例如苄氧基羰基(Cbz)、苄氧基甲基(BOM)、新戊酰氧基甲基(POM))、C1-C10-烯氧基羰基、C1-C6烷基羰基(例如乙酰基或新戊酰基)、C6-C10-芳基羰基;C1-C6-烷氧基羰基(例如叔丁氧基羰基(Boc)、甲基羰基、三氯乙氧基羰基(Troc)、新戊酰基(Piv)、烯丙氧基羰基),C6-C10-芳基C1-C6-烷氧基羰基(例如9-芴基甲基氧基羰基(Fmoc)),烯丙基或肉桂基,磺酰基或次磺酰基,琥珀酰亚胺基基团,甲硅烷基基团(例如三芳基甲硅烷基、三烷基甲硅烷基、三乙基甲硅烷基(TES)、三甲基甲硅烷基乙氧基甲基(SEM)、三甲基甲硅烷基(TMS)、三异丙基甲硅烷基或叔丁基二甲基甲硅烷基)。
根据本披露,优选的保护基团(PG)可以选自包括以下的组:叔丁基氧基羰基(Boc)、苄氧基羰基(Cbz)、对甲氧基苄基(PMB)、甲基氧基羰基、三甲基甲硅烷基乙氧基甲基(SEM)和苄基。在一个实施例中,保护基团(PG)是叔丁氧基羰基(Boc)。
在一些实施例中,本披露内容的化合物对其他蛋白质具有选择性。
磷酸主链修饰
磷酸基团
在一些实施例中,经修饰的核苷酸的磷酸基团可以通过用不同的取代基替代一个或多个氧来修饰。此外,经修饰的核苷酸(例如经修饰的核酸中存在的经修饰的核苷酸)可以包含用如本文所述的经修饰的磷酸大规模替代未经修饰的磷酸部分。在一些实施例中,磷酸主链的修饰可以包括产生不带电荷的接头或具有不对称电荷分布的带电荷的接头的改变。
经修饰的磷酸基团的实例包括硫代磷酸酯、硒代磷酸酯(phosphoroselenate)、硼酸磷酸酯(borano phosphate)、硼酸磷酸酯(borano phosphate ester)、氢膦酸酯、氨基磷酸酯、烷基或芳基膦酸酯以及磷酸三酯。在一些实施例中,磷酸主链部分中的非桥接磷酸氧原子之一可以被以下任何基团替代:硫(S)、硒(Se)、BR3(其中R可以是例如氢、烷基或芳基)、C(例如烷基基团、芳基基团等)、H、NR2(其中R可以是例如氢、烷基或芳基)、或OR(其中R可以是例如烷基或芳基)。未经修饰的磷酸基团中的磷原子是非手性的。然而,用以上原子或原子团中的一个替代一个非桥接氧可以使磷原子变得具手性;也就是说,以这种方式修饰的磷酸基团中的磷原子是立构中心。立构磷原子可以具有“R”构型(本文中为Rp)或“S”构型(本文中为Sp)。
二硫代磷酸酯的两个非桥接氧被硫替代。二硫代磷酸酯中的磷中心是非手性的,其阻止了寡核糖核苷酸非对映异构体的形成。在一些实施例中,对一个或两个非桥接氧的修饰还可以包括用独立地选自S、Se、B、C、H、N和OR(R可以是例如烷基或芳基)的基团替代非桥接氧。
磷酸接头也可以通过用氮(桥接氨基磷酸酯)、硫(桥接硫代磷酸酯)和碳(桥接亚甲基膦酸酯)替代桥接氧(即,连接磷酸与核苷的氧)来修饰。替代可以在任一连接氧或两个连接氧处发生。
磷酸基团的替代
磷酸基团可以被不含磷的连接体替代。在一些实施例中,带电荷的磷酸基团可以被中性部分替代。
可以替代磷酸基团的部分的实例可以包括但不限于例如甲基膦酸酯、羟基氨基、硅氧烷、碳酸酯、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸酯、磺酰胺、硫代甲缩醛、甲缩醛、肟、亚甲基亚氨基、亚甲基甲基亚氨基、亚甲基亚肼基、亚甲基二甲基亚肼基和亚甲基氧基甲基亚氨基。
核糖磷酸主链的替代
还可以构建能模拟核酸的支架,其中磷酸接头和核糖被核酸酶抗性核苷或核苷酸替代物替代。在一些实施例中,核碱基可以被替代物主链拴系。实例可以包括但不限于吗啉代、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。
糖修饰
经修饰的核苷和经修饰的核苷酸可以包含对糖基的一种或多种修饰。例如,2'羟基基团(OH)可以被许多不同的“氧基”或“脱氧”取代基修饰或替代。在一些实施例中,对2'羟基基团的修饰可以增强核酸的稳定性,因为羟基不再能被去质子化以形成2'-醇盐离子。2'-醇盐可以通过对接头磷原子的分子内亲核攻击来催化降解。
“氧基”-2'羟基基团修饰的实例可以包括烷氧基或芳氧基(OR,其中“R”可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖);聚乙二醇(PEG)、0(CH2CH20)nCH2CH2OR(其中R可以是例如H或任选地取代的烷基,并且n可以是从0至20(例如,从0至4、从0至8、从0至10、从0至16、从1至4、从1至8、从1至10、从1至16、从1至20、从2至4、从2至8、从2至10、从2至16、从2至20、从4至8、从4至10、从4至16、以及从4至20)的整数)。在一些实施例中,“氧基”-2'羟基基团修饰可以包括“锁”核酸(LNA),其中2'羟基可以例如通过Ci-6亚烷基或Cj-6亚杂烷基桥连接至相同核糖的4'碳,其中示例性桥可以包括亚甲基、亚丙基、醚或氨基桥;O-氨基(其中氨基可以是例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或多氨基)和氨基烷氧基、0(CH2)n-氨基(其中氨基可以是例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或多氨基)。在一些实施例中,“氧基”-2'羟基基团修饰可以包括甲氧基乙基基团(MOE)(OCH2CH2OCH3,例如PEG衍生物)。
“脱氧”修饰可以包括氢(即脱氧核糖,例如在部分ds RNA的突出部分);卤素(例如,溴、氯、氟或碘);氨基(其中氨基可以是例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸);NH(CH2CH2NH)nCH2CH2-氨基(其中氨基可以是例如如本文所述的)、-NHC(0)R(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氰基;巯基;烷基-硫代-烷基;硫代烷氧基;以及烷基、环烷基、芳基、烯基和炔基,其可以任选地被例如如本文所述的氨基取代。
糖基还可以含有一个或多个如下碳,这些碳具有与核糖中相应碳相反的立体化学构型。因此,经修饰的核酸可以包含含有例如阿拉伯糖(作为糖)的核苷酸。核苷酸“单体”可以在糖上的Γ位具有α键,例如α-核苷。经修饰的核酸还可以包含“脱碱基”糖,其在C-处缺乏核碱基。这些脱碱基糖还可以在一个或多个组成性糖原子上被进一步修饰。经修饰的核酸还可以包含一种或多种L形式的糖,例如L-核苷。
通常,RNA包含糖基核糖,其是具有氧的5元环。示例性的经修饰的核苷和经修饰的核苷酸可以包括但不限于核糖中的氧的替代(例如,用硫(S)、硒(Se)或亚烷基,例如像亚甲基或亚乙基);双键的添加(例如,以用环戊烯基或环己烯基替代核糖);核糖的环收缩(例如,以形成环丁烷或氧杂环丁烷的4元环);核糖的环扩展(例如,以形成具有另外的碳或杂原子的6元或7元环,例如像还具有氨基磷酸酯主链的脱水己糖醇、阿卓糖醇、甘露醇、环己基、环己烯基以及吗啉代)。在一些实施例中,经修饰的核苷酸可以包括多环形式(例如,三环);和“解锁”形式,如二醇核酸(GNA)(例如,R-GNA或S-GNA,其中核糖被连接到磷酸二酯键的二醇单元替代)、苏阿糖核酸(TNA,其中核糖被a-L-苏阿呋喃糖基-(3'-→2')替代)。
对核碱基的修饰
可以掺入经修饰的核酸中的本文所述的经修饰的核苷和经修饰的核苷酸可以包含经修饰的核碱基。核碱基的实例包括但不限于腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。这些核碱基可以被修饰或完全替代以提供可以掺入经修饰的核酸中的经修饰的核苷和经修饰的核苷酸。核苷酸的核碱基可以独立地选自嘌呤、嘧啶、嘌呤或嘧啶类似物。在一些实施例中,核碱基可以包括例如碱基的天然存在的和合成的衍生物。
尿嘧啶
在一些实施例中,经修饰的核碱基是经修饰的尿嘧啶。具有经修饰的尿嘧啶的示例性核碱基和核苷包括但不限于假尿苷(ψ)、吡啶-4-酮核糖核苷、5-氮杂-尿苷、6-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代-尿苷(s2U)、4-硫代-尿苷(s4U)、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基-尿苷(ho5U)、5-氨基烯丙基-尿苷、5-卤代-尿苷(例如5-碘-尿苷或5-溴-尿苷)、3-甲基-尿苷(m3U)、5-甲氧基-尿苷(mo5U)、尿苷5-氧基乙酸(cmo5U)、尿苷5-氧基乙酸甲酯(mcmo^U)、5-羧甲基-尿苷(cmsU)、1-羧甲基-假尿苷、5-羧基羟基甲基-尿苷(chm5U)、5-羧基羟基甲基-尿苷甲酯(mchm5U)、5-甲氧基羰基甲基-尿苷(mcm5U)、5-甲氧基羰基甲基-2-硫代-尿苷(mcm5s2U)、5-氨基甲基-2-硫代-尿苷(nm5s2U)、5-甲基氨基甲基-尿苷(mnm5U)、5-甲基氨基甲基-2-硫代-尿苷(mnm5s2U)、5-甲基氨基甲基-2-硒代-尿苷(mnm5se2U)、5-氨甲酰基甲基-尿苷(ncm5U)、5-羧甲基氨基甲基-尿苷(cmnm5U)、5-羧甲基氨基甲基-2-硫代-尿苷(cmnm\s2U)、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷(xcm5U)、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷(Trn5s2U)、1-牛磺酸甲基-4-硫代-假尿苷、5-甲基-尿苷(m5U,即,具有核碱基脱氧胸腺嘧啶)、1-甲基-假尿苷(ιτι'ψ)、5-甲基-2-硫代-尿苷(m5s2U)、l-甲基-4-硫代-假尿苷(m's\|/)、4-硫代-1-甲基-假尿苷、3-甲基-假尿苷(m'V)、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮杂-假尿苷、2-硫代-1-甲基-1-脱氮杂-假尿苷、二氢尿苷(D)、二氢假尿苷、5,6-二氢尿苷、5-甲基-二氢尿苷(m5D)、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫代-假尿苷、N1-甲基-假尿苷、3-(3-氨基-3-羧基丙基)尿苷(acp3U)、1-甲基-3-(3-氨基-3-羧基丙基假尿苷、5-(异戊烯基氨基甲基)尿苷(inm5U)、5-(异戊烯基氨基甲基])-2-硫代-尿苷(inm5s2U)、a-硫代-尿苷、2'-0-甲基-尿苷(Urn)、5,2'-0-二甲基-尿苷(m5Um)、2'-0-甲基-假尿苷(ψπι)、2-硫代-2'-0-甲基-尿苷(s2Um)、5-甲氧基羰基甲基-2'-0-甲基-尿苷(mcm 5Um)、5-氨甲酰基甲基-2'-0-甲基-尿苷(ncm 5Um)、5-羧甲基氨基甲基-2'-0-甲基-尿苷(cmnm 5Um)、3,2'-0-二甲基-尿苷(m3Um)、5-(异戊烯基氨基甲基)-2'-0-甲基-尿苷(inm5Um)、1-硫代-尿苷、脱氧胸苷、2'-F-阿糖-尿苷、2'-F-尿苷、2'-OH-阿糖-尿苷、5-(2-甲氧羰基乙烯基)尿苷、5-[3-(1-E-丙烯基氨基)尿苷、吡唑并[3,4-d]嘧啶、黄嘌呤、以及次黄嘌呤。
胞嘧啶
在一些实施例中,经修饰的核碱基是经修饰的胞嘧啶。具有经修饰的胞嘧啶的示例性核碱基和核苷包括但不限于5-氮杂-胞苷、6-氮杂-胞苷、假异胞苷、3-甲基-胞苷(m3C)、N4-乙酰基-胞苷(act)、5-甲酰基-胞苷(f5C)、N4-甲基-胞苷(m4C)、5-甲基-胞苷(m5C)、5-卤代-胞苷(例如5-碘-胞苷)、5-羟基甲基-胞苷(hm5C)、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷(s2C)、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮杂-假异胞苷、1-甲基-1-脱氮杂-假异胞苷、泽布拉恩(zebularine)、5-氮杂-泽布拉恩、5-甲基-泽布拉恩、5-氮杂-2-硫代-泽布拉恩、2-硫代-泽布拉恩、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷、4-甲氧基-1-甲基-假异胞苷、赖胞苷(k2C)、a-硫代-胞苷、2'-0-甲基-胞苷(Cm)、5,2'-0-二甲基-胞苷(m5Cm)、N4-乙酰基-2'-0-甲基-胞苷(ac4Cm)、N4,2'-0-二甲基-胞苷(m4Cm)、5-甲酰基-2'-0-甲基-胞苷(f5Cm)、N4,N4,2'-0-三甲基-胞苷(m4 2Cm)、1-硫代-胞苷、2'-F-阿糖-胞苷、2'-F-胞苷、以及2'-OH-阿糖-胞苷。
腺嘌呤
在一些实施例中,经修饰的核碱基是经修饰的腺嘌呤。具有经修饰的腺嘌呤的示例性核碱基和核苷包括但不限于2-氨基-嘌呤、2,6-二氨基嘌呤、2-氨基-6-卤代-嘌呤(例如2-氨基-6-氯-嘌呤)、6-卤代-嘌呤(例如6-氯-嘌呤)、2-氨基-6-甲基-嘌呤、8-叠氮基-腺苷、7-脱氮杂-腺嘌呤、7-脱氮杂-8-氮杂-腺嘌呤、7-脱氮杂-2-氨基-嘌呤、7-脱氮杂-8-氮杂-2-氨基-嘌呤、7-脱氮杂-2,6-二氨基嘌呤、7-脱氮杂-8-氮杂-2,6-二氨基嘌呤、1-甲基-腺苷(m'A)、2-甲基-腺嘌呤(m A)、N6-甲基-腺苷(m6A)、2-甲硫基-N6-甲基-腺苷(ms2m6A)、N6-异戊烯基-腺苷(i6A)、2-甲硫基-N6-异戊烯基-腺苷(ms2i6A)、N6-(顺-羟基异戊烯基)腺苷(io6A)、2-甲硫基-N6-(顺-羟基异戊烯基)腺苷(ms2io6A)、N6-甘氨酰基氨甲酰基-腺苷(g6A)、N6-苏氨酰基氨甲酰基-腺苷(t6A)、N6-甲基-N6-苏氨酰基氨甲酰基-腺苷(m6t6A)、2-甲硫基-N6-苏氨酰基氨甲酰基-腺苷(ms2g6A)、N6,N6-二甲基-腺苷(m6 2A)、N6-羟基正缬氨酰基氨甲酰基-腺苷(hn6A)、2-甲硫基-N6-羟基正缬氨酰基氨甲酰基-腺苷(ms2hn6A)、N6-乙酰基-腺苷(ac6A)、7-甲基-腺嘌呤、2-甲硫基-腺嘌呤、2-甲氧基-腺嘌呤、a-硫代-腺苷、2'-0-甲基-腺苷(Am)、N6,2'-0-二甲基-腺苷(m5Am)、N6-甲基-2'-脱氧腺苷、N6,N6,2'-0-三甲基-腺苷(m6 2Am)、1,2'-0-二甲基-腺苷(m'Am)、2'-0-核糖基腺苷(磷酸)(Ar(p))、2-氨基-N6-甲基-嘌呤、1-硫代-腺苷、8-叠氮基-腺苷、2'-F-阿糖-腺苷、2'-F-腺苷、2'-OH-阿糖-腺苷、以及N6-(19-氨基-五氧杂十九烷基)-腺苷。
鸟嘌呤
在一些实施例中,经修饰的核碱基是经修饰的鸟嘌呤。具有经修饰的鸟嘌呤的示例性核碱基和核苷包括但不限于肌苷(I)、1-甲基-肌苷(m'l)、怀俄苷(imG)、甲基怀俄苷(mimG)、4-脱甲基-怀俄苷(imG-14)、异怀俄苷(imG2)、怀丁苷(yW)、过氧怀丁苷(o2yW)、羟基怀丁苷(OHyW)、修饰不足的羟基怀丁苷(OHyW*)、7-脱氮杂-鸟苷、辫苷(Q)、环氧辫苷(oQ)、半乳糖基-辫苷(galQ)、甘露糖基-辫苷(manQ)、7-氰基-7-脱氮杂-鸟苷(preQ0)、7-氨基甲基-7-脱氮杂-鸟苷(preQi)、古嘌苷(G+)、7-脱氮杂-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮杂-鸟苷、6-硫代-7-脱氮杂-8-氮杂-鸟苷、7-甲基-鸟苷(m7G)、6-硫代-7-甲基-鸟苷、7-甲基-肌苷、6-甲氧基-鸟苷、1-甲基-鸟苷(m'G)、N2-甲基-鸟苷(m2G)、N2,N2-二甲基-鸟苷(m2 2G)、N2,7-二甲基-鸟苷(m2,7G)、N2,N2,7-二甲基-鸟苷(m2,2,7G)、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲硫基-鸟苷、N2-甲基-6-硫代-鸟苷、N2,N2-二甲基-6-硫代-鸟苷、a-硫代-鸟苷、2'-0-甲基-鸟苷(Gm)、N2-甲基-2'-0-甲基-鸟苷(m3/4m)、N2,N2-二甲基-2'-0-甲基-鸟苷(m2 2Gm)、1-甲基-2'-0-甲基-鸟苷(m'Gm)、N2,7-二甲基-2'-0-甲基-鸟苷(m2,7Gm)、2'-0-甲基-肌苷(Im)、l,2'-0-二甲基-肌苷(m'lm)、06-苯基-2'-脱氧肌苷、2'-0-核糖基鸟苷(磷酸)(Gr(p))、1-硫代-鸟苷、06-甲基-鸟苷、06-甲基-2'-脱氧鸟苷、2'-F-阿糖-鸟苷、以及2'-F-鸟苷。
经修饰的gRNA
在一些实施例中,经修饰的核酸可以是经修饰的gRNA。在一些实施例中,gRNA可以在3'端被修饰。在该实施例中,gRNA可以在3'末端U核糖处被修饰。例如,U核糖的两个末端羟基基团可以被氧化成醛基并伴随核糖环的打开以提供经修饰的核苷,其中U可以是未经修饰的或经修饰的尿苷。
在另一个实施例中,3'末端U可以用2'3'环磷酸酯修饰,其中U可以是未经修饰的或经修饰的尿苷。在一些实施例中,gRNA分子可以含有3'核苷酸,其可以被稳定化以对抗降解,例如通过掺入一个或多个本文所述的经修饰的核苷酸。在该实施例中,例如,尿苷可以被经修饰的尿苷(例如5-(2-氨基)丙基尿苷和5-溴尿苷)或被本文所述的任何经修饰的尿苷替代;腺苷和鸟嘌呤可以被经修饰的腺苷和鸟苷(例如在8位处有修饰的,例如8-溴鸟苷)或被本文所述的任何经修饰的腺苷或鸟苷替代。在一些实施例中,脱氮核苷酸(例如7-脱氮腺苷)可以掺入gRNA中。在一些实施例中,O-和N-烷基化的核苷酸(例如N6-甲基腺苷)可以掺入gRNA中。在一些实施例中,可以掺入糖修饰的核糖核苷酸,例如,其中2'OH-基团被选自以下的基团替代:H、-OR、-R(其中R可以是例如甲基、烷基、环烷基、芳基、芳烷基、杂芳基或糖)、卤素、-SH、-SR(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氨基(其中氨基可以是例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸);或氰基(-CN)。在一些实施例中,磷酸主链可以如本文所述的修饰,例如用硫代磷酸酯基团。在一些实施例中,gRNA的突出端区中的核苷酸可以各自独立地是经修饰或未经修饰的核苷酸,包括但不限于2'-糖修饰的(如2-F 2'-O-甲基)胸苷(T)、2'-O-甲氧基乙基-5-甲基尿苷(Teo)、2'-O-甲氧基乙基腺苷(Aeo)、2'-O-甲氧基乙基-5-甲基胞苷(m5Ceo)及其任何组合。
在一个实施例中,RNA分子(例如gRNA分子)的单链突出端中的一个或多个或所有核苷酸是脱氧核苷酸。
XIV.药物组合物
本发明的药物组合物可以包含本文所述的gRNA分子(例如如本文所述的多种gRNA分子)或包含用本文所述的一种或多种gRNA分子修饰的一种或多种细胞的细胞(例如细胞群,例如造血干细胞(例如CD34+细胞)群),与一种或多种药学上或生理学上可接受的载体、稀释剂或赋形剂的组合。此类组合物可以包含缓冲液,如中性缓冲盐水、磷酸盐缓冲盐水等;碳水化合物,如葡萄糖、甘露糖、蔗糖或葡聚糖、甘露醇;蛋白质;多肽或氨基酸如甘氨酸;抗氧化剂;螯合剂,如EDTA或谷胱甘肽;佐剂(例如氢氧化铝);以及防腐剂。在一个方面,本发明的组合物被配制用于静脉内施用。
本发明的药物组合物能以适合于待治疗(或预防)的疾病的方式施用。施用的总量和频率将由如患者的状况以及患者的疾病的类型和严重程度等因素来确定,然而适当的剂量可以通过临床试验来确定。
在一个实施例中,药物组合物基本上不含(例如没有可检测水平的)污染物,例如选自由以下组成的组:内毒素、支原体、小鼠抗体、合并的人血清、牛血清白蛋白、牛血清、培养基成分、不需要的CRISPR系统成分、细菌和真菌。在一个实施例中,细菌是选自下组的至少一种,该组由以下组成:粪产碱菌(Alcaligenes faecalis)、白色念珠菌(Candidaalbicans)、大肠杆菌、流感嗜血杆菌(Haemophilus influenza)、脑膜炎奈瑟氏菌(Neisseria meningitides)、铜绿假单胞菌(Pseudomonas aeruginosa)、金黄色葡萄球菌(Staphylococcus aureus)、肺炎链球菌(Streptococcus pneumonia)、和酿脓链球菌A群(Streptococcus pyogenes group A)。
能以任何常规方式施用主题组合物,包括通过雾化吸入、注射、摄取、输血、植入或移植。可以向患者经动脉、皮下、真皮内、瘤内、结内、髓内、肌内、通过静脉内(i.v.)注射、或者腹膜内施用本文所述的组合物。在一方面,通过真皮内或皮下注射向患者施用本发明的组合物。在一方面,通过静脉内注射来施用本发明的细胞组合物。
有待向患者施用的以上治疗的剂量将随着所治疗病症的确切性质和该治疗的受者而变化。可以根据本领域接受的做法来进行人类施用的剂量的缩放。
XV.细胞
本发明还涉及包含本发明的gRNA分子或编码所述gRNA分子的核酸的细胞。
在一方面,细胞是通过本文所述的方法制备的细胞。
在实施例中,细胞是造血干细胞(例如造血干细胞和祖细胞;HSPC),例如CD34+干细胞。在实施例中,细胞是CD34+/CD90+干细胞。在实施例中,细胞是CD34+/CD90-干细胞。在实施例中,细胞是人造血干细胞。在实施例中,细胞是自体的。在实施例中,细胞是同种异体的。
在实施例中,细胞衍生自骨髓,例如自体骨髓。在实施例中,细胞衍生自外周血,例如动员的外周血,例如自体动员的外周血。在使用动员的外周血的实施例中,细胞分离自已施用动员剂的患者。在实施例中,动员剂是G-CSF。在实施例中,动员剂是
Figure BDA0003693276070001831
(AMD3100)。在实施例中,动员剂包含G-CSF和
Figure BDA0003693276070001832
(AMD3100)的组合。在实施例中,细胞衍生自脐带血,例如同种异体脐带血。在实施例中,细胞衍生自血红蛋白病患者,例如患有镰状细胞疾病的患者或患有地中海贫血例如β-地中海贫血的患者。
在实施例中,细胞是哺乳动物细胞。在实施例中,细胞是人细胞。在实施例中,细胞衍生自血红蛋白病患者,例如患有镰状细胞疾病的患者或患有地中海贫血例如β-地中海贫血的患者。
在一方面,本发明提供了如下细胞,该细胞在与例如如本文所述的一种或多种gRNA分子(例如作为如本文所述的CRISPR系统的部分引入所述细胞中)具有互补性的核酸序列处或附近(例如,在其20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸内)包含修饰或改变,例如插入/缺失。在实施例中,细胞是CD34+细胞。在实施例中,经改变或经修饰的细胞(例如CD34+细胞)保持分化成多个谱系的细胞的能力,例如保持分化成红系细胞谱系细胞的能力。在实施例中,经改变或经修饰的细胞(例如CD34+细胞)在培养中(例如,在包含干细胞扩增剂(例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇)的培养中)已经历或能够经历至少2次、至少3次、至少4次、至少5次、至少6次、至少7次、至少8次、至少9次或至少10次或更多次倍增。在实施例中,经改变或经修饰的细胞(例如CD34+细胞)在培养中(例如,在包含例如如本文所述的干细胞扩增剂分子(例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇)的培养中)已经历或能够经历至少5次(例如约5次)倍增。在实施例中,经改变或经修饰的细胞(例如CD34+细胞)表现出和/或能够分化成如下细胞,例如分化成红系细胞谱系细胞,例如分化成红细胞,该细胞相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平),例如胎儿血红蛋白蛋白质水平增加至少20%。在实施例中,经改变或经修饰的细胞(例如CD34+细胞)表现出和/或能够分化成如下细胞,例如分化成红系细胞谱系细胞,例如分化成红细胞,该细胞相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平),例如产生至少6皮克,例如至少7皮克、至少8皮克、至少9皮克、或至少10皮克的胎儿血红蛋白。在实施例中,经改变或经修饰的细胞(例如CD34+细胞)表现出和/或能够分化成如下细胞,例如分化成红系细胞谱系细胞,例如分化成红细胞,该细胞相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平),例如产生约6皮克至约12皮克、约6皮克至约7皮克、约7皮克至约8皮克、约8皮克至约9皮克、约9皮克至约10皮克、约10皮克至约11皮克或约11皮克至约12皮克的胎儿血红蛋白。
在一方面,本发明提供了包含如下细胞的细胞群,这些细胞在与例如如本文所述的一种或多种gRNA分子(例如作为如本文所述的CRISPR系统的部分引入所述细胞中)具有互补性的核酸序列处或附近(例如,在其20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸内)具有修饰或改变,例如插入/缺失。在实施例中,该群的至少50%(例如至少60%、至少70%、至少80%或至少90%)的细胞具有修饰或改变(例如具有至少一种修饰或改变),例如在引入本发明的gRNA和/或CRISPR系统后第2天,例如如通过NGS(例如如本文所述)所测量的。在实施例中,该群的至少90%(例如至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%)的细胞具有修饰或改变(例如具有至少一种修饰或改变),例如在引入本发明的gRNA和/或CRISPR系统后第2天,例如如通过NGS(例如如本文所述)所测量的。在实施例中,该细胞群包含CD34+细胞,例如包含至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%或至少约98%的CD34+细胞。在实施例中,包含经改变或经修饰的细胞(例如CD34+细胞)的细胞群保持产生(例如分化成)多个谱系的细胞的能力,例如保持产生(例如分化成)红系细胞谱系细胞的能力。在实施例中,该细胞群(例如CD34+细胞群)在培养中(例如,在包含干细胞扩增剂(例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇)的培养中)已经历或能够经历至少2次、至少3次、至少4次、至少5次、至少6次、至少7次、至少8次、至少9次或至少10次或更多次群倍增。在实施例中,经改变或经修饰的细胞群(例如CD34+细胞群)在培养中(例如,在包含例如如本文所述的干细胞扩增剂分子(例如(S)-2-(6-(2-(lH-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇)的培养中)已经历或能够经历至少5次(例如约5次)群倍增。在实施例中,包含经改变或经修饰的细胞(例如CD34+细胞)的细胞群表现出和/或能够分化成如下细胞群,例如分化成红系细胞谱系的细胞群,例如分化成红细胞群,该细胞群相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平),例如胎儿血红蛋白蛋白质水平增加至少20%。在实施例中,包含经改变或经修饰的细胞(例如CD34+细胞)的细胞群表现出和/或能够分化成如下细胞群,例如分化成红系细胞谱系的细胞群,例如分化成红细胞群,该细胞群相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平),例如包含产生每个细胞至少6皮克,例如至少7皮克、至少8皮克、至少9皮克、或至少10皮克胎儿血红蛋白的细胞。在实施例中,经改变或经修饰的细胞(例如CD34+细胞)群表现出和/或能够分化成如下细胞群,例如分化成红系细胞谱系的细胞群,例如分化成红细胞群,该细胞群相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平),例如包含产生每个细胞约6皮克至约12皮克、约6皮克至约7皮克、约7皮克至约8皮克、约8皮克至约9皮克、约9皮克至约10皮克、约10皮克至约11皮克或约11皮克至约12皮克胎儿血红蛋白的细胞。
在实施例中,例如如本文所述的细胞群包含至少约1e3个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e4个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e5个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e6个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e7个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e8个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e9个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e10个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e11个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e12个细胞。在实施例中,例如如本文所述的细胞群包含至少约1e13个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约1e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约2e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约3e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约4e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约5e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约6e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约7e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约8e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约9e6个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约1e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约2e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约3e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约4e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约5e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约6e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约7e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约8e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约9e7个细胞/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约1e8个细胞/千克待施用这些细胞的患者的体重。在任何上述实施例中,该细胞群可以包含至少约50%(例如至少约60%、至少约70%、至少约80%、至少约90%、至少约95%或至少约99%)的HSPC,例如CD34+细胞。在任何上述实施例中,该细胞群可以包含约60%的HSPC,例如CD34+细胞。在一个实施例中,例如如本文所述的细胞群包含约3e7个细胞并且包含约2e7个HSPC,例如CD34+细胞。如本申请中所使用的,科学记数法[数字]e[数字]具有其普通含义。因此,例如,2e6相当于2×106或2,000,000。
在实施例中,例如如本文所述的细胞群包含至少约1e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约1.5e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约2e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约3e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约4e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约5e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约6e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约7e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约8e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约9e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约1e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约2e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约3e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约4e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约5e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约6e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约7e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约8e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约9e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约1e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约2e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约3e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约4e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含至少约5e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。
在实施例中,例如如本文所述的细胞群包含约1e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约1.5e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约2e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约3e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约4e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约5e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约6e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约7e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约8e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约9e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约1e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约2e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约3e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约4e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约5e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约6e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约7e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约8e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约9e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约1e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约2e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约3e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约4e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含约5e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。
在实施例中,例如如本文所述的细胞群包含约2e6至约10e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中,例如如本文所述的细胞群包含2e6至10e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。
本发明的细胞可以包含本发明的gRNA分子或编码所述gRNA分子的核酸、以及本发明的Cas9分子或编码所述Cas9分子的核酸。在一个实施例中,本发明的细胞可以包含核糖核蛋白(RNP)复合物,该复合物包含本发明的gRNA分子和本发明的Cas9分子。
优选修饰本发明的细胞以离体包含本发明的gRNA分子,例如通过本文所述的方法,例如通过电穿孔或通过TRIAMF(如专利申请PCT/US2017/54110中所述,通过引用以其全文并入)。
本发明的细胞包括如下细胞,在这些细胞中通过引入包含本发明的gRNA的CRISPR系统而改变(例如减少或抑制)一种或多种基因的表达。例如,相对于未经修饰的细胞,本发明的细胞可具有降低水平的β珠蛋白(例如,包含镰状突变的血红蛋白β)表达。作为另一个实例,相对于未经修饰的细胞,本发明的细胞可以具有增加的胎儿血红蛋白表达水平。可替代地,或另外,本发明的细胞可以产生(例如分化成)另一类型的细胞(例如红细胞),其相对于从未经修饰的细胞分化的细胞具有增加的胎儿血红蛋白表达水平。在实施例中,胎儿血红蛋白水平的增加为至少约20%、至少约30%、至少约40%或至少约50%。可替代地,或另外,本发明的细胞可以产生(例如分化成)另一类型的细胞(例如红细胞),其相对于从未经修饰的细胞分化的细胞具有降低的β珠蛋白(例如,包含镰状突变的血红蛋白β,在本文中也称为镰状β珠蛋白)表达水平。在实施例中,镰状β球蛋白水平的降低为至少约20%、至少约30%、至少约40%或至少约50%。
本发明的细胞包括如下细胞,在这些细胞中通过引入包含本发明的gRNA的CRISPR系统而改变(例如减少或抑制)一种或多种基因的表达。例如,相对于未经修饰的细胞,本发明的细胞可以具有降低的血红蛋白β(例如突变型或野生型血红蛋白β)表达水平。在另一方面,本发明提供了由引入了包含本发明的gRNA的CRISPR系统的细胞衍生(例如由其分化)的细胞。在这些方面,其中引入了包含本发明的gRNA的CRISPR系统的细胞可能不会表现出降低的血红蛋白β(例如突变型或野生型血红蛋白β)水平,但是由其衍生(例如由其分化)的细胞表现出降低的血红蛋白β(例如突变型或野生型血红蛋白β)水平。在实施例中,衍生(例如,分化)在体内完成(例如,在患者中,例如在血红蛋白病患者中,例如在患有镰状细胞疾病或地中海贫血例如β地中海贫血的患者)。在实施例中,其中引入了包含本发明的gRNA的CRISPR系统的细胞是CD34+细胞,并且由其衍生(例如分化)的细胞属于红系细胞谱系,例如红细胞。
本发明的细胞包括如下细胞,在这些细胞中通过引入包含本发明的gRNA的CRISPR系统而改变(例如增加或促进)一种或多种基因的表达。例如,相对于未经修饰的细胞,本发明的细胞可以具有增加的胎儿血红蛋白表达水平。在另一方面,本发明提供了由引入了包含本发明的gRNA的CRISPR系统的细胞衍生(例如由其分化)的细胞。在这些方面,其中引入了包含本发明的gRNA的CRISPR系统的细胞可能不会表现出增加的胎儿血红蛋白水平,但是由其衍生(例如由其分化)的细胞表现出增加的胎儿血红蛋白水平。在实施例中,衍生(例如,分化)在体内完成(例如,在患者中,例如在血红蛋白病患者中,例如在患有镰状细胞疾病或地中海贫血例如β地中海贫血的患者)。在实施例中,其中引入了包含本发明的gRNA的CRISPR系统的细胞是CD34+细胞,并且由其衍生(例如分化)的细胞属于红系细胞谱系,例如红细胞。
在另一方面,本发明提供了如下细胞,这些细胞在与引入所述细胞中的一种或多种gRNA分子(例如,gRNA分子的靶序列)具有互补性的核酸序列处(例如内)或其附近(例如,在其20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸内)包含插入/缺失。在实施例中,插入/缺失是移码插入/缺失。在实施例中,细胞包括大缺失,例如1kb、2kb、3kb、4kb、5kb、6kb或更多的缺失。在实施例中,大缺失包含布置在引入所述细胞的一种或多种gRNA分子的两个结合位点之间的核酸。
在一方面,本发明涉及细胞群(例如,如本文所述),例如HSPC群,其包含细胞,这些细胞在与例如如本文所述的一种或多种gRNA分子(例如被引入如本文所述的所述细胞中)具有互补性的核酸序列处或附近(例如,在其20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸内)包括插入/缺失。在实施例中,插入/缺失是移码插入/缺失。在实施例中,细胞群包括包含大缺失的细胞,例如1kb、2kb、3kb、4kb、5kb、6kb或更多的缺失。在实施例中,大缺失包含布置在引入所述细胞的一种或多种gRNA分子的两个结合位点之间的核酸。在实施例中,该群的20%-100%的细胞包括所述大缺失、一个或多个插入/缺失。在实施例中,该群的30%-100%的细胞包括所述大缺失、一个或多个插入/缺失。在实施例中,该群的40%-100%的细胞包括所述大缺失、一个或多个插入/缺失。在实施例中,该群的50%-100%的细胞包括所述大缺失、一个或多个插入/缺失。在实施例中,该群的60%-100%的细胞包括所述大缺失、一个或多个插入/缺失。在实施例中,该群的70%-100%的细胞包括所述大缺失、一个或多个插入/缺失。在实施例中,该群的80%-100%的细胞包括所述大缺失、一个或多个插入/缺失。在实施例中,该群的90%-100%的细胞包括所述大缺失、一个或多个插入/缺失。在实施例中,该细胞群例如在受试者例如人中保留分化成多种细胞类型的能力,例如保持分化成红类细胞谱系细胞(例如红细胞)的能力。在实施例中,经编辑的细胞(例如,HSPC细胞,例如CD34+细胞,例如CD34+细胞的任何亚群,例如,如本文所述)例如在细胞培养物中保持增殖的能力(和/或增殖),例如在细胞培养(例如,在本文所述的细胞培养基中,例如,包含一种或多种干细胞扩增剂例如化合物4的细胞培养基)1、2、3、4、5、6、7或更多天后(例如,在约1或约2天后)增殖至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少35倍、至少40倍、至少45倍、至少50倍或更多。在实施例中,经编辑且分化的细胞(例如红细胞)保持增殖的能力,例如,在例如如实例中所述的例如红系细胞分化培养基(EDM)中或在受试者(例如哺乳动物,例如人)中7天后增殖至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少35倍、至少40倍、至少45倍、至少50倍或更多倍,和/或在例如如实例中所述的红系细胞分化培养基(EDM)中21天后增殖至少30倍、至少35倍、至少40倍、至少45倍、至少50倍、至少55倍、至少60倍、至少65倍、至少70倍、至少75倍、至少80倍、至少85倍、至少90倍、至少95倍、至少100倍、至少110倍、至少120倍、至少130倍、至少140倍、至少150倍、至少200倍、至少300倍、至少400倍、至少500倍、至少600倍、至少700倍、至少800倍、至少900倍、至少1000倍、至少1100倍、至少1200倍、至少1300倍、至少1400倍、至少1500倍或更多倍。
在一个实施例中,本发明提供细胞例如CD34+细胞的群,其中该群的至少90%、例如至少95%、例如至少98%的细胞包含大缺失或一个或多个插入/缺失(例如如本文所述)。不受理论的束缚,据信将如本文所述的gRNA分子或CRISPR系统引入细胞群中会在所述群中产生插入/缺失和/或大缺失的模式,并且因此,包含插入/缺失和/或大缺失的群中的每个细胞可能不会表现出相同的插入/缺失和/或大缺失。在实施例中,插入/缺失和/或大缺失包含在与本文所述的gRNA分子的靶向结构域互补的位点处或附近的一个或多个核酸;其中所述细胞保持分化成红系细胞谱系细胞(例如红细胞)的能力;和/或其中相对于由类似的未经修饰的细胞群分化的细胞,从该细胞群分化的所述细胞具有增加的胎儿血红蛋白水平(例如,该群具有更高的%F细胞)。在实施例中,细胞群离体经历了至少2倍的扩增,例如,在包含一种或多种干细胞扩增剂(例如,包含(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)的培养基中。在实施例中,细胞群离体经历了至少5倍的扩增,例如,在包含一种或多种干细胞扩增剂(例如,包含(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)的培养基中。
在实施例中,插入/缺失小于约50个核苷酸,例如,小于约45个、小于约40个、小于约35个、小于约30个或小于约25个核苷酸。在实施例中,插入/缺失小于约25个核苷酸。在实施例中,插入/缺失小于约20个核苷酸。在实施例中,插入/缺失小于约15个核苷酸。在实施例中,插入/缺失小于约10个核苷酸。在实施例中,插入/缺失小于约9个核苷酸。在实施例中,插入/缺失小于约9个核苷酸。在实施例中,插入/缺失小于约7个核苷酸。在实施例中,插入/缺失小于约6个核苷酸。在实施例中,插入/缺失小于约5个核苷酸。在实施例中,插入/缺失小于约4个核苷酸。在实施例中,插入/缺失小于约3个核苷酸。在实施例中,插入/缺失小于约2个核苷酸。在任何上述实施例中,插入/缺失是至少1个核苷酸。在实施例中,插入/缺失是1个核苷酸。在实施例中,大缺失包含约1kb的DNA。在实施例中,大缺失包含约2kb的DNA。在实施例中,大缺失包含约3kb的DNA。在实施例中,大缺失包含约4kb的DNA。在实施例中,大缺失包含约5kb的DNA。在实施例中,大缺失包含约6kb的DNA。
在实施例中,细胞群(例如,如本文所述)包含插入/缺失和/或大缺失模式,其包含与包括本文所述的gRNA分子的CRISPR系统相关的最常检测到的插入/缺失中的任何1、2、3、4、5或6个。在实施例中,通过本文描述的方法例如通过NGS或qPCR检测插入/缺失和/或大缺失。
在一方面,细胞或细胞群(例如,如本文所述)在脱靶位点不包含插入/缺失或大缺失,例如,如通过本文描述的方法检测的。
在实施例中,后代,例如分化的后代,例如本文所述的细胞或细胞群(例如,衍生自镰状细胞疾病患者)的红系细胞(例如,红细胞)后代产生比未经修饰的细胞更低水平的镰状β珠蛋白和/或更高水平的γ珠蛋白。在实施例中,后代,例如分化的后代,例如本文所述的细胞或细胞群(例如,衍生自镰状细胞疾病患者)的红系细胞(例如,红细胞)后代产生比未经修饰的细胞更低水平的镰状β珠蛋白和更高水平的γ珠蛋白。在实施例中,镰状β珠蛋白以比未经修饰的细胞低至少约20%、至少约30%、至少约40%或至少约50%的水平产生。在实施例中,γ珠蛋白以比未经修饰的细胞高至少约20%、至少约30%、至少约40%、至少约50%、至少约60%或至少约70%的水平产生。
在一方面,本发明提供了例如如本文所述的经修饰的HSPC群或由所述HSPC分化的红系细胞(例如,离体或在患者中分化)群,其中至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%的细胞是F细胞。在实施例中,该细胞群比不具有引入所述细胞中的例如如本文所述的一种或多种gRNA分子的相似的细胞群含有更高百分比的F细胞(或能够分化成(例如在体内)含有更高百分比的F细胞的红细胞群)。在实施例中,该细胞群相对于不具有引入所述细胞中的例如如本文所述的一种或多种gRNA分子的相似的细胞群具有增加至少20%,例如增加至少21%、增加至少22%、增加至少23%、增加至少24%、增加至少25%、增加至少26%、增加至少27%、增加至少28%、或增加至少29%的F细胞(或能够分化成(例如在体内)具有增加至少20%,例如增加至少21%、增加至少22%、增加至少23%、增加至少24%、增加至少25%、增加至少26%、增加至少27%、增加至少28%、或增加至少29%的F细胞的红细胞群)。在实施例中,该细胞群相对于不具有引入所述细胞中的例如如本文所述的一种或多种gRNA分子的相似的细胞群具有增加至少30%,例如增加至少35%、增加至少40%、增加至少45%、增加至少50%、增加至少55%、增加至少60%、增加至少65%、增加至少70%、增加至少75%、增加至少80%、增加至少85%、增加至少90%、或增加至少95%的F细胞(或能够分化成(例如在体内)具有增加至少30%,例如增加至少35%、增加至少40%、增加至少45%、增加至少50%、增加至少55%、增加至少60%、增加至少65%、增加至少70%、增加至少75%、增加至少80%、增加至少85%、增加至少90%、或增加至少95%的F细胞的红细胞群)。在实施例中,该细胞群相对于不具有引入所述细胞中的例如如本文所述的一种或多种gRNA分子的相似的细胞群具有增加至少10%-90%、20%-80%、20%-70%、20%-60%、20%-50%、20%-40%、20%-30%、25%-80%、25%-70%、25%-60%、25%-50%、25%-40%、25%-35%、25%-30%、30%-80%、30%-70%、30%-60%、30%-50%、30%-40%、或30%-35%的F细胞(或能够分化成(例如在体内)具有增加至少10%-90%、20%-80%、20%-70%、20%-60%、20%-50%、20%-40%、20%-30%、25%-80%、25%-70%、25%-60%、25%-50%、25%-40%、25%-35%、25%-30%、30%-80%、30%-70%、30%-60%、30%-50%、30%-40%、或30%-35%的F细胞的红细胞群)。在实施例中,例如如通过本文所述方法产生的细胞群包含足够数量的细胞和/或增加足够的%F细胞以治疗有需要的患者的(当例如以治疗有效量引入所述患者中时)例如如本文所述的血红蛋白病,例如镰状细胞疾病和/或β地中海贫血。在实施例中,F细胞的增加是在例如如本文所述的红系细胞分化测定中所测量的。
在实施例中,包括在本文所述的任何实施例和方面中,本发明涉及例如如通过本文所述的任何gRNA、方法和/或CRISPR系统修饰的细胞(例如细胞群),该细胞包含每个细胞产生至少6皮克胎儿血红蛋白的F细胞。在实施例中,F细胞产生每个细胞至少7皮克的胎儿血红蛋白。在实施例中,F细胞产生每个细胞至少8皮克的胎儿血红蛋白。在实施例中,F细胞产生每个细胞至少9皮克的胎儿血红蛋白。在实施例中,F细胞产生每个细胞至少10皮克的胎儿血红蛋白。在实施例中,F细胞平均产生每个细胞6.0皮克与7.0皮克之间、7.0皮克与8.0皮克之间、8.0皮克与9.0皮克之间、9.0皮克与10.0皮克之间、10.0皮克与11.0皮克之间、或11.0皮克与12.0皮克之间的胎儿血红蛋白。
在实施例中,细胞或细胞群,例如如本文所述细胞或细胞群(例如,包含插入/缺失)(或其后代)可在其引入的受试者的细胞中检测到,例如,通过例如使用本文所述的方法检测插入/缺失保持可检测。在实施例中,细胞或细胞群(或其后代)在其引入的受试者中在将所述细胞或细胞群引入所述受试者后可被检测至少10周、至少14周、至少16周、至少18周、至少20周、至少30周、至少40周、至少50周或更长时间。
在实施例中,一个或多个插入/缺失在本文所述细胞或细胞群已被引入的受试者的细胞(例如,骨髓和/或外周血的细胞,例如CD34+细胞)中是可检测的,例如,通过本文所述的方法例如NGS保持可被检测。在实施例中,所述一个或多个插入/缺失在本文所述细胞或细胞群已被引入的受试者的细胞(例如骨髓和/或外周血的细胞,例如CD34+细胞)中在本文所述细胞或细胞群被引入所述受试者中之后可被检测到至少10周、至少14周、至少16周、至少18周、至少20周、至少30周、至少40周、至少50周或更长时间。在实施例中,所述一个或多个插入/缺失的检测水平不随时间降低,或降低小于5%、小于10%、小于15%、小于20%、小于30%、小于40%或小于50%(例如相对于移植前的插入/缺失检测水平或相对于移植后第2周或移植后第8周的检测水平),例如在移植后第20周测量时相对于移植前测量的或在移植后第2周或移植后第8周测量的检测水平(例如,包含该一个或多个插入/缺失的细胞的百分比)。
在实施例中,包括在任何上述实施例中,本发明的细胞和/或细胞群包含不含有编码Cas9分子的核酸的细胞,例如由其组成。
XVI.另外的WIZ抑制剂及其使用方法
如上所述,“WIZ抑制剂”是指导致WIZ基因或WIZ蛋白的表达可检测地降低或WIZ蛋白的活性水平降低的物质,这是与没有这种物质的那些水平相比。在一些实施例中,WIZ抑制剂是小分子化合物(例如,可以靶向WIZ进行降解的小分子化合物,也称为“WIZ降解剂”)。在一些实施例中,WIZ抑制剂是抗WIZ shRNA。在一些实施例中,WIZ抑制剂是抗WIZ siRNA。在一些实施例中,WIZ抑制剂是抗WIZ ASO。在一些实施例中,WIZ抑制剂是抗WIZ AMO。在一些实施例中,WIZ抑制剂是抗WIZ反义核酸。在一些实施例中,WIZ抑制剂是本文所述的组合物或细胞或细胞群(其包含本文所述的gRNA分子)。
本文还提供了可以降低WIZ基因表达或WIZ蛋白活性的组合物。此类组合物包括但不限于小分子化合物(例如,可以靶向WIZ蛋白进行降解的小分子化合物,例如通过E3泛素途径,也称为“WIZ降解剂”)、siRNA、shRNA、ASO、miRNA、AMO。示例性shRNA包括表7中列出的那些。
表7.
名称 序列 SEQ ID NO
shWIZ_#1 AGCCCACAATGCCACGGAAAT 3196
shWIZ_#2 GCAACATCTACACCCTCAAAT 3197
shWIZ_#4 TGACCGAGTGGTACGTCAATG 3198
shWIZ_#5 AGCGGCAGAACATCAACAAAT 3199
本文所述的发明的发明人的一个令人惊讶的发现是WIZ基因表达/蛋白活性与血红蛋白F(HbF)产生之间的联系。如实例和图中所示,敲低或敲除细胞中的WIZ基因显著增加了这些细胞中的HbF诱导。
本文还提供了治疗血红蛋白病和通过向患者施用细胞或细胞群或含有本文所述的此类细胞或细胞群的组合物或降低WIZ基因表达和/或WIZ蛋白活性的组合物的方法。在一些方面,降低WIZ基因表达和/或WIZ蛋白活性的组合物包含小分子化合物(例如,WIZ降解剂)、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。在一些方面,血红蛋白病是β-地中海贫血或镰状细胞疾病。
本文还提供了治疗血红蛋白病和通过向患者施用细胞或细胞群或含有本文所述的此类细胞或细胞群的组合物或降低WIZ基因表达和/或WIZ蛋白活性的组合物来增加哺乳动物中胎儿血红蛋白表达的方法。在一些方面,降低WIZ基因表达和/或WIZ蛋白活性的组合物包含小分子化合物(例如,WIZ降解剂)、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。
因此,本文还提供了通过向患者施用包含本文所述的WIZ抑制剂的组合物来治疗血红蛋白病的方法。在一些实施例中,WIZ抑制剂是可以靶向WIZ进行降解的小分子化合物。在一些实施例中,WIZ抑制剂是抗WIZ shRNA。在一些实施例中,WIZ抑制剂是抗WIZ siRNA。在一些实施例中,WIZ抑制剂是抗WIZ ASO。在一些实施例中,WIZ抑制剂是抗WIZ miRNA。在一些实施例中,WIZ抑制剂是抗WIZ AMO(抗miRNA寡核苷酸)。在一些实施例中,WIZ抑制剂是本文所述的组合物或细胞或细胞群(其包含本文所述的gRNA分子)。
本文还提供了通过向哺乳动物施用包含本文所述的WIZ抑制剂的组合物来增加哺乳动物中胎儿血红蛋白表达的方法。在一些实施例中,WIZ抑制剂是可以靶向WIZ进行降解的小分子化合物。在一些实施例中,WIZ抑制剂是抗WIZ shRNA。在一些实施例中,WIZ抑制剂是抗WIZ siRNA。在一些实施例中,WIZ抑制剂是抗WIZ ASO。在一些实施例中,WIZ抑制剂是本文所述的组合物或细胞或细胞群(其包含本文所述的gRNA分子)。
XVII-WIZ降解剂
如本文所用,“降解剂”意指例如本披露的化合物,所述化合物有效减少、或降低特异性蛋白(例如WIZ)的水平或降解特异性蛋白(例如WIZ)。可以通过将用本披露的化合物处理后剩余的特异性蛋白(例如WIZ)的量与用本披露的化合物处理前测量的存在的特异性蛋白(例如WIZ)的初始量或水平进行比较来测量降解的特异性蛋白(例如WIZ)的量。
如本文所用,“选择性降解剂”或“选择性化合物”意指例如本披露的化合物,所述化合物有效减少、或降低特异性蛋白(例如WIZ)的水平或降解特异性蛋白(例如WIZ)(比任何其他蛋白质更大程度)。例如,可以通过将化合物减少或降低特异性蛋白(例如WIZ)的水平或降解特异性蛋白的能力与该化合物减少或降低其他蛋白质水平或降解其他蛋白质的能力进行比较,鉴定“选择性降解剂”或“选择性化合物”。在一些实施例中,可以通过测量化合物的EC50或IC50鉴定选择性。降解可以通过介导E3连接酶(例如包含蛋白Cereblon的E3-连接酶复合物)来实现。
在一个实施例中,降解的特异性蛋白是WIZ蛋白。在一个实施例中,与初始水平相比,至少约30%的WIZ被降解。在一个实施例中,与初始水平相比,至少约40%的WIZ被降解。在一个实施例中,与初始水平相比,至少约50%的WIZ被降解。在一个实施例中,与初始水平相比,至少约60%的WIZ被降解。在一个实施例中,与初始水平相比,至少约70%的WIZ被降解。在一个实施例中,与初始水平相比,至少约75%的WIZ被降解。在一个实施例中,与初始水平相比,至少约80%的WIZ被降解。在一个实施例中,与初始水平相比,至少约85%的WIZ被降解。在一个实施例中,与初始水平相比,至少约90%的WIZ被降解。在一个实施例中,与初始水平相比,至少约95%的WIZ被降解。在一个实施例中,与初始水平相比,超过95%的WIZ被降解。在一个实施例中,与初始水平相比,至少约99%的WIZ被降解。
在实施例中,与初始水平相比,从约30%至约99%的量的WIZ蛋白被降解。在实施例中,与初始水平相比,从约40%至约99%的量的WIZ蛋白被降解。在实施例中,与初始水平相比,从约50%至约99%的量的WIZ蛋白被降解。在实施例中,与初始水平相比,从约60%至约99%的量的WIZ蛋白被降解。在实施例中,与初始水平相比,从约70%至约99%的量的WIZ蛋白被降解。在实施例中,与初始水平相比,从约80%至约99%的量的WIZ蛋白被降解。在实施例中,与初始水平相比,从约90%至约99%的量的WIZ蛋白被降解。在实施例中,与初始水平相比,从约95%至约99%的量的WIZ蛋白被降解。在实施例中,与初始水平相比,从约90%至约95%的量的WIZ蛋白被降解。
如本文所用,术语“诱导胎儿血红蛋白”、“胎儿血红蛋白诱导”、或“增加胎儿血红蛋白表达”是指增加受试者血液中HbF的百分比。在一个实施例中,受试者血液中总HbF的量增加。在一个实施例中,受试者血液中总血红蛋白的量增加。在一个实施例中,与不存在本文披露的化合物的任一情况相比,HbF的量增加了至少约10%、或至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%、或至少约100%、或超过100%,例如至少约2倍、或至少约3倍、或至少约4倍、或至少约5倍、或至少约6倍、或至少约7倍、或至少约8倍、或至少约9倍、或至少约10倍、或超过10倍。
在一个实施例中,与不存在本文披露的化合物的任一情况相比,血液(例如受试者血液)中总血红蛋白增加了至少约10%、或至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%、或至少约100%、或超过100%,例如至少约2倍、或至少约3倍、或至少约4倍、或至少约5倍、或至少约6倍、或至少约7倍、或至少约8倍、或至少约9倍、或至少约10倍、或超过10倍。
在一个实施例中,WIZ降解剂是3-(5-甲氧基-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮化合物或其药学上可接受的盐或其组合物。在进一步的实施例中,WIZ降解剂是式(I)的化合物或其药学上可接受的盐水合物、溶剂化物、前药、立体异构体或互变异构体,或其组合物。
Figure BDA0003693276070002021
其中:
Y选自O、CH2、和CF2
z是从0至2的整数;
RX1和RX2各自独立地选自氢和C1-C6烷基;
RY1和RY2各自独立地选自氢和C1-C6烷基;
R1选自氢和C1-C6烷基;
R2选自氢、-C(=O)-R3、C3-C8环烷基、C1-C6卤代烷基、和C1-C10烷基,其中所述烷基被独立地选自以下的0-1个取代基取代:C6-C10芳基,包含独立地选自N、O和S的1-4个杂原子的5元至10元杂芳基,包含独立地选自N、O和S的1-2个杂原子的4元至6元杂环基,和C3-C8环烷基,
其中所述芳基、杂芳基、杂环基和环烷基各自独立地被0-5个R4取代;
R3选自-CH=CR3aR3b,C6-C10芳基,包含独立地选自N、O和S的1-4个杂原子的5元至10元杂芳基,包含独立地选自N、O和S的1-2个杂原子的4元至6元杂环基,C3-C8环烷基,和C1-C6烷基,其中所述烷基被0-3个R3c取代,并且
其中所述芳基、杂芳基、杂环基和环烷基各自独立地被0-5个R4取代;
R3a和R3b连同它们所附接的碳原子一起形成C3-C8环烷基环;
每个R3c在每次出现时独立地选自-C(=O)-R3d,NR3eR3f,C1-C6烷氧基,-O-R3d,羟基,-O-C6-C10芳基,C1-C6芳基C6-C10烷基-O-,包含独立地选自N、O和S的1-4个杂原子的5元至10元杂芳基、C6-C10芳基,包含独立地选自N、O和S的1-4个杂原子的5元至10元杂芳基,包含独立地选自N、O和S的1-2个杂原子的4元至6元杂环基,和C3-C8环烷基,
其中所述-O-芳基、芳基烷基-O-、和-O-杂芳基各自独立地被0-3个R4a取代,并且
其中所述芳基、杂芳基、杂环基和环烷基各自独立地被0-5个R4取代;
R3d是包含独立地选自N、O和S的1-2个杂原子的4元至6元杂环基;
R3e和R3f各自独立地选自氢和C1-C6烷基;
每个R4在每次出现时独立地选自C6-C10芳基,-O-C6-C10芳基,C1-C6芳基C6-C10烷基-O-,包含独立地选自N、O和S的1-4个杂原子的5元至10元杂芳基、包含独立地选自N、O和S的1-4个杂原子的5元至10元杂芳基,包含独立地选自N、O和S的1-2个杂原子的4元至6元杂环基,C1-C10烷基,C1-C6烷氧基,C1-C6卤代烷基,-SO2R4c,卤素,羟基,-CN,-O-包含独立地选自N、O和S的1-2个杂原子的4元至6元杂环基,氧代,C1-C6卤代烷氧基,-C(=O)-O-(R5),-C(=O)-(R5),-C(=O)-NR6aR6b,NR6aR6b,-NH-C(=O)-O-(C1-C6烷基),和C3-C8环烷基,其中所述芳基、-O-芳基、芳基烷基-O-、-O-杂芳基、杂芳基和杂环基各自独立地被0-3个R4a取代,
其中所述烷基和烷氧基各自独立地被0-1个R4b取代,并且
其中所述环烷基被各自独立地选自以下的0-3个取代基取代:-CN、C1-C6烷基、C1-C6烷氧基、和羟基;
R4a在每次出现时独立地选自-CN,C1-C6烷氧基,C1-C6卤代烷基,卤素,羟基,-C(=O)-O-(R5),包含独立地选自N、O和S的1-4个杂原子的5元至10元杂芳基,二(C1-C6烷基)氨基C1-C6烷基,和C1-C6烷基,其中所述烷基被0-1个R4b取代,并且其中所述杂芳基被0-3个R4a-1取代;
R4a-1在每次出现时独立地选自C1-C6烷基、二(C1-C6烷基)氨基C1-C6烷基、-CN、C1-C6烷氧基、和C1-C6卤代烷基;
R4b在每次出现时独立地选自-CN,-C(=O)NR6aR6b,NR6aR6b,包含独立地选自N、O和S的1-4个杂原子的5元至10元杂芳基,-C(=O)-OH,C1-C6烷氧基,包含独立地选自N、O和S的1个或2个杂原子的4元至6元杂环基,C3-C8环烷基,C2-C4炔基,和C6-C10芳基,其中所述芳基被各自独立地选自以下的0-1个取代基取代:-CN、C1-C6卤代烷基、和C1-C6烷基;
R4c选自C6-C10芳基、羟基、NH2、和卤素;
R5选自C1-C6烷基、C6-C10芳基、和C6-C10芳基C1-C6烷基;
R6a和R6b各自独立地选自氢和C1-C6烷基;
或R6a和R6b连同它们所附接的氮原子一起形成包含选自N、O和S的0-1个另外的杂原子的5元或6元杂环基,其中所述杂环基被0-2个R6c取代;
R6c在每次出现时独立地选自C6-C10芳基C1-C6烷基、-C(=O)-O-(C1-C6烷基)、-C(=O)-(C1-C6烷基)、氧代和C1-C6烷基,其中所述烷基被独立地选自以下的0-1个取代基取代:-CN和包含独立地选自N、O和S的1-2个杂原子的4元至6元杂环基。
制备方法
本披露内容的化合物能以有机合成领域技术人员熟知的许多方法制备。举例来说,本披露内容的化合物可以使用下文描述的方法、以及合成有机化学领域中已知的合成方法或本领域技术人员所理解的其变体来合成。
通常,式(I)的化合物可根据下文提供的方案制备。
通用方案1
Figure BDA0003693276070002051
以上反应方案的起始材料是可商购的,或可以根据本领域技术人员已知的方法或通过本文披露的方法来制备。通常,本披露内容的化合物按照上述反应方案1如下制备:
在步骤1中,在极性溶剂(例如乙腈(ACN))存在下,金属光氧化还原反应(例如铱(Ir)催化的INT-1与式INT-1A的醇配偶体的光氧化还原偶联)可以提供交叉偶联的醚产物INT-2。在酸性条件下除去保护基团(例如Boc)可以提供游离胺(I)-1(步骤2),然后可以将其在硼氢化物试剂(例如乙酸硼氢化钠)存在下、通过与适当的醛进行还原胺化(步骤3-i),或在胺碱和极性溶剂(例如二异丙基乙胺(DIPEA)和二甲基甲酰胺(DMF))存在下、通过与适当的甲磺酸烷基酯进行烷基化反应(步骤3-ii)而转化为(I)-2。当具有式(I)-2的化合物含有N保护的部分(例如N保护的哌嗪基团)时,这些化合物可以在酸性条件下通过脱保护(例如Boc)在步骤4中进一步转化为(I)-3,随后用适当的醛和硼氢化钠试剂进行还原胺化,或用适当的烷基化试剂进行烷基化反应,或用适当的活化剂和碱进行酰胺偶联,以提供具有式(I)-4的化合物。对于方案1,R2、R6a、R6b和R6c如本文所定义。
通用方案2
Figure BDA0003693276070002061
以上反应方案的起始材料是可商购的,或可以根据本领域技术人员已知的方法或通过本文披露的方法来制备。通常,本披露的化合物按照上述反应方案2如下制备:可以将具有式(I)-1的化合物在硼氢化物试剂(例如乙酸硼氢化钠)存在下、通过与适当的酮进行还原胺化(步骤3-i)而转化为(I)-5,或在碱(例如K2CO3)和极性溶剂(例如二甲基乙酰胺(DMA))存在下、通过与适当的烷基碘化物进行烷基化反应而转化为(I)-6。对于方案2,R2如本文所定义。
通用方案3
Figure BDA0003693276070002071
以上反应方案的起始材料是可商购的,或可以根据本领域技术人员已知的方法或通过本文披露的方法来制备。通常,本披露的化合物按照上述反应方案3如下制备:化合物(I)-1与适当的羧酸、活化剂(例如HATU)和碱(例如DIPEA或NMM)进行的酰胺偶联反应提供了酰胺产物(I)-7。对于方案3,R3如本文所定义。
通用方案4
Figure BDA0003693276070002081
以上反应方案的起始材料是可商购的,或可以根据本领域技术人员已知的方法或通过本文披露的方法来制备。通常,本披露的化合物按照上述反应方案4如下制备:
在步骤1中,在极性溶剂(例如乙腈(ACN))存在下,金属光氧化还原反应(例如铱(Ir)催化的(INT-3)与式(INT-1B)的醇配偶体的光氧化还原偶联)可以提供交叉偶联的醚产物(4)-I。在酸性条件下除去保护基团(例如Boc)可以提供游离胺(4)-II(步骤2),然后可以将其在硼氢化物试剂(例如乙酸硼氢化钠)存在下、通过与合适的醛进行还原胺化(步骤3-i)而转化为(4)-III。可替代地,如通用方案1和2所述,可以将(4)-II在胺碱和极性溶剂(例如二异丙基乙胺(DIPEA)和二甲基甲酰胺(DMF))存在下、通过与适当的甲磺酸烷基酯或烷基卤化物进行烷基化反应(步骤3-ii)而转化为4-(III)。可替代地,如通用方案1和3所述,可以将(4)-II在极性溶剂(例如DMF)中、通过与适当的羧酸、活化剂(例如HATU)和碱(例如DIPEA或NMM)进行酰胺偶联反应(步骤3-iii)而转化为4-(III)。用合适的试剂(例如SOCl2)氯化内酯(4)-III并开环得到(4)-IV。随后,通过在酸性条件下使用INT-IC进行酰胺化和亲核取代来闭环,产生了式(I)的最终产物。对于方案4,Y、z、Rx1、Rx2、Ry1、Ry2、R1和R2如本文所定义。
化合物的制备
应当理解,在以下描述中,仅当所描绘式的取代基和/或变量的组合产生稳定化合物时,此类组合才是被允许的。
本领域技术人员还应理解,在下文所述的方法中,中间体化合物的官能团可能需要通过合适的保护基团保护。此类官能团包括羟基、酚、氨基和羧酸。适用于羟基或酚的保护基团包括三烷基甲硅烷基或二芳基烷基甲硅烷基(例如,叔丁基二甲基甲硅烷基、叔丁基二苯基甲硅烷基或三甲基甲硅烷基)、四氢吡喃基、苄基、经取代的苄基、甲基等。适用于氨基、脒基和胍基的保护基团包括叔丁氧基羰基、苄氧基羰基等等。适用于羧酸的保护基团包括烷基酯、芳基酯或芳基烷基酯。
保护基团可以根据标准技术添加或去除,所述标准技术是本领域技术人员熟知的并且如本文所述。保护基团的用途详细地描述于J.F.W.McOmie,"Protective Groups inOrganic Chemistry[有机化学中的保护基团]",Plenum Press[Plenum出版社],伦敦和纽约1973;T.W.Greene和P.G.M.Wuts,"Greene's Protective Groups in OrganicSynthesis[格林有机合成中的保护基团]",第四版,Wiley[威利出版社],纽约2007;P.J.Kocienski,"Protecting Groups[保护基团]",第三版,Georg Thieme Verlag[格奥尔格蒂梅出版社],斯图加特和纽约2005;以及在"Methoden der organischen Chemie"(Methods of Organic Chemistry)[有机化学方法],Houben Weyl,第4版,第15卷/I,GeorgThieme Verlag[格奥尔格蒂梅出版社],斯图加特1974。
所述保护基团还可以是聚合物树脂,例如王氏(Wang)树脂或2-氯三苯甲基-氯树脂。
以下反应方案说明了制备本披露内容的化合物的方法。应当理解,本领域技术人员将能够通过类似的方法或通过本领域技术人员已知的方法来制造这些化合物。一般来讲,起始组分和试剂可以从以下来源获得,例如西格玛奥德里奇公司(Sigma Aldrich)、兰开斯特合成有限公司(Lancaster Synthesis,Inc.)、五月桥公司(Maybridge)、矩阵科学公司(Matrix Scientific)、TCI公司、美国氟化学公司(Fluorochem USA)、Strem公司、其他商业供应商,或可以根据本领域技术人员已知的来源合成,或根据本披露所述进行制备。
分析方法、材料和仪器
除非另有说明,否则使用如从商业供应商处收到的试剂和溶剂。除非另有说明,否则在Bruker Avance光谱仪或Varian Oxford 400MHz光谱仪上获得质子核磁共振(NMR)光谱。光谱以ppm(δ)给出,并且以赫兹报告偶联常数J。将四甲基硅烷(TMS)用作内标。相对于二甲基亚砜(δ2.50)、甲醇(δ3.31)、氯仿(δ7.26)或NMR光谱数据中所示的其他溶剂,以ppm报告化学位移。将少量干燥样品(2-5mg)溶于适当的氘代溶剂(1mL)中。化学名称使用得自CambridgeSoft的ChemBioDraw Ultra v12生成。
使用Waters系统(Acquity UPLC和Micromass ZQ质谱仪)或Agilent-1260Infinity(6120四极杆)收集质谱(ESI-MS);除非另有说明,否则报告的所有质量均为质子化的母离子的m/z。将样品溶解于合适的溶剂(如MeCN、DMSO、或MeOH)中,并且使用自动样品处理器将其直接注入柱中。在Waters Acquity UPLC系统上进行分析(柱:WatersAcquity UPLC BEH C18 1.7μm,2.1x 30mm;流速:1mL/min;55℃(柱温);溶剂A:水中的0.05%甲酸,溶剂B:MeOH中的0.04%甲酸;梯度:从0至0.10min,95%溶剂A;从0.10至0.50min,95%溶剂A至20%溶剂A;从0.50至0.60min,20%溶剂A至5%溶剂A;从0.6至0.8min,保持在5%溶剂A;从0.80至0.90min,5%溶剂A至95%溶剂A;以及从0.90至1.15min,保持在95%溶剂A)。
通过引用并入
本文提及的所有出版物、专利和专利申请以其全文通过引用特此并入,如同每个单独的出版物、专利或专利申请被明确且单独地表明通过引用并入。在冲突存在的情况下,将以本申请(包括本文的任何定义)为准。
等同物
本领域的技术人员仅使用常规实验就将认识到或能够确定本文所述的本发明这些具体实施例的许多等效形式。虽然已经参照具体方面披露了本发明,但是本领域其他技术人员可以在不偏离本发明的真实精神以及范围的情况下设想本发明的其他方面以及变化。所附权利要求旨在理解为包括所有这类方面以及等同变化。
实例
实例1-示例性一般方法
指导物选择和设计
使用人参考基因组和用户定义的目的基因组区(例如,基因、基因的外显子、非编码调节区等)经由计算机模拟进行初始指导物选择,用于鉴定目的区中的PAM。对于每个鉴定的PAM,进行分析并报告统计数值。基于例如如本文所述的用于确定效率和疗效的许多方法进一步选择和排序gRNA分子。该实例提供了可用于测定本文所述的本发明的CRISPR系统、gRNA和其他方面的程序的实验细节。在该实例中记录了对在特定实验中采用的这些一般程序的任何修改。
下一代测序(NGS)以及中靶切割效率和插入/缺失形成的分析
为了确定对基因组中的靶位置编辑(例如,切割)的效率,利用深度测序来鉴定由非同源末端连接引入的插入和缺失的存在。
总之,在靶位点周围设计PCR引物,并且在编辑的和未经编辑的样品中PCR扩增目的基因组区。将得到的扩增子转换成为依诺米那(Illumina)测序文库中并测序。将测序读数与人类基因组参考比对,并进行变体调用分析,这使我们能够确定目标靶区的序列变体及其频率。对数据进行各种质量过滤,排除已知变体或仅在未经编辑的样品中鉴定的变体。编辑百分比定义为在目的中靶位点上发生的所有插入或缺失事件的百分比(即,中靶位点上的插入和缺失读数相比于中靶位点上的读数总数(野生型和突变体读数))。
RNP生成
向Cas9蛋白中添加crRNA和tracrRNA导致活性Cas9核糖核蛋白复合物(RNP)的形成,其介导与crRNA指定的靶区的结合和靶基因组DNA的特异性切割。通过将tracrRNA和crRNA加载到Cas9中形成该复合物,其被认为引起Cas9的构象变化,从而允许其结合并切割dsDNA。
将crRNA和tracrRNA分别在95℃变性2分钟,并使其达到室温。将Cas9蛋白(10mg/ml)添加到5X CCE缓冲液(20mM HEPES、100mM KCl、5mM MgCl2、1mM DTT、5%甘油)中,然后向其中添加tracrRNA和各种crRNA(在分开的反应中),并在37℃孵育10分钟,从而形成活性RNP复合物。通过电穿孔和其他方法将复合物递送到广泛多种细胞中,包括HEK-293和CD34+造血细胞。
将RNP递送到CD34+HSC中
将Cas9 RNP递送到CD34+HSC中。
将CD34+HSC解冻并在添加有IL6、SCF、TPO、Flt3L和Pen/Strep的StemSpan SFEM(干细胞技术公司)培养基中培养(约500,000个细胞/ml)过夜。根据各个RNP递送反应,将大约90,000个细胞等分并沉淀。然后将细胞重悬于60ul P3核转染缓冲液(龙沙公司)中,随后向其中添加活性RNP。然后将HSC以一式三份(20uL/电穿孔)进行电穿孔(例如,使用龙沙核转染仪上的程序CA-137进行核转染)。电穿孔后立即将StemSpan SFEM培养基(含有IL12、SCF、TPO、Flt3L和Pen/Strep)添加到HSC中,将其培养至少24小时。然后收获HSC并进行T7E1、NGS和/或表面标志物表达分析。
HSC功能测定
可以使用已知技术例如流式细胞术或体外集落形成测定法来测定CD34+HSC的干细胞表型。举例来说,使用Methocult H4034最优试剂盒(干细胞技术公司),使用制造商的方案,通过体外集落形成测定法(CFC)来测定细胞。简言之,将<=100ul体积的500-2000个CD34+细胞添加到1ml-1.25ml methocult中。将混合物剧烈涡旋4-5秒以充分混合,然后使其在室温下静置至少5分钟。使用注射器,将1ml-1.25ml的MethoCult+细胞转移到6孔板的35mm皿或孔中。根据制造商的方案,在12-14天后评估集落数和形态。
体内异种移植
HSC在功能上由其自我更新和多谱系分化的能力来定义。此功能性只能在体内进行评估。用于确定人HSC功能的金标准是通过异种移植到NOD-SCIDγ小鼠(NSG)中,该小鼠通过一系列突变是严重免疫受损的,因此可以充当人细胞的受体。编辑后的HSC被移植到NSG小鼠中以验证诱导的编辑不影响HSC功能。如在这些实例中更全面地描述,使用周期性外周血分析来评估人类嵌合和谱系发展,并且使用20周后的二次移植来建立功能性HSC的存在。
实例2-WIZ的缺失诱导胎儿血红蛋白在mPB CD34+源性红系细胞中表达
材料与方法
细胞培养
将HEK293T细胞维持在含有丙酮酸钠、非必需氨基酸、10%FBS、1xL-谷氨酰胺(2mM)、1%pen/strep(100U/ml)、1x HEPES(25mM)的DMEM高葡萄糖完全培养基中。除非另有说明,否则所有用于培养HEK293T细胞的试剂均从InvitrogenTM获得。
在shRNA转导或靶向WIZ的靶向性核糖核蛋白(RNP)电穿孔之前,将动员的外周血(mPB)CD34+细胞(澳赛尔斯公司)维持在补充有各自50ng/mL的rhTPO、rhIL-6、rhFLT3L、rhSCF的StemSpanTM无血清扩增培养基(SFEM)(干细胞技术公司)中2-3天。所有细胞因子均从
Figure BDA0003693276070002141
公司获得。将细胞培养物保持在37℃和5%CO2湿润的组织培养箱中。
靶向WIZ的shRNA慢病毒克隆的产生
针对WIZ的各自的shRNA的5'-磷酸化有义和反义互补单链DNA寡核苷酸由集成DNA技术公司(Integrated DNA Technologies,Inc.,IDT)合成。将每个DNA寡核苷酸设计为分别在5’-末端和3'-末端带有PmeI/AscI限制性突出端,以便随后相容性连接到慢病毒载体骨架中。通过在98℃在加热块上加热5分钟、随后在工作台上冷却至室温来将等摩尔的互补寡核苷酸在NEB缓冲液2(New England
Figure BDA0003693276070002142
公司)中退火。使用T4 DNA连接酶试剂盒(新英格兰生物实验室),将退火的双链DNA寡核苷酸连接到用PmeI/AscI消化的pHAGE慢病毒主链中。根据制造商的方案,将连接反应转化为化学感受态的Stbl3细胞(InvitrogenTM)。使用mU6测序引物(5'-ctacattttacatgatagg-3')(SEQ ID NO:3206)验证阳性克隆,并将质粒通过阿尔塔生物技术公司(Alta Biotech LLC)纯化。
根据制造商的说明(InvitrogenTM),使用Lipofectamine 3000试剂以150mm组织培养皿形式,通过用表达pCMV-dR8.91和pCMV-VSV-G的包膜质粒共转染HEK293T细胞来生成相应shRNA构建体的慢病毒颗粒。共转染后48小时收获慢病毒上清液,通过0.45μm过滤器(密理博公司(Millipore))过滤,并使用带有Ultracel-100膜的Amicon Ultra 15(密理博公司)进行浓缩。连续稀释和感染HEK293T细胞后,使用eGFP表达作为转导标志物,通过流式细胞术确定每种慢病毒颗粒的感染单位。
mPB CD34+细胞的慢病毒shRNA转导和FACS分选
mPB CD34+转导在retronectin包被的非组织培养物处理的96孔平底板(康宁公司(Corning,Inc.))上进行。简而言之,将TC板用100μL的
Figure BDA0003693276070002151
(1μg/mL)(宝生物公司(TAKARABIO,Inc.))包被,密封并在4℃孵育过夜。然后去除
Figure BDA0003693276070002152
并将板与PBS中的BSA(牛血清白蛋白)(1%)在室温孵育30分钟。随后,将BSA(牛血清白蛋白)吸出并用100μL慢病毒浓缩液代替,并在室温以2000xg离心2小时。接下来,轻轻吸取残留的上清液,准备进行mPB CD34+细胞的转导。将一万个细胞接种于150μL补充有各自50ng/mL的rhTPO、rhIL-6、rhFLT3L和rhSCF的StemSpanTM无血清扩增培养基(SFEM)中,以开始转导。将细胞培养72小时,然后使用eGFP表达作为标志物评估转导效率。
在FACSAriaTM III(BD生物科学公司)上分选eGFP阳性细胞。简而言之,将转导的mPB CD34+细胞群洗涤,并用含1x Hank缓冲盐水溶液、EDTA(1mM)和FBS(2%)的FACS缓冲液重悬。分选的eGFP阳性细胞用于红系分化测定。
对WIZ进行靶向性CRISPR敲除
Alt-R CRISPR-Cas9 crRNA和tracrRNA(5’-AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU-3’;SEQ ID NO:3207)购自整合DNA技术公司(Integrated DNA Technologies,Inc.)。使用聚合酶链反应(PCR)机(伯乐公司),在Tris缓冲液(10mM,pH 7.5)中,通过在95℃加热5分钟,然后冷却到室温,使等量的tracrRNA与WIZ靶向型crRNA(表8)退火。随后,通过将退火的tracrRNA:crRNA与6ug Cas9在1x缓冲液(含有HEPES(100mM)、KCl(50mM)、MgCl2(2.5mM)、甘油(0.03%)、DTT(1mM)和Tris pH 7.5(2mM))中在37℃下混合5分钟来产生核糖核蛋白(RNP)复合物。
根据制造商的建议,在4D-NucleofectorTM(龙沙公司(Lonza))上进行RNP复合物的电穿孔。简而言之,将重悬于含有补充剂(龙沙公司)的原代细胞P3缓冲液中的50,000个mPBCD34+细胞与核比色皿中每孔5μL RNP复合物预混合,并在室温孵育5分钟。随后,使用CM-137程序使混合物进行电穿孔。RNP电穿孔后将细胞培养72小时,然后开始红系分化。
表8.
名称 序列(5'至3') 目标基因组区域 SEQ ID NO
rg_0111 ACGGAGGCTAAGCGTCGCAA 随机导向,非靶向 3108
WIZ_6 AACATCTTTCGGGCCGTAGG chr19:15427143-15427163 (+) 3201
WIZ_9 GACATCCGCTGCGAGTTCTG chr19:15427488-15427510 (-) 3107
WIZ_12 TGCAGCGTCCCGGGCAGAGC chr19:15425751-15425773 (-) 3203
WIZ_14 CAAGCCGTGCCTCATCAAGA chr19:15425571-15425593 (-) 3204
WIZ_15 CGGGCACACCTGCGGCAGTT chr19:15424942-15424964 (-) 3202
WIZ_18 AGTGGGTGCGGCACTTACAG chr19:15423169-15423191 (-) 3205
shRNA转导的或RNP电穿孔的mPB CD34+细胞的红系分化
通过在96孔组织培养板中每孔接种8,000个RNP电穿孔的或FACS分选的eGFP+mPBCD34+细胞来开始红系分化。基础分化培养基由IMDM(伊斯科夫改良的杜尔贝科培养基)、人AB血清(5%)、转铁蛋白(330μg/mL)、胰岛素(10μg/mL)和肝素(2IU/mL)组成。分化培养基补充有rhSCF(100ng/mL)、rhIL-3(10ng/mL)、rhEPO(2.5U/mL)和氢化可的松(1μM)。分化4天后,使细胞在新鲜培养基中分裂(1:4),以维持最佳生长密度。将细胞再培养3天,并用于评估胎儿血红蛋白(HbF)表达。
通过RNA-seq分析HbF基因表达
在mPB CD34+HSC中,使用WIZ_6和WIZ_18gRNA或非靶向加扰gRNA阴性对照对WIZ进行两次独立的靶向性CRISPR/Cas9敲除(KO)。然后将来自KO和阴性对照的细胞培养7天以进行红系分化并用于总RNA分离(Zymo研究公司(Zymo Research),目录号R1053)。在测序前使用Agilent RNA 6000Pico试剂盒(安捷伦公司(Agilent),目录号5067-1513)确定分离的RNA的量。
使用Illumina TruSeq Stranded mRNA样品制备方案制备RNA测序文库,并使用Illumina NovaSeq6000平台(依诺米那公司(Illumina))进行测序。样品被测序为具有2x76个碱基对的长度。对于每个样品,使用salmon版本0.8.2(Patro等人,2017;doi:10.1038/nmeth.4197)来将测序片段映射到由ENSEMBL数据库提供的人参考基因组hg38中的注释转录物。通过使用tximport(Soneson等人,2015;doi:10.12688/f1000research.7563.1)将转录物水平计数的计数相加来获得每个基因的表达水平。使用DESeq2来标准化文库大小和转录物长度差异,并测试用靶向WIZ的gRNA处理的样品与用加扰gRNA对照处理的样品之间的差异表达(Love等人,2014;doi:10.1186/s13059-014-0550-8)。使用ggplot2(Wickham H(2016).ggplot2:Elegant Graphics for Data Analysis[用于数据分析的精致图形].Springer-Verlag New York[纽约施普林格出版社].ISBN 978-3-319-24277-4;https://ggplot2.tidyverse.org)来可视化数据。
HbF细胞内染色
将十万个细胞等分到U型底96孔板中,并根据制造商的建议(英杰公司(Invitrogen)),在黑暗中用稀释的LIVE/DEAD可固定紫色活力染料染色20min。将细胞用FACS染色缓冲液洗涤,随后在黑暗中用抗CD71-BV711(BD生物科学公司)和抗CD235a-APC(BD生物科学公司)染色20min。在用三倍体积的1x PBS洗涤两轮后,在室温在黑暗中,将细胞用1X BD Cytofix/Cytoperm(BD生物科学公司)固定并透化30分钟。随后,将细胞用三倍体积的1x Perm/wash缓冲液(BD生物科学公司)洗涤两次。将抗HbF-FITC(赛默科技公司(ThermoScientific))在1x perm/wash缓冲液中稀释(1:25),添加到透化细胞中并在室温在黑暗中孵育30分钟。接下来,将细胞用三倍体积的1x perm/wash缓冲液洗涤两次,并使用LSR Fortessa(BD生物科学公司)通过流式细胞术进行分析。使用FlowJo软件分析数据。
结果
WIZ KO在红系分化时上调HBG1/2表达
使用两个独立的gRNA(WIZ_6和WIZ_18)对WIZ进行靶向KO显示出胎儿血红蛋白基因(HBG1/2)上调,如图1A所示。
WIZ敲低和KO上调HbF蛋白
为了验证WIZ是否为HbF表达的负调节物,采用了shRNA和CRISPR-Cas9介导的敲低和敲除功能遗传学方法。将mPB CD34+细胞用shRNA或CRISPR-Cas9试剂处理并使其红系分化7天,然后进行流式细胞术分析。靶向敲低WIZ转录物导致78%-91%的HbF+细胞,相比之下,阴性对照加扰的shRNA导致40%的HbF+细胞。误差条代表两个生物学重复的标准误差,每个生物学重复具有三个技术重复(图1B)。CRISPR/Cas9介导的WIZ的靶向缺失导致62%-88%的HbF+细胞,相比之下,随机导向的crRNA导致39%的HbF+细胞。误差条代表一种生物样品的标准误差,所述生物样品具有四个技术重复(图1C)。总而言之,通过shRNA敲低(使用四种不同的shRNA序列证明)或CRISPR敲除(使用六种不同的gRNA序列证明)对WIZ的调节(例如抑制和/或降解)诱导人原代红细胞中的胎儿血红蛋白表达。这些数据提供了遗传证据,即证明WIZ是胎儿血红蛋白表达的调节剂,并且是治疗镰状细胞疾病和β-地中海贫血的新靶点。
在一定程度上,任何序列表与说明书中列举的任何序列之间存在任何差异,但说明书中列举的序列应被认为是正确的序列。除非另有说明,否则所有基因组位置均依据hg38。
实例3-WIZ降解剂
化合物的制备
通用方法I-用内酯进行光氧化还原催化的代表性程序
向40mL小瓶中装入5-溴异苯并呋喃-1(3H)-酮(5-I)(1当量)、醇结构单元(1当量)、NiCl2(甘醇二甲醚)(0.05当量)、dtbbpy(0.05当量)和Ir[(dF(CF3)ppy)2dtbbpy]PF6(0.01当量)。然后添加ACN(0.186M),随后添加2,2,6,6-四甲基哌啶(1当量)。将反应烧瓶抽真空并用氮气回填三次。将所得混合物放置于MacMillian蓝色LED光反应器中18小时。然后将反应混合物过滤并将固体用二氯甲烷洗涤。将滤液浓缩并通过反相HPLC或硅胶色谱法纯化。
通用方法II-Boc脱保护的代表性程序
将氨基-醚内酯实例(4)-I(1当量)悬浮于二噁烷(0.2M)。然后添加二噁烷中的4MHCl(6当量),并将所得混合物在40℃下搅拌2小时。将反应混合物在减压下浓缩以提供游离氨基-醚内酯实例(4)-II。将获得的产物不经纯化用于下个步骤。
通用方法III-减少胺化的代表性程序
将游离氨基-醚内酯实例(4)-II(1当量)悬浮于DMF(0.2M)。添加醛(3当量)。将反应在室温下搅拌5分钟,然后添加NaBH(OAc)3(3当量)。将反应在室温下搅拌18小时。将反应用饱和水性碳酸氢钠淬灭并用二氯甲烷萃取三次。将有机相合并,通过相分离器并浓缩。将粗材料通过硅胶色谱法纯化。
通用方法IV-开SOCl2内酯的代表性程序
向在70℃下搅拌的内酯(1当量)在二氯乙烷(0.2M)和EtOH(0.2M)中的溶液逐滴添加亚硫酰氯(12当量),并将所得混合物在70℃下搅拌过夜。将反应混合物冷却至室温,用水稀释,并用饱和水性碳酸氢钠淬灭。将反应混合物用EtOAc萃取三次,并将合并的有机相通过相分离器并浓缩到
Figure BDA0003693276070002191
上。将粗材料通过硅胶色谱法纯化。
通用方法V-内酰胺环闭合的代表性程序
在2mL微波小瓶中,将3-氨基哌啶-2,6-二酮盐酸盐(2当量)溶解于DMF(0.2M)中。然后添加DIPEA(5当量)并且将所得混合物在室温下搅拌15分钟。将α-氯酯(1当量)溶解于DMF(0.2M)中并添加,并且在85℃下继续搅拌18小时,然后在150℃在微波辐射下搅拌2小时。将反应混合物浓缩到
Figure BDA0003693276070002192
上并通过硅胶柱色谱法纯化。
通用方法VI-用3-(5-溴-1-氧代异吲哚啉-2-基)-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-2,6-二酮进行光氧化还原催化的代表性程序
向8mL红色加盖的小瓶中添加3-(5-溴-1-氧代异吲哚啉-2-基)-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-2,6-二酮INT-XXX(1当量)、醇结构单元(1.2当量)、dtbbpy(0.05当量)、NiCl2(甘醇二甲醚)(0.05当量)和Ir[(dF(CF3)ppy)2dtbbpy]PF6(0.01当量)。然后添加ACN(0.3M),随后添加2,2,6,6-四甲基哌啶(1.05当量)。将反应烧瓶抽真空并用氮气回填三次。将反应混合物放置于蓝色LED光下的光反应器板中18小时,然后过滤并浓缩。
通用方法VII-整体脱保护的代表性程序
向SEM保护的戊二酰亚胺、Boc保护的胺和异吲哚啉衍生物(实例INT-2)(1当量)在ACN(0.11M)中的溶液添加甲磺酸(11.2当量)。将所得混合物在室温下搅拌72小时,并且然后冷却至0℃。然后添加三乙胺(13.04当量),随后添加N1,N2-二甲基乙烷-1,2-二胺(1.5当量)。然后将反应混合物在室温下搅拌4小时,浓缩,并通过反相HPLC纯化。
3-(5-溴-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(INT-XX)
Figure BDA0003693276070002201
步骤1.4-溴-2-(氯甲基)苯甲酸乙酯(1-1b)
将5-溴苯酞1-1a(1200g,5.633mol)在EtOH(12L)中的搅拌悬浮液加热至68-72℃。然后在7h的时间内逐滴添加SOCl2(2.40L,33.0mol)。将反应混合物在减压下浓缩至约4L,然后添加水(5L)和MTBE(5L)。将所得混合物搅拌40min。分离各相,并将水相用MTBE(1x5L)萃取。将合并的有机层用5%水性NaHCO3(5L)洗涤,经Na2SO4干燥,过滤并浓缩至干燥,以提供呈浅棕色固体的1-1b(1450g,5.25mol,93%产率)。MS[M+Na]+=298.9。1H NMR(400MHz,氯仿-d)δ7.85(d,J=8.4Hz,1H),7.72(d,J=2.0Hz,1H),7.52(dd,J=8.3,2.0Hz,1H),5.00(s,2H),4.38(q,J=7.1Hz,2H),1.40(t,J=7.1Hz,3H)。
步骤2.3-(5-溴-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(INT-XX)
向3-氨基哌啶-2,6-二酮盐酸盐1-1c(596.3g,3.623mol)和i-Pr2NEt(2.50L,14.3mol)在DMF(5.0L)中的搅拌悬浮液中添加1-1b(1000g,3.623mmol),并将所得反应混合物在85-90℃下搅拌24h。然后使反应混合物冷却至室温,添加水(20L),并将所得混合物搅拌12h。将形成的沉淀过滤,并用水(5L)和MeOH(2L)洗涤。将粗固体在MeOH(5L)中浆化1h,过滤,并用MeOH(2L)洗涤。然后将所得固体置于EtOAc(10L)中并搅拌1h。然后将所获得的悬浮液过滤,用EtOAc(5L)洗涤,并在减压下在45℃-50℃干燥以得到呈灰白色固体的INT-XX(740g,2.29mol,63%产率)。MS[M+1]+=323.2。1H NMR(400MHz,DMSO-d6)δ10.99(s,1H),7.91-7.88(m,1H),7.72(dd,J=8.1,1.6Hz,1H),7.67(d,J=8.0Hz,1H),5.11(dd,J=13.3,5.1Hz,1H),4.47(d,J=17.7Hz,1H),4.34(d,J=17.7Hz,1H),2.98-2.83(m,1H),2.65-2.55(m,1H),2.45-2.29(m,1H),2.01(dtd,J=12.7,5.3,2.3Hz,1H)。
3-(5-溴-1-氧代异吲哚啉-2-基)-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-2,6-二酮(INT-XXX)
Figure BDA0003693276070002211
在0℃下,向INT-XX(10.0g,30.9mmol)和DBU(6.9mL,46mmol)在DMF(95mL)中的搅拌溶液中添加SEMCl(6.6mL,37mmol),并允许所得反应混合物升温至室温然后搅拌5h。添加另外部分的DBU(3.5mL,23mmol)和SEMCl(3.3mL,19mmol)并继续再搅拌2h。然后将反应混合物用饱和水性NH4Cl(250mL)淬灭并且用EtOAc(x3)萃取。将合并的有机相经Na2SO4干燥,过滤,并且浓缩至干燥。将粗物质溶解于最少量的EtOAc(约50mL)中,并添加Et2O:庚烷(v/v=1:2,400mL)。将所得混浊溶液在-5℃静置过夜。将形成的沉淀过滤,用庚烷洗涤(x3),并在真空下干燥以得到呈灰白色固体的INT-XXX(11.53g,25.4mmol,82%产率)。MS[M+H]+=453.4。1H NMR(400MHz,氯仿-d)δ7.75(d,J=8.6Hz,1H),7.66-7.61(m,2H),5.37-5.09(m,3H),4.48(d,J=16.2Hz,1H),4.32(d,J=16.2Hz,1H),3.74-3.50(m,2H),3.11-2.98(m,1H),2.94-2.83(m,1H),2.33(qd,J=13.2,4.7Hz,1H),2.24-2.15(m,1H),0.97-0.90(m,2H),0.00(s,9H)。
实例3.1:叔丁基2-(1-羟基乙基)哌啶-1-甲酸酯(INT-1)的非对映异构体混合物
Figure BDA0003693276070002221
向20mL小瓶中装入1-(哌啶-2-基)乙醇(0.5g,3.87mmol)、二碳酸二叔丁酯(0.98mL,4.26mmol)、K2CO3(0.59g,4.26mmol)和THF(20mL),并将所得混合物在室温下剧烈搅拌48小时。将反应混合物用盐水稀释,并用EtOAc萃取三次。将有机相合并,通过相分离器并浓缩到
Figure BDA0003693276070002224
上。将
Figure BDA0003693276070002223
残余物通过硅胶色谱法(用在庚烷中的0-100%乙酸乙酯洗脱,使用ELSD检测)纯化,以提供呈澄清油状物的叔丁基2-(1-羟基乙基)哌啶-1-甲酸酯INT-1(680mg,2.97mmol,77%产率)的非对映异构体混合物。1H NMR(400MHz,氯仿-d)δ4.17-3.90(m,3H),2.99-2.68(m,1H),2.05-1.98(m,1H),1.85-1.54(m,5H),1.49(s,9H),1.23(dd,J=9.3,6.1Hz,3H)。
实例3.2:5-(1-(1-乙基哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮(INT-3)的非对映异构体
Figure BDA0003693276070002222
步骤1:叔丁基2-(1-((1-氧代-1,3-二氢异苯并呋喃-5-基)氧基)乙基)哌啶-1-甲酸酯(1)的非对映异构体混合物
根据通用方法I,从5-溴异苯并呋喃-1(3H)-酮和叔丁基2-(1-羟基乙基)哌啶-1-甲酸酯INT-1(0.67g,2.93mmol)的非对映异构体混合物开始制备产物。将反应混合物过滤,并且将固体用二氯甲烷洗涤。将滤液浓缩,并将粗材料溶解于最少的甲醇中并通过反相ELSD/uV触发的硅胶色谱法(用均含有5mM NH4OAc作为改性剂的5-50%95:5ACN:H2O至95:5H2O:ACN洗脱)纯化,以提供呈橙色固体的叔丁基2-(1-((1-氧代-1,3-二氢异苯并呋喃-5-基)氧基)乙基)哌啶-1-甲酸酯1的非对映异构体混合物(533mg,1.46mmol,50.3%产率)。可替代地,可以将粗材料通过硅胶色谱法(用在庚烷中的含1%TEA的0-100%3:1EtOAc:EtOH洗脱)纯化,以提供所希望的产物。LCMS[M+H-叔丁基]+:306.1。1H NMR(400MHz,氯仿-d)δ7.69(d,J=8.5Hz,1H),6.91(dd,J=8.5,2.1Hz,1H),6.79(dd,J=6.9,2.0Hz,1H),5.12(d,J=6.0Hz,2H),4.64(ddd,J=14.1,8.3,6.2Hz,1H),4.32-4.14(m,1H),2.69-2.48(m,1H),1.90-1.81(m,1H),1.69-1.58(m,1H),1.54-1.40(m,4H),1.34(s,10H),1.19(d,J=6.1Hz,3H)。
步骤2:5-(1-(哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮(2)的非对映异构体混合物
根据通用方法II,从叔丁基2-(1-((1-氧代-1,3-二氢异苯并呋喃-5-基)氧基)乙基)哌啶-1-甲酸酯1(0.53g,1.46mmol)的非对映异构体混合物开始制备产物。将反应混合物浓缩,以提供呈粗橙色固体的5-(1-(哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮2的非对映异构体混合物。将粗产物不经纯化用于下个步骤。LCMS[M+H]+:262.1。
步骤3:非对映异构体5-(1-(1-乙基哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮(INT-3)
根据通用方法III,从5-(1-(哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮2(0.39g,1.48mmol)和乙醛(0.25mL,4.42mmol)的非对映异构体混合物开始制备产物。将反应混合物用饱和水性碳酸氢钠淬灭,并用二氯甲烷萃取三次。将有机相合并,通过相分离器并浓缩。将粗材料通过硅胶色谱法(用在二氯甲烷中的0-20%甲醇洗脱)纯化,以提供呈棕色油状物的5-(1-(1-乙基哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮INT-3的非对映异构体混合物(372mg,1.29mmol,87%产率)。LCMS[M+H]+:290.2。1H NMR(400MHz,氯仿-d)δ7.81(dd,J=8.5,1.9Hz,1H),7.03(dd,J=8.5,2.1Hz,1H),6.92(s,1H),5.24(s,2H),4.93-4.62(m,1H),3.06-2.81(m,2H),2.60-2.43(m,2H),2.32-2.17(m,1H),1.77(dd,J=27.1,14.7Hz,2H),1.66-1.48(m,3H),1.35(dd,J=11.4,6.3Hz,4H),1.11-0.97(m,3H)。将异构体的非对映异构体混合物通过手性SFC[柱21x250mm Chiralpak IC;含10mM NH3的CO2助溶剂30%IPA;以80g/min在125巴在25℃下]分离,以提供两种非对映异构体的混合物以及两种干净单一的非对映异构体:峰3:呈橙色固体的5-(1-(1-乙基哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮的非对映异构体3(101mg,0.349mmol,23.7%)。手性SFC Rt 14min。峰4:呈橙色固体的5-(1-(1-乙基哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮的非对映异构体4(105mg,0.363mmol,24.6%)。手性SFC Rt 19min。将异构体的混合物进一步通过手性SFC[柱21x250mm Chiralpak IG;含10mM NH3的CO2助溶剂25%1:1:MeOH:IPA;以80g/min在125巴在25℃下]分离,以提供另外两种非对映异构体:峰1:呈橙色固体的5-(1-(1-乙基哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮的非对映异构体1(30.4mg,0.105mmol,7.1%)。手性SFC Rt4.9min。峰2:呈橙色固体的5-(1-(1-乙基哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮的非对映异构体2(35mg,0.121mmol,8.2%)。手性SFC Rt 4.7min。
实例3.3:3-(5-(1-(1-乙基哌啶-2-基)乙氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(I-5)的非对映异构体
Figure BDA0003693276070002251
步骤1:乙基2-(氯甲基)-4-(1-(1-乙基哌啶-2-基)乙氧基)苯甲酸酯(4)的单一非对映异构体
根据通用方法IV,从单一非对映异构体5-(1-(1-乙基哌啶-2-基)乙氧基)异苯并呋喃-1(3H)-酮INT-3峰3(0.1g,0.346mmol)开始制备产物(4)。将粗材料通过硅胶色谱法(用在庚烷中的0-100%乙酸乙酯洗脱)纯化,以提供呈橙色油状物的单一非对映异构体乙基2-(氯甲基)-4-(1-(1-乙基哌啶-2-基)乙氧基)苯甲酸酯4(102mg,0.288mmol,83%产率)。LCMS[M+H]+:354.6。1H NMR(400MHz,氯仿-d)δ7.98(d,J=8.7Hz,1H),7.07(d,J=2.6Hz,1H),6.85(dd,J=8.8,2.6Hz,1H),5.05(s,2H),4.65(qd,J=6.4,2.8Hz,1H),4.35(q,J=7.1Hz,2H),3.02-2.89(m,2H),2.58-2.49(m,1H),2.45(dt,J=10.2,2.9Hz,1H),2.23(ddd,J=12.0,10.8,3.2Hz,1H),1.83-1.68(m,2H),1.63-1.45(m,3H),1.39(t,J=7.1Hz,3H),1.36-1.21(m,4H),1.02(t,J=7.1Hz,3H)。
步骤2:非对映异构体3-(5-(1-(1-乙基哌啶-2-基)乙氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(I-5)
根据通用方法V,从单一非对映异构体乙基2-(氯甲基)-4-(1-(1-乙基哌啶-2-基)乙氧基)苯甲酸酯4(102mg,0.288mmol)开始制备化合物I-5。将反应混合物通过硅胶色谱法(用在EtOAc中的含1%TEA的0-100%3:1EtOAc:EtOH洗脱)纯化,以提供呈白色固体的单一非对映异构体3-(5-(1-(1-乙基哌啶-2-基)乙氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮I-5(28.4mg,0.069mmol,23.92%产率)。LCMS[M+H]+:400.3。1H NMR(400MHz,DMSO-d6)δ10.97(s,1H),7.61(d,J=8.4Hz,1H),7.18(d,J=2.2Hz,1H),7.03(dd,J=8.4,2.2Hz,1H),5.07(dd,J=13.3,5.1Hz,1H),4.77-4.68(m,1H),4.39(d,J=17.2Hz,1H),4.26(d,J=17.1Hz,1H),2.96-2.83(m,3H),2.64-2.54(m,1H),2.45-2.30(m,2H),2.26-2.13(m,1H),2.01-1.92(m,1H),1.70(d,J=10.2Hz,2H),1.55-1.22(m,8H),0.94(t,J=7.0Hz,3H)。
实例3.4:非对映异构体3-(1-氧代-5-(((R)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮(I-47)
Figure BDA0003693276070002261
步骤1:非对映异构体叔丁基(2R)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-甲酸酯(46)
根据通用方法VI从(R)-1-N-Boc-2-羟基甲基哌啶(28mg,0.132mmol)开始制备中间体46。将反应混合物过滤并浓缩,以提供呈棕色固体的非对映异构体叔丁基(2R)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-甲酸酯46。将粗材料无需纯化即可用于下个步骤。LCMS[M+H-156.3(TMSCH2CH2,叔丁基)]+:432.26。
步骤2:非对映异构体3-(1-氧代-5-(((R)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮(I-47)
根据通用方法VII,从叔丁基(2R)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-甲酸酯46(64.7mg,0.11mmol)开始制备化合物I-47。将反应混合物浓缩,溶解于DMSO中,并通过碱性物质触发的反相HPLC(用在含有5mM NH4OH作为改性剂的水中的10%-30%ACN洗脱)纯化。在收集前,每个测试管中含有3滴甲酸。将纯的级分合并,浓缩并冻干,以提供呈奶油色固体的非对映异构体3-(1-氧代-5-(((R)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮I-47(4.55mg,9.62μmol,8.74%产率)。LCMS[M+H]+:358.3。1H NMR(400MHz,DMSO-d6)δ10.95(s,1H),8.29(s,1H),7.62(d,J=8.4Hz,1H),7.18(d,J=2.3Hz,1H),7.06(dd,J=8.5,2.2Hz,1H),5.07(dd,J=13.3,5.0Hz,1H),4.39(d,J=17.1Hz,1H),4.26(d,J=17.3Hz,1H),3.98(dd,J=9.5,4.6Hz,1H),3.88(ddd,J=9.2,7.2,1.6Hz,1H),3.03-2.83(m,3H),2.68-2.55(m,2H),2.44-2.29(m,1H),2.03-1.92(m,1H),1.80-1.61(m,2H),1.59-1.52(m,1H),1.49-1.43(m,1H),1.38-1.29(m,2H),1.21-1.10(m,1H)。
实例3.5:非对映异构体1-(羟基甲基)-3-(1-氧代-5-(((S)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮(I-49)
Figure BDA0003693276070002271
步骤1:非对映异构体叔丁基(2S)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-甲酸酯(48)
根据通用方法VI从(S)-N-Boc-哌啶-2-甲醇(28mg,0.132mmol)开始制备中间体48。将反应混合物过滤并浓缩,以提供呈棕色油状物的叔丁基(2S)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-甲酸酯48。粗材料无需纯化即可用于下个反应。LCMS[M+H]+:156.3(TMSCH2CH2,tButyl)]+:432.2。
步骤2:非对映异构体3-(1-氧代-5-(((S)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮(I-49)
根据通用方法VII,从叔丁基(2S)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-甲酸酯48(64.7mg,0.11mmol)开始制备化合物I-49。将反应混合物浓缩并将三分之一的材料通过碱性物质触发的反相HPLC(用在含有5mM NH4OH作为改性剂的水中的10%-30%ACN洗脱)纯化。在收集前,每个测试管中含有3滴甲酸。将纯的级分合并,浓缩并冻干,以提供呈奶油色固体的非对映异构体3-(1-氧代-5-(((S)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮I-49(3.94mg,8.33μmol,4.48%产率)。其余物质无需纯化即可用于下个反应。LCMS[M+H]+:358.2。1H NMR(400MHz,DMSO-d6)δ10.92(s,1H),7.62(d,J=8.4Hz,1H),7.21-7.15(m,1H),7.06(dd,J=8.4,2.3Hz,1H),5.07(dd,J=13.3,5.0Hz,1H),4.39(d,J=17.3Hz,1H),4.26(d,J=17.3Hz,1H),4.05-3.96(m,1H),3.96-3.83(m,1H),3.02-2.87(m,3H),2.63-2.54(m,2H),2.45-2.33(m,1H),2.03-1.91(m,1H),1.80-1.59(m,2H),1.59-1.50(m,1H),1.49-1.43(m,2H),1.38-1.31(m,1H),1.21-1.09(m,1H)。
实例3.6:3-(5-(((R)-1-乙基哌啶-2-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮
Figure BDA0003693276070002291
根据通用方法III,从1-(羟基甲基)-3-(1-氧代-5-(((R)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮I-47(26mg,0.073mmol)和乙醛(0.5mL,8.85mmol)开始制备化合物I-50。将反应混合物用饱和水性碳酸氢钠淬灭并用4:1二氯甲烷:异丙醇萃取4次。将有机相合并,通过相分离器并浓缩。将粗材料通过碱性物质触发的反相HPLC(用在含有5mMNH4OH作为改性剂的水中的15%-40%ACN洗脱)纯化。在样品收集前,每个测试管中含有3滴甲酸。将纯的级分合并,浓缩并冻干,以提供呈橙色固体的3-(5-(((R)-1-乙基哌啶-2-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮I-50(4.59mg,9.90μmol,13.56%产率)。LCMS[M+H]+:386.3。1H NMR(400MHz,DMSO-d6)δ10.96(s,1H),8.23(s,1H),7.62(d,J=8.4Hz,1H),7.23-7.14(m,1H),7.05(dd,J=8.4,2.2Hz,1H),5.07(dd,J=13.3,5.1Hz,1H),4.39(d,J=17.2Hz,1H),4.26(d,J=17.2Hz,1H),4.21-4.11(m,1H),4.07-3.95(m,1H),2.91(ddd,J=18.0,13.6,5.5Hz,1H),2.81-2.55(m,3H),2.44-2.32(m,2H),2.24(td,J=11.6,10.6,3.2Hz,1H),2.17-2.10(m,1H),2.02-1.93(m,1H),1.78-1.70(m,1H),1.70-1.61(m,1H),1.58-1.51(m,1H),1.50-1.40(m,2H),1.35-1.22(m,1H),0.97(t,J=7.1Hz,3H)。
根据实例3.6,从(I-47)或(I-49)的最终产物开始制备以下化合物。
Figure BDA0003693276070002292
Figure BDA0003693276070002301
Figure BDA0003693276070002311
实例3.7:(3,3-二氟环丁基)甲磺酸甲酯(INT-51)
Figure BDA0003693276070002312
向(3,3-二氟环丁基)甲醇(0.16g,1.310mmol)在DCM(1.4mL)中的溶液逐滴添加DIPEA(0.46mL,2.62mmol)、1-甲基-1H-咪唑(0.21mL,2.62mmol)和甲磺酰氯(0.15mL,1.96mmol)。将所得混合物在室温下搅拌18小时,然后用DCM(30mL)稀释。将有机相用1M水性HCl洗涤三次,并用饱和水性碳酸氢钠洗涤两次。将合并的有机相通过相分离器并浓缩,以提供呈橙色油状物的(3,3-二氟环丁基)甲磺酸甲酯INT-51(227mg,1.134mmol,87%产率)。1HNMR(400MHz,氯仿-d)δ4.33-4.24(m,2H),3.07(s,3H),2.82-2.68(m,2H),2.67-2.53(m,1H),2.52-2.36(m,2H)。
实例3.8:非对映异构体3-(5-(((R)-1-((3,3-二氟环丁基)甲基)哌啶-2-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮
Figure BDA0003693276070002321
将(3,3-二氟环丁基)甲磺酸甲酯INT-51(101mg,0.504mmol)添加至40mL小瓶,并溶解于DMF(2.1mL)中。添加1-(羟基甲基)-3-(1-氧代-5-(((R)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮I-47(0.15g,0.420mmol),随后添加DIPEA(0.15mL,0.839mmol)。将所得混合物在室温下搅拌72小时,在50℃下搅拌18小时,在60℃下搅拌24小时,然后在100℃下搅拌24小时。将反应混合物用饱和水性碳酸氢钠淬灭并用4:1DCM:iPrOH萃取三次。将有机相合并,通过相分离器并浓缩到
Figure BDA0003693276070002322
上。将粗材料通过硅胶色谱法(用在庚烷中的含1%TEA的0-100%3:1EtOAc:EtOH洗脱)纯化,以提供呈白色固体的3-(5-(((R)-1-((3,3-二氟环丁基)甲基)哌啶-2-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮I-52(38.9mg,0.081mmol,19.28%产率)。LCMS[M+H]+:462.5。1H NMR(400MHz,DMSO-d6)δ10.97(s,1H),7.64(d,J=8.4Hz,1H),7.20(d,J=2.3Hz,1H),7.07(dd,J=8.4,2.3Hz,1H),5.08(dd,J=13.3,5.2Hz,1H),4.40(d,J=17.1Hz,1H),4.28(d,J=17.3Hz,1H),4.23-4.13(m,1H),4.13-4.01(m,1H),2.98-2.77(m,3H),2.74-2.57(m,4H),2.45-2.13(m,6H),2.04-1.93(m,1H),1.77-1.60(m,2H),1.58-1.27(m,4H)。
实例3.9:3-(5-(((R)-1-异丙基哌啶-2-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(I-53)
Figure BDA0003693276070002331
将3-(1-氧代-5-(((R)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮I-47(68mg,0.190mmol)悬浮于DMA(1.90mL)。添加K2CO3(39mg,0.285mmol),并将所得混合物抽真空并用氮气回填3次。添加2-碘丙烷(0.10mL,0.95mmol),并在微波辐射下,将反应混合物在100℃下加热3小时。将反应混合物用50%饱和水性碳酸氢钠淬灭并用4:1DCM:iPrOH萃取三次。将有机相合并,通过相分离器并浓缩到
Figure BDA0003693276070002332
上。将粗材料通过硅胶色谱法(用在庚烷中的含1%TEA的0-100%3:1乙酸乙酯:乙醇洗脱)纯化。将纯的级分合并,浓缩并冻干,以提供呈白色固体的3-(5-(((R)-1-异丙基哌啶-2-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮I-53(52.96mg,0.130mmol,68.3%产率)。LCMS[M+H]+:400.6。1H NMR(400MHz,DMSO-d6)δ10.96(s,1H),7.62(d,J=8.3Hz,1H),7.19(d,J=2.3Hz,1H),7.05(dd,J=8.7,2.1Hz,1H),5.07(dd,J=13.3,5.2Hz,1H),4.39(d,J=17.1Hz,1H),4.26(d,J=17.2Hz,1H),4.20-3.92(m,2H),3.25-3.09(m,1H),2.97-2.70(m,3H),2.59(ddd,J=17.2,4.7,2.2Hz,1H),2.45-2.31(m,1H),2.15(s,1H),2.02-1.91(m,1H),1.82-1.64(m,2H),1.62-1.52(m,1H),1.44-1.22(m,3H),1.12-0.98(m,3H),0.96-0.86(m,3H)。
实例3.10:对映异构体5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮(INT-56)
Figure BDA0003693276070002341
步骤1:外消旋-叔丁基2,2-二甲基-5-(((1-氧代-1,3-二氢异苯并呋喃-5-基)氧基)甲基)吗啉-4-甲酸酯(54)
根据通用方法I,从4-boc-5-羟基甲基-2,2-二甲基-吗啉(507mg,2.065mmol)开始制备中间体54。将粗材料通过硅胶色谱法(用在庚烷中的0-100%乙酸乙酯洗脱)纯化,以提供呈奶油色固体的外消旋-叔丁基2,2-二甲基-5-(((1-氧代-1,3-二氢异苯并呋喃-5-基)氧基)甲基)吗啉-4-甲酸酯54(587mg,1.555mmol,83%产率)。LCMS[M+H]+:322.1(不含叔丁基的质量)。1H NMR(400MHz,氯仿-d)δ7.73(d,J=8.5Hz,1H),7.00(dd,J=8.5,2.2Hz,1H),6.93(d,J=2.1Hz,1H),5.19(s,2H),4.29-4.06(m,2H),3.94-3.54(m,5H),1.41(s,9H),1.20(s,3H),1.16(s,3H)。
步骤2:外消旋-5-((6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮(55)
根据通用方法II,从叔丁基2,2-二甲基-5-(((1-氧代-1,3-二氢异苯并呋喃-5-基)氧基)甲基)吗啉-4-甲酸酯54(0.587g,1.555mmol)开始制备中间体55。将反应混合物浓缩,以提供呈白色固体的5-((6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮55。粗材料无需纯化即可用于下个反应。LCMS[M+H]+:278.3。
步骤3:对映异构体5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮(INT-56)
根据通用方法III,从5-((6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮55(1.11g,4.0mmol)和乙醛(0.5mL,9.33mmol)开始制备INT-56。将粗材料通过硅胶色谱法(用在庚烷中的含1%TEA的0-100%3:1EtOAc:EtOH洗脱)纯化,以提供呈粉色固体的5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮INT-56(275mg,0.901mmol,22.51%产率)。LCMS[M+H]+:306.5。1H NMR(400MHz,氯仿-d)δ7.79(d,J=8.5Hz,1H),7.03(dd,J=8.5,2.2Hz,1H),6.95-6.89(m,1H),5.23(s,2H),4.20(dd,J=9.5,4.4Hz,1H),4.07(dd,J=9.5,6.4Hz,1H),3.85(dd,J=11.6,3.5Hz,1H),3.70(dd,J=11.6,7.0Hz,1H),2.92-2.79(m,1H),2.79-2.66(m,1H),2.62-2.47(m,2H),2.23(d,J=11.5Hz,1H),1.28(s,3H),1.25(s,3H),1.05(t,J=7.1Hz,3H)。将异构体的混合物通过手性SFC[柱21x250mmChiralpak IF;CO2助溶剂25%MeOH;以80g/min在125巴在25℃下]分离,以提供两种对映异构体:峰1:呈浅黄色固体的5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮的对映异构体1(99mg,0.324mmol,8.10%产率)。手性SFC Rt 2.5min。峰2:呈浅红色固体的5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮的对映异构体2(111.5mg,0.365mmol,9.13%产率)。手性SFC Rt 3.7min。
实例3.11:非对映异构体3-(5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(I-58)
Figure BDA0003693276070002361
步骤1:单一对映异构体乙基2-(氯甲基)-4-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)苯甲酸酯(57)
根据通用方法IV,从5-((6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮INT-56峰1(99mg,0.324mmol)开始制备中间体57,以提供呈棕色油状物的单一对映异构体乙基2-(氯甲基)-4-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)苯甲酸酯57。将粗材料无需纯化即可用于下个步骤。LCMS[M+H]+:370.4。
步骤2:非对映异构体3-(5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(I-58)
根据通用方法V,从乙基2-(氯甲基)-4-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)苯甲酸酯57(120mg,0.324mmol)开始制备化合物I-58。将粗材料通过硅胶色谱法(用在庚烷中的含有1%TEA作为改性剂的0-100%3:1乙酸乙酯:乙醇洗脱)纯化。将含有所希望的产物的级分合并,浓缩并冻干,以提供呈浅紫色固体的3-(5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮I-58(71mg,0.169mmol,52.2%产率)。LCMS[M+H]+:416.6。1H NMR(400MHz,DMSO-d6)δ10.97(s,1H),7.63(d,J=8.3Hz,1H),7.26-7.15(m,1H),7.08(dd,J=8.4,2.3Hz,1H),5.08(dd,J=13.3,5.2Hz,1H),4.40(dd,J=17.4,1.8Hz,1H),4.34-4.15(m,2H),4.12-4.00(m,1H),3.74(dd,J=11.6,3.4Hz,1H),3.57(dd,J=11.4,7.4Hz,1H),2.91(ddd,J=17.3,13.6,5.4Hz,1H),2.78-2.65(m,2H),2.64-2.49(m,2H),2.48-2.31(m,2H),2.13(d,J=11.4Hz,1H),2.03-1.93(m,1H),1.21(s,3H),1.16(s,3H),0.98(t,J=7.1Hz,3H)。
实例3.12:非对映异构体3-(5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(I-60)
Figure BDA0003693276070002371
步骤1:单一对映异构体乙基2-(氯甲基)-4-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)苯甲酸酯(59)
根据通用方法IV,从5-((6,6-二甲基吗啉-3-基)甲氧基)异苯并呋喃-1(3H)-酮INT-56峰2(111.5mg,0.365mmol)开始制备中间体59,以提供呈棕色油状物的乙基2-(氯甲基)-4-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)苯甲酸酯59。将粗材料无需纯化即可用于下个步骤。LCMS[M+H]+:370.4。
步骤2:非对映异构体(5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(I-60)
根据通用方法V,从乙基2-(氯甲基)-4-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)苯甲酸酯59(135mg,0.365mmol)开始制备化合物I-60。将粗材料通过硅胶色谱法(用在庚烷中的含有1%TEA作为改性剂的0-100%3:1乙酸乙酯:乙醇洗脱)纯化。将含有所希望的产物的级分合并,浓缩并冻干,以提供呈浅紫色固体的(5-((4-乙基-6,6-二甲基吗啉-3-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮I-60(68.1mg,0.161mmol,44.0%产率)。LCMS[M+H]+:416.4。1H NMR(400MHz,DMSO-d6)δ10.97(s,1H),7.63(d,J=8.5Hz,1H),7.25-7.17(m,1H),7.08(dd,J=8.5,2.2Hz,1H),5.08(dd,J=13.3,5.0Hz,1H),4.40(dd,J=17.6,1.8Hz,1H),4.34-4.16(m,2H),4.12-4.01(m,1H),3.74(dd,J=11.3,3.4Hz,1H),3.57(dd,J=11.6,7.4Hz,1H),2.91(ddd,J=17.2,13.6,5.4Hz,1H),2.78-2.64(m,2H),2.63-2.54(m,2H),2.48-2.31(m,2H),2.17-2.10(m,1H),2.03-1.92(m,1H),1.21(s,3H),1.16(s,3H),0.98(t,J=7.1Hz,3H)。
实例3.13:叔丁基4-(4-(((2R)-2-(((2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-基)甲基)苯基)哌嗪-1-甲酸酯(I-73)
Figure BDA0003693276070002381
根据通用方法III,从3-(1-氧代-5-(((R)-哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮I-47(0.45g,1.259mmol)和1-boc-4-(4-甲酰基苯基)哌嗪(550mg,1.894mmol)开始制备化合物I-73。将粗材料通过硅胶色谱法(用在庚烷中的含1%TEA的0-100%3:1乙酸乙酯:乙醇洗脱)纯化。将纯的级分合并,浓缩并冻干,以提供呈白色固体的叔丁基4-(4-(((2R)-2-(((2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-基)甲基)苯基)哌嗪-1-甲酸酯I-73(599mg,0.948mmol,75%产率)。LCMS[M+H]+:632.6。1H NMR(400MHz,氯仿-d)δ7.98(d,J=14.3Hz,1H),7.81(d,J=8.4Hz,1H),7.25(d,J=8.2Hz,2H),7.03(dd,J=8.3,2.2Hz,1H),6.95(s,1H),6.89(d,J=8.4Hz,2H),5.22(dd,J=13.2,5.2Hz,1H),4.46(d,J=15.8Hz,1H),4.32-4.19(m,2H),4.09(dd,J=9.8,4.8Hz,1H),3.99(d,J=13.6Hz,1H),3.63-3.53(m,4H),3.39(d,J=13.6Hz,1H),3.16-3.06(m,4H),2.99-2.74(m,4H),2.36(qd,J=13.0,5.0Hz,1H),2.27-2.12(m,2H),1.91-1.80(m,1H),1.76-1.70(m,1H),1.68-1.46(m,13H)。
实例3.14:3-(1-氧代-5-(((R)-1-(4-(哌嗪-1-基)苄基)哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮(INT-74)
Figure BDA0003693276070002391
将叔丁基4-(4-(((2R)-2-(((2-(2,6-二氧代哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)哌啶-1-基)甲基)苯基)哌嗪-1-甲酸酯I-73(0.599g,0.948mmol)悬浮于二噁烷(体积:4mL,比率:1.333)并溶解于三氟乙醇(体积:3mL,比率:1.000)中。添加在二噁烷中的4M HCl(1.422mL,5.69mmol),并将所得混合物在室温下搅拌过夜。将反应混合物浓缩,以提供呈粉色固体的稍微不纯的3-(1-氧代-5-(((R)-1-(4-(哌嗪-1-基)苄基)哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮INT-74(700mg,1.317mmol)。粗物质无需纯化即可用于下一步。LCMS[M+H]+:532.5。
实例3.15:3-(5-(((R)-1-(4-(4-(氧杂环丁烷-3-基甲基)哌嗪-1-基)苄基)哌啶-2-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮(I-76)
Figure BDA0003693276070002401
根据通用方法III,从3-(1-氧代-5-(((R)-1-(4-(哌嗪-1-基)苄基)哌啶-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮INT-74(0.15g,0.282mmol)和氧杂环丁烷-3-甲醛(49mg,0.564mmol)开始制备INT-74。将粗材料通过硅胶色谱法(用在庚烷中的含1%TEA的0-100%3:1乙酸乙酯:乙醇洗脱)纯化。将纯的级分合并,浓缩并冻干,以提供呈白色固体的3-(5-(((R)-1-(4-(4-(氧杂环丁烷-3-基甲基)哌嗪-1-基)苄基)哌啶-2-基)甲氧基)-1-氧代异吲哚啉-2-基)哌啶-2,6-二酮I-76(43.17mg,0.072mmol,25.4%产率)。LCMS[M+H]+:602.3。1H NMR(400MHz,DMSO-d6)δ10.90(s,1H),7.54(d,J=8.4Hz,1H),7.13-7.03(m,3H),6.99(dd,J=8.6,2.2Hz,1H),6.77(d,J=8.4Hz,2H),5.00(dd,J=13.2,5.0Hz,1H),4.58(dd,J=7.8,5.8Hz,2H),4.37-4.13(m,5H),4.05(dd,J=10.3,5.5Hz,1H),3.81(d,J=13.2Hz,1H),3.24-3.19(m,1H),3.18-3.07(m,1H),3.03-2.93(m,4H),2.84(ddd,J=17.3,13.6,5.4Hz,1H),2.71-2.48(m,5H),2.39-2.28(m,5H),2.07-1.96(m,1H),1.96-1.86(m,1H),1.75-1.64(m,1H),1.63-1.51(m,1H),1.51-1.22(m,4H)。
实例3.16:3-(1-氧代-5-(((R)-吡咯烷-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮(I-81)
Figure BDA0003693276070002411
步骤1:叔丁基(2R)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)吡咯烷-1-甲酸酯(80)
根据通用方法VI,从N-Boc-D-脯氨醇(27mg,0.132mmol)开始制备中间体80,以提供叔丁基(2R)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)吡咯烷-1-甲酸酯80。将粗材料无需处理或纯化即可用于下个步骤作为溶液。LCMS[M+H-156.3(TMSCH2CH2,叔丁基)]+:418.6。
步骤2:46:3-(1-氧代-5-(((R)-吡咯烷-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮(I-81)
根据通用方法VII,从叔丁基(2R)-2-(((2-(2,6-二氧代-1-((2-(三甲基甲硅烷基)乙氧基)甲基)哌啶-3-基)-1-氧代异吲哚啉-5-基)氧基)甲基)吡咯烷-1-甲酸酯80(63mg,0.110mmol)开始制备化合物I-81。将粗材料浓缩,并通过碱性物质触发的反相HPLC(用在含有5mM NH4OH作为改性剂的水中的10%-30%ACN洗脱)纯化。在样品收集前,每个测试管中含有3滴甲酸。将纯的级分合并,浓缩并冻干,以提供呈三乙胺盐的产物。将PL-HCO3MP SPE柱(聚合物实验室(瓦里安公司),部件号PL3540-C603(或当量);在6ml试管中的500mg预填充树脂)用EtOH(5mL)预洗涤。将产物溶解于EtOH(3mL)中,并通过柱经施加较小压力进行过滤。将柱用EtOH(5mL)洗涤,并将滤液浓缩并冻干,以提供呈白色固体的3-(1-氧代-5-(((R)-吡咯烷-2-基)甲氧基)异吲哚啉-2-基)哌啶-2,6-二酮I-81(7.3mg,0.021mmol,19.09%产率)。LCMS[M+H]+:344.3。1H NMR(400MHz,DMSO-d6)δ10.93(s,1H),7.63(d,J=8.4Hz,1H),7.17(d,J=2.2Hz,1H),7.05(dd,J=8.3,2.3Hz,1H),5.07(dd,J=13.3,5.1Hz,1H),4.39(d,J=17.1Hz,1H),4.26(d,J=17.2Hz,1H),4.05-3.92(m,2H),3.54(p,J=6.8Hz,1H),2.97-2.83(m,3H),2.59(ddd,J=17.2,4.6,2.2Hz,1H),2.45-2.30(m,1H),2.03-1.86(m,2H),1.86-1.62(m,2H),1.59-1.44(m,2H)。
生物学数据
材料与方法
实例3.17:HiBit标签融合蛋白测定中WIZ蛋白水平的定量
将来自普洛麦格公司(Promega)的Hibit系统用于开发高通量和定量测定,以测量WIZ蛋白水平对化合物(例如WIZ降解剂)的响应变化。HiBit标签来源于分裂的纳米荧光素酶,并且具有以下蛋白质序列:VSGWRLFKKIS(SEQ ID No:3208)。将纳米荧光素酶(称为LgBit,来自普洛麦格公司)的互补片段添加到HiBit标签中,以形成有活性的纳米荧光素酶,其活性可以精确测量。以这种方式,可以在细胞裂解物中定量具有HiBit标签的融合蛋白的水平。
构建慢病毒载体(基于InvitrogenTMpLenti6.2/V5 DEST骨架),其将HiBit标签置于WIZ上游,并从HSVTK启动子表达融合蛋白。
为了确保HiBit-WIZ融合蛋白在群体中的所有细胞中的适度和一致的表达,从具有单拷贝构建体的细胞构建稳定的细胞系。使用来自InvitrogenTM的ViraPowerTM试剂盒制备与构建体一起包装的慢病毒。在低感染复数下,将来自ATCC的293T细胞(目录号:CRL-3216)用病毒感染,并在培养基中通过5μg/mL杀稻瘟菌素选择2周。
如下测量化合物处理的细胞系中HiBit-WIZ标记的融合蛋白的水平:
第1天,将细胞在正常生长培养基中稀释至1.0x106个细胞/ml。将20μL的细胞悬液接种到固体白色384孔板的每个孔中。将板在37℃和5%CO2湿润的组织培养箱中孵育过夜。
第2天,在384孔板中制备连续稀释的化合物。在第1、2、23、24列给化合物板提供DMSO,在第3-12列和第13-22列给化合物板提供10点化合物稀释系列。将10mM的化合物储备溶液放入第3列或第13列中,并进行1:5连续稀释,直至每种化合物有10点稀释系列。通过
Figure BDA0003693276070002432
(Labcyte公司)声转移将50nL稀释的化合物转移到铺板的细胞中。化合物的最高浓度为25μM。将板在37℃和5%CO2湿润的组织培养箱中孵育过夜(约18小时)。
第3天,将板从培养箱中取出并允许其在室温平衡60分钟。如制造商方案所述添加HiBit底物(
Figure BDA0003693276070002433
HiBit Lytic Detection System,普洛麦格公司目录号:N3050)。将板在室温孵育30分钟,并使用
Figure BDA0003693276070002434
读数器
Figure BDA0003693276070002435
读取发光。使用
Figure BDA0003693276070002436
软件包对数据进行分析和可视化。
化合物的WIZ降解活性(表9)
表9示出了本披露的化合物在293T细胞中的WIZ HiBit测定中的WIZ降解活性。WIZAmax反映了DMSO归一化,WIZ-HiBit的曲线拟合百分比保持为25uM。通过以下方式进行计算:将DMSO对照归一化为100%,对剂量响应数据进行参数曲线拟合(10点,5倍),随后使用拟合方程计算在25uM处的响应(nd=未确定)。
表9.
Figure BDA0003693276070002431
Figure BDA0003693276070002441
实例3.18:小分子HbF诱导测定
从澳赛尔斯公司(AllCells,LLC)获得冷冻保存的原代人CD34+造血干细胞和祖细胞。在通过施用粒细胞集落刺激因子进行动员后,从健康供体的外周血中分离CD34+细胞。使用2阶段培养法使细胞向红系谱系离体分化。在第一阶段,将细胞在37℃在5%CO2下在补充有rhSCF(50ng/mL,
Figure BDA0003693276070002442
公司)、rhIL-6(50ng/mL,
Figure BDA0003693276070002443
公司)、rhIL-3(50ng/mL,
Figure BDA0003693276070002444
公司)和rhFlt3L(50ng/mL,
Figure BDA0003693276070002445
公司)以及1X抗生素-抗真菌药(生命技术公司(Life Technologies),赛默飞世尔科技公司)的StemSpanTM无血清扩增培养基(SFEM)(干细胞技术公司(STEMCELL Technologies Inc.))中培养6天。在第二阶段期间,将细胞在37℃在5%CO2下、在化合物存在下、在红系分化培养基中以5,000个细胞/mL培养7天。红系分化培养基包括IMDM(生命技术公司),补充有胰岛素(10μg/mL,西格玛奥德里奇公司)、肝素(2U/mL,西格玛奥德里奇公司)、全转铁蛋白(330μg/mL,西格玛奥德里奇公司)、人血清AB(5%,西格玛奥德里奇公司)、氢化可的松(1μM,干细胞技术公司)、rhSCF(100ng/mL,
Figure BDA0003693276070002446
公司)、rhIL-3(5ng/mL,
Figure BDA0003693276070002447
公司)、rhEPO(3U/mL,
Figure BDA0003693276070002448
公司)和1X抗生素-抗真菌剂。将所有化合物溶解并稀释到二甲基亚砜(DMSO)中,然后将其添加到培养基中,使最终浓度为0.3%DMSO,从而从7uM开始以30点、1:3稀释系列进行测试。
染色和流式细胞术
为了进行活力分析,将样品洗涤并重悬于磷酸盐缓冲盐水(PBS)中,并用LIVE/DEADTM可固定紫色死细胞染色试剂盒(生命技术公司,L34963)染色20分钟。然后将细胞再次用PBS洗涤,并重悬于补充有2%胎牛血清(FBS)和2mM EDTA的PBS中,以准备进行细胞表面标志物分析。将细胞用别藻蓝素偶联的CD235a(1:100,BD生物科学公司,551336)抗体和Brilliant Violet偶联的CD71(1:100,BD生物科学公司,563767)抗体标记20分钟。为了分析细胞质胎儿血红蛋白(HbF),根据制造商的方案,使用固定缓冲液(
Figure BDA0003693276070002451
420801)和透化洗涤缓冲液(
Figure BDA0003693276070002452
421002)将细胞固定并透化。在透化步骤期间,将细胞用藻红蛋白偶联或FITC偶联的HbF特异性抗体(1:10-1:25,InvitrogenTM,MHFH04-4)染色30分钟。在FACSCantoTMII流式细胞仪或LSRFortessaTM(BD生物科学公司)上进行分析之前,将染色的细胞用磷酸盐缓冲盐水洗涤。使用FlowJoTM软件(BD生物科学公司)进行数据分析。
化合物的HbF诱导活性(表10)
将mPB CD34+细胞扩增6天,然后在化合物存在下使其红系分化7天。将细胞固定,染色并通过流式细胞术分析。表10示出了化合物的HbF诱导活性。HbF Amax=在拟合的剂量响应曲线中HbF阳性染色细胞的最高百分比(%HbF+细胞)。DMSO处理的细胞的基线%HbF+细胞约为30%-40%。
表10.
Figure BDA0003693276070002453
Figure BDA0003693276070002461
表1
Figure BDA0003693276070002462
Figure BDA0003693276070002471
Figure BDA0003693276070002481
Figure BDA0003693276070002491
Figure BDA0003693276070002501
Figure BDA0003693276070002511
Figure BDA0003693276070002521
Figure BDA0003693276070002531
Figure BDA0003693276070002541
Figure BDA0003693276070002551
Figure BDA0003693276070002561
Figure BDA0003693276070002571
Figure BDA0003693276070002581
Figure BDA0003693276070002591
Figure BDA0003693276070002601
Figure BDA0003693276070002611
Figure BDA0003693276070002621
Figure BDA0003693276070002631
Figure BDA0003693276070002641
Figure BDA0003693276070002651
Figure BDA0003693276070002661
Figure BDA0003693276070002671
Figure BDA0003693276070002681
Figure BDA0003693276070002691
Figure BDA0003693276070002701
Figure BDA0003693276070002711
Figure BDA0003693276070002721
Figure BDA0003693276070002731
Figure BDA0003693276070002741
Figure BDA0003693276070002751
Figure BDA0003693276070002761
Figure BDA0003693276070002771
Figure BDA0003693276070002781
Figure BDA0003693276070002791
Figure BDA0003693276070002801
Figure BDA0003693276070002811
Figure BDA0003693276070002821
Figure BDA0003693276070002831
Figure BDA0003693276070002841
Figure BDA0003693276070002851
Figure BDA0003693276070002861
Figure BDA0003693276070002871
Figure BDA0003693276070002881
Figure BDA0003693276070002891
Figure BDA0003693276070002901
Figure BDA0003693276070002911
Figure BDA0003693276070002921
Figure BDA0003693276070002931
Figure BDA0003693276070002941
Figure BDA0003693276070002951
Figure BDA0003693276070002961
Figure BDA0003693276070002971
Figure BDA0003693276070002981
Figure BDA0003693276070002991
Figure BDA0003693276070003001
Figure BDA0003693276070003011
Figure BDA0003693276070003021
Figure BDA0003693276070003031
Figure BDA0003693276070003041
Figure BDA0003693276070003051
Figure BDA0003693276070003061
Figure BDA0003693276070003071
Figure BDA0003693276070003081
Figure BDA0003693276070003091
Figure BDA0003693276070003101
Figure BDA0003693276070003111
Figure BDA0003693276070003121
Figure BDA0003693276070003131
Figure BDA0003693276070003141
Figure BDA0003693276070003151
Figure BDA0003693276070003161
Figure BDA0003693276070003171
Figure BDA0003693276070003181
Figure BDA0003693276070003191
Figure BDA0003693276070003201
Figure BDA0003693276070003211
Figure BDA0003693276070003221
Figure BDA0003693276070003231
Figure BDA0003693276070003241
Figure BDA0003693276070003251
Figure BDA0003693276070003261
Figure BDA0003693276070003271
Figure BDA0003693276070003281
Figure BDA0003693276070003291
Figure BDA0003693276070003301
Figure BDA0003693276070003311
Figure BDA0003693276070003321
Figure BDA0003693276070003331
Figure BDA0003693276070003341
Figure BDA0003693276070003351
Figure BDA0003693276070003361
Figure BDA0003693276070003371
Figure BDA0003693276070003381
Figure BDA0003693276070003391
Figure BDA0003693276070003401
Figure BDA0003693276070003411
Figure BDA0003693276070003421
Figure BDA0003693276070003431
Figure BDA0003693276070003441
Figure BDA0003693276070003451
Figure BDA0003693276070003461
Figure BDA0003693276070003471
Figure BDA0003693276070003481
Figure BDA0003693276070003491
Figure BDA0003693276070003501
Figure BDA0003693276070003511
Figure BDA0003693276070003521
Figure BDA0003693276070003531
Figure BDA0003693276070003541
Figure BDA0003693276070003551
Figure BDA0003693276070003561
Figure BDA0003693276070003571
Figure BDA0003693276070003581
Figure BDA0003693276070003591
Figure BDA0003693276070003601
Figure BDA0003693276070003611
Figure BDA0003693276070003621
Figure BDA0003693276070003631
Figure BDA0003693276070003641
Figure BDA0003693276070003651
Figure BDA0003693276070003661
Figure BDA0003693276070003671
Figure BDA0003693276070003681
Figure BDA0003693276070003691
Figure BDA0003693276070003701
Figure BDA0003693276070003711
Figure BDA0003693276070003721
表2
Figure BDA0003693276070003722
Figure BDA0003693276070003731
Figure BDA0003693276070003741
Figure BDA0003693276070003751
Figure BDA0003693276070003761
Figure BDA0003693276070003771
Figure BDA0003693276070003781
Figure BDA0003693276070003791
Figure BDA0003693276070003801
Figure BDA0003693276070003811
Figure BDA0003693276070003821
Figure BDA0003693276070003831
Figure BDA0003693276070003841
Figure BDA0003693276070003851
Figure BDA0003693276070003861
Figure BDA0003693276070003871
Figure BDA0003693276070003881
Figure BDA0003693276070003891
Figure BDA0003693276070003901
Figure BDA0003693276070003911
Figure BDA0003693276070003921
Figure BDA0003693276070003931
Figure BDA0003693276070003941
Figure BDA0003693276070003951
Figure BDA0003693276070003961
Figure BDA0003693276070003971
Figure BDA0003693276070003981
Figure BDA0003693276070003991
Figure BDA0003693276070004001
Figure BDA0003693276070004011
Figure BDA0003693276070004021
Figure BDA0003693276070004031
Figure BDA0003693276070004041
Figure BDA0003693276070004051
Figure BDA0003693276070004061
Figure BDA0003693276070004071
Figure BDA0003693276070004081
Figure BDA0003693276070004091
Figure BDA0003693276070004101
Figure BDA0003693276070004111
Figure BDA0003693276070004121
Figure BDA0003693276070004131
Figure BDA0003693276070004141
Figure BDA0003693276070004151
Figure BDA0003693276070004161
Figure BDA0003693276070004171
Figure BDA0003693276070004181
Figure BDA0003693276070004191
Figure BDA0003693276070004201
Figure BDA0003693276070004211
Figure BDA0003693276070004221
Figure BDA0003693276070004231
Figure BDA0003693276070004241
Figure BDA0003693276070004251
Figure BDA0003693276070004261
Figure BDA0003693276070004271
Figure BDA0003693276070004281
Figure BDA0003693276070004291
Figure BDA0003693276070004301
Figure BDA0003693276070004311
Figure BDA0003693276070004321
Figure BDA0003693276070004331
Figure BDA0003693276070004341
Figure BDA0003693276070004351
Figure BDA0003693276070004361
Figure BDA0003693276070004371
Figure BDA0003693276070004381
Figure BDA0003693276070004391
Figure BDA0003693276070004401
Figure BDA0003693276070004411
Figure BDA0003693276070004421
Figure BDA0003693276070004431
Figure BDA0003693276070004441
Figure BDA0003693276070004451
Figure BDA0003693276070004461
Figure BDA0003693276070004471
Figure BDA0003693276070004481
Figure BDA0003693276070004491
Figure BDA0003693276070004501
Figure BDA0003693276070004511
Figure BDA0003693276070004521
Figure BDA0003693276070004531
Figure BDA0003693276070004541
Figure BDA0003693276070004551
Figure BDA0003693276070004561
Figure BDA0003693276070004571
Figure BDA0003693276070004581
Figure BDA0003693276070004591
Figure BDA0003693276070004601
表3
Figure BDA0003693276070004602
Figure BDA0003693276070004611
Figure BDA0003693276070004621
Figure BDA0003693276070004631
Figure BDA0003693276070004641
Figure BDA0003693276070004651
Figure BDA0003693276070004661
Figure BDA0003693276070004671
Figure BDA0003693276070004681

Claims (91)

1.一种gRNA分子,其包含tracr和crRNA,其中所述crRNA包含与含有宽间隔的锌指的蛋白(WIZ)基因(例如,人WIZ基因)的靶序列互补的靶向结构域。
2.如权利要求1所述的gRNA分子,其中所述WIZ基因包含位于Chr19:15419978-15451624,-链,hg38的基因组核酸序列。
3.如权利要求1-2中任一项所述的gRNA分子,其中所述靶向结构域包含以下中的任一个,例如由以下中的任一个组成:SEQ ID NO:1至SEQ ID NO:3106或其片段。
4.如权利要求1-2中任一项所述的gRNA分子,其中所述靶向结构域包含以下中的任一个,例如由以下中的任一个组成:SEQ ID NO:1至SEQ ID NO:3106。
5.如权利要求1所述的gRNA分子,其中所述靶向结构域包含以下中的任一个,例如由以下中的任一个组成:SEQ ID NO:1488、SEQ ID NO:1565、SEQ ID NO:2801、SEQ ID NO:2809、SEQ ID NO:3071或其片段。
6.如权利要求2-5中任一项所述的gRNA分子,其中所述靶向结构域包含以下,例如由以下组成:所述靶向结构域序列中任何一个的17、18、19或20个连续核酸。
7.如权利要求6所述的gRNA分子,其中所述靶向结构域序列中任何一个的所述17、18、19、或20个连续核酸是布置于所述靶向结构域序列的3’端的17、18、19、或20个连续核酸。
8.如权利要求6所述的gRNA分子,其中所述靶向结构域序列中任何一个的所述17、18、19、或20个连续核酸是布置于所述靶向结构域序列的5’端的17、18、19、或20个连续核酸。
9.如权利要求6所述的gRNA分子,其中所述靶向结构域序列中任何一个的所述17、18、19、或20个连续核酸不包含所述靶向结构域序列的5'或3'核酸。
10.如权利要求2-9中任一项所述的gRNA分子,其中所述靶向结构域由所述靶向结构域序列组成。
11.如任一前述权利要求所述的gRNA分子,其中所述gRNA分子是双指导RNA分子。
12.如任一前述权利要求所述的gRNA分子,其中所述gRNA分子是单指导RNA分子。
13.如权利要求12所述的gRNA分子,所述gRNA分子包含:
(a)SEQ ID NO:3123;
(b)SEQ ID NO:3159;或
(c)以上(a)或(b)中的任一个,其在3'端进一步包含1、2、3、4、5、6或7个尿嘧啶(U)核苷酸;其中(a)至(c)中任一个的序列布置在所述靶向结构域3',任选地紧邻3'。
14.如权利要求1所述的gRNA分子,所述gRNA分子包含以下,例如由以下组成:
(a)tracr,其包含以下,例如由以下组成:SEQ ID NO:3152;或
(b)tracr,其包含以下,例如由以下组成:SEQ ID NO:3109或3174。
15.如任一前述权利要求所述的gRNA分子,其中
a)当将包含所述gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时,在与所述gRNA分子的靶向结构域互补的靶序列处或附近形成插入/缺失;和/或
b)当将包含所述gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞时,产生缺失,所述缺失包含WIZ基因中与所述gRNA靶向结构域互补(例如,与所述gRNA靶向结构域至少90%互补,例如与所述gRNA靶向结构域完全互补)的序列之间的序列,例如基本上全部序列。
16.如任一前述权利要求所述的gRNA分子,其中当将包含所述gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞群中时,在所述群的例如至少约15%、例如至少约17%、例如至少约20%、例如至少约30%、例如至少约40%、例如至少约50%、例如至少约55%、例如至少约60%、例如至少约70%、例如至少约75%的细胞中,在与所述gRNA分子的靶向结构域互补的靶序列处或附近形成插入/缺失。
17.如任一前述权利要求所述的gRNA分子,其中当将包含所述gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞(例如,细胞群)中时:
(a)胎儿血红蛋白的表达在所述细胞或其后代中增加,例如其红系细胞后代,例如其红细胞后代,任选地其中相对于未引入所述gRNA分子的细胞的群或其后代的群例如其红系细胞后代的群、例如其红细胞后代的群中胎儿血红蛋白的表达水平,所述胎儿血红蛋白的表达增加至少约15%,例如至少约17%,例如至少约20%,例如至少约25%,例如至少约30%,例如至少约35%,例如至少约40%;
(b)所述细胞或细胞群,或其后代,例如其红系细胞后代,例如其红细胞后代产生每个细胞至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白;
(c)在所述细胞中没有形成脱靶插入/缺失,例如,在WIZ基因之外没有形成脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测;和/或
(d)所述细胞群的超过约5%、例如超过约1%、例如超过约0.1%、例如超过约0.01%的细胞中检测不到脱靶插入/缺失,例如在WIZ基因之外检测不到脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测。
18.如任一前述权利要求所述的gRNA分子,其中所述细胞是(或细胞群包含)哺乳动物细胞、灵长类动物细胞或人细胞,例如,是人细胞,任选地其中所述细胞获自患有血红蛋白病的患者,所述血红蛋白病是例如镰状细胞疾病或地中海贫血,例如β-地中海贫血。
19.如权利要求18所述的gRNA分子,其中所述细胞是(或细胞群包含)HSPC,任选地CD34+HSPC,任选地CD34+CD90+HSPC。
20.如任一前述权利要求所述的gRNA分子,其中对于有待施用所述细胞的患者,所述细胞是自体的或同种异体的。
21.一种组合物,其包含:
1)一种或多种如权利要求1-20中任一项所述的gRNA分子(包括第一gRNA分子)、和Cas9分子;
2)一种或多种如权利要求1-20中任一项所述的gRNA分子(包括第一gRNA分子)、和包含编码Cas9分子的核苷酸序列的核酸;
3)包含一个或多个各自编码一种如权利要求1-20中任一项所述的gRNA分子(包括第一gRNA分子)的核苷酸序列的核酸、和Cas9分子;
4)包含一个或多个各自编码一种如权利要求1-20中任一项所述的gRNA分子(包括第一gRNA分子)的核苷酸序列的核酸、和包含编码Cas9分子的核苷酸序列的核酸;或
5)以上1)至4)中的任一个、和模板核酸;或
6)以上1)至4)中的任一个、和包含编码模板核酸的核苷酸序列的核酸。
22.一种组合物,其包含如权利要求1-20中任一项所述的第一gRNA分子,进一步包含Cas9分子,任选地,其中所述Cas9分子是活性或非活性的酿脓链球菌Cas9,任选地其中所述Cas9分子包含SEQ ID NO:3133或与其具有至少95%、96%、97%、98%或99%序列同源性的序列。
23.如权利要求21-22中任一项所述的组合物,其中所述Cas9分子包含以下,例如由以下组成:
(a)SEQ ID NO:3161;
(b)SEQ ID NO:3162;
(c)SEQ ID NO:3163;
(d)SEQ ID NO:3164;
(e)SEQ ID NO:3165;
(f)SEQ ID NO:3166;
(g)SEQ ID NO:3167;
(h)SEQ ID NO:3168;
(i)SEQ ID NO:3169;
(j)SEQ ID NO:3170;
(k)SEQ ID NO:3171;或
(l)SEQ ID NO:3172。
24.如权利要求21-23中任一项所述的组合物,其中所述第一gRNA分子和Cas9分子存在于核糖核蛋白复合物(RNP)中。
25.如权利要求21-24中任一项所述的组合物,所述组合物被配制在适于电穿孔的介质中。
26.如权利要求21-25中任一项所述的组合物,其中每种所述gRNA分子与本文所述的Cas9分子处于RNP中,并且其中每种所述RNP的浓度小于约10uM,例如小于约3uM、例如小于约1uM、例如小于约0.5uM、例如小于约0.3uM、例如小于约0.1uM,任选地其中所述RNP的浓度为约2uM或约1uM,任选地其中所述组合物进一步包含细胞例如HSPC的群。
27.一种核酸序列,其编码一种或多种如权利要求1-20中任一项所述的gRNA分子。
28.一种载体,其包含如权利要求27所述的核酸,任选地其中所述载体选自由以下组成的组:慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、质粒、微环、纳米质粒和RNA载体。
29.一种在细胞内的靶序列处或附近改变所述细胞(例如细胞群)(例如改变核酸的结构(例如序列))的方法,所述方法包括使所述细胞(例如细胞群)与以下进行接触(例如向所述细胞(例如细胞群)中引入以下):
1)一种或多种如权利要求1-20中任一项所述的gRNA分子、和Cas9分子;
2)一种或多种如权利要求1-20中任一项所述的gRNA分子、和包含编码Cas9分子的核苷酸序列的核酸;
3)包含一个或多个各自编码一种如权利要求1-20中任一项所述的gRNA分子的核苷酸序列的核酸、和Cas9分子;
4)包含一个或多个各自编码一种如权利要求1-20中任一项所述的gRNA分子的核苷酸序列的核酸、和包含编码Cas9分子的核苷酸序列的核酸;
5)以上1)至4)中的任一个、和模板核酸;
6)以上1)至4)中的任一个、和包含编码模板核酸的核苷酸序列的核酸;
7)如权利要求21-26中任一项所述的组合物;或
8)如权利要求28所述的载体。
30.如权利要求29所述的方法,其中所述细胞是动物细胞,例如哺乳动物细胞、灵长类动物细胞或人细胞,例如是人细胞;任选地,其中所述细胞获自患有血红蛋白病的患者,所述血红蛋白病是例如镰状细胞疾病或地中海贫血,例如β-地中海贫血。
31.如权利要求29-30中任一项所述的方法,其中所述细胞是HSPC,任选地CD34+HSPC,任选地CD34+CD90+HSPC。
32.如权利要求29-31中任一项所述的方法,其中将所述细胞布置于包含已富集CD34+细胞的细胞群的组合物中。
33.如权利要求29-32中任一项所述的方法,其中从骨髓、外周血(例如,动员的外周血)或脐带血分离所述细胞(例如细胞群)。
34.如权利要求29-33中任一项所述的方法,其中对于有待施用所述细胞的患者,所述细胞是自体的或同种异体的。
35.如权利要求29-34中任一项所述的方法,其中:
a)所述改变导致在与所述一种或多种gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;和/或
b)所述改变导致缺失,所述缺失包含WIZ基因中与所述一种或多种gRNA分子的靶向结构域互补(例如,与所述gRNA靶向结构域至少90%互补,例如,与所述gRNA靶向结构域完全互补)的序列之间的序列,例如基本上所有序列。
36.如权利要求29-35中任一项所述的方法,其中:
(a)所述方法产生细胞群,其中所述群的至少约15%,例如至少约17%、例如至少约20%、例如至少约30%、例如至少约40%、例如至少约50%、例如至少约55%、例如至少约60%、例如至少约70%、例如至少约75%已被改变,例如包含插入/缺失;
(b)所述改变产生细胞(例如细胞群),所述细胞(例如细胞群)能够分化成红系细胞谱系的分化的细胞(例如红细胞),并且其中所述分化的细胞例如相对于未经改变的细胞(例如细胞群)表现出增加的胎儿血红蛋白水平;
(c)所述改变产生细胞群,所述细胞群能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群例如相对于未经改变的细胞群具有增加的F细胞百分比(例如,F细胞百分比高至少约15%、高至少约20%、高至少约25%、高至少约30%、或高至少约40%);和/或
(d)所述改变产生细胞(例如细胞群),所述细胞(例如细胞群)能够分化成分化的细胞,例如红系细胞谱系细胞(例如红细胞),并且其中所述分化的细胞产生每个细胞至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。
37.一种通过如权利要求29-36中任一项所述的方法改变的细胞,或一种通过如权利要求29-36中任一项所述的方法能获得的细胞。
38.一种细胞,所述细胞包含如权利要求1-20中任一项所述的第一gRNA分子、或如权利要求21-26中任一项所述的组合物、如权利要求27所述的核酸、或如权利要求28所述的载体。
39.如权利要求37-38中任一项所述的细胞,其中所述细胞能够分化成分化的细胞,例如红系细胞谱系细胞(例如红细胞),并且其中所述分化的细胞例如相对于未经修饰以包含gRNA分子的相同类型的细胞表现出增加的胎儿血红蛋白水平,任选地其中例如相对于未经修饰以包含gRNA分子的相同类型的分化的细胞,所述分化的细胞(例如红系细胞谱系细胞,例如红细胞)产生至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。
40.如权利要求37-39中任一项所述的细胞,所述细胞已与干细胞扩增剂进行了接触。
41.如权利要求40所述的细胞,其中所述干细胞扩增剂是:
a)(1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺;
b)甲基4-(3-哌啶-1-基丙基氨基)-9H-嘧啶并[4,5-b]吲哚-7-甲酸酯;
c)4-(2-(2-(苯并[b]噻吩-3-基)-9-异丙基-9H-嘌呤-6-基氨基)乙基)苯酚;
d)(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇;或
e)其组合(例如,(1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺和(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)。
42.一种细胞,例如如权利要求37-41中任一项所述的细胞,所述细胞包含:
a)与如权利要求1-20中任一项所述的gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;和/或
b)缺失,所述缺失包含WIZ基因中与如权利要求1-20中任一项所述的gRNA分子的靶向结构域互补(例如,与所述gRNA靶向结构域至少90%互补,例如,与所述gRNA靶向结构域完全互补)的序列之间的序列,例如基本上所有序列。
43.如权利要求37-42中任一项所述的细胞,其中所述细胞是动物细胞,例如哺乳动物细胞、灵长类动物细胞或人细胞,例如是人细胞;任选地,其中所述细胞获自患有血红蛋白病的患者,所述血红蛋白病是例如镰状细胞疾病或地中海贫血,例如β-地中海贫血。
44.如权利要求37-43中任一项所述的细胞,其中所述细胞是HSPC,任选地CD34+HSPC,任选地CD34+CD90+HSPC。
45.如权利要求37-44中任一项所述的细胞,其中从骨髓、外周血(例如,动员的外周血)或脐带血分离所述细胞(例如细胞群)。
46.如权利要求37-45中任一项所述的细胞,其中对于有待施用所述细胞的患者,所述细胞是自体的或同种异体的。
47.一种细胞群,所述细胞群包含如权利要求37-46中任一项所述的细胞,任选地其中所述群的至少约50%,例如至少约60%、例如至少约70%、例如至少约80%、例如至少约90%(例如至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%)的细胞是如权利要求37-46中任一项所述的细胞。
48.如权利要求47所述的细胞群,其中所述细胞群能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群例如相对于相同类型的未经修饰的细胞群具有增加的F细胞百分比(例如,F细胞百分比高至少约15%、高至少约17%、高至少约20%、高至少约25%、高至少约30%、或高至少约40%);任选地其中所述分化的细胞群的F细胞产生每个细胞平均至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。
49.如权利要求47-48中任一项所述的细胞群,所述细胞群包含:
1)至少1e6个CD34+细胞/kg待施用所述细胞的患者体重;
2)至少2e6个CD34+细胞/kg待施用所述细胞的患者体重;
3)至少3e6个CD34+细胞/kg待施用所述细胞的患者体重;
4)至少4e6个CD34+细胞/kg待施用所述细胞的患者体重;或
5)从2e6个到10e6个CD34+细胞/kg待施用所述细胞的患者体重。
50.如权利要求47-49中任一项所述的细胞群,其中所述群的至少约40%,例如至少约50%(例如,至少约60%、至少约70%、至少约80%、或至少约90%)的细胞是CD34+细胞,任选地其中所述群的至少约10%,例如至少约15%、例如至少约20%、例如至少约30%的细胞是CD34+CD90+细胞。
51.如权利要求47-50中任一项所述的细胞群,其中所述细胞群衍生自脐带血、外周血(例如,动员的外周血)或骨髓,例如衍生自骨髓。
52.如权利要求47-51中任一项所述的细胞群,其中所述细胞群包含以下,例如由以下组成:哺乳动物细胞,例如人细胞,任选地其中所述细胞群获自患有血红蛋白病的患者,例如镰状细胞疾病或地中海贫血,例如β-地中海贫血。
53.如权利要求47-52中任一项所述的细胞群,其中所述细胞群(i)相对于其将被施用的患者是自体的,或(ii)相对于其将被施用的患者是同种异体的。
54.一种组合物,其包含如权利要求37-53中任一项所述的细胞或细胞群,任选地包含药学上可接受的介质,例如适于冷冻保存的药学上可接受的介质。
55.一种治疗血红蛋白病的方法,所述方法包括向患者施用如权利要求37-53中任一项所述的细胞或细胞群或如权利要求54所述的组合物或降低WIZ基因表达和/或WIZ蛋白活性的组合物。
56.一种增加哺乳动物中胎儿血红蛋白表达的方法,所述方法包括向患者施用如权利要求37-53中任一项所述的细胞或细胞群或如权利要求54所述的组合物或降低WIZ基因表达和/或WIZ蛋白活性的组合物。
57.如权利要求55所述的方法,其中所述血红蛋白病是β-地中海贫血或镰状细胞疾病。
58.如权利要求55或56所述的方法,其中降低WIZ基因表达和/或WIZ蛋白活性的所述组合物包含小分子化合物、siRNA、shRNA、反义寡核苷酸(ASO)、miRNA、抗微小RNA寡核苷酸(AMO)或其任何组合。
59.一种制备细胞(例如细胞群)的方法,所述方法包括:
(a)提供细胞(例如细胞群)(例如HSPC(例如HSPC群));
(b)在包含干细胞扩增剂的细胞培养基中离体培养所述细胞(例如所述细胞群);以及
(c)向所述细胞中引入如权利要求1-20中任一项所述的第一gRNA分子、编码如权利要求1-20中任一项所述的第一gRNA分子的核酸分子、如权利要求21-26中任一项所述的组合物、如权利要求27所述的核酸、或如权利要求28所述的载体。
60.如权利要求59所述的方法,其中在步骤(c)的所述引入之后,所述细胞(例如细胞群)能够分化成分化的细胞(例如分化的细胞群),例如红系细胞谱系细胞(例如红系细胞谱系细胞群),例如红细胞(例如红细胞群),并且其中所述分化的细胞(例如分化的细胞群)例如相对于未经受步骤(c)的相同细胞产生增加的胎儿血红蛋白。
61.如权利要求59-60中任一项所述的方法,其中所述干细胞扩增剂是:
a)(1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺;
b)甲基4-(3-哌啶-1-基丙基氨基)-9H-嘧啶并[4,5-b]吲哚-7-甲酸酯;
c)4-(2-(2-(苯并[b]噻吩-3-基)-9-异丙基-9H-嘌呤-6-基氨基)乙基)苯酚;
d)(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇;或
e)其组合(例如,(1r,4r)-N1-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺和(S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-1-醇)。
62.如权利要求59-61中任一项所述的方法,其中所述细胞培养基包含血小板生成素(Tpo)、Flt3配体(Flt-3L)和人干细胞因子(SCF),任选地其中所述细胞培养基进一步包含人白细胞介素6(IL-6);任选地,其中所述细胞培养基包含血小板生成素(Tpo)、Flt3配体(Flt-3L)、人干细胞因子(SCF)和如果存在的话人IL-6,各自的浓度范围为约10ng/mL至约1000ng/mL,任选地各自的浓度为约50ng/mL,例如浓度为50ng/mL。
63.如权利要求59-62中任一项所述的方法,其中所述细胞培养基包含干细胞扩增剂,所述干细胞扩增剂的浓度范围为约1nM至约1mM,任选地浓度范围为约1uM至约100nM,任选地浓度范围为约500nM至约750nM,任选地浓度为约500nM,例如浓度为500nM,或浓度为约750nM,例如浓度为750nM。
64.如权利要求59-63中任一项所述的方法,其中步骤(b)的培养包括在步骤(c)的引入之前的培养期,任选地其中在步骤(c)的引入之前的培养期为至少12小时,例如为约1天至约12天的时间段,例如为约1天至约6天的时间段,例如为约1天至约3天的时间段,例如为约1天至约2天的时间段,或为约2天的时间段。
65.如权利要求59-64中任一项所述的方法,其中步骤(b)的培养包括在步骤(c)的引入后的培养期,任选地其中在步骤(c)的引入之后的培养期为至少12小时,例如为约1天至约12天的时间段,例如为约1天至约6天的时间段,例如为约2天至约4天的时间段,例如为约2天的时间段或为约3天的时间段或为约4天的时间段。
66.如权利要求59-65中任一项所述的方法,其中所述细胞群离体扩增至少3倍,例如至少4倍,例如至少5倍,例如至少10倍。
67.如权利要求59-66中任一项所述的方法,其中步骤(c)的引入包括电穿孔。
68.如权利要求59-67中任一项所述的方法,其中步骤(a)中提供的细胞(例如,细胞群)是人细胞(例如,人细胞群)。
69.如权利要求68所述的方法,其中步骤(a)中提供的细胞(例如细胞群)分离自骨髓、外周血(例如动员的外周血)或脐带血。
70.如权利要求69所述的方法,其中
(i)步骤(a)中提供的细胞(例如细胞群)分离自骨髓,例如分离自患有血红蛋白病的患者的骨髓,任选地其中所述血红蛋白病是镰状细胞疾病或地中海贫血,任选地其中所述地中海贫血是β地中海贫血;或
(ii)步骤(a)中提供的细胞(例如细胞群)分离自外周血,例如分离自患有血红蛋白病的患者的外周血,任选地其中所述血红蛋白病是镰状细胞疾病或地中海贫血,任选地其中所述地中海贫血是β地中海贫血;任选地其中所述外周血是动员的外周血,任选地其中使用普乐沙福、G-CSF或其组合动员所述动员的外周血。
71.如权利要求59-70中任一项所述的方法,其中步骤(a)中提供的细胞群富集CD34+细胞。
72.如权利要求59-71中任一项所述的方法,其中在步骤(c)的引入之后,冷冻保存所述细胞(例如细胞群)。
73.如权利要求59-72中任一项所述的方法,其中在步骤(c)的引入之后,所述细胞(例如细胞群)包含:
a)与所述第一gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;和/或
b)缺失,所述缺失包含WIZ基因中与所述第一gRNA分子的靶向结构域互补(例如,与所述gRNA靶向结构域至少90%互补,例如,与所述gRNA靶向结构域完全互补)的序列之间的序列,例如基本上所有序列。
74.如权利要求59-73中任一项所述的方法,其中:
(a)在步骤(c)的引入之后,所述细胞群的至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的细胞包含在与所述第一gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;
(b)在步骤(c)的引入后,所述细胞(例如细胞群)能够分化成红系细胞谱系的分化的细胞(例如红细胞),并且其中所述分化的细胞例如相对于未经改变的细胞(例如细胞群)表现出增加的胎儿血红蛋白水平;
(c)在步骤(c)的引入后,所述细胞群能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群例如相对于未经改变的细胞群具有增加的F细胞百分比(例如,F细胞百分比高至少约15%、高至少约20%、高至少约25%、高至少约30%、或高至少约40%);
(d)在步骤(c)的引入后,所述细胞(例如细胞群)能够分化成分化的细胞,例如红系细胞谱系细胞(例如红细胞),并且其中所述分化的细胞(例如,分化的细胞群)产生每个细胞至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白;
(e)在步骤(c)的引入后,在所述细胞中没有形成脱靶插入/缺失,例如,在WIZ基因之外没有形成脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测;和/或
(f)在步骤(c)的引入后,所述细胞群的超过约5%、例如超过约1%、例如超过约0.1%、例如超过约0.01%的细胞中检测不到脱靶插入/缺失,例如在WIZ基因之外检测不到脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测。
75.一种细胞(例如细胞群),所述细胞(例如细胞群)通过如权利要求59-74中任一项所述的方法可获得。
76.一种细胞,例如改变的细胞,例如如权利要求75所述的细胞,其中:
(a)所述细胞群的至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的细胞包含在与如权利要求1-20中任一项所述的gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失;
(b)所述细胞(例如细胞群)能够分化成红系细胞谱系的分化的细胞(例如红细胞),并且其中所述分化的细胞例如相对于未经改变的细胞(例如细胞群)表现出增加的胎儿血红蛋白水平;
(c)所述细胞群能够分化成分化的细胞群,例如红系细胞谱系细胞群(例如红细胞群),并且其中所述分化的细胞群例如相对于未经改变的细胞群具有增加的F细胞百分比(例如,F细胞百分比高至少约15%、高至少约20%、高至少约25%、高至少约30%、或高至少约40%);
(d)所述细胞(例如细胞群)能够分化成分化的细胞,例如红系细胞谱系细胞(例如红细胞),并且其中所述分化的细胞(例如,分化的细胞群)产生每个细胞至少约6皮克(例如,至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白;
(e)在所述细胞中没有形成脱靶插入/缺失,例如,在WIZ基因之外没有形成脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测;
(f)所述细胞群的超过约5%、例如超过约1%、例如超过约0.1%、例如超过约0.01%的细胞中检测不到脱靶插入/缺失,例如在WIZ基因之外检测不到脱靶插入/缺失,例如,这可通过下一代测序和/或核苷酸插入测定而检测;和/或
(g)任选地如通过检测与如权利要求1-20中任一项所述的gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失而检测的,所述细胞或其后代在其被移植的患者中在移植后超过16周、超过20周或超过24周时是可被检测的。
77.如权利要求75-76中任一项所述的细胞,其中所述细胞是动物细胞,例如哺乳动物细胞、灵长类动物细胞或人细胞,例如是人细胞;任选地,其中所述细胞获自患有血红蛋白病的患者,所述血红蛋白病是例如镰状细胞疾病或地中海贫血,例如β-地中海贫血。
78.如权利要求75-77中任一项所述的细胞,其中所述细胞是HSPC,任选地CD34+HSPC,任选地CD34+CD90+HSPC。
79.如权利要求75-78中任一项所述的细胞,其中从骨髓、外周血(例如,动员的外周血)或脐带血分离所述细胞(例如细胞群)。
80.如权利要求75-79中任一项所述的细胞,其中对于有待施用所述细胞的患者,所述细胞是自体的或同种异体的。
81.一种治疗血红蛋白病的方法,所述方法包括向人患者施用包含如权利要求37-53或74-79中任一项所述的细胞或细胞群的组合物或降低WIZ基因表达和/或WIZ蛋白活性的组合物。
82.一种增加人患者中胎儿血红蛋白表达的方法,所述方法包括向所述人患者施用包含如权利要求37-53或74-79中任一项所述的细胞或细胞群的组合物的或降低WIZ基因表达和/或WIZ蛋白活性的组合物。
83.如权利要求81所述的方法,其中所述血红蛋白病是β-地中海贫血或镰状细胞疾病。
84.如权利要求81-83中任一项所述的方法,其中向所述人患者施用组合物,所述组合物包含至少约1e6个如权利要求37-53或74-79中任一项所述的细胞/kg人患者体重,例如,至少约1e6个如权利要求37-53或74-79中任一项所述的CD34+细胞/kg人患者体重。
85.如权利要求81-84中任一项所述的方法,其中任选地如通过检测与如权利要求1-20中任一项所述的gRNA分子的靶向结构域互补的基因组DNA序列处或附近的插入/缺失而检测的,所述细胞或细胞群、或其后代在施用后超过16周、超过20周或超过24周时在所述人患者中是可检测的;任选地其中参考细胞群(例如,CD34+细胞)中插入/缺失的检测水平在施用后超过16周、超过20周或超过24周时相对于即将施用前所述细胞群中插入/缺失的检测水平降低不超过50%、不超过40%、不超过30%、不超过20%、不超过10%、不超过5%或不超过1%。
86.如权利要求81或权利要求82所述的方法,其中降低WIZ基因表达和/或WIZ蛋白活性的所述组合物包含小分子化合物、siRNA、shRNA、ASO、miRNA、AMO或其任何组合。
87.如权利要求1-20中任一项所述的gRNA分子、如权利要求21-26或54中任一项所述的组合物、如权利要求27所述的核酸、如权利要求28所述的载体、如权利要求37-53或75-80中任一项所述的细胞或细胞群、或降低WIZ基因表达和/或WIZ蛋白活性的组合物,用作药物。
88.如权利要求1-20中任一项所述的gRNA分子、如权利要求21-26或54中任一项所述的组合物、如权利要求27所述的核酸、如权利要求28所述的载体、如权利要求37-53或75-80中任一项所述的细胞或细胞群、或降低WIZ基因表达和/或WIZ蛋白活性的组合物,用于制造药物。
89.如权利要求1-20中任一项所述的gRNA分子、如权利要求21-26或54中任一项所述的组合物、如权利要求27所述的核酸、如权利要求28所述的载体、如权利要求37-53或75-80中任一项所述的细胞或细胞群、或降低WIZ基因表达和/或WIZ蛋白活性的组合物,用于治疗疾病。
90.如权利要求1-20中任一项所述的gRNA分子、如权利要求21-26或54中任一项所述的组合物、如权利要求27所述的核酸、如权利要求28所述的载体、如权利要求37-53或75-80中任一项所述的细胞或细胞群、或降低WIZ基因表达和/或WIZ蛋白活性的组合物,用于治疗疾病,其中所述疾病是血红蛋白病,任选地其中所述血红蛋白病是镰状细胞疾病或地中海贫血(例如β-地中海贫血)。
91.如权利要求87-90所述的gRNA分子、组合物、核酸、载体、细胞或细胞群、或降低WIZ基因表达和/或WIZ蛋白活性的组合物,其中降低WIZ基因表达和/或WIZ蛋白活性的所述组合物包含小分子化合物、siRNA、shRNA、ASO、miRNA、AMO或其任何组合。
CN202080086828.7A 2019-12-18 2020-12-16 用于治疗血红蛋白病的组合物和方法 Pending CN115176005A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962950048P 2019-12-18 2019-12-18
US201962950025P 2019-12-18 2019-12-18
US62/950,025 2019-12-18
US62/950,048 2019-12-18
PCT/IB2020/001098 WO2021123920A1 (en) 2019-12-18 2020-12-16 Compositions and methods for the treatment of hemoglobinopathies

Publications (1)

Publication Number Publication Date
CN115176005A true CN115176005A (zh) 2022-10-11

Family

ID=74701511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080086828.7A Pending CN115176005A (zh) 2019-12-18 2020-12-16 用于治疗血红蛋白病的组合物和方法

Country Status (5)

Country Link
US (1) US20230279394A1 (zh)
EP (1) EP4077676A1 (zh)
JP (1) JP2023506842A (zh)
CN (1) CN115176005A (zh)
WO (1) WO2021123920A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023164636A1 (en) * 2022-02-25 2023-08-31 Vor Biopharma Inc. Compositions and methods for homology-directed repair gene modification

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5800815A (en) 1903-05-05 1998-09-01 Cytel Corporation Antibodies to P-selectin and their uses
WO1993021956A1 (en) 1992-05-05 1993-11-11 Cytel Corporation Antibodies to p-selectin and their uses
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US6309639B1 (en) 1991-02-05 2001-10-30 The Board Of Regents Of The University Of Oklahoma Method for inhibiting an inflammatory response using antibodies to P-selectin glycoprotein ligand
US5622701A (en) 1994-06-14 1997-04-22 Protein Design Labs, Inc. Cross-reacting monoclonal antibodies specific for E- and P-selectin
AR013269A1 (es) 1997-08-04 2000-12-13 Scras Producto que contiene por lo menos un rna de doble filamento combinado con por lo menos un agente anti-viral, para la utilizacion terapeutica en eltratamiento de una enfermedad viral, en especial de la hepatitis viral
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
AUPP249298A0 (en) 1998-03-20 1998-04-23 Ag-Gene Australia Limited Synthetic genes and genetic constructs comprising same I
GB9827152D0 (en) 1998-07-03 1999-02-03 Devgen Nv Characterisation of gene function using double stranded rna inhibition
AU776150B2 (en) 1999-01-28 2004-08-26 Medical College Of Georgia Research Institute, Inc. Composition and method for (in vivo) and (in vitro) attenuation of gene expression using double stranded RNA
DE19956568A1 (de) 1999-01-30 2000-08-17 Roland Kreutzer Verfahren und Medikament zur Hemmung der Expression eines vorgegebenen Gens
WO2001029058A1 (en) 1999-10-15 2001-04-26 University Of Massachusetts Rna interference pathway genes as tools for targeted genetic interference
GB9927444D0 (en) 1999-11-19 2000-01-19 Cancer Res Campaign Tech Inhibiting gene expression
WO2002059300A2 (en) 2000-12-28 2002-08-01 J & J Research Pty Ltd Double-stranded rna-mediated gene suppression
US20060019912A1 (en) 2003-12-19 2006-01-26 Chiron Corporation Cell transfecting formulations of small interfering RNA related compositions and methods of making and use
CA2885854C (en) 2004-04-13 2017-02-21 F. Hoffmann-La Roche Ag Anti-p-selectin antibodies
US8945565B2 (en) 2006-12-01 2015-02-03 Selexys Pharmaceuticals Corporation Methods of treating inflammatory or thrombotic conditions with anti-P-selectin antibodies
WO2008069999A2 (en) 2006-12-01 2008-06-12 Selexys Pharmaceuticals Corporation Anti-p-selectin antibodies and methods of using the same to treat inflammatory diseases
US20110212096A1 (en) 2006-12-01 2011-09-01 Scott Rollins Anti-p-selectin antibodies and methods of their use and identification
PE20100362A1 (es) 2008-10-30 2010-05-27 Irm Llc Derivados de purina que expanden las celulas madre hematopoyeticas
EP2516010A2 (en) 2009-12-23 2012-10-31 Novartis AG Lipids, lipid compositions, and methods of using them
US20130171241A1 (en) 2010-07-06 2013-07-04 Novartis Ag Liposomes with lipids having an advantageous pka-value for rna delivery
RU2577983C2 (ru) 2010-08-31 2016-03-20 Новартис Аг Липиды, подходящие для липосомной доставки кодирующей белок рнк
ES2861428T3 (es) 2011-07-06 2021-10-06 Glaxosmithkline Biologicals Sa Liposomas que presentan una relación N:P útil para suministro de moléculas de ARN
CN113337402A (zh) 2011-10-17 2021-09-03 麻省理工学院 细胞内传递
US9394547B2 (en) 2012-01-03 2016-07-19 City University Of Hong Kong Method and apparatus for delivery of molecules to cells
WO2013103467A1 (en) 2012-01-06 2013-07-11 Alcon Research, Ltd. Interfering rna delivery system and uses thereof
US9409906B2 (en) 2012-01-27 2016-08-09 Universite De Montreal Pyrimido[4,5-B]indole derivatives and use thereof in the expansion of hematopoietic stem cells
AU2014218621B2 (en) 2013-02-25 2019-11-07 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
JP6352950B2 (ja) 2013-03-08 2018-07-04 ノバルティス アーゲー 活性薬物の送達のための脂質と脂質組成物
ES2923018T3 (es) 2013-03-15 2022-09-22 Glaxosmithkline Biologicals Sa Métodos de purificación de ARN
CA2902709A1 (en) 2013-03-15 2014-09-25 Global Blood Therapeutics, Inc. Compositions and methods for the modulation of hemoglobin (s)
CN105848793B (zh) 2013-08-16 2019-03-05 麻省理工学院 材料选择性的递送至细胞
PT3083556T (pt) 2013-12-19 2020-03-05 Novartis Ag Lípidos e composições lipídicas para a entrega de agentes ativos
EP3083579B1 (en) 2013-12-19 2022-01-26 Novartis AG Lipids and lipid compositions for the delivery of active agents
EP3556858A3 (en) * 2014-04-09 2020-01-22 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating cystic fibrosis
EP3526260A4 (en) 2016-10-13 2020-11-18 President and Fellows of Harvard College NON-MYELOABLATIVE PACKAGING COMPOSITIONS AND METHODS
US20180135080A1 (en) * 2016-11-15 2018-05-17 Genomic Vision Sa Method for the monitoring of modified nucleases induced-gene editing events by molecular combing
US20180305719A1 (en) * 2017-04-19 2018-10-25 The Board Of Trustees Of The University Of Illinois Vectors For Integration Of DNA Into Genomes And Methods For Altering Gene Expression And Interrogating Gene Function

Also Published As

Publication number Publication date
JP2023506842A (ja) 2023-02-20
EP4077676A1 (en) 2022-10-26
WO2021123920A1 (en) 2021-06-24
US20230279394A1 (en) 2023-09-07

Similar Documents

Publication Publication Date Title
US20230118337A1 (en) Compositions and methods for the treatment of hemoglobinopathies
US20240002843A1 (en) Compositions and methods for the treatment of hemoglobinopathies
US20230018543A1 (en) Crispr/cas-mediated gene conversion
JP7396783B2 (ja) 移植を改善するためのcrispr/cas関連方法および組成物
JP7030522B2 (ja) 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
US20180119123A1 (en) Crispr/cas-related methods and compositions for treating hiv infection and aids
JP2019525759A (ja) Bcl11aホーミングエンドヌクレアーゼバリアント、組成物、および使用方法
US20230279394A1 (en) Compositions and methods for the treatment of hemoglobinopathies
WO2022269518A2 (en) Compositions and methods for the treatment of hemoglobinopathies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination