CN116724115A - 包括dna编辑酶的硫代磷酸酯核酸偶联物 - Google Patents

包括dna编辑酶的硫代磷酸酯核酸偶联物 Download PDF

Info

Publication number
CN116724115A
CN116724115A CN202180060117.7A CN202180060117A CN116724115A CN 116724115 A CN116724115 A CN 116724115A CN 202180060117 A CN202180060117 A CN 202180060117A CN 116724115 A CN116724115 A CN 116724115A
Authority
CN
China
Prior art keywords
nucleic acid
cell
complex
phosphorothioate
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180060117.7A
Other languages
English (en)
Inventor
H·于
Y-J·李
A·赫尔曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
City of Hope
Original Assignee
City of Hope
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by City of Hope filed Critical City of Hope
Publication of CN116724115A publication Critical patent/CN116724115A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3513Protein; Peptide

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)

Abstract

本文尤其提供了能用于体外和体内编辑(例如,修复、修饰)细胞中的DNA的复合物。本文所提供的所述复合物包括通过化学接头结合到硫代磷酸酯核酸的DNA编辑剂。所述化学接头(例如,二硫化物接头)可以是一旦复合物进入细胞内部就解离的接头,从而释放所述DNA编辑剂并允许所述DNA编辑剂接近并编辑细胞靶序列。本文所提供的所述复合物表现出高转染效率和编辑效力,因此提供了有用的治疗工具和诊断工具。

Description

包括DNA编辑酶的硫代磷酸酯核酸偶联物
相关申请的交叉引用
本申请要求于2020年5月22日提交的美国临时申请号63/029,225的权益,该申请以全文引用的方式并入本文并用于所有目的。
对“序列表”、表格或作为ASCII文件提交的计算机程序列表附录的引用
写入文件048440-764001WO_ST25.TXT中的序列表以引用的方式并入本文,该文件创建于2021年5月21日,大小为89,323字节,机器格式为IBM-PC且系统为MS-Windows操作系统。
关于在联邦资助的研究和开发下所作发明的权利的声明
本发明是在美国国立卫生研究院授予的NIH CA247368的政府支持下进行的。政府对本发明具有某些权利。
背景技术
编辑细胞如T细胞、造血干细胞、癌细胞和其它类型的细胞中的基因可对治疗各种疾病都有很大的影响。作为一个实例,离体CAR-T细胞中Cas9介导的基因删除的结果是CAR-T细胞在癌症患者体内的效力提高(Edward Stadtmauer等人,《科学(Science)》,2020)。然而,将Cas9酶和向导RNA引入细胞,尤其是T细胞和造血干细胞的当前方法面临多重挑战。将Cas9蛋白/向导RNA电穿孔到T细胞中,在杀死和削弱T细胞的同时,只能实现低转染效率。Cas9蛋白/向导RNA电穿孔后,只有极少量的T细胞可以被慢病毒载体转导(EdwardStadtmauer等人,《科学》,2020),这是生成CAR-T细胞所需要的。使用慢病毒递送Cas9编码基因和特异性向导RNA也会将不必要的病毒基因添加到治疗性T细胞中并引起制造延迟,从而降低了对患者成功进行CAR-T治疗的机会。本文特别提供了本领域中这些和其它问题的解决方案。
发明内容
在一个方面,提供了一种用于将基因编辑剂递送至细胞的复合物。该复合物包括通过化学接头共价结合到硫代磷酸酯核酸的基因编辑剂。
在一个方面,提供了一种用于将基因编辑剂递送至细胞的复合物。该复合物包括:(i)双链硫代磷酸酯寡核苷酸;(ii)通过第一化学接头共价结合到第一硫代磷酸酯核酸的第一基因编辑剂;和(ii)通过第二化学接头共价结合到第二硫代磷酸酯核酸的第二基因编辑剂;其中第一硫代磷酸酯核酸的至少一部分和第二硫代磷酸酯核酸的一部分彼此互补,并且其中第一硫代磷酸酯核酸的至少一部分与第二硫代磷酸酯核酸的至少一部分杂交,从而形成双链硫代磷酸酯寡核苷酸。
在另一方面,提供了一种用于将基因编辑剂递送至细胞的复合物。该复合物包括(i)双链硫代磷酸酯寡核苷酸;(ii)通过第一化学接头共价结合到第一硫代磷酸酯核酸的基因编辑剂;和(ii)通过第二化学接头共价结合到第二硫代磷酸酯核酸的靶向剂,其中第一硫代磷酸酯核酸的至少一部分和第二硫代磷酸酯核酸的一部分彼此互补。并且其中第一硫代磷酸酯核酸的至少一部分与所述第二硫代磷酸酯核酸的至少一部分杂交,从而形成双链硫代磷酸酯寡核苷酸。
在一个方面,提供了一种药物组合物。该药物组合物包括药物赋形剂和如本文所提供的复合物,包括其实施例。
在一个方面,提供了一种将基因编辑剂递送至细胞的方法。该方法包括使细胞与本文所提供的复合物(包括其实施例)接触,从而将基因编辑剂递送至细胞。
附图说明
图1是示出硫代磷酸酯化寡核苷酸(PS)偶联到具有伯胺醛共价键的Cas9蛋白的凝胶的代表性图像。将Cas9蛋白与醛硫代磷酸酯化DNA寡核苷酸混合,并以1:5的比例温育所指示的时间点。将硫代磷酸酯化DNA寡核苷酸与FAM偶联,以用绿色荧光标记经修饰的Cas9(Absλ最大值=495nm,Emλ最大值=520nm),以实现检测。
图2A和图2B示出了硫代磷酸酯化DNA寡核苷酸(PS寡核苷酸)偶联到具有二硫键的Cas9-Cys蛋白的凝胶的代表性图像。图2A.Cas9-Cys蛋白和硫醇硫代磷酸酯化寡核苷酸以1:5的比例温育并温育16小时。硫醇硫代磷酸酯化寡核苷酸通过二硫键形成偶联到Cas9-Cys。第1:Cas9-Cys-PS指示未经蛋白纯化的偶联混合物。第2:Cas9-Cys-PS呈现在PS偶联后经纯化的Cas9-Cys-PS。左图示出了考马斯蓝染色,右图指示荧光标记的Cas9-Cys-PS。图2B.体外Cas9活性测定。STAT3向导RNA靶向DNA片段(2.1kb)通过PCR进行扩增,并用作Cas9底物供体外酶测定用。如图所示,在37℃温育2小时后,通过200ng Cas9将全长DNA底物切割成两个1.5kb和0.6kb的DNA片段。在PS偶联和纯化后,使用相同量(200ng)的未经修饰或经修饰的Cas9-Cys执行体外酶活性测定。
图3A和图3B示出了每1种Cas9/向导RNA使用1或5个PS寡核苷酸的经修饰的Cas9/向导RNA的高效入胞。
图4A和图4B示出了细胞穿透Cas9-Cys-PS蛋白表现出内化到小鼠脾T细胞中的高效率。(图4A)将2μg的Cas9-Cys-PS与1×105或1×106小鼠脾CD3+T细胞(具有或不具有CD3和CD28激活)一起温育16小时。Cas9-Cys-PS的细胞穿透率通过流式细胞术进行检定。(图4B)绿色荧光强度如图所指示。
图5A和图5B绘示了细胞穿透Cas9-Cys-PS蛋白高效穿透进入CAR-T细胞。图5A将5μg的PS修饰蛋白与1×105个模拟或CAR-T细胞一起温育16小时。PS修饰蛋白的细胞穿透率通过流式细胞术进行检定。模拟T,未经慢病毒介导的CAR-T工程化的人T细胞。CAR-T,通过慢病毒转导工程化的人T细胞。添加胰蛋白酶以消除PS修饰蛋白的细胞表面结合。图5B.绿色荧光强度如所指示。
图6示出了用于Cas9-Cys-PS偶联物的STAT3 gRNA靶向DNA序列。细胞穿透Cas9-Cys-PS在人T细胞中诱导了90%的STAT3基因突变。在提取DNA之前,人T细胞与Cas9-Cys-PS温育72小时。STAT3 gRNA靶向DNA片段通过PCR进行扩增,并亚克隆到pCR2.1DNA载体。基因突变频率通过Sanger DNA测序进行检定。蓝色突出显示的DNA序列表示PAM序列,黄色的核苷酸为插入突变。红色连字符指示核苷酸的缺失。“m”,核苷酸突变。每种类型的DNA突变的频率以百分比表示。
图7A至图7F示出了PS-Cas9-RNP在人CAR-T细胞中的细胞穿透率和基因破坏率。图7A示出了用FITC标记的PS-Cas9-RNP在人CD19CAR-T细胞中的细胞穿透效率通过荧光显微镜进行检定。比例尺,20μm。图7B示出了在以所指示的浓度向人CAR-T细胞添加PS-Cas9-RNP后,细胞内PS-Cas9-RNP通过荧光凝胶成像和蛋白印迹法进行监测。图7C示出了CAR-T细胞的细胞活力不受PS-Cas9-RNP的影响。将1×105个CAR-T细胞在不存在或存在PS-Cas9-RNP的情况下以所指示的浓度培养4天。图7D、图7E和图7F.将10μg(58.8皮摩尔)的PS-Cas9-RNP添加到1×105CAR-T细胞中并培养4天。图7D示出了PS-Cas9-PDCD1 RNP或PS-Cas9-TET2RNP或两者的细胞穿透效力通过流式细胞术进行检定。结果表明,PS-Cas9-RNP可以穿透90%以上的CAR-T细胞。图7E示出了在PS-Cas9-TET2 RNP转染后,CAR-T中TET2的基因扰动通过蛋白印迹法(左图)和经靶向的TET2座位的DNA测序(右图)进行检定。图7F.PS-Cas9-PDCD-RNP对CAR-T细胞中PDCD1的基因扰动通过流式细胞术(左图)、蛋白印迹法(中图)和经靶向的PDCD1座位的DNA测序(右图)进行检定。最初使用两种不同的PDCD1gRNA来生成PS-Cas9-PDCD1 RNP(PS-Cas9-PDCD1 RNP1和PS-Cas9-PDCD1 RNP2)。如蛋白印迹法所示,PS-Cas9-PDCD1 RNP2介导的PDCD1基因的扰动优于PS-Cas9-PDCD1 RNP1。
图8A至图8D.图8A示出了PS-Cas9-STAT3-RNP在具有(血清+CD3/CD28)或不具有(仅血清)激活的小鼠脾T细胞中的高细胞穿透效力(90%左右)和STAT3基因破坏,如流式细胞术所示。T细胞激活1天后,将PS-Cas9-STAT3 RNP(58.8皮摩尔)添加到1×105小鼠脾T细胞中。4天后执行流式细胞术。图8B示出了PS-Cas9-RNP的细胞穿透率通过荧光显微镜进一步证实。比例尺,20μm。图8C示出了在静息和激活脾T细胞时观察到PS-Cas9-STAT3 RNP的类似的高细胞穿透效力。图8D和图8E示出了PS-Cas9-STAT3-RNP在脾T细胞中对STAT3的基因扰动通过qPCR(图8C)和蛋白印迹法(图8D)进行检定。qPCR:设计正向引物以退火到基因扰动位点。
图9A和图9B.图9A示出了PS-Cas9-RNP高效穿透原代鼠巨噬细胞并破坏经靶向的基因。将PS-Cas9-STAT3 RNP(58.8皮摩尔)添加到1×105个小鼠巨噬细胞中。4天后,PS-Cas9-STAT3 RNP(PS-Cas9/STAT3 gRNA)在鼠巨噬细胞中的细胞穿透率通过荧光显微镜进行检定,并且穿透效力通过右图上的条形图显示。所示的为在图像的四个不同域中细胞穿透率的平均数。比例尺,20μm。图9B示出了PS-Cas9-STAT3 RNP对STAT3基因的扰动通过T7E1测定证实。*,从靶基因扩增的PCR产物的全长。黑色箭头指示经切割的DNA产物。
图10A至图10B.PS-Cas9-RNP高效穿透原代人NK细胞并破坏经靶向的基因。图10A示出了1×105个人NK细胞从供体PBMC细胞分离,并与PS-Cas9-STAT3 RNP(58.8皮摩尔)温育4天。PS-Cas9(无向导RNA)或PS-Cas9-STAT3-RNP(FITC标记的PS-Cas9,带有STAT3-gRNA#1)在人NK细胞中的细胞穿透率通过流式细胞术进行检定。图10B示出了PS-Cas9-STAT3 RNP在FITC阳性细胞(FITC+)中对STAT3基因的扰动通过T7E1测定证实。*,从靶基因扩增的PCR产物的全长。黑色箭头指示经切割的DNA产物。基因扰动率通过PCR产物的条带强度进行定量。
图11A至图11D.PS寡核苷酸偶联使小鼠胰腺肿瘤KPC肿瘤类器官中Cas9 RNP和靶基因(STAT3)敲除的细胞穿透成为可能。图11A示出了PS-Cas9-STAT3 RNP(Cy5标记的)在小鼠KPC肿瘤类器官中的细胞穿透率在温育16小时后通过共聚焦显微镜检可视化。比例尺:20μm。图11B示出了使用PS-Cas9-STAT3 RNP靶向Stat3座位。*,来自与或不与PS-Cas9-STAT3RNP温育的KPC类器官的Stat3靶区的PCR产物。M,标记物。黑色箭头指示T7E1切割测定后预期的经切割的产物。图11C示出了在添加或不添加PS-Cas9-STAT3 RNP的KPC类器官3天后通过qPCR测量靶Stat3基因的相对基因表达。未配对学生T检验;**;p<0.01。图11D示出了荧光IHC染色表明在用PS-Cas9-STAT3 RNP温育3天的KPC肿瘤类器官中STAT3表达显著降低。比例尺:50μm。
图12示出了PS-Cas9-PARG RNP(FITC标记的)在患者来源的卵巢肿瘤类器官中的细胞穿透率在温育3或5天后通过共焦显微镜检可视化。比例尺:100μm。
图13A至图13E示出了PS-Cas9-PARG RNP介导的PARG基因扰动的体内细胞穿透在奥拉帕尼(Olaparib)耐药的人卵巢癌OVCAR8异种移植肿瘤中表现出显著的抗肿瘤作用。图13A示出了当肿瘤大小达到100mm3时,荷瘤NSG小鼠用100μg的PS-Cas9-PARG RNP(Cy5标记的;0.58纳摩尔)或媒介物(HBSS)仅处理一次。图像指示在注射0.5小时或第5天后在荷瘤小鼠体内PS-Cas9-PARG RNP(Cy5标记的)的瘤周注射。处理5天后将小鼠安乐死,肿瘤大小显示在底框上。图13B示出了测量肿瘤重量并以柱状图显示。图13C示出了T7E1测定用于测量用HBSS或PS-Cas9-PARG RNP处理的肿瘤中的PARG基因扰动。*,从靶基因扩增的PCR产物的全长。箭头指示经切割的基因产物。图13D示出了PS-Cas9-PARG RNP对基因扰动的作用通过DNA测序进一步证实。野生型PARG基因和突变型PARG基因的比例示于饼形图中。图13E示出了用HBSS或PS-Cas9-PARG RNP处理的肿瘤中PARG的蛋白水平通过蛋白印迹法测量。对肌动蛋白的水平进行平行检测作为上样对照。
图14示出了具有5个PS寡核苷酸的Cas9(Cas9-5C)对先前测试的具有1个PS寡核苷酸的Cas9(Cas9-C)。我们的实现位点特异性PS附着的Cas9-C和Cas9-5C的工程化的DNA和蛋白序列。
图15A至图15D示出了Cas9-5C在细胞穿透率和基因破坏率方面均优于Cas9-C。图15A示出了体外Cas9测定,其揭示了Cas9的酶活性不受C末端Cys标签和PS寡核苷酸偶联的干扰。黑色箭头指示经切割的DNA产物。图15B.为了比较PS-Cas9-C和PS-Cas9-5C(两者都是FITC标记的)的细胞穿透效力,使用较低剂量的PS偶联的Cas9RNP(15皮摩尔)进行转染。流式细胞术显示PS-Cas9-5C-STAT3 RNP在小鼠脾T细胞和淋巴细胞中的细胞穿透效率高于PS-Cas9-C-STAT3 RNP。图15C和图15D示出了在添加PS-Cas9-STAT3 RNP后4天,STAT3基因扰动通过总细胞群中的蛋白印迹法(图15C)和分选的FITC阳性细胞中的T7E1测定法(图15D)进行检定。
图16A和图16B.100μg的PS-Cas9-5C(0.58纳摩尔;FITC标记的)与等分子的T细胞受体A/B(TCRA/TCRB)gRNA混合以生成PS-Cas9-5C-TCRA/TCRB RNP(图16A)。在向从供体PBMC分离的1×106人CD4+T细胞中添加0.58纳摩尔后4天,PS-Cas9-5C-TCRA/TCRB RNP(FITC标记的)在人CD4+T细胞中的细胞穿透效力(67.1%左右)通过流式细胞术进行检定。基因扰动对TCRA/TCRB基因座位的影响分别在没有可检测PS-Cas9-5C(FITC-)CD4 T细胞和高度PS-Cas9-5C RNP阳性(FITC++)CD4 T细胞的情况下通过流式细胞术进行检定(图16B)。在PS-Cas9-TCRA/TCRB RNP高阳性(FITC++)CD4 T细胞中TCRα/β的表达显著降低。结果还提示通过使用PS-Cas9-TCRA/TCRB RNP生成同种异体CAR-T细胞的可能性。
图17A和图17B.PS-Cas9-5C-RNP高效穿透并破坏鼠海马神经元。神经元通过使用商业试剂盒(Pierce初级神经元分离试剂盒(Pierce Primary Neuron Isolation Kit))从C57BL/6小鼠制备。将58皮摩尔的PS-Cas9-5C(10μg)与(PS-Cas9-5C-STAT3 RNP)或不与STAT3 gRNA(PS-Cas9)一起添加到1×105个神经元。添加STAT3 gRNA(PS-Cas9)或PS-Cas9-5C-STAT3 RNP三天后,细胞穿透效率和基因扰动通过流式细胞术(图17A)和T7E1测定(图17B)进行检定。图17A.对照:无转染;PS-Cas9:单独的PS-Cas9;PS-Cas9-STAT3 RNP:PS-Cas9/STAT3 gRNA。图17B.左图:T7E1测定的结果通过DNA电泳示出。*,从靶基因扩增的PCR产物的全长。黑色箭头指示经切割的DNA产物。右图:基因扰动的水平通过DNA凝胶上显示的DNA条带的强度进行定量。
图18A和图18B.PS-Cas9-5C-RNP高效穿透并破坏人骨髓CD34+造血干细胞。图18A.1×105个人骨髓CD34+造血干细胞(购自正能生物(Zenbio))与PS-Cas9-STAT3RNP(58.8皮摩尔;STAT3 gRNA#3)温育4天。PS-Cas9-5C-STAT3 RNP(FITC标记的)在人骨髓CD34+造血干细胞中的细胞穿透率通过流式细胞术进行检定,并且穿透效力通过右图上的条形图显示。所示的为三次独立实验的平均数。对照:无PS-Cas9。图18B.PS-Cas9-STAT3 RNP对靶基因的基因扰动通过细胞分选(FITC阳性:FITC+;FITC阴性:FITC-)和T7E1测定显示。*,从靶基因扩增的PCR产物的全长。黑色箭头指示经切割的DNA产物。
图19A和图19B.两个互补的硫代磷酸酯寡核苷酸的杂交使得抗体物理偶联到Cas9,导致Cas-9对细胞类型选择性基因的扰动。图19A.PS-AS-赫赛汀(Herceptin)是偶联到赫赛汀(人抗Her2抗体)的反义(AS)PS寡核苷酸(Cy5标记的)。PS-S-Cas9是偶联到Cas9的正义(S)PS寡核苷酸(FITC标记的)。在以1:1的比例混合PS-AS-赫赛汀和PS-S-Cas9后,抗体-Cas9复合物的二聚化通过非变性SDS-PAGE进行检定,并通过荧光成像(Cy5和FL488)可视化。图19B.上图,如流式细胞术所示,PS-Cas9-PS-赫赛汀的细胞穿透效力在MCF7-Her2表达细胞中高于在MCF7(Her2-)细胞中。下图,荧光强度(Cy5)的平均数通过软件FlowJo进行定量,并示于条形图中。
图20A至图20C.图20A.将1×106个Her2阴性MCF7和Her2表达MCF7-Her2细胞与亚最佳浓度的所指示的PS-Cas9一起温育,以辨别细胞穿透Cas9键合到抗体的潜在优势(将30皮摩尔的PS-Cas9 RNP(STAT3 gRNA#1)或PS-Cas9-PS-赫赛汀RNP(STAT3gRNA#1)用于实验。上图,STAT3的蛋白表达通过蛋白印迹法进行检定。下图,蛋白条带强度通过软件ImageJ进行定量,并以条形图示出。图20B.四种卵巢癌细胞系中Her2表达的水平通过流式细胞术进行检定。SKO3具有最高水平的Her2表达,而OVCAR3具有最低水平。SKOV3细胞和OVCAR3细胞用于转染PS-Cas9 RNP(STAT3 gRNA#1)或PS-Cas9-PS-赫赛汀RNP(STAT3 gRNA#1)4天。右上图,STAT3的蛋白表达通过蛋白印迹法进行检定。右下图,蛋白条带强度通过Image进行定量并以条形图示出。图20C.PS-Cas9 RNP或PS-Cas9-PS-赫赛汀在MCF7-Her2+细胞中对STAT3基因扰动的效力通过DNA测序进一步证实。野生型STAT3基因和经突变的STAT3基因的比例示于饼图中。
图21.经二聚化的PS-Cas9在破坏经靶向的基因时增加Cas9活性。两个互补(硫代磷酸酯)寡核苷酸的杂交使得PS-Cas9的两个分子能够形成二聚体。PS-S-Cas9是正义(S)PS寡核苷酸(FITC标记的)偶联的Cas9。PS-AS-Cas9是反义(AS)PS寡核苷酸(Cy5标记的)偶联的Cas9。在以1:1比例混合PS-AS-Cas9和PS-S-Cas9后,PS-Cas9复合物的二聚化通过非变性SDS-PAGE进行检定,并通过荧光成像(Cy5.5和FL488)可视化。
图22A和图22B.图22A示出了使用PS-Cas9-STAT3 RNP的PS单体(PS-S-Cas9-STAT3RNP1;100μg;0.58纳摩尔)或二聚体(PS-S-AS-Cas9-STAT3 RNP;PS-S-Cas9-STAT3 RNP1和PS-AS-Cas9-STAT3 RNP2各50μg)转染从两个健康供体的PBMC分离的1×106人髓样细胞(CD11b+)。使用两种不同的STAT3 gRNA(gRNA#1和gRNA#2,两者之间有47bp)生成PS-Cas9RNP二聚体(与正义(S)和反义(AS)PS寡核苷酸配对)。添加PS-Cas9 RNP二聚体或单体4天后,细胞穿透效力通过流式细胞术进行检定。如图所示,单体PS-S-Cas9-STAT3 RNP(100μg)在来自两个不同供体的髓样细胞中的细胞穿透效力分别为56.9%和68.5%。PS-Cas9-STAT3 RNP二聚体(PS-S-AS-Cas9-STAT3 RNP)在次优实验条件(PS-S-Cas9和PS-AS-Cas9各50μg)下的穿透效力为35.5%和35.1%。图22B示出了用于检定PS-Cas9-STAT3 RNP的单体(PS-S-Cas9-STAT3 RNP1或PS-S-Cas9-STAT3 RNP2)、两种不同单体混合物(PS-S-Cas9-STAT3 RNP1和PS-S-Cas9-STAT3 RNP2各50μg;两种RNP均与正义PS寡核苷酸偶联)或二聚体的中靶基因扰动效力的T7E1测定。结果表明PS-S-AS-Cas9-STAT3二聚体在STAT3基因扰动方面比PS-Cas9-STAT3 RNP的单体或双单体混合物更高效。*,从靶基因扩增的PCR产物的全长。黑色箭头指示经切割的DNA片段。
图23A和图23B.与单一PS失活Cas9相比,经二聚化的PS失活Cas9(dCas9)增加了基因激活能力。图23A.硫代磷酸酯寡核苷酸二聚化使两个PS-dCas9-VP64分子能够形成二聚体。PS-S-dCas9是正义(S)PS寡核苷酸(FITC标记的)偶联的dCas9。PS-AS-dCas9是反义(AS)PS寡核苷酸(Cy5标记的)偶联的dCas9。在以1:1比例混合PS-AS-dCas9和PS-S-dCas9后,PS-dCas9复合物的二聚化通过非变性SDS-PAGE进行检定,并通过荧光成像(Cy5.5和FL488)可视化。图23B.激活基因时对单体和二聚体PS-dCas9的功能分析。设计用于靶向VEGFA启动子座位的两个gRNA(图23A和图23B)彼此接近。PS-S-dCas9-VP64与gRNA A一起温育以形成PS-S-dCas9-VP64-RNP-A,而PS-AS-dCas9-VP64-RNP-B与gRNA B一起温育以形成PS-AS-dCas9-VP64 RNP。将PS-S-dCas9-VP64 RNP和PS-AS-dCas9-VP64 RNP以1:1的比例混合以形成二聚体复合物。将1×106个HEK293细胞与100μg(0.58纳摩尔)PS-S-dCas9-VP64-RNP-A、PS-AS-dCas9-VP64-RNP-B或PS-S-AS-dCas9-VP64 RNP-AB二聚体一起温育2天。相对VEGFA表达通过qPCR进行检定和定量。所示的为平均数±SD;n=3;双尾学生T检验;***,p<0.005;****,p<0.001。
图24示出了基于STAT3 gRNA#1和#2的脱靶基因预测(IDT在线软件:www.idtdna.com/pages/products/crispr-genome-editing/alt-r-crispr-cas9-system),对PS-Cas9-STAT3 RNP二聚体与其单体抗衡部分(单个单体和双单体混合物)相比的脱靶基因扰动进行评估。检测到STAT3 gRNA#1对12号染色体和16号染色体的脱靶基因剪切,而STAT3 gRNA#2仅在2个单体对照的1号染色体中具有脱靶基因破坏。相比之下,没有检测到PS-S-AS-Cas9-STAT3二聚体所进行的脱靶基因剪切。*,从靶基因扩增的PCR产物的全长。黑色箭头指示T7E1切割后的预测DNA产物。
具体实施方式
定义
虽然本文示出和描述了本发明的各种实施例和方面,但是对于本领域技术人员来说显而易见的是,这些实施例和方面仅通过举例的方式提供。在不脱离本发明的情况下,本领域技术人员将想到许多变化、改变和替换。应当理解,在实践本发明时可以采用本文所描述的本发明实施例的各种替代方案。
本文使用的章节标题仅用于组织目的,而不应被解释为限制所描述的主题。本申请中引用的所有文献或部分文献,包括但不限于专利、专利申请、文章、书籍、手册和论文,出于任何目的以全文引用的方式明确并入。
除非另有定义,否则本文使用的所有技术和科学术语具有本发明所属领域技术人员通常理解的含义。以下参考文献为技术人员提供了本发明中所使用的术语中的许多术语的一般定义:Singleton等人,《微生物学和分子生物学词典(Dictionary of Microbiologyand molecular biology)(1994年第2版);《剑桥科技词典(The Cambridge Dictionary ofScience and Technology)(Walker版,1988);《遗传学词汇表(The Glossary ofGenetics)》,第5版,R.Rieger等人(编辑),施普林格(Springer Verlag)(1991);和Hale和Marham,《哈珀柯林斯生物学词典(The Harper Collins Dictionary of Biology)》(1991)。如本文所用,除非另外指明,否则以下术语具有其所赋予的含义。
在本公开和以下权利要求中使用单数不定冠词或定冠词(例如,“一个/一种(a/an)”、“该/所述”等)遵循专利中“至少一个”含义的传统方法,除非在特定情况下从上下文清楚地看出,该术语在该特定情况下旨在具体表示一个且仅一个。同样,术语“包含(comprising)”是开放式的,不排除另外的项目、特征、组件等。除非另有指示,否则本文所标识的参考文献以全文引用的方式明确并入本文中。
术语“包含(comprise)”、“包括(include)”和“具有(have)”及其派生词在本文中可互换地用作全面的、开放式术语。例如,使用“包含(comprising)”、“包括(including)”或“具有(having)”意味着无论包含、具有或包括什么元素都不是含有动词的条款的主题所涵盖的唯一元素。
在取代基基团由其常规化学式指明从左到右书写的情况下,它们同样涵盖在化学上同一的取代基,这些取代基是从右到左书写结构所产生的,例如-CH2O-等同于-OCH2-。
除非另有说明,否则术语“烷基”,本身或作为另一取代基的一部分,意指直链(即,无支链的)或支碳链(或碳)或其组合,其可为完全饱和的、单不饱和的或多不饱和的且可包括单价自由基、二价自由基和多价自由基。烷基可以包括指定数目的碳(例如,C1-C10是指一至十个碳)。烷基是未环化的链。饱和烃自由基的实例包括但不限于如甲基、乙基、正丙基、异丙基、正丁基、叔丁基、异丁基、仲丁基、甲基等基团,例如,正戊基、正己基、正庚基、正辛基等的同源物和异构体。不饱和烷基基团是具有一个或多个双键或三键的不饱和烷基基团。不饱和烷基基团的实例包括但不限于乙烯基、2-丙烯基、巴豆基、2-异戊烯基、2-(丁二烯基)、2,4-戊二烯基、3-(1,4-戊二烯基)、乙炔基、1-和3-丙炔基、3-丁炔基以及高级同源物和异构体。烷氧基是经由氧接头(-O-)附着到分子的其余部分的烷基。烷基部分可以是烯基部分。烷基部分可以是炔基部分。烷基部分可以是完全饱和的。烯基可以包括多于一个双键和/或除该一个或多个双键之外的一个或多个三键。炔基可以包括多于一个三键和/或除该一个或多个三键之外的一个或多个双键。
除非另有说明,否则术语“亚烷基”,本身或作为另一取代基的一部分,意指衍生自烷基的二价自由基,例如但不限于-CH2CH2CH2CH2-。通常,烷基(或亚烷基)基团将具有1至24个碳原子,具有10个或更少碳原子的那些基团在本文中是优选的。“低级烷基”或“低级亚烷基”是较短链的烷基或亚烷基基团,通常具有8个或更少的碳原子。除非另有说明,否则术语“亚烯基”,本身或作为另一取代基的一部分,意指衍生自烯烃的二价自由基。
除非另有说明,否则术语“杂烷基”,本身或与另一术语组合,意指稳定的直链或支链或其组合,包括至少一个碳原子和至少一个杂原子(例如,O、N、P、Si和S),并且其中氮和硫原子可以任选地被氧化,并且氮杂原子可以任选地被季铵化。杂原子(例如,N、S、Si或P)可以置于杂烷基基团的任何内部位置或烷基基团附着到分子的其余部分的位置。杂烷基是未环化的链。实例包括但不限于:-CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3)-CH3、-CH2-S-CH2-CH3、-CH2-CH2、-S(O)-CH3、-CH2-CH2-S(O)2-CH3、-CH=CH-O-CH3、-Si(CH3)3、-CH2-CH=N-OCH3、-CH=CH-N(CH3)-CH3、-O-CH3、-O-CH2-CH3和-CN。至多两个或三个杂原子可以是连续的,如,例如,-CH2-NH-OCH3和-CH2-O-Si(CH3)3。杂烷基部分可以包括一个杂原子(例如,O、N、S、Si或P)。杂烷基部分可以包括两个任选不同的杂原子(例如,O、N、S、Si或P)。杂烷基部分可以包括三个任选不同的杂原子(例如,O、N、S、Si或P)。杂烷基部分可以包括四个任选不同的杂原子(例如,O、N、S、Si或P)。杂烷基部分可以包括五个任选不同的杂原子(例如,O、N、S、Si或P)。杂烷基部分可以包括至多8个任选不同的杂原子(例如,O、N、S、Si或P)。除非另有说明,否则术语“杂烯基”,本身或与另一术语组合,意指包括至少一个双键的杂烷基。杂烯基可以任选地包括多于一个双键和/或除该一个或多个双键之外的一个或多个三键。除非另有说明,否则术语“杂炔基”,本身或与另一术语组合,意指包括至少一个三键的杂烷基。杂炔基可以任选地包括多于一个三键和/或除该一个或多个三键之外的一个或多个双键。
类似地,除非另有说明,否则术语“杂亚烷基”,本身或作为另一取代基的一部分,意指衍生自杂烷基的二价自由基,例如但不限于-CH2-CH2-S-CH2-CH2-和-CH2-S-CH2-CH2-NH-CH2-。对于杂亚烷基基团,杂原子还可以占据链末端中的任一个链末端或两个链末端(例如,亚烷基氧基、亚烷基二氧基、亚烷基氨基、亚烷基二氨基等)。仍进一步地,对于亚烷基和杂亚烷基键合基团,键合基团的式的书写方向并不暗示键合基团的朝向。例如,式-C(O)2R'-表示-C(O)2R'-和-R'C(O)2-两者。如上面所描述的,如本文所用的杂烷基基团包括那些通过杂原子附着到分子的其余部分的基团,如-C(O)R'、-C(O)NR'、-NR'R”、-OR'、-SR'和/或-SO2R'。在列举“杂烷基”,随后列举具体的杂烷基基团,如-NR'R”等的情况下,应理解术语杂烷基和-NR'R”不是多余的或互斥的。相反,列举具体的杂烷基基团以增加清晰度。因此,术语“杂烷基”在本文中不应解释为排除具体的杂烷基基团,例如-NR'R”等。
除非另有说明,否则术语“环烷基”和“杂环烷基”,本身或与其它术语组合,分别意指“烷基”和“杂烷基”的环状形式。环烷基和杂环烷基不是芳族的。另外地,对于杂环烷基,杂原子可占据杂环附着到分子的其余部分的位置。环烷基的实例包括但不限于环丙基、环丁基、环戊基、环己基、1-环己基、3-环己基、环庚基等。杂环烷基的实例包括但不限于1-(1,2,5,6-四氢吡啶基)、1-哌啶基、2-哌啶基、3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、四氢噻吩-3-基、1-哌嗪基、2-哌嗪基等。“亚环烷基”和“杂亚环烷基”,单独或作为另一取代基的一部分,分别意指衍生自环烷基和杂环烷基的二价自由基。
除非另有说明,术语“卤代”或“卤素”,本身或作为另一取代基的一部分,意指氟、氯、溴或碘原子。另外地,术语如“卤代烷基”意在包括单卤代烷基和多卤代烷基。例如,术语“卤代(C1-C4)烷基”包括但不限于氟甲基、二氟甲基、三氟甲基、2,2,2-三氟乙基、4-氯丁基、3-溴丙基等。
除非另有说明,否则术语“酰基”意指C(O)R,其中R是经取代或未经取代的烷基、经取代或未经取代的环烷基、经取代或未经取代的杂烷基、经取代或未经取代的杂环烷基、经取代或未经取代的芳基或经取代或未经取代的杂芳基。
除非另有说明,术语“芳基”意指多不饱和的芳族烃取代基,其可为单个环或稠合在一起(即,稠环芳基)或共价键合的多个环(优选1至3个环)。稠环芳基是指稠合在一起的多个环,其中稠环中的至少一个稠环是芳基环。术语“杂芳基”是指含有至少一个杂原子如N、O或S的芳基基团(或环),其中氮原子和硫原子任选地被氧化,并且氮原子任选地被季铵化。因此,术语“杂芳基”包括稠环杂芳基基团(即,稠合在一起的多个环,其中稠环中的至少一个稠环是杂芳环)。5,6-稠环杂亚芳基意指稠合在一起的两个环,其中一个环具有5个成员并且另一环具有6个成员,并且其中至少一个环是杂芳基环。同样,6,6-稠环杂亚芳基是指稠合在一起的两个环,其中一个环具有6个成员并且另一环具有6个成员,并且其中至少一个环是杂芳基环。并且6,5-稠环杂亚芳基是指稠合在一起的两个环,其中一个环具有6个成员并且另一环具有5个成员,并且其中至少一个环是杂芳基环。杂芳基基团可以通过碳或杂原子附着到分子的其余部分。芳基基团和杂芳基基团的非限制性实例包括苯基、萘基、吡咯基、吡唑基、哒嗪基、三嗪基、嘧啶基、咪唑基、吡嗪基、嘌呤基、恶唑基、异恶唑基、噻唑基、呋喃基、噻吩基、吡啶基、嘧啶基、苯并噻唑基、苯并恶唑基、苯并咪唑基、苯并呋喃基、异苯并呋喃基、吲哚基、异吲哚基、苯并苯硫基、异喹啉基、喹喔啉基、喹啉基、1-萘基、2-萘基、4-联苯基、1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪唑基、4-咪唑基、吡嗪基、2-恶唑基、4-恶唑基、2-苯基-4-恶唑基、5-恶唑基、3-异恶唑基、4-异恶唑基、5-异恶唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩基、3-噻吩基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5-喹喔啉基、3-喹啉基和6-喹啉基。用于上述芳基和杂芳基环系统中的每一者的取代基选自下述可接受的取代基的组。“亚芳基”和“杂芳基”,单独或作为另一取代基的一部分,分别意指衍生自芳基和杂芳基的二价自由基。杂芳基基团取代基可以是键结到环杂原子氮的-O-。
螺环是两个或更多个环,其中相邻的环通过单个原子附着。螺环内的单个环可以相同或不同。螺环中的单个环可以是经取代或未经取代的,并且可以具有与一组螺环内的其它单个环不同的取代基。螺环内单个环的可能取代基是当不是螺环的一部分时用于同一环的可能取代基(例如,用于环烷基或杂环烷基环的取代基)。螺环可以是经取代或未经取代的环烷基、经取代或未经取代的亚环烷基、经取代或未经取代的杂环烷基或经取代或未经取代的杂亚环烷基,并且螺环基团内的单个环可以是就在前一列表中的任何环,包括具有一种类型的所有环(例如,所有环是经取代的杂亚环烷基,其中每个环可以是相同或不同的经取代的杂亚环烷基)。当提及螺环系统时,杂环螺环意指螺环,其中至少一个环是杂环并且其中每个环可以是不同的环。当提及螺环系统时,经取代的螺环意指至少一个环被取代并且每个取代基可以任选地不同。
稠环杂环烷基-芳基是稠合到杂环烷基的芳基。稠环杂环烷基-杂芳基是稠合到杂环烷基的杂芳基。稠环杂环烷基-环烷基是稠合到环烷基的杂环烷基。稠环杂环烷基-杂环烷基是稠合到另一杂环烷基的杂环烷基。稠环杂环烷基-芳基、稠环杂环烷基-杂芳基、稠环杂环烷基-环烷基或稠环杂环烷基-杂环烷基可以各自独立地是未经取代的或被本文所描述的一个或多个取代基取代。
符号表示化学部分附着到分子或化学式的其余部分的点。
如本文所用的术语“氧代”意指双键结到碳原子的氧。
术语“烷基亚芳基”是共价键结到亚烷基部分的亚芳基部分(在本文中也称为亚烷基接头)。在实施例中,烷基亚芳基基团具有下式:
烷基亚芳基部分可以在亚烷基部分或亚芳基接头上(例如在碳2、3、4或6上)用卤素、氧代、-N3、-CF3、-CCl3、-CBr3、-CI3、-CN、-CHO、-OH、-NH2、-COOH、-CONH2、-NO2、-SH、-SO2CH3、-SO3H、-OSO3H、-SO2NH2、-NHNH2、-ONH2、-NHC(O)NHNH2、经取代或未经取代的C1-C5烷基或经取代或未经取代的2至5元杂烷基取代(例如,被取代基基团取代)。在实施例中,烷基亚芳基是未经取代的。
如本文所用的术语“烷基磺酰基”意指具有式-S(O2)-R'的部分,其中R'是如上定义的经取代或未经取代的烷基基团。R'可以具有规定数量的碳(例如,“C1-C4烷基磺酰基”)。
上述术语中的每个术语(例如,“烷基”、“杂烷基”、“环烷基”、“杂环烷基”、“芳基”和“杂芳基”)包括所指示的自由基的经取代的形式和未经取代的形式。下面提供了每种类型的自由基的优选取代基。
用于烷基和杂烷基(包括通常称为亚烷基、烯基、杂亚烷基、杂烯基、炔基、环烷基、杂环烷基、环烯基和杂环烯基的那些基团)的取代基可以是选自但不限于以下的多种基团中的一种或多种基团:-OR'、=O、=NR'、=N-OR'、-NR'R”、-SR'、-卤素、-SiR'R”R”'、-OC(O)R'、-C(O)R'、-CO2R'、-CONR'R”、-OC(O)NR'R”、-NR”C(O)R'、-NR'-C(O)NR”R”'、-NR”C(O)2R'、-NR-C(NR'R”R”')=NR””、-NR-C(NR'R”)=NR”'、-S(O)R'、-S(O)2R'、-S(O)2NR'R”、-NRSO2R'、-NR'NR”R”'、-ONR'R”、-NR'C(O)NR”NR”'R””、-CN、-NO2、-NR'SO2R”、-NR'C(O)R”、-NR'C(O)-OR”、-NR'OR”,其数量范围为0至(2m'+1),其中m'是此类自由基中碳原子的总数。R、R'、R”、R”'和R””各自优选独立地指氢、经取代或未经取代的杂烷基、经取代或未经取代的环烷基、经取代或未经取代的杂环烷基、经取代或未经取代的芳基(例如,被1至3个卤素取代的芳基)、经取代或未经取代的杂芳基、经取代或未经取代的烷基、烷氧基或硫代烷氧基基团或芳烷基基团。当本文所描述的化合物包括多于一个R基团时,例如,当存在这些基团中的多于一个基团时,R基团中的每个R基团各自独立地选择为R'、R”、R”'和R””基团。当R'和R”附着到同一氮原子时,它们可与氮原子组合以形成4元环、5元环、6元环或7元环。例如,-NR'R”包括但不限于1-吡咯烷基和4-吗啉基。根据对取代基的上述讨论,本领域技术人员将理解,术语“烷基”意在包括包括结合到除氢基团以外的基团的碳原子的基团,如,卤代烷基(例如,-CF3和-CH2CF3)和酰基(例如,-C(O)CH3、-C(O)CF3、-C(O)CH2OCH3等)。
类似于针对烷基描述的取代基,芳基和杂芳基基团的取代基是不同的并且选自,例如:-OR'、-NR'R”、-SR'、-卤素、-SiR'R”R”'、-OC(O)R'、-C(O)R'、-CO2R'、-CONR'R”、-OC(O)NR'R”、-NR”C(O)R'、-NR'-C(O)NR”R”'、-NR”C(O)2R'、-NR-C(NR'R”R”')=NR””、-NR-C(NR'R”)=NR”'、-S(O)R'、-S(O)2R'、-S(O)2NR'R”、-NRSO2R'、-NR'NR”R”'、-ONR'R”、-NR'C(O)NR”NR”'R””、-CN、-NO2、-R'、-N3、-CH(Ph)2、氟(C1-C4)烷氧基以及氟(C1-C4)烷基、-NR'SO2R”、-NR'C(O)R”、-NR'C(O)-OR”、-NR'OR”,其数量范围为0至芳族环系上开放价的总数;并且其中R'、R”、R”'和R””优选独立地选自氢、经取代或未经取代的烷基、经取代或未经取代的杂烷基、经取代或未经取代的环烷基、经取代或未经取代的杂环烷基、经取代或未经取代的芳基和经取代或未经取代的杂芳基。当本文所描述的化合物包括多于一个R基团时,例如,当存在这些R基团中的多于一个R基团时,R基团中的每个R基团各自独立地选择为R'、R”、R”'和R””基团。
环的取代基(例如,环烷基、杂环烷基、芳基、杂芳基、亚环烷基、杂亚环烷基、亚芳基或杂亚芳基)可以被描绘为环上的取代基而不是环的具体原子上的取代基(通常称为浮动取代基)。在这种情况下,取代基可以附着到环原子中的任何环原子(遵循化学价规则),并且在稠环或螺环的情况下,描绘为与稠环或螺环的一个成员相关联的取代基(单个环上的浮动取代基)可以是稠环或螺环中的任何稠环或螺环上的取代基(多个环上的浮动取代基)。当取代基附着到环但不附着到具体原子(浮动取代基)且取代基的下标为大于1的整数时,多个取代基可在相同原子、相同环、不同原子、不同稠环、不同螺环上,并且每个取代基可任选地不同。在环附着到分子的其余部分的点不限于单个原子(浮动取代基)的情况下,附着点可以是环的任何原子,并且在稠环或螺环的情况下,附着点可以是稠环或螺环中任何稠环或螺环的任何原子,同时遵循化学价规则。在环、稠环或螺环含有一个或多个环杂原子且环、稠环或螺环显示具有一个或多个浮动取代基(包括但不限于附着到分子的其余部分的点)的情况下,浮动取代基可以键结到杂原子。在环杂原子显示结合到具有浮动取代基的结构或式中的一个或多个氢(例如,具有到环原子的两个键和到氢的第三键的环氮)的情况下,当杂原子键结到浮动取代基时,取代基将被理解为替换该氢,同时遵循化学价规则。
在部分被R取代基取代的情况下,该基团可被称为“R取代的。”在部分为R取代的情况下,该部分被至少一个R取代基取代并且每个R取代基任选地不同。例如,在本文的部分是R1A经取代或未经取代的烷基时,多个R1A取代基可以附着到烷基部分,其中每个R1A取代基任选地不同。在R取代的部分被多个R取代基取代的情况下,R取代基中的每个R取代基在本文中可以使用如R'、R”等上撇符号(')进行区分。例如,在部分是R3A经取代或未经取代的烷基的情况下且该部分被多个R3A取代基取代时,该多个R3A取代基可以被区分为R3A'、R3A”、R3A”'等。在一些实施例中,该多个R取代基为3个。
两个或更多个取代基可以任选地接合以形成芳基、杂芳基、环烷基或杂环烷基基团。此类所谓的成环取代基通常(尽管不一定总是)被发现附着到环状碱基结构。在一个实施例中,成环取代基附着到碱基结构的相邻成员。例如,附着到环状碱基结构的相邻成员的两个成环取代基产生稠环结构。在另一实施例中,成环取代基附着到碱基结构的单个成员。例如,附着到环状碱基结构的单个成员的两个成环取代基产生螺环结构。在又一实施例中,成环取代基附着到碱基结构的非相邻成员。
芳基或杂芳基环的相邻原子上的取代基中的两个取代基可任选地形成式-T-C(O)-(CRR')q-U-的环,其中T和U独立地是-NR-、-O-、-CRR'-或单键,并且q为0至3的整数。可替代地,芳基或杂芳基环的相邻原子上的取代基中的两个取代基可任选地被式-A-(CH2)r-B-的取代基替换,其中A和B独立地是-CRR'-、-O-、-NR-、-S-、-S(O)-、-S(O)2-、-S(O)2NR'-或单键,并且r为1至4的整数。这样形成的新环的单键中的一个单键可以任选地被双键替换。可替代地,芳基或杂芳基环的相邻原子上的取代基中的两个取代基可任选地被式-(CRR')s-X'-(C”R”R”')d-的取代基替换,其中s和d独立地为0至3的整数,并且X'为-O-、-NR'-、-S-、-S(O)-、-S(O)2-或-S(O)2NR'-。取代基R、R'、R”和R”'优选独立地选自氢、经取代或未经取代的烷基、经取代或未经取代的杂烷基、经取代或未经取代的环烷基、经取代或未经取代的杂环烷基、经取代或未经取代的芳基和经取代或未经取代的杂芳基。
如本文所用,术语“杂原子”或“环杂原子”意在包括氧(O)、氮(N)、硫(S)、磷(P)和硅(Si)。
如本文所用的“取代基基团”意指选自以下部分的基团:
(A)氧代、
卤素、-CCl3、-CBr3、-CF3、-CI3、-CN、-OH、-NH2、-COOH、-CONH2、-NO2、-SH、-SO3H、-SO4H、-SO2NH2、-NHNH2、-ONH2、-NHC(O)NHNH2、-
NHC(O)NH2、-NHSO2H、
-NHC(O)H、-NHC(O)OH、-NHOH、-OCCl3、-OCF3、-OCBr3、-OCI3、-OCHCl2、-OCHBr2、-OCHI2、-OCHF2、未经取代的烷基(例如,C1-C8烷基、C1-C6烷基或C1-C4烷基)、未经取代的杂烷基(例如,2至8元杂烷基、2至6元杂烷基或2至4元杂烷基)、未经取代的环烷基(例如,C3-C8环烷基、C3-C6环烷基或C5-C6环烷基)、未经取代的杂环烷基(例如,3至8元杂环烷基、3至6元杂环烷基或5至6元杂环烷基)、未经取代的芳基(例如,C6-C10芳基、C10芳基、或苯基)或未经取代的杂芳基(例如,5至10元杂芳基、5至9元杂芳基或5至6元杂芳基),和
(B)烷基、杂烷基、环烷基、杂环烷基、芳基、杂芳基,其被至少一个选自以下的取代基取代:
(i)氧代、
卤素、-CCl3、-CBr3、-CF3、-CI3、-CN、-OH、-NH2、-COOH、-CONH2、-NO2、-SH、-SO3H、-SO4H、-SO2NH2、-NHNH2、-ONH2
-NHC(O)NHNH2、-NHC(O)NH2、-NHSO2H、
-NHC(O)H、-NHC(O)OH、-NHOH、-OCCl3、-OCF3、-OCBr3、-OCI3、-OCHCl2、-OCHBr2、-OCHI2、-OCHF2、未经取代的烷基(例如,C1-C8烷基、C1-C6烷基或C1-C4烷基)、未经取代的杂烷基(例如,2至8元杂烷基、2至6元杂烷基或2至4元杂烷基)、未经取代的环烷基(例如,C3-C8环烷基、C3-C6环烷基或C5-C6环烷基)、未经取代的杂环烷基(例如,3至8元杂环烷基、3至6元杂环烷基或5至6元杂环烷基)、未经取代的芳基(例如,C6-C10芳基、C10芳基、或苯基)或未经取代的杂芳基(例如,5至10元杂芳基、5至9元杂芳基或5至6元杂芳基),和
(ii)烷基、杂烷基、环烷基、杂环烷基、芳基、杂芳基,其被至少一个选自以下的取代基取代:
(a)氧代、卤素、-CCl3、-CBr3、-CF3、-CI3、-CN、-OH、-NH2、-COOH、-CONH2、-NO2、-SH、-SO3H、-SO4H、-SO2NH2、-NHNH2、-ONH2、-NHC(O)NHNH2、-NHC(O)NH2、-NHSO2H、-NHC(O)H、-NHC(O)OH、-NHOH、-OCCl3、-OCF3、-OCBr3、-OCI3、-OCHCl2、-OCHBr2、-OCHI2、-OCHF2、未经取代的烷基(例如,C1-C8烷基、C1-C6烷基或C1-C4烷基)、未经取代的杂烷基(例如,2至8元杂烷基、2至6元杂烷基或2至4元杂烷基)、未经取代的环烷基(例如,C3-C8环烷基、C3-C6环烷基或C5-C6环烷基)、未经取代的杂环烷基(例如,3至8元杂环烷基、3至6元杂环烷基或5至6元环烷基)、未经取代的芳基(例如,C6-C10芳基、C10芳基、或苯基)或未经取代的杂芳基(例如,5至10元杂芳基、5至9元杂芳基或5至6元杂芳基),和
(b)烷基、杂烷基、环烷基、杂环烷基、芳基、杂芳基,其被至少一个选自以下的取代基取代:氧代、卤素、-CCl3、-CBr3、-CF3、-CI3、-CN、-OH、-NH2、-COOH、-CONH2、-NO2、-SH、-SO3H、-SO4H、-SO2NH2、-NHNH2、-ONH2、-NHC(O)NHNH2、-NHC(O)NH2、-NHSO2H、-NHC(O)H、-NHC(O)OH、-NHOH、-OCCl3、-OCF3、-OCBr3、-OCI3、-OCHCl2、-OCHBr2、-OCHI2、-OCHF2、未经取代的烷基(例如,C1-C8烷基、C1-C6烷基或C1-C4烷基)、未经取代的杂烷基(例如,2至8元杂烷基、2至6元杂烷基或2至4元杂烷基)、未经取代的环烷基(例如,C3-C8环烷基、C3-C6环烷基或C5-C6环烷基)、未经取代的杂环烷基(例如,3至8元杂环烷基、3至6元杂环烷基或5至6元杂环烷基)、未经取代的芳基(例如,C6-C10芳基、C10芳基、或苯基)或未经取代的杂芳基(例如,5至10元杂芳基、5至9元杂芳基或5至6元杂芳基)。
如本文所提供的“化学接头”是共价接头、非共价接头、肽接头(包括肽部分的接头)、可切割肽接头、经取代或未经取代的亚烷基、经取代或未经取代的杂亚烷基、经取代或未经取代的亚环烷基、经取代或未经取代的杂亚环烷基、经取代或未经取代的亚芳基或经取代或未经取代的杂亚芳基或其任何组合。因此,如本文所提供的化学接头可以包括多个化学部分,其中该多个化学部分中的每个化学部分在化学上不同。可替代地,化学接头可以是非共价接头。非共价接头的实例包括但不限于离子键、氢键、卤素键、范德华相互作用(例如,偶极-偶极、偶极-诱导偶极、伦敦色散)、环堆叠(π效应)和疏水相互作用。在实施例中,化学接头使用偶联化学形成,该偶联化学包括但不限于亲核取代(例如,胺和醇与酰卤、活性酯的反应)、亲电取代(例如,烯胺反应)和碳-碳和碳-杂原子多个键的加成(例如,迈克尔反应、狄尔斯-阿尔德加成)。
如本文所用的“大小受限的取代基”或“大小受限的取代基基团”意指选自上面针对“取代基基团”所描述的取代基中的所有取代基的基团,其中每个经取代或未经取代的烷基是经取代或未经取代的C1-C20烷基,每个经取代或未经取代的杂烷基是经取代或未经取代的2至20元杂烷基,每个经取代或未经取代的环烷基是经取代或未经取代的C3-C8环烷基,每个经取代或未经取代的杂环烷基是经取代或未经取代的3至8元杂环烷基,每个经取代或未经取代的芳基为经取代或未经取代的C6-C10芳基,并且每个经取代或未经取代的杂芳基为经取代或未经取代的5至10元杂芳基。
如本文所用的“低级取代基”或“低级取代基基团”意指选自上面针对“取代基基团”所描述的取代基中的所有取代基的基团,其中每个经取代或未经取代的烷基是经取代或未经取代的C1-C8烷基,每个经取代或未经取代的杂烷基是经取代或未经取代的2至8元杂烷基,每个经取代或未经取代的环烷基是经取代或未经取代的C3-C7环烷基,每个经取代或未经取代的杂环烷基是经取代或未经取代的3至7元杂环烷基,每个经取代或未经取代的芳基为经取代或未经取代的C6-C10芳基,并且每个经取代或未经取代的杂芳基为经取代或未经取代的5至9元杂芳基。
在一些实施例中,本文化合物中所描述的每个经取代的基团被至少一个取代基基团取代。更具体地,在一些实施例中,本文化合物中所描述的每个经取代的烷基、经取代的杂烷基、经取代的环烷基、经取代的杂环烷基、经取代的芳基、经取代的杂芳基、经取代的亚烷基、经取代的杂亚烷基、经取代的亚环烷基、经取代的杂亚环烷基、经取代的亚芳基和/或经取代的杂亚芳基被至少一个取代基基团取代。在其它实施例中,这些基团中的至少一个或全部基团被至少一个大小受限的取代基基团取代。在其它实施例中,这些基团中的至少一个或全部基团被至少一个低级取代基基团取代。
在本文化合物的其它实施例中,每个经取代或未经取代的烷基可以是经取代或未经取代的C1-C20烷基,每个经取代或未经取代的杂烷基是经取代或未经取代的2至20元杂烷基,每个经取代或未经取代的环烷基是经取代或未经取代的C3-C8环烷基,每个经取代或未经取代的杂环烷基是经取代或未经取代的3至8元杂环烷基,每个经取代或未经取代的芳基是经取代或未经取代的C6-C10芳基,且/或每个经取代或未经取代的杂芳基是经取代或未经取代的5至10元杂芳基。在本文化合物的一些实施例中,每个经取代或未经取代的亚烷基是经取代或未经取代的C1-C20亚烷基,每个经取代或未经取代的杂亚烷基是经取代或未经取代的2至20元杂亚烷基,每个经取代或未经取代的亚环烷基是经取代或未经取代的C3-C8亚环烷基,每个经取代或未经取代的杂亚环烷基是经取代或未经取代的3至8元杂亚环烷基,每个经取代或未经取代的亚芳基是经取代或未经取代的C6-C10亚芳基,且/或每个经取代或未经取代的杂亚芳基是经取代或未经取代的5至10元杂亚芳基。
在一些实施例中,每个经取代或未经取代的烷基是经取代或未经取代的C1-C8烷基,每个经取代或未经取代的杂烷基是经取代或未经取代的2至8元杂烷基,每个经取代或未经取代的环烷基是经取代或未经取代的C3-C7环烷基,每个经取代或未经取代的杂环烷基是经取代或未经取代的3至7元杂环烷基,每个经取代或未经取代的芳基是经取代或未经取代的C6-C10芳基,且/或每个经取代或未经取代的杂芳基是经取代或未经取代的5至9元杂芳基。在一些实施例中,每个经取代或未经取代的亚烷基是经取代或未经取代的C1-C8亚烷基,每个经取代或未经取代的杂亚烷基是经取代或未经取代的2至8元杂亚烷基,每个经取代或未经取代的亚环烷基是经取代或未经取代的C3-C7亚环烷基,每个经取代或未经取代的杂亚环烷基是经取代或未经取代的3至7元杂亚环烷基,每个经取代或未经取代的亚芳基是经取代或未经取代的C6-C10亚芳基,和/或每个经取代或未经取代的杂亚芳基是经取代或未经取代的5至9元杂亚芳基。在一些实施例中,该化合物是一种下面的实施例部分、图或表中所列出的化学物种。
如本文所用,术语“偶联物”是指原子或分子之间的缔合。缔合可以是直接或间接的。例如,核酸和蛋白之间的偶联例如通过共价键可以是直接的,例如通过非共价键(例如,静电相互作用(例如,离子键、氢键、卤素键)、范德华相互作用(例如偶极-偶极、偶极-诱导的偶极、伦敦色散)、环堆叠(π效应)、疏水相互作用等)也可以是间接的。在实施例中,偶联物使用偶联化学形成,该偶联化学包括但不限于亲核取代(例如,胺和醇与酰卤、活性酯的反应)、亲电取代(例如,烯胺反应)和碳-碳和碳-杂原子多个键的加成(例如,迈克尔反应、狄尔斯-阿尔德加成)。这些和其它有用的反应讨论于例如,March,《高等有机化学(ADVANCED ORGANIC CHEMISTRY)》,第3版,约翰威立国际出版公司(John Wiley&Sons)》,纽约(NewYork),1985;Hermanson,《生物偶联技术(BIOCONJUGATE TECHNIQUES)》,学术出版社(Academic Press),圣迪哥(San Diego),1996;和Feeney等人,“蛋白的修饰(MODIFICATIONOF PROTEINS)”;《化学进展丛书(Advances in Chemistry Series)》,第198卷,美国化学学会(American Chemical Society),华盛顿哥伦比亚特区(Washington,D.C.),1982。
本文中用于偶联化学(包括本领域中已知的“点击化学”)的有用的反应性部分或功能基团包括,例如:
(a)羧基基团及其各种衍生物,包括但不限于N-羟基琥珀酰亚胺酯、N-羟基苯并三唑酯、酰卤、酰基咪唑、硫酯、对硝基苯基酯、烷基、烯基、炔基和芳族酯;
(b)羟基基团,其可转化为酯、醚、醛等。
(c)卤代烷基基团,其中卤化物可随后被亲核基团如,例如,胺、羧酸根阴离子、硫醇阴离子、碳负离子或醇盐离子代替,从而导致新基团在卤素原子的位点的共价附着;
(d)亲二烯体基团,其能够参与狄尔斯-阿尔德反应,如,例如,马来酰亚胺基团;
(e)醛基或酮基基团,使得随后的衍生化可以经由形成羰基衍生物,如,例如,亚胺、腙、缩氨基脲或肟或经由如格氏加成或烷基锂加成等机制进行;
(f)磺酰卤基团,其用于随后与胺反应,例如,形成磺酰胺;
(g)硫醇基团,其可以转化成二硫化物,与酰卤反应或键结到金属,如金;
(h)胺或巯基基团,其可以是例如酰化的、烷基化的或氧化的;
(i)烯烃,其可经历例如,环加成、酰化、迈克尔加成等;
(j)环氧化物,其可以与例如,胺和羟基化合物反应;
(k)亚磷酰胺和其它可用于核酸合成的标准功能基团;
(l)金属硅氧化物键结;
(m)金属键结,其到反应性磷基团(例如,磷化氢)以形成例如,磷酸二酯键;和
(n)砜,例如,乙烯基砜。
通过使用偶联(“点击”)化学接合小模块单元的组合物的化学合成是本领域公知的,并且描述于例如,H.C.Kolb、M.G.Finn和K.B.Sharpless((2001).“点击化学:来自少数良好反应的不同化学功能(Click Chemistry:Diverse Chemical Function from a FewGood Reactions”.《德国应用化学国际版(Angewandte Chemie International Edition)》40(11):2004-2021);R.A.Evans((2007).“叠氮化物-炔烃1,3-偶极“点击”环加成及其在聚合物科学和表面修饰中的应用(The Rise of Azide–Alkyne 1,3-Dipolar‘Click'Cycloaddition and its Application to Polymer Science and SurfaceModification)”.《澳大利亚化学杂志(Australian Journal of Chemistry)》60(6):384-395;W.C.Guida等人《医学研究综述(Med.Res.Rev.)》第3页,1996;Spiteri、Christian和Moses、John E.((2010).“铜催化的叠氮化物-炔烃环加成:1,4,5-三取代的1,2,3-三唑的区域选择性合成(Copper-Catalyzed Azide–Alkyne Cycloaddition:RegioselectiveSynthesis of 1,4,5-Trisubstituted1,2,3-Triazoles”.《德国应用化学国际版》49(1):31-33);Hoyle、Charles E.和Bowman、Christopher N.((2010).“硫醇-烯点击化学(Thiol–Ene Click Chemistry)”.《德国应用化学国际版》49(9):1540-1573);Blackman、MelissaL.和Royzen、Maksim以及Fox、Joseph M.((2008).“四嗪连接反应:基于反电子需求狄尔斯–阿尔德反应性的快速生物偶联(Tetrazine Ligation:Fast Bioconjugation Based onInverse-Electron-Demand Diels-Alder Reactivity)”.《美国化学学会杂志(Journal ofthe American Chemical Society)》130(41):13518-13519);Devaraj、Neal K.和Weissleder、Ralph以及Hilderbrand、Scott A.((2008).“基于四嗪的环加成:预靶向的活细胞标记的应用(Tetrazine Based Cycloadditions:Application to Pretargeted LiveCell Labeling)”.《生物偶联化学(Bioconjugate Chemistry)》19(12):2297-2299);Henning;Neves、Andre;Stairs、Shaun;Brindle、Kevin;Leeper、Finian((2011).“探索用于与生物分子连接的基于异腈的点击化学(Exploring isonitrile-based click chemistry for ligation with biomolecules)”.<有机和生物分子化学(Organic&Biomolecular Chemistry)),其全部内容通过整体引用的方式并入本文并用于所有目的。
可以选择反应性功能基团使得它们不参与或干扰本文所描述的蛋白或核酸的化学稳定性。举例来说,核酸可以包括乙烯基砜或其它反应性部分(例如,马来酰亚胺)。任选地,核酸可以包括具有式-S-S-R的反应性部分。R可以是例如,保护基团。任选地,R是己醇。如本文所用,术语己醇包括具有式C6H13OH的化合物,并且包括:1-己醇、2-己醇、3-己醇、2-甲基-1-戊醇、3-甲基-1-戊醇、4-甲基-1-戊醇、2-甲基-2-戊醇、3-甲基-2-戊醇、4-甲基-2-戊醇、2-甲基-3-戊醇、3-甲基-3-戊醇、2,2-二甲基-1-丁醇、2,3-二甲基-1-丁醇、3,3-二甲基-1-丁醇、2,3-二甲基-2-丁醇、3,3-二甲基-2-丁醇和2-乙基-1-丁醇。任选地,R是1-己醇。
如本文所提供的术语“反应性部分”是指分子的化学功能基团(例如,本文所提供的化合物或抗原结合域),其能够与相同或不同分子的另一反应性部分形成共价或非共价键(例如,静电相互作用(例如,离子键、氢键、卤素键)、范德华相互作用(例如,偶极-偶极、偶极-诱导的偶极、伦敦色散)、环堆叠(π效应)、疏水相互作用等)(例如,共价或非共价键)。在实施例中,反应性部分是点击化学反应性基团或点击化学反应性部分(即,能用于偶联化学的反应性部分或功能基团(包括本领域已知的“点击化学”))。如上面所描述的,点击化学反应性基团是能用于偶联化学的化学功能基团。因此,在实施例中,反应性部分是叠氮化物部分。在实施例中,反应性部分具有–N=N+=N-的结构。在实施例中,反应性部分是炔烃。
在实施例中,反应性部分是DBCO。本文所提供的术语“DBCO”在惯用意义上是指由PubChem号77078258所标识的二苯并环辛基或任何包括DBCO的反应性基团。在实施例中,反应性部分具有或包括以下结构:
其中/>指示附着到分子的提示物的点。在实施例中,反应性部分是30kDa聚乙二醇化的-DBCO。
在实施例中,反应性部分是反式-环辛烯(TCO)部分。本文所提供的术语“TCO”在惯用意义上是指由PubChem No.89994470标识的反式环辛烯或任何包括TCO的反应性基团。在实施例中,反应性部分具有或包括以下结构:
其中/>指示附着到分子的提示物的点。
在实施例中,反应性部分是四嗪部分。本文所提供的术语“四嗪”在惯用意义上是指由PubChem No.9263标识的四嗪或任何包括四嗪的反应性基团。在实施例中,反应性部分具有或包括以下结构:
其中/>指示附着到分子的提示物的点。
如本文所用,术语“约”意指包括规定值的一系列值,本领域普通技术人员会认为这些值与规定值合理类似。在实施例中,术语“约”意指在使用本领域通常可接受的测量的标准偏差内。在实施例中,“约”意指延伸至规定值的+/-10%的范围。在实施例中,“约”意指规定值。
“核酸”是指单链或双链形式的脱氧核糖核苷酸或其核糖核苷酸和聚合物及其补体。术语“多核苷酸”是指核苷酸的线性序列。术语“核苷酸”通常是指多核苷酸的单个单元,即单体。核苷酸可以是核糖核苷酸、脱氧核糖核苷酸或其经修饰的形式。本文所设想的多核苷酸的实例包括单链和双链RNA,以及具有单链和双链DNA和RNA的混合物的杂交分子。本文所设想的核酸,例如,多核苷酸的实例包括但不限于任何类型的RNA,例如,mRNA、siRNA、miRNA、sgRNA和向导RNA和任何类型的DNA、基因组DNA、质粒DNA和微环DNA及其任何片段。在实施例中,该核酸是信使RNA。在实施例中,该信使RNA是信使核糖核蛋白(RNP)。在多核苷酸的上下文中,术语“双链体”在通常和惯用意义上是指双链型。核酸可以是直链或支链的。例如,核酸可以是核苷酸的直链或核酸可以是支链的,例如,使得核酸包含核苷酸的一个或多个臂或支链。任选地,支链核酸被重复分支以形成更高级的结构,如树枝状大分子等。
如本文所用的核酸还指具有与自然存在的核酸相同的基本化学结构的核酸。此类类似物具有经修饰的糖和/或经修饰的环取代基,但保留与自然存在的核酸相同的基本化学结构。核酸模拟物是指具有与核酸的一般化学结构不同的结构,但以类似于自然存在的核酸的方式起作用的化学化合物。此类类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性甲基膦酸酯、2-O-甲基核糖核苷酸和肽核酸(PNA)。
如本文所用,术语“核酸”、“核酸分子”、“核酸寡聚物”、“寡核苷酸”、“核酸序列”、“核酸片段”和“多核苷酸”可互换地使用,并且旨在包括但不限于共价键合在一起、可具有各种长度的聚合形式的核苷酸、脱氧核糖核苷酸或核糖核苷酸或其类似物、衍生物或修饰物。不同的多核苷酸可以具有不同的三维结构,并且可以执行各种已知或未知的功能。多核苷酸的非限制性实例包括基因、基因片段、外显子、内含子、基因间DNA(包括但不限于异色DNA)、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、分离的序列DNA、分离的序列RNA、sgRNA、向导RNA、核酸探针和引物。能用于本公开的方法中的多核苷酸可以包含自然核酸序列及其变体、人工核酸序列或此类序列的组合。
多核苷酸通常由四个核苷酸碱基的特异性序列组成:腺嘌呤(A);胞嘧啶(C);鸟嘌呤(G);和胸腺嘧啶(T)(当多核苷酸是RNA时,尿嘧啶(U)代表胸腺嘧啶(T))。因此,术语“多核苷酸序列”是多核苷酸分子的字母表示;可替代地,该术语可应用于多核苷酸分子本身。该字母表示可以输入到具有中央处理单元的计算机中的数据库中,并用于生物信息学应用,如功能基因组学和同源性检索。多核苷酸可以任选地包括一个或多个非标准核苷酸、核苷酸类似物和/或经修饰的核苷酸。
核酸,包括例如,具有硫代磷酸酯主链的核酸,可以包括一个或多个反应性部分。如本文所用,术语反应性部分包括能够通过共价、非共价或其它相互作用与另一分子,例如核酸或多肽反应的任何基团。举例来说,核酸可包括通过共价、非共价或其它相互作用与蛋白或多肽上的氨基酸反应的氨基酸反应性部分。
该术语还涵盖含有已知的核苷酸类似物或经修饰的主链残基或键合的核酸,其是合成的、自然存在的和非自然存在的,具有与参考核酸相似的结合特性,并且以与参考核苷酸类似的方式代谢。此类类似物的实例包括但不限于磷酸二酯衍生物,包括例如,氨基磷酸酯、二氨基磷酸酯、硫代磷酸酯(也称为在磷酸酯中具有替换氧的双键硫的硫代磷酸酯)、二硫代磷酸酯、膦酰基羧酸、膦酰基羧酸酯、膦酰基乙酸、膦酰基甲酸、膦酸甲酯、膦酸硼或O-甲基亚磷酰胺键合(参见Eckstein,《寡核苷酸和类似物:实用方法(Oligonucleotides andAnalogues:A Practical Approach)》,牛津大学出版社(Oxford University Press))以及对核苷酸碱基的修饰,如在5-甲基胞苷或假尿苷中;以及肽核酸主链和键合。其它类似物核酸包括具有正主链;非离子主链、经修饰的糖和非核糖主链的类似物核酸(例如本领域已知的二氨基磷酸酯吗啉代寡核苷酸或锁核酸(LNA)),包括描述于美国专利第5,235,033号和第5,034,506号以及《ASC研讨会系列580(ASC Symposium Series 580)》,《反义研究中的碳水化合物修饰(Carbohydrate Modifications in Antisense Research)》,Sanghui和Cook编辑的第6章和第7章中描述的类似物核酸。含有一个或多个碳环糖的核酸也包括于核酸的一个定义内。对核糖-磷酸主链的修饰可以出于多种原因进行,例如,为了增加此类分子在生理环境中,或作为生物芯片上的探针的稳定性和半衰期。可以制备自然存在的核酸和类似物的混合物;可替代地,可以制备不同核酸类似物的混合物,以及自然存在的核酸和类似物的混合物。在实施例中,DNA中的核苷酸间键合为磷酸二酯、磷酸二酯衍生物或两者的组合。
术语“硫代磷酸酯核酸”是指其中一个或多个核苷酸间键合是通过硫代磷酸酯部分(硫代磷酸酯)部分的核酸。硫代磷酸酯部分可以是一硫代磷酸酯(-P(O)3(S)3--)或二硫代磷酸酯(-P(O)2(S)2 3--)。在本文所提供的所有方面的实施例中,硫代磷酸酯部分是一硫代磷酸酯(-P(O)3(S)3--)。也就是说,在本文所提供的所有方面的实施例中,硫代磷酸酯核酸是一硫代磷酸酯核酸。在实施例中,硫代磷酸酯核酸的核苷中的一个或多个核苷通过硫代磷酸酯部分(例如,一硫代磷酸酯)部分键合,并且剩余的核苷通过磷酸二酯部分(-P(O)4 3--)键合。在实施例中,硫代磷酸酯核酸的核苷中的一个或多个核苷通过硫代磷酸酯部分(例如,一硫代磷酸酯)部分键合,并且剩余的核苷通过甲基膦酸酯键合而键合。在实施例中,硫代磷酸酯核酸的所有核苷通过硫代磷酸酯部分(例如,一硫代磷酸酯)部分键合。
硫代磷酸酯寡核苷酸(硫代磷酸酯核酸)在长度上通常为约5、6、7、8、9、10、12、15、25、30、40、50或更多个核苷酸,最多约100个核苷酸。硫代磷酸酯核酸在长度上也可以更长,例如200、300、500、1000、2000、3000、5000、7000、10,000等。如上面所描述的,在某些实施例中,本文的硫代磷酸酯核酸含有一个或多个磷酸二酯键。在其它实施例中,硫代磷酸酯核酸包括替代主链(例如,本领域已知的磷酸二酯的模拟物或类似物,如,硼磷酸酯、甲基膦酸酯、氨基磷酸酯或O-甲基亚磷酰胺键合(参见Eckstein,《寡核苷酸和类似物:实用方法》,牛津大学出版社)。硫代磷酸酯核酸还可以包括本领域已知的一种或多种核酸类似物单体,如,肽核酸单体或聚合物、锁核酸单体或聚合物、吗啉代单体或聚合物、二醇核酸单体或聚合物或苏糖核酸单体或聚合物。其它类似物核酸包括具有正主链;非离子主链和非核糖主链的类似物核酸,包括在美国专利第5,235,033号和第5,034,506号以及《ASC研讨会系列580》,《反义研究中的碳水化合物修饰》,Sanghui和Cook编辑的第6章和第7章中所描述的类似物核酸。含有一个或多个碳环糖的核酸也包括于核酸的一个定义内。对核糖-磷酸主链的修饰可以出于多种原因进行,例如,为了增加此类分子在生理环境中,或作为生物芯片上的探针的稳定性和半衰期。可以制备自然存在的核酸和类似物的混合物;可替代地,可以制备不同核酸类似物的混合物,以及自然存在的核酸和类似物的混合物。硫代磷酸酯核酸和硫代磷酸酯聚合物主链可以是线性或支链的。例如,支链核酸被重复分支以形成更高级的结构,如树枝状大分子等。
如本文所用,“硫代磷酸酯聚合物主链”是具有至少两个硫代磷酸酯键合(例如一硫代磷酸酯)(例如将糖亚单位、环状亚单位或烷基亚单位键合在一起)的化学聚合物。硫代磷酸酯聚合物主链可以是硫代磷酸酯糖聚合物,其是一种硫代磷酸酯核酸,其中戊糖链的一个或多个(或全部)链缺少通常存在于核酸中的碱基(核碱基)。硫代磷酸酯聚合物主链可以包括两个或更多个硫代磷酸酯键合。在实施例中,硫代磷酸酯聚合物主链包括至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个硫代磷酸酯键合。在实施例中,硫代磷酸酯聚合物主链包括8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个硫代磷酸酯键合。在实施例中,硫代磷酸酯核酸包括至少8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个硫代磷酸酯键合。在实施例中,硫代磷酸酯核酸包括8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个硫代磷酸酯键合。硫代磷酸酯聚合物主链可包括5、6、7、8、9、10、12、15、25、30、40、50或更多个键合,并且可以含有多达约100个硫代磷酸酯键合。硫代磷酸酯聚合物主链也可以含有更大量的键合,例如200、300、500、1000、2000、3000、5000、7000、10,000等。
硫代磷酸酯核酸和硫代磷酸酯聚合物主链可以是部分或完全硫代磷酸酯化的。在实施例中,硫代磷酸酯核酸的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或100%的核苷酸间键合是硫代磷酸酯键合。在实施例中,硫代磷酸酯核酸的10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或100%的核苷酸间键合是硫代磷酸酯键合。例如,硫代磷酸酯核酸的50%或更多的核苷酸间键合可以是硫代磷酸酯键合。在实施例中,硫代磷酸酯核酸的5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的核苷酸间键合是硫代磷酸酯键合。在实施例中,硫代磷酸酯核酸的50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的核苷酸间键合是硫代磷酸酯键合。在实施例中,硫代磷酸酯核酸的75%、80%、85%、90%、95%或99%的核苷酸间键合是硫代磷酸酯键合。在实施例中,硫代磷酸酯核酸的90%、95%或99%的核苷酸间键合是硫代磷酸酯键合。在实施例中,剩余的核苷酸间键合是磷酸二酯键合。在实施例中,剩余的核苷酸间键合是甲基膦酸酯键合。在实施例中,硫代磷酸酯核酸的100%的核苷酸间键合是硫代磷酸酯键合。类似地,硫代磷酸酯聚合物主链中5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的糖间键合可以是硫代磷酸酯键合。在实施例中,硫代磷酸酯聚合物主链中50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的糖间键合可以是硫代磷酸酯键合。在实施例中,硫代磷酸酯聚合物主链中75%、80%、85%、90%、95%或99%的糖间键合可以是硫代磷酸酯键合。在实施例中,硫代磷酸酯聚合物主链中90%、95%或99%的糖间键合可以是硫代磷酸酯键合。在实施例中,剩余的核苷酸间键合是磷酸二酯键合。在实施例中,剩余的核苷酸间键合是甲基膦酸酯键合。在实施例中,硫代磷酸酯聚合物主链的100%糖间键合是硫代磷酸酯键合。
“标记的核酸或寡核苷酸”是通过接头或化学键共价结合,或通过离子键、范德华键、静电键或氢键非共价结合到标记上的核酸,使得核酸的存在可以通过检测结合到核酸结合的可检测标记的存在来检测。可替代地,一种使用高亲和力相互作用的方法可以取得相同的结果,其中一对结合伙伴中的一者结合另一者,例如,生物素、链霉亲和素。在实施例中,硫代磷酸酯核酸或硫代磷酸酯聚合物主链包括可检测标记,如本文公开的和本领域通常已知的。在实施例中,硫代磷酸酯核酸或硫代磷酸酯聚合物主链通过化学接头连接到可检测标记。
“标记”或“可检测部分”是一种能通过光谱手段、光化学手段、生物化学手段、免疫化学手段、化学手段或其它物理手段检测的组合物。例如,有用的标记包括32P、荧光染料、电子致密试剂、酶(例如,如ELISA中常用的)、生物素、地高辛配基或半抗原和蛋白或其它实体,其可以例如通过将放射性标记掺入与靶肽特异性反应的肽或抗体中而变得可检测。可以采用本领域已知的用于将抗体与标记物偶联的任何合适的方法,例如,使用Hermanson,《生物偶联技术(Bioconjugate Techniques)》1996,学术出版社有限公司(AcademicPress,Inc.),圣地亚哥,中所描述的方法。
本文所提供的硫代磷酸酯核酸和硫代磷酸酯聚合物主链可以包括一个或多个反应性部分,例如,共价反应性部分。可以使用任何合适的接头,例如,本领域已知的聚合物接头或可替代地聚乙二醇接头或等同物将反应性部分附着到硫代磷酸酯核酸和硫代磷酸酯聚合物主链的其余部分。接头在实施例中可以包括(即,附着到)如本文所描述的可检测标记。如本文所用,术语“共价反应性部分”是指能够与如本文所描述的基因编辑剂或靶向剂的氨基酸发生化学反应以形成共价键并因此形成如本文所提供的偶联物的化学部分。
核酸可以包括非特异性序列。如本文所用,术语“非特异性序列”是指不针对特定功能而编码的核酸序列。例如,非特异性序列可以含有一系列未设计为与任何其它核酸序列互补或仅部分互补的残基。非特异性序列可以是不针对功能性核酸或蛋白而编码的序列。在实施例中,非特异性序列是包括彼此随机附着的核苷酸的核酸序列。在实施例中,非特异性序列不针对生物功能而编码。非特异性序列可以被称为“置乱”序列(例如,置乱核酸序列)。置乱序列(例如,置乱核酸序列)可以通过软件工具产生以产生序列置乱作为功能序列(例如核酸序列)的阴性对照。非特异性序列可以通过将核苷酸彼此随机附着而不以一定顺序生成。举例来说,非特异性序列(例如,核酸序列)是当与细胞或生物体接触时不起阻滞性核酸作用的序列(例如,核酸序列)。本文所提供的硫代磷酸酯核酸是非特异性核酸序列,其不包括特异性序列信息和/或不针对功能性核酸或蛋白而编码。因此,本文所提供的硫代磷酸酯核酸的功能与其序列无关,但取决于它们是否包括硫代磷酸酯键合。
术语“互补的”或“互补性”是指一种核酸通过传统Watson-Crick或其它非传统类型与另一核酸序列形成氢键的能力。例如,序列A-G-T与序列T-C-A互补。百分比互补性指示核酸分子中可与第二核酸序列形成氢键(例如,Watson-Crick碱基配对)的残基的百分比(例如10个中有5个、6个、7个、8个、9个、10个分别为50%、60%、70%、80%、90%和100%互补性)。“完全互补”意指核酸序列的所有毗邻残基将与第二核酸序列中相同数目的毗邻残基氢键结。如本文所用的“基本上互补”是指至少60%、65%、70%、75%、80%、85%、90%、95%的互补性程度。在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个核苷酸的区域内的97%、98%、99%或100%,或是指两种在严格条件(即,严格杂交条件)下杂交的核酸。如果核酸在5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个毗邻核苷酸的区域内包括至少50%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%互补的序列,那么如本文所提供的核酸基本上互补或互补。
短语“严格杂交条件”是指探针将与其靶子序列通常在核酸的复杂混合物中杂交但不与其它序列杂交的条件。严格条件是依赖于序列的,在不同情况下有所不同。较长的序列在较高温度下特异性杂交。有关核酸杂交的详尽指导见于Tijssen,《生物化学和分子生物学技术——用核探针杂交(Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Probes)》,“杂交原理和核酸测定策略综述(Overview ofprinciples of hybridization and the strategy of nucleic acid assays)”(1993)。一般而言,严格条件被选择为在限定的离子强度pH下比特异性序列的热熔点(Tm)低约5至10℃。Tm是50%与靶互补的探针在平衡(在靶序列过量存在时,在Tm下,50%的探针在平衡下被占据)下与靶序列杂交的温度(在限定的离子强度、pH和核酸浓度下)。严格条件也可以通过添加去稳定剂如甲酰胺来实现。对于选择性或特异性杂交,正信号是背景的至少两倍,优选是10倍的杂交。示范性严格杂交条件可以如下:50%甲酰胺、5×SSC和1%SDS,在42℃下温育,或5×SSC、1%SDS,在65℃下温育,在0.2×SSC和0.1%SDS中在65℃下洗涤。
如果核酸所编码的多肽基本上同一,那么在严格条件下并不彼此杂交的核酸仍基本上同一。例如,当使用遗传密码准许的最大密码子简并性产生核酸拷贝时,就会发生这种情况。在此类情况下,核酸通常在适度严格杂交条件下杂交。示范性“适度严格杂交条件”包括在40%甲酰胺、1M NaCl、1%SDS的缓冲液中在37℃下杂交,且在1X SSC中在45℃下洗涤。正杂交为背景的至少两倍。普通技术人员将容易认识到替代性杂交和洗涤条件可以用于提供类似严格度的条件。用于确定杂交参数的其它指导原则提供于许多参考文献中,例如《现代分子生物学实验指南(Current Protocols in Molecular Biology)》版,Ausubel等人,同上。
术语“基因”意指参与产生蛋白的DNA节段;其包括编解码区之前和之后的区(前导和尾部)以及各个编解码节段(外显子)之间的间插序列(内含子)。前导、尾部以及内含子包括基因转录和转译过程中必需的调控元件。此外,“蛋白基因产物”为由特定基因表达的蛋白。
本文所提供的术语“基因组编辑”或“基因编辑”是指涉及酶如聚合酶、连接酶、外切核酸酶、核酸内切酶等或其组合的逐步过程。例如,基因编辑可以包括切割核酸分子,切除在切割位点或其附近的核苷酸,最新合成新的核苷酸被以及连接经切割的链的过程。因此,本文为此提供的“基因编辑剂”包括能够编辑基因组序列的任何蛋白或酶或其组合。基因编辑可以导致靶序列处的核苷酸插入、核苷酸的缺失,或突变(点突变)。作为基因编辑的结果,一个或多个核苷酸可以在靶序列(靶座位)处插入、删除或被一个或多个化学上不同的核苷酸替换。因此,使用各种基因编辑方法(例如,使用同源重组(HR)、非同源端接合(NHEJ)、转座子介导的系统、loxP-Cre系统、CRISPR/Cas9或TALEN的方法)修饰的细胞在本公开的范围内。在实施例中,靶向并修饰受试者的基因组DNA内的一个或多个靶座位。治疗方法包含本领域可用的基因编辑工具,例如,CRISPR、锌指核酸酶、大范围核酸酶,其中靶DNA座位,例如,目标基因被修饰以在基因产物,例如,蛋白或酶中产生活性降低或无活性的突变(功能丧失突变)。
如本文所使用的关于基因的单词“表达”或“表达的”意指该基因的转录和/或转译产物。细胞中DNA分子的表达水平可以根据细胞内存在的对应mRNA的量或细胞产生的DNA编码的蛋白的量来确定。非编解码核酸分子(例如,sgRNA)的表达水平可以通过本领域众所周知的标准PCR或Northern印迹方法来检测。参见Sambrook等人,1989《分子克隆:实验手册(Molecular Cloning:A Laboratory Manual)》18.1-18.88。
如本文所提供的术语“转录调控序列”是指能够增加或减少生物体内特异性基因的转录(例如,表达)的DNA节段。转录调控序列的非限制性实例包括启动子、增强子和沉默子。
术语“转录开始位点”和“转录起始位点”可互换地使用以在本文中指基因序列(例如,DNA序列)的5'端,其中RNA聚合酶(例如,DNA指导的RNA聚合酶)开始合成RNA转录物。转录开始位点可以为转录的DNA序列的第一个核苷酸,其中RNA聚合酶开始合成RNA转录物。技术人员可以通过常规实验和分析来确定转录开始位点,例如,通过执行失控转录测定或根据FANTOM5数据库的定义。
如本文所用的术语“启动子”是指启动特定基因转录的DNA区。启动子通常位于DNA上的基因转录开始位点附近、基因的上游和相同链上(即,正义链上5'处)。启动子在长度上可以为约100至约1000个碱基对。
如本文所用的术语“增强子”是指可以由蛋白(例如,转录因子)结合以增加基因转录发生的可能性的DNA区。增强子在长度上可以为约50至约1500个碱基对。增强子可以位于其调控的转录起始位点的下游或上游,并且可以距离转录起始位点数百个碱基对。
如本文所用的术语“沉默子”是指能够结合被称为阻遏物的转录调控因子的DNA序列,从而对基因的转录产生负面影响。沉默子DNA序列可以在整个DNA的许多不同位置处发现,包括但不限于靶基因上游,其作用是阻遏基因的转录(例如,沉默基因表达)。
PAM是指“前间隔序列邻近基序”。这些位点通常是与由Cas9结合的DNA序列相邻的2至6个碱基对的DNA序列。因此,在一些情况下,可以使用除Cas9之外的DNA结合调节增强剂,并且在其它情况下,可以使用单一Cas9/RNA复合物作为DNA结合调节增强剂(单独或与不同的DNA结合调节增强剂结合)。
如本文所提供的“向导RNA”或“gRNA”是指能够结合核蛋白从而形成核糖核蛋白复合物的核糖核苷酸序列。在实施例中,该向导RNA包括一种或多种RNA分子。在实施例中,gRNA包括与靶位点(例如,靶序列)互补的核苷酸序列。gRNA中所包括的互补核苷酸序列可以介导核糖核蛋白复合物与所述靶序列的结合,从而提供核糖核蛋白复合物的序列特异性。因此,在实施例中,向导RNA与靶核酸(例如,靶序列)互补。在实施例中,向导RNA结合靶核酸序列(例如,靶序列)。在实施例中,向导RNA与CRISPR核酸序列互补。在实施例中,向导RNA的补体与靶核酸(例如,靶序列)具有约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。本文所提供的靶核酸序列是由细胞表达的核酸序列。在实施例中,本文所提供的靶核酸序列是靶序列。在实施例中,靶序列是外源性核酸序列。在实施例中,靶序列是内源性核酸序列。在实施例中,靶序列形成细胞基因的一部分。因此,在实施例中,向导RNA与细胞基因或其片段互补。在实施例中,向导RNA相对于靶序列约为50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%。在实施例中,向导RNA与细胞基因的序列互补约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%。在实施例中,向导RNA结合细胞基因序列。
在实施例中,向导RNA是单链核糖核酸。在实施例中,向导RNA在长度上为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。在实施例中,向导RNA在长度上为约10至约30个核酸残基。在实施例中,向导RNA在长度上为约20个核酸残基。在实施例中,向导RNA的长度可以是至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个核酸残基或糖残基。在实施例中,向导RNA在长度上为从5至50、10至50、15至50、20至50、25至50、30至50、35至50、40至50、45至50、5至75、10至75、15至75、20至75、25至75、30至75、35至75、40至75、45至75、50至75、55至75、60至75、65至75、70至75、5至100、10至100、15至100、20至100、25至100、30-100、35至100、40至100、45至100、50至100、55至100、60至100、65至100、70至100、75至100、80至100、85至100、90至100、95至100或更多个残基。在实施例中,向导RNA在长度上为10至15、10至20、10至30、10至40或10至50个残基。
一般而言,向导RNA是与靶多核苷酸序列具有足够互补性以与靶序列(例如,基因组或线粒体DNA靶序列)杂交并指导RNA向导的DNA核酸内切酶与靶序列的序列特异性结合的任何多核苷酸序列。在实施例中,当使用合适的比对算法最佳比对时,向导RNA与其对应的靶序列之间的互补性程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。在实施例中,当使用合适的比对算法最佳比对时,向导RNA与其对应的靶序列之间的互补性程度为至少约80%、85%、90%、95%或100%。在实施例中,互补性程度为至少90%。最佳比对可以使用用于比对序列的任何合适的算法来确定,其非限制性实例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如,Burrows-Wheeler比对器)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft科技(Novocraft Technologies))、ELAND(因美纳(Illumina),加利福尼亚州圣地亚哥(SanDiego,Calif.))、SOAP(可在soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。在实施例中,向导RNA在长度上为约或大于约10、20、30、35、40、45、50、75或更多个核苷酸。在实施例中,向导RNA在长度上为约10至约50、约15至约30或约20至约25个核苷酸。在实施例中,向导RNA在长度上小于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸。在实施例中,向导RNA在长度上为约20个核苷酸或大于约20个核苷酸。向导RNA指导复合物(例如,CRISPR复合物)与靶序列的序列特异性结合的能力可以通过任何合适的测定来评估。例如,足以形成复合物(例如,CRISPR复合物)的CRISPR系统的组分,包括待测试的向导RNA,可以如通过用编码CRISPR序列的组分的载体转染,接着通过本领域已知的Surveyor测定法评估靶序列内的优先切割而提供给具有对应靶序列的宿主细胞。类似地,靶多核苷酸序列的切割可以通过提供靶序列、复合物(例如,CRISPR复合物)的组分,包括待测试的向导RNA和不同于测试向导RNA的对照向导RNA,以及比较在测试和对照向导RNA反应之间在靶序列处的结合或切割速率而在试管中进行评价。其它测定法也是可能的,并且本领域技术人员会想到。
术语“氨基酸”是指自然存在和合成的氨基酸、以及以与自然存在的氨基酸类似的一种方式起作用的氨基酸类似物和氨基酸模拟物。自然存在的氨基酸是由遗传密码编码的氨基酸、以及后来经修饰的那些氨基酸,例如,羟基脯氨酸、γ-羧基谷氨酸以及O-磷酸丝氨酸。氨基酸类似物是指具有与自然存在的氨基酸相同的基本化学结构的化合物,即,结合到氢、羧基基团、氨基基团和R基团的α碳,例如,高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。此类类似物具有经修饰的R基团(例如,正亮氨酸)或经修饰的肽主链,但保留与自然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指结构不同于氨基酸的一般化学结构但以与自然存在的氨基酸类似的方式起作用的化合物。术语“非自然存在的氨基酸”和“非自然氨基酸”是指自然界中未发现的氨基酸类似物、合成氨基酸和氨基酸模拟物。
氨基酸在本文通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会(IUPAC-IUB Biochemical Nomenclature Commission)推荐的单字母符号来提及。同样,核苷酸可以由其通常接受的单字母密码来提及。
术语“多肽”、“肽”和“蛋白”在本文中可互换地使用以指代氨基酸残基的聚合物,其中该聚合物可以在实施例中偶联到不由氨基酸组成的部分。这些术语适用于一个或多个氨基酸残基为对应自然存在的氨基酸的人造化学模拟物的氨基酸聚合物,也适用于自然存在的氨基酸聚合物和非自然存在的氨基酸聚合物。“融合蛋白”是指编码以重组方式表达为单个部分的两个或更多个单独的蛋白序列的嵌合蛋白。
“经保守修饰的变体”适用于氨基酸序列和核酸序列两者。关于特定核酸序列,“经保守修饰的变体”是指编码同一或基本上同一的氨基酸序列的那些核酸。由于遗传密码的简并,多个核酸序列将编码任何给定的蛋白。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在由密码子指定丙氨酸的每个位置,该密码子可以改变为所描述的对应密码子中的任何密码子而不改变所编码的多肽。此类核酸变异为“沉默变异”,其为经保守修饰的变异的一个物种。本文中编码多肽的每个核酸序列也描述了核酸的每个可能的沉默变异。技术人员将认识到核酸中的每个密码子(除通常是甲硫氨酸的唯一密码子的AUG和通常是色氨酸的唯一密码子TGG外)可以经修饰以得到在功能上相同的分子。因此,编码多肽的核酸的每个沉默变异隐含在每个所描述的序列中。
至于氨基酸序列,技术人员将认识到改变、添加或删除所编码的序列中的单个氨基酸或小百分比的氨基酸的核酸、肽、多肽或蛋白序列的个别取代、缺失或添加为“经保守修饰的变体”,其中改变会引起氨基酸经化学上类似的氨基酸取代。提供功能上类似的氨基酸的保守取代表在本领域中众所周知。此类经保守修饰的变体除了本公开的多晶型变体、种间同源物和等位基因并且不排除多晶型变体、种间同源物和等位基因。以下八组各自含有彼此保守取代的氨基酸:(1)丙氨酸(A)、甘氨酸(G);(2)天冬氨酸(D)、谷氨酸(E);(3)天冬酰胺(N)、谷氨酰胺(Q);(4)精氨酸(R)、赖氨酸(K);(5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);(6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);(7)丝氨酸(S)、苏氨酸(T);以及(8)半胱氨酸(C)、甲硫氨酸(M)(参见,例如,Creighton《蛋白(Proteins)》(1984))。
“序列同一性百分比”是通过在比较窗口内比较两个最佳比对的序列确定的,其中比较窗口中的多核苷酸序列或多肽序列的部分可以包含如相比于用于两个序列的最佳比对的参考序列(其不包含添加或缺失)的添加或缺失(即,间隙)。百分比通过以下计算:确定两个序列中出现同一核酸碱基或氨基酸残基的位置的数量以得到匹配的位置的数量,将匹配的位置的数量除以比较窗口中的位置的总数量并且将结果乘以100以得到序列同一性百分比。
在两个或更多个核酸或多肽序列的上下文中,术语“同一的”或百分比“同一性”是指如使用以下序列比较算法中的一种算法或通过人工比对和目视检查测量的,当在比较窗口或指定区域内针对最大对应性进行比较和比对时,相同的或具有规定百分比的相同氨基酸残基或核苷酸(即,在本发明的例如整个多肽序列的指明区域内或本发明的多肽的单个结构域内具有60%的同一性,任选地65%、70%、75%、80%、85%、90%、95%、98%或99%的同一性)的两个或更多个序列或子序列。此类序列然后被称为“基本上同一”。此定义也指测试序列的补体。任选地,该同一性存在于长度为至少约15个核苷酸的区域内,或更优选地存在于长度为100至500或1000或更多个核苷酸的区域内。
对于序列比较,通常一个序列充当参考序列,测试序列与其进行比较。当使用序列比较算法时,将测试序列和参考序列录入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。可以使用默认程序参数,也可以指定替代性参数。然后序列比较算法基于程序参数计算测试序列相对于参考序列的序列同一性百分比。
如本文所用,“比较窗口”包括选自由以下组成的组的毗邻位置的数量中的任一数量的节段的参考:例如,全长序列或20至600、约50至约200或约100至约150个氨基酸或核苷酸,其中在两个序列最佳比对后,可将序列与相同数量的毗邻位置的参考序列进行比较。用于比较的序列比对方法在本领域中是众所周知的。用于比较的序列的最佳比对可以例如通过以下进行:例如,Smith和Waterman的局部同源性算法1970《应用数学进展(Adv.Appl.Math.)》2:482c、Needleman和Wunsch的同源性比对算法(1970)《分子生物学杂志(J.Mol.Biol.)》48:443、Pearson和Lipman的相似性搜索方法(1988)《美国国家科学院院刊(Proc.Nat'l.Acad.Sci.USA)》85:2444、这些算法(威斯康星遗传学软件包(WisconsinGenetics Software Package),遗传学计算机组公司(Genetics Computer Group),575《科学指南(Science Dr.)威斯康星州麦迪逊(Madison,WI)中的GAP、BESTFIT、FASTA和TFASTA)的计算机化实现或人工比对和目视检查(参见,例如,Ausubel等人,《现代分子生物学实验指南》(1995增补))。
适合于确定百分比序列同一性和序列相似性的算法的实例是BLAST和BLAST 2.0算法,其分别描述于Altschul等人(1977)《核酸研究(Nuc.Acids Res.)》25:3389-3402,和Altschul等人(1990)《分子生物学杂志》215:403-410。用于执行BLAST分析的软件可在国家生物技术信息中心(National Center for Biotechnology Information)公开获取(http://www.ncbi.nlm.nih.gov/)。该算法涉及首先通过标识问询序列中的长度W的短字符来标识高评分序列对(HSP),当与数据库序列中相同长度的字符比对时,该问询序列中的长度W的短字符能匹配或满足某一正值阈值得分T。T被称为邻近字符得分阈值(Altschul等人,同上)。这些初始邻近字符命中充当启动搜索以找到含有其的较长HSP的种子。字符命中沿每个序列在两个方向上延伸,直到累积比对得分可以增加。对于核苷酸序列,利用参数M(匹配残基对的奖励得分;总是>0)和N(错配残基的罚分;总是<0)计算累积得分。对于氨基酸序列,使用评分矩阵来计算累积得分。当出现以下情形时,终止每个方向上字符命中的延伸:累积比对得分从其最大实现值下降X的量;由于累积一个或多个负评分的残基比对而使累积得分达到0或更低;或到达任一序列的端。BLAST算法参数W、T以及X决定比对的敏感性和速度。BLASTN程序(对于核苷酸序列)默认使用:字长(W)为11、预期值(E)为10、M=5、N=-4以及两条链的比较。对于氨基酸序列,BLASTP程序默认使用:字长(W)为3、预期值(E)为10以及BLOSUM62评分矩阵(参见Henikoff和Henikoff(1989),《美国国家科学院院刊》89:10915)比对(B)为50、期望值(E)为10、M=5、N=-4以及两条链的比较。
BLAST算法还对两个序列之间的相似性执行统计分析(参见,例如,Karlin和Altschul(1993)《美国国家科学院院刊》90:5873-5787)。BLAST算法提供的相似性的一个度量是最小和概率(P(N)),其提供了两个核苷酸序列或氨基酸序列之间的匹配偶然出现的概率的指示。例如,如果测试核酸与参考核酸的比较中的最小和概率小于约0.2、更优选小于约0.01以及最优选小于约0.001,则认为核酸与参考序列类似。
两个核酸序列或多肽是基本上同一的指示是第一核酸所编码的多肽与针对第二核酸所编码的多肽产生的抗体发生免疫交叉反应,如下文所述。因此,例如,在两个肽的区别仅为保守型取代的情况下,多肽通常与第二多肽是基本上同一。两个核酸序列是基本上同一的另一指示是两个分子或其补体在严格条件下彼此杂交,如下文所述两个核酸序列基本上同一的另一指示是相同的引物可用于扩增该序列。
氨基酸或核苷酸碱基“位置”由编号表示,该编号基于其相对于N末端(或5'端)的位置顺序地标识参考序列中的每个氨基酸(或核苷酸碱基)。由于在确定最佳比对时必须考虑的缺失、插入、截短、融合等,因此,一般而言,测试序列中的通过仅从N末端进行计数而确定的氨基酸残基的编号不一定与其在参考序列中的对应位置的编号相同。例如,在变体相对于比对的参考序列具有缺失的情况下,变体中将不存在与参考序列中的缺失位点处的位置相对应的氨基酸。在比对的参考序列中存在插入的情况下,该插入将不对应于参考序列中的经编号的氨基酸位置。在截短或融合的情况下,参考序列或比对的序列中可能存在不对应于对应序列中的任何氨基酸的氨基酸段。
当在对给定氨基酸或多核苷酸序列进行编号的上下文中使用时,术语“相对于...进行编号”或“对应于...进行编号”是指在将给定氨基酸或多核苷酸序列与参考序列进行比较时,对指明的参考序列的残基进行编号。
“抗体”是指包含来自免疫球蛋白基因或其片段的特异性结合并识别抗原的框架区的多肽。所识别的免疫球蛋白基因包括κ、λ、α、γ、δ、ε和μ恒定区基因以及无数免疫球蛋白可变区基因。轻链被分类为κ或λ。重链被分类为γ、μ、α、δ或ε,其又分别定义免疫球蛋白类别IgG、IgM、IgA、IgD和IgE。通常,抗体的抗原结合区在确定结合的特异性和亲和力中起重要作用。在一些实施例中,抗体或抗体片段可以来源自不同的生物体,包括人、小鼠、大鼠、仓鼠、骆驼等。本发明的抗体可以包括在一个或多个氨基酸位置处被修饰或突变以改善或调节抗体的期望功能(例如,糖基化、表达、抗原识别、效应物功能、抗原结合、特异性等)的抗体。
抗体是内部结构复杂的大复杂分子(分子量约150,000或约1320个氨基酸)。自然抗体分子含有两对同一的多肽链,每对都有一条轻链和一条重链。每条轻链和每条重链又由两个区组成:参与结合靶抗原的可变(“V”)区和与免疫系统的其它组分相互作用的恒定(“C”)区。轻链可变区和重链可变区在三维空间聚集在一起形成结合抗原(例如,细胞表面上的受体)的可变区。在每个轻链或重链可变区内,有三个称为互补决定区(“CDR”)的短节段(长度平均为10个氨基酸)。抗体可变结构域中的6个CDR(3个来自轻链,3个来自重链)在3维空间中折叠在一起,形成与靶抗原对接的实际抗体结合位点。CDR的位置和长度已由Kabat,E.等人《免疫相关蛋白序列(Sequences of Proteins of ImmunologicalInterest)》,美国卫生与公众服务部(U.S.Department of Health and Human Services)1983、1987精确定义。不包含在CDR中的可变区的部分称为框架(“FR”),其构成CDR的环境。
示范性免疫球蛋白(抗体)结构单元包含四聚体。每个四聚体由两对同一的多肽链组成,每对具有一条“轻”链(约25kD)和一条“重”链(约50至70kD)。每条链的N末端限定了主要负责抗原识别的约100至110或更多个氨基酸的可变区。术语可变轻链(VL)和可变重链(VH)分别指这些轻链和重链。Fc(即,片段可结晶区)是免疫球蛋白的“基”或“尾”,并且通常由两条重链组成,该重链根据抗体的类别贡献两个或三个恒定结构域。通过结合到特异性蛋白,Fc区确保每种抗体对给定抗原产生适当的免疫应答。Fc区也结合到各种细胞受体,如Fc受体和其它免疫分子,如补体蛋白。
抗体例如、作为完整的免疫球蛋白或作为通过用各种肽酶消化产生的许多良好表征的片段而存在。因此,例如,胃蛋白酶消化铰链区中二硫键下方的抗体以产生F(ab)'2,F(ab)'2是Fab的二聚体,其本身是通过二硫键接合到VH-CH1的轻链。F(ab)'2可以在温和条件下还原以断裂铰链区中的二硫键,从而将F(ab)'2二聚体转化成Fab'单体。Fab'单体基本上是具有部分铰链区的抗原结合部分(参见,基础免疫学(Fundamental Immunology)(Paul编辑,第3版)1993)。虽然各种抗体片段是根据完整抗体的消化来定义的,但是本领域技术人员将理解这些片段可以通过化学方法或通过使用重组DNA方法从头合成。因此,如本文所用的术语抗体还包括通过修饰完整抗体产生的抗体片段或使用重组DNA方法(例如,单链Fv)从头合成的抗体片段或使用噬菌体展示文库标识的抗体片段(参见,例如,McCafferty等人,《自然(Nature)》348:552-554(1990))。
单链可变片段(scFv)通常是免疫球蛋白的重链(VH)和轻链(VL)的可变区的融合蛋白,其与10至约25个氨基酸的短接头肽连接。接头为了柔韧性常常富含甘氨酸,为了溶解性也常常富含丝氨酸或苏氨酸。接头可以将VH的N末端与VL的C末端连接,反之亦然。
mAb的表位是mAb结合到的其抗原的区域。如果每种抗体竞争性阻滞(阻断)另一种抗体与抗原的结合,则两种抗体结合到相同或重叠的表位。也就是说,如在竞争性结合测定法中所测量的,1×、5×、10×、20×或100×过量的一种抗体阻滞另一种抗体的结合到至少30%,但优选50%、75%、90%或甚至99%(参见,例如,Junghans等人,《癌症研究(CancerRes.)》50:1495,1990)。可替代地,如果抗原中减少或消除一种抗体的结合的基本上所有氨基酸突变减少或消除另一种抗体的结合,则两种抗体具有相同的表位。如果减少或消除一种抗体的结合的一些氨基酸突变减少或消除另一种抗体的结合,则两种抗体具有重叠表位。
如本文所提供的“抗体变体”是指一种能够结合到抗原并且包括抗体或其片段的一个或多个结构域的多肽。抗体变体的非限制性实例包括结构域抗体或纳米抗体、亲和体(多肽,其比单克隆抗体小(例如,约6kDA)并且能够以高亲和力结合抗原并模拟单克隆抗体、单特异性Fab2、双特异性Fab2、三特异性Fab3、单价IgG、scFv、双特异性双体、三特异性三体、scFv-Fc、微抗体、IgNAR、V-NAR、hcIgG、VhH或肽体。本文所描述的“纳米抗体”或“单结构域抗体”在本领域中是众所周知的,是指由单个单体可变抗体结构域组成的抗体片段。像全抗体一样,其能够选择性地结合到特异性抗原。本文所提供的“肽体”是指附着(通过共价或非共价接头)到抗体的Fc结构域的肽部分。本领域已知的抗体变体的其它非限制性实例包括由软骨鱼或骆驼科动物产生的抗体。来自骆驼科动物的抗体及其可变区以及其生产、分离和使用的方法的一般描述可以在文献WO97/49805和WO 97/49805中找到,其以全文引用的方式并入本文中并且用于所有目的。同样,来自软骨鱼的抗体及其可变区以及其生产、分离和使用的方法可以在WO2005/118629中找到,其以全文引用的方式并入本文中并用于所有目的。
对于本发明的合适抗体和根据本发明的供使用的合适抗体,例如,重组抗体、单克隆抗体或多克隆抗体的制备,可以使用本领域已知的许多技术(参见,例如,Kohler和Milstein,《自然》256:495-497(1975);Kozbor等人,《当代免疫学(Immunology Today)》4:72(1983);Cole等人,《单克隆抗体和癌症疗法(Monoclonal Antibodies and CancerTherapy)》第77至96页,Alan R.Liss公司(Alan R.Liss,Inc.)(1985);Coligan,《现代免疫学实验指南(Current Protocols in Immunology)》(1991);Harlow和Lane,《抗体:实验室手册(Antibodies,A laboratory manual)》(1988);和Goding,《单克隆抗体:原则与实践(Monoclonal Antibodies:Principles and Practice)》(第2版,1986))。编码目标抗体的重链和轻链的基因可以从细胞中克隆,例如,编码单克隆抗体的基因可以从杂交瘤中克隆并用于产生重组单克隆抗体。编码单克隆抗体重链和轻链的基因文库也可由杂交瘤或浆细胞制成。重链和轻链基因产物的随机组合生成具有不同抗原特异性的大抗体池(参见,例如,Kuby,《免疫学(Immunology)》(第3版,1997)。用于产生单链抗体或重组抗体的技术(美国专利4,946,778,美国专利第4,816,567号)可适用于产生针对本发明多肽的抗体。此外,转基因小鼠或其它生物体如其它哺乳动物可用于表达人源化或人抗体(参见,例如,美国专利第5,545,807号;第5,545,806号;第5,569,825号;第5,625,126号;第5,633,425号;第5,661,016号,Marks等人,《生物技术(Bio/Technology)》10:779-783(1992);Lonberg等人,《自然》368:856-859(1994);Morrison,《自然》368:812-13(1994);Fishwild等人,《自然生物技术(Nature Biotechnology)14:845-51(1996);Neuberger,《自然生物技术》14:826(1996);和Lonberg和Huszar,《国际免疫学回顾(Intern.Rev.Immunol.)》13:65-93(1995))。可替代地,噬菌体展示技术可用于标识特异性结合到所选抗原的抗体和异聚Fab片段(参见,例如,McCafferty等人,《自然》348:552-554(1990);Marks等人,《生物技术》10:779-783(1992))。抗体也可以制成双特异性的,即能识别两种不同的抗原(参见,例如,WO93/08829,Traunecker等人,《欧洲分子生物学学会杂志(EMBO J.)》10:3655-3659(1991);和Suresh等人,《酶学方法(Methods in Enzymology)》121:210(1986))。抗体也可以是异源偶联物,例如,两个共价接合的抗体或免疫毒素(参见,例如,美国专利第4,676,980号、WO91/00360;WO 92/200373;和EP 03089)。
用于人源化或灵长类化非人抗体的方法在本领域中是众所周知的(例如,美国专利第4,816,567号;第5,530,101号;第5,859,205号;第5,585,089号;第5,693,761号;第5,693,762号;第5,777,085号;第6,180,370号;第6,210,671号和第6,329,511号;WO 87/02671;EP专利申请0173494;Jones等人(1986)《自然》321:522;和Verhoyen等人(1988)《科学》239:1534)。人源化抗体进一步描述于例如Winter和Milstein(1991)《自然》349:293中。一般而言,人源化抗体具有一个或多个从非人来源引入其中的氨基酸残基。这些非人氨基酸残基往往被称为输入残基,其通常取自输入可变结构域。人源化基本上可以按照Winter及其同事的方法执行(参见,例如,Morrison等人,《美国科学院院报(PNAS USA)》,81:6851-6855(1984),Jones等人,《自然》321:522-525(1986);Riechmann等人,《自然》332:323-327(1988);Morrison和Oi,《免疫学进展(Adv.Immunol.)》,44:65-92(1988),Verhoeyen等人,《科学》239:1534-1536(1988)和Presta,《当代结构生物学观点(Curr.Op.Struct.Biol.)》2:593-596(1992),Padlan,《分子免疫学(Molec.Immun.)》,28:489-498(1991);Padlan,《分子免疫学》,31(3):169-217(1994)),方法是用啮齿动物CDR或CDR序列取代人抗体的对应序列。因此,这种人源化抗体是嵌合抗体(美国专利第4,816,567号),其中基本上不到一个完整的人可变结构域被来自非人物种的对应序列取代。实际上,人源化抗体通常是人抗体,其中一些CDR残基和可能一些FR残基被啮齿动物抗体中相似位点的残基取代。例如,包含针对人源化免疫球蛋白框架区编解码的第一序列和针对所需免疫球蛋白互补决定区编解码的第二序列集的多核苷酸可以以合成方法或通过组合合适的cDNA和基因组DNA节段来产生。人恒定区DNA序列可以按照众所周知的程序从各种人细胞中分离。
“嵌合抗体”是一种抗体分子,其中(a)恒定区或其部分被改变、替换或交换,使得抗原结合位点(可变区)键合到不同或经改变的类别、效应物功能和/或物种或赋予嵌合抗体新特性的完全不同的分子的恒定区,例如,酶、毒素、激素、生长因子、药物等;或(b)可变区或其部分用具有不同或经改变的抗原特异性的可变区进行改变、替换或交换。本发明的优选抗体和根据本发明的供使用的优选抗体包括人源化和/或嵌合单克隆抗体。
本文所提供的“治疗性抗体”是指用于治疗癌症、自身免疫性疾病、移植排斥、心血管疾病或其它疾病或病症(如本文所描述的疾病或病症)的任何抗体或其功能性片段(例如,纳米抗体)。治疗性抗体的非限制性实例包括鼠抗体、鼠源化的或人源化的嵌合体抗体或人抗体,包括但不限于爱必妥(Erbitux)(西妥昔单抗(cetuximab))、瑞普罗(阿昔单抗(abciximab))、舒莱(巴利昔单抗(basiliximab))、瑞米凯德(Remicade)(英夫利昔单抗(infliximab));正克隆OKT3(莫罗单抗CD3(muromonab-CD3));美罗华(Rituxan)(利妥昔单抗(rituximab))、百克沙(Bexxar)(托西莫单抗(tositumomab))、修美乐(Humira)(阿达木单抗(adalimumab))、坎帕斯(Campath)(阿仑单抗(alemtuzumab))、舒莱(巴利昔单抗(basiliximab))、阿瓦斯汀(Avastin)(贝伐单抗(bevacizumab))、希敏佳(Cimzia)(培塞利珠单抗(certolizumab pegol))、塞尼哌(Zenapax)(达利珠单抗(daclizumab))、舒立瑞(Soliris)(依库珠单抗(eculizumab))、瑞体肤(Raptiva)(依法珠单抗(efalizumab))、米罗他(Mylotarg)(吉妥珠单抗(gemtuzumab))、泽娃灵(Zevalin)(替伊莫单抗(ibritumomabtiuxetan))、Tysabri(那他珠单抗(natalizumab))、索雷尔(Xolair)(奥马珠单抗(omalizumab))、Synagis(帕利珠单抗(palivizumab))、维必施(Vectibix)(帕尼单抗(panitumumab))、诺适得(Lucentis)(雷珠单抗(ranibizumab))和赫赛汀(Herceptin)(曲妥珠单抗(trastuzumab))。
用于将治疗剂偶联到抗体的技术是众所周知的(参见,例如,Arnon等人,“癌症疗法中用于药物的免疫靶向的单克隆抗体(Monoclonal Antibodies For ImmunotargetingOf Drugs In Cancer Therapy)”,Reisfeld等人(编辑),第243-56页(Alan R.Liss公司1985);Hellstrom等人,“受控药物递送中用于药物递送的抗体(Antibodies For DrugDelivery in Controlled Drug Delivery)”(第2版),Robinson等人(编辑),第623-53页(马塞尔·德克公司(Marcel Dekker,Inc.)1987);“癌症疗法中细胞毒性剂的抗体携带体:单克隆抗体'84的综述:《生物学和临床应用》(Antibody Carriers Of Cytotoxic AgentsIn Cancer Therapy:A Review"in Monoclonal Antibodies‘84:Biological AndClinical Applications)”,Pinchera等人(编辑),第475-506页(1985);和Thorpe等人,“抗体-毒素偶联物的制备和细胞毒性特性(The Preparation And Cytotoxic Properties OfAntibody-Toxin Conjugates)”,《免疫学评论(Immunol.Rev.)》,62:119-58(1982))。如本文所用,术语“抗体-药物偶联物”或“ADC”是指与偶联到抗体或以其它方式共价结合到抗体的治疗剂。
当提及蛋白或肽时,短语“特异性(或选择性)结合到抗体”或“与……特异性(或选择性)免疫反应的”是指往往在蛋白和其它生物制剂的异质群体中决定蛋白存在的结合反应。因此,在指定的免疫测定条件下,指明的抗体结合到特定蛋白至少是背景的两倍,更通常是背景的10至100倍。在此类条件下到抗体的特异性结合通常需要其对特定蛋白的特异性而选择的抗体。例如,可以选择多克隆抗体以仅获得与所选抗原特异性免疫反应而不与其它蛋白特异性免疫反应的抗体亚群。这种选择可以通过减去与其它分子交叉反应的抗体来实现。多种免疫测定形式可用于选择与特定蛋白特异性免疫反应的抗体。例如,固相ELISA免疫测定法按常规用于选择与蛋白特异性免疫反应的抗体(参见,例如,Harlow和Lane,抗体的使用(Using Antibodies),《实验室手册(A Laboratory Manual)》(1998),用于描述可用于测定特异性免疫反应性的免疫测定形式和条件)。
“配体”是指一种能够结合到受体的媒剂,例如,多肽或其它分子。
术语“抗原”和“表位”可互换地指被免疫系统的组分,例如,抗体、T细胞受体或其它免疫受体如自然杀伤(NK)细胞上的受体特异性识别的分子(例如,多肽)的部分。如本文所用,术语“抗原”涵盖抗原性表位及其抗原性片段。
对于本文所描述的特异性蛋白(例如,Cas9、Cpf1、TALEN等),所命名的蛋白包括保持蛋白活性(例如,与天然蛋白相比在至少50%、80%、90%、95%、96%、97%、98%、99%或100%的活性内)的蛋白中的任何蛋白的自然存在的形式或变体或同源物。在实施例中,与自然存在的形式相比,变体或同源物在整个序列或序列的一部分(例如,50,100,150或200个连续氨基酸部分)上具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的氨基酸序列同一性。在实施例中,该蛋白是如通过其NCBI序列参考所标识的蛋白。在实施例中,该蛋白是如通过其NCBI序列参考所标识的蛋白或其功能片段或同源物。
术语“RNA向导的DNA核酸内切酶”等在通常和惯用意义上是指切割DNA多核苷酸链内的磷酸二酯键的酶,其中磷酸二酯键的识别由单独的RNA序列(例如,单一向导RNA或pegRNA)促进。
“pegRNA”或“主要编辑向导RNA”是一种核糖核酸分子,其能够(i)与欲编辑的靶核苷酸序列杂交并且(ii)编码替换靶序列或其部分(至少一个核苷酸(例如,2、3、4、5、6))的新遗传信息。pegRNA包括延伸的单向导RNA(sgRNA),其包括引物结合位点(PBS)和逆转录酶(RT)模板序列。在DNA编辑期间,引物结合位点允许带切口的DNA链的3'端与pegRNA杂交,而RT模板用作合成经编辑的遗传信息的模板。
术语“II类CRISPR核酸内切酶”是指具有与Cas9类似的核酸内切酶活性并参与II类CRISPR系统的核酸内切酶。一种实例II类CRISPR系统是来自酿脓链球菌(Streptococcuspyogenes)SF370的II型CRISPR座位,其含有四个基因Cas9、Cas1、Cas2和Csn1的簇,以及两个非编解码RNA元件、tracrRNA和由非重复序列的短段(间隔序列,各约30bp)间隔的重复序列(直接重复)的特征性阵列。Cpf1酶属于推定的V型CRISPR-cas系统。II型系统和V型系统都包括在CRISPR-cas系统的II类中。
术语“核酸酶缺乏型RNA向导的DNA核酸内切酶”或“核酸酶缺乏型RNA向导的DNA核酸内切酶”在通常和惯用意义上是指靶向DNA多核苷酸内的特异性磷酸二酯键的RNA向导的DNA核酸内切酶(例如,自然存在的RNA向导的DNA核酸内切酶的经突变的形式),其中磷酸二酯键的识别由单独的多核苷酸序列(例如,RNA序列(例如,单一向导RNA(sgRNA))促进,但是不能将靶磷酸二酯键切割至显著的程度(例如,在生理条件下没有可测量的磷酸二酯键的切割)。因此,核酸酶缺乏型RNA向导的DNA核酸内切酶在与多核苷酸(例如sgRNA)复合时保留DNA结合能力(例如,特异性结合到靶序列),但缺乏显著的核酸内切酶活性(例如,任何量的可检测核酸内切酶活性)。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是dCas9、dCpf1、ddCpf1、核酸酶缺乏型Cas9变体、核酸酶缺乏型II类CRISPR核酸内切酶、锌指结构域、亮氨酸拉链结构域、翼螺旋结构域、TAL效应物、螺旋转角螺旋基序、螺旋环螺旋结构域、HMB盒结构域、Wor3结构域、OB折叠结构域、免疫球蛋白结构域或B3结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是锌指结构域、亮氨酸拉链结构域、翼螺旋结构域、TAL效应物,螺旋转角螺旋基序、螺旋环螺旋结构域、HMB盒结构域、Wor3结构域、OB折叠结构域、免疫球蛋白结构域或B3结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是锌指结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是亮氨酸拉链结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是翼螺旋结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是TAL效应物。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是螺旋环螺旋结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是HMB盒结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是Wor3结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是OB折叠结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是免疫球蛋白结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是B3结构域。在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是dCas9、ddCpf1、核酸酶缺乏型Cas9变体或核酸酶缺乏型II类CRISPR核酸内切酶。
在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是dCas9。如本文所提及的术语“dCas9”或“dCas9蛋白”是核酸内切酶活性的两个催化位点都有缺陷或缺乏活性的Cas9蛋白。在实施例中,dCas9蛋白在对应于酿脓链球菌Cas9的D10A和H840A的位置具有突变。在实施例中,由于野生型Cas9的核酸内切酶催化位点(RuvC和HNH)处的点突变,dCas9蛋白缺乏核酸内切酶活性。点突变可以是D10A和H840A。在实施例中,dCas9基本上不具有可检测核酸内切酶(例如,脱氧核糖核酸内切酶)活性。在实施例中,dCas9基本上不具有可检测核酸内切酶(例如,脱氧核糖核酸内切酶)活性。
如本文所提及的“CRISPR相关蛋白9”、“Cas9”、“Csn1”或“Cas9蛋白”包括保持Cas9核酸内切酶活性(例如,与Cas9相比在至少50%、80%、90%、95%、96%、97%、98%、99%或100%活性内)的Cas9核酸内切酶或其变体或同源物的重组或自然存在的形式中的任何重组或自然存在的形式。在一些方面,与自然存在的Cas9蛋白相比,变体或同源物在整个序列或序列的一部分(例如50、100、150或200个连续氨基酸部分)上具有至少90%、95%、96%、97%、98%、99%或100%的氨基酸序列同一性。在实施例中,Cas9蛋白与由UniProt参考号Q99ZW2所标识的蛋白或与其具有实质同一性的变体或同源物基本上同一。在实施例中,Cas9蛋白与由UniProt参考号Q99ZW2所标识的蛋白的氨基酸序列具有至少75%的序列同一性。在实施例中,Cas9蛋白与由UniProt参考号Q99ZW2所标识的蛋白的氨基酸序列具有至少80%的序列同一性。在实施例中,Cas9蛋白与由UniProt参考号Q99ZW2所标识的蛋白的氨基酸序列具有至少85%的序列同一性。在实施例中,Cas9蛋白与由UniProt参考号Q99ZW2所标识的蛋白的氨基酸序列具有至少90%的序列同一性。在实施例中,Cas9蛋白与由UniProt参考号Q99ZW2所标识的蛋白的氨基酸序列具有至少95%的序列同一性。
在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是“ddCpf1”或“ddCas12a”。术语“DNA酶失活Cpf1”或“ddCpf1”是指导致Cpf1 DNA酶活性钝化的经突变的氨基酸球菌属(Acidaminococcus sp.)Cpf1(AsCpf1)。在实施例中,ddCpf1在AsCpf1的RuvC结构域中包括E993A突变。在实施例中,ddCpf1基本上不具有可检测核酸内切酶(例如,脱氧核糖核酸内切酶)活性。
在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是dLbCpf1。术语“dLbCpf1”:是指缺乏DNA酶活性的来自毛螺菌科(Lachnospiraceae)细菌ND2006的经突变的Cpf1(LbCpf1)。在实施例中,dLbCpf1包括D832A突变。在实施例中dLbCpf1基本上不具有可检测核酸内切酶(例如,脱氧核糖核酸内切酶)活性。
在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是dFnCpf1。术语“dFnCpf1”是指缺乏DNA酶活性的来自新凶手弗朗西斯菌(Francisella novicida)U112的突变后的Cpf1(FnCpf1)。在实施例中,dFnCpf1包括D917A突变。在实施例中,dFnCpf1基本上不具有可检测核酸内切酶(例如,脱氧核糖核酸内切酶)活性。
如本文所提及的“Cpf1”或“Cpf1蛋白”包括保持Cpf1核酸内切酶活性(例如,与Cpf1相比在至少50%、80%、90%、95%、96%、97%、98%、99%或100%活性内)的Cpf1(来自普氏菌属(Prevotella)和弗朗西斯氏菌属1(Francisella 1)的CRISPR)核酸内切酶或其变体或同源物的重组或自然存在的形式中的任何重组或自然存在的形式。在实施例中,与自然存在的Cpf1蛋白相比,变体或同源物在整个序列或序列的一部分(例如50、100、150或200个连续氨基酸部分)上具有至少90%、95%、96%、97%、98%、99%或100%的氨基酸序列同一性。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白或与其具有实质同一性的变体或同源物基本上同一。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白同一。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白的氨基酸序列具有至少75%的序列同一性。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白的氨基酸序列具有至少80%序列同一性。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白同一。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白的氨基酸序列具有至少85%的序列同一性。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白同一。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白的氨基酸序列具有至少90%的序列同一性。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白同一。在实施例中,Cpf1蛋白与由UniProt参考号U2UMQ6所标识的蛋白的氨基酸序列具有至少95%的序列同一性。
如本文所提及的“Argonaut”或“Argonaut蛋白”包括保持Argonaut核酸内切酶活性((例如,与Argonaut相比在至少50%、80%、90%、95%、96%、97%、98%、99%或100%活性内))的Argonaut(格氏嗜盐碱杆菌(Natronobacterium gregoryi))核酸内切酶或其变体或同源物的重组或自然存在的形式中的任何重组或自然存在的形式。在实施例中,与自然存在的Argonaut蛋白相比,变体或同源物在整个序列或序列的一部分(例如50、100、150或200个连续氨基酸部分)上具有至少90%、95%、96%、97%、98%、99%或100%的氨基酸序列同一性。在实施例中,Argonaut蛋白与由UniProt参考号A0A172MAH6所标识的蛋白或与其具有实质同一性的变体或同源物基本上同一。
在实施例中,核酸酶缺乏型RNA向导的DNA核酸内切酶是核酸酶缺乏型II类CRISPR核酸内切酶。如本文所用的术语“核酸酶缺乏型II类CRISPR核酸内切酶”是指具有导致降低、受损或无活性的核酸内切酶活性的突变的任何II类CRISPR核酸内切酶。
“可检测媒剂”或“可检测部分”是一种能通过合适的手段例如光谱手段、光化学手段、生物化学手段、免疫化学手段、化学手段、磁共振成像手段或其它物理手段检测的组合物。例如,有用的可检测媒剂包括18F、32P、33P、45Ti、47Sc、52Fe、59Fe、62Cu、64Cu、67Cu、67Ga、68Ga、77As、86Y、90Y。89Sr、89Zr、94Tc、94Tc、99mTc、99Mo、105Pd、105Rh、111Ag、111In、123I、124I、125I、131I、142Pr、143Pr、149Pm、153Sm、154-1581Gd、161Tb、166Dy、166Ho、169Er、175Lu、177Lu、186Re、188Re、189Re、194Ir、198Au、199Au、211At、211Pb、212Bi、212Pb、213Bi、223Ra、225Ac、Cr、V、Mn、Fe、Co、Ni、Cu、La、Ce、Pr、Nd、Pm、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu、32P、荧光团(例如,荧光染料)、电子致密试剂、酶(例如,如在ELISA中常用的)、生物素、地高辛、顺磁性分子、顺磁性纳米颗粒、超小型超顺磁性氧化铁(“USPIO”)纳米颗粒、USPIO纳米颗粒聚集体、超顺磁性氧化铁(“SPIO”)纳米颗粒、SPIO纳米颗粒聚集体、单晶氧化铁纳米颗粒、单晶氧化铁、纳米颗粒造影剂、脂质体或含有钆螯合物(“Gd螯合物”)分子的其它递送媒介物、钆、放射性同位素、放射性核素(例如,碳-11、氮-13、氧-15、氟-18、铷-82)、氟脱氧葡萄糖(例如,标记的氟-18)、任何γ射线发射放射性核素、正电子发射放射性核素、放射性标记的葡萄糖、放射性标记的水、放射性标记氨、生物胶体、微泡(例如,包括微泡壳,包括白蛋白、半乳糖、脂质和/或聚合物;微泡气体芯,包括空气、重气体、全氟碳、氮、八氟丙烷、全氟烷脂质微球、全氟脲等)、碘化造影剂(例如,碘海醇、碘克沙醇、碘佛醇、碘帕醇、碘昔兰、碘普罗胺、泛影葡胺、甲泛影酸、碘克酸)、硫酸钡、二氧化钍、金、金纳米颗粒、金纳米颗粒聚集体、荧光团、双光子荧光团或半抗原和蛋白或例如,通过将放射性标记物掺入与靶肽特异性反应的肽或抗体中变得可检测的其它实体。
如本文所用的“细胞”是指进行足以保存或复制其基因组DNA的代谢或其它功能的细胞。细胞可通过本领域中众所周知的方法来鉴定,包括例如,存在完整膜、特定染料染色、能够产生后代或在配子的情况下能够与第二配子组合以产生活的后代。细胞可以包括原核细胞和真核细胞。原核细胞包括但不限于细菌。真核细胞包括不限于酵母细胞和衍生自植物和动物的细胞,例如,哺乳动物细胞、昆虫(例如,夜蛾)细胞和人细胞。细胞在其为自然地非粘附性的或已经例如通过胰蛋白酶消化进行处理以不粘附于表面时,可能是有用的。
如本文所用的“T细胞”或“T淋巴细胞”是一种在细胞介导的免疫中起核心作用的淋巴细胞(白细胞的亚型)。它们可以通过细胞表面存在T细胞受体与其它淋巴细胞如B细胞和自然杀伤细胞区分开来。T细胞包括例如,自然杀伤T(NKT)细胞、细胞毒性T淋巴细胞(CTL)、调控性T(Treg)细胞和T辅助细胞。不同类型的T细胞可以通过使用T细胞检测剂来区分。
“干细胞”是以通过有丝分裂细胞分裂自我更新的能力和分化成组织或器官的潜力为特征的细胞。在哺乳动物干细胞中,可以区分胚胎干细胞(ES细胞)和体干细胞(例如,HSC)。胚胎干细胞存在于囊胚中并产生胚胎组织,而为了组织再生和修复的目的,体干细胞驻留于成体组织中。如本文所提供的“神经干细胞”是指能够通过有丝分裂细胞分裂自我更新并分化成神经细胞(例如,神经胶质细胞、神经元、星形胶质细胞、少突胶质细胞)的干细胞。
如本文所用,术语“载体”是指一种核酸分子,其能够转运键合到其的另一核酸。一种类型的载体是“质粒”,其是指一种可以连接另外的DNA节段的线性或环状双链DNA环。另一种类型的载体是病毒载体,其中另外的DNA节段可以连接到病毒基因组中。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其它载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到宿主细胞的基因组中,并由此与宿主基因组一起复制。此外,某些载体能够指导与其可操作键合的基因的表达。这些载体在本文中称为“表达载体”。一般而言,在重组DNA技术中有效用的表达载体往往是质粒的形式。在本说明书中,“质粒”和“载体”可以可互换地使用,因为质粒是最常用的载体形式。然而,本发明旨在包括此类其它形式的表达载体,如病毒载体(例如,复制缺陷型逆转录病毒、腺病毒和腺伴随病毒),其具有等同的功能。另外地,一些病毒载体能够特异性或非特异性地靶向特定细胞类型。无复制能力的病毒载体或复制缺陷型病毒载体是指能够感染其靶细胞并递送其病毒有效负载,但随后无法继续导致细胞裂解和死亡的典型裂解途径的病毒载体。
术语“转染(transfection/transfecting)”、“转导(transduction/transducing)”可以可互换地使用,并且被定义为将核酸分子和/或蛋白引入细胞的过程。可以使用非病毒或基于病毒的方法将核酸引入细胞。核酸分子可为编码完整蛋白或其功能部分的序列。通常,核酸载体包含蛋白表达所必需的元件(例如,启动子、转录开始位点等)。非病毒转染方法包括不使用病毒DNA或病毒颗粒作为递送系统将核酸分子引入至细胞的任何适当方法。示范性非病毒转染方法包括编码融合蛋白的核酸的纳米颗粒封装(例如,脂质纳米颗粒、金纳米颗粒等)、磷酸钙转染、脂质体转染、核转染、声穿孔、通过热休克转染、磁转染和电穿孔。对于基于病毒的方法,任何有用的病毒载体均可用于本文所描述的方法。病毒载体的实例包括但不限于反转录病毒、腺病毒、慢病毒和腺相关病毒载体。在实施例中,按照本领域众所周知的标准程序,使用反转录病毒载体将核酸分子引入到细胞中。术语“转染”或“转导”还指将蛋白从外部环境引入到细胞中。通常,蛋白的转导或转染依赖于能够穿过细胞膜的肽或蛋白与目标蛋白的附着。参见,例如,Ford等人(2001)《基因疗法(GeneTherapy)》8:1-4和Prochiantz(2007)《自然方法(Nat.Methods)》4:119-20。
“接触”根据其普通含义使用,是指允许至少两个不同物种变得足够接近以反应、相互作用或物理接触的过程。然而,应了解,所得反应产物可以直接由所添加试剂之间的反应或由来自可以在反应混合物中产生的所添加试剂中的一个或多个的中间物来产生。
术语“接触”可以包括允许两个物种反应、相互作用或物理接触,其中这两个物种可以是例如,本文所提供的融合蛋白和核酸序列(例如,靶DNA序列)。
如本文所定义,当参考如本文所提供的组合物(例如,融合蛋白、复合物、核酸、载体)使用时,术语“阻滞(inhibition/inhibit/inhibiting)”、“阻遏(repression/repressing)”、“沉默(silencing/silence)”等是指相对于核酸序列的活性(例如,基因的转录)在不存在组合物(例如,融合蛋白、复合物、核酸、载体)的情况下,对核酸序列的活性(例如,转录)产生负面影响(例如,降低)。在实施例中,阻滞是指疾病或疾病(例如癌症)症状的减少。因此,阻滞包括至少部分地、部分地或完全地阻断核酸序列的激活(例如,转录)或降低、预防或延迟核酸序列的激活(例如,转录)。阻滞后的活性(例如,转录)可以为对照中的90%、80%、70%、60%、50%、40%、30%、20%、10%或更低。在实施例中,与对照相比,阻滞为1.5倍、2倍、3倍、4倍、5倍、10倍或更高。
“对照”样品或值是指充当参考(通常为已知参考)以用于与测试样品比较的样品。例如,测试样品可以例如在存在测试化合物的情况下从测试条件中获取,并且与已知条件的样品进行比较,例如,在不存在测试化合物的情况下(阴性对照)或在存在已知化合物的情况下(阳性对照)进行比较。对照还可以表示从多个测试或结果中收集的平均值。本领域技术人员将认识到,对照可以经设计以用于评估任何数量的参数。例如,可以设计一种对照以基于药理学数据(例如,半衰期)或治疗措施(例如,副作用的比较)比较治疗益处。本领域技术人员将理解,哪些对照在给定情形下是有价值的,并且能够基于与对照值的比较来分析数据。对照对于确定数据的重要性也很有价值。例如,如果对照中给定参数的值广泛变化,则测试样品的变化将不被视为显著的。
如本文所提供的“靶多核苷酸序列”或“靶序列”是存在于细胞中或由细胞表达的核酸序列,向导序列经设计与其具有互补性,其中靶序列与向导序列之间的杂交促进CRISPR复合物的形成。假如存在足够的互补性以引起杂交并且促进CRISPR复合物的形成,则不一定需要完全互补性。在实施例中,靶多核苷酸序列是外源性核酸序列。在实施例中,靶多核苷酸序列是内源性核酸序列。
靶多核苷酸序列或靶序列可以是适于表观基因组编辑的多核苷酸(例如,DNA序列)的任何区域。在实施例中,靶多核苷酸序列是基因的一部分。在实施例中,靶多核苷酸序列是转录调控序列的一部分。在实施例中,靶多核苷酸序列是启动子、增强子或沉默子的一部分。在实施例中,靶多核苷酸序列是启动子的一部分。在实施例中,靶多核苷酸序列是增强子的一部分。在实施例中,靶多核苷酸序列是沉默子的一部分。
“患者”或“对其有需要的受试者”是指患有或易患可通过施用如本文所提供的组合物或药物组合物治疗的疾病或病症的活生物体。非限制性实例包括人、其它哺乳动物、牛、大鼠、小鼠、狗、猴、山羊、绵羊、牛、鹿和其它非哺乳动物。在一些实施例中,患者是人。
术语“疾病”或“病症”是指能够用本文所提供的化合物、药物组合物或方法治疗的患者或受试者的状态或健康状态。在实施例中,该疾病是癌症(例如,肺癌、卵巢癌、骨肉瘤、膀胱癌、宫颈癌、肝癌、肾癌、皮肤癌(例如,Merkel细胞癌)、睾丸癌、白血病、淋巴瘤(套细胞淋巴瘤)、头颈癌、结肠直肠癌、前列腺癌、胰腺癌、黑素瘤、乳腺癌、成神经细胞瘤)。
如本文所用,术语“癌症”是指在哺乳动物中发现的所有类型的癌症、赘生物或恶性肿瘤,包括白血病、淋巴瘤、黑素瘤、神经内分泌肿瘤、癌和肉瘤。可以用本文所提供的化合物、药物组合物或方法治疗的示范性癌症包括淋巴瘤(例如,套细胞淋巴瘤、滤泡性淋巴瘤、弥漫性大B细胞淋巴瘤、边缘区淋巴瘤、伯基特淋巴瘤)、肉瘤、膀胱癌、骨癌、脑肿瘤、宫颈癌、结肠癌、食管癌、胃癌、头颈癌、肾癌、骨髓瘤、甲状腺癌、白血病、前列腺癌、乳腺癌(例如,三阴性、ER阳性、ER阴性、化疗抗性、赫赛汀抗性、HER2阳性、多柔比星(doxorubicin)抗性、它莫西芬(tamoxifen)抗性、导管癌、小叶癌、原发性、转移性)、卵巢癌、胰腺癌、肝癌(例如,肝细胞癌)、肺癌(例如,非小细胞肺癌、鳞状细胞肺癌、腺癌、大细胞肺癌、小细胞肺癌、类癌瘤、肉瘤)、多形性成胶质细胞瘤、神经胶质瘤、黑素瘤、前列腺癌、去势抵抗性前列腺癌、乳腺癌、三阴性乳腺癌、成胶质细胞瘤、卵巢癌、肺癌、鳞状细胞癌(例如头、颈或食道)、结肠直肠癌、白血病(例如,成淋巴细胞性白血病、慢性淋巴细胞性白血病、毛细胞白血病)、急性髓样白血病、淋巴瘤、B细胞淋巴瘤或多发性骨髓瘤。另外的实例包括甲状腺癌、内分泌系统癌、脑癌、乳腺癌、宫颈癌、结肠癌、头颈癌、食管癌、肝癌、肾癌、肺癌、非小细胞肺癌、黑色素瘤、间皮瘤、卵巢癌、肉瘤、胃癌、子宫癌或髓母细胞瘤、霍奇金病、非霍奇金淋巴瘤、多发性骨髓瘤、成神经细胞瘤、胶质瘤、多形性成胶质细胞瘤、卵巢癌、横纹肌肉瘤、原发性血小板增多症、原发性巨球蛋白血症、原发性脑肿瘤、癌症、恶性胰腺岛瘤、恶性类癌瘤、膀胱癌、癌前皮肤病变、睾丸癌、淋巴瘤、甲状腺癌、成神经细胞瘤、食管癌、泌尿生殖道癌、恶性高钙血症、子宫内膜癌、肾上腺皮质癌、内分泌或外分泌胰腺肿瘤、甲状腺髓样癌症、甲状腺髓样癌、黑色素瘤、结肠直肠癌、乳头状甲状腺癌、肝细胞癌、佩吉特乳头病、分叶状肿瘤、小叶癌、导管癌、胰腺星状细胞癌、肝星状细胞癌或前列腺癌。
如本文所用,术语“转移”、“转移性的”和“转移性癌症”可以可互换地使用,是指增殖性疾病或疾症(例如,癌症)从一个器官或另一非相邻器官或身体部分的扩散。癌症发生在起源部位,例如乳房,该部位被称为原发性肿瘤,例如,原发性乳腺癌。原发性肿瘤或起源部位中的一些癌细胞获得穿透和浸润局部区域中的周围正常组织的能力和/或穿透淋巴系统或血管系统的壁的能力,该淋巴系统或血管系统通过系统循环到身体中的其它部位和组织。由原发性肿瘤的癌细胞形成的第二临床上可检测的肿瘤称为转移性或继发性肿瘤。当癌细胞转移时,转移性肿瘤及其细胞被认为与原始肿瘤的细胞类似。因此,如果肺癌转移到乳房,乳房部位的继发性肿瘤由异常肺细胞组成,而不是异常乳腺细胞。乳腺中的继发性肿瘤被称为转移性肺癌。因此,短语转移性癌症是指受试者有或曾经有原发性肿瘤并有一种或多种继发性肿瘤的疾病。短语非转移性癌症或具有非转移性癌症的受试者是指受试者有原发性肿瘤但没有一种或多种继发性肿瘤的疾病。例如,转移性肺癌是指具有原发性肺肿肿瘤史且例如在乳房中第二位置或多个位置处具有一种或多种继发性肿瘤的受试者体内的疾病。
在与疾病(例如,癌症(例如,白血病、淋巴瘤、B细胞淋巴瘤或多发性骨髓瘤)相关的物质或物质活性或功能的上下文中,术语“相关”或“与……相关”意指该疾病(例如,癌症(例如,白血病、淋巴瘤、B细胞淋巴瘤或多发性骨髓瘤)由该物质或物质活性或功能(全部或部分)引起或该疾病的症状由该物质或物质活性或功能(全部或部分)引起。
如本文所用,术语“细胞穿透(cell-penetrating/cell-penetration)”是指分子(例如蛋白)以显著或有效量从细胞外环境进入到细胞中的能力。因此,细胞穿透偶联物是一种从细胞外环境穿过膜并进入细胞的分子。
如本文所用,术语“非细胞穿透(non-cell penetrating/non-cellpenetration)”是指分子(例如,蛋白或肽)不能以显著或有效量从细胞外环境进入细胞中。因此,非细胞穿透性肽或蛋白通常不能从细胞外环境通过细胞膜进入细胞,以实现对细胞群体、器官或生物体的显著生物学作用。该术语不排除一种或多种少量肽或蛋白可以进入细胞的可能性。然而,该术语是指通常不能从细胞外环境进入细胞至显著程度的分子。非细胞穿透分子和物质的实例包括但不限于大分子,诸如,例如,高分子量蛋白。可以使用本领域技术人员已知的方法来确定肽或蛋白是非细胞穿透的。举例来说,肽或蛋白可以被荧光标记,并且肽或蛋白从细胞外环境进入细胞的能力可以通过流式细胞术分析或共焦显微镜术在体外进行测定。
如本文所用,“分子量”(M.W.)或“分子质量”是指分子中所有原子的原子量的总和。就分子而言,具有高分子量的分子通常具有25kDa或更高的分子量。举例来说,高分子量蛋白可具有约25kDa至1000kDa或更高的M.W.。
如本文所用,术语“细胞内”意指在细胞内部。如本文所用,“细胞内靶”是位于细胞内部的靶,例如,核酸、多肽或其它分子(例如,碳水化合物),并且是本文所提供的非细胞穿透蛋白结合的靶。结合可以是直接的或间接的。在实施例中,非细胞穿透蛋白选择性结合细胞内靶。术语“选择性地结合(selectively binds/selectively binding)”或“特异性地结合(specifically binding)”是指一种媒剂(例如,非细胞穿透蛋白)结合一种媒剂(例如,细胞内靶),部分或完全排除其它媒剂。所谓结合意指至少约1.5倍于测定方法背景的可检测结合。对于选择性或特异性结合,这种可检测结合可以针对给定媒剂而不是对照媒剂而检测到。可替代地或另外地,结合的检测可以通过测定下游分子或事件的存在来确定。
如本文所用,“治疗(treatment/treating)”或“缓和(palliating)”或“减轻(ameliorating)”在本文中可互换地使用。这些术语是指一种获得有益或期望结果的方法,包括但不限于治疗益处和/或预防益处。治疗益处意指根除或减轻正接受治疗的潜在疾症。此外,通过根除或减轻与潜在疾症相关的一种或多种生理症状达到治疗益处从而在患者中观察到改善,但患者可能仍然受潜在疾症的折磨。对于预防益处,该组合物也可以施用于有发生特定疾病风险的患者或施用于报告疾病的生理症状中的一种或多种生理症状的患者,即使尚未作出该疾病的诊断。治疗包括预防疾病,即,通过在诱导疾病之前施用保护性组合物使疾病的临床症状不发展;抑制疾病,即,通过在诱导事件之后但在疾病的临床出现或重现之前施用保护性组合物,使疾病的临床症状不发展;阻滞疾病,即通过在其最初出现后施用保护性组合物来阻止临床症状的发展;预防疾病的复发和/或缓解疾病,即,通过在其最初出现后施用保护性组合物引起临床症状的消退。例如,本文的某些方法治疗癌症(例如,肺癌、卵巢癌、骨肉瘤、膀胱癌、宫颈癌、肝癌、肾癌、皮肤癌(例如,Merkel细胞癌)、睾丸癌、白血病、成淋巴细胞性白血病、慢性淋巴细胞性白血病、毛细胞白血病癌细胞)、淋巴瘤(例如,套细胞淋巴瘤(MCL)、滤泡性淋巴瘤、弥漫性大B细胞淋巴瘤、边缘区淋巴瘤、伯基特淋巴瘤)、头颈癌、结肠直肠癌、前列腺癌、胰腺癌、黑素瘤、乳腺癌、成神经细胞瘤)。例如,本文的某些方法通过降低或减少或预防癌症的发生、生长、转移或进展来治疗癌症;或通过减少癌症症状来治疗癌症。癌症(例如,肺癌、卵巢癌、骨肉瘤、膀胱癌、宫颈癌、肝癌、肾癌、皮肤癌(例如,Merkel细胞癌)、睾丸癌、白血病、淋巴瘤、头颈癌、结肠直肠癌、前列腺癌、胰腺癌、黑素瘤、乳腺癌、成神经细胞瘤)的症状是本领域普通技术人员已知的或可以确定的。
如本文所用,术语“治疗(treatment/treat/treating)”是指一种减少以蛋白酶表达为特征的疾病或病症的一种或多种症状或以蛋白酶表达为特征的疾病或病症的症状的影响的方法。因此,在所公开的方法中,治疗可以指既定疾病、病症或疾病或病症的症状的严重程度10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的减少。例如,如果受试者中的疾病的一个或多个症状相较于对照有10%的减少,则用于治疗疾病的方法被认为是一种治疗法。因此,与天然或对照水平相比,减少可以是10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或10%至100%之间的任何百分比减少。应当理解,治疗并不一定指疾病、病症或该疾病、病症的症状的治愈或完全消除。此外,如本文所用,提及降低、减少或阻滞包括相较于对照水平的10%、20%、30%、40%、50%、60%、70%、80%、90%或更大的变化,并且此类术语可以包括,但不一定包括完全消除。
术语“剂量(dose)”和“用药量(dosage)”在本文中可互换地使用。剂量是指每次施用时给予个体的活性成分的量。剂量将根据许多因素而变化,包括给定疗法的正常剂量范围、施用频率;个体体型和耐受性;病情严重程度;副作用风险;以及施用途径。本领域技术人员将认识到,剂量可以根据上述因素或基于治疗进展进行改动。术语“剂型”是指药物或药物组合物的特定形式,并且取决于施用途径。例如,剂型可以是用于雾化,例如用于吸入剂的液体形式,可以是例如用于经口递送的片剂或液体,也可以是例如用于注射的盐水溶液。
“有效量”是足以实现指定目的的量(例如,达到施用其的效果、治疗疾病、降低酶活性、减少疾病或病症的一种或多种症状)。“有效量”的实例是足以促进治疗、预防或减少疾病的症状的量,其也可被称为“治疗有效量”。一种或多种症状的“减少”(以及该短语的语法等同词)意指降低症状的严重性或频率或消除症状。药物的“预防有效量”是指当给受试者施用时具有预期的预防效果的药物量,例如,预防或延迟损伤、疾病、病理或病症的发作(或复发)的药物的量或减少损伤、疾病、病理或病症或其症状发作(或再发)的可能性。完全预防作用不一定通过施用一个剂量而发生,并且可以仅在施用一系列剂量后发生。因此,预防有效量可以在一次或多次施用。如本文所用,“活性降低量”是指相对于不存在拮抗剂而言降低酶或蛋白活性所需的拮抗剂的量。如本文所用,“功能破坏量”是指相对于不存在拮抗剂而言破坏酶或蛋白功能所需的拮抗剂的量。可以在文献中找到给定类别的药物产品的适当用药量的指导。例如,对于给定的参数,有效量将表现出至少5%、10%、15%、20%、25%、40%、50%、60%、75%、80%、90%或至少100%的增加或降低。效力也可以“倍数”增加或减少表示。例如,与对照相比,治疗有效量可以具有至少1.2倍、1.5倍、2倍、5倍或更高的作用。确切的量将取决于治疗的目的,并且将由本领域技术人员使用已知技术确定(参见,例如,Lieberman,《药物剂型(Pharmaceutical Dosage Forms)》(第1至3卷,1992);Lloyd《药物化合的技艺、科学和技术(The Art,Science and Technology ofPharmaceutical Compounding)》(1999);Pickar,《剂量计算(Dosage Calculations)》(1999);和《雷明顿:药学科学与实践(The Science and Practice of Pharmacy)》,第20版,2003,Gennaro编辑,利平科特威廉姆斯和维尔金斯出版社(Lippincott,Williams&Wilkins))。
如本文所用,术语“施用”意指对受试者的口服施用、作为栓剂施用、局部接触、静脉内施用、腹膜内施用、肌内施用、病灶内施用、鞘内施用、鼻内施用或皮下施用,或者缓释装置,例如,微型穿透泵的植入。通过任何途径施用,包括肠胃外和透粘膜施用(例如经口腔、舌下、腭、齿龈、鼻、阴道、直肠或透皮施用)。肠胃外施用包括例如,静脉内、肌内、小动脉内、皮内、皮下、腹膜内、心室内和颅内施用。其它递送模式包括但不限于使用脂质体制剂、静脉内输注、透皮贴剂等。“共同施用”是指本文所描述的组合物在施用一种或多种另外的疗法例如,癌症疗法如化学疗法、激素疗法、放射疗法或免疫疗法的同时、之前或之后施用。本发明的化合物可以单独施用于患者,也可以共同施用于患者。共同施用意指同时或相继施用单独或组合的化合物(多于一种化合物)。因此,当需要时,制品还可以与其它活性物质组合(例如,以减少代谢降解)。本发明的组合物可以通过透皮、局部途径递送、配制成涂抹棒、溶液、悬浮液、乳液、凝胶、乳膏、软膏、糊剂、凝胶剂、涂料、粉末和气雾剂形式施用。
适于口服施用的制剂可由以下组成:(a)液体溶液,如有效量的悬浮于稀释剂如水、盐水或PEG 400中的本文所提供的抗体;(b)胶囊、小药囊或片剂,各自含有预定量作为液体、固体、颗粒或明胶的活性成分;(c)适当液体中的悬浮液;和(d)合适的乳液。片剂形式可包括以下的一种或多种:乳糖、蔗糖、甘露醇、山梨醇、磷酸钙、玉米淀粉、马铃薯淀粉、微晶纤维素、明胶、胶体二氧化硅、滑石、硬脂酸镁、硬脂酸和其它赋形剂、着色剂、填料、结合剂、稀释剂、缓冲剂、增湿剂、防腐剂、调味剂、染料、崩解剂和药物相容携带体。锭剂形式可包含在香味剂例如,蔗糖中的活性成分,以及包含在惰性基质,如明胶以及甘油或蔗糖和阿拉伯胶乳液、凝胶等中的活性成分的锭剂,除了活性成分之外,还包含本领域已知的携带体。
药物组合物还可以包括大的、缓慢代谢的大分子(如蛋白)、多糖(如壳聚糖)、聚乳酸、聚乙醇酸和共聚物(如乳胶官能化的sepharose(TM)、琼脂糖、纤维素等)、聚合氨基酸、氨基酸共聚物和脂质聚集体(如油滴或脂质体)。另外地,这些携带体可用作免疫刺激剂(即佐剂)。
用于直肠施用的合适制剂包括例如栓剂,其由包装核酸与栓剂基质组成。合适的栓剂基质包括自然或合成的甘油三酯或石蜡烃。令外,也可以使用明胶直肠胶囊,其由选定化合物与基质的组合组成,该基质包括例如液体甘油三酯、聚乙二醇和石蜡烃。
适于胃肠外施用,例如通过关节内(关节中)、静脉内、肌内、瘤内、皮内、腹膜内和皮下途径的制剂包括水性和非水性等渗无菌注射溶液,其可以含有抗氧化剂、缓冲液、抑菌剂和使得溶液与预期接受者的血液等渗的溶质,以及可包括悬浮剂、增溶剂、增稠剂、稳定剂和防腐剂的水性和非水性无菌悬液。在本发明的实践中,组合物可以通过例如静脉输注、口服、局部、腹膜内、膀胱内或鞘内施用。胃肠外施用、口服施用和静脉内施用是优选的施用方法。化合物制剂可以以单位剂量或多剂量密封容器呈现,如安瓿和小瓶。
注射溶液和悬浮液可以由前述种类的无菌粉末、颗粒和片剂制备。由核酸转导以用于离体疗法的细胞也可如上面所描述的静脉内或胃肠外施用。
药物制品优选为单位剂型。在这种形式中,制品被细分为含有适量活性组分的单位剂量。单位剂型可以是包装制品,该包装含有不同量的制品,如经包装的片剂、胶囊和小瓶或安瓿中的粉末。此外,单位剂型也可以是胶囊、片剂、扁囊剂或锭剂本身,其也可以是适量的这些剂型中的任何剂型的包装形式。如果需要,该组合物还可以含有其它相容的治疗剂。
联合施用设想使用单独的制剂或单一药物制剂的共同施用和以任一顺序的连续施用,其中优选存在两个(或所有)活性剂同时发挥其生物活性的时间段。
本文所提供的组合物的有效剂量根据许多不同因素而变化,包括施用方式、靶位点、患者的生理状态、患者是人还是动物、施用的其它药物以及治疗是预防性的还是治疗性的。然而,本领域普通技术人员将立即认识到适当和/或等效的剂量查看用于治疗和预防癌症的经批准的组合物的剂量用作指导。
如本文所用,术语“药学上可接受的”与“生理学上可接受的”和“药理学上可接受的”同义使用。药物组合物通常会包含用于缓冲和储存保存的媒剂,并且可以包括用于适当递送的缓冲液和携带体,这取决于施用途径。
“药学上可接受的赋形剂”和“药学上可接受的携带体”是指协助将活性剂施用给受试者并被受试者吸收且能纳入本发明的组合物,而不引起对患者的显著不良毒性效果的物质。药学上可接受的赋形剂的非限制性实例包括水、NaCl、生理盐水溶液、乳酸林格氏液、标准蔗糖、标准葡萄糖、结合剂、填充剂、崩解剂、润滑剂、包衣、甜味剂、香味剂、盐溶液(林格溶液)、醇、油、明胶、碳水化合物如乳糖、直链淀粉或淀粉、脂肪酸酯、羟甲基纤维素、聚乙烯吡咯烷酮和颜料等。此类制品可以被灭菌,如需要,可以混合助剂如润滑剂、防腐剂、稳定剂、湿润剂、乳化剂、影响渗透压的盐、缓冲液、着色剂和/或芳香物质等,其不会与本发明化合物发生有害反应。本领域技术人员将认识到其它药物赋形剂能用于本发明中。
术语“药学上可接受的盐”是指衍生自本领域熟知的多种有机和无机抗衡离子的盐,并且仅举例来说包括钠、钾、钙、镁、铵、四烷基铵等;且在此时,分子含有碱性功能基团、有机或无机酸的盐,如盐酸盐、氢溴酸盐、酒石酸盐、甲磺酸盐、乙酸盐、马来酸盐、草酸盐等。
术语“制品”旨在包括活性化合物与作为提供胶囊的携带体的包封材料的制剂,其中具有或不具有其它携带体的活性组分被携带体包围,该携带体因此与其缔合。类似地,包括扁囊剂和锭剂。片剂、粉末、胶囊、药丸、扁囊剂和锭剂可以用作适于口服施用的固体剂型。
该药物制品任选地为单位剂型。在这种形式中,制品被细分为含有适量活性组分的单位剂量。单位剂型可以是包装制品,该包装含有不同量的制品,如经包装的片剂、胶囊和小瓶或安瓿中的粉末。此外,单位剂型也可以是胶囊、片剂、扁囊剂或锭剂本身,其也可以是适量的这些剂型中的任何剂型的包装形式。单位剂型可以是冷冻分散体。
本发明的组合物可另外包括提供持续释放和/或舒适性的组分。此类组分包括高分子量阴离子类粘液状聚合物、胶凝多糖和细碎的药物携带体底物。这些组分更详细地讨论于美国专利第4,911,920号;第5,403,841号;第5,212,162号;和第4,861,760号中。出于所有目的,这些专利的全部内容以全文引用的方式并入本文中。本发明的组合物还可以作为微球递送以在体内缓慢释放。例如,微球可以经由含药物微球的皮内注射施用,这些含药物微球皮下缓慢释放(参见Rao,《生物材料科学杂志聚合物版(J.BiomaterSci.Polym.Ed.)》7:623-645,1995;作为可生物降解的和可注射的凝胶制剂(参见,例如,Gao《药理学研究(Pharm.Res.)》12:857-863,1995);或作为用于口服施用的微球(参见,例如,Eyles《药学与药理学杂志(J.Pharm.Pharmacol.)》49:669-674,1997)。在实施例中,本发明的组合物的制剂可以通过采用与细胞膜融合或被胞吞的脂质体来递送,即通过使用附着到脂质体的受体配体,其结合到细胞的表面膜蛋白受体,导致胞吞。通过使用脂质体,特别是当脂质体表面携带对靶细胞特异的受体配体,或以其它方式优先针对具体器官时,可以将本发明的组合物的递送集中于体内靶细胞。(参见,例如,Al-Muhammed,《微胶囊化杂志(J.Microencapsul.)》13:293-306,1996;Chonn《当代生物技术观点(Curr.Opin.Biotechnol.)》6:698-708,1995;Ostro《美国医院药学杂志Am.J.Hosp.Pharm.)》46:1576-1587,1989)。本发明的组合物还可以作为纳米颗粒递送。
复合物
本文提供尤其能用于体外和体内编辑(例如,修复、修饰)细胞中的DNA的复合物。本文所提供的复合物尤其包括通过化学接头结合到硫代磷酸酯核酸的DNA编辑剂。化学接头(例如,二硫化物接头)可以是一旦复合物进入细胞内部就解离的接头,从而释放DNA编辑剂并允许DNA编辑剂接近并编辑细胞靶序列。本文所提供的复合物表现出高细胞内化效率和编辑效力,因此提供了有用的治疗工具和诊断工具。本文所提供的复合物此外具有高度靶特异性并且缺乏非特异性的脱靶活性。对于靶向递送至细胞中,本文所提供的复合物可附着到靶向剂(例如,抗体、核酸),该靶向剂特异性结合复合物应递送至的细胞上的表面标记物。通过两条互补的硫代磷酸酯化核酸链的杂交,编辑剂和靶向剂结合在一起,其中第一条硫代磷酸酯化核酸链通过第一化学接头附着到编辑剂,第二条硫代磷酸酯化核酸链通过第二化学接头附着到靶向剂。此外,为了增强位点特异性编辑活性,提供了包括通过硫代磷酸酯核酸彼此结合的两种编辑剂的复合物。通过两条互补的硫代磷酸酯化核酸链的杂交,第一编辑剂和第二编辑剂结合在一起,其中第一条硫代磷酸酯化核酸链通过第一化学接头附着到第一编辑剂,第二条硫代磷酸酯化核酸链通过第二化学接头附着到第二编辑剂。
在一个方面,提供了一种用于将基因编辑剂递送至细胞的复合物。该复合物包括通过化学接头共价结合到硫代磷酸酯核酸的基因编辑剂。在实施例中,基因编辑剂包括半胱氨酸,并且硫代磷酸酯核酸包括通过半胱氨酸和硫醇部分之间的二硫键共价结合到基因编辑剂的硫醇部分。在实施例中,硫代磷酸酯核酸结合到基因编辑剂的C末端。
在实施例中,化学接头是共价接头。
在实施例中,化学接头是L1。在实施例中,L1可以是键-O-、
-S-、-C(O)-、-C(O)O-、-C(O)NH-、-S(O)2NH-、-NH-、-NHC(O)NH-、经取代(例如,被取代基基团、大小受限的取代基或低级取代基基团取代)或未经取代的亚烷基、经取代(例如,被取代基基团、大小受限的取代基或低级取代基基团取代)或未经取代的杂亚烷基、经取代(例如,被取代基基团、大小受限的取代基或低级取代基基团取代)或未经取代的亚环烷基、经取代(例如,被取代基基团、大小受限的取代基或低级取代基基团取代)或未经取代的杂亚环烷基、经取代(例如,被取代基基团、大小受限的取代基或低级取代基基团取代)或未经取代的亚芳基或经取代(例如,被取代基基团、大小受限的取代基或低级取代基基团取代)或未经取代的杂亚芳基。
在实施例中,L1可以是键-O-、-S-、-C(O)-、-C(O)O-、-C(O)NH-、-S(O)2NH-、-NH-、-NHC(O)NH-、经取代或未经取代的(例如,C1-C20、C1-C10、C1-C5)亚烷基、经取代或未经取代的(例如,2至20元、2至10元、2至5元)杂亚烷基、经取代或未经取代的(例如,C3-C8、C3-C6、C3-C5)亚环烷基、经取代或未经取代的(例如,3至8元、3至6元、3至5元)杂亚环烷基、经取代或未经取代的(例如,C6-C10、C6-C8、C6-C5)亚芳基或经取代或未经取代的(例如,5至10元、5至8元、5至6元)杂亚芳基。
在实施例中,L1是经取代或未经取代的C1-C10亚烷基。在实施例中,L1是经取代或未经取代的C2-C10亚烷基。在实施例中,L1是经取代或未经取代的C4-C10亚烷基。在实施例中,L1是经取代或未经取代的C6-C10亚烷基。在实施例中,L1是经取代或未经取代的C8-C10亚烷基。在实施例中,L1是经取代或未经取代的C2-C8亚烷基。在实施例中,L1是经取代或未经取代的C4-C8亚烷基。在实施例中,L1是经取代的C1-C10亚烷基。在实施例中,L1是经取代的C2-C10亚烷基。在实施例中,L1是经取代的C4-C10亚烷基。在实施例中,L1是经取代的C6-C10亚烷基。在实施例中,L1是经取代的C8-C10亚烷基。在实施例中,L1是经取代的C2-C8亚烷基。在实施例中,L1是经取代的C4-C8亚烷基。在实施例中,L1是经取代的C6亚烷基。
在实施例中,L1是经取代或未经取代的1至10元杂亚烷基。在实施例中,L1是经取代或未经取代的2至10元杂亚烷基。在实施例中,L1是经取代或未经取代的4至10元杂亚烷基。在实施例中,L1是经取代或未经取代的6至10元杂亚烷基。在实施例中,L1是经取代或未经取代的8至10元杂亚烷基。在实施例中,L1是未经取代的1至10元杂亚烷基。在实施例中,L1是未经取代的4至10元杂亚烷基。在实施例中,L1是未经取代的2至8元杂亚烷基。在实施例中,L1是未经取代的2至6元杂亚烷基。在实施例中,L1是未经取代的7元杂亚烷基。
在实施例中,化学接头是pH敏感性接头。“pH敏感性接头”是化学接头,其结构完整性是依赖于pH的。因此,pH敏感性接头可在第一pH下结合两种组分(例如,硫代磷酸酯核酸和基因编辑剂),但在第二pH下可不结合这些相同组分。pH敏感性接头在第二pH下的化学结构不同于其在第一pH下的结构,并且不允许pH敏感性接头将两种组分结合在一起。
本文所提供的基因编辑复合物包括基因编辑剂(例如,第一或第二基因编辑剂),或通过二硫键共价结合到硫代磷酸酯核酸的基因编辑剂和靶向剂。二硫键可以在基因编辑剂或靶向剂的氨基酸残基与包括硫醇部分的硫代磷酸酯核酸之间形成。氨基酸残基可以是半胱氨酸、受保护的半胱氨酸(共价附着到保护基团的半胱氨酸)或被硫醇取代基取代的精氨酸(辛基硫醇取代的精氨酸)。在实施例中,化学接头是硫酯接头。在实施例中,化学接头是二硫化物接头。
本文所提供的基因编辑剂或靶向剂通过二硫键共价附着到一个或多个硫代磷酸酯核酸。如本文所提供的“二硫键”、“二硫桥”或“二硫键”是指通过使两个硫醇部分反应形成的共价键。两个反应性硫醇部分中的第一硫醇部分形成本文所提供的基因编辑剂或靶向剂的一部分,并且第二硫醇部分形成本文所提供的一种或多种硫代磷酸酯核酸的一部分。在实施例中,本文所提供的基因编辑复合物具有RA-S-S-RB的结构,其中RA是基因编辑剂(例如,第一基因编辑剂或第二基因编辑剂),而RB是硫代磷酸酯核酸。二硫键在基因编辑剂(例如,第一基因编辑剂或第二基因编辑剂)的半胱氨酸(第一或第二半胱氨酸)与硫代磷酸酯核酸的硫醇反应性部分之间形成。
如本文所提供的“硫醇反应性部分”是包括硫原子的化学部分,其中硫可以形成二硫键的一部分,并且在本文中也可以被称为“含硫反应性部分”。如本文所提及的二硫键包括衍生自经反应的-SH取代基(即硫醇基团或硫醇取代基,其是包括硫醇的基团或取代基)的硫原子。因此,本文所提供的硫醇反应性部分也可称为硫反应性部分。在实施例中,硫原子形成氨基酸的一部分(例如,半胱氨酸侧链)。在实施例中,硫原子形成经取代的氨基酸侧链(例如,经取代的精氨酸侧链)的一部分。当硫原子形成经取代的氨基酸侧链的一部分时,氨基酸侧链可以被经取代或未经取代的烷基、经取代或未经取代的杂烷基、经取代或未经取代的环烷基、经取代或未经取代的杂环烷基、经取代或未经取代的芳基或经取代或未经取代的杂芳基取代。在实施例中,经取代的氨基酸侧链被辛基硫醇取代。在实施例中,辛基硫醇具有下式:
在式(III)中,*表示与氨基酸侧链的附着点,**表示与第一半胱氨酸的附着点。在实施例中,经取代的氨基酸侧链是经取代的精氨酸侧链。在实施例中,经取代的精氨酸包括式(III)的化合物。在实施例中,经取代的精氨酸是辛基硫醇取代的精氨酸。在实施例中,辛基硫醇取代的精氨酸包括式(III)的化合物。在实施例中,硫醇侧链氨基酸是半胱氨酸。
如上所讨论的,聚合物主链含有与核酸序列相同的结构(即含有键合在一起的两个或更多个糖残基链),不同之处在于聚合物主链缺乏核酸序列中通常存在的碱基。
硫代磷酸酯核酸或硫代磷酸酯聚合物主链可以具有任何合适的长度。在实施例中,硫代磷酸酯核酸或硫代磷酸酯聚合物主链在长度上独立地为10、20、30、40、50、60、70、80、90、100或更多个核酸残基或糖残基。在实施例中,硫代磷酸酯核酸或硫代磷酸酯聚合物主链在长度上独立地为10至30个残基。因此,每个核酸或聚合物主链在长度上可以为至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个核酸残基或糖残基。在实施例中,硫代磷酸酯核酸在长度上可以为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核酸残基。
在实施例中,硫代磷酸酯核酸或硫代磷酸酯聚合物主链在长度上独立地为5至50、10至50、15至50、20至50、25至50、30至50、35至50、40至50、45至50、5至75、10至75、15至75、20至75、25至75、30至75、35至75、40至75、45至75、50至75、55至75、60至75、65至75、70至75、5至100、10至100、15至100、20至100、25至100、30至100、35至100、40至100、45至100、50至100、55至100、60至100、65至100、70至100、75至100、80至100、85至100、90至100、95至100或更多个残基。在实施例中,硫代磷酸酯核酸为在长度上为从5至50、10至50、15至50、20至50、25至50、30至50、35至50、40至50、45至50、5至75、10至75、15至75、20至75、25至75、30至75、35至75、40至75、45至75、50至75、55至75、60至75、65至75、70至75、5至100、10至100、15至100、20至100、25至100、30至100、35至100、40至100、45至100、50至100、55至100、60至100、65至100、70至100、75至100、80至100、85至100、90至100或95至100个残基。在实施例中,硫代磷酸酯核酸或硫代磷酸酯聚合物主链在长度上独立地为10至15、10至20、10至30、10至40或10至50个残基。在实施例中,硫代磷酸酯核酸在长度上为从10至15、10至20、10至30、10至40或10至50个残基。
在实施例中,一个硫代磷酸酯核酸或硫代磷酸酯聚合物主链的长度不同于另一硫代磷酸酯核酸或硫代磷酸酯聚合物主链。举例来说,如果将两个硫代磷酸酯核酸或硫代磷酸酯聚合物主链附着到如本文所提供的基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂,则第一硫代磷酸酯核酸或硫代磷酸酯聚合物主链可以具有一个长度(例如,22个残基)并且第二硫代磷酸酯核酸或硫代磷酸酯聚合物主链可以具有不同长度(例如,25个残基)。因此,如果多个硫代磷酸酯核酸和硫代磷酸酯聚合物主链附着到本文所提供的基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂,则硫代磷酸酯核酸和硫代磷酸酯聚合物主链可具有许多不同的长度,例如,长度范围为10至30个残基。
在实施例中,多个硫代磷酸酯核酸或硫代磷酸酯聚合物主链附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂。在实施例中,1、2、3、4、5、6、7、8、9、10、15、20、25个或更多个硫代磷酸酯核酸或硫代磷酸酯聚合物主链附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂。在实施例中,附着是共价的。附着可以是非共价的。硫代磷酸酯核酸或硫代磷酸酯聚合物主链可以独立地附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂的赖氨酸、精氨酸、半胱氨酸或组氨酸。在实施例中,每个硫代磷酸酯核酸或硫代磷酸酯聚合物主链附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂的半胱氨酸。在实施例中,基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂包括附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂的10%、25%、50%、75%、90%、95%或100%的赖氨酸、精氨酸、半胱氨酸、组氨酸或其组合的硫代磷酸酯核酸或硫代磷酸酯聚合物主链。
如上所讨论的,核酸,例如,硫代磷酸酯核酸或硫代磷酸酯聚合物主链可通过多种机制附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂。硫代磷酸酯核酸或硫代磷酸酯聚合物主链可以共价或非共价附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂。在实施例中,当多个硫代磷酸酯核酸或硫代磷酸酯聚合物主链附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂时,多个硫代磷酸酯核酸或硫代磷酸酯聚合物主链中的每个硫代磷酸酯核酸或硫代磷酸酯聚合物主链可以共价或非共价附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂。在实施例中,基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂包括经共价和非共价附着的硫代磷酸酯核酸或硫代磷酸酯聚合物主链。在实施例中,基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂包括经共价附着的硫代磷酸酯核酸或硫代磷酸酯聚合物主链并且不包含经非共价附着的硫代磷酸酯核酸或硫代磷酸酯聚合物主链。在实施例中,基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂包括经非共价附着的硫代磷酸酯核酸或硫代磷酸酯聚合物主链并且不包含经共价附着的硫代磷酸酯核酸或硫代磷酸酯聚合物主链。硫代磷酸酯核酸或硫代磷酸酯聚合物主链中的每个硫代磷酸酯核酸或硫代磷酸酯聚合物主链可以含有反应性部分,例如,氨基酸反应性部分或共价反应性部分,其促进硫代磷酸酯核酸或硫代磷酸酯聚合物主链附着到基因编辑剂(例如第一或第二基因编辑剂)或靶向剂。因此,硫代磷酸酯核酸或硫代磷酸酯聚合物主链可以通过反应性部分附着到基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂。
本文所提供的复合物可以通过以下制成:使未经附着的基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂与未经附着的硫代磷酸酯核酸或未经附着的硫代磷酸酯聚合物主链接触,以及使未经附着的硫代磷酸酯核酸或未经附着的硫代磷酸酯聚合物主链共价结合到未经附着的基因编辑剂(例如,第一或第二基因编辑剂)或靶向剂的氨基酸,从而附着并形成该基因编辑复合物。如在制作基因编辑复合物的上下文中所用的术语“未经附着的”旨在指示在附着和形成复合物之前基因编辑剂(例如,第一或第二基因编辑剂)、靶向剂、硫代磷酸酯核酸或硫代磷酸酯聚合物主链的状态。即,术语“未经附着的”表明基因编辑剂(例如,第一或第二基因编辑剂)、靶向剂、硫代磷酸酯核酸或硫代磷酸酯聚合物主链是游离的,并且相对于它们在基因编辑复合物内的缔合形式处于其未结合状态。
在实施例中,硫代磷酸酯核酸或硫代磷酸酯聚合物主链包括共价反应性部分。如上面所描述的,共价反应性部分可与蛋白的赖氨酸、精氨酸、半胱氨酸或组氨酸反应(例如,与氨基酸侧链反应)。在实施例中,共价反应性部分与半胱氨酸反应。共价反应性部分是硫醇反应性部分。
在实施例中,硫代磷酸酯核酸是单链核酸。在实施例中,硫代磷酸酯核酸是硫代磷酸酯脱氧核糖核酸。在实施例中,硫代磷酸酯核酸在长度上为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为10、20、30、40、50、60、70、80、90、100或更多个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为10、20、30、40、50、60、70、80、90或100个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为10个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为20个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为30个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为40个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为50个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为60个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为70个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为80个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为90个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为100个核酸残基。
在实施例中,硫代磷酸酯核酸在长度上为约10至约30个核酸残基。在实施例中,硫代磷酸酯核酸在长度上为约20个核酸残基。
在实施例中,基因编辑剂是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。在实施例中,基因编辑剂是RNA向导的DNA核酸内切酶。在实施例中,基因编辑剂是转录激活因子样效应物核酸酶(TALEN)。在实施例中,基因编辑剂是锌指核酸酶。在实施例中,基因编辑剂是Argonaut核酸内切酶。
在实施例中,RNA向导的DNA核酸内切酶是Cas9、Cpf1或II类CRISPR核酸内切酶。在实施例中,RNA向导的DNA核酸内切酶是Cas9。在实施例中,RNA向导的DNA核酸内切酶是Cpf1。在实施例中,RNA向导的DNA核酸内切酶是II类CRISPR核酸内切酶。RNA向导的DNA核酸内切酶的非限制性实例包括Cas9、GeoCas9、CasX、CasY、Cas14a、Cas12a(Cpf1)、Cas9切口酶、高保真Cas9、sSpCas9、SpCas9-HF1、HypaCas9、Fokl融合的dCas9、xCas9、Cas13a、b和d以及其它基于CRISPR的编辑器。
在实施例中,基因编辑剂包括SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:25或SEQ IDNO:27的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:2的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:3的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:4的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:5的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:6的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:7的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:18的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:22的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:25的序列。在实施例中,所述基因编辑剂包括SEQ ID NO:27的序列。
在实施例中,所述基因编辑剂具有SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:25或SEQID NO:27的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:2的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:3的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:4的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:5的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:6的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:7的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:18的序列。在实施例中,所述基因编辑剂具有SEQ IDNO:22的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:25的序列。在实施例中,所述基因编辑剂具有SEQ ID NO:27的序列。
在实施例中,基因编辑剂由包括SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:24或SEQ ID NO:26的序列的核酸编码。在实施例中,基因编辑剂由包括SEQ ID NO:17的序列的核酸编码。在实施例中,基因编辑剂由包括SEQ ID NO:21的序列的核酸编码。在实施例中,基因编辑剂由包括SEQ ID NO:24的序列的核酸编码。在实施例中,基因编辑剂由包括SEQID NO:26的序列的核酸编码。
在实施例中,复合物形成细胞的一部分。在实施例中,细胞是癌细胞或健康细胞。在实施例中,细胞是癌细胞。在实施例中,细胞是健康细胞。在实施例中,细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。在实施例中,细胞是T细胞。在实施例中,细胞是嵌合抗原受体(CAR)T细胞。在实施例中,细胞是自然杀伤(Nk)细胞。在实施例中,细胞是巨噬细胞。在实施例中,细胞是神经元细胞。在实施例中,细胞是造血干细胞。在实施例中,细胞是胰腺癌细胞或卵巢癌细胞。在实施例中,细胞是胰腺癌细胞。在实施例中,细胞是卵巢癌细胞。
在实施例中,复合物进一步包括结合到基因编辑剂的一种或多种向导RNA。在实施例中,一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。在实施例中,一个或多个靶序列是STAT-3靶序列。在实施例中,向导RNA包括SEQ ID NO:1(SEQ ID NO:1ACAATCCGGGCAATCTCCATTGG)的序列。在实施例中,向导RNA包括SEQ ID NO:30的序列。在实施例中,向导RNA包括SEQ ID NO:37的序列。在实施例中,向导RNA包括SEQ ID NO:38的序列。
在实施例中,一个或多个靶序列是程序性细胞死亡蛋白1(PDCD1)靶序列。在实施例中,向导RNA包括SEQ ID NO:31的序列。在实施例中,向导RNA是SEQ ID NO:31的序列。
如本文所提及的“PDCD1”或“PDCD1蛋白”包括保持PDCD1活性(例如,与PDCD1相比在至少50%、80%、90%、95%、96%、97%、98%、99%或100%活性内)的程序性细胞死亡蛋白1(PDCD1)或其变体或同源物的重组或自然存在的形式中的任何重组或自然存在的形式。在一些方面,与自然存在的PDCD1蛋白相比,变体或同源物在整个序列或序列的一部分(例如50、100、150或200个连续氨基酸部分)上具有至少90%、95%、96%、97%、98%、99%或100%的氨基酸序列同一性。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白或与其具有实质同一性的变体或同源物基本上同一。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白的氨基酸序列具有至少75%的序列同一性。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白的氨基酸序列具有至少80%的序列同一性。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白的氨基酸序列具有至少85%的序列同一性。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白的氨基酸序列具有至少90%的序列同一性。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白的氨基酸序列具有至少95%的序列同一性。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白的氨基酸序列具有至少98%的序列同一性。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白的氨基酸序列具有至少99%的序列同一性。在实施例中,PDCD1蛋白与由NCBI参考号NP_005009所标识的蛋白的氨基酸序列具有100%的序列同一性。
在实施例中,一个或多个靶序列是程序性细胞死亡蛋白1(PDCD2)靶序列。在实施例中,向导RNA包括SEQ ID NO:32的序列。在实施例中,向导RNA是SEQ ID NO:32的序列。
如本文所提及的“PDCD2”或“PDCD2蛋白”包括保持PDCD2活性(例如,与PDCD2相比在至少50%、80%、90%、95%、96%、97%、98%、99%或100%活性内)的程序性细胞死亡蛋白2(PDCD2)或其变体或同源物的重组或自然存在的形式中的任何重组或自然存在的形式。在一些方面,与自然存在的PDCD2蛋白相比,变体或同源物在整个序列或序列的一部分(例如50、100、150或200个连续氨基酸部分)上具有至少90%、95%、96%、97%、98%、99%或100%的氨基酸序列同一性。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白或与其具有实质同一性的变体或同源物基本上同一。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白的氨基酸序列具有至少75%的序列同一性。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白的氨基酸序列具有至少80%的序列同一性。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白的氨基酸序列具有至少85%的序列同一性。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白的氨基酸序列具有至少90%的序列同一性。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白的氨基酸序列具有至少95%的序列同一性。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白的氨基酸序列具有至少98%的序列同一性。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白的氨基酸序列具有至少99%的序列同一性。在实施例中,PDCD2蛋白与由UniProt参考号Q16342所标识的蛋白的氨基酸序列具有100%序列同一性。
在实施例中,一个或多个靶序列是Tet甲基胞嘧啶双加氧酶2(TET2)靶序列。在实施例中,向导RNA包括SEQ ID NO:33的序列。在实施例中,向导RNA是SEQ ID NO:33的序列。
在实施例中,一个或多个靶序列是PARG聚(ADP核糖)糖水解酶靶序列。在实施例中,向导RNA包括SEQ ID NO:34的序列。在实施例中,向导RNA包括SEQ ID NO:34的序列。
如本文所提及的“PARG”或“PARG蛋白”包括保持PARG活性(例如与PARG相比在至少50%、80%、90%、95%、96%、97%、98%、99%或100%活性内)的PARG聚(ADP核糖)糖水解酶或其变体或同源物的重组或自然存在的形式中的任何重组或自然存在的形式。在一些方面,与自然存在的PARG蛋白相比,变体或同源物在整个序列或序列的一部分(例如50、100、150或200个连续氨基酸部分)上具有至少90%、95%、96%、97%、98%、99%或100%的氨基酸序列同一性。在实施例中,PARG蛋白基本上与由uniproT参考号
Q86W56所标识的蛋白或与其具有实质同一性的变体或同源物实质上同一。在实施例中,PARG蛋白与由UniProt参考号Q86W56所标识的蛋白的氨基酸序列具有至少75%的序列同一性。在实施例中,PARG蛋白与由UniProt参考号Q86W56所标识的蛋白的氨基酸序列具有至少80%的序列同一性。在实施例中,PARG蛋白与由UniProt参考号Q86W56所标识的蛋白的氨基酸序列具有至少85%的序列同一性。在实施例中,PARG蛋白与由UniProt参考号Q86W56所标识的蛋白的氨基酸序列具有至少90%的序列同一性。在实施例中,PARG蛋白与由UniProt参考号Q86W56所标识的蛋白的氨基酸序列具有至少95%的序列同一性。在实施例中,PARG蛋白与由UniProt参考号Q86W56所标识的蛋白的氨基酸序列具有至少98%的序列同一性。在实施例中,PARG蛋白与由UniProt参考号Q86W56所标识的蛋白的氨基酸序列具有至少99%的序列同一性。
在实施例中,一个或多个靶序列是T细胞受体α(TCR-a)靶序列。在实施例中,向导RNA包括SEQ ID NO:35的序列。在实施例中,向导RNA是SEQ ID NO:35的序列。
在实施例中,一个或多个靶序列是T细胞受体β(TCR-b)靶序列。在实施例中,向导RNA包括SEQ ID NO:36的序列。在实施例中,向导RNA是SEQ ID NO:36的序列。
在实施例中,一个或多个靶序列是血管内皮生长因子Aα(VEGFA-a)靶序列。在实施例中,向导RNA包括SEQ ID NO:39的序列。在实施例中,向导RNA是SEQ ID NO:39的序列。
在实施例中,一个或多个靶序列是血管内皮生长因子Aβ(VEGFA-b)靶序列。在实施例中,向导RNA包括SEQ ID NO:40的序列。在实施例中,向导RNA是SEQ ID NO:40的序列。
在实施例中,向导RNA包括SEQ ID NO:1、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39或SEQ ID NO:40的序列。
包括第二基因编辑剂或靶向剂的编辑复合物
在一个方面,提供了一种用于将基因编辑剂递送至细胞的复合物。该复合物包括:(i)双链硫代磷酸酯寡核苷酸;(ii)通过第一化学接头共价结合到第一硫代磷酸酯核酸的第一基因编辑剂;和(ii)通过第二化学接头共价结合到第二硫代磷酸酯核酸的第二基因编辑剂;其中第一硫代磷酸酯核酸的至少一部分和第二硫代磷酸酯核酸的一部分彼此互补,并且其中第一硫代磷酸酯核酸的至少一部分与第二硫代磷酸酯核酸的至少一部分杂交,从而形成双链硫代磷酸酯寡核苷酸。
在另一方面,提供了一种用于将基因编辑剂递送至细胞的复合物。该复合物包括(i)双链硫代磷酸酯寡核苷酸;(ii)通过第一化学接头共价结合到第一硫代磷酸酯核酸的基因编辑剂;和(ii)通过第二化学接头共价结合到第二硫代磷酸酯核酸的靶向剂,其中第一硫代磷酸酯核酸的至少一部分和第二硫代磷酸酯核酸的一部分彼此互补。并且其中第一硫代磷酸酯核酸的至少一部分与所述第二硫代磷酸酯核酸的至少一部分杂交,从而形成双链硫代磷酸酯寡核苷酸。
当用于两个核酸序列之间的互补性或两个核酸序列的杂交的上下文中时,术语“至少一部分”是指其在生物领域中的普通含义。在第一核酸序列和第二核酸序列的核苷酸的“至少一部分”彼此互补的情况下,第一核酸的至少一个(例如,2、3、4、5、6、7、8、9、10、15、20)核苷酸与第二核酸的核苷酸形成合适的碱基对(即,腺嘌呤与胸腺嘧啶和鸟嘌呤与胞嘧啶,而不是错配)。
在实施例中,第一硫代磷酸酯核酸的2至5个核苷酸与第二硫代磷酸酯核酸的2至5个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至5个毗邻核苷酸与第二硫代磷酸酯核酸的2至5个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至6个核苷酸与第二硫代磷酸酯核酸的2至6个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至6个毗邻核苷酸与第二硫代磷酸酯核酸的2至6个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至7个核苷酸与第二硫代磷酸酯核酸的2至7个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至7个毗邻核苷酸与第二硫代磷酸酯核酸的2至7个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至8个核苷酸与第二硫代磷酸酯核酸的2至8个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至8个毗邻核苷酸与第二硫代磷酸酯核酸的2-8个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至9个核苷酸与第二硫代磷酸酯核酸的2至9个核苷酸互补。在实施例中第一硫代磷酸酯核酸的2至9个毗邻核苷酸与第二硫代磷酸酯核酸的2-9个毗邻核苷酸互补。在实施例中第一硫代磷酸酯核酸的2至10个核苷酸与第二硫代磷酸酯核酸的2至10个核苷酸互补。在实施例中第一硫代磷酸酯核酸的2至10个毗邻核苷酸与第二硫代磷酸酯核酸的2至10个毗邻核苷酸互补。
在实施例中,第一硫代磷酸酯核酸的2至11个核苷酸与第二硫代磷酸酯核酸的2至11个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至11个毗邻核苷酸与第二硫代磷酸酯核酸的2至11个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至12个核苷酸与第二硫代磷酸酯核酸的2至12个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至12个毗邻核苷酸与第二硫代磷酸酯核酸的2至12个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至13个核苷酸与第二硫代磷酸酯核酸的2至13个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至13个毗邻核苷酸与第二硫代磷酸酯核酸的2至13个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至14个核苷酸与第二硫代磷酸酯核酸的2至14个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至14个毗邻核苷酸与第二硫代磷酸酯核酸的2至14个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至15个核苷酸与第二硫代磷酸酯核酸的2至15个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至15个毗邻核苷酸与第二硫代磷酸酯核酸的2至15个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至16个核苷酸与第二硫代磷酸酯核酸的2至16个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至16个毗邻核苷酸与第二硫代磷酸酯核酸的2至16个毗邻核苷酸互补。
在实施例中,第一硫代磷酸酯核酸的2至17个核苷酸与第二硫代磷酸酯核酸的2至17个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至17个毗邻核苷酸与第二硫代磷酸酯核酸的2至17个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至18个核苷酸与第二硫代磷酸酯核酸的2至18个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至18个毗邻核苷酸与第二硫代磷酸酯核酸的2至18个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至19个核苷酸与第二硫代磷酸酯核酸的2至19个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至19个毗邻核苷酸与第二硫代磷酸酯核酸的2至19个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至20个核苷酸与第二硫代磷酸酯核酸的2至20个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至20个毗邻核苷酸与第二硫代磷酸酯核酸的2至20个毗邻核苷酸互补。
在实施例中,第一硫代磷酸酯核酸的20个核苷酸与第二硫代磷酸酯核酸的20个核苷酸互补。在实施例中,第一硫代磷酸酯核酸的22个毗邻核苷酸与第二硫代磷酸酯核酸的22个毗邻核苷酸互补。
在实施例中,第一硫代磷酸酯核酸和第二硫代磷酸酯核酸彼此70%、75%、80%、85%、90%、95%、98%、99%或100%互补。
在第一硫代磷酸酯核酸的“至少一部分”与第二硫代磷酸酯核酸的至少一部分杂交的情况下,第一核酸的至少一个(例如,2、3、4、5、6、7、8、9、10、15、20)核苷酸与第二核酸的核苷酸形成合适的碱基对(即,腺嘌呤与胸腺嘧啶、鸟嘌呤与胞嘧啶,而不是错配),从而形成双链核酸分子。在实施例中,该部分包括2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个碱基对。
在实施例中,第一硫代磷酸酯核酸的2至5个核苷酸与第二硫代磷酸酯核酸的2至5个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至5个毗邻核苷酸与第二硫代磷酸酯核酸的2至5个毗邻核苷酸互补。在实施例中,第一硫代磷酸酯核酸的2至6个核苷酸与第二硫代磷酸酯核酸的2至6个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至6个毗邻核苷酸与第二硫代磷酸酯核酸的2至6个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至7个核苷酸与第二硫代磷酸酯核酸的2至7个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至7个毗邻核苷酸与第二硫代磷酸酯核酸的2至7个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至8个核苷酸与第二硫代磷酸酯核酸的2至8个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至8个毗邻核苷酸与第二硫代磷酸酯核酸的2至8个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至9个核苷酸与第二硫代磷酸酯核酸的2至9个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至9个毗邻核苷酸与第二硫代磷酸酯核酸的2至9个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至10个核苷酸与第二硫代磷酸酯核酸的2至10个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至10个毗邻核苷酸与第二硫代磷酸酯核酸的2至10个毗邻核苷酸杂交。
在实施例中,第一硫代磷酸酯核酸的2至11个核苷酸与第二硫代磷酸酯核酸的2至11个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至11个毗邻核苷酸与第二硫代磷酸酯核酸的2至11个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至12个核苷酸与第二硫代磷酸酯核酸的2至12个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至12个毗邻核苷酸与第二硫代磷酸酯核酸的2至12个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至13个核苷酸与第二硫代磷酸酯核酸的2至13个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至13个毗邻核苷酸与第二硫代磷酸酯核酸的2至13个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至14个核苷酸与第二硫代磷酸酯核酸的2至14个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至14个毗邻核苷酸与第二硫代磷酸酯核酸的2至14个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至15个核苷酸与第二硫代磷酸酯核酸的2至15个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至15个毗邻核苷酸与第二硫代磷酸酯核酸的2至15个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至16个核苷酸与第二硫代磷酸酯核酸的2至16个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至16个毗邻核苷酸与第二硫代磷酸酯核酸的2至16个毗邻核苷酸杂交。
在实施例中,第一硫代磷酸酯核酸的2至17个核苷酸与第二硫代磷酸酯核酸的2至17个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至17个毗邻核苷酸与第二硫代磷酸酯核酸的2至17个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至18个核苷酸与第二硫代磷酸酯核酸的2至18个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至18个毗邻核苷酸与第二硫代磷酸酯核酸的2至18个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至19个核苷酸与第二硫代磷酸酯核酸的2至19个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至19个毗邻核苷酸与第二硫代磷酸酯核酸的2至19个毗邻核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至20个核苷酸与第二硫代磷酸酯核酸的2至20个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的2至20个毗邻核苷酸与第二硫代磷酸酯核酸的2至20个毗邻核苷酸杂交。
在实施例中,第一硫代磷酸酯核酸的20个核苷酸与第二硫代磷酸酯核酸的20个核苷酸杂交。在实施例中,第一硫代磷酸酯核酸的22个毗邻核苷酸与第二硫代磷酸酯核酸的22个毗邻核苷酸杂交。
上面所描述的基因编辑剂(包括其实施例)中的任何基因编辑剂均可用于本节中所描述的基因编辑复合物。因此,在实施例中,第一基因编辑剂和第二基因编辑剂独立地是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。在实施例中,第一基因编辑剂和第二基因编辑剂独立地是Cas9、Cpf1或II类CRISPR核酸内切酶。在实施例中,第一基因编辑剂是第一Cas9,第二基因编辑剂是第二Cas9。在实施例中,第一基因编辑剂和第二基因编辑剂独立地为核酸酶缺乏型的。在实施例中,第一基因编辑剂包括第一半胱氨酸,并且第一硫代磷酸酯核酸包括通过第一半胱氨酸和第一硫醇部分之间的二硫键共价结合到第一基因编辑剂的第一硫醇部分。
在实施例中,第二基因编辑剂包括第二半胱氨酸,并且第二硫代磷酸酯核酸包括通过第二半胱氨酸和第二硫醇部分之间的二硫键共价结合到第二基因编辑剂的第二硫醇部分。在实施例中,第一硫代磷酸酯核酸结合到第一基因编辑剂的C末端。在实施例中,第二硫代磷酸酯核酸结合到第二基因编辑剂的C末端。
上面所描述的化学接头(包括其实施例)中的任何化学接头均可用于本节中所描述的基因编辑复合物。因此,在实施例中,第一化学接头和第二化学接头独立地是pH敏感性接头。在实施例中,第一化学接头和第二化学接头独立地是硫酯接头。
上面所描述的硫代磷酸酯核酸(包括其实施例)中的任何硫代磷酸酯核酸均可用于本节中所描述的基因编辑复合物。在实施例中,第一硫代磷酸酯核酸和第二硫代磷酸酯核酸独立地是硫代磷酸酯脱氧核糖核酸或硫代磷酸酯核糖核酸。在实施例中,第一硫代磷酸酯核酸和第二硫代磷酸酯核酸在长度上独立地为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。在实施例中,第一硫代磷酸酯核酸和第二硫代磷酸酯核酸在长度上独立地为约10至约30个核酸残基。在实施例中,一种或多种向导RNA与细胞中的一个或多个靶序列互补。
在实施例中,复合物进一步包括结合到第一基因编辑剂或第二基因编辑剂的一种或多种向导RNA。上面所描述的向导RNA(包括其实施例)中的任何向导RNA均可用于本节中所描述的基因编辑复合物。在实施例中,向导RNA包括SEQ ID NO:1、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的序列。
在实施例中,复合物形成细胞的一部分。上面针对基因编辑复合物所描述的任何实施例均是适用的且均是本节中所描述的基因编辑复合物的预想。因此,在实施例中,细胞是癌细胞或健康细胞。在实施例中,细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。在实施例中,细胞是胰腺癌细胞或卵巢癌细胞。
在实施例中,一种或多种向导RNA与细胞中的一个或多个靶序列互补。上面所描述的靶序列(包括其实施例)中的任何靶序列均可用于本节中所描述的基因编辑复合物。在实施例中,一个或多个靶序列是STAT-3靶序列、程序性细胞死亡蛋白1(PDCD1)靶序列、程序性细胞死亡蛋白1(PDCD2)靶序列、Tet甲基胞嘧啶双加氧酶2(TET2)靶序列、PARG聚(ADP核糖)糖水解酶靶序列、T细胞受体α(TCR-a)靶序列、T细胞受体β(TCR-b)靶序列、血管内皮生长因子Aα(VEGFA-a)靶序列或血管内皮生长因子Aβ(VEGFA-b)靶序列。
在实施例中,一种或多种向导RNA包括SEQ ID NO:1、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的序列。
在另一方面,提供了一种用于将基因编辑剂递送至细胞的复合物。该复合物包括(i)双链硫代磷酸酯寡核苷酸;(ii)通过第一化学接头共价结合到第一硫代磷酸酯核酸的基因编辑剂;和(ii)通过第二化学接头共价结合到第二硫代磷酸酯核酸的靶向剂,其中第一硫代磷酸酯核酸的至少一部分和第二硫代磷酸酯核酸的一部分彼此互补。并且其中第一硫代磷酸酯核酸的至少一部分与所述第二硫代磷酸酯核酸的至少一部分杂交,从而形成双链硫代磷酸酯寡核苷酸。
上描所描述的基因编辑剂(包括其实施例)中的任何基因编辑剂均可用于本节中所描述的基因编辑复合物。在实施例中,基因编辑剂是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。在实施例中,基因编辑剂是Cas9、Cpf1或II类CRISPR核酸内切酶。在实施例中,基因编辑剂是Cas9。
在实施例中,靶向剂是蛋白或核酸。在实施例中,靶向剂是抗体。在实施例中,靶向剂是癌症特异性抗体。在实施例中,抗体是抗HER2抗体。设想用于本文所提供的方法和组合物的抗体的非限制性实例包括抗Her2(马吉妥昔单抗(Margetuximab)、德卢替康曲妥珠单抗(trastuzumab deruxtecan)、西米普利单抗(Cemiplimab)、恩美曲妥珠单抗(Ado-trastuzumab emtansine))、帕妥珠单抗(Pertuzumab)、曲妥珠单抗)、抗PD-1(信迪利单抗(Sintilimab))、特瑞普利单抗(Toripalimab)、瑞弗利单抗(Retifanlimab)、巴替利单抗(Balstilimab)、多斯塔利单抗(Dostarlimab)、纳武单抗(Nivolumab)、派姆单抗(Pembrolizumab))、抗PD-L1(德瓦鲁单抗(Durvalumab)、阿维单抗(Avelumab)、阿替利珠单抗(Atezolizumab))、抗CTLA-4(伊匹单抗(Ipilimumab)、抗IL-2R(巴利昔单抗、达利珠单抗)、抗B7-H3(奥博妥单抗(Omburtamab))、抗组织因子(替索单抗(Tisotumab vedotin))、抗EGFR(埃万妥单抗(Amivantamab)、耐昔妥珠单抗(Necitumumab)、帕尼单抗、西妥昔单抗)、抗c-MET(埃万妥单抗)、抗CD20(乌妥昔单抗(Ublituximab)、奥克立珠单抗(Ocrelizumab)、奥妥珠单抗(Obinutuzumab)、奥法木单抗(Ofatumumab)、托西莫单抗I131(Tositomomab-I131)、替伊莫单抗、利妥昔单抗)、抗IFNAR1(阿尼鲁单抗(Anifrolumab))、抗CD19(替朗妥昔单抗(Loncastuximab tesirine)、塔法昔他单抗(Tafasitamab)、伊奈利珠单抗(Inebilizumab)、博纳吐单抗(Blinatumomab))、抗CD3(替利组单抗(Teplizumab)、博纳吐单抗、卡妥索单抗(Catumaxomab)、莫罗单抗CD3)、
抗CD25(伊诺莫单抗(Inolimomab))、抗EpCAM(莫妥组单抗(Oportuzumabmonatox)、卡妥索单抗、依决洛单抗(Edrecolomab))、抗CD52(阿仑单抗)、抗CD33(吉妥珠单抗(Gemtuzumab ozogamicin))、抗GD2(那昔妥单抗(Naxitamab)、地努妥昔单抗(Dinutuximab))、抗BCMA(贝兰他单抗莫福汀(Belantamab mofodin))、抗IL-6R(萨特利珠单抗(Satralizumab)、西鲁库单抗(Sarilumab)、托珠单抗(Tocilizumab))、抗CD30(维汀-布妥昔单抗(Brentuximab vedotin))、抗IL-4Rα(度普利尤单抗(Dupiumab))、抗TROP-2(戈沙妥珠单抗(Sacituzumab govitecan))、抗IGF-1R(替妥木单抗(Teprotumumab))、抗CD38(艾萨妥昔单抗(Isatuximab)、达雷妥尤单抗(Daratumumab))、抗CGRP受体、抗结合素4(维汀-恩弗妥单抗(Enfortumab vedotin))、抗P选择素(立赞利珠单抗(Crizanlizumab))、抗CCR4(莫格利珠单抗(Mogamulizumab))、抗VEGF(布洛赛珠单抗(Brolucizumab)、雷珠单抗、贝伐单抗)、抗VEGFR2(雷莫卢单抗(Ramucirumab))、抗CD79b(维汀-泊洛妥珠单抗)、抗CD22(帕舒托-莫塞妥莫单抗(Moxetumomab pasudotox、奥加伊妥珠单抗(Inotuzumabozogamicin))、抗CD4(伊巴珠单抗(Ibalizumab))、抗IL-5Rα(Benralizumab(贝那利珠单抗))、抗IL-17R(柏达鲁单抗(Brodalumab))、抗PDGRFα(奥拉单抗(Olaratumab))、抗SLAMF7(埃罗妥珠单抗(Elotuzumab))、抗α4β7整合素(维多珠单抗(Vedolizumab))、抗Muc1、抗CD44、抗CD133、抗CD5、抗CD7、抗CD70、抗IL13Rα2、抗PSCA、抗PSMA、抗GPC3、抗FAP、抗CEA、抗CD34、抗CD123、抗CD32、抗CD79a、抗CD96、抗CD123、抗ROR1、抗MESO抗原受体、抗TIM3、抗Src、抗Jak1、抗Jak2、抗c-Kit、抗CD36、抗MDR1、抗FGFR2、抗FGFR3和抗FLT3。
在实施例中,基因编辑剂是核酸酶缺乏型。在实施例中,基因编辑剂包括第一半胱氨酸,并且第一硫代磷酸酯核酸包括通过第一半胱氨酸和第一硫醇部分之间的二硫键共价结合到基因编辑剂的第一硫醇部分。在实施例中,靶向剂包括第二半胱氨酸,并且第二硫代磷酸酯核酸包括通过第二半胱氨酸和第二硫醇部分之间的二硫键共价结合到靶向剂的第二硫醇部分。在实施例中,第一硫代磷酸酯核酸结合到基因编辑剂的C末端。在实施例中,第二硫代磷酸酯核酸独立地附着到靶向剂的赖氨酸、精氨酸、半胱氨酸或组氨酸。
在实施例中,第一化学接头和第二化学接头独立地是pH敏感性接头。上面所描述的化学接头(包括其实施例)中的任何化学接头均可用于本节中所描述的基因编辑复合物。在实施例中,第一化学接头和第二化学接头独立地是硫酯接头。
上面所描述的硫代磷酸酯核酸(包括其实施例)中的任何硫代磷酸酯核酸均可用于本节中所描述的基因编辑复合物。在实施例中,第一硫代磷酸酯核酸和第二硫代磷酸酯核酸独立地是硫代磷酸酯脱氧核糖核酸或硫代磷酸酯核糖核酸。在实施例中,第一硫代磷酸酯核酸和第二硫代磷酸酯核酸在长度上独立地为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。在实施例中,第一硫代磷酸酯核酸和第二硫代磷酸酯核酸在长度上独立地为约10至约30个核酸残基。在实施例中,复合物进一步包括结合到基因编辑剂的一种或多种向导RNA。上面所描述的向导RNA(包括其实施例)中的任何向导RNA均可用于本节中所描述的基因编辑复合物。
在实施例中,复合物形成细胞的一部分。上面针对基因编辑复合物所描述的任何实施例均是适用的且均是本节中所描述的基因编辑复合物的预想。因此,在实施例中,细胞是癌细胞或健康细胞。在实施例中,细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。在实施例中,细胞是胰腺癌细胞或卵巢癌细胞。
在实施例中,一种或多种向导RNA与细胞中的一个或多个靶序列互补。上面所描述的靶序列(包括其实施例)中的任何靶序列均可用于本节中所描述的基因编辑复合物。在实施例中,一个或多个靶序列是STAT-3靶序列、程序性细胞死亡蛋白1(PDCD1)靶序列、程序性细胞死亡蛋白1(PDCD2)靶序列、Tet甲基胞嘧啶双加氧酶2(TET2)靶序列、PARG聚(ADP核糖)糖水解酶靶序列、T细胞受体α(TCR-a)靶序列、T细胞受体β(TCR-b)靶序列、血管内皮生长因子Aα(VEGFA-a)靶序列或血管内皮生长因子Aβ(VEGFA-b)靶序列。
在实施例中,一种或多种向导RNA包括SEQ ID NO:1、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的序列。
在一个方面,提供了一种药物组合物。药物组合物包括药物赋形剂和如本文所提供的复合物,包括其实施例。
本文所提供的基因编辑复合物(包括其实施例)可通过到一个或多个硫代磷酸酯核酸的附着而递送至细胞中。本文所提供的基因编辑剂可以是非细胞穿透蛋白,其在附着到本文所提供的硫代磷酸酯核酸后内化到细胞中。在实施例中,基因编辑剂在存在硫代磷酸酯核酸的情况下是细胞穿透性的。在实施例中,基因编辑剂在不存在硫代磷酸酯核酸的情况下是非细胞穿透性的。在实施例中,相对于在不存在硫代磷酸酯核酸的情况下,在存在硫代磷酸酯核酸的情况下细胞内化的基因编辑剂的量增加。在实施例中,相对于在不存在硫代磷酸酯核酸的情况下,在存在硫代磷酸酯核酸的情况下细胞内化的基因编辑剂的量增加2、3、4、5、6、7、8、9、10、100、10000、10,000倍。在实施例中,在不存在硫代磷酸酯核酸的情况下,基因编辑剂不被细胞以可检测量内化。
在一个方面,提供了一种将基因编辑剂递送至细胞的方法。该方法包括使细胞与本文所提供的复合物(包括其实施例)接触,从而将基因编辑剂递送至细胞。在实施例中,接触发生在体外或体内。在实施例中,细胞是T细胞或干细胞。在实施例中,细胞是多能干细胞、免疫细胞、癌细胞或神经元。在实施例中,细胞是T细胞(例如,嵌合抗原受体T细胞)、自然杀伤细胞、巨噬细胞或B细胞。在实施例中,细胞是癌细胞,其可以是肾上腺癌细胞、肝胰管壶腹癌细胞、胆道癌细胞、膀胱/泌尿道癌细胞、骨癌细胞、肠癌细胞、乳腺癌细胞、CNS/脑癌细胞、宫颈癌细胞、食道/胃癌细胞、眼癌细胞、头颈癌细胞、肾癌细胞、肝癌细胞、肺癌细胞、淋巴癌细胞、骨髓癌细胞、卵巢/输卵管癌细胞、胰腺癌细胞、外周神经系统癌细胞、胸膜癌细胞、前列腺癌细胞、皮肤癌细胞、软组织癌细胞、睾丸癌细胞、胸腺癌细胞、甲状腺癌细胞、子宫或外阴/阴道癌细胞。
实例
实例1
本文所提供的方法以高效率(大于90%)将Cas9/向导RNA递送至T细胞和其它细胞中,接着是预期基因的高效删除(等于或大于90%)。
Cas9酶用包括接头的硫代磷酸酯化(PS)ssDNA寡核苷酸进行修饰,接着与向导RNA混合。经修饰的Cas9/向导RNA保留了有效的酶活性。
当将经修饰的Cas9/向导RNA混合物添加到所培养的肿瘤细胞、新鲜的小鼠T细胞、原代人T细胞、人CAR-T细胞时,经修饰的Cas9/向导RNA混合物非常有效地穿透这些细胞。内化后的经修饰的Cas9/向导RNA有效地删除了经靶向的基因。
到目前为止,已经测试了两种附着化学。第一种附着化学是通过伯胺醛交联的Cas9硫代磷酸酯寡核苷酸(PS)偶联(图1)。Cas9蛋白中的伯胺键用于偶联醛-硫代磷酸酯化ssDNA-寡核苷酸。第二种附着化学是PS寡核苷酸在Cas9酶中的限定位点的附着。结果表明Cas9的C末端半胱氨酸上的附着保留了完整/接近完整的酶活性,以及向导RNA的结合(图2)。一旦经修饰的酶在细胞内部,经附着的PS ssDNA寡核苷酸就被会分离。这种方法也可以使两个或更多个PS ssDNA寡核苷酸附着在Cas9的限定位点。
在实施例中,化学接头可以是PS(硫代磷酸酯核酸)-半胱氨酸键,其可以通过硫醇还原酶(二硫键)或内体/溶酶体半胱氨酸蛋白酶切割,因此是半胱氨酸接头。因此,接头可以通过二硫键或任何其它类型的共价键用于PS偶联。可以使用用于半胱氨酸偶联(硫酯键)的马来酰亚胺基接头:包括但不限于马来酰亚胺基己酰基(mc)和马来酰亚胺基甲基环己烷-1-羧酸酯(mcc)基接头,如mc-Val-Cit-接头或mc-Val-Ala-接头。一旦Cas9-PS偶联物穿透进细胞,硫酯键可以由硫酯酶或组织蛋白酶B(蛋白酶)释放。具有对氨基苄氧基(PABO)间隔序列的苯丙氨酸-赖氨酸(Phe-Lys)二肽接头是可用于PS偶联的可切割接头。PS偶联物可在接头被组织蛋白酶B蛋白酶切割后释放。
如图3A和图3B以及图4A和图4B所绘示,Cas9-Cys-PS偶联物以接近100%内化到人恶性T细胞中,并且进一步证明内化到小鼠脾T细胞中的效率很高。细胞穿透Cas9-Cys-PS偶联物也以高效率穿透CAR-T细胞,并通过经修饰的Cas9/向导RNA(9/10=90%)导致有效的经靶向的基因删除/突变,如图5A和图5B所示。这些结果表明,在骨髓移植之前递送Cas9/STAT3向导RNA以在T细胞中诱导STAT3功能性敲除可以减少移植物抗宿主疾病并增加抗肿瘤免疫应答。
实例2
除了通过删除免疫抑制基因和/或可引起细胞因子风暴的基因使CAR-T细胞更有效之外,本文所提供的组合物和方法用于制备通用CAR-T细胞。通过删除T细胞受体、MHC,可以降低同种异体应答。使用该技术生成通用CAR-T的可行性示于图5A和图5B中。
该方法用于删除T细胞、造血干细胞、干细胞和其它类型的细胞中的基因,如图3A和图3B以及图4A和图4B所示。
以下附着化学是用于通过共价键、二硫键或硫酯键形成将PS ssDNA寡核苷酸偶联到Cas9的替代方法。附着化学包括:胺到胺、胺-叠氮化物、胺-醛、叠氮化物-醛、胺到巯基基团、巯基到巯基基团、马来酰亚胺到巯基基团。
这种方法的替代方法包括使用与Cas9酶混合的多种向导RNA删除若干基因。除了Cas9酶之外,使用类似化学附着PS ssDNA寡核苷酸的其它CRISPR相关蛋白核酸内切酶用于细胞穿透和Cas9基因删除。该方法也适用于转录激活因子样效应物核酸酶(TALEN),其可以被工程化以剪切DNA的特异性序列。
本文所提供的组合物和方法用于降低Cas9酶的脱靶效应。生成双特异性Cas9对:每个Cas9都具有位于基因的经靶向的区域一端侧翼的向导RNA。一种Cas9酶与正义PSssDNA寡核苷酸附着,而另一种Cas9酶与反义PS ssDNA寡核苷酸附着。通过互补性使PSssDNA寡核苷酸退火能够生成结合到经靶向的基因的两个独立区的双特异性Cas9/向导RNA。如果退火期间的加热是Cas9酶活性的问题,则可以使用热稳定的Cas蛋白。
除了基因删除之外,本文所提供的方法和组合物通过向导RNA有效内化失活Cas9酶以递送激活剂和抑制剂,从而分别调控免疫刺激和免疫抑制基因的表达。
本文所公开的细胞穿透Cas9/向导RNA方法可用于体内治疗。例如,通过局部注射以删除肿瘤细胞、肿瘤相关免疫细胞和癌症相关成纤维细胞、癌症干细胞和肿瘤内皮细胞中的基因如STAT3来治疗实体瘤,以阻断肿瘤细胞生长并诱导抗肿瘤免疫应答。
描述了形成本文所提供的具有化学接头的潜在附着位点的复合物的部分的DNA编辑剂的示范性实施例:
非正式序列表
SEQ ID NO:1ACAATCCGGGCAATCTCCATTGG
SEQ ID NO:2(来自酿脓链球菌(S.pyogenes)的Cas9))
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA
LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHR
LEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKAD
LRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENP
INASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTP
NFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEI
FFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPY
YVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDK
NLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVD
LLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQ
LKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL HEHIANLAGS PAIKKGILQT VKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLI
REVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKK
YPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEI
TLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE
KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPE
DNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDK
PIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQ
SITGLYETRI DLSQLGGD
SEQ ID NO:3(来自酿脓链球菌(S.pyogenes)的Cas9,Cas9和HIS标签之间的接头用粗体和下划线显示)
/>
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
SEQ ID NO:5(ddCasCfp1)
MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRI
YKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIG
RTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTT
YFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENV
KKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNL
AIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRN
ENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGK
ITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTT
LKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSF
YNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGI
MPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQT
HTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWID
FTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVE
TGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRP
KSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARA
LLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPE
TPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWS
VVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLANLNFGFKSKRTGIAEKAVYQQ
FEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPY
TSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSF
QRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANE
LIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYIN
SPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNG
ISNQDWLAYIQELRN
SEQ ID NO:6(ddLbCfp1)
MSKLEKFTNCYSLSKTLRFKAIPVGKTQENIDNKRLLVEDEKRAEDYKGVKKLLD
RYYLSFINDVLHSIKLKNLNNYISLFRKKTRTEKENKELENLEINLRKEIAKAFKGN
EGYKSLFKKDIIETILPEFLDDKDEIALVNSFNGFTTAFTGFFDNRENMFSEEAKSTS
IAFRCINENLTRYISNMDIFEKVDAIFDKHEVQEIKEKILNSDYDVEDFFEGEFFNFV
LTQEGIDVYNAIIGGFVTESGEKIKGLNEYINLYNQKTKQKLPKFKPLYKQVLSDR
ESLSFYGEGYTSDEEVLEVFRNTLNKNSEIFSSIKKLEKLFKNFDEYSSAGIFVKNG
PAISTISKDIFGEWNVIRDKWNAEYDDIHLKKKAVVTEKYEDDRRKSFKKIGSFSL
EQLQEYADADLSVVEKLKEIIIQKVDEIYKVYGSSEKLFDADFVLEKSLKKNDAVV
AIMKDLLDSVKSFENYIKAFFGEGKETNRDESFYGDFVLAYDILLKVDHIYDAIRN
YVTQKPYSKDKFKLYFQNPQFMGGWDKDKETDYRATILRYGSKYYLAIMDKKY
AKCLQKIDKDDVNGNYEKINYKLLPGPNKMLPKVFFSKKWMAYYNPSEDIQKIY
KNGTFKKGDMFNLNDCHKLIDFFKDSISRYPKWSNAYDFNFSETEKYKDIAGFYR
EVEEQGYKVSFESASKKEVDKLVEEGKLYMFQIYNKDFSDKSHGTPNLHTMYFK
LLFDENNHGQIRLSGGAELFMRRASLKKEELVVHPANSPIANKNPDNPKKTTTLSY
DVYKDKRFSEDQYELHIPIAINKCPKNIFKINTEVRVLLKHDDNPYVIGIARGERNL
LYIVVVDGKGNIVEQYSLNEIINNFNGIRIKTDYHSLLDKKEKERFEARQNWTSIEN
IKELKAGYISQVVHKICELVEKYDAVIALADLNSGFKNSRVKVEKQVYQKFEKML
IDKLNYMVDKKSNPCATGGALKGYQITNKFESFKSMSTQNGFIFYIPAWLTSKIDP
STGFVNLLKTKYTSIADSKKFISSFDRIMYVPEEDLFEFALDYKNFSRTDADYIKK
WKLYSYGNRIRIFRNPKKNNVFDWEEVCLTSAYKELFNKYGINYQQGDIRALLCE
QSDKAFYSSFMALMSLMLQMRNSITGRTDVDFLISPVKNSDGIFYDSRNYEAQEN
AILPKNADANGAYNIARKVLWAIGQFKKAEDEKLDKVKIAISNKEWLEYAQTSVK
H
SEQ ID NO:7(ddFnCfp1)
MYPYDVPDYASGSGMSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEK
RAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDF
KSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFK
ANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFL
ENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIAN
FNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVL
FKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDL
KAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKE
QELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQ
NKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSE
DKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLA
NGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYK
LLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDC
RKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYI
DSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEA
ELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITI
NFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFN
IIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVI
EYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGV
LRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEF
FSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNW
DTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRN
SKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
SEQ ID NO:8野生型:
ATAGAGCAGGTATCTTGAGAAGCCAATGGAGATTGCCCGGATTGTGGCCCGGTGCCTGTG
SEQ ID NO:9突变1:
ATAGAGCAGGTATCTTGAGAAGCCAATGGGAATTcCCCcGTTtTGCCGGTGCCTGTG
SEQ ID NO:10突变2:
ATAGAGCAGGTATCTTGAGAAGCCAAGGGAATTCCCGTTGTGGCCCGGTGCCTGTG
SEQ ID NO:11突变3:
ATAGAGCAGGTATCTTGAGAAGCCAAGGGAAATTCCCCCGATTTGGCCCGGTGCCTGTG
SEQ ID NO:12突变4:
ATAGAGCAGGTATCTTGAGAAGCCAAGGAATTCCCccATTTCCCGGTGCCTGTG
SEQ ID NO:13突变5:
ATAGAGCAGGTATCTTGAGAAGCCAATGGAATTCCCGGATTTGTGGCCCGGTGCCTGTG
SEQ ID NO:14突变6:
ATAGAGCAGGTATCTTGAGAAGCCAATGGAGAATTGCCCGGATTGTGGCCCGGTGCCTGTG
SEQ ID NO:15突变7:
ATAGAGCAGGTATCTTGAGAAGCCAATGGAGATTGCCCCGGATTGTGGCCCGGTGCCTGTG
SEQ ID NO:16突变8:
ATAGAGCAGGTATCTTGAGAAGCCAATGGAGATTGCCCCGGATTTGGCCCGGTGCCTGTG
SEQ ID NO:17Cas9-C构建体核酸(所示的Cas9-C比对的核酸)
SEQ ID NO:18Cas9-C构建体蛋白序列(所示的Cas9-C比对的氨基酸序列)
SEQ ID NO:19:SV40 NLS P K K K R K V
SEQ ID NO:20:His标签H H H H H H
SEQ ID NO:21Cas9-5C构建体核酸(所示的Cas9-5C比对的核酸)
SEQ ID NO:22Cas9-5C构建体蛋白序列(所示的Cas9-5C比对的氨基酸序列)
SEQ ID NO:23Cys标签C C C C C
SEQ ID NO:24Cas9-C核酸(Cas9-C比对中粗斜体所示的核酸序列)
SEQ ID NO:25Cas9-C蛋白酸(Cas9-C比对中粗斜体所示的氨基酸序列)
SEQ ID NO:26Cas9-5C核酸(Cas9-5C比对中粗斜体所示的核酸序列)
SEQ ID NO:27Cas9-5C蛋白氨基酸(Cas9-5C序列对比中粗斜体所示的氨基酸序列)包括更多序列的表
*指示硫代磷酸酯化核苷酸。
P实施例
P实施例1.一种用于将基因编辑剂递送至细胞的复合物,所述复合物包含基因编辑剂,所示基因编辑剂通过化学接头共价结合到硫代磷酸酯核酸。
P实施例2.根据P实施例1所述的复合物,其中所述基因编辑剂包含半胱氨酸并且所述硫代磷酸酯核酸包含硫醇部分,所述硫醇部分通过所述半胱氨酸和所述硫醇部分之间的二硫键共价结合到所述基因编辑剂。
P实施例3.根据P实施例1或2所述的复合物,其中所述硫代磷酸酯核酸结合到所述基因编辑剂的C末端。
P实施例4.根据P实施例1至3中任一项所述的复合物,其中所述化学接头是pH敏感性接头。
P实施例5.根据P实施例1、3或4中任一项所述的复合物,其中所述化学接头是硫酯接头。
P实施例6.根据P实施例1至5中任一项所述的复合物,其中所述硫代磷酸酯核酸是单链核酸。
P实施例7.根据P实施例1至6中任一项所述的复合物,其中所述硫代磷酸酯核酸是硫代磷酸酯脱氧核糖核酸。
P实施例8.根据P实施例1至7中任一项所述的复合物,其中所述硫代磷酸酯核酸在长度上为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。
P实施例9.根据P实施例1至8中任一项所述的复合物,其中所述硫代磷酸酯核酸在长度上为约10至约30个核酸残基。
P实施例10.根据P实施例1至9中任一项所述的复合物,其中所述硫代磷酸酯核酸在长度上为约20个核酸残基。
P实施例11.根据P实施例1至10中任一项所述的复合物,其中所述基因编辑剂是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。
P实施例12.根据P实施例11所述的复合物,其中所述RNA向导的DNA核酸内切酶是Cas9、Cpf1或II类CRISPR核酸内切酶。
P实施例13.根据P实施例11或12所述的复合物,其中所述RNA向导的DNA核酸内切酶是核酸酶缺乏型的。
P实施例14.根据P实施例1至13中任一项所述的复合物,所述复合物进一步包含结合到所述基因编辑剂的一种或多种向导RNA。
P实施例15.根据P实施例14所述的复合物,其中所述一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。
P实施例16.根据P实施例15所述的复合物,其中所述一个或多个靶序列是STAT-3靶序列。
P实施例17.根据P实施例14至16中任一项所述的复合物,其中所述向导RNA包含SEQ ID NO:1的序列。
P实施例18.一种用于将基因编辑剂递送至细胞的复合物,所述复合物包含:
(i)双链硫代磷酸酯寡核苷酸;
(ii)第一基因编辑剂,所述第一基因编辑剂通过第一化学接头共价结合到第一硫代磷酸酯核酸;和
(ii)第二基因编辑剂,所述第二基因编辑剂通过第二化学接头共价结合到第二硫代磷酸酯核酸;
其中所述第一硫代磷酸酯核酸的至少一部分和所述第二硫代磷酸酯核酸的一部分彼此互补,并且其中所述第一硫代磷酸酯核酸的至少一部分与所述第二硫代磷酸酯核酸的至少一部分杂交,从而形成所述双链硫代磷酸酯寡核苷酸。
P实施例19.根据P实施例18所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。
P实施例20.根据P实施例18或19所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是Cas9、Cpf1或II类CRISPR核酸内切酶。
P实施例21.根据P实施例18或19所述的复合物,其中所述第一基因编辑剂是第一Cas9并且所述第二基因编辑剂是第二Cas9。
P实施例22.根据P实施例21所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是核酸酶缺乏型的。
P实施例23.根据P实施例18至22中任一项所述的复合物,其中所述第一基因编辑剂包含第一半胱氨酸,并且所述第一硫代磷酸酯核酸包含第一硫醇部分,所述第一硫醇部分通过所述第一半胱氨酸和所述第一硫醇部分之间的二硫键共价结合到所述第一基因编辑剂。
P实施例24.根据P实施例18至23中任一项所述的复合物,其中所述第二基因编辑剂包含第二半胱氨酸,并且所述第二硫代磷酸酯核酸包含第二硫醇部分,所述第二硫醇部分通过所述第二半胱氨酸和所述第二硫醇部分之间的二硫键共价结合到所述第二基因编辑剂。
P实施例25.根据P实施例18至24中任一项所述的复合物,其中所述第一硫代磷酸酯核酸结合到所述第一基因编辑剂的C末端。
P实施例26.根据P实施例18至25中任一项所述的复合物,其中所述第二硫代磷酸酯核酸结合到所述第二基因编辑剂的C末端。
P实施例27.根据P实施例18至26中任一项所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是pH敏感性接头。
P实施例28.根据P实施例18至27中任一项所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是硫酯接头。
P实施例29.根据P实施例18至28中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸独立地是硫代磷酸酯脱氧核糖核酸或硫代磷酸酯核糖核酸。
P实施例30.根据P实施例18至29中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。
P实施例31.根据P实施例18至30中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10至约30个核酸残基。
P实施例32.根据P实施例18至31中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10至约30个核酸残基。
P实施例33.根据P实施例32所述的复合物,其中所述一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。
P实施例34.一种将基因编辑剂递送至细胞的方法,所述方法包含使细胞与根据P实施例1至33中任一项所述的复合物接触,从而将所述基因编辑剂递送至所述细胞。
P实施例35.根据P实施例34所述的方法,其中所述接触发生在体外或体内。
P实施例36.根据P实施例34或35的方法,其中所述细胞是T细胞或干细胞。
实施例
实施例1.一种用于将基因编辑剂递送至细胞的复合物,所述复合物包含基因编辑剂,所示基因编辑剂通过化学接头共价结合到硫代磷酸酯核酸。
实施例2.根据实施例1所述的复合物,其中所述基因编辑剂包含半胱氨酸,并且所述硫代磷酸酯核酸包含硫醇部分,所述硫醇部分通过所述半胱氨酸和所述硫醇部分之间的二硫键共价结合到所述基因编辑剂。
实施例3.根据实施例1或2所述的复合物,其中所述硫代磷酸酯核酸结合到所述基因编辑剂的C末端。
实施例4.根据实施例1至3中任一项所述的复合物,其中所述化学接头是pH敏感性接头。
实施例5.根据实施例1、3或4中任一项所述的复合物,其中所述化学接头是硫酯接头。
实施例6.根据实施例1至5中任一项所述的复合物,其中所述硫代磷酸酯核酸是单链核酸。
实施例7.根据实施例1至6中任一项所述的复合物,其中所述硫代磷酸酯核酸是硫代磷酸酯脱氧核糖核酸。
实施例8.根据实施例1至7中任一项所述的复合物,其中所述硫代磷酸酯核酸在长度上为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。
实施例9.根据实施例1至8中任一项所述的复合物,其中所述硫代磷酸酯核酸在长度上为约10至约30个核酸残基。
实施例10.根据实施例1至9中任一项所述的复合物,其中所述硫代磷酸酯核酸在长度上为约20个核酸残基。
实施例11.根据实施例1至10中任一项所述的复合物,其中所述基因编辑剂是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。
实施例12.根据实施例11所述的复合物,其中所述RNA向导的DNA核酸内切酶是Cas9、Cpf1或II类CRISPR核酸内切酶。
实施例13.根据实施例11或12所述的复合物,其中所述RNA向导的DNA核酸内切酶是核酸酶缺乏型的。
实施例14.根据实施例1至13中任一项所述的复合物,所述复合物进一步包含一种或多种向导RNA,所述一种或多种向导RNA结合到所述基因编辑剂。
实施例15.根据实施例1至14中任一项所述的复合物,其中所述复合物形成细胞的一部分。
实施例16.根据实施例15所述的复合物,其中所述细胞是癌细胞或健康细胞。
实施例17.根据实施例15或16所述的复合物,其中所述细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。
实施例18.根据实施例15或16所述的复合物,其中所述细胞是胰腺癌细胞或卵巢癌细胞。
实施例19.根据实施例14至19中任一项所述的复合物,其中所述一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。
实施例20.根据实施例19所述的复合物,其中所述一个或多个靶序列是STAT-3靶序列。
实施例21.根据实施例14至20中任一项所述的复合物,其中所述一种或多种向导RNA包含SEQ ID NO:1的序列。
实施例22.一种用于将基因编辑剂递送至细胞的复合物,所述复合物包含:
(i)双链硫代磷酸酯寡核苷酸;
(ii)第一基因编辑剂,所述第一基因编辑剂通过第一化学接头共价结合到第一硫代磷酸酯核酸;和
(ii)第二基因编辑剂,所述第二基因编辑剂通过第二化学接头共价结合到第二硫代磷酸酯核酸;
其中所述第一硫代磷酸酯核酸的至少一部分和所述第二硫代磷酸酯核酸的一部分彼此互补,并且其中所述第一硫代磷酸酯核酸的至少一部分与所述第二硫代磷酸酯核酸的至少一部分杂交,从而形成所述双链硫代磷酸酯寡核苷酸。
实施例23.根据实施例22所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。
实施例24.根据实施例22或23所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是Cas9、Cpf1或II类CRISPR核酸内切酶。
实施例25.根据实施例22或23所述的复合物,其中所述第一基因编辑剂是第一Cas9并且所述第二基因编辑剂是第二Cas9。
实施例26.根据实施例25所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是核酸酶缺乏型的。
实施例27.根据实施例22至26中任一项所述的复合物,其中所述第一基因编辑剂包含第一半胱氨酸,并且所述第一硫代磷酸酯核酸包含第一硫醇部分,所述第一硫醇部分通过所述第一半胱氨酸和所述第一硫醇部分之间的二硫键共价结合到所述第一基因编辑剂。
实施例28.根据实施例22至27中任一项所述的复合物,其中所述第二基因编辑剂包含第二半胱氨酸,并且所述第二硫代磷酸酯核酸包含第二硫醇部分,所述第二硫醇部分通过所述第二半胱氨酸和所述第二硫醇部分之间的二硫键共价结合到所述第二基因编辑剂。
实施例29.根据实施例22至28中任一项所述的复合物,其中所述第一硫代磷酸酯核酸结合到所述第一基因编辑剂的C末端。
实施例30.根据实施例22至29中任一项所述的复合物,其中所述第二硫代磷酸酯核酸结合到所述第二基因编辑剂的C末端。
实施例31.根据实施例22至30中任一项所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是pH敏感性接头。
实施例32.根据实施例22至31中任一项所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是硫酯接头。
实施例33.根据实施例22至32中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸独立地是硫代磷酸酯脱氧核糖核酸或硫代磷酸酯核糖核酸。
实施例34.根据实施例22至33中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。
实施例35.根据实施例22至34中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10至约30个核酸残基。
实施例36.根据实施例22至35中任一项所述的复合物,所述复合物进一步包含一种或多种向导RNA,所述一种或多种向导RNA结合到所述第一基因编辑剂或所述第二基因编辑剂。
实施例37.根据实施例22至36中任一项所述的复合物,其中所述复合物形成细胞的一部分。
实施例38.根据实施例37所述的复合物,其中所述细胞是癌细胞或健康细胞。
实施例39.根据实施例37或38所述的复合物,其中所述细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。
实施例40.根据实施例37或38所述的复合物,其中所述细胞是胰腺癌细胞或卵巢癌细胞。
实施例41.根据实施例22至40中任一项所述的复合物,其中所述一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。
实施例42.根据实施例41所述的复合物,其中所述一个或多个靶序列是STAT-3靶序列。
实施例43.根据实施例36至42中任一项所述的复合物,其中所述一种或多种向导RNA包含SEQ ID NO:1的序列。
实施例44.一种用于将基因编辑剂递送至细胞的复合物,所述复合物包含:
(i)双链硫代磷酸酯寡核苷酸;
(ii)基因编辑剂,所述基因编辑剂通过第一化学接头共价结合到第一硫代磷酸酯核酸;和
(ii)靶向剂,所述靶向剂通过第二化学接头共价结合到第二硫代磷酸酯核酸;
其中所述第一硫代磷酸酯核酸的至少一部分和所述第二硫代磷酸酯核酸的一部分彼此互补;并且
其中所述第一硫代磷酸酯核酸的至少一部分与所述第二硫代磷酸酯核酸的至少一部分杂交,从而形成所述双链硫代磷酸酯寡核苷酸。
实施例45.根据实施例44所述的复合物,其中所述基因编辑剂是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。
实施例46.根据实施例44或45的复合物,其中所述基因编辑剂是Cas9、Cpf1或II类CRISPR核酸内切酶。
实施例47.根据实施例44至46中任一项所述的复合物,其中所述基因编辑剂是Cas9。
实施例48.根据实施例44至47中任一项所述的复合物,其中所述靶向剂是蛋白或核酸。
实施例49.根据实施例44至48中任一项所述的复合物,其中所述靶向剂是抗体。
实施例50.根据实施例44至49中任一项所述的复合物,其中所述靶向剂是癌症特异性抗体。
实施例51.根据实施例44至50中任一项所述的复合物,其中所述基因编辑剂是核酸酶缺乏型的。
实施例52.根据实施例44至51中任一项所述的复合物,其中所述基因编辑剂包含第一半胱氨酸,并且所述第一硫代磷酸酯核酸包含第一硫醇部分,所述第一硫醇部分通过所述第一半胱氨酸和所述第一硫醇部分之间的二硫键共价结合到所述基因编辑剂。
实施例53.根据实施例44至52中任一项所述的复合物,其中所述靶向剂包含第二半胱氨酸,并且所述第二硫代磷酸酯核酸包含第二硫醇部分,所述第二硫醇部分通过所述第二半胱氨酸和所述第二硫醇部分之间的二硫键共价结合到所述靶向剂。
实施例54.根据实施例44至53中任一项所述的复合物,其中所述第一硫代磷酸酯核酸结合到所述基因编辑剂的C末端。
实施例55.根据实施例44至54中任一项所述的复合物,其中所述第二硫代磷酸酯核酸独立地附着到所述靶向剂的赖氨酸、精氨酸、半胱氨酸或组氨酸。
实施例56.根据实施例44至55中任一项所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是pH敏感性接头。
实施例57.根据实施例44至56中任一项所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是硫酯接头。
实施例58.根据实施例44至57中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸独立地是硫代磷酸酯脱氧核糖核酸或硫代磷酸酯核糖核酸。
实施例59.根据实施例44至58中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。
实施例60.根据实施例44至58中任一项所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10至约30个核酸残基。
实施例61.根据实施例44至60中任一项所述的复合物,所述复合物进一步包含一种或多种向导RNA,所述一种或多种向导RNA结合到所述基因编辑剂。
实施例62.根据实施例44至36中任一项所述的复合物,其中所述复合物形成细胞的一部分。
实施例63.根据实施例62所述的复合物,其中所述细胞是癌细胞或健康细胞。
实施例64.根据实施例62或63所述的复合物,其中所述细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。
实施例65.根据实施例62或63所述的复合物,其中所述细胞是胰腺癌细胞或卵巢癌细胞。
实施例66.根据实施例44至65中任一项所述的复合物,其中所述一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。
实施例67.根据实施例66所述的复合物,其中所述一个或多个靶序列是STAT-3靶序列。
实施例68.根据实施例61至67中任一项所述的复合物,其中所述一种或多种向导RNA包含SEQ ID NO:1的序列。
实施例69.一种药物组合物,所述药物组合物包含根据实施例1至68中任一项所述的复合物和药学上可接受的赋形剂。
实施例70.一种将基因编辑剂递送至细胞的方法,所述方法包含使细胞与根据实施例1至68中任一项所述的复合物接触,从而将所述基因编辑剂递送至所述细胞。
实施例71.根据实施例70所述的方法,其中所述接触发生在体外或体内。
实施例72.根据实施例70或71所述的方法,其中所述细胞是癌细胞或健康细胞。
实施例73.根据实施例70或71所述的方法,其中所述细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。
实施例74.根据实施例70或71所述的方法,其中所述细胞是胰腺癌细胞或卵巢癌细胞。

Claims (74)

1.一种用于将基因编辑剂递送至细胞的复合物,所述复合物包含基因编辑剂,所述基因编辑剂通过化学接头共价结合到硫代磷酸酯核酸。
2.根据权利要求1所述的复合物,其中所述基因编辑剂包含半胱氨酸,并且所述硫代磷酸酯核酸包含硫醇部分,所述硫醇部分通过所述半胱氨酸和所述硫醇部分之间的二硫键共价结合到所述基因编辑剂。
3.根据权利要求1所述的复合物,其中所述硫代磷酸酯核酸结合到所述基因编辑剂的C末端。
4.根据权利要求1所述的复合物,其中所述化学接头是pH敏感性接头。
5.根据权利要求1所述的复合物,其中所述化学接头是硫酯接头。
6.根据权利要求1所述的复合物,其中所述硫代磷酸酯核酸是单链核酸。
7.根据权利要求1所述的复合物,其中所述硫代磷酸酯核酸是硫代磷酸酯脱氧核糖核酸。
8.根据权利要求1所述的复合物,其中所述硫代磷酸酯核酸在长度上为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。
9.根据权利要求1所述的复合物,其中所述硫代磷酸酯核酸在长度上为约10至约30个核酸残基。
10.根据权利要求1所述的复合物,其中所述硫代磷酸酯核酸在长度上为约20个核酸残基。
11.根据权利要求1所述的复合物,其中所述基因编辑剂是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。
12.根据权利要求11所述的复合物,其中所述RNA向导的DNA核酸内切酶是Cas9、Cpf1或II类CRISPR核酸内切酶。
13.根据权利要求11所述的复合物,其中所述RNA向导的DNA核酸内切酶是核酸酶缺乏型的。
14.根据权利要求1所述的复合物,所述复合物进一步包含一种或多种向导RNA,所述一种或多种向导RNA结合到所述基因编辑剂。
15.根据权利要求1所述的复合物,其中所述复合物形成细胞的一部分。
16.根据权利要求15所述的复合物,其中所述细胞是癌细胞或健康细胞。
17.根据权利要求15所述的复合物,其中所述细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。
18.根据权利要求15所述的复合物,其中所述细胞是胰腺癌细胞或卵巢癌细胞。
19.根据权利要求14所述的复合物,其中所述一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。
20.根据权利要求19所述的复合物,其中所述一个或多个靶序列是STAT-3靶序列、程序性细胞死亡蛋白1(PDCD1)靶序列、程序性细胞死亡蛋白1(PDCD2)靶序列、Tet甲基胞嘧啶双加氧酶2(TET2)靶序列、PARG聚(ADP核糖)糖水解酶靶序列、T细胞受体α(TCR-a)靶序列、T细胞受体β(TCR-b)靶序列、血管内皮生长因子Aα(VEGFA-a)靶序列或血管内皮生长因子Aβ(VEGFA-b)靶序列。
21.根据权利要求14所述的复合物,其中所述一种或多种向导RNA包含SEQ IDNO:1、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的序列。
22.一种用于将基因编辑剂递送至细胞的复合物,所述复合物包含:
(i)双链硫代磷酸酯寡核苷酸;
(ii)第一基因编辑剂,所述第一基因编辑剂通过第一化学接头共价结合到第一硫代磷酸酯核酸;和
(ii)第二基因编辑剂,所述第二基因编辑剂通过第二化学接头共价结合到第二硫代磷酸酯核酸;
其中所述第一硫代磷酸酯核酸的至少一部分和所述第二硫代磷酸酯核酸的一部分彼此互补,并且其中所述第一硫代磷酸酯核酸的至少一部分与所述第二硫代磷酸酯核酸的至少一部分杂交,从而形成所述双链硫代磷酸酯寡核苷酸。
23.根据权利要求22所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。
24.根据权利要求22所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是Cas9、Cpf1或II类CRISPR核酸内切酶。
25.根据权利要求22所述的复合物,其中所述第一基因编辑剂是第一Cas9并且所述第二基因编辑剂是第二Cas9。
26.根据权利要求25所述的复合物,其中所述第一基因编辑剂和所述第二基因编辑剂独立地是核酸酶缺乏型的。
27.根据权利要求22所述的复合物,其中所述第一基因编辑剂包含第一半胱氨酸,并且所述第一硫代磷酸酯核酸包含第一硫醇部分,所述第一硫醇部分通过所述第一半胱氨酸和所述第一硫醇部分之间的二硫键共价结合到所述第一基因编辑剂。
28.根据权利要求22所述的复合物,其中所述第二基因编辑剂包含第二半胱氨酸,并且所述第二硫代磷酸酯核酸包含第二硫醇部分,所述第二硫醇部分通过所述第二半胱氨酸和所述第二硫醇部分之间的二硫键共价结合到所述第二基因编辑剂。
29.根据权利要求22所述的复合物,其中所述第一硫代磷酸酯核酸结合到所述第一基因编辑剂的C末端。
30.根据权利要求22所述的复合物,其中所述第二硫代磷酸酯核酸结合到所述第二基因编辑剂的C末端。
31.根据权利要求22所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是pH敏感性接头。
32.根据权利要求22所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是硫酯接头。
33.根据权利要求22所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸独立地是硫代磷酸酯脱氧核糖核酸或硫代磷酸酯核糖核酸。
34.根据权利要求22所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。
35.根据权利要求22所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10至约30个核酸残基。
36.根据权利要求22所述的复合物,所述复合物进一步包含一种或多种向导RNA,所述一种或多种向导RNA结合到所述第一基因编辑剂或所述第二基因编辑剂。
37.根据权利要求22所述的复合物,其中所述复合物形成细胞的一部分。
38.根据权利要求37所述的复合物,其中所述细胞是癌细胞或健康细胞。
39.根据权利要求37所述的复合物,其中所述细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。
40.根据权利要求37所述的复合物,其中所述细胞是胰腺癌细胞或卵巢癌细胞。
41.根据权利要求22所述的复合物,其中所述一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。
42.根据权利要求41所述的复合物,其中所述一个或多个靶序列是STAT-3靶序列、程序性细胞死亡蛋白1(PDCD1)靶序列、程序性细胞死亡蛋白1(PDCD2)靶序列、Tet甲基胞嘧啶双加氧酶2(TET2)靶序列、PARG聚(ADP核糖)糖水解酶靶序列、T细胞受体α(TCR-a)靶序列、T细胞受体β(TCR-b)靶序列、血管内皮生长因子Aα(VEGFA-a)靶序列或血管内皮生长因子Aβ(VEGFA-b)靶序列。
43.根据权利要求36所述的复合物,其中所述一种或多种向导RNA包含SEQ IDNO:1、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的序列。
44.一种用于将基因编辑剂递送至细胞的复合物,所述复合物包含:
(i)双链硫代磷酸酯寡核苷酸;
(ii)基因编辑剂,所述基因编辑剂通过第一化学接头共价结合到第一硫代磷酸酯核酸;和
(ii)靶向剂,所述靶向剂通过第二化学接头共价结合到第二硫代磷酸酯核酸;
其中所述第一硫代磷酸酯核酸的至少一部分和所述第二硫代磷酸酯核酸的一部分彼此互补;并且
其中所述第一硫代磷酸酯核酸的至少一部分与所述第二硫代磷酸酯核酸的至少一部分杂交,从而形成所述双链硫代磷酸酯寡核苷酸。
45.根据权利要求44所述的复合物,其中所述基因编辑剂是RNA向导的DNA核酸内切酶、转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶或Argonaut核酸内切酶。
46.根据权利要求44所述的复合物,其中所述基因编辑剂是Cas9、Cpf1或II类CRISPR核酸内切酶。
47.根据权利要求44所述的复合物,其中所述基因编辑剂是Cas9。
48.根据权利要求44所述的复合物,其中所述靶向剂是蛋白或核酸。
49.根据权利要求44所述的复合物,其中所述靶向剂是抗体。
50.根据权利要求44所述的复合物,其中所述靶向剂是癌症特异性抗体。
51.根据权利要求44所述的复合物,其中所述基因编辑剂是核酸酶缺乏型的。
52.根据权利要求44所述的复合物,其中所述基因编辑剂包含第一半胱氨酸,并且所述第一硫代磷酸酯核酸包含第一硫醇部分,所述第一硫醇部分通过所述第一半胱氨酸和所述第一硫醇部分之间的二硫键共价结合到所述基因编辑剂。
53.根据权利要求44所述的复合物,其中所述靶向剂包含第二半胱氨酸,并且所述第二硫代磷酸酯核酸包含第二硫醇部分,所述第二硫醇部分通过所述第二半胱氨酸和所述第二硫醇部分之间的二硫键共价结合到所述靶向剂。
54.根据权利要求44所述的复合物,其中所述第一硫代磷酸酯核酸结合到所述基因编辑剂的C末端。
55.根据权利要求44所述的复合物,其中所述第二硫代磷酸酯核酸独立地附着到所述靶向剂的赖氨酸、精氨酸、半胱氨酸或组氨酸。
56.根据权利要求44所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是pH敏感性接头。
57.根据权利要求44所述的复合物,其中所述第一化学接头和所述第二化学接头独立地是硫酯接头。
58.根据权利要求44所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸独立地是硫代磷酸酯脱氧核糖核酸或硫代磷酸酯核糖核酸。
59.根据权利要求44所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10、20、30、40、50、60、70、80、90、100或更多个核酸残基。
60.根据权利要求44所述的复合物,其中所述第一硫代磷酸酯核酸和所述第二硫代磷酸酯核酸在长度上独立地为约10至约30个核酸残基。
61.根据权利要求44所述的复合物,所述复合物进一步包含一种或多种向导RNA,所述一种或多种向导RNA结合到所述基因编辑剂。
62.根据权利要求44所述的复合物,其中所述复合物形成细胞的一部分。
63.根据权利要求62所述的复合物,其中所述细胞是癌细胞或健康细胞。
64.根据权利要求62所述的复合物,其中所述细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。
65.根据权利要求62所述的复合物,其中所述细胞是胰腺癌细胞或卵巢癌细胞。
66.根据权利要求44所述的复合物,其中所述一种或多种向导RNA与所述细胞中的一个或多个靶序列互补。
67.根据权利要求66所述的复合物,其中所述一个或多个靶序列是STAT-3靶序列、程序性细胞死亡蛋白1(PDCD1)靶序列、程序性细胞死亡蛋白1(PDCD2)靶序列、Tet甲基胞嘧啶双加氧酶2(TET2)靶序列、PARG聚(ADP核糖)糖水解酶靶序列、T细胞受体α(TCR-a)靶序列、T细胞受体β(TCR-b)靶序列、血管内皮生长因子Aα(VEGFA-a)靶序列或血管内皮生长因子Aβ(VEGFA-b)靶序列。
68.根据权利要求61所述的复合物,其中所述一种或多种向导RNA包含SEQ IDNO:1、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39或SEQ ID NO:40的序列。
69.一种药物组合物,所述药物组合物包含根据权利要求1、22或44中任一项所述的复合物和药学上可接受的赋形剂。
70.一种将基因编辑剂递送至细胞的方法,所述方法包含使细胞与权利要求1、22或44中任一项所述的复合物接触,从而将所述基因编辑剂递送至所述细胞。
71.根据权利要求70所述的方法,其中所述接触发生在体外或体内。
72.根据权利要求70所述的方法,其中所述细胞是癌细胞或健康细胞。
73.根据权利要求70所述的方法,其中所述细胞是T细胞、嵌合抗原受体(CAR)T细胞、自然杀伤(Nk)细胞、巨噬细胞、神经元细胞或造血干细胞。
74.根据权利要求70所述的方法,其中所述细胞是胰腺癌细胞或卵巢癌细胞。
CN202180060117.7A 2020-05-22 2021-05-21 包括dna编辑酶的硫代磷酸酯核酸偶联物 Pending CN116724115A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063029225P 2020-05-22 2020-05-22
US63/029,225 2020-05-22
PCT/US2021/033760 WO2021237160A2 (en) 2020-05-22 2021-05-21 Phosphorothioate nucleic acid conjugates including dna editing enzymes

Publications (1)

Publication Number Publication Date
CN116724115A true CN116724115A (zh) 2023-09-08

Family

ID=78707615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180060117.7A Pending CN116724115A (zh) 2020-05-22 2021-05-21 包括dna编辑酶的硫代磷酸酯核酸偶联物

Country Status (4)

Country Link
US (1) US20240110176A1 (zh)
EP (1) EP4153762A2 (zh)
CN (1) CN116724115A (zh)
WO (1) WO2021237160A2 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009143345A2 (en) * 2008-05-22 2009-11-26 University Of Massachusetts Nucleic acid silencing agent-protein conjugates and use thereof for treating hcv-related disorders
AU2014312031A1 (en) * 2013-08-29 2016-03-24 City Of Hope Cell penetrating conjugates and methods of use thereof
US20160362667A1 (en) * 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
US20210214724A1 (en) * 2017-10-23 2021-07-15 The Broad Institute, Inc. Novel nucleic acid modifiers

Also Published As

Publication number Publication date
WO2021237160A2 (en) 2021-11-25
US20240110176A1 (en) 2024-04-04
EP4153762A2 (en) 2023-03-29
WO2021237160A3 (en) 2022-02-17

Similar Documents

Publication Publication Date Title
JP6968389B2 (ja) Bcmaに結合するキメラ抗原受容体(car)及びその応用
JP7333104B2 (ja) B7-h3に対するモノクローナル抗体および細胞治療におけるその使用
CN103124740B (zh) 抗-ssx-2t细胞受体和相关材料及使用方法
KR20220019259A (ko) Una 아미다이트 및 이의 용도
WO2020108646A1 (en) Cd19-and psma-based combined car-t immunotherapy
KR102617818B1 (ko) 인간 t 세포 수용체 알파 불변 영역 유전자에 대한 특이성을 갖는 최적화된 조작된 뉴클레아제
WO2019047899A1 (zh) 通用型嵌合抗原受体t细胞制备技术
JP7178568B2 (ja) がんを治療するための癌胎児性抗原関連細胞接着分子6を標的とするcar免疫細胞
JP2022513668A (ja) キメラ抗原受容体ファクトリおよびその使用方法
CN111629715A (zh) 通过调节细胞活化状态改变体内免疫细胞的炎症状态
CN111655278A (zh) 免疫治疗性癌症控制中的混合谱系激酶结构域样蛋白
JP2022512941A (ja) 核酸送達のためのハイブリッド犠牲細胞透過性複合体
JP2024506550A (ja) 治療剤及び診断剤並びにその使用
EP4228601A1 (en) In vivo targeting of fibrosis by anti-cd5-targeted fap-car t mrna-lnp
IL303340A (en) Compositions and methods for administering nucleic acids to cells
JP2022535005A (ja) 抗bcma免疫療法によりがんを処置するための組成物および方法
WO2022095903A1 (zh) 靶向pd-1h(vista)的抗肿瘤免疫治疗方法
US20230265214A1 (en) Compositions and methods for delivery of nucleic acids to cells
CN111836630A (zh) 多特异性配体结合物
CN116724115A (zh) 包括dna编辑酶的硫代磷酸酯核酸偶联物
CN116635427A (zh) 嵌合抗原受体
JP2023512469A (ja) 癌療法におけるbcma特異的キメラ抗原受容体を発現する遺伝子改変t細胞及びその使用
JP2022544075A (ja) 改良された免疫療法のための細胞およびその使用
KR20220056847A (ko) 조작된 종양선택적 단백질 발현
CN114787181A (zh) 用抗pd-1/il-15免疫细胞因子靶向pd-1的新型免疫疗法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination