CN117043327A - 用cas酶进行多重编辑 - Google Patents

用cas酶进行多重编辑 Download PDF

Info

Publication number
CN117043327A
CN117043327A CN202280020320.6A CN202280020320A CN117043327A CN 117043327 A CN117043327 A CN 117043327A CN 202280020320 A CN202280020320 A CN 202280020320A CN 117043327 A CN117043327 A CN 117043327A
Authority
CN
China
Prior art keywords
sequence
rna
target
locus
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280020320.6A
Other languages
English (en)
Inventor
布莱恩·托马斯
克利斯多佛·布朗
奥德拉·德沃托
克里斯蒂娜·布特弗尔德
利萨·亚历山大
丹妮拉·S·A·戈尔茨曼
格雷格·科斯特
丽贝卡·拉莫特
迭戈·埃斯皮诺萨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Macrogenomics
Original Assignee
Macrogenomics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Macrogenomics filed Critical Macrogenomics
Priority claimed from PCT/US2022/021004 external-priority patent/WO2022198080A1/en
Publication of CN117043327A publication Critical patent/CN117043327A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文描述了用于使用Cas酶进行多重编辑或使用Cas酶编辑T细胞或相关细胞的方法、组合物和系统。

Description

用CAS酶进行多重编辑
相关申请交叉引用
本申请要求于2021年3月19日提交的题为“使用CAS酶进行多重编辑(MULTIPLEXEDITING WITH CAS ENZYMES)”的美国临时申请第63/163,510号的权益;于2021年5月10日提交的题为“使用CAS酶进行多重编辑(MULTIPLEX EDITING WITH CAS ENZYMES)”的美国临时申请第63/186,506号的权益;以及于2021年9月8日提交的题为“使用CAS酶进行多重编辑(MULTIPLEX EDITING WITH CAS ENZYMES)”的美国临时申请第63/241,916号的权益;所述美国临时申请中的每个美国临时申请通过引用整体并入本文。
序列表
本申请含有已经以ASCII格式电子提交的序列表,并且特此通过引用整体并入。创建于2022年3月17日的所述ASCII副本命名为55921-719-601-SL.txt并且大小为70,612字节。
背景技术
Cas酶以及其相关的成簇的规则间隔的短回文重复序列(CRISPR)向导核糖核酸(RNA)似乎是原核免疫系统的普遍组分(约45%的细菌,约84%的古细菌),用于通过CRISPR-RNA引导的核酸切割来保护此类微生物免受非自身核酸的侵害,如传染性病毒和质粒。虽然编码CRISPR RNA元件的脱氧核糖核酸(DNA)元件在结构和长度上可能相对保守,但其CRISPR相关(Cas)蛋白是高度多样化的,含有多种核酸相互作用结构域。虽然早在1987年就观察到CRISPR DNA元件,但CRISPR/Cas复合物的可编程核酸内切酶切割能力直到最近才被认识到,从而引起重组CRISPR/Cas系统在各种DNA操纵和基因编辑应用中的使用。
发明内容
在一些方面,本公开提供了一种编辑细胞内的两个或更多个基因座的方法,所述方法包括使以下与所述细胞接触:(a)2类II型Cas核酸内切酶复合物,所述2类II型Cas核酸内切酶复合物包括:(i)2类II型Cas核酸内切酶;以及(ii)第一工程化向导RNA,所述第一工程化向导RNA包括:RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第一组一个或多个靶基因座杂交;(b)2类V型Cas核酸内切酶复合物,所述2类V型Cas核酸内切酶复合物包括:(i)2类V型Cas核酸内切酶;以及(ii)第二工程化向导RNA,所述第二工程化向导RNA包括:RNA序列,所述RNA序列被配置成与所述2类V型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第二组一个或多个靶基因座杂交。在一些实施例中,所述2类II型Cas核酸内切酶不是Cas9核酸内切酶。在一些实施例中,所述2类II型Cas核酸内切酶是Cas12a核酸内切酶。在一些实施例中,所述2类II型Cas核酸内切酶包括与SEQ ID NO:1或4中的任一个或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ IDNO:7或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个具有至少80%、85%、90%或95%序列同一性的序列。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率编辑所述第一基因座的基因组序列,和/或以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率编辑所述第二基因座的基因组序列。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶以200pmol或更低、100pmol或更低、50pmol或更低、25pmol或更低、5pmol或更低或1pmol或更低的浓度引入。在一些实施例中,所述细胞内的脱靶位点以小于0.2%的频率被破坏,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,所述细胞内的脱靶位点以小于0.01%的频率被破坏,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括T细胞受体(TCR)基因座。在一些实施例中,被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:10-15中的任一个、其补体或其反向补体具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性。在一些实施例中,所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括白蛋白(ALB)基因座。在一些实施例中,被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:17-19中的任一个、其补体或其反向补体具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性。在一些实施例中,所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括核受体亚家族3C组成员1(NR3C1)基因座。在一些实施例中,被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:16、20、21或22中的任一个、其补体或其反向补体具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性。在一些实施例中,所述方法进一步包括将包括以下的供体DNA序列引入到所述细胞:编码异源工程化T细胞受体分子的开放阅读框、包括位于所述第一组一个或多个靶基因座的第一侧的DNA序列的第一同源臂和包括位于所述第一组一个或多个靶基因座的第二侧的DNA序列的第二同源臂。在一些实施例中,编辑包括插入插入和缺失(indel)、提前终止密码子、错义密码子、移码突变、腺嘌呤脱氨基化、胞嘧啶脱氨基化或其任何组合。
在一些方面,本公开提供了一种制备糖皮质激素抵抗性工程化T细胞的方法,所述方法包括将以下引入到T细胞或其前体:(a)靶向T细胞受体(TCR)基因座的RNA引导的核酸内切酶复合物,所述RNA引导的核酸内切酶复合物包括:(i)第一RNA引导的核酸内切酶或编码所述第一RNA引导的核酸内切酶的DNA;以及(ii)第一工程化向导RNA,所述第一工程化向导RNA包括RNA序列,所述RNA序列被配置成与所述第一RNA引导的核酸内切酶形成复合物,以及第一间隔子序列,所述第一间隔子序列被配置成与所述TCR基因座的至少一部分杂交;以及(b)靶向T细胞受体核受体亚家族3C组成员1(NR3C1)基因座的RNA引导的核酸内切酶复合物,所述RNA引导的核酸内切酶复合物包括:(i)第二RNA引导的核酸内切酶;以及(ii)第二工程化向导RNA,所述第二工程化向导RNA包括:RNA序列,所述RNA序列被配置成与所述第二RNA引导的核酸内切酶形成复合物,以及第二间隔子序列,所述第二间隔子序列被配置成与所述NR3C1基因座的至少一部分杂交。在一些实施例中,所述TCR基因座的所述至少一部分位于所述T细胞基因座内。在一些实施例中,所述方法进一步包括将(b)包括以下的供体DNA序列引入到所述细胞:编码异源工程化T细胞受体分子的开放阅读框、包括位于所述靶序列的第一侧的DNA序列的第一同源臂和包括位于所述TCR基因座内的所述靶序列的第二侧的DNA序列的第二同源臂。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶包括2类II型或2类V型Cas核酸内切酶。在一些实施例中,所述第一RNA引导的核酸内切酶包括所述2类II型Cas核酸内切酶,并且所述第二RNA引导的核酸内切酶包括所述2类V型Cas核酸内切酶。在一些实施例中,所述第二RNA引导的核酸内切酶包括所述2类II型Cas核酸内切酶,并且所述第一RNA引导的核酸内切酶包括所述2类V型Cas核酸内切酶。在一些实施例中,所述异源工程化T细胞受体是CAR分子。在一些实施例中,所述T细胞受体基因座的所述至少一部分是T细胞受体α常数(TRAC)基因座或T细胞受体β常数(TRBC)基因座。在一些实施例中,所述同源臂包括所述TCR基因座内的接近所述T细胞受体基因座的所述至少一部分的内含子区或外显子区。在一些实施例中,所述T细胞受体基因座的所述至少一部分是TRAC的第一或第三外显子。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率破坏所述TCR基因座和所述NR3C1基因座的基因组序列。在一些实施例中,所述效率是针对从所述TCR和NR3C1基因座表达的蛋白质通过流式细胞术测定的。在一些实施例中,所述NR3C1基因座的所述至少一部分是外显子2或外显子3。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率产生对CAR分子呈阳性并且对NR3C1呈阴性的细胞。在一些实施例中,所述方法进一步包括将(a)至(c)同时引入到所述T细胞或其前体。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶包括与SEQ ID NO:1、4或7中的任一个或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个、其补体或其反向补体具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶以100pmol或更低、50pmol或更低、25pmol或更低、5pmol或更低或1pmol或更低的浓度存在。在一些实施例中,所述T细胞或所述其前体包括T细胞、造血干细胞(HSC)或外周血单核细胞(PBMC)。在一些实施例中,所述第二间隔子序列包括与SEQ IDNO:16、20、21或22中的任一个、其补体或其反向补体具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,所述第一或所述第二间隔子序列包括至少约19至24个核苷酸、至少约19个核苷酸、至少约20个核苷酸、至少约22个核苷酸或至少约24个核苷酸。在一些实施例中,所述供体DNA序列在病毒载体中递送。在一些实施例中,所述病毒载体是AAV或AAV-6载体。
在一些方面,本公开提供了用于糖皮质激素抵抗性T细胞或其前体的群体,包括:(a)TCR基因座内的在SEQ ID NO:10-15中的任一个的杂交区的100个、75个、50个、25个或10个核苷酸内的异源序列。在一些实施例中,所述T细胞或其前体进一步包括(b)包含插入和缺失的NR3C1基因座。在一些实施例中,所述异源序列是插入和缺失。在一些实施例中,所述异源序列包括开放阅读框,所述开放阅读框包括编码异源T细胞受体或CAR分子的核苷酸序列。在一些实施例中,所述NR3C1基因座包括SEQ ID NO:16、20、21或22中的任一个的杂交区的100个、75个、50个、25个或10个核苷酸内的插入和缺失。在一些实施例中,少于0.2%的所述细胞在脱靶基因座处具有插入和缺失,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,少于0.01%的所述细胞在脱靶基因座处具有插入和缺失,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,所述细胞群体基本上没有染色体易位。
在一些方面,本公开提供了一种编辑细胞内的两个或更多个基因座的方法,所述方法包括使以下与所述细胞接触:(a)第一Cas核酸内切酶复合物,所述第一Cas核酸内切酶复合物包括:(i)第一Cas核酸内切酶;以及(ii)一种或多种工程化向导RNA,包括:RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第一靶序列杂交;(b)第二Cas核酸内切酶复合物,所述第二Cas核酸内切酶复合物包括:(i)第二Cas核酸内切酶;以及(ii)一种或多种工程化向导RNA,包括:RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第二靶序列杂交。在一些实施例中,所述方法进一步包括将以下引入到所述细胞:(c)第一供体DNA序列,所述第一供体DNA序列包括编码第一转基因的开放阅读框、包括位于所述第一靶序列的5'侧的DNA序列的5'同源臂和包括位于所述第一靶序列的3'侧的DNA序列的3'同源臂;以及(d)第二供体DNA序列,所述第二供体DNA序列包括编码第二转基因的开放阅读框、包括位于所述第二靶序列的5'侧的DNA序列的5'同源臂和包括位于所述第二靶序列的3'侧的DNA序列的3'同源臂。在一些实施例中,所述第一转基因和所述第二转基因是不同的。在一些实施例中,所述第一靶序列或所述第二靶序列是T细胞受体基因座内的靶序列、TRAC内的靶序列、TRBC内的靶序列、NR3C1内的靶序列或AAVS1基因座内的靶序列或其任何组合。在一些实施例中,所述第一或第二转基因是GR的α、β、α-D3或β-D3同种型、CAR分子、截短的低亲和力神经生长因子受体(tLNGFR)序列、上皮生长因子受体的截短版本(tEGFR)、GFP编码序列或其任何组合。在一些实施例中,包括位于所述第一靶序列的5'侧的DNA序列的所述5'同源臂或包括位于所述第二靶序列的5'侧的DNA序列的所述5'同源臂包括SEQ ID NO:42或23或与其具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,包括位于所述第一靶序列的5'侧的DNA序列的所述3'同源臂或包括位于所述第二靶序列的5'侧的DNA序列的所述3'同源臂包括SEQ ID NO:43或24或与其具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,所述第一或所述第二2类II型Cas核酸内切酶包括与SEQ ID NO:1或4中的任一个或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个、其补体或其反向补体具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,被配置成与所述第一靶序列杂交的所述间隔子序列或被配置成与所述第二靶序列杂交的所述间隔子序列与SEQ ID NO:16、20、21、22或41中的任一个、或其补体、其补体或其反向补体具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性。在一些实施例中,所述第一或所述第二核酸内切酶包括2类II型Cas核酸内切酶或2类V型Cas核酸内切酶,或其任何组合。
在一些方面,本公开提供了一种分离的核酸,其包括SEQ ID NO:63-65中的任一个的序列,或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。
在一些方面,本公开提供了一种分离的核酸,其包括本文描述的任何序列、其补体或其反向补体。在一些实施例中,所述分离的核酸是向导RNA。
在一些方面,本公开提供了一种细胞,其包括本文所描述的核酸中的任何核酸。在一些实施例中,所述细胞是T细胞或其前体。在一些实施例中,所述T细胞或其前体包括T细胞、造血干细胞(HSC)或外周血单核细胞(PBMC)。
在一些实施例中,本公开提供了一种载体,其包括本文所描述的核酸中的任何核酸。在一些实施例中,所述载体是腺相关病毒(AAV)载体。在一些实施例中,所述AAV载体是AAV-6血清型载体。
在一些方面,本公开提供了一种载体,其包括与SEQ ID NO:23、24、42或43中的任一个具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,所述载体进一步包括转基因,所述转基因侧接有与SEQ ID NO:23、24、42或43中的任一个具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的所述序列。在一些实施例中,所述转基因包括GR的α、β、α-D3或β-D3同种型、CAR分子、截短的低亲和力神经生长因子受体(tLNGFR)序列、上皮生长因子受体的截短版本(tEGFR)、GFP编码序列或其任何组合。在一些实施例中,所述载体进一步包括SEQ ID NO:63或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的变体的tEGFR编码序列。在一些实施例中,所述载体包括SEQ ID NO:64或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的变体的tLNGFR编码序列。在一些实施例中,所述载体进一步包括SEQ ID NO:63或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的变体的MND启动子。在一些实施例中,所述载体进一步包括SEQ ID NO:64或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的变体的MSCV启动子。
在一些方面,本公开提供了一种编辑细胞内的两个或更多个基因座的方法,所述方法包括使所述细胞接触或使以下与所述细胞接触:(a)2类II型Cas核酸内切酶复合物或多核苷酸,所述2类II型Cas核酸内切酶复合物包括或所述多核苷酸编码:(i)2类II型Cas核酸内切酶;以及(ii)一种或多种工程化向导RNA,包括:RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第一组一个或多个靶基因座杂交。在一些实施例中,所述方法进一步包括使所述细胞接触或使以下与所述细胞接触:(b)2类V型Cas核酸内切酶复合物,所述2类V型Cas核酸内切酶复合物包括:(i)2类V型Cas核酸内切酶;以及(ii)一种或多种工程化向导RNA,包括:RNA序列,所述RNA序列被配置成与所述2类V型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第二组一个或多个靶基因座杂交。在一些实施例中,所述2类II型Cas核酸内切酶不是Cas9核酸内切酶。在一些实施例中,2类II型Cas核酸内切酶是Cas12a核酸内切酶。在一些实施例中,所述2类II型Cas核酸内切酶包括与SEQ ID NO:1或4中的任一个或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ IDNO:7或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个或其补体具有至少80%、85%、90%或95%的序列。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率编辑所述第一基因座的基因组序列,和/或以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率编辑所述第二基因座的基因组序列。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶以200pmol或更低、100pmol或更低、50pmol或更低、25pmol或更低、5pmol或更低或1pmol或更低的浓度引入。在一些实施例中,所述细胞内的脱靶位点以小于0.2%的频率被破坏,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,所述细胞内的脱靶位点以小于0.01%的频率被破坏,如通过全基因组脱靶双链断裂测定的。在一些实施例中,所述全基因组脱靶双链断裂分析包括HTGTS测定(高通量全基因组易位测序(high-throughput,genome-widetranslocation sequencing);参见例如Chiarle等人《细胞(Cell)》2011年9月30;147(1):107-19.doi:10.1016/j.cell.2011.07.049,所述文献出于所有目的通过引用明确并入本文)、LAM-HTGTS测定(线性扩增介导的高通量全基因组测序(linear amplificationmediated high-throughput genome-wide sequencing);参见例如Hu等人《自然实验室指南(Nat Protoc.)》2016.11(5):853-71.doi:10.1038/nprot.2016.043,所述文献出于所有目的通过引用明确并入本文)或Digenome-Seq(体外Cas消化全基因组测序(in vitro Cas-digested whole genome sequencing);参见例如Kim等人《自然方法(Nat Methods.)》2015.12(3):237-43.doi:10.1038/nmeth.3284,所述文献出于所有目的通过引用明确并入本文)测定。在一些实施例中,所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括T细胞受体(TCR)基因座。在一些实施例中,被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:10-15中的任一个或其补体具有至少80%、85%、90%或95%序列同一性。在一些实施例中,所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括核受体亚家族3C组成员1(NR3C1)基因座。在一些实施例中,被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:16、20、21或22中的任一个或其补体具有至少80%、85%、90%或95%序列同一性。在一些实施例中,所述方法进一步包括将包括以下的供体DNA序列引入到所述细胞:编码异源工程化T细胞受体分子的开放阅读框、包括位于所述第一组一个或多个靶基因座的第一侧的DNA序列的第一同源臂和包括位于所述第一组一个或多个靶基因座的第二侧的DNA序列的第二同源臂。在一些实施例中,编辑包括插入插入和缺失、提前终止密码子、错义密码子、移码突变、腺嘌呤脱氨基化、胞嘧啶脱氨基化或其任何组合。
在一些方面,本公开提供了一种制备糖皮质激素抵抗性工程化T细胞的方法,所述方法包括将以下引入到T细胞或其前体:(a)靶向T细胞受体(TCR)基因座的RNA引导的核酸内切酶复合物或多核苷酸,所述RNA引导的核酸内切酶复合物包括或所述多核苷酸编码:(i)第一RNA引导的核酸内切酶或编码所述第一RNA引导的核酸内切酶的DNA;以及(ii)第一工程化向导RNA,所述第一工程化向导RNA包括RNA序列,所述RNA序列被配置成与所述第一RNA引导的核酸内切酶形成复合物,以及第一间隔子序列,所述第一间隔子序列被配置成与所述TCR基因座的至少一部分杂交;以及(b)靶向T细胞受体核受体亚家族3C组成员1(NR3C1)基因座的RNA引导的核酸内切酶复合物或多核苷酸,所述RNA引导的核酸内切酶复合物包括或所述多核苷酸编码:(i)第二RNA引导的核酸内切酶;以及(ii)第二工程化向导RNA,所述第二工程化向导RNA包括:RNA序列,所述RNA序列被配置成与所述第二RNA引导的核酸内切酶形成复合物,以及第二间隔子序列,所述第二间隔子序列被配置成与所述NR3C1基因座的至少一部分杂交。在一些实施例中,所述TCR基因座的所述至少一部分位于所述T细胞基因座内。在一些实施例中,所述方法进一步包括将(b)包括以下的供体DNA序列引入到所述细胞:编码异源工程化T细胞受体分子的开放阅读框、包括位于所述靶序列的第一侧的DNA序列的第一同源臂和包括位于所述TCR基因座内的所述靶序列的第二侧的DNA序列的第二同源臂。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶包括2类II型或2类V型Cas核酸内切酶。在一些实施例中,所述第一RNA引导的核酸内切酶包括所述2类II型Cas核酸内切酶,并且所述第二RNA引导的核酸内切酶包括所述2类V型Cas核酸内切酶。在一些实施例中,所述第二RNA引导的核酸内切酶包括所述2类II型Cas核酸内切酶,并且所述第一RNA引导的核酸内切酶包括所述2类V型Cas核酸内切酶。在一些实施例中,所述异源工程化T细胞受体是CAR分子。在一些实施例中,所述T细胞受体基因座的所述至少一部分是T细胞受体α常数(TRAC)基因座或T细胞受体β常数(TRBC)基因座。在一些实施例中,所述同源臂包括所述TCR基因座内的接近所述T细胞受体基因座的所述至少一部分的内含子区或外显子区。在一些实施例中,所述T细胞受体基因座的所述至少一部分是TRAC的第一或第三外显子。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率破坏所述TCR基因座和所述NR3C1基因座的基因组序列。在一些实施例中,所述效率是针对从所述TCR和NR3C1基因座表达的蛋白质通过流式细胞术测定的。在一些实施例中,所述NR3C1基因座的所述至少一部分是外显子2或外显子3。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率产生对CAR分子呈阳性并且对NR3C1呈阴性的细胞。在一些实施例中,所述方法包括将(a)至(c)同时引入到所述T细胞或其前体。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶包括与SEQ ID NO:1、4或7中的任一个具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ IDNO:3、6或9中的任一个或其补体具有至少80%、85%、90%或95%序列同一性的序列。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶以100pmol或更低、50pmol或更低、25pmol或更低、5pmol或更低或1pmol或更低的浓度存在。在一些实施例中,所述T细胞或所述其前体包括T细胞、造血干细胞(HSC)或外周血单核细胞(PBMC)。在一些实施例中,所述第二间隔子序列包括与SEQ ID NO:16、20、21或22中的任一个或其补体具有至少80%、85%、90%或95%序列同一性的序列。在一些实施例中,所述第一或所述第二间隔子序列包括至少约19至24个核苷酸、至少约19个核苷酸、至少约20个核苷酸、至少约22个核苷酸或至少约24个核苷酸。在一些实施例中,所述供体DNA序列在病毒载体中递送。在一些实施例中,所述病毒载体是AAV或AAV-6载体。
在一些方面,本公开提供了T细胞群体,包括:(a)TCR基因座内的在SEQ ID NO:10-15中的任一个的杂交区的100个、75个、50个、25个或10个核苷酸内的异源序列或在SEQ IDNO:42的杂交区的100个、75个、50个、25个或10个核苷酸内的异源序列。在一些实施例中,所述T细胞进一步包括(b)包含插入和缺失的NR3C1基因座。在一些实施例中,所述NR3C1基因座中的所述插入和缺失赋予所述T细胞糖皮质激素抗性。在所述异源序列的杂交区的100个、75个、50个、25个或10个核苷酸内的异源序列是插入和缺失。在一些实施例中,所述异源序列包括开放阅读框,所述开放阅读框包括编码异源T细胞受体或CAR分子的核苷酸序列。在一些实施例中,所述NR3C1基因座包括SEQ ID NO:16、20、21或22中的任一个的杂交区的100个、75个、50个、25个或10个核苷酸内的插入和缺失。在一些实施例中,少于0.2%在脱靶基因座处具有插入和缺失,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,少于0.01%在脱靶基因座处具有插入和缺失,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,所述细胞群体基本上没有染色体易位。
在一些方面,本公开提供了一种编辑细胞内的两个或更多个基因座的方法,所述方法包括使以下与所述细胞接触:(a)第一Cas核酸内切酶复合物或多核苷酸,所述第一Cas核酸内切酶复合物包括或所述多核苷酸编码:(i)第一Cas核酸内切酶;以及(ii)一种或多种工程化向导RNA,包括:RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第一靶序列杂交;(b)第二Cas核酸内切酶复合物,所述第二Cas核酸内切酶复合物包括:(i)第二Cas核酸内切酶;以及(ii)一种或多种工程化向导RNA,包括:RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第二靶序列杂交。在一些实施例中,所述方法进一步包括将以下引入到所述细胞:(c)第一供体DNA序列,所述第一供体DNA序列包括编码第一转基因的开放阅读框、包括位于所述第一靶序列的5'侧的DNA序列的5'同源臂和包括位于所述第一靶序列的3'侧的DNA序列的3'同源臂;以及(d)第二供体DNA序列,所述第二供体DNA序列包括编码第二转基因的开放阅读框、包括位于所述第二靶序列的5'侧的DNA序列的5'同源臂和包括位于所述第二靶序列的3'侧的DNA序列的3'同源臂。在一些实施例中,所述第二转基因是不同的。在一些实施例中,所述第一靶序列或所述第二靶序列是T细胞受体基因座内的靶序列、TRAC内的靶序列、TRBC内的靶序列、NR3C1内的靶序列或AAVS1基因座内的靶序列或其任何组合。在一些实施例中,所述第一或第二转基因是GR的α、β、α-D3或β-D3同种型、CAR分子或其任何组合。在一些实施例中,包括位于所述第一靶序列的5'侧的DNA序列的所述5'同源臂或包括位于所述第二靶序列的5'侧的DNA序列的所述5'同源臂包括SEQ ID NO:42或23。在一些实施例中,包括位于所述第一靶序列的5'侧的DNA序列的所述3'同源臂或包括位于所述第二靶序列的5'侧的DNA序列的所述3'同源臂包括SEQ ID NO:43或24。在一些实施例中,所述第一或所述第二2类II型Cas核酸内切酶包括与SEQ ID NO:1或4中的任一个或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个或其补体具有至少80%、85%、90%或95%序列同一性的序列。在一些实施例中,被配置成与所述第一靶序列杂交的所述间隔子序列或被配置成与所述第二靶序列杂交的所述间隔子序列与SEQ ID NO:16、20、21、22或41中的任一个或其补体具有至少80%、85%、90%或95%序列同一性。在一些实施例中,所述第一或所述第二核酸内切酶包括2类II型Cas核酸内切酶或2类V型Cas核酸内切酶,或其任何组合。
根据以下具体实施方式,本领域的技术人员将显而易知本公开的额外方面和优势,在具体实施方式中仅示出和描述本公开的说明性实施例。如将认识到,本公开能够具有其它不同的实施例,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开。因此,附图和说明书本质上被视为是说明性的而非限制性的。
通过引用并入
本说明书中所提到的所有公开、专利和专利申请均通过相同的程度引用结合在此,如同特定且单独地指示每个单独的公开、专利或专利申请是通过引用并入的。
附图说明
本发明的新颖特征在所附权利要求书中具体阐述。通过参考阐述了说明性实施例的以下详细说明,将获得对本发明的特征和优点的更好理解,在所述实施例中利用了本发明的原理,并且在其附图中:
图1描绘了用于使用本文所述的Cas核酸内切酶与递送CAR-T供体序列的AAV载体的组合产生同种异体CAR-T细胞的方案。
图2描绘了实例1中的实验的结果,所述实验测试了含有靶向TRAC的向导RNA的MG3-6、MG3-8和MG29-1 RNP以及Cas9对照在TRAC中实现的插入和缺失形成。左图指示通过下一代测序(NGS)测量的插入和缺失形成百分比,而右图指示通过流式细胞术评估的细胞表型(TCR+或TCR-)。
图3描绘了实例1中的实验结果,所述实验使用本文所述的靶向TRAC的RNP核酸酶复合物与含有CAR-T序列的AAV供体载体的组合测试了所靶向的CAR-T整合。示出了流式细胞术图,所述流式细胞术图示出了TCR表达状态(TCR-或TCR+,x轴)以及CAR抗原结合结构域的表达(y轴)。对于所有MG3-6、MG3-8和MG29-1,获得了类似的结果。
图4描绘了如实例2中所述的使用MG3-6和MG29-1 RNP复合物的组合对两个基因座(一个是TRAC)进行的多重编辑。
图5描绘了如实例2中所述的使用MG3-6和MG29-1 RNP复合物的组合对三个基因座(一个是TRAC)进行的多重编辑。
图6示出了如实例3中的用于测试GR转基因到AAVS1基因座中的整合的PCR实验的设计(A)或琼脂糖凝胶照片(B和C),所述琼脂糖凝胶照片描绘了如实例3中的在暴露于靶向每个位点的单独供体DNA的同时使用不同Cas酶同时靶向AAVS1和TRAC基因座的实验的结果。(B)描绘了GR转基因从T细胞暴露于以下的任一条件进行的扩增:携带GR转基因的AAV构建体(泳道2-5)、GR转基因AAV构建体/靶向AAVS1的SpCas9/靶向TRAC的MG3-6/CAR转基因AAV(泳道6-9)构建体或GR AAV构建体/仅感染复数(MOI)为25K的靶向AAVS1的SpCas9(泳道10-13)。(C)描绘了GR转基因从T细胞暴露于以下的任一条件进行的扩增:测定对照(模拟转染或没有转基因的Cas复合物;泳道2-4)、MOI为50K的GR AAV构建体/仅靶向AAVS1的SpCas9(泳道5-8)或MOI为100K的GR AAV构建体/仅感染复数(MOI)为50K的靶向AAVS1的SpCas9(泳道9-12)。结果表明,无论是否靶向另外的TRAC基因座,GR转基因都以类似的效率整合到AAVS1基因座中。
图7描绘了流式细胞术图,所述流式细胞术图描绘了如实例3中的如实例3中的在暴露于靶向每个位点的单独供体DNA的同时使用不同Cas酶同时靶向AAVS1和TRAC基因座的实验的结果。示出了单独的图(A-D),其中携带每个GR转基因的AAV与靶向AAVS1的SpCas9复合物、靶向TRAC的MG3-6复合物和携带CAR的AAV一起引入到T细胞。结果表明,对于所有GR转基因,TCR敲除和CAR整合的效率类似,并且即使同时靶向AAVS1基因座,效率也很高(效率为51.31%-61.1%)。
图8描绘了如实例4中的用于评估MG3-6、MG3-8和MG29-1核酸内切酶以及SpCas9(“Cas9”)的脱靶特异性的全基因组脱靶双链断裂分析测定的结果。
图9描绘了制备活性全TCR的δ链、γ链和ε链的组装。
图10示出如实例5中所述的在原代T细胞中进行的多重TRAC/TRBC编辑,如通过含有插入和缺失的所靶向基因座处的序列的百分比来评估的。结果表明,当同时靶向两个位点时,两个位点出都存在高频破坏。
图11描绘了实例6中描述的单基因敲除实验的通过流式细胞术得到的基因编辑结果。示出了条形图,所述条形图展示了含有评估TCR和B2M敲除的4种表型(TCR-B2M-DKO、TCR-B2M+、TCR+B2M-和TCR+B2M+)中的每种表型的被分析细胞的百分比。所述图表明:(a)所有TCR靶向条件都高效地产生TCR敲除,其中MG3-6 TRAC6和MG3-6 TRBC E2 sgRNA产生最高效的TCR敲除;并且(b)所有B2M靶向条件都产生B2M敲除,其中B2M H1和B2M D2产生最高效的B2M敲除。
图12描绘了实例7中描述的双基因敲除实验的通过流式细胞术得到的基因编辑结果,所述实验使用实例6中的B2M和TRAC条件,但组合使用。示出了条形图,所述条形图展示了含有评估TCR和B2M敲除的4种表型(TCR-B2M-DKO、TCR-B2M+、TCR+B2M-和TCR+B2M+)中的每种表型的被分析细胞的百分比。所述图表明,最高效的双重靶向条件是A4、B4和C4,其涉及MG3-6 TRAC6条件和MG29-1 B2M H1、D2或A3条件。最高效的双重靶向条件似乎是B4,其使用MG3-6 TRAC6 sgRNA和MG29-1 B2M D2sgRNA。
图13描绘了实例8中描述的三重基因敲除实验的通过流式细胞术得到的基因编辑结果,所述实验使用实例6中的B2M、TRAC和TRBC条件,但组合使用。
图14描绘了实例8中描述的三重基因敲除实验在DNA水平下的基因编辑结果,所述实验使用实例6的B2M、TRAC和TRBC条件,但组合使用。
图15描绘了实例8中描述的三重基因敲除实验的通过下一代测序(NGS)测定的基因编辑结果的分析。
图16描绘了实例9中描述的实验在T细胞中蛋白质水平下的基因编辑结果。示出了条形图,所述条形图指示了对GFP/tEGFR、tLNGFR、双重靶向整合(GFP/tLNGFR)、双重靶向整合(tEGFR/tLNGFR)或TCR呈阳性的T细胞的百分比(%),如使用实例9中所述的核酸酶、向导和AAV的组合通过荧光激活细胞分选(FACS)测定的。
图17描绘了实例10中描述的实验的AAVS1位点和TRAC基因座在T细胞中的DNA水平下的基因编辑结果。示出了使用实例10中描述的条件通过下一代测序(因美纳MiSeq(Illumina MiSeq))检测到的序列的百分比的条形图,其中在AAVS1基因座处检测到至少一个插入和缺失(插入和缺失%)。
具体实施方式
虽然本文中已经示出并描述了本发明的各种实施例,但是对于本领域的技术人员显而易见的是,这些实施例仅作为实例提供。在不脱离本发明的情况下,本领域技术人员可以想到多种变化、改变和替换。应当理解,可以采用本文所述的本发明实施例的各种替代方案。
除非另有指示,否则本文所公开的一些方法的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的技术。参见例如,Sambrook和Green等人,《分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual)》,第4版(2012);丛书《当代分子生物学实验指南(Current Protocols in Molecular Biology)》(F.M.Ausubel等人编辑);丛书《酶学方法(Methods In Enzymology)》(学术出版社公司(Academic Press,Inc.)),《PCR 2:实用方法(PCR 2:APractical Approach)》(M.J.MacPherson,B.D.Hames和G.R.Taylor编辑(1995)),Harlow和Lane编辑(1988)《抗体:实验室手册(Antibodies,A Laboratory Manual)》以及《动物细胞培养:基础技术和专门应用手册(Culture of Animal Cells:A Manual of Basic Technique and SpecializedApplications)》,第6版(R.I.Freshney编辑(2010))(所述文献通过引用整体并入本文)。
如本文所使用的,除非上下文另外清楚地指示,否则单数形式“一个/一种(a/an)”和“所述”也旨在包含复数形式。此外,在详细描述和/或权利要求中使用术语“包含(including)”、“包含(include)”、“具有(having)”、“具有(has)”、“具有(with)”或其变体的情况下,这种术语旨在以类似于术语“包括(comprising)”的方式是包含性的。
术语“约(about)”或“大约(approximately)”意指在如由本领域普通技术人员确定的特定值的可接受误差范围内,这将部分地取决于值是如何测量或测定的,即,测量系统的局限性。例如,“约”可以意指按照本领域的实践在一个或超过一个标准差内。可替代地,“约”可以意指给定值的至多20%、至多15%、至多10%、至多5%或至多1%的范围。
如本文所使用的,“细胞”通常是指生物细胞。细胞可以是活生物体的基本结构、功能和/或生物单位。细胞可以源自具有一个或多个细胞的任何生物体。一些非限制性实例包含:原核细胞、真核细胞、细菌细胞、古细菌细胞,单细胞真核生物的细胞、原生动物细胞、来自植物(例如来自种植农作物、水果、蔬菜、谷物、大豆、玉米、玉蜀黍、小麦、种子、西红柿、大米、木薯、甘蔗、南瓜、干草、土豆、棉花、大麻、烟草、开花植物、针叶树、裸子植物、蕨类植物、石松、金鱼藻、地钱、苔藓的细胞)的细胞、藻细胞(例如,布朗葡萄藻(Botryococcusbraunii)、莱茵衣藻(Chlamydomonas reinhardti)、拟微球藻(Nannochloropsisgaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、C.Agardh展枝马尾藻(Sargassumpatens C.Agardh)等)、海藻(例如海带)、真菌细胞(例如酵母细胞,来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如鱼、两栖动物、爬行动物、鸟、哺乳动物)的细胞、来自哺乳动物(例如猪、牛、山羊、绵羊、啮齿动物、大鼠、小鼠、非人灵长类动物、人等)的细胞等。有时,细胞并非源自天然生物体(例如,细胞可以是合成制造的,有时称为人工细胞)。
如本文所使用的,术语“核苷酸”通常是指碱基-糖-磷酸组合。核苷酸可以包括合成核苷酸。核苷酸可以是核酸序列(例如脱氧核糖核酸(DNA)和核糖核酸(RNA))的单体单元。术语核苷酸可以包含核糖核苷三磷酸、腺苷三磷酸(ATP)、尿苷三磷酸(UTP)、胞嘧啶三磷酸(CTP)、鸟苷三磷酸(GTP)和脱氧核糖核苷三磷酸如dATP、dCTP、dITP、dUTP、dGTP、dTTP或其衍生物。此类衍生物可以包含例如[αS]dATP、7-脱氮-dGTP和7-脱氮-dATP,以及赋予含有它们的核酸分子核酸酶抗性的核苷酸衍生物。如本文所使用的,术语核苷酸可以是指双脱氧核糖核苷三磷酸(ddNTP)和其衍生物。双脱氧核糖核苷三磷酸的说明性实例可以包含但不限于:ddATP、ddCTP、ddGTP、ddITP和ddTTP。核苷酸可以是未标记的或可检测标记的,如使用包括光学可检测部分(例如荧光团)的部分。也可以用量子点进行标记。可检测标记可以包含例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可以包含但不限于荧光素、5-羧基荧光素(FAM)、2'7'-二甲氧基-4'5-二氯-6-羧基荧光素(JOE)、罗丹明、6-羧基罗丹明(R6G)、N,N,N',N'-四甲基-6-羧基罗丹明(TAMRA)、6-羧基-X-罗丹明(ROX)、4-(4'二甲氨基苯偶氮基)苯甲酸(DABCYL)、瀑布蓝、俄勒冈绿、德克萨斯红、青色素和5-(2'-氨乙基)氨基萘-1-磺酸(EDANS)。荧光标记的核苷酸的具体实例可以包含可从加利福尼亚州福斯特市的铂金埃尔默公司(Perkin Elmer,Foster City,Calif)获得的[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP和[dROX]ddTTP;可从伊利诺伊州阿灵顿高地的安玛西亚公司(Amersham,Arlington Heights,Il.)获得的FluoroLink脱氧核苷酸、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP和FluoroLink Cy5-dUTP;可从印第安纳州印第安纳波利斯的宝灵曼公司(BoehringerMannheim,Indianapolis,Ind.)获得的荧光素-15-dATP、荧光素-12-dUTP、四甲基-罗丹明-6-dUTP、IR770-9-dATP、荧光素-12-ddUTP、荧光素-12-UTP和荧光素-15-2'-dATP;以及可从俄勒冈州尤金的分子探针公司(Molecular Probes,Eugene,Oreg)获得的染色体标记的核苷酸、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、瀑布蓝-7-UTP、瀑布蓝-7-dUTP、荧光素-12-UTP、荧光素-12-dUTP、俄勒冈绿488-5-dUTP、罗丹明绿-5-UTP、罗丹明绿-5-dUTP、四甲基罗丹明-6-UTP、四甲基罗丹明-6-dUTP、德克萨斯红-5-UTP、德克萨斯红-5-dUTP和德克萨斯红-12-dUTP。核苷酸也可以通过化学修饰进行标记或标出。经化学修饰的单核苷酸可以是生物素-dNTP。生物素化dNTP的一些非限制性实例可以包含生物素-dATP(例如bio-N6-ddATP、生物素-14-dATP)、生物素-dCTP(例如生物素-11-dCTP、生物素-14-dCTP)和生物素-dUTP(例如生物素-11-dUTP、生物素-16-dUTP、生物素-20-dUTP)。核苷酸可以包括核苷酸类似物。在一些实施例中,核苷酸类似物可以包括在任何位置被修饰的天然核苷酸的结构,以改变核苷酸的某些化学性质,同时保留核苷酸类似物执行其预期功能的能力(例如,与RNA或DNA中的其它核苷酸杂交)。可以衍生的核苷酸的位置的实例包括5位,例如5-(2-氨基)丙基尿苷、5-溴尿苷、5-丙炔尿苷、5-丙烯基尿苷等;6位,例如6-(2-氨基)丙基尿苷;8位的腺苷和/或鸟苷,例如,8-溴鸟苷、8-氯鸟苷、8-氟鸟苷等。核苷酸类似物还包含脱氮核苷酸,例如,7-脱氮腺苷:O-和N-修饰的(例如,烷基化的,例如,N6-甲基腺苷,或以其它方式适当修饰的)核苷酸;以及如Herdewijn,《反义核酸药物开发(Antisense Nucleic Acid Drug Dev.)》,2000年8月.10(4):297-310中描述的那些其它杂环修饰的核苷酸类似物。核苷酸类似物还可以包括对核苷酸的糖部分的修饰。例如,2′OH基团可以被选自H、OR、R、F、Cl、Br、I、SH、SR、NH2、NHR、NR2、COOR或OR的基团替代,其中R是经取代或未经取代的C1-C6烷基、烯基、炔基、芳基等。其它可能的修饰包括美国专利第5,858,988号和第6,291,438号中描述的那些。可以衍生的核苷酸的位置的实例包括5位,例如5-(2-氨基)丙基尿苷、5-溴尿苷、5-丙炔尿苷、5-丙烯基尿苷等;6位,例如6-(2-氨基)丙基尿苷;8位的腺苷和/或鸟苷,例如,8-溴鸟苷、8-氯鸟苷、8-氟鸟苷等。核苷酸类似物还包含脱氮核苷酸,例如,7-脱氮腺苷:O-和N-修饰的(例如,烷基化的,例如,N6-甲基腺苷,或以其它方式适当修饰的)核苷酸;以及如Herdewijn,《反义核酸药物开发(Antisense Nucleic Acid Drug Dev.)》,2000年8月.10(4):297-310中描述的那些其它杂环修饰的核苷酸类似物。
核苷酸类似物还可以包括对核苷酸的糖部分的修饰。例如,2′OH基团可以被选自H、OR、R、F、Cl、Br、I、SH、SR、NH2、NHR、NR2、COOR或OR的基团替代,其中R是经取代或未经取代的C1-C6烷基、烯基、炔基、芳基等。其它可能的修饰包括美国专利第5,858,988号和第6,291,438号中描述的那些。
术语“多核苷酸”、“寡核苷酸”和“核酸”可互换使用以通常指代任何长度的核苷酸的聚合形式,脱氧核糖核苷酸或核糖核苷酸或其类似物,呈单链、双链或多链形式。多核苷酸对于细胞可以是外源性的或内源性的。多核苷酸可以存在于无细胞环境中。多核苷酸可以是基因或其片段。多核苷酸可以是DNA。多核苷酸可以是RNA。多核苷酸可以具有任何三维结构,并且可以进行任何功能。多核苷酸可以包括一种或多种类似物(例如,改变的主链、糖或核碱基)。如果存在,则可以在组装聚合物之前或之后赋予对核苷酸结构的修饰。类似物的一些非限制性实例包含:5-溴尿嘧啶、肽核酸、异源核酸、吗啉代、锁核酸、甘油核酸、苏糖核酸、双脱氧核苷酸、虫草素、7-脱氮-GTP、荧光团(例如,与糖连接的罗丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷和怀俄苷。多核苷酸的非限制性实例包含基因或基因片段的编码或非编码区、根据连接分析定义的多个基因座(一个基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的DNA、包含无细胞DNA(cfDNA)和无细胞RNA(cfRNA)的无细胞多核苷酸、核酸探针和引物。核苷酸序列可以间杂有非核苷酸组分。多核苷酸可以包括自然界中发现的核苷酸和核苷酸类似物(例如,合成核苷酸类似物)的混合物。
术语“转染”或“转染的”通常指通过非病毒或基于病毒的方法将核酸引入细胞中。核酸分子可以是编码完整蛋白或其功能部分的基因序列。参见例如Sambrook等人(1989),《分子克隆:实验室手册》,18.1-18.88(所述文献通过引用整体并入本文)。
术语“肽”、“多肽”和“蛋白质”在本文中可互换使用以通常指代至少两个通过肽键连接的氨基酸残基的聚合物。此术语不表示聚合物的具体长度,也不旨在暗示或区分肽是使用重组技术、化学或酶促合成产生的还是天然存在的。所述术语适用于天然存在的氨基酸聚合物以及包括至少一种经修饰的氨基酸的氨基酸聚合物。在一些情况下,聚合物可以间杂有非氨基酸。所述术语包含任何长度的氨基酸链,包含全长蛋白质以及具有或不具有二级和/或三级结构(例如,结构域)的蛋白质。术语还涵盖已被修饰的氨基酸聚合物;例如通过二硫键形成、糖基化、脂化、乙酰化、磷酸化、氧化和任何其它操作,如与标记组分缀合。如本文所使用的,术语“氨基酸(amino acid)”和“氨基酸(amino acids)”通常是指天然和非天然氨基酸,包含但不限于经修饰的氨基酸和氨基酸类似物。经修饰的氨基酸可以包含已被化学修饰以包含非天然存在于氨基酸上的基团或化学部分的天然氨基酸和非天然氨基酸。氨基酸类似物可以指氨基酸衍生物。术语“氨基酸”包含D-氨基酸和L-氨基酸。
如本文所使用的,“非天然”通常可以指在天然核酸或蛋白质中未发现的核酸或多肽序列。非天然可以指亲和标签。非天然可以指融合物。非天然可以指天然存在的包括突变、插入和/或缺失的核酸或多肽序列。非天然序列可以表现出和/或编码也可以由与非天然序列融合的核酸和/或多肽序列表现出的活性(例如,酶活性、甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)。非天然核酸或多肽序列可以通过基因工程化与天然存在的核酸或多肽序列(或其变体)连接以产生嵌合核酸和/或编码嵌合核酸和/或多肽的多肽序列。
如本文所使用的,术语“启动子”通常是指控制基因转录或表达并且可以位于与启动RNA转录的核苷酸或核苷酸区相邻或重叠的调节DNA区。启动子可以含有结合蛋白质因子(通常称为转录因子)的特定DNA序列,其促进RNA聚合酶与DNA的结合,从而导致基因转录。‘基础启动子’,也称为‘核心启动子’,通常可以指含有促进可操作连接的多核苷酸转录表达的所有基本元件的启动子。真核基础启动子通常(尽管不一定)含有TATA盒和/或CAAT盒。
如本文所使用的,术语“表达”通常是指从DNA模板转录核酸序列或多核苷酸(如转录为mRNA或其它RNA转录本)的过程和/或随后将经转录的mRNA翻译为肽、多肽、或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸源自基因组DNA,则表达可以包含在真核细胞中剪接mRNA。
如本文所使用的,“可操作地连接”、“可操作连接”、“操作性地连接”或其语法等效物通常是指遗传元素,例如启动子、增强子、聚腺苷酸化序列等的并置,其中所述元素处于允许其以预期方式操作的关系中。例如,如果调节元件有助于启动编码序列的转录,则可以包括启动子和/或增强子序列的调节元件可操作地连接到编码区。只要维持这种功能关系,调节元件与编码区之间就会存在插入残基。
如本文所使用的,“载体”通常是指包括多核苷酸或与多核苷酸缔合并且可以用于介导多核苷酸到细胞的递送的大分子或大分子缔合物。载体的实例包含质粒、病毒载体、脂质体和其它基因递送媒剂。载体通常包括遗传元件,例如调节元件,其可操作地连接到基因以促进基因在靶标中的表达。
如本文所使用的,“表达盒”和“核酸盒”通常可互换使用以指代一起表达或可操作地连接用于表达的核酸序列或元件的组合。在一些情况下,表达盒是指调节元件和其可操作地连接用于表达的一个或多个基因的组合。
如本文所使用的,“工程化”对象通常表明所述对象已通过人为干预进行修饰。根据非限制性实例:核酸可以通过将其序列改变成自然界中不存在的序列来修饰;核酸可以通过将其连接到自然界中不与其缔合的核酸来修饰,使得连接产物具有原始核酸中不存在的功能;工程化核酸可以用自然界不存在的序列在体外合成;可以通过将蛋白质的氨基酸序列改变为自然界中不存在的序列来修饰蛋白质;工程化蛋白质可以获得新的功能或特性。“工程化”系统包括至少一个工程化组分。
如本文所使用的,“合成的”和“人工的”通常可以互换使用是指代与天然存在的人蛋白质具有低序列同一性(例如小于50%序列同一性、小于25%序列同一性、小于10%序列同一性、小于5%序列同一性、小于1%序列同一性)的蛋白质或其结构域。例如,VPR和VP64结构域是合成的反式激活结构域。
如本文所使用的,术语“Cas12a”通常指属于2类V-A型Cas核酸内切酶的Cas核酸内切酶家族,并且(a)使用相对较小的向导RNA(约42-44个核苷酸),其在从CRISPR阵列转录后由核酸酶自身处理,以及(b)切割DNA以留下交错的切割位点。该酶家族的另外的特征可以在例如Zetsche B,Heidenreich M,Mohanraju P,等人《自然生物技术(Nat Biotechnol)》2017;35:31–34和Gootenberg JS,Abudayyeh OO,等人《细胞》2015;163:759–771中发现,所述文献通过引用并入本文。
如本文所使用的,“引导核酸”或其变体通常可以指可以与另一个核酸杂交的核酸。向导核酸可以是RNA。向导核酸可以是DNA。向导核酸可以被编程成与核酸序列位点特异性结合。待靶向的核酸或靶核酸可以包括核苷酸。向导核酸可以包括核苷酸。靶核酸的一部分可以与向导核酸的一部分互补。与向导核酸互补并杂交的双链靶多核苷酸的链可以称为互补链。双链靶多核苷酸的与互补链互补并且因此可能不与向导核酸互补的链可以被称为非互补链。向导核酸可以包括多核苷酸链,并且可以称为“单一向导核酸”。向导核酸可以包括两条多核苷酸链,并且可以称为“双向导核酸”。如果没有另外说明,则术语“向导核酸”可以包含在内,指单一向导核酸和双向导核酸两者。向导核酸可以包括可以被称为“核酸靶向区段”或“核酸靶向序列”或“间隔子序列”的区段。核酸靶向区段可以包括子区段,所述子区段可以被称为“蛋白质结合区段”或“蛋白质结合序列”或“Cas蛋白质结合区段”。向导核酸可以包括sgRNA。向导核酸可以包括crRNA。
在两个或更多个核酸或多肽序列的上下文中,术语“序列同一性”或“百分比同一性”通常是指当在局部或全局比较窗内进行比较和比对以获得最大对应性时,两个(例如,在成对比对中)或更多个(例如,在多序列比对中)相同或具有相同特定百分比的氨基酸残基或核苷酸的序列,如使用序列比较算法测量的。用于多肽序列的合适的序列比较算法包含例如使用字长(W)为3、期望值(E)为10的参数以及BLOSUM62评分矩阵(将空位罚分设置为存在11,扩展1)并且使用长于30个残基的多肽序列的条件组成评分矩阵调整的BLASTP;使用字长(W)为2、期望值(E)为1000000的参数以及PAM30评分矩阵(对于少于30个残基的序列,将空隙罚分设置为9来打开空隙,并且设置为1来扩展空隙)(这些是BLAST套件中BLASTP的默认参数,可在https://blast.ncbi.nlm.nih.gov获得)的BLASTP;具有参数的CLUSTALW;具有以下参数的CLUSTALW与Smith-Waterman同源性搜索算法:匹配为2、失配为-1并且间隙为-1;具有默认参数的MUSCLE;具有以下参数的MAFFT:retree为2并且maxiterations为1000;具有默认参数的Novafold;具有默认参数的HMMER hmmalign。
如本文所使用的,术语“嵌合抗原受体”、“CAR”或“CAR分子”通常指包含至少细胞外抗原结合结构域的重组多肽构建体,跨膜结构域和细胞质信号传导结构域(本文也称为“细胞内信号传导结构域”),其包含源自本文所定义的刺激分子的功能性信号传导结构域。在一些实施例中,刺激分子是与T细胞受体复合物或NKG2D的信号传导结构域相关联的ζ链。在一些实施例中,细胞内信号传导结构域进一步包括源自至少一种如下定义的共刺激分子的一个或多个功能性信号传导结构域。在一些实施例中,共刺激分子选自4-1BB(即,CD137)、CD27和/或CD28。在一些实施例中,CAR包含嵌合融合蛋白,所述嵌合融合蛋白包含细胞外抗原识别结构域、跨膜结构域和胞质信号传导结构域,所述胞质信号传导结构域包含源自刺激分子的功能性信号传导结构域。在一些实施例中,CAR包含嵌合融合蛋白,所述嵌合融合蛋白包含细胞外抗原识别结构域、跨膜结构域和胞质信号传导结构域,所述胞质信号传导结构域包含源自共刺激分子的功能性信号传导结构域和源自刺激分子的功能性信号传导结构域。在一些实施例中,CAR包含嵌合融合蛋白,所述嵌合融合蛋白包含细胞外抗原识别结构域、跨膜结构域和细胞内信号传导结构域,所述细胞内信号传导结构域包含源自一个或多个共刺激分子的两个功能性信号传导结构域和源自刺激分子的功能性信号传导结构域。在一些实施例中,CAR包含嵌合融合蛋白,所述嵌合融合蛋白包含细胞外抗原识别结构域、跨膜结构域和细胞内信号传导结构域,所述细胞内信号传导结构域包含源自一个或多个共刺激分子的至少两个功能性信号传导结构域和源自刺激分子的功能性信号传导结构域。在一些实施例中,CAR在CAR融合蛋白的氨基末端(N项)包含任选的前导序列。在一些实施例中,CAR进一步包含在细胞外抗原识别结构域的N末端的前导序列,其中在细胞处理和CAR定位到细胞膜期间,前导序列任选地从抗原识别结构域(例如,scFv)切割。
术语“信号传导结构域”通常指蛋白质的功能部分,其通过在细胞内传递信息来发挥作用,从而通过产生第二信使或通过响应于此类信使而用作效应物,通过定义的信号传导通路来调节细胞活性。
如本文所使用的,术语“抗体”通常指源自免疫球蛋白分子的蛋白质或多肽序列,其与抗原特异性结合,例如非共价地、可逆地和以特定方式结合。抗体可以是多克隆或单克隆、多链或单链、或完整的免疫球蛋白,并且可以源自天然来源或重组来源。抗体可以是免疫球蛋白分子的四聚体。例如,天然存在的IgG抗体是一种包括通过二硫键互连的至少两个重(H)链和两个轻(L)链的四聚体。每条重链包含重链可变区(在本文中缩写为VH)和重链恒定区。重链恒定区包含三个结构域CH1、CH2和CH3。每条轻链包含轻链可变区(在本文中缩写为VL)和轻链恒定区。轻链恒定区包含一个结构域CL。VH和VL区可以被进一步细分成高变区,被称为互补决定区(CDR),散布着更为保守的区,被称为框架区(FR)。每个VH和VL包含按照以下顺序从氨基端到羧基端布置的三个CDR和四个FR:FR1、CDR1、FR2、CDR2、FR3、CDR3和FR4。重链和轻链的可变区含有与抗原相互作用的结合结构域。抗体的恒定区可以介导免疫球蛋白与宿主组织或因子的结合,包含免疫系统的各种细胞(例如,效应细胞)以及经典补体系统的第一组分(C1q)。术语“抗体”包括但不限于单克隆抗体、人类抗体、人源化抗体、骆驼科抗体和嵌合抗体。抗体可以属于任何同种型/种类(例如,IgG、IgE、IgM、IgD、IgA和IgY)或子类(例如,IgG1、IgG2、IgG3、IgG4、IgA1和IgA2)。
术语“抗体片段”是指完整抗体或其重组变体的至少一部分并且是指抗原结合结构如本文例如,完整抗体的抗原决定可变区,所述抗原结合结构域足以赋予抗体片段对如抗原等靶标的识别和特异性结合。抗体片段的实例包含但不限于Fab、Fab'、F(ab')2和Fv片段、单链或“scFv”抗体片段、线性抗体、如sdAb(VL或VH)等单结构域抗体、骆驼科VHH结构域和由抗体片段形成的多特异性抗体。术语“scFv”是指包括包含轻链的可变区的至少一个抗体片段和包含重链的可变区的至少一个抗体片段的融合蛋白,其中轻链可变区和重链可变区通过短的柔性多肽连接子连续地连接并且能够作为单链多肽表达,并且其中scFv保留了其源自的完整抗体的特异性。除非另有说明,否则如本文所使用的,scFv可以具有任意顺序的VL和VH可变区,例如,相对于多肽的N端和C端末端,scFv可以包括VL-接头-VH或者可以包括VH-接头-VL。
CAR组合物的包括抗体或其抗体片段的部分可以多种形式存在,其中抗原结合结构域作为连续多肽链的一部分表达,包括例如单结构域抗体片段(sdAb)、单链抗体(scFv)和人源化抗体(Harlow等人,1999,《使用抗体:实验室手册(Using antibodies:ALaboratory Manual)》,纽约冷泉港实验室出版社(Cold Spring Harbor LaboratoryPress,NY);Harlow等人,1989,见:《抗体:实验室手册(Antibodies:A LaboratoryManual)》,纽约冷泉港实验室出版社;Houston等人,1988,《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》85:5879-5883;Bird等人,1988,《科学(Science)》242:423-426)。在一些实施例中,本发明的CAR组合物的抗原结合结构域包括抗体片段。在一些实施例中,CAR包括包含scFv的抗体片段。
本公开包含本文所描述的具有一个或多个保守氨基酸取代的酶中的任何酶的变体。此类保守取代可以在多肽的氨基酸序列中进行,而不破坏多肽的三维结构或功能。保守取代可以通过具有类似疏水性、极性和R链长度的氨基酸相互取代来完成。另外或可替代地,通过比较来自不同物种的同源蛋白质的比对序列,可以通过定位物种之间突变的氨基酸残基(例如不改变经编码的蛋白质的基本功能的非保守残基)来鉴定保守取代。此类保守取代的变体可以包括与本文所描述的核酸内切酶蛋白质序列中的任何一个核酸内切酶蛋白质序列具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%同一性的变体。在一些实施例中,此类保守取代的变体是功能变体。此类功能变体可以涵盖具有取代的序列,使得核酸内切酶的一个或多个关键活性位点残基或向导RNA结合残基的活性不被破坏。在一些实施例中,本文所描述的蛋白质中的任何蛋白质的功能变体缺乏对Cas核酸内切酶的特征的保守或功能残基中的至少一个的取代。在一些实施例中,本文所描述的蛋白质中的任何蛋白质的功能变体缺乏对Cas核酸内切酶的特征的所有保守或功能残基的取代。
本公开还包括本文所描述的酶中的任何酶的变体,其取代一个或多个催化残基以降低或消除酶(例如,活性降低的变体)的活性。在一些实施例中,作为本文所描述的蛋白质的活性降低的变体包括至少一个、至少两个或所有三个RuvC催化残基的破坏性取代。
提供功能类似氨基酸的保守取代表可从各种参考文献中获得(参见例如Creighton,《蛋白质:结构与分子特性(Proteins:Structures and MolecularProperties)》(W H弗里曼出版社(W H Freeman&Co.);第2版(1993年12月))。以下八个基团各自含有彼此保守取代的氨基酸:
1)丙氨酸(A)、甘氨酸(G);
2)天冬氨酸(D)、谷氨酸(E);
3)天冬酰胺(N)、谷氨酰胺(Q);
4)精氨酸(R)、赖氨酸(K);
5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);
6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);
7)丝氨酸(S)、苏氨酸(T);以及
8)半胱氨酸(C)、甲硫氨酸(M)
概述
具有独特功能和结构的新Cas酶的发现可能会提供进一步破坏脱氧核糖核酸(DNA)编辑技术的可能性,从而提高速度、特异性、功能和易用性。相对于微生物中成簇的规则间隔的短回文重复序列(CRISPR)系统的预测流行率和微生物物种的纯粹多样性,文献中存在功能表征的CRISPR/Cas酶相对较少。这部分是因为大量的微生物物种可能不容易在实验室条件下培养。对包括大量微生物物种的自然环境生态位进行宏基因组测序可能会提供大幅增加新的记录的CRISPR/Cas系统的数量,并且加速新寡核苷酸编辑功能的发现的可能性。这种方法富有成效的最近的实例通过2016年通过对天然微生物群落的宏基因组分析发现CasX/CasY CRISPR系统证明。
CRISPR/Cas系统是RNA引导的核酸酶复合物,其已描述为在微生物中充当适应性免疫系统。在CRISPR/Cas系统的自然环境中,所述CRISPR/Cas系统出现在CRISPR(成簇的规则间隔的短回文重复序列)操纵子或基因座中,其通常包括两部分:(i)由同样短的间隔子序列分隔的短重复序列阵列(30-40bp),其编码基于RNA的靶向元件;以及(ii)编码Cas的ORF,所述Cas编码由基于RNA的靶向元件以及辅助蛋白/酶引导的核酸酶多肽。特定靶核酸序列的有效核酸酶靶向通常需要以下两者:(i)靶标(靶种子)的前6-8个核酸与crRNA向导之间的互补杂交;以及(ii)靶种子的定义附近内存在原间隔子邻近基序(PAM)序列(PAM通常是宿主基因组内不常表示的序列)。根据系统的确切功能和组织,CRISPR-Cas系统通常基于共享的功能特性和进化类似性分为2种类别、5种类型和16种亚型(参见图1)。
I类CRISPR-Cas系统具有大的多亚基效应子复合物,并且包括I、III和IV型。II类CRISPR-Cas系统通常具有单多肽多结构域核酸酶效应子,并且包括II型、V型和VI型。
II型CRISPR-Cas系统在组分方面被认为是最简单的。在II型CRISPR-Cas系统中,将CRISPR阵列处理成成熟的crRNA不需要存在特殊的核酸内切酶亚基,而是需要小的反式编码的crRNA(tracrRNA),其区与阵列重复序列互补;tracrRNA与其对应的效应子核酸酶(例如Cas9)和重复序列相互作用以形成前体dsRNA结构,所述前体dsRNA结构被内源性RNA酶III切割,从而生成负载tracrRNA和crRNA两者的成熟的效应子酶。Cas II核酸酶被鉴定为DNA核酸酶。2型效应子通常表现出包括RuvC样核酸内切酶结构域的结构,所述RuvC样核酸内切酶结构域采用RNA酶H折叠,其中RuvC样核酸酶结构域的所述折叠内插入有不相关的HNH核酸酶结构域。RuvC样结构域负责靶(例如,crRNA互补)DNA链的切割,而HNH结构域负责置换的DNA链的切割。
V型CRISPR-Cas系统的特征在于与包括RuvC样结构域的II型效应子的结构类似的核酸酶效应子(例如Cas12)结构。类似于II型,大多数(但不是全部)V型CRISPR系统使用tracrRNA将pre-crRNA处理成成熟的crRNA;然而,与需要RNA酶III将pre-crRNA切割成多个crRNA的II型系统不同,V型系统能够使用效应子核酸酶本身来切割pre-crRNA。与II型CRISPR-Cas系统一样,V型CRISPR-Cas系统再次被鉴定为DNA核酸酶。与II型CRISPR-Cas系统不同,一些V型酶(例如Cas12a)似乎具有强大的由双链靶序列的第一个crRNA定向切割激活的单链非特异性脱氧核糖核酸酶活性。
CRISPR-Cas系统由于其靶向性和易用性,近年来已成为首选的基因编辑技术。最常用的系统是2类、II型SpCas9和2类、V-A型Cas12a(先前的Cpf1)。特别是V-A型系统正变得越来越广泛地使用,因为据其在细胞中的报告的特异性高于其它核酸酶,具有更少或没有脱靶作用。V-A系统的优点还在于,向导RNA小(42-44个核苷酸,相比之下SpCas9大约为100nt),并且在从CRISPR阵列转录后由核酸酶自身处理,从而简化了多基因编辑的多重应用。此外,V-A系统具有交错的切割位点,这可能有助于定向修复途径,如微同源性依赖性靶向整合(MITI)。
最常用的V-A型酶需要在所选靶位点旁边有一个5'原间隔子相邻基序(PAM):针对毛螺菌科细菌ND2006 LbCas12a和氨基酸球菌属AsCas12a的5'-TTTV-3';以及针对新凶手弗朗西斯菌FnCas12a的5'-TTV-3'。最近对直链同源物的探索揭示了具有较少限制性PAM序列的蛋白质,其在哺乳动物细胞培养例如,YTV、YYN或TTN中也具有活性。然而,这些酶并不完全涵盖V-A生物多样性和靶向性,并且可能不代表所有可能的活性和PAM序列要求。在此,从大量的V-A型核酸酶宏基因组中提取了数千个基因组片段。记录的V-A酶的多样性可能已经扩大,并且新的系统可能已经发展成为高度靶向、紧凑和精确的基因编辑药剂。
示例实施例
在一些方面,本公开提供了一种编辑细胞内的两个或更多个基因座的方法,所述方法包括使所述细胞接触或使以下与所述细胞接触:(a)2类II型Cas核酸内切酶复合物,所述2类II型Cas核酸内切酶复合物包括:(i)2类II型Cas核酸内切酶;以及(ii)一种或多种工程化向导RNA,包括:RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第一组一个或多个靶基因座杂交。在一些实施例中,所述方法进一步包括使所述细胞接触或使以下与所述细胞接触:(b)2类V型Cas核酸内切酶复合物,所述2类V型Cas核酸内切酶复合物包括:(i)2类V型Cas核酸内切酶;以及(ii)一种或多种工程化向导RNA,包括:RNA序列,所述RNA序列被配置成与所述2类、V型Cas核酸内切酶结合,以及间隔子序列,所述间隔子序列被配置成与第二组一个或多个靶基因座杂交。在一些实施例中,Cas核酸内切酶以核糖核蛋白(RNP)颗粒的形式接触(例如,在基于脂质或基于电穿孔/核转染的转染的情况下)。在一些实施例中,Cas核酸内切酶以编码所述核酸内切酶或相关联的向导RNA(例如,在载体或体外转录的mRNA的情况下)的序列的形式引入。在一些实施例中,编辑包括插入插入和缺失、提前终止密码子、错义密码子、移码突变、腺嘌呤脱氨基化、胞嘧啶脱氨基化或其任何组合。
Cas核酸内切酶可以是在特定参数下引入或以实现特定靶度量的方式引入的特异性Cas核酸内切酶。在一些实施例中,所述2类II型Cas核酸内切酶不是Cas9核酸内切酶。在一些实施例中,所述2类II型Cas核酸内切酶是Cas12a核酸内切酶。在一些实施例中,所述2类II型Cas核酸内切酶包括与SEQ ID NO:1或4中的任一个或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:7或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个具有至少80%、85%、90%或95%序列同一性的序列。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率编辑所述第一基因座的基因组序列,和/或以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率编辑所述第二基因座的基因组序列。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶以200pmol或更低、100pmol或更低、50pmol或更低、25pmol或更低、5pmol或更低或1pmol或更低的浓度引入。在一些实施例中,脱靶位点以小于0.2%的频率被破坏,如通过全基因组脱靶双链断裂分析确定的。在一些实施例中,脱靶位点以小于0.01%的频率被破坏,如通过全基因组脱靶双链断裂分析确定的。在一些实施例中,所述全基因组脱靶双链断裂分析包括HTGTS测定(高通量全基因组易位测序(high-throughput,genome-wide translocation sequencing);参见例如Chiarle等人《细胞》2011年9月30;147(1):107-19.doi:10.1016/j.cell.2011.07.049,所述文献出于所有目的通过引用明确并入本文)、LAM-HTGTS测定(线性扩增介导的高通量全基因组测序(linear amplification mediated high-throughput genome-widesequencing);参见例如Hu等人《自然实验室指南》2016.11(5):853-71.doi:10.1038/nprot.2016.043,所述文献出于所有目的通过引用明确并入本文)或Digenome-Seq(体外Cas消化全基因组测序(in vitro Cas-digested whole genome sequencing);参见例如Kim等人《自然方法》2015.12(3):237-43.doi:10.1038/nmeth.3284,所述文献出于所有目的通过引用明确并入本文)测定。
所靶向的基因座可以包括任何基因座。所靶向的基因座可以是特定的治疗上感兴趣的基因座,如T细胞受体(TCR)基因座(包括TCR基因座的保留有多种T细胞亚型如TRAC和TRBC的恒定区)、糖皮质激素受体基因座(又名GR基因座)、编码其它核激素受体的基因座(例如雌激素受体、孕激素受体或雄激素受体基因座)或编码特定致癌基因或肿瘤抑制剂的基因座。在一些实施例中,所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括T细胞受体(TCR)基因座。在一些实施例中,被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:10-15中的任一个具有至少80%、85%、90%或95%序列同一性。在一些实施例中,所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括核受体亚家族3C组成员1(NR3C1)基因座。在一些实施例中,被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:16、20、21或22中的任一个具有至少80%、85%、90%或95%序列同一性。
本文使用的编辑方法的任何一种编辑方法都可以与供体核酸分子结合使用,例如通过在Cas酶或Cas复合物靶向的位点之一的同源重组引入转基因。在一些实施例中,所述方法进一步包括将包括以下的供体DNA序列引入到所述细胞:编码内源性基因的转基因版本的开放阅读框、包括位于所述靶序列的第一侧的DNA序列的第一同源臂和包括位于内源性基因的基因座内的所述靶序列的第二侧的DNA序列的第二同源臂。在一些情况下,转基因可以是CAR-T分子。在一些实施例中,所述方法进一步包括将包括以下的供体DNA序列引入到所述细胞:编码异源工程化T细胞受体分子的开放阅读框、包括位于所述靶序列的第一侧的DNA序列的第一同源臂和包括位于所述TCR基因座内的所述靶序列的第二侧的DNA序列的第二同源臂。
在一些方面,本公开提供了一种制备糖皮质激素抵抗性工程化T细胞的方法,所述方法包括将以下引入到T细胞或其前体:(a)靶向T细胞受体(TCR)基因座的RNA引导的核酸内切酶复合物,所述RNA引导的核酸内切酶复合物包括:(i)第一RNA引导的核酸内切酶或编码所述第一RNA引导的核酸内切酶的DNA;以及(ii)第一工程化向导RNA,所述第一工程化向导RNA包括:RNA序列,所述RNA序列被配置成与所述第一RNA引导的核酸内切酶形成复合物,以及第一间隔子序列,所述第一间隔子序列被配置成与所述TCR基因座的至少一部分杂交。在一些实施例中,所述方法进一步包括向所述T细胞或所述其前体引入:(b)靶向T细胞受体核受体亚家族3C组成员1(NR3C1)基因座的RNA引导的核酸内切酶复合物,所述RNA引导的核酸内切酶复合物包括:(i)第二RNA引导的核酸内切酶;以及(ii)第二工程化向导RNA,所述第二工程化向导RNA包括:RNA序列,所述RNA序列被配置成与所述第二RNA引导的核酸内切酶形成复合物,以及第二间隔子序列,所述第二间隔子序列被配置成与所述NR3C1基因座的至少一部分杂交。在一些实施例中,所述TCR基因座的所述至少一部分位于所述T细胞基因座内。在一些实施例中,所述方法进一步包括将(b)包括以下的供体DNA序列引入到所述细胞:编码异源工程化T细胞受体分子的开放阅读框、包括位于所述靶序列的第一侧的DNA序列的第一同源臂和包括位于所述TCR基因座内的所述靶序列的第二侧的DNA序列的第二同源臂。
II型或V型核酸内切酶可以包括特定的Cas核酸内切酶。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶包括2类II型或2类V型Cas核酸内切酶。在一些实施例中,所述第一RNA引导的核酸内切酶包括所述2类II型Cas核酸内切酶,并且所述第二RNA引导的核酸内切酶包括所述2类V型Cas核酸内切酶。在一些实施例中,所述第二RNA引导的核酸内切酶包括所述2类II型Cas核酸内切酶,并且所述第一RNA引导的核酸内切酶包括所述2类V型Cas核酸内切酶。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶包括与SEQ ID NO:1、4或7中的任一个具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。在一些实施例中,所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个具有至少80%、85%、90%或95%序列同一性的序列。在一些实施例中,所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶以100pmol或更低、50pmol或更低、25pmol或更低、5pmol或更低或1pmol或更低的浓度存在。
本文使用的编辑方法的任何一种编辑方法都可以与供体核酸分子结合使用,例如通过在Cas酶或Cas复合物靶向的位点之一的同源重组引入转基因。在一些实施例中,所述异源工程化T细胞受体是CAR分子。在一些实施例中,所述T细胞受体基因座的所述至少一部分是T细胞受体α常数(TRAC)基因座或T细胞受体β常数(TRBC)基因座。在一些实施例中,所述T细胞受体基因座的所述至少一部分是TRAV或TRAJ基因座。在一些实施例中,所述T细胞受体基因座的所述至少一部分是TRBV或TRBJ基因座。在一些实施例中,所述同源臂包括所述TCR基因座内的接近所述T细胞受体基因座的所述至少一部分的内含子区或外显子区。在一些实施例中,所述T细胞受体基因座的所述至少一部分是TRAC的第一或第三外显子。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率破坏所述TCR基因座和所述NR3C1基因座的基因组序列。在一些实施例中,所述效率是针对从所述TCR或NR3C1基因座表达的蛋白质通过流式细胞术测定的。在一些实施例中,所述NR3C1基因座的所述至少一部分是外显子2或外显子3。在一些实施例中,所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率产生对CAR分子呈阳性并且对NR3C1呈阴性的细胞。在一些实施例中,所述方法包括将(a)至(c)同时引入到所述T细胞或其前体。在一些实施例中,所述T细胞或所述其前体包括T细胞、造血干细胞(HSC)或外周血单核细胞(PBMC)。在一些实施例中,所述第二间隔子序列包括与SEQ ID NO:16、20、21或22中的任一个具有至少80%、85%、90%或95%序列同一性的序列。在一些实施例中,所述第一或所述第二间隔子序列包括至少约19至24个核苷酸、至少约19个核苷酸、至少约20个核苷酸、至少约22个核苷酸或至少约24个核苷酸。
结合本文所述方法使用的供体序列可以在所述方法中以各种形式提供。在一些实施例中,供体序列以核酸分子(例如单链或双链DNA或RNA)的形式提供。在一些实施例中,在载体(例如质粒、YAC质粒、BAC质粒、噬菌粒或病毒载体)中提供供体序列。在病毒载体的情况下,病毒载体可以包括具有特定血清型的AAV病毒。在一些实施例中,所述供体DNA序列在病毒载体中递送。在一些实施例中,所述病毒载体是AAV或AAV-6载体。
在一些方面,本公开提供了糖皮质激素抵抗性CAR-T细胞群体,包括:(a)TCR基因座内的在SEQ ID NO:10-15中的任一个的杂交区的100个、75个、50个、25个或10个核苷酸内的异源序列。在一些实施例中,所述群体进一步包括(b)包含插入和缺失的NR3C1基因座。在一些实施例中,所述异源序列是插入和缺失。在一些实施例中,所述异源序列包括开放阅读框,所述开放阅读框包括编码异源T细胞受体或CAR分子的核苷酸序列。在一些实施例中,所述NR3C1基因座包括SEQ ID NO:16、20、21或22中的任一个的杂交区的100个、75个、50个、25个或10个核苷酸内的插入和缺失。在一些实施例中,所述群体中少于0.2%的细胞在脱靶基因座处具有插入和缺失,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,所述群体中少于0.01%的细胞在脱靶基因座处具有插入和缺失,如通过全基因组脱靶双链断裂分析测定的。在一些实施例中,所述全基因组脱靶双链断裂分析包括HTGTS测定(高通量全基因组易位测序(high-throughput,genome-wide translocation sequencing);参见例如Chiarle等人《细胞》2011年9月30;147(1):107-19.doi:10.1016/j.cell.2011.07.049,所述文献出于所有目的通过引用明确并入本文)、LAM-HTGTS测定(线性扩增介导的高通量全基因组测序(linear amplification mediated high-throughput genome-widesequencing);参见例如Hu等人《自然实验室指南》2016.11(5):853-71.doi:10.1038/nprot.2016.043,所述文献出于所有目的通过引用明确并入本文)或Digenome-Seq(体外Cas消化全基因组测序(in vitro Cas-digested whole genome sequencing);参见例如Kim等人《自然方法》2015.12(3):237-43.doi:10.1038/nmeth.3284,所述文献出于所有目的通过引用明确并入本文)测定。在一些实施例中,所述细胞群体基本上没有染色体易位。
在一些方面,本公开提供了通过本文所述方法的任何方法产生的细胞。
在一些方面,本公开提供了下表1中提供的蛋白质序列或核苷酸序列。
表1:本文所述的示例蛋白质、向导RNA、靶向序列和同源臂
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
在一些情况下,本文所述的核酸内切酶的任何核酸内切酶可以包括具有一个或多个核定位序列(NLS)的变体。NLS可以接近核酸内切酶的N-或C-末端。NLS可以被附加到SEQID NO:25-40中的任一个的N末端或C末端,或者被附加到与SEQ ID NO:25-40中的任一个具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的变体。在一些情况下,NLS可以包括与SEQ ID NO:25-40中的任一个基本上相同的序列。
表2:可以与根据本公开的Cas效应子一起使用的示例NLS序列。
在一些情况下,本文所述的任何核酸内切酶方法可以进一步包括将单链或双链DNA修复模板引入细胞。在一些情况下,工程化核酸酶系统进一步包括单链DNA修复模板。在一些情况下,工程化核酸酶系统进一步包括双链DNA修复模板。在一些情况下,单链或双链DNA修复模板可以包括5'至3':第一同源臂(包括与所述靶脱氧核糖核酸序列的至少20个核苷酸的序列的5')、合成DNA序列至少10个核苷酸以及第二同源臂(包括与所述靶序列的至少20个核苷酸的序列的3')。
在一些情况下,第一同源臂包括至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少175个、至少200个、至少250个、至少300个、至少400个、至少500个、至少750个或至少1000个核苷酸的序列。在一些情况下,第二同源臂包括至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少175个、至少200个、至少250个、至少300个、至少400个、至少500个、至少750个或至少1000个核苷酸的序列。
在一些情况下,第一和第二同源臂与原核生物的基因组序列同源。在一些情况下,第一和第二同源臂与细菌的基因组序列同源。在一些情况下,第一和第二同源臂与真菌的基因组序列同源。在一些情况下,第一和第二同源臂与真核细胞的基因组序列同源。
在一些情况下,本文所述的任何核酸内切酶方法可以进一步包括将DNA修复模板引入细胞。DNA修复模板可以包括双链DNA片段。双链DNA片段可以侧接有一个单链DNA片段。双链DNA片段可以侧接有两个单链DNA片段。在一些情况下,单链DNA片段与双链DNA片段的5'端缀合。在一些情况下,单链DNA片段与双链DNA片段的3'端缀合。
在一些情况下,单链DNA片段具有1至15个核苷酸碱基的长度。在一些情况下,单链DNA片段具有4至10个核苷酸碱基的长度。在一些情况下,单链DNA片段具有4个核苷酸碱基的长度。在一些情况下,单链DNA片段具有5个核苷酸碱基的长度。在一些情况下,单链DNA片段具有6个核苷酸碱基的长度。在一些情况下,单链DNA片段具有7个核苷酸碱基的长度。在一些情况下,单链DNA片段具有8个核苷酸碱基的长度。在一些情况下,单链DNA片段具有9个核苷酸碱基的长度。在一些情况下,单链DNA片段具有10个核苷酸碱基的长度。
在一些情况下,单链DNA片段具有与间隔子序列内的序列互补的核苷酸序列。在一些情况下,双链DNA序列包括条形码、开放阅读框、增强子、启动子、蛋白质编码序列、miRNA编码序列、RNA编码序列或转基因。
在一些情况下,本文所述的序列同一性可以通过BLASTP、CLUSTALW、MUSCLE或MAFFT算法,或具有Smith-Waterman同源性搜索算法参数的CLUSTALW算法来测定。可以通过所述BLASTP同源性搜索算法使用字长(W)为3、期望值(E)为10的参数和BLOSUM62评分矩阵(在存在11、扩展1时设置间隙成本),并且使用条件组成得分矩阵调整来测定序列同一性。
本公开的系统或方法可以用于各种应用,例如核酸编辑(例如,基因编辑)、与核酸分子结合(例如,序列特异性结合)。此类系统或方法可以用于例如解决(例如,去除或替换)可能引起受试者的疾病的遗传突变,使基因灭活以便确定其在细胞中的功能,作为检测致病遗传元件的诊断工具(例如通过裂解逆转录病毒RNA或编码致病突变的扩增DNA序列),作为灭活酶与探针结合以靶向和检测特定核苷酸序列(例如编码细菌抗生素抗性的序列),通过靶向病毒基因组使病毒灭活或无法感染宿主细胞,添加基因或修改代谢途径来对生物体进行工程化以产生有价值的小分子、大分子或次级代谢物,建立用于进化选择的基因驱动元件,作为生物传感器检测外来小分子和核苷酸对细胞的干扰。
实例
实例1-在TCAR基因座处编辑
开发了一种使用本文所述核酸酶生产CAR-T细胞(以及其他携带异源T细胞受体的T细胞样细胞)的工作流程(图1)。因此,开发了用于靶向T细胞受体基因座(例如,TRAC基因座)的核酸酶复合物。开发间隔子序列(SEQ ID NO:10-15)以靶向TRAC基因与2类、II型核酸内切酶MG3-6(SEQ ID NO:1)或SpCas9或2类V型核酸内切酶MG29-1(SEQ ID NO:7)的组合,并将其引入每种酶的对应sgRNA中(见表1)。组装包括每个靶向sgRNA的TRAC的RNP复合物,并将其核转染到人T细胞(200,000个具有Lonza 4-D Nucleofector的T细胞,使用程序EO-115和P3缓冲液)中,所述人T细胞在通过使用(干细胞技术公司(Stemcell Technologies)人T细胞分离试剂盒#17951)的阴性选择和CD2/3/28珠激活从PBMC纯化后培养了四天(美天旎公司(Miltenyi)T细胞激活/扩增试剂盒#130-091-441)。通过下一代测序(NGS)分析细胞中TRAC基因的插入和缺失形成(图2左侧)以及通过流式细胞术与模拟转染的T细胞一起进行TCR表达(图2右侧)。NGS和流式细胞术的分析指示,MG3-6和MG29-1在诱导转染的T细胞中T细胞受体表达的插入和缺失形成或破坏方面与SpCas9相当或更好。
接下来,测试了使用上述RNP复合物进行编辑以促进CAR-T分子靶向整合到TRAC基因座中的能力。开发了包括核苷酸序列的AAV-6载体,所述核苷酸序列包括侧接有靶向TRAC基因的5'和3'同源臂(例如SEQ ID NO:23-24)的CAR-T分子。如上所述使用MG29-1 RNP进行TRAC靶向,但随后在转染后将100,000个AAV-6载体的载体基因组(vg)添加到T细胞中。使用流式细胞术分析细胞的TCR受体和CAR抗原结合结构域的表达(图3)。流式细胞术指示,用AAV核酸内切酶组合处理的大约60%的T细胞表达CAR抗原结合结构域。在将靶向TRAC的MG3-6和MG3-8 RNP与AAV-6/CAR-T整合构建体组合的实验中获得了类似的结果。
实例2-在TCR样细胞中进行多重编辑
结合TRAC基因座的修饰(例如,CAR-T整合)来修饰其它基因可能是有利的。因此,测定了本文所述的核酸酶复合物靶TRAC加上另外的基因座的能力。一个此类基因座是NR3C1(也称为GR或糖皮质激素受体)基因座,其可能有利于破坏以赋予CAR-T细胞对糖皮质激素药物的非反应性(例如,在癌症患者同时接受糖皮质激素治疗的情况下,或在癌症患者患有需要糖皮质激素维持的自身免疫性病症的情况下)。设计了三个MG29-1相容的靶向序列(靶B-D;SEQ ID NO:20、21、22)以靶向NR3C1基因,并将其结合到MG29-1向导RNA中。组装包括MG29-1和这些向导RNA的RNP复合物。通过用上述MG29-1/NR3C1-gRNA-RNP复合物和MG3-6/TRAC-RNP的各种组合进行核转染来处理T细胞(图4)。使用NGS对核感染后的细胞进行分析,以评估每个基因座中的插入和缺失形成。结果指示,虽然不同的向导RNA具有不同的靶向NR3C1的效率(参见“MG29-1 GR-13”、“MG29-1 GR-28”、“MG29-1 GR-29”),但靶向TRAC的MG3-6复合物和靶向NR3C1的MG29-1复合物的组合能够有效地诱导两个基因中的插入和缺失形成(参见图4中最右边的三个条件)。
已经建立了使用本文所述的核酸酶复合物靶向两个不同基因座的能力,靶向三个基因座(例如选自TRAC、基因座B-29/SEQ ID NO:16、基因座C-87/SEQ ID NO:17、基因座C-74/SEQ ID NO:18或基因座C-83/SEQ ID NO:19)的能力通过如上所述将对应于每个基因座的RNP单独或以三个的组合核转染到T细胞中并评估NGS的插入和缺失形成来评估(图5)。该实验的结果指示,即使在结合针对不同基因座的三种不同RNP的条件下,所有三个基因座中的插入和缺失都以可观的量产生。
实例3-具有多基因替代的多重编辑
在建立了编辑多个基因座并将转基因整合到至少一个基因座的能力后,通过编辑T细胞内的两个不同基因座并提供靶向两个不同基因座的两个不同的供体DNA模板来测试同时编辑两个或更多个基因位并同时整合两个基因座中的基因的能力。选择AAVS1(安全港)基因座和上述TRAC基因座作为靶位点。如实例1和2中制备的原代T细胞(2x105)用下列物质的组合进行核转染:(a)SpCas9(12pmol)和靶向AAVS1基因座的相容sgRNA(60pmol,SEQID NO:41表示间隔子序列)以及(b)MG3-6(52pmol)以及相容TRAC3-6 6sgRNA(60pmol,SEQID NO:10)。在核感染之后,将细胞与两种不同的AAV-6载体温育,每种载体的感染复数(MOI)为50,000:(a)一种携带转基因,所述转基因包括GR的4种不同同种型(GRα、GRβ、GR-αD3和GR-βD3)中的每一种,所述同种型侧接有靶向AAVS1基因座的5'和3'同源臂(SEQ IDNO:42、43);以及(b)一种携带CAR,其侧接有靶向TRAC基因座的5'和3'同源臂(SEQ ID NO:23-24)。温育四天后,通过以下方法分析T细胞:(a)在AAVS1基因座处存在GR转基因的PCR(参见图6的PCR设计和结果)或(b)CAR抗原结合结构域和T细胞受体的流式细胞术,以评估CAR在TRAC基因座处的整合(图7)。来自PCR和流式细胞术实验的数据指示,两种转基因(GR和CAR)能够同时插入,而没有明显的性能损失;在双重AAVS1/TCR靶向条件下GR转基因的PCR(中间四条泳道,图6B)示出与单独AAVS1靶向相似的整合结果(最后四条泳道,图7B或中间四条泳道,图7C),而TCR的流式细胞术(图7A、7B、7C、7D)示出CAR的高度整合和TCR的损失,即使同时靶向AAVS1。
实例4-通过全基因组脱靶双链断裂分析的特异性分析
MG3-6、MG3-8和MG29-1的靶特异性经由全基因组脱靶双链断裂分析和SpCas9(“Cas9”)进行评估。结果呈现于图8中。结果指示,MG3-6、MG3-8和MG29-1的脱靶编辑水平低于Cas9。
实例5-在T细胞中进行多重编辑
制造基于重组TCR的T细胞产物可能需要将新的、所需的TCR的α链和β链引入T细胞池中,因为a/b链是TCR的亚基,可以给予抗原特异性识别。然后,这些新的a/b链可以与δ/γ/ε链组装以形成活性的、完整的TCR(参见图9)。不幸的是,在这种简单的情况下,现有的a/b链仍然在接受者细胞中表达。这引入了一种不期望的可能性,即现有的α可以与新的β配对,并且新的α可以和现有的β配对,例如,新的、期望的TCR a/b链不知道它们“应该”配对在一起。如果没有进一步的行动,T细胞现在将表达四种不同的TCR(a/b、a'/b、a/b'、a'/b'),其中一种具有工程化特异性。这导致了两个问题:i)其将新的、期望的TCR的表达减少了四倍;ii)两个杂交a/b对(a'/b和a/b')具有自身免疫的风险,因为它们将以不可预测的、潜在的自反应方式识别抗原。
在该实验中,用CD2/3/28珠扩增的原代T细胞使用Lonza 4D电穿孔仪和溶液P3在每种条件下使用200K细胞进行核转染,递送104pmol的MG3-6蛋白和128pmol的向导RNA或相同量的V型酶MG29-1或MG3-6和MG29-1。使用的MG3-6向导为MG3-6-TRAC-6(SEQ ID NO:44)以及MG3-6-TRBC(SEQ ID NO:45);长度为22nt。3天后从这些细胞中采集基因组DNA,并通过NGS进行分析(参见图10)。图10的结果展示了具有插入和缺失的所靶向位点的序列的百分比,表明当靶向两个位点的RNP同时引入细胞中时,在这些细胞中存在双重TRAC/TRBC敲除。
实例6-单基因敲除的流式细胞术基因编辑结果
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PBMC(外周血单核细胞)中纯化原代T细胞。使用Lonza 4D电穿孔仪将RNP(100pmol蛋白质和150pmol向导RNA)的核转染执行到T细胞(200,000)中。为了通过流式细胞术进行分析,核转染后3天,将100,000个T细胞用抗CD3和抗B2M抗体在4C下染色30分钟,并且在Attune Nxt流式细胞仪上进行分析(图11)。图11示出了包括评估TCR和B2M的敲除的4种表型中的每一种的分析细胞的百分比,展示:(a)所有TCR靶向条件都高效地产生TCR敲除,其中MG3-6 TRAC6和MG3-6 TRBC E2sgRNA产生最高效的TCR敲除;并且(b)所有B2M靶向条件都产生B2M敲除,其中B2M H1和B2MD2产生最高效的B2M敲除。
实例7-双基因敲除的流式细胞术基因编辑结果
在实例6中单独评估TCR/B2M靶向条件的性能后,还测试了使用条件组合的同时双重破坏用于TRAC和B2M靶向(图12)。根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PBMC中纯化原代T细胞。使用Lonza4D电穿孔仪将RNP(100pmol蛋白质和150pmol向导RNA)的核转染执行到T细胞(200,000)中。为了通过流式细胞术进行分析,核转染后3天,将100,000个T细胞用抗CD3和抗B2M抗体在4C下染色30分钟,并且在Attune Nxt流式细胞仪上进行分析(图12)。图12示出了包括评估TCR和B2M的敲除的4种表型中的每一种的分析细胞的百分比,展示最高效的双重靶向条件是A4、B4和C4,涉及MG3-6 TRAC6条件和MG29-1 B2M H1、D2或A3条件。最高效的双重靶向条件似乎是B4,其使用MG3-6 TRAC6sgRNA和MG29-1 B2M D2sgRNA。
实例8-三基因敲除的流式细胞术基因编辑结果
在实例6中单独和实例7中双重评估TCR/B2M靶向条件的性能后,还测试了使用条件组合的同时双重破坏用于同时TRAC、TRBC和B2M靶向。根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PBMC中纯化原代T细胞。使用Lonza 4D电穿孔仪将RNP(100pmol蛋白质和150pmol向导RNA)的核转染执行到T细胞(200,000)中。为了通过流式细胞术进行分析,核转染后3天,将100,000个T细胞用抗CD3和抗B2M抗体在4C下染色30分钟,并且在AttuneNxt流式细胞仪上进行分析(图13)。流式细胞术结果指示,条件B2、E1和F1是最高效的敲除三重靶向条件。
采集细胞,并且在转染后五天制备基因组DNA。生成适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单个靶序列。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图14)。此处的测序结果与图13中的结果冲突,因为插入和缺失可能不一定反映基因的功能破坏(如通过流式细胞术测定的)。
表3:实例8中使用的gRNA组合
/>
因此,进行另外的分析(见图15)以通过测序验证三重敲除细胞的产生。证明三重敲除细胞成功产生的数据在图15中示出。“编辑”列中的数据取自图14,而“野生型”列中数据为100%减去编辑百分比。双重和三重敲除的最小(Min.)频率是在假设单个细胞中编辑事件之间的可能重叠最小的情况下计算的。因此,TRBC与B2M之间的最小双重敲除频率是100%减去TRBC的野生型细胞的百分比和减去B2M的野生型的细胞的百分比。因此,最小三重敲除频率是100%减去可能不包括双重敲除的细胞的百分比减去TRAC的野生型细胞的百分比。观察到的高编辑频率排除了所有编辑事件发生在单独细胞中的可能性。因此,图15中的数据表明成功地产生了三重敲除TRAC/TRBC/B2M细胞。
实例9-GFP和表面标志物在编辑的T细胞中的表达
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PBMC中纯化原代人T细胞。使用Lonza 4D电穿孔仪将MG3-6 mRNA(500ng/150pmol向导)、MG29-1 RNP(100pmol/150pmol向导)和/或SpCas9 RNP(12pmol/60pmol向导)的核转染执行到T细胞(200,000)中。核转染后,细胞立即在包括AAV-6(50,000MOI)的培养基中回收。使用的AAV载体包括:(a)AAV载体,所述AAV载体递送MSCV启动子驱动的截短的低亲和力神经生长因子受体(tLNGFR)编码序列,所述序列侧接有与MG3-6-TRAC-6的切割位点相对应的同源臂(SEQ ID NO:64)或MG29-1-TRAC-35(SEQ ID NO:65);以及(b)AAV载体,所述AAV载体递送编码GFP的MND启动子驱动的多顺反子构建体以及上皮生长因子受体的截短版本(tEGFR),所述tEGFR侧接有与Mali等人AAVS1 T2的切割位点相对应的同源臂(SEQ ID NO:63)。转染后四天,对100,000个细胞进行活力染色(活/死固定水性细胞染色试剂盒;赛默飞世尔科技公司(ThermoFisherScientific))和tLNGFR(CD271)的表达(VioBlue REAfinityTM,克隆REA844;美天旎生物技术公司(Miltenyi Biotech))、tEGFR(西妥昔单抗生物仿制药(Cetuximab Biosimilar),647,克隆Hu1;R&D系统公司(R&D Systems))和TCR a/b(Brilliant Violet785,克隆IP26;百进生物公司(BioLegend))。将细胞在4℃下染色30分钟,并在Attune NxT流式细胞仪上获取数据。表达tLNGFR、GFP、tEGFR和/或TCR a/b的细胞在单个活细胞上门控(图16)。
实例10-在编辑的T细胞中在AAVS1位点的插入和缺失分析
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PBMC中纯化原代T细胞。使用Lonza 4D电穿孔仪将MG3-6 mRNA(500ng/150pmol向导)、MG29-1 RNP(100pmol/150pmol向导)和/或SpCas9 RNP(12pmol/60pmol向导)的核转染执行到T细胞(200,000)中。核转染后,细胞立即在包括AAV-6(50,000MOI)的培养基中回收。所使用的AAV载体包括侧接有与MG3-6-TRAC-6或MG29-1-TRAC-35的切割位点相对应的同源臂的MSCV启动子驱动的上皮生长因子受体的截短版本(tLNGFR)编码序列、编码GFP的MND启动子驱动多顺反子构建体、以及侧接有与Mali等人AAVS1 T2的切割位点相对应的同源臂的上皮生长因子受体的截短的版本(tEGFR)。采集细胞,并且在转染后四天制备基因组DNA。产生、优化并用于扩增包括这些实验中使用的不同AAVS1位点特异性RNA向导的靶位点的区的适合用于基于NGS的DNA测序的PCR引物。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图17)上的推定结合区。结果表明,TRAC和AAVS1最高效的双重靶向条件是涉及MG29-1与sgRNA F3和MG3-6与sgRNA TRAC3-6#6的条件。
虽然本文已经示出并描述了本发明的优选实施例,但是对于本领域的技术人员将显而易见的是,这些实施例仅以实例的方式提供。本发明不旨在受说明书中提供的具体实施例的限制。虽然已参考前述说明书描述本发明,但本文实施例的描述和说明不打算以限制性意义进行。在不脱离本发明的情况下,所属领域的技术人员现在将意识到许多变型、变化和替代物。此外,应当理解,本发明的全部方面不限于本文所阐述的具体描述、配置或相对比例,其取决于各种条件和变量。应理解,本文所描述的本发明的实施例的各个替代方案都可以用于实践本发明。因此,经考虑本发明应同样涵盖任何这类替代方案、修改、变型或等效物。所附权利要求书旨在限定本发明的范围,并且由此覆盖这些权利要求和其等效物的范围内的方法和结构。
序列表
<110> 宏基因组学公司(METAGENOMI, INC.)
<120> 用CAS酶进行多重编辑
<130> 55921-719.601
<140>
<141>
<150> 63/241,916
<151> 2021-09-08
<150> 63/186,506
<151> 2021-05-10
<150> 63/163,510
<151> 2021-03-19
<160> 65
<170> PatentIn 3.5版
<210> 1
<211> 1132
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:MG3-6蛋白序列(2类II型)
<400> 1
Met Ser Ala Asp Ser Leu Asn Tyr Arg Ile Gly Val Asp Val Gly Asp
1 5 10 15
Arg Ser Val Gly Leu Ala Ala Ile Glu Leu Asp Asp Asp Gly Phe Pro
20 25 30
Leu Lys Lys Leu Ala Met Val Thr Phe Arg His Asp Gly Gly Lys Asp
35 40 45
Pro Ala Thr Gly Lys Thr Pro Lys Ser Arg Lys Glu Thr Ala Gly Val
50 55 60
Ala Arg Arg Thr Met Arg Met Arg Arg Arg Lys Lys Lys Arg Leu Lys
65 70 75 80
Asp Leu Asp Lys Lys Leu Arg Asp Leu Gly Tyr Phe Val Pro Arg Asp
85 90 95
Glu Glu Pro Gln Thr Tyr Glu Ala Trp Ser Ser Arg Ala Arg Leu Ala
100 105 110
Glu Ser Arg Phe Glu Asp Pro His Glu Arg Gly Glu His Leu Val Arg
115 120 125
Ala Val Arg His Met Ala Arg His Arg Gly Trp Arg Asn Pro Trp Trp
130 135 140
Ser Phe Ser Gln Leu Glu Glu Ala Ser Gln Glu Pro Ser Glu Thr Phe
145 150 155 160
Gly Arg Ile Leu Glu Arg Ala Gln His Glu Trp Gly Glu Arg Val Ser
165 170 175
Asp Asn Ala Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Asn
180 185 190
Ile Leu Leu Arg Pro Arg Arg Tyr Glu His Asn Pro Lys Thr Gly Lys
195 200 205
Asn Ala Glu Lys Leu Asn Val Arg Gly Gln Glu Pro Ile Leu Leu Asp
210 215 220
Lys Val Arg Gln Glu Asp Val Leu Ala Glu Leu Arg Arg Ile Cys Lys
225 230 235 240
Val Gln Gly Ile Glu Asp Gln Tyr Pro Glu Leu Ala His Ala Val Phe
245 250 255
Thr Gln Val Arg Pro Tyr Val Pro Thr Glu Arg Val Gly Lys Asp Pro
260 265 270
Leu Gln Pro Met Lys Ile Arg Ala Ser Arg Ala Ser Leu Glu Phe Gln
275 280 285
Glu Phe Arg Ile Arg Asp Ala Val Ala Asn Leu Arg Ile Arg Val Gly
290 295 300
Gly Ser Glu Arg Arg Pro Leu Thr Glu Glu Glu Tyr Asp Arg Ala Val
305 310 315 320
Asp Tyr Leu Met Glu Tyr Ser Asp Thr Thr Pro Pro Thr Trp Gly Glu
325 330 335
Val Ala Asp Glu Leu Glu Ile Ala Glu Asn Thr Leu Ile Ala Pro Val
340 345 350
Ile Asp Asp Val Arg Leu Asn Val Ala Pro Tyr Asp Arg Ser Ser Ala
355 360 365
Ile Val Glu Ala Lys Leu Lys Arg Lys Thr Gln Ala Arg Gln Trp Trp
370 375 380
Asp Asp Asp Ala Asn Leu Asp Leu Arg Ser Gln Leu Ile Leu Leu Val
385 390 395 400
Ser Asp Ala Thr Asp Asp Thr Ala Arg Val Ala Glu Asn Ser Gly Leu
405 410 415
Leu Glu Val Phe Glu Ser Trp Ser Asp Glu Glu Lys Gln Thr Leu Gln
420 425 430
Asp Leu Lys Phe Asp Ser Gly Arg Ala Ala Tyr Ser Ile Asp Thr Leu
435 440 445
Asn Lys Leu Asn Ala Tyr Met His Glu His Arg Val Gly Leu His Glu
450 455 460
Ala Arg Gln Asn Val Phe Gly Val Ser Asp Thr Trp Arg Pro Pro Arg
465 470 475 480
Asp Arg Leu Asp Glu Pro Thr Gly Gln Pro Thr Val Asp Arg Val Leu
485 490 495
Thr Ile Val Arg Arg Phe Ile Leu Asp Cys Glu Arg Ala Trp Gly Arg
500 505 510
Pro Gln Lys Ile Val Val Glu His Ala Arg Thr Gly Leu Met Gly Pro
515 520 525
Ser Gln Arg Ala Asp Val Leu Lys Glu Ile Ala Arg Asn Arg Asn Ala
530 535 540
Asn Glu Arg Ile Arg Gln Glu Leu Arg Glu Gly Gly Ile Glu Ala Pro
545 550 555 560
Asn Arg Ala Asp Ile Arg Arg Asn Ser Ile Ile Gln Asp Gln Glu Ser
565 570 575
Gln Cys Leu Tyr Cys Gly Lys Glu Ile Gly Val Leu Thr Ala Glu Leu
580 585 590
Asp His Ile Val Pro Arg Ala Gly Gly Gly Ser Ser Lys Arg Glu Asn
595 600 605
Leu Ala Ala Val Cys Arg Ala Cys Asn Ala Ser Lys Gly Ser Arg Pro
610 615 620
Phe Ala Val Trp Ala Gly Pro Ala Arg Leu Glu Arg Thr Ile Gln Arg
625 630 635 640
Leu Arg Glu Leu Gln Ala Phe Lys Thr Lys Ser Lys Lys Arg Thr Leu
645 650 655
Asn Ala Ile Ile Arg Arg Leu Lys Gln Arg Glu Glu Asp Glu Pro Ile
660 665 670
Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr Ala Ala Thr Ser Ile Arg
675 680 685
Glu Arg Leu Glu Gln His Phe Asn Asp Asp Leu Pro Asp Gly Phe Ala
690 695 700
Pro Val Ala Val Asp Val Tyr Gly Gly Ser Leu Thr Arg Glu Ser Arg
705 710 715 720
Arg Ala Gly Gly Ile Asp Lys Ser Ile Met Leu Arg Gly Gln Ser Asp
725 730 735
Lys Asn Arg Phe Asp Val Arg His His Ala Ile Asp Ala Ala Val Met
740 745 750
Thr Leu Leu Asn Pro Ser Val Ala Val Thr Leu Glu Gln Arg Arg Met
755 760 765
Leu Lys Gln Glu Asn Asp Tyr Ser Ser Pro Arg Gly Gln His Asp Asn
770 775 780
Gly Trp Arg Asp Phe Ile Gly Arg Gly Glu Ala Ser Gln Ser Lys Phe
785 790 795 800
Leu His Trp Lys Lys Thr Ala Val Val Leu Ala Asp Leu Ile Ser Glu
805 810 815
Ala Ile Glu Gln Asp Thr Ile Pro Val Val Asn Pro Leu Arg Leu Arg
820 825 830
Pro Gln Asn Gly Ser Val His Lys Asp Thr Val Glu Ala Val Leu Glu
835 840 845
Arg Thr Val Gly Asp Ser Trp Thr Asp Lys Gln Val Ser Arg Ile Val
850 855 860
Asp Pro Asn Thr Tyr Ile Ala Phe Leu Ser Leu Leu Gly Arg Lys Lys
865 870 875 880
Glu Leu Asp Ala Asp His Gln Arg Leu Val Ser Val Ser Ala Gly Val
885 890 895
Lys Leu Leu Ala Asp Glu Arg Val Gln Ile Phe Pro Glu Glu Ala Ala
900 905 910
Ser Ile Leu Thr Pro Arg Gly Val Val Lys Ile Gly Asp Ser Ile His
915 920 925
His Ala Arg Leu Tyr Gly Trp Lys Asn Gln Arg Gly Asp Ile Gln Val
930 935 940
Gly Met Leu Arg Val Phe Gly Ala Glu Phe Pro Trp Phe Met Arg Glu
945 950 955 960
Ser Gly Val Lys Asp Ile Leu Arg Val Pro Ile Pro Gln Gly Ser Gln
965 970 975
Ser Tyr Arg Asp Leu Ala Ala Thr Thr Arg Lys Phe Ile Glu Asn Gly
980 985 990
Gln Ala Thr Glu Phe Gly Trp Ile Thr Gln Asn Asp Glu Ile Glu Ile
995 1000 1005
Ser Ala Glu Glu Tyr Leu Ala Thr Asp Lys Gly Asp Ile Leu Ser
1010 1015 1020
Asp Phe Leu Gly Ile Leu Pro Glu Ile Arg Trp Lys Val Thr Gly
1025 1030 1035
Ile Glu Asp Asn Arg Arg Ile Arg Leu Arg Pro Leu Leu Leu Ser
1040 1045 1050
Ser Glu Ala Ile Pro Asn Met Leu Asn Gly Arg Leu Leu Thr Gln
1055 1060 1065
Glu Glu His Asp Leu Ile Ala Leu Val Ile Asn Lys Gly Val Arg
1070 1075 1080
Val Val Val Ser Thr Phe Leu Ala Leu Pro Ser Thr Lys Ile Ile
1085 1090 1095
Arg Arg Asn Asn Leu Gly Ile Pro Arg Trp Arg Gly Asn Gly His
1100 1105 1110
Leu Pro Thr Ser Leu Asp Ile Gln Arg Ala Ala Thr Gln Ala Leu
1115 1120 1125
Glu Gly Arg Asp
1130
<210> 2
<211> 7
<212> RNA
<213> 未知
<220>
<223> 对未知的描述:具有sgRNA的MG3-6共有3' PAM
<220>
<221> modified_base
<222> (1)..(2)
<223> a、c、u、g、未知或其它
<400> 2
nnrgryy 7
<210> 3
<211> 110
<212> RNA
<213> 未知
<220>
<223> 对未知的描述:MG3-6 sgRNA
<220>
<221> modified_base
<222> (1)..(22)
<223> a、c、u、g、未知或其它
<400> 3
nnnnnnnnnn nnnnnnnnnn nnguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110
<210> 4
<211> 1132
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:MG3-8蛋白序列(2类II型)
<400> 4
Met Ser Thr Asp Met Lys Asn Tyr Arg Ile Gly Val Asp Val Gly Asp
1 5 10 15
Arg Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Ala Gly Phe Pro
20 25 30
Ile Gln Lys Leu Ala Leu Val Thr Phe Arg His Asp Gly Gly Leu Asp
35 40 45
Pro Thr Asp Asn Pro Lys Ser Arg Lys Glu Thr Arg Gly Glu Ala Arg
50 55 60
Arg Arg Met Arg Met Thr Arg Arg Arg Lys Gln Arg Leu Arg Asp Leu
65 70 75 80
Asp Lys Val Leu Glu Asn Leu Gly Tyr Thr Val Pro Glu Gly Pro Glu
85 90 95
Pro Glu Thr Tyr Glu Ala Trp Thr Ser Arg Ala Leu Leu Ala Ser Ile
100 105 110
Lys Leu Ala Ser Ala Asp Glu Leu Asn Glu His Leu Val Arg Ala Val
115 120 125
Arg His Ile Ala Arg His Arg Gly Trp Val Asn Pro Trp Trp Ser Leu
130 135 140
Asp Gln Leu Glu Arg Ala Ser Gln Glu Pro Ser Glu Thr Phe Glu Ile
145 150 155 160
Ile Leu Ala Arg Ala Arg Glu Leu Phe Gly Glu Arg Val Pro Ala Asn
165 170 175
Pro Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Glu Val Leu
180 185 190
Leu Arg Pro Arg Ala Glu Lys Lys Lys Lys Thr Gly Tyr Val Arg Gly
195 200 205
Thr Pro Leu Leu Ala Ala Gln Val Arg Gln Ile Asp Gln Val Ala Glu
210 215 220
Leu Arg Arg Ile Cys Glu Val Gln Gly Ile Glu Glu Gln Tyr Glu Thr
225 230 235 240
Leu Arg Asn Ala Ile Phe Ala His Lys Val Ala Tyr Val Pro Thr Glu
245 250 255
Arg Val Gly Lys Asp Pro Leu Ala Pro Ser Lys Asn Arg Thr Ile Arg
260 265 270
Ala Ser Leu Glu Phe Gln Glu Phe Arg Ile Leu Asp Ser Val Ala Asn
275 280 285
Leu Arg Val Arg Thr Asp Ser Arg Ala Lys Arg Glu Leu Thr Glu Gly
290 295 300
Glu Tyr Asp Ala Ala Val Glu Phe Leu Met Gly Tyr Thr Ala Lys Glu
305 310 315 320
Gln Pro Ser Trp Ala Asp Val Ala Glu Glu Ile Gly Val Pro Gly Asn
325 330 335
Arg Leu Ile Ala Pro Val Leu Glu Asp Val Gln Gln Lys Thr Ala Pro
340 345 350
Phe Asp Arg Ser Ser Ala Ala Phe Glu Lys Ala Met Ser Lys Arg Thr
355 360 365
Glu Ala Arg Gln Trp Trp Glu Ala Asn Asp Asp Asp Gln Leu Arg Ser
370 375 380
Leu Phe Ile Met Phe Leu Ala Asp Ala Thr Asn Asp Thr Glu Glu Ala
385 390 395 400
Ala Ala Val Ala Gly Leu Pro Glu Leu Tyr Met Ser Trp Pro Ala Glu
405 410 415
Glu Arg Glu Ala Leu Ser Asn Ile Asp Phe Glu Lys Gly Arg Val Ala
420 425 430
Tyr Ser His Glu Thr Leu Ser Lys Leu Ser Glu Tyr Met His Glu His
435 440 445
Arg Val Gly Leu His Glu Ala Arg Lys Ala Val Phe Gly Val Asp Asp
450 455 460
Thr Trp Arg Pro Pro Leu Ala Lys Leu Glu Glu Pro Thr Gly Gln Pro
465 470 475 480
Thr Val Asp Arg Val Leu Thr Ile Leu Arg Arg Phe Val Leu Asp Cys
485 490 495
Glu Arg Gln Trp Gly Arg Pro Arg Ala Ile Thr Val Glu His Ala Arg
500 505 510
Ile Gly Leu Val Gly Pro Ala Gln Arg Gln Asn Ile Leu Lys Glu Gln
515 520 525
Glu Asp Asn Arg Lys Asn Asn Glu Cys Ile Arg Asp Glu Leu Arg Lys
530 535 540
Ser Gly Val Glu Asn Pro Ser Arg Thr Glu Val Arg Arg His Leu Val
545 550 555 560
Val Gln Asp Gln Glu Ser Gln Cys Leu Tyr Cys Gly Ala Val Ile Arg
565 570 575
Thr Asp Thr Ser Glu Leu Asp His Ile Val Pro Arg Ala Gly Gly Gly
580 585 590
Ser Ser Arg Arg Glu Asn Leu Ala Ala Val Cys Arg Tyr Cys Asn Ser
595 600 605
Lys Lys Asp Arg Thr Leu Phe Tyr Asp Trp Ala Gly Ser Val Arg Leu
610 615 620
Gln Glu Thr Ile Asp Arg Val Arg Gln Leu Lys Ala Phe Lys Asp Ser
625 630 635 640
Lys Lys Ala Lys Met Phe Lys Asn Gln Ile Arg Arg Leu Arg Gln Thr
645 650 655
Glu Ala Asp Glu Pro Ile Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr
660 665 670
Ala Ala Val Ala Val Arg Glu Arg Leu Glu Gln His Phe Asn Glu Gly
675 680 685
Leu Ala Pro Asp Asp Lys Asn Arg Val Val Leu Asp Val Tyr Ala Gly
690 695 700
Ser Val Thr Arg Glu Ser Arg Arg Ala Gly Gly Ile Asp Glu Arg Ile
705 710 715 720
Leu Leu Arg Gly Glu Arg Asp Lys Asn Arg Phe Asp Val Arg His His
725 730 735
Ala Ile Asp Ala Ala Val Met Thr Leu Leu Asn Arg Ser Val Ala Leu
740 745 750
Thr Leu Glu Gln Arg Ser Gln Leu Arg Arg Ala Phe Tyr Glu Gln Gly
755 760 765
Leu Asp Lys Leu Asp Arg Asp Gln Leu Lys Pro Glu Glu Asp Trp Arg
770 775 780
Asn Phe Ile Gly Leu Ser Leu Ala Ser Gln Glu Lys Phe Leu Glu Trp
785 790 795 800
Lys Lys Val Thr Thr Val Leu Gly Asp Leu Leu Ala Glu Ala Ile Glu
805 810 815
Asp Asp Ser Ile Ala Val Val Ser Pro Leu Arg Leu Arg Pro Gln Asn
820 825 830
Gly Arg Val His Lys Asp Thr Ile Ala Ala Val Lys Lys Gln Thr Leu
835 840 845
Gly Ser Ala Trp Ser Ala Asp Ala Val Lys Arg Ile Val Asp Pro Glu
850 855 860
Ile Tyr Leu Ala Met Lys Asp Ala Leu Gly Lys Ser Lys Val Leu Pro
865 870 875 880
Glu Asp Ser Ala Arg Thr Leu Glu Leu Ser Asp Gly Arg Tyr Leu Glu
885 890 895
Ala Asp Asp Glu Val Leu Phe Phe Pro Lys Asn Ala Ala Ser Ile Leu
900 905 910
Thr Pro Arg Gly Val Ala Glu Ile Gly Gly Ser Ile His His Ala Arg
915 920 925
Leu Tyr Ser Trp Leu Thr Lys Lys Gly Glu Leu Lys Ile Gly Met Leu
930 935 940
Arg Val Tyr Gly Ala Glu Phe Pro Trp Leu Met Arg Glu Ser Gly Ser
945 950 955 960
His Asp Val Leu Arg Met Pro Ile His Pro Gly Ser Gln Ser Phe Arg
965 970 975
Asp Met Gln Asp Thr Thr Arg Lys Ala Val Glu Ser Ser Glu Ala Val
980 985 990
Glu Phe Ala Trp Ile Thr Gln Asn Asp Glu Leu Glu Phe Glu Pro Glu
995 1000 1005
Asp Tyr Ile Ala His Gly Gly Lys Asp Glu Leu Arg Gln Phe Leu
1010 1015 1020
Glu Phe Met Pro Glu Cys Arg Trp Arg Val Asp Gly Phe Lys Lys
1025 1030 1035
Asn Tyr Gln Ile Arg Ile Arg Pro Ala Met Leu Ser Arg Glu Gln
1040 1045 1050
Leu Pro Ser Asp Ile Gln Arg Arg Leu Glu Ser Lys Thr Leu Thr
1055 1060 1065
Glu Asn Glu Ser Leu Leu Leu Lys Ala Leu Asp Thr Gly Leu Val
1070 1075 1080
Val Ala Ile Gly Gly Leu Leu Pro Leu Gly Thr Leu Lys Val Ile
1085 1090 1095
Arg Arg Asn Asn Leu Gly Phe Pro Arg Trp Arg Gly Asn Gly Asn
1100 1105 1110
Leu Pro Thr Ser Phe Glu Val Arg Ser Ser Ala Leu Arg Ala Leu
1115 1120 1125
Gly Val Glu Gly
1130
<210> 5
<211> 7
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:MG3-8共有3' PAM
<220>
<221> modified_base
<222> (1)..(2)
<223> a、c、t、g、未知或其它
<400> 5
nnrgrty 7
<210> 6
<211> 110
<212> RNA
<213> 未知
<220>
<223> 对未知的描述:MG3-8 sgRNA
<220>
<221> modified_base
<222> (1)..(22)
<223> a、c、u、g、未知或其它
<400> 6
nnnnnnnnnn nnnnnnnnnn nnguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc ggcuccucuu aggaacgggc gguauguuuu 110
<210> 7
<211> 1280
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:MG29-1(2类V-A型Cas效应子,Cas12a类)蛋白序列
<400> 7
Met Phe Asn Asn Phe Ile Lys Lys Tyr Ser Leu Gln Lys Thr Leu Arg
1 5 10 15
Phe Glu Leu Lys Pro Val Gly Glu Thr Ala Asp Tyr Ile Glu Asp Phe
20 25 30
Lys Ser Glu Tyr Leu Lys Asp Thr Val Leu Lys Asp Glu Gln Arg Ala
35 40 45
Lys Asp Tyr Gln Glu Ile Lys Thr Leu Ile Asp Asp Tyr His Arg Glu
50 55 60
Tyr Ile Glu Glu Cys Leu Arg Glu Pro Val Asp Lys Lys Thr Gly Glu
65 70 75 80
Ile Leu Asp Phe Thr Gln Asp Leu Glu Asp Ala Phe Ser Tyr Tyr Gln
85 90 95
Lys Leu Lys Glu Asn Pro Thr Glu Asn Arg Val Gly Trp Glu Lys Glu
100 105 110
Gln Glu Ser Leu Arg Lys Lys Leu Val Thr Ser Phe Val Gly Asn Asp
115 120 125
Gly Leu Phe Lys Lys Glu Phe Ile Thr Arg Asp Leu Pro Glu Trp Leu
130 135 140
Gln Lys Lys Gly Leu Trp Gly Glu Tyr Lys Asp Thr Val Glu Asn Phe
145 150 155 160
Lys Lys Phe Thr Thr Tyr Phe Ser Gly Phe His Glu Asn Arg Lys Asn
165 170 175
Met Tyr Thr Ala Glu Ala Gln Ser Thr Ala Ile Ala Asn Arg Leu Met
180 185 190
Asn Asp Asn Leu Pro Lys Phe Phe Asn Asn Tyr Leu Ala Tyr Gln Thr
195 200 205
Ile Lys Glu Lys His Pro Asp Leu Val Phe Arg Leu Asp Asp Ala Leu
210 215 220
Leu Gln Ala Ala Gly Val Glu His Leu Asp Glu Ala Phe Gln Pro Arg
225 230 235 240
Tyr Phe Ser Arg Leu Phe Ala Gln Ser Gly Ile Thr Ala Phe Asn Glu
245 250 255
Leu Ile Gly Gly Arg Thr Thr Glu Asn Gly Glu Lys Ile Gln Gly Leu
260 265 270
Asn Glu Gln Ile Asn Leu Tyr Arg Gln Gln Asn Pro Glu Lys Ala Lys
275 280 285
Gly Phe Pro Arg Phe Met Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg
290 295 300
Glu Thr His Ser Phe Leu Pro Asp Ala Phe Glu Asn Asp Lys Glu Leu
305 310 315 320
Leu Gln Ala Leu Arg Asp Tyr Val Asp Ala Ala Thr Ser Glu Glu Gly
325 330 335
Met Ile Ser Gln Leu Asn Lys Ala Met Asn Gln Phe Val Thr Ala Asp
340 345 350
Leu Lys Arg Val Tyr Ile Lys Ser Ala Ala Leu Thr Ser Leu Ser Gln
355 360 365
Glu Leu Phe His Phe Phe Gly Val Ile Ser Asp Ala Ile Ala Trp Tyr
370 375 380
Ala Glu Lys Arg Leu Ser Pro Lys Lys Ala Gln Glu Ser Phe Leu Lys
385 390 395 400
Gln Glu Val Tyr Ala Ile Glu Glu Leu Asn Gln Ala Val Val Gly Tyr
405 410 415
Ile Asp Gln Leu Glu Asp Gln Ser Glu Leu Gln Gln Leu Leu Val Asp
420 425 430
Leu Pro Asp Pro Gln Lys Pro Val Ser Ser Phe Ile Leu Thr His Trp
435 440 445
Gln Lys Ser Gln Glu Pro Leu Gln Ala Val Ile Ala Lys Val Glu Pro
450 455 460
Leu Phe Glu Leu Glu Glu Leu Ser Lys Asn Lys Arg Ala Pro Lys His
465 470 475 480
Asp Lys Asp Gln Gly Gly Glu Gly Phe Gln Gln Val Asp Ala Ile Lys
485 490 495
Asn Met Leu Asp Ala Phe Met Glu Val Ser His Ala Ile Lys Pro Leu
500 505 510
Tyr Leu Val Lys Gly Arg Lys Ala Ile Asp Met Pro Asp Val Asp Thr
515 520 525
Gly Phe Tyr Ala Asp Phe Ala Glu Ala Tyr Ser Ala Tyr Glu Gln Val
530 535 540
Thr Val Ser Leu Tyr Asn Lys Thr Arg Asn His Leu Ser Lys Lys Pro
545 550 555 560
Phe Ser Lys Asp Lys Ile Lys Ile Asn Phe Asp Ala Pro Thr Leu Leu
565 570 575
Asn Gly Trp Asp Leu Asn Lys Glu Ser Asp Asn Lys Ser Ile Ile Leu
580 585 590
Arg Lys Asp Gly Asn Phe Tyr Leu Ala Ile Met His Pro Lys His Thr
595 600 605
Lys Val Phe Asp Cys Tyr Ser Ala Ser Glu Ala Ala Gly Lys Cys Tyr
610 615 620
Glu Lys Met Asn Tyr Lys Leu Leu Ser Gly Ala Asn Lys Met Leu Pro
625 630 635 640
Lys Val Phe Phe Ser Lys Lys Gly Ile Glu Thr Phe Ser Pro Pro Gln
645 650 655
Glu Ile Leu Asp Leu Tyr Lys Asn Asn Glu His Lys Lys Gly Ala Thr
660 665 670
Phe Lys Leu Glu Ser Cys His Lys Leu Ile Asp Phe Phe Lys Arg Asn
675 680 685
Ile Pro Lys Tyr Lys Val His Pro Thr Asp Asn Phe Gly Trp Asp Val
690 695 700
Phe Gly Phe His Phe Ser Pro Thr Ser Ser Tyr Gly Asp Leu Ser Gly
705 710 715 720
Phe Tyr Arg Glu Val Glu Ala Gln Gly Tyr Lys Leu Trp Phe Ser Asp
725 730 735
Val Ser Glu Ala Tyr Ile Asn Lys Cys Val Glu Glu Gly Lys Leu Phe
740 745 750
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Asn Ser Thr Gly Lys
755 760 765
Pro Asn Leu His Thr Leu Tyr Trp Lys Gly Leu Phe Glu Pro Glu Asn
770 775 780
Leu Lys Asp Val Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Tyr
785 790 795 800
Arg Lys His Ser Ile Lys His Glu Asp Lys Thr Ile His Arg Ala Lys
805 810 815
Asp Pro Ile Ala Asn Lys Asn Ala Asp Asn Pro Lys Lys Gln Ser Val
820 825 830
Phe Asp Tyr Asp Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe
835 840 845
Phe Phe His Val Pro Ile Ser Leu Asn Phe Lys Ser Gln Gly Val Val
850 855 860
Arg Phe Asn Asp Lys Ile Asn Gly Leu Leu Ala Ala Gln Asp Asp Val
865 870 875 880
His Val Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu Tyr Tyr Thr
885 890 895
Val Val Asn Gly Lys Gly Glu Val Val Glu Gln Gly Ser Leu Asn Gln
900 905 910
Val Ala Thr Asp Gln Gly Tyr Val Val Asp Tyr Gln Gln Lys Leu His
915 920 925
Ala Lys Glu Lys Glu Arg Asp Gln Ala Arg Lys Asn Trp Ser Thr Ile
930 935 940
Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Leu Ser Gln Val Val His
945 950 955 960
Lys Leu Ala Gln Leu Ile Val Lys His Asn Ala Ile Val Cys Leu Glu
965 970 975
Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln
980 985 990
Val Tyr Gln Lys Phe Glu Lys Ala Leu Ile Asp Lys Leu Asn Tyr Leu
995 1000 1005
Val Phe Lys Glu Arg Gly Ala Thr Gln Ala Gly Gly Tyr Leu Asn
1010 1015 1020
Ala Tyr Gln Leu Ala Ala Pro Phe Glu Ser Phe Glu Lys Leu Gly
1025 1030 1035
Lys Gln Thr Gly Ile Leu Tyr Tyr Val Arg Ser Asp Tyr Thr Ser
1040 1045 1050
Lys Ile Asp Pro Ala Thr Gly Phe Val Asp Phe Leu Lys Pro Lys
1055 1060 1065
Tyr Glu Ser Met Ala Lys Ser Lys Val Phe Phe Glu Ser Phe Glu
1070 1075 1080
Arg Ile Gln Trp Asn Gln Ala Lys Gly Tyr Phe Glu Phe Glu Phe
1085 1090 1095
Asp Tyr Lys Lys Met Cys Pro Ser Arg Lys Phe Gly Asp Tyr Arg
1100 1105 1110
Thr Arg Trp Val Val Cys Thr Phe Gly Asp Thr Arg Tyr Gln Asn
1115 1120 1125
Arg Arg Asn Lys Ser Ser Gly Gln Trp Glu Thr Glu Thr Ile Asp
1130 1135 1140
Val Thr Ala Gln Leu Lys Ala Leu Phe Ala Ala Tyr Gly Ile Thr
1145 1150 1155
Tyr Asn Gln Glu Asp Asn Ile Lys Asp Ala Ile Ala Ala Val Lys
1160 1165 1170
Tyr Thr Lys Phe Tyr Lys Gln Leu Tyr Trp Leu Leu Arg Leu Thr
1175 1180 1185
Leu Ser Leu Arg His Ser Val Thr Gly Thr Asp Glu Asp Phe Ile
1190 1195 1200
Leu Ser Pro Val Ala Asp Glu Asn Gly Val Phe Phe Asp Ser Arg
1205 1210 1215
Lys Ala Thr Asp Lys Gln Pro Lys Asp Ala Asp Ala Asn Gly Ala
1220 1225 1230
Tyr His Ile Ala Leu Lys Gly Leu Trp Asn Leu Gln Gln Ile Arg
1235 1240 1245
Gln His Asp Trp Asn Val Glu Lys Pro Lys Lys Leu Asn Leu Ala
1250 1255 1260
Met Lys Asn Glu Glu Trp Phe Gly Phe Ala Gln Lys Lys Lys Phe
1265 1270 1275
Arg Ala
1280
<210> 8
<211> 4
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:MG29-1共有5' PAM
<220>
<221> modified_base
<222> (4)..(4)
<223> a、c、t、g、未知或其它
<400> 8
tttn 4
<210> 9
<211> 44
<212> RNA
<213> 未知
<220>
<223> 对未知的描述:MG29-1 crRNA
<220>
<221> modified_base
<222> (21)..(44)
<223> a、c、u、g、未知或其它
<400> 9
uaauuucuac uguuguagau nnnnnnnnnn nnnnnnnnnn nnnn 44
<210> 10
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> MG3-6-TRAC-6-22
<400> 10
cgaatcctcc tcctgaaagt gg 22
<210> 11
<211> 20
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> SpyCas9 TRAC-1-20
<400> 11
acaaaactgt gctagacatg 20
<210> 12
<211> 20
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> SpyCas9 TRAC-2-20
<400> 12
agagcaacag tgctgtggcc 20
<210> 13
<211> 20
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> SpyCas9 TRAC-3-20
<400> 13
tctctcagct ggtacacggc 20
<210> 14
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> MG29-1-TRAC-19-22
<400> 14
ttgctccagg ccacagcact gt 22
<210> 15
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> MG29-1-TRAC-35-22
<400> 15
gagtctctca gctggtacac gg 22
<210> 16
<211> 20
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> MG29-1-GR-29-20(NR3C1靶向)
<400> 16
cagcttccac aagttaagac 20
<210> 17
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> MG29-1-ALB-87(白蛋白靶向)
<400> 17
cgcactaagg aaagtgcaaa gt 22
<210> 18
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> MG29-1-ALB-74(白蛋白靶向)
<400> 18
aataaagcat agtgcaatgg at 22
<210> 19
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> MG29-1-ALB-83(白蛋白靶向)
<400> 19
tgagatcaac agcacaggtt tt 22
<210> 20
<211> 20
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> NR3C1间隔子靶序列MG29-1-GR-13-20(“靶B”)
<400> 20
gtctgtggta tacaatttca 20
<210> 21
<211> 20
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> NR3C1间隔子靶序列MG29-1-GR-28-20(“靶C”)
<400> 21
ggaggtggtc ctgttgttgc 20
<210> 22
<211> 20
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> NR3C1间隔子靶序列MG29-1-GR-29-20(“靶D”)
<400> 22
cagcttccac aagttaagac 20
<210> 23
<211> 500
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> 靶向TRAC的CAR 5'同源臂
<400> 23
ttaatgccaa cataccataa acctcccatt ctgctaatgc ccagcctaag ttggggagac 60
cactccagat tccaagatgt acagtttgct ttgctgggcc tttttcccat gcctgccttt 120
actctgccag agttatattg ctggggtttt gaagaagatc ctattaaata aaagaataag 180
cagtattatt aagtagccct gcatttcagg tttccttgag tggcaggcca ggcctggccg 240
tgaacgttca ctgaaatcat ggcctcttgg ccaagattga tagcttgtgc ctgtccctga 300
gtcccagtcc atcacgagca gctggtttct aagatgctat ttcccgtata aagcatgaga 360
ccgtgacttg ccagccccac agagccccgc ccttgtccat cactggcatc tggactccag 420
cctgggttgg ggcaaagagg gaaatgagat catgtcctaa ccctgatcct cttgtcccac 480
agatatccag aaccctgacc 500
<210> 24
<211> 500
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> 靶向TRAC的CAR 3'同源臂
<400> 24
ctgccgtgta ccagctgaga gactctaaat ccagtgacaa gtctgtctgc ctattcaccg 60
attttgattc tcaaacaaat gtgtcacaaa gtaaggattc tgatgtgtat atcacagaca 120
aaactgtgct agacatgagg tctatggact tcaagagcaa cagtgctgtg gcctggagca 180
acaaatctga ctttgcatgt gcaaacgcct tcaacaacag cattattcca gaagacacct 240
tcttccccag cccaggtaag ggcagctttg gtgccttcgc aggctgtttc cttgcttcag 300
gaatggccag gttctgccca gagctctggt caatgatgtc taaaactcct ctgattggtg 360
gtctcggcct tatccattgc caccaaaacc ctctttttac taagaaacag tgagccttgt 420
tctggcagtc cagagaatga cacgggaaaa aagcagatga agagaaggtg gcaggagagg 480
gcacgtggcc cagcctcagt 500
<210> 25
<211> 7
<212> PRT
<213> 猿猴病毒40
<220>
<223> SV40
<400> 25
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 26
<211> 16
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:核质蛋白双组分NLS序列
<400> 26
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 27
<211> 9
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:C-myc NLS序列
<400> 27
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 28
<211> 11
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:C-myc NLS序列
<400> 28
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 29
<211> 38
<212> PRT
<213> 智人(Homo Sapiens)
<220>
<223> hRNPA1 M9 NLS
<400> 29
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 30
<211> 42
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:输入蛋白α IBB结构域序列
<400> 30
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 31
<211> 8
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:肌瘤T蛋白序列
<400> 31
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 32
<211> 8
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:肌瘤T蛋白序列
<400> 32
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 33
<211> 8
<212> PRT
<213> 智人(Homo Sapiens)
<220>
<223> p53
<400> 33
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 34
<211> 12
<212> PRT
<213> 小家鼠(Mus musculus)
<220>
<213> 鼠c-abl IV
<400> 34
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 35
<211> 5
<212> PRT
<213> 甲型流感病毒
<220>
<213> 流感病毒NS1
<400> 35
Asp Arg Leu Arg Arg
1 5
<210> 36
<211> 7
<212> PRT
<213> 甲型流感病毒
<220>
<213> 流感病毒NS1
<400> 36
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 37
<211> 10
<212> PRT
<213> 丁型肝炎病毒
<220>
<213> 肝炎病毒δ抗原
<400> 37
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 38
<211> 10
<212> PRT
<213> 小家鼠(Mus musculus)
<220>
<223> 鼠Mx1蛋白
<400> 38
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 39
<211> 20
<212> PRT
<213> 智人(Homo Sapiens)
<220>
<223> 人聚(ADP-核糖)聚合酶
<400> 39
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 40
<211> 17
<212> PRT
<213> 智人(Homo Sapiens)
<220>
<223> 类固醇激素受体(人)糖皮质激素
<400> 40
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 41
<211> 20
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> AAVS1间隔子靶序列
<400> 41
ggggccacta gggacaggat 20
<210> 42
<211> 500
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> 靶向AAVS1的GR同种型5'同源臂
<400> 42
ctccttctgg ggcctgtgcc atctctcgtt tcttaggatg gccttctccg acggatgtct 60
cccttgcgtc ccgcctcccc ttcttgtagg cctgcatcat caccgttttt ctggacaacc 120
ccaaagtacc ccgtctccct ggctttagcc acctctccat cctcttgctt tctttgcctg 180
gacaccccgt tctcctgtgg attcgggtca cctctcactc ctttcatttg ggcagctccc 240
ctacccccct tacctctcta gtctgtgcta gctcttccag ccccctgtca tggcatcttc 300
caggggtccg agagctcagc tagtcttctt cctccaaccc gggcccctat gtccacttca 360
ggacagcatg tttgctgcct ccagggatcc tgtgtccccg agctgggacc accttatatt 420
cccagggccg gttaatgtgg ctctggttct gggtactttt atctgtcccc tccaccccac 480
agtggggcca ctagggacag 500
<210> 43
<211> 500
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> 靶向AAVS1的GR同种型3'同源臂
<400> 43
gattggtgac agaaaagccc catccttagg cctcctcctt cctagtctcc tgatattggg 60
tctaaccccc acctcctgtt aggcagattc cttatctggt gacacacccc catttcctgg 120
agccatctct ctccttgcca gaacctctaa ggtttgctta cgatggagcc agagaggatc 180
ctgggaggga gagcttggca gggggtggga gggaaggggg ggatgcgtga cctgcccggt 240
tctcagtggc caccctgcgc taccctctcc cagaacctga gctgctctga cgcggccgtc 300
tggtgcgttt cactgatcct ggtgctgcag cttccttaca cttcccaaga ggagaagcag 360
tttggaaaaa caaaatcaga ataagttggt cctgagttct aactttggct cttcaccttt 420
ctagtcccca atttatattg ttcctccgtg cgtcagtttt acctgtgaga taaggccagt 480
agccagcccc gtcctggcag 500
<210> 44
<211> 110
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> MG3-6 sgRNA targeting TRAC
<400> 44
cgaauccucc uccugaaagu ggguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110
<210> 45
<211> 108
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> 靶向TRBC1/2的MG3-6 sgRNA
<400> 45
cggcgcugac gaucugggug guugagaauc gaaagauucu uaauaaggca uccuuccgau 60
gcugacuucu caccguccgu uuuccaauag gagcgggcgg uauguuuu 108
<210> 46
<211> 42
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 靶向TRAC的MG29-1 sgRNA
<400> 46
uaauuucuac uguuguagau gagucucuca gcugguacac gg 42
<210> 47
<211> 40
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 靶向TRBC1/2的MG29-1 sgRNA
<400> 47
uaauuucuac uguuguagau agccaucaga agcagagauc 40
<210> 48
<211> 40
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 靶向TRBC1/2的MG29-1 sgRNA
<400> 48
uaauuucuac uguuguagau gcccuauccu ggguccacuc 40
<210> 49
<211> 42
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 靶向B2M的MG29-1 sgRNA
<400> 49
uaauuucuac uguuguagau uaucucuugu acuacacuga au 42
<210> 50
<211> 42
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 靶向B2M的MG29-1 sgRNA
<400> 50
uaauuucuac uguuguagau agugggggug aauucagugu ag 42
<210> 51
<211> 42
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 靶向B2M的MG29-1 sgRNA
<400> 51
uaauuucuac uguuguagau cauucucugc uggaugacgu ga 42
<210> 52
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> TRAC间隔子靶序列(MG3-6-TRAC-6)
<400> 52
cgaatcctcc tcctgaaagt gg 22
<210> 53
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> AAVS1间隔子靶序列(MG3-6-AAVS1-D2)
<400> 53
taggaaggag gaggcctaag ga 22
<210> 54
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> TRAC间隔子靶序列(MG29-1-TRAC-35)
<400> 54
gagtctctca gctggtacac gg 22
<210> 55
<211> 22
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> AAVS1 间隔子靶序列(MG29-1-AAVS1-F3)
<400> 55
tctgtcccct ccaccccaca gt 22
<210> 56
<211> 23
<212> DNA
<213> 智人(Homo Sapiens)
<220>
<223> AAVS1 间隔子靶序列(SpCas9, Mali等人AAVS1 T2)
<400> 56
ggggccacta gggacaggat tgg 23
<210> 57
<211> 110
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> 靶向TRAC的MG3-6 sgRNA(MG3-6-TRAC-6)
<400> 57
cgaauccucc uccugaaagu ggguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110
<210> 58
<211> 110
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> 靶向AAVS1的MG3-6 sgRNA(MG3-6-AAVS1-D2)
<400> 58
uaggaaggag gaggccuaag gaguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110
<210> 59
<211> 42
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 靶向TRAC的MG29-1 sgRNA(MG29-1-TRAC-35)
<400> 59
uaauuucuac uguuguagau gagucucuca gcugguacac gg 42
<210> 60
<211> 42
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 靶向AAVS1的MG29-1 sgRNA(MG29-1-AAVS1-F3)
<400> 60
uaauuucuac uguuguagau ucuguccccu ccaccccaca gu 42
<210> 61
<211> 100
<212> RNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> 靶向AAVS1的SpCas9 sgRNA(SpCas9, Mali等人AAVS1 T2)
<400> 61
ggggccacua gggacaggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 62
<211> 3705
<212> DNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> MG3-6核酸酶(mRNA序列)
<400> 62
atgcatgcgc ggccgcaagc tttaatacga ctcactataa ggaaaagcca gctccagcag 60
gcgctgctca ctcctcccca tcctctccct ctgtccctct gtccctctga ccctgcactg 120
tcccagcacc atggccccca agaagaagcg gaaagttggc ggcggaggca gcagcaccga 180
catgaagaac taccggatcg gcgtggacgt gggcgataga tctgttggac tggccgccat 240
cgagttcgac gatgatggac tgcccatcca gaagctggcc ctggtcacct ttagacacga 300
tggcggactg gaccccacca agaacaagac ccctatgagc cggaaagaga cacggggaat 360
cgccagacgg accatgcgga tgaacagaga gcggaagcgg cggctgagaa acctggacaa 420
cgtgctggaa aacctgggct actctgtgcc tgagggccct gagcctgaga catatgaggc 480
ctggacaagc agagccctgc tggcctctat caaactggcc tctgccgacg agctgaacga 540
acaccttgtc agagccgtgc ggcacatggc cagacataga ggatgggcca atccttggtg 600
gtccctggac cagctggaaa aggccagcca agagcctagc gagacattcg agatcatcct 660
ggccagagcc agagagctgt tcggcgagaa ggtgcccgct aatcctacac tgggaatgct 720
gggagccctg gccgctaaca atgaggtgct gctgaggccc agggacgaga agaagagaaa 780
gaccggatac gtgcggggca cccctctgat gtttgctcaa gttcgacagg gcgatcagct 840
ggccgagctg cggagaattt gtgaagtgca gggcatcgag gaccagtacg aggctctgag 900
actgggcgtg ttcgaccaca agcaccccta cgtgcccaaa gaaagagtgg gcaaagaccc 960
tctgaacccc agcaccaaca gaaccatcag agccagcctg gaatttcaag agttccgcat 1020
cctggacagc gtggccaatc tgagagtgcg gatcggcagc agagccaaga gggaactgac 1080
agaggccgag tatgatgccg ccgtggaatt cctgatggac tacgccgaca aagagcagcc 1140
tagctgggcc gatgtggccg agaaaattgg cgtgcccggc aacagactgg tggcccctgt 1200
tctggaagat gtgcagcaga aaacagcccc ttacgacaga agcagcgccg cctttgagaa 1260
ggccatgggc aagaaaaccg aggccagaca gtggtgggag tccaccgatg atgaccagct 1320
gagaagcctg ctgattgcct tcctggtgga cgccaccaac gacacagaag aagccgctgc 1380
tgaagccggc ctgagcgagc tgtataagtc ttggcctgcc gaggaaagag aggccctgtc 1440
caacatcgac ttcgagaagg gcagagtggc ctacagccaa gaaaccctga gcaagctgag 1500
cgagtacatg cacgagtaca gagtgggact gcacgaggct agaaaggccg tgttcggagt 1560
ggatgatacc tggcggcctc ctctggataa gctggaagaa cctacaggac agcctgccgt 1620
ggacagagtg ctgaccatcc tgagaagatt cgtgctggac tgcgagcggc aatggggcag 1680
acctagagcc atcaccgtgg aacacacacg gacaggcctg atgggcccaa cacagagaca 1740
gaagatcctg aacgagcaga agaagaaccg ggccgacaac gagagaatcc gggatgagct 1800
gagagaatct ggcgtggaca acccctccag agccgaagtt cggagacacc tgatcgtgca 1860
agagcaagag tgccagtgcc tgtactgcgg caccatgatc accaccacca caagcgagct 1920
ggaccacatc gttcctagag ccggtggcgg cagcagcaga agggaaaatc tggccgctgt 1980
gtgcagagcc tgcaacgcca agaagaaacg cgagctgttc tacgcctggg ctggcccagt 2040
gaagtcccaa gagacaatcg agagagtcag acagctgaag gcctttaagg acagcaagaa 2100
agccaagatg ttcaagaacc agatccgccg gctgaaccag accgaggccg atgagcctat 2160
cgacgaaaga agcctggcca gcacatctta cgccgctgtg gccgttagag agcggctgga 2220
acagcacttc aacgaaggcc tggcactgga cgacaagtcc agagtggtgc tggatgtgta 2280
tgccggcgct gtgaccagag agtctcgtag agctggcggc atcgacgagc ggattctgct 2340
gagaggcgag cgggacaaga acagattcga tgtgcggcat cacgccgtgg acgctgctgt 2400
tatgaccctg ctgaacagat ccgtggctct gaccctggaa cagagatcac agctgcggcg 2460
gaccttctac gagcaaggac tggacaaact ggaccggaac cagctgaagc ccgaggaaga 2520
ttggagagac ttcaccggac tggcccctgc ctctcaagag aagtttctgg aatggcggaa 2580
ggccgccacc atcctgggag atttgctggc cgaagccatc gaggatgact ctatcgccgt 2640
ggtgtcccca ctgagactga ggccacagaa tggcagcgtg cacctggaaa caatcagcgc 2700
cgtgaagaag cagaccctgg gctctgattg gccagccgac gccgtgaaaa gaatcgtgga 2760
ccccgagatc tacctggcta tgaaggatgc cctgggaaag ctgaaagagc tgcccgagga 2820
tagcgccaga tctctggaac tgcccgacgg cagattcgtg gaagccgatg acgaggtgct 2880
gttcttccca gagaacgccg ccagcattct gacccctaga ggcgtggcag agatcggcgg 2940
ctctattcac catgccagac tgtacggctg gctgaccaaa aagggcgagc tgaaagtggg 3000
catgctgaga gtgtacggcg ccgagtttcc ctggctgatg agagagtccg gctccagaaa 3060
cgtgctgagc atgcctatcc acagaggcag ccagagcttc cgggacatgc aggacacaac 3120
ccggaaagcc gtggaaagcg gagaggctgt ggaattcgcc tggatcaccc agaacgatga 3180
gctggaattc gaccccgacg actacattgc ccacggcgga aaggacgaac tgagacagtt 3240
cctgggcttt atgcccgagt gccgttggag agtggacggc ttcaagaaga attaccagat 3300
cagaatcagg cccgccatgc tgagcagaga gcagctgcct agcgacatcc agcggagact 3360
ggaaagcaag accctgacca agaacgagtc cctgctgctg aaagccctgg atacaggact 3420
ggtggtggcc atcggaggac tgctgcctct cgagacactg aaagtgatcc ggcgcaacaa 3480
tctgggcttc cccaggtggc gcggaaacgg aaatctgccc accagctttg aagtgcggag 3540
cagcgctctg agagccctgg gagttgaagg atctggcgga aaaagacctg ccgccacaaa 3600
gaaagccgga caggccaaga aaaagaagtg accacacccc cattccccca ctccagatag 3660
aacttcagtt atatctcacg tgtctggagt tggatccatg catgc 3705
<210> 63
<211> 4036
<212> DNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> 插入在AAVS1基因座处的转基因(MND启动子驱动的GFP和tEGFR编码序列,
其侧接有与Mali等人AAVS1 T2向导的切割位点相对应的同源臂)
<400> 63
ggccgcttaa ttaataataa ggaagtgcca ttccgcctga cctctccttc tggggcctgt 60
gccatctctc gtttcttagg atggccttct ccgacggatg tctcccttgc gtcccgcctc 120
cccttcttgt aggcctgcat catcaccgtt tttctggaca accccaaagt accccgtctc 180
cctggcttta gccacctctc catcctcttg ctttctttgc ctggacaccc cgttctcctg 240
tggattcggg tcacctctca ctcctttcat ttgggcagct cccctacccc ccttacctct 300
ctagtctgtg ctagctcttc cagccccctg tcatggcatc ttccaggggt ccgagagctc 360
agctagtctt cttcctccaa cccgggcccc tatgtccact tcaggacagc atgtttgctg 420
cctccaggga tcctgtgtcc ccgagctggg accaccttat attcccaggg ccggttaatg 480
tggctctggt tctgggtact tttatctgtc ccctccaccc cacagtgggg ccactaggga 540
cagatttgtg tgaacagaga aacaggagaa tatgggccaa acaggatatc tgtggtaagc 600
agttcctgcc ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg 660
atatctgtgg taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg 720
cggtcccgcc ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac 780
ctgaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg 840
cgcgcttctg ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcaa 900
atgcctggag acgccatcca cgctgttttg acctccatag aagacaccga ctctagagga 960
tccaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat 1020
cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga 1080
gggcgatgcc acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc 1140
cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta 1200
ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca 1260
ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt 1320
cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg 1380
caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc 1440
cgacaagcag aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg 1500
cagcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct 1560
gctgcccgac aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa 1620
gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga 1680
cgagctgtac aagggcagcg gcgaaggaag gggttctctg ttgacttgcg gggatgttga 1740
agaaaacccg ggaccaatgc ttctcctggt gacaagcctt ctgctctgtg agttaccaca 1800
cccagcattc ctcctgatca ggaaggtgtg caacggcatc ggcatcggcg agttcaagga 1860
cagcctgagc atcaacgcca ccaacatcaa gcacttcaag aactgcacca gcatcagcgg 1920
cgacctgcac atcctgcccg tggccttcag gggcgacagc ttcacccaca ccccccccct 1980
ggacccccag gagctggaca tcctgaagac cgtgaaggag atcaccggct tcctgctgat 2040
ccaggcctgg cccgagaaca ggaccgacct gcacgccttc gagaacctgg agatcatcag 2100
gggcaggacc aagcagcacg gccagttcag cctggccgtg gtgagcctga acatcaccag 2160
cctgggcctg aggagcctga aggagatcag cgacggcgac gtgatcatca gcggcaacaa 2220
gaacctgtgc tacgccaaca ccatcaactg gaagaagctg ttcggcacca gcggccagaa 2280
gaccaagatc atcagcaaca ggggcgagaa cagctgcaag gccaccggcc aggtgtgcca 2340
cgccctgtgc agccccgagg gctgctgggg ccccgagccc agggactgcg tgagctgcag 2400
gaacgtgagc aggggcaggg agtgcgtgga caagtgcaac ctgctggagg gcgagcccag 2460
ggagttcgtg gagaacagcg agtgcatcca gtgccacccc gagtgcctgc cccaggccat 2520
gaacatcacc tgcaccggca ggggccccga caactgcatc cagtgcgccc actacatcga 2580
cggcccccac tgcgtgaaga cctgccccgc cggcgtgatg ggcgagaaca acaccctggt 2640
gtggaagtac gccgacgccg gccacgtgtg ccacctgtgc caccccaact gcacctacgg 2700
ctgcaccggc cccggcctgg agggctgccc caccaacggc cccaagatcc ccagcatcgc 2760
caccggcatg gtgggcgccc tgctgctgct gctggtggtg gccctgggca tcggcctgtt 2820
catgggcagc ggcgaaggaa ggggttctct gttgacttgc ggggatgttg aagaaaaccc 2880
gggaccaatg gggaatgaag caagttatcc attggaaatg tgtagccatt ttgatgctga 2940
tgaaataaag agactcggaa aacgatttaa gaaactcgat cttgataata gtggatctct 3000
ctctgtcgaa gaattcatgt cccttcctga actccaacaa aatccactcg tccaaagagt 3060
cattgatata tttgatacgg atgggaatgg tgaagtcgat tttaaagaat ttattgaagg 3120
ggttagtcaa ttttccgtca aaggggataa agaacagaaa ctccgctttg cgtttcgaat 3180
ttatgacatg gacaaggacg gatacatctc caacggggaa ctctttcaag ttctcaaaat 3240
gatggtagga aataacacca aacttgcgga cactcaactc caacaaattg ttgataaaac 3300
aattattaac gctgataaag atggagatgg tcgtattagc tttgaagaat tttgcgcagt 3360
tgtcggcggt ttggacatcc acaagaagat ggtagtcgat gtttgaaact tgtttattgc 3420
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 3480
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttacg ccgattggtg 3540
acagaaaagc cccatcctta ggcctcctcc ttcctagtct cctgatattg ggtctaaccc 3600
ccacctcctg ttaggcagat tccttatctg gtgacacacc cccatttcct ggagccatct 3660
ctctccttgc cagaacctct aaggtttgct tacgatggag ccagagagga tcctgggagg 3720
gagagcttgg cagggggtgg gagggaaggg ggggatgcgt gacctgcccg gttctcagtg 3780
gccaccctgc gctaccctct cccagaacct gagctgctct gacgcggccg tctggtgcgt 3840
ttcactgatc ctggtgctgc agcttcctta cacttcccaa gaggagaagc agtttggaaa 3900
aacaaaatca gaataagttg gtcctgagtt ctaactttgg ctcttcacct ttctagtccc 3960
caatttatat tgttcctccg tgcgtcagtt ttacctgtga gataaggcca gtagccagcc 4020
ccgtcctggc agggcc 4036
<210> 64
<211> 4263
<212> DNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> 插入在TRAC基因座处的转基因(MSCV启动子驱动的tLNGFR编码序列,
其侧接有与MG3-6-TRAC-6的切割位点相对应的同源臂。)
<400> 64
caatggtcct gtctctcaag aatcccctgc cactcctcac acccaccctg ggcccatatt 60
catttccatt tgagttgttc ttattgagtc atccttcctg tggtagcgga actcactaag 120
gggcccatct ggacccgagg tattgtgatg ataaattctg agcacctacc ccatccccag 180
aagggctcag aaataaaata agagccaagt ctagtcggtg tttcctgtct tgaaacacaa 240
tactgttggc cctggaagaa tgcacagaat ctgtttgtaa ggggatatgc acagaagctg 300
caagggacag gaggtgcagg agctgcaggc ctcccccacc cagcctgctc tgccttgggg 360
aaaaccgtgg gtgtgtcctg caggccatgc aggcctggga catgcaagcc cataaccgct 420
gtggcctctt ggttttacag atacgaacct aaactttcaa aacctgtcag tgattgggtt 480
ccgaatcctc ctcctgaaag ttaattaatg aatgaatgaa ataaaagatc tttattttca 540
ttagatctgt gtgttggttt tttgtgtgat cctcgaggga atgaaagacc ccacctgtag 600
gtttggcaag ctagcttaag taacgccatt ttgcaaggca tggaaaatac ataactgaga 660
atagagaagt tcagatcaag gttaggaaca gagagacagc agaatatggg ccaaacagga 720
tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 780
ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 840
tgaaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg 900
cgcgcttctg ctccccgagc tcaataaaag agcccacaac ccctcactcg gcgcgcgcca 960
gtccggtacc agtcgccacc atggccctgc ctgtgacagc tctgctcctc cctctggccc 1020
tgctgctcca tgccgccaga cccgacatcg tgctgaccca gagccccccc agcctggcca 1080
tgtctctggg caagagagcc accatcagct gccgggccag cgagagcgtg accatcctgg 1140
gcagccacct gatccactgg tatcagcaga agcccggcca gccccccacc ctgctgatcc 1200
agctcgccag caatgtgcag accggcgtgc ccgccagatt cagcggcagc ggcagcagaa 1260
ccgacttcac cctgaccatc gaccccgtgg aagaggacga cgtggccgtg tactactgcc 1320
tgcagagccg gaccatcccc cggacctttg gcggaggcac caaactggaa atcaagggca 1380
gcaccagcgg ctccggcaag cctggctctg gcgagggcag cacaaaggga cagattcagc 1440
tggtgcagag cggccctgag ctgaagaaac ccggcgagac agtgaagatc agctgcaagg 1500
cctccggcta caccttcacc gactacagca tcaactgggt gaaaagagcc cctggcaagg 1560
gcctgaagtg gatgggctgg atcaacaccg agacaagaga gcccgcctac gcctacgact 1620
tccggggcag attcgccttc agcctggaaa ccagcgccag caccgcctac ctgcagatca 1680
acaacctgaa gtacgaggac accgccacct acttttgcgc cctggactac agctacgcca 1740
tggactactg gggccagggc accagcgtga ccgtgtccag cttcgtgccc gtgttcctgc 1800
ccgccaaacc taccaccacc cctgccccta gacctcccac cccagcccca acaatcgcca 1860
gccagcctct gtctctgcgg cccgaagcct gtagacctgc tgccggcgga gccgtgcaca 1920
ccagaggcct ggacttcgcc tgcgacatct acatctgggc ccctctggcc ggcacctgtg 1980
gcgtgctgct gctgagcctg gtgatcaccc tgtactgcaa ccaccggaac agaagcaagc 2040
ggagccggct gctgcacagc gactacatga acatgacccc aagacggcct ggccccaccc 2100
ggaagcacta ccagccttac gcccctccca gagacttcgc cgcctaccgg tccagagtga 2160
agttcagcag atccgccgac gcccctgcct accagcaggg acagaaccag ctgtacaacg 2220
agctgaacct gggcagacgg gaagagtacg acgtgctgga caagcggaga ggccgggacc 2280
ccgagatggg cggaaagccc agacggaaga acccccagga aggcctgtat aacgaactgc 2340
agaaagacaa gatggccgag gcctacagcg agatcggcat gaagggcgag cggaggcgcg 2400
gcaagggcca cgatggcctg taccagggcc tgagcaccgc caccaaggac acctacgacg 2460
ccctgcacat gcaggccctg ccccccagag gatccggcgc tacaaatttt tcactgctga 2520
aacaggcggg tgatgtggag gagaaccctg gacccatggg tgctggcgca actggacgcg 2580
ctatggatgg acctcgcttg ctgcttcttc tgcttctcgg ggtctcattg ggtggtgcta 2640
aggaagcatg cccaacggga ctttatacgc atagcggaga gtgttgcaaa gcttgtaacc 2700
tgggcgaagg cgtcgcgcaa ccttgtggtg caaatcaaac cgtctgcgag ccatgtttgg 2760
actctgttac gtttagtgac gtagtatctg cgacagagcc atgcaagcct tgtacggaat 2820
gtgtaggatt gcagagcatg tctgcccctt gtgtagaagc cgacgatgca gtttgcaggt 2880
gcgcgtatgg ctattaccaa gacgaaacaa ccggacgatg tgaagcttgc cgagtttgtg 2940
aagcgggttc cgggcttgta ttctcatgtc aggataagca gaacaccgtc tgcgaagagt 3000
gccccgatgg cacctacagc gatgaagcga accatgtaga cccctgcctg ccttgcaccg 3060
tttgtgaaga cacggaacga cagttgcggg agtgtacccg gtgggcagac gccgagtgcg 3120
aagagattcc aggccgctgg atcacgcgaa gtaccccgcc agaaggttcc gacagtactg 3180
caccaagcac ccaagaacca gaggcgcccc ccgagcagga cctgattgcc tccaccgtgg 3240
cgggtgttgt tactacggtt atgggctcat cccagcccgt tgttacccga ggaactacag 3300
acaacctgat tccggtatat tgttctatct tggcggctgt agtagttggc ttggtcgcgt 3360
acatcgcttt caaaagatga aagcttgata atcaacctct ggattacaaa atttgtgaaa 3420
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 3480
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 3540
cctggttagt tcttgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag 3600
gggctcggct gttgggcact gacaattccg tggaacttgt ttattgcagc ttataatggt 3660
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 3720
agttgtggtt tgtccaaact catcaatgta tcttagttta aactggccgg gtttaatctg 3780
ctcatgacgc tgcggctgtg gtccagctga ggtgaggggc cttgaagctg ggagtggggt 3840
ttagggacgc gggtctctgg gtgcatccta agctctgaga gcaaacctcc ctgcagggtc 3900
ttgcttttaa gtccaaagcc tgagcccacc aaactctcct acttcttcct gttacaaatt 3960
cctcttgtgc aataataatg gcctgaaacg ctgtaaaata tcctcatttc agccgcctca 4020
gttgcacttc tcccctatga ggtaggaaga acagttgttt agaaacgaag aaactgaggc 4080
cccacagcta atgagtggag gaagagagac acttgtgtac accacatgcc ttgtgttgta 4140
cttctctcac cgtgtaacct cctcatgtcc tctctcccca gtacggctct cttagctcag 4200
tagaaagaag acattacact catattacac cccaatcctg gctagagtct ccgcaccctc 4260
ctc 4263
<210> 65
<211> 4295
<212> DNA
<223> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<223> 插入在TRAC基因座处的转基因(MSCV启动子驱动的tLNGFR编码序列,
其侧接有与MG29-1-TRAC-35的切割位点相对应的同源臂。)
<400> 65
gcggccgctt aattaattaa tgccaacata ccataaacct cccattctgc taatgcccag 60
cctaagttgg ggagaccact ccagattcca agatgtacag tttgctttgc tgggcctttt 120
tcccatgcct gcctttactc tgccagagtt atattgctgg ggttttgaag aagatcctat 180
taaataaaag aataagcagt attattaagt agccctgcat ttcaggtttc cttgagtggc 240
aggccaggcc tggccgtgaa cgttcactga aatcatggcc tcttggccaa gattgatagc 300
ttgtgcctgt ccctgagtcc cagtccatca cgagcagctg gtttctaaga tgctatttcc 360
cgtataaagc atgagaccgt gacttgccag ccccacagag ccccgccctt gtccatcact 420
ggcatctgga ctccagcctg ggttggggca aagagggaaa tgagatcatg tcctaaccct 480
gatcctcttg tcccacagat atccagaacc ctgaccttaa ttaatgaatg aatgaaataa 540
aagatcttta ttttcattag atctgtgtgt tggttttttg tgtgatcctc gagggaatga 600
aagaccccac ctgtaggttt ggcaagctag cttaagtaac gccattttgc aaggcatgga 660
aaatacataa ctgagaatag agaagttcag atcaaggtta ggaacagaga gacagcagaa 720
tatgggccaa acaggatatc tgtggtaagc agttcctgcc ccggctcagg gccaagaaca 780
gatggtcccc agatgcggtc ccgccctcag cagtttctag agaaccatca gatgtttcca 840
gggtgcccca aggacctgaa aatgaccctg tgccttattt gaactaacca atcagttcgc 900
ttctcgcttc tgttcgcgcg cttctgctcc ccgagctcaa taaaagagcc cacaacccct 960
cactcggcgc gcgccagtcc ggtaccagtc gccaccatgg ccctgcctgt gacagctctg 1020
ctcctccctc tggccctgct gctccatgcc gccagacccg acatcgtgct gacccagagc 1080
ccccccagcc tggccatgtc tctgggcaag agagccacca tcagctgccg ggccagcgag 1140
agcgtgacca tcctgggcag ccacctgatc cactggtatc agcagaagcc cggccagccc 1200
cccaccctgc tgatccagct cgccagcaat gtgcagaccg gcgtgcccgc cagattcagc 1260
ggcagcggca gcagaaccga cttcaccctg accatcgacc ccgtggaaga ggacgacgtg 1320
gccgtgtact actgcctgca gagccggacc atcccccgga cctttggcgg aggcaccaaa 1380
ctggaaatca agggcagcac cagcggctcc ggcaagcctg gctctggcga gggcagcaca 1440
aagggacaga ttcagctggt gcagagcggc cctgagctga agaaacccgg cgagacagtg 1500
aagatcagct gcaaggcctc cggctacacc ttcaccgact acagcatcaa ctgggtgaaa 1560
agagcccctg gcaagggcct gaagtggatg ggctggatca acaccgagac aagagagccc 1620
gcctacgcct acgacttccg gggcagattc gccttcagcc tggaaaccag cgccagcacc 1680
gcctacctgc agatcaacaa cctgaagtac gaggacaccg ccacctactt ttgcgccctg 1740
gactacagct acgccatgga ctactggggc cagggcacca gcgtgaccgt gtccagcttc 1800
gtgcccgtgt tcctgcccgc caaacctacc accacccctg cccctagacc tcccacccca 1860
gccccaacaa tcgccagcca gcctctgtct ctgcggcccg aagcctgtag acctgctgcc 1920
ggcggagccg tgcacaccag aggcctggac ttcgcctgcg acatctacat ctgggcccct 1980
ctggccggca cctgtggcgt gctgctgctg agcctggtga tcaccctgta ctgcaaccac 2040
cggaacagaa gcaagcggag ccggctgctg cacagcgact acatgaacat gaccccaaga 2100
cggcctggcc ccacccggaa gcactaccag ccttacgccc ctcccagaga cttcgccgcc 2160
taccggtcca gagtgaagtt cagcagatcc gccgacgccc ctgcctacca gcagggacag 2220
aaccagctgt acaacgagct gaacctgggc agacgggaag agtacgacgt gctggacaag 2280
cggagaggcc gggaccccga gatgggcgga aagcccagac ggaagaaccc ccaggaaggc 2340
ctgtataacg aactgcagaa agacaagatg gccgaggcct acagcgagat cggcatgaag 2400
ggcgagcgga ggcgcggcaa gggccacgat ggcctgtacc agggcctgag caccgccacc 2460
aaggacacct acgacgccct gcacatgcag gccctgcccc ccagaggatc cggcgctaca 2520
aatttttcac tgctgaaaca ggcgggtgat gtggaggaga accctggacc catgggtgct 2580
ggcgcaactg gacgcgctat ggatggacct cgcttgctgc ttcttctgct tctcggggtc 2640
tcattgggtg gtgctaagga agcatgccca acgggacttt atacgcatag cggagagtgt 2700
tgcaaagctt gtaacctggg cgaaggcgtc gcgcaacctt gtggtgcaaa tcaaaccgtc 2760
tgcgagccat gtttggactc tgttacgttt agtgacgtag tatctgcgac agagccatgc 2820
aagccttgta cggaatgtgt aggattgcag agcatgtctg ccccttgtgt agaagccgac 2880
gatgcagttt gcaggtgcgc gtatggctat taccaagacg aaacaaccgg acgatgtgaa 2940
gcttgccgag tttgtgaagc gggttccggg cttgtattct catgtcagga taagcagaac 3000
accgtctgcg aagagtgccc cgatggcacc tacagcgatg aagcgaacca tgtagacccc 3060
tgcctgcctt gcaccgtttg tgaagacacg gaacgacagt tgcgggagtg tacccggtgg 3120
gcagacgccg agtgcgaaga gattccaggc cgctggatca cgcgaagtac cccgccagaa 3180
ggttccgaca gtactgcacc aagcacccaa gaaccagagg cgccccccga gcaggacctg 3240
attgcctcca ccgtggcggg tgttgttact acggttatgg gctcatccca gcccgttgtt 3300
acccgaggaa ctacagacaa cctgattccg gtatattgtt ctatcttggc ggctgtagta 3360
gttggcttgg tcgcgtacat cgctttcaaa agatgaaagc ttgataatca acctctggat 3420
tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 3480
ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 3540
tcctccttgt ataaatcctg gttagttctt gccacggcgg aactcatcgc cgcctgcctt 3600
gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtgga acttgtttat 3660
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 3720
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt agtttaaacc 3780
tgccgtgtac cagctgagag actctaaatc cagtgacaag tctgtctgcc tattcaccga 3840
ttttgattct caaacaaatg tgtcacaaag taaggattct gatgtgtata tcacagacaa 3900
aactgtgcta gacatgaggt ctatggactt caagagcaac agtgctgtgg cctggagcaa 3960
caaatctgac tttgcatgtg caaacgcctt caacaacagc attattccag aagacacctt 4020
cttccccagc ccaggtaagg gcagctttgg tgccttcgca ggctgtttcc ttgcttcagg 4080
aatggccagg ttctgcccag agctctggtc aatgatgtct aaaactcctc tgattggtgg 4140
tctcggcctt atccattgcc accaaaaccc tctttttact aagaaacagt gagccttgtt 4200
ctggcagtcc agagaatgac acgggaaaaa agcagatgaa gagaaggtgg caggagaggg 4260
cacgtggccc agcctcagtg tttaaacgcg gccgc 4295

Claims (73)

1.一种编辑细胞内的两个或更多个基因座的方法,所述方法包括使以下与所述细胞接触:
(a)2类II型Cas核酸内切酶复合物,所述2类II型Cas核酸内切酶复合物包括:
(i)2类II型Cas核酸内切酶;以及
(ii)第一工程化向导RNA,所述第一工程化向导RNA包括:
RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及
间隔子序列,所述间隔子序列被配置成与第一组一个或多个靶基因座杂交;
(b)2类V型Cas核酸内切酶复合物,所述2类V型Cas核酸内切酶复合物包括:
(i)2类V型Cas核酸内切酶;以及
(ii)第二工程化向导RNA,所述第二工程化向导RNA包括:
RNA序列,所述RNA序列被配置成与所述2类V型Cas核酸内切酶结合,以及
间隔子序列,所述间隔子序列被配置成与第二组一个或多个靶基因座杂交。
2.根据权利要求1所述的方法,其中所述2类II型Cas核酸内切酶不是Cas9核酸内切酶。
3.根据权利要求1或2所述的方法,其中所述2类II型Cas核酸内切酶是Cas12a核酸内切酶。
4.根据权利要求1至3中任一项所述的方法,其中所述2类II型Cas核酸内切酶包括与SEQ ID NO:1或4中的任一个或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。
5.根据权利要求1至3中任一项所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQID NO:7或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。
6.根据权利要求1至5中任一项所述的方法,其中所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个具有至少80%、85%、90%或95%序列同一性的序列。
7.根据权利要求1至6中任一项所述的方法,其中所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率编辑所述第一基因座的基因组序列,和/或以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率编辑所述第二基因座的基因组序列。
8.根据权利要求1至7中任一项所述的方法,其中所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶以200pmol或更低、100pmol或更低、50pmol或更低、25pmol或更低、5pmol或更低或1pmol或更低的浓度引入。
9.根据权利要求1至8中任一项所述的方法,其中所述细胞内的脱靶位点以小于0.2%的频率被破坏,如通过全基因组脱靶双链断裂分析测定的。
10.根据权利要求9所述的方法,其中所述细胞内的脱靶位点以小于0.01%的频率被破坏,如通过全基因组脱靶双链断裂分析测定的。
11.根据权利要求1至10中任一项所述的方法,其中所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括T细胞受体(TCR)基因座。
12.根据权利要求11所述的方法,其中被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:10-15中的任一个或其补体具有至少80%、85%、90%或95%序列同一性。
13.根据权利要求1至12中任一项所述的方法,其中所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括白蛋白(ALB)基因座。
14.根据权利要求13所述的方法,其中被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:17至19中的任一个或其补体具有至少80%、85%、90%或95%序列同一性。
15.根据权利要求1至14中任一项所述的方法,其中所述第一组一个或多个靶基因座或所述第二组一个或多个靶基因座包括核受体亚家族3C组成员1(NR3C1)基因座。
16.根据权利要求15所述的方法,其中被配置成与所述第一组一个或多个靶基因座杂交的所述间隔子序列或被配置成与所述第二组一个或多个靶基因座杂交的所述间隔子序列与SEQ ID NO:16、20、21或22中的任一个或其补体具有至少80%、85%、90%或95%序列同一性。
17.根据权利要求1至16中任一项所述的方法,其进一步包括将包括以下的供体DNA序列引入到所述细胞:编码异源工程化T细胞受体分子的开放阅读框、包括位于所述第一组一个或多个靶基因座的第一侧的DNA序列的第一同源臂和包括位于所述第一组一个或多个靶基因座的第二侧的DNA序列的第二同源臂。
18.根据权利要求1至17中任一项所述的方法,其中编辑包括插入插入和缺失(indel)、提前终止密码子、错义密码子、移码突变、腺嘌呤脱氨基化、胞嘧啶脱氨基化或其任何组合。
19.一种制备糖皮质激素抵抗性工程化T细胞的方法,所述方法包括将以下引入到T细胞或其前体:
(a)靶向T细胞受体(TCR)基因座的RNA引导的核酸内切酶复合物,所述RNA引导的核酸内切酶复合物包括:
(i)第一RNA引导的核酸内切酶或编码所述第一RNA引导的核酸内切酶的DNA;以及
(ii)第一工程化向导RNA,所述第一工程化向导RNA包括
RNA序列,所述RNA序列被配置成与所述第一RNA引导的核酸内切酶形成复合物,以及
第一间隔子序列,所述第一间隔子序列被配置成与所述TCR基因座的至少一部分杂交;以及
(b)靶向T细胞受体核受体亚家族3C组成员1(NR3C1)基因座的RNA引导的核酸内切酶复合物,所述RNA引导的核酸内切酶复合物包括:
(i)第二RNA引导的核酸内切酶;以及
(ii)第二工程化向导RNA,所述第二工程化向导RNA包括:
RNA序列,所述RNA序列被配置成与所述第二RNA引导的核酸内切酶形成复合物,以及
第二间隔子序列,所述第二间隔子序列被配置成与所述NR3C1基因座的至少一部分杂交。
20.根据权利要求19所述的方法,其中所述TCR基因座的所述至少一部分位于所述T细胞基因座内。
21.根据权利要求19至20中任一项所述的方法,其进一步包括将(b)包括以下的供体DNA序列引入到所述细胞:编码异源工程化T细胞受体分子的开放阅读框、包括位于所述靶序列的第一侧的DNA序列的第一同源臂和包括位于所述TCR基因座内的所述靶序列的第二侧的DNA序列的第二同源臂。
22.根据权利要求19至21中任一项所述的方法,其中所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶包括2类II型Cas核酸内切酶或2类V型Cas核酸内切酶。
23.根据权利要求19至22中任一项所述的方法,其中所述第一RNA引导的核酸内切酶包括所述2类II型Cas核酸内切酶,并且所述第二RNA引导的核酸内切酶包括所述2类V型Cas核酸内切酶。
24.根据权利要求19至22中任一项所述的方法,其中所述第二RNA引导的核酸内切酶包括所述2类II型Cas核酸内切酶,并且所述第一RNA引导的核酸内切酶包括所述2类V型Cas核酸内切酶。
25.根据权利要求19至24中任一项所述的方法,其中所述异源工程化T细胞受体是CAR分子。
26.根据权利要求19至25中任一项所述的方法,其中所述T细胞受体基因座的所述至少一部分是T细胞受体α常数(TRAC)基因座或T细胞受体β常数(TRBC)基因座。
27.根据权利要求19至26中任一项所述的方法,其中所述同源臂包括所述TCR基因座内的接近所述T细胞受体基因座的所述至少一部分的内含子区或外显子区。
28.根据权利要求19至26中任一项所述的方法,其中所述T细胞受体基因座的所述至少一部分是TRAC的第一外显子或第三外显子。
29.根据权利要求19至28中任一项所述的方法,其中所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率破坏所述TCR基因座和所述NR3C1基因座的基因组序列。
30.根据权利要求28所述的方法,其中所述效率是针对从所述TCR基因座和所述NR3C1基因座表达的蛋白质通过流式细胞术测定的。
31.根据权利要求19至30中任一项所述的方法,其中所述NR3C1基因座的所述至少一部分是外显子2或外显子3。
32.根据权利要求19至31中任一项所述的方法,其中所述方法以至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或更高的效率产生对CAR分子呈阳性并且对NR3C1呈阴性的细胞。
33.根据权利要求19至32中任一项所述的方法,其包括将(a)至(c)同时引入到所述T细胞或其前体。
34.根据权利要求19至33中任一项所述的方法,其中所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶包括与SEQ ID NO:1、4或7中的任一个具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。
35.根据权利要求19至34中任一项所述的方法,其中所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个具有至少80%、85%、90%或95%序列同一性的序列。
36.根据权利要求19至35中任一项所述的方法,其中所述第一RNA引导的核酸内切酶或所述第二RNA引导的核酸内切酶以100pmol或更低、50pmol或更低、25pmol或更低、5pmol或更低或1pmol或更低的浓度存在。
37.根据权利要求19至36中任一项所述的方法,其中所述T细胞或所述其前体包括T细胞、造血干细胞(HSC)或外周血单核细胞(PBMC)。
38.根据权利要求19至37中任一项所述的方法,其中所述第二间隔子序列包括与SEQID NO:16、20、21或22中的任一个或其补体具有至少80%、85%、90%或95%序列同一性的序列。
39.根据权利要求19至38中任一项所述的方法,其中所述第一间隔子序列或所述第二间隔子序列包括至少约19至24个核苷酸、至少约19个核苷酸、至少约20个核苷酸、至少约22个核苷酸或至少约24个核苷酸。
40.根据权利要求19至38中任一项所述的方法,其中所述供体DNA序列在病毒载体中递送。
41.根据权利要求40所述的方法,其中所述病毒载体是AAV载体或AAV-6载体。
42.一种糖皮质激素抵抗性T细胞群体,其包括:
(a)TCR基因座内的在SEQ ID NO:10-15中的任一个的杂交区的100个、75个、50个、25个或10个核苷酸内的异源序列;
(b)包括插入和缺失的NR3C1基因座。
43.根据权利要求42所述的糖皮质激素抵抗性T细胞群体,其中所述异源序列是插入和缺失。
44.根据权利要求42或43所述的糖皮质激素抵抗性T细胞群体,其中所述异源序列包括开放阅读框,所述开放阅读框包括编码异源T细胞受体或CAR分子的核苷酸序列。
45.根据权利要求42至44中任一项所述的糖皮质激素抵抗性T细胞群体,其中所述NR3C1基因座包括SEQ ID NO:16、20、21或22中的任一个的杂交区的100个、75个、50个、25个或10个核苷酸内的插入和缺失。
46.根据权利要求42至45中任一项所述的糖皮质激素抵抗性T细胞群体,其中少于0.2%在脱靶基因座处具有插入和缺失,如通过全基因组脱靶双链断裂分析测定的。
47.根据权利要求43所述的糖皮质激素抵抗性T细胞群体,其中少于0.01%在脱靶基因座处具有插入和缺失,如通过全基因组脱靶双链断裂分析测定的。
48.根据权利要求42至47中任一项所述的糖皮质激素抵抗性T细胞群体,其中所述细胞群体基本上没有染色体易位。
49.一种编辑细胞内的两个或更多个基因座的方法,所述方法包括使以下与所述细胞接触:
(a)第一Cas核酸内切酶复合物,所述第一Cas核酸内切酶复合物包括:
(i)第一Cas核酸内切酶;以及
(ii)一种或多种工程化向导RNA,所述一种或多种工程化向导RNA包括:
RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及
间隔子序列,所述间隔子序列被配置成与第一靶序列杂交;
(b)第二Cas核酸内切酶复合物,所述第二Cas核酸内切酶复合物包括:
(i)第二Cas核酸内切酶;以及
(ii)一种或多种工程化向导RNA,所述一种或多种工程化向导RNA包括:
RNA序列,所述RNA序列被配置成与所述2类II型Cas核酸内切酶结合,以及
间隔子序列,所述间隔子序列被配置成与第二靶序列杂交。
50.根据权利要求49所述的方法,其进一步包括将以下引入到所述细胞:
(c)第一供体DNA序列,所述第一供体DNA序列包括编码第一转基因的开放阅读框、包括位于所述第一靶序列的5'侧的DNA序列的5'同源臂和包括位于所述第一靶序列的3'侧的DNA序列的3'同源臂;以及
(d)第二供体DNA序列,所述第二供体DNA序列包括编码第二转基因的开放阅读框、包括位于所述第二靶序列的5'侧的DNA序列的5'同源臂和包括位于所述第二靶序列的3'侧的DNA序列的3'同源臂。
51.根据权利要求50所述的方法,其中所述第一转基因和所述第二转基因不同。
52.根据权利要求50至51中任一项所述的方法,其中所述第一靶序列或所述第二靶序列是T细胞受体基因座内的靶序列、TRAC基因座内的靶序列、TRBC基因座内的靶序列、NR3C1基因座内的靶序列或AAVS1基因座内的靶序列或其任何组合。
53.根据权利要求50至52中任一项所述的方法,其中所述第一转基因或所述第二转基因是GR的α、β、α-D3或β-D3同种型、CAR分子、截短的低亲和力神经生长因子受体(tLNGFR)序列、上皮生长因子受体的截短版本(tEGFR)、GFP编码序列或其任何组合。
54.根据权利要求50至53中任一项所述的方法,其中包括位于所述第一靶序列的5'侧的DNA序列的所述5'同源臂或包括位于所述第二靶序列的5'侧的DNA序列的所述5'同源臂包括SEQ ID NO:42或23。
55.根据权利要求50至54中任一项所述的方法,其中包括位于所述第一靶序列的5'侧的DNA序列的所述3'同源臂或包括位于所述第二靶序列的5'侧的DNA序列的所述3'同源臂包括SEQ ID NO:43或24。
56.根据权利要求49至55中任一项所述的方法,其中所述第一2类II型Cas核酸内切酶或所述第二2类II型Cas核酸内切酶包括与SEQ ID NO:1或4中的任一个或其变体具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的序列。
57.根据权利要求49至56中任一项所述的方法,其中所述第一工程化向导RNA或所述第二工程化向导RNA包括与SEQ ID NO:3、6或9中的任一个具有至少80%、85%、90%或95%序列同一性的序列。
58.根据权利要求49至57中任一项所述的方法,其中被配置成与所述第一靶序列杂交的所述间隔子序列或被配置成与所述第二靶序列杂交的所述间隔子序列与SEQ ID NO:16、20、21、22或41中的任一个或其补体具有至少80%、85%、90%或95%序列同一性。
59.根据权利要求49至58中任一项所述的方法,其中所述第一核酸内切酶或所述第二核酸内切酶包括2类II型Cas核酸内切酶或2类V型Cas核酸内切酶或其任何组合。
60.一种分离的核酸,其包括SEQ ID NO:63-65中的任一个的序列或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。
61.一种细胞,其包括根据权利要求60所述的分离的核酸。
62.根据权利要求61所述的细胞,其中所述细胞是T细胞或其前体。
63.根据权利要求62所述的细胞,其中所述T细胞或其前体包括T细胞、造血干细胞(HSC)或外周血单核细胞(PBMC)。
64.一种载体,其包括权利要求60的分离的核酸序列。
65.根据权利要求64所述的载体,其中所述载体是腺相关病毒(AAV)载体。
66.根据权利要求65所述的载体,其中所述AAV载体是AAV-6血清型载体。
67.一种载体,其包括与SEQ ID NO:23、24、42或43中的任一个具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。
68.根据权利要求67所述的载体,其进一步包括转基因,所述转基因侧接有与SEQ IDNO:23、24、42或43中的任一个具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的所述序列。
69.根据权利要求68所述的载体,其中所述转基因包括GR的α、β、α-D3或β-D3同种型、CAR分子、截短的低亲和力神经生长因子受体(tLNGFR)序列、上皮生长因子受体的截短版本(tEGFR)、GFP编码序列或其任何组合。
70.根据权利要求67或68所述的载体,其包括SEQ ID NO:63或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的变体的tEGFR编码序列。
71.根据权利要求67或68所述的载体,其包括SEQ ID NO:64或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的变体的tLNGFR编码序列。
72.根据权利要求67或68所述的载体,其包括SEQ ID NO:63或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的变体的MND启动子。
73.根据权利要求67或68所述的载体,其包括SEQ ID NO:64或与其具有至少约75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的变体的MSCV启动子。
CN202280020320.6A 2021-03-19 2022-03-18 用cas酶进行多重编辑 Pending CN117043327A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/163,510 2021-03-19
US63/186,506 2021-05-10
US202163241916P 2021-09-08 2021-09-08
US63/241,916 2021-09-08
PCT/US2022/021004 WO2022198080A1 (en) 2021-03-19 2022-03-18 Multiplex editing with cas enzymes

Publications (1)

Publication Number Publication Date
CN117043327A true CN117043327A (zh) 2023-11-10

Family

ID=88630472

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280020320.6A Pending CN117043327A (zh) 2021-03-19 2022-03-18 用cas酶进行多重编辑

Country Status (1)

Country Link
CN (1) CN117043327A (zh)

Similar Documents

Publication Publication Date Title
EP3359184B1 (en) Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene
AU2022204298A1 (en) Nucleobase editors and uses thereof
KR102547738B1 (ko) 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법
KR20210138603A (ko) 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기를 갖는 변형된 면역 세포
KR102151065B1 (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
EP2401295B1 (en) Method for producing antibodies
CN116096876A (zh) Ii类v型crispr系统
JP6965466B2 (ja) 操作されたカスケード構成要素およびカスケード複合体
KR20230157387A (ko) Cas 효소를 이용한 다중 편집
AU2022331424A1 (en) Persistent allogeneic modified immune cells and methods of use thereof
CA3228222A1 (en) Class ii, type v crispr systems
JP2022530029A (ja) 核酸ガイドヌクレアーゼ細胞ターゲティングスクリーニングのための方法及び組成物
JP7026304B2 (ja) 部位特異的dna開裂及び修復による標的化原位置タンパク質多様化
KR20240049306A (ko) Ruvc 도메인을 갖는 효소
CN117043327A (zh) 用cas酶进行多重编辑
CN113564145B (zh) 用于胞嘧啶碱基编辑的融合蛋白及其应用
RU2656142C1 (ru) РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pBiPr-ABIgA1FI6-ht ДЛЯ ПОЛУЧЕНИЯ РЕКОМБИНАНТНОГО ИММУНОГЛОБУЛИНА А ИЗОТИПА IGA1
EP4271805A1 (en) Novel nucleic acid-guided nucleases
US20220145332A1 (en) Cell penetrating transposase
TWI704224B (zh) 編輯核酸序列之組成物及方法
US20230340437A1 (en) Modified nucleases
CN117355607A (zh) 非病毒同源性介导的末端连接
CA3189662A1 (en) Compositions comprising a nuclease and uses thereof
CA3223311A1 (en) Compositions and methods for targeting, editing or modifying human genes
WO2023164593A2 (en) Systems and methods for transposing cargo nucleotide sequences

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination