CN112469823A - 布鲁顿氏酪氨酸激酶的基于talen和基于crispr/cas的基因编辑 - Google Patents

布鲁顿氏酪氨酸激酶的基于talen和基于crispr/cas的基因编辑 Download PDF

Info

Publication number
CN112469823A
CN112469823A CN201980038650.6A CN201980038650A CN112469823A CN 112469823 A CN112469823 A CN 112469823A CN 201980038650 A CN201980038650 A CN 201980038650A CN 112469823 A CN112469823 A CN 112469823A
Authority
CN
China
Prior art keywords
cell
gene
sequence
btk
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980038650.6A
Other languages
English (en)
Inventor
大卫·J·拉林斯
考特尼·克劳夫
伊兰·F·可汗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seattle Childrens Hospital
Original Assignee
Seattle Childrens Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seattle Childrens Hospital filed Critical Seattle Childrens Hospital
Publication of CN112469823A publication Critical patent/CN112469823A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/10Protein-tyrosine kinases (2.7.10)
    • C12Y207/10002Non-specific protein-tyrosine kinase (2.7.10.2), i.e. spleen tyrosine kinase
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Abstract

本公开提供了改善的基因组编辑组合物和用于编辑人类BTK基因的方法。本公开还提供了用于预防、治疗或缓解X‑连锁无丙种球蛋白血症(XLA)的至少一种症状的基因组编辑的细胞。

Description

布鲁顿氏酪氨酸激酶的基于TALEN和基于CRISPR/CAS的基因 编辑
相关申请的交叉引用
本申请要求2018年4月27日提交的美国临时申请No.62/664,035的优先权,其通过引用整体并入本文。
电子提交的文本文件的描述
通过电子方式提交的文本文件的内容通过引用全文并入本文:序列表的计算机可读形式副本(文件名:SECH_001_01WO_ST25.txt,记录日期:2019年4月26日,文件大小为75千字节)。
背景技术
技术领域
本公开涉及改善的基因编辑组合物。更具体地,本公开涉及基于TALEN和基于CRISPR/Cas的基因编辑组合物,以及使用其来编辑布鲁顿氏酪氨酸激酶(BTK)基因的方法。
相关领域的描述
X-连锁无丙种球蛋白血症是一种由布鲁顿氏酪氨酸激酶(BTK)基因突变引起的罕见免疫缺陷。BTK基因中有600多种不同的突变与X-连锁无丙种球蛋白血症相关。这些突变中的大多数导致缺乏BTK蛋白。其他突变会改变单个蛋白质构建块(氨基酸),这可导致异常BTK蛋白质产生,其迅速在细胞中分解。正常B的成熟和活化、BCR-介导的信号传导以及髓样细胞中的一些信号传导途径都需要BTK。缺乏功能性BTK的受试者主要具有未成熟的B细胞,最少的抗体产生,并且易于复发和威胁生命的感染。
现有的治疗包括减轻了这些感染的严重程度的终生静脉内免疫球蛋白疗法,并明智地使用抗生素治疗。造血细胞移植(HCT)是唯一可用的有潜力提供XLA治愈的方法。然而,由于难以找到HLA匹配的供体以及与GvHD相关的潜在毒性,大多数XLA患者未用这种方法治疗。尽管移植存活率有了显著改善,但治疗相关的死亡率风险已成为XLA的异基因HCT的障碍。已经开发了整合在天然近端BTK基因启动子的控制下编码BTK cDNA的自灭活慢病毒载体(LV),并在人类XLA的小鼠模型中对其进行了评价。然而,与逆转录病毒和基于LV的基因疗法相关的插入诱变和基因表达失调存在巨大风险。
发明概述
本公开通常部分涉及介导人类BTK基因的基因编辑的基于TALEN或基于CRISPR的基因编辑系统,及其使用方法。
在各个实施方案中,基因编辑组合物包含切割人布鲁顿氏酪氨酸激酶(BTK)基因中的靶位点的TALEN。
在某些实施方案中,TALEN包含具有选自包括以下的组的RVD的TAL效应子结构域:
a)T1-F RVDs HD NG HD NN NI HD NG NI NG NN NI NI NI NI HD NG;
b)T1-R RVDs HD NG NI NI NN NN HD HD NI NI NN NG HD HD NG;
c)T2-F RVDs NI NG HD NI NI NN NN NI HD NG NG NN NN HD HD NG;
d)T2-R RVDs NI HD HD NI NI HD NN NI NI NI NI NG NG NG NI HD HD NG;
e)T3-F RVDs NI NG NG NG HD HD NG NI NN HD HD NG NI NG NI NI HD NG;
f)T3-R RVDs NN NN HD NG NG HD NG NG NI NN NN NI HD HD NG NG NG;
g)T4-F RVDs HD HD NI NG NG NG NN NI NI NI HD NG NI NN NN NG;和
h)T4-R RVDs HD HD NG HD NI NG HD HD HD NG HD NG NG NN NN NG NG;以及
TAL效应子结构域能够结合靶位点T1、T2、T3或T4。
在各个实施方案中,基因编辑组合物包含Cas蛋白或编码Cas蛋白的多核苷酸;引导-RNA(gRNA);和包含功能性BTK基因或其片段的修复模板;并且基因编辑系统能够修复B细胞中的内源性BTK基因或掺入功能性BTK基因于B细胞的基因组中。
在某些实施方案中,gRNA包含SEQ ID NO:9-17所示的核苷酸序列。
在各个实施方案中,多核苷酸编码本文所述的基因编辑组合物。
在各个实施方案中,mRNA编码本文所述的基因编辑组合物。
在各个实施方案中,cDNA编码本文所述的基因编辑组合物。
在各个实施方案中,载体包含编码本文所述的基因编辑组合物的多核苷酸。
在各个实施方案中,细胞包含编码本文所述的基因编辑组合物的多核苷酸。
在各个实施方案中,细胞包含编码本文所述的基因编辑组合物的mRNA。
在各个实施方案中,细胞包含载体,所述载体包含编码本文所述的基因编辑组合物的多核苷酸。
在各个实施方案中,细胞包含本文所述的一种或多种基因组修饰。
在某些实施方案中,细胞是造血细胞。
在某些实施方案中,细胞是造血干细胞或祖细胞。
在某些实施方案中,细胞是CD34+细胞。
在某些实施方案中,细胞是CD133+细胞。
在另外的实施方案中,组合物包含本文所述的细胞。
在具体的实施方案中,组合物还包含生理上可接受的载体。
在各个实施方案中,编辑细胞中的BTK基因的方法包括将本文所述的基因编辑组合物、多核苷酸和载体中的一种或多种及供体修复模板引入至细胞中,其中基因编辑组合物的表达在BTK基因中的靶位点处产生双链断裂,并将供体修复模板通过双链断裂(DSB)位点处的同源介导的修复(HDR)掺入BTK基因中。
在某些实施方案中,BTK基因包含导致X-连锁无丙种球蛋白血症(XLA)的一种或多种氨基酸突变或缺失。
在具体的实施方案中,细胞是造血细胞。
在具体的实施方案中,细胞是造血干细胞或祖细胞。
在具体的实施方案中,细胞是CD34+细胞。
在具体的实施方案中,细胞是CD133+细胞。
在具体的实施方案中,编码多肽的多核苷酸是mRNA。
在具体的实施方案中,将编码5′-3′外切核酸酶的多核苷酸引入细胞中。
在另外的实施方案中,将编码Trex2或其生物活性片段的多核苷酸引入细胞中。
在一些实施方案中,供体修复模板包含与DSB的BTK基因序列5′同源的5′同源臂和与DSB的BTK基因序列3′同源的3′同源臂。
在各个实施方案中,供体多核苷酸经设计以修复BTK基因中的一种或多种氨基酸突变或缺失。
在具体的实施方案中,供体多核苷酸包含编码BTK多肽的cDNA。
在另外的实施方案中,供体多核苷酸包含表达盒,所述表达盒包含可操纵地连接至编码BTK多肽的cDNA的启动子。
在具体的实施方案中,5′同源臂和3′同源臂的长度独立地选自约100bp至约2500bp。
在各个实施方案中,5′同源臂和3′同源臂的长度独立选自地约600bp至约1500bp。
在一些实施方案中,5′同源臂是约1500bp并且3′同源臂是约1000bp。
在某些实施方案中,5′同源臂是约600bp并且3′同源臂是约600bp。
在另外的实施方案中,病毒载体用于将供体修复模板引入至细胞中。
在某些实施方案中,病毒载体是重组腺相关病毒载体(rAAV)或逆转录病毒。
在各个实施方案中,rAAV具有来自AAV2的一个或多个ITR。
在另外的实施方案中,rAAV具有选自由以下组成的组的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和AAV10。
在具体的实施方案中,rAAV具有AAV2或AAV6血清型。
在一些实施方案中,逆转录病毒是慢病毒。
在某些实施方案中,慢病毒是整合酶缺陷型慢病毒(IDLV)。
在具体的实施方案中,治疗、预防或缓解X-连锁无丙种球蛋白血症(XLA)或与其相关的病况的至少一种症状的方法,其包括从受试者中收获细胞群;根据本文所述的编辑BTK基因的方法编辑细胞群,和施用经编辑的细胞群至受试者。
附图说明
图1A显示了标注了人BTK基因内TALEN(T1-T4)切割位点的位置的BTK基因座的示意图。示意图未按比例绘制。
图1B显示了原代T细胞中用每种TALEN实现的破坏百分比。将原代人T细胞培养于补充有IL-2(50ng/ml)、IL-7(5ng/ml)和IL-15(5ng/ml)的T细胞生长培养基中,并使用CD3/CD28珠粒(Dynabeads,Life Technologies)刺激48小时。去除珠粒,并将细胞静置过夜,然后使用带有TALEN mRNA(1μg的各种RNA单体)的Neon转染系统进行电穿孔。将细胞再培养5天,并提取基因组DNA。使用PCR纯化试剂盒扩增并纯化切割位点周围的区域。将200ng经纯化的PCR产物与T7内切核酸酶(NEB)一起孵育,在凝胶上进行分析,并使用Licor ImageStudio Lite软件对破坏百分比进行定量。在随后的图中,TALEN T3被用于实验中。
图1C显示了用于使用TALEN编辑BTK基因的AAV供体模板的示意图。DT AAV载体具有侧接有MND启动子驱动的绿色荧光蛋白(GFP)盒的1kb的同源臂。DT-Del AAV供体具有跨越5’同源臂末端至TAL间隔子结构域(SEQ ID NO:72)的基因组区缺失,导致第二外显子和内含子的部分缺失以消除TALEN的切割。
图1D显示了使用TALEN和AAV供体模板在原代T细胞中进行编辑。柱状图描绘了GFP表达的时程。同源重组(HR)百分比报告为第15天的GFP百分比(%)。
图1E显示了代表性FACS图,该图显示了使用TALEN和AAV供体的共递送,在原代T细胞编辑后第2天和第15天的GFP表达。
图2A显示了带有注释的CRISPR引导物的BTK基因座的示意图。显示了人BTK基因内的引导RNA(G1-G9)的位置。示意图未按比例绘制。
图2B显示了如由T7内切核酸酶(New England Biolabs)测定的具有引导物G1至G9的BTK基因座处的破坏百分比(%)。使用Licor Image Studio Lite软件量化了破坏百分比。在随后图内的实验中使用了引导G3。
图2C显示了使用CRISPR-Cas编辑BTK基因的三种示例性AAV供体模板的示意图。DTAAV载体具有侧接MND启动子驱动的绿色荧光蛋白(GFP)的1kb同源臂。DT-PAM AAV供体具有PAM序列(SEQ ID NO:73)中的突变以消除由引导G3进行的切割。DT-Del载体具有缺失(SEQID NO:74)以消除由引导G3进行的切割。
图2D显示了在原代T细胞中使用Cas9+引导物和AAV供体模板的共递送进行的编辑。将原代人CD3+ T细胞培养并珠粒刺激。然后将细胞用Cas9蛋白和单个引导RNA的核糖核蛋白复合体(RNP)转染,并在两个小时后以20%的培养体积添加AAV供体。在第2天、第8天和第15天分析细胞的GFP表达。第15天的GFP表达指示同源介导的修复(HDR)。
图2E显示了代表性FACS图,其显示了使用RNP+AAV供体对原代T细胞进行编辑之后第2天和第15天的GFP表达。
图3A显示了人CD34+细胞编辑方案的示意图。将成人动员的CD34+细胞在补充有TPO、SCF、FLT3L(100ng/ml)和IL3(60ng/ml)的SCGM培养基中培养48小时,然后使用Neon电穿孔系统用TALEN或者以1:1.2比率混合的Cas9蛋白和单个引导RNA的核糖核蛋白复合体(RNP)进行电穿孔。sgRNA购自Trilink Biotechnologies并在5′和3′末端的三个末端位置处具有化学修饰的核苷酸。将细胞在第2天和第5天通过流式细胞术分析。
图3B显示了使用TALEN mRNA和AAV供体模板的共递送对CD34+HSC中的BTK基因座进行编辑。如前所述将成人动员的人CD34+细胞在SCGM培养基中培养,然后使用Neon电穿孔系统用TALEN mRNA进行电穿孔。在电穿孔之后立即添加携带供体模板的AAV载体。对照包括未操纵的细胞和仅用AAV转导且未转染核酸酶(AAV)的细胞。柱状图描绘了第5天的GFP百分比,表示HDR。
图3C显示了描绘了在编辑之后第2天和第5天从模拟物、AAV或AAV+TALEN处理的CD34+细胞中进行的GFP表达的FACS图。
图3D显示了用TALEN和AAV供体编辑之后的CD34+细胞存活力。柱状图表示编辑后第2天和第5天仅模拟物和AAV以及AAV+TALEN处理的细胞的存活率。
图3E显示了TALEN编辑的CD34+细胞的CFU测定。编辑之后一天将TALEN编辑的、仅TALEN、仅AAV和模拟物细胞涂铺在Methocult培养基上,以进行菌落形成单位(CFU)测定。简言之,将500个细胞一式两份涂铺在Methocult H4034培养基(Stemcell Technologies)中,在37℃下孵育12-14天,并根据其形态和GFP表达枚举菌落。CFU-E:菌落形成单位红系,M:巨噬细胞,GM:粒细胞,巨噬细胞,G:粒细胞,GEMM:粒细胞,红系,巨噬细胞,巨核细胞,BFU-E:爆发集落形成单位红系。n=3个独立供体。数据表示为平均值±SEM。
图4A显示了使用RNP和AAV供体模板的共递送进行的于CD34+HSC中的BTK基因座的编辑。如前所述将成人动员的人类CD34+细胞在SCGM培养基中培养,然后使用Neon电穿孔系统用RNP复合物进行电穿孔。在电穿孔之后立即添加携带供体模板的AAV载体。对照包括未操纵的细胞和仅用AAV转导且未转染核酸酶(AAV)的细胞。柱状图描绘了第5天的GFP百分比,表示HDR。
图4B显示了与图4A相同的实验,并描绘了显示在第2天和第5天GFP表达的代表性FAC图。
图4C显示了用RNP和AAV供体编辑之后的CD34+细胞存活力。柱状图表示编辑后第2天和第5天仅模拟物和AAV以及AAV+RNP处理(在各种RNP和AAV剂量下)的细胞的存活率。
图4D显示了RNP编辑的CD34+细胞的CFU测定。编辑之后一天将RNP编辑的、仅AAV和模拟物细胞涂铺在Methocult培养基上,以进行菌落形成单位(CFU)测定。简言之,将500个细胞一式两份涂铺在Methocult H4034培养基(Stemcell Technologies)中,在37℃下孵育12-14天,并根据其形态和GFP表达枚举菌落。CFU-E:菌落形成单位红系,M:巨噬细胞,GM:粒细胞,巨噬细胞,G:粒细胞,GEMM:粒细胞,红系,巨噬细胞,巨核细胞,BFU-E:爆发集落形成单位红系。n=3个独立供体。数据表示为平均值±SEM。
图5A显示了表达GFP的无启动子AAV供体模板的示意图。该载体含有GFP、经截短的土拨鼠肝炎病毒转录后调控元件(WPRE3)和SV40聚腺苷酸化信号。该插入物在任一侧侧接有BTK基因座的0.5kb同源臂。
图5B显示了使用无启动子GFP载体在CD34+HSC中使用RNP和AAV供体模板的共递送进行的BTK基因座的编辑。柱状图描绘了第1、2和5天的GFP百分比,第5天的GFP百分比表示HDR。
图5C显示了与图4A相同的实验,并描绘了显示了第2天和第5天的GFP表达的代表性FAC图。
图5D显示了用RNP和无启动子AAV供体编辑之后CD34+细胞存活力。柱状图表示编辑后第1天、第2天和第5天仅模拟物和AAV以及AAV+RNP处理的细胞(在各种RNP和AAV剂量下)的存活率。第5天的GFP百分比指示HDR百分比。
图5E显示了用于确定HDR的数字液滴PCR测定。使用DNeasy血液和组织试剂盒(Qiagen)从造血干细胞和祖细胞(HSPC)中分离基因组DNA。为了评估编辑率,使用在AAV插入物内的正向引物结合和与同源区域之外的BTK基因座结合的反向引物进行“进-出”液滴数字PCR。生成了ActB基因的类似尺寸的对照扩增子以用作对照。所有反应均一式两份进行。使用QX200 Droplet Generator(Bio-Rad)将PCR反应物分成液滴。使用探针的ddPCRSupermix(不含UTP(Bio-Rad)、900nM引物、250nM探针、50ng基因组DNA和1%DMSO)进行扩增。使用QuantaSoft软件(Bio-Rad)在QX200 Droplet Digital PCR System(Bio-Rad)上分析液滴。
图6显示了表达密码子优化的BTK的AAV供体模板的示意图。
图7显示了用TALEN+AAV或RNP+AAV编辑的细胞中HDR(同源介导的修复)与NHEJ(非同源性末端结合)的比率的比较。
图8A是从内源性启动子表达密码子优化的BTK cDNA的rAAV6供体载体的示意图。
图8B显示了来自单个CD34+供体的数据,证明了将BTK cDNA以预计可容易在XLA中提供临床益处的水平引入内源性BTK基因座的能力。
序列说明
SEQ ID NO:1-8是人类BTK基因的第一内含子和第二内含子中的TALEN靶位点。
SEQ ID NO:9-17是gRNA序列G1-G9。
SEQ ID NO:18是人BTK多肽的氨基酸序列。
SEQ ID NO:19-24是BTK基因座的AAV靶向载体的序列。
SEQ ID NO:25-35是用于使用RNP或TALEN+AAV.MND.GFP载体或使用RNP和表达ATG.coBTK的AAV载体确定CD34+细胞中的HDR的寡聚物和探针。
发明详述
A.综述
本公开通常部分涉及经改善的基因组编辑组合物及其使用方法。不希望受任何特定理论所束缚,本文所述的基因组编辑组合物用于增加细胞中的布鲁顿氏酪氨酸激酶(BTK)的量,以治疗、预防或缓解与X-连锁无丙种球蛋白血症(XLA)相关的症状。因此,本文所述的组合物向具有XLA的受试者提供潜在治愈方案。不希望受任何特定理论的束缚,可以考虑一种将编码功能性BTK蛋白的多核苷酸引入到具有一种或多种导致XLA的突变和/或缺失的BTK基因中的基因编辑方法将挽救XLA引起的免疫和功能性缺陷,并提供潜在的治疗疗法。
在各个实施方案中,考虑了基因组编辑策略、组合物、经遗传修饰的细胞及其使用方法以增加或恢复BTK功能。不希望受任何特定理论所束缚,考虑了BTK基因的基因组编辑以引入编码BTK蛋白的功能性拷贝的多核苷酸。在一个实施方案中,编辑BTK基因包括引入以在造血干细胞(HSC)中在内源性启动子和增强子的控制下的此类方式编码BTK蛋白的功能性拷贝的多核苷酸。在免疫细胞中恢复功能性BTK将有效治疗、预防和/或缓解与患有XLA的受试者相关的一种或多种症状。
各个实施方案中考虑的基因组编辑方法包括经设计以结合并切割BTK基因中的靶结合位点的TALEN(转录激活子样效应子核酸酶)变体。在具体的实施方案中考虑的TALEN变体可用于在靶多核苷酸序列中引入双链断裂,并且在多核苷酸模板(如供体修复模板)的存在下导致同源介导的修复(HDR),即供体修复模板的同源重组至BTK基因中。在某些实施方案中考虑的TALEN变体还可被设计为切口酶,其生成可使用细胞碱基切除修复(BER)机制或同源重组在供体修复模板的存在下来修复的单链DNA断裂。同源重组需要同源DNA作为用于修复双链DNA断裂的模板,并且可被利用来产生无限的多种修饰,这些修饰通过引入包含编码治疗性基因(如,BTK)的表达盒或多核苷酸的供体DNA于在每一侧侧接有携带与靶位点所侧接的区域的同源性的序列的靶位点处而指定。
各个其他实施方案中考虑的基因组编辑方法包括经设计以结合和切割BTK基因中的靶结合位点的CRISPR/Cas系统。具体的实施方案中考虑的CRISPR/Cas系统可用于在靶多核苷酸序列中引入双链断裂,并且在多核苷酸模板(如供体修复模板)的存在下导致同源介导的修复(HDR),即供体修复模板的同源重组至BTK基因中。还可通过一种或多种引导RNA(gRNA)将某些实施方案中考虑的CRISPR/Cas系统引导至一个或多个切割位点。某些实施方案中考虑的CRISPR/Cas系统还可被设计为切口酶,其生成可使用细胞碱基切除修复(BER)机制或同源重组在供体修复模板的存在下来修复的单链DNA断裂。同源重组需要同源DNA作为用于修复双链DNA断裂的模板,并且可被利用来产生无限多种修饰,这些修饰通过引入包含编码治疗性基因(如,BTK)的表达盒或多核苷酸的供体DNA于在每一侧侧接有携带与靶位点所侧接的区域的同源性的序列的靶位点处而指定。
在一个优选的实施方案中,本文所述的基因组编辑组合物包含靶向人BTK基因的转录激活子样效应子核酸酶(TALEN)。
在一个优选的实施方案中,本文所述的基因组编辑组合物包含靶向人BTK基因的CRISPR(成簇规律间隔短回文重复序列)/Cas(CRISPR相关的)核酸酶系统。在此类实施方案中,定点核酸酶是CRISPR-相关的内切核酸酶(“Cas“内切核酸酶”)并且核酸引导分子是引导RNA(gRNA)。
在各个实施方案中,其中DNA断裂在BTK基因的第一内含子或第二内含子中产生并且提供了供体修复模板(即包含编码功能性BTK多肽的多核苷酸的供体修复模板),DSB通过在DNA断裂-位点处同源重组用模板的序列修复。在优选的实施方案中,修复模板包含编码功能性BTK多肽的多核苷酸序列,所述功能性BTK多肽经设计以插入其中多核苷酸和BTK多肽的表达在内源性BTK启动子和/或增强子的控制下的位点处。
在一个优选的实施方案中,本文所述的基因组编辑组合物包含TALEN变体和一种或多种末端加工酶以提高HDR效率。
在一个优选的实施方案中,本文所述的基因组编辑组合物包含靶向人BTK基因、编码功能性BTK蛋白的供体修复模板和末端加工酶(如Trex2)的TALEN或CRISPR/Cas核酸酶系统。
在各个实施方案中,考虑了基因组编辑的细胞。基因组编辑的细胞包含功能性BTK多肽,挽救了B细胞发育,并预防XLA。
因此,与现有的XLA治疗的基因编辑策略相比,本文所述的方法和组合物代表了一种巨大的改善。
用于重组(即,经工程化的)DNA、肽和寡核苷酸合成、免疫测定、组织培养、转化(如,电穿孔、脂质体转染)、酶促反应、纯化的技术及相关技术和程序可如本说明书全文引用和讨论的微生物学、分子生物学、生物化学、分子遗传学、细胞生物学、病毒学和免疫学的各种常见且更具体的参考文献中所述一般进行。参见,如Sambrook等人,MolecularCloning:A Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.;Current Protocols in Molecular Biology(John Wiley和Sons,2008年7月更新);Short Protocols in Molecular Biology:A Compendium of Methodsfrom Current Protocols in Molecular Biology,Greene Pub.Associates and Wiley-Interscience;Glover,DNA Cloning:A Practical Approach,第I&II卷(IRL Press,Oxford Univ.Press USA,1985);Current Protocols in Immunology(编者:JohnE.Coligan,Ada M.Kruisbeek,David H.Margulies,Ethan M.Shevach,Warren Strober2001 John Wiley&Sons,NY,NY);Real-Time PCR:Current Technology andApplications,Julie Logan,Kirstin Edwards和Nick Saunders编辑,2009,CaisterAcademic Press,Norfolk,UK;以及Techniques for the Analysis of Complex Genomes,(Academic Press,New York,1992);Guthrie和Fink,Guide to Yeast Genetics andMolecular Biology(Academic Press,New York,1991);Oligonucleotide Synthesis(N.Gait编辑,1984);Nucleic Acid The Hybridization(B.Hames&S.Higgins,编辑,1985);Transcription and Translation(B.Hames&S.Higgins,编辑,1984);Animal CellCulture(R.Freshney编辑,1986);Perbal,A Practical Guide to Molecular Cloning(1984);Next-Generation Genome Sequencing(Janitz,2008 Wiley-VCH);PCR Protocols(Methods in Molecular Biology)(Park编辑,第3版,2010 Humana Press);ImmobilizedCells And Enzymes(IRL Press,1986);论文,Methods In Enzymology(Academic Press,Inc.,N.Y.);Gene Transfer Vectors For Mammalian Cells(J.H.Miller和M.P.Calos编辑,1987,Cold Spring Harbor Laboratory);Harlow和Lane,Antibodies,(Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.,1998);Immunochemical MethodsIn Cell And Molecular Biology(Mayer和Walker编辑,Academic Press,London,1987);Handbook Of Experimental Immunology,第I-IV卷(D.M.Weir和CC Blackwell编辑,1986);Roitt,Essential Immunology,第6版,(Blackwell Scientific Publications,Oxford,1988);Current Protocols in Immunology(Q.E.Coligan,A.M.Kruisbeek,D.H.Margulies,E.M.Shevach和W.Strober编辑,1991);Annual Review of Immunology;以及期刊中的专题论文,诸如Advances in Immunology。
B.定义
在更详细地阐述本公开之前,提供将在本文中使用的某些术语的定义可能有助于其理解。
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。尽管与本文描述的那些方法或材料相似或等同的任何方法和材料都可以用于特定实施方案的实践或测试中,但是本文描述了组合物、方法和材料的优选实施方案。为了本公开的目的,下面定义以下术语。在整个本公开中阐述了附加定义。
冠词“一”、“一个”和“该”在本文中用于指代该冠词的语法对象的一个或多个(即,至少一个,或一个或多个)。举例来说,“一要素”意指一个要素或一个或多个要素。
替代方案(如,“或”)的使用应理解为意指替代方案中的一个、两者或其任何组合。
术语“和/或”应被理解为意指替代方案中的一种或两种。
如本文所用,术语“约”或“大约”是指与参考量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度相比,数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度变化多达15%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%。在一个实施方案中,术语“约”或“大约”是指量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度约是参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度的±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%或±1%的范围。
在一个实施方案中,如1至5、约1至5、或约1至约5的范围是指由该范围涵盖的每个数值。例如,在一个非限制性且仅说明性实施方案中,范围“1至5”等于表达1、2、3、4、5;或1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5或5.0;或1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9或5.0。
如本文所用,术语“基本上”是指数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度与参考量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度相比,是80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。在一个实施方案中,“基本上相同”是指产生效应(如生理效应)的量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度与参考数量、水平、值、数目、频率、百分比、尺寸、大小、量、重量或长度大致相同。
在整个说明书中,除非上下文另外要求,否则词语“包括(comprise)”、“包括/包含(comprises)”和“包含(comprising)”将被理解为暗示包括陈述的步骤或要素或者步骤或要素的组,但不排除任何其他步骤或要素或者步骤或要素的组。“由……组成”意指包括且限于短语“由……组成”之后的任何内容。因此,短语“由……组成”指示所列出的要素是必需的或强制性的,并且可能不存在其他要素。“基本上由……组成”意指包括在该短语之后列出的任何要素,并且限于不干扰或导致本公开中针对所列要素所指定的活性或作用的其他要素。因此,短语“基本上由……组成”指示所列要素是必需的或强制性的,但不存在其他对所列要素的活性或作用有重大影响的要素。
在整个说明书中,对“一个实施方案”、“一实施方案”、“一个特定的实施方案”、“一个相关的实施方案”、“某一个实施方案”、“另一个实施方案”或“另一实施方案”或其组合的指代意指结合实施方案描述的特定特征、结构或性质包括在至少一个实施方案中。因此,在本说明书中各个地方出现的前述短语不一定都指同一实施方案。此外,可以以任何适合的方式在一个或多个实施方案中组合特定特征、结构或性质。还应理解,在一个实施方案中对特征的主动叙述用作在一个具体的实施方案中排除该特征的基础。
术语“离体”通常是指在生物体之外发生的活动,诸如在生物体之外的人工环境中在活组织中或活组织上进行的实验或测量,优选天然条件的最小改变。在具体的实施方案中,“离体”程序涉及从生物体取出并且通常在无菌条件下并且通常持续数小时或多达约24小时、但包括多达48或72小时(这取决于情形)的在实验室装置中培养或调节的活细胞或组织。在某些实施方案中,可将此类组织或细胞收集并冷冻,并且此后解冻以用于离体处理。这样的组织或细胞可以被收集和冷冻,然后融化以进行离体治疗。使用活细胞或组织持续超过几天的组织培养实验或程序通常被认为是“在体外”,尽管在某些实施方案中该术语可以与离体互换使用。
术语“体内”通常是指在生物体内发生的活动。在一个实施方案中,细胞基因组是在体内经工程化的、编辑或修饰的。
“增强”或“促进”或“增加”或“扩增”或“增强”通常是指与由媒介物或对照引起的响应相比,本文所述的TALEN变体、基因组编辑组合物或基因组编辑的细胞产生、引发或引起更大的响应(即生理响应)的能力。可测量的响应可包括尤其根据本领域和本文描述的理解显而易见的HDR和/或BTK表达的增加。“增加的”或“增强”的量通常是“统计上显著”量,并且可包括增加是由媒介物或对照产生的响应的1.1、1.2、1.5、2、3、4、5、6、7、8、9、10、15、20、30或更多倍(如500、1000倍)(包括所有整数和居间且高于1的小数点,如1.5、1.6、1.7、1.8等)。
“减小”或“降低”或“减少”或“降低”或“减轻”或“消融”或“抑制”或“减弱”通常是指与由媒介物或多种引起的响应相比,本文所述的TALEN变体CRISPR/Cas系统、基因组编辑组合物或基因组编辑的细胞产生、引发或引起更小的响应(即,生理响应)的能力。可测量的响应可以包括与XLA相关的一种或多种症状的减小。“减小”或“降低的”的量通常是“统计上显著”的量,并且可包括减小是由媒介物或对照产生的响应的1.1、1.2、1.5、2、3、4、5、6、7、8、9、10、15、20、30或更多倍(如,500、1000倍)(包括所有整数和居间且高于1的小数点,如1.5、1.6、1.7、1.8)。
“维持”或“保留”或“维持”或“无变化”或“无显著变化”或“无显著减少”通常指本文所述的TALEN变体、基因组编辑组合物或基因组编辑的细胞产生、引发或引起与由媒介物或对照引起的响应相比基本上类似或相当的生理响应(即下游效应)的能力。相当的响应是与参考响应没有显著差异或可测量差异的响应。
如本文所用的术语“特异性结合亲和力”或“特异性结合”或“特异性结合的”或“特异性结合”或“特异性靶向”描述一种分子与另一种的结合,如多肽的DNA结合结构域以比本底结合更大的结合亲和力结合至DNA。结合结构域如果以例如大于或等于约105M-1的亲和力或Ka(即,特定结合相互作用的等效缔合常数,其单位为1/M)结合至或缔合于靶位点,则“特异性结合”至靶位点。在某些实施方案中,结合结构域以大于或等于约106M-1、107M-1、108M-1、109M-1、1010M-1、1011M-1、1012M-1或1013M-1的Ka结合至靶位点。“高亲和力”结合结构域是指其Ka为至少107M-1、至少108M-1、至少109M-1、至少1010M-1、至少1011M-1、至少1012M-1、至少1013M-1或更大的那些结合结构域。
可替代地,亲和力可被定义为特定结合相互作用的平衡解离常数(Kd),其单位是M(如10-5M至10-13M或更小)。包含一个或多个DNA结合结构域的TALEN变体对在具体的实施方案中考虑的DNA靶位点的亲和力可使用常见技术(如,酵母细胞表面展示,或通过结合缔合,或使用标记的配体进行的置换测定)容易确定。
在一个实施方案中,特异性结合的亲和力是本底结合的约2倍、本底结合的约5倍、本底结合的约10倍、本底结合的约20倍、本底结合的约50倍、本底结合的约100倍或本底结合的约1000倍,或更大。
术语“选择性结合”或“选择性结合的”或“选择性结合”或“选择性靶向”并描述在多个脱靶分子存在下一个分子与靶分子的优先结合(中靶结合)。在具体的实施方案中,TALEN选择性结合中靶DNA结合位点的频率是TALEN结合脱靶DNA靶结合位点的约5、10、15、20、25、50、100或1000倍。
“中靶”是指靶位点序列。
“脱靶”是指与靶位点序列类似但不同一的序列。
“靶位点”或“靶序列”是只要存在足够的结合和/或切割条件就限定结合分子将结合和/或切割的一部分核酸的染色体或染色体外核酸序列。当指代仅提及靶位点或靶序列的一条链的多核苷酸序列或SEQ ID NO.时,应当理解,由TALEN变体或CRISPR/Cas系统结合和/或切割的靶位点或靶序列是双链的,并且包含参考序列及其互补序列。在一个优选的实施方案中,靶位点是人BTK基因中的序列。
“重组”是指两种多核苷酸之间遗传信息交换的过程,包括但不限于由非同源性末端结合(NHEJ)和同源重组进行的供体捕获。为了本公开的目的,“同源重组(HR)”是指特殊形式的此类改变,其经由同源性介导的修复(HDR)机制发生在例如细胞中的双链断裂修复期间。该过程需要核苷酸序列同源性,使用“供体”分子作为模板来修复“靶”分子(即经历了双链断裂的分子),并分别被称为“非交叉基因转化”或“短道基因转化”,因为它会导致将遗传信息从供体转移至靶标。不希望受任何特定理论所束缚,此类转移可涉及对在断裂的靶标和供体之间形成的异源双链体DNA进行错配校正,和/或“合成依赖性链退火”,其中供体用于重新合成将成为靶标和/或相关过程一部分的遗传信息。此类专门的HR通常导致靶分子的序列发生改变,使得供体多核苷酸的部分或全部序列被掺入靶多核苷酸中。
“切割”是指DNA分子的共价主链的断裂。切割可以通过多种方法引发,包括但不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割两者均是可能的。双链切割可以由于两个不同的单链切割事件发生。DNA切割可导致钝端或交错端的产生。在某些实施方案中,本文所述的多肽和TALEN变体(如TALEN等)可用于靶向双链DNA切割。内切核酸酶切割识别位点可以在任一DNA链上或两条DNA链上。
“外源”分子是通常不存在于细胞中但通过一种或多种遗传、生化或其他方法引入细胞中的分子。示例性外源分子包括但不限于小有机分子、蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、以上分子的任何修饰的衍生物或包含一种或多种以上分子的任何复合物。用于引入外源分子至细胞中的方法是本领域技术人员已知的,并且包括但不限于脂质介导的转移(即脂质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、生物聚合物纳米粒子、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体-介导的转移。
“内源性”分子是在特定环境条件下通常以特定发育阶段存在于特定细胞中的分子。另外的内源性分子可以包括蛋白质。
“基因”是指编码基因产物的DNA区域,以及调控基因产物产生的所有DNA区域,无论此类调控序列是否与编码和/或转录序列相邻。基因包括但不限于启动子序列、增强子、沉默子、绝缘子、边界元件、终止子、聚腺苷酸化序列、转录后响应元件、翻译调控序列诸如核糖体结合位点和内部核糖体进入位点、复制起点、基质附着位点和基因座控制区。
“基因表达”是指将基因中包含的信息转换为基因产物。基因产物可以是基因的直接转录产物(如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其他类型的RNA)或通过mRNA翻译产生的蛋白质。基因产物还包括通过诸如加帽、聚腺苷酸化、甲基化和编辑的过程修饰的RNA,及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、豆蔻酰化和糖基化修饰的蛋白。
如本文所用,术语“经遗传工程化的”或“经遗传修饰”是指染色体或染色体外添加呈DNA或RNA形式的基因外物质至细胞中的总遗传物质。遗传修饰可被靶向或非靶向至细胞基因组中的特定位点。在一个实施方案中,遗传修饰是位点特异性的。在一个实施方案中,遗传修饰不是位点特异性的。
如本文所用,术语“基因组编辑”是指取代、缺失和/或引入遗传物在细胞基因组中的靶位点处,其恢复、修正、破坏和/或修饰基因或基因产物的表达。在具体的实施方案中考虑的基因组编辑包括引入一种或多种TALEN变体至细胞中以在细胞基因组内的靶位点处或附近在供体修复模板的存在下生成DNA损伤。
如本文所用,术语“基因疗法”是指引入额外的遗传物质至细胞内的总遗传物质中,其恢复、修正或修饰基因或基因产物的表达或用于表达治疗性多肽的目的。在具体的实施方案中,通过恢复、修正、破坏或修饰基因或基因产物的表达或用于表达治疗性多肽的目的基因组编辑来引入遗传物质至细胞基因组中被认为是基因疗法。
C.基于TALEN的系统
本文具体的实施方案中考虑的适用于基因组编辑BTK基因中的靶位点的TALEN变体包含一个或多个DNA结合结构域和一个或多个DNA切割结构域(如,一个或多个内切核酸酶和/或外切核酸酶结构域)和任选的本文所述的一种或多种接头。术语“重编程的核酸酶”、“经工程化的核酸酶”、“核酸酶变体”或“TALEN变体”可互换使用并且是指包含一个或多个DNA结合结构域和一个或多个DNA切割结构域的TALEN,其中TALEN已从亲本或天然存在的TALEN设计和/或修饰,以结合并切割BTK基因中的双链DNA靶序列,优选人BTK基因的第一或第二内含子中的靶序列,和更优选如SEQ ID NO:1-8所示的人BTK基因的第一或第二内含子中的靶序列。TALEN变体可从天然存在的效应子结构域或之前的TALEN变体设计和/或修饰。具体的实施方案中考虑的TALEN变体还可包含一个或多个另外的功能性结构域,如展现出5′-3′外切核酸酶、5′-3′碱性外切核酸酶、3′-5′外切核酸酶(如,Trex2)、5′flap内切核酸酶、解旋酶、模板-依赖性DNA聚合酶或非模板-依赖性DNA聚合酶活性的末端加工酶的末端加工酶促结构域。
在各个实施方案中,将TALEN重新编程以在BTK基因中引入双链断裂(DSB),优选人BTK基因的第一内含子或第二内含子中的靶序列,和更优选如SEQ ID NO:1-8所示的人BTK基因的第一内含子或第二内含子中的靶序列。“TALEN”是指包含TAL效应子DNA结合结构域和酶促结构域的蛋白。它们通过融合TAL效应子DNA-结合结构域至DNA切割结构域(切割DNA链的核酸酶)来制备。上述的FokI限制酶是适用于基于TALEN的基因调控系统的示例性酶促结构域。
TAL效应子是由黄单胞菌属(Xanthomonas)细菌感染植物时经由其III型分泌系统分泌的蛋白质。DNA结合结构域含有一条重复的、高度保守的33–34个氨基酸序列,具有不同的第12和13氨基酸。这两个位置称为重复可变二残基(RVD),是高度可变的,并且与特定的核苷酸识别高度相关。因此,TAL效应子结构域可通过选择含有适当RVD的重复区段的组合而工程化以结合特定靶DNA序列。对RVD组合的核酸特异性如下:HD靶向胞嘧啶、NI靶向腺嘌呤、NG靶向胸腺嘧啶和NN靶向鸟嘌呤(尽管在一些实施方案中,NN还可以更低的特异性结合腺嘌呤)。
在一些实施方案中,TAL效应子结构域结合至与BTK基因的靶基因座内的靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与选自表1中所列那些的靶基因的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与选自表1中所列那些的靶基因的靶基因座内的靶DNA序列100%同一的靶DNA序列。
在一些实施方案中,TAL效应子结构域结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列100%同一的靶DNA序列。
在一些实施方案中,TAL效应子结构域结合至与SEQ ID NO:1-8中的一种至少90%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与SEQ ID NO:1-8中的一种至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与SEQ ID NO:1-8中的一种100%同一的的靶DNA序列。
在一些实施方案中,TAL效应子结构域结合至与BTK基因的靶基因座内的靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与选自表1中所列那些的靶基因的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与选自表1中所列那些的靶基因的靶基因座内的靶DNA序列100%同一的靶DNA序列。
表1:靶位点
SEQ ID NO:1 TALEN 1-F靶位点 TCTCGACTATGAAAACT
SEQ ID NO:2 TALEN 1-R靶位点 TCTAAGGCCAAGTCCT
SEQ ID NO:3 TALEN 2-F靶位点 TATCAAGGACTTGGCCT
SEQ ID NO:4 TALEN 2-R靶位点 TACCAACGAAAATTTACCT
SEQ ID NO:5 TALEN 3-F靶位点 TATTTCCTAGCCTATAACT
SEQ ID NO:6 TALEN 3-R靶位点 TGGCTTCTTAGGACCTTT
SEQ ID NO:7 TALEN 4-F靶位点 CCATTTGAAACTAGGT
SEQ ID NO:8 TALEN 4-R靶位点 CCTCATCCCTCTTGGTT
在一些实施方案中,TAL效应子结构域结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二外显子或第三外显子内)的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二外显子或第三外显子内)的靶基因座内的靶DNA序列100%同一的靶DNA序列。
在一些实施方案中,TAL效应子结构域结合至与SEQ ID NO:1-8中的一种90%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与SEQ ID NO:1-8中的一种至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,TAL效应子结构域结合至与SEQ ID NO:1-8中一种100%同一的靶DNA序列。
在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域的至少一个结合至与BTK基因的靶基因座内的靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域的至少一个结合至与选自表1中列出的那些的靶基因的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域的至少一种结合至与选自表1列出的那些的靶基因的靶基因座内的靶DNA序列100%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域的至少一个结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域的至少一种结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域中的至少一种结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列100%同一的靶DNA序列。
在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域的至少一种结合至与SEQ ID NO:1-8中的一种至少90%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域的至少一种结合至与SEQ ID NO:1-8中的一种至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含TAL效应子结构域的两种或多种TAL效应子-融合蛋白,其中TAL效应子结构域的至少一种结合至与SEQ ID NO:1-8中的一种100%同一的靶DNA序列。
在一些实施方案中,TAL效应子结构域包含如表2所示的RVD序列。
表2:TAL效应子结构域RVD
T1(#1181)
T1-F RVDs HD NG HD NN NI HD NG NI NG NN NI NI NI NI HD NG
T1-R RVDs HD NG NI NI NN NN HD HD NI NI NN NG HD HD NG
T2(#1182)
T2-F RVDs NI NG HD NI NI NN NN NI HD NG NG NN NN HD HD NG
T2-R RVDs NI HD HD NI NI HD NN NI NI NI NI NG NG NG NI HD HD NG
T3(#1183)
T3-F RVDs NI NG NG NG HD HD NG NI NN HD HD NG NI NG NI NI HD NG
T3-R RVDs NN NN HD NG NG HD NG NG NI NN NN NI HD HD NG NG NG
T4
T4-F RVDs HD HD NI NG NG NG NN NI NI NI HD NG NI NN NN NG
T4-R RVDs HD HD NG HD NI NG HD HD HD NG HD NG NG NN NN NG NG
用于组装TAL-效应子重复序列的方法和组合物是本领域已知的。参见如,Cermak等人,Nucleic Acids Research,39:12,2011,e82。用于构建TAL-效应子重复序列的质粒可从Addgene商购获得。
D.基于CRISPR/Cas的系统
组合基因-调控系统包括定点修饰多肽和核酸引导分子。在本文中,“定点修饰多肽”是指结合至核酸引导分子、由其所结合的核酸引导分子靶向至靶核酸序列(例如DNA序列)并修饰靶DNA序列(如,靶DNA的切割、突变或甲基化)的多肽。定点修饰多肽包含两个部分,即结合核酸引导物的部分和活性部分。在一些实施方案中,定点修饰多肽包含展现出定点酶促活性(如,DNA甲基化、DNA切割、组蛋白乙酰化、组蛋白甲基化等)的活性部分,其中酶促活性的位点由引导核酸确定。在一些情况下,定点修饰多肽具有修饰靶DNA的酶促活性(如,核酸酶活性、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、脱氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性或糖基化酶活性)。在其他情况下,定点修饰多肽具有修饰与靶DNA相关的多肽(如组蛋白)的酶促活性(如甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性或脱豆蔻酰化活性)。在一些实施方案中,活性部分调节靶DNA序列的转录(如,以增加或减少转录)。
核酸引导物包含两个部分:第一部分,其与内源性靶DNA序列(在本文中称为“DNA-结合区段”)互补并能够与内源性靶DNA序列(在本文中称为“DNA-结合区段”)结合;和第二部分,其能够与定点修饰多肽(在本文中称为“蛋白-结合区段”)相互作用。在一些实施方案中,将核酸引导物的DNA-结合区段和蛋白-结合区段包含于单个多核苷酸分子内。在一些实施方案中,核酸引导物的DNA-结合区段和蛋白-结合区段各自被包含于分开的多核苷酸分子中,使得核酸引导物包含彼此缔合以形成功能性引导物的两种多核苷酸分子。
核酸引导物通过与靶基因的DNA序列内包含的靶DNA序列特异性杂交,介导组合的蛋白质/核酸基因调控系统的靶特异性。本文提及的靶基因涵盖此特定基因的全长DNA序列,并且特定靶基因的全长DNA序列将包含多个靶遗传基因座,其是指特定靶基因序列的部分(如,外显子或内含子)。在每个靶遗传位点内有在本文中称为“靶DNA序列”或“靶序列”的DNA序列的较短链段,其可被本文所述的基因调控系统修饰。此外,每个靶遗传基因组都包含一个“靶修饰位点”,它是指由基因调控系统诱导的修饰的精确位置(如,插入、缺失或突变的位置,DNA断裂的位置或表观遗传修饰的位置)。本文所述的基因-调控系统可包含单个核酸引导物,或可包含多个核酸引导物(如2、3、4、5、6、7、8、9、10或多个核酸引导物)。
以下描述的CRISPR/Cas系统是组合蛋白/核酸系统的示例性实施方案。
在一些实施方案中,本文所述的基因编辑系统是CRISPR(成簇规律间隔短回文重复序列)/Cas(CRISPR相关的)核酸酶系统。在此类实施方案中,定点修饰多肽是CRISPR-相关的内切核酸酶(“Cas”内切核酸酶)并且核酸引导分子是引导RNA(gRNA)。
Cas多肽是指可以与gRNA分子相互作用并与gRNA分子协同归巢或定位至靶DNA序列的多肽,并包括天然存在的Cas蛋白和经工程化的、改变的或以其他方式修饰的Cas蛋白,其与天然存在的Cas序列相差一个或多个氨基酸残基。
在一些实施方案中,Cas蛋白是Cas9蛋白。Cas9是使用HNH核酸酶结构域以切割DNA的靶链和使用RuvC样结构域以切割非靶链的多-结构域酶。在一些实施方案中,Cas9的突变体可通过选择性结构域失活生成,使得WT Cas9能够转化为不能切割DNA的非酶促活性的突变体(如,dCas9),或能够通过切割靶或非靶链中的一条或另一条来产生单链DNA断裂的切口酶突变体。
引导RNA(gRNA)包含两个区段,即DNA-结合区段和蛋白-结合区段。在一些实施方案中,gRNA的蛋白-结合区段被包含于一个RNA分子中,并且DNA-结合区段被包含于另一个分开的RNA分子中。此类实施方案在本文中称为“双分子gRNA”或“两分子gRNA”或“双重gRNA”。在一些实施方案中,gRNA是单个RNA分子并在本文中称为“单个-引导RNA”或“sgRNA”。术语“引导RNA”或“gRNA”是包含性的,其均被称为两分子引导RNA和sgRNA。
gRNA的蛋白-结合区段部分包含两个相互互补的核苷酸互补链段,以形成双链RNA双链体(dsRNA双链体),从而促进了与Cas蛋白的结合。
gRNA的DNA-结合区段(或“DNA-结合序列”)包含与特定序列靶DNA序列互补并能够结合至特定序列靶DNA序列的核苷酸序列。gRNA的蛋白质-结合区段与Cas相互作用,并且gRNA分子与定点修饰多肽的相互作用导致Cas结合至内源性DNA,并在靶DNA序列内或周围产生一种或多种修饰。靶修饰位点的精确位置由以下两者确定:(i)gRNA和靶DNA序列之间的碱基配对互补性;和(ii)在靶DNA序列中称为前间区序列邻近基序(PAM)的短基序的位置。Cas结合至靶DNA序列需要PAM序列。多种PAM序列是本领域已知的,并且适合与本领域已知的特定Cas内切核酸酶(如,Cas9内切核酸酶)一起使用(参见如,Nat Methods.2013年11月;10(11):1116–1121和Sci Rep.2014;4:5405)。在一些实施方案中,PAM序列位于靶修饰位点的50个碱基对内。在一些实施方案中,PAM序列位于靶修饰位点的10个碱基对之内。可以通过这种方法靶向的DNA序列仅受PAM序列与靶修饰位点之间的相对距离以及存在介导序列特异性、gRNA-介导的Cas结合的的独特20碱基对序列的限制。在一些实施方案中,靶修饰位点位于靶基因座的5'末端。在一些实施方案中,靶修饰位点位于靶基因座的3’末端。在一些实施方案中,靶修饰位点位于靶基因座的内含子或外显子内。
在一些实施方案中,本公开提供了编码gRNA的多核苷酸。在一些实施方案中,将gRNA-编码核酸包含于表达载体(如重组表达载体)中。在一些实施方案中,本公开提供了编码定点修饰多肽的多核苷酸。在一些实施方案中,将编码定点修饰多肽的多核苷酸包含于表达载体(如重组表达载体)中。
Cas蛋白
在一些实施方案中,定点修饰多肽是Cas蛋白。多种种类的Cas分子可用于本文所述的方法和组合物中,包括来源于以下的Cas分子:化脓性链球菌(S.pyogenes)、金黄色葡萄球菌(S.aureus)、脑膜炎奈瑟氏球菌(N.meningitidis)、嗜热链球菌(S.thermophiles)、燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacilluspleuropneumoniae)、产琥珀酸放线杆菌(Actinobacillus succinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属物种(Actinomyces sp.)、Cycliphilusdenitrificans、寡食氨基酸单胞菌(Aminomonas paucivorans)、蜡样芽胞杆菌(Bacillus cereus)、斯密氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌(Bacillus thuringiensis)、拟杆菌属物种(Bacteroides sp.)、Blastopirellula marina、慢生根瘤菌属物种(Bradyrhizobiumsp.)、侧孢短芽孢杆菌(Brevibacillus laterospoxus)、大肠弯曲杆菌(Campylobactercoli)、空肠弯曲杆菌(Campylobacter jejuni)、红嘴鸥弯曲杆菌(Campylobacter lari)、Candidatus puniceispirillum、解纤维梭菌(Clostridium cellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒杆菌(Corynebacterium accolens)、白喉棒杆菌(Corynebacterium diphtheria)、马氏棒杆菌(Corynebacterium matruchotii)、Dinoroseobacter shibae、细长真杆菌(Eubacterium dolichum)、γ-变形球菌(Gammaproteobacterium)、重氮营养葡糖酸醋杆菌(Gluconacetobacterdiazotrophicus)、副流感嗜血杆菌(Haemophilus parainfluenzae)、生痰嗜血杆菌(Haemophilus sputomm)、加拿大螺杆菌(Helicobacter canadensis)、同性恋螺杆菌(Helicobacter cinaedi)、鼬鼠螺杆菌(Helicobacter mustelae)、多养型泥杆菌(Ilyobacter polytropus)、金氏金氏菌(Kingella kingae)、卷曲乳杆菌(Lactobacilluscrispatus)、伊氏李斯特氏菌(Listeria ivanovii)、单核细胞增多性李斯特氏菌(Listeria monocytogenes)、李斯特氏菌科细菌(Listeriaceae bacterium)、甲基孢囊菌属物种(Methylocystis sp.)、丝孢甲烷弯菌(Methylosinus trichosporium)、羞怯动弯杆菌(Mobiluncus mulieris)、小杆状奈瑟氏球菌(Neisseria bacilliformis)、灰色奈瑟氏球菌(Neisseria cinerea)、金黄奈瑟氏球菌(Neisseria flavescens)、乳糖奈瑟氏球菌(Neisseria lactamica)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、奈瑟氏球菌属物种(Neisseria sp.)、瓦茨瓦尔西奈瑟氏球菌(Neisseria wadsworthii)、亚硝酸菌属物种(Nitrosomonas sp.)、食淋洗物细小棒菌(Parvibaculum lavamentivorans)、多杀性巴斯德氏菌(Pasteurella multocida)、琥珀酸考拉杆菌(Phascolarctobacteriumsuccinatutens)、蒲桃雷尔氏菌(Ralstonia syzygii)、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属物种(Rhodovulum sp.)、米氏西蒙斯氏菌(Simonsiella muelleri)、鞘氨醇单胞菌属物种(Sphingomonas sp.)、葡萄园芽孢乳杆菌(Sporolactobacillus vineae)、金黄色葡萄球菌(Staphylococcus aureus)、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属物种(Streptococcus sp.)、罕见小球菌属物种(Subdoligranulum sp.)、运动替斯崔纳菌(Tistrella mobilis)、密螺旋体属物种(Treponema sp.)或蚯蚓蚯蚓肾杆菌(Verminephrobacter eiseniae)。
在一些实施方案中,Cas蛋白是Cas9蛋白或Cas9直向同源物,并选自由以下组成的组:SpCas9、SpCas9-HF1、SpCas9-HF2、SpCas9-HF3、SpCas9-HF4、SaCas9、FnCpf、FnCas9、eSpCas9和NmeCas9。在一些实施方案中,内切核酸酶选自由以下组成的组:C2C1、C2C3、Cpf1(还被称为Cas12a)、Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也被称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3和Csf4。另外的Cas9直向同源物描述于国际PCT公开No.WO 2015/071474中。
在一些实施方案中,Cas9蛋白是天然存在的Cas9蛋白。示例性天然存在的Cas9分子描述于Chylinski等人,RNA Biology 2013 10:5,727-737中。此类Cas9分子包括以下的Cas9分子:类簇1(cluster 1)细菌家族、类簇2细菌家族、类簇3细菌家族、类簇4细菌家族、类簇5细菌家族、类簇6细菌家族、类簇7细菌家族、类簇8细菌家族、类簇9细菌家族、类簇10细菌家族、类簇11细菌家族、类簇12细菌家族、类簇13细菌家族、类簇14细菌家族、类簇15细菌家族、类簇16细菌家族、类簇17细菌家族、类簇18细菌家族、类簇19细菌家族、类簇20细菌家族、类簇21细菌家族、类簇22细菌家族、类簇23细菌家族、类簇24细菌家族、类簇25细菌家族、类簇26细菌家族、类簇27细菌家族、类簇28细菌家族、类簇29细菌家族、类簇30细菌家族、类簇31细菌家族、类簇32细菌家族、类簇33细菌家族、类簇34细菌家族、类簇35细菌家族、类簇36细菌家族、类簇37细菌家族、类簇38细菌家族、类簇39细菌家族、类簇40细菌家族、类簇41细菌家族、类簇42细菌家族、类簇43细菌家族、类簇44细菌家族、类簇45细菌家族、类簇46细菌家族、类簇47细菌家族、类簇48细菌家族、类簇49细菌家族、类簇50细菌家族、类簇51细菌家族、类簇52细菌家族、类簇53细菌家族、类簇54细菌家族、类簇55细菌家族、类簇56细菌家族、类簇57细菌家族、类簇58细菌家族、类簇59细菌家族、类簇60细菌家族、类簇61细菌家族、类簇62细菌家族、类簇63细菌家族、类簇64细菌家族、类簇65细菌家族、类簇66细菌家族、类簇67细菌家族、类簇68细菌家族、类簇69细菌家族、类簇70细菌家族、类簇71细菌家族、类簇72细菌家族、类簇73细菌家族、类簇74细菌家族、类簇75细菌家族、类簇76细菌家族、类簇77细菌家族、或类簇78细菌家族。
在一些实施方案中,Cas9蛋白包含与Chylinski等人,RNA Biology 2013 10:5,727-737;Hou等人,PNAS早期版本2013,1-6)中描述的Cas9氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施方案中,Cas多肽包含以下活性中的一种或多种:
a)切口酶活性,即切割核酸分子的单链(如,非互补链或互补链)的能力;
b)双链核酸酶活性,即切割双链核酸的两条链并产生双链断裂的能力,其在一个实施方案中是存在两种切口酶活性;
c)内切核酸酶活性;
d)外切核酸酶活性;和/或
e)解旋酶活性,即解开双链核酸的螺旋结构的能力。
在一些实施方案中,Cas9是野生型(WT)Cas9蛋白或直向同源物。WT Cas9包含两个催化活性的结构域(HNH和RuvC)。基于gRNA特异性的WT Cas9与DNA的结合导致可由非同源性末端结合(NHEJ)修复或同源介导的修复(HDR)的双链DNA断裂。在一些实施方案中,Cas9融合至异源蛋白,其募集DNA-损害信号传导蛋白、外切核酸酶或磷酸酶以进一步提高通过一种修复机制或另一种来修复靶序列的可能性或速率。在一些实施方案中,WT Cas9与核酸修复模板共表达以促进通过同源介导的修复掺入外源核酸序列。
在一些实施方案中,不同Cas9蛋白(即来自不同物种的Cas9蛋白)可有利于用于各种提供的方法中,以便利用不同Cas9蛋白的各种酶促性质(如,用于不同的PAM序列偏好;用于升高或降低的酶促活性;用于升高或降低的细胞毒性水平;以改变NHEJ、同源介导的修复、单链断裂、双链断裂之间的平衡等)。
在一些实施方案中,Cas蛋白是来源于化脓性链球菌的Cas9蛋白,并识别PAM序列基序NGG、NAG、NGA(Mali等人,Science 2013;339(6121):823-826)。在一些实施方案中,Cas蛋白是来源于嗜热链球菌的Cas9蛋白并识别PAM序列基序NGGNG和/或NNAGAAW(W=A或T)(参见,如Horvath等人,Science,2010;327(5962):167-170,和Deveau等人,J BACTERIOL2008;190(4):1390-1400)。在一些实施方案中,Cas蛋白是来源于变异链球菌(S.mutans)的Cas9蛋白并识别PAM序列基序NGG和/或NAAR(R=A或G)(参见,如Deveau等人,J BACTERIOL2008;190(4):1390-1400)。在一些实施方案中,Cas蛋白是来源于金黄色葡萄球菌的Cas9蛋白并识别PAM序列基序NNGRR(R=A或G)。在一些实施方案中,Cas蛋白是来源于金黄色葡萄球菌的Cas9蛋白并识别PAM序列基序N GRRT(R=A或G)。在一些实施方案中,Cas蛋白是来源于金黄色葡萄球菌的Cas9蛋白并识别PAM序列基序N GRRV(R=A或G)。在一些实施方案中,Cas蛋白是来源于脑膜炎奈瑟氏球菌的Cas9蛋白并识别PAM序列基序N GATT或N GCTT(R=A或G,V=A、G或C)(参见,如Hou等人,PNAS 2013,1-6)。在前述实施方案中,N可以是任何核苷酸残基,如A、G、C或T中任一种。
在一些实施方案中,提供了编码Cas蛋白的多核苷酸。在一些实施方案中,多核苷酸编码与国际PCT公开No.WO 2015/071474或Chylinski等人,RNA Biology 2013 10:5,727-737中所述的Cas蛋白至少90%同一的Cas蛋白。在一些实施方案中,多核苷酸编码与国际PCT公开No.WO 2015/071474或Chylinski等人,RNA Biology 201310:5,727-737中所述的Cas蛋白至少95%、96%、97%、98%或99%同一的Cas蛋白。在一些实施方案中,多核苷酸编码与国际PCT公开No.WO 2015/071474或Chylinski等人,RNA Biology 2013 10:5,727-737中所述的Cas蛋白100%同一的Cas蛋白。
Cas突变体
在一些实施方案中,Cas多肽经工程化以改变Cas多肽的一种或多种性质。例如,在一些实施方案中,Cas多肽包含改变的酶促性质,如改变的核酸酶活性(与天然存在的或其他参考Cas分子相比)或改变的解旋酶活性。在一些实施方案中,经工程化的Cas多肽可具有改变其尺寸的改变,如减小其尺寸但对Cas多肽的另一种性质没有显著影响的氨基酸序列缺失。在一些实施方案中,经工程化的Cas多肽包含改变包含影响PAM识别的改变。例如,可以改变经工程化的Cas多肽以识别除了由相应野生型Cas蛋白识别的PAM序列之外的PAM序列。
可以多种方式制备具有所需性质的Cas多肽,包括对天然存在的Cas多肽或亲本Cas多肽的改变,以提供具有所需性质的突变体或改变的Cas多肽。例如,可以将一种或多种突变引入亲本Cas多肽(如,天然存在的或经工程化的Cas多肽)的序列中。此类突变和差异可包含取代(如,保守取代或非必需氨基酸的取代);插入;或缺失。在一些实施方案中,突变体Cas多肽包含相对于亲本Cas多肽的一种或多种突变(如,至少1、2、3、4、5、10、15、20、30、40或50个突变)。
在一个实施方案中,突变体Cas多肽包含与天然存在的Cas多肽不同的切割性质。在一些实施方案中,Cas是Cas切口酶突变体。Cas切口酶突变体包含仅一个酶促活性结构域(HNH结构域或RuvC结构域)。Cas切口酶突变体保留基于gRNA特异性的DNA结合,但能够切割仅一条DNA链,导致单链断裂(如“切口”)。在一些实施方案中,两种互补Cas切口酶突变体(如,一种Cas切口酶突变体具有失活的RuvC结构域,和一种Cas切口酶突变体具有失活的HNH结构域)在含对应于两条分开靶序列的两种gRNA的相同的细胞中表达;一条靶序列在正义DNA链上,并且一条在反义DNA链上。这种双重-切口酶系统导致交错的双链断裂并可增加靶特异性,并可增加靶特异性,因为产生的两个脱靶缺口不太可能足够靠近以生成双链断裂。在一些实施方案中,Cas切口酶突变体与核酸修复模板一起共表达以促进通过同源介导的修复来掺入外源核酸序列。
在一些实施方案中,Cas是经失活的Cas(dCas)突变体。在此类实施方案中,Cas多肽不包含任何固有的酶促活性并且不能介导DNA切割。在此类实施方案中,dCas可与能够以非切割基方式修饰DNA的异源蛋白融合。例如,在一些实施方案中,dCas蛋白融合至转录激活子或转录阻遏子结构域(如,Kruppel相关盒(KRAB或SKD);Mad mSIN3相互作用结构域(SID或SID4X);ERF阻遏子结构域(ERD);MAX-相互作用蛋白1(MXI1);等)。在一些此类情况下,dCas融合蛋白由引导RNA靶向至靶DNA中的特定位置(即,序列),并发挥基因座-特异性调控,诸如阻断RNA聚合酶结合至启动子(其选择性抑制转录激活子功能),和/或修饰局部染色质状态(如,当使用修饰靶DNA或修饰与靶DNA相关的多肽的融合序列时)。在一些情况下,变化是瞬时的(如,转录阻遏或活化)。在一些情况下,变化是可遗传的(如,当表观遗传修饰是针对靶DNA或与靶DNA相关的蛋白质(如核小体组蛋白)进行的)。
在一些实施方案中,本文所述的Cas多肽可经工程化以改变Cas多肽的PAM特异性。在一些实施方案中,突变体Cas多肽具有PAM特异性,其与亲本Cas多肽的PAM特异性不同。例如,天然存在的Cas蛋白可经修饰以改变突变体Cas多肽识别的PAM序列以减少脱靶位点、改善特异性或消除PAM识别需求。在一些实施方案中,Cas蛋白可经修饰以增加PAM识别序列的长度。在一些实施方案中,PAM识别序列的长度是至少4、5、6、7、8、9、10或15个氨基酸长。识别不同PAM序列和/或具有降低的脱靶活性的Cas多肽可使用定向进化生成。可用于Cas多肽的定向进化的示例性方法和系统描述于如Esvelt等人Nature 2011,472(7344):499-503中。
示例性Cas突变体描述于国际PCT公开No.WO 2015/161276中,其通过引用整体并入本文。
gRNA
本公开提供了指导定点修饰多肽至特定靶DNA序列的引导RNA(gRNA)。gRNA包含DNA-靶向区段和蛋白-结合区段。gRNA的DNA-靶向区段包含与靶DNA序列中的序列互补的核苷酸序列。因此,gRNA的DNA-靶向区段与靶DNA以序列特异性方式经由杂交(即,碱基配对)相互作用,并且DNA-靶向区段的核苷酸序列确定了gRNA将结合的靶DNA内的位置。gRNA的DNA-靶向区段可被修饰(如,通过遗传工程化)以杂交至靶DNA序列内的任何所需的序列。
引导RNA的蛋白-结合区段与定点修饰的多肽(如Cas9蛋白)相互作用以形成复合物。引导RNA经由上述DNA-靶向区段将结合的多肽引导至靶DNA内的特定核苷酸序列。引导RNA的蛋白质-结合区段包含两个核苷酸链段,其彼此互补并形成双链RNA双链体。
在一些实施方案中,gRNA包含两个分开的RNA分子。在此类实施方案中,两个RNA分子中的每一个包含彼此互补的核苷酸链段,使得两个RNA分子的互补核苷酸杂交以形成蛋白-结合区段的双链RNA双链体。在一些实施方案中,gRNA包含单个RNA分子(sgRNA)。
gRNA对靶基因座的特异性由DNA-结合区段的序列介导,所述DNA-结合区段的序列包括与靶基因座内的靶DNA序列互补的约20个核苷酸。在一些实施方案中,相应的靶DNA序列是约20个核苷酸长。在一些实施方案中,本发明的gRNA序列的DNA-结合区段与靶基因座内的靶DNA序列至少90%互补。在一些实施方案中,本发明的gRNA序列的DNA-结合区段与靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%互补。在一些实施方案中,本发明的gRNA序列的DNA-结合区段与靶基因座内的靶DNA序列100%互补。
在一些实施方案中,gRNA序列的DNA-结合区段结合至与BTK基因的靶基因座内靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,gRNA序列的DNA-结合区段结合至与选自表1所列那些的靶基因的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,gRNA序列的DNA-结合区段结合至与选自表1所列那些的靶基因的靶基因座内的靶DNA序列100%同一的靶DNA序列。在一些实施方案中,gRNA序列的DNA-结合区段结合至与BTK基因外显子内或BTK基因内含子内的靶基因座内靶DNA序列至少90%同一的靶DNA序列,优选在BTK基因的第二或第三外显子内。在一些实施方案中,gRNA序列的DNA-结合区段结合至与BTK基因外显子内或BTK基因内含子内的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列,优选在BTK基因的第二或第三外显子内。在一些实施方案中,gRNA序列的DNA-结合区段结合至与BTK基因外显子内或BTK基因内含子内的靶基因座内的靶DNA序列100%同一的靶DNA序列,优选在BTK基因的第二或第三外显子内。
在一些实施方案中,gRNA序列的DNA-结合区段结合至与表3中序列之一至少90%同一的靶DNA序列。
表3:示例性引导序列
引导 序列
G1 AGCTATGGCCGCAGTGATTC(SEQ ID NO:9)
G2 AGGCGCTTCTTGAAGTTTAG(SEQ ID NO:10)
G3 ATGAGTATGACTTTGAACGT(SEQ ID NO:11)
G4 AGGGATGAGGATTAATGTCC(SEQ ID NO:12)
G5 ACACTGAATTGGGGGGGGAT(SEQ ID NO:13)
G6 AACTAGGTAGCTAGGCTGAG(SEQ ID NO:14)
G7 GCTTTAGCTAGTTATAGGCT(SEQ ID NO:15)
G8 AGAGGTAAATTTTCGTTGGT(SEQ ID NO:16)
G9 GATGCACACTGAATTGGGGG(SEQ ID NO:17)
在一些实施方案中,gRNA序列的DNA-结合区段结合至与表3中序列之一至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,gRNA序列的DNA-结合区段结合至与表3中序列之一100%同一的靶DNA序列。
在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与BTK基因的靶基因座内的靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与选自表1所列那些的靶基因的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与选自表1所列那些的靶基因的靶基因座内的靶DNA序列100%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列至少90%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与BTK基因外显子内或BTK基因内含子内(优选在BTK基因的第二或第三外显子内)的靶基因座内的靶DNA序列100%同一的靶DNA序列。
在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与SEQ ID NO:1-8中的一种至少90%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与SEQ ID NO:1-8中的一种至少95%、96%、97%、98%或99%同一的靶DNA序列。在一些实施方案中,基因编辑组合物包含各自包含DNA-结合区段的两种或多种gRNA分子,其中DNA-结合区段中的至少一个结合至与SEQ ID NO:1-8中的一种100%同一的靶DNA序列。
在一些实施方案中,本文所述的gRNA序列的DNA-结合区段经设计使用本领域已知的算法(如,Cas-OFF探测器)最小化脱靶结合以鉴定特定靶基因座或靶基因所特有的靶序列。
在一些实施方案中,本文所述的gRNA可包含向核酸酶引入稳定性的一种或多种经修饰的核苷或核苷酸。在此类实施方案中,与非修饰的gRNA相比,这些经修饰的gRNA可引发减少的先天免疫。术语“先天免疫响应”包括对通常病毒或细菌来源的外源核酸(包括单链核酸)的细胞响应,其涉及诱导细胞因子表达和释放,特别是干扰素和细胞死亡。
在一些实施方案中,本文所述的gRNA在5’末端处或附近(如,在其5’末端的1-10、1-5或1-2个核苷酸内)修饰。在一些实施方案中,gRNA的5’末端通过掺入真核mRNA帽结构或帽类似物(如,G(5‘)ppp(5‘)G帽类似物、m7G(5‘)ppp(5‘)G帽类似物或3‘-0-Me-m7G(5‘)ppp(5‘)G抗逆帽类似物(ARCA))来修饰。在一些实施方案中,体外转录的gRNA通过用磷酸酶(如,小牛肠碱性磷酸酶)处理以去除5’三磷酸根基团来修饰。在一些实施方案中,gRNA包含在其3’末端(如,在其3’末端的1-10、1-5或1-2个核苷酸内)处或附近的修饰。例如,在一些实施方案中,gRNA的3’末端通过添加一个或多个(如,25-200个)腺嘌呤(A)残基来修饰。
在一些实施方案中,经修饰的核苷和经修饰的核苷酸可存在于gRNA中,但还可存在于其他基因-调控系统(如,基于mRNA、RNAi或siRNA的系统)中。在一些实施方案中,经修饰的核苷和核苷酸可包括以下中的一种或多种:
a)改变,如替换非连接磷酸根氧中的一个或两个和/或在磷酸二酯主链键联中的连接磷酸根氧中的一个或多个;
b)改变,如替换如核糖糖上的2’羟基的核糖糖的组分;
c)用“去磷酸”接头完全取代磷酸根部分;
d)天然存在的核碱基的修饰或替换;
e)核糖-磷酸根主链的替换或修饰;
f)寡核苷酸的3’末端或5’末端的修饰,如末端磷酸根基团的去除、修饰或替换或一部分的缀合;和
g)修饰糖。
在一些实施方案中,可以将以上列出的修饰组合,以提供可以具有两种、三种、四种或多种修饰的修饰的核苷和核苷酸。例如,在一些实施方案中,经修饰的核苷或核苷酸可具有经修饰的糖和经修饰的核碱基。在一些实施方案中,修饰gRNA的每个碱基。在一些实施方案中,gRNA分子的每个磷酸根基团都被硫代磷酸根基团替代。
在一些实施方案中,软件工具可用于优化用户靶序列内gRNA的选择,如以最小化整个基因组的总脱靶活性。脱靶活性可能不是切割。例如,对于使用化脓性链球菌Cas9的每种可能的gRNA选择,软件工具可鉴定基因组内的含有多达一定数目(如1、2、3、4、5、6、7、8、9或10)的错配碱基对的所有潜在的脱靶序列(在NAG或NGG PAM之前)。例如,可以使用实验得出的加权方案来预测每条脱靶序列的切割效率。然后可以根据其总预测的脱靶切割对每种可能的gRNA进行排名;排名最高的gRNA表示那些可能具有最大的中靶和最小的脱靶切割的gRNA。其他功能,如用于gRNA载体构建的自动试剂设计、用于中靶Surveyor测定的引物设计以及用于高通量检测的引物设计,以及经由下一代测序对脱靶切割进行高通量检测和定量的引物设计,也可包括在工具中。
末端加工酶
具体的实施方案中考虑的基因组编辑组合物和方法包括使用TALEN变体或Cas蛋白和末端加工酶编辑细胞基因组。在具体的实施方案中,单个多核苷酸编码由接头(自切割肽序列,如2A序列)或由IRES序列分隔的TALEN或Cas蛋白和末端加工酶。在具体的实施方案中,基因组编辑组合物包含编码TALEN变体或Cas蛋白的多核苷酸和编码末端加工酶的分开的多核苷酸。
术语“末端加工酶”是指修饰多核苷酸链的经暴露的末端的酶。多核苷酸可以是双链DNA(dsDNA)、单链DNA(ssDNA)、RNA、DNA和RNA的双链杂合体,及合成DNA(例如,含有除了A、C、G和T之外的碱基)。末端加工酶可通过添加一种或多种核苷酸、去除一种或多种核苷酸、去除或修饰磷酸根基团和/或去除或修饰羟基基团来修饰经暴露的多核苷酸链末端。末端加工酶可通过其他化学或机械方式(诸如剪切(例如经由通过细隔距针、加热、超声处理、微珠滚动和雾化)、电离辐射、紫外线辐射、氧自由基、化学水解和化疗剂),在内切核酸酶切割位点处或在由其他化学或机械方式生成的末端处修饰末端。
在具体的实施方案中,具体的实施方案中考虑的基因组编辑组合物和方法包括使用TALEN或CRISPR/Cas系统和DNA末端加工酶编辑细胞基因组。
术语“DNA末端加工酶”是指修饰DNA的裸露端的酶。DNA末端加工酶可以修饰平末端或交错末端(带有5′或3′突出端的末端)。DNA末端加工酶可修饰单链或双链DNA。DNA末端加工酶可以在内切核酸酶切割位点处的末端处或者在由其他化学或机械方式(诸如剪接(例如经由通过细隔距针、加热、超声处理、微珠滚动和雾化)、电离辐射、紫外线辐射、氧自由基、化学水解和化疗剂)生成的末端处修饰末端。DNA末端加工酶可以通过添加一个或多个核苷酸、去除一个或多个核苷酸、去除或修饰磷酸根基团和/或去除或修饰羟基基团来修饰经暴露的DNA末端。
适用于本文所述的具体的实施方案中的DNA末端加工酶的说明性实例包括但不限于:5′-3′外切核酸酶、5′-3′碱性外切核酸酶、3′-5′外切核酸酶、5′flap内切核酸酶、解旋酶、磷酸酶、水解酶和非模板-依赖性DNA聚合酶。
适用于本文所述的具体的实施方案中的DNA末端加工酶的另外说明性实例包括但不限于Trex2、Trex1、无跨膜结构域的Trex1、Apollo、Artemis、DNA2、Exo1、ExoT、ExoIII、Fen1、Fan1、MreII、Rad2、Rad9、TdT(末端脱氧核苷酰转移酶)、PNKP、RecE、RecJ、RecQ、λ外切核酸酶、Sox、牛痘DNA聚合酶、外切核酸酶I、外切核酸酶III、外切核酸酶VII、NDK1、NDK5、NDK7、NDK8、WRN、T7-外切核酸酶基因6、鸟类成髓细胞病病毒整合蛋白(IN)、Bloom、Antartic Phophatase、碱性磷酸酶、多核苷酸激酶(PNK)、ApeI、绿豆核酸酶、Hex1、TTRAP(TDP2)、Sgs1、Sae2、CUP、Polμ、Polλ、MUS81、EME1、EME2、SLX1、SLX4和UL-12。
在具体的实施方案中,用于编辑本文所述的细胞基因组的基因组编辑组合物和方法包括多肽,其包括TALEN或Cas蛋白和外切核酸酶。术语“外切核酸酶”是指经由断裂3′或5′末端处的磷酸二酯键的水解反应的在多核苷酸链的末端处切割磷酸二酯键的酶。
适用于本文所述的具体的实施方案中的外切核酸酶的说明性实例包括但不限于:hExoI、酵母ExoI、大肠埃希氏菌ExoI、hTREX2、小鼠TREX2、大鼠TREX2、hTREX1、小鼠TREX1、大鼠TREX1和大鼠TREX1。
在具体的实施方案中,DNA末端加工酶是3′或5′外切核酸酶,优选Trex 1或Trex2,更优选Trex2,和甚至更优选人或小鼠Trex2。
E.靶位点
具体的实施方案中考虑的核酸酶变体可经设计以结合至BTK基因中的任何适合的靶序列并且与天然存在的效应子结构域相比,可具有新型结合特异性。在具体的实施方案中,靶位点是基因调控区域,其包括但不限于启动子、增强子、阻遏子元件等。在具体的实施方案中,靶位点是基因或剪接位点的编码区域。在具体的实施方案中,TALEN变体或CRISPR/Cas系统和供体修复模板可经设计以插入治疗性多核苷酸。在具体的实施方案中,TALEN变体或CRISPR/Cas系统和供体修复模板可经设计以插入在内源性BTK基因调控元件或表达控制序列的控制下的治疗性多核苷酸。
在各个实施方案中,TALEN变体或CRISPR/Cas系统结合至并切割位于X染色体上的布鲁顿氏酪氨酸激酶(BTK)基因中的靶序列。BTK基因编码对于B细胞发育和成熟是必需的酪氨酸激酶。BTK尤其还被称为布鲁顿无丙种球蛋白血症酪氨酸激酶、B-细胞祖细胞激酶(BPK)、酪氨酸-蛋白激酶BTK同种型(缺乏外显子13至17)、显性-阴性激酶-缺陷型布鲁顿酪氨酸激酶、酪氨酸-蛋白激酶BTK同种型(缺乏外显子14)、经截短的布鲁顿无丙种球蛋白血症酪氨酸激酶、PSCTK1、AGMX1、无丙种球蛋白血症酪氨酸激酶(ATK)、无丙种球蛋白血症酪氨酸激酶、酪氨酸-蛋白激酶BTK和IMD1。在具体的实施方案中使用的示例性BTK参考序列号包括但不限于NM_000061.2、NP_000052.1、AK057105、BC109079、DA619542、DB636737、CCDS14482.1、Q06187、Q5JY90、ENSP00000308176.7、OTTHUMP00000023676、ENST00000308731.7、OTTHUMT00000057532、NM_001287344.1、NP_001274273.1、NM_001287345.1和NP_001274274.1。
在具体的实施方案中,TALEN变体或CRISPR/Cas系统引入双链断裂(DSB)于BTK基因中,优选人BTK基因的第一内含子或第二内含子中的靶序列,并且更优选如SEQ ID NO:1-8所示的人BTK基因的第一内含子或第二内含子中的靶序列。在具体的实施方案中,TALEN或CRISPR/Cas系统包含通过切割序列“ACTT”来引入双链断裂于如SEQ ID NO:1-8中所示的BTK基因的第一内含子或第二内含子中的靶位点处的核酸酶。
在一个优选的实施方案中,TALEN或CRISPR/Cas系统切割双链DNA并引入DSB至SEQID NO:1-8所示的多核苷酸序列中。
在一个优选的实施方案中,BTK基因是人类BTK基因。
F.供体修复模板
核酸酶变体可用于引入DSB于靶序列中;DSB可在一个或多个供体修复模板的存在下通过同源介导的修复(HDR)机制修复。在具体的实施方案中,供体修复模板用于插入序列至基因组中。在特别优选的实施方案中,供体修复模板用于插入编码治疗性BTK多肽的多核苷酸序列,如SEQ ID NO:18。
MAAVILESIFLKRSQQKKKTSPLNFKKRLFLLTVHKLSYYEYDFERGRRGSKKGSIDVEKITCVETVVPEKNPPPERQIPRRGEESSEMEQISIIERFPYPFQVVYDEGPLYVFSPTEELRKRWIHQLKNVIRYNSDLVQKYHPCFWIDGQYLCCSQTAKNAMGCQILENRNGSLKPGSSHRKTKKPLPPTPEEDQILKKPLPPEPAAAPVSTSELKKVVALYDYMPMNANDLQLRKGDEYFILEESNLPWWRARDKNGQEGYIPSNYVTEAEDSIEMYEWYSKHMTRSQAEQLLKQEGKEGGFIVRDSSKAGKYTVSVFAKSTGDPQGVIRHYVVCSTPQSQYYLAEKHLFSTIPELINYHQHNSAGLISRLKYPVSQQNKNAPSTAGLGYGSWEIDPKDLTFLKELGTGQFGVVKYGKWRGQYDVAIKMIKEGSMSEDEFIEEAKVMMNLSHEKLVQLYGVCTKQRPIFIITEYMANGCLLNYLREMRHRFQTQQLLEMCKDVCEAMEYLESKQFLHRDLAARNCLVNDQGVVKVSDFGLSRYVLDDEYTSSVGSKFPVRWSPPEVLMYSKFSSKSDIWAFGVLMWEIYSLGKMPYERFTNSETAEHIAQGLRLYRPHLASEKVYTIMYSCWHEKADERPTFKILLSNILDVMDEES
(SEQ ID NO:18)
在特别优选的实施方案中,供体修复模板用于插入编码治疗性BTK多肽的多核苷酸序列,使得BTK多肽的表达在内源性BTK启动子和/或增强子的控制下。
在各个实施方案中,将供体修复模板通过用包含供体修复模板的腺相关病毒(AAV)、逆转录病毒(如慢病毒、IDLV等)、单纯性疱疹病毒、腺病毒或牛痘病毒载体转导细胞来引入造血细胞(如造血干细胞或祖细胞或CD34+细胞)中。
在具体的实施方案中,供体修复模板包含侧接DSB位点的一个或多个同源臂。
如本文所用,术语“同源臂”是指供体修复模板中与侧接由核酸酶引入靶位点处的DNA断裂的DNA序列同一或几乎同一的核酸序列。在一个实施方案中,供体修复模板包含含与DNA断裂位点的5′的DNA序列同一或几乎同一的核酸序列的5′同源臂。在一个实施方案中,供体修复模板包含含与DNA断裂位点的3′的DNA序列同一或几乎同一的核酸序列的3′同源臂。在一个优选的实施方案中,供体修复模板包含5′同源臂和3′同源臂。供体修复模板可包含与同DSB位点紧密相邻的基因组序列的同源性,或与从DSB位点起任何数目的碱基对内的基因组序列的同源性。在一个实施方案中,供体修复模板包含与基因组序列同源的核酸序列,约5bp、约10bp、约25bp、约50bp、约100bp、约250bp、约500bp、约1000bp、约2500bp、约5000bp、约10000bp或更多个,包括任何居间长度的同源序列。
在具体的实施方案中考虑的同源臂的适合长度的说明性实例可独立选自并包括但限于:约100bp、约200bp、约300bp、约400bp、约500bp、约600bp、约700bp、约800bp、约900bp、约1000bp、约1100bp、约1200bp、约1300bp、约1400bp、约1500bp、约1600bp、约1700bp、约1800bp、约1900bp、约2000bp、约2100bp、约2200bp、约2300bp、约2400bp、约2500bp、约2600bp、约2700bp、约2800bp、约2900bp或约3000bp,或更长的同源臂,包括所有居间长度的同源臂。
适合的同源臂长度的另外说明性实例包括但限于:约100bp至约3000bp、约200bp至约3000bp、约300bp至约3000bp、约400bp至约3000bp、约500bp至约3000bp、约500bp至约2500bp、约500bp至约2000bp、约750bp至约2000bp、约750bp至约1500bp,或约1000bp至约1500bp,包括所有居间长度的同源臂。
在一个具体的实施方案中,5′同源臂和3′同源臂的长度独立选自约500bp至约1500bp。在一个实施方案中,5′同源臂是约1500bp并且3′同源臂是约1000bp。在一个实施方案中,5′同源臂是约200bp至约600bp并且3′同源臂是约200bp至约600bp。在一个实施方案中,5′同源臂是约200bp并且3′同源臂是约200bp。在一个实施方案中,5′同源臂是约300bp并且3′同源臂是约300bp。在一个实施方案中,5′同源臂是约400bp并且3′同源臂是约400bp。在一个实施方案中,5′同源臂是约500bp并且3′同源臂是约500bp。在一个实施方案中,5′同源臂是约600bp并且3′同源臂是约600bp。
G.多肽
本文所述了各种多肽,包括但不限于TALEN和Cas蛋白。在优选的实施方案中,多肽包含编码表2所示的一种或多种RVD的氨基酸序列。“多肽”、“多肽片段”、“肽”和“蛋白”可互换使用,除非有相反说明,并根据常规含义,即作为氨基酸序列。在一个实施方案中,“多肽”包括融合多肽和其他变体。多肽可使用多种公知的重组和/或合成技术中的任一种进行制备。多肽不限于特定长度,如它们可包含全长蛋白序列、全长蛋白片段或融合蛋白,并且可包括多肽的翻译后修饰,例如糖基化、乙酰化、磷酸化等,以及本领域已知的其他修饰,即天然存在的和非天然存在的两者。
如本文所用的“经分离的蛋白质”、“经分离的肽”或“经分离的多肽”等是指从细胞环境以及与其他细胞组分的缔合中,体外合成、分离和/或纯化肽或多肽分子,即其与体内物质没有显著缔合。
在具体的实施方案中考虑的多肽的说明性实例包括但不限于TALEN、Cas蛋白、末端加工核酸酶、融合多肽及其变体。
多肽包括“多肽变体”。多肽变体可在一种或多种氨基酸取代、缺失、添加和/或插入方面不同于天然存在的多肽。此类变体可以是天然存在的或可以例如通过修饰以上多肽序列的一种或多种氨基酸来合成性生成。例如,在具体的实施方案中,可能需要通过引入一种或多种取代、缺失、添加和/或插入至多肽中来改善结合并切割人BTK基因中的靶位点的TALEN、CRISPR/Cas等的生物性质。在具体的实施方案中,多肽包括与本文所述的参考序列中的任一种具有至少约65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%氨基酸同一性的多肽,通常其中变体维持参考序列的至少一种生物活性。
多肽变体包括生物活性“多肽片段”。生物活性多肽片段的说明性实例包括DNA结合结构域、核酸酶结构域等。如本文所用,术语“生物活性片段”或“最小生物活性片段”是指保留至少100%、至少90%、至少80%、至少70%、至少60%、至少50%、至少40%、至少30%、至少20%、至少10%或至少5%天然存在的多肽活性的多肽片段。在优选的实施方案中,生物活性是对靶序列的结合亲和力和/或切割活性。在某些实施方案中,多肽片段可包含至少5至约1700个氨基酸长的氨基酸链。将理解,在某些实施方案中,片段是至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、100、110、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700或更多个氨基酸长。在具体的实施方案中,多肽包含TALEN变体的生物活性片段。在具体的实施方案中,本文所示的多肽可包含一种或多种表示为“X”的氨基酸。“X”如果在氨基酸SEQ ID NO中存在,则是指任何氨基酸。一种或多种“X”残基可存在于特别是本文所述的SEQ ID NO中所示的氨基酸序列的N-和C-末端处。如果“X”氨基酸不存在,SEQ ID NO中所示的剩余氨基酸序列可被认为是生物活性片段。
生物活性片段可包含N-末端截短和/或C-末端截短。在一个具体的实施方案中,生物活性片段缺乏以下或包含与相应的野生型TALEN或TAL效应子结构域序列相比以下的缺失:TALEN或TAL效应子结构域的1、2、3、4、5、6、7或8个N-末端氨基酸,更优选与相应的野生型TALEN或TAL效应子结构域序列相比TALEN或TAL效应子结构域的4个N-末端氨基酸的缺失。在一个具体的实施方案中,生物活性片段缺乏以下或包含与相应的野生型TALEN或TAL效应子结构域序列相比以下的缺失:TALEN或TAL效应子结构域的1、2、3、4或5个C-末端氨基酸,更优选与相应的野生型TALEN或TAL效应子结构域序列相比TALEN或TAL效应子结构域的2个C-末端氨基酸的缺失。在一个特别优选的实施方案中,生物活性片段缺乏或包含与相应的野生型TALEN或TAL效应子结构域相比,TALEN或TAL效应子结构域的4个N-末端氨基酸和2个C-末端氨基酸的缺失。
如上所述,可以以多种方式改变多肽,包括氨基酸取代、缺失、截短和插入。用于此类操纵的方法是本领域通常已知的。例如,可以通过DNA中的突变来制备参考多肽的氨基酸序列变体。用于诱变和核苷酸序列改变的方法是本领域众所周知的。参见,例如Kunkel(1985,Proc.Natl.Acad.Sci.USA.82:488-492),Kunkel等人,(1987,Methods in Enzymol,154:367-382),美国专利No.4,873,192,Watson,J.D.等人,(Molecular Biology of theGene,第四版,Benjamin/Cummings,Menlo Park,Calif.,1987)及其中引用的参考文献。对不影响目标蛋白的生物活性的适当氨基酸取代的指导可见于以下的模型中:Dayhoff等人,(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.)。
在某些实施方案中,变体将含有一种或多种保守取代。“保守取代”是其中一个氨基酸取代具有相似性质的另一个氨基酸的保守取代,使得肽化学领域的技术人员会期望多肽的二级结构和亲水性质基本不变。可以在具体的实施方案中考虑的多核苷酸和多肽的结构中进行修饰。多肽包括具有至少约数的多肽并仍然获得编码具有所需性质的变体或衍生物多肽的功能性分子。当需要改变多肽的氨基酸序列以产生等效的或甚至改进的变体多肽时,本领域技术人员例如可以改变编码DNA序列的一个或多个密码子,如根据表1。
表1-氨基酸密码子
Figure BDA0002827312770000451
使用本领域熟知的计算机程序(诸如DNASTAR、DNA Strider、Geneious、MacVector或Vector NTI软件),可以找到确定哪些氨基酸残基可以被取代、插入或缺失而不消除生物活性的指南。优选地,本文公开的蛋白质变体中的氨基酸变化是保守的氨基酸变化,即类似带电或不带电的氨基酸的取代。保守的氨基酸变化涉及与其侧链相关的一个氨基酸家族的取代。将天然存在的氨基酸通常分为四个家族:酸性(天冬氨酸、谷氨酸)、碱性(赖氨酸、精氨酸、组氨酸)、非极性(丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)和不带电荷的极性(甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸)氨基酸。苯丙氨酸、色氨酸和酪氨酸有时被联合分类为芳香族氨基酸。在肽或蛋白质中,适合的保守氨基酸取代是本领域技术人员已知的,并且通常可以在不改变所得分子的生物活性的情况下进行制备。本领域技术人员认识到,通常在多肽的非必需区中的单个氨基酸取代不显著改变生物活性(参见,如Watson等人Molecular Biology of the Gene,第4版,1987,The Benjamin/Cummings Pub.Co.,第224页)。
在其中需要表达两种或多种多肽的一个实施方案中,编码其的多核苷酸序列可通过如本文其他地方所公开的IRES序列分开。
具体的实施方案中考虑的多肽包括融合多肽。在具体的实施方案中,提供了融合多肽和编码融合多肽的多核苷酸。融合多肽和融合蛋白是指具有至少两个、三个、四个、五个、六个、七个、八个、九个或十个多肽区段的多肽。
在另一个实施方案中,两种或多种多肽可表达为包含如本文其他地方所公开的一条或多条自切割多肽序列的融合蛋白。
在一个实施方案中,本文所述的融合蛋白包含一个或多个TAL效应子结构域和一种或多种核酸酶,和一种或多种接头和/或自切割多肽。
在一个实施方案中,本文所述的融合蛋白包含TALEN变体;接头或自切割肽;和末端加工酶,其包括但不限于5′-3′外切核酸酶、5′-3′碱性外切核酸酶和3′-5′外切核酸酶(如Trex2)。
融合多肽可包含一个或多个多肽结构域或区段,包括但不限于信号肽、细胞渗透肽结构域(CPP)、DNA结合结构域、核酸酶结构域等,表位标签(如,麦芽糖结合蛋白(“MBP”)、谷胱甘肽S转移酶(GST)、HIS6、MYC、FLAG、V5、VSV-G和HA)、多肽接头和多肽切割信号。融合多肽通常是连接的C-末端至N-末端,尽管它们还可以是连接的C-末端至C-末端、N-末端至N-末端或N-末端至C-末端。在具体的实施方案中,融合蛋白的多肽可以呈任何顺序。融合多肽或融合蛋白还可以包括保守修饰的变体、多态变体、等位基因、突变体、亚序列和种间同系物,只要保留了融合多肽的所需活性即可。融合多肽可以通过化学合成方法或通过两个部分之间的化学键联产生,或者通常可以使用其他标准技术制备。包含融合多肽的连接的DNA序列可操作地连接至如本文其他地方所公开的适合的转录或翻译控制元件。
融合多肽可以任选地包含可用于连接多肽内的一个或多个多肽或结构域的接头。肽接头序列可用于通过足以确保每条多肽折叠为其适当的二级和三级结构的距离分开任两种或多种多肽组分以便使多肽结构域发挥其所需功能。将此类肽接头序列使用本领域的标准技术掺入融合多肽。可基于以下因素选择适合的肽接头序列:(1)其采用柔性延伸构象的能力;(2)它们无法采用能够与第一和第二多肽上的功能性表位相互作用的二级结构;和(3)缺乏可能与多肽功能性表位反应的疏水或带电残基。优选的肽接头序列含有Gly、Asn和Ser残基。其他接近中性的氨基酸,诸如Thr和Ala也可用于接头序列中。可以有用地用作接头的氨基酸序列包括Maratea等人,Gene 40:39-46,1985;Murphy等人,Proc.Natl.Acad.Sci.USA 83:8258-8262,1986;美国专利No.4,935,233和美国专利No.4,751,180中公开的那些。当特定融合多肽区段含有可用于分开功能性结构域并防止立体干扰的非必需N-末端氨基酸区时,不需要接头序列。优选的接头通常是作为重组融合蛋白的一部分合成的柔性氨基酸子序列。接头多肽的长度可以是1至200个氨基酸长,1至100个氨基酸长,或者1至50个氨基酸长,包括其间的所有整数值。
示例性接头包括但不限于以下氨基酸序列:甘氨酸聚合物(G)n;甘氨酸-丝氨酸聚合物(G1-5S1-5)n,其中n是至少一、二、三、四或五的整数;甘氨酸-丙氨酸聚合物;丙氨酸-丝氨酸聚合物;GGG;DGGGS(SEQ ID NO:36);TGEKP(SEQ ID NO:37)(参见如Liu等人,PNAS5525-5530(1997));GGRR(SEQ ID NO:38)(Pomerantz等人1995,同上);(GGGGS)n其中n=1、2、3、4或5(SEQ ID NO:39)(Kim等人,PNAS 93,1156-1160(1996.);EGKSSGSGSESKVD(SEQ ID NO:40)(Chaudhary等人,1990,Proc.Natl.Acad.Sci.U.S.A.87:1066-1070);KESGSVSSEQLAQFRSLD(SEQ ID NO 41)(Bird等人,1988,Science 242:423-426),GGRRGGGS(SEQ ID NO:42);LRQRDGERP(SEQ ID NO:43);LRQKDGGGSERP(SEQ ID NO:44);LRQKD(GGGS)2ERP(SEQ ID NO:45)。可替代地,可以使用能够模拟DNA结合位点和肽本身的计算机程序(Desjarlais&Berg,PNAS 90:2256-2260(1993),PNAS 91:11099-11103(1994)或通过噬菌体展示方法合理设计柔性接头。
融合多肽还可以在本文所述的每个多肽结构域之间或在内源性开放阅读框与由供体修复模板编码的多肽之间包含多肽切割信号。此外,可以将多肽切割位点插入在任何接头肽序列中。示例性多肽切割信号包括多肽切割识别位点,诸如蛋白酶切割位点、核酸酶切割位点(如,罕见的限制酶识别位点、自切割核酶识别位点)和自切割病毒寡肽(参见deFelipe和Ryan,2004.Traffic,5(8);616-26)。
适合的蛋白酶切割位点和自切割肽是技术人员已知的(参见,如,于Ryan等人,1997.J.Gener.Virol.78,699-722;Scymczak等人(2004)Nature Biotech.5,589-594中)。示例性蛋白酶切割位点包括但不限于以下物质的切割位点:马铃薯Y病毒NIa蛋白酶(如烟草蚀纹病毒蛋白酶)、马铃薯Y病毒HC蛋白酶、马铃薯Y病毒P1(P35)蛋白酶、大麦花叶病毒NIa蛋白酶、大麦花叶病毒RNA-2-编码的蛋白酶、口疮病毒L蛋白酶、肠病毒2A蛋白酶、鼻病毒2A蛋白酶、微小核糖核酸病毒3C蛋白酶、豇豆花叶病毒24K蛋白酶、线虫传多面体病毒24K蛋白酶、RTSV(水稻东格鲁球状病毒)3C-样蛋白酶、PYVF(欧防风黄点病毒)3C-样蛋白酶、肝素、凝血酶、因子Xa和肠激酶。由于其高切割严格性,TEV(烟草蚀纹病毒)蛋白酶切割位点在一个实施方案中是优选的,如EXXYXQ(G/S)(SEQ ID NO:46),例如ENLYFQG(SEQ ID NO:47)和ENLYFQS(SEQ ID NO:48),其中X表示任何氨基酸(由TEV进行切割发生于Q和G或Q和S之间)。
在某些实施方案中,自切割多肽位点包括2A或2A-样位点、序列或结构域(Donnelly等人,2001.J.Gen.Virol.82:1027-1041)。在一个具体的实施方案中,病毒2A肽是口疮病毒2A肽、马铃薯Y病毒2A肽或心病毒2A肽。
在一个实施方案中,病毒2A肽选自由以下组成的组:口蹄疫病毒(FMDV)2A肽、马鼻炎A病毒(ERAV)2A肽、明脉扁刺蛾病毒(TaV)2A肽、猪捷申病毒-1(PTV-1)2A肽、泰勒病毒2A肽和脑心肌炎病毒2A肽。
2A位点的说明性实例提供于表2中。
表2:示例性2A位点包括以下序列:
SEQ ID NO:49 GSGATNFSLLKQAGDVEENPGP
SEQ ID NO:50 ATNFSLLKQAGDVEENPGP
SEQ ID NO:51 LLKQAGDVEENPGP
SEQ ID NO:52 GSGEGRGSLLTCGDVEENPGP
SEQ ID NO:53 EGRGSLLTCGDVEENPGP
SEQ ID NO:54 LLTCGDVEENPGP
SEQ ID NO:55 GSGQCTNYALLKLAGDVESNPGP
SEQ ID NO:56 QCTNYALLKLAGDVESNPGP
SEQ ID NO:57 LLKLAGDVESNPGP
SEQ ID NO:58 GSGVKQTLNFDLLKLAGDVESNPGP
SEQ ID NO:59 VKQTLNFDLLKLAGDVESNPGP
SEQ ID NO:60 LLKLAGDVESNPGP
SEQ ID NO:61 LLNFDLLKLAGDVESNPGP
SEQ ID NO:62 TLNFDLLKLAGDVESNPGP
SEQ ID NO:63 LLKLAGDVESNPGP
SEQ ID NO:64 NFDLLKLAGDVESNPGP
SEQ ID NO:65 QLLNFDLLKLAGDVESNPGP
SEQ ID NO:66 APVKQTLNFDLLKLAGDVESNPGP
SEQ ID NO:67 VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQT
SEQ ID NO:68 LNFDLLKLAGDVESNPGP
SEQ ID NO:69 LLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP
SEQ ID NO:70 EARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP
H.多核苷酸
在具体的实施方案中,提供了编码本文所述的一种或多种TALEN、TAL效应子结构域、Cas蛋白、引导RNA(gRNA)、末端加工酶和融合多肽的多核苷酸。如本文所用,术语“多核苷酸”或“核酸”是指脱氧核糖核酸(DNA)、核糖核酸(RNA)和DNA/RNA杂合体。多核苷酸可以是单链或双链并且重组、合成或经分离的。多核苷酸包括但不限于:前-信使RNA(前-mRNA)、信使RNA(mRNA)、合成RNA、合成mRNA、基因组DNA(gDNA)、PCR扩增的DNA、互补DNA(cDNA)、合成DNA和重组DNA。多核苷酸是指至少5、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少100、至少200、至少300、至少400、至少500、至少1000、至少5000、至少10000或至少15000或更多个以及所有中等长度的核苷酸长的聚合物形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或者经修饰形式的任一类型的核苷酸。在该上下文中将容易理解“中等长度”意指在引用值之间的任何长度,诸如6、7、8、9等,101、102、103等;151、152、153等;201、202、203等。在具体的实施方案中,多核苷酸或变体与参考序列具有至少或约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
在具体的实施方案中,多核苷酸可以是密码子-优化的。如本文所用,术语“密码子-优化的”是指取代编码多肽的多核苷酸中的密码子以便提高多肽的表达、稳定性和/或活性。影响密码子优化的因子包括但不限于以下中的一种或多种:(i)两个或多个生物体或基因或合成构建的偏好表之间密码子偏好的变化,(ii)生物体、基因或基因组内的密码子偏好程度的变化,(iii)包括背景在内的密码子的系统变异,(iv)根据其解码tRNA的密码子的变异,(v)根据GC%的密码子的总的或在三重峰/三联体的一个位置中的变异,(vi)与参考序列例如天然存在的序列的类似度的程度变异,(vii)密码子频率截止值的变异,(viii)从DNA序列翻译的mRNA的结构性质,(ix)有关密码子取代集的设计待基于的DNA序列功能的先验知识,和/或(x)每种氨基酸的密码子集的总体变异,和/或(xi)分离去除假翻译起始位点。
如本文所用,术语“核苷酸”是指与磷酸化糖的N-配糖键联中的杂环含氮碱基。核苷酸应理解包括天然碱基,和各种各样的本领域识别的经修饰的碱基。此类碱基通常位于核苷酸糖部分的1′位置处。核苷酸通常包含碱基、糖和磷酸根基团。在核糖核酸(RNA)中,糖是核糖,并且在脱氧核糖核酸(DNA)中,糖是脱氧核糖,即缺乏存在于核糖中的羟基基团的糖。示例性天然含氮碱基包括嘌呤、腺苷(A)和胍(G),及嘧啶、胞苷(C)和胸苷(T)(或在RNA的情况下,尿嘧啶(U))。脱氧核糖的C-1原子键合至嘧啶的N-1或嘌呤的N-9。核苷酸通常是单磷酸根、二磷酸根或三磷酸根。核苷酸可以在糖、磷酸根和/或碱基部分处未修饰或被修饰(还可互换地被称为核苷酸类似物、核苷酸衍生物、经修饰的核苷酸、非天然核苷酸和非标准核苷酸;参见例如WO 92/07065和WO 93/15187)。经修饰的核酸碱基的实例由Limbach等人,(1994,Nucleic Acids Res.22,2183-2196)概述。
核苷酸也可被认为是核苷的磷酸酯,其酯化作用发生在附接至糖的C-5的羟基基团上。如本文所用,术语“核苷”是指含糖的N-配糖键联中的杂环含氮碱基。核苷在本领域中被认为包括天然碱,并且还包括公知的经修饰的碱。此类碱基通常位于核苷糖部分的1′位置处。核苷通常包含碱基和糖基团。核苷可以在糖和/或碱基部分未修饰或被修饰(还可互换地称为核苷类似物、核苷衍生物、经修饰的核苷、非天然核苷或非标准核苷)。还同样如上所述,Limbach等人,(1994,Nucleic Acids Res.22,2183-2196)总结了经修饰的核酸碱基的实例。
在各个示例性实施方案中,本文所述的多核苷酸包括但不限于编码TALEN、CRISPR/Cas系统、引导RNA、末端加工酶、融合多肽的多核苷酸,以及包含本文所述的多核苷酸的转移质粒。
如本文所用,术语“多核苷酸变体”和“变体”等是指在下文中定义严格的条件下展示出与参考多核苷酸序列或同参考序列杂交的多核苷酸的显著序列同一性的多核苷酸。这些术语还涵盖通过至少一种核苷的添加、缺失、取代或修饰而与参考多核苷酸不同的多核苷酸。因此,术语“多核苷酸变体”和“变体”包括其中将一种或多种核苷酸添加或缺失、修饰或者用不同的核苷酸替代的多核苷酸。在这一点上,本领域众所周知,可以对参考多核苷酸进行某些改变,包括突变、添加、缺失和取代,由此经改变的多核苷酸保留参考多核苷的生物功能或活性。
在一个实施方案中,多核苷酸包含在严格条件下与靶核酸序列杂交的核苷酸序列。在“严格条件”下杂交描述了其中彼此至少60%同一的核苷酸序列保持杂交的杂交方案。通常,选择严格条件为在限定的离子强度和pH下,比特定序列的热熔点(Tm)低约5℃。Tm是50%在平衡时与靶序列杂交的探针杂交至靶序列的温度(在限定的离子强度、pH和核酸浓度下)。由于靶序列通常过量存在,因此在Tm下,50%探针处于平衡状态。
如本文所用的引用“序列同一性”或例如包含“与…50%同一的序列”是指在比较窗口内的基于逐个核苷酸或逐个氨基酸的序列同一的程度。因此,“序列同一性的百分比”可通过在比较窗内比较两条任选对齐的序列、确定相同核酸碱基(如A、T、C、G、I)或相同氨基酸残基(如Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys和Met)在两条序列中出现以产生错配位置数的位置数、在比较窗(即,窗大小)内将匹配数除以总位置数并将结果乘以100以得到序列同一性百分比来计算。包括在内的是与本文所述的任何参考序列具有至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸和多肽,通常其中多肽变体维持参考多肽的至少一种生物活性。
用于描述两种或多种多核苷酸或多肽之间的序列关系的术语包括“参考序列”、“比较窗”、“序列同一性”、“序列同一性的百分比”和“显著同一性”。“参考序列”是至少12但通常是15至18并且通常至少25个单体单位(包括核苷酸和氨基酸残基)的长度。因为两种多核苷酸可各自包含(1)在两个多核苷酸之间类似的序列(即,仅完全多核苷酸序列的一部分),和(2)在两个多核苷酸之间发散的序列,两个(或多个)多核苷酸之间的序列比较通常通过在“比较窗”内比较两个多核苷酸的序列以鉴定和比较序列相似性的局部区来进行。“比较窗”是指至少6个连续位置的概念区段,通常约为50至约100,更通常约为100至约150,其中在将两条序列最佳对齐之后,将序列与相同数目的连续位置的参考序列进行比较。对于两条序列的最佳比对,与参考序列(不包含添加或缺失)相比,比较窗可包含约20%或更少的添加或缺失(即空位)。用于比对比较窗的最佳序列比对可以通过计算机化的算法实现方式(Wisconsin Genetics Software Package Release 7.0中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575 Science Drive Madison,WI,USA)或通过由所选各种方法中任一种生成的检查和最佳比对(即,导致比较窗内的最高百分比同源性)进行。还可以参考BLAST程序家族,例如由Altschul等人,1997,Nucl.Acids Res.25:3389公开。序列分析的详细讨论可见于Ausubel等人,Current Protocols in Molecular Biology,JohnWiley&Sons Inc.,1994-1998,第15章的Unit 19.3中。
如本文所用的“经分离的多核苷酸”是指已经从以天然存在的状态侧接其的序列中纯化的多核苷酸,如已经从与片段天然相邻的序列中去除的DNA片段。在具体的实施方案中,“经分离的多核苷酸”是指互补DNA(cDNA)、重组多核苷酸、合成多核苷酸或并非天然存在且人工制备的其他多核苷酸。
在一些实施方案中,本公开提供了编码gRNA的多核苷酸。在一些实施方案中,将gRNA-编码核酸包含于表达载体如重组表达载体中。在一些实施方案中,本公开提供了编码定点修饰多肽的多核苷酸。在一些实施方案中,将编码定点修饰多肽的多核苷酸包含于表达载体如重组表达载体中。
在各个实施方案中,多核苷酸包含编码本文所述的多肽的mRNA,其包括但不限于TALEN、TAL效应子结构域、Cas蛋白和末端加工酶。在某些实施方案中,mRNA包含帽、一种或多种核苷酸和/或经修饰的核苷酸和聚(A)尾。
在具体的实施方案中,本文所述的mRNA包含聚(A)尾以有助于保护mRNA免于外切核酸酶降解、稳定mRNA并促进翻译。在某些实施方案中,mRNA包含3′聚(A)尾结构。
在具体的实施方案中,聚(A)尾的长度是至少约10、25、50、75、100、150、200、250、300、350、400、450或至少约500或更多个腺嘌呤核苷酸或任何居间数目的腺嘌呤核苷酸。在具体的实施方案中,聚(A)尾的长度是至少约125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、202、203、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274或275或更多个腺嘌呤核苷酸。
在具体的实施方案中,聚(A)尾的长度是约10至约500个腺嘌呤核苷酸、约50至约500个腺嘌呤核苷酸、约100至约500个腺嘌呤核苷酸、约150至约500个腺嘌呤核苷酸、约200至约500个腺嘌呤核苷酸、约250至约500个腺嘌呤核苷酸、约300至约500个腺嘌呤核苷酸、约50至约450个腺嘌呤核苷酸、约50至约400个腺嘌呤核苷酸、约50至约350个腺嘌呤核苷酸、约100至约500个腺嘌呤核苷酸、约100至约450个腺嘌呤核苷酸、约100至约400个腺嘌呤核苷酸、约100至约350个腺嘌呤核苷酸、约100至约300个腺嘌呤核苷酸、约150至约500个腺嘌呤核苷酸、约150至约450个腺嘌呤核苷酸、约150至约400个腺嘌呤核苷酸、约150至约350个腺嘌呤核苷酸、约150至约300个腺嘌呤核苷酸、约150至约250个腺嘌呤核苷酸、约150至约200个腺嘌呤核苷酸、约200至约500个腺嘌呤核苷酸、约200至约450个腺嘌呤核苷酸、约200至约400个腺嘌呤核苷酸、约200至约350个腺嘌呤核苷酸、约200至约300个腺嘌呤核苷酸、约250至约500个腺嘌呤核苷酸、约250至约450个腺嘌呤核苷酸、约250至约400个腺嘌呤核苷酸、约250至约350个腺嘌呤核苷酸或约250至约300个腺嘌呤核苷酸或任何居间范围的腺嘌呤核苷酸。
描述多核苷酸方向的术语包括:5′(通常具有游离磷酸根基团的多核苷酸的末端)和3′(通常是具有游离羟基(OH)基团的多核苷酸的末端)。多核苷酸序列可以在5′至3′方向或3′至5′方向上进行注释。对于DNA和mRNA,5′至3′链被指定为“有义”、“正”或“编码”链,因为其序列与前-信使(前-mRNA)的序列同一[RNA中的尿嘧啶(U)除外,取而代之的是DNA中的胸腺嘧啶(T)]。对于DNA和mRNA,由RNA聚合酶转录的链,即互补3′至5′链被称为“模板”、“反义”、“负”或“非编码”链。如本文所用,术语“反向”是指以3′至5′方向书写的5′至3′序列或以5′至3′方向书写的3′至5′序列。
术语“互补的”和“互补性”是指与碱基配对规则相关的多核苷酸(即核苷酸序列)。例如,DNA序列5′A G T C A T G 3′的互补链是3′T C A G T A C 5′。后面的序列通常被书写为反向互补,其5′末端在左边并且3′末端在右边5′C A T G A C T 3′。等于其反向互补序列的序列被称为回文序列。互补性可以是“部分的”,其中只有一些核酸碱基根据碱基配对规则进行匹配。或者,核酸之间可以有“完全”或“全部”互补性。
如本文所用的术语“核酸盒”或“表达盒”是指可表达RNA和随后多肽的载体内的遗传序列。在一个实施方案中,核酸盒含有一种或多种目标基因,如一种或多种目标多核苷酸。在另一个实施方案中,核酸盒含有一种或多种表达控制序列,如启动子、增强子、聚(A)序列及一种或多种目标基因,如一种或多种目标多核苷酸。载体可包含1、2、3、4、5、6、7、8、9或10或多个核酸盒。核酸盒在载体内定位和依序定向,使得可将盒中的核酸转录成RNA,并且当有必要时,翻译为蛋白或多肽,经历经转化的细胞中的活性所需的适当的翻译后修饰,并且通过靶向至适当的细胞内区室或分泌至胞外区室中来易位至适当的生物活性区室。优选地,盒具有适合于易于插入载体的3′和5′末端,例如,其在每个末端具有限制性核酸内切酶位点。在一个优选的实施方案中,核酸盒包含用于治疗、预防或缓解遗传疾病的治疗基因的序列。盒可作为单个单元移除并插入质粒或病毒载体中。
多核苷酸包括一种或多种目标多核苷酸。如本文所用,术语“目标多核苷酸”是指编码多肽或融合多肽的多核苷酸,或者用作本文所述的抑制性多核苷酸的转录的模板的多核苷酸。
此外,本领域普通技术人员将理解,由于遗传密码的简并性,存在如本文所考虑的许多可以编码多肽或其变体片段的核苷酸序列。这些多核苷酸中的一些与任何天然基因的核苷酸序列具有最小的同源性。然而,在具体的实施方案中,尤其考虑了由密码子使用差异而变化的多核苷酸,例如,针对人类和/或灵长类密码子选择而优化的多核苷酸。在一个实施方案中,提供了包含特定等位基因序列的多核苷酸。等位基因是由于一种或多种突变,例如核苷酸的缺失、添加和/或取代而改变的内源性多核苷酸序列。
在某些实施方案中,目标多核苷酸包含供体修复模板。
具体的实施方案中考虑的多核苷酸,无论编码序列本身的长度如何,都可以与如本文其它处公开或本领域已知的其他DNA序列组合,诸如启动子和/或增强子、非翻译区(UTR)、Kozak序列、聚腺苷酸化信号、其他限制性酶切位点、多个克隆位点、内部核糖体进入位点(IRES)、重组酶识别位点(如,LoxP、FRT和Att位点)、终止密码子、转录终止信号、转录后响应元件和编码自切割多肽的多核苷酸、表位标签,使得它们的总长度可以有相当大的变化。因此,在具体的实施方案中考虑的是,可以采用几乎任何长度的多核苷酸片段,其总长度优选受到制备便利性和预期重组DNA方案中的用途的限制。
可以使用本领域已知和可用的多种成熟技术中的任一种来制备、操纵、表达和/或递送多核苷酸。为了表达所需的聚合物,可以将编码多肽的核苷酸序列插入适当的载体中。所需的多肽也可以通过将编码多肽的mRNA递送至细胞中来表达。
载体的说明性实例包括但不限于质粒、自主复制序列和可转座元件,如SleepingBeauty、PiggyBac。
载体的另外说明性实例包括但不限于质粒,噬菌粒,粘粒,人工染色体诸如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1-衍生的人工染色体(PAC),噬菌体诸如λ噬菌体或M13噬菌体,和动物病毒。
可用作载体的病毒的说明性实例包括但不限于逆转录病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如,单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒和乳多泡病毒(如,SV40)。
表达载体的说明性实例包括但不限于用于在哺乳动物细胞中表达的pClneo载体(Promega);用于在哺乳动物细胞中的慢病毒-介导的基因转移和表达的pLenti4/V5-DESTTM、pLenti6/V5-DESTTM和pLenti6.2/V5-GW/lacZ(Invitrogen)。在具体的实施方案中,可将本文公开的多肽的编码序列连接至此类表达载体中以在哺乳动物细胞中表达多肽。
在具体的实施方案中,载体是附加体载体或染色体外维持的载体。如本文所用,术语“附加体”是指能够在不整合至宿主染色体DNA中的情况下并且在从分裂的宿主细胞中逐渐丢失的情况下进行复制的载体,也意味着所述载体在染色体外或以附加体复制。
表达载体中存在的“表达控制序列”、“控制元件”或“调控序列”是载体的那些非翻译区域—复制起点、选择盒、启动子、增强子、翻译起始信号(Shine Dalgarno序列或Kozak序列)内含子、转录后调控元件、聚腺苷酸序列、5′和3′非翻译区—它们与宿主细胞蛋白相互作用以进行转录和翻译。此类元件的强度和特异性可能有所不同。根据所使用的载体系统和宿主,可以使用任何数目的适合的转录和翻译元件,包括遍在型启动子和诱导型启动子。
在具体的实施方案中,多核苷酸包含载体,其包括但不限于表达载体和病毒载体。载体可包含一种或多种外源性、内源性或异源性控制序列诸如启动子和/或增强子。“内源性控制序列”是与基因组中的给定基因天然连接的内源性控制序列。“外源控制序列”是通过遗传操纵(即分子生物技术)的方式与基因并置放置以使得此基因的转录由连接的增强子/启动子引导的外源控制序列。“异源性控制序列”是来自与被遗传操纵的细胞不同的物种的外源序列。“合成”控制序列可包含以下物质的元件:一条或多条内源性和/或外源序列,和/或在体外或在计算机中确定以提供具体疗法的最佳启动子和/或增强子活性的序列。
如本文所用的术语“启动子”是指RNA聚合酶结合的多核苷酸(DNA或RNA)的识别位点。RNA聚合酶起始并转录可操作地连接至启动子的多核苷酸。在具体的实施方案中,在哺乳动物细胞中可操作的启动子包含位于从转录起始的位点上游大概25至30个碱基处的富AT区和/或从转录起始上游70至80个碱基处存在的另一条序列,CNCAAT区(其中N可以是任何核苷酸)。
术语“增强子”是指含有能够提供增强的转录的序列并且在一些情况下可独立于其相对于另一控制序列的方向起作用的DNA区段。增强子可与启动子和/或其他增强子元件协同或加成起作用。术语“启动子/增强子”是指含有能够提供启动子和增强子功能两者的序列的DNA区段。
术语“可操作连接”是指并置,其中所述的组件呈允许其以其预定方式起作用的关系。在一个实施方案中,术语是指核酸表达控制序列(诸如启动子和/或增强子)和第二多核苷酸序列(如,目标多核苷酸)之间的功能性键联,其中表达控制序列指导与第二序列对应的核酸的转录。
如本文所用,术语“组成型表达控制序列”是指不断或持续允许可操作连接序列转录的启动子、增强子或启动子/增强子。组成型表达控制序列分别可以是允许在各种各样细胞和组织类型中表达的“泛在型”启动子、增强子或启动子/增强子,或者允许在严格种类的细胞和组织类型中表达的“细胞特异性”、“细胞类型特异性”、“细胞谱系特异性”或“组织特异性”启动子、增强子或启动子/增强子。
适用于具体的实施方案中的说明性泛在型表达控制序列包括但不限于巨细胞病毒(CMV)立即早期启动子、病毒猿猴病毒40(SV40)(如早期或晚期)、莫洛尼鼠白血病病毒(MoMLV)LTR启动子、劳斯肉瘤病毒(RSV)LTR、单纯性疱疹病毒(HSV)(胸苷激酶)启动子、来自牛痘病毒的H5、P7.5和P11启动子、短延伸因子1-α(EF1a-短)启动子、长延伸因子1-α(EF1a-长)启动子、早期生长响应1(EGR1)、铁蛋白H(FerH)、铁蛋白L(FerL)、甘油醛3-磷酸脱氢酶(GAPDH)、真核翻译起始因子4A1(EIF4A1)、热激70kDa蛋白5(HSPA5)、热激蛋白90kDaβ成员1(HSP90B1)、热激蛋白70kDa(HSP70)、β-驱动蛋白(β-KIN)、人ROSA 26基因座(Irions等人,Nature Biotechnology 25,1477-1482(2007))、泛素C启动子(UBC)、磷酸甘油酸激酶-1(PGK)启动子、巨细胞病毒增强子/鸡β-肌动蛋白(CAG)启动子、β-肌动蛋白启动子和骨髓增生性肉瘤病毒增强子、负对照缺失的、dl587rev引物结合位点取代的(MND)启动子(Challita等人,J Virol.69(2):748-55(1995))。
在特定的实施方案中,可能可取的是使用细胞、细胞类型、细胞谱系或组织特异性表达控制序列来实现所需多核苷酸序列的细胞类型特异性、谱系特异性或组织特异性表达(例如,仅在细胞类型、细胞谱系或组织的子集中或者在具体发育阶段期间表达编码多肽的特定核酸)。
如本文所用,“条件表达”可以指任何类型的条件表达,包括但不限于诱导型表达;阻遏表达;在具有特定生理、生物或疾病状态等的细胞或组织中表达。该定义不旨在排除细胞类型或组织特异性表达。某些实施方案提供了感兴趣的多核苷酸的条件表达,例如,通过使细胞、组织、有机体等经受引起多核苷酸表达或引起由感兴趣的多核苷酸编码的多核苷酸的表达增加或减少的处理或条件来控制表达。
诱导型启动子/系统的说明性实例包括但不限于类固醇诱导型启动子,如编码糖皮质激素或雌激素受体的基因的启动子(通过用相应的激素处理可诱导的)、金属硫蛋白启动子(通过用各种重金属处理可诱导的)、MX-1启动子(通过干扰素可诱导的)、“GeneSwitch”米非司酮可调节系统(Sirin等人,2003,Gene,323:67)、Cumate诱导型基因开关(WO2002/088346)、四环素依赖性调节系统等。
条件表达也可以通过使用位点特异性DNA重组酶来实现。根据某些实施方案,多核苷酸包含由位点特异性重组酶介导的至少一个(通常两个)重组位点。如本文所用,术语“重组酶”或“位点特异性重组酶”包括参与涉及一个或多个重组位点(例如,两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个)的重组反应的切除(excisive)蛋白或整合蛋白、酶、辅因子或相关蛋白,其可以是野生型蛋白(参见Landy,Current Opinion inBiotechnology 3:699-707(1993))、或其突变体、衍生物(例如,含有重组蛋白序列或其片段的融合蛋白)、片段和变体。适用于特定实施方案的重组酶的说明性实例包括但不限于:Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、ΦC31、Cin、Tn3解离酶、TndX、XerC、XerD、TnpX、Hjc、Gin、SpCCE1和ParA。
所述多核苷酸可以包含针对多种位点特异性重组酶中的任一种的一个或多个重组位点。应理解,位点特异性重组酶的靶位点是除载体(例如逆转录病毒载体或慢病毒载体)整合所需的任何位点之外。如本文所用,术语“重组序列”、“重组位点”或“位点特异性重组位点”是指重组酶识别并结合的特定核酸序列。
在特定的实施方案中,本文考虑的多核苷酸包括编码一种或多种多肽的一种或多种感兴趣的多核苷酸。在特定的实施方案中,为了实现多种多肽中的每一种的有效翻译,多核苷酸序列可以被一个或多个IRES序列或者编码自切割多肽的多核苷酸序列隔开。
如本文所用,“内部核糖体进入位点”或“IRES”是指促进直接内部核糖体进入顺反子(蛋白质编码区)的起始密码子(如ATG)从而导致基因的帽-非依赖性翻译的元件。参见,例如,Jackson等人,1990.Trends Biochem Sci 15(12):477-83)和Jackson andKaminski.1995.RNA 1(10):985-1000。本领域技术人员通常采用的IRES的实例包括在美国专利第6,692,736号中描述的那些。本领域已知的“IRES”的其它实例包括但不限于可从小核糖核酸病毒获得的IRES(Jackson等人,1990)和可从病毒或细胞mRNA来源获得的IRES,如例如免疫球蛋白重链结合蛋白(BiP)、血管内皮生长因子VEGF)(Huez等人,1998.Mol.Cell.Biol.18(11):6178-6190)、成纤维细胞生长因子2(FGF-2)和胰岛素样生长因子(IGFII)、翻译起始因子eIF4G和酵母转录因子TFIID和HAP4、可从Novagen商购获得的脑心肌炎病毒(EMCV)(Duke等人,1992.J.Virol 66(3):1602-9)和VEGF IRES(Huez等人,1998.Mol Cell Biol 18(11):6178-90)。在小核糖核酸病毒科、双顺反子病毒科和黄病毒科物种的病毒基因组以及在HCV、弗云德鼠白血病病毒(FrMLV)和莫洛尼鼠白血病病毒(MoMLV)中也报道了IRES。
在特定的实施方案中,多核苷酸包含具有共有Kozak序列并编码所需多肽的多核苷酸。如本文所用,术语“Kozak序列”是指极大地促进mRNA与核糖体小亚基的初始结合并增加翻译的短核苷酸序列。共有Kozak序列是(GCC)RCCATGG(SEQ ID NO:71),其中R是嘌呤(A或G)(Kozak,1986.Cell.44(2):283-92和Kozak,1987.Nucleic Acids Res.15(20):8125-48)。
指导异源核酸转录物的有效终止和聚腺苷酸化的元件增加异源基因表达。转录终止信号通常存在于聚腺苷酸化信号的下游。在特定的实施方案中,载体包含编码待表达多肽的多核苷酸的聚腺苷酸化序列3’。本文所用的术语“polyA位点”或“polyA序列”表示指导新生RNA转录物被RNA聚合酶II终止和聚腺苷酸化的DNA序列。聚腺苷酸化序列可以通过将polyA尾添加至编码序列的3’末端来促进mRNA稳定性,因此有助于提高的翻译效率。切割和聚腺苷酸化由RNA中的聚(A)序列指导。哺乳动物pre-mRNA的核心poly(A)序列具有两个识别元件,其侧面有切割-聚腺苷酸化位点。通常,几乎不变的AAUAAA六聚体位于富含U或GU残基的更多可变元件的上游20-50个核苷酸。新生转录物的切割发生在这两个元件之间,并且与5’切割产物中多达250个腺苷酸的添加偶联。在特定的实施方案中,核心poly(A)序列是理想的poly(A)序列(例如,AATAAA、ATTAAA、AGTAAA)。在特定的实施方案中,poly(A)序列是SV40 poly(A)序列、牛生长激素poly(A)序列(BGHpA)、兔β-珠蛋白polyA序列(rβgpA)、其变体、或本领域已知的其它合适的异源或内源性polyA序列。
在特定的实施方案中,编码TALEN、CRISPR/Cas系统、末端加工酶或融合多肽中的一种或多种的多核苷酸可以通过非病毒和病毒方法引入造血细胞,例如CD34+细胞。在特定的实施方案中,编码TALEN或Cas核酸酶和/或供体修复模板的一种或多种多核苷酸的递送可以通过相同的方法或通过不同的方法,和/或通过相同的载体或通过不同的载体来提供。
术语“载体”在本文中用于指能够转移或运输另一种核酸分子的核酸分子。转移的核酸通常与载体核酸分子连接,例如插入到载体核酸分子中。载体可以包括指导细胞中自主复制的序列,或者可以包括足以允许整合到宿主细胞DNA中的序列。在特定的实施方案中,非病毒载体用于将本文考虑的一种或多种多核苷酸递送至CD34+细胞。
非病毒载体的说明性实例包括但不限于质粒(例如DNA质粒或RNA质粒)、转座子、粘粒和细菌人工染色体。
在特定实施方案中考虑的多核苷酸的非病毒递送的示例性方法包括但不限于:电穿孔、声穿孔、脂质转染、显微注射、基因枪法(biolistics)、病毒颗粒、脂质体、免疫脂质体、纳米颗粒、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒体、DEAE-葡聚糖介导的转移、基因枪和热休克。
在特定实施方案中考虑的适用于特定实施方案中的多核苷酸递送系统的说明性实例包括但不限于由Amaxa Biosystems,Maxcyte,Inc.,BTX Molecular DeliverySystems,and Copernicus Therapeutics Inc提供的那些。脂质转染试剂是市售的(例如TransfectamTM和LipofectinTM)。已经在文献中描述适用于多核苷酸的有效受体识别脂质转染的阳离子和中性脂质。参见例如Liu等人,(2003)Gene Therapy.10:180–187;和Balazs等人,(2011)Journal of Drug Delivery.2011:1-12。在特定的实施方案中也考虑了抗体靶向的、细菌衍生的、非活性的基于纳米细胞的递送。
如下所述,包含在特定实施方案中考虑的多核苷酸的病毒载体可以通过施用至个体患者,通常通过全身施用(例如静脉内、腹腔内、肌内、皮下或颅内输注)或局部施用而在体内递送。可选地,可以将载体递送至离体细胞,如从个体患者(例如,动员的外周血液,淋巴细胞,骨髓吸出物,组织活检等)或通用的供体造血干细胞中移植的细胞,随后将细胞再植入患者。
在一个实施方案中,将包含TALEN变体或CRISPR/Cas系统和/或供体修复模板的病毒载体直接施用至有机体以在体内转导细胞。可选地,可以施用裸DNA或mRNA。施用是通过通常用于将分子引入与血液或组织细胞最终接触的任何途径,包括但不限于注射、输注、局部施用和电穿孔。施用这种核酸的合适方法是本领域技术人员可获得的并且是本领域技术人员众所周知的,并且尽管可以使用一种以上的途径施用特定的组合物,但特定的途径通常可以提供比另一种途径更直接和更有效的反应。
适用于本文考虑的特定实施方案的病毒载体系统的说明性实例包括但不限于腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、腺病毒和牛痘病毒载体。
I.基因组编辑的细胞
通过在特定实施方案中考虑的方法制备的基因组编辑的细胞提供了用于治疗X-连锁无丙种球蛋白血症(XLA)的改进的基于细胞的治疗剂。不希望受任何特定理论的束缚,认为本文考虑的组合物和方法可以用于将编码功能性BTK多肽的多核苷酸引入BTK基因,所述BTK基因包含一个或多个突变和/或缺失,所述突变和/或缺失导致很少或没有内源性BTK表达和XLA;因此,提供了更稳健的基因组编辑的细胞组合物,其可以用于治疗XLA,并且在一些实施方案中潜在地治愈XLA。
在特定实施方案中考虑的基因组编辑的细胞可以是自体的/自身的(“自我的”)或非自体的(“非自我的”,例如,同种异体的、同基因的或异种的)。本文所用的“自体的”是指来自同一受试者的细胞。本文所用的“同种异体的”是指与比较的细胞在遗传上不同的相同物种的细胞。本文所用的“同基因的”是指与比较的细胞遗传上相同的不同受试者的细胞。本文所用的“异种的”是指与比较的细胞不同物种的细胞。在优选的实施方案中,细胞获自哺乳动物受试者。在更优选的实施方案中,细胞获自灵长类受试者,任选非人灵长类。在最优选的实施方案中,细胞获自人类受试者。
“分离的细胞”是指非天然存在的细胞,例如,自然界中不存在的细胞、修饰的细胞、经工程化的细胞等,其从体内组织或器官获得并且基本上不含细胞外基质。
可以使用本文所考虑的组合物和方法编辑其基因组的细胞类型的说明性实例包括但不限于细胞系、原代细胞、干细胞、祖细胞和分化细胞。
术语“干细胞”是指这样的细胞,其是未分化的细胞,能够(1)长期自我更新,或产生原始细胞的至少一个相同拷贝的能力,(2)在单个细胞水平上分化成多种,并且在一些情况下仅一种专门的细胞类型,以及(3)组织的体内功能再生。干细胞根据其发育潜能分为全能的、多能的、专能的和寡/单能的。“自我更新”是指具有产生未改变的子细胞和产生专门细胞类型(潜力)的独特能力的细胞。可以以两种方式实现自我更新。不对称细胞分裂产生与亲本细胞相同的一个子细胞和与亲本细胞不同的一个子细胞,并且是祖细胞或分化细胞。对称的细胞分裂产生两个相同的子细胞。细胞的“增殖”或“扩增”是指对称分裂的细胞。
如本文所用,术语“祖细胞(progenitor)”或“祖细胞(progenitor cells)”是指具有自我更新和分化成更成熟细胞的能力的细胞。许多祖细胞沿着单一谱系分化,但可能具有相当广泛的增殖能力。
在特定的实施方案中,所述细胞是原代细胞。本文所用的术语“原代细胞”在本领域中已知是指已经从组织中分离并已经建立用于体外或离体生长的细胞。与连续细胞系相比,相应的细胞经历了非常少的群体倍增(如果有的话),因此更代表了它们所来源的组织的主要功能性成分,因此代表了体内状态的更具代表性的模型。从各种组织获得样品的方法和建立原代细胞系的方法是本领域众所周知的(参见,例如,Jones和Wise,Methods MolBiol.1997)。用于本文考虑的方法的原代细胞衍生自脐带血、胎盘血、动员外周血和骨髓。在一个实施方案中,原代细胞是造血干细胞或祖细胞。
在一个实施方案中,基因组编辑的细胞是胚胎干细胞。
在一个实施方案中,基因组编辑的细胞是成体干细胞或祖细胞。
在一个实施方案中,基因组编辑的细胞是原代细胞。
在优选的实施方案中,基因组编辑的细胞是造血细胞,例如造血干细胞,造血祖细胞(如B细胞祖细胞),或包含造血细胞的细胞群。
如本文所用,术语“细胞群”是指可以由任何数量的同质或异质细胞类型和/或同质或异质细胞类型组合组成的多个细胞,如本文别处所述。例如,为了转导造血干细胞或祖细胞,可以从脐带血、胎盘血、骨髓或动员外周血分离或获得细胞群。细胞群可以包含约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或约100%的待编辑的靶细胞类型。在某些实施方案中,造血干细胞或祖细胞可以使用本领域已知的方法从异质细胞群中分离或纯化。
获得造血细胞的说明性来源包括但不限于:脐带血、骨髓或动员外周血。
造血干细胞(HSC)产生定向的造血祖细胞(HPC),其能够在有机体的生命中产生成熟血细胞的全部库。术语“造血干细胞”或“HSC”是指产生有机体的所有血细胞类型的多能干细胞,包括骨髓细胞(例如单核细胞和巨噬细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、红细胞、巨核细胞/血小板、树突细胞)和淋巴样谱系(例如T细胞、B细胞)。NK细胞)和本领域已知的其它细胞(参见Fei,R.,等人,美国专利第5,635,387号;McGlave,等人,美国专利第5,460,964号;Simmons,P.,等人,美国专利第5,677,136号;Tsukamoto,等人,美国专利第5,750,397号;Schwartz,等人.,美国专利第5,759,793号;DiGuisto,等人,美国专利第681,599号;Tsukamoto,等人,美国专利第5,716,827号)。当移植到致死辐射的动物或人中时,造血干细胞和祖细胞可以重新填充红系细胞、嗜中性粒细胞-巨噬细胞、巨核细胞和淋巴样造血细胞池。
适用于本文考虑的方法和组合物的造血干细胞或祖细胞的另外说明性实例包括作为CD34+CD38LoCD90+CD45RA-的造血细胞,作为CD34+、CD59+、Thy1/CD90+、CD38Lo/-、C-kit/CD117+的造血细胞和CD133+的造血细胞。
在优选的实施方案中,造血细胞是CD133+CD90+
在优选的实施方案中,造血细胞是CD133+CD34+
在优选的实施方案中,造血细胞是CD133+CD90+CD34+
存在各种方法来表征造血层级结构。一种表征方法是SLAM代码。SLAM(信号淋巴细胞活化分子)家族是大于10种分子的群组,其基因主要串联位于1号染色体(小鼠)上的单个基因座,都属于免疫球蛋白基因超家族的一个亚组,并且最初被认为参与T细胞刺激。该家族包括CD48、CD150、CD244等,CD150是创始成员,因此也被称为slamF1,即SLAM家族成员1。造血层级结构的标记SLAM代码是造血干细胞(HSC)-CD150+CD48-CD244-;专能祖细胞(MPP)-CD150-CD48-CD244;谱系限制祖细胞(LRP)-CD150-CD48+CD244+;普通髓系祖细胞(CMP)(CMP)-lin-SCA-1-c-kit+CD34+CD16/32mid;粒细胞-巨噬细胞祖细胞(GMP)-lin-SCA-1-c-kit+CD34+CD16/32hi;和巨核细胞-红系祖细胞(MEP)-lin-SCA-1-c-kit+CD34-CD16/32low
用本文考虑的组合物和方法编辑的优选靶细胞类型包括造血细胞,优选人造血细胞,更优选人造血干细胞和祖细胞,甚至更优选CD34+人造血干细胞。本文所用的术语“CD34+细胞”是指在其细胞表面上表达CD34蛋白的细胞。本文所用的“CD34”是指经常充当细胞-细胞粘附因子的细胞表面糖蛋白(例如,唾液酸粘蛋白)。CD34+是造血干细胞和祖细胞的细胞表面标志物。
在一个实施方案中,基因组编辑的造血细胞是CD150+CD48-CD244-细胞。
在一个实施方案中,基因组编辑的造血细胞是CD34+CD133+细胞。
在一个实施方案中,基因组编辑的造血细胞是CD133+细胞。
在一个实施方案中,基因组编辑的造血细胞是CD34+细胞。
在特定的实施方案中,包含造血干细胞和祖细胞(HSPC)的造血细胞群包含被编辑以表达功能性BTK多肽的缺陷BTK基因,其中编辑是由HDR修复的DSB。
在特定的实施方案中,基因组编辑的细胞包含B细胞祖细胞。
在特定的实施方案中,基因组编辑的细胞包含BTK基因中的一个或多个突变和/或缺失,其导致很少或没有内源性BTK表达。
J.组合物和制剂
在特定实施方案中考虑的组合物可以包含一种或多种多肽、多核苷酸、包含其的载体以及基因组编辑组合物和基因组编辑细胞组合物,如本文考虑的。在特定实施方案中考虑的基因组编辑组合物和方法可用于在细胞或细胞群中编辑人BTK基因中的靶位点。在优选的实施方案中,基因组编辑组合物用于通过造血细胞,例如造血干细胞或祖细胞,或CD34+细胞中的HDR来编辑BTK基因。
在各种实施方案中,本文考虑的组合物包含TALEN变体或CRISPR/Cas系统和任选的末端加工酶,例如3’-5’核酸外切酶(Trex2)。TALEN变体或Cas蛋白可以是mRNA的形式,其经由上文公开的多核苷酸递送方法(例如电穿孔、脂质纳米颗粒等)引入细胞。在一个实施方案中,经由上文公开的多核苷酸递送方法将包含编码TALEN或Cas蛋白的mRNA以及引导RNA(如果使用Cas蛋白)以及任选的3’-5’核酸外切酶的组合物引入细胞中。
在特定的实施方案中,本文考虑的组合物包含细胞群、TALEN变体或CRISPR/Cas系统和任选的供体修复模板。在特定实施方案中,本文考虑的组合物包含细胞群、TALEN变体或CRISPR/Cas系统、末端加工酶和任选的供体修复模板。TALEN变体或CRISPR/Cas系统和/或末端加工酶可以是mRNA的形式,其经由上文公开的多核苷酸递送方法引入细胞。供体修复模板也可以通过单独的组合物引入细胞。
在特定的实施方案中,本文考虑的组合物包含细胞群、TALEN或CRISPR/Cas和gRNA,以及任选的供体修复模板。在特定的实施方案中,本文考虑的组合物包含细胞群、TALEN或CRISPR/Cas和gRNA、3’-5’核酸外切酶以及任选的供体修复模板。TALEN或CRISPR/Cas和gRNA和/或3’-5’核酸外切酶可以是经由上文公开的多核苷酸递送方法引入细胞的mRNA形式。供体修复模板也可以通过单独的组合物引入细胞。gRNA和Cas蛋白也可以一起或通过单独的组合物引入细胞。Cas蛋白可以作为蛋白或编码该蛋白的多核苷酸提供。
在特定的实施方案中,细胞群包括遗传修饰的造血细胞,包括但不限于造血干细胞、造血祖细胞、CD133+细胞和CD34+细胞。
组合物包括但不限于药物组合物。“药物组合物”是指配制在药学上可接受的或生理学上可接受的溶液中,用于单独或与一种或多种其它治疗方式组合施用至细胞或动物的组合物。还应理解,如果需要,组合物也可以与其它试剂组合施用,所述其它试剂剂例如细胞因子、生长因子、激素、小分子、化疗剂、前药、药物、抗体或其它各种药物活性剂。实际上对组合物中也可以包含的其它组分没有限制,条件是另外的试剂不会不利地影响组合物。
短语“药学上可接受的”在本文中用于指在合理的医学判断范围内适合用于与人类和动物的组织接触而没有过度的毒性、刺激、过敏反应或者其它问题或并发症,与合理的益处/风险比相称的那些化合物、材料、组合物和/或剂型。
术语“药学上可接受的载体”是指与治疗细胞一起施用的稀释剂、佐剂、赋形剂或媒介物。药物载体的说明性实例可以是无菌液体,如细胞培养基、水和油,包括石油、动物、植物或合成来源的那些,如花生油、大豆油、矿物油、芝麻油等。盐溶液和右旋糖水溶液和甘油溶液也可用作液体载体,特别是用于可注射溶液。在特定实施方案中的合适的药物赋形剂包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂奶粉、甘油、丙烯、乙二醇、水、乙醇等。除非任何常规介质或试剂与活性成分不相容,考虑了其在治疗组合物中的用途。补充的活性成分也可以掺入到组合物中。
在一个实施方案中,包含药学上可接受的载体的组合物适于施用至受试者。在特定的实施方案中,包含载体的组合物适于肠胃外施用,例如血管内(静脉内或动脉内)、腹腔内或肌内施用。在特定的实施方案中,包含药学上可接受的载体的组合物适于心室内、脊柱内或鞘内施用。药学上可接受的载体包括无菌水溶液、细胞培养基或分散液。这种介质和试剂用于药物活性物质的用途是本领域众所周知的。除非任何常规培养基或试剂与转导的细胞不相容,考虑了其在药物组合物中的用途。
在特定的实施方案中,本文考虑的组合物包含遗传修饰的造血干细胞和/或祖细胞,其包含编码功能性BTK多肽的外源性多核苷酸和药学上可接受的载体。
在特定的实施方案中,本文考虑的组合物包含遗传修饰的造血干细胞和/或祖细胞,其包含含有一个或多个突变和/或缺失的BTK基因和编码功能性BTK多肽的外源性多核苷酸以及药学上可接受的载体。包含本文考虑的基于细胞的组合物的组合物可以通过肠胃外施用方法施用。
药学上可接受的载体必须具有足够高的纯度和足够低的毒性以使其适于施用至所治疗的人受试者。它还应保持或增加组合物的稳定性。药学上可接受的载体可以是液体或固体,并根据计划的施用方式选择,以在与组合物的其它组分组合时提供所需的体积、稠度等。例如,药学上可接受的载体可以是但不限于粘合剂(例如,预糊化的玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素等)、填充剂(例如,乳糖和其它糖、微晶纤维素、果胶、明胶、硫酸钙、乙基纤维素、聚丙烯酸酯、磷酸氢钙等)、润滑剂(例如,硬脂酸镁、滑石、二氧化硅、胶态二氧化硅、硬脂酸、金属硬脂酸盐、氢化植物油、玉米淀粉、聚乙二醇、苯甲酸钠、乙酸钠等)、崩解剂(例如淀粉、羟基乙酸淀粉钠等)或润湿剂(例如十二烷基硫酸钠等)。用于本文考虑的组合物的其它合适的药学上可接受的载体包括但不限于水、盐溶液、醇、聚乙二醇、明胶、直链淀粉、硬脂酸镁、滑石、硅酸、粘性石蜡、羟甲基纤维素、聚乙烯吡咯烷酮等。
此类载体溶液还可以含有缓冲剂、稀释剂和其它合适的添加剂。本文所用的术语“缓冲剂”是指其化学组成中和酸或碱而pH没有显著变化的溶液或液体。本文考虑的缓冲剂的实例包括但不限于Dulbecco磷酸盐缓冲盐水(PBS)、林格氏溶液、5%右旋糖水溶液(D5W)、正常/生理盐水(0.9%NaCl)。
药学上可接受的载体可以以足以维持组合物的pH为约7的量存在。可选地,组合物的pH范围为约6.8至约7.4,例如6.8、6.9、7.0、7.1、7.2、7.3和7.4。在另一个实施方案中,组合物的pH为约7.4。
本文考虑的组合物可以包含无毒的药学上可接受的介质。组合物可以是悬浮液。本文所用的术语“悬浮液”是指细胞不附着于固体支持物的非粘附状态。例如,可以搅拌或搅动维持为悬浮液的细胞,并且不将其附着于支持物,如培养皿上。
在特定的实施方案中,本文考虑的组合物配制在悬浮液中,其中基因组编辑的造血干细胞和/或祖细胞分散在静脉内(IV)袋等中的可接受的液体培养基或溶液中,例如盐水或无血清培养基。可接受的稀释剂包括但不限于水、PlasmaLyte、林格氏溶液、等渗氯化钠(盐)溶液、无血清细胞培养基和适于低温储存的培养基,例如
Figure BDA0002827312770000701
培养基。
在某些实施方案中,药学上可接受的载体基本上不含人或动物来源的天然蛋白,并且适于储存包含基因组编辑的细胞群(例如造血干细胞和祖细胞)的组合物。治疗性组合物旨在施用至人患者,因此基本上不含细胞培养成分,如牛血清白蛋白、马血清和胎牛血清。
在一些实施方案中,将组合物配制在药学上可接受的细胞培养基中。此类组合物适于施用于人受试者。在特定的实施方案中,药学上可接受的细胞培养基是无血清培养基。
无血清培养基具有优于含血清培养基的数个优点,包括简化的和更好限定的组成、降低的污染物程度、消除潜在的感染性试剂来源和更低的成本。在各种实施方案中,无血清培养基是无动物的,并且可以任选地是无蛋白质的。任选地,培养基可以含有生物药学上可接受的重组蛋白。“无动物的”培养基是指其中组分衍生自非动物来源的培养基。重组蛋白代替了在无动物培养基中的天然动物蛋白,并且营养物获自合成的、植物的或微生物的来源。相比之下,“无蛋白质”培养基被定义为基本上不含蛋白质。
用于特定组合物中的无血清培养基的说明性实例包括但不限于QBSF-60(QualityBiological,Inc.)、StemPro-34(Life Technologies)和X-VIVO 10。
在优选的实施方案中,包含基因组编辑的造血干细胞和/或祖细胞的组合物被配制在PlasmaLyte中。
在各种实施方案中,将包含造血干细胞和/或祖细胞的组合物配制在冷冻保存培养基中。例如,含有冷冻保存试剂的冷冻保存介质可以用于维持解冻后的高细胞活力结果。用于特定组合物的低温保存介质的说明性实例包括但不限于CryoStor CS10、CryoStorCS5和CryoStor CS2。
在一个实施方案中,将组合物配制在包含50:50的PlasmaLyte A:CryoStor CS10的溶液中。
在特定的实施方案中,组合物基本上不含支原体、内毒素和微生物污染物。就内毒素而言,“基本上不含”意指每剂量细胞的内毒素比FDA允许的用于生物制剂的内毒素少,生物制剂是每天5EU/kg体重的总内毒素,对于平均70kg的人,其是350EU/总剂量的细胞。在特定的实施方案中,包含用本文考虑的逆转录病毒载体转导的造血干细胞或祖细胞的组合物含有约0.5EU/mL至约5.0EU/mL、或约0.5EU/mL、1.0EU/mL、1.5EU/mL、2.0EU/mL、2.5EU/mL、3.0EU/mL、3.5EU/mL、4.0EU/mL、4.5EU/mL或5.0EU/mL。
在某些实施方案中,考虑了适于递送多核苷酸的组合物和制剂,包括但不限于编码一种或多种TALEN变体或CRISPR/Cas系统的一种或多种mRNA,以及任选的末端加工酶。
用于离体递送的示例性制剂还可以包括使用本领域已知的各种转染剂,如磷酸钙、电穿孔、热休克和各种脂质体制剂(即,脂质介导的转染)。如下文更详细描述的,脂质体是包埋一部分水性流体的脂质双层。DNA自发地结合到阳离子脂质体的外表面(凭借其电荷),并且这些脂质体将与细胞膜相互作用。
在特定的实施方案中,药学上可接受的载体溶液的制剂是本领域技术人员众所周知的,正如在各种治疗方案中开发用于使用本文所述的特定组合物的合适的给药和治疗方案一样,所述治疗方案包括例如肠内和肠胃外,例如血管内、静脉内、动脉内、骨内、心室内、脑内、颅内、脊柱内、鞘内、髓内施用和制剂。本领域技术人员应理解,本文考虑的特定实施方案可以包括其它制剂,如制药领域众所周知的那些,并且描述于例如Remington:TheScience and Practice of Pharmacy,第I卷和第II卷,第22版,Loyd V.AllenJr.Philadelphia编辑,PA:Pharmaceutical Press;2012,将其通过引用以其整体并入。
K.基因组编辑细胞疗法
通过在特定实施方案中考虑的方法制备的基因组编辑的细胞提供了用于预防、治疗和缓解X-连锁无丙种球蛋白血症(XLA)或者用于预防、治疗或缓解与XLA相关的至少一种症状或具有引起BTK基因突变的XLA的受试者的改进的药物产品。如本文所用,术语“药物产品”是指使用本文考虑的组合物和方法产生的基因修饰的细胞。在特定的实施方案中,药物产品包含遗传修饰的造血干细胞或祖细胞,例如CD34+细胞。遗传修饰的造血干细胞或祖细胞产生整个B细胞谱系,而在BTK基因中包含导致XLA的一个或多个突变和/或缺失的未修饰细胞在B细胞发育中是有缺陷的。
在特定的实施方案中,将被编辑的造血干细胞或祖细胞包含非功能性的或者破坏的、消除的或部分缺失的BTK基因,从而减少或消除BTK表达并取消正常的B细胞发育。
在特定的实施方案中,基因组编辑的造血干细胞或祖细胞包含非功能性的或者破坏的、消除的或部分缺失的BTK基因,从而减少或消除内源性BTK表达,并且进一步包含插入BTK基因的多核苷酸,其编码恢复正常B细胞发育的功能性BTK多肽。
在特定实施方案中,基因组编辑的造血干细胞或祖细胞为诊断患有或疑似患有XLA的受试者提供治愈、预防或缓解疗法。
在各种实施方案中,基因组编辑组合物通过直接注射到需要基因治疗的受试者的细胞、组织或器官在体内例如骨髓中施用。在各种其它实施方案中,细胞用本文考虑的TALEN变体或CRISPR/Cas系统在体外或离体编辑,并任选地离体扩增。然后将基因组编辑的细胞施用至需要治疗的受试者。
用于本文考虑的基因组编辑方法的优选细胞包括自体/自身(“自我”)细胞,优选造血细胞,更优选造血干细胞或祖细胞,甚至更优选CD34+细胞。
如本文所用,术语“个体”和“受试者”通常可互换地使用,并且是指表现出可以用本文别处考虑的TALEN或CRISPR/Cas、基因组编辑组合物、基因治疗载体、基因组编辑载体、基因组编辑的细胞和方法治疗的XLA的症状的任何动物。合适的受试者(例如,患者)包括实验室动物(如小鼠、大鼠、兔或豚鼠)、农场动物和家养动物或宠物(如猫或狗)。包括非人灵长类,优选人类受试者。典型的受试者包括已经被诊断患有XLA或处于患有XLA的风险中的人患者。
如本文所用,术语“患者”是指已经被诊断患有XLA的受试者,所述XLA可以用本文别处考虑的TALEN或CRISPR/Cas、基因组编辑组合物、基因治疗载体、基因组编辑载体、基因组编辑细胞和方法治疗。
如本文所用,“治疗(treatment)”或“治疗(treating)”包括对XLA的症状或病理的任何有益或期望的效果,并且可以包括XLA的一种或多种可测量标志物的甚至最小的减少。治疗可以任选地涉及延迟XLA的进展。“治疗”不一定表示XLA或其相关症状的完全根除或治愈。
如本文所用,“预防(prevent)”和类似词语,如“预防(prevention)”、“预防(prevented)”、“预防(preventing)”等表示用于预防、抑制或降低XLA发生或复发的可能性的方法。它还指延迟XLA的发作或复发或者延迟XLA的发生或复发。如本文所用,“预防”和类似词语还包括在XLA发作或复发之前降低其强度、效果、症状和/或负担。
如本文所用,短语“缓解…中的至少一种症状”是指减少XLA的一种或多种症状。在特定的实施方案中,可缓解的XLA的一种或多种症状包括但不限于常见的感染,包括但不限于支气管炎(气道感染)、慢性腹泻、结膜炎(眼部感染)、中耳炎(中耳感染)、肺炎(肺部感染)、鼻窦炎(鼻窦感染)、皮肤感染、上呼吸道感染;由于细菌、病毒和其它微生物引起的感染;以及细菌感染,包括但不限于流感嗜血杆菌(Haemophilus influenzae)、肺炎双球菌(肺炎链球菌(Streptococcus pneumoniae))和葡萄球菌感染。
如本文所用,术语“量”是指足以实现有益或所需的预防或治疗结果(包括临床结果)的TALEN变体或CRISPR/Cas系统、基因组编辑组合物或基因组编辑的细胞的“有效的量”或“有效量”。
“预防有效量”是指足以实现所需的预防结果的TALEN变体或CRISPR/Cas系统、基因组编辑组合物或基因组编辑的细胞的量。通常但不是必需的,由于在疾病之前或疾病早期的受试者中使用预防剂量,因此预防有效量小于治疗有效量。
TALEN变体或CRISPR/Cas系统、基因组编辑组合物或基因组编辑的细胞的“治疗有效量”可以根据诸如个体的疾病状态、年龄、性别和体重以及在个体中引起所需反应的能力等因素而变化。治疗有效量也是其中治疗有益效果超过任何有毒或有害效果的量。术语“治疗有效量”包括有效“治疗”受试者(例如,患者)的量。当指示治疗量时,待施用的特定实施方案中考虑的组合物的精确量可以由医师根据说明书并考虑患者(受试者)的年龄、体重、肿瘤大小、感染或转移的程度和状况的个体差异来确定。
基因组编辑的细胞可以作为骨髓或脐带血移植物的一部分在已经或没有经历骨髓消融治疗的个体中施用。在一个实施方案中,本文考虑的基因组编辑的细胞在骨髓移植中被施用至已经经历化学消融或放射消融骨髓治疗的个体。
在一个实施方案中,将一定剂量的基因组编辑的细胞静脉内递送至受试者。在优选的实施方案中,将基因组编辑的造血干细胞静脉内施用至受试者。
在一个说明性实施方案中,提供至受试者的基因组编辑的细胞的有效量为至少2×106个细胞/kg、至少3×106个细胞/kg、至少4×106个细胞/kg、至少5×106个细胞/kg、至少6×106个细胞/kg、至少7×106个细胞/kg、至少8×106个细胞/kg、至少9×106个细胞/kg、或至少10×106个细胞/kg、或更多个细胞/kg,包括细胞的所有介于中间的剂量。
在另一个说明性实施方案中,提供至受试者的基因组编辑的细胞的有效量为约2×106个细胞/kg、约3×106个细胞/kg、约4×106个细胞/kg、约5×106个细胞/kg、约6×106个细胞/kg、约7×106个细胞/kg、约8×106个细胞/kg、约9×106个细胞/kg、或约10×106个细胞/kg、或更多个细胞/kg,包括所有介于中间的细胞剂量。
在另一个说明性实施方案中,提供至受试者的基因组编辑的细胞的有效量为约2x106个细胞/kg至约10x106个细胞/kg、约3x106个细胞/kg至约10x106个细胞/kg、约4x106个细胞/kg至约10x106个细胞/kg、约5x106个细胞/kg至约10x106个细胞/kg、2x106个细胞/kg至约6x106个细胞/kg、2x106个细胞/kg至约7x106个细胞/kg、2x106个细胞/kg至约8x106个细胞/kg、3x106个细胞/kg至约6x106个细胞/kg、3x106个细胞/kg至约7x106个细胞/kg、3x106个细胞/kg至约8x106个细胞/kg、4x106个细胞/kg至约6x106个细胞/kg、4x106个细胞/kg至约7x106个细胞/kg、4x106个细胞/kg至约8x106个细胞/kg、5x106个细胞/kg至约6x106个细胞/kg、5x106个细胞/kg至约7x106个细胞/kg、5x106个细胞/kg至约8x106个细胞/kg、或6x106个细胞/kg至约8x106个细胞/kg,包括所有介于中间的细胞剂量。
剂量的一些变化将必然根据所治疗的受试者的状况而发生。在任何情况下,负责施用的人将决定个体受试者的适当剂量。
在特定的实施方案中,基因组编辑的细胞疗法用于治疗、预防或缓解XLA或与其相关的病况,其包括向BTK基因中具有导致很少或没有内源性BTK表达的一个或多个突变和/或缺失的受试者施用治疗有效量的本文考虑的基因组编辑的细胞。在一个实施方案中,基因组编辑的细胞疗法缺乏功能性内源性BTK表达,但包含编码功能性BTK多肽的外源性多核苷酸。
在各种实施方案中,向受试者施用一定量的基因组编辑的细胞,所述细胞包含有效增加受试者中BTK表达的编码功能性BTK多肽的外源性多核苷酸。在特定的实施方案中,在BTK基因中包含一个或多个有害突变或缺失的基因组编辑的细胞中,来自外源性多核苷酸的BTK表达的量相比内源性BTK表达增加至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约100%,至少约2倍,至少约5倍,至少约10倍,至少约50倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍或至少约1000倍,或更多倍。
本领域普通技术人员能够使用常规方法以确定适当的给药途径和有效量的包含本文考虑的基因组编辑的细胞的组合物的恰当剂量。本领域普通技术人员还将认识到,在某些疗法中,可能需要多次施用本文考虑的药物组合物来实现治疗。
用于治疗适于用基因组编辑的造血干细胞和祖细胞疗法治疗的受试者的主要方法之一是输血。因此,在本文考虑的组合物和方法的主要目标之一是减少输血的数量或消除输血的需要。
在特定的实施方案中,将药物产品施用一次。
在某些实施方案中,将药物产品在1年、2年、5年、10年或更长的跨度内施用1次、2次、3次、4次、5次、6次、7次、8次、9次或10次或更多次。
本说明书中引用的所有出版物、专利申请和公布的专利通过引用并入本文,如同每个单独的出版物、专利申请或公布的专利被具体地和单独地指出通过引用并入一样。
尽管为了清楚理解的目的,已经通过示例和实例的方式详细描述了上述实施方案,但对于本领域的普通技术人员来说,根据本文所考虑的教导,在不脱离所附权利要求的精神或范围的情况下,可以对其进行某些改变和修改是显而易见的。以下实施例仅以说明的方式提供,而不是以限制的方式提供。本领域技术人员将容易地认识到可以改变或修改各种非关键参数以产生基本上类似的结果。
实施例
实施例1
人BTK基因内含子2中靶位点处基于TALEN的基因编辑。
在人BTK基因内产生TALEN的靶位点T1-T4(图1A)。TALEN的序列如下:
表2:TAL效应子结构域RVD
T1(#1181)
T1-F RVDs HD NG HD NN NI HD NG NI NG NN NI NI NI NI HD NG
T1-R RVDs HD NG NI NI NN NN HD HD NI NI NN NG HD HD NG
T2(#1182)
T2-F RVDs NI NG HD NI NI NN NN NI HD NG NG NN NN HD HD NG
T2-R RVDs NI HD HD NI NI HD NN NI NI NI NI NG NG NG NI HD HD NG
T3(#1183)
T3-F RVDs NI NG NG NG HD HD NG NI NN HD HD NG NI NG NI NI HD NG
T3-R RVDs NN NN HD NG NG HD NG NG NI NN NN NI HD HD NG NG NG
T4
T4-F RVDs HD HD NI NG NG NG NN NI NI NI HD NG NI NN NN NG
T4-R RVDs HD HD NG HD NI NG HD HD HD NG HD NG NG NN NN NG NG
图1B显示了原代T细胞中用每种TALEN实现的破坏百分比。将原代人T细胞培养于补充有IL-2(50ng/ml)、IL-7(5ng/ml)和IL-15(5ng/ml)的T细胞生长培养基中,并使用CD3/CD28珠粒(Dynabeads,Life Technologies)刺激48小时。去除珠粒,并将细胞静置过夜,然后使用带有TALEN mRNA(1μg的每种RNA单体)的Neon转染系统进行电穿孔。将细胞再培养5天,并提取基因组DNA。使用PCR纯化试剂盒扩增并纯化切割位点周围的区域。将200ng经纯化的PCR产物与T7核酸内切酶(NEB)一起孵育,在凝胶上进行分析,并使用Licor ImageStudio Lite软件对破坏百分比进行定量。在随后的图中,TALEN T3被用于实验中。
图1C显示了用于使用TALEN编辑BTK基因的AAV供体模板的示意图。DT AAV载体具有侧接有MND启动子驱动的绿色荧光蛋白(GFP)盒的1kb的同源臂。DT-Del AAV供体具有跨越5’同源臂末端至TAL间隔子结构域的基因组区缺失,导致第二外显子和内含子的部分缺失以消除被TALEN的切割。
图1D显示了使用TALEN和AAV供体模板在原代T细胞中进行编辑。柱状图描绘了GFP表达的时程。同源重组(HR)百分比报告为第15天的GFP百分比(%)。
图1E显示了代表性FACS图,该图显示了使用TALEN和AAV供体的共递送,在原代T细胞编辑后第2天和第15天的GFP表达。
实施例2
人BTK基因内含子2中靶位点处的CRISPR/CAS基因编辑。
在人BTK基因内对应于引导RNA位置G1-G9的靶位点产生TALEN(图2A)。gRNA序列如下:
引导 序列
G1 AGCTATGGCCGCAGTGATTC
G2 AGGCGCTTCTTGAAGTTTAG
G3 ATGAGTATGACTTTGAACGT
G4 AGGGATGAGGATTAATGTCC
G5 ACACTGAATTGGGGGGGGAT
G6 AACTAGGTAGCTAGGCTGAG
G7 GCTTTAGCTAGTTATAGGCT
G8 AGAGGTAAATTTTCGTTGGT
G9 GATGCACACTGAATTGGGGG
图2B显示了如由T7核酸内切酶(New England Biolabs)测定的具有引导物G1至G9的BTK基因座处的破坏百分比(%)。使用Licor Image Studio Lite软件量化了破坏百分比。在随后图内的实验中使用了引导G3。
图2C显示了使用CRISPR-Cas编辑BTK基因的三种示例性AAV供体模板的示意图。DTAAV载体具有侧接有MND启动子驱动的绿色荧光蛋白(GFP)的1kb同源臂。DT-PAM AAV供体具有PAM序列中的突变以消除由引导G3进行的切割。DT-Del载体具有缺失以消除由引导G3进行的切割。
实施例3
在原代T细胞中通过共递送Cas9蛋白和单一引导RNA的核糖核蛋白复合体(RNP)以及AAV供体进行的CRISPR/CAS基因编辑。
图2D显示了在原代T细胞中使用Cas9+引导物和AAV供体模板的共递送进行的编辑。将原代人CD3+ T细胞培养并珠粒刺激。然后将细胞用Cas9蛋白和单一引导RNA的核糖核蛋白复合体(RNP)转染,并在两个小时后以20%的培养体积添加AAV供体。在第2天、第8天和第15天分析细胞的GFP表达。第15天的GFP表达指示同源定向修复(HDR)。
图2E显示了代表性FACS图,其显示了使用RNP+AAV供体对原代T细胞进行编辑之后第2天和第15天的GFP表达。
实施例4
基于CRISPR/CAS或TALEN系统的CD34+T细胞中的基因编辑。
图3A显示了人CD34+细胞编辑方案的示意图。将成人动员的CD34+细胞在补充有TPO、SCF、FLT3L(100ng/ml)和IL3(60ng/ml)的SCGM培养基中培养48小时,然后使用Neon电穿孔系统用TALEN或者以1:1.2比率混合的Cas9蛋白和单一引导RNA的核糖核蛋白复合体(RNP)进行电穿孔。sgRNA购自Trilink Biotechnologies并在5′和3′末端的三个末端位置处具有化学修饰的核苷酸。将细胞在第2天和第5天通过流式细胞术分析。
图3B显示了使用TALEN mRNA和AAV供体模板的共递送对CD34+HSC中的BTK基因座进行编辑。如前所述将成人动员的CD34+细胞在SCGM培养基中培养,然后使用Neon电穿孔系统用TALEN mRNA进行电穿孔。在电穿孔之后立即添加携带供体模板的AAV载体。对照包括未操纵的细胞和仅用AAV转导且未转染核酸酶(AAV)的细胞。柱状图描绘了第5天的%GFP,表示HDR。
图3C显示了描绘了在编辑之后第2天和第5天从模拟物、AAV或AAV+TALEN处理的CD34+细胞中进行的GFP表达的FACS图。
图3D显示了用TALEN和AAV供体编辑之后的CD34+细胞活力。柱状图表示编辑后第2天和第5天模拟物和仅AAV以及AAV+TALEN处理的细胞的存活率。
图3E显示了TALEN编辑的CD34+细胞的CFU测定。编辑之后第一天将TALEN编辑的、仅TALEN、仅AAV和模拟物细胞涂铺在Methocult培养基上,以进行菌落形成单位(CFU)测定。简而言之,将500个细胞一式两份涂铺在Methocult H4034培养基(StemcellTechnologies)中,在37℃下孵育12-14天,并根据其形态和GFP表达枚举菌落。CFU-E:菌落形成单位-红系,M:巨噬细胞,GM:粒细胞,巨噬细胞,G:粒细胞,GEMM:粒细胞,红系,巨噬细胞,巨核细胞,BFU-E:爆发集落形成单位红系。n=3个独立供体。数据表示为平均值±SEM。
图4A显示了使用RNP和AAV供体模板的共递送进行的于CD34+HSC中的BTK基因座的编辑。如前所述将成人动员的CD34+细胞在SCGM培养基中培养,然后使用Neon电穿孔系统用RNP复合物进行电穿孔。在电穿孔之后立即添加携带供体模板的AAV载体。对照包括未操纵的细胞和仅用AAV转导且未转染核酸酶(AAV)的细胞。柱状图描绘了第5天的GFP百分比(%),表示HDR。
图4B显示了与图4A相同的实验,并描绘了显示在第2天和第5天GFP表达的代表性FAC图。
图4C显示了用RNP和AAV供体编辑之后的CD34+细胞活力。条形图表示编辑后第2天和第5天模拟物和仅AAV以及AAV+RNP处理(在各种RNP和AAV剂量下)的细胞的存活率。
图4D显示了RNP编辑的CD34+细胞的CFU测定。编辑之后第一天将RNP编辑的、仅AAV和模拟物细胞涂铺在Methocult培养基上,以进行菌落形成单位(CFU)测定。简而言之,将500个细胞一式两份涂铺在Methocult H4034培养基(Stemcell Technologies)中,在37℃下孵育12-14天,并根据其形态和GFP表达枚举菌落。CFU-E:菌落形成单位红系,M:巨噬细胞,GM:粒细胞,巨噬细胞,G:粒细胞,GEMM:粒细胞,红系,巨噬细胞,巨核细胞,BFU-E:爆发集落形成单位红系。n=3个独立供体。数据表示为平均值±SEM。
图5A显示了表达GFP的无启动子的AAV供体模板的示意图。该载体含有GFP、截短的土拨鼠肝炎病毒转录后调控元件(WPRE3)和SV40聚腺苷酸化信号。该插入物在任一侧侧接有BTK基因座的0.5kb同源臂。
图5B显示了使用无启动子的GFP载体在CD34+HSC中使用RNP和AAV供体模板的共递送进行的BTK基因座的编辑。柱状图描绘了第1天、第2天和第5天的GFP百分比(%),第5天的GFP百分比表示HDR。
图5C显示了与图4A相同的实验,并描绘了显示了第2天和第5天的GFP表达的代表性FAC图。
图5D显示了用RNP和无启动子的AAV供体编辑之后CD34+细胞活力。柱状图表示编辑后第1天、第2天和第5天模拟物和仅AAV以及AAV+RNP处理的细胞(在各种RNP和AAV剂量下)的存活率。第5天的GFP百分比表示HDR百分比。
图5E显示了用于确定HDR的数字液滴PCR测定。使用DNeasy血液和组织试剂盒(Qiagen)从造血干细胞和祖细胞(HSPC)中分离基因组DNA。为了评估编辑率,使用在AAV插入物内的正向引物结合和与同源区域之外的BTK基因座结合的反向引物进行“进-出”液滴数字PCR。生成了ActB基因的类似尺寸的对照扩增子以用作对照。所有反应均一式两份进行。使用QX200 Droplet Generator(Bio-Rad)将PCR反应物分成液滴。使用不含UTP的探针的ddPCR Supermix(Bio-Rad)、900nM引物、250nM探针、50ng基因组DNA和1%DMSO进行扩增。使用QuantaSoft软件(Bio-Rad)在QX200 Droplet Digital PCR System(Bio-Rad)上分析液滴。
图6显示了表达密码子优化的BTK的AAV供体模板的示意图。
实施例5
AAV靶标载体_序列。
#DT(#1177)(SEQ ID NO:19)
用于BTK基因座的AAV靶向载体。该载体含有MND启动子、eGFP(增强的绿色荧光蛋白)和SV40聚腺苷酸化信号,并且侧接有约1kb的同源臂。
DT-Del(#1233)(SEQ ID NO:20)
该载体含有MND启动子、eGFP和SV40聚腺苷酸化信号。该插入物在任一侧侧接有BTK基因座的大约1kb的同源臂。该载体专门设计用于与BTK TALEN T3一起使用。缺失TALEN结合位点以消除被TALEN切割。
DT-PAM 1254(SEQ ID NO:21)
该载体含有MND启动子、eGFP和SV40聚腺苷酸化信号。该插入物在任一侧侧接有BTK基因座的大约1kb的同源臂。该载体被设计用于与BTK引导物G3一起起作用,因为缺失PAM位点以消除修复模板被引导物切割。
DT-PAM mut(#1251)(SEQ ID NO:22)
该载体含有MND启动子、eGFP和SV40聚腺苷酸化信号。该插入物在任一侧侧接有BTK基因座的大约1kb的同源臂。突变PAM位点以消除被引导物G3切割。
ATG-DT-Del(#1375)(SEQ ID NO:23)
该载体含有eGFP、截短的土拨鼠肝炎病毒转录后调控元件(WPRE3)和SV40聚腺苷酸化信号,并且侧接有BTK基因座的0.5kb的同源臂。它被设计成与BTK引导物G3一起起作用。
ATG-BTK DT-DEL(#1379)(SEQ ID NO:24)
该载体含有密码子优化的BTK cDNA,截短的土拨鼠肝炎病毒转录后调控元件(WPRE3)和SV40聚腺苷酸化信号。该插入片段的两侧均与BTK基因座有0.5kb的同源臂,并特别设计用于BTK指导G3。
实施例6
用CRISPR/Cas或基于TALEN的系统在CD34+ T细胞中的HDR:NHEJ比率。
概述
图7描绘了在RNP与TALEN平台的情况下(当用rAAV6靶向载体共递送时),同源定向修复:非同源末端连接比率的比较。较高的HDR:NHEJ比率是有利的,因为这意味着细胞被引发以使用HDR代替诱变的NHEJ来修复切割。
尽管用两种核酸酶平台实现了高水平的HDR,但与RNP+AAV递送相比,TALEN+AAV的HDR:NHEJ比率更高。
图8A-图8B说明了用RNP和rAAV6 BTK cDNA靶向载体处理的CD34+细胞中的HDR编辑,所述载体被设计用于将密码子优化的BTK cDNA以预测在X-连锁无丙种球蛋白血症(XLA)中容易提供临床益处的水平表达到内源性BTK基因座中。
结果
图7显示了用TALEN+AAV或RNP+AAV编辑的细胞中HDR(同源定向修复)对比NHEJ(非同源性末端结合)的比率的比较。将成人动员的CD34+细胞在补充有TPO、SCF、FLT3L和IL6(100ng/ml)的SCGM培养基中培养48小时,然后使用Neon电穿孔。将细胞用0.5μg的各TALEN单体或2μg的RNP(Cas9:引导比为1:1.2)转染,然后以3%的培养体积进行AAV转导。在第5天从培养的细胞中提取基因组DNA并进行ddPCR以确定HDR比率。
为了评估编辑率,使用在AAV插入物内的正向引物结合和与同源区域之外的BTK基因座结合的反向引物进行“进-出”液滴数字PCR。生成了CCR5基因的类似尺寸的对照扩增子以用作对照。所有反应均一式两份进行。使用QX200 Droplet Generator(Bio-Rad)将PCR反应物分成液滴。使用不含UTP的探针的ddPCR Supermix(Bio-Rad)、900nM引物、250nM探针和50ng基因组DNA进行扩增。使用QuantaSoft软件(Bio-Rad)在QX200 Droplet Digital PCRSystem(Bio-Rad)上分析液滴。另外,扩增切割位点周围的区域,提取凝胶并进行ICE(CRISPR编辑的推断)分析以确定NHEJ率。HDR对比NHEJ的比率绘制在该图上。颜色代表独立的CD34+供体。数据呈现为平均值±SEM。
较高的HDR:NHEJ比率是有利的,因为这意味着细胞被引发以使用HDR代替诱变的NHEJ来修复切割。尽管用RNP平台实现了较高水平的HDR,但与RNP+AAV递送相比,TALEN+AAV的HDR:NHEJ比率相对较高。
图8A-图8B显示了用RNP和rAAV6 BTK cDNA靶向载体处理的CD34+细胞中的HDR编辑,所述载体被设计用于在成功编辑的HSC中表达密码子优化的BTK cDNA。图8A是表达来自内源性启动子的密码子优化的BTK cDNA的rAAV6供体载体的示意图。如前所述培养成人动员的CD34+细胞,然后使用Neon仪器进行电穿孔。用5μg的RNP(Cas9:引导比为1:1.2)转染HSC细胞,然后在600和1200的MOI下进行AAV转导。在第5天从培养的细胞中提取基因组DNA并进行液滴-数字PCR(ddPCR)测定以确定HDR比率。
为了评估编辑率,使用在AAV插入物内的正向引物结合和与同源区域之外的BTK基因座结合的反向引物进行“进-出”液滴数字PCR。生成了CCR5基因的类似尺寸的对照扩增子以用作对照。所有反应均一式两份进行。使用QX200 Droplet Generator(Bio-Rad)将PCR反应物分成液滴。使用不含UTP的探针的ddPCR Supermix(Bio-Rad)、900nM引物、250nM探针和50ng基因组DNA进行扩增。使用QuantaSoft软件(Bio-Rad)在QX200 Droplet Digital PCRSystem(Bio-Rad)上分析液滴。
在图8B中,清楚地显示了来自单个CD34+供体的数据,证明了将BTK cDNA以预测在XLA中容易提供临床益处的水平引入内源性BTK基因座的能力。
表5提供了用于测定使用RNP或TALEN+AAV.MND.GFP载体靶向的CD34+细胞中的HDR的寡核苷酸和探针的列表。
表5
Figure BDA0002827312770000841
表6提供了用于测定使用RNP和表达ATG.coBTK的AAV载体靶向的CD34+细胞中的HDR的寡核苷酸和探针的列表。对照CCR5寡核苷酸/探针与GFP载体相同。
表6
BTK(coBTK)_WPRE3探针 TCCTGGTTAGTTCTTGCCAC SEQ ID NO:33
BTKco_HR正向寡核苷酸 AGAAACTGCCTGGTGAACGAC SEQ ID NO:34
BTKco_HR反向寡核苷酸 CCCCATCTCAGACATTGGTC SEQ ID NO:35
通常,在以下权利要求中,所使用的术语不应被解释为将权利要求限制在本说明书和权利要求中所公开的具体实施方案中,而应被解释为包括所有可能的实施方案以及这些权利要求所授权的等同物的全部范围。因此,权利要求不受本公开内容的限制。
序列表
<110> 西雅图儿童研究所 (Seattle Children's Research Institute)
大卫·J·拉林斯 (Rawlings, David J.)
考特尼·克劳夫 (Clough, Courtnee)
伊兰·F·可汗 (Khan, Iram F.)
<120> 布鲁顿氏酪氨酸激酶的基于TALEN和基于CRISPR/CAS的基因编辑
<130> SECH-001/01WO
<150> US 62/664,035
<151> 2018-04-27
<160> 74
<170> PatentIn version 3.5
<210> 1
<211> 17
<212> DNA
<213> 人类 (Homo sapiens)
<400> 1
tctcgactat gaaaact 17
<210> 2
<211> 16
<212> DNA
<213> 人类 (Homo sapiens)
<400> 2
tctaaggcca agtcct 16
<210> 3
<211> 17
<212> DNA
<213> 人类 (Homo sapiens)
<400> 3
tatcaaggac ttggcct 17
<210> 4
<211> 19
<212> DNA
<213> 人类 (Homo sapiens)
<400> 4
taccaacgaa aatttacct 19
<210> 5
<211> 19
<212> DNA
<213> 人类 (Homo sapiens)
<400> 5
tatttcctag cctataact 19
<210> 6
<211> 18
<212> DNA
<213> 人类 (Homo sapiens)
<400> 6
tggcttctta ggaccttt 18
<210> 7
<211> 16
<212> DNA
<213> 人类 (Homo sapiens)
<400> 7
ccatttgaaa ctaggt 16
<210> 8
<211> 17
<212> DNA
<213> 人类 (Homo sapiens)
<400> 8
cctcatccct cttggtt 17
<210> 9
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 9
agctatggcc gcagtgattc 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 10
aggcgcttct tgaagtttag 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 11
atgagtatga ctttgaacgt 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 12
agggatgagg attaatgtcc 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 13
acactgaatt ggggggggat 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 14
aactaggtag ctaggctgag 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 15
gctttagcta gttataggct 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 16
agaggtaaat tttcgttggt 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 17
gatgcacact gaattggggg 20
<210> 18
<211> 659
<212> PRT
<213> 人类 (Homo sapiens)
<400> 18
Met Ala Ala Val Ile Leu Glu Ser Ile Phe Leu Lys Arg Ser Gln Gln
1 5 10 15
Lys Lys Lys Thr Ser Pro Leu Asn Phe Lys Lys Arg Leu Phe Leu Leu
20 25 30
Thr Val His Lys Leu Ser Tyr Tyr Glu Tyr Asp Phe Glu Arg Gly Arg
35 40 45
Arg Gly Ser Lys Lys Gly Ser Ile Asp Val Glu Lys Ile Thr Cys Val
50 55 60
Glu Thr Val Val Pro Glu Lys Asn Pro Pro Pro Glu Arg Gln Ile Pro
65 70 75 80
Arg Arg Gly Glu Glu Ser Ser Glu Met Glu Gln Ile Ser Ile Ile Glu
85 90 95
Arg Phe Pro Tyr Pro Phe Gln Val Val Tyr Asp Glu Gly Pro Leu Tyr
100 105 110
Val Phe Ser Pro Thr Glu Glu Leu Arg Lys Arg Trp Ile His Gln Leu
115 120 125
Lys Asn Val Ile Arg Tyr Asn Ser Asp Leu Val Gln Lys Tyr His Pro
130 135 140
Cys Phe Trp Ile Asp Gly Gln Tyr Leu Cys Cys Ser Gln Thr Ala Lys
145 150 155 160
Asn Ala Met Gly Cys Gln Ile Leu Glu Asn Arg Asn Gly Ser Leu Lys
165 170 175
Pro Gly Ser Ser His Arg Lys Thr Lys Lys Pro Leu Pro Pro Thr Pro
180 185 190
Glu Glu Asp Gln Ile Leu Lys Lys Pro Leu Pro Pro Glu Pro Ala Ala
195 200 205
Ala Pro Val Ser Thr Ser Glu Leu Lys Lys Val Val Ala Leu Tyr Asp
210 215 220
Tyr Met Pro Met Asn Ala Asn Asp Leu Gln Leu Arg Lys Gly Asp Glu
225 230 235 240
Tyr Phe Ile Leu Glu Glu Ser Asn Leu Pro Trp Trp Arg Ala Arg Asp
245 250 255
Lys Asn Gly Gln Glu Gly Tyr Ile Pro Ser Asn Tyr Val Thr Glu Ala
260 265 270
Glu Asp Ser Ile Glu Met Tyr Glu Trp Tyr Ser Lys His Met Thr Arg
275 280 285
Ser Gln Ala Glu Gln Leu Leu Lys Gln Glu Gly Lys Glu Gly Gly Phe
290 295 300
Ile Val Arg Asp Ser Ser Lys Ala Gly Lys Tyr Thr Val Ser Val Phe
305 310 315 320
Ala Lys Ser Thr Gly Asp Pro Gln Gly Val Ile Arg His Tyr Val Val
325 330 335
Cys Ser Thr Pro Gln Ser Gln Tyr Tyr Leu Ala Glu Lys His Leu Phe
340 345 350
Ser Thr Ile Pro Glu Leu Ile Asn Tyr His Gln His Asn Ser Ala Gly
355 360 365
Leu Ile Ser Arg Leu Lys Tyr Pro Val Ser Gln Gln Asn Lys Asn Ala
370 375 380
Pro Ser Thr Ala Gly Leu Gly Tyr Gly Ser Trp Glu Ile Asp Pro Lys
385 390 395 400
Asp Leu Thr Phe Leu Lys Glu Leu Gly Thr Gly Gln Phe Gly Val Val
405 410 415
Lys Tyr Gly Lys Trp Arg Gly Gln Tyr Asp Val Ala Ile Lys Met Ile
420 425 430
Lys Glu Gly Ser Met Ser Glu Asp Glu Phe Ile Glu Glu Ala Lys Val
435 440 445
Met Met Asn Leu Ser His Glu Lys Leu Val Gln Leu Tyr Gly Val Cys
450 455 460
Thr Lys Gln Arg Pro Ile Phe Ile Ile Thr Glu Tyr Met Ala Asn Gly
465 470 475 480
Cys Leu Leu Asn Tyr Leu Arg Glu Met Arg His Arg Phe Gln Thr Gln
485 490 495
Gln Leu Leu Glu Met Cys Lys Asp Val Cys Glu Ala Met Glu Tyr Leu
500 505 510
Glu Ser Lys Gln Phe Leu His Arg Asp Leu Ala Ala Arg Asn Cys Leu
515 520 525
Val Asn Asp Gln Gly Val Val Lys Val Ser Asp Phe Gly Leu Ser Arg
530 535 540
Tyr Val Leu Asp Asp Glu Tyr Thr Ser Ser Val Gly Ser Lys Phe Pro
545 550 555 560
Val Arg Trp Ser Pro Pro Glu Val Leu Met Tyr Ser Lys Phe Ser Ser
565 570 575
Lys Ser Asp Ile Trp Ala Phe Gly Val Leu Met Trp Glu Ile Tyr Ser
580 585 590
Leu Gly Lys Met Pro Tyr Glu Arg Phe Thr Asn Ser Glu Thr Ala Glu
595 600 605
His Ile Ala Gln Gly Leu Arg Leu Tyr Arg Pro His Leu Ala Ser Glu
610 615 620
Lys Val Tyr Thr Ile Met Tyr Ser Cys Trp His Glu Lys Ala Asp Glu
625 630 635 640
Arg Pro Thr Phe Lys Ile Leu Leu Ser Asn Ile Leu Asp Val Met Asp
645 650 655
Glu Glu Ser
<210> 19
<211> 7209
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体 - AAV靶向载体
<400> 19
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtggga 180
actttatttg tctttctgtg tttcagttac ctaaattgaa tccttctgga gtattgtagg 240
tttggggagg ctaaataagt tgtgtttcat aaatgaacag aggtggcatc tatatcagta 300
agacagttgc atcacttttg catgatgctg tctaaaagaa ctaatttaag ctaaatgggg 360
aaaaggtcag aaaacaacaa ctaccccccc cccaccaaaa cccaccaaaa aaaattatgt 420
tttcaacttt agaacaaatc ttctatcctt tgtagctcag tcagtgggtg tgggcaaaat 480
cagttgggca gcagttagtg tgtgtccaga actgcaggtg cagcctccat atccttatta 540
gttcccttgg ttacagaccc cagtgggaca atgtttgaaa aattatattc accgtctagg 600
aaattgggaa ctgaaagtcc aatatctgcc tcagtggagt tctggcacct gcattatccc 660
ttctgggtat atcaagatca acagctgcac agatactttt gcttttcaca gattctacac 720
atatcatata aaggtgaata gtgtaaagct acctctacac cttaccaagc acacaggtgc 780
gtgccattta acatctagag cattccattg ccttatacaa gaactcagtt tatatgagct 840
cacaacatcg aaccaatccc cccccaattc agtgtgcatc cattatacct gaaacctgac 900
agagctgggg gctgtgggag gaggttggta ggaagaaatt attttgtgag ctgtgcacat 960
ttttgttcca tttgaaacta ggtagctagg ctgaggggga accaagaggg atgaggatta 1020
atgtcctggg tcctcaggaa ctttcattat caacagcaca caggtgaact ccagaaagaa 1080
gaagctatgg ccgcagtgat tctggagagc atctttctga agcgatcccg aacagagaaa 1140
caggagaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 1200
caagaacagt tggaacagca gaatatgggc caaacaggat atctgtggta agcagttcct 1260
gccccggctc agggccaaga acagatggtc cccagatgcg gtcccgccct cagcagtttc 1320
tagagaacca tcagatgttt ccagggtgcc ccaaggacct gaaatgaccc tgtgccttat 1380
ttgaactaac caatcagttc gcttctcgct tctgttcgcg cgcttctgct ccccgagctc 1440
tatataagca gagctcgttt agtgaaccgt cagatcgcct ggagacgcca tccacgctgt 1500
tttgacttcc atagaaggat ctcgaggcca ccatggtgag caagggcgag gagctgttca 1560
ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 1620
tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca 1680
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc 1740
agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1800
ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1860
gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1920
acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1980
acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc 2040
acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 2100
gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca 2160
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 2220
tcactctcgg catggacgag ctgtacaagt aaactagtgt cgactgcttt atttgtgaaa 2280
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2340
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaaaac 2400
agaaaaagaa aacatcacct ctaaacttca agaagcgcct gtttctcttg accgtgcaca 2460
aactctccta ctatgagtat gactttgaac gtggggtaag tttctcgact atgaaaactg 2520
agtttcaaga tatcaaggac ttggccttag atctttcttg gggaagaggt aaattttcgt 2580
tggtaggagg aggggagtag aatggaccta agttctttca aattcagcaa aatatttcct 2640
agcctataac tagctaaagc cggaaagtca aaggtcctaa gaagccacaa ggaaaatatt 2700
accatggaat cttggaattg atgagcactc attaaatgat tgttgaaaat gaaatcgaag 2760
agttggaaat tgcttcctta cttcctatga ggaaggtaca tacagtcatt cactcttcca 2820
tggtatttgc cctccatttg gtagtcatag atttatagat ctggaaggat ttttttttct 2880
tcccccacat gacaggtcct ggtgccacct cactttgttg aatgattaga taacaaaatc 2940
taatcatctg gttgcttaat ccctcttaat ctttctccat tttcttcctc attctacttc 3000
tcagagaaga ggcagtaaga agggttcaat agatgttgag aagatcactt gtgttgaaac 3060
agtggttcct gaaaaaaatc ctcctccaga aagacagatt ccggtaagaa gagaccaatg 3120
tctgagatgg ggaacagcag atttgaagaa atttgcaaca tttaaattct ctgtaaatag 3180
actggtgatg ctgtgcaacg tggaacacgg tcaagtttcc tttaaaaatt cttcactcta 3240
ccatattggt tataaagaat cttagcttct ttccttcata ttcagaacat ctcactaaac 3300
atggaaaatt tgttaacaca aacttttaaa tgatgctata tctagttttc aaactggtca 3360
gagatcattg attttattcc ctcagttctc tcaggatcag atttagaggc ttaagtaagt 3420
ctgaatgtca taatcctagg gctctgctct agagtagata agtagcatgg cgggttaatc 3480
attaactaca aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 3540
ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 3600
gtgagcgagc gagcgcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc 3660
ccaacagttg cgcagcctga atggcgaatg gcgattccgt tgcaatggct ggcggtaata 3720
ttgttctgga tattaccagc aaggccgata gtttgagttc ttctactcag gcaagtgatg 3780
ttattactaa tcaaagaagt attgcgacaa cggttaattt gcgtgatgga cagactcttt 3840
tactcggtgg cctcactgat tataaaaaca cttctcagga ttctggcgta ccgttcctgt 3900
ctaaaatccc tttaatcggc ctcctgttta gctcccgctc tgattctaac gaggaaagca 3960
cgttatacgt gctcgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg 4020
gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 4080
cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 4140
aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 4200
cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 4260
ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 4320
aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 4380
ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt 4440
acaatttaaa tatttgctta tacaatcttc ctgtttttgg ggcttttctg attatcaacc 4500
ggggtacata tgattgacat gctagtttta cgattaccgt tcatcgattc tcttgtttgc 4560
tccagactct caggcaatga cctgatagcc tttgtagaga cctctcaaaa atagctaccc 4620
tctccggcat gaatttatca gctagaacgg ttgaatatca tattgatggt gatttgactg 4680
tctccggcct ttctcacccg tttgaatctt tacctacaca ttactcaggc attgcattta 4740
aaatatatga gggttctaaa aatttttatc cttgcgttga aataaaggct tctcccgcaa 4800
aagtattaca gggtcataat gtttttggta caaccgattt agctttatgc tctgaggctt 4860
tattgcttaa ttttgctaat tctttgcctt gcctgtatga tttattggat gttggaatcg 4920
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 4980
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 5040
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5100
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 5160
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 5220
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 5280
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 5340
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 5400
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 5460
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 5520
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 5580
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 5640
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 5700
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 5760
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 5820
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 5880
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 5940
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 6000
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 6060
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 6120
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 6180
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 6240
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 6300
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 6360
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 6420
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 6480
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 6540
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 6600
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 6660
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 6720
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 6780
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 6840
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 6900
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 6960
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 7020
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 7080
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 7140
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 7200
tcattaatg 7209
<210> 20
<211> 7212
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体 – AAV靶向载体
<400> 20
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtggga 180
actttatttg tctttctgtg tttcagttac ctaaattgaa tccttctgga gtattgtagg 240
tttggggagg ctaaataagt tgtgtttcat aaatgaacag aggtggcatc tatatcagta 300
agacagttgc atcacttttg catgatgctg tctaaaagaa ctaatttaag ctaaatgggg 360
aaaaggtcag aaaacaacaa ctaccccccc cccaccaaaa cccaccaaaa aaaattatgt 420
tttcaacttt agaacaaatc ttctatcctt tgtagctcag tcagtgggtg tgggcaaaat 480
cagttgggca gcagttagtg tgtgtccaga actgcaggtg cagcctccat atccttatta 540
gttcccttgg ttacagaccc cagtgggaca atgtttgaaa aattatattc accgtctagg 600
aaattgggaa ctgaaagtcc aatatctgcc tcagtggagt tctggcacct gcattatccc 660
ttctgggtat atcaagatca acagctgcac agatactttt gcttttcaca gattctacac 720
atatcatata aaggtgaata gtgtaaagct acctctacac cttaccaagc acacaggtgc 780
gtgccattta acatctagag cattccattg ccttatacaa gaactcagtt tatatgagct 840
cacaacatcg aaccaatccc cccccaattc agtgtgcatc cattatacct gaaacctgac 900
agagctgggg gctgtgggag gaggttggta ggaagaaatt attttgtgag ctgtgcacat 960
ttttgttcca tttgaaacta ggtagctagg ctgaggggga accaagaggg atgaggatta 1020
atgtcctggg tcctcaggaa ctttcattat caacagcaca caggtgaact ccagaaagaa 1080
gaagctatgg ccgcagtgat tctggagagc atctttctga agcgatcccg aacagagaaa 1140
caggagaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 1200
caagaacagt tggaacagca gaatatgggc caaacaggat atctgtggta agcagttcct 1260
gccccggctc agggccaaga acagatggtc cccagatgcg gtcccgccct cagcagtttc 1320
tagagaacca tcagatgttt ccagggtgcc ccaaggacct gaaatgaccc tgtgccttat 1380
ttgaactaac caatcagttc gcttctcgct tctgttcgcg cgcttctgct ccccgagctc 1440
tatataagca gagctcgttt agtgaaccgt cagatcgcct ggagacgcca tccacgctgt 1500
tttgacttcc atagaaggat ctcgaggcca ccatggtgag caagggcgag gagctgttca 1560
ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 1620
tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca 1680
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc 1740
agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1800
ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1860
gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1920
acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1980
acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc 2040
acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 2100
gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca 2160
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 2220
tcactctcgg catggacgag ctgtacaagt aaactagtgt cgactgcttt atttgtgaaa 2280
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2340
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaaagc 2400
taaagccgga aagtcaaagg tcctaagaag ccacaaggaa aatattacca tggaatcttg 2460
gaattgatga gcactcatta aatgattgtt gaaaatgaaa tcgaagagtt ggaaattgct 2520
tccttacttc ctatgaggaa ggtacataca gtcattcact cttccatggt atttgccctc 2580
catttggtag tcatagattt atagatctgg aaggattttt ttttcttccc ccacatgaca 2640
ggtcctggtg ccacctcact ttgttgaatg attagataac aaaatctaat catctggttg 2700
cttaatccct cttaatcttt ctccattttc ttcctcattc tacttctcag agaagaggca 2760
gtaagaaggg ttcaatagat gttgagaaga tcacttgtgt tgaaacagtg gttcctgaaa 2820
aaaatcctcc tccagaaaga cagattccgg taagaagaga ccaatgtctg agatggggaa 2880
cagcagattt gaagaaattt gcaacattta aattctctgt aaatagactg gtgatgctgt 2940
gcaacgtgga acacggtcaa gtttccttta aaaattcttc actctaccat attggttata 3000
aagaatctta gcttctttcc ttcatattca gaacatctca ctaaacatgg aaaatttgtt 3060
aacacaaact tttaaatgat gctatatcta gttttcaaac tggtcagaga tcattgattt 3120
tattccctca gttctctcag gatcagattt agaggcttaa gtaagtctga atgtcataat 3180
cctagggctc tgagtcacat gatatccttt aataccttac tatttattct cttctcactt 3240
tccggagcga gagacataaa acctactgat ttttgagttc acttttaaaa aatatatatc 3300
aatttcagta ttttcttttt ttcttttttt tttctttttt tagacagagt ctcgctctgt 3360
tgcccaggct ggaatgcact ggtgccatct tggctcactg caaccttcac ctcccgggtt 3420
caagcaattc tcatgcctca gcctcccaag tctagagtag ataagtagca tggcgggtta 3480
atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3540
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 3600
tcagtgagcg agcgagcgcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 3660
ttcccaacag ttgcgcagcc tgaatggcga atggcgattc cgttgcaatg gctggcggta 3720
atattgttct ggatattacc agcaaggccg atagtttgag ttcttctact caggcaagtg 3780
atgttattac taatcaaaga agtattgcga caacggttaa tttgcgtgat ggacagactc 3840
ttttactcgg tggcctcact gattataaaa acacttctca ggattctggc gtaccgttcc 3900
tgtctaaaat ccctttaatc ggcctcctgt ttagctcccg ctctgattct aacgaggaaa 3960
gcacgttata cgtgctcgtc aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc 4020
gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 4080
gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 4140
ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 4200
aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 4260
cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 4320
ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 4380
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 4440
tttacaattt aaatatttgc ttatacaatc ttcctgtttt tggggctttt ctgattatca 4500
accggggtac atatgattga catgctagtt ttacgattac cgttcatcga ttctcttgtt 4560
tgctccagac tctcaggcaa tgacctgata gcctttgtag agacctctca aaaatagcta 4620
ccctctccgg catgaattta tcagctagaa cggttgaata tcatattgat ggtgatttga 4680
ctgtctccgg cctttctcac ccgtttgaat ctttacctac acattactca ggcattgcat 4740
ttaaaatata tgagggttct aaaaattttt atccttgcgt tgaaataaag gcttctcccg 4800
caaaagtatt acagggtcat aatgtttttg gtacaaccga tttagcttta tgctctgagg 4860
ctttattgct taattttgct aattctttgc cttgcctgta tgatttattg gatgttggaa 4920
tcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatggtg 4980
cactctcagt acaatctgct ctgatgccgc atagttaagc cagccccgac acccgccaac 5040
acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca gacaagctgt 5100
gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag 5160
acgaaagggc ctcgtgatac gcctattttt ataggttaat gtcatgataa taatggtttc 5220
ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt 5280
ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata 5340
atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt 5400
tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc 5460
tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat 5520
ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct 5580
atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca 5640
ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg 5700
catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa 5760
cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg 5820
ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga 5880
cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg 5940
cgaactactt actctagctt cccggcaaca attaatagac tggatggagg cggataaagt 6000
tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg 6060
agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc 6120
ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca 6180
gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc aagtttactc 6240
atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct aggtgaagat 6300
cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 6360
agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 6420
ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 6480
accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct 6540
tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 6600
cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 6660
gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc 6720
gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 6780
gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 6840
cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 6900
tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 6960
ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 7020
ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat 7080
taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc 7140
agtgagcgag gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc 7200
gattcattaa tg 7212
<210> 21
<211> 7114
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体 – AAV靶向载体
<400> 21
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtggga 180
actttatttg tctttctgtg tttcagttac ctaaattgaa tccttctgga gtattgtagg 240
tttggggagg ctaaataagt tgtgtttcat aaatgaacag aggtggcatc tatatcagta 300
agacagttgc atcacttttg catgatgctg tctaaaagaa ctaatttaag ctaaatgggg 360
aaaaggtcag aaaacaacaa ctaccccccc cccaccaaaa cccaccaaaa aaaattatgt 420
tttcaacttt agaacaaatc ttctatcctt tgtagctcag tcagtgggtg tgggcaaaat 480
cagttgggca gcagttagtg tgtgtccaga actgcaggtg cagcctccat atccttatta 540
gttcccttgg ttacagaccc cagtgggaca atgtttgaaa aattatattc accgtctagg 600
aaattgggaa ctgaaagtcc aatatctgcc tcagtggagt tctggcacct gcattatccc 660
ttctgggtat atcaagatca acagctgcac agatactttt gcttttcaca gattctacac 720
atatcatata aaggtgaata gtgtaaagct acctctacac cttaccaagc acacaggtgc 780
gtgccattta acatctagag cattccattg ccttatacaa gaactcagtt tatatgagct 840
cacaacatcg aaccaatccc cccccaattc agtgtgcatc cattatacct gaaacctgac 900
agagctgggg gctgtgggag gaggttggta ggaagaaatt attttgtgag ctgtgcacat 960
ttttgttcca tttgaaacta ggtagctagg ctgaggggga accaagaggg atgaggatta 1020
atgtcctggg tcctcaggaa ctttcattat caacagcaca caggtgaact ccagaaagaa 1080
gaagctatgg ccgcagtgat tctggagagc atctttctga agcgatcccg aacagagaaa 1140
caggagaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 1200
caagaacagt tggaacagca gaatatgggc caaacaggat atctgtggta agcagttcct 1260
gccccggctc agggccaaga acagatggtc cccagatgcg gtcccgccct cagcagtttc 1320
tagagaacca tcagatgttt ccagggtgcc ccaaggacct gaaatgaccc tgtgccttat 1380
ttgaactaac caatcagttc gcttctcgct tctgttcgcg cgcttctgct ccccgagctc 1440
tatataagca gagctcgttt agtgaaccgt cagatcgcct ggagacgcca tccacgctgt 1500
tttgacttcc atagaaggat ctcgaggcca ccatggtgag caagggcgag gagctgttca 1560
ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 1620
tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca 1680
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc 1740
agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1800
ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1860
gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1920
acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1980
acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc 2040
acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 2100
gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca 2160
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 2220
tcactctcgg catggacgag ctgtacaagt aaactagtgt cgactgcttt atttgtgaaa 2280
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2340
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaaggg 2400
gtaagtttct cgactatgaa aactgagttt caagatatca aggacttggc cttagatctt 2460
tcttggggaa gaggtaaatt ttcgttggta ggaggagggg agtagaatgg acctaagttc 2520
tttcaaattc agcaaaatat ttcctagcct ataactagct aaagccggaa agtcaaaggt 2580
cctaagaagc cacaaggaaa atattaccat ggaatcttgg aattgatgag cactcattaa 2640
atgattgttg aaaatgaaat cgaagagttg gaaattgctt ccttacttcc tatgaggaag 2700
gtacatacag tcattcactc ttccatggta tttgccctcc atttggtagt catagattta 2760
tagatctgga aggatttttt tttcttcccc cacatgacag gtcctggtgc cacctcactt 2820
tgttgaatga ttagataaca aaatctaatc atctggttgc ttaatccctc ttaatctttc 2880
tccattttct tcctcattct acttctcaga gaagaggcag taagaagggt tcaatagatg 2940
ttgagaagat cacttgtgtt gaaacagtgg ttcctgaaaa aaatcctcct ccagaaagac 3000
agattccggt aagaagagac caatgtctga gatggggaac agcagatttg aagaaatttg 3060
caacatttaa attctctgta aatagactgg tgatgctgtg caacgtggaa cacggtcaag 3120
tttcctttaa aaattcttca ctctaccata ttggttataa agaatcttag cttctttcct 3180
tcatattcag aacatctcac taaacatgga aaatttgtta acacaaactt ttaaatgatg 3240
ctatatctag ttttcaaact ggtcagagat cattgatttt attccctcag ttctctcagg 3300
atcagattta gaggcttaag taagtctgaa tgtcataatc ctagggctct gctctagagt 3360
agataagtag catggcgggt taatcattaa ctacaaggaa cccctagtga tggagttggc 3420
cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg 3480
cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgccagctgg cgtaatagcg 3540
aagaggcccg caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcgat 3600
tccgttgcaa tggctggcgg taatattgtt ctggatatta ccagcaaggc cgatagtttg 3660
agttcttcta ctcaggcaag tgatgttatt actaatcaaa gaagtattgc gacaacggtt 3720
aatttgcgtg atggacagac tcttttactc ggtggcctca ctgattataa aaacacttct 3780
caggattctg gcgtaccgtt cctgtctaaa atccctttaa tcggcctcct gtttagctcc 3840
cgctctgatt ctaacgagga aagcacgtta tacgtgctcg tcaaagcaac catagtacgc 3900
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 3960
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 4020
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 4080
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 4140
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 4200
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 4260
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 4320
gaattttaac aaaatattaa cgtttacaat ttaaatattt gcttatacaa tcttcctgtt 4380
tttggggctt ttctgattat caaccggggt acatatgatt gacatgctag ttttacgatt 4440
accgttcatc gattctcttg tttgctccag actctcaggc aatgacctga tagcctttgt 4500
agagacctct caaaaatagc taccctctcc ggcatgaatt tatcagctag aacggttgaa 4560
tatcatattg atggtgattt gactgtctcc ggcctttctc acccgtttga atctttacct 4620
acacattact caggcattgc atttaaaata tatgagggtt ctaaaaattt ttatccttgc 4680
gttgaaataa aggcttctcc cgcaaaagta ttacagggtc ataatgtttt tggtacaacc 4740
gatttagctt tatgctctga ggctttattg cttaattttg ctaattcttt gccttgcctg 4800
tatgatttat tggatgttgg aatcgcctga tgcggtattt tctccttacg catctgtgcg 4860
gtatttcaca ccgcatatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa 4920
gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg 4980
catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac 5040
cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt ttataggtta 5100
atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg 5160
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 5220
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 5280
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 5340
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 5400
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 5460
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag 5520
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 5580
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 5640
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 5700
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 5760
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 5820
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 5880
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 5940
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 6000
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 6060
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 6120
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 6180
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 6240
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 6300
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 6360
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 6420
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 6480
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 6540
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 6600
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 6660
aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg 6720
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 6780
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 6840
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 6900
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 6960
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 7020
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccca atacgcaaac 7080
cgcctctccc cgcgcgttgg ccgattcatt aatg 7114
<210> 22
<211> 7209
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体 - AAV靶向载体
<400> 22
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtggga 180
actttatttg tctttctgtg tttcagttac ctaaattgaa tccttctgga gtattgtagg 240
tttggggagg ctaaataagt tgtgtttcat aaatgaacag aggtggcatc tatatcagta 300
agacagttgc atcacttttg catgatgctg tctaaaagaa ctaatttaag ctaaatgggg 360
aaaaggtcag aaaacaacaa ctaccccccc cccaccaaaa cccaccaaaa aaaattatgt 420
tttcaacttt agaacaaatc ttctatcctt tgtagctcag tcagtgggtg tgggcaaaat 480
cagttgggca gcagttagtg tgtgtccaga actgcaggtg cagcctccat atccttatta 540
gttcccttgg ttacagaccc cagtgggaca atgtttgaaa aattatattc accgtctagg 600
aaattgggaa ctgaaagtcc aatatctgcc tcagtggagt tctggcacct gcattatccc 660
ttctgggtat atcaagatca acagctgcac agatactttt gcttttcaca gattctacac 720
atatcatata aaggtgaata gtgtaaagct acctctacac cttaccaagc acacaggtgc 780
gtgccattta acatctagag cattccattg ccttatacaa gaactcagtt tatatgagct 840
cacaacatcg aaccaatccc cccccaattc agtgtgcatc cattatacct gaaacctgac 900
agagctgggg gctgtgggag gaggttggta ggaagaaatt attttgtgag ctgtgcacat 960
ttttgttcca tttgaaacta ggtagctagg ctgaggggga accaagaggg atgaggatta 1020
atgtcctggg tcctcaggaa ctttcattat caacagcaca caggtgaact ccagaaagaa 1080
gaagctatgg ccgcagtgat tctggagagc atctttctga agcgatcccg aacagagaaa 1140
caggagaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 1200
caagaacagt tggaacagca gaatatgggc caaacaggat atctgtggta agcagttcct 1260
gccccggctc agggccaaga acagatggtc cccagatgcg gtcccgccct cagcagtttc 1320
tagagaacca tcagatgttt ccagggtgcc ccaaggacct gaaatgaccc tgtgccttat 1380
ttgaactaac caatcagttc gcttctcgct tctgttcgcg cgcttctgct ccccgagctc 1440
tatataagca gagctcgttt agtgaaccgt cagatcgcct ggagacgcca tccacgctgt 1500
tttgacttcc atagaaggat ctcgaggcca ccatggtgag caagggcgag gagctgttca 1560
ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg 1620
tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca 1680
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc 1740
agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc 1800
ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc 1860
gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg 1920
acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca 1980
acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc 2040
acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg 2100
gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca 2160
aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga 2220
tcactctcgg catggacgag ctgtacaagt aaactagtgt cgactgcttt atttgtgaaa 2280
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2340
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaaaac 2400
agaaaaagaa aacatcacct ctaaacttca agaagcgcct gtttctcttg accgtgcaca 2460
aactctccta ctatgagtat gactttgaac gtggtgtaag tttctcgact atgaaaactg 2520
agtttcaaga tatcaaggac ttggccttag atctttcttg gggaagaggt aaattttcgt 2580
tggtaggagg aggggagtag aatggaccta agttctttca aattcagcaa aatatttcct 2640
agcctataac tagctaaagc cggaaagtca aaggtcctaa gaagccacaa ggaaaatatt 2700
accatggaat cttggaattg atgagcactc attaaatgat tgttgaaaat gaaatcgaag 2760
agttggaaat tgcttcctta cttcctatga ggaaggtaca tacagtcatt cactcttcca 2820
tggtatttgc cctccatttg gtagtcatag atttatagat ctggaaggat ttttttttct 2880
tcccccacat gacaggtcct ggtgccacct cactttgttg aatgattaga taacaaaatc 2940
taatcatctg gttgcttaat ccctcttaat ctttctccat tttcttcctc attctacttc 3000
tcagagaaga ggcagtaaga agggttcaat agatgttgag aagatcactt gtgttgaaac 3060
agtggttcct gaaaaaaatc ctcctccaga aagacagatt ccggtaagaa gagaccaatg 3120
tctgagatgg ggaacagcag atttgaagaa atttgcaaca tttaaattct ctgtaaatag 3180
actggtgatg ctgtgcaacg tggaacacgg tcaagtttcc tttaaaaatt cttcactcta 3240
ccatattggt tataaagaat cttagcttct ttccttcata ttcagaacat ctcactaaac 3300
atggaaaatt tgttaacaca aacttttaaa tgatgctata tctagttttc aaactggtca 3360
gagatcattg attttattcc ctcagttctc tcaggatcag atttagaggc ttaagtaagt 3420
ctgaatgtca taatcctagg gctctgctct agagtagata agtagcatgg cgggttaatc 3480
attaactaca aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 3540
ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 3600
gtgagcgagc gagcgcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc 3660
ccaacagttg cgcagcctga atggcgaatg gcgattccgt tgcaatggct ggcggtaata 3720
ttgttctgga tattaccagc aaggccgata gtttgagttc ttctactcag gcaagtgatg 3780
ttattactaa tcaaagaagt attgcgacaa cggttaattt gcgtgatgga cagactcttt 3840
tactcggtgg cctcactgat tataaaaaca cttctcagga ttctggcgta ccgttcctgt 3900
ctaaaatccc tttaatcggc ctcctgttta gctcccgctc tgattctaac gaggaaagca 3960
cgttatacgt gctcgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg 4020
gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 4080
cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 4140
aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 4200
cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 4260
ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 4320
aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 4380
ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt 4440
acaatttaaa tatttgctta tacaatcttc ctgtttttgg ggcttttctg attatcaacc 4500
ggggtacata tgattgacat gctagtttta cgattaccgt tcatcgattc tcttgtttgc 4560
tccagactct caggcaatga cctgatagcc tttgtagaga cctctcaaaa atagctaccc 4620
tctccggcat gaatttatca gctagaacgg ttgaatatca tattgatggt gatttgactg 4680
tctccggcct ttctcacccg tttgaatctt tacctacaca ttactcaggc attgcattta 4740
aaatatatga gggttctaaa aatttttatc cttgcgttga aataaaggct tctcccgcaa 4800
aagtattaca gggtcataat gtttttggta caaccgattt agctttatgc tctgaggctt 4860
tattgcttaa ttttgctaat tctttgcctt gcctgtatga tttattggat gttggaatcg 4920
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 4980
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 5040
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5100
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 5160
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 5220
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 5280
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 5340
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 5400
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 5460
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 5520
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 5580
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 5640
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 5700
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 5760
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 5820
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 5880
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 5940
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 6000
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 6060
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 6120
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 6180
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 6240
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 6300
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 6360
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 6420
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 6480
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 6540
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 6600
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 6660
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 6720
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 6780
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 6840
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 6900
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 6960
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 7020
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 7080
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 7140
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 7200
tcattaatg 7209
<210> 23
<211> 6050
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体 – AAV靶向载体
<400> 23
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtattc 180
accgtctagg aaattgggaa ctgaaagtcc aatatctgcc tcagtggagt tctggcacct 240
gcattatccc ttctgggtat atcaagatca acagctgcac agatactttt gcttttcaca 300
gattctacac atatcatata aaggtgaata gtgtaaagct acctctacac cttaccaagc 360
acacaggtgc gtgccattta acatctagag cattccattg ccttatacaa gaactcagtt 420
tatatgagct cacaacatcg aaccaatccc cccccaattc agtgtgcatc cattatacct 480
gaaacctgac agagctgggg gctgtgggag gaggttggta ggaagaaatt attttgtgag 540
ctgtgcacat ttttgttcca tttgaaacta ggtagctagg ctgaggggga accaagaggg 600
atgaggatta atgtcctggg tcctcaggaa ctttcattat caacagcaca caggtgaact 660
ccagaaagaa gaagctatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat 720
cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga 780
gggcgatgcc acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc 840
cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta 900
ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca 960
ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt 1020
cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg 1080
caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc 1140
cgacaagcag aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg 1200
cagcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct 1260
gctgcccgac aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa 1320
gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga 1380
cgagctgtac aagtaagata atcaacctct ggattacaaa atttgtgaaa gattgactgg 1440
tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta 1500
tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttagt 1560
tcttgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 1620
gttgggcact gacaattccg tggactagtg tcgactgctt tatttgtgaa atttgtgatg 1680
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 1740
ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagg ggtaagtttc 1800
tcgactatga aaactgagtt tcaagatatc aaggacttgg ccttagatct ttcttgggga 1860
agaggtaaat tttcgttggt aggaggaggg gagtagaatg gacctaagtt ctttcaaatt 1920
cagcaaaata tttcctagcc tataactagc taaagccgga aagtcaaagg tcctaagaag 1980
ccacaaggaa aatattacca tggaatcttg gaattgatga gcactcatta aatgattgtt 2040
gaaaatgaaa tcgaagagtt ggaaattgct tccttacttc ctatgaggaa ggtacataca 2100
gtcattcact cttccatggt atttgccctc catttggtag tcatagattt atagatctgg 2160
aaggattttt ttttcttccc ccacatgaca ggtcctggtg ccacctcact ttgttgaatg 2220
attagataac aaaatctaat catctggttg cttaatccct cttaatcttt ctccattttc 2280
ttcctcattc tagagtagat aagtagcatg gcgggttaat cattaactac aaggaacccc 2340
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 2400
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgcc 2460
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 2520
aatggcgaat ggcgattccg ttgcaatggc tggcggtaat attgttctgg atattaccag 2580
caaggccgat agtttgagtt cttctactca ggcaagtgat gttattacta atcaaagaag 2640
tattgcgaca acggttaatt tgcgtgatgg acagactctt ttactcggtg gcctcactga 2700
ttataaaaac acttctcagg attctggcgt accgttcctg tctaaaatcc ctttaatcgg 2760
cctcctgttt agctcccgct ctgattctaa cgaggaaagc acgttatacg tgctcgtcaa 2820
agcaaccata gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 2880
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 2940
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 3000
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 3060
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 3120
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 3180
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 3240
aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttaa atatttgctt 3300
atacaatctt cctgtttttg gggcttttct gattatcaac cggggtacat atgattgaca 3360
tgctagtttt acgattaccg ttcatcgatt ctcttgtttg ctccagactc tcaggcaatg 3420
acctgatagc ctttgtagag acctctcaaa aatagctacc ctctccggca tgaatttatc 3480
agctagaacg gttgaatatc atattgatgg tgatttgact gtctccggcc tttctcaccc 3540
gtttgaatct ttacctacac attactcagg cattgcattt aaaatatatg agggttctaa 3600
aaatttttat ccttgcgttg aaataaaggc ttctcccgca aaagtattac agggtcataa 3660
tgtttttggt acaaccgatt tagctttatg ctctgaggct ttattgctta attttgctaa 3720
ttctttgcct tgcctgtatg atttattgga tgttggaatc gcctgatgcg gtattttctc 3780
cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct 3840
gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc gccctgacgg 3900
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 3960
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct cgtgatacgc 4020
ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg tggcactttt 4080
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 4140
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 4200
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 4260
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 4320
gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 4380
gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 4440
attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 4500
gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 4560
agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 4620
ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 4680
cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 4740
gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4800
cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4860
gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4920
ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4980
acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 5040
ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 5100
aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc 5160
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 5220
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 5280
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5340
actggcttca gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc 5400
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5460
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 5520
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 5580
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 5640
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 5700
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 5760
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 5820
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 5880
tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat 5940
accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag 6000
cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg 6050
<210> 24
<211> 5908
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 人工序列 - AAV靶向载体
<400> 24
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120
actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac acgcgtattc 180
accgtctagg aaattgggaa ctgaaagtcc aatatctgcc tcagtggagt tctggcacct 240
gcattatccc ttctgggtat atcaagatca acagctgcac agatactttt gcttttcaca 300
gattctacac atatcatata aaggtgaata gtgtaaagct acctctacac cttaccaagc 360
acacaggtgc gtgccattta acatctagag cattccattg ccttatacaa gaactcagtt 420
tatatgagct cacaacatcg aaccaatccc cccccaattc agtgtgcatc cattatacct 480
gaaacctgac agagctgggg gctgtgggag gaggttggta ggaagaaatt attttgtgag 540
ctgtgcacat ttttgttcca tttgaaacta ggtagctagg ctgaggggga accaagaggg 600
atgaggatta atgtcctggg tcctcaggaa ctttcattat caacagcaca caggtgaact 660
ccagaaagaa gaagctatgg ccgccgtgat cctggaaagc atcttcctga agcggagcca 720
gcagaagaag aaaaccagcc ccctgaactt caagaagcgg ctgttcctgc tgaccgtgca 780
caagctgtcc tactacgagt acgacttcga gcggggcaga cggggcagca agaagggcag 840
catcgacgtc gagaagatca cctgcgtgga gaccgtggtg cccgagaaga acccccctcc 900
cgagcggcag atccccagac ggggcgagga aagcagcgag atggaacaga tcagcatcat 960
cgagcggttc ccttacccat tccaagtggt gtacgacgag ggccccctgt acgtgttcag 1020
ccccaccgag gaactgcgga agcggtggat tcaccagctg aagaacgtga tccggtacaa 1080
cagcgacctg gtgcagaagt accacccctg cttttggatc gacggccagt acctgtgctg 1140
cagccagacc gccaagaacg ctatgggctg ccagattctg gaaaaccgga acggcagcct 1200
gaagcccggc agcagccaca gaaagaccaa gaagcccctg ccccccaccc ccgaagagga 1260
ccagatcctg aagaagcctc tgcctcccga gcccgccgct gcacctgtga gcaccagcga 1320
gctgaagaaa gtggtggccc tgtacgacta catgcccatg aacgccaacg acctgcagct 1380
gcggaagggc gacgagtact tcatcctgga agaaagcaac ctgccctggt ggcgggccag 1440
ggacaagaac ggccaggaag gctacatccc cagcaactac gtgaccgagg ccgaggactc 1500
catcgagatg tacgagtggt acagcaagca catgaccaga agccaggccg aacagctgct 1560
gaagcaggaa ggcaaagagg gcggcttcat cgtccgggac agcagcaagg ccggcaagta 1620
caccgtgagc gtgttcgcca agagcaccgg cgacccccag ggcgtgatcc ggcactacgt 1680
ggtgtgcagc accccccaga gccagtacta cctggccgag aagcacctgt tcagcaccat 1740
ccccgagctg atcaactatc accagcacaa cagcgctgga ctgatttctc ggctgaagta 1800
ccccgtgtcc cagcagaaca aaaacgcccc cagcacagcc ggcctgggct acggcagctg 1860
ggagatcgac cccaaggacc tgaccttcct gaaagagctg ggcaccggcc agttcggcgt 1920
ggtgaagtac ggcaagtgga ggggccagta cgacgtggcc atcaagatga tcaaggaagg 1980
cagcatgagc gaggacgagt tcatcgagga agccaaagtg atgatgaacc tgagccacga 2040
gaagctggtg cagctgtacg gcgtgtgcac caagcagcgg cccatcttca tcatcaccga 2100
gtacatggcc aacggctgcc tgctgaacta cctgcgggag atgcggcaca ggttccagac 2160
acagcagctg ctcgaaatgt gcaaggacgt gtgcgaggct atggaatacc tggaatccaa 2220
gcagttcctg caccgggacc tggccgccag aaactgcctg gtgaacgacc agggggtggt 2280
gaaggtgtcc gacttcggcc tgagcagata cgtgctggac gacgagtaca ccagcagcgt 2340
gggcagcaag ttccccgtgc ggtggagccc ccctgaggtg ctgatgtaca gcaagttcag 2400
cagcaagagc gacatctggg ccttcggcgt gctgatgtgg gagatctaca gcctgggcaa 2460
gatgccctac gagcggttca ccaacagcga gaccgccgag cacatcgccc agggcctgcg 2520
gctgtacagg ccccacctgg ccagcgagaa ggtgtacacc atcatgtaca gctgctggca 2580
cgagaaggcc gacgagaggc ccaccttcaa gatcctgctg tccaacatcc tggacgtgat 2640
ggacgaggaa agctgagata atcaacctct ggattacaaa atttgtgaaa gattgactgg 2700
tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta 2760
tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttagt 2820
tcttgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 2880
gttgggcact gacaattccg tggactagtg tcgactgctt tatttgtgaa atttgtgatg 2940
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 3000
ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagg ggtaagtttc 3060
tcgactatga aaactgagtt tcaagatatc aaggacttgg ccttagatct ttcttgggga 3120
agaggtaaat tttcgttggt aggaggaggg gagtagaatg gacctaagtt ctttcaaatt 3180
cagcaaaata tttcctagcc tataactagc taaagccgga aagtcaaagg tcctaagaag 3240
ccacaaggaa aatattacca tggaatcttg gaattgatga gcactcatta aatgattgtt 3300
gaaaatgaaa tcgaagagtt ggaaattgct tccttacttc ctatgaggaa ggtacataca 3360
gtcattcact cttccatggt atttgccctc catttggtag tcatagattt atagatctgg 3420
aaggattttt ttttcttccc ccacatgaca ggtcctggtg ccacctcact ttgttgaatg 3480
attagataac aaaatctaat catctggttg cttaatccct cttaatcttt ctccattttc 3540
ttcctcattc tagagtagat aagtagcatg gcgggttaat cattaactac aaggaacccc 3600
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3660
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgcc 3720
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 3780
aatggcgaat ggcgattccg ttgcaatggc tggcggtaat attgttctgg atattaccag 3840
caaggccgat agtttgagtt cttctactca ggcaagtgat gttattacta atcaaagaag 3900
tattgcgaca acggttaatt tgcgtgatgg acagactctt ttactcggtg gcctcactga 3960
ttataaaaac acttctcagg attctggcgt accgttcctg tctaaaatcc ctttaatcgg 4020
cctcctgttt agctcccgct ctgattctaa cgaggaaagc acgttatacg tgctcgtcaa 4080
agcaaccata gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 4140
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 4200
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 4260
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 4320
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 4380
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 4440
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 4500
aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttaa atatttgctt 4560
atacaatctt cctgtttttg gggcttttct gattatcaac cggggtacat atgattgaca 4620
tgctagtttt acgattaccg ttcatcgatt ctcttgtttg ctccagactc tcaggcaatg 4680
acctgatagc ctttgtagag acctctcaaa aatagctacc ctctccggca tgaatttatc 4740
agctagaacg gttgaatatc atattgatgg tgatttgact gtctccggcc tttctcaccc 4800
gtttgaatct ttacctacac attactcagg cattgcattt aaaatatatg agggttctaa 4860
aaatttttat ccttgcgttg aaataaaggc ttctcccgca aaagtattac agggtcataa 4920
tgtttttggt acaaccgatt tagctttatg ctctgaggct ttattgctta attttgctaa 4980
ttctttgcct tgcctgtatg atttattgga tgttggaatc gcctgatgcg gtattttctc 5040
cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct 5100
gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc gccctgacgg 5160
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 5220
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct cgtgatacgc 5280
ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg tggcactttt 5340
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 5400
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 5460
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 5520
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 5580
gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 5640
gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 5700
attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 5760
gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 5820
agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 5880
ggaccgaagg agctaaccgc ttttttgc 5908
<210> 25
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 25
gagcaaagac cccaacgaga 20
<210> 26
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 26
aggttttatg tctctcgctc cg 22
<210> 27
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 27
gcatggacga gctgtacaag 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 28
atggtcagac ccagtgggtg 20
<210> 29
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 29
tgacaggtcc tggtgccacc t 21
<210> 30
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 30
aaagatttgc agagagatga gt 22
<210> 31
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 31
gccaagcaat gaagttttgt 20
<210> 32
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 32
cctgggcaac atagtgtgat c 21
<210> 33
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 33
tcctggttag ttcttgccac 20
<210> 34
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 34
agaaactgcc tggtgaacga c 21
<210> 35
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 35
ccccatctca gacattggtc 20
<210> 36
<211> 5
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 36
Asp Gly Gly Gly Ser
1 5
<210> 37
<211> 5
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 37
Thr Gly Glu Lys Pro
1 5
<210> 38
<211> 4
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 38
Gly Gly Arg Arg
1
<210> 39
<211> 5
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 39
Gly Gly Gly Gly Ser
1 5
<210> 40
<211> 14
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 40
Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp
1 5 10
<210> 41
<211> 18
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 41
Lys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser
1 5 10 15
Leu Asp
<210> 42
<211> 8
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 42
Gly Gly Arg Arg Gly Gly Gly Ser
1 5
<210> 43
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 43
Leu Arg Gln Arg Asp Gly Glu Arg Pro
1 5
<210> 44
<211> 12
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 44
Leu Arg Gln Lys Asp Gly Gly Gly Ser Glu Arg Pro
1 5 10
<210> 45
<211> 16
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 示例性接头序列
<400> 45
Leu Arg Gln Lys Asp Gly Gly Gly Ser Gly Gly Gly Ser Glu Arg Pro
1 5 10 15
<210> 46
<211> 7
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> TEV蛋白酶的切割序列
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa是任意氨基酸
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa是任意氨基酸
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa = Gly或Ser
<400> 46
Glu Xaa Xaa Tyr Xaa Gln Xaa
1 5
<210> 47
<211> 7
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> TEV蛋白酶的切割序列
<400> 47
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 48
<211> 7
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> TEV蛋白酶的切割序列
<400> 48
Glu Asn Leu Tyr Phe Gln Ser
1 5
<210> 49
<211> 22
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 49
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 50
<211> 19
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 50
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 51
<211> 14
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 51
Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
1 5 10
<210> 52
<211> 21
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 52
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 53
<211> 18
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 53
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 54
<211> 13
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 54
Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
1 5 10
<210> 55
<211> 23
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 55
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 56
<211> 20
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 56
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 57
<211> 14
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 57
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 58
<211> 25
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 58
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 59
<211> 22
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 59
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 60
<211> 14
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 60
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 61
<211> 19
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 61
Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210> 62
<211> 19
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 62
Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210> 63
<211> 14
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 63
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210> 64
<211> 17
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 64
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
1 5 10 15
Pro
<210> 65
<211> 20
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 65
Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 66
<211> 24
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 66
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
1 5 10 15
Asp Val Glu Ser Asn Pro Gly Pro
20
<210> 67
<211> 40
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 67
Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro
1 5 10 15
Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys
20 25 30
Ile Val Ala Pro Val Lys Gln Thr
35 40
<210> 68
<211> 18
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 68
Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro
1 5 10 15
Gly Pro
<210> 69
<211> 40
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 69
Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val
1 5 10 15
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
20 25 30
Asp Val Glu Ser Asn Pro Gly Pro
35 40
<210> 70
<211> 33
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 包括2A位点的自切割多肽
<400> 70
Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu
1 5 10 15
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
20 25 30
Pro
<210> 71
<211> 10
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 共有Kozak序列
<400> 71
gccrccatgg 10
<210> 72
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 72
agctaaagcc ggaaagtc 18
<210> 73
<211> 23
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 73
atgagtatga ctttgaacgt ggt 23
<210> 74
<211> 14
<212> DNA
<213> 人工序列 (Artificial Sequence)
<220>
<223> 合成的构建体
<400> 74
gggggtaagt ttct 14

Claims (43)

1.基因编辑组合物,其包含切割人布鲁顿氏酪氨酸激酶(BTK)基因中的靶位点的TALEN。
2.如权利要求1所述的基因编辑组合物,其中所述TALEN包含具有选自以下的RVD的TAL效应子结构域:
Figure FDA0002827312760000011
其中所述TAL效应子结构域能够结合靶位点T1、T2、T3或T4。
3.基因编辑组合物,其包含:
a)Cas蛋白或编码Cas蛋白的多核苷酸;
b)引导-RNA(gRNA);和
c)包含功能性BTK基因或其片段的修复模板;
其中所述基因编辑系统能够修复B细胞中的内源性BTK基因或将功能性BTK基因插入至B细胞的基因组中。
4.如权利要求3所述的基因编辑组合物,其中所述gRNA包含SEQ ID NO:9至17所示的核苷酸序列。
5.多核苷酸,其编码权利要求1至4中任一项所述的基因编辑组合物。
6.mRNA,其编码权利要求1至4中任一项所述的基因编辑组合物。
7.cDNA,其编码权利要求1至4中任一项所述的基因编辑组合物。
8.载体,其包含编码权利要求1至4中任一项所述的基因编辑组合物的多核苷酸。
9.细胞,其包含权利要求1至4中任一项所述的基因编辑组合物。
10.细胞,其包含编码权利要求1至4中任一项所述的基因编辑组合物的多核苷酸。
11.细胞,其包含权利要求8所述的载体。
12.细胞,其包含由权利要求1至4中任一项所述的基因编辑组合物引入的一种或多种基因组修饰。
13.如权利要求9至12中任一项所述的细胞,其中所述细胞是造血细胞。
14.如权利要求9至13中任一项所述的细胞,其中所述细胞是造血干细胞或祖细胞。
15.如权利要求9至14中任一项所述的细胞,其中所述细胞是CD34+细胞。
16.如权利要求9至15中任一项所述的细胞,其中所述细胞是CD133+细胞。
17.组合物,其包含权利要求9至16中任一项所述的细胞。
18.组合物,其包含权利要求9至16中任一项所述的细胞和生理上可接受的载体。
19.编辑细胞中的BTK基因的方法,其包括:将权利要求1至4中任一项所述的基因编辑组合物、权利要求5所述的多核苷酸或权利要求8所述的载体;以及供体修复模板引入至所述细胞中,其中所述基因编辑组合物的表达在BTK基因中的靶位点处产生了双链断裂,并且所述供体修复模板通过双链断裂(DSB)的位点处同源介导的修复(HDR)掺入所述BTK基因中。
20.如权利要求19所述的方法,其中所述BTK基因包含导致X-连锁的无丙种球蛋白血症(XLA)的一种或多种氨基酸突变或缺失。
21.如权利要求19或权利要求20所述的方法,其中所述细胞是造血细胞。
22.如权利要求19至21中任一项所述的方法,其中所述细胞是造血干细胞或祖细胞。
23.如权利要求19至22中任一项所述的方法,其中所述细胞是CD34+细胞。
24.如权利要求19至23中任一项所述的方法,其中所述细胞是CD133+细胞。
25.如权利要求19至24中任一项所述的方法,其中编码所述多肽的多核苷酸是mRNA。
26.如权利要求19至25中任一项所述的方法,其中将编码5′-3′外切核酸酶的多核苷酸引入所述细胞中。
27.如权利要求19至26中任一项所述的方法,其中将编码Trex2或其生物活性片段的多核苷酸引入所述细胞中。
28.如权利要求19至27中任一项所述的方法,其中所述供体修复模板包含与所述DSB的BTK基因序列5′同源的5′同源臂、供体多核苷酸和与所述DSB的BTK基因序列3′同源的3′同源臂。
29.如权利要求28所述的方法,其中所述供体多核苷酸经设计以修复所述BTK基因中的一种或多种氨基酸突变或缺失。
30.如权利要求28所述的方法,其中所述供体多核苷酸包含编码BTK多肽的cDNA。
31.如权利要求28所述的方法,其中所述供体多核苷酸包括表达盒,所述表达盒包含可操作地连接至编码BTK多肽的cDNA的启动子。
32.如权利要求28至31中任一项所述的方法,其中所述5′同源臂和所述3′同源臂的长度独立地选自约100bp至约2500bp。
33.如权利要求28至31中任一项所述的方法,其中所述5′同源臂和所述3′同源臂的长度独立地选自约600bp至约1500bp。
34.如权利要求28至33中任一项所述的方法,其中所述5′同源臂为约1500bp并且所述3′同源臂为约1000bp。
35.如权利要求28至34中任一项所述的方法,其中所述5′同源臂为约600bp并且所述3′同源臂为约600bp。
36.如权利要求28至35中任一项所述的方法,其中病毒载体用于将所述供体修复模板引入至所述细胞中。
37.如权利要求36所述的方法,其中所述病毒载体是重组腺相关病毒载体(rAAV)或逆转录病毒。
38.如权利要求37所述的方法,其中所述rAAV具有来自AAV2的一个或多个ITR。
39.如权利要求37或权利要求38所述的方法,其中所述rAAV具有选自以下的血清型:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和AAV10。
40.如权利要求37至39中任一项所述的方法,其中所述rAAV具有AAV2或AAV6血清型。
41.如权利要求36所述的方法,其中所述逆转录病毒是慢病毒。
42.如权利要求41所述的方法,其中所述慢病毒是整合酶缺陷型慢病毒(IDLV)。
43.治疗、预防或缓解X-连锁无丙种球蛋白血症(XLA)或与其相关的病况的至少一种症状的方法,所述方法包括从受试者中收获细胞群;根据权利要求19至42中任一项所述的方法编辑所述细胞群,以及施用经编辑的细胞群至所述受试者。
CN201980038650.6A 2018-04-27 2019-04-26 布鲁顿氏酪氨酸激酶的基于talen和基于crispr/cas的基因编辑 Pending CN112469823A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862664035P 2018-04-27 2018-04-27
US62/664,035 2018-04-27
PCT/US2019/029417 WO2019210216A2 (en) 2018-04-27 2019-04-26 Talen-based and crispr/cas-based gene editing for bruton's tyrosine kinase

Publications (1)

Publication Number Publication Date
CN112469823A true CN112469823A (zh) 2021-03-09

Family

ID=68293656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980038650.6A Pending CN112469823A (zh) 2018-04-27 2019-04-26 布鲁顿氏酪氨酸激酶的基于talen和基于crispr/cas的基因编辑

Country Status (7)

Country Link
US (1) US20220064651A1 (zh)
EP (1) EP3784029A4 (zh)
JP (1) JP2021521838A (zh)
CN (1) CN112469823A (zh)
AU (1) AU2019260754A1 (zh)
CA (1) CA3098435A1 (zh)
WO (1) WO2019210216A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110785179A (zh) * 2017-04-21 2020-02-11 西雅图儿童医院(Dba西雅图儿童研究所) Wiskott-Aldrich综合征和X连锁血小板减少症中的治疗性基因组编辑

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019232253A1 (en) * 2018-05-30 2019-12-05 The Regents Of The University Of California Gene editing of monogenic disorders in human hematopoietic stem cells -- correction of x-linked agammaglobulinemia (xla)
GB2611929B (en) 2018-10-16 2023-11-22 Blueallele Corp Methods for targeted insertion of DNA in genes
WO2023192936A2 (en) * 2022-03-30 2023-10-05 Fred Hutchinson Cancer Center Systems and methods to produce b cells that express selected antibodies and gene products

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013009525A1 (en) * 2011-07-08 2013-01-17 Cellectis S.A. Method for increasing the efficiency of double-strand break-induced mutagenssis
CA2865129A1 (en) * 2012-02-24 2013-08-29 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies
WO2014167494A1 (en) * 2013-04-09 2014-10-16 Alma Mater Studiorum - Universita' Di Bologna Molecular signature and its uses as diagnostic agent
CN105531372A (zh) * 2013-06-14 2016-04-27 塞尔克蒂斯股份有限公司 植物中非转基因基因组编辑方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013009525A1 (en) * 2011-07-08 2013-01-17 Cellectis S.A. Method for increasing the efficiency of double-strand break-induced mutagenssis
US20140234975A1 (en) * 2011-07-08 2014-08-21 Cellectis Method for increasing the efficiency of double-strand-break induced mutagenesis
CA2865129A1 (en) * 2012-02-24 2013-08-29 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies
CN104284669A (zh) * 2012-02-24 2015-01-14 弗雷德哈钦森癌症研究中心 治疗血红蛋白病的组合物和方法
WO2014167494A1 (en) * 2013-04-09 2014-10-16 Alma Mater Studiorum - Universita' Di Bologna Molecular signature and its uses as diagnostic agent
CN105531372A (zh) * 2013-06-14 2016-04-27 塞尔克蒂斯股份有限公司 植物中非转基因基因组编辑方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ALEXANDRE JUILLERAT ET AL.: ""Optimized tuning of TALEN specificity using non-conventional RVDs"", 《SCIENTIFIC REPORTS》, vol. 5, pages 1 - 7 *
COURTNEE CLOUGH ET AL.: ""Targeting the BTK Locus in Primary Human Hematopoietic Cells with TALENs and AAV Donor Template"", 《MOLECULAR THERAPY》, vol. 24, no. 1, pages 54 *
金征宇 等: "《基因与纳米探针:医药分子成像理论与实践》", vol. 1, 天津科学技术出版社, pages: 521 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110785179A (zh) * 2017-04-21 2020-02-11 西雅图儿童医院(Dba西雅图儿童研究所) Wiskott-Aldrich综合征和X连锁血小板减少症中的治疗性基因组编辑

Also Published As

Publication number Publication date
WO2019210216A9 (en) 2020-03-19
CA3098435A1 (en) 2019-10-31
JP2021521838A (ja) 2021-08-30
WO2019210216A3 (en) 2019-12-12
EP3784029A4 (en) 2022-04-20
US20220064651A1 (en) 2022-03-03
WO2019210216A2 (en) 2019-10-31
AU2019260754A1 (en) 2020-11-26
EP3784029A2 (en) 2021-03-03

Similar Documents

Publication Publication Date Title
KR102386029B1 (ko) 게놈 편집 면역 효과기 세포
US20230174967A1 (en) Donor repair templates multiplex genome editing
KR102451510B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
CN112469823A (zh) 布鲁顿氏酪氨酸激酶的基于talen和基于crispr/cas的基因编辑
CN113271955A (zh) 用于细胞介导的溶瘤病毒疗法的增强的系统
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
CN112218882A (zh) Foxp3在经编辑的cd34+细胞中的表达
KR20140060541A (ko) 암을 치료하기 위한 rna 조작된 t 세포
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
CN110551713A (zh) 用于修饰梭状芽孢杆菌属细菌的优化的遗传工具
KR20210005179A (ko) 헤모글로빈-관련 돌연변이를 편집하기 위한 상동성-지정 복구 주형 설계 및 전달
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
CN110785179A (zh) Wiskott-Aldrich综合征和X连锁血小板减少症中的治疗性基因组编辑
KR20220130093A (ko) 오토펄린 듀얼 벡터 시스템을 사용한 감각신경성 난청을 치료하기 위한 조성물 및 방법
KR20240004253A (ko) 오토펄린 듀얼 벡터 시스템을 사용한 감각신경성 난청을 치료하기 위한 방법
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
CN113614229A (zh) 遗传修饰的梭菌属细菌、其制备和用途
RU2781083C2 (ru) Варианты, композиции и методы применения хоминг-эндонуклеазы pd-1
US20210230565A1 (en) Bruton&#39;s tyrosine kinase homing endonuclease variants, compositions, and methods of use
KR20240022575A (ko) 아머링된 키메라 수용체 및 이의 사용 방법
CA3229923A1 (en) Enzymatically methylated dna and methods of production and therapeutic use
CN114286857A (zh) 用于修饰细菌的优化的遗传工具

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination