CN110248957B - 经人工操纵的sc功能控制系统 - Google Patents

经人工操纵的sc功能控制系统 Download PDF

Info

Publication number
CN110248957B
CN110248957B CN201780083263.5A CN201780083263A CN110248957B CN 110248957 B CN110248957 B CN 110248957B CN 201780083263 A CN201780083263 A CN 201780083263A CN 110248957 B CN110248957 B CN 110248957B
Authority
CN
China
Prior art keywords
domain
nucleic acid
sequence
complementary
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780083263.5A
Other languages
English (en)
Other versions
CN110248957A (zh
Inventor
金奭中
宋东佑
洪永彬
崔炳玉
李宰荣
李贞慜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toolgen Inc
Original Assignee
Toolgen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toolgen Inc filed Critical Toolgen Inc
Publication of CN110248957A publication Critical patent/CN110248957A/zh
Application granted granted Critical
Publication of CN110248957B publication Critical patent/CN110248957B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/30Nerves; Brain; Eyes; Corneal cells; Cerebrospinal fluid; Neuronal stem cells; Neuronal precursor cells; Glial cells; Oligodendrocytes; Schwann cells; Astroglia; Astrocytes; Choroid plexus; Spinal cord tissue
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Toxicology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Neurosurgery (AREA)
  • Ophthalmology & Optometry (AREA)
  • Neurology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Nitrogen And Oxygen Or Sulfur-Condensed Heterocyclic Ring Systems (AREA)

Abstract

本发明涉及经人工操纵的SC功能控制因子及其用途,所述经人工操纵的SC功能控制因子用于SC功能控制和/或治疗或减轻由SC功能紊乱引起的疾病。更具体而言,本发明涉及能够进行人工SC功能控制和/或治疗或减轻由SC功能紊乱引起的疾病的系统,所述系统包括:经人工操纵的SC功能控制因子,该经人工操纵的SC功能控制因子用于SC功能控制和/或治疗或缓解由SC功能紊乱引起的疾病;和/或组合物,该组合物能够人工操纵SC功能控制因子。在一个具体方面,本发明涉及SC功能控制因子(例如经人工操纵的PMP22)的SC功能控制系统,和/或其表达产物。

Description

经人工操纵的SC功能控制系统
技术领域
本发明涉及经人工操纵的SC功能控制因子及其用途,所述经人工操纵的SC功能控制因子用于SC功能控制和/或治疗或减轻由SC功能紊乱引起的疾病。更具体而言,本发明涉及能够进行人工SC功能控制和/或治疗或减轻由SC功能紊乱引起的疾病的系统,所述系统包含:经人工操纵的SC功能控制因子,该经人工操纵的SC功能控制因子用于SC功能控制和/或治疗或减轻由SC功能紊乱引起的疾病;和/或组合物,该组合物用于所述经人工操纵的SC功能控制因子。
背景技术
施旺细胞(下文中也简称为SC)或神经膜细胞是外周神经系统的主要的神经胶质细胞。神经胶质细胞用于支持神经元,并且在外周神经系统中包含卫星细胞、嗅鞘细胞、肠神经胶质细胞、位于感觉神经末梢的神经胶质细胞(例如Pacinian小体)等。
在有髓轴突中,施旺细胞形成髓鞘。鞘不连续,并且单个的施旺细胞围绕约100μm的轴突。相邻施旺细胞之间的间隙称为郎飞结。脊椎动物神经系统与髓鞘隔绝,以维持轴突的膜电容。动作电位从郎飞结的一个结点跳至另一结点。通过该过程,传导速度增加高达10倍,而不增加轴突直径,并且可节省能量。施旺细胞可为在中枢神经系统中起相同作用的少突胶质细胞的类似物。然而,不同于少突胶质细胞,施旺细胞仅在一个轴突中形成髓鞘。
作为遗传性疾病的腓骨肌萎缩症(CMT)疾病是由于在外周神经系统中形成髓鞘的施旺细胞的异常而引起的肢体肌肉逐渐萎缩的疾病。其中,1A型腓骨肌萎缩症(CMT1A)是外周神经系统中最常发生的遗传性疾病之一,并且对于用从动物模型获得的信息找出CMT1A的遗传原因和CMT1A的解决方案来说,人类和动物模型之间的遗传信息存在极大的差异(在匹配方面存在问题)。
CMT1A占所有CMT病例的多于一半,且约占CMT1病例的70%,并且CMT的发病率为1/2500。CMT1A表现出如下的病理特征,例如肌肉无力和缺失、反射减少、肢端感觉异常、肢体畸形、神经传导速度(NCV)降低、肥厚性节段性脱髓鞘和如同洋葱鳞茎发生的髓鞘再生。
目前,对于由施旺细胞的功能障碍引起的疾病(例如CMT1A),没有根本性的治疗剂或治疗方法。只有使用物理疗法、整形外科辅助设备和整形外科手术来部分减轻症状的恶化的方法。因此,非常需要开发用于由施旺细胞的功能障碍引起的疾病的根本性治疗方法。
发明内容
技术问题
为了解决该问题,本发明涉及经人工操纵的SC功能控制系统,该系统具有改进的SC功能控制效果。更具体而言,本发明涉及经人工操纵的SC功能控制因子和SC功能控制系统(也称为SC功能控制修饰系统),该系统人工控制SC功能和/或修饰SC功能控制因子的表达。
本发明提供了用于特定目的的经遗传学上操纵或修饰的SC功能控制因子。
作为一种实施方式,本发明旨在提供经人工操纵的SC功能控制系统。
作为一种实施方式,本发明旨在提供经人工操纵的SC功能控制因子修饰系统。
作为一种实施方式,本发明旨在提供经人工操纵的SC功能控制因子及其表达产物。
作为一种实施方式,本发明旨在提供用于操纵基因的组合物及使用所述组合物的方法,所述组合物用于操纵SC功能控制因子。
作为一种实施方式,本发明旨在提供用于控制SC功能的方法。
作为一种实施方式,本发明旨在提供用于治疗SC功能障碍相关疾病的治疗组合物或药物组合物及其各种用途。
作为一种实施方式,本发明旨在提供经人工操纵的PMP22的SC功能控制因子和/或其表达产物。
作为一种实施方式,本发明旨在提供用于基因操纵的组合物,所述组合物用于PMP22的SC功能控制因子的人工操纵。
作为一种实施方式,本发明旨在提供经人工操纵的PMP22的SC功能控制因子和/或用于人工操纵的基因操纵组合物的治疗用途。
作为一种实施方式,本发明旨在提供经人工操纵的PMP22的SC功能控制因子和/或用于人工操纵的基因操纵组合物的额外用途。
技术方案
为了解决该问题,本发明涉及能够人工控制SC功能的系统,该系统包括:用于SC功能控制和/或治疗或缓解SC功能障碍相关疾病的经人工操纵的SC功能控制因子;和/或能够人工操纵SC功能控制因子的组合物。
本发明提供了用于特定目的的经人工操纵的SC功能控制因子。
“SC功能控制因子”是指直接参与或间接影响SC功能控制的所有元件。在该情况下,所述元件可为DNA、RNA、基因、肽、多肽或蛋白质。此外,SC功能控制因子包括直接参与或间接影响施旺细胞以及神经胶质细胞和/或成纤维细胞的功能控制的所有元件。
在实施方式中,所述元件包括SC功能控制所涉及的非自然的(即,经人工操纵的)所有各种材料。例如,所述元件可为在施旺细胞中表达的经遗传学上操纵或修饰的基因或蛋白质。
SC功能控制因子可阻遏或抑制施旺细胞、神经胶质细胞和/或成纤维细胞的生长,或者促进或增高施旺细胞的生长。
SC功能控制因子可中断或阻滞施旺细胞、神经胶质细胞和/或成纤维细胞的细胞周期的进展,或促进施旺细胞的细胞周期的进展。
SC功能控制因子可促进或阻遏施旺细胞、神经胶质细胞和/或成纤维细胞的分化。
SC功能控制因子可促进或阻遏施旺细胞、神经胶质细胞和/或成纤维细胞的死亡。
SC功能控制因子可帮助或干扰外周神经细胞的存活。
SC功能控制因子可帮助或干扰外周神经细胞的维持和信号转导。
SC功能控制因子可控制神经细胞轴突的髓鞘形成。
在该情况下,髓鞘形成包括髓鞘形成的整个过程(例如髓鞘的产生、髓鞘的变性、髓鞘的再生、髓鞘的维持和髓鞘的致密髓鞘(compact myelin))、以及与髓鞘变性或髓鞘功能相关的所有机制。
SC功能控制因子可用于缓解和治疗由功能障碍或有缺陷的施旺细胞引起的疾病。
在本发明的一个实施方式中,SC功能控制因子可为例如经人工操纵的PMP22基因。
在本发明的一个实施方式中,SC功能控制因子可包括一种或多种经人工操纵的基因。例如,PMP22基因可经人工操纵。
因此,本发明的一个实施方式提供了在核酸序列中具有修饰的PMP22基因作为经人工操纵的SC功能控制因子。
核酸序列中的修饰可不受限制地通过引导核酸-编辑蛋白复合体进行人工操纵。
术语“引导核酸-编辑蛋白复合体”是指经由引导核酸和编辑蛋白间的相互作用形成的复合体,并且该核酸-蛋白复合体包含引导核酸和编辑蛋白。
引导核酸-编辑蛋白复合体可用于修饰对象。所述对象可为靶核酸、基因、染色体或蛋白。
例如,所述基因可为通过引导核酸-编辑蛋白复合体进行人工操纵的SC功能控制因子。
其中,经人工操纵的SC功能控制因子包括核酸的一种或多种修饰,所述修饰为:
在构成所述SC功能控制因子的核酸序列中的前间隔邻近基序(PAM)序列中或在邻近其5'端和/或3'端的连续的1bp-50bp碱基序列区域中,一个或多个核苷酸的缺失或插入、用不同于野生型基因的一个或多个核苷酸进行的置换、以及一个或多个外源核苷酸的插入中的至少一种;
在构成所述SC功能控制因子的核酸序列中的一个或多个核苷酸的化学修饰。
核酸的修饰可发生于基因的启动子区。
核酸的修饰可发生于基因的外显子区。
核酸的修饰可发生于基因的内含子区。
核酸的修饰可发生于基因的增强子区。
PAM序列可为例如如下序列中的一种或多种(以5'至3'方向描述):
NGG(N为A、T、C或G);
NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;并且Y为C或T);
NNAGAAW(N各自独立地为A、T、C或G;并且W为A或T);
NNNNGATT(N各自独立地为A、T、C或G);
NNGRR(T)(N各自独立地为A、T、C或G;R为A或G;(T)为可随意添加的序列);以及
TTN(N为A、T、C或G)。
所述编辑蛋白可来源于:酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌属(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、产绿色链霉菌(Streptomycesviridochromogenes)、产绿色链霉菌、粉红链孢囊菌(Streptosporangium roseum)、粉红链孢囊菌、AlicyclobacHlus acidocaldarius、假真菌样芽孢杆菌(Bacilluspseudomycoides)、Bacillus selenitireducens、Exiguobacterium sibiricum、德氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、Microscilla marina、Burkholderiales bacterium、Polaromonas naphthalenivorans、极单孢菌属(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝杆藻属(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻属(Synechococcussp.)、阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)、Ammonifex degensii、Caldicellulosiruptor bescii、Candidatus Desulforudis、肉毒梭状芽孢杆菌(Clostridium botulinum)、艰难梭状芽孢杆菌(Clostridium difficile)、Finegoldiamagna、Natranaerobius thermophilus、Pelotomaculum thermopropionicu、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)、Allochromatium vinosum、海杆菌属(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、Nitrosococcus watsoni、游海假交替单胞菌(Pseudoalteromonas haloplanktis)、Ktedonobacter racemifer、Methanohalobiumevestigatum、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospiraplatensis)、节旋藻属(Arthrospira sp.)、鞘丝藻属(Lyngbya sp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤藻属(Oscillatoria sp.)、Petrotoga mobilis、非洲栖热腔菌(Thermosipho africanus)或Acaryochloris marina。
在一个示例性实施方式中,编辑蛋白可为选自于由如下所组成的组中的一种或多种:来源于酿脓链球菌的Cas9蛋白、来源于空肠弯曲杆菌(Campylobacter jejuni)的Cas9蛋白、来源于嗜热链球菌的Cas9蛋白、来源于金黄色葡萄球菌的Cas9蛋白、来源于脑膜炎奈瑟菌(Neisseria meningitidis)的Cas9蛋白以及Cpf1蛋白。作为实例,编辑蛋白可为来源于酿脓链球菌的Cas9蛋白或来源于空肠弯曲杆菌的Cas9蛋白。
另外,在另一实施方式中,
本发明提供了引导核酸,所述引导核酸靶向PMP22基因的核酸序列中的包含如下的区域的一部分:染色体17的15,267,977至15,273,977(调控区);染色体17的15,229,777至15,265,326(编码区);或染色体17的15,268,191至15,437,045、染色体17的15,239,833至15,258,667、或染色体17的15,342,770至15,435,639(非编码区)。
在一个示例性实施方式中,本发明提供了引导核酸,所述引导核酸能够与PMP22基因的核酸序列中的靶序列SEQ ID NO:1-SEQ ID NO:66(例如,SEQ ID NO:1至SEQ ID NO:8,SEQ ID NO:14至SEQ ID NO:29或SEQ ID NO:41至SEQ ID NO:53)分别形成互补结合。
引导核酸可与PMP22基因的部分核酸序列形成互补结合。所述互补结合可包括0-5个、0-4个、0-3个或0-2个错配。作为示例性实例,引导核酸可为与靶序列SEQ ID NO:1-SEQID NO:66(例如,SEQ ID NO:1-SEQ ID NO:8,SEQ ID NO:14-SEQ ID NO:29或SEQ ID NO:41-SEQ ID NO:53)中的一条或多条分别形成互补结合的核苷酸。
例如,本发明可提供选自如下所述的组中的一种或多种引导核酸:
能够与PMP22基因的核酸序列中的靶序列SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:41、SEQ ID NO:44、SEQ ID NO:45和SEQ IDNO:53分别形成互补结合的引导核酸;
所述引导核酸可不受限制地为18bp-25bp、18bp-24bp、18bp-23bp、19bp-23bp、19bp-23bp或20bp-23bp的核苷酸。它可能会产生0-5个、0-4个、0-3个、0-2个或0-1个错配。
此外,本发明提供了用于基因操纵的组合物,所述组合物可用于为了特定目的的SC功能控制因子的人工操纵。
在另一实施方式中,用于基因操纵的组合物可包含引导核酸-编辑蛋白复合体或编码该复合体的核酸序列。
作为示例性实施方式,用于基因操纵的组合物可包含:
(a)引导核酸或编码该引导核酸的核酸序列,所述引导核酸靶向PMP22基因的核酸序列中包含如下的区域的一部分:染色体17的15,267,977至15,273,977(调控区);染色体17的15,229,777至15,265,326(编码区);或染色体17的15,268,191至15,437,045、染色体17的15,239,833至15,258,667、或染色体17的15,342,770至15,435,639(非编码区);以及
(b)编辑蛋白或编码该编辑蛋白的核酸序列,所述编辑蛋白与引导核酸形成复合体以切割或修饰PMP22基因的核酸序列中的靶向位点。
在一个示例性实施方式中,用于基因操纵的组合物可包含:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够与PMP22基因的核酸序列中的靶序列SEQ ID NO:1-SEQ ID NO:66(例如,SEQ ID NO:1-SEQ ID NO:8、SEQID NO:14-SEQ ID NO:29或SEQ ID NO:41-SEQ ID NO:53)分别形成互补结合;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由如下所组成的组中的一种或多种蛋白:来源于酿脓链球菌的Cas9蛋白、来源于空肠弯曲杆菌的Cas9蛋白、来源于嗜热链球菌的Cas9蛋白、来源于金黄色葡萄球菌的Cas9蛋白、来源于脑膜炎奈瑟菌的Cas9蛋白以及Cpf1蛋白。
在一个示例性实施方式中,引导核酸可为与PMP22基因的核酸序列中的如下靶序列中的一条或多条分别形成互补结合的核酸序列:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:41、SEQ ID NO:44、SEQ ID NO:45和SEQ IDNO:53。
在一个示例性实施方式中,用于基因操纵的组合物可为病毒载体系统。
病毒载体可包括选自于由如下所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、牛痘病毒(vaccinia virus)、痘苗病毒(poxvirus)和单纯疱疹病毒。
在又一示例性实施方式中,本发明可提供用于对细胞进行人工操纵的方法,所述方法包括向细胞中引入:
(a)引导核酸或编码该引导核酸的核酸序列,所述引导核酸靶向PMP22基因的核酸序列中的包含如下的区域的一部分:染色体17的15,267,977至15,273,977(调控区);染色体17的15,229,777至15,265,326(编码区);或染色体17的15,268,191至15,437,045、染色体17的15,239,833至15,258,667、或染色体17的15,342,770至15,435,639(非编码区);以及
(b)编辑蛋白或编码该编辑蛋白的核酸序列,所述编辑蛋白与引导核酸形成复合体以切割或修饰PMP22基因的核酸序列中的靶向位点。
在一个示例性实施方式中,本发明提供了用于对细胞进行人工操纵的方法,所述方法包括向细胞引入:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够与PMP22基因的核酸序列中的靶序列SEQ ID NO:1-SEQ ID NO:66(例如,SEQ ID NO:1-SEQ ID NO:8、SEQID NO:14-SEQ ID NO:29或SEQ ID NO:41-SEQ ID NO:53)分别形成互补结合;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由如下所组成的组中的一种或多种蛋白:来源于酿脓链球菌的Cas9蛋白、来源于空肠弯曲杆菌的Cas9蛋白、来源于嗜热链球菌的Cas9蛋白、来源于金黄色葡萄球菌的Cas9蛋白、来源于脑膜炎奈瑟菌的Cas9蛋白以及Cpf1蛋白。
引导核酸和编辑蛋白可以以核酸序列的形式存在于一个或多个载体中,或者可存在于通过将引导核酸和编辑蛋白偶合形成的复合体中。
引入可在体内或离体进行。
引入可通过选自如下中的一种或多种方法进行:电穿孔、脂质体、质粒、病毒载体、纳米粒子和蛋白易位结构域(PTD)融合蛋白法。
病毒载体可为选自于由如下所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、牛痘病毒、痘苗病毒和单纯疱疹病毒。
在另一示例性实施方式中,本发明提供了用于治疗SC功能障碍相关疾病和/或SC功能控制因子相关疾病的药物组合物。
所述药物组合物可包含用于基因操纵的组合物,所述组合物可用于SC功能控制因子的人工操纵。
用于基因操纵的组合物的配方与上文所述相同。
一个实施方式提供了通过对PMP22基因进行测序而用于提供关于受试者中的能够被人工操纵的靶位置的序列的信息的方法。
另外,一个实施方式提供了通过使用由所述方法提供的信息构建文库的方法。
一个实施方式提供了用于基因操纵的试剂盒,所述试剂盒包含如下:
(a)引导核酸或编码该引导核酸的核酸序列,所述引导核酸靶向PMP22基因的核酸序列中的包含如下的区域的一部分:染色体17的15,267,977至15,273,977(调控区);染色体17的15,229,777至15,265,326(编码区);或染色体17的15,268,191至15,437,045、染色体17的15,239,833至15,258,667、或染色体17的15,342,770至15,435,639(非编码区);以及
(b)编辑蛋白或编码该编辑蛋白的核酸序列,所述编辑蛋白与引导核酸形成复合体以切割或修饰PMP22基因的核酸序列中的靶向位点。
在一个示例性实施方式中,本发明提供了用于基因操纵的试剂盒,所述试剂盒包含如下成分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够与PMP22基因的核酸序列中的靶序列SEQ ID NO:1-SEQ ID NO:66(例如,SEQ ID NO:1-SEQ ID NO:8、SEQID NO:14-SEQ ID NO:29或SEQ ID NO:41-SEQ ID NO:53)分别形成互补结合;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由如下所组成的组中的一种或多种蛋白:来源于酿脓链球菌的Cas9蛋白、来源于空肠弯曲杆菌的Cas9蛋白、来源于嗜热链球菌的Cas9蛋白、来源于金黄色葡萄球菌的Cas9蛋白、来源于脑膜炎奈瑟菌的Cas9蛋白以及Cpf1蛋白。
可使用此类试剂盒对感兴趣的基因进行人工操纵。
在一个示例性实施方式中,本发明可提供用于治疗SC功能障碍紊乱的组合物,所述组合物包含:
引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够与PMP22基因的核酸序列中的一条或多条靶序列分别形成互补结合;以及
编辑蛋白或编码所述编辑蛋白的核酸序列。
所述靶序列可为PMP22基因的核酸序列中的包含如下的区域的一部分:染色体17的15,267,977至15,273,977(调控区);染色体17的15,229,777至15,265,326(编码区);或染色体17的15,268,191至15,437,045、染色体17的15,239,833至15,258,667、或染色体17的15,342,770至15,435,639(非编码区)。
靶序列可为SEQ ID NO:1-SEQ ID NO:66(例如,SEQ ID NO:1-SEQ ID NO:8、SEQID NO:14-SEQ ID NO:29、SEQ ID NO:41-SEQ ID NO:53)中的一条或多条序列。
在一个示例性实施方式中,来源于空肠弯曲杆菌、酿脓链球菌的Cas9蛋白可用作编辑蛋白。
在一个实例中,SC功能障碍紊乱可为SC功能控制因子相关疾病。
在一个实例中,SC功能控制因子相关疾病是1A型腓骨肌痿缩症(CMT1A)、德热里纳-索塔斯(Dejerine-Sottas)病(DSS)、先天性髓鞘形成减少神经病变(CHN)或Roussy-Levy综合征(RLS)。
在一个示例性实施方式中,本发明提供了经人工操纵的SC功能控制因子或用于基因操纵的组合物的用途的全部方面,所述组合物用于SC功能控制因子的人工操纵中以治疗对象中的疾病。
治疗对象可为包括灵长类动物(例如人、猴等)、啮齿类动物(例如小鼠、大鼠等)等在内的哺乳动物。
有益效果
可将经人工操纵的SC功能控制因子以及其功能由该因子进行人工修饰的SC功能控制系统用于SC功能障碍紊乱的有效的治疗用途,所述SC功能障碍紊乱例如SC功能控制因子相关疾病(例如1A型腓骨肌痿缩症(CMT1A)、德热里纳-索塔斯病(DSS)、先天性髓鞘形成减少神经病变(CHN)或Roussy-Levy综合征(RLS))。通过涉及SC功能控制因子的多种体内机制,可改善SC功能控制系统的功效。
例如,可使用PMP22基因。
附图说明
图1是示出由SpCas9-sgRNA介导的基因操纵引起的插入缺失频率的一组结果,并且示出了(a)CDS、(b)TATA-盒和(c)增强子各自的插入缺失频率,在其中将sgRNA的靶位点分开。
图2是示出由CjCas9-sgRNA介导的基因操纵引起的插入缺失频率的一组结果,并且示出了(a)CDS、(b)TATA-盒和(c)增强子各自的插入缺失频率,在其中将sgRNA的靶位点分开。
图3示出了在施旺细胞样细胞中SpCas9-sgRNA靶向人PMP22基因的控制因子(调控元件)的基因操纵效应。
图4示出了由靶向人PMP22的CDS的SpCas9-sgRNA诱导的移码突变比率。
图5示出了经由双sgRNA的处理的人PMP22的调控元件的关键位点的缺失。
图6是示出人类施旺细胞样细胞中经由SpCas9-sgRNA而来的人PMP22的mRNA表达降低的图表。
图7是示出在人原代施旺细胞中的人PMP22基因的每个靶位点处经由SpCas9-sgRNA而来的PMP22的有效且特异性的表达降低的图表,并且(a)示出了在每个靶位点处经由SpCas9-sgRNA而来的插入缺失频率测量结果,(b)示出了PMP22的相对的mRNA表达的比较结果,该结果(具有或不具有髓鞘形成信号因子和RNP复合体进行的处理)通过qRT-PCR对每个靶位点进行测量(n=3,单因素方差分析和Tukey事后检验:*p<0.05),以及(c)示出了靶向远端增强子位点(远端增强子区域)B和C的SpCas9-sgRNA的插入缺失频率的测量结果。
图8是示出通过在体外将CRISPR-Cas9靶向人PMP22基因的TATA-盒位点而来的PMP22的有效且特异性的表达降低的图表,并且(a)示出靶向人PMP22位置的启动子位点的靶序列,并且(b)中最左边的图表、中间的图表和最右边的图表分别示出了在人原代施旺细胞中使用靶向深度测序的插入缺失频率的测量结果、总的插入缺失频率中的TATA-盒1突变频率的测量结果(n=3)、以及PMP22的相对的mRNA表达的比较结果,该结果(具有或不具有髓鞘形成信号因子和RNP复合体进行的处理)通过qRT-PCR在人原代施旺细胞中测量(n=3,单因素方差分析和Tukey事后检验:*p<0.05)。
图9示出了经由人原代施旺细胞中的靶向深度测序通过计算机脱靶分析发现的脱靶和中靶的PMP22-TATA RNP的插入缺失频率,并且(a)是示出插入缺失频率的图表,(b)示出了具有高频率的插入缺失模式,并且(c)示出了通过计算机脱靶分析发现的脱靶位置。
图10是示出在人的整个基因组中被PMP22-TATA RNP切割的位置的一组结果,并且(a)示出了全基因组Circos图,(b)示出了在通过计算机脱靶分析发现的脱靶位置中经由Digenome-seq出现的脱靶位置,以及(c)是示出脱靶位置的插入缺失频率的图表。
图11示意性地示出了在C22小鼠中使用PMP22-TATA RNA疗法的治疗方式。
图12是示出在CMT1A小鼠中通过经由CRISPR/Cas9而来的PMP22的表达抑制来减轻疾病表型的一组结果,并且(a)是示出在用mRosa26或PMP22-TATA RNP复合体处理的坐骨神经中使用靶向深度测序的插入缺失频率的图表(n=3),(b)是在图12a的总插入缺失频率之中的TATA-盒1突变频率的测量结果(n=3),以及(c)是使用来自用mRosa26或PMP22-TATARNP复合体处理的坐骨神经的qRT-PCR来比较PMP22的mRNA表达的相对量的图表。
图13是通过计算机分析示出小鼠基因组中的PMP22-TATA sgRNA的脱靶位置和插入缺失频率的一组结果,并且(a)示出了脱靶位置,并且(b)是示出了在每个脱靶位置的插入缺失频率的图表。
图14是示出在CMT1A小鼠中通过经由CRISPR/Cas9而来的PMP22的表达抑制来减轻疾病表型的一组结果,并且(a)是用mRosa26或PMP22-TATA RNP复合体处理的坐骨神经组织的半薄切片的一组图像,并且(b)中的上图表和下图表分别是示出在用PMP22-TATA RNP处理的小鼠中g-比率增加的散点图以及示出在用PMP22-TATA RNP处理的小鼠中的有髓轴突的直径增加的图表。
图15是示出在CMT1A小鼠中通过经由CRISPR/Cas9而来的PMP22的表达抑制引起的电生理学变化的一组结果,并且(a)是示出远端潜伏期(DL)的变化的图表,(b)是示出运动神经传导速度(NCV)的变化的图表,并且(c)是示出复合肌肉动作电位(CMAP)的变化的图表(对于mRosa26 RNP,n=7;对于PMP22-TATA,n=10)。
图16是在CMT1A小鼠中由经由CRISPR/Cas9而来的PMP22的表达抑制引起的运动行为的一组分析结果,并且(a)中的上图表和下图表分别是转棒试验结果(对于mRosa26 RNP,n=7;对于PMP22-TATA,n=11)以及直至小鼠变为8周龄至16周龄的每周测量的转棒试验结果(对于mRosa26 RNP,n=7;对于PMP22-TATA,n=11),并且(b)中的上图表和下图表分别是示出用mRosa26或PMP22-TATA RNP复合体处理的C22小鼠的腓肠肌重量/体重的比值的图表以及用mRosa26或PMP22-TATARNP复合体处理的C22小鼠的一组腓肠肌图像。
具体实施方式
除非另有定义,本文使用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文所述的方法和材料类似或相同的方法和材料可用于本发明的实践或测试中,适合的方法和材料在下文中描述。本文提及的所有出版物、专利申请、专利和其它参考文献都以引用的方式将它们整体并入。另外,材料、方法和实例仅为说明性的,而并非旨在限制。
本发明的一个方面涉及
经人工操纵的SC功能控制系统,所述系统具有减轻或治愈施旺细胞功能障碍的作用。
具体而言,本发明的一个方面涉及各个方面的构型,所述构型能够通过人工操纵SC功能控制因子来调节SC功能控制因子的表达或从施旺细胞的异常功能中恢复以减轻或治疗SC功能控制因子表达紊乱或施旺细胞功能障碍相关疾病。本发明的一个方面包括经人工表达的SC功能控制因子和/或其功能被修饰的SC功能控制因子、所述因子的制备方法、包含所述因子的组合物、所述因子的治疗用途等。
本发明的另一方面涉及
用于控制第三体内机制的另外的系统,所述系统伴随着经人工表达的SC功能控制因子和/或其功能被修饰的SC功能控制因子的各种功能。
具体而言,本发明的另一方面可不仅通过靶向髓鞘形成功能(其中涉及经人工操纵的SC功能控制因子)而且还可通过靶向第三体内功能来控制相应的机制。本发明的另一方面包括经人工表达的SC功能控制因子和/或其功能被修饰的SC功能控制因子、所述因子的制备方法、包含所述因子的组合物、所述因子的能够减轻或治疗与第三功能相关的疾病的治疗用途等。
[SC功能]
本发明的一个实施方式涉及SC功能控制系统的改进和修饰。
“SC功能控制”是指SC功能因子的整体功能控制,例如,受PMP22基因的功能影响的施旺细胞、神经胶质细胞和/或成纤维细胞,并且在本文中,该功能包括施旺细胞、神经胶质细胞和/或成纤维细胞的生长、分化和死亡的整个发育和生长过程,并且还包括施旺细胞的外周神经细胞的存活和维持以及轴突上的髓鞘的形成(髓鞘形成)等所有功能。此外,SC功能控制包括施旺细胞、神经胶质细胞和/或成纤维细胞的整体功能,例如,对从细胞生长和分化到细胞死亡的整个发育和生长过程的控制。
SC功能控制包括对如下的所有机制的控制:阻遏或抑制施旺细胞、神经胶质细胞和/或成纤维细胞的生长,或者促进或增加施旺细胞、神经胶质细胞和/或成纤维细胞的生长。
SC功能控制包括对如下的所有机制的控制:中断或阻滞施旺细胞、神经胶质细胞和/或成纤维细胞的细胞周期的进展,或者促进施旺细胞、神经胶质细胞和/或成纤维细胞的细胞周期的进展。
SC功能控制包括对如下的所有机制的控制:促进或阻遏施旺细胞、神经胶质细胞和/或成纤维细胞的分化。
SC功能控制包括对所有机制的控制,例如对促进或阻遏施旺细胞、神经胶质细胞和/或成纤维细胞的死亡(例如细胞凋亡)的机制的控制。
此外,SC功能控制包括对如下的所有机制的控制:帮助或干扰外周神经细胞的存活。
SC功能控制包括对如下的所有机制的控制:帮助或干扰外周神经细胞的维持和信号转导。
SC功能控制包括对神经细胞的轴突的髓鞘形成所涉及的所有机制的控制。
在该情况下,髓鞘形成包括髓鞘形成的全部过程(例如髓鞘的产生、髓鞘的变性、髓鞘的再生、髓鞘的维持和髓鞘的致密髓鞘)、以及与髓鞘变性或髓鞘功能相关的所有机制。
此外,SC功能控制包括对如下的所有机制的控制:阻遏或抑制成纤维细胞或神经胶质细胞生长,或者促进或增加成纤维细胞或神经胶质细胞的生长。
SC功能控制包括对成纤维细胞或神经胶质细胞的活性所涉及的所有机制的控制。
在一个实施方式中,SC功能控制可参与治疗或减轻由PMP22的复制引起的疾病。
例如,SC功能控制因子可参与治疗或减轻由例如PMP22的表达方面的修饰(包括突变)引起的疾病。
在一个实施方式中,SC功能控制可控制髓鞘形成。
例如,由于SC功能控制因子、例如PMP22的过表达)具有通过使髓鞘不稳定(导致干扰髓鞘的维持和形成)而造成神经病变的特征,因此通过控制SC功能控制因子的表达的SC功能控制可控制髓鞘形成。
在另一实施方式中,SC功能控制可控制施旺细胞的分化。
例如,由于SC功能控制因子(例如,PMP22)具有在施旺细胞的分化期间增加表达的特征,因此通过控制SC功能控制因子的表达的SC功能控制可控制施旺细胞的分化。
在一个实施方式中,SC功能控制可控制神经细胞的信号转导。
例如,由于SC功能控制因子、例如PMP22的过表达具有通过使髓鞘不稳定(导致干扰髓鞘的形成和维持)而降低神经细胞的信号转导(即传导速度)的特征,因此通过控制SC功能控制因子的表达的SC功能控制可控制髓鞘形成。
[SC功能控制因子]
SC功能控制因子
本发明的一个实施方式是经人工操纵或修饰的SC功能控制因子。
“SC功能控制因子”是指直接参与或间接影响SC功能控制的所有元件。在该情况下,所述元件可为DNA、RNA、基因、肽、多肽或蛋白质。
在实施方式中,该元件包括非自然地涉及(即经人工操纵的SC功能控制)的所有各种材料。例如,该元件可为在施旺细胞中表达的经遗传学操纵或修饰的基因或蛋白。
术语“经人工操纵的”是指经人工修饰的状态,而不是在自然状态下发生并且按其实际样子存在的状态。
术语“经遗传学操纵的”是指实施使本发明中提及的生物学上或非生物学上来源的材料经受人工的遗传学修饰的操纵的情况,并且例如,其可为出于特定目的对其中的基因组进行了人工修饰的基因和/或基因产物(多肽、蛋白等)。
作为优选的实例,本发明提供了为了特定目的的经遗传学操纵或修饰的SC功能控制因子。
在下文中,具有所列功能的基因或蛋白不仅可具有一种类型的SC功能控制相关功能,还可具有多种功能。此外,如果需要,本发明可提供两种以上的SC功能控制相关功能和因子。
SC功能控制因子可阻遏或抑制施旺细胞的生长,或者促进或增加施旺细胞的生长。
SC功能控制因子可中断或阻滞施旺细胞的细胞周期的进展,或促进施旺细胞的细胞周期的进展。
SC功能控制因子可促进或阻遏施旺细胞的分化。
SC功能控制因子可促进或阻遏施旺细胞的死亡。
SC功能控制因子可帮助或干扰外周神经细胞的存活。
SC功能控制因子可帮助或干扰外周神经细胞的维持和信号转导。
SC功能控制因子可控制神经细胞轴突的髓鞘形成。
在该情况下,髓鞘形成包括髓鞘形成的全部过程(例如髓鞘的产生、髓鞘的变性、髓鞘的再生、髓鞘的维持和髓鞘的致密髓鞘)、以及与髓鞘变性或髓鞘功能相关的所有机制。
SC功能控制因子可用于减轻和治疗由功能障碍或有缺陷的施旺细胞引起的疾病。
此外,SC功能控制因子可控制如下的所有机制:阻遏或抑制成纤维细胞或神经胶质细胞生长,或者促进或增加成纤维细胞或神经胶质细胞的生长。
SC功能控制因子可控制成纤维细胞或神经胶质细胞的活性涉及的所有机制。
在一个实施方式中,SC功能控制因子可为PMP22。
在任何实施方式中,SC功能控制因子可为PMP22。
外周髓鞘蛋白22(PMP22)基因是指编码PMP22蛋白的基因(全长DNA、cDNA或mRNA),也称为GAS3或GAS-3。在一个实例中,PMP22基因可为选自于由如下所组成的组中的一种或多种,但不限于此:编码人PMP22的基因(例如,NCBI登录号NP_000295.1、NP_001268384.1、NP_001268385.1、NP_001317072.1、NP_696996.1、NP_696997.1等),例如,由NCBI登录号NM_000304.3、NM_001281455.1、NM_001281456.1、NM_001330143.1、NM_153321.2、NM_153322.2等代表的PMP22基因。
所述外周髓鞘蛋白22(PMP22)是22kDa的髓鞘的跨膜糖蛋白,并且PMP22在形成外周神经系统的髓鞘的施旺细胞中表达,且在致密髓鞘的形成和维持中起重要作用。PMP22基因映射至人染色体17p11.2-p12,并且编码PMP22糖蛋白的产生。PMP22基因表达的修饰与遗传性的脱髓鞘的外周神经病变有关,并导致髓鞘的异常合成和异常功能。由PMP22的复制引起的PMP22的增加的表达是引起疾病的最可能的机制。
PMP22的点突变或移码突变导致遗传性压力易感性神经病变(HNPP),并且错义突变导致称为德热里纳-索塔斯综合征(DSS)和先天性髓鞘形成减少神经病变(CHN)的各种类型的CMT。此外,Roussy-Levy综合征(RLS)由PMP22的复制引起,并且通常被认为是CMT1A的表型变体。
SC功能控制因子可来源于包括灵长类动物(例如人和猴)、啮齿类动物(例如大鼠和小鼠)等在内的哺乳动物。
基因信息可从公众已知的数据库(例如美国国家生物技术信息中心(NCBI)的GenBank)获得。
作为本发明的一个实施方式,SC功能控制因子(例如PMP22)可为经人工操纵的SC功能控制因子。
在任何实施方式中,可对经人工操纵的SC功能控制因子进行遗传学操纵。
可通过在野生型基因的基因组序列的部分或全部区域中人工引起插入、缺失、置换或倒位突变来获得基因操纵或修饰。另外,也可通过对两种以上的经操纵或修饰的基因进行融合来获得基因操纵或修饰。
例如,通过基因操纵或修饰使基因失活,从而使由该基因编码的蛋白能够不以具有其固有功能的蛋白的形式表达。
例如,可通过基因操纵或修饰使基因进一步活化,从而使由该基因编码的蛋白将以具有比其固有功能改进的功能的蛋白的形式表达。作为实例,当由特定基因编码的蛋白的功能为A时,由经操纵的基因表达的蛋白的功能可完全不同于A,或者可具有包含A的额外功能(A+B)。
例如,由于基因操纵或修饰,可利用具有不同功能或互补功能的两种以上的基因来表达融合的两种以上的蛋白。
例如,由于基因操纵或修饰,可通过利用具有不同功能或互补功能的两种以上的基因来分别地或独立地表达两种以上的蛋白。
经操纵的SC功能控制因子可阻遏或抑制施旺细胞的生长、或者促进或增加施旺细胞的生长。
经操纵的SC功能控制因子可中断或阻滞施旺细胞的细胞周期的进展、或促进施旺细胞的细胞周期的进展。
经操纵的SC功能控制因子可促进或阻遏施旺细胞的分化。
经操纵的SC功能控制因子可促进或阻遏施旺细胞的死亡。
经操纵的SC功能控制因子可帮助或干扰外周神经细胞的存活。
经操纵的SC功能控制因子可帮助或干扰外周神经细胞的维持和信号转导。
经操纵的SC功能控制因子可控制神经细胞轴突的髓鞘形成。
在该情况下,髓鞘形成包括髓鞘形成的全部过程(例如髓鞘的产生、髓鞘的变性、髓鞘的再生、髓鞘的维持和髓鞘的致密髓鞘)、以及与髓鞘变性或髓鞘功能相关的所有机制。
经操纵的SC功能控制因子可用于减轻和治疗由功能障碍或有缺陷的施旺细胞引起的疾病。
此外,经操纵的SC功能控制因子可控制如下的所有机制:阻遏或抑制成纤维细胞或神经胶质细胞的生长,或者促进或增加成纤维细胞或神经胶质细胞的生长。
经操纵的SC功能控制因子可控制成纤维细胞或神经胶质细胞的活性涉及的所有机制。
操纵包括SC功能控制因子的所有结构或功能的修饰。
SC功能控制因子的结构修饰包括与自然状态下存在的野生型不同的所有修饰。
例如,当SC功能控制因子是DNA或RNA基因时,
结构修饰可为在其中一个或多个核苷酸缺失的结构修饰。
结构修饰可为在其中插入一个或多个核苷酸的结构修饰。
在该情况下,插入的核苷酸包括从含有SC功能控制因子的对象或从该对象的外部引入的所有核苷酸。
结构修饰可为在其中一个或多个核苷酸被置换的结构修饰。
结构修饰可包括一个或多个核苷酸的化学修饰。
在该情况下,化学修饰包括官能团的添加、移除或取代中的全部。
作为另一实例,当SC功能控制因子是肽、多肽或蛋白时,
结构修饰可为在其中一个或多个氨基酸缺失的结构修饰。
结构修饰可为在其中插入一个或多个氨基酸的结构修饰。
在该情况下,插入的氨基酸包括从含有SC功能控制因子的对象或从该对象的外部引入的所有氨基酸。
结构修饰可为在其中一个或多个氨基酸被置换的结构修饰。
结构修饰可包括一个或多个氨基酸的化学修饰。
在该情况下,化学修饰包括官能团的添加、移除或取代中的全部。
结构修饰可为在其中连接另一肽、多肽或蛋白的部分或全部的结构修饰。
在该情况下,其它肽、多肽或蛋白可为SC功能控制因子,或者可为执行另一功能的肽、多肽或蛋白。
SC功能控制因子的功能修饰包括与自然状态下存在的野生型相比具有改善或变劣的功能或具有第三不同功能的所有修饰。
例如,当SC功能控制因子是肽、多肽或蛋白时,
功能修饰可为SC功能控制因子的突变。
在该情况下,突变可为SC功能控制因子的功能得以改善或抑制的突变。
功能修饰可为在其中添加了SC功能控制因子的功能的功能修饰。
在该情况下,添加的功能可为相同的功能或不同的功能。此外,向其添加功能的SC功能控制因子可与其它肽、多肽或蛋白融合。
功能修饰可为由SC功能控制因子的表达增加而引起的功能方面的增加。
功能修饰可为由SC功能控制因子的表达降低而引起的功能方面的降低。
功能修饰可为由SC功能控制因子的表达减少而引起的功能方面的恢复。
作为一个实施方式,SC功能控制因子可由以下的一个或多个诱导:
SC功能控制因子(即待操纵的基因,下文中称为靶基因)的全部或部分删除,例如删除1bp或更多的核苷酸,例如删除靶基因的1-30bp核苷酸、1-27bp核苷酸、1-25bp核苷酸、1-23bp核苷酸、1-20bp核苷酸、1-15bp核苷酸、1-10bp核苷酸、1-5bp核苷酸、1-3bp核苷酸或者1bp核苷酸,
用不同于野生型的核苷酸置换靶基因的1bp或更长的核苷酸(例如1-30bp核苷酸、1-27bp核苷酸、1-25bp核苷酸、1-23bp核苷酸、1-20bp核苷酸、1-15bp核苷酸、1-10bp核苷酸、1-5bp核苷酸、1-3bp核苷酸或者1bp核苷酸);以及
向靶基因的任意位置中插入1bp或更多的核苷酸,例如1-30bp核苷酸、1-27bp核苷酸、1-25bp核苷酸、1-23bp核苷酸、1-20bp核苷酸、1-15bp核苷酸、1-10bp核苷酸、1-5bp核苷酸、1-3bp核苷酸或者1bp核苷酸(各自独立地选自A、T、C或G)。
靶基因的经修饰的部分(“靶区域”)可为基因的1bp以上、3bp以上、5bp以上、7bp以上、10bp以上、12bp以上、15bp以上、17bp以上、20bp以上(例如1bp-30bp、3bp-30bp、5bp-30bp、7bp-30bp、10bp-30bp、12bp-30bp、15bp-30bp、17bp-30bp、20bp-30bp、1bp-27bp、3bp-27bp、5bp-27bp、7bp-27bp、10bp-27bp、12bp-27bp、15bp-27bp、17bp-27bp、20bp-27bp、1bp-25bp、3bp-25bp、5bp-25bp、7bp-25bp、10bp-25bp、12bp-25bp、15bp-25bp、17bp-25bp、20bp-25bp、1bp-23bp、3bp-23bp、5bp-23bp、7bp-23bp、10bp-23bp、12bp-23bp、15bp-23bp、17bp-23bp、20bp-23bp、1bp-20bp、3bp-20bp、5bp-20bp、7bp-20bp、10bp-20bp、12bp-20bp、15bp-20bp、17bp-20bp、21bp-25bp、18bp-22bp或者21bp-23bp)的连续的碱基序列位点。
同时,本发明的不同实施方式涉及
用于控制第三体内机制的额外系统,伴随有其功能经人工修饰的上述SC功能控制因子的各种功能。
作为一个实施方式,PMP22可参与第三体内机制的控制。
由于许多研究已证实肿瘤细胞中的PMP22的表达增加,这意味着PMP22的表达影响各种癌症疾病中的肿瘤细胞的增殖相关机制,经人工操纵的PMP22可阻遏或抑制各种肿瘤(例如,乳腺癌、胃癌、胰腺癌等)的细胞的增殖,例如,通过PMP22表达的抑制或操纵以使PMP22失活。另外,通过经人工操纵的PMP22,可阻遏或抑制各种癌症疾病的进展或转移或者提供减轻或治疗癌症疾病的效果。
如上所述,本发明的经人工操纵的示例性因子可控制SC功能,并且可通过靶向第三体内功能来控制相应的机制。本发明的实施方式包括其功能被人工修饰的SC功能控制因子、所述因子的制备方法、包含所述因子的组合物、所述因子的能够减轻或治疗与第三功能相关的疾病的治疗用途等。
[SC功能控制系统]
本发明的一个实施方式为SC功能控制系统,所述系统通过人工操纵SC功能控制因子来控制SC功能。
本发明的“SC功能控制系统”为包括通过经人工操纵的SC功能控制因子的表达变化和/或功能变化而影响SC功能的促进、增加、抑制、阻遏和/或正常功能恢复的所有现象的术语,并且包括直接或间接参与SC功能控制系统的所有材料、组件、方法和用途。
构成SC功能控制系统的各个元件也统称为“SC功能控制元件”。
此外,SC功能控制系统包括SC功能控制修饰系统,所述SC功能控制修饰系统的表达和/或功能通过人工操纵SC功能控制因子进行修饰。
“SC功能控制因子修饰系统”统指存在于对象的基因组中或从外部引入的SC功能控制因子的转录,从经转录的遗传信息(例如,mRNA)表达为蛋白质的总体的SC功能控制因子的表达的修饰(即表达减少、表达增加和表达维持等过程)及其产物。
此外,“SC功能控制因子修饰系统”还包括如下的全部过程及其产物:通过SC功能控制因子的突变干扰正常的SC功能控制因子的表达和/或功能,或表达正常的SC功能控制因子(例如正常的SC功能控制因子的突变的表达)、异常的SC功能控制因子的表达和经人工修饰的SC功能控制因子。
作为一个实施方式,本发明的系统包括SC功能控制因子(即PMP22修饰系统)作为SC功能控制元件,并且在该情况下,SC功能控制因子(即PMP22)包括经人工操纵的SC功能控制因子。
“PMP22修饰系统”统指存在于对象的基因组中或从外部引入的PMP22基因的转录,从经转录的遗传信息(例如,mRNA)表达为蛋白质的总体的PMP22的表达的修饰(即表达减少、表达增加和表达维持等过程)及其产物。
此外,“PMP22修饰系统”还包括通过PMP22的突变干扰正常PMP22的表达和/或功能,或表达正常的PMP22(例如PMP22突变的表达)、异常的PMP22和经人工修饰的PMP22的全部过程及其产物。
在PMP22修饰系统中,通过经人工操纵的PMP22,
在任何实施方式中,可增加或促进PMP22的表达。
在任何实施方式中,可抑制或阻遏PMP22的表达。
例如,当PMP22基因被复制和过表达时,可通过经人工操纵的PMP22将表达阻遏或降低至正常表达水平。
在任何实施方式中,可增强或促进PMP22的功能。
在任何实施方式中,可降级或阻遏PMP22的功能。
此外,在PMP22修饰系统中,通过经人工操纵的PMP22,
在任何实施方式中,可阻遏或抑制施旺细胞的生长,或者可促进或增加施旺细胞的生长。
在任何实施方式中,可中断或阻滞施旺细胞的细胞周期的进展,或者可促进施旺细胞的细胞周期的进展。
在任何实施方式中,可促进或阻遏施旺细胞的分化。
在任何实施方式中,可促进或阻遏施旺细胞的死亡。
在任何实施方式中,可帮助或干扰外周神经细胞的存活。
在任何实施方式中,可帮助或干扰外周神经细胞的维持和信号转导。
在任何实施方式中,可控制神经细胞轴突的髓鞘形成。
在该情况下,髓鞘形成包括髓鞘形成的全部过程(例如髓鞘的产生、髓鞘的变性、髓鞘的再生、髓鞘的维持和髓鞘的致密髓鞘)、以及与髓鞘变性或髓鞘功能相关的所有机制。
在任何实施方式中,可将其用于减轻和治疗由功能障碍或有缺陷的施旺细胞引起的疾病。
在一个实施方式中,可控制如下的所有机制:阻遏或抑制成纤维细胞或神经胶质细胞的生长,或者促进或增加成纤维细胞或神经胶质细胞的生长。
在任何实施方式中,可控制成纤维细胞或神经胶质细胞的活性涉及的所有机制。
在任何实施方式中,可通过靶向PMP22参与的第三体内功能来控制相应的机制。
在实施方式中,本发明的SC功能控制系统包括用于对SC功能控制因子进行操纵的组合物作为SC功能控制元件。
在实施方式中,本发明的SC功能控制因子修饰系统包括用于对SC功能控制因子进行操纵的组合物。
用于操纵的组合物可为能够对SC功能控制因子进行人工操纵的组合物,优选为用于基因操纵的组合物。
在下文中,将描述用于基因操纵的组合物。
[用于操纵SC功能控制因子的组合物]
本发明的SC功能控制因子和SC功能控制系统(包括SC功能控制因子修饰系统)中涉及的材料的操纵或修饰可优选通过基因操纵来实现。
在一个方面,可通过靶向SC功能控制因子的调控区、非编码区或编码区的部分或全部来提供操纵基因的组合物和方法。
对于组合物和方法,
在实施方式中,可操纵或修饰参与形成靶SC功能控制系统(包括SC功能控制因子修饰系统)的SC功能控制基因中的一种或多种以形成靶SC功能控制系统。可通过修饰构成基因的核酸来进行操纵或修饰。作为操纵结果,包括敲减、敲除和敲入的全部形式。
在实施方式中,可将调控区、非编码区或编码区的部分或全部用作靶标。
在任何实施方式中,可将构成SC功能控制基因的核酸之中的调控区域用作操纵靶标。
例如,可将诸如近端启动子、增强子、TATA盒和起始子的调控元件的部分或完整序列用作靶标。作为具体实例,可将启动子、TATA盒、CAAT盒、起始位点、终止位点、供体剪接位点、受体剪接位点、Poly A位点、增强子、3'非翻译区(UTR)、5'UTR、衰减子和GC盒的部分或完整序列用作靶标。
在任何实施方式中,可在构成SC功能控制基因的核酸序列之中靶向增强子位点(例如,EGR2-结合位点、SOX10-结合位点或TEAD1-结合位点)或远端增强子位点(远端增强子区域)。
在任何实施方式中,可将构成SC功能控制基因的核酸之中的编码区用作操纵靶标。
例如,可将内含子序列或外显子序列用作靶标。另外,可靶向编码序列(例如编码区、起始编码区)以用于表达和敲除的变化。
在实施方式中,核酸的修饰可为1bp或更多的核苷酸(例如,1bp-30bp、1bp-27bp、1bp-25bp、1bp-23bp、1bp-20bp、1bp-15bp、1bp-10bp、1bp-5bp、1bp-3bp或1bp核苷酸)的置换、缺失和/或插入。
在实施方式中,对于如下而言,可靶向上述区域以使得一种或多种SC功能控制基因包含缺失或突变:一种或多种SC功能控制基因的敲除,一种或多种基因的表达的消除,或者一个、两个或三个等位基因的敲除。
在示例性实施方式中,基因的敲减可用于降低不期望的等位基因或转录物组的表达。
在实施方式中,可将基因的敲减用于通过靶向调控区、非编码区或编码区的部分或全部来改变影响施旺细胞的功能的SC功能控制基因。
在实施方式中,可控制SC功能控制基因的活性,例如,通过改变该基因的核酸来活化或使之失活。此外,施旺细胞的功能可通过该基因的核酸的变化而活化或失活。
在实施方式中,基因的核酸的修饰可催化单链或双链的切割,即通过引导核酸-编辑蛋白复合体使靶基因的特定位点处的核酸链断裂,从而导致靶基因失活。
在实施方式中,可通过诸如同源重组或非同源末端连接(NHEJ)等机制来修复核酸链的断裂。
在这种情况下,当出现NHEJ机制时,可在切割位点处诱导DNA序列的改变,从而导致基因失活。通过NHEJ进行的修复可引起短的基因片段的置换、插入或缺失,并可用于诱导相应的基因敲除或基因敲减。此外,SC功能控制基因的敲除或敲减的诱导可影响施旺细胞的功能和/或其作用机制。
另一方面,本发明提供了用于对SC功能控制因子进行操纵的组合物。
用于操纵的组合物可为能够对SC功能控制因子进行人工操纵的组合物,优选用于基因操纵的组合物。
可将该组合物用于一种或多种SC功能控制基因的基因操纵,以形成靶SC功能控制系统,所述SC功能控制基因参与形成靶SC功能控制系统(包括SC功能控制因子修饰系统)。
可考虑到基因表达控制过程来进行基因操纵。
在示例性实施方式中,可通过选择适合于如下的各个步骤的操纵方式来进行基因操纵:转录步骤、RNA加工步骤、RNA转运步骤、RNA降解步骤、翻译步骤和蛋白修饰控制步骤。
在实施方式中,小分子RNA(sRNA)使用RNA干扰(RNAi)或RNA沉默破坏mRNA或降低其稳定性,并且,在一些情况下,使mRNA断裂以干扰蛋白合成信息的传递,引起对遗传信息的表达的控制。
可通过构成SC功能控制因子的核酸的修饰来进行基因操纵。作为操纵结果,包括敲减、敲除和敲入的所有形式。
在任何实施方式中,核酸的修饰可为1bp或更多的核苷酸(例如,1bp-30bp、1bp-27bp、1bp-25bp、1bp-23bp、1bp-20bp、1bp-15bp、1bp-10bp、1bp-5bp、1bp-3bp或1bp核苷酸)的置换、缺失和/或插入。
在任何实施方式中,对于如下而言,可对该基因进行操纵以使得一种或多种SC功能控制因子包含缺失或突变:一种或多种SC功能控制因子的敲除,一种或多种因子的表达的消除,或者一个、两个或三个等位基因的敲除。
在任何实施方式中,SC功能控制因子的敲减可用于降低不期望的等位基因或转录物组的表达。
在任何实施方式中,核酸的修饰可为一个或多个核酸片段或基因的插入。在这种情况下,核酸片段可为由一个或多个核苷酸组成的核酸序列,并且核酸片段的长度可为1bp-40bp、1bp-50bp、1bp-60bp、1bp-70bp、1bp-80bp、1bp-90bp、1bp-100bp、1bp-500bp或1bp-1000bp。在这种情况下,插入的基因可为SC功能控制因子中的一种或具有不同功能的基因。
在实施方式中,核酸的修饰可利用能够催化DNA分子或RNA分子(优选DNA分子)中的核酸之间的键的水解(切割)的野生型或变体酶。核酸的修饰可利用引导核酸-编辑蛋白复合体。
例如,可使用选自于由如下所组成的组中的一种或多种核酸酶对基因进行操纵,从而控制遗传信息的表达:大范围核酸酶、锌指核酸酶、CRISPR/Cas9(Cas9蛋白)、CRISPR-Cpf1(Cpf1蛋白)以及TALE核酸酶。
在任何实施方式中,可使用引导核酸-编辑蛋白复合体(例如CRISPR/Cas系统),通过非同源末端连接(NHEJ)或同源指导修复(HDR)来介导基因操纵,但不限于此。
在这种情况下,当出现NHEJ机制时,可在切割位点处诱导DNA序列的改变,导致基因的失活或抑制其表达。由NHEJ进行的修复可引起短的基因片段的置换、插入或缺失,并可用于诱导相应的基因敲除或基因敲减。
另一方面,本发明可提供基因操纵位点。
在实施方式中,当通过NHEJ介导的改变对基因进行改变时,基因操纵位点是指引起SC功能控制基因产物的表达的降低或消除的基因中的位点。
例如,
该位点可处于起始编码区中。
该位点可处于启动子序列中。
该位点可处于增强子序列中。
该位点可处于特定的内含子序列中。
该位点可处于特定的外显子序列中。
作为一个实施方式,用于对SC功能控制因子进行操纵的组合物
可靶向影响施旺细胞功能的作为操纵对象的PMP22基因。
将PMP22基因的靶位点(即,发生基因操纵的位点或被识别用于基因操纵的位点的靶序列)的实例总结在表1、表2、表3、表4、表5、表6和表7中。
靶序列可靶向一种或多种基因。
靶序列可同时靶向两种以上的基因。在这种情况下,两种以上的基因可为同源基因或异源基因。
基因可含有一种或多种靶序列。
基因可同时靶向两种以上的靶序列。
根据靶序列的数量,可对基因的基因操纵的位置和数量进行改变。
根据靶序列的数量和位置,能够以各种方式设计基因操纵。
基因操纵可同时在两种以上的靶序列中发生。在这种情况下,两种以上的靶序列可存在于同源基因或异源基因中。
对于两种以上的基因,可同时进行基因操纵。在这种情况下,两种以上的基因可为同源基因或异源基因。
在下文中,将可用于本发明的实施方式中的靶序列的实例示于下表中:
表1.对于PMP22基因的编码序列而言的SpCas9的靶序列
表2.对于PMP22基因的编码序列而言的CjCas9的靶序列
表3.对于PMP22基因的启动子序列而言的SpCas9的靶序列
表4.对于PMP22基因的启动子序列而言的CjCas9的靶序列
表5.对于PMP22基因的增强子序列而言的SpCas9的靶序列
表6.对于PMP22基因的增强子序列而言的CjCas9的靶序列
表7.对于PMP22基因的远端增强子区B和C而言的SpCas9的靶序列。
[表1]
[表2]
[表3]
[表4]
/>
[表5]
/>
[表6]
[表7]
用于操纵基因剪刀系统的组合物
本发明的SC功能控制系统(包括SC功能控制修饰系统)可包含引导核酸-编辑蛋白复合体作为用于对SC功能控制因子(即PMP22基因)进行操纵的组合物。
引导核酸-编辑蛋白复合体
术语“引导核酸-编辑蛋白复合体”是指通过引导核酸和编辑蛋白之间的相互作用形成的复合体,该核酸-蛋白复合体包含引导核酸和编辑蛋白。
术语“引导核酸”是指能够识别靶核酸、基因、染色体或蛋白的核酸。
引导核酸能够以DNA、RNA或DNA/RNA杂交体的形式存在,并可具有5-150个碱基的核酸序列。
引导核酸可包含一个或多个结构域。
结构域可为,但不限于:引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域或尾部结构域。
引导核酸可包含两个以上的结构域,所述两个以上的结构域可为相同结构域的重复或可为不同的结构域。
引导核酸可具有一条连续的核酸序列。
例如,所述一条连续的核酸序列可为(N)m,其中N代表A、T、C或G,或者代表A、U、C或G;并且m为1-150的整数。
引导核酸可具有两条以上的连续的核酸序列。
例如,所述两条以上的连续的核酸序列可为(N)m和(N)o,其中N代表A、T、C或G,或者代表A、U、C或G;m和o为1-150的整数,并且m和o可相同或彼此不同。
术语“编辑蛋白”是指能够与核酸直接结合或无需直接结合而与核酸相互作用的肽、多肽或蛋白。
编辑蛋白可为酶。
编辑蛋白可为融合蛋白。
此处,“融合蛋白”是指通过将酶与额外的结构域、肽、多肽或蛋白融合而产生的蛋白。
术语“酶”是指含有能够切割核酸、基因、染色体或蛋白的结构域的蛋白。
额外的结构域、肽、多肽或蛋白可为具有与所述酶相同或不同的功能的功能结构域、肽、多肽或蛋白。
融合蛋白可在酶的氨基末端(N端)或其附近、羧基末端(C端)或其附近、酶的中间部分及它们的组合中的一个或多个区域处包含额外的结构域、肽、多肽或蛋白。
融合蛋白可在酶的N端或其附近、C端或其附近、酶的中间部分及它们的组合中的一个或多个区域处包含功能结构域、肽、多肽或蛋白。
引导核酸-编辑蛋白复合体可用于修饰对象。
所述对象可为靶核酸、基因、染色体或蛋白。
例如,引导核酸-编辑蛋白复合体可引起感兴趣的蛋白的表达的最终调节(例如,抑制、阻遏、减少、增加或促进)、蛋白的移除或新蛋白的表达。
此处,引导核酸-编辑蛋白复合体可在DNA、RNA、基因或染色体水平发挥作用。
引导核酸-编辑蛋白复合体可在基因转录和翻译阶段发挥作用。
引导核酸-编辑蛋白复合体可在蛋白水平发挥作用。
1.引导核酸
引导核酸为能够识别靶核酸、基因、染色体或蛋白并形成引导核酸-蛋白复合体的核酸。
此处,将引导核酸配置为对由引导核酸-蛋白复合体靶向的核酸、基因、染色体或蛋白进行识别或靶向。
引导核酸能够以DNA、RNA或DNA/RNA混合物的形式存在,并具有5-150个核酸的序列。
引导核酸能够以线性或环状存在。
引导核酸可为一条连续的核酸序列。
例如,所述一条连续的核酸序列可为(N)m,其中N为A、T、C或G,或者为A、U、C或G;m为1-150的整数。
引导核酸可为两条以上的连续的核酸序列。
例如,所述两条以上的连续的核酸序列可为(N)m和(N)o,其中N代表A、T、C或G,或代表A、U、C或G;m和o为1-150的整数,并可相同或彼此不同。
引导核酸可包含一个或多个结构域。
此处,所述结构域可为,但不限于:引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域或尾部结构域。
引导核酸可包含两个以上的结构域,所述两个以上的结构域可为相同结构域的重复或可为不同的结构域。
结构域将在下文中描述。
i)引导结构域
术语“引导结构域”为具有能够与靶基因或核酸上的靶序列形成互补结合的互补引导序列的结构域,并且用于与靶基因或核酸特异性地相互作用。
引导序列为与靶基因或核酸上的靶序列互补的核酸序列,例如具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
引导结构域可为5-50个碱基的序列。
在一个实例中,引导结构域可为具有5-50个碱基、10-50个碱基、15-50个碱基、20-50个碱基、25-50个碱基、30-50个碱基、35-50个碱基、40-50个碱基或45-50个碱基的序列。
在另一实例中,引导结构域可为具有1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
引导结构域可具有引导序列。
引导序列可为能够与靶基因或核酸上的靶序列形成互补结合的互补碱基序列。
引导序列可为与靶基因或核酸上的靶序列互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
引导序列可为5-50个碱基的序列。
在一个实例中,引导结构域可为5-50个碱基、10-50个碱基、15-50个碱基、20-50个碱基、25-50个碱基、30-50个碱基、35-50个碱基、40-50个碱基或45-50个碱基的序列。
在另一实例中,引导序列可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
另外,引导结构域可包含引导序列和额外的碱基序列。
额外的碱基序列可用于改善或降级引导结构域的功能。
额外的碱基序列可用于改善或降级引导序列的功能。
额外的碱基序列可为1-35个碱基的序列。
在一个实例中,额外的碱基序列可为5-35个碱基、10-35个碱基、15-35个碱基、20-35个碱基、25-35个碱基或30-35个碱基的序列。
在另一实例中,额外的碱基序列可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基或30-35个碱基的序列。
额外的碱基序列可位于引导序列的5'端。
额外的碱基序列可位于引导序列的3'端。
ii)第一互补结构域
术语“第一互补结构域”是包含与第二互补结构域互补的核酸序列的核酸序列,并具有足够的互补性以与第二互补结构域形成双链。
第一互补结构域可为5-35个碱基的序列。
在一个实例中,第一互补结构域可为5-35个碱基、10-35个碱基、15-35个碱基、20-35个碱基、25-35个碱基或30-35个碱基的序列。
在另一实例中,第一互补结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基或30-35个碱基的序列。
iii)接头结构域
术语“接头结构域”是连接两个以上的结构域(两个以上的相同或不同的结构域)的核酸序列。接头结构域可通过共价键合或非共价键合与两个以上的结构域连接,或者可通过共价键合或非共价键合连接两个以上的结构域。
接头结构域可为1-30个碱基的序列。
在一个实例中,接头结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或25-30个碱基的序列。
在另一实例中,接头结构域可为1-30个碱基、5-30个碱基、10-30个碱基、15-30个碱基、20-30个碱基或25-30个碱基的序列。
iv)第二互补结构域
术语“第二互补结构域”是包含与第一互补结构域互补的核酸序列的核酸序列,并具有足够的互补性以与第一互补结构域形成双链。
第二互补结构域可具有与第一互补结构域互补的碱基序列以及与第一互补结构域没有互补性的碱基序列(例如,不与第一互补结构域形成双链的碱基序列),并且可具有比第一互补结构域更长的碱基序列。
第二互补结构域可具有5-35个碱基的序列。
在一个实例中,第二互补结构域可为1-35个碱基、5-35个碱基、10-35个碱基、15-35个碱基、20-35个碱基、25-35个碱基或30-35个碱基的序列。
在另一实例中,第二互补结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基或30-35个碱基的序列。
v)近端结构域
术语“近端结构域”是指邻近于第二互补结构域定位的核酸序列。
近端结构域中可具有互补碱基序列,并且由于互补碱基序列可形成双链。
近端结构域可为1-20个碱基的序列。
在一个实例中,近端结构域可为1-20个碱基、5-20个碱基、10-20个碱基或15-20个碱基的序列。
在另一实例中,近端结构域可为1-5个碱基、5-10个碱基、10-15个碱基或15-20个碱基的序列。
vi)尾部结构域
术语“尾部结构域”是位于引导核酸的两个末端中的一个或多个末端处的核酸序列。
尾部结构域中可具有互补碱基序列,并且由于互补碱基序列可形成双链。
尾部结构域可为1-50个碱基的序列。
在一个实例中,尾部结构域可为5-50个碱基、10-50个碱基、15-50个碱基、20-50个碱基、25-50个碱基、30-50个碱基、35-50个碱基、40-50个碱基或45-50个碱基的序列。
在另一实例中,尾部结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
同时,所述结构域(即,引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域和尾部结构域)中包含的核酸序列的部分或全部可选择性地或额外地包含化学修饰。
化学修饰可为但不限于:甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基-3'硫代PACE(MSP)。
引导核酸包含一个或多个结构域。
引导核酸可包含引导结构域。
引导核酸可包含第一互补结构域。
引导核酸可包含接头结构域。
引导核酸可包含第二互补结构域。
引导核酸可包含近端结构域。
引导核酸可包含尾部结构域。
此处,可存在1个、2个、3个、4个、5个、6个或更多的结构域。
引导核酸可包含1个、2个、3个、4个、5个、6个或更多的引导结构域。
引导核酸可包含1个、2个、3个、4个、5个、6个或更多的第一互补结构域。
引导核酸可包含1个、2个、3个、4个、5个、6个或更多的接头结构域。
引导核酸可包含1个、2个、3个、4个、5个、6个或更多的第二互补结构域。
引导核酸可包含1个、2个、3个、4个、5个、6个或更多的近端结构域。
引导核酸可包含1个、2个、3个、4个、5个、6个或更多的尾部结构域。
此处,在引导核酸中,一种类型的结构域可为重复的。
引导核酸可包含具有或不具有重复的数个结构域。
引导核酸可包含相同类型的结构域。此处,相同类型的结构域可具有相同的核酸序列或不同的核酸序列。
引导核酸可包含两种类型的结构域。此处,两种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含三种类型的结构域。此处,三种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含四种类型的结构域。此处,四种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含五种类型的结构域。此处,五种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含六种类型的结构域。此处,六种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
例如,引导核酸可由[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[接头结构域]-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]组成。此处,两个引导结构域可包含用于不同或相同靶标的引导序列;两个第一互补结构域和两个第二互补结构域可具有相同或不同的核酸序列。当引导结构域包含用于不同靶标的引导序列时,引导核酸可特异性地结合至两种不同的靶标;并且此处,该特异性结合可同时或序贯地进行。此外,接头结构域可被特定的酶切割,并且在特定的酶的存在下,引导核酸可被分成两个或三个部分。
作为本发明的引导核酸的具体实例,下面将描述gRNA。
gRNA
术语“gRNA”是指能够相对于靶基因或核酸而将gRNA-CRISPR酶复合体(即,CRISPR复合体)特异性地靶向的核酸。另外,gRNA是可结合至CRISPR酶并将CRISPR酶引导至靶基因或核酸的核酸特异性RNA。
gRNA可包含多个结构域。由于各结构域,相互作用可出现在gRNA的活性形式或三维结构的链中或者这些链之间。
gRNA可被称为单链gRNA(单个RNA分子)或双链gRNA(包含多于一个、通常为两个离散的RNA分子)。
在一个示例性实施方式中,单链gRNA以5'至3'的方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)、第一个互补结构域、接头结构域、第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,由此与第一互补结构域形成双链核酸)、近端结构域以及任选的尾部结构域。
在另一实施方式中,双链gRNA可包含第一链和第二链,所述第一链包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)以及第一互补结构域;所述第二链以5'至3'的方向包含第二互补结构域(所述结构域具有与第一互补结构域序列互补的序列,由此与第一互补结构域形成双链核酸)、近端结构域以及任选的尾部结构域。
此处,第一链可指crRNA,并且第二链可指tracrRNA。crRNA可包含引导结构域和第一互补结构域;tracrRNA可包含第二互补结构域、近端结构域和任选的尾部结构域。
在又一实施方式中,单链gRNA以5'至3'的方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)、第一互补结构域、第二互补结构域、以及具有与第一互补结构域序列互补的序列(由此与第一互补结构域形成双链核酸)的结构域。
i)引导结构域
引导结构域包含能够与靶基因或核酸上的靶序列形成互补结合的互补的引导序列。引导序列可为与靶基因或核酸上的靶序列具有互补性的核酸序列,例如,具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。引导结构域被认为允许gRNA-Cas复合体(即CRISPR复合体)与靶基因或核酸特异性地相互作用。
引导结构域可为5-50个碱基的序列。
作为示例性实施方式,引导结构域可为16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
作为示例性实施方式,引导结构域可包含16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
此处,引导结构域可包含引导序列。
引导序列可为能够与靶基因或核酸上的靶序列形成互补结合的互补的碱基序列。
引导序列可为与靶基因或核酸上的靶序列互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
在一个示例性实施方式中,引导序列可为与靶基因(即,PMP22基因的靶序列)互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
引导序列可为5-50个碱基的序列。
在示例性实施方式中,引导序列可为16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
在一个示例性实施方式中,引导序列可包含16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
在一个示例性实施方式中,引导序列可为与PMP22基因的靶序列互补的核酸序列,所述引导序列为16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
此处,对于引导序列而言的靶基因(即,PMP22基因)的靶序列分别列于上文的表1、表2、表3、表4、表5、表6和表7中,但本发明不限于此。
此处,引导结构域可包含引导序列和额外的碱基序列。
额外的碱基序列可为1-35个碱基的序列。
在一个示例性实施方式中,额外的碱基序列可为1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的序列。
例如,额外的碱基序列可为单碱基序列(鸟嘌呤(G))或两个碱基的序列(GG)。
额外的碱基序列可位于引导序列的5'端。
额外的碱基序列可位于引导序列的3'端。
选择性地,引导结构域的碱基序列的部分或全部可包含化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
ii)第一互补结构域
第一互补结构域包含与第二互补结构域互补的核酸序列,并且具有足够的互补性,从而使得能够与第二互补结构域形成双链。
此处,第一互补结构域可为5-35个碱基的序列。第一互补结构域可包含5-35个碱基的序列。
在一个示例性实施方式中,第一互补结构域可为5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
在另一实施方式中,第一互补结构域可包含5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
第一互补结构域可与天然的第一互补结构域具有同源性、或可来源于天然的第一互补结构域。此外,第一互补结构域可取决于天然存在的物种而在第一互补结构域的碱基序列中具有差异、可来源于天然存在的物种中含有的第一互补结构域、或可与天然存在的物种中含有的第一互补结构域具有部分或完全的同源性。
在一个示例性实施方式中,第一互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第一互补结构域或来源于其的第一互补结构域具有部分(即至少50%以上)或完全的同源性。
例如,当第一互补结构域为酿脓链球菌的第一互补结构域或来源于其的第一互补结构域时,第一互补结构域可为5'-GUUUUAGAGCUA-3'或与5'-GUUUUAGAGCUA-3'具有部分(即至少50%以上)或完全的同源性的碱基序列。此处,第一互补结构域可进一步包含(X)n,产生5'-GUUUUAGAGCUA(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;并且n可表示碱基数,其为5-15的整数。此处,(X)n可为相同碱基的n个重复,或为n个碱基A、T、U和G的混合物。
在另一实施方式中,当第一互补结构域为空肠弯曲杆菌的第一互补结构域或来源于其的第一互补结构域时,第一互补结构域可为5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'或与5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'具有部分(即至少50%以上)或完全的同源性的碱基序列。此处,第一互补结构域可进一步包含(X)n,产生5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;并且n可表示碱基数,其为5-15的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合物。
在另一实施方式中,第一互补结构域可与如下的第一互补结构域或来源于其的第一互补结构域具有部分(即至少50%以上)或完全的同源性Parcubacteria bacterium(GWC2011_GWC2_44_17)、毛螺科菌(Lachnospiraceae bacterium)(MC2017)、Butyrivibrioproteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(Acidaminococcus sp.)(BV3L6)、猕猴卟啉单胞菌(Porphyromonas macacae)、毛螺科菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌(Prevotella disiens)、牛眼莫拉氏菌(Moraxella bovoculi)(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体(Leptospira inadai)、毛螺科菌(MA2020)、新凶手弗朗西斯菌(Francisella novicida)(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌(Eubacterium eligens)。
例如,当第一互补结构域为Parcubacteria bacterium的第一互补结构域或来源于其的第一互补结构域时,第一互补结构域可为5'-UUUGUAGAU-3'或与5'-UUUGUAGAU-3'具有部分(即至少50%以上)同源性的碱基序列。此处,第一互补结构域可进一步包含(X)n,产生5'-(X)nUUUGUAGAU-3'。X可选自于由碱基A、T、U和G所组成的组;并且n可表示碱基数,其为1-5的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合物。
选择性地,第一互补结构域的碱基序列的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
iii)接头结构域
接头结构域为连接两个以上的结构域的核酸序列,并且连接两个以上相同或不同的结构域。通过共价键合或非共价键合,接头结构域可与两个以上的结构域连接,或可连接两个以上的结构域。
接头结构域可为将第一互补结构域与第二互补结构域连接以产生单链gRNA的核酸序列。
接头结构域可通过共价键合或非共价键合与第一互补结构域和第二互补结构域连接。
接头结构域可通过共价键合或非共价键合将第一互补结构域和第二互补结构域连接。
接头结构域可为1-30个碱基的序列。接头结构域可包含1-30个碱基的序列。
在示例性实施方式中,接头结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或25-30个碱基的序列。
在示例性实施方式中,接头结构域可包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或25-30个碱基的序列。
接头结构域适合用于单链gRNA分子中,并可用于通过共价键合或非共价键合与双链gRNA的第一链和第二链连接或者将第一链与第二链连接来产生单链gRNA。接头结构域可用于通过共价键合或非共价键合与双链gRNA的crRNA和tracrRNA连接或者将crRNA与tracrRNA连接来产生单链gRNA。
接头结构域可与天然序列(例如,tracrRNA的部分序列)具有同源性,或者可来源于天然序列。
选择性地,接头结构域的碱基序列的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
iv)第二互补结构域
第二互补结构域包含与第一互补结构域互补的核酸序列,并且具有足够的互补性以与第一互补结构域形成双链。第二互补结构域可包含与第一互补结构域互补的碱基序列以及与第一互补结构域没有互补性的碱基序列(例如,不与第一互补结构域形成双链的碱基序列),并且可具有比第一互补结构域更长的碱基序列。
此处,第二互补结构域可为5-35个碱基的序列。第二互补结构域可包含5-35个碱基的序列。
在示例性实施方式中,第二互补结构域可为5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
在示例性实施方式中,第二互补结构域可包含5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
此外,第二互补结构域可与天然的第二互补结构域具有同源性,或者可来源于天然的第二互补结构域。此外,第二互补结构域可根据天然存在的物种而在第二互补结构域的碱基序列中具有差异、可来源于天然存在的物种中含有的第二互补结构域、或可与天然存在的物种中含有的第二互补结构域具有部分或完全的同源性。
在示例性实施方式中,第二互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第二互补结构域或来源于其的第二互补结构域具有部分(即至少50%以上)或完全的同源性。
例如,当第二互补结构域为酿脓链球菌的第二互补结构域或来源于其的第二互补结构域时,第二互补结构域可为5'-UAGCAAGUUAAAAU-3'或与5'-UAGCAAGUUAAAAU-3'具有部分(即,至少50%以上)同源性的碱基序列(下划线标出与第一互补结构域形成双链的碱基序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,产生5'-(X)n UAGCAAGUUAAAAU(X)m-3'。X可选自于由碱基A、T、U和G所组成的组;并且n和m各自可表示碱基数,其中n可为1-15的整数,而m可为1-6的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合物。此外,(X)m可表示相同碱基的m个重复,或者表示m个碱基A、T、U和G的混合物。
在另一实例中,当第二互补结构域为空肠弯曲杆菌的第二互补结构域或来源于其的第二互补结构域时,第二互补结构域可为5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'或与5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'具有部分(即至少50%以上)同源性的碱基序列(下划线标出与第一互补结构域形成双链的碱基序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,产生5'-(X)n AAGAAAUUUAAAAAGGGACUAAAAU(X)m-3'。X可选自于由碱基A、T、U和G所组成的组;并且n和m各自可表示碱基数,其中n可为1-15的整数,而m可为1-6的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合物。另外,(X)m可表示相同碱基的m个重复,或者表示m个碱基A、T、U和G的混合物。
在另一实施方式中,第二互补结构域可与如下的第二互补结构域或来源于其的第二互补结构域具有部分(即至少50%以上)或完全的同源性:Parcubacteria bacterium(GWC2011_GWC2_44_17)、毛螺科菌(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺科菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌、牛眼莫拉氏菌(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺科菌(MA2020)、新凶手弗朗西斯菌(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌。
例如,当第二互补结构域为Parcubacteria bacterium的第二互补结构域或来源于其的第二互补结构域时,第二互补结构域可为5'-AAAUUUCUACU-3'或与5'-AAAUUUCUACU-3'具有部分(即至少50%以上)同源性的碱基序列(下划线标出与第一互补结构域形成双链的碱基序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,产生5'-(X)nAAAUUUCUACU(X)m-3'。X可选自于由碱基A、T、U和G所组成的组;并且n和m各自可表示碱基数,其中n可为1-10的整数,而m可为1-6的整数。此处,(X)n可表示相同碱基的n个重复,或者表示n个碱基A、T、U和G的混合物。此外,(X)m可表示相同碱基的m个重复,或表示m个碱基A、T、U和G的混合物。
选择性地,第二互补结构域的碱基序列的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
v)近端结构域
近端结构域为邻近于第二互补结构域定位的1-20个碱基的序列,以及位于第二互补结构域的3’端方向的结构域。此处,近端结构域可用于在其中的互补碱基序列之间形成双链。
在一个示例性实施方式中,近端结构域可为5个、6个、7个、8个、8个、9个、10个、11个、12个、13个、14个或15个碱基的序列。
在另一实施方式中,近端结构域可包含5个、6个、7个、8个、8个、9个、10个、11个、12个、13个、14个或15个碱基的序列。
此外,近端结构域可与天然的近端结构域具有同源性,或者可来源于天然的近端结构域。此外,近端结构域可根据天然存在的物种而在碱基序列中具有差异、可来源于天然存在的物种中含有的近端结构域、或者可与天然存在的物种中含有的近端结构域具有部分或完全的同源性。
在示例性实施方式中,近端结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的近端结构域或来源于其的近端结构域具有部分(即至少50%以上)或完全的同源性。
例如,当近端结构域是酿脓链球菌的近端结构域或来源于其的近端结构域时,近端结构域可为5'-AAGGCUAGUCCG-3'或与5'-AAGGCUAGUCCG-3'具有部分(即至少50%以上)同源性的碱基序列。此处,近端结构域可进一步包含(X)n,产生5'-AAGGCUAGUCCG(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;并且n可表示碱基数,其为1-15的整数。此处,(X)n可表示相同碱基的n个重复,或表示n个碱基A、T、U和G的混合物。
在又一实例中,当近端结构域为空肠弯曲杆菌的近端结构域或来源于其的近端结构域时,近端结构域可为5'-AAAGAGUUUGC-3'或与5'-AAAGAGUUUGC-3'具有至少50%以上的同源性的碱基序列。此处,近端结构域可进一步包含(X)n,产生5'-AAAGAGUUUGC(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;并且n可表示碱基数,其为1-40的整数。此处,(X)n可表示相同碱基的n个重复,或表示n个碱基A、T、U和G的混合物。
选择性地,近端结构域的碱基序列的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
vi)尾部结构域
尾部结构域为能够被选择性地添加至单链gRNA或双链gRNA的3’端的结构域。尾部结构域可为1-50个碱基的序列,或包含1-50个碱基的序列。此处,尾部结构域可用于在其中的互补碱基序列之间形成双链。
在示例性实施方式中,尾部结构域可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
在示例性实施方式中,尾部结构域可包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
此外,尾部结构域可与天然的尾部结构域具有同源性,或者可来源于天然的尾部结构域。此外,尾部结构域可根据天然存在的物种而在碱基序列中具有差异、可来源于天然存在的物种中含有的尾部结构域、或者可与天然存在的物种中含有的尾部结构域具有部分或完全的同源性。
在一个示例性实施方式中,尾部结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的尾部结构域或来源于其的尾部结构域具有部分(即至少50%以上)或完全的同源性。
例如,当尾部结构域为酿脓链球菌的尾部结构域或来源于其的尾部结构域时,尾部结构域可为5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'或与5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'具有部分(即至少50%以上)同源性的碱基序列。此处,尾部结构域可进一步包含(X)n,产生5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;并且n可表示碱基数,其为1-15的整数。此处,(X)n可表示相同碱基的n个重复,或表示n个碱基(例如A、T、U和G)的混合物。
在另一实例中,当尾部结构域为空肠弯曲杆菌的尾部结构域或来源于其的尾部结构域时,尾部结构域可为5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'或与5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'具有部分(即至少50%以上)同源性的碱基序列。此处,尾部结构域可进一步包含(X)n,产生5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUUU(X)n-3'。X可选自于由碱基A、T、U和G所组成的组;并且n可表示碱基数,其为1-15的整数。此处,(X)n可表示相同碱基的n个重复,或表示n个碱基A、T、U和G的混合物。
在另一实施方式中,尾部结构域可在3'端包含参与体外或体内转录方法的1-10个碱基的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板的3'端的任意碱基序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可包含数个尿嘧啶碱基或替代的碱基。
选择性地,尾部结构域的碱基序列的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
gRNA可包含如上所述的多个结构域,并因此可根据gRNA中含有的结构域来调整核酸序列的长度;并且由于各结构域,相互作用可出现在处于gRNA的活性形式或三维结构的链中或者这些链之间。
gRNA可指单链gRNA(单个RNA分子)或双链gRNA(包含多于一个、通常为两个离散的RNA分子)。
双链gRNA
双链gRNA由第一链和第二链组成。
此处,第一链可由
5'-[引导结构域]-[第一互补结构域]-3'组成;以及
第二链可由
5'-[第二互补结构域]-[近端结构域]-3',或
5'-[第二互补结构域]-[近端结构域]-[尾部结构域]-3'组成。
此处,第一链可指crRNA,第二链可指tracrRNA。
第一链
引导结构域
在第一链中,引导结构域包含能够与靶基因或核酸上的靶序列形成互补结合的互补引导序列。引导序列为与靶基因或核酸上的靶序列互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。引导结构域被认为允许gRNA-Cas复合体(即CRISPR复合体)与靶基因或核酸特异性地相互作用。
此处,引导结构域可为5-50个碱基的序列,或包含5-50个碱基的序列。例如,引导结构域可为或包含16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
此外,引导结构域可包含引导序列。
此处,引导序列可为能够与靶基因或核酸上的靶序列形成互补结合的互补碱基序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
在示例性实施方式中,引导序列可为与靶基因(即,PMP22基因的靶序列)互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
此处,引导序列可为5-50个碱基的序列或包含5-50个碱基的序列。例如,引导序列可为或包含16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
在一个示例性实施方式中,引导序列为与PMP22基因的靶序列互补的核酸序列。该引导序列可为5-50个碱基的序列或包含5-50个碱基的序列。例如,该引导序列可为或包含16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
此处,对于引导序列而言的靶基因(即PMP22基因的靶序列)列于上文的表1、表2、表3、表4、表5、表6和表7中,但本发明不限于此。
选择性地,引导结构域可包含引导序列和额外的碱基序列。
此处,额外的碱基序列可为1-35个碱基的序列。例如,额外的碱基序列可为1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的序列。
在一个示例性实施方式中,额外的碱基序列可包含一个碱基(鸟嘌呤(G))或两个碱基(GG)。
此处,额外的碱基序列可位于引导结构域的5'端,或位于引导序列的5'端。
额外的碱基序列可位于引导结构域的3'端,或位于引导序列的3'端。
第一互补结构域
第一互补结构域包含与第二链的第二互补结构域互补的核酸序列,并且其为具有足够互补性以与第二互补结构域形成双链的结构域。
此处,第一互补结构域可为或包含5-35个碱基的序列。例如,第一互补结构域可为或包含5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
第一互补结构域可与天然的第一互补结构域具有同源性,或者可来源于天然的第一互补结构域。此外,第一互补结构域可根据天然存在的物种而在碱基序列中具有差异、可来源于天然存在的物种中含有的第一互补结构域、或可与天然存在的物种中含有的第一互补结构域具有部分或完全的同源性。
在一个示例性实施方式中,第一互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第一互补结构域或来源于其的第一互补结构域具有部分(即至少50%以上)或完全的同源性。
选择性地,第一互补结构域可包含不经历与第二链的第二互补结构域互补结合的额外的碱基序列。
此处,额外的碱基序列可为1-15个碱基的序列。例如,额外的碱基序列可为1-5个碱基、5-10个碱基或10-15个碱基的序列。
选择性地,引导结构域和/或第一互补结构域的碱基序列的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
因此,如上所述,第一链可由5'-[引导结构域]-[第一互补结构域]-3'组成。
此外,第一链可任选地包含额外的碱基序列。
在一个实例中,第一链可为
5’-(N靶标)-(Q)m-3’;或
5’-(X)a-(N靶标)-(X)b-(Q)m-(X)c-3’。
此处,N靶标是能够与靶基因或核酸上的靶序列形成互补结合的碱基序列,并且是可根据靶基因或核酸上的靶序列进行改变的碱基序列区域。
在一个示例性实施方式中,N靶标可为能够与靶基因(即,PMP22基因的靶序列)形成互补结合的碱基序列。
此处,(Q)m为包含第一互补结构域的碱基序列,其能够与第二链的第二互补结构域形成互补结合。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全的同源性的序列;并且根据来源的物种,可对第一互补结构域的碱基序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;并且m可为碱基数,其为5-35的整数。
例如,当第一互补结构域与酿脓链球菌的第一互补结构域或来源于酿脓链球菌的第一互补结构域具有部分或完全的同源性时,(Q)m可为5'-GUUUUAGAGCUA-3'或与5'-GUUUUAGAGCUA-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当第一互补结构域与空肠弯曲杆菌的第一互补结构域或来源于空肠弯曲杆菌的第一互补结构域具有部分或完全的同源性时,(Q)m可为5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'或与5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当第一互补结构域与嗜热链球菌的第一互补结构域或来源于嗜热链球菌的第一互补结构域具有部分或完全的同源性时,(Q)m可为5'-GUUUUAGAGCUGUGUUGUUUCG-3'或与5'-GUUUUAGAGCUGUGUUGUUUCG-3'具有至少50%或更高同源性的碱基序列。
另外,(X)a、(X)b和(X)c各自选择性地为额外的碱基序列,其中X可各自独立地选自于由A、U、C和G所组成的组;并且a、b和c各自可为碱基数,其为0或1-20的整数。
第二链
第二链可由第二互补结构域和近端结构域组成,并选择性地包含尾部结构域。
第二互补领域
在第二链中,第二互补结构域包含与第一链的第一互补结构域互补的核酸序列,并且其具有足够的互补性以与第一互补结构域形成双链。第二互补结构域可包含与第一互补结构域互补的碱基序列以及不与第一互补结构域互补的碱基序列(例如,不与第一互补结构域形成双链的碱基序列),并且可具有比第一互补结构域更长的碱基序列。
此处,第二互补结构域可为5-35个碱基的序列,或包含5-35个碱基的序列。例如,第二互补结构域可为或包含5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列,但本发明不限于此。
第二互补结构域可与天然的第二互补结构域具有同源性,或者可来源于天然的第二互补结构域。此外,第二互补结构域可根据天然存在的物种而在碱基序列中具有差异、可来源于天然存在的物种中含有的第二互补结构域、或者可与天然存在的物种中含有的第二互补结构域具有部分或完全的同源性。
在一个示例性实施方式中,第二互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第二互补结构域或来源于其的第二互补结构域具有部分(即至少50%以上)或完全的同源性。
选择性地,第二互补结构域可进一步包含不经历与第一链的第一互补结构域互补结合的额外的碱基序列。
此处,额外的碱基序列可为1-25个碱基的序列。例如,额外的碱基序列可为1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基或20-25个碱基的序列。
近端结构域
在第二链中,近端结构域为1-20个碱基的序列,并且该结构域位于第二互补结构域的3'端方向。例如,近端结构域可为或包含5个、6个、7个、8个、8个、9个、10个、11个、12个、13个、14个或15个碱基的序列。
此处,近端结构域可在其中的互补的碱基序列之间具有双链结合。
另外,近端结构域可与天然的近端结构域具有同源性,或者可来源于天然的近端结构域。此外,近端结构域可根据天然存在的物种而在碱基序列中具有差异、可来源于天然存在的物种的近端结构域、或者可与天然存在的物种的近端结构域具有部分或完全的同源性。
在一个示例性实施方式中,近端结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的近端结构域或来源于其的近端结构域具有部分(即至少50%以上)或完全的同源性。
尾部结构域
选择性地,在第二链中,尾部结构域可为被选择性地添加至第二链的3'端的结构域,并且该尾部结构域可为1-50个碱基的序列或包含1-50个碱基的序列。例如,尾部结构域可为或包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基、25-30个碱基、30-35个碱基、35-40个碱基、40-45个碱基或45-50个碱基的序列。
此处,尾部结构域可在其中的互补的碱基序列之间具有双链结合。
此外,尾部结构域可与天然的尾部结构域具有同源性,或者可来源于天然的尾部结构域。此外,尾部结构域可根据天然存在的物种而在碱基序列中具有差异、可来源于天然存在的物种中含有的尾部结构域、或者可与天然存在的物种中含有的尾部结构域具有部分或完全的同源性。
在一个示例性实施方式中,尾部结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的尾部结构域,或来源于其的尾源结构域具有部分(即至少50%以上)或完全的同源性。
在另一实施方式中,尾部结构域在3'端可包含参与体外或体内转录方法的1-10个碱基的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板的3'端的任意碱基序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可包含数个尿嘧啶碱基或替代的碱基。
选择性地,第二互补结构域、近端结构域和/或尾部结构域的碱基序列的各自的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
因此,如上所述,第二链可由5'-[第二互补结构域]-[近端结构域]-3'或5'-[第二互补结构域]-[近端结构域]-[尾部结构域]-3'组成。
此外,第二链可选择性地包含额外的碱基序列。
在一个示例性实施方式中,第二链可为5'-(Z)h-(P)k-3'或5'-(X)d-(Z)h-(X)e-(P)k-(X)f-3'。
在另一实施方式中,第二链可为5'-(Z)h-(P)k-(F)i-3'或5'-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3'。
此处,(Z)h是包含第二互补结构域的碱基序列,其能够与第一链的第一互补结构域形成互补结合。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全的同源性的序列;并且根据来源的物种,可对第二互补结构域的碱基序列进行修饰。Z可各自独立地选自于由A、U、C和G所组成的组;并且h可为碱基数,其为5-50的整数。
例如,当第二互补结构域与酿脓链球菌的第二互补结构域或来源于其的第二互补结构域具有部分或完全的同源性时,(Z)h可为5'-UAGCAAGUUAAAAU-3'或与5'-UAGCAAGUUAAAAU-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当第二互补结构域与空肠弯曲杆菌的第二互补结构域或来源于其的第二互补结构域具有部分或完全的同源性时,(Z)h可为5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'或与5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当第二互补结构域与嗜热链球菌的第二互补结构域或来源于其的第二互补结构域具有部分或完全的同源性时,(Z)h可为5'-CGAAACAACACAGCGAGUUAAAAU-3'或与5'-CGAAACAACACAGCGAGUUAAAAU-3'具有至少50%或更高同源性的碱基序列。
(P)k是包含近端结构域的碱基序列,其可与天然存在的物种的近端结构域具有部分或完全的同源性;并且根据来源的物种,可对近端结构域的碱基序列进行修饰。P可各自独立地选自于由A、U、C和G所组成的组;并且k可为碱基数,其为1-20的整数。
例如,当近端结构域与酿脓链球菌的近端结构域或来源于其的近端结构域具有部分或完全的同源性时,(P)k可为5'-AAGGCUAGUCCG-3'或与5'-AAGGCUAGUCCG-3'具有至少50%或的更高同源性的碱基序列。
在另一实例中,当近端结构域与空肠弯曲杆菌的近端结构域或来源于其的近端结构域具有部分或完全的同源性时,(P)k可为5'-AAAGAGUUUGC-3'或与5'-AAAGAGUUUGC-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当近端结构域与嗜热链球菌的近端结构域或来源于其的近端结构域具有部分或完全的同源性时,(P)k可为5'-AAGGCUUAGUCCG-3'或与5'-AAGGCUUAGUCCG-3'具有至少50%或更高同源性的碱基序列。
(F)i可为包含尾部结构域的碱基序列,其与天然存在的物种的尾部结构域具有部分或完全的同源性;并且根据来源的物种,可对尾部结构域的碱基序列进行修饰。F可各自独立地选自于由A、U、C和G所组成的组;并且i可为碱基数,其为1-50的整数。
例如,当尾部结构域与酿脓链球菌的尾部结构域或来源于其的尾部结构域具有部分或完全的同源性时,(F)i可为5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'或与5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当尾部结构域与空肠弯曲杆菌的尾部结构域或来源于其的尾部结构域具有部分或完全的同源性时,(F)i可为5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'或与5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'具有至少50%或更高同源性的碱基序列。
在又一实例中,当尾部结构域与嗜热链球菌的尾部结构域或来源于其的尾部结构域具有部分或完全的同源性时,(F)i可为5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'或与5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'具有至少50%或更高同源性的碱基序列。
此外,(F)i可在3'端包含参与体外或体内转录方法的1-10个碱基的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板的3'端的任意碱基序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可包含数个尿嘧啶碱基或替代的碱基。
另外,(X)d、(X)e和(X)f可为选择性地添加的碱基序列,其中X可各自独立地选自于由A、U、C和G所组成的组;并且d、e和f各自可为碱基数,其为0或1-20的整数。
单链gRNA
单链gRNA可分为两种类型。
i)单链gRNA
首先,存在如下的单链gRNA:其中,通过接头结构域连接双链gRNA的第一链和第二链;并且此处,单链gRNA由5'-[第一链]-[接头结构域]-[第二链]-3'组成。
具体而言,单链gRNA可由如下组成:
5'-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-3';或
5'-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-[尾部结构域]-3'。
除接头结构域外的各结构域与双链gRNA的第一链和第二链的各结构域的描述相同。
接头结构域
在单链gRNA中,接头结构域是连接第一链和第二链的结构域,具体而言,是将第一互补结构域与第二互补结构域连接以产生单链gRNA的核酸序列。此处,接头结构域可通过共价键合或非共价键合与第一互补结构域和第二互补结构域连接,或者可通过共价键合或非共价键合连接第一互补结构域和第二互补结构域。
接头结构域可为1-30个碱基的序列或包含1-30个碱基的序列。例如,接头结构域可为或包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或25-30个碱基的序列。
接头结构域适合用于单链gRNA分子中,并且可通过共价键合或非共价键合与双链gRNA的第一链和第二链连接或者连接第一链和第二链以用于产生单链gRNA。接头结构域可通过共价键合或非共价键合与双链gRNA的crRNA和tracrRNA连接或者连接crRNA和tracrRNA,以用于产生单链gRNA。
接头结构域可与天然序列(例如,tracrRNA的部分序列)具有同源性,或者可来源于天然序列。
选择性地,接头结构域的碱基序列的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
因此,如上所述,单链gRNA可由如下组成:5'-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-3';或5'-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-[尾部结构域]-3'。
此外,单链gRNA可选择性地包含额外的碱基序列。
在一个示例性实施方式中,单链gRNA可为
5’-(N靶标)-(Q)m-(L)j-(Z)h-(P)k-3’;或者
5’-(N靶标)-(Q)m-(L)j-(Z)h-(P)k-(F)i-3’。
在另一实施方式中,单链gRNA可为
5'-(X)a-(N靶标)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-3';或者
5'-(X)a-(N靶标)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3'。
此处,N靶标是能够与靶基因或核酸上的靶序列形成互补结合的碱基序列,并且N靶标是可根据靶基因或核酸上的靶序列进行改变的碱基序列区域。
在一个示例性实施方式中,N靶标为能够与靶基因(即PMP基因的靶序列)形成互补结合的碱基序列。
(Q)m含有包含第一互补结构域的碱基序列,其能够与第二互补结构域形成互补结合。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全的同源性的序列;并且根据来源的物种,可对第一互补结构域的碱基序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;并且m可为碱基数,其为5-35的整数。
例如,当第一互补结构域与酿脓链球菌的第一互补结构域或来源于其的第一互补结构域具有部分或完全的同源性时,(Q)m可为5'-GUUUUAGAGCUA-3'或与5'-GUUUUAGAGCUA-3'具有至少50%或更高的同源性的碱基序列。
在另一实例中,当第一互补结构域与空肠弯曲杆菌的第一互补结构域或来源于其的第一互补结构域具有部分或完全的同源性时,(Q)m可为5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'或与5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'具有至少50%或更高的同源性的碱基序列。
在又一实例中,当第一互补结构域与嗜热链球菌的第一互补结构域或来源于其的第一互补结构域具有部分或完全的同源性时,(Q)m可为5'-GUUUUAGAGCUGUGUUGUUUCG-3'或与5'-GUUUUAGAGCUGUGUUGUUUCG-3'具有至少50%或更高的同源性的碱基序列。
此外,(L)j是包含接头结构域的碱基序列,并将第一互补结构域和第二互补结构域连接,由此产生单链gRNA。此处,L可各自独立地选自于由A、U、C和G所组成的组;并且j可为碱基数,其为1-30的整数。
(Z)h是包含第二互补结构域的碱基序列,其能够与第一互补结构域互补结合。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全的同源性的序列;并且根据来源的物种,可对第二互补结构域的碱基序列进行改变。Z可各自独立地选自于由A、U、C和G所组成的组;并且h为碱基数,其可为5-50的整数。
例如,当第二互补结构域与酿脓链球菌的第二互补结构域或来源于其的第二互补结构域具有部分或完全的同源性时,(Z)h可为5'-UAGCAAGUUAAAAU-3'或与5'-UAGCAAGUUAAAAU-3'具有至少50%或更高的同源性的碱基序列。
在另一实例中,当第二互补结构域与空肠弯曲杆菌的第二互补结构域或来源于其的第二互补结构域具有部分或完全的同源性时,(Z)h可为5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'或与5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'具有至少50%或更高的同源性的碱基序列。
在又一实例中,当第二互补结构域与嗜热链球菌的第二互补结构域或来源于其的第二互补结构域具有部分或完全的同源性时,(Z)h可为5'-CGAAACAACACAGCGAGUUAAAAU-3'或与5'-CGAAACAACACAGCGAGUUAAAAU-3'具有至少50%或更高的同源性的碱基序列。
(P)k是包含近端结构域的碱基序列,其可与天然存在的物种的近端结构域具有部分或完全的同源性;并且根据来源的物种,可对近端结构域的碱基序列进行修饰。P可各自独立地选自于由A、U、C和G所组成的组;并且k可为碱基数,其为1-20的整数。
例如,当近端结构域与酿脓链球菌的近端结构域或来源于其的近端结构域具有部分或完全的同源性时,(P)k可为5'-AAGGCUAGUCCG-3'或与5'-AAGGCUAGUCCG-3'具有至少50%或更高的同源性的碱基序列。
在另一实例中,当近端结构域与空肠弯曲杆菌的近端结构域或来源于其的近端结构域具有部分或完全的同源性时,(P)k可为5'-AAAGAGUUUGC-3'或与5'-AAAGAGUUUGC-3'具有至少50%或更高的同源性的碱基序列。
在又一实例中,当近端结构域与嗜热链球菌的近端结构域或来源于其的近端结构域具有部分或完全的同源性时,(P)k可为5'-AAGGCUUAGUCCG-3'或与5'-AAGGCUUAGUCCG-3'具有至少50%或更高的同源性的碱基序列。
(F)i可为包含尾部结构域的碱基序列,并且与天然存在的物种的尾部结构域具有部分或完全的同源性;并且根据来源的物种,可对尾部结构域的碱基序列进行修饰。F可各自独立地选自于由A、U、C和G所组成的组;并且i可为碱基数,其为1-50的整数。
例如,当尾部结构域与酿脓链球菌的尾部结构域或来源于其的尾部结构域具有部分或完全的同源性时,(F)i可为5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'或与5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'具有至少50%或更高同源性的碱基序列。
在另一实例中,当尾部结构域与空肠弯曲杆菌的尾部结构域或来源于其的尾部结构域具有部分或完全的同源性时,(F)i可为5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'或与5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'具有50%或更高的同源性的碱基序列。
在又一实例中,当尾部结构域与嗜热链球菌的尾部结构域或来源于其的尾部结构域具有部分或完全的同源性时,(F)i可为5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'或与5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'具有至少50%或更高的同源性的碱基序列。
此外,(F)i可在3'端包含参与体外或体内转录方法的1-10个碱基的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板的3'端的任意碱基序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可包含数个尿嘧啶碱基或替代的碱基。
此外,(X)a、(X)b、(X)c、(X)d、(X)e和(X)f可为选择性地添加的碱基序列,其中X可各自独立地选自于由A、U、C和G所组成的组;并且a、b、c、d、e和f各自可为碱基数,其为0或1-20的整数。
ii)单链gRNA
其次,单链gRNA可为由引导结构域、第一互补结构域和第二互补结构域组成的单链gRNA;并且此处,单链gRNA可由如下组成:
5'-[第二互补结构域]-[第一互补结构域]-[引导结构域]-3';或者
5'-[第二互补结构域]-[接头结构域]-[第一互补结构域]-[引导结构域]-3'。
引导结构域
在单链gRNA中,引导结构域包含能够与靶基因或核酸上的靶序列形成互补结合的互补引导序列。引导序列可为与靶基因或核酸上的靶序列具有互补性的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高互补性或完全的互补性。引导结构域被认为允许gRNA-Cas复合体(即CRISPR复合体)与靶基因或核酸特异性地相互作用。
此处,引导结构域可为或包含5-50个碱基的序列。例如,引导结构域可为或包含16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
此外,引导结构域可包含引导序列。
此处,引导序列可为能够与靶基因或核酸上的靶序列形成互补结合的互补碱基序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
在一个示例性实施方式中,引导序列可为与靶基因(即PMP22基因的靶序列)互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
此处,引导序列可为5-50个碱基的序列或包含5-50个碱基的序列。例如,引导序列可为或包含16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
在一个示例性实施方式中,引导序列为与PMP22基因的靶序列互补的核酸序列。该引导序列可为5-50个碱基的序列或包含5-50个碱基的序列。例如,该引导序列可为或包含16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
此处,对于引导序列而言的靶基因(即PMP22基因)的靶序列分别列于上文的表1、表2、表3、表4、表5、表6和表7中,但本发明不限于此。
选择性地,引导结构域可包含引导序列和额外的碱基序列。
此处,额外的碱基序列可为1-35个碱基的序列。例如,额外的碱基序列可为1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的序列。
在一个示例性实施方式中,额外的碱基序列可为单个碱基的序列(鸟嘌呤(G))或两个碱基的序列(GG)。
此处,额外的碱基序列可位于引导结构域的5'端、或位于引导序列的5'端。
额外的碱基序列可位于引导结构域的3'端、或位于引导序列的3'端。
第一互补结构域
第一互补结构域是包含与第二互补结构域互补的核酸序列的结构域,并具有足够的互补性以与第二互补结构域形成双链。
此处,第一互补结构域可为5-35个碱基的序列或包含5-35个碱基的序列。例如,第一互补结构域可为或包含5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
第一互补结构域可与天然的第一互补结构域具有同源性,或者可来源于天然的第一互补结构域。此外,第一互补结构域可取决于天然存在的物种而在第一互补结构域的碱基序列中具有差异、可来源于天然存在的物种中含有的第一互补结构域、或者可与天然存在的物种中含有的第一互补结构域具有部分或完全的同源性。
在一个示例性实施方式中,第一互补结构域可与如下的第一互补结构域或来源于其的第一互补结构域具有部分(即至少50%以上)或完全的同源性:Parcubacteriabacterium(GWC2011_GWC2_44_17)、毛螺科菌(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺科菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌、牛眼莫拉氏菌(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺科菌(MA2020)、新凶手弗朗西斯菌(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌。
选择性地,第一互补结构域可包含不经历与第二互补结构域的互补结合的额外的碱基序列。
此处,额外的碱基序列可为1-15个碱基的序列。例如,额外的碱基序列可为1-5个碱基、5-10个碱基或10-15个碱基的序列。
第二互补结构域
第二互补结构域包含与第一互补结构域互补的核酸序列,并且具有足够的互补性以与第一互补结构域形成双链。第二互补结构域可包含与第一互补结构域互补的碱基序列以及与第一互补结构域没有互补性的碱基序列(例如,不与第一互补结构域形成双链的碱基序列),并且可具有比第一互补结构域更长的碱基序列。
此处,第二互补结构域可为或包含5-35个碱基的序列。例如,第二互补结构域可为5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
第二互补结构域可与天然的第二互补结构域具有同源性,或者可来源于天然的第二互补结构域。此外,第二互补结构域可根据天然存在的物种而在第二互补结构域的碱基序列中具有差异、可来源于天然存在的物种中含有的第二互补结构域、或者可与天然存在的物种中含有的第二互补结构域具有部分或完全的同源性。
在一个示例性实施方式中,第二互补结构域可与如下的第二互补结构域或来源其的第二互补结构域具有部分(即至少50%以上)或完全的同源性:Parcubacteriabacterium(GWC2011_GWC2_44_17)、毛螺科菌(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺科菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌、牛眼莫拉氏菌(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺科菌(MA2020)、新凶手弗朗西斯菌(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌。
选择性地,第二互补结构域可包含不经历与第一互补结构域的互补结合的额外的碱基序列。
此处,额外的碱基序列可为1-15个碱基的序列。例如,额外的碱基序列可为1-5个碱基、5-10个碱基或10-15个碱基的序列。
接头结构域
选择性地,接头结构域是连接第一互补结构域和第二互补结构域以产生单链gRNA的核酸序列。此处,接头结构域可通过共价键合或非共价键合与第一互补结构域和第二互补结构域连接或者可连接第一互补结构域和第二互补结构域。
接头结构域可为1-30个碱基的序列或包含1-30个碱基的序列。例如,接头结构域可为或包含1-5个碱基、5-10个碱基、10-15个碱基、15-20个碱基、20-25个碱基或25-30个碱基的序列。
选择性地,引导结构域、第一互补结构域、第二互补结构域和接头结构域的碱基序列的部分或全部可具有化学修饰。化学修饰可为甲基化、乙酰化、磷酸化、硫代磷酸酯键、锁核酸(LNA)、2'-O-甲基3'硫代磷酸酯(MS)或2'-O-甲基3'硫代PACE(MSP),但本发明不限于此。
因此,如上所述,单链gRNA可由如下组成:5'-[第二互补结构域]-[第一互补结构域]-[引导结构域]-3';或5'-[第二互补结构域]-[接头结构域]-[第一互补结构域]-[引导结构域]-3'。
此外,单链gRNA可选择性地包含额外的碱基序列。
在一个示例性实施方式中,单链gRNA可为
5'-(Z)h-(Q)m-(N靶标)-3';或者
5'-(X)a-(Z)h-(X)b-(Q)m-(X)c-(N靶标)-3'。
在另一示例性实施方式中,单链gRNA可为:
5'-(Z)h-(L)j-(Q)m-(N靶标)-3';或者
5'-(X)a-(Z)h-(L)j-(Q)m-(X)c-(N靶标)-3'。
此处,N靶标是能够与靶基因或核酸上的靶序列形成互补结合的碱基序列,以及N靶标是可根据靶基因或核酸上的靶序列进行改变的碱基序列区域。
在一个示例性实施方式中,N靶标可为能够与靶基因(即PMP22基因的靶序列)形成互补结合的碱基序列。
(Q)m是包含第一互补结构域的碱基序列,其能够与第二链的第二互补结构域形成互补结合。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全的同源性的序列;并且根据来源的物种,可对第一互补结构域的碱基序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;并且m可为碱基数,其为5-35的整数。
例如,当第一互补结构域与Parcubacteria bacterium的第一互补结构域或来源于其的第一互补结构域具有部分或完全的同源性时,(Q)m可为5'-UUUGUAGAU-3'或与5'-UUUGUAGAU-3'具有至少50%或更高同源性的碱基序列。
(Z)h是包含第二互补结构域的碱基序列,其能够与第一链的第一互补结构域形成互补结合。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全的同源性的序列;并且根据来源的物种,可对第二互补结构域的碱基序列进行修饰。Z可各自独立地选自于由A、U、C和G所组成的组;并且h可为是碱基数,其可为5-50的整数。
例如,当第二互补结构域与Parcubacteria bacterium的第二互补结构域或来源于其的第二互补结构域具有部分或完全的同源性时,(Z)h可为5'-AAAUUUCUACU-3'或与5'-AAAUUUCUACU-3'具有至少50%或更高同源性的碱基序列。
此外,(L)j是包含接头结构域的碱基序列,它将第一互补结构域和第二互补结构域连接。此处,L可各自独立地选自于由A、U、C和G所组成的组;并且j可为碱基数,其为1-30的整数。
此外,(X)a、(X)b和(X)c各自选择性地为额外的碱基序列,其中X可各自独立地选自于由A、U、C和G所组成的组;并且a、b和c可为碱基数,其为0或1-20的整数。
2.编辑蛋白
编辑蛋白是指能够直接结合至核酸或无需直接结合而与核酸相互作用的肽、多肽或蛋白。
核酸可为靶核酸、基因或染色体中含有的核酸。
核酸可为引导核酸。
编辑蛋白可为酶。
编辑蛋白可为融合蛋白。
此处,融合蛋白是指通过将酶与额外的结构域、肽、多肽或蛋白融合而产生的蛋白。
酶是指包含能够切割核酸、基因、染色体或蛋白的结构域的蛋白。
酶可为核酸酶、蛋白酶或限制性酶。
所述额外的结构域、肽、多肽或蛋白可为具有与所述酶相同或不同的功能的功能结构域、肽、多肽或蛋白。
融合蛋白可在酶的N端或其附近、酶的C端或其附近、酶的中间区域以及它们的组合中的一处或多处包含额外的结构域、肽、多肽或蛋白。
融合蛋白可在酶的N端或其附近、酶的C端或其附近、酶的中间区域及它们的组合中的一处或多处包含功能结构域、肽、多肽或蛋白。
此处,功能结构域、肽、多肽或蛋白可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域、肽、多肽或蛋白,或者为用于分离和纯化蛋白(包括肽)的标签或报告基因,但本发明不限于此。
功能结构域、肽、多肽或蛋白可为脱氨酶。
标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;并且报告基因包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸苷酶、荧光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。
此外,功能结构域、肽、多肽或蛋白可为核定位序列或信号(NLS)或者核输出序列或信号(NES)。
NLS可为:具有氨基酸序列PKKKRKV的SV40病毒大T抗原的NLS;来源于核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK的核质蛋白双分型NLS);具有氨基酸序列PAAKRVKLD或RQRRNELKRSP的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY的hRNPA1M9NLS;来源于输入蛋白α的IBB结构域序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;肌瘤T蛋白序列VSRKRPRP和PPKKARED;人p53序列POPKKKPL;小鼠c-ablIV序列SALIKKKKKMAP;流感病毒NS1序列DRLRR和PKQKKRK;丁型肝炎病毒抗原序列RKLKKKIKKL;小鼠Mx1蛋白序列REKKKFLKRR;人多聚(ADP-核糖)聚合酶序列KRKGDEVDGVDEVAKKKSKK;或者类固醇激素受体(人)糖皮质激素序列RKCLQAGMNLEARKTKK,但本发明不限于此。
编辑蛋白可包括具有完全活性的酶。
此处,“具有完全活性的酶”是指具有与野生型酶的功能相同的功能的酶,并且例如,切割双链DNA的野生型酶具有将双链DNA全部切割的完全的酶活性。
此外,具有完全活性的酶包括与野生型酶的功能相比具有改善的功能的酶,并且例如,与野生型酶相比,切割双链DNA的野生型酶的特定的修饰或操纵类型具有改善的完全的酶活性,即切割双链DNA的活性。
编辑蛋白可包括具有不完全或部分活性的酶。
此处,“具有不完全或部分活性的酶”是指具有野生型酶的部分功能的酶,并且例如,切割双链DNA的野生型酶的特定的修饰或操纵类型具有切割双链的一部分(即单链DNA)的不完全或部分的酶活性。
编辑蛋白可包括失活的酶。
此处,“失活的酶”是指其中野生型酶的功能完全失活的酶。例如,切割双链DNA的野生型酶的特定的修饰或操纵类型没有活性,从而完全不能切割双链DNA。
编辑蛋白可为天然的酶或融合蛋白。
编辑蛋白能够以部分修饰的天然酶或融合蛋白的形式存在。
编辑蛋白可为在天然状态下不存在的人工产生的酶或融合蛋白。
编辑蛋白能够以在天然状态下不存在的经部分修饰的人工酶或融合蛋白的形式存在。
此处,修饰可为对编辑蛋白中含有的氨基酸进行置换、移除、添加或上述修饰的组合。
此外,修饰可为对编码编辑蛋白的碱基序列中的部分碱基进行置换、移除、添加或上述修饰的组合。
作为本发明的编辑蛋白的一个示例性实施方式,将在下文描述CRISPR酶。
CRISPR酶
术语“CRISPR酶”是CRISPR-Cas系统的主要的蛋白成分,并与gRNA形成复合体,从而产生CRISPR-Cas系统。
CRISPR酶是具有编码CRISPR酶的序列的核酸或多肽(或蛋白),并且代表性地,II型CRISPR酶或V型CRISPR酶已广泛使用。
II型CRISPR酶为Cas9,所述Cas9可来源于多种微生物,例如酿脓链球菌、嗜热链球菌、链球菌属、金黄色葡萄球菌、达松维尔拟诺卡氏菌、始旋链霉菌、产绿色链霉菌、产绿色链霉菌、粉红链孢囊菌、粉红链孢囊菌、AlicyclobacHlus acidocaldarius、假真菌样芽孢杆菌、Bacillus selenitireducens、Exiguobacterium sibiricum、德氏乳杆菌、唾液乳杆菌、Microscilla marina、Burkholderiales bacterium、Polaromonasnaphthalenivorans、极单孢菌属、瓦氏鳄球藻、蓝杆藻属、铜绿微囊藻、聚球藻属、阿拉伯糖醋盐杆菌、Ammonifex degensii、Caldicelulosiruptor bescii、CandidatusDesulforudis、肉毒梭状芽孢杆菌、艰难梭状芽孢杆菌、Finegoldia magna、Natranaerobius thermophilus、Pelotomaculum thermopropionicu、喜温嗜酸硫杆菌、嗜酸氧化亚铁硫杆菌、Allochromatium vinosum、海杆菌属、嗜盐亚硝化球菌、Nitrosococcuswatsoni、游海假交替单胞菌、Ktedonobacter racemifer、Methanohalobium evestigatum、多变鱼腥藻、泡沫节球藻、念珠藻属、极大节旋藻、钝顶节旋藻、节旋藻属、鞘丝藻属、原型微鞘藻、颤藻属、Petrotoga mobilis、非洲栖热腔菌或Acaryochloris marina。
术语“Cas9”是与gRNA结合从而切割或修饰靶基因或核酸上的靶序列或位置的酶,并且可由HNH结构域(能够切割与gRNA形成互补结合的核酸链)、RuvC结构域(能够切割与gRNA形成互补结合的核酸链)、REC结构域(识别靶标)以及PI结构域(识别PAM)组成。对于Cas9的具体结构特征,可参考Hiroshi Nishimasu等,(2014)Cell 156:935-949。
此外,V型CRISPR酶可为Cpf1,其可来源于如下:链球菌属(Streptococcus)、弯曲杆菌属(Campylobacter)、Nitratifractor、葡萄球菌属(Staphylococcus)、Parvibaculum、罗氏菌属(Roseburia)、奈瑟菌属(Neisseria)、葡糖醋杆菌属(Gluconacetobacter)、固氮螺菌属(Azospirillum)、Sphaerochaeta、乳杆菌属(Lactobacillus)、真杆菌属(Eubacterium)、棒状杆菌属(Corynebacter)、肉杆菌属(Carnobacterium)、红杆菌属(Rhodobacter)、李斯特菌属(Listeria)、Paludibacter、梭菌属(Clostridium)、毛螺科菌属(Lachnospiraceae)、Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西斯菌属(Francisella)、军团杆菌属(Legionella)、脂环酸芽孢杆菌(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、拟杆菌属(Bacteroidetes)、创伤球菌属(Helcococcus)、钩端螺旋体属(Letospira)、脱硫弧菌属(Desulfovibrio)、脱硫弯曲杆菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、肿块芽孢杆菌属(Tuberibacillus)、芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacilus)、甲基杆菌属(Methylobacterium)或氨基酸球菌属(Acidaminococcus)。
Cpf1可由RuvC结构域(类似并对应于Cas9的RuvC结构域)、Nuc结构域(无Cas9的HNH结构域)、REC结构域(识别靶标)、WED结构域以及PI结构域(识别PAM)组成。对于Cpf1的具体结构特征,可参见Takashi Yamano等,(2016)Cell 165:949-962。
可从天然存在的微生物中分离或者通过重组或合成方法非天然地产生Cas9或Cpf1蛋白的CRISPR酶。
II型CRISPR酶
根据针对两种以上类型的天然微生物II型CRISPR酶分子的研究(Jinek等,Science,343(6176):1247997,2014)以及针对酿脓链球菌Cas9(SpCas9)与gRNA复合的研究(Nishimasu等,Cell,156:935-949,2014;以及Anders等,Nature,2014,doi:10.1038/nature13579)确定了II型CRISPR酶的晶体结构。
II型CRISPR酶包含两个裂片(lobes),即识别(REC)裂片和核酸酶(NUC)裂片,并且各裂片包含数个结构域。
REC裂片包含富含精氨酸的桥螺旋(BH)结构域、REC1结构域和REC2结构域。
此处,BH结构域为长α螺旋且富含精氨酸的区域,而REC1和REC2结构域在识别gRNA(例如,单链gRNA、双链gRNA或tracrRNA)中形成的双链中起重要作用。
NUC裂片包含RuvC结构域、HNH结构域和PAM相互作用(PI)结构域。此处,RuvC结构域包括RuvC样结构域,或者将HNH结构域用于包括HNH样结构域。
此处,RuvC结构域与具有II型CRISPR酶的天然存在的微生物家族的成员共享结构相似性,并切割单链(例如,靶基因或核酸的非互补链,即不与gRNA形成互补结合的链)。在本领域中,RuvC结构域有时指RuvCI结构域、RuvCII结构域或RuvCIII结构域,并且一般称为RuvCI、RuvCII或RuvCIII。例如,在SpCas9的情况中,RuvC结构域由位于SpCas9的第1-59位、第718-769位和第909-1098位氨基酸的序列处的三个分离的RuvC结构域(RuvCI、RuvCII和RuvCIII)各自组装成。
HNH结构域与HNH核酸内切酶共享结构相似性,并切割单链(例如靶核酸分子的互补链,即与gRNA形成互补结合的链)。HNH结构域位于RuvCII和RuvCIII基序之间。例如,在SpCas9的情况中,HNH结构域位于SpCas9的第775-908位的氨基酸序列处。
PI结构域识别靶基因或核酸中的特定的碱基序列(即前间隔邻近基序(PAM))或与PAM相互作用。例如,在SpCas9的情况中,PI结构域位于SpCas9的第1099-1368位氨基酸的序列处。
此处,PAM可根据II型CRISPR酶的来源而变化。例如,当CRISPR酶是SpCas9,PAM可为5'-NGG-3';当CRISPR酶是嗜热链球菌Cas9(StCas9)时,PAM可为5'-NNAGAAW-3'(W=A或T);当CRISPR酶是脑膜炎奈瑟菌Cas9(NmCas9)时,PAM可为5'-NNNNGATT-3';并且当CRISPR酶是空肠弯曲杆菌Cas9(CjCas9)时,PAM可为5'-NNNVRYAC-3'(V=G或C或A,R=A或G,Y=C或T),其中,N可为A、T、G或C,或者A、U、G或C。
V型CRISPR酶
V型CRISPR酶包含类似的RuvC结构域(对应于II型CRISPR酶的RuvC结构域),并且可由Nuc结构域(而不是II型CRISPR酶的HNH结构域)、REC结构域和WED结构域(识别靶标)以及PI结构域(识别PAM)组成。对于V型CRISPR酶的具体结构特征,可参见Takashi Yamano等(2016)Cell 165:949-962。
V型CRISPR酶可与gRNA相互作用,从而形成gRNA-CRISPR酶复合体,即CRISPR复合体,并且可在gRNA的协作下允许引导序列接近包含PAM序列的靶序列。此处,V型CRISPR酶与靶基因或核酸相互作用的能力依赖于PAM序列。
PAM序列是存在于靶基因或核酸中的序列,并可被V型CRISPR酶的PI结构域识别。PAM序列可根据V型CRISPR酶的来源改变。即,取决于物种,存在能够被特异性识别的不同的PAM序列。
在一个实例中,由Cpf1识别的PAM序列可为5'-TTN-3'(N为A、T、C或G)。
CRISPR酶活性
CRISPR酶切割靶基因或核酸的双链或单链,并具有引起双链或单链的断裂或缺失的核酸酶活性。通常,野生型II型CRISPR酶或V型CRISPR酶切割靶基因或核酸的双链。
为了对CRISPR酶的上述核酸酶活性进行操纵或修饰,可对CRISPR酶进行操纵或修饰,可将此类经操纵或修饰的CRISPR修饰成具有不完全或部分活性、或失活的酶。
具有不完全或部分活性的酶
经修饰而改变其酶活性从而表现出不完全或部分活性的CRISPR酶称为切口酶(nickase)。
术语“切口酶”是指经操纵或修饰以仅切割靶基因或核酸的双链中的一条链的CRISPR酶,并且切口酶具有切割单链(例如不与靶基因或核酸的gRNA互补的链或与其互补的链)的核酸酶活性。因此,为了切割双链,需要两种切口酶的核酸酶活性。
例如,切口酶通过RuvC结构域可具有核酸酶活性。即,切口酶可包含HNH结构域的核酸酶活性,并且为此可对HNH结构域进行操纵或修饰。
在一个实例中,如果CRISPR酶是II型CRISPR酶,
在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9的氨基酸序列中的第840位残基由组氨酸突变为丙氨酸时,将HNH结构域的核酸酶活性失活以用作切口酶。由于由此产生的切口酶具有RuvC结构域的核酸酶活性,它能够切割靶基因或核酸的非互补链,即不与gRNA形成互补结合的链。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9的氨基酸序列中的第559位残基由组氨酸突变为丙氨酸时,将HNH结构域的核酸酶活性失活以用作切口酶。由此产生的切口酶通过RuvC结构域具有核酸酶活性,并因此能够切割靶基因或核酸的非互补链,即不与gRNA形成互补结合的链。
例如,切口酶通过HNH结构域可具有核酸酶活性。即,切口酶可包含RuvC结构域的核酸酶活性,并且为此可对RuvC结构域进行操纵或修饰。
在一个实例中,如果CRISPR酶是II型CRISPR酶,
在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9的氨基酸序列中的第10位残基由天冬氨酸突变为丙氨酸时,将RuvC结构域的核酸酶活性失活以用作切口酶。由此产生的切口酶具有HNH结构域的核酸酶活性,并因此能够切割靶基因或核酸的互补链,即与gRNA形成互补结合的链。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9的氨基酸序列中的第8位残基由天冬氨酸突变为丙氨酸时,将RuvC结构域的核酸酶活性失活以用作切口酶。由此产生的切口酶具有HNH结构域的核酸酶活性,并因此能够切割靶基因或核酸的互补链,即与gRNA形成互补结合的链。
失活的酶
经修饰而使酶活性完全失活的CRISPR酶称为失活的CRISPR酶。
术语“失活的CRISPR酶”是指经修饰而完全不切割靶基因或核酸的双链的CRISPR酶,并且由于野生型CRISPR酶的具有核酸酶活性的结构域中的突变,失活的CRISPR酶不具核酸酶活性。失活的CRISPR酶可为其中RuvC结构域和HNH结构域的核酸酶活性失活的酶。
例如,可对失活的CRISPR酶在RuvC结构域和HNH结构域进行操纵或修饰,从而使得核酸酶活性失活。
在一个实例中,如果CRISPR酶是II型CRISPR酶,在一个示例性实施方式中,在SpCas9的情况下,当分别将SpCas9的氨基酸序列中的第10位和第840位残基由天冬氨酸和组氨酸突变为丙氨酸时,通过RuvC结构域和HNH结构域的核酸酶活性失活,从而使得完全不能切割靶基因或核酸的双链。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9的氨基酸序列中的第8位和第559位残基由天冬氨酸和组氨酸突变为丙氨酸时,通过RuvC结构域和HNH结构域的核酸酶活性失活,从而使得完全不能切割靶基因或核酸的双链。
其它活性
除上述核酸酶活性外,CRISPR酶还可具有核酸内切酶活性、核酸外切酶活性或解旋酶活性(即,使得双链核酸的螺旋结构退火的能力)。
此外,可对CRISPR酶进行修饰以完全、不完全或部分地激活CRISPR酶的核酸内切酶活性、核酸外切酶活性或解旋酶活性。
CRISPR酶的靶向
CRISPR酶可与gRNA相互作用,从而形成gRNA-CRISPR酶复合体,即CRISPR复合体,并且可在gRNA的协作下使得引导序列接近包含PAM序列的靶序列。此处,CRISPR酶与靶基因或核酸相互作用的能力依赖于PAM序列。
PAM序列是存在于靶基因或核酸中的序列,其可被CRISPR酶的PI结构域识别。PAM序列可根据CRISPR酶的来源改变。即,根据物种,存在能够被特异性识别的多种PAM序列。
在一个实例中,如果CRISPR酶是II型CRISPR酶,
在SpCas9的情况下,PAM序列可为5'-NGG-3'、5'-NAG-3'和/或5'-NGA-3';
在StCas9的情况下,PAM序列可为5'-NGGNG-3'和/或5'-NNAGAAW-3'(W=A或T);
在NmCas9的情况下,PAM序列可为5'-NNNNGATT-3'和/或5'-NNNGCTT-3';
在CjCas9的情况下,PAM序列可为5'-NNNVRYAC-3'(V=G、C或A;R=A或G;Y=C或T);
在变形链球菌(Streptococcus mutans)Cas9(SmCas9)的情况下,PAM序列可为5'-NGG-3'和/或5'-NAAR-3'(R=A或G);以及
在金黄色葡萄球菌Cas9(SaCas9)的情况下,PAM序列可为5'-NNGRR-3'、5'-NNGRRT-3'和/或5'-NNGRRV-3'(R=A或G;V=G、C或A)。
在另一实例中,如果CRISPR酶是V型CRISPR酶,
在Cpf1的情况下,PAM序列可为5'-TTN-3'。
此处,N可为A、T、G或C;或者A、U、G或C。
可利用取决于物种能够被特异性识别的PAM序列对能够识别特定的PAM序列的CRISPR酶进行操纵或修饰。例如,可用CjCas9的PI结构域替换SpCas9的PI结构域,以便具有SpCas9的核酸酶活性并识别CjCas9特异性的PAM序列,从而产生识别CjCas9特异性的PAM序列的SpCas9。可通过PI结构域的置换或替换来改变特异性识别的PAM序列。
CRISPR酶突变体
可对CRISPR酶进行修饰来改善或抑制多种特征,例如核酸酶活性、解旋酶活性、与gRNA相互作用的能力、以及接近靶基因或核酸的能力(例如CRISPR酶的PAM识别能力)。
此外,CRISPR酶突变体可为如下的CRISPR酶:其与gRNA相互作用以形成gRNA-CRISPR酶复合体(即CRISPR复合体),并经修饰或操纵以改善靶特异性,从而使得当接近或定位至靶基因或核酸时,仅切割靶基因或核酸的双链或单链,而不切割与gRNA部分地形成互补结合的非靶基因或核酸的双链或单链以及不与gRNA形成互补结合的非靶基因或核酸的双链或单链。
此处,将对与gRNA部分地形成互补结合的非靶基因或核酸的双链或单链以及不与gRNA形成互补结合的非靶基因或核酸的双链或单链进行切割的效应称为脱靶效应,将与gRNA部分地形成互补结合的非靶基因或核酸或者不与gRNA形成互补结合的非靶基因或核酸的位置或碱基序列称为脱靶靶标。此处,可存在一个或多个脱靶靶标。另一方面,将对靶基因或核酸的双链或单链进行切割的效应称为中靶效应,并将靶基因或核酸的位置或靶序列称为中靶靶标。
CRISPR酶突变体在天然存在的CRISPR酶的至少一个氨基酸处进行修饰,与未修饰的CRISPR酶相比,可对各种特征(例如核酸酶活性、解旋酶活性、与gRNA相互作用的能力、接近靶基因或核酸的能力以及靶特异性)的一种或多种进行修饰(例如改善或抑制)。此处,修饰可为氨基酸的置换、移除、添加或它们的混合。
在CRISPR酶突变体中,
修饰可为对位于存在于天然产生的CRISPR酶中的由带正电的氨基酸组成的区域中的一个或两个以上的氨基酸进行的修饰。
例如,修饰可为对存在于天然产生的CRISPR酶中的带正电的氨基酸(例如赖氨酸(K)、精氨酸(R)和组氨酸(H))中的一个或两个以上的氨基酸进行的修饰。
修饰可为对位于存在于天然产生的CRISPR酶中的由不带正电的氨基酸组成的区域中的一个或两个以上的氨基酸进行的修饰。
例如,修饰可为对存在于天然产生的CRISPR酶中的不带正电氨基酸(即天冬氨酸(D)、谷氨酸(E)、丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W))中的一个或两个以上的氨基酸进行的修饰。
在另一实例中,修饰可为对存在于天然产生的CRISPR酶中的不带电氨基酸(即丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W))中的一个或两个以上的氨基酸进行的修饰。
此外,修饰可为对存在于天然产生的CRISPR酶中的一个或两个以上的带疏水性残基的氨基酸进行的修饰。
例如,修饰可为对存在于天然产生的CRISPR酶中的甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W)中的一个或两个以上的氨基酸进行的修饰。
修饰可为对存在于天然产生的CRISPR酶中的一个或两个以上的带极性残基的氨基酸进行的修饰。
例如,修饰可为对存在于天然产生的CRISPR酶中的丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、赖氨酸(K)、精氨酸(R)、组氨酸(H)、天冬氨酸(D)和谷氨酸(E)中的一个或两个以上的氨基酸进行的修饰。
此外,修饰可为对存在于天然产生的CRISPR酶中的包括赖氨酸(K)、精氨酸(R)和组氨酸(H)在内的氨基酸中的一个或两个以上进行的修饰。
例如,修饰可为对存在于天然产生的CRISPR酶中的包括赖氨酸(K)、精氨酸(R)和组氨酸(H)在内的氨基酸中的一个或两个以上进行的置换。
修饰可为对存在于天然产生的CRISPR酶中的包括天冬氨酸(D)和谷氨酸(E)在内的氨基酸中的一个或两个以上进行的修饰。
例如,修饰可为对存在于天然产生的CRISPR酶中的包括天冬氨酸(D)和谷氨酸(E)在内的氨基酸中的一个或两个以上进行的置换。
修饰可为对存在于天然产生的CRISPR酶中的包括丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W)在内的氨基酸中的一个或两个以上进行的修饰。
例如,修饰可为对存在于天然产生的CRISPR酶中的包括丝氨酸(S)、苏氨酸(T)、天冬酰胺(N)、谷氨酰胺(Q)、半胱氨酸(C)、脯氨酸(P)、甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、苯丙氨酸(F)、酪氨酸(Y)和色氨酸(W)在内的氨基酸中的一个或两个以上进行的置换。
此外,修饰可为对存在于天然产生的CRISPR酶中的一个、两个、三个、四个、五个、六个、七个或更多个氨基酸进行的修饰。
此外,在CRISPR酶突变体中,
修饰可为对CRISPR酶的RuvC结构域中存在的一个或两个以上的氨基酸进行的修饰。此处,RuvC结构域可为RuvCI、RuvCII或RuvCIII结构域。
修饰可为对CRISPR酶的HNH结构域中存在的一个或两个以上的氨基酸进行的修饰。
修饰可为对CRISPR酶的REC结构域中存在的一个或两个以上的氨基酸进行的修饰。
修饰可为对CRISPR酶的PI结构域中存在的一个或两个以上的氨基酸进行的修饰。
修饰可为对CRISPR酶的REC、RuvC、HNH和PI结构域中的至少两个或更多个结构域中含有的两个以上的氨基酸进行的修饰。
在一个实例中,修饰可为对CRISPR酶的REC和RuvC结构域中含有的两个以上的氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC和RuvC结构域中含有的A203、H277、G366、F539、I601、M763、D965和F1038氨基酸中的至少两个或更多个进行的修饰。
在另一实例中,修饰可为对CRISPR酶的REC和HNH结构域中含有的两个以上的氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC和HNH结构域中含有的A203、H277、G366、F539、I601和K890氨基酸中的至少两个或更多个进行的修饰。
在一个实例中,修饰可为对CRISPR酶的REC和PI结构域中含有的两个以上的氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC和PI结构域中含有的A203、H277、G366、F539、I601、T1102和D1127氨基酸中的至少两个或更多个进行的修饰。
在另一实例中,修饰可为对CRISPR酶的REC、RuvC和HNH结构域中含有的三个以上的氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC、RuvC和HNH结构域中含有的A203、H277、G366、F539、I601、M763、K890、D965和F1038氨基酸中的至少三个或更多个进行的修饰。
在一个实例中,修饰可为对CRISPR酶的REC、RuvC和PI结构域中含有的三个以上的氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC、RuvC和PI结构域中含有的A203、H277、G366、F539、I601、M763、D965、F1038、T1102和D1127氨基酸中的至少三个或更多个进行的修饰。
在另一实例中,修饰可为对CRISPR酶的REC、HNH和PI结构域中含有的三个以上的氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC、HNH和PI结构域中含有的A203、H277、G366、F539、I601、K890、T1102和D1127氨基酸中的至少三个或更多个进行的修饰。
在一个实例中,修饰可为对CRISPR酶的RuvC、HNH和PI结构域中含有的三个以上的氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的RuvC、HNH和PI结构域中含有的M763、K890、D965、F1038、T1102和D1127氨基酸中的至少三个或更多个进行的修饰。
在另一实例中,修饰可为对CRISPR酶的REC、RuvC、HNH和PI结构域中含有的四个以上的氨基酸进行的修饰。
在一个示例性实施方式中,在SpCas9突变体中,修饰可为对SpCas9的REC、RuvC、HNH和PI结构域中含有的A203、H277、G366、F539、I601、M763、K890、D965、F1038、T1102和D1127氨基酸中的至少四个或更多个进行的修饰。
此外,在CRISPR酶突变体中,
修饰可为对参与CRISPR酶的核酸酶活性的一个或两个以上的氨基酸进行的修饰。
例如,在SpCas9突变体中,修饰可为对由如下氨基酸所组成的组中的一个或两个以上的氨基酸进行的修饰:D10、E762、H840、N854、N863以及D986;或者修饰可为对由对应于其它Cas9直系同源物的氨基酸所组成的组中的一个或两个以上的氨基酸进行的修饰。
修饰可为用于将CRISPR酶的核酸酶活性部分地失活的修饰,并且此类CRISPR酶突变体可为切口酶。
此处,修饰可为用于将CRISPR酶的RuvC结构域的核酸酶活性失活的修饰,并且此类CRISPR酶突变体不能切割靶基因或核酸的非互补链(即不与gRNA形成互补结合的链)。
在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9的氨基酸序列的第10位残基由天冬氨酸突变为丙氨酸(即D10A突变)时,RuvC结构域的核酸酶活性失活,并因此可将SpCas9用作切口酶。由此产生的切口酶不能切割靶基因或核酸的非互补链(即不与gRNA形成互补结合的链)。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9的氨基酸序列的第8位残基由天冬氨酸突变为丙氨酸(即D8A突变)时,RuvC结构域的核酸酶活性失活,并因此可将CjCas9用作切口酶。由此产生的切口酶不能切割靶基因或核酸的非互补链(即不与gRNA形成互补结合的链)。
此外,此处,修饰可为用于将CRISPR酶的HNH结构域的核酸酶活性失活的修饰,并且此类CRISPR酶突变体不能切割靶基因或核酸的互补链(即与gRNA形成互补结合的链)。
在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9的氨基酸序列的第840位残基由组氨酸突变为丙氨酸(即H840A突变)时,HNH结构域的核酸酶活性失活,并因此可将SpCas9用作切口酶。由此产生的切口酶不能切割靶基因或核酸的互补链(即与gRNA形成互补结合的链)。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9的氨基酸序列的第559位残基由组氨酸突变为丙氨酸(即H559A突变)时,HNH结构域的核酸酶活性失活,并因此可将CjCas9用作切口酶。由此产生的切口酶不能切割靶基因或核酸的互补链(即与gRNA形成互补结合的链)。
此外,修饰可为用于将CRISPR酶的核酸酶活性完全失活的修饰,并且此类CRISPR酶突变体可为失活的CRISPR酶。
此处,修饰可为用于将CRISPR酶的RuvC和HNH结构域的核酸酶活性失活的修饰,并且此类CRISPR酶突变体不能切割靶基因或核酸的双链。
在一个示例性实施方式中,在SpCas9的情况下,当将SpCas9的氨基酸序列的第10位和第840位残基分别由天冬氨酸和组氨酸突变为丙氨酸(即D10A和H840A突变)时,RuvC结构域和HNH结构域的核酸酶活性失活,靶基因或核酸的双链可能完全不被切割。
在另一示例性实施方式中,在CjCas9的情况下,当将CjCas9的氨基酸序列的第8位和第559位残基分别由天冬氨酸和组氨酸突变为丙氨酸(即D8A和H559A突变)时,通过RuvC结构域和HNH结构域的核酸酶活性失活,并因此靶基因或核酸的双链可能完全不被切割。
此外,除CRISPR酶的固有特征外,CRISPR酶突变体还可进一步包含任选的功能结构域,并且此类CRISPR酶突变体可具有除固有特征外的额外特征。
此处,功能结构域可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域,或者为用于分离和纯化蛋白(包括肽)的标签或报告基因,但本发明不限于此。
功能结构域、肽、多肽或蛋白可为脱氨酶。
例如,不完整或部分的CRISPR酶可额外包含胞苷脱氨酶作为功能结构域。在一个示例性实施方式中,可将胞苷脱氨酶(例如载脂蛋白B编辑复合体1(APOBEC1))添加至SpCas9切口酶,从而生成融合蛋白。由此形成的[SpCas9切口酶]-[APOBEC1]可用于由C到T或U、或者由G到A的编辑或者碱基修复中。
标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;并且报告基因包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸苷酶、荧光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。
此外,功能结构域可为核定位序列或信号(NLS)或者核输出序列或信号(NES)。
在一个实例中,CRISPR酶可包含一个或多个NLS。此处,一个或多个NLS可被包含在CRIPSR酶的N端或其附近、酶的C端或其附近或者它们的组合。NLS可为来源于如下NLS的NLS序列,但本发明不限于此:具有氨基酸序列PKKKRKV的SV40病毒大T抗原的NLS;来源于核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK的核质蛋白双分型NLS);具有氨基酸序列PAAKRVKLD或RQRRNELKRSP的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY的hRNPA1 M9 NLS;来自输入蛋白α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;肌瘤T蛋白的序列VSRKRPRP和PPKKARED;人p53的序列POPKKKPL;小鼠c-abl IV的序列SALIKKKKKMAP;流感病毒NS1的序列DRLRR和PKQKKRK;丁型肝炎病毒抗原的序列RKLKKKIKKL;小鼠Mx1蛋白的序列REKKKFLKRR;人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK;或者来源于类固醇激素受体(人)糖皮质激素的序列的NLS序列RKCLQAGMNLEARKTKK。
此外,CRISPR酶突变体可包括通过将CRISPR酶分为两个以上的部分而制备的拆分型(split-type)CRISPR酶。术语“拆分”是指对蛋白的功能或结构性划分,或者将蛋白随机划分为两个以上的部分。
此处,拆分型CRISPR酶可为具有完全活性的酶、具有不完全或部分活性的酶或者失活的酶。
例如,可在第656位残基(酪氨酸)和第657位残基(苏氨酸)之间将SpCas9分为两部分,从而生成拆分型SpCas9。
此外,拆分型CRISPR酶可选择性地包含用于重构的额外的结构域、肽、多肽或蛋白。
此处,“重构”是指拆分型CRISPR酶形成为在结构上与野生型CRISPR酶相同或类似。
用于重构的额外的结构域、肽、多肽或蛋白可为FRB和FKBP二聚化结构域;内含肽(intein);ERT和VPR结构域;或者在特定条件下形成异二聚体的结构域。
例如,可在第713位残基(丝氨酸)和第714位残基(甘氨酸)之间将SpCas9分为两个部分,从而生成拆分的SpCas9。可将FRB结构域连接至两个部分中的一个部分,并可将FKBP结构域连接至另一部分。在由此产生的拆分的SpCas9中,FRB结构域和FKBP结构域能够在存在雷帕霉素的环境中以二聚体形成,从而产生重构的CRISPR酶。
本发明所述的CRISPR酶或CRISPR酶突变体可为多肽、蛋白或者具有编码其的序列的核酸,并可针对将引入所述CRISPR酶或CRISPR酶突变体的对象进行密码子优化。
术语“密码子优化”是指通过在保持天然氨基酸序列的同时将天然序列的至少一个密码子替换为在宿主细胞中更频繁使用或最常使用的密码子以改善在宿主细胞中的表达,来对核酸序列修饰的过程。多种物种对特定氨基酸的特定密码子具有特定偏好,并且该密码子偏好(不同生物体间密码子使用的差别)常与mRNA的翻译效率相关,这被认为取决于所翻译的密码子的特征和特定tRNA分子的可用性。细胞中选择的优势tRNA通常反映了肽合成中最常使用的密码子。因此,可通过基于密码子优化在给定的生物体中的最优的基因表达来对基因进行定制化。
3.靶序列
术语“靶序列”是存在于靶基因或核酸中并与引导核酸的引导结构域中含有的引导序列具有互补性的碱基序列。靶序列是可根据靶基因或核酸(即用于基因操纵或修正的对象)而改变的碱基序列,可根据靶基因或核酸将其设计为多种形式。
靶序列可与引导核酸的引导结构域中含有的引导序列形成互补结合,并且靶序列的长度可与引导序列的长度相同。
靶序列可为5-50个碱基的序列。
在实施方式中,靶序列可为16个、17个、18个、19个、20个、21个、22个、23个、24个或25个碱基的序列。
靶序列可为与引导核酸的引导结构域中含有的引导序列互补的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高的互补性或完全的互补性。
在一个实例中,靶序列可为1-8个碱基的序列或包含1-8个碱基的序列,其与引导核酸的引导结构域中含有的引导序列不互补。
此外,靶序列可为邻近能够被编辑蛋白识别的核酸序列的碱基序列。
在一个实例中,靶序列可为邻近能够被编辑蛋白识别的核酸序列的5'端和/或3'端的连续的5-50个碱基的序列。
在一个示例性实施方式中,gRNA-CRISPR酶复合体的靶序列将在下文中描述。
当靶基因或核酸被gRNA-CRISPR酶复合体靶向时,
靶序列对gRNA的引导结构域中含有的引导序列具有互补性。靶序列是根据靶基因或核酸(即基因操纵或修正的对象)而改变的碱基序列,可根据靶基因或核酸将其设计为多种形式。
此外,靶序列可为邻近能够被CRISPR酶(即Cas9或Cpf1)识别的PAM序列的碱基序列。
在一个实例中,靶序列可为邻近被CRISPR酶识别的PAM序列的5'端和/或3'端的连续的5-50个碱基的序列。
在一个示例性实施方式中,当CRISPR酶是SpCas9时,靶序列可为邻近5'-NGG-3'、5'-NAG-3'和/或5'-NGA-3'(N=A、T、G或C,或者A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在另一示例性实施方式中,当CRISPR酶是StCas9时,靶序列可为邻近5'-NGGNG-3'和/或5'-NNAGAAW-3'(W=A或T;N=A、T、G或C,或者A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在又一示例性实施方式中,当CRISPR酶是NmCas9时,靶序列可为邻近5'-NNNNGATT-3'和/或5'-NNNGCTT-3'(N=A、T、G或C,或者A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在一个示例性实施方式中,当CRISPR酶是CjCas9时,靶序列可为邻近5'-NNNVRYAC-3'(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或者A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在另一示例性实施方式中,当CRISPR酶是SmCas9时,靶序列可为邻近5'-NGG-3'和/或5'-NAAR-3'(R=A或G;N=A、T、G或C,或者A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在又一示例性实施方式中,当CRISPR酶是SaCas9时,靶序列可为邻近5'-NNGRR-3'、5'-NNGRRT-3'和/或5'-NNGRRV-3'(R=A或G;V=G、C或A;N=A、T、G或C,或者A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在一个示例性实施方式中,当CRISPR酶是Cpf1时,靶序列可为邻近5'-TTN-3'(N=A、T、G或C,或者A、U、G或C)序列的5'端和/或3'端的连续的16-25个碱基的序列。
在本发明的一个示例性实施方式中,
靶序列可为PMP22基因中含有的核酸序列。
可替代地,
靶序列可为PMP22基因的部分核酸序列。
可替代地,靶序列可为PMP22基因的编码区或非编码区或它们的混合物的核酸序列。
可替代地,
靶序列可为PMP22基因的启动子、TATA盒、CAAT盒、起始位点、终止位点、供体剪接位点、受体剪接位点、Poly A位点、增强子、3'UTR(非翻译区)、5'UTR、衰减子和GC盒或其混合物的核酸序列。
可替代地,
靶序列可为PMP22基因的外显子、内含子或其混合物的核酸序列。
可替代地,
靶序列可为包含或邻近PMP22基因的突变区域(例如,不同于野生型基因的区域)的核酸序列。
可替代地,
靶序列可为PMP22基因的连续的5-50个核酸的序列。
作为本发明的一个示例性实施方式,将PMP22基因的上述靶序列总结于表1、表2、表3、表4、表5、表6和表7中。
[经操纵的SC功能控制因子的产物]
4.引导核酸-编辑蛋白复合体及其用途
引导核酸-编辑蛋白复合体可对靶标进行修饰。
靶标可为靶核酸、基因、染色体或蛋白。
例如,引导核酸-编辑蛋白复合体可用于对感兴趣的蛋白的表达进行最终调控(例如抑制、阻遏、降低、升高或促进)、移除蛋白、对蛋白活性进行调控(例如抑制、阻遏、降低、升高或促进)或表达新蛋白。
此处,引导核酸-编辑蛋白复合体可在DNA、RNA、基因或染色体水平发挥作用。
例如,引导核酸-编辑蛋白复合体可通过对靶DNA进行操纵或修饰来对靶DNA编码的蛋白的表达进行调控(例如抑制、阻遏、降低、升高或促进)、移除蛋白、对蛋白活性进行调控(例如抑制、阻遏、降低、升高或促进)或表达经修饰的蛋白。
在另一实例中,引导核酸-编辑蛋白复合体可通过对靶RNA进行操纵或修饰来对靶DNA编码的蛋白的表达进行调控(例如抑制、阻遏、降低、升高或促进)、移除蛋白、对蛋白活性进行调控(例如抑制、阻遏、降低、升高或促进)或表达经修饰的蛋白。
在一个实例中,引导核酸-编辑蛋白复合体可通过对靶基因进行操纵或修饰来对靶DNA编码的蛋白的表达进行调控(例如抑制、阻遏、降低、升高或促进)、移除蛋白、对蛋白活性进行调控(例如抑制、阻遏、降低、升高或促进)或表达经修饰的蛋白。
在另一实例中,引导核酸-编辑蛋白复合体可通过对靶染色体进行操纵或修饰来对靶DNA编码的蛋白的表达进行调控(例如抑制、阻遏、降低、升高或促进)、移除蛋白、对蛋白活性进行调控(例如抑制、阻遏、降低、升高或促进)或表达经修饰的蛋白。
引导核酸-编辑蛋白复合体可在基因转录和翻译阶段发挥作用。
在一个实例中,引导核酸-编辑蛋白复合体可促进或阻遏靶基因的转录,从而对靶基因编码的蛋白的表达进行调控(例如抑制、阻遏、降低、升高或促进)。
在另一实例中,引导核酸-编辑蛋白复合体可促进或阻遏靶基因的翻译,从而对靶基因编码的蛋白的表达进行调控(例如抑制、阻遏、降低、升高或促进)。
引导核酸-编辑蛋白复合体可在蛋白水平发挥作用。
在一个实例中,引导核酸-编辑蛋白复合体可对靶蛋白进行操纵或修饰,从而移除靶蛋白或对蛋白活性进行调控(例如抑制、阻遏、降低、升高或促进)。
在一个示例性实施方式中,本发明提供了用于操纵SC功能控制因子(例如PMP22基因)的引导核酸-编辑蛋白复合体。优选地,提供了gRNA-CRISPR酶复合体。
特别是,本发明可提供包含能够与来自基因的靶序列形成互补结合的引导结构域的gRNA,例如,分离的gRNA或非天然的gRNA以及编码其的DNA。可将gRNA以及编码其的DNA序列设计成能够互补性地结合至表1、表2、表3、表4、表5、表6和表7中列出的靶序列。
此外,将gRNA的靶区域设计成提供第三基因,所述第三基因具有核酸修饰(例如双链断裂或单链断裂);或在PMP22基因的靶位点处具有特定功能。
此外,当将两个以上的gRNA用于在靶基因中诱导两个以上的切割事件(例如,双链或单链断裂)时,由于相同或不同的Cas9蛋白可发生两个以上的切割事件。
gRNA例如
可靶向PMP22基因的两个以上的区域,并且
可独立地诱导PMP22基因的双链和/或单链的切割,或者
可诱导一个外源核苷酸向PMP22基因的切割位点中的插入。
此外,在本发明的另一示例性实施方式中,构成引导核酸-编辑蛋白复合体的核酸可包含:
(a)编码包含引导结构域的引导核酸的序列,所述引导结构域与本文所述的PMP22基因的靶序列互补;以及
(b)编码编辑蛋白的序列。
此处,根据靶区域,可存在两种以上的(a);并且(b)可利用相同的编辑蛋白或两种以上的编辑蛋白。
在实施方式中,可将核酸设计为靶向酶促活化的编辑蛋白或其部分活化的编辑蛋白以将其置于足够邻近敲除或敲减的靶位点,以减少、降低或抑制PMP22基因的表达。
在另一实施方式中,可将核酸设计为靶向酶促失活的编辑蛋白或其融合蛋白(例如,转录阻遏物结构域融合体)以将其置于足够邻近敲减的靶位点,以减少、降低或抑制PMP22基因的表达。
此外,显而易见的是,在SC功能控制因子(即PMP22基因)的操纵中将利用上述的引导核酸-编辑蛋白复合体的结构、功能和所有应用。
引导核酸-编辑蛋白复合体的用途
在本发明的引导核酸-编辑蛋白复合体的用途的实施方式中,下面将对利用gRNA-CRISPR酶复合体对靶DNA、RNA、基因或染色体进行的操纵或修饰加以描述。
基因操纵
可使用上述的gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或核酸进行操纵或修正。此处,对靶基因或核酸的操纵或修正包括如下的全部阶段:i)对靶基因或核酸进行切割或破坏;以及ii)对经破坏的靶基因或核酸进行修复。
i)靶基因或核酸的切割或破坏
i)靶基因或核酸的切割或破坏可为使用CRISPR复合体对靶基因或核酸进行的切割或破坏,并且尤其是,对靶基因或核酸中的靶序列进行的切割或破坏。
在一个实例中,使用CRISPR复合体对靶基因或核酸进行的切割或破坏可为将靶序列的双链完全切割或破坏。
在一个示例性实施方式中,当使用野生型SpCas9时,与gRNA形成互补结合的靶序列的双链可被完全切割。
在另一示例性实施方式中,当使用SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,SpCas9切口酶(D10A)可切割与gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与gRNA形成互补结合的靶序列的非互补单链,并且可序贯地或同时进行切割。
在又一示例性实施方式中,当使用SpCas9切口酶(D10A)和SpCas9切口酶(H840A)以及具有不同的靶序列的两条gRNA时,SpCas9切口酶(D10A)可切割与第一gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与第二gRNA形成互补结合的靶序列的非互补单链,并且可序贯地或同时进行切割。
在另一实例中,使用CRISPR复合体对靶基因或核酸进行的切割或破坏可为仅对靶序列的单链进行的切割或破坏。此处,单链可为与gRNA形成互补结合的靶序列的互补单链或与gRNA形成互补结合的靶序列的非互补单链。
在一个示例性实施方式中,当使用SpCas9切口酶(D10A)时,SpCas9切口酶(D10A)可切割与gRNA形成互补结合的靶序列的互补单链,而与gRNA形成互补结合的靶序列的非互补单链不能被切割。
在另一示例性实施方式中,当使用SpCas9切口酶(H840A)时,SpCas9切口酶(H840A)可切割与gRNA形成互补结合的靶序列的非互补单链,而与gRNA形成互补结合的靶序列的互补单链不能被切割。
在又一实例中,使用CRISPR复合体对靶基因或核酸进行的切割或破坏可为部分移除核酸片段。
在一个示例性实施方式中,当使用具有不同靶序列的两条gRNA和野生型SpCas9时,可对与第一gRNA形成互补结合的靶序列的双链进行切割,并可对与第二gRNA形成互补结合的靶序列的双链进行切割,从而通过第一gRNA和第二gRNA以及SpCas9移除核酸片段。
在另一示例性实施方式中,当使用具有不同的靶序列的两条gRNA、野生型SpCas9、SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,野生型SpCas9可切割与第一gRNA形成互补结合的靶序列的双链,SpCas9切口酶(D10A)可切割与第二gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割非互补单链,从而通过第一gRNA和第二gRNA、野生型SpCas9、SpCas9切口酶(D10A)以及SpCas9切口酶(H840A)移除核酸片段。
在又一示例性实施方式中,当使用具有不同的靶序列的两条gRNA、SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,SpCas9切口酶(D10A)可切割与第一gRNA形成互补结合的靶序列的互补单链,SpCas9切口酶(H840A)可切割非互补单链,SpCas9切口酶(D10A)可切割与第二gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割非互补单链,从而通过第一gRNA和第二gRNA、SpCas9切口酶(D10A)以及SpCas9切口酶(H840A)移除核酸片段。
在又一示例性实施方式中,当使用具有不同的靶序列的三条gRNA、野生型SpCas9、SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,野生型SpCas9可切割与第一gRNA形成互补结合的靶序列的双链,SpCas9切口酶(D10A)可切割与第二gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与第三gRNA形成互补结合的靶序列的非互补单链,从而通过第一gRNA、第二gRNA、第三gRNA、野生型SpCas9、SpCas9切口酶(D10A)以及SpCas9切口酶(H840A)移除核酸片段。
在又一示例性实施方式中,当使用具有不同的靶序列的四条gRNA、SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,SpCas9切口酶(D10A)可切割与第一gRNA形成互补结合的靶序列的互补单链,SpCas9切口酶(H840A)可切割与第二gRNA形成互补结合的靶序列的非互补单链,SpCas9切口酶(D10A)可切割与第三gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与第四gRNA形成互补结合的靶序列的非互补单链,从而通过第一gRNA、第二gRNA、第三gRNA、第四gRNA、SpCas9切口酶(D10A)以及SpCas9切口酶(H840A)移除核酸片段。
ii)经破坏的靶基因或核酸的修复或恢复
可借助NHEJ和同源指导的修复(HDR)来对通过CRISPR复合体切割或破坏的靶基因或核酸进行修复或恢复。
非同源末端连接(NHEJ)
NHEJ是通过将被切割的双链或单链的两端进行连接来对DNA中的双链断裂进行恢复或修复的方法,一般而言,当将通过双链断裂(例如切割)形成的两个相容末端频繁地彼此接触以将两个末端完全连接时,被破坏的双链得以修复。NHEJ是能够用于整个细胞周期中的恢复方法,并且通常当在细胞中不存在用作模板的同源基因组时(例如G1期)发生。
在利用NHEJ对经破坏的基因或核酸进行修复的过程中,核酸序列中的一些插入和/或缺失(插入缺失)出现在NHEJ修复区中,此类插入和/或缺失导致读码框位移,产生移码突变的转录组mRNA。结果是,由于无义介导的降解或无法合成正常蛋白,固有功能丧失。此外,虽然读码框得以维持,在其中插入或缺失相当量的序列的突变也可导致破坏蛋白的功能。由于相比蛋白的非重要区域的突变,重要的功能结构域中的突变可能几乎不被容忍,突变为基因座依赖性的。
虽然不能预期在天然状态下由NHEJ产生的插入缺失突变,特定的插入缺失序列优选位于给定的经破坏的区域中,并可来自微同源的小区域。常规地,缺失的长度范围为1bp-50bp,插入趋向于更短,并通常包含直接包围经破坏的区域的短的重复序列。
此外,NHEJ是造成突变的过程,并且当不必须产生特定的最终序列时,可将NHEJ用于对小的序列的基序进行删除。
可使用该NHEJ进行由CRISPR复合体靶向的基因的特异性敲除。可使用CRISPR酶(例如Cas9或Cpf1)切割靶基因或核酸的双链或两条单链,并可通过NHEJ使靶基因或核酸的经破坏的双链或两条单链具有插入缺失,从而诱导靶基因或核酸的特异性敲除。此处,由CRISPR酶切割的靶基因或核酸的位点可为非编码区或编码区;此外,由NHEJ恢复的靶基因或核酸的位点可在非编码区或编码区。
同源指导的修复(HDR)
HDR是无错的修正方法,其使用同源序列作为模板以对经破坏的基因或核酸进行修复或恢复,一般而言,为修复或恢复受损DNA(即,恢复细胞的固有信息),利用未被修饰的互补碱基序列的信息或者姐妹染色单体的信息对经破坏的DNA进行修复。HDR最常见的类型为同源重组(HR)。HDR是通常出现在活跃分裂的细胞的S期或G2/M期的修复或恢复方法。
为使用HDR而不使用细胞的姐妹染色单体或互补碱基序列对经破坏的DNA进行修复或恢复,可将使用互补碱基序列或同源碱基序列的信息人工合成的DNA模板(即,包含互补碱基序列或同源碱基序列的核酸模板)提供至细胞,从而修复经破坏的DNA。此处,当将核酸序列或核酸片段进一步添加至核酸模板来修复经破坏的DNA时,可使进一步添加至经破坏的DNA的核酸序列或核酸片段经受敲入。进一步添加的核酸序列或核酸片段可为用于对由正常基因或核酸的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸,但本发明不限于此。
在一个实例中,可使用CRISPR复合体切割靶基因或核酸的双链或单链,可将核酸模板(该核酸模板包含与邻近切割位点的碱基序列互补的碱基序列)提供至细胞,并可通过HDR修复或恢复靶基因或核酸被切割的碱基序列。
此处,包含互补碱基序列的核酸模板可具有经破坏的DNA(即,互补碱基序列中被切割的双链或单链),并进一步包含待插入至经破坏DNA中的核酸序列或核酸片段。可使用包含待插入互补碱基序列中的核酸序列或核酸片段的核酸模板将额外的核酸序列或核酸片段插入至经破坏的DNA(即,靶基因或核酸)的被切割的位点。此处,待插入的核酸序列或核酸片段以及额外的核酸序列或核酸片段可为用于对由正常基因或核酸的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸。互补碱基序列可为与经破坏的DNA互补结合的碱基序列(即,靶基因或核酸的被切割的双链或单链的左侧或右侧的碱基序列)。或者,互补碱基序列可为与经破坏的DNA互补结合的碱基序列(即,靶基因或核酸的被切割的双链或单链的5'和3'端)。互补碱基序列可为15-3000个碱基的序列,可根据核酸模板或靶基因的大小对互补碱基序列的长度或大小进行适当设计。此处,作为核酸模板,可使用双链或单链的核酸,或者其可为线性或环状,但本发明不限于此。
在另一实例中,使用CRISPR复合体切割双链或单链的靶基因或核酸,将核酸模板(该核酸模板包含具有邻近切割位点的碱基序列的同源碱基序列)提供至细胞,并可通过HDR修复或恢复靶基因或核酸的被切割的碱基序列。
此处,包含同源碱基序列的核酸模板可为经破坏的DNA(即,被切割的双链或单链的同源碱基序列),并进一步包含待插入至经破坏的DNA的核酸序列或核酸片段。可使用包含待插入的核酸序列或核酸片段和同源碱基序列的核酸模板将额外的核酸序列或核酸片段插入至经破坏的DNA(即,靶基因或核酸的被切割的位点)。此处,待插入的核酸序列或核酸片段以及额外的核酸序列或核酸片段可为用于对由正常基因或核酸的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸。同源碱基序列可为经破坏的DNA,即,与靶基因或核酸的左侧和右侧的单链碱基序列或被切割的双链碱基序列具有同源性的碱基序列。或者,同源碱基序列可为与经破坏的DNA(即,靶基因或核酸的被切割的双链或单链的3'和5'端)具有同源性的碱基序列。同源碱基序列可为15-3000个碱基的序列,并且可根据核酸模板或者靶基因或核酸的大小对同源碱基序列的长度或大小进行适当设计。此处,作为核酸模板,可使用双链或单链的核酸,并且其可为线性或环状,但本发明不限于此。
除了NHEJ和HDR之外,还存在对经破坏的DNA进行修复或恢复的方法。
单链退火(SSA)
SSA是对靶核酸中存在的两个重复序列间的双链断裂进行修复的方法,并且通常使用多于30个碱基的重复序列。对重复序列进行切割(以产生粘性末端),从而相对于靶核酸双链在各经破坏的末端产生单链;并且,在切割后,用RPA蛋白对含有重复序列的单链垂悬部分(overhang)进行包覆,从而防止重复序列彼此的不适当的退火。RAD52结合至垂悬部分上的各重复序列,并安置能够对互补重复序列进行退火的序列。退火后,垂悬部分的单链瓣状物(flap)被切割,并且合成新DNA来填充特定的缺口,从而恢复DNA双链。作为该修复的结果,两个重复之间的DNA序列被删除,并且删除长度可取决于多种因素(包括此处使用的两个重复的位置和切割的路径或进行程度)。
为了对靶核酸序列进行修饰或修正,与HDR类似,SSA使用互补序列(即互补重复序列);而与之不同的是,SSA不需要核酸模板。
单链断裂修复(SSBA)
通过与上述修复机制不同的机制,SSBR对基因组中的单链断裂进行修复。在单链DNA断裂的情况下,PARP1和/或PARP2识别断裂并动员修复机制。对于DNA断裂,PARP1的结合和活性是暂时的,并且通过促进在经破坏的区域中的SSBR蛋白复合体的稳定性来促进SSBR。SSBR复合体中最重要的蛋白是XRCC1,它与促进DNA的3'和5'端加工的蛋白相互作用来稳定DNA。末端加工通常涉及将经破坏的3'端修复为羟基化状态和/或将经破坏的5'端修复为含磷酸盐的部分,并且在末端加工后,发生DNA缺口填充。存在两种DNA缺口填充方法,即短补丁修复和长补丁修复,并且短补丁修复涉及单碱基的插入。在DNA缺口填充后,DNA连接酶促进末端连接。
错配修复(MMR)
MMR作用于错配的DNA碱基。MSH2/6或MSH2/3复合体各自具有ATPase活性,并因此在识别错配和起始修复中起到重要作用,并且MSH2/6主要识别碱基-碱基错配并鉴别出一个或两个碱基的错配,而MSH2/3主要识别更长的错配。
碱基切除修复(BER)
BER是在整个细胞周期中均活跃的修复方法,并用于从基因组中移除小的非螺旋扭曲的碱基破坏的区域。在经破坏的DNA中,通过切割将碱基连接至磷酸-脱氧核糖骨架的N-糖苷键来移除经破坏的碱基,随后切割磷酸二酯骨架,从而生成单链DNA中的断裂。移除由此形成的经破坏的单链末端,用新的互补碱基填充由于移除的单链造成的缺口,随后通过DNA连接酶将新填充的互补碱基的末端与骨架连接,引起对经破坏的DNA的修复。
核苷酸切除修复(NER)
NER是对于从DNA中移除大的螺旋扭曲破坏而言重要的切除机制,并且当识别到破坏时,移除含有经破坏的区域的短的单链DNA片段,产生22-30个碱基的单链缺口。用新的互补碱基填充所产生的缺口,并通过DNA连接酶将新填充的互补碱基的末端连接至骨架,产生对经破坏的DNA的修复。
基因操纵效果
对靶基因或核酸的操纵或修正主要可产生敲除、敲减和敲入的效果。
敲除
术语“敲除”是指靶基因或核酸的失活,而“靶基因或核酸的失活”是指不发生靶基因或核酸的转录和/或翻译的状态。通过敲除可对造成疾病的基因或具有异常功能的基因的转录和翻译进行抑制,从而阻止蛋白表达。
例如,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或核酸进行编辑或修正时,可使用CRISPR复合体对靶基因或核酸进行切割。可利用CRISPR复合体通过NHEJ对经破坏的靶基因或核酸进行修复。由于NHEJ,经破坏的靶基因或核酸可具有插入缺失,并由此可诱导靶基因或核酸的特定的敲除。
敲减
术语“敲减”是指靶基因或核酸的转录和/或翻译或者靶蛋白的表达降低。通过敲减对基因或蛋白的过表达进行调控,可预防发病或可治疗疾病。
例如,当利用gRNA-CRISPR失活酶-转录抑制活性结构域复合体(即,包含转录抑制活性结构域的CRISPR失活复合体)对靶基因或核酸进行编辑或修正时,CRISPR失活复合体可特异性地结合至靶基因或核酸,可通过CRISPR失活复合体中包含的转录抑制活性结构域对靶基因或核酸的转录进行抑制,从而诱导敲减(其中,相应基因或核酸的表达被抑制)。
敲入
术语“敲入”是指将特定的核酸或基因插入至靶基因或核酸中,此处,“特定的核酸”是指待被插入或者被表达的感兴趣的基因或核酸。通过敲入将触发疾病的突变基因修正至正常或将正常的基因插入来诱导正常基因的表达,可将触发疾病的突变基因用于疾病的治疗中。
此外,敲入可进一步需要供体。
例如,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或核酸进行编辑或修正时,可利用CRISPR复合体切割靶基因或核酸。可通过HDR使用CRISPR复合体来修复经破坏的靶基因或核酸。此处,可使用供体将特定的核酸插入至经破坏的基因或核酸中。
术语“供体”是指有助于经破坏的基因或核酸的基于HDR的修复的核酸序列,并且此处,供体可包含特定的核酸。
供体可为双链核酸或单链核酸。
供体能够以线性或环状存在。
供体可包含与靶基因或核酸具有同源性的核酸序列。
例如,供体可包含与处于待插入特定的核酸的位置(例如经破坏的核酸的上游(左侧)和下游(右侧))处的各碱基序列具有同源性的核酸序列。此处,待插入的特定核酸可位于与经破坏的核酸的下游碱基序列具有同源性的核酸序列和与经破坏的核酸的上游碱基序列具有同源性的核酸序列之间。此处,同源的核酸序列可具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的同源性或完全的同源性。
供体可任选包含额外的核酸序列。此处,额外的核酸序列可用于增强供体稳定性、敲入效率或HDR效率。
例如,额外的核酸序列可为富含A和T的核酸序列(即富A-T结构域)。此外,额外的核酸序列可为支架/基质附着区(SMAR)。
在涉及本发明的基因操纵效果的一个示例性实施方式中,使用gRNA-CRISPR酶复合体获得的经操纵的靶基因(即经操纵的SC功能控制因子,优选经操纵的PMP22))可具有如下组成。
在一个示例性实施方式中,当PMP22是基因时,
在位于构成PMP22基因的核酸序列中的PAM序列中或邻近其5'端和/或3'端的碱基序列中的连续的1bp-50bp、1bp-40bp或1bp-30bp、优选3bp-25bp的区域中,
通过gRNA-CRISPR酶复合体进行人工操纵的PMP22的组成可包括如下之中的一种或多种核酸修饰:
一个或多个核苷酸的缺失或插入;
用不同于野生型基因的一个或多个核苷酸进行的置换;以及
一个或多个外源核苷酸的插入。
另外,一个或多个核苷酸的化学修饰可被包括在构成PMP22基因的核酸序列中。
此处,“外源核苷酸”是包括除PMP22基因所固有的核苷酸以外的全部外源物(例如异源核苷酸或经人工合成的核苷酸)在内的概念。外源核苷酸还包括用于表达具有特定功能的蛋白的大小为数百bp、数千bp或数万bp的核苷酸,以及大小为50bp以下的小的寡核苷酸。此类外源核苷酸可为供体。
化学修饰包括甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化,例如,将核苷酸中含有的部分官能团用氢原子、氟原子、-O-烷基、-O-酰基和氨基中的任一者取代,但本发明不限于此。另外,为了增加核酸分子的转移能力,可将官能团用-Br、-Cl、-R、-R'OR、-SH、-SR、-N3和-CN(R=烷基、芳基、亚烷基)中的任一者进行取代。另外,可将至少一个核苷酸的磷酸骨架用烷基膦酸酯形式、氨基磷酸酯形式和硼烷磷酸酯(boranophosphate)形式中的任一者进行取代。另外,化学修饰可为核酸分子中包含的至少一种类型的核苷酸用锁核酸(LNA)、解锁核酸(UNA)、吗啉代和肽核酸(PNA)中的任一者进行的取代,并且化学修饰可为核酸分子与选自于由脂质、细胞穿透肽和细胞靶向配体所组成的组中的一种或多种的结合。
为形成期望的SC功能控制系统(包括SC功能控制修饰系统),可将使用gRNA-CRISPR酶复合体的人工操纵施用至构成SC功能控制因子(即PMP22基因)的核酸。
包含PMP22基因的核酸修饰的区域可为靶区域或靶序列。
此类靶序列可为gRNA-CRISPR酶复合体的靶标,并且靶序列可包含由CRISPR酶识别的PAM序列或者可不包含由CRISPR酶识别的PAM序列。此类靶序列可向本领域普通技术人员提供gRNA设计阶段中的重要标准。
此类核酸修饰包括核酸的“切割”。
靶区域中的术语“切割”是指多聚核苷酸共价骨架的断裂。切割包括磷酸二酯键的酶促水解或化学水解,但本发明不限于此,并还包括多种其它方法。切割能够在单链和双链两者上进行,并且双链的切割可产生于不同的单链的切割。双链切割可产生平末端或交错末端。
当使用失活的CRISPR酶时,它可诱导具有特定功能的因子,以使得靠近靶区域或PMP22基因的某一区域而无需切割过程。取决于该特定功能,PMP22基因的核酸序列中可包含一个或多个核苷酸的化学修饰。
在一个实例中,可通过由gRNA-CRISPR酶复合体形成的核酸切割而来的靶活性和非靶活性引起多种插入缺失的出现。
术语“插入缺失”是发生在DNA碱基序列中的一些碱基中间的插入或缺失的总称。当gRNA-CRISPR酶复合体切割如上所述的PMP22基因的核酸(DNA或RNA)时,可通过HDR或NHEJ机制在修复期间将插入缺失引入靶序列中。
本发明的经人工操纵的PMP22基因是指使用此类核酸的供体通过切割、插入缺失或插入进行的原始基因的核酸序列的修饰,并且有助于期望的SC功能控制系统(包括SC功能控制因子修饰系统),例如,表现出通过PMP22的表达和/或功能修饰来控制施旺细胞的功能的效果。
例如,
可通过经人工操纵的PMP22基因抑制特定的蛋白的表达和活性。
可通过经人工操纵的PMP22基因使特定的蛋白失活。
作为实例,可切割基因组中的PMP22基因的特定靶位点来敲减或敲除基因。
作为另一实例,可通过使用与转录阻遏物结构域或染色质修饰蛋白融合的酶促失活的CRISPR酶来介导靶向敲减,以改变转录,例如,阻断、减少或降低PMP22基因的转录。
可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来阻遏或抑制、或者促进或增加施旺细胞的生长。
可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来中断或阻滞、或者促进施旺细胞的细胞周期的进展。
可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来促进或阻遏施旺细胞的分化。
可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来促进或阻遏施旺细胞的死亡。
可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来帮助或干扰外周神经细胞的存活。
可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来帮助或干扰外周神经细胞的维持和信号转导。
可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来控制神经细胞轴突的髓鞘形成。
在这种情况下,髓鞘形成包括髓鞘形成的全部过程(例如髓鞘的产生、髓鞘的变性、髓鞘的再生、髓鞘的维持和髓鞘的致密髓鞘)、以及与髓鞘变性或髓鞘功能相关的所有机制。
可将经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)用于功能障碍或缺陷的施旺细胞的减轻和治疗。
此外,可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来控制阻遏或抑制成纤维细胞或神经胶质细胞的生长、或者促进或增加成纤维细胞或神经胶质细胞的生长的所有机制。
可通过经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)来控制成纤维细胞或神经胶质细胞的活性涉及的所有机制。
在本发明的一个示例性实施方式中,根据gRNA-CRISPR酶复合体的组成特征(例如包含在PMP22基因的靶区域中或在邻近的主要的PAM序列方面不同),经人工操纵的SC功能控制因子(即经人工操纵的PMP22基因)可提供多种经人工操纵的PMP22基因。
下文中,虽然已经说明了CRISPR酶的代表性实例,它们仅为具体的实例,并此本发明不限于此。
例如,当CRISPR酶是SpCas9蛋白时,PAM序列为5'-NGG-3'(N为A、T、G或C),并且经切割的碱基序列区域(靶区域)可为靶基因中邻近5'-NGG-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp或21bp-23bp)的区域。
本发明可提供经人工操纵的PMP22基因,其通过在PMP22基因的核酸序列中进行如下而制备:
a)删除邻近5'-NGG-3'(N为A、T、C或G)序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b)用不同于野生型基因的核苷酸置换邻近5'-NGG-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp)的区域中的一个或多个核苷酸;
c)将一个或多个核苷酸插入至邻近5'-NGG-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d)选自a)至c)中的两者以上的组合。
例如,当CRISPR酶是CjCas9蛋白时,PAM序列为5'-NNNNRYAC-3'(N各自独立地为A、T、C或G;R为A或G;并且Y为C或T),并且经切割的碱基序列区域(靶区域)可为靶基因中邻近5'-NNNNRYAC-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp或21bp-23bp)的区域。
本发明可提供经人工操纵的PMP22基因,其通过在PMP22基因的核酸序列中进行如下而制备:
a')删除邻近5'-NNNNRYAC-3'(N各自独立地为A、T、C或G;R为A或G;并且Y为C或T)的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b')用不同于野生型基因的核苷酸置换邻近5'-NNNNRYAC-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp)的区域中的一个或多个核苷酸;
c')将一个或多个核苷酸插入至邻近5'-NNNNRYAC-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d')选自a')至c')中的两者以上的组合。
例如,当CRISPR酶是StCas9蛋白时,PAM序列为5'-NNAGAAW-3'(N各自独立地为A、T、C或G;并且W为A或T),并且经切割的碱基序列区域(靶区域)可为靶基因中邻近5'-NNAGAAW-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp或21bp-23bp)的区域。
本发明可提供经人工操纵的PMP22基因,其通过在PMP22基因的核酸序列中进行如下而制备:
a”)删除邻近5'-NNAGAAW-3'(N各自独立地为A、T、C或G;并且W为A或T)序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b”)用不同于野生型基因的核苷酸置换邻近5'-NNAGAAW-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp)的区域中的一个或多个核苷酸;
c”)将一个或多个核苷酸插入至邻近5'-NNAGAAW-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d”)选自a”)至c”)中的两者以上的组合。
例如,当CRISPR酶是NmCas9蛋白时,PAM序列为5'-NNNNGATT-3'(N各自独立地为A、T、C或G),并且经切割的碱基序列区域(靶区域)可为靶基因中邻近5'-NNNNGATT-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp或21bp-23bp)的区域。
本发明可提供经人工操纵的PMP22基因,其通过在PMP22基因的核酸序列中进行如下而制备:
a”')删除邻近5'-NNNNGATT-3'(N各自独立地为A、T、C或G)序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b”')用不同于野生型基因的核苷酸置换邻近5'-NNNNGATT-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp)的区域中的一个或多个核苷酸;
c”')将一个或多个核苷酸插入至邻近5'-NNNNGATT-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d”')选自a”')至c”')中的两者以上的组合。
例如,当CRISPR酶是SaCas9蛋白时,PAM序列为5'-NNGRR(T)-3'(N各自独立地为A、T、C或G;R为A或G;并且(T)为可随意添加的序列),并且经切割的碱基序列区域(靶区域)可为靶基因中邻近5'-NNGRR(T)-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp或21bp-23bp)的区域。
本发明可提供经人工操纵的PMP22基因,其通过在PMP22基因的核酸序列中进行如下而制备:
a””)删除邻近5'-NNGRR(T)-3'序列(N各自独立地为A、T、C或G;R为A或G;并且(T)为可随意添加的序列)的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域中的一个或多个核苷酸;
b””)用不同于野生型基因的核苷酸置换邻近5'-NNGRR(T)-3'序列的5'端和/或3'端的碱基序列中的连续的1bp-25bp(例如,17bp-23bp)的区域中的一个或多个核苷酸;
c””)将一个或多个核苷酸插入至邻近5'-NNGRR(T)-3'序列的碱基序列中的连续的1bp-25bp(例如17bp-23bp)的区域;或者
d””)选自a””)至c””)中的两者以上的组合。
例如,当CRISPR酶是Cpf1蛋白时,PAM序列可为5'-TTN-3'(N为A、T、C或G),并且经切割的碱基序列区域(靶区域)可为邻近5'-TTN-3'序列的5'端和/或3'端的碱基序列中的连续的10bp-30bp(例如,15bp-26bp、17bp-30bp或17bp-26bp)的区域。
Cpf1蛋白可为来源于如下的Cpf1蛋白,例如Parcubacteria bacterium(GWC2011_GWC2_44_17)、毛螺科菌(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteriabacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺科菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌、牛眼莫拉氏菌(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺科菌(MA2020)、新凶手弗朗西斯菌(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌等;例如,Parcubacteriabacterium(GWC2011_GWC2_44_17)、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺科菌(ND2006)、Porphyromonascrevioricanis、解糖胨普雷沃菌、牛眼莫拉氏菌(237)、稻田钩端螺旋体、毛螺科菌(MA2020)、新凶手弗朗西斯菌(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌,但所述本发明不限于此。
本发明可提供经人工操纵的PMP22基因,其通过在PMP22基因的核酸序列中进行如下而制备:
a””')删除邻近5'-TTN-3'(N为A、T、C或G)序列的5'端和/或3'端的碱基序列中的连续的10bp-30bp(例如15bp-26bp)的区域中的一个或多个核苷酸;
b””')用不同于野生型基因的核苷酸置换邻近5'-TTN-3'序列的5'端和/或3'端的碱基序列中的连续的10bp-30bp(例如,15bp-26bp)的区域中的一个或多个核苷酸;
c””')将一个或多个核苷酸插入至邻近5'-TTN-3'序列的5'端和/或3'端的碱基序列中的连续的10bp-30bp(例如15bp-26bp)的区域;或者
d””')选自a””')至c””')中的两者以上的组合。
在另一示例性实施方式中,当PMP22为蛋白时,
经人工操纵的蛋白包括通过gRNA-CRISPR酶复合体的直接或间接作用参与形成新的血管或经修饰的血管的全部蛋白。
例如,经人工操纵的蛋白可为通过由gRNA-CRISPR酶复合体进行人工操纵的PMP22基因表达的蛋白,或者受此类蛋白活性的影响而增加或减少的另外的蛋白质,但本发明不限于此。
经人工操纵的PMP22蛋白可具有对应于经人工操纵的PMP22基因的组成的氨基酸组成和活性。
作为实施方式,
可提供(i)其表达特征被改变的经人工操纵的蛋白。
例如,蛋白修饰可具有如下的一种或多种特征:
在PMP22基因的核酸序列中的PAM序列的碱基序列中或邻近其5'端和/或3'端的碱基序列中的连续的1bp-50bp、1bp-40bp、1bp-30bp并优选3bp-25bp的区域中,取决于一个或多个核苷酸的缺失或插入的表达水平的降低或升高;
取决于用不同于野生型基因的一个或多个核苷酸进行的置换的表达水平的降低或升高;
取决于一个或多个外源核苷酸的插入的表达水平的降低或升高、融合蛋白的表达或特定蛋白的独立表达;以及
受上述蛋白的表达特征影响的第三蛋白的表达水平的降低或升高。
可提供(ii)其结构特征改变的经人工操纵的蛋白。
例如,蛋白修饰可具有如下的一种或多种特征:
在PMP22基因的核酸序列中的PAM序列的碱基序列中或邻近其5'端和/或3'端的碱基序列中的连续的1bp-50bp、1bp-40bp、1bp-30bp并优选3bp-25bp的区域中,取决于一个或多个核苷酸的缺失或插入的密码子的改变、氨基酸的改变和三维结构的改变;
取决于用不同于野生型基因的一个或多个核苷酸进行的置换的密码子的改变、氨基酸的改变和三维结构的改变;
取决于一个或多个外源核苷酸的插入的密码子的改变、氨基酸的改变和三维结构的改变、或者与特定蛋白的融合结构或与特定蛋白分离的独立结构;以及
受上述结构特征改变的蛋白影响的第三蛋白的密码子的改变、氨基酸的改变和三维结构的改变。
可提供(iii)其功能特征改变的经人工操纵的蛋白。
例如,蛋白修饰可具有如下的一种或多种特征:
在PMP22基因的核酸序列中的PAM序列的碱基序列中或邻近其5'端和/或3'端的碱基序列中的连续的1bp-50bp、1bp-40bp、1bp-30bp并优选3bp-25bp的区域中,通过由一个或多个核苷酸的删除或插入引起的蛋白修饰而来的特定功能的激活或失活或者新功能的引入;
通过由用不同于野生型基因的一个或多个核苷酸进行的置换引起的蛋白修饰而来的特定功能的激活或失活或者新功能的引入;
通过由一个或多个外源核苷酸的插入引起的蛋白修饰而来的特定功能的激活或失活或者新功能的引入(特别是,由于特定蛋白的融合表达或独立表达而向现有功能中引入第三功能);以及
受上述功能特征改变的蛋白影响的第三蛋白的功能改变。
此外,可包含通过在构成PMP22基因的核酸序列中的一个或多个核苷酸的化学修饰进行人工操纵的蛋白。
例如,可改变由甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化引起的蛋白的表达特征、结构特征和功能特征中的一种或多种。
例如,由于核苷酸的化学修饰而将第三蛋白结合到基因的核酸序列中,可获得第三结构和功能。
5.其它额外成分
可选择性地添加额外的成分来增加引导核酸-编辑蛋白复合体的效率或改善对经破坏的基因或核酸的修复效率。
可选择性地使用额外的成分来改善引导核酸-编辑蛋白复合体的效率。
激活因子
可将额外的成分用作激活因子来增加引导核酸-编辑蛋白复合体对靶核酸、基因或染色体的切割效率。
术语“激活因子”是指用于使引导核酸-编辑蛋白复合体与靶核酸、基因或染色体之间的结合稳定或者使得引导核酸-编辑蛋白复合体能够更容易地接近靶核酸、基因或染色体的核酸。
激活因子可为双链核酸或单链核酸。
激活因子可为线性或环状。
可将激活因子分为“协助部(helper)”和“护送部(escorter)”,所述“协助部”稳定引导核酸-编辑蛋白复合体与靶核酸、基因或染色体之间的结合,所述“护送部”用于使引导核酸-编辑蛋白复合体能够更容易地接近靶核酸、基因或染色体。
协助部可提高引导核酸-编辑蛋白复合体对靶核酸、基因或染色体的切割效率。
例如,协助部包含与靶核酸、基因或染色体具有同源性的核酸序列。因此,当将引导核酸-编辑蛋白复合体结合至靶核酸、基因或染色体时,协助部中包含的同源核酸序列可与靶核酸、基因或染色体形成额外的互补结合,以稳定引导核酸-编辑蛋白复合体与靶核酸、基因或染色体之间的结合。
护送部可提高引导核酸-编辑蛋白复合体对靶核酸、基因或染色体的切割效率。
例如,护送部包含与靶核酸、基因或染色体具有同源性的核酸序列。此处,护送部中包含的同源核酸序列可部分地与引导核酸-编辑蛋白复合体的引导核酸形成互补结合。因此,与引导核酸-编辑蛋白复合体部分地形成互补结合的护送部可与靶核酸、基因或染色体部分地形成互补结合,作为结果,可允许引导核酸-编辑蛋白复合体精确地接近靶核酸、基因或染色体的位置。
同源核酸序列可具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的同源性或者完全的同源性。
此外,额外的成分可选择性地用于改善经破坏的基因或核酸的修复效率。
辅助因子(assistor)
可将额外的成分用作辅助因子来改善经破坏的基因或核酸的修复效率。
术语“辅助因子”是指用于参与经破坏的基因或核酸(例如由引导核酸-编辑蛋白复合体切割的基因或核酸)的修复过程或提高修复效率的核酸。
辅助因子可为双链核酸或单链核酸。
辅助因子能够以线性或环状存在。
根据修复方法,可将辅助因子分为“NHEJ辅助因子”和“HDR辅助因子”,所述“NHEJ辅助因子”参与使用NHEJ的修复过程或改善修复效率,所述“HDR辅助因子”参与使用HDR的修复过程或改善修复效率。
NHEJ辅助因子可参与使用NHEJ的经破坏的基因或核酸的修复过程或改善经破坏的基因或核酸的修复效率。
例如,NHEJ辅助因子可包含与经破坏的核酸序列的一部分具有同源性的核酸序列。此处,同源核酸序列可包含与处于经破坏的核酸序列的一端(例如3'端)处的核酸序列具有同源性的核酸序列,并且包含与处于经破坏的核酸序列的另一端(例如5'端)处的核酸序列具有同源性的核酸序列。此外,可包含与经破坏的核酸序列的上游和下游的碱基序列各自具有同源性的核酸序列。具有此类同源性的核酸序列可帮助经破坏的核酸序列的两部分被紧挨着放置,由此增高NHEJ的经破坏的核酸的修复效率。
HDR辅助因子可参与使用HDR的经破坏的基因或核酸的修复过程或改善经破坏的基因或核酸的修复效率。
例如,HDR辅助因子可包含与经破坏的核酸序列的一部分具有同源性的核酸序列。此处,同源核酸序列可包含与处于经破坏的核酸序列的一端(例如3'端)处的核酸序列具有同源性的核酸序列,以及与处于经破坏的核酸序列的另一端(例如5'端)处的核酸序列具有同源性的核酸序列。或者,可包含与经破坏的核酸序列的上游和下游的碱基序列各自具有同源性的核酸序列。具有此类同源性的核酸序列可作为经破坏的核酸序列的模板,以增高HDR的经破坏的核酸的修复效率。
在另一实例中,HDR辅助因子可包含与经破坏的核酸序列的一部分具有同源性的核酸序列以及特定的核酸(例如待插入的核酸或基因)。此处,同源核酸序列可包含与经破坏的核酸序列的上游和下游的碱基序列各自具有同源性的核酸序列。特定的核酸可位于与经破坏的核酸的下游的碱基序列具有同源性的核酸序列和与经破坏的核酸的上游的碱基序列具有同源性的核酸序列之间。具有此类同源性的核酸序列和特定的核酸可作为供体以将特定的核酸插入至经破坏的核酸中,从而增高HDR的敲入效率。
同源核酸序列可具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的同源性或完全的同源性。
6.对象
术语“对象”是指向其中引入引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;在其中运行(operates)引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;或者获取自所述有机体的试样或样本。
受试者可为包含引导核酸-编辑蛋白复合体的靶核酸、基因、染色体或蛋白的有机体。
有机体可为细胞、组织、植物、动物或人。
细胞可为原核细胞或真核细胞。
真核细胞可为植物细胞、动物细胞或人细胞,但本发明不限于此。
组织可为动物体组织或人体组织,例如皮肤、肝、肾、心脏、肺、脑或肌肉组织。
受试者可为包含引导核酸-编辑蛋白复合体的靶核酸、基因、染色体或蛋白的试样或样本。
试样或样本可获取自包含靶核酸、基因、染色体或蛋白的有机体,并可为唾液、血液、皮肤组织、施旺细胞、癌细胞或干细胞。
在本发明中,作为具体的实例,对象可包含引导核酸-编辑蛋白复合体的靶基因或核酸。
此处,靶基因可为SC功能控制因子。
SC功能控制因子可为PMP22基因。
靶基因可为野生型或野生型的修饰形式。
在本发明的一个示例性实施方式中,受试者可包含由引导核酸-编辑蛋白复合体操纵的基因或核酸。
此处,经操纵的基因可为SC功能控制因子。
SC功能控制因子可为PMP22基因。
此处,引导核酸可靶向PMP22基因。
引导核酸可为与PMP22基因的靶序列互补的核酸序列。
引导核酸可靶向一种或多种基因。
引导核酸可同时靶向两种以上的基因。此处,两种以上的基因可为同源基因或异源基因。
引导核酸可靶向一种或多种靶序列。
可根据靶序列的数量或位置以各种形式设计引导核酸。
在本发明的一个示例性实施方式中,引导核酸可为与表1、表2、表3、表4、表5、表6和表7中列出的序列的一种或多种靶序列互补的核酸序列。
在一些实施方式中,对于PMP22基因的人工操纵,引导核酸序列对应于靶序列SEQID NO:1-SEQ ID NO:66的任一种。
在一些实施方式中,对于PMP22的人工操纵,提供了与引导核酸序列相互作用的编辑蛋白,对应于例如与靶序列SEQ ID NO:1-SEQ ID NO:66(例如SEQ ID NO:1-SEQ ID NO:8或SEQ ID NO:14-SEQ ID NO:29或SEQ ID NO:41-SEQ ID NO:53)的任一种形成复合体。
在一些实施方式中,提供了各基因的核酸修饰产物及其表达产物,其中人工操纵发生在SEQ ID NO:1-SEQ ID NO:66(例如SEQ ID NO:1-SEQ ID NO:8或SEQ ID NO:14-SEQID NO:29或SEQ ID NO:41-SEQ ID NO:53)的任一者的靶序列区域中。
7.递送
可通过多种递送方法和多种形式将引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体递送入或引入对象中。
能够以DNA、RNA或混合形式将引导核酸递送入或引入对象中。
能够以编码编辑蛋白的DNA、RNA、DNA/RNA混合物、肽、多肽的形式或者以蛋白的形式将编辑蛋白递送入或引入对象中。
能够以编码各成分(即引导核酸或编辑蛋白)的DNA、RNA或其混合物的形式将引导核酸-编辑蛋白复合体递送入或引入对象中。
可将引导核酸-编辑蛋白复合体作为引导核酸(具有DNA、RNA或其混合物的形式)与编辑蛋白(具有肽、多肽或蛋白的形式)的复合体递送入或引入对象中。
此外,可通过多种递送方法并以多种形式将能够提高或抑制引导核酸-编辑蛋白复合体的效率的额外的成分递送入或引入对象中。
能够以DNA、RNA、DNA/RNA混合物、肽、多肽或蛋白的形式将额外的成分递送入或引入对象中。
i)以DNA、RNA或其混合物的形式递送
可通过本领域已知的方法将编码引导核酸和/或编辑蛋白的DNA、RNA或其混合物的形式递送入或引入对象中。
或者,可通过载体、非载体或其组合将编码引导核酸和/或编辑蛋白的DNA、RNA或其混合物的形式递送入或引入对象中。
载体可为病毒载体或非病毒载体(例如质粒)。
非载体可为裸DNA、DNA复合体或mRNA。
基于载体的引入
可通过载体将编码引导核酸和/或编辑蛋白的核酸序列递送入或引入对象中。
载体可包含编码引导核酸和/或编辑蛋白的核酸序列。
例如,载体可同时包含分别编码引导核酸和编辑蛋白的核酸序列。
例如,载体可包含编码引导核酸的核酸序列。
作为实例,引导核酸中包含的结构域可全部包含于一个载体中,或可将其分开并随后包含于不同的载体中。
例如,载体可包含编码编辑蛋白的核酸序列。
在一个实例中,在编辑蛋白的情况下,编码编辑蛋白的核酸序列可包含于一个载体中,或可将其分开并随后包含于数个载体中。
载体可含有一种或多种调控/控制成分。
此处,调控/控制成分可包括:启动子、增强子、内含子、多聚腺苷酸信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。
启动子可为由RNA聚合酶II识别的启动子。
启动子可为由RNA聚合酶III识别的启动子。
启动子可为诱导型启动子。
启动子可为对象特异性启动子。
启动子可为病毒或非病毒启动子。
就启动子而言,可根据控制区(即,编码引导核酸或编辑蛋白的核酸序列)使用适当的启动子。
例如,用于引导核酸的启动子可为H1、EF-1a、tRNA或U6启动子。例如,用于编辑蛋白的启动子可为CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。
载体可为病毒载体或重组病毒载体。
病毒可为DNA病毒或RNA病毒。
此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。
此处,RNA病毒可为单链RNA(ssRNA)病毒。
病毒可为逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、牛痘病毒、痘苗病毒或单纯疱疹病毒,但本发明不限于此。
一般说来,病毒可感染宿主(例如细胞),由此将编码病毒的遗传信息的核酸引入宿主或将编码遗传信息的核酸插入宿主基因组中。可使用具有此类特征的病毒将引导核酸和/或编辑蛋白引入对象中。使用病毒引入的引导核酸和/或编辑蛋白可在对象(例如细胞)中临时表达。或者,使用病毒引入的引导核酸和/或编辑蛋白可在对象(例如细胞)中持续表达长的时间(例如1周、2周或3周,1个月、2个月、3个月、6个月或9个月,1年或2年,或永久)。
根据病毒的类型,病毒的包装能力可从至少2kb至50kb变化。取决于此类包装能力,可设计包含引导核酸或编辑蛋白的病毒载体或者包含引导核酸和编辑蛋白两者的病毒载体。或者,可设计包含引导核酸、编辑蛋白和额外的成分的病毒载体。
在一个实例中,可通过重组的慢病毒递送或引入编码引导核酸和/或编辑蛋白的核酸序列。
在另一实例中,可通过重组的腺病毒递送或引入编码引导核酸和/或编辑蛋白的核酸序列。
在又一实施方式中,可通过重组的AAV递送或引入编码引导核酸和/或编辑蛋白的核酸序列。
在又一实例中,可通过杂交的病毒(例如本文中列出的病毒的一种或多种杂交体)递送或引入编码引导核酸和/或编辑蛋白的核酸序列。
基于非载体的引入
可使用非载体将编码引导核酸和/或编辑蛋白的核酸序列递送入或引入对象中。
非载体可包含编码引导核酸和/或编辑蛋白的核酸序列。
非载体可为裸DNA、DNA复合体、mRNA或它们的混合物。
可通过电穿孔、粒子轰击、声致穿孔、磁转染、瞬时细胞压缩或挤压(例如在文献[Lee等(2012)Nano Lett.,12,6322-6327]中所描述的)、脂质介导的转染、树枝状分子、纳米粒子、磷酸钙、二氧化硅、硅酸盐(Ormosil)或它们的组合将非载体递送入或引入对象中。
作为实例,可通过将细胞与编码引导核酸和/或编辑蛋白的核酸序列在卡盒(cartridge)、腔室或试管中混合并以预定的持续时间和振幅将电刺激施加至细胞来实施借助电穿孔的递送。
在另一实例中,可使用纳米粒子进行非载体递送。纳米粒子可为无机纳米粒子(例如磁性纳米粒子、二氧化硅等)或有机纳米粒子(例如聚乙二醇(PEG)包被的脂质等)。纳米粒子的外表面可缀合有能够附着的带正电的聚合物(例如聚乙烯亚胺、聚赖氨酸、聚丝氨酸等)。
在一些实施方式中,可使用脂质壳进行非载体的递送。
在一些实施方式中,可使用外泌体进行非载体递送。外泌体是用于转移蛋白和RNA的内源性纳米囊泡,可将RNA递送到大脑和另一靶器官。
在一些实施方式中,可使用脂质体进行非载体递送。脂质体是球形囊泡结构,其由围绕内部水相的单个或多个层状脂质双层和相对不透明的外部的亲脂性磷脂双层组成。虽然脂质体可由数种不同类型的脂质制成;磷脂最常用于生产作为药物运载体的脂质体。
可包含其它添加物。
ii)以肽、多肽或蛋白的形式递送
可通过本领域已知的方法以肽、多肽或蛋白的形式将编辑蛋白递送入或引入对象中。
可通过电穿孔、显微注射、瞬时细胞压缩或挤压(例如在文献[Lee等(2012)NanoLett.,12,6322-6327]中所描述的)、脂质介导的转染、纳米粒子、脂质体、肽介导的递送或它们的组合将肽、多肽或蛋白形式递送入或引入对象中。
肽、多肽或蛋白可与编码引导核酸的核酸序列一起递送。
在一个实例中,可通过在卡盒、腔室或试管中对细胞进行混合来实施经由电穿孔的转移,将编辑蛋白与引导核酸一起或不与引导核酸一起引入该细胞中,并以预定的持续时间和振幅将电刺激施加至细胞。
iii)以核酸-蛋白混合物的形式进行的递送
能够以引导核酸-编辑蛋白复合体的形式将引导核酸和编辑蛋白递送入或引入对象中。
例如,引导核酸可为DNA、RNA或其混合物。编辑蛋白可为肽、多肽或蛋白。
在一个实例中,能够以包含RNA型引导核酸和蛋白型编辑蛋白的引导核酸-编辑蛋白复合体(即核糖核蛋白(RNP))的形式将引导核酸和编辑蛋白递送入或引入对象中。
在本发明中,作为用于将引导核酸和/或编辑蛋白递送入对象中的方法的实施方式,下面将对gRNA、CRISPR酶或gRNA-CRISPR酶复合体的递送进行描述。
在本发明的实施方式中,使用载体将编码gRNA和/或CRISPR酶的核酸序列递送入或引入对象中。
载体可包含编码gRNA和/或CRISPR酶的核酸序列。
例如,载体可同时包含编码gRNA和/或CRISPR酶的核酸序列。
例如,载体可包含编码gRNA的核酸序列。
在一个实例中,gRNA中包含的结构域可全部包含于一个载体中,或可将其分开并随后包含于不同的载体中。
例如,载体可包含编码CRISPR酶的核酸序列。
在一个实例中,在CRISPR酶的情况下,编码CRISPR酶的核酸序列可包含于一个载体中,或可将编码CRISPR酶的核酸序列分开并随后包含于数个载体中。
载体可含有一种或多种调控/控制成分。
此处,调控/控制成分可包括:启动子、增强子、内含子、多聚腺苷酸信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。
启动子可为由RNA聚合酶II识别的启动子。
启动子可为由RNA聚合酶III识别的启动子。
启动子可为诱导型启动子。
启动子可为对象特异性启动子。
启动子可为病毒或非病毒启动子。
就启动子而言,可根据控制区(即,编码gRNA和/或CRISPR酶的核酸序列)使用适当的启动子。
例如,用于gRNA的启动子可为H1、EF-1a、tRNA或U6启动子。例如,用于CRISPR酶的启动子可为CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。
载体可为病毒载体或重组病毒载体。
病毒可为DNA病毒或RNA病毒。
此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。
此处,RNA病毒可为单链RNA(ssRNA)病毒。
病毒可为逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、牛痘病毒、痘苗病毒或单纯疱疹病毒,但本发明不限于此。
一般说来,病毒可感染宿主(例如细胞),由此将编码病毒的遗传信息的核酸引入宿主或将编码遗传信息的核酸插入宿主基因组中。可使用具有此类特征的病毒将gRNA和/或CRISPR酶引入对象中。使用病毒引入的gRNA和/或CRISPR酶可在对象(例如细胞)中临时表达。或者,使用病毒引入的gRNA和/或CRISPR酶可在对象(例如细胞)中持续表达长的时间(例如1周、2周或3周,1个月、2个月、3个月、6个月或9个月,1年或2年,或永久)。
根据病毒的类型,病毒的包装能力可从至少2kb至50kb变化。取决于此类包装能力,可设计仅包含gRNA或CRISPR酶的病毒载体或者包含gRNA和CRISPR酶两者的病毒载体。或者,可设计包含gRNA、CRISPR酶和额外的成分的病毒载体。
在一个实例中,可通过重组的慢病毒递送或引入编码gRNA和/或CRISPR酶的核酸序列。
在另一实例中,可通过重组的腺病毒递送或引入编码gRNA和/或CRISPR酶的核酸序列。
在又一实施方式中,可通过重组的AAV递送或引入编码gRNA和/或CRISPR酶的核酸序列。
在又一实例中,可通过杂交病毒(例如本文所述的病毒)的一种或多种杂交体递送或引入编码gRNA和/或CRISPR酶的核酸序列。
在本发明的一个示例性实施方式中,可将gRNA-CRISPR酶复合体递送入或引入对象中。
例如,gRNA能够以DNA、RNA或其混合物的形式存在。CRISPR酶能够以肽、多肽或蛋白的形式存在。
在一个实例中,能够以包含RNA型gRNA和蛋白型CRISPR的gRNA-CRISPR酶复合体(即核糖核蛋白(RNP)的形式将gRNA和CRISPR酶递送入或引入对象中。
可通过电穿孔、显微注射、瞬时细胞压缩或挤压(例如在文献[Lee等(2012)NanoLett.,12,6322-6327]中所描述的)、脂质介导的转染、纳米粒子、脂质体、肽介导的递送或它们的组合将gRNA-CRISPR酶复合体递送入或引入对象中。
8.转化体
术语“转化体”是指其中引入了引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;其中表达引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;或者获取自所述有机体的试样或样本。
转化体可为其中以DNA、RNA或其混合物的形式引入了引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体。
例如,转化体可为其中引入了包含编码引导核酸和/或编辑蛋白的核酸序列的载体的有机体。此处,载体可为非病毒载体、病毒载体或重组的病毒载体。
在另一实例中,转化体可为其中以非载体形式引入了编码引导核酸和/或编辑蛋白的核酸序列的有机体。此处,非载体可为裸DNA、DNA复合体、mRNA或它们的混合物。
转化体可为其中以肽、多肽或蛋白的形式引入了编辑蛋白、引导核酸-编辑蛋白复合体或引导核酸的有机体。
转化体可为其中以DNA、RNA、肽、多肽、蛋白或它们的混合物的形式引入了引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体。
例如,转化体可为其中引入了包含RNA型引导核酸和蛋白型编辑蛋白的引导核酸-编辑蛋白复合体的有机体。
转化体可为包含引导核酸-编辑蛋白复合体的靶核酸、基因、染色体或蛋白的有机体。
有机体可为细胞、组织、植物、动物或人。
细胞可为原核细胞或真核细胞。
真核细胞可为植物细胞、动物细胞或人细胞,但本发明不限于此。
组织可为动物体组织或人体组织,例如皮肤、肝、肾、心脏、肺、脑或肌肉组织。
转化体可为其中引入或表达引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体,或者获取自所述有机体的试样或样本。
试样或样本可为唾液、血液、皮肤组织、施旺细胞、癌细胞或干细胞。
[用途]
本发明的一个实施方式是使用SC功能控制因子(优选用于对PMP22进行人工操纵的组合物)或经人工操纵的SC功能控制因子(优选经人操纵的PMP22)治疗患有施旺细胞功能障碍相关疾病的受试者的用途。
待治疗的受试者可为包括灵长类动物(例如人、猴等)、啮齿类动物(例如小鼠、大鼠等)在内的哺乳动物。
待治疗的疾病
在实施方式中,待治疗的疾病可为SC功能障碍相关疾病。
“SC功能障碍相关疾病”是指由施旺细胞的异常功能产生的所有状态。“SC功能障碍相关疾病”包括由异常或有缺陷的施旺细胞引起的疾病,其可在从施旺细胞的生长和分化到施旺细胞的死亡的整个发育和生长过程中发生,并且还包括由功能(例如施旺细胞的外周神经细胞的存活和维持以及轴突中的髓鞘的形成(髓鞘形成))的异常或缺陷引起的所有疾病。
此外,SC功能障碍相关疾病还包括由成纤维细胞和/或神经胶质细胞的异常功能产生的所有状态。SC功能障碍相关疾病包括由异常或有缺陷的细胞引起的疾病,其可在从成纤维细胞和/或神经胶质细胞的生长和分化到成纤维细胞和/或神经胶质细胞的死亡的整个发育和生长过程中发生。
SC功能障碍相关疾病的实例包括腓骨肌萎缩症(CMT)、格林-巴利综合征(GBS)、急性炎性脱髓鞘性多发性神经根病变、神经鞘瘤病和慢性炎性脱髓鞘性多发性神经根病变(CIDP),但不限于此。
在一个实例中,SC功能障碍相关疾病可为脱髓鞘疾病。
在这种情况下,脱髓鞘疾病包括由于髓鞘的损伤、缺陷、不稳定、变性和髓鞘再生而发生的所有疾病。
此外,SC功能障碍相关疾病包括SC功能控制因子相关疾病。
“SC功能控制因子相关疾病”是指由于SC功能控制因子的突变、SC功能控制基因的复制、SC功能控制因子的异常表达等而发生的所有状态。
SC功能控制因子相关疾病的实例包括腓骨肌痿缩症(CMT)、德热里纳-索塔斯病、先天性髓鞘形成减少神经病(CHN)、Roussy-Levy综合征(RLS)和遗传性压力易感性神经病变(HNPP),但不限于此。
在一个实例中,SC功能控制因子相关疾病可为PMP22相关疾病。
在这种情况下,PMP22相关疾病包括由于PMP22的突变、PMP22基因的复制、PMP22的异常表达等而发生的所有疾病。
在一个实施方式中,SC功能控制因子相关疾病可为由于PMP22基因的复制而发生的疾病。
优选地,SC功能控制因子相关疾病可为1A型腓骨肌痿缩症(CMT1A)、德热里纳-索塔斯病(DSS)、先天性髓鞘形成减少神经病(CHN)或Roussy-Levy综合征(RLS)。
-腓骨肌萎缩症(CMT)
CMT症是由在人染色体中发生的基因复制引起的遗传性疾病,并且通过突变对参与手和脚中的外周神经发育的基因进行复制,从而引起畸形(例如,如同倒置的香槟酒瓶的形状)。CMT症是一种相对常见的神经系统遗传疾病,在美国,100,000人有36人发病,并且全世界患者数量为280万,并且估计在韩国就约为17,000人。根据遗传方面,CMT症主要分为总共5种类型,即CMT1、CMT2、CMT3、CMT4和CMTX;CMT1、CMT2和CMT3占多数,并且在儿童中遗传率为50%;且CMT4为隐性遗传并以25%的概率遗传。CMT1和CMT2在大多数的国内患者中占主导地位(分别为80%和20%-40%),并且CMT3和CMT4极为罕见。CMTX随着X染色体通过母系遗传,但其频率为10%-20%。
CMT1是由于参与神经元轴突周围的髓鞘的蛋白的形成的基因复制而不能进行正常的基因表达过程引起的疾病。CMT1A是一种常染色体显性遗传病,由位于第17号染色体的17p11.2-p12上的PMP22基因的复制引起,导致由PMP22(其为髓鞘的一个重要成分)的过表达引起的髓鞘的结构和功能异常。
CMT2与轴突异常相关,并且是具有显著降低的运动感觉神经的动作电位而神经传导速度接近正常状态的神经病变,并且CMT3在幼年早期发生,是一种极为罕见的常染色体隐性遗传疾病,并且是临床症状和神经传导速度降低非常严重的类型。CMT4也是一种发病年龄早且临床症状严重的类型,其为常染色体隐性遗传,并且当与X染色体相关时发生CMTX并且其在男性中的症状比在女性中的症状更严重。
-德热里纳-索塔斯病(DSD)
DSS是一种早期发生的脱髓鞘运动感觉神经病变,并且通常是一种常染色体显性遗传的疾病,但也是经常染色体隐性遗传的,表现出严重的脱髓鞘神经病变,从婴儿期表现出运动神经异常,并且其特征在于表现出非常慢的神经传导和脑脊液中的特定蛋白的增加。德热里纳-索塔斯病具有非常快的进展速度,并且其特征在于步态紊乱从早期开始并且也是遗传的,但也会偶发地发生。与CMT1A类似,在一些患有DSS的患者中发现PMP22复制,并且此外,证实存在相应基因的错义突变。
-先天性髓鞘形成减少神经病变(CHN)
CHN是一种神经系统疾病,其症状在出生后立即出现,并且作为其主要症状,出现呼吸衰竭、肌肉无力、肌肉运动不协调、肌肉张力减退、无反射、运动不协调(运动神经机能病;共济失调)、以及麻痹或感觉迟钝,并且其以相同的比例影响男性和女性。CHN是遗传性疾病,其中疾病发生于运动神经和感觉神经,并且其特征在于髓鞘形成减少,同时髓鞘的脱髓鞘和髓鞘再生反复进行。
-Roussy-Levy综合征(RLS)
RLS是一种罕见类型的遗传性运动感觉神经病变,并且在1926年由Roussy和Levy等首次描述,并且是四肢颤抖、步态丧失等比其它遗传性运动感觉神经病变更严重的情况。但是后来在各种遗传性运动感觉神经病变亚型中发现了相同的症状,因此目前认为RLS是遗传性运动感觉神经病变方面出现的一种症状。对于RLS,在首次报道患有RLS的患者的基因检测中发现了作为髓鞘蛋白零基因的MPZ基因的突变,并且在其它患者中,报道了如下情况:存在作为外周神经的髓鞘蛋白22的基因的PMP22基因的复制。
在其它实施方式中,本发明可提供伴随着特定因子(例如,SC功能控制因子)的各种功能的用于控制第三体内机制的额外的系统,所述特定因子的功能是经人工操纵的。
例如,经人工修饰的特定因子可为PMP22基因。
除了施旺细胞的功能以外,第三机制可为涉及基因的体内机制。
治疗组合物或药物组合物
本发明的一个示例性实施方式涉及待用于使用经人工操纵的SC功能控制因子来治疗疾病的组合物。
该组合物可包含能够对SC功能控制因子进行人工操纵的操纵组合物。该组合物可指治疗性组合物或药物组合物。
在示例性的实施方式中,该组合物可包含能够对SC功能控制因子进行人工操纵的操纵组合物。
操纵组合物可包含引导核酸-编辑蛋白复合体。
操纵组合物可包含引导核酸和/或编辑蛋白。
操纵组合物可包含编码引导核酸和/或编辑蛋白的核酸。
操纵组合物可包含含有编码引导核酸和/或编辑蛋白的核酸的病毒。
在另一示例性实施方式中,该组合物可进一步包含额外的元件。
额外的元件可包括用于递送入受试者体内的合适运载体。
在一个示例性实施方式中,将提供以下的治疗组合物:
用于治疗SC功能障碍紊乱和/或SC功能控制因子相关疾病的组合物,其包括能够与PMP22基因的核酸序列中的一个或多个靶序列中的每一个形成互补结合的引导核酸、或编码该引导核酸的核酸序列,以及
编辑蛋白或编码该编辑蛋白的核酸序列;
用于治疗SC功能障碍紊乱和/或SC功能控制因子相关疾病的组合物,其包括能够与PMP22基因的核酸序列的靶序列SEQ ID NO:1-SEQ ID NO:66(例如SEQ ID NO:1至SEQ IDNO:8、SEQ ID NO:14-SEQ ID NO:29或SEQ ID NO:41-SEQ ID NO:53)各自形成互补结合的引导核酸、或编码该引导核酸的核酸序列,以及
编辑蛋白或编码该编辑蛋白的核酸序列。
用于治疗SC功能障碍紊乱和/或SC功能控制因子相关疾病的组合物,其包括由引导核酸或编码该引导核酸的核酸序列与编辑蛋白形成的复合体,所述引导核酸能够与PMP22基因的核酸序列的靶序列SEQ ID NO:1-SEQ ID NO:66(例如SEQ ID NO:1至SEQ IDNO:8、SEQ ID NO:14-SEQ ID NO:29或SEQ ID NO:41-SEQ ID NO:53)各自形成互补结合。
此处,引导核酸或编码该引导核酸的核酸序列,以及编码编辑蛋白的核酸序列能够以一个或多个载体的形式存在。引导核酸或编码该引导核酸的核酸序列,以及编码编辑蛋白的核酸序列能够以同源载体或异源载体的形式存在。
治疗方法
在本发明的另一示例性实施方式中,提供了用于治疗患者的疾病的方法,所述方法包括生产上述组合物,以及向需要其的患者提供有效量的组合物。
基因操纵治疗
可使用通过操纵活的有机体的基因来调控SC功能控制因子(优选PMP22基因的表达)的治疗方法。可通过直接注射用于操纵基因的组合物以将活的有机体的基因操纵入有机体中来实现此类治疗方法。
用于基因操纵的组合物可包含引导核酸-编辑蛋白复合体。
可将用于基因操纵的组合物注射到身体的特定位置。
此处,身体的特定位置可为SC功能控制因子(优选PMP22)的表达和/或功能异常的组织或是靠近该组织的位置。例如,身体的具体位置例如可为外周神经组织。
给予组合物的受试者可为包括灵长类动物(例如人、猴等)、啮齿类动物(例如小鼠、大鼠等)在内的哺乳动物。
可通过任何方便的方法(例如注射、输注、植入、移植等)给予组合物。可将组合物皮下给予、皮内给予、眼内给予、玻璃体内给予、瘤内给予、结内给予、髓内给予、肌内给予、静脉内给予、淋巴管内给予和腹膜内给予。
组合物的剂量(用于获得预定的期望效果的药学上有效的量)可选自104-109个细胞/kg给药的受试者体重(例如105-106个细胞/kg体重)的数值范围内的全部整数,但本发明不限于此。可考虑给药的受试者的年龄、健康状况和体重,同时接受的治疗的类型(如果有的话),共治疗的频率和期望效果的特征,来适当地将组合物开处方。
一个方面,本发明提供了用于对原核细胞中的靶多核苷酸进行修饰的方法,所述方法可在体内、离体或体外实现。
在一些实施方式中,该方法可包括从人或非人动物进行细胞或细胞群取样,以及对细胞进行修饰。培养可在任何步骤离体发生。也可将细胞再引入非人动物或植物中。再引入的细胞最优选为干细胞。
在另一示例性实施方式中,本发明可提供人工操纵细胞的方法,所述方法包括向细胞引入:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够与PMP22基因的核酸序列的靶序列SEQ ID NO:1-SEQ ID NO:66(例如SEQ ID NO:1至SEQ ID NO:8、SEQ IDNO:14-SEQ ID NO:29或SEQ ID NO:41-SEQ ID NO:53)形成互补结合;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由来源于酿脓链球菌的Cas9蛋白、来源于空肠弯曲杆菌的Cas9蛋白、来源于嗜热链球菌的Cas9蛋白、来源于金黄色葡萄球菌的Cas9蛋白、来源于脑膜炎奈瑟菌的Cas9蛋白以及Cpf1蛋白所组成的组中的一种或多种蛋白。
引导核酸和编辑蛋白能够以核酸序列的形式存在于一个或多个载体中,或者存在于引导核酸和编辑蛋白的组合的复合体中。
引入步骤可在体内或离体进行。
在引入步骤之前,可参考上述“7.递送”部分的技术。
例如,可通过选自如下中的一种或多种方法实现引入阶段:电穿孔、脂质体、质粒、病毒载体、纳米粒子和蛋白易位结构域(PTD)融合蛋白法。
例如,病毒载体可为选自于由如下所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、牛痘病毒、痘苗病毒和单纯疱疹病毒。
当将SC功能控制因子(优选为PMP22)通过本发明的一些实施方式的方法和组合物进行人工操纵时,可控制PMP22的异常表达和/或功能,并通过控制PMP22的异常表达和/或功能,异常PMP22的表达和/或功能通常得到改善,从而可获得由PMP22的异常表达引起的施旺细胞的异常功能的恢复或改善等的效果。
其它用途
在一些实施方式中,本发明可提供用于制备治疗SC功能障碍紊乱和/或SC功能控制因子相关疾病的组合物的试剂盒。
可通过本领域已知的常规制备方法制备试剂盒。
试剂盒可进一步包含可检测标记。术语“可检测标记”是指用于在没有标记的相同类型的分子之中特异性地检测含有标记的分子的原子或分子。可将可检测标记连接至特异性地结合至蛋白或其片段的抗体、相互作用蛋白、配体、纳米粒子或适体。可检测标记可包括放射性核素、荧光团和酶。
在一些实施方式中,本发明可提供筛选能够调控经人工操纵的SC功能控制因子(优选PMP22基因)的表达水平的材料的方法。
在一些实施方式中,本发明可提供通过分析SC功能控制因子(优选PMP22基因)的序列,用来提供针对受试者中能够进行人工操纵的靶位点的序列的信息的方法。
另外,还提供了使用由此类方法提供的信息构建文库的方法。
此处,可使用已知的数据库。
在具体的实施方式中,可提供可用于使用本发明的方法进行研究的动物或细胞。
可使用上述方法制备包含在与疾病相关的一种或多种核酸序列方面进行编辑的染色体的动物或细胞。此类核酸序列可为参考序列,所述参考序列可编码疾病相关蛋白序列或可与疾病有关。
在一个示例性实施方式中,可使用常用于通过本发明方法制备的动物或细胞的疾病研究中的测量,在动物或细胞中研究突变以及疾病的发生和/或进展的影响。或者,可使用此类动物或细胞研究活性化合物在疾病中的药效。
在另一示例性实施方式中,可使用通过本发明的方法制备的动物或细胞,对可能的基因治疗策略的效果进行评价。即,可通过修饰编码疾病相关蛋白的染色体序列来阻遏或减少相应疾病的发展和/或进展。特别是,该方法包括通过编辑编码疾病相关蛋白的染色体序列来形成经修饰的蛋白,从而实现经修饰的动物或细胞的应答。因此,在一些实施方式中,可将经遗传学上修饰的动物与易受相应疾病的发展影响的动物进行比较,从而评价基因治疗方法的效果。
该用途可包括疾病模型、药理学模型、发育模型、细胞功能模型和人源化模型。例如,该用途可包括经由PMP22的施旺细胞的异常功能相关的疾病模型、药理学模型、发育模型、细胞功能模型和人源化模型。
经人工操纵的SC功能控制因子和由此而来的SC功能控制系统(SC功能控制修饰系统)可用于治疗生效的SC功能障碍和/或SC控制因子相关疾病,例如,PMP22过表达或PMP22基因复制相关疾病。此外,通过涉及SC功能控制因子(优选PMP22)的各种体内机制,可改善SC功能控制系统(包括SC功能控制因子修改系统)的功效。
发明详述
在下文中,将参考实施例进一步详细地描述本发明。
这些实施例仅用于更详细地描述本发明而提供,并且对于本领域技术人员而言可能显而易见的是,本发明的范围不限于下列实施例。
实验方法
1.gRNA的设计
使用CRISPR RGEN Tools(www.rgenome.net),选择人PMP22基因的CRISPR/Cas9靶区域。PMP22基因的靶位点可根据CRISPR酶的类型而变化,将SpCas9的PMP22基因的编码位点(编码序列,CDS)的靶序列、TATA盒位点和增强子位点(例如,EGR2-结合位点、SOX10-结合位点或TEAD1-结合位点;或远端增强子位点(远端增强子区域)B或C)总结于上述的表1、表3、表5和表7中,并将CjCas9的PMP22基因的编码位点(编码序列,CDS)的靶序列、TATA-盒位点和增强子位点(例如,EGR2-结合位点或SOX10-结合位点)总结于表2、表4和表6中。
将所有的gRNA以嵌合的单链RNA(sgRNA)的形式产生。除靶序列外,Cj特异性sgRNA和Sp特异性sgRNA的骨架序列分别为5'-GUUUUAGUCCCUGAAAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'和5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'。
2.gRNA的构建和合成
将sgRNA包装到AAV载体中或用RNA合成。为了将sgRNA插入病毒载体中,设计对应于sgRNA的20-22个碱基的序列的DNA寡核苷酸并退火,并且使用BsmBI位点连接到pRGEN-Cas9(内部开发的)载体中。将Cas9和在5'末端包含可变靶序列的sgRNA分别通过CMV和U6启动子表达。
此外,对于RNP的递送系统而言,在通过对由Phusion Taq介导的聚合作用产生的两个部分互补的寡核苷酸进行退火产生模板后,通过T7RNA聚合酶转录sgRNA。使用光谱法纯化和定量经转录的sgRNA。
3.Cas9蛋白的纯化
将包含NLS和HA表位的经密码子优化的Cas9DNA序列亚克隆到pET28载体中,并在最佳培养条件下使用IPTG在BL21(DE3)中表达。使用Ni-NTA琼脂糖珠纯化经表达的Cas9蛋白,并用合适的缓冲液透析。通过使用众所周知的有效的sgRNA的体外切割试验证实了Cas9的活性。
4.细胞培养
根据制造商的使用手册培养人施旺样细胞系(ATCC)和人原代施旺细胞(ScienCell)。将人施旺样细胞在含有高浓度的葡萄糖的Dulbecco改良Eagle培养基(DMEM)(WelGene)(补充有1x青霉素/链霉素(WelGene)和10%胎牛血清(WelGene))中培养。
将人原代施旺细胞维持在销售商提供的施旺细胞培养溶液(ScienCell)中。对于分化,将细胞在含有低浓度葡萄糖的DMEM(WelGene)(补充有1%胎牛血清(WelGene)、用于髓鞘的形成(髓鞘形成)的信号转导的100ng/mL Nrg1(Peprotech)以及100μM dbcAMP(Sigma-Aldrich))中培养7天。
5.转导(转染)
对于转导(转染),将含有4μg Cas9蛋白(ToolGen)和1μg sgRNA的RNP复合物在室温下孵育15分钟。此后,通过使用10μL电穿孔尖头和氖电穿孔仪(ThermoFisher)将RNP复合体进行电穿孔,并递送至2×105个细胞。对于靶向深度测序,在转导后72小时从经转导的细胞中收集基因组DNA(gDNA)。
6.体外实时PCR(qRT-PCR)
使用RNeasy minikit(Qiagen)根据制造商的方案从人原代施旺细胞中提取mRNA。此后,使用高容量cDNA逆转录试剂盒(ThermoFisher)对100ng mRNA进行逆转录。根据制造商的方案,使用QuantStudio 3(ThermoFisher),用100ng Taqman Gene expressionmaster mix进行qRT-PCR。使用Ct值计算PMP22表达水平,并将GAPDH用作内源对照。将本研究中使用的Taqman探针(ThermoFisher)总结于下表8中。
[表8]
靶基因 Taqman Gene Experssion Assay 登录号
PMP22 Hs00165556_m1 NM_000304.3
GAPDH HS02786624_g1 NM_001256799.2
7.靶向的深度测序
使用Phusion聚合酶taq(New England BioLabs)通过PCR从gDNA扩增中靶位点,所述gDNA从经转导的细胞中提取。此后,使用Mi-Seq(Illumina)对PCR扩增产物进行双端深度测序。使用在线Cas-Analyzer工具(www.rgenome.net)分析深度测序结果。证实了在PAM序列的上游3bp处是否作为由Cas9而来的插入缺失的结果发生突变。将本研究中使用的引物总结于下表9中。
[表9]
/>
/>
8.计算机模拟的脱靶位点的设计
使用在线工具(www.rgenome.net)经计算机模拟设计了脱靶潜在位点。最大3bp的错配被认为是脱靶位点。
9.Digenome-seq
使用DNeasy Blood&Tissue Kit(Qiagen)根据销售商的方案纯化HeLa细胞的基因组DNA。在37℃下,将预先孵育的Cas9蛋白(100nM)和sgRNA(300nM)与基因组DNA(10μg)在1mL反应溶液(100mM NaCl、50mM Tris-HCl、10mM MgCl2、100μg/ml BSA,pH 7.9)中混合8小时。用RNase A(50μg/mL)处理截短的基因组DNA,并使用DNeasy Tissue Kit(Qiagen)再次纯化。使用Covaris系统将1μg截短的基因组DNA分成片段,并将用于产生文库的衔接子与DNA片段连接。此后,使用HiSeq×Ten测序仪(Illumina)以30-40×(Macrogen)的测序深度使文库经受全基因组测序(WGS)。通过DNA切割评分系统在基因组中的经切割的每个碱基序列的位置处计算体外切割评分。
10.小鼠和神经内注射
用于本研究中的C22小鼠品系(B6;CBACa-Tg(PMP22)C22Clh/H)购自MRC Harwell(Oxfordshire,UK)。用PMP22-TATA RNP处理C22小鼠(4只雄性和7只雌性)。以与先前的研究相同的方式进行神经内注射(Daisuke Ino.,J Vis Exp.,(2016)115)。将6日龄小鼠麻醉,并通过手术暴露小鼠坐骨神经。为了使神经损伤最小化,立即使用连接到微量注射器的经拉制的玻璃微量移液管在坐骨切迹的末端进行神经内注射。将11μg Cas9蛋白和2.75μgsgRNA的RNP复合物(每只小鼠)与Lipofectamine 3000(Invitrogen,Carlsbad,CA,USA)一起注射到小鼠中。本研究中使用的所有动物的饲养、使用和治疗均按照三星动物管理和使用委员会(SMC-20170206001)根据国际实验动物管理评估和认证协会制定的指南进行。
11.转棒实验(转棒测试)
使用转棒装置(B.S.Technolab INC,韩国)来评估运动协调性。进行该实验以评估小鼠的平衡和运动协调。在实验之前,小鼠经历了3天的训练期。在该实验中,将水平旋转棒(21rpm)用于转棒实验。测量小鼠在旋转棒上的滞留时间,并允许小鼠在棒上停留至多300秒。
12.电生理测试
为了评估电生理状态,以与先前研究中相同的方式进行神经传导测试(NCS)(Jinho Lee,J Biomed Sci.,(2015)22,43)。总之,用二氧化碳气体麻醉小鼠,并且在实验期间使用鼻锥供应1.5%异氟烷来维持麻醉。完全移除从远端到后爪的毛发。使用NicoletVikingQuest装置(Natus Medical)进行NCS。对于坐骨神经的运动神经传导试验,来自远端部分和近端部分的响应各自通过如下来确定:将活动记录针电极放置在腓肠肌上并伴随着附着至腱的参考电极,以及在靠近与身体中心部的距离为6mm且位于后大腿的中心线内的记录电极的位置处设置刺激负电极。测量远端潜伏期(DL)、运动神经传导速度(MNCV)和复合肌肉动作电位(CMAP)的幅度。将CMAP在最大过度刺激下测量。
13.神经组织学和图像
对小鼠的坐骨神经进行活组织检查,并通过显微镜分析进行受影响的样品的病理检查。使用含有2%戊二醛的25mM二甲胂酸盐缓冲液分别固定样品。用甲苯胺蓝对半薄切片进行染色。在1%OsO4中孵育1小时后,将样品在系列乙醇中脱水,然后使其通过环氧丙烷并包埋在环氧树脂(Epon 812,Oken,Nagano,日本)中。使用Leica ultra-microtome(LeicaMicrosystems)将细胞切片一定厚度(1μm),并用甲苯胺蓝染色30-45秒。使用Zeiss Zen 2程序(Carl Zeiss,Oberkochen,德国)通过测量髓鞘的内径和外径来计算g-比率(轴突直径/纤维直径)。
14.统计分析
通过使用Tukey事后多重比较的单因素方差分析来评估与mRNA表达水平相关的数据的统计学显著性。使用Mann-Whitney U检验(http://www.socscistatistics.com/tests/mannwhitney/Default2.aspx)计算其它类型的所给出的数据。使用GraphPad Prism分析从本研究产生的数据和图表。显著性水平设定为0.05。
实施例1.sgRNA筛选
为了筛选可将人PMP22的表达降低至正常范围的治疗有效的sgRNA序列,用被设计靶向PMP基因的编码序列(CDS)和TATA-盒以及基因内的增强子结合位点的各种sgRNA和Cas9s转导人细胞系。简言之,将Jurkat人T细胞用于SpCas9筛选,并将HEK293T细胞用于CjCas9。从细胞中收集gDNA并使之经受靶向深度测序。通过NHEJ介导的插入缺失识别由sgRNA序列诱导的各种突变模式。数种SpCas9-sgRNA在CDS和两个调控位点中强烈地诱导插入缺失(图1)。证实了在特定的CjCas9-sgRNA中诱导了30%-40%的插入缺失(图2)。
实施例2.施旺样细胞的基因操纵
虽然在人类细胞中鉴定出由sgRNA引起的有效的插入缺失突变,但不确定该效应在施旺细胞中是否也是可能的。因此,为了研究施旺细胞中的PMP22表达抑制和基因操纵的影响,使用sNF02.0细胞(施旺样细胞)证实了SpCas9-sgRNA效应。在sNF02.0细胞中反复地测试在Jurkat细胞中鉴定的有效SpCas9-sgRNA。转导后,通过深度测序分析证实了,通过相同的sgRNA获得了相同的高的插入缺失频率。特别地,证实了几乎70%-80%的插入缺失处于由靶向CDS的sgRNA引起的PMP22的移码中(图4)。
靶向启动子(TATA-盒)位点的单个sgRNA的转导和靶向增强子结合位置的单个sgRNA的转导分别诱导31%和59%的插入缺失(图3)。有趣的是,在用双sgRNA处理的大量细胞中发现了含有髓鞘基因的主要控制因子(例如,EGR或SOX10结合位置)的40bp-50bp的小的缺失、或者重要的TATA盒。(图5)。
实施例3.基因操纵对PMP22的表达控制
为了通过有效的sgRNA评估PMP22的表达变化,使施旺样细胞分化,并进行qRT-PCR。结果,大多数的靶向PMP22的sgRNA有效地抑制PMP22的表达(图6)。当使用单个sgRNA时,与仅用Cas9处理的对照相比,PMP22的表达降低约30%,并且当使用双sgRNA时,与仅用Cas9处理的对照相比,PMP22的表达降低约50%。
实施例4.施旺细胞的基因操纵
在先前在施旺样细胞中证实PMP22的表达抑制和基因操纵效果后,证实了先前的结果是否在人原代施旺细胞中表现出类似的作用。使用SpCas9-sgRNA在人原代施旺细胞中的人PMP22基因的每个靶位点处观察取决于靶位点的插入缺失频率。结果,证实了在靶向PMP22基因的TATA-盒、增强子和编码序列的大多数sgRNA中,靶位点处的插入缺失频率高(图7a)。此外,即使当使用各自靶向TATA盒和增强子的双sgRNA时,也显示出高的插入缺失频率。使用额外地靶向编码远端增强子位点B和C的序列的sgRNA证实了在靶位点发生插入缺失(图7c),并且在这种情况下,将靶向APOC3的sgRNA用作对照。
另外,为了确认在每个靶位点处的SpCas9-sgRNA是否引起PMP22基因的表达降低,进行了qRT-PCR分析。由于PMP22在施旺细胞分化的最后阶段进行转录,因此用包括神经调节蛋白-1(Nrg1)和二丁基环AMP(dbcAMP)在内的众所周知的不同的信号转导因子处理人原代施旺细胞7天。结果证实,与未用Nrg1和dbcAMP处理的细胞相比,用Nrg1和dbcAMP处理的细胞中的PMP22的表达增加了9倍。相比之下,当在每个靶位点处用SpCas9-sgRNA处理细胞时,证实了PMP22的表达被诱导了4-6倍。这被确定归因于由在每个靶位点处SpCas9-sgRNA对PMP22的各靶位点修饰引起的PMP22的表达抑制(图7b)。
实施例5.使用靶向人PMP22基因的TATA盒位点的CRISPR/Cas9对PMP22的有效且特异性的表达的降低的影响(体外)
通过选择sgRNA_TATA_Sp#1(下文,描述为PMP22-TATA sgRNA)在人原代施旺细胞中进行实验,所述sgRNA_TATA_Sp#1在靶向先前筛选的TATA盒位点的sgRNA之中显示出的高的插入缺失效率并且可靶向TATA盒。通过用包含sgRNA和Cas9蛋白的RNP复合物转导人原代施旺细胞诱导插入缺失(图8b),并且通过靶向深度测序分析证实,在人PMP22的TATA盒位点处产生了89.54±1.39%的总的插入缺失(图8)。
另外,为了证实在PMP22的TATA盒处形成的突变是否引起PMP22基因的表达降低,进行了qRT-PCR分析。由于PMP22在施旺细胞分化的最后阶段进行转录,因此用包括神经调节蛋白-1(Nrg1)和二丁基环AMP(dbcAMP)在内的众所周知的不同的信号因子处理人原代施旺细胞7天。结果证实,与未用Nrg1和dbcAMP处理的细胞相比,用Nrg1和dbcAMP处理的细胞中的PMP22的表达增加了9倍。相比之下,当用PMP22-TATA RNP一起处理细胞时,证实了PMP22的表达被诱导了6倍。这被确定归因于由CRISPR/Cas9对PMP22的TATA修饰引起的PMP22的表达抑制(图8)。在用分化信号转导因子和AAVS1靶标RNP两者处理的对照中,可确认PMP22基因的分化没有差异。
为了证实PMP22-TATA RNP的特异性,进行了基于计算机模拟的脱靶分析。通过靶向深度测序,在通过计算机分析确认的脱靶位置处证实了无超过测序错误率(平均0.1%)的插入缺失突变(图9)。由于基于计算机模拟的脱靶分析可能是偏倚的方式,因此还进行了Digenome-seq(并非偏倚的基于完整测序的脱靶分析)。结果,可确认在体外由PMP22-TATARNP切割的9个脱靶位置(图10a,图10b)。然而,作为通过靶向深度测序进行的重新分析的结果,在脱靶位置未发现异常的插入缺失突变(图10c)。
这些结果显示,PMP22-TATA RNP对PMP22的TATA盒的有效且特异性的修饰可控制人原代施旺细胞中的PMP22的转录水平。
实施例6.CMT1A小鼠中的CRISPR/Cas9介导的PMP22的表达抑制对疾病表型的减轻作用
为了测试在体内的PMP22-TATA RNP对PMP22的转录控制,将由脂质体包封的PMP22-TATA RNP直接注射到C22小鼠的坐骨神经内(图11)。在这种情况下,将靶向Rosa26(mRosa26)的RNP复合物用作对照。将mRosa26 RNP或PMP22-TATA RNP经神经内注射入并递送至6日龄(p6)小鼠的左侧坐骨神经(同侧的),并将右侧坐骨神经用作内部对照(对侧的)。注射后4周,通过从坐骨神经收集基因组DNA,经靶向深度测序确认RNP复合物的神经内递送效率。结果,用mRosa26 RNP和PMP22-TATA RNP处理的所有坐骨神经均显示出约11%的插入缺失效率(图12a)。此外,与体外结果一致,以总体的插入缺失测序读数证实了98.48±0.15%的TATA-盒突变(图12b)。
另外,为了确认在体内的TATA-box突变对PMP22的表达抑制,针对经RNP处理的坐骨神经进行了从整个坐骨神经提取的mRNA的qRT-PCR分析。与体外结果类似,证实了与对照相比,PMP22基因的表达降低38%(图12c)。
为了确认通过PMP22-TATA RNP是否在坐骨神经中发生了脱靶突变,进行了基于计算机模拟的脱靶分析。结果,从小鼠基因组确认了包括3bp或更多的错配的8个脱靶(图13a),并且作为进行靶向深度测序的结果,从用PMP22-TATA RNP处理的神经(同侧的)确认没有超过测序错误率的插入缺失突变(图13b)。
为了测试由PMP22-TATA RNP引起的PMP22转录的减少是否可阻止脱髓鞘,获得用PMP22-TATA RNP或mRosa26RNP处理的C22小鼠的坐骨神经,并且对其半薄切片用甲苯胺蓝(髓鞘染色)进行染色。此外,为了测量g-比率,测量轴突直径和纤维(包含髓鞘的轴突)直径。结果,可确认在用PMP22-TATA RNP处理的实验组中形成较厚的髓鞘片(图14a,图14b)。另外,当用PMP22-TATA RNP处理实验组时,与用mRosa26 RNP处理的对照相比,发现具有大直径的轴突的数量增加(图14a,图14b)。在用PMP22-TATA RNP处理的实验组(16.5%)中测量直径为6μm或更大的大的有髓纤维的数量的结果显示出比对照中更明显的治疗效果(2.6%,p<0.01)。
考虑到髓鞘形成组织学分析的显著改善,研究了两组的电生理学特性。结果证实,与用mRosa26 RNP处理的对照相比,用PMP22-TATA RNP处理的实验组的坐骨神经中的远端潜伏期(DL)降低且运动神经传导速度(NCV)增加(图15a,图15b),并且该结果与用PMP22-TATA RNP处理的神经中的髓鞘厚度和轴突直径的增加相符。此外,证实了在用PMP22-TATARNP处理的神经中,复合肌肉动作电位(CMAP)的幅度显著增加(图15c),这与先前的结果相符。
考虑到PMP22-TATA RNP的组织学和电生理学改善的作用,通过转棒实验分析小鼠的运动行为。结果证实,用PMP22-TATA RNP处理的小鼠(11至16周龄)比用mRosa26 RNP处理的小鼠(11至16周龄)在棒上保持更长时间(图16a)。此外,证实了与用mRosa26 RNP处理的小鼠相比,用MP22-TATA RNP处理的小鼠的肌肉增加(图16b)。
这些结果示出了PMP22-TATA RNP通过过表达PMP22来减轻或治疗脱髓鞘(例如CMT1A)的治疗效果。
因此,上述结果示出了使用靶向PMP22的启动子位点的CRISPR/Cas9的PMP22的表达抑制效果。此外,该结果示出了将PMP22-TATA RNP直接非病毒递送至C22小鼠的坐骨神经可改善与由PMP过表达引起的脱髓鞘相关的临床和神经病理学表型。因此,认为CRISPR/Cas9介导的PMP22的控制因子位点的修饰可能是治疗CMT1A和表现出脱髓鞘性神经病变的其它疾病的良好策略。
[工业应用性]
可将经人工操纵的SC功能控制因子和SC功能控制系统(功能由其进行人工修饰)用于SC功能障碍紊乱的有效治疗,所述SC功能障碍紊乱例如SC功能控制因子相关疾病(例如1A型腓骨肌痿缩症(CMT1A)、德热里纳-索塔斯病(DSS)、先天性髓鞘形成减少神经病变(CHN)或Roussy-Levy综合征(RLS))。通过涉及SC功能控制因子的各种体内机制,可改善SC功能控制系统的功效。
<110> 株式会社图尔金(TOOLGEN INCORPORATED)
<120> 经人工操纵的SC功能控制系统
<130> OPP17-045
<150> US 62/421,516
<151> 2016-11-14
<160> 150
<170> KoPatentIn 3.0
<210> 1
<211> 20
<212> DNA
<213> 智人
<400> 1
cgatgatact cagcaacagg 20
<210> 2
<211> 20
<212> DNA
<213> 智人
<400> 2
ggacgatgat actcagcaac 20
<210> 3
<211> 20
<212> DNA
<213> 智人
<400> 3
atggacacgc aactgatctc 20
<210> 4
<211> 20
<212> DNA
<213> 智人
<400> 4
gatgatcgac aggatcatgg 20
<210> 5
<211> 20
<212> DNA
<213> 智人
<400> 5
gaagatgatc gacaggatca 20
<210> 6
<211> 20
<212> DNA
<213> 智人
<400> 6
aactcttcac cctcaccaag 20
<210> 7
<211> 20
<212> DNA
<213> 智人
<400> 7
aaaacctgcc ccccttggtg 20
<210> 8
<211> 20
<212> DNA
<213> 智人
<400> 8
ggaatcttcc aaattcttgc 20
<210> 9
<211> 22
<212> DNA
<213> 智人
<400> 9
gatcgtggag acgaacagca gc 22
<210> 10
<211> 22
<212> DNA
<213> 智人
<400> 10
gctgacgatc gtggagacga ac 22
<210> 11
<211> 22
<212> DNA
<213> 智人
<400> 11
cgcaactgat ctctggcaga ac 22
<210> 12
<211> 22
<212> DNA
<213> 智人
<400> 12
gtgcgtgatg agtgctgcgg cc 22
<210> 13
<211> 22
<212> DNA
<213> 智人
<400> 13
gtgtagatgg ccgcagcact ca 22
<210> 14
<211> 20
<212> DNA
<213> 智人
<400> 14
ggaccagccc ctgaataaac 20
<210> 15
<211> 20
<212> DNA
<213> 智人
<400> 15
ggcgtctttc cagtttattc 20
<210> 16
<211> 20
<212> DNA
<213> 智人
<400> 16
gcgtctttcc agtttattca 20
<210> 17
<211> 20
<212> DNA
<213> 智人
<400> 17
cgtctttcca gtttattcag 20
<210> 18
<211> 20
<212> DNA
<213> 智人
<400> 18
ttcaggggct ggtccaatgc 20
<210> 19
<211> 20
<212> DNA
<213> 智人
<400> 19
tcaggggctg gtccaatgct 20
<210> 20
<211> 20
<212> DNA
<213> 智人
<400> 20
accatgacat atcccagcat 20
<210> 21
<211> 20
<212> DNA
<213> 智人
<400> 21
tttccagttt attcaggggc 20
<210> 22
<211> 20
<212> DNA
<213> 智人
<400> 22
cagttacagg gagcaccacc 20
<210> 23
<211> 20
<212> DNA
<213> 智人
<400> 23
ctggtctggc ttcagttaca 20
<210> 24
<211> 20
<212> DNA
<213> 智人
<400> 24
cctggtctgg cttcagttac 20
<210> 25
<211> 20
<212> DNA
<213> 智人
<400> 25
aactggaaag acgcctggtc 20
<210> 26
<211> 20
<212> DNA
<213> 智人
<400> 26
gaataaactg gaaagacgcc 20
<210> 27
<211> 20
<212> DNA
<213> 智人
<400> 27
tccaatgctg ggatatgtca 20
<210> 28
<211> 20
<212> DNA
<213> 智人
<400> 28
aatgctggga tatgtcatgg 20
<210> 29
<211> 20
<212> DNA
<213> 智人
<400> 29
atagaggctg agaacctctc 20
<210> 30
<211> 22
<212> DNA
<213> 智人
<400> 30
gccctctgaa tctccagtca at 22
<210> 31
<211> 22
<212> DNA
<213> 智人
<400> 31
aatctccagt caattccaac ac 22
<210> 32
<211> 22
<212> DNA
<213> 智人
<400> 32
aattaggcaa ttcttgtaaa gc 22
<210> 33
<211> 22
<212> DNA
<213> 智人
<400> 33
ttaggcaatt cttgtaaagc at 22
<210> 34
<211> 22
<212> DNA
<213> 智人
<400> 34
aaagcatagg cacacatcac cc 22
<210> 35
<211> 22
<212> DNA
<213> 智人
<400> 35
gcctggtctg gcttcagtta ca 22
<210> 36
<211> 22
<212> DNA
<213> 智人
<400> 36
gtgtccaact ttgtttgctt tc 22
<210> 37
<211> 22
<212> DNA
<213> 智人
<400> 37
gtattctgga aagcaaacaa ag 22
<210> 38
<211> 22
<212> DNA
<213> 智人
<400> 38
cagtcttggc atcacaggct tc 22
<210> 39
<211> 22
<212> DNA
<213> 智人
<400> 39
ggacctcttg gctattacac ag 22
<210> 40
<211> 22
<212> DNA
<213> 智人
<400> 40
ggagccagtg ggacctcttg gc 22
<210> 41
<211> 20
<212> DNA
<213> 智人
<400> 41
ttgggcatgt ttgagctggt 20
<210> 42
<211> 20
<212> DNA
<213> 智人
<400> 42
tttgggcatg tttgagctgg 20
<210> 43
<211> 20
<212> DNA
<213> 智人
<400> 43
gagctggtgg gcgaagcata 20
<210> 44
<211> 20
<212> DNA
<213> 智人
<400> 44
agctggtggg cgaagcatat 20
<210> 45
<211> 20
<212> DNA
<213> 智人
<400> 45
tgggcgaagc atatgggcaa 20
<210> 46
<211> 20
<212> DNA
<213> 智人
<400> 46
ggcctccatc ctaaacaatg 20
<210> 47
<211> 20
<212> DNA
<213> 智人
<400> 47
gggttgggag gtttgggcgt 20
<210> 48
<211> 20
<212> DNA
<213> 智人
<400> 48
aggtttgggc gtgggagtcc 20
<210> 49
<211> 19
<212> DNA
<213> 智人
<400> 49
ttcagagact cagctattt 19
<210> 50
<211> 19
<212> DNA
<213> 智人
<400> 50
ggccacattg tttaggatg 19
<210> 51
<211> 19
<212> DNA
<213> 智人
<400> 51
ggctttgggc atgtttgag 19
<210> 52
<211> 19
<212> DNA
<213> 智人
<400> 52
aacatgccca aagcccagc 19
<210> 53
<211> 19
<212> DNA
<213> 智人
<400> 53
acatgcccaa agcccagcg 19
<210> 54
<211> 23
<212> DNA
<213> 智人
<400> 54
ttaaatcaca gaggcaaaga gtt 23
<210> 55
<211> 22
<212> DNA
<213> 智人
<400> 55
ttgcatagtg ctagactgtt tt 22
<210> 56
<211> 22
<212> DNA
<213> 智人
<400> 56
gggtcatgtg ttttgaaaac ag 22
<210> 57
<211> 22
<212> DNA
<213> 智人
<400> 57
cccaaacctc ccaacccaca ac 22
<210> 58
<211> 22
<212> DNA
<213> 智人
<400> 58
actcagctat ttctggaatg ac 22
<210> 59
<211> 22
<212> DNA
<213> 智人
<400> 59
tcatcgcctt tgtgagctcc at 22
<210> 60
<211> 22
<212> DNA
<213> 智人
<400> 60
cagacacagg ctttgctcta gc 22
<210> 61
<211> 22
<212> DNA
<213> 智人
<400> 61
caaagcctgt gtctggccac ta 22
<210> 62
<211> 22
<212> DNA
<213> 智人
<400> 62
agcagtttgt gcccactagt gg 22
<210> 63
<211> 22
<212> DNA
<213> 智人
<400> 63
atgtcaaggt attccagcta ac 22
<210> 64
<211> 22
<212> DNA
<213> 智人
<400> 64
gaataactgt atcaaagtta gc 22
<210> 65
<211> 22
<212> DNA
<213> 智人
<400> 65
ttcctaatta agaggctttg tg 22
<210> 66
<211> 22
<212> DNA
<213> 智人
<400> 66
gagctagttt gtcagggtct ag 22
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 67
cacagggcag tcagagaccc 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 68
gcaaacaaag ttggacactg 20
<210> 69
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 69
agactcccgc ccatcttcta gaaa 24
<210> 70
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 70
aagtcgctct gagttgttat cagt 24
<210> 71
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 71
cagtgaaacg caccagacg 19
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 72
aatctgccta acaggaggtg 20
<210> 73
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 73
gagggaatgg ggaccaaagg catt 24
<210> 74
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 74
tcatgtgggg tgatgttcag gaag 24
<210> 75
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 75
agagcagctg acctgaggtc caa 23
<210> 76
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 76
cccaagggta gagtgcaagt aaac 24
<210> 77
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 77
gcatcctagc tcatttggtc tgct 24
<210> 78
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 78
gagaggattc ctcatgaatg ggat 24
<210> 79
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 79
accaaacact acacttggtt actg 24
<210> 80
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 80
ctcccactag caattttaaa gtct 24
<210> 81
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 81
gaatgttcag cacaggtttc cttg 24
<210> 82
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 82
ggtcaaaagg agctccatat ttga 24
<210> 83
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 83
caggacaccc atggccaaat ccag 24
<210> 84
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 84
cagagcctcc tgcagggatg tcaa 24
<210> 85
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 85
gcctgccaag gtgactctca tcta 24
<210> 86
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 86
tgcccaggct gatcttgaac tcct 24
<210> 87
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 87
cccagagtta agaggttctt tcct 24
<210> 88
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 88
gaagctactc cagtgcaact agct 24
<210> 89
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 89
acgcagtctg ttctgtgcag tgt 23
<210> 90
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 90
aggccttccc aaggaagacc ctga 24
<210> 91
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 91
gctgatcact ggccaaatcc agct 24
<210> 92
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 92
gggaaacaat gggatcaagc tgca 24
<210> 93
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 93
gcccctttgt aagttgagga gcat 24
<210> 94
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 94
ccctctacct ctctcaatgg gctt 24
<210> 95
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 95
cagacaagca aatgctgaga gatt 24
<210> 96
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 96
cctgtcatta tgatgttcgc tagt 24
<210> 97
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 97
ccagagttgg cctcctacag agat 24
<210> 98
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 98
gtggatgccc cactactgtt catt 24
<210> 99
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 99
tacccaattt gccagtctgt gtct 24
<210> 100
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 100
accaccaggc ctgccctaca aga 23
<210> 101
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 101
tgtgaatttg atcctggcat tatg 24
<210> 102
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 102
tacagacaag cagatgctga gaga 24
<210> 103
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 103
cagtcaacag agctctaacc tcct 24
<210> 104
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 104
agcacctggt tgcacatcaa ctt 23
<210> 105
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 105
catgtggtcc ctgaacgtga atga 24
<210> 106
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 106
gtctgtcgct tgccctcttc tct 23
<210> 107
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 107
atgcagggcc tctagaccat ttca 24
<210> 108
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 108
ctcagccctt tgtgcactca cct 23
<210> 109
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 109
tgcacatcgc aaacatttcg 20
<210> 110
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 110
tgggtatcgc actgtgtcag 20
<210> 111
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 111
aggttcacat ggcttgtggt 20
<210> 112
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 112
atatctgaaa tgcccgcagg 20
<210> 113
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 113
tgcacatcgc aaacatttcg 20
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 114
tgggtatcgc actgtgtcag 20
<210> 115
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 115
tctttaaagg ccttatctcc 20
<210> 116
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 116
ttctgcttga gaattcatcc 20
<210> 117
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 117
ctcctaatct ttcacttagg 20
<210> 118
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 118
caaagcctgg tataacatag 20
<210> 119
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 119
tcacttcgag catctgtgg 19
<210> 120
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 120
ccaaatgaca ggctgagct 19
<210> 121
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 121
agcaggaagt gaaggctaag 20
<210> 122
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 122
atgtaacgtg gcaactctgg 20
<210> 123
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 123
gtgttgctct cgtcaattag 20
<210> 124
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 124
aggtgttgta catggagaag 20
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 125
tgtgagccac catacccagc 20
<210> 126
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 126
cctgcagtcc tttgcggatc 20
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 127
tcgctgccag tataacatgc 20
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 128
aactccagtc tctagactcg 20
<210> 129
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 129
aatagtttga cgttggagcc 20
<210> 130
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 130
actcccaaca tgttctcctg 20
<210> 131
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 131
atcatcgctc acagagtcc 19
<210> 132
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 132
acgactgcag gatcttaatg 20
<210> 133
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 133
tggatggagg ttgggaatcc 20
<210> 134
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 134
ttgaggcagc agcactctcc 20
<210> 135
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 135
agtctatcct agcagctcc 19
<210> 136
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 136
actgagacca gataatgcag 20
<210> 137
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 137
aagagatgcg agttgttcc 19
<210> 138
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 138
cctcttctac tctgagtgg 19
<210> 139
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 139
acctggttta tcacaagcta 20
<210> 140
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 140
aacgtgaaca gaaggatttc 20
<210> 141
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 141
atcactccat cagagtcagg 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 142
tggctccttc tattctctcc 20
<210> 143
<211> 23
<212> DNA
<213> 智人
<400> 143
tatggaattc ccaagccccc tgg 23
<210> 144
<211> 23
<212> DNA
<213> 智人
<400> 144
ggaattccat atgagtcatc tgg 23
<210> 145
<211> 23
<212> DNA
<213> 智人
<400> 145
cacagcctac actttgatta tgg 23
<210> 146
<211> 23
<212> DNA
<213> 智人
<400> 146
tcaggagcat taagcatata ggg 23
<210> 147
<211> 23
<212> DNA
<213> 智人
<400> 147
gaccacggtc catgaattcc tgg 23
<210> 148
<211> 23
<212> DNA
<213> 智人
<400> 148
agtatttgca gctgaacaaa agg 23
<210> 149
<211> 23
<212> DNA
<213> 智人
<400> 149
atggagtaca gagagacata agg 23
<210> 150
<211> 23
<212> DNA
<213> 智人
<400> 150
aaagaatcaa tgcacagcca tgg 23

Claims (10)

1.组合物用于制备治疗CMT1A疾病的药物中的用途,其中,所述组合物包含:
来源于酿脓链球菌的Cas9蛋白或编码所述Cas9蛋白的核酸;以及
引导RNA或编码所述引导RNA的核酸,所述引导RNA包含crRNA和tracrRNA,其中,所述crRNA包含引导结构域和第一互补结构域;
其中,所述引导结构域和所述第一互补结构域从5’端至3’端依次连接;
其中,所述引导结构域能够靶向PMP22基因的TATA盒区域;
其中,所述crRNA的所述引导结构域具有选自SEQ ID NO:14-SEQ ID NO:17的序列;
其中,所述第一互补结构域和所述tracrRNA能够与所述Cas9蛋白相互作用。
2.如权利要求1所述的用途,其中,所述引导RNA是单个引导RNA。
3.如权利要求1或2所述的用途,其中,所述crRNA的所述第一互补结构域具有如下序列:5’-GUUUUAGAGCUA-3’;
其中,所述tracrRNA具有如下序列:5’-UAGCAAGUUAAAAU-3’、5’-AAGGCUAGUCCG-3’和5’-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’从5’端至3’端依次连接。
4.如权利要求1或2所述的用途,其中,所述组合物包含处于核糖核蛋白形式的所述引导RNA和所述Cas9蛋白。
5.如权利要求1或2所述的用途,其中,所述组合物处于载体的形式,所述载体包含编码所述引导RNA的核酸和编码所述Cas9蛋白的核酸。
6.一种对经分离的细胞中存在的PMP22基因的TATA盒区域进行编辑的方法,所述方法包括向所述经分离的细胞中引入如下组合物,其中,所述组合物包含:
来源于酿脓链球菌的Cas9蛋白或编码所述Cas9蛋白的核酸;以及
引导RNA或编码所述引导RNA的核酸,所述引导RNA包含crRNA和tracrRNA,其中,所述crRNA包含引导结构域和第一互补结构域;
其中,所述引导结构域和所述第一互补结构域从5’端至3’端依次连接;
其中,所述引导结构域能够靶向PMP22基因的TATA盒区域;
其中,所述crRNA的所述引导结构域具有选自SEQ ID NO:14-SEQ ID NO:17的序列;
其中,所述第一互补结构域和所述tracrRNA能够与所述Cas9蛋白相互作用。
7.如权利要求6所述的方法,其中,所述引导RNA是单个引导RNA。
8.如权利要求6或7所述的方法,其中,所述crRNA的所述第一互补结构域具有如下序列:5’-GUUUUAGAGCUA-3’;
其中,所述tracrRNA具有如下序列:5’-UAGCAAGUUAAAAU-3’、5’-AAGGCUAGUCCG-3’和5’-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3’从5’端至3’端依次连接。
9.如权利要求6或7所述的方法,其中,所述组合物包含处于核糖核蛋白形式的所述引导RNA和所述Cas9蛋白。
10.如权利要求6或7所述的方法,其中,所述组合物处于载体的形式,所述载体包含编码所述引导RNA的核酸和编码所述Cas9蛋白的核酸。
CN201780083263.5A 2016-11-14 2017-09-28 经人工操纵的sc功能控制系统 Active CN110248957B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662421516P 2016-11-14 2016-11-14
US62/421,516 2016-11-14
PCT/KR2017/010897 WO2018088694A2 (ko) 2016-11-14 2017-09-28 인위적으로 조작된 sc 기능 조절 시스템

Publications (2)

Publication Number Publication Date
CN110248957A CN110248957A (zh) 2019-09-17
CN110248957B true CN110248957B (zh) 2023-12-19

Family

ID=62109586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780083263.5A Active CN110248957B (zh) 2016-11-14 2017-09-28 经人工操纵的sc功能控制系统

Country Status (10)

Country Link
US (1) US20190276503A1 (zh)
EP (2) EP3896162A1 (zh)
JP (1) JP7338937B2 (zh)
KR (2) KR102437228B1 (zh)
CN (1) CN110248957B (zh)
AU (1) AU2017358122B2 (zh)
BR (1) BR112019009725A2 (zh)
CA (1) CA3043148A1 (zh)
RU (2) RU2022105597A (zh)
WO (1) WO2018088694A2 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11572574B2 (en) 2017-09-28 2023-02-07 Toolgen Incorporated Artificial genome manipulation for gene expression regulation
CN111527208B (zh) * 2017-09-28 2024-05-14 株式会社图尔金 用于基因表达调节的人工基因组操纵
EP3628735A1 (en) * 2018-09-25 2020-04-01 Centre National De La Recherche Scientifique Antisense rna targeting pmp22 for the treatment of charcot-marie-tooth 1a disease
EP3798301A1 (en) * 2019-09-25 2021-03-31 KWS SAAT SE & Co. KGaA Promoter repression
WO2021184021A1 (en) * 2020-03-13 2021-09-16 Codiak Biosciences, Inc. Extracellular vesicle-aso constructs targeting pmp22
CN114621922A (zh) * 2022-02-15 2022-06-14 中山大学附属第五医院 一种大鼠海绵体神经来源施旺细胞的提取纯化和培养方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015188056A1 (en) * 2014-06-05 2015-12-10 Sangamo Biosciences, Inc. Methods and compositions for nuclease design
CN105164264A (zh) * 2012-12-12 2015-12-16 布罗德研究所有限公司 用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100613038B1 (ko) * 2004-07-07 2006-08-16 공주대학교 산학협력단 염색체 17p11.2-p12 지역의 중복을 제외한 유전자돌연변이를 발병 원인으로 하는 CMT 질환의 진단방법및 진단키트
CA2690815A1 (en) * 2007-06-12 2008-12-18 Case Western Reserve University Targeted cell death
DE202013012597U1 (de) * 2012-10-23 2017-11-21 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
AU2014281026B2 (en) * 2013-06-17 2020-05-28 Massachusetts Institute Of Technology Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
US20160237455A1 (en) * 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
KR20160102056A (ko) * 2013-12-26 2016-08-26 더 제너럴 하스피탈 코포레이션 멀티플렉스 가이드 rna
CN106922154B (zh) * 2014-08-06 2022-01-07 基因工具股份有限公司 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105164264A (zh) * 2012-12-12 2015-12-16 布罗德研究所有限公司 用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化
WO2015188056A1 (en) * 2014-06-05 2015-12-10 Sangamo Biosciences, Inc. Methods and compositions for nuclease design

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9;DOENCH,J.G. et al;《nature biotechnology》;20160118;摘要及该文章的补充数据材料 *
基因治疗假肥大型肌营养不良症后机体的免疫反应;赵翠萍等;《国际神经病学神经外科学杂志》;20050630(第03期);267-269 *

Also Published As

Publication number Publication date
KR20220122592A (ko) 2022-09-02
JP2019537446A (ja) 2019-12-26
RU2019118283A (ru) 2020-12-14
KR102621539B1 (ko) 2024-01-09
US20190276503A1 (en) 2019-09-12
CA3043148A1 (en) 2018-05-17
WO2018088694A2 (ko) 2018-05-17
RU2768043C2 (ru) 2022-03-23
RU2022105597A (ru) 2022-04-04
RU2019118283A3 (zh) 2021-04-26
AU2017358122B2 (en) 2022-12-22
BR112019009725A2 (pt) 2019-11-19
JP7338937B2 (ja) 2023-09-05
KR20180054427A (ko) 2018-05-24
WO2018088694A3 (ko) 2018-08-09
EP3539980A2 (en) 2019-09-18
KR102437228B1 (ko) 2022-08-30
CN110248957A (zh) 2019-09-17
EP3539980A4 (en) 2020-10-07
AU2017358122A1 (en) 2019-07-04
EP3896162A1 (en) 2021-10-20

Similar Documents

Publication Publication Date Title
CN110248957B (zh) 经人工操纵的sc功能控制系统
CN111527208B (zh) 用于基因表达调节的人工基因组操纵
KR102662879B1 (ko) 망막 기능장애 질환 치료를 위한 유전자 조작
KR20180136914A (ko) 간에서 목적하는 단백질 발현하기 위한 플랫폼
US20230295652A1 (en) Artificial genome manipulation for gene expression regulation
CN112888461A (zh) 抗凝因子的基因编辑
KR20200011899A (ko) 인위적인 유전자 조작을 통한 자가면역질환 치료
EP3640334A1 (en) Genome editing system for repeat expansion mutation
KR102670361B1 (ko) 유전자 발현 조절을 위한 인위적인 게놈 조작
US20230190889A1 (en) Gene editing of anticoagulant factors
EP4326864A1 (en) Novel omni 117, 140, 150-158, 160-165, 167-177, 180-188, 191-198, 200, 201, 203, 205-209, 211-217, 219, 220, 222, 223, 226, 227, 229, 231-236, 238-245, 247, 250, 254, 256, 257, 260 and 262 crispr nucleases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40014170

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant