CN110352242A - Pcsk9的基因编辑 - Google Patents

Pcsk9的基因编辑 Download PDF

Info

Publication number
CN110352242A
CN110352242A CN201780087049.7A CN201780087049A CN110352242A CN 110352242 A CN110352242 A CN 110352242A CN 201780087049 A CN201780087049 A CN 201780087049A CN 110352242 A CN110352242 A CN 110352242A
Authority
CN
China
Prior art keywords
domain
nucleotide sequence
seq
guidance
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780087049.7A
Other languages
English (en)
Inventor
J.P.麦安蒂
D.R.刘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard University
Original Assignee
Harvard University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard University filed Critical Harvard University
Publication of CN110352242A publication Critical patent/CN110352242A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/04Anorexiants; Antiobesity agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/06Antihyperlipidemics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/02Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/10Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/12Antihypertensives
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Abstract

本文提供了将功能丧失突变引入到参与LDL‑R介导的胆固醇清除途径的蛋白质因子(例如PCSK9、APOC3、LDL‑R或IDOL)中的系统、组合物和方法。可以使用其中描述的基于CRISPR/Cas9的核碱基编辑器引入功能丧失突变。本文进一步提供了治疗与高循环胆固醇水平相关的状况的组合物和方法。

Description

PCSK9的基因编辑
相关申请
本申请要求2016年12月23日提交的美国临时申请U.S.S.N.62/438,869的根据35U.S.C.§119(e)的优先权,其通过引用并入本文。
政府支持
本发明是在国立卫生研究院(National Institutes of Health)授予的拨款号GM065865下得到政府支持完成的。政府拥有本发明的某些权利。
发明背景
肝脏蛋白质前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)是一种分泌性、球状、自体激活丝氨酸蛋白酶,其起内体囊泡内的蛋白质结合衔接物作用以在低密度脂蛋白(LDL)颗粒的胞吞作用期间桥接与LDL受体(LDL-R)的pH依赖性相互作用,从而阻止LDL-R再循环到细胞表面并导致LDL-胆固醇清除降低。阻断或抑制PCSK9的功能以加强LDL-R介导的LDL胆固醇清除在制药业中具有重要意义。然而,目前在体内生成PCSK9保护性变体和功能丧失突变体的方法由于需要修饰大量细胞以调控胆固醇水平而是无效的。其他担忧涉及可能由基因组编辑引起的脱靶效应、基因组不稳定性或致癌性修饰。
发明概述
本文提供的是用于修饰编码PCSK9蛋白的多核苷酸(例如DNA)以产生功能丧失PCSK9变体的系统、组合物、试剂盒和方法。本文还提供的是用于修饰编码LDLR、IDOL或APOC3/C5蛋白的多核苷酸(例如DNA)以产生功能丧失变体的系统、组合物、试剂盒和方法。用于产生突变体的方法学依赖于基于CRISPR/Cas9的碱基编辑技术。本文所述的精确靶向方法优于先前提出的策略,其使用工程化的核酸酶在PCSK9基因组基因座或本文所述的其他基因座中产生随机插入/缺失(indel)。由于脱靶效应的可能性低,该方法还具有更有利的安全概况。因此,本文所述的碱基编辑方法对基因组稳定性,包括癌基因激活或肿瘤抑制基因失活具有低影响。在一些实施方案中,使用本文所述的方法生成的功能丧失变体(例如PCSK9、LDLR、IDOL或APOC3/C5变体)具有心脏保护功能。在一些实施方案中,使用本文所述的方法生成的功能丧失变体(例如PCSK9、LDLR、IDOL或APOC3/C5变体)降低LDL水平。在一些实施方案中,使用本文所述的方法生成的功能丧失变体(例如PCSK9、LDLR、IDOL或APOC3/C5变体)降低LDL胆固醇水平。在一些实施方案中,使用本文所述的方法生成的功能丧失变体(例如PCSK9、LDLR、IDOL或APOC3/C5变体)降低总胆固醇水平。在一些实施方案中,使用本文所述的方法生成的功能丧失变体(例如PCSK9、LDLR、IDOL或APOC3/C5变体)增加HDL水平。
本公开的一些方面提供编辑编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸的方法,所述方法包括使编码PCSK9的多核苷酸接触(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到所述编码PCSK9的多核苷酸中的靶胞嘧啶(C)碱基,其中所述接触导致所述融合蛋白对所述靶C碱基脱氨基,从而导致所述编码PCSK9的多核苷酸中胞嘧啶(C)至胸腺嘧啶(T)变化。
在一些实施方案中,所述引导核苷酸序列-可编程DNA结合蛋白域选自下组:核酸酶无活性的Cas9(dCas9)域、核酸酶无活性的Cpf1域、核酸酶无活性的Argonaute域,及其变体和组合。在一些实施方案中,所述引导核苷酸序列-可编程DNA结合蛋白域是核酸酶无活性的Cas9(dCas9)域。在一些实施方案中,所述dCas9域的氨基酸序列包含对应于SEQ IDNO:1中D10A和/或H840A突变的突变。在一些实施方案中,使用Cas9切口酶。在一些实施方案中,所述Cas9切口酶的氨基酸序列包含对应于SEQ ID NO:1中D10A突变的突变,并且其中所述dCas9域包含对应于SEQ ID NO:1的氨基酸840的位置处的组氨酸。
在一些实施方案中,所述引导核苷酸序列-可编程DNA结合蛋白域包含核酸酶无活性的Cpf1(dCpf1)域。在一些实施方案中,所述dCpf1域来自氨基酸球菌属(Acidaminococcus)或毛螺菌科(Lachnospiraceae)的物种。
在一些实施方案中,所述引导核苷酸序列-可编程DNA结合蛋白域包含核酸酶无活性的Argonaute(dAgo)域。在一些实施方案中,所述dAgo域来自格氏嗜盐碱杆菌(Natronobacterium gregoryi)(dNgAgo)。
作为一组非限制性实例,本文所述的任何包括Cas9域的融合蛋白可以使用另一种引导核苷酸序列-可编程DNA结合蛋白,例如CasX、CasY、Cpf1、C2c1、C2c2、C2c3和Argonaute替换Cas9域。这些可以是蛋白质的核酸酶无活性的变体。引导核苷酸序列-可编程DNA结合蛋白包括但不限于Cas9(例如dCas9和nCas9)、saCas9(例如saCas9d、saCas9n、saKKHCas9)、CasX、CasY、Cpf1、C2c1、C2c2、C2C3、Argonaute和任何本文所述的合适的蛋白质。在一些实施方案中,本文所述的融合蛋白包含Gam蛋白、引导核苷酸序列-可编程DNA结合蛋白和胞苷脱氨酶域。
在一些实施方案中,所述胞嘧啶脱氨酶域包含载脂蛋白B mRNA-编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,所述胞嘧啶脱氨酶选自下组:APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、激活诱导的脱氨酶(AID)和pmCDA1。在一些实施方案中,所述胞嘧啶脱氨酶包含SEQ ID NO:271-292和303的任一个的氨基酸序列。
在一些实施方案中,(a)的融合蛋白进一步包含尿嘧啶糖基化酶抑制剂(UGI)域。在一些实施方案中,胞嘧啶脱氨酶域与所述引导核苷酸序列-可编程DNA结合蛋白域的N端融合。在一些实施方案中,UGI域与所述引导核苷酸序列-可编程DNA结合蛋白域的C端融合。
在一些实施方案中,胞嘧啶脱氨酶经由任选的接头与所述引导核苷酸序列-可编程DNA结合蛋白域融合。在一些实施方案中,所述UGI域经由任选的接头与所述dCas9域融合。在一些实施方案中,所述融合蛋白包含结构NH2-[胞嘧啶脱氨酶域]-[任选的接头序列]-[引导核苷酸序列-可编程DNA结合蛋白域]-[任选的接头序列]-[UGI域]-COOH。
在一些实施方案中,所述接头包含(GGGS)n(SEQ ID NO:1998)、(GGGGS)n(SEQ IDNO:308)、(G)n、(EAAAK)n(SEQ ID NO:309)、(GGS)n、SGSETPGTSESATPES(SEQ ID NO:310)或(XP)n基序,或任何这些的组合,其中n独立地是1和30之间的整数,并且其中X是任何氨基酸。在一些实施方案中,所述接头包含氨基酸序列SGSETPGTSESATPES(SEQ ID NO:310)。在一些实施方案中,所述接头是(GGS)n,并且其中n是1、3或7。
在一些实施方案中,融合蛋白包含SEQ ID NO:10或293-302的任一个的氨基酸序列。
在一些实施方案中,编码PCSK9蛋白的多核苷酸包含编码链和互补链。在一些实施方案中,编码PCSK9蛋白的多核苷酸包含编码区和非编码区。
在一些实施方案中,C至T变化发生在所述编码PCSK9的多核苷酸的编码序列中或编码链上。在一些实施方案中,C至T变化导致所述PCSK9蛋白中的突变。在一些实施方案中,PCSK9蛋白中的所述突变是功能丧失突变。在一些实施方案中,所述突变选自表3中列出的突变。在一些实施方案中,用于本发明中的所述引导核苷酸序列选自表3中列出的引导核苷酸序列。
在一些实施方案中,功能丧失突变在所述PCSK9编码序列中引入提前终止密码子,其导致截短的或非功能性的PCSK9蛋白。在一些实施方案中,所述提前终止密码子是TAG(琥珀)、TGA(乳白)或TAA(赭石)。
在一些实施方案中,所述提前终止密码子经由所述编码链上的第一个C的脱氨基从CAG至TAG变化生成。在一些实施方案中,所述提前终止密码子经由所述编码链上的第一个C的脱氨基从CGA至TGA变化生成。在一些实施方案中,所述提前终止密码子经由所述编码链上的第一个C的脱氨基从CAA至TAA变化生成。在一些实施方案中,所述提前终止密码子经由所述互补链上的第二个C的脱氨基从TGG至TAG变化生成。在一些实施方案中,所述提前终止密码子经由所述互补链上的第三个C的脱氨基从TGG至TGA变化生成。在一些实施方案中,所述提前终止密码子经由所述编码链上的C的脱氨基和所述互补链上的C的脱氨基从CGG至TAG或CGA至TAA变化生成。在一些实施方案中,所述引导核苷酸序列选自表6中列出的引导核苷酸序列(SEQ ID NO:938-1123)。
在一些实施方案中,引入串联的提前终止密码子。在一些实施方案中,所述突变选自下组:W10X-W11X、Q99X-Q101X、Q342X-Q344X和Q554X-Q555X,其中X是终止密码子。可以在表6中找到用于连续突变的引导核苷酸序列。
在一些实施方案中,所述提前终止密码子在结构上去稳定化突变后引入。在一些实施方案中,所述突变选自下组:P530S/L-Q531X、P581S/L-R582X和P618S/L-Q619X,其中X是终止密码子。在一些实施方案中,用于引入所述提前终止密码子的所述引导核苷酸序列选自SEQ ID NO:938-1123,并且其中用于引入结构上去稳定化突变的所述引导核苷酸序列选自SEQ ID NO:579-937。在一些实施方案中,所述突变使PCSK9蛋白质折叠去稳定化。
在一些实施方案中,突变选自表4中列出的突变。在一些实施方案中,所述引导核苷酸序列选自表4中列出的引导核苷酸序列(SEQ ID NO:579-937)。
在一些实施方案中,所述C至T变化发生在所述编码PCSK9的多核苷酸的非编码区中的剪接位点处。在一些实施方案中,所述C至T变化发生在内含子-外显子接合处。在一些实施方案中,所述C至T变化发生在剪接供体位点处。在一些实施方案中,所述C至T变化发生在剪接受体位点处。在一些实施方案中,所述C至T变化发生在与起始密码子(AUG)中G碱基配对的C碱基处。在一些实施方案中,所述C至T变化阻止PCSK9 mRNA成熟或消除PCSK9表达。在一些实施方案中,所述引导核苷酸序列选自表8中列出的引导核苷酸序列(SEQ ID NO:1124-1309)。
在一些实施方案中,PAM序列位于变化的C的3’,例如选自下组的PAM序列:NGG、NGAN、NGNG、NGAG、NGCG、NNGRRT、NGRRN、NNNRRT、NGGNG、NNNGATT、NNAGAA和NAAAC,其中Y是嘧啶,R是嘌呤以及N是任何核碱基。在一些实施方案中,PAM序列位于变化的C的5’,例如选自下组的PAM序列:NNT、NNNT和YNT,其中Y是嘧啶以及N是任何核碱基。在一些实施方案中,没有PAM序列位于靶C碱基的5’或3’。
在一些实施方案中,将至少1、2、3、4、5、6、7、8、9或10个突变引入到编码PCSK9的多核苷酸中。
在一些实施方案中,引导核苷酸序列是RNA(引导RNA或gRNA)。在一些实施方案中,引导核苷酸序列是ssDNA(引导DNA或gDNA)。
本公开的其他方面提供编辑编码载脂蛋白C3(APOC3)蛋白的多核苷酸的方法,所述方法包括使所述编码APOC3的多核苷酸接触:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码APOC3的多核苷酸中的靶胞嘧啶(C)碱基,其中所述接触导致所述融合蛋白对所述靶C碱基脱氨基,从而导致所述编码APOC3的多核苷酸中胞嘧啶(C)至胸腺嘧啶(T)变化。在一些实施方案中,所述引导核苷酸序列选自SEQ ID NO:1806-1906。
本公开的其他方面提供编辑编码低密度脂蛋白受体(LDL-R)蛋白的多核苷酸的方法,所述方法包括使编码LDL-R的多核苷酸接触:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码LDL-R的多核苷酸中的靶胞嘧啶(C)碱基,其中所述接触导致所述融合蛋白对所述靶C碱基脱氨基,从而导致编码LDLR的多核苷酸中胞嘧啶(C)至胸腺嘧啶(T)变化。在一些实施方案中,引导核苷酸序列选自SEQ ID NO:1792-1799。
本公开的其他方面提供编辑编码所述LDL受体的诱导性降解物(IDOL)蛋白的多核苷酸的方法,所述方法包括使所述编码IDOL的多核苷酸接触:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码IDOL的多核苷酸中的靶C碱基,其中所述接触导致所述融合蛋白对所述靶C碱基脱氨基,从而导致所述编码IDOL的多核苷酸中胞嘧啶(C)至胸腺嘧啶(T)变化。在一些实施方案中,引导核苷酸序列选自SEQ ID NO:1788-1791。
在一些实施方案中,方法在体外实施。在一些实施方案中,方法在培养的细胞中实施。在一些实施方案中,方法在体内实施。在一些实施方案中,方法离体实施。
在一些实施方案中,方法在哺乳动物中实施。在一些实施方案中,其中所述哺乳动物是啮齿动物。在一些实施方案中,所述哺乳动物是灵长类动物。在一些实施方案中,所述哺乳动物是人。在一些实施方案中,所述方法在受试者的器官(例如肝)中实施。
本公开的其他方面提供编辑编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin9型(PCSK9)蛋白的多核苷酸的方法,所述方法包括使所述编码PCSK9的多核苷酸接触融合蛋白,所述融合蛋白包含:(a)可编程DNA结合蛋白域;和(b)脱氨酶域,其中所述接触导致所述融合蛋白对所述靶碱基脱氨基,从而导致所述编码PCSK9的多核苷酸中碱基变化。
在一些实施方案中,可编程DNA结合域包含锌指核酸酶(ZFN)域。在一些实施方案中,所述可编程DNA结合域包含转录激活物样效应物(TALE)域。在一些实施方案中,所述可编程DNA结合域是引导核苷酸序列-可编程DNA结合蛋白域。
在一些实施方案中,可编程DNA结合域选自下组:核酸酶无活性的Cas9域(例如dCas9和nCas9)、核酸酶无活性的Cpf1域、核酸酶无活性的Argonaute域,及其变体。在一些实施方案中,所述可编程DNA结合域是CasX、CasY、C2c1、C2c2、C2c3域,或其变体。在一些实施方案中,所述可编程DNA结合域是saCas9(例如saCas9d、saCas9n、saKKH Cas9)域,或其变体。在一些实施方案中,可编程DNA结合域与引导核苷酸序列缔合。在一些实施方案中,所述脱氨酶是胞嘧啶脱氨酶。在一些实施方案中,靶碱基是胞嘧啶(C)碱基并且靶C碱基的脱氨基导致C至脱氧尿苷(dU)变化,其领先于引入胸腺嘧啶(T)代替靶C。在一些实施方案中,本文所述的融合蛋白包含Gam蛋白、引导核苷酸序列-可编程DNA结合蛋白和胞苷脱氨酶域。
本公开的一些方面提供组合物,其包含:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸。在一些实施方案中,(i)的所述融合蛋白进一步包含Gam蛋白。
本公开的其他方面提供组合物,其包含:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸;和(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码载脂蛋白C3蛋白的多核苷酸。在一些实施方案中,(i)的所述融合蛋白进一步包含Gam蛋白。
本公开的其他方面提供组合物,其包含:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸;(iii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码载脂蛋白C3蛋白的多核苷酸;和(iv)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码低密度脂蛋白受体蛋白的多核苷酸。在一些实施方案中,(i)的所述融合蛋白进一步包含Gam蛋白。
本公开的其他方面提供组合物,其包含:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;将(i)的所述融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸的引导核苷酸序列;在一些实施方案中,将(i)的所述融合蛋白靶向到编码载脂蛋白C3蛋白的多核苷酸的引导核苷酸序列;在一些实施方案中,将(i)的所述融合蛋白靶向到编码低密度脂蛋白受体蛋白的多核苷酸的引导核苷酸序列;并且在一些实施方案中,将(i)的所述融合蛋白靶向到编码所述LDL受体的诱导性降解物蛋白的多核苷酸的引导核苷酸序列。在一些实施方案中,(i)的所述融合蛋白进一步包含Gam蛋白。
在一些实施方案中,(ii)的所述引导核苷酸序列选自SEQ ID NO:336-1309。在一些实施方案中,(iii)的所述引导核苷酸序列选自SEQ ID NO:1806-1906。在一些实施方案中,(iv)的所述引导核苷酸序列引导核苷酸序列选自SEQ ID NO:1792-1799。在一些实施方案中,(v)的所述引导核苷酸序列选自SEQ ID NO:1788-1791。
本公开的其他方面提供组合物,其包含编码融合蛋白的核酸和本文所述的引导核苷酸序列。在一些实施方案中,所述组合物进一步包含药学上可接受的载体。
本公开的其他方面提供加强LDL受体介导的LDL胆固醇清除的方法,所述方法包括向有此需要的受试者施用治疗有效量的本文所述的组合物。
本公开的其他方面提供降低受试者中循环胆固醇水平的方法,所述方法包括向有此需要的受试者施用治疗有效量的本文所述的组合物。
本公开的其他方面提供治疗状况的方法,所述方法包括向有此需要的受试者施用治疗有效量的本文所述的组合物。在一些实施方案中,所述状况是高胆固醇血症、总胆固醇水平升高、低密度脂蛋白(LDL)水平升高、LDL-胆固醇水平升高、高密度脂蛋白水平降低、肝脏脂肪变性、冠心病、缺血、中风、外周血管疾病、血栓形成、2型糖尿病、高血压、动脉粥样硬化、肥胖、阿尔茨海默氏病、神经变性,或其组合。
本文进一步提供的是试剂盒,其包含本文所述的组合物。
如下所述,在某些实施方案的详细描述中阐述了本发明的某些实施方案的细节。根据定义、实施例、附图和权利要求书,本发明的其他特征、目的和优点将是明显的。
附图简述
构成本说明书的一部分的附图阐明了本发明的若干实施方案,并与说明书一起用于解释本发明的原理。
图1A描绘了前PCSK9原开放阅读框,其显示在与低密度脂蛋白(LDL)胆固醇升高相关的人群中鉴定的天然存在的功能获得(GOF)变体(其导致LDL受体(LDL-R)降解增加),以及显示与较低LDL胆固醇和心脏保护相关的有益功能丧失(LOF)表型的其他变体。以红色突出显示的变体已经以机械论方式证实。显示了关键的催化位点残基。3b
图1B是未切割的前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)原的模型(基于PDB:1R6V),其显示催化三联体残基(Asp186、His226和Ser386)的位置和产生GOF(S127R、F216L、D374Y)或LOF变体(R46L、ΔR97、L253F、A433T)的选择的残基,所述变体影响PCSK9蛋白水解自体激活、蛋白酶失活或LDL-R结合亲和力(参见表1和2)。
图1C显示在X射线共结构(PDB:3BPS)中观察到的PCSK9和LDL-R的EGF-A域之间的相互作用。19
图2是肝细胞中PCSK9的基本功能的示意图,其在LDL的胞吞作用后阻止LDL-R再循环至细胞表面。制药行业正在探索阻断PCSK9功能的多种策略(表12),包括两种FDA批准的抗PCSK9抗体治疗剂,2-3期的其他抗体和临床前阶段中:adnectin、肽、小分子、反义寡聚物和RNA干扰。
图3A显示通过改变剪接位点:供体位点、分支点或接受体位点来阻止PCSK9mRNA成熟和蛋白质产生的策略。
图3B至3D显示人剪接体内含子分支点、供体和接受体位点的共有序列,表明供体和接受体位点的鸟苷是互补链上C→T反应的碱基编辑的优良靶标。
图4显示了PCSK9的蛋白质和开放阅读框序列。以灰色突出显示的残基对应于表4(提前终止密码子)或表5(去稳定化变体)。该图中的顶层核苷酸序列描绘了SEQ ID NO:1990。该图中的第二层氨基酸序列描绘了SEQ ID NO:1991。
图5是显示外显子(大写)和内含子(小写)的PCSK9基因组序列。外显子/内含子接合中的关键核苷酸加下划线。该图描绘了SEQ ID NO:1994。
图6是显示PAM和靶序列的相对位置的编号方案的图。该图描绘了SEQ ID NO:1995。
定义
如本文和权利要求书中所用,除非上下文另外明确指出,否则单数形式“一种”、“一个”和“该/所述”包括单数和复数提及物。因此,例如,提及“试剂”包括单一试剂和多个此类试剂。
“胆固醇”是指所有动物细胞生物合成的脂质分子。不希望受特定理论束缚,胆固醇是所有动物细胞膜的必需结构组分,其是维持膜结构完整性和流动性两者所必需的。胆固醇使动物细胞能够免除细胞壁(以保护细胞膜完整性和细胞存活力),从而允许动物细胞改变形状并允许动物移动(与受其细胞壁限制的细菌和植物细胞不同)。除了其对动物细胞结构的重要性外,胆固醇还可以充当类固醇激素和胆汁酸的生物合成的前体。胆固醇是所有动物合成的主要固醇。在脊椎动物中,肝细胞通常比其他细胞产生更多的量。它通常在原核生物(细菌和古细菌)中不存在。
对于膜结构和其他用途两者,所有动物细胞都制造胆固醇,相对生产率随细胞类型和器官功能而异。每日总胆固醇产量的约20%发生在肝中;其他合成率较高的部位包括肠、肾上腺和生殖器官。肝将胆固醇排泄到胆汁液中,所述胆汁液然后储存在胆囊中。胆汁含有胆汁盐,其溶解消化道中的脂肪并帮助肠道吸收脂肪分子以及脂溶性维生素A、D、E和K。胆固醇在体内循环使用。通常,肝排泄的约50%的胆固醇被小肠重新吸收回到血流中。
作为分离的分子,胆固醇仅微溶于水;它只在小浓度下溶解到(水基)血流中。相反,胆固醇在脂蛋白,即具有外部两亲性蛋白质和脂质的复杂的盘状颗粒内转运,所述脂蛋白的面向外部的结构是水溶性的并且面向内部的结构是脂溶性的;即经由乳化转运。脂蛋白颗粒基于其密度分类:低密度脂蛋白(LDL)、极低密度脂蛋白(VLDL)、高密度脂蛋白(HDL)、乳糜微粒等。甘油三酯和胆固醇酯在内部携带。磷脂和胆固醇(是两亲性的)在脂蛋白颗粒的单层表面中转运。
表面LDL受体在胆固醇吸收的过程期间被内化,并且SREBP根据其在细胞内的浓度调节其合成,SREBP是控制胆固醇的从头合成的相同蛋白质。具有丰富胆固醇的细胞的LDL受体合成被阻断,以阻止LDL颗粒中的新胆固醇被摄取。相反地,当细胞缺乏胆固醇时,LDL受体合成得到促进。
不希望受任何具体理论束缚,如果此生理过程变得不受调节,那么过量的LDL颗粒将在血液中移行而没有被LDL受体摄取的机会。这些LDL颗粒被氧化并通过清道夫受体被巨噬细胞摄取,所述巨噬细胞然后变得过饱并形成泡沫细胞。这些泡沫细胞通常被困在血管壁中并促成动脉粥样硬化斑块形成。胆固醇内稳态的差异影响早期动脉粥样硬化(颈动脉内膜-中膜厚度)的发展。这些斑块是心脏病发作、中风和其他严重医学问题的主要原因,导致所谓的LDL胆固醇(实际上是脂蛋白)与“坏”胆固醇的关联。
“前蛋白质转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9)”是指人中由PCSK9基因编码的酶。PCSK9与低密度脂蛋白(LDL)颗粒的受体结合。在肝中,LDL受体通过胞吞作用途径从血液中除去LDL颗粒。当PCSK9与LDL受体结合时,受体被导向溶酶体途径并被蛋白水解酶分解,从而限制了给定LDL受体能够从血液中摄取LDL颗粒的次数。因此,阻断PCSK9活性可以导致更多的再循环并存在于肝细胞的表面上的LDL受体,并将从血液中除去更多的LDL胆固醇。因此,阻断PCSK9可以降低血液胆固醇水平。在许多物种中发现了PCSK9直向同源物。由于肽链的一部分阻断其活性,PCSK9在最初合成时是无活性的,即前酶原;前蛋白质转化酶除去该部分以激活酶。前PCSK9是一种分泌性、球状、丝氨酸蛋白酶,其能够将其N端原结构域(pro-domain)蛋白水解自动加工成PCSK9的有效内源性抑制剂,该抑制剂阻断其催化位点。PCSK9在胆固醇内稳态中的作用已在医学上得以开发利用。阻断PCSK9的药物可以降低低密度脂蛋白胆固醇(LDL-C)的血液水平。前两种PCSK9抑制剂阿利库单抗(alirocumab)和依伏库单抗(evolocumab)在2015年被美国食品和药物管理局(U.S.Food and DrugAdministration)批准在他汀类药物和其他药物不充分的情况下降低胆固醇。
“低密度脂蛋白(LDL)”是指脂蛋白的五大类之一,从最不稠密(较低重量-体积比的颗粒)到最稠密(较大重量-体积比的颗粒):乳糜微粒、极低密度脂蛋白(VLDL)、低密度脂蛋白(LDL)、中密度脂蛋白(IDL)和高密度脂蛋白(HDL)。脂蛋白在细胞外液中全身转移脂质(脂肪),从而促进脂肪经由受体介导的胞吞作用在全身被细胞利用和吸收。脂蛋白是由多个蛋白质,通常为80-100个蛋白质/颗粒(对于LDL和更大的颗粒由单个载脂蛋白B构造)组成的复杂颗粒。单个LDL颗粒的直径约为220-275埃,通常转运3,000至6,000个脂肪分子/颗粒,大小随内部含有的脂肪分子的数量和混合而变化。携带的脂质包括所有脂肪分子,其中胆固醇、磷脂和甘油三酯占优势;各自的量变化很大。脂蛋白可以从血液中取样。
不希望受任何具体理论束缚,由于氧化形式更容易被蛋白多糖保留,LDL颗粒在它们侵入内皮并被氧化时造成心血管疾病的风险。一组复杂的生化反应调节LDL颗粒的氧化,主要受坏死细胞碎片和内皮中自由基的存在刺激。LDL颗粒浓度的增加与随时间的动脉壁内动脉粥样硬化的累积速率增加密切相关,最终导致几十年后突然的斑块破裂,并引发动脉开口内的凝块或开口变窄或闭合,即心血管疾病、中风和其他血管疾病并发症。
“低密度脂蛋白(LDL)受体”是指839个氨基酸(除去21个氨基酸的信号肽后)的镶嵌蛋白,其介导富含胆固醇的LDL颗粒的胞吞作用。它是识别载脂蛋白B100的细胞表面受体,所述载脂蛋白B100嵌入LDL颗粒的外部磷脂层中。该受体还识别在乳糜微粒残余物和VLDL残余物(IDL)中发现的apoE蛋白。在人中,LDL受体蛋白由LDLR基因编码。LDL受体复合物存在于细胞表面上的网格蛋白包被的小窝(或芽)中,当经由衔接蛋白与LDL-胆固醇结合时,所述小窝被夹断以在细胞内形成网格蛋白包被的囊泡。这允许LDL-胆固醇在称为胞吞作用的过程中被结合并内化。此过程发生在所有有核细胞中,但主要发生在肝中,肝从循环中除去约70%的LDL。
“LDL受体的诱导性降解物(IDOL)”是指泛素连接酶,其将内体中的LDL受体泛素化并将受体引导至溶酶体区室以进行降解。响应细胞内胆固醇的增加,LXR/RXR转录上调IDOL。IDOL的药理学抑制可以通过增加血浆LDL受体密度来降低血浆LDL胆固醇。
“载脂蛋白C-III(APOC3)”是人中由APOC3基因编码的蛋白质。APOC3是极低密度脂蛋白(VLDL)的成分。APOC3抑制脂蛋白脂肪酶和肝脂肪酶。还认为其抑制富含甘油三酯的颗粒的肝摄取。APOC3水平的增加诱导高甘油三酯血症的发展。最近的证据表明APOC3在富含脂质的条件下促进富含甘油三酯的VLDL颗粒的组装和从肝细胞分泌的细胞内作用。然而,已显示人apoC3编码序列中两个天然存在的点突变A23T和K58E消除了富含甘油三酯的VLDL颗粒的细胞内组装和从肝细胞的分泌。
如本文所用,术语“Gam蛋白”通常是指能够结合双链核酸(例如双链DNA)的双链断裂的一个或多个末端的蛋白质。在一些实施方案中,Gam蛋白阻止或抑制双链断裂的位点处核酸的一条或多条链的降解。在一些实施方案中,Gam蛋白是来自噬菌体Mu的天然存在的Gam蛋白,或其非天然存在的变体。
术语“功能丧失突变”或“失活突变”是指导致基因产物具有较少功能或没有功能(部分或完全失活)的突变。当等位基因具有完全的功能丧失(无效等位基因)时,它通常被称为穆勒变形模式(Muller’s morphs schema)中的无定形(amorphic)突变。与此类突变相关的表型通常是隐性的。例外是当生物体是单倍体时,或当正常基因产物的减少剂量对于正常表型不足时(这称为单倍剂量不足)。
术语“保护性突变”或“保护性变体”是指导致基因产物与野生型基因具有相反作用或功能的突变。这通常被称为穆勒变形模式中的反效(antimorphic)突变。与此类突变相关的表型最通常是显性的。例外是当生物体是单倍体时,或当反效基因产物的减少剂量不足以压倒野生型表型时。
术语“功能获得突变”或“激活突变”是指改变基因产物以使其作用变强(增强的激活)或甚至被不同且异常的功能取代的突变。功能获得突变也可以称为新变形(neomorphic)突变。当新等位基因得以创建时,含有新创建的等位基因以及原始等位基因的杂合子将表达新的等位基因,以遗传方式将突变限定为显性表型。
“高胆固醇血症”,也称为血脂异常,是血液中存在高水平的胆固醇。它是高血脂和“高脂蛋白血症”(血液中脂蛋白水平升高)的一种形式。血液中非HDL胆固醇和LDL水平升高可能是饮食、肥胖、遗传性(遗传)疾病(如家族性高胆固醇血症中的LDL受体突变)或存在其他疾病如糖尿病和甲状腺功能低下的结果。
“低胆固醇血症”是指血液中存在异常低水平的胆固醇。尽管高总胆固醇的存在(高胆固醇血症)与心血管疾病相关,但身体的胆固醇产生的缺陷也可以导致不良后果。
术语“基因组”是指细胞或生物体的遗传物质。它通常包括DNA(或在RNA病毒的情况下的RNA)。基因组包括基因、编码区、非编码DNA以及线粒体和叶绿体的基因组。基因组通常不包括人工引入到细胞或生物体中的遗传物质,例如转化到细菌中的质粒不是细菌基因组的一部分。
“可编程DNA结合蛋白”是指可以经编程以靶向基因组内的任何所期望的核苷酸序列的DNA结合蛋白。为了编程DNA结合蛋白以结合所期望的核苷酸序列,DNA结合蛋白可以进行修饰以改变其结合特异性,例如锌指DNA结合域、锌指核酸酶(ZFN)或转录激活物样效应物蛋白(TALE)。ZFN是通过将锌指DNA结合域与DNA切割域融合而生成的人工限制酶。锌指域可以进行工程化改造以靶向特定的所期望的DNA序列,并且这使得锌指能够结合复杂基因组内的独特序列。转录激活物样效应物核酸酶(TALEN)是工程化的限制酶,其可以进行工程化改造以切割DNA的特定序列。它们通过将TAL效应物DNA结合域与核酸酶域(例如Fok1)融合而制成。转录激活物样效应物(TALE)可以进行工程化改造以结合实际上任何所期望的DNA序列。用于编程ZFN和TALE的方法对于本领域技术人员来说是熟悉的。例如,此类方法描述于Maeder,et al.,Mol.Cell 31(2):294-301,2008;Carroll et al.,Genetics Societyof America,188(4):773-782,2011;Miller et al.,Nature Biotechnology 25(7):778-785,2007;Christian et al.,Genetics 186(2):757-61,2008;Li et al.,Nucleic AcidsRes.39(1):359-372,2010;和Moscou et al.,Science 326(5959):1501,2009,每篇通过引用并入本文。
“引导核苷酸序列-可编程DNA结合蛋白”是指能够结合DNA的蛋白质、多肽或域,并且与其靶DNA序列的结合由引导核苷酸序列介导。因此,应理解,引导核苷酸序列-可编程DNA结合蛋白与引导核苷酸序列结合。“引导核苷酸”可以是RNA或DNA分子(例如,单链DNA或ssDNA分子),其与靶序列互补并且可以将DNA结合蛋白引导至靶序列。因此,引导核苷酸序列-可编程DNA结合蛋白可以是RNA-可编程DNA结合蛋白(例如Cas9蛋白),或ssDNA-可编程DNA结合蛋白(例如Argonaute蛋白)。“可编程”意指DNA结合蛋白可以进行编程以结合引导核苷酸靶向的任何DNA序列。示例性引导核苷酸序列-可编程DNA结合蛋白包括但不限于Cas9(例如dCas9和nCas9)、saCas9(例如saCas9d、saCas9d、saKKH Cas9)、CasX、CasY、Cpf1、C2c1、C2c2、C2c3、Argonaute,以及本文所述的任何其他合适的蛋白质,或其变体。
在一些实施方案中,引导核苷酸序列作为单核苷酸分子存在并且包含两种域:(1)与靶核酸共享同源性(例如,并且指导引导核苷酸序列-可编程DNA结合蛋白质与靶标的结合)的域;和(2)结合引导核苷酸序列-可编程DNA结合蛋白的域。在一些实施方案中,域(2)对应于称为tracrRNA的序列,并且包含茎-环结构。例如,在一些实施方案中,域(2)与如Jinek et al.,Science 337:816-821(2012)(其通过引用并入本文)中提供的tracrRNA相同或同源。gRNA(例如包括域2的那些)的其他实例可以在美国专利申请公开文本US20160208288和美国专利申请公开文本US20160200779中找到,每篇通过引用并入本文。
因为引导核苷酸序列与靶DNA序列杂交,所以引导核苷酸序列-可编程DNA结合蛋白原则上能够特异性结合与引导核苷酸序列互补的任何序列。使用引导核苷酸序列-可编程DNA结合蛋白(如Cas9)进行位点特异性切割(例如,以修饰基因组)的方法是本领域已知的(参见例如Cong,L.et al.Multiplex genome engineering using CRISPR/Cassystems.Science 339,819-823(2013);Mali,P.et al.RNA-guided human genomeengineering via Cas9.Science 339,823-826(2013);Hwang,W.Y.et al.Efficientgenome editing in zebrafish using a CRISPR-Cas system.Nature biotechnology31,227-229(2013);Jinek,M.et al.RNA-programmed genome editing in humancells.eLife 2,e00471(2013);Dicarlo,J.E.et al.Genome engineering inSaccharomyces cerevisiae using CRISPR-Cas systems.Nucleic acids research(2013);Jiang,W.et al.RNA-guided editing of bacterial genomes using CRISPR-Cassystems.Nature biotechnology 31,233-239(2013);每篇通过引用并入本文)。
如本文所用,术语“Cas9”或“Cas9核酸酶”是指包含Cas9蛋白、其片段或变体的RNA引导的核酸酶。Cas9核酸酶有时也称为casn1核酸酶或CRISPR(聚簇规则间隔短回文重复)相关核酸酶。CRISPR是适应性免疫系统,其提供针对移动遗传元件(病毒、可转座元件和接合质粒)的保护。CRISPR簇含有间隔区,与先前的移动元件互补的序列,并靶向侵入核酸。CRISPR簇得以转录并加工成CRISPR RNA(crRNA)。在II型CRISPR系统中,对前-crRNA的正确加工需要反式编码的小RNA(tracrRNA)、内源性核糖核酸酶3(rne)和Cas9蛋白。tracrRNA充当用于前-crRNA的核糖核酸酶3辅助加工的引导。随后,Cas9/crRNA/tracrRNA以内切核水解方式切割与间隔区互补的线性或环状dsDNA靶标。首先以内切核水解方式切割不与crRNA互补的靶链,然后以3’-5’外切核水解方式修剪。在自然界中,DNA结合和切割通常需要蛋白质和这两种RNA。然而,单一引导RNA(“sgRNA”或简称“gNRA”)可以进行工程化改造以将crRNA和tracrRNA两者的方面并入单一RNA种类中。参见例如Jinek et al.,Science 337:816-821(2012),其通过引用并入本文。
Cas9核酸酶序列和结构是本领域技术人员熟知的(参见例如Ferretti et al.,Proc.Natl.Acad.Sci.98:4658-4663(2001);Deltcheva E.et al.,Nature 471:602-607(2011);和Jinek et al.,Science 337:816-821(2012),每篇通过引用并入本文)。已经在各种物种中描述了Cas9直向同源物,包括但不限于酿脓链球菌(S.pyogenes)和嗜热链球菌(S.thermophilus)。基于本公开,另外的合适的Cas9核酸酶和序列对于本领域技术人员将是明显的,并且此类Cas9核酸酶和序列包括来自公开于Chylinski et al.,(2013)RNABiology 10:5,726-737的生物体和基因座的Cas9序列;其通过引用并入本文。在一些实施方案中,野生型Cas9对应于来自酿脓链球菌(Streptococcus pyogenes)的Cas9(NCBI参考序列:NC_002737.2,SEQ ID NO:5(核苷酸);和Uniport参考序列:Q99ZW2,SEQ ID NO:1(氨基酸)。
酿脓链球菌Cas9(野生型)核苷酸序列
酿脓链球菌Cas9(野生型)蛋白质序列
(单下划线:HNH域;双下划线:RuvC域)
在一些实施方案中,野生型Cas9对应于来自酿脓链球菌的Cas9(NCBI参考序列:NC_017053.1,SEQ ID NO 2003(核苷酸);SEQ ID NO:2004(氨基酸)):
(单下划线:HNH域;双下划线:RuvC域)
在一些实施方案中,野生型Cas9对应于或包含来自酿脓链球菌的Cas9(SEQ IDNO:2005(核苷酸)和/或SEQ ID NO:2006(氨基酸)):
(单下划线:HNH域;双下划线:RuvC域)
在一些实施方案中,野生型Cas9对应于来自金黄色链球菌(StreptococcusAureus)的Cas9。金黄色链球菌Cas9野生型(SEQ ID NO:6)
在一些实施方案中,野生型Cas9对应于来自嗜热链球菌(Streptococcusthermophilus)的Cas9。
嗜热链球菌野生型CRISPR3 Cas9(St3Cas9)
嗜热链球菌CRISPR1 Cas9野生型(St1Cas9)
在一些实施方案中,Cas9是指来自以下的Cas9:溃疡棒杆菌(Corynebacteriumulcerans)(NCBI Refs:NC_015683.1,NC_017317.1);白喉棒杆菌(Corynebacteriumdiphtheria)(NCBI Refs:NC_016782.1,NC_016786.1);Spiroplasma syrphidicola(NCBIRef:NC_021284.1);中间普雷沃氏菌(Prevotella intermedia)(NCBI Ref:NC_017861.1);台湾螺原体(Spiroplasma taiwanense)(NCBI Ref:NC_021846.1);海豚链球菌(Streptococcus iniae)(NCBI Ref:NC_021314.1);波罗的海贝尔氏菌(Belliellabaltica)(NCBI Ref:NC_018010.1);Psychroflexus torquisI(NCBI Ref:NC_018721.1);无害李斯特氏菌(Listeria innocua)(NCBI Ref:NP_472073.1)、空肠弯曲杆菌(Campylobacter jejuni)(NCBI Ref:YP_002344900.1)或脑膜炎奈瑟氏球菌(Neisseriameningitidis)(NCBI Ref:YP_002342100.1)或者是指来自实施例1中列出的任何生物体的Cas9(SEQ ID NOs:11-260)。
在一些实施方案中,提供了包含Cas9的片段的蛋白质。例如,在一些实施方案中,蛋白质包含两种Cas9域的一种:(1)Cas9的gRNA结合域;或(2)Cas9的DNA切割域。在一些实施方案中,包含Cas9或其片段的蛋白质称为“Cas9变体”。Cas9变体与Cas9或其片段共享同源性。例如,Cas9变体与野生型Cas9至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,与野生型Cas9相比,Cas9变体可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个氨基酸变化。在一些实施方案中,Cas9变体包含Cas9的片段(例如,gRNA结合域或DNA切割域),使得该片段与野生型Cas9的相应的片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,片段是相应的野生型Cas9的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%或至少99.5%。在一些实施方案中,片段的长度为至少100个氨基酸。在一些实施方案中,片段的长度为至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600、至少650、至少700、至少750、至少800、至少850、至少900、至少950、至少1000、至少1050、至少1100、至少1150、至少1200、至少1250或至少1300个氨基酸。
为了在本公开的融合蛋白中用作引导核苷酸序列-可编程DNA结合蛋白域,Cas9蛋白需要是核酸酶无活性的。核酸酶无活性的Cas9蛋白可以可互换地称为“dCas9”蛋白(代表核酸酶-“死亡的”Cas9)。用于生成具有无活性的DNA切割域的Cas9蛋白(或其片段)的方法是已知的(参见例如Jinek et al.,Science.337:816-821(2012);Qi et al.,(2013)Cell.28;152(5):1173-83,每篇通过引用并入本文)。例如,已知Cas9的DNA切割域包括两个亚域,即HNH核酸酶亚域和RuvC1亚域。HNH亚域切割与gRNA互补的链,而RuvC1亚域切割非互补链。这些亚域内的突变可以沉默Cas9的核酸酶活性。例如,突变D10A和H840A使酿脓链球菌Cas9的核酸酶活性完全失活(Jinek et al.,Science.337:816-82l(2012);Qi et al.,Cell.28;152(5):1173-83(2013))。
dCas9(D10A和H840A)
(单下划线:HNH域;双下划线:RuvC域)。
本公开的dCas9涵盖完全无活性的Cas9或部分无活性的Cas9。例如,dCas9的两种核酸酶域中的一种可以被失活,而另一种核酸酶域保持活性。此类部分活性的Cas9由于其切割靶定的DNA序列的一条链的能力而也可以称为“Cas9切口酶”。适合根据本公开内容使用的Cas9切口酶具有活性HNH域和无活性RuvC域,并且能够仅切割由sgRNA结合的靶DNA的链(其是经由胞苷脱氨基编辑的链的相反链)。本公开的Cas9切口酶可以包含使RuvC域失活的突变,例如D10A突变。应理解,使RuvC域失活的任何突变可以包括在Cas9切口酶中,例如RuvC域中的插入、缺失或单个或多个氨基酸的取代。在本文所述的Cas9切口酶中,当RuvC域失活时,HNH域保持激活。因此,尽管Cas9切口酶可以包含除使RuvC域失活的突变(例如D10A)之外的突变,但那些突变不影响HNH域的活性。在非限制性Cas9切口酶实例中,位置840处的组氨酸保持不变。以下提供适合于本公开的示例性Cas9切口酶的序列。
酿脓链球菌Cas9切口酶(D10A)
(单下划线:HNH域;双下划线:RuvC域)
金黄色链球菌Cas9切口酶(D10A)
应理解,当本文使用术语“dCas9”或“核酸酶无活性的Cas9”时,其是指在HNH和RuvC域中均无活性的Cas9变体以及Cas9切口酶。例如,本公开中使用的dCas9可以包括SEQID NO:2或SEQ ID NO:3中所示的氨基酸序列。在一些实施方案中,dCas9可以包含使RuvC或HNH域失活的其他突变。基于本公开和本领域的知识,使Cas9失活的另外的合适的突变对于本领域技术人员而言将是显而易见的,并且在本公开的范围内。此类另外的示例性合适的核酸酶无活性的Cas9域包括但不限于D839A和/或N863A(参见例如Prashant et al.,Nature Biotechnology.2013;31(9):833-838,其通过引用并入本文)或K603R(参见例如Chavez et al.,Nature Methods 12,326-328,2015,其通过引用并入本文)。术语Cas9、dCas9或Cas9变体还涵盖来自任何生物体的Cas9、dCas9或Cas9变体。还应理解,根据本公开可以使用来自任何生物体的dCas9、Cas9切口酶或其他适当的Cas9变体。
“脱氨酶”是指催化从分子中除去胺基或催化脱氨基(例如通过水解)的酶。在一些实施方案中,脱氨酶是胞苷脱氨酶,分别催化胞苷(C)至尿苷(U)、脱氧胞苷(dC)至脱氧尿苷(dU)或5-甲基-胞苷至胸苷(T,5-甲基-U)的脱氨基。随后的DNA修复机制确保dU被T替换,如Komor等人(Nature,Programmable editing of a target base in genomic DNA withoutdouble-stranded DNA cleavage,533,420-424(2016),其通过引用并入本文)中所述。在一些实施方案中,脱氨酶是胞嘧啶脱氨酶,催化并促进胞嘧啶至尿嘧啶(例如在RNA中)或胸腺嘧啶(例如在DNA中)的转化。在一些实施方案中,脱氨酶是来自生物体(例如人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠)的天然存在的脱氨酶。在一些实施方案中,脱氨酶是来自生物体的天然存在的脱氨酶的变体,并且该变体不在自然界中存在。例如,在一些实施方案中,脱氨酶或脱氨酶域与来自生物体的天然存在的脱氨酶至少50%、至少55%、至少60%、至少65%、至少70%、至少75%至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。
“胞嘧啶脱氨酶”是指催化化学反应的酶。如从反应式中可以明显看出的,此类化学反应导致C至U/T核碱基变化。在基因的背景中,此类核苷酸变化或突变可以继而导致蛋白质中的氨基酸变化,其可能影响蛋白质的功能,例如功能丧失或功能获得。随后的DNA修复机制确保DNA中的尿嘧啶碱基被T取代,如Komor等人(Nature,Programmableediting of a target base in genomic DNA without double-stranded DNA cleavage,533,420-424(2016),其通过引用并入本文)中所述。
一类示例性合适的胞嘧啶脱氨酶是胞嘧啶脱氨酶的载脂蛋白B mRNA-编辑复合物(APOBEC)家族,其涵盖用来以受控且有益的方式引发诱变的11种蛋白质。载脂蛋白B编辑复合物3(APOBEC3)酶经由逆转录病毒ssDNA中胞嘧啶的脱氨基为人细胞提供针对某种HIV-1株的保护。这些胞嘧啶脱氨酶都需要Zn2+-配位基序(coordinating motif)(His-X-Glu-X23-26-Pro-Cys-X2-4-Cys;SEQ ID NO:1996)和结合水分子实现催化活性。谷氨酸残基作用为将水分子激活成氢氧化锌,用于脱氨基反应中的亲核攻击。每个家族成员优先在其自己的特定“热点(hotspot)”处脱氨基,例如对于hAID为WRC(W是A或T,R是A或G),或对于hAPOBEC3F为TTC。最近APOBEC3G催化域的晶体结构揭示了包含侧翼为六个α-螺旋的五股β-折叠核心的二级结构,据信其在整个家族中是保守的。已显示活性中心环负责ssDNA结合和确定“热点”身份两者。这些酶的过表达已与基因组不稳定性和癌症联系起来,因此突出显示了序列特异性靶向的重要性。另一种合适的胞嘧啶脱氨酶是激活诱导性胞苷脱氨酶(AID),其通过以转录依赖性、链偏爱的方式将ssDNA中的胞嘧啶转化为尿嘧啶来负责抗体的成熟。
如本文所用,术语“碱基编辑器”或“核碱基编辑器”广泛地指本文所述的任何融合蛋白。在一些实施方案中,核碱基编辑器能够精确地使靶碱基脱氨基以将其转化为不同的碱基,例如,碱基编辑器可以靶向核酸序列中的C碱基并将该C转化为T碱基。在一些实施方案中,碱基编辑器包含与胞苷脱氨酶融合的Cas9(例如dCas9和nCas9)、CasX、CasY、Cpf1、C2c1、C2c2、C2c3或Argonaute蛋白。例如,在一些实施方案中,碱基编辑器可以是胞嘧啶脱氨酶-dCas9融合蛋白。在一些实施方案中,碱基编辑器可以是胞嘧啶脱氨酶-Cas9切口酶融合蛋白。在一些实施方案中,碱基编辑器可以是脱氨酶-dCas9-UGI融合蛋白。在一些实施方案中,碱基编辑器可以是UGI-脱氨酶-dCas9融合蛋白。在一些实施方案中,碱基编辑器可以是UGI-脱氨酶-Cas9切口酶融合蛋白。在一些实施方案中,碱基编辑器可以是APOBEC1-dCas9-UGI融合蛋白。在一些实施方案中,碱基编辑器可以是APOBEC1-Cas9切口酶-UGI融合蛋白。在一些实施方案中,碱基编辑器可以是APOBEC1-dCpf1-UGI融合蛋白。在一些实施方案中,碱基编辑器可以是APOBEC1-dNgAgo-UGI融合蛋白。在一些实施方案中,碱基编辑器包含与胞苷脱氨酶融合的CasX蛋白。在一些实施方案中,碱基编辑器包含与胞苷脱氨酶融合的CasY蛋白。在一些实施方案中,碱基编辑器包含与胞苷脱氨酶融合的Cpf1蛋白。在一些实施方案中,碱基编辑器包含与胞苷脱氨酶融合的C2c1蛋白。在一些实施方案中,碱基编辑器包含与胞苷脱氨酶融合的C2c2蛋白。在一些实施方案中,碱基编辑器包含与胞苷脱氨酶融合的C2c3蛋白。在一些实施方案中,碱基编辑器包含与胞苷脱氨酶融合的Argonaute蛋白。在一些实施方案中,本文所述的融合蛋白包含Gam蛋白、引导核苷酸序列-可编程DNA结合蛋白和胞苷脱氨酶域。在一些实施方案中,碱基编辑器包含与CasX蛋白融合的Gam蛋白,所述CasX蛋白与胞苷脱氨酶融合。在一些实施方案中,碱基编辑器包含与CasY蛋白融合的Gam蛋白,所述CasY蛋白与胞苷脱氨酶融合。在一些实施方案中,碱基编辑器包含与Cpf1蛋白融合的Gam蛋白,所述Cpf1蛋白与胞苷脱氨酶融合。在一些实施方案中,碱基编辑器包含与C2c1蛋白融合的Gam蛋白,所述C2c1蛋白与胞苷脱氨酶融合。在一些实施方案中,碱基编辑器包含与C2c2蛋白融合的Gam蛋白,所述C2c2蛋白与胞苷脱氨酶融合。在一些实施方案中,碱基编辑器包含与C2c3蛋白融合的Gam蛋白,所述C2c3蛋白与胞苷脱氨酶融合。在一些实施方案中,碱基编辑器包含与Argonaute蛋白融合的Gam蛋白,所述Argonaute蛋白与胞苷脱氨酶融合。在一些实施方案中,碱基编辑器包含与saCas9蛋白融合的Gam蛋白,所述saCas9蛋白与胞苷脱氨酶融合。实施例1中提供了本文所述的核碱基编辑器的非限制性示例性序列,SEQID NO:293-302。此类核碱基编辑器和使用它们进行基因组编辑的方法已在本领域中描述,例如在美国专利9,068,179、美国专利申请公开US 20150166980、US20150166981、US20150166982、US20150166984和US20150165054,以及美国临时申请U.S.S.N.62/245,828、62/279,346、62/311,763、62/322,178、62/357,352、62/370,700和62/398,490,以及Komor et al.,Nature,Programmable editing of a target base in genomic DNAwithout double-stranded DNA cleavage,533,420-424(2016)中,每篇通过引用并入本文。
术语“靶位点”或“靶序列”是指核酸分子(例如DNA分子)内被本文提供的融合蛋白脱氨基的序列。在一些实施方案中,靶序列是多核苷酸(例如DNA),其中多核苷酸包含编码链和互补链。如本文所用,“编码链”和“互补链”的含义与本领域中术语的通用含义相同。在一些实施方案中,靶序列是哺乳动物的基因组中的序列。在一些实施方案中,靶序列是人的基因组中的序列。在一些实施方案中,靶序列是非人动物的基因组中的序列。术语“目标密码子”是指由碱基编辑器编辑并经由脱氨基转化为不同密码子的氨基酸密码子。术语“靶碱基”是指由碱基编辑器编辑并经由脱氨基转化为不同碱基的核苷酸碱基。在一些实施方案中,编码链中的目标密码子被编辑(例如脱氨基)。在一些实施方案中,互补链中的目标密码子被编辑(例如脱氨基)。
如本文所用,术语“尿嘧啶糖基化酶抑制剂”或“UGI”是指能够抑制尿嘧啶-DNA糖基化酶碱基切除修复酶的蛋白质。
如本文所用,术语“接头”是指连接两个分子或部分,例如融合蛋白的两个域,诸如例如核酸酶无活性的Cas9域和核酸编辑域(例如脱氨酶域)的化学基团或分子。在一些实施方案中,接头连接RNA可编程核酸酶的gRNA结合域(包括Cas9核酸酶域)和核酸编辑域的催化域(例如脱氨酶域)。在一些实施方案中,接头连接RNA可编程核酸酶的gRNA结合域(例如Cas9)和Gam蛋白。在一些实施方案中,接头连接RNA可编程核酸酶的gRNA结合域(例如Cas9)和UGI域。在一些实施方案中,接头连接UGI域和Gam蛋白。在一些实施方案中,接头连接核酸编辑域的催化域(例如脱氨酶域)和UGI域。在一些实施方案中,接头连接核酸编辑域的催化域(例如脱氨酶域)和Gam蛋白。通常,接头位于两个基团、分子、域或其他部分之间或侧翼有两个基团、分子、域或其他部分,并且经由共价键与彼此连接,从而连接两个。在一些实施方案中,接头是一个氨基酸或多个氨基酸(例如肽或蛋白质)。在一些实施方案中,接头是有机分子、基团、聚合物聚合物(例如非天然聚合物、非肽聚合物)或化学部分。在一些实施方案中,接头的长度为2-100个氨基酸,例如长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也考虑了更长或更短的接头。
如本文所用,术语“突变”是指序列(例如核酸或氨基酸序列)内的残基用另一个残基取代或序列内一个或多个残基的缺失或插入。本文通常通过鉴定初始残基,随后是序列内残基的位置和新取代的残基的身份来描述突变。用于产生本文提供的氨基酸取代(突变)的各种方法在本领域中是熟知的,并且由例如Green and Sambrook,Molecular Cloning:ALaboratory Manual(第4版,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.(2012))提供。
如本文所用,术语“核酸”和“多核苷酸”是指包含核碱基和酸性部分的化合物(例如核苷、核苷酸或核苷酸的聚合物)。通常,聚合核酸,例如包含三个或更多个核苷酸的核酸分子是线性分子,其中相邻的核苷酸经由磷酸二酯连接彼此连接。在一些实施方案中,“核酸”是指个别的核酸残基(例如核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含三个或更多个个别核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可以可互换地使用以指核苷酸的聚合物(例如,至少三个核苷酸的串)。在一些实施方案中,“核酸”涵盖RNA以及单链和/或双链DNA。核酸可以是天然存在的,例如在基因组、转录物、mRNA、tRNA、rRNA、siRNA、snRNA、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的背景中。另一方面,核酸分子可以是非天然存在的分子,例如重组DNA或RNA、人工染色体、经工程化的基因组或其片段,或合成DNA、RNA或DNA/RNA杂合体,或包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物,例如具有除磷酸二酯主链之外的类似物。核酸可以从天然来源纯化、使用重组表达系统产生并任选地纯化、化学合成等。在适当的情况下,例如在化学合成分子的情况下,核酸可以包含核苷类似物,例如具有化学修饰的碱基或糖,和主链修饰的类似物。除非另有说明,核酸序列以5’至3’方向呈现。在一些实施方案中,核酸是或包含天然核苷(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷);核苷类似物(例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤和2-硫代胞苷);化学修饰的碱基;生物修饰的碱基(例如甲基化碱基);插入的碱基;经修饰的糖(例如2’-氟核糖、核糖、2’-脱氧核糖、阿拉伯糖和己糖);和/或经修饰的磷酸基团(例如硫代磷酸酯和5’-N-亚磷酰胺连接)。
术语“蛋白质”、“肽”和“多肽”在本文中可互换使用,并且是指通过肽(酰胺)键连接在一起的氨基酸残基的聚合物。该术语是指任何大小、结构或功能的蛋白质、肽或多肽。通常,蛋白质、肽或多肽将是至少三个氨基酸长。蛋白质、肽或多肽可以指个别的蛋白质或蛋白质的集合。蛋白质、肽或多肽中的一个或多个氨基酸可以被修饰,例如通过添加化学实体如碳水化合物基团、羟基、磷酸基团、法呢基、异法呢基、脂肪酸基团,用于缀合、官能化的接头或其他修饰等。蛋白质、肽或多肽也可以是单个分子或者可以是多分子复合物。蛋白质、肽或多肽可以仅仅是天然存在的蛋白质或肽的片段。蛋白质、肽或多肽可以是天然存在的、重组的或合成的,或其任何组合。如本文所用的术语“融合蛋白”是指包含来自至少两种不同蛋白质的蛋白质域的杂合多肽。一种蛋白质可以位于融合蛋白的氨基端(N端)部分或位于羧基端(C端)蛋白质,从而分别形成“氨基端融合蛋白”或“羧基端融合蛋白”。蛋白质可以包含不同的域,例如核酸结合域(例如指导蛋白质与靶位点结合的Cas9的gRNA结合域)和核酸编辑蛋白的核酸切割域或催化域。在一些实施方案中,蛋白质与核酸例如RNA复合或缔合。本文提供的任何蛋白质可以通过本领域已知的任何方法产生。例如,本文提供的蛋白质可以经由重组蛋白质表达和纯化产生,其特别适用于包含肽接头的融合蛋白。用于重组蛋白质表达和纯化的方法是熟知的,并且包括Green and Sambrook,Molecular Cloning:ALaboratory Manual(第4版,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.(2012))描述的那些,其通过引用并入本文。
如本文所用,术语“受试者”是指个体生物体,例如个体哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,受试者是非人哺乳动物。在一些实施方案中,受试者是非人灵长类动物。在一些实施方案中,受试者是啮齿动物(例如小鼠、大鼠)。在一些实施方案中,受试者是驯养的动物。在一些实施方案中,受试者是绵羊、山羊、牛、猫或狗。在一些实施方案中,受试者是研究动物。在一些实施方案中,受试者是经遗传工程化的,例如遗传工程化的非人受试者。受试者可以是任何性别和处于任何发育阶段的。
如本文中在蛋白质或核酸的背景中使用,术语“重组”是指自然界中不存在,但是作为人工程化的产物的蛋白质或核酸。例如,在一些实施方案中,重组蛋白质或核酸分子包含氨基酸或核苷酸序列,其相比于任何天然存在的序列包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个或至少七个突变。本文所述的融合蛋白(例如碱基编辑器)是以重组方式制成的。重组技术是本领域技术人员熟悉的。
“内含子”是指基因内在最终RNA产物的成熟期间通过RNA剪接除去的任何核苷酸序列。术语内含子是指基因内的DNA序列和RNA转录物中的相应序列两者。RNA剪接后在最终成熟RNA中连接在一起的序列是外显子。内含子发现于大多数生物体和许多病毒的基因中,并且可以位于一大批基因中,包括生成蛋白质、核糖体RNA(rRNA)和转移RNA(tRNA)的基因。当从含有内含子的基因生成蛋白质时,RNA剪接作为在转录之后且在翻译之前的RNA加工途径的部分发生。
“外显子”是指基因中在通过RNA剪接除去了内含子后成为该基因产生的最终成熟RNA的部分的任何部分。术语外显子是指基因内的DNA序列和RNA转录物中的相应序列两者。在RNA剪接中,内含子被除去,并且外显子彼此共价连接作为生成成熟信使RNA的部分。
“剪接”是指新合成的信使RNA转录物(也称为初级mRNA转录物)的加工。剪接后,内含子被除去并且外显子连接在一起(连接)形成含有完整开放阅读框的成熟的mRNA分子,其被解码并翻译成蛋白质。对于核编码的基因,剪接以共转录方式或在转录后立即在核内发生。RNA剪接的分子机制已被广泛描述于例如Pagani et al.,Nature Reviews Genetics5,389-396,2004;Clancy et al.,Nature Education 1(1):31,2011;Cheng et al.,Molecular Genetics and Genomics 286(5-6):395-410,2014;Taggart et al.,NatureStructural&Molecular Biology 19(7):719-2,2012中,每篇的内容通过引用并入本文。本领域技术人员熟悉RNA剪接的机制。
“可变剪接”是指导致编码多种蛋白质的单个基因的基因表达期间的调节过程。在该过程中,基因的特定外显子可以包括在由该基因产生的最终经加工的信使RNA(mRNA)内或从中排除。因此,从经可变剪接的mRNA翻译的蛋白质将含有其氨基酸序列的差异,并且通常含有其生物学功能的差异。值得注意的是,可变剪接允许人基因组指导比将从其20,000个蛋白质编码基因预期的蛋白质多得多的蛋白质的合成。可变剪接有时也称为差异剪接(differential splicing)。可变剪接作为真核生物中的正常现象发生,其中它大大增加了可以由基因组编码的蛋白质的生物多样性;在人中,约95%的多外显子基因是经可变剪接的。观察到多种可变剪接的模式,其中最常见的是外显子跳读。在该模式中,特定外显子可以在某些条件下或特定组织中包括在mRNA中,并且在其他情况下从mRNA中省略。剪接的异常变异也与疾病有关;大部分人遗传性病症是由剪接变体引起的。异常剪接变体也被认为有助于癌症的发展,并且剪接因子基因经常在不同类型的癌症中发生突变。本领域还描述了可变剪接的调节,例如在Douglas et al.,Annual Review of Biochemistry 72(1):291-336,2003;Pan et al.,Nature Genetics 40(12):1413-1415,2008;Martin et al.,Nature Reviews 6(5):386-398,2005;Skotheim et al.,The International Journal ofBiochemistry&Cell Biology 39(7-8):1432-49,2007中,每篇通过引用并入本文。
“编码框”或“开放阅读框”是指编码多肽的密码子区段。由于DNA解释为三个核苷酸(密码子)的组,因此DNA链具有三个不同的阅读框。DNA分子的双螺旋具有两条反平行链,因此在两条链各有三个阅读框的情况下,有六种可能的框翻译。当翻译在正确的编码框中进行时,可以产生功能性蛋白质。开放阅读框中一个或两个碱基的插入或缺失导致编码框的移位,也称为“移码突变”。典型的移码突变导致过早的翻译终止和/或截短的或非功能性的蛋白质。
在发明详述、实施例和权利要求书中更详细地描述了这些和其他示例性取代者。本发明不意图以任何方式受上述取代者的示例性列表的限制。
发明详述
本文公开的是用于生产肝蛋白质前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)的经工程化改造的和天然存在的保护性变体以单独地和与其他保护性基因变体组合加强LDL受体介导的LDL胆固醇清除的新的基因组/碱基编辑系统、方法和组合物,所述其他保护性基因变体可以协同改善循环胆固醇和甘油三酯水平。
前蛋白质转化酶枯草杆菌蛋白酶-kexin 9型(PCSK9),也称为神经凋亡调节的转化酶1(“NARC-1”),是鉴定为分泌性枯草杆菌酶家族的第9个成员的蛋白酶K样枯草杆菌酶。PCSK9的基因定位于人染色体Ip33-p34.3。PCSK9在能够增殖和分化的细胞中表达,所述细胞包括例如肝细胞、肾间充质细胞、肠回肠和结肠上皮以及胚胎脑端脑神经元。参见例如Seidah et al.,2003PNAS 100:928-933,其通过引用并入本文。
PCSK9的原始合成是72-kDa的无活性的酶前体或酶原的形式,其在内质网(“ER”)中经历自催化的分子内加工以激活其功能性。据报道,此种内部加工事件发生在SSVFAQ↓SIP基序处,并且已被报道为从ER离开的必要条件。“↓”表示切割位点。参见Benjannet etal.,2004J.Biol.Chem.279:48865-48875和Seidah et al.,2003PNAS 100:928-933,每篇通过引用并入本文。然后经切割的蛋白质得以分泌。经切割的肽保持与经激活且分泌的酶缔合。人PCSK9的基因序列(其长约22kb,具有编码692个氨基酸的蛋白质的12个外显子)可以在例如保藏号NP_777596.2中找到。人、小鼠和大鼠PCSK9核酸序列已经得到保藏;例如,分别参见GenBank登录号:AX127530(也是AX207686)、AX207688和AX207690。翻译的蛋白质在NH2端含有信号肽,并且在细胞和组织中,在内质网中发现约74kDa的酶原(前体)形式的全长蛋白质。在细胞中的初始加工期间,约14kDa原结构域肽经自催化切割以产生成熟的约60kDa蛋白质,其含有催化域和通常称为富含半胱氨酸-组氨酸的域(CHRD)的C端域。这种约60kDa形式的PCSK9由肝细胞分泌。PCSK9的分泌形式似乎是生理活性种类,尽管尚未排除约60kDa形式的细胞内功能作用。
野生型PCSK9基因(>gi|299523249|ref|NM_174936.3|人前蛋白质转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9),转录物变体1,SEQ ID NO:1990)
人PCSK9氨基酸序列(SEQ ID NO:1991)
小鼠PCSK 9氨基酸序列(SEQ ID NO:1992)
大鼠PCSK9氨基酸序列(SEQ ID NO:1993)
PCSK9已被归因于在肝和神经细胞的分化中起作用,在胚胎肝中高表达,并且与胆固醇内稳态密切相关。最近的研究表明PCSK9在胆固醇生物合成或摄取中具有特定的作用。在对胆固醇喂养的大鼠的研究中,Maxwell等发现PCSK9以与参与胆固醇生物合成的其他三种基因相似的方式下调,Maxwell et al.,2003J Lipid Res.44:2109-2119,其通过引用并入本文。令人感兴趣的是,PCSK9的表达也受固醇调节元件结合蛋白(“SREBP”)的调节,如同参与胆固醇代谢的其他基因所见。这些发现后来得到了PCSK9转录调节的研究的支持,该研究证明此类调节对于与脂蛋白代谢有关的其他基因是相当典型的;Dubuc et al.,2004Arterioscler.Thromb.Vase.Biol 24:1454-1459,其通过引用并入本文。PCSK9表达以归因于药物的降胆固醇作用的方式受他汀类药物上调。此外,PCSK9启动子具有涉及胆固醇调节的两个保守位点,固醇调节元件和SpI位点。已显示PCSK9的腺病毒表达导致循环LDL的显著的时间依赖性增加(Benjannet et al.,2004J Biol Chem.279:48865-48875,其通过引用并入本文)。此外,缺失PCSK9基因的小鼠具有增加的肝LDL受体水平并且更快速地从血浆清除LDL;Rashid et al.,2005Proc.Natl Acad.Sci.USA 102:5374-5379,其通过引用并入本文。
最近报道了当转移至未转染的HepG2细胞时,来自用PCSK9瞬时转染的HepG2细胞的培养基减少了细胞表面LDLR的量和LDL的内化;参见Cameron et al.,2006Human MoIGenet.15:1551-1558,其通过引用并入本文。结论是PCSK9或PCSK9作用的因子是分泌性的并且能够在经转染的和未转染的细胞两者中降解LDLR。最近,证明了添加到HepG2细胞的培养基的纯化的PCSK9具有以剂量和时间依赖性方式减少细胞表面LDLR数量的作用;Lagaceet al.,2006J Clin.Invest.116:2995-3005,其通过引用并入本文。
在若干专利公开文本中公开和/或要求保护许多PCSK9变体,所述专利公开文本包括但不限于以下:PCT公开号WO2001031007、WO2001057081、WO2002014358、WO2001098468、WO2002102993、WO2002102994、WO2002046383、WO2002090526、WO2001077137和WO2001034768;美国公开号US 2004/0009553和US 2003/0119038以及欧洲公开号EP 1 440981、EP 1 067 182和EP 1 471 152,每篇通过引用并入本文。
PCSK9的若干突变体形式已得以充分表征,包括S127R、N157K、F216L、R218S和D374Y,其中S127R、F216L和D374Y与常染色体显性高胆固醇血症(ADH)相关。Benjannet etal.(J.Biol.Chem.,279(47):48865-48875(2004))证明S127R和D374Y突变导致在ER中加工以形成活性分泌性酶原的PCSK9原的水平显著降低。因此,据信野生型PCSK9增加LDL受体的周转率,引起LDL清除的抑制(Maxwell et al.,PNAS,102(6):2069-2074(2005);Benjannetet al.和Lalanne et al),而PCSK9常染色体显性突变导致LDLR水平增加、循环LDL清除增加和血浆胆固醇水平相应的降低。参见Rashid et al.,PNAS,102(15):5374-5379(2005);Abifadel et al.,2003Nature Genetics 34:154-156;Timms et al.,2004Hum.Genet.114:349-353;和Leren,2004Clin.Genet.65:419-422,每篇通过引用并入本文。
Abifadel等人的后来发表的关于S127R突变的研究报道,携带此类突变的患者在血浆中表现出更高的总胆固醇和apoB100,这归因于(1)含有apoB100的脂蛋白(如低密度脂蛋白(“LDL”)、极低密度脂蛋白(“VLDL”)和中密度脂蛋白(“IDL”))的过量产生,和(2)所述脂蛋白的清除或转化的相关减少。上面提到的研究总共证明了PCSK9在调节LDL产生中起作用的事实。PCSK9的表达或上调与LDL胆固醇的血浆水平增加相关,并且PCSK9表达的抑制或缺乏与低LDL胆固醇血浆水平相关。值得注意的是,与PCSK9序列变异相关的较低水平的LDL胆固醇已经赋予了针对冠心病的保护作用;Cohen et al.,2006N.Engl.J.Med.354:1264-1272。
Lalanne等人证明了PCSK9中含有S127R突变的两名患者中LDL分解代谢受损并且含有载脂蛋白B的脂蛋白合成增强(J.Lipid Research,46:1312-1319(2005))。Sun等人也提供证据表明PCSK9的突变体形式也是异常严重的显性高胆固醇血症的原因,这是由于其增加载脂蛋白B分泌的作用(Sun et al.,Hum.Mol.Genet.,14(9):1161-1169(2005))。除了证明PCSK9的突变体形式也降低LDL受体的水平(Park et al.,J.Biol.Chem.,279:50630-50638(2004)的结果外,这些结果与先前证明了在小鼠中腺病毒介导的PCSK9过表达导致严重的高胆固醇血症(由于LDL受体的量急剧减少)的结果一致,Dubuc et al.,Thromb.Vasc.Biol.,24:1454-1459(2004)。PCSK9在细胞系(包括肝来源的细胞)和小鼠肝中体内的过表达导致LDLR蛋白水平和LDLR功能活性的明显降低,而LDLR mRNA水平没有变化(Maxwell et al.,Proc.Nat.Amer.Sci.,101:7100-7105(2004);Benjannet S.et al.,J.Bio.Chem.279:48865-48875(2004))。
已经提出了各种抑制PSCK9的治疗方法,包括:通过基因沉默剂如RNAi抑制PSCK9合成;通过单克隆抗体、小肽或adnectin抑制PCSK9与LDLR的结合;和小分子抑制剂抑制PCSK9自催化加工。这些策略已描述于Hedrick et al.,Curr Opin Investig Drugs 2009;10:938-46;Hooper et al.,Expert Opin Biol Ther,2013;13:429-35;Rhainds et al.,Clin Lipid,2012;7:621-40;Seidah et al;,Expert Opin Ther Targets 2009;13:19-28;和Seidah et al.,Nat Rev Drug Discov 2012;11:367-83中,每篇通过引用并入本文。
生成PCSK9突变体的策略
本公开的一些方面提供编辑编码PCSK9蛋白的多核苷酸以将突变引入到PCSK9基因中的系统、组合物和方法。本文所述的基因编辑方法依赖于如美国专利9,068,179、美国专利申请公开US20150166980,US20150166981,US20150166982,US20150166984和US20150165054,以及美国临时申请62/245828,62/279346,62/311,763,62/322178,62/357352,62/370700和62/398490,以及于Komor et al.,Nature,Programmable editing ofa target base in genomic DNA without double-stranded DNA cleavage,533,420-424(2016)中所述的核碱基编辑器,每篇通过引用并入本文。
核碱基编辑器在精确编辑PCSK9基因中的靶碱基上非常有效,并且DNA双链断裂对于基因编辑不是必需的,因此降低了基因组不稳定性并且阻止了可能由其他基因组编辑方法引起的可能的致癌修饰。本文所述的核碱基编辑器可以经编程以靶向和修饰单个碱基。在一些实施方案中,靶碱基是胞嘧啶(C)碱基,并且可以经由通过核碱基编辑器的脱氨基转化为胸腺嘧啶(T)碱基。
为了编辑编码PCSK9蛋白的多核苷酸,使多核苷酸与本文所述的核碱基编辑器接触。在一些实施方案中,使编码PCSK9的多核苷酸与核碱基编辑器和引导核苷酸序列接触,其中引导核苷酸序列将核碱基编辑器靶向到编码PCSK9的多核苷酸中的靶碱基(例如C碱基)。
在一些实施方案中,编码PCSK9的多核苷酸是细胞的基因组DNA中的PCSK9基因座。在一些实施方案中,细胞是培养的细胞。在一些实施方案中,细胞是体内的。在一些实施方案中,细胞是体外的。在一些实施方案中,细胞是离体的。在一些实施方案中,细胞来自哺乳动物。在一些实施方案中,哺乳动物是人。在一些实施方案中,哺乳动物是啮齿动物。在一些实施方案中,啮齿动物是小鼠。在一些实施方案中,啮齿动物是大鼠。
如本领域技术人员所理解的,编码PCSK9的多核苷酸可以是包含编码链和互补链的DNA分子,例如基因组中的PCSK9基因座。因此,编码PCSK9的多核苷酸也可以包括编码区(例如外显子)和非编码区(例如内含子或剪接位点)。在一些实施方案中,靶碱基(例如C碱基)位于编码PCSK9的多核苷酸(例如PCSK9基因座)的编码区(例如外显子)中。因此,编码区中碱基的转化可以导致PCSK9蛋白序列中的氨基酸变化,即突变。在一些实施方案中,突变是功能丧失突变。在一些实施方案中,功能丧失突变是天然存在的功能丧失突变,例如G106R、L253F、A443T、R93C等。在一些实施方案中,功能丧失突变是经工程化改造的(即,非天然存在的),例如G24D、S47F、R46H、S153N、H193Y等。
在一些实施方案中,靶碱基位于PCSK9基因的非编码区中,例如在内含子或剪接位点中。在一些实施方案中,靶碱基位于剪接位点中,并且此类靶碱基的编辑引起PSCK9 mRNA的可变剪接。在一些实施方案中,可变剪接导致功能丧失PCSK9突变体。在一些实施方案中,可变剪接导致在PSCK9 mRNA中引入提前终止密码子,从而导致截短的且不稳定的PCSK9蛋白。在一些实施方案中,产生折叠缺陷的PCSK9突变体。
使用本公开特别有用于创建的PCSK9变体是功能丧失变体,其可以单独或与途径中涉及的其他基因(例如APOC3、LDL-R或Idol)组合地加强LDL受体介导的LDL胆固醇的清除。在一些实施方案中,使用本公开的方法产生的PCKS9功能丧失变体在细胞中有效表达。在一些实施方案中,使用本公开的方法产生的PCKS9功能丧失变体被激活并输出以接合(engage)以旁分泌机制来自未修饰的细胞的网格蛋白包被的小窝,从而与野生型PCSK9蛋白竞争。在一些实施方案中,PCSK9功能丧失变体包含LDL-R键合区中与LDL-R蛋白直接接触的残基中的突变。在一些实施方案中,LDL-R键合区中与LDL-R蛋白直接接触的残基选自下组:R194、R237、F379、S372、D374、D375、D378、R46、R237和A443。
如本文所述,与野生型PCSK9蛋白相比,功能丧失PCSK9变体可以具有降低的活性。PCSK9活性是指本领域中任何已知的PCSK9蛋白的生物活性。例如,在一些实施方案中,PCSK9活性是指其蛋白酶活性。在一些实施方案中,PCSK9活性是指其通过细胞分泌途径得以分泌的能力。在一些实施方案中,PCSK9活性是指其在网格蛋白包被的囊泡中起蛋白质结合衔接物作用的能力。在一些实施方案中,PCSK9活性是指其与LDL受体相互作用的能力。在一些实施方案中,PCSK9活性是指其阻止LDL受体再循环的能力。这些实例并不意味是限制性的。
在一些实施方案中,功能丧失PCSK9变体的活性可以降低至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少99%或更多。在一些实施方案中,与野生型PCSK9蛋白相比,功能丧失PCSK9变体具有不超过50%、不超过40%、不超过30%、不超过20%、不超过10%、不超过5%、不超过1%或更少的活性。用于测定PCSK9活性的非限制性示例性测定法已在本领域中描述,例如在美国专利申请公开US20120082680中,其通过引用并入本文。
为了编辑PCSK9基因,PCSK9基因(多核苷酸分子)可以与核碱基编辑器接触,其中核碱基编辑器与其靶序列结合并编辑所期望的碱基。例如,核碱基编辑器可以在期望PCSK9基因编辑的细胞中表达(例如肝细胞),从而允许PCSK9基因与核碱基编辑器接触。在一些实施方案中,核碱基编辑器与其PCSK9中的靶序列的结合由引导核苷酸序列(例如,包含与PCSK9基因中靶序列的链之一互补的核苷酸序列的核苷酸分子)介导。因此,通过设计引导核苷酸序列,核碱基编辑器可以经编程以编辑PCSK9基因中的任何靶碱基。在一些实施方案中,引导核苷酸序列与期望编辑的细胞中的核碱基编辑器共表达。
本文提供的是可以经由碱基编辑产生的非限制性的示例性的PCSK9功能丧失变体(表1和图1)和制备它们的策略。
表1示例性功能丧失PCSK9突变
密码子变化
使用本文所述的核碱基编辑器,若干氨基酸密码子可以经由密码子内靶碱基的脱氨基转化为不同的密码子。例如,在一些实施方案中,胞嘧啶(C)碱基经由通过包含胞嘧啶脱氨酶域(例如APOBEC1或AID)的核碱基编辑器进行脱氨基转化为胸腺嘧啶(T)碱基。值得注意的是,在经由脱氨基(例如通过胞嘧啶脱氨酶如APOBEC1或AID)的C至T变化期间,胞嘧啶首先转化为尿嘧啶(U),导致G∶U错配。G∶U错配然后通过DNA修复和复制途径转化为T∶A对,因此在原始胞嘧啶的位置处引入胸腺嘧啶。如本领域技术人员所熟悉的,氨基酸密码子中碱基的转化可以导致该密码子编码的氨基酸的变化。胞嘧啶脱氨酶能够经由脱氨基将胞嘧啶(C)碱基转化为胸腺嘧啶(T)碱基。因此,设想对于含有C碱基的氨基酸密码子,该C碱基可以直接转化为T。例如,亮氨酸密码子(CTC)可以经由编码链上第一个C的脱氨基改变为TTC(苯丙氨酸)密码子。对于含有鸟嘌呤(G)碱基的氨基酸密码子,C碱基存在于互补链上;并且G碱基可以经由互补链上的脱氨基转化为腺嘌呤(A)。例如,(Met/M)密码子可以经由互补链上的第三个C的脱氨基转化为(Ile/I)密码子。在一些实施方案中,需要两个C至T变化以将密码子转化成不同的密码子。可以通过本公开的核碱基编辑器在编码PCSK9的多核苷酸中制备的可能突变的非限制性实例总结于表2中。
表2经由碱基编辑进行的PCSK9基因中的示例性密码子变化
在一些实施方案中,为了结合其靶序列并编辑所期望的碱基,核碱基编辑器依赖于其引导核苷酸序列(例如引导RNA)。在一些实施方案中,引导核苷酸序列是gRNA序列。通常,gRNA包含允许Cas9结合的tracrRNA框架和引导序列,其对本文公开的融合蛋白序列赋予特异性。在一些实施方案中,引导RNA包含结构5’-[引导序列]-guuuuagagcuagaaauagcaaguuaaaauaaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuuu-3’(SEQ ID NO:1997),其中引导序列包含与靶序列互补的序列。引导序列通常约20个核苷酸长。例如,引导序列可以是15-25个核苷酸长。在一些实施方案中,引导序列为15、16、17、18、19、20、21、22、23、24或25个核苷酸长。此类合适的引导RNA序列通常包含与待编辑的靶核苷酸的上游或下游50个核苷酸内的核酸序列互补的引导序列。
表3中提供了可以用于将核碱基编辑器靶向到其靶序列以诱导特定突变的引导序列。应理解,本文呈现的突变和引导序列仅用于说明目的,并不意味着限制性的。
表3经由密码子变化进行的示例性PCSK9功能丧失突变
*单下划线表示编码链上的C至T变化
双下划线表示互补链上的C至T变化
提供了引导序列(将核碱基编辑器靶向到靶序列的引导RNA的部分),其可以与本文提供的任何tracrRNA框架序列一起使用以生成完整的引导RNA序列a)BE类型:SpBE3=APOBEC1-SpCas9n-UGI;VQR-SpBE3=APOBEC1-VQR-SpCas9n-UGI;EQR-SpBE3=APOBEC1-EQR-SpCas9n-UGI;VRER-SpBE3=APOBEC1-VRER-SpCas9n-UGI;SaBE3=APOBEC1-SaCas9n-UGI;KKH-SaBE3=APOBEC1-KKH-SaCas9n-UGI;St3BE3=APOBEC1-St3Cas9n-UGI;St1BE3=APOBEC1-St1Cas9n-UGI。
在一些实施方案中,使用本文所述的方法产生的功能丧失PCSK9变体包含模拟天然保护性变体R46L的R46C突变(CGT至TGT)。PCSK9R46L变体的特征在于具有降低胆固醇的作用并降低早发性心肌梗塞的风险。参见例如,于Strom et al.,Clinica Chimica Acta,Volume 411,Issues 3-4,2,Pages 229-233,2010;Saavedra et al.,ArteriosclerThromb Vasc Biol.,34(12):2700-5,2014;Cameron et al.,Hum.Mol.Genet.,15(9):1551-1558,2006;和Bonnefond et al.,Diabetologia,Volume 58,Issue 9,pp 2051-2055,2015中,每篇通过引用并入本文。
在一些实施方案中,使用本文所述的方法产生的功能丧失PCSK9变体包含L253F突变(CTC至TTC)。已显示PCSK9 L253F变体降低血浆LDL-胆固醇水平。参见例如,于Kotowskiet al.,Am J Hum Genet.,78(3):410-422,2006;Zhao et al.,Am J Hum Genet.,79(3):514-523,2006;Huang et al.,Circ Cardiovasc Genet.,2(4):354-361,2009;和Hamptonet al.,PNAS,vol 104,No.37,14604-14609,2007中,每篇通过引用并入本文。
在一些实施方案中,使用本文所述的方法产生的功能丧失PCSK9变体包含A443T突变(GCC至ACC)。已显示PCSK9A443T突变体与降低的血浆LCL-胆固醇水平相关。参见例如,于Mayne et al.,Lipids in Health and Disease,2013-12:70,2013;Allard et al.,HumMutat.,26(5):497,2005;Huang et al.,Circ Cardiovasc Genet.,2(4):354-361,2009;和Benjannet et al.,Journal of Biological Chemistry,Vol.281,No.41,2006中,每篇通过引用并入本文。
在一些实施方案中,使用本文所述的方法产生的功能丧失PCSK9变体包含R93C突变(CGC至TGC)。已显示PCSK9 R93C变体与降低的血浆LCL-胆固醇水平相关。参见例如于Mayne et al.,Lipids in Health and Disease,2013-12:70,2013;Miyake et al.,Atherosclerosis,196(1):29-36,2008;和Tang et al.,Nature Communications,6,Article number:10206,2015中,每篇通过引用并入本文。
在一些实施方案中,可以通过降低适当折叠和活性的PCSK9蛋白的水平来降低细胞PCSK9活性。将去稳定化突变引入到野生型PCSK9蛋白中可以导致蛋白质的错误折叠或去激活。与野生型PCSK9蛋白相比,包含本文所述的一种或多种去稳定化突变的PCSK9变体可以具有降低的活性。例如,包含本文所述的一种或多种去稳定化突变的PCSK9变体的活性可以降低至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%或更多。
此外,本公开还考虑使用去稳定化突变以抵消功能获得PCSK9变体的作用。功能获得PCSK9变体(例如,图1A中描述的功能获得变体已经在本领域中描述并且发现与高胆固醇血症相关(例如于Peterson et al.,J Lipid Res.2008Jun;49(6):1152-1156;Benjannetet al.,J Biol Chem.2012Sep 28;287(40):33745-55;Abifadel et al.,Atherosclerosis.2012Aug;223(2):394-400;和Cameron et al.,Hum.Mol.Genet.(1May2006)15(9):155l-1558中,每篇通过引用并入本文)。将去稳定化突变引入到这些功能获得PCSK9变体中可以导致这些功能获得变体的错误折叠和去激活,从而抵消由功能获得突变引起的过度活性。此外,LDL-R介导的胆固醇清除途径中的若干种其他关键因子(例如LDL-R、APOB或APOC)中的功能获得突变也已在本领域中描述。因此,使用本文所述的组合物和方法在这些因子中产生去稳定化突变以抵消功能获得突变的有害作用,也在本公开的范围内。
因此,本公开进一步提供了引起PCSK9蛋白错误折叠或PCSK9蛋白结构上去稳定化的突变。可以使用本文所述方法产生的非限制性示例性去稳定化PCSK9突变显示于表4中。
表4使蛋白质折叠去稳定化的示例性PCSK9变体
*提供了引导序列(将核碱基编辑器靶向到靶序列的引导RNA的部分),其可以与本文提供的任何tracrRNA框架序列一起使用以生成完整的引导RNA序列a)BE类型:SpBE3=APOBEC1-SpCas9n-UGI;VQR-SpBE3=APOBEC1-VQR-SpCas9n-UGI;EQR-SpBE3=APOBEC1-EQR-SpCas9n-UGI;VRER-SpBE3=APOBEC1-VRER-SpCas9n-UGI;SaBE3=APOBEC1-SaCas9n-UGI;KKH-SaBE3=APOBEC1-KKH-SaCas9n-UGI;St3BE3=APOBEC1-St3Cas9n-UGI;St1BE3=APOBEC1-St1Cas9n-UGI。
在一些实施方案中,考虑了包含本文所述的多于一种突变的PCSK9变体。例如,可以使用本文所述的方法产生PCSK9变体,其包括选自表3和4的1、2、3、4、5、6、7、8、9、10个或更多个突变。为了在PCSK9基因中产生多个突变,可以使用多个引导核苷酸序列,每个引导核苷酸序列靶向一个靶碱基。核碱基编辑器能够编辑由引导核苷酸序列指示的每个碱基。例如,1、2、3、4、5、6、7、8、9、10个或更多个引导核苷酸序列可以用于基因编辑反应中。在一些实施方案中,引导核苷酸序列是RNA(例如gRNA)。在一些实施方案中,引导核苷酸序列是单链DNA分子。
提前终止密码子
本公开的一些方面提供编辑PCSK9基因以减少所产生的全长、功能性PCSK9蛋白的量的策略。在一些实施方案中,可以将终止密码子引入到正常终止密码子上游的PCSK9基因的编码序列中(称为“提前终止密码子”)。提前终止密码子导致提前的翻译终止,进而导致截短且无功能的蛋白质,并经由无义介导的mRNA衰变途径诱导mRNA的快速降解。参见例如Baker et al.,Current Opinion in Cell Biology 16(3):293-299,2004;Chang et al.,Annual Review of Biochemistry 76:51-74,2007;和Behm-Ansmant et al.,Genes&Development 20(4):391-398,2006,每篇通过引用并入本文。
本文所述的核碱基编辑器可以用于将若干个氨基酸密码子转化为终止密码子(例如,TAA、TAG或TGA)。例如,包括胞嘧啶脱氨酶域的核碱基编辑器能够经由脱氨基将胞嘧啶(C)碱基转化为胸腺嘧啶(T)碱基。因此,设想对于含有C碱基的氨基酸密码子,该C碱基可以转化为T。例如,CAG(Gln/Q)密码子可以经由编码链上第一个C的脱氨基改变为TAG(琥珀)密码子。对于含有鸟嘌呤(G)碱基的有义密码子,C碱基存在于互补链上;并且G碱基可以经由互补链上的C的脱氨基转化为腺苷(A)。例如,(Trp/W)密码子可以经由互补链上第二个C的脱氨基转化为(琥珀)密码子。在一些实施方案中,需要两个C至T变化以将密码子转化为无义密码子。例如,(R)密码子经由编码链上第一个C的脱氨基和互补链上第二个C的脱氨基转化为(琥珀)密码子。表5中提供了可以经由碱基编辑改变为终止密码子的密码子的非限制性实例。
表5转化为终止密码子
*单下划线:编码链上的变化
双下划线:互补链上的变化
因此,本公开提供可以在PCSK9基因中转化为提前终止密码子的氨基酸密码子的非限制性实例。在一些实施方案中,当靶残基位于柔性环中时,终止密码子的引入可以有效地生成截短。在一些实施方案中,彼此相邻的两个密码子可以都转化为终止密码子,导致两个彼此相邻的终止密码子(也称为“串联终止密码子”)。“相邻”意指两个终止密码子之间不超过5个氨基酸。例如,两个终止密码子可以彼此直接相邻(其间为0个氨基酸)或其间具有1、2、3、4或5个氨基酸。串联终止密码子的引入在生成截短和非功能性PCSK9突变中可能特别有效。可以引入的串联终止密码子的非限制性实例包括:W10X-W11X、Q99X-Q101X、Q342X-Q344X和Q554X-Q555X,其中X表示终止密码子。在一些实施方案中,可以在结构上去稳定化突变(例如,表2中列出的结构上去稳定化突变)之后引入终止密码子以有效地产生截短PCSK9蛋白。后面有终止密码子的结构上去稳定化突变的非限制性实例包括:P530S/L-Q531X、P581S/L-R582X和P618S/L-Q619X,其中X表示终止密码子。
可以通过本文所述的核碱基编辑器改变为终止密码子的示例性密码子和可以使用的引导核苷酸序列列于表6中。该实例仅用于说明目的,并不意味着限制性的。
表6经由碱基编辑将提前终止密码子引入到PCSK9基因中
*在环/接头区中发现的残基标记为+或++
提供了引导序列(将核碱基编辑器靶向到靶序列的引导RNA的部分),其可以与本文提供的任何tracrRNA框架序列一起使用以生成完整的引导RNA序列a)BE类型:SpBE3=APOBEC1-SpCas9n-UGI;VQR-SpBE3=APOBEC1-VQR-SpCas9n-UGI;EQR-SpBE3=APOBEC1-EQR-SpCas9n-UGI;VRER-SpBE3=APOBEC1-VRER-SpCas9n-UGI;SaBE3=APOBEC1-SaCas9n-UGI;KKH-SaBE3=APOBEC1-KKH-SaCas9n-UGI;St3BE3=APOBEC1-St3Cas9n-UGI;St1BE3=APOBEC1-St1Cas9n-UGI。
PCSK9基因的非编码区中的靶碱基-剪接变体
本公开的一些方面提供经由阻止PCSK9mRNA成熟和产生来降低细胞PCSK9活性的策略。在一些实施方案中,此类策略涉及PCSK9基因中剪接位点的更改。经更改的剪接位点可以导致更改的PCSK9mRNA的剪接和成熟。例如,在一些实施方案中,经更改的剪接位点可以导致外显子的跳读,继而导致经截短的蛋白质产物或经更改的阅读框。在一些实施方案中,当框内终止密码子遇到内含子中的翻译核糖体时,经更改的剪接位点可以导致内含子序列的翻译和过早的翻译终止。在一些实施方案中,起始密码子得以编辑并且蛋白质翻译在下一个ATG密码子处开始,所述下一个ATG密码子可能不在正确的编码框中。
剪接位点通常包含内含子供体位点、Lariat分支点和内含子受体位点。剪接的机制对于本领域技术人员来说是熟悉的。如图3中所示,内含子供体位点具有GGGTRAGT的共有序列,并且与内含子供体位点共有序列中的G碱基配对的C碱基可以由本文所述的核碱基编辑器靶向,从而更改内含子供体位点。Lariat分支点也具有共有序列,例如YTRAC,其中Y是嘧啶并且R是嘌呤。Lariat分支点共有序列中的C碱基可以由本文所述的核碱基编辑器靶向,导致随后的外显子的跳读。内含子受体位点具有YNCAGG的共有序列,其中Y是嘧啶并且N是任何核苷酸。内含子受体位点的共有序列的C碱基和与内含子受体位点的共有序列中的G碱基配对的C碱基可以由本文所述的核碱基编辑器靶向,从而更改内含子受体位点,继而导致外显子的跳读。表7中描述了更改PCSK9基因的剪接位点的一般策略。
表7经由碱基编辑的内含子-外显子接合的示例性更改
如本文所述,人PCSK9(SEQ ID NO:1990)的基因序列约22kb长,并且含有12个外显子和11个内含子。可以更改每个外显子-内含子接合以破坏PCSK9 mRNA的加工和成熟。因此,表8中提供的是可以使用本文所述的核碱基编辑器在PCSK9基因中进行的更改的非限制性实例,以及可以用于每个更改的引导序列。
表8经由碱基编辑更改PCSK9基因中的内含子/外显子接合
*提供了引导序列(将核碱基编辑器靶向靶序列的引导RNA的部分),其可以与本文提供的任何tracrRNA框架序列一起使用以生成完整的引导RNA序列a)BE类型:SpBE3=APOBEC1-SpCas9n-UGI;VQR-SpBE3=APOBEC1-VQR-SpCas9n-UGI;EQR-SpBE3=APOBEC1-EQR-SpCas9n-UGI;VRER-SpBE3=APOBEC1-VRER-SpCas9n-UGI;SaBE3=APOBEC1-SaCas9n-UGI;KKH-SaBE3=APOBEC1-KKH-SaCas9n-UGI;St3BE3=APOBEC1-St3Cas9n-UGI;St1BE3=APOBEC1-St1Cas9n-UGI。
用于以高特异性和低脱靶结合的有效碱基编辑的引导RNA序列的评分
为了使用碱基编辑实现有效且特异性的基因组修饰,需要明智地选择含有靶C(对此可以生成特定的互补引导RNA序列)的基因组序列和(若需要的话)与胞苷脱氨酶(例如Cas9、dCas9、Cas9n、Cpf1、NgAgo等)融合的DNA结合域匹配的附近的PAM,如Komor et al.,Nature,533,420-424(2016)中所述,其通过引用并入本文。引导RNA序列和PAM偏好限定了可编程DNA结合域(例如Cas9、dCas9、Cas9n、Cpf1、NgAgo等)的基因组靶序列。由于一些基因组序列的重复性质以及整个基因组中短序列呈现的随机频率,有必要鉴定用于编程具有最低潜在脱靶位点数的碱基编辑器的引导RNA,考虑到针对基因组中所有其他序列的1、2、3、4个或更多个错配,如Hsu et al(Nature biotechnology,2013,31(9):827-832)、Fusi etal(bioRxiv 021568;doi:http://dx.doi.org/10.1101/021568)、Chari et al(NatureMethods,2015,12(9):823-6)、Doench et al(Nature Biotechnology,2014,32(12):1262-7)、Wang et al(Science,2014,343(6166):80-4)、Moreno-Mateos et al(NatureMethods,2015,12(10):982-8)、Housden et al(Science Signaling,2015,8(393):rs9)、Haeussler et al,(Genome Biol.2016;17:148)中所述,每篇通过引用并入本文。也可以考虑引导RNA和靶DNA之间形成凸起的可能性,如Bae et al(Bioinformatics,2014,30,1473-5)中所述,其通过引用并入本文。表9-13中显示了来自表3-8的所选引导RNA的经计算的特异性评分的非限制性实例。显示了可能影响DNA结合域编程效率的其他经计算的参数,如Housden et al(Science Signaling,2015,8(393):rs9)、Farboud et al(Genetics,2015,199(4):959-71)中所述,每篇通过引用并入本文。
其他保护性变体
LDL-R介导的胆固醇清除途径涉及多个参与者。该途径中涉及的蛋白质因子的非限制性实例包括:载脂蛋白C3(APOC3)、LDL受体(LDL-R)和LDL受体蛋白的增加的降解(IDOL)。这些蛋白质因子及其各自的功能在本领域中有所描述。此外,这些因子的功能丧失变体已经得以鉴定和表征,并且确定具有心脏保护功能。参见例如et al.,NEngl J Med 2014;371:32-41July 3,2014;Scholtz1 et al.,Hum.Mol.Genet.(1999)8(11):2025-2030;De Castro-Orós et al.,BMC Medical Genomics,20147:17;和Gu etal.,J Lipid Res.2013,54(12):3345-57,每篇通过引用并入本文。
因此,本公开的一些方面提供使用核碱基编辑器和本文所述的策略生成APOC3(例如A43T和R19X)、LDL-R和IDOL(例如R266X)的功能丧失变体。表13中提供了此类变体和可以用于制备它们的引导序列的非限制性实例。
表13 APOC3、LDL-R和IDOL的功能丧失变体
*提供了引导序列(将核碱基编辑器靶向到靶序列的引导RNA的部分),其可以与本文提供的任何tracrRNA框架序列一起使用以生成完整的引导RNA序列a)BE类型:SpBE3=APOBEC1-SpCas9n-UGI;VQR-SpBE3=APOBEC1-VQR-SpCas9n-UGI;EQR-SpBE3=APOBEC1-EQR-SpCas9n-UGI;VRER-SpBE3=APOBEC1-VRER-SpCas9n-UGI;SaBE3=APOBEC1-SaCas9n-UGI;KKH-SaBE3=APOBEC1-KKH-SaCas9n-UGI;St3BE3=APOBEC1-St3Cas9n-UGI;St1BE3=APOBEC1-St1Cas9n-UGI。
APOC3氨基酸序列(NC_000011.9GRCh37.p5,SEQ ID NO:1800)
APOC3 cDNA序列显示分配给相应密码子的氨基酸残基。靶向用于碱基编辑的残基的实例标有下划线(核苷酸序列:SEQ ID NO:1801,蛋白质序列:SEQ ID NO:1802)。
APOC3基因组序列(SEQ ID NO:1803)显示非编码区和内含子(小写)以及外显子(大写)。靶向用于碱基编辑的剪接中涉及的碱基的实例标有下划线。
IDOL氨基酸序列(SEQ ID NO:1804)
LDL-R氨基酸序列(SEQ ID NO:1805)
还提供了可以使用本文所述的核碱基编辑器在APOC3基因中产生的功能丧失突变。生成功能丧失突变的策略类似于用于PCSK9的策略(例如,提前终止密码子、去稳定化突变、更改剪接等)。APOC3突变和引导RNA序列列于表14-16中。
表14经由密码子变化和提前终止密码子的示例性APOC3保护性功能丧失突变
*提供了引导序列(将核碱基编辑器靶向到靶序列的引导RNA的部分),其可以与本文提供的任何tracrRNA框架序列一起使用以生成完整的引导RNA序列a)BE类型:SpBE3=APOBEC1-SpCas9n-UGI;VQR-SpBE3=APOBEC1-VQR-SpCas9n-UGI;EQR-SpBE3=APOBEC1-EQR-SpCas9n-UGI;VRER-SpBE3=APOBEC1-VRER-SpCas9n-UGI;SaBE3=APOBEC1-SaCas9n-UGI;KKH-SaBE3=APOBEC1-KKH-SaCas9n-UGI;St3BE3=APOBEC1-St3Cas9n-UGI;St1BE3=APOBEC1-St1Cas9n-UGI。
表15经由碱基编辑更改APOC3基因中的内含子/外显子接合
*提供了引导序列(将核碱基编辑器靶向到靶序列的引导RNA的部分),其可以与本文提供的任何tracrRNA框架序列一起使用以生成完整的引导RNA序列a)BE类型:SpBE3=APOBEC1-SpCas9n-UGI;VQR-SpBE3=APOBEC1-VQR-SpCas9n-UGI;EQR-SpBE3=APOBEC1-EQR-SpCas9n-UGI;VRER-SpBE3=APOBEC1-VRER-SpCas9n-UGI;SaBE3=APOBEC1-SaCas9n-UGI;KKH-SaBE3=APOBEC1-KKH-SaCas9n-UGI;St3BE3=APOBEC1-St3Cas9n-UGI;St1BE3=APOBEC1-St1Cas9n-UGI。
在一些实施方案中,提供了将功能丧失突变同时引入到LDL介导的胆固醇清除途径中的多于一种蛋白质因子中。例如,在一些实施方案中,可以将功能丧失突变同时引入到PCSK9和APOC3中。在一些实施方案中,可以将功能丧失突变同时引入到PCSK9和LDL-R中。在一些实施方案中,可以将功能丧失突变同时引入到PCSK9和IODL中。在一些实施方案中,可以将功能丧失突变同时引入到APOC3和IODL中。在一些实施方案中,可以将功能丧失突变同时引入到LDL-R和APOC3中。在一些实施方案中,可以将功能丧失突变同时引入到LDL-R和IDOL中。在一些实施方案中,可以将功能丧失突变同时引入到PCSK9、APOC3、LDL-R和IDOL中。为了将功能丧失突变同时引入到多于一种蛋白质中,使用多个引导核苷酸序列。
本文进一步提供的是用于在本文所述的LDL-R介导的胆固醇清除途径中涉及的任何蛋白质因子中生成新的且未表征的突变的方法。例如,可以针对这些蛋白质因子的基因组位点中的所有可能的PAM序列设计引导核苷酸序列的文库,并用于在这些蛋白质中生成突变。可以评估蛋白质变体的功能。如果鉴定出功能丧失变体,则可以经由对经编辑的基因组位点进行测序(例如经由DNA深度测序)来鉴定用于产生突变的特定gRNA。
核碱基编辑器
通过使用核碱基编辑器实现生成本文所述的功能丧失PCSK9变体的方法。如本文所述,核碱基编辑器是融合蛋白,其包含:(i)可编程DNA结合蛋白域;和(ii)脱氨酶域。应理解,任何可编程DNA结合域可以用于碱基编辑器中。
在一些实施方案中,可编程DNA结合蛋白域包含锌指核酸酶(ZFN)或转录激活物样效应物域(TALE)的DNA结合域。在一些实施方案中,可编程DNA结合蛋白域可以由引导核苷酸序列编程,并因此称为“引导核苷酸序列-可编程DNA结合蛋白域”。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是核酸酶无活性的Cas9,或dCas9。如本文所用的dCas9涵盖在其核酸酶活性中完全无活性,或在其核酸酶活性中部分无活性(例如Cas9切口酶)的Cas9。因此,在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是Cas9切口酶。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是核酸酶无活性的Cpf1。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是核酸酶无活性的Argonaute。
在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是dCas9域。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是Cas9切口酶。在一些实施方案中,dCas9域包含SEQ ID NO:2或SEQ ID NO:3的氨基酸序列。在一些实施方案中,dCas9域包含与本文提供的Cas9域(例如SEQ ID NO:11-260)的任一个至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列,并且包含对应于SEQID NO:1中D10X(X是除了D的任何氨基酸)和/或H840X(X是除了H的任何氨基酸)的突变。在一些实施方案中,dCas9域包含与本文提供的Cas9域(例如SEQ ID NO:11-260)的任一个至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列,并且包含对应于SEQ ID NO:1中D10A和/或H840A的突变。在一些实施方案中,Cas9切口酶包含与本文提供的Cas9域(例如SEQ ID NO:11-260)的任一个至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列,并且包含对应于SEQ ID NO:1中D10X(X是除了D的任何氨基酸)的突变和对应于SEQ ID NO:1中位置840的位置处的组氨酸。在一些实施方案中,Cas9切口酶包含与本文提供的Cas9域(例如SEQ ID NO:11-260)的任一个至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列,并且包含对应于SEQ ID NO:1中D10A的突变和对应于SEQ ID NO:1中位置840的位置处的组氨酸。在一些实施方案中,提供了dCas9或Cas9切口酶的变体或同源物(例如分别为SEQ ID NO:2或SEQID NO:3的变体),其分别与SEQ ID NO:2或SEQ ID NO:3至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%,并且包含对应于SEQ ID NO:1中D10A和/或H840A的突变。在一些实施方案中,提供了Cas9的变体(例如SEQ ID NO:2的变体),其具有比SEQ ID NO:2短或长约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多的氨基酸序列,条件是dCas9变体包含对应于SEQ ID NO:1中D10A和/或H840A的突变。在一些实施方案中,提供了Cas9切口酶的变体(例如SEQ ID NO:3的变体),其具有比SEQ ID NO:3短或长约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多的氨基酸序列,条件是dCas9变体包含对应于D10A的突变并且包含对应于SEQ ID NO:1中位置840的位置处的组氨酸。
基于本公开和本领域的知识,另外的合适的核酸酶无活性的dCas9域对于本领域技术人员而言将是显而易见的,并且在本公开的范围内。此类另外的示例性合适的核酸酶无活性的Cas9域包括但不限于D10A/H840A、D10A/D839A/H840A、D10A/D839A/H840A/N863A突变体域(参见例如Prashant et al.,Nature Biotechnology.2013;31(9):833-838,其通过引用并入本文)或K603R(参见例如Chavez et al.,Nature Methods 12,326-328,2015,其通过引用并入本文)。
在一些实施方案中,与野生型Cas9域相比,本文所述的核碱基编辑器包含具有降低的Cas9域与DNA的糖-磷酸主链之间的静电相互作用的Cas9域。在一些实施方案中,Cas9域包含降低Cas9域与DNA的糖-磷酸主链之间的缔合的一个或多个突变。在一些实施方案中,本文所述的核碱基编辑器包含dCas9(例如具有D10A和H840A突变)或Cas9切口酶(例如具有D10A突变),其中dCas9或Cas9切口酶进一步包含SEQ ID NO:1中提供的氨基酸序列的N497X、R661X、Q695X和/或Q926X突变的一个或多个,或SEQ ID NO:11-260中提供的任何氨基酸序列中的相应突变,其中X是任何氨基酸。在一些实施方案中,本文所述的核碱基编辑器包含dCas9(例如具有D10A和H840A突变)或Cas9切口酶(例如具有D10A突变),其中dCas9或Cas9切口酶进一步包含SEQ ID NO:1中提供的氨基酸序列的N497A、R661A、Q695A和/或Q926A突变的一个或多个,或SEQ ID NO:11-260中提供的任何氨基酸序列中的相应突变。在一些实施方案中,dCas9域(例如,本文提供的任何核碱基编辑器)包含如SEQ ID NO:2-9的任一个中所示的氨基酸序列。在一些实施方案中,核碱基编辑器包含如SEQ ID NO:293-302和321的任一个中所示的氨基酸序列。在一些实施方案中,Cas9域(例如,本文提供的任何融合蛋白的Cas9域)包含如SEQ ID NO:9中所示的氨基酸序列。在一些实施方案中,融合蛋白包含如SEQ ID NO:321中所示的氨基酸序列。具有高保真度的Cas9域是本领域已知的,并且对于本领域技术人员而言将是显而易见的。例如,具有高保真度的Cas9域已描述于Kleinstiver,B.P.,et al.“High-fidelity CRISPR-Cas9 nucleases with nodetectable genome-wide off-target effects.”Nature 529,490-495(2016);和Slaymaker,I.M.,et al.“Rationally engineered Cas9 nucleases with improvedspecificity.”Science 351,84-88(2015)中;每篇的全部内容通过引用并入本文。
应当理解,本文提供的碱基编辑器,例如碱基编辑器2(BE2)或碱基编辑器3(BE3),可以通过如本文所述修饰Cas9域来转化为高保真度碱基编辑器以生成高保真碱基编辑器,例如,高保真碱基编辑器2(HF-BE2)或高保真碱基编辑器3(HF-BE3)。在一些实施方案中,碱基编辑器2(BE2)包含脱氨酶域、dCas9域和UGI域。在一些实施方案中,碱基编辑器3(BE3)包含脱氨酶域、nCas9域和UGI域。
具有降低的Cas9和DNA主链之间的静电相互作用的Cas9变体。
(SEQ ID NO:9,相对于SEQ ID NO:1的突变用粗体且加下划线)
高保真核碱基编辑器(HF-BE3)
Cas9识别靶DNA序列中CRISPR重复序列中的短基序(PAM基序)。如本文所用,“PAM基序”或“前间隔区相邻基序”是指在CRISPR细菌适应性免疫系统中直接在由Cas9核酸酶靶向的DNA序列之后的DNA序列。PAM是入侵病毒或质粒的组分,但不是细菌CRISPR基因座的组分。自然地,若靶DNA序列后没有PAM序列,则Cas9不会成功结合或切割靶DNA序列。PAM是必需的靶向组分(未在细菌基因组中发现),其区分细菌自我与非自我DNA,从而阻止CRISPR基因座被核酸酶靶向和破坏。
野生型酿脓链球菌Cas9识别规范PAM序列(5’-NGG-3’)。其他Cas9核酸酶(例如来自嗜热链球菌、金黄色葡萄球菌、脑膜炎奈瑟氏球菌或齿垢密螺旋体(Treponemadenticolaor)的Cas9)及其Cas9变体已在本领域中描述为具有不同的或更放松的PAM要求。例如,在Kleinstiver et al.,Nature 523,481-485,2015;Klenstiver et al.,Nature529,490-495,2016;Ran et al.,Nature,Apr 9;520(7546):186-191,2015;Kleinstiveret al.,Nat Biotechnol,33(12):1293-1298,2015;Hou et al.,Proc Natl Acad Sci U SA,110(39):15644-9,2014;Prykhozhij et al.,PLoS One,10(3):e0119372,2015;Zetscheet al.,Cell 163,759-771,2015;Gao et al.,Nature Biotechnology,doi:10.1038/nbt.3547,2016;Want et al.,Nature 461,754-761,2009;Chavez et al.,doi:dx.doi.org/10.1101/058974;Fagerlund et al.,Genome Biol.2015;16:25,2015;Zetsche et al.,Cell,163,759-771,2015;和Swarts et al.,Nat Struct Mol Biol,21(9):743-53,2014中,每篇通过引用并入本文。
因此,本公开的引导核苷酸序列-可编程DNA结合蛋白可以识别多种PAM序列,包括但不限于:NGG、NGAN、NGNG、NGAG、NGCG、NNGRRT、NGRRN、NNNRRT、NNNGATT、NNAGAAW、NAAAC、TTN、TTTN和YTN,其中Y是嘧啶,并且N是任何核碱基。
具有不同的PAM特异性的RNA-可编程DNA结合蛋白的一个实例是来自普雷沃氏菌(Prevotella)和弗朗西斯菌(Francisella)1(Cpf1)的聚簇规则间隔短回文重复。与Cas9类似,Cpf1也是2类CRISPR效应物。已经显示,Cpf1介导了强大的DNA干扰,其具有与Cas9不同的特征。Cpf1是缺乏tracrRNA的单一RNA引导的内切核酸酶,并且它利用富含T的前间隔区相邻基序(TTN、TTTN或YTN)。此外,Cpf1经由交错的DNA双链断裂切割DNA。在16种Cpf1家族蛋白中,来自氨基酸球菌属或毛螺菌科的两种酶显示在人细胞中具有有效的基因组编辑活性。
在本公开中也有用的是核酸酶无活性的Cpf1(dCpf1)变体,其可以用作引导核苷酸序列-可编程DNA结合蛋白域。Cpf1蛋白具有RuvC样内切核酸酶域,其类似于Cas9的RuvC域,但不具有HNH内切核酸酶域,并且Cpf1的N端不具有Cas9的alpha螺旋识别叶(lobe)。它在Zetsche et al.,Cell,163,759-771,2015(其通过引用并入本文)中显示,Cpf1的RuvC样域负责切割两条DNA链并且RuvC样域的失活使Cpf1核酸酶活性失活。例如,对应于新凶手弗朗西斯菌(Francisella novicida)Cpf1(SEQ ID NO:10)中的D917A、E1006A或D1255A的突变使Cpf1核酸酶活性失活。在一些实施方案中,本公开的dCpf1包含对应于SEQ ID NO:10中D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A或D917A/E1006A/D1255A的突变。应当理解,可以根据本公开使用使Cpf1的RuvC域失活的任何突变,例如取代突变、缺失或插入。
因此,在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是核酸酶无活性的Cpf1(dCpf1)。在一些实施方案中,dCpf1包含SEQ ID NO:261-267或2007-2014的任一个的氨基酸序列。在一些实施方案中,dCpf1包含与SEQ ID NO:10至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列,并且包含对应于SEQ ID NO:10中D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A或D917A/E1006A/D1255A的突变。根据本公开,也可以使用来自其他细菌物种的Cpf1。
野生型新凶手弗朗西斯菌Cpf1(SEQ ID NO:10)(D917、E1006和D1255是粗体且加下划线的)
新凶手弗朗西斯菌Cpf1 D917A(SEQ ID NO:261)(A917、E1006和D1255是粗体且加下划线的)
新凶手弗朗西斯菌Cpf1 E1006A(SEQ ID NO:262)(D917、A1006和D1255是粗体且加下划线的)
新凶手弗朗西斯菌Cpf1 D1255A(SEQ ID NO:263)(D917、E1006和A1255是粗体且加下划线的)
新凶手弗朗西斯菌Cpf1 D917A/E1006A(SEQ ID NO:264)(A917、A1006和D1255是粗体且加下划线的)
新凶手弗朗西斯菌Cpf1 D917A/D1255A(SEQ ID NO:265)(A917、E1006和A1255是粗体且加下划线的)
新凶手弗朗西斯菌Cpf1 E1006A/D1255A(SEQ ID NO:266)(D917、A1006和A1255是粗体且加下划线的)
新凶手弗朗西斯菌Cpf1 D917A/E1006A/D1255A(SEQ ID NO:267)(A917、A1006和A1255是粗体且加下划线的)
在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是来自氨基酸球菌属物种(AsCpf1)的Cpf1蛋白。来自氨基酸球菌属物种的Cpf1蛋白先前已经得以描述了并且对于技术人员将是显而易见的。示例性的氨基酸球菌属Cpf1蛋白(AsCpf1)包括但不限于本文提供的任何AsCpf1蛋白。
野生型AsCpf1-残基R912以粗体下划线表示,并且残基661-667以斜体和下划线表示。
AsCpf1(R912A)-残基A912以粗体下划线表示,并且残基661-667以斜体和下划线表示。
在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是来自毛螺菌科物种(LbCpf1)的Cpf1蛋白。来自毛螺菌科物种的Cpf1蛋白先前已经得以描述了并且对于技术人员将是显而易见的。示例性的毛螺菌科Cpf1蛋白(LbCpf1)包括但不限于本文提供的任何AsCpf1蛋白。
野生型LbCpf1-残基R836和R1138以粗体下划线表示。
LbCpf1(R836A)-残基A836以粗体下划线表示。
LbCpf1(R1138A)-残基A1138以粗体下划线表示。
在一些实施方案中,Cpf1蛋白是残缺的(crippled)Cpf1蛋白。如本文所用,“残缺的Cpf1”蛋白质是与野生型Cpf1蛋白质相比具有降低的核酸酶活性的Cpf1蛋白。在一些实施方案中,残缺的Cpf1蛋白优选比非靶链更有效地切割靶链。例如,Cpf1蛋白优选切割待编辑的核苷酸所在的双链核酸分子的链。在一些实施方案中,残缺的Cpf1蛋白优选比靶链更有效地切割非靶链。例如,Cpf1蛋白优选切割待编辑的核苷酸不在的双链核酸分子的链。在一些实施方案中,残缺的Cpf1蛋白优选比其切割非靶链至少5%更有效地切割靶链。在一些实施方案中,残缺的Cpf1蛋白优选比其切割非靶链至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%更有效地切割靶链。
在一些实施方案中,残缺的Cpf1蛋白是非天然存在的Cpf1蛋白。在一些实施方案中,残缺的Cpf1蛋白包含相对于野生型Cpf1蛋白的一个或多个突变。在一些实施方案中,残缺的Cpf1蛋白包含相对于野生型Cpf1蛋白的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个突变。在一些实施方案中,残缺的Cpf1蛋白包含如SEQ ID NO:2009中或另一种Cpf1蛋白的相应氨基酸中所示的R836A突变。应当理解,包含与SEQ ID NO:2009的R836A的同源残基(例如相应的氨基酸)的Cpf1也可以突变以实现类似的结果。在一些实施方案中,残缺的Cpf1蛋白包含如SEQ ID NO:2009中或另一种Cpf1蛋白的相应氨基酸中所示的R1138A突变。在一些实施方案中,残缺的Cpf1蛋白包含如SEQ ID NO:2007中或另一种Cpf1蛋白的相应氨基酸中所示的R912A突变。不希望受任何特定理论的束缚,SEQ ID NO:2009(LbCpf1)的残基R838和SEQ ID NO:2007(AsCpf1)的残基R912是相应的(例如,同源的)残基的实例。例如,SEQ ID NO:2007和2009之间的比对的一部分显示R912和R838是相应的残基。
在一些实施方案中,本文提供的任何Cpf1蛋白包含一个或多个氨基酸缺失。在一些实施方案中,本文提供的任何Cpf1蛋白包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸缺失。不希望受任何特定理论的束缚,在Cpf1中存在螺旋区(其包括AsCpf1的残基661-667(SEQ ID NO:2007)),其可能阻碍与Cpf1融合的脱氨酶(例如APOBEC)的功能。该区域包含氨基酸序列KKTGDQK。因此,本公开的方面提供了包含破坏Cpf1中的该螺旋区的突变(例如缺失)的Cpf1蛋白。在一些实施方案中,Cpf1蛋白包含SEQ IDNO:2007中的以下残基的一个或多个缺失,或另一种Cpf1蛋白中的一个或多个相应的缺失:K661、K662、T663、G664、D665、Q666和K667。在一些实施方案中,Cpf1蛋白包含SEQ ID NO:2007中的T663和D665缺失,或另一种Cpf1蛋白中的相应的缺失。在一些实施方案中,Cpf1蛋白包含SEQ ID NO:2007中的K662、T663、D665和Q666缺失,或另一种Cpf1蛋白中的相应的缺失。在一些实施方案中,Cpf1蛋白包含SEQ ID NO:2007中的K661、K662、T663、D665、Q666和K667缺失,或另一种Cpf1蛋白中的相应的缺失。
AsCpf1(缺失的T663和D665)
AsCpf1(缺失K662、T663、D665和Q666)
AsCpf1(缺失K661、K662、T663、D665、Q666和K667)
在一些实施方案中,本公开的引导核苷酸序列-可编程DNA结合蛋白对PAM序列没有要求。此类引导核苷酸序列-可编程DNA结合蛋白的一个实例可以是来自格氏嗜盐碱杆菌(Natronobacterium gregoryi)的Argonaute蛋白(NgAgo)。NgAgo是ssDNA引导的内切核酸酶。NgAgo结合约24个核苷酸的5’磷酸化ssDNA(gDNA),以将其引导至其靶位点,并将在gDNA位点处产生DNA双链断裂。与Cas9相比,NgAgo-gDNA系统不需要前间隔区相邻基序(PAM)。使用核酸酶无活性的NgAgo(dNgAgo)可以极大地扩展可以靶向的密码子。NgAgo的表征和使用已经描述于Gao et al.,Nat Biotechnol.Epub 2016May 2.PubMed PMID:27136078;Swarts et al.,Nature.507(7491)(2014):258-61;和Swarts et al.,NucleicAcidsRes.43(10)(2015):5120-9,每篇通过引用并入本文。格氏嗜盐碱杆菌Argonaute的序列提供于SEQ ID NO:270中。
野生型格氏嗜盐碱杆菌Argonaute(SEQ ID NO:270)
在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是Argonaute蛋白的原核同源物。Argonaute蛋白的原核同源物是已知的并且已经描述于例如Makarova et al.,“Prokaryotic homologs of Argonaute proteins are predicted to function as keycomponents of a novel system of defense against mobile genetic elements”,Biol.Direct.2009Aug 25;4:29.doi:10.1186/1745-6150-4-29中,其通过引用并入本文。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是Marinitoga piezophilaArgonaute(MpAgo)蛋白。CRISPR相关的Marinitoga piezophila Argonaute(MpAgo)蛋白使用5’-磷酸化引导物切割单链靶序列。所有已知的Argonaute均使用5’引导物。MpAgo-RNA复合物的晶体结构显示包含阻断5’磷酸盐相互作用的残基的引导链结合位点。该数据表明对5’-羟基化引导物具有非规范特异性的Argonaute亚类的演化。参见例如Kaya et al.,“Abacterial Argonaute with noncanonical guide RNA specificity”,Proc Natl AcadSci U S A.2016Apr 12;113(15):4057-62,其全部内容在此通过引用并入。应当理解,其他Argonaute蛋白可以用于本文所述的任何融合蛋白(例如碱基编辑器)中,例如,用于将脱氨酶(例如胞苷脱氨酶)引导至靶核酸(例如ssRNA)。
在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是微生物CRISPR-Cas系统的单一效应物。微生物CRISPR-Cas系统的单一效应物包括但不限于Cas9、Cpf1、C2c1、C2c2和C2c3。通常,微生物CRISPR-Cas系统分为1类和2类系统。1类系统具有多亚基效应复合物,而2类系统具有单一蛋白质效应物。Cas9和Cpf1是2类效应物。除了Cas9和Cpf1之外,三种不同的2类CRISPR-Cas系统(C2c1、C2c2和C2c3)已经由Shmakov et al.,“Discoveryand Functional Characterization of Diverse Class 2CRISPR Cas Systems”,Mol.Cell,2015Nov 5;60(3):385-397描述,其全部内容通过引用并入本文。两个系统(C2c1和C2c3)的效应物含有与Cpf1相关的RuvC样内切核酸酶域。第三个系统,C2c2含有具有两个预测的HEPN RNA酶域的效应物。与C2c1产生CRISPR RNA不同,成熟CRISPR RNA的产生是不依赖tracrRNA的。C2c1依赖于CRISPR RNA和tracrRNA两者实现DNA切割。已显示细菌性C2c2对于CRISPR RNA成熟具有独特的RNA酶活性,不同于其RNA激活的单链RNA降解活性。这些RNA酶功能彼此不同,并且与Cpf1的CRISPR RNA加工行为不同。参见例如East-Seletsky;etal.,“Two distinct RNase activities of CRISPR-C2c2enable guide-RNA processingand RNA detection”,Nature,2016Oct 13;538(7624):270-273,其全部内容在此通过引用并入。Leptotrichia shahii中C2c2的体外生化分析已显示,C2c2由单个CRISPR RNA引导,并且可以经编程以切割携带互补前间隔区(protospacer)的ssRNA靶标。两个保守的HEPN域中的催化残基介导切割。催化残基中的突变生成催化无活性的RNA结合蛋白。参见例如Abudayyeh et al.,“C2c2is a single-component programmable RNA-guided RNA-targeting CRISPR effector,”Science,2016 Aug 5;353(6299),其全部内容在此通过引用并入。
已经报告了与嵌合单分子引导RNA(sgRNA)复合的酸土脂环酸芽孢杆菌(Alicyclobaccillus acidoterrastris)C2c1(AacC2c1)的晶体结构。参见例如,Liu etal.,“C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”,Mol.Cell,2017Jan 19;65(2):310-322,通过引用并入本文。还已经报告了与靶DNA结合的酸土脂环酸芽孢杆菌C2c1作为三元复合物的晶体结构。参见例如,Yang et al.,“PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Casendonuclease”,Cell,2016Dec 15;167(7):1814-1828,其全部内容在此通过引用并入。具有靶DNA链和非靶DNA链两者的AacC2c1的催化能力构象已被独立地捕获,定位在单个RuvC催化袋内,其中C2c1介导的切割导致靶DNA的交错的七核苷酸断裂。C2c1三元复合物与先前鉴定的Cas9和Cpf1对应物之间的结构比较证明了CRISPR-Cas9系统使用的机制的多样性。
在一些实施方案中,本文提供的任何融合蛋白的引导核苷酸序列-可编程DNA结合蛋白是C2c1、C2c2或C2c3蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是C2c1蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是C2c2蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是C2c3蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白包含与天然存在的C2c1、C2c2或C2c3蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是天然存在的C2c1、C2c2或C2c3蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白包含与SEQ ID NO:2015-2017的任一个至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白包含SEQ ID NO:2015-2017的任一个的氨基酸序列。应当理解,根据本公开也可以使用来自其他细菌物种的C2c1、C2c2或C2c3。
C2c1(uniprot.org/uniprot/T0D7A2#)
sp|T0D7A2|C2C1_ALIAG CRISPR相关的内切核酸酶C2c1 OS=酸土脂环酸芽孢杆菌(菌株ATCC 49025/DSM 3922/CIP 106132/NCIMB 13137/GD3B)GN=c2c1 PE=1SV=1
C2c2(uniprot.org/uniprot/P0DOC6)
>sp|P0DOC6|C2C2_LEPSD CRISPR相关的内切核糖核酸酶C2c2OS=Leptotrichiashahii(菌株DSM 19757/CCUG 47503/CIP 107916/JCM 16776/LB37)GN=c2c2PE=1 SV=1
C2c3,翻译自>CEPX01008730.1海洋宏基因组基因组组装TARA_037_MES_0.1-0.22,重叠群TARA_037MES_0.1-0.22scaffold22115_1,全基因组鸟枪序列。
在一些实施方案中,本文提供的任何融合蛋白的引导核苷酸序列-可编程DNA结合蛋白是来自古生菌(archaea)(例如纳古生菌(nanoarchaea))的Cas9,其构成单细胞原核微生物的域和界。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是CasX或CasY,其已经描述于例如Burstein et al.,“New CRISPR-Cas systems from uncultivatedmicrobes.”Cell Res.2017Feb 21.doi:10.1038/cr.2017.21中,其通过引用并入本文。使用基因组分辨的宏基因组学,鉴定了许多CRISPR-Cas系统,包括在生命的古生菌域中首次报告的Cas9。这种趋异的Cas9蛋白在纳古生菌中作为活性CRISPR-Cas系统的一部分发现。在细菌中,发现了两个以前未知的系统,CRISPR-CasX和CRISPR-CasY,它们在迄今发现的最紧凑的系统中。在一些实施方案中,Cas9是指CasX或CasX的变体。在一些实施方案中,Cas9是指CasY或CasY的变体。应当理解,其他RNA引导的DNA结合蛋白可以用作引导核苷酸序列-可编程DNA结合蛋白,并且在本公开的范围内。
在一些实施方案中,本文提供的任何融合蛋白的引导核苷酸序列-可编程DNA结合蛋白是CasX或CasY蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是CasX蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是CasY蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白包含与天然存在的CasX或CasY蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白是天然存在的CasX或CasY蛋白。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白包含与SEQ ID NO:2018-2020的任一个至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。在一些实施方案中,引导核苷酸序列-可编程DNA结合蛋白包含SEQ ID NO:2018-2020的任一个的氨基酸序列。应当理解,根据本公开也可以使用来自其他细菌物种的CasX和CasY。
CasX(uniprot.org/uniprot/F0NN87;uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR相关的Casx蛋白OS=冰岛硫化叶菌(Sulfolobus islandicus)(菌株HVE10/4)GN=SiH_0402 PE=4 SV=1
>tr|F0NH53|F0NH53_SULIR CRISPR相关的蛋白质,Casx OS=冰岛硫化叶菌(菌株REY15A)GN=SiRe_0771 PE=4 SV=1
CasY(ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1CRISPR相关的蛋白质CasY[未培养的Parcubacteria组细菌]
具有降低的PAM排他性(exclusivity)的Cas9域
本公开的一些方面提供具有不同PAM特异性的Cas9域。通常,Cas9蛋白,例如来自酿脓链球菌的Cas9(spCas9),需要规范的NGG PAM序列以结合特定的核酸区域。这可以限制在基因组内编辑期望的碱基的能力。在一些实施方案中,本文提供的碱基编辑融合蛋白可以需要定位于精确的位置处,例如其中靶碱基位于四碱基区域(例如“脱氨基窗口”)内,所述四碱基区域在PAM的上游的约15个碱基。参见Komor,A.C.,et al.,“Programmableediting of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016),其全部内容在此通过引用并入。因此,在一些实施方案中,本文提供的任何融合蛋白可以含有Cas9域,所述Cas9域能够结合不含规范的(例如NGG)PAM序列的核苷酸序列并且具有放松的PAM要求(无PAM(PAMless)的Cas9)。与如SEQ ID NO:1提供的酿脓链球菌Cas9相比,无PAM的Cas9对靶序列表现出增加的活性,所述靶序列在其3’端处不包括规范的PAM(例如NGG),例如活性增加至少5倍、至少10倍、至少50倍、至少100倍、至少500倍、至少1,000倍、至少5,000倍、至少10,000倍、至少50,000倍、至少100,000倍、至少500,000倍或至少1,000,000倍。结合非规范PAM序列的Cas9域已经于本领域中描述并且对于熟练技术人员而言将是显而易见的。例如,结合非规范PAM序列的Cas9域已经描述于Kleinstiver,B.P.,et al.,“Engineered CRISPR-Cas9 nucleases with altered PAMspecificities”Nature523,481-485(2015);和Kleinstiver,B.P.,et al.,“Broadeningthe targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAMrecognition”Nature Biotechnology 33,1293-1298(2015)中;每篇的全部内容在此通过引用并入。还参见美国临时申请62/245828、62/279346、62/311763、62/322178和62/357332,每篇通过引用并入本文。在一些实施方案中,用于本公开中的dCas9或Cas9切口酶可以进一步包含放松PAM要求的突变,例如,对应于SEQ ID NO:1中A262T、K294R、S409I、E480K、E543D、M694I或E1219V的哭变。
在一些实施方案中,Cas9域是来自金黄色葡萄球菌的Cas9域(SaCas9)。在一些实施方案中,SaCas9域是核酸酶活性的SaCas9、核酸酶无活性的SaCas9(SaCas9d)或SaCas9切口酶(SaCas9n)。在一些实施方案中,SaCas9包含氨基酸序列SEQ ID NO:2021。在一些实施方案中,SaCas9包含SEQ ID NO:2021的N579X突变或本文公开的任何Cas9蛋白中提供的任何氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中的相应的突变,其中X是除N之外的任何氨基酸。在一些实施方案中,SaCas9包含SEQ ID NO:2021的N579A突变或SEQ IDNO:1-260、2004或2006中提供的任何氨基酸序列中的相应的突变。在一些实施方案中,SaCas9域、SaCas9d域或SaCas9n域可以结合具有非规范PAM的核酸序列。在一些实施方案中,SaCas9域、SaCas9d域或SaCas9n域可以结合具有NNGRRT PAM序列的核酸序列。在一些实施方案中,SaCas9域包含SEQ ID NO:2021的E781X、N967X和R1014X突变的一个或多个,或本文提供的任何Cas9氨基酸序列中(包括但不限于SEQ ID NO:1-260、2004或2006中)相应的突变,其中X是任何氨基酸。在一些实施方案中,SaCas9域包含SEQ ID NO:2021的E781K、N967K和R1014H突变的一个或多个,或本文提供的任何Cas9氨基酸序列中(包括但不限于SEQ ID NO:1-260、2004或2006中)一个或多个相应的突变。在一些实施方案中,SaCas9域包含SEQ ID NO:2021的E781K、N967K或R1014H突变或本文提供的任何Cas9氨基酸序列中(包括但不限于SEQ ID NO:1-260、2004或2006中)一个或多个相应的突变。
在一些实施方案中,本文提供的任何融合蛋白的Cas9域包含与SEQ ID NO:2021-2024或268的任一个至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9域包含SEQ ID NO:2021-2024或268的任一个的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9域由SEQID NO:2021-2024或268的任一个的氨基酸序列组成。
示例性SaCas9序列
可以将SEQ ID NO:2021的残基N579(其是加下划线且粗体的)突变(例如突变为A579)以产生SaCas9切口酶。
示例性SaCas9d序列
SEQ ID NO:2022的残基A10(其可以从SEQ ID NO:E1的D10突变以产生核酸酶无活性的SaCas9d)是加下划线且粗体的。
示例性SaCas9n序列
SEQ ID NO:2023的残基A579(其可以从SEQ ID NO:2021的N579突变以产生SaCas9切口酶)是加下划线且粗体的。
示例性SaKKH Cas9
SEQ ID NO:2024的残基A579(其可以从SEQ ID NO:2021的N579突变以产生SaCas9切口酶)是加下划线且粗体的。SEQ ID NO:2024的残基K781、K967和H1014(其可以从SEQ IDNO:2021的E781、N967和R1014突变以产生SaKKH Cas9)是加下划线且斜体的。
KKH-nCas9(D10A/E782K/N968K/R1015H)金黄色链球菌Cas9切口酶
在一些实施方案中,Cas9域是来自酿脓链球菌的Cas9域(SpCas9)。在一些实施方案中,SpCas9域是核酸酶活性的SpCas9、核酸酶无活性的SpCas9(SpCas9d)或SpCas9切口酶(SpCas9n)。在一些实施方案中,SpCas9包含氨基酸序列SEQ ID NO:2025。在一些实施方案中,SpCas9包含SEQ ID NO:2025的D9X突变,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变,其中X是除D之外的任何氨基酸。在一些实施方案中,SpCas9包含SEQ ID NO:2025的D9A突变,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变。在一些实施方案中,SpCas9域、SpCas9d域或SpCas9n域可以结合具有非规范PAM的核酸序列。在一些实施方案中,SpCas9域、SpCas9d域或SpCas9n域可以结合具有NGG、NGA或NGCG PAM序列的核酸序列。在一些实施方案中,SpCas9域包含SEQ ID NO:2025的D1134X、R1334X和T1336X突变的一个或多个,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变,其中X是任何氨基酸。在一些实施方案中,SpCas9域包含SEQ ID NO:2025的D1134E、R1334Q和T1336R突变的一个或多个,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变。在一些实施方案中,SpCas9域包含SEQID NO:2025的D1134E、R1334Q和T1336R突变,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变。在一些实施方案中,SpCas9域包含SEQID NO:2025的D1134X、R1334X和T1336X突变的一个或多个,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变,其中X是任何氨基酸。在一些实施方案中,SpCas9域包含SEQ ID NO:2025的D1134V、R1334Q和T1336R突变的一个或多个,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变。在一些实施方案中,SpCas9域包含SEQ ID NO:2025的D1134V、R1334Q和T1336R突变,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变。在一些实施方案中,SpCas9域包含SEQ ID NO:2025的D1134X、G1217X、R1334X和T1336X突变的一个或多个,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ IDNO:1-260、2004或2006)中相应的突变,其中X是任何氨基酸。在一些实施方案中,SpCas9域包含SEQ ID NO:2025的D1134V、G1217R、R1334Q和T1336R突变的一个或多个,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变。在一些实施方案中,SpCas9域包含SEQ ID NO:2025的D1134V、G1217R、R1334Q和T1336R突变,或本文提供的任何Cas9氨基酸序列(包括但不限于SEQ ID NO:1-260、2004或2006)中相应的突变。
在一些实施方案中,本文提供的任何融合蛋白的Cas9域包含与SEQ ID NO:2025-2029或2000-2002的任一个至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9域包含SEQ ID NO:2025-2029或2000-2002的任一个的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9域由SEQ ID NO:2025-2029或2000-2002的任一个的氨基酸序列组成。
示例性SpCas9
示例性SpCas9n
VRER-Cas9(D1135V/G1218R/R1335E/T1337R)酿脓链球菌Cas9
(单下划线:HNH域;双下划线:RuvC域)VRER-nCas9(D10A/D1135V/G1218R/R1335E/T1337R)酿脓链球菌Cas9切口酶
(单下划线:HNH域;双下划线:RuvC域)
VQR-Cas9(D1135V/R1335Q/T1337R)酿脓链球菌Cas9
(单下划线:HNH域;双下划线:RuvC域)
VQR-nCas9(D10A/D1135V/R1335Q/T1337R)酿脓链球菌Cas9切口酶
(单下划线:HNH域;双下划线:RuvC域)
EQR-Cas9(D1135E/R1335Q/T1337R)酿脓链球菌Cas9
(单下划线:HNH域;双下划线:RuvC域)
EQR-nCas9(D10A/D1135E/R1335Q/T1337R)酿脓链球菌Cas9切口酶
(单下划线:HNH域;双下划线:RuvC域)
下文提供了适用于本文所述的核碱基编辑器中的其他非限制性、示例性Cas9变体(包括具有替代PAM要求的dCas9、Cas9切口酶和Cas9变体)及其各自的序列。
嗜热链球菌CRISPR1 Cas9(StlCas9)切口酶(D9A)
嗜热链球菌CRISPR3Cas9(St3Cas9)切口酶(D10A)
脱氨酶域
在一些实施方案中,用于本公开的核碱基编辑器包含:(i)引导核苷酸序列-可编程DNA结合蛋白域;和(ii)脱氨酶域。在一些实施方案中,融合蛋白的脱氨酶域是胞嘧啶脱氨酶。在一些实施方案中,脱氨酶是APOBEC1脱氨酶。在一些实施方案中,脱氨酶是大鼠APOBEC1。在一些实施方案中,脱氨酶是人APOBEC1。在一些实施方案中,脱氨酶是APOBEC2脱氨酶。在一些实施方案中,脱氨酶是APOBEC3A脱氨酶。在一些实施方案中,脱氨酶是APOBEC3B脱氨酶。在一些实施方案中,脱氨酶是APOBEC3C脱氨酶。在一些实施方案中,脱氨酶是APOBEC3D脱氨酶。在一些实施方案中,是APOBEC3F脱氨酶。在一些实施方案中,脱氨酶是APOBEC3G脱氨酶。在一些实施方案中,脱氨酶是APOBEC3H脱氨酶。在一些实施方案中,脱氨酶是APOBEC4脱氨酶。在一些实施方案中,脱氨酶是激活诱导的脱氨酶(AID)。在一些实施方案中,脱氨酶是七鳃鳗(Lamprey)CDA1(pmCDA1)。在一些实施方案中,脱氨酶是人APOBEC3G或其功能性片段。在一些实施方案中,脱氨酶是包含对应于人APOBEC3G中D316R/D317R突变的突变的APOBEC3G变体。可以根据本公开的方法使用的示例性、非限制性胞嘧啶脱氨酶序列在下面的实施例1中提供。
在一些实施方案中,胞嘧啶脱氨酶是野生型脱氨酶或如SEQ ID NO:271-292和303中所示的脱氨酶。在一些实施方案中,本文提供的融合蛋白的胞嘧啶脱氨酶域包括脱氨酶的片段和与脱氨酶同源的蛋白质。例如,在一些实施方案中,脱氨酶域可以包含如SEQ IDNO:271-292和303的任一个中所示的氨基酸序列的片段。在一些实施方案中,脱氨酶域包含与SEQ ID NO:271-292和303的任一个中所示的氨基酸序列同源的氨基酸序列或与SEQ IDNO:271-292和303的任一个中所示的氨基酸序列的片段同源的氨基酸序列。在一些实施方案中,包含脱氨酶、脱氨酶的片段或脱氨酶的同源物或脱氨酶的蛋白质称为“脱氨酶变体”。脱氨酶变体与脱氨酶或其片段共享同源性。例如,脱氨酶变体与野生型脱氨酶或如SEQ IDNO:271-292和303的任一个中所示的脱氨酶至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%。在一些实施方案中,脱氨酶变体包含脱氨酶的片段,使得该片段与野生型脱氨酶或如SEQ ID NO:271-292和303的任一个中所示的脱氨酶的相应的片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%。在一些实施方案中,胞嘧啶脱氨酶与如SEQ ID NO:291或SEQ ID NO:292中所示的APOBEC3G变体至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同,并且包含对应于SEQ ID NO:290中D316E/D317R突变的突变。
在一些实施方案中,胞嘧啶脱氨酶域与引导核苷酸序列-可编程DNA结合蛋白域的N端融合。例如,融合蛋白可以具有NH2-[胞嘧啶脱氨酶]-[引导核苷酸序列-可编程DNA结合蛋白域]-COOH的构造。上面的一般体系构造中使用的“]-[”表示存在可选的接头序列。如本文所用,术语“接头”是指连接两个分子或部分,例如融合蛋白的两个域,诸如例如dCas9域和胞嘧啶脱氨酶域的化学基团或分子。通常,接头位于两个基团、分子或其他部分之间或侧翼有两个基团、分子或其他部分,并且经由共价键与每一个连接,从而连接两者。在一些实施方案中,接头是一个氨基酸或多个氨基酸(例如肽或蛋白质)。在一些实施方案中,接头是有机分子、基团、聚合物或化学部分。在一些实施方案中,接头的长度为5-100个氨基酸,例如长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也考虑了更长或更短的接头。
在一些实施方案中,胞嘧啶脱氨酶域和Cas9域经由接头彼此融合。可以采用胞嘧啶脱氨酶域(例如APOBEC1)和Cas9域之间的各种接头长度和柔性度(例如,范围为从形式(GGGS)n(SEQ ID NO:1998)、(GGGGS)n(SEQ ID NO:308)、(GGS)n和(G)n的非常柔性接头至形式(EAAAK)n(SEQ ID NO:309)、SGSETPGTSESATPES(SEQ ID NO:310)(参见例如Guilingeret,al.,Nat.Biotechnol.2014;32(6):577-82;全部内容通过引用并入本文)、(XP)n的更刚性接头,或任何这些的组合,其中X是任何氨基酸并且n独立地是1至30之间的整数,以便实现对于特定应用的脱氨酶活性的最佳长度。在一些实施方案中,n独立地是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30,或者若存在超过一个接头或超过一个接头基序,则为其任何组合。在一些实施方案中,接头包含(GGS)n基序,其中n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,接头包含(GGS)n基序,其中n是1、3或7。在一些实施方案中,接头包含氨基酸序列SGSETPGTSESATPES(SEQ ID NO:310),也称为XTEN接头。在一些实施方案中,接头包含选自下组的氨基酸序列,其包括但不限于AGVF、GFLG、FK、AL、ALAL或ALALA。在一些实施方案中,合适的接头基序和配置包括描述于Chen et al.,Fusion protein linkers:property,design and functionality.Adv Drug Deliv Rev.2013;65(10):1357-69(其通过引用并入本文)中的那些。在一些实施方案中,接头可以包含任何以下氨基酸序列:VPFLLEPDNINGKTC(SEQ ID NO:311)、GSAGSAAGSGEF(SEQ ID NO:312)、SIVAQLSRPDPA(SEQID NO:313)、MKIIEQLPSA(SEQ ID NO:314)、VRHKLKRVGS(SEQ ID NO:315)、GHGTGSTGSGSS(SEQ ID NO:316)、MSRPDPA(SEQ ID NO:317)、GSAGSAAGSGEF(SEQ ID NO:312)、SGSETPGTSESA(SEQ ID NO:318)、SGSETPGTSESATPEGGSGGS(SEQ ID NO:319)或GGSM(SEQ IDNO:320)。基于本公开内容,其他合适的接头序列对于本领域技术人员而言将是显而易见的。
为了成功编辑所期望的靶C碱基,可以优化Cas9和APOBEC之间的接头,如Komoretal.,Nature,533,420-424(2016)中所述,其通过引用并入本文。用于碱基编辑的编号方案基于在DNA结合域(例如Cas9、nCas9、dCas9)结合基因组位点时发生的由可编程引导RNA序列置换的DNA的单链段(R-环)内靶C的预测位置(见图6)。方便地,紧绕靶C的序列也与引导RNA的序列匹配。用于碱基编辑的编号方案基于标准的20聚体可编程序列,并将位置“21”定义为PAM序列的第一个DNA碱基,导致位置“1”分配给与20聚体可编程引导RNA序列的5’末端匹配的第一个DNA碱基。因此,对于所有Cas9变体,位置“21”被定义为PAM序列(例如NGG、NGAN、NGNG、NGAG、NGCG、NNGRRT、NGRRN、NNNRRT、NNNGATT、NNAGAA、NAAAC)的第一个碱基。当使用较长的可编程引导RNA序列(例如21聚体)时,5’-末端碱基被分配为从“-1”开始的递减负数。对于与PAM序列的位置不同或不需要PAM序列的其他DNA结合域,可编程引导RNA序列用作编号的参考。3-aa接头给出2-5碱基编辑窗口(例如,相对于位置21处的PAM序列的位置2、3、4或5)。9-aa接头给出3-6碱基编辑窗口(例如,相对于位置21处的PAM序列的位置3、4、5或6)。16-aa接头(例如SGSETPGTSESATPES(SEQ ID NO:310)接头)给出4-7碱基编辑窗口(例如,相对于位置21处的PAM序列的位置4、5、6或7)。21-aa接头给出5-8碱基编辑窗口(例如,相对于位置21处的PAM序列的位置5、6、7、8)。这些窗口的每一个都可以用于编辑不同的靶定的C碱基。例如,靶定的C碱基可以处于与相邻PAM序列不同的距离,并且通过改变接头长度,确保了所期望的C碱基的精确编辑。基于CRISPR/Cas9技术的教导,特别是美国临时申请U.S.S.N.62/245828、62/279346、62/311,763、62/322178、62/357352、62/370700和62/398490,以及Komor et al.,Nature,Programmable editing of a target base ingenomic DNA without double-stranded DNA cleavage,533,420-424(2016)(每篇通过引用并入本文)的教导,本领域技术人员将能够为他/她的目的确定编辑的窗口,并且适当地设计胞嘧啶脱氨酶-dCas9蛋白的接头以精确靶向期望的C碱基。
为了成功编辑所期望的靶C碱基,可以选择适当的Cas9域附接到脱氨酶域(例如APOBEC1),这是因为不同的Cas9域可以导致不同的编辑窗口,如美国临时申请U.S.S.N.62/245,828,62/279,346,62/311,763,62/322,178,62/357,352,62/370,700和62/398,490,以及Komor et al.,Nature,533,420-424(2016)中所述,每篇通过引用并入本文。例如,APOBEC1-XTEN-SaCas9n-UGI给出1-12碱基编辑窗口(例如,相对于位置20-26中的NNNRRTPAM序列的位置1、2、3、4、5、6、7、8、9、10、11或12)。基于CRISPR/Cas9技术的教导,本领域技术人员将能够为他/她的目的确定编辑窗口,并且正确地确定所需的Cas9同源物和与胞嘧啶脱氨酶附接的接头以精确靶向期望的C碱基。
在一些实施方案中,用于本公开的融合蛋白进一步包含尿嘧啶糖基化酶抑制剂(UGI)域。“尿嘧啶糖基化酶抑制剂”是指抑制尿嘧啶-DNA糖基化酶的活性的蛋白质。由脱氨基诱导的C至T碱基变化导致U∶G异源双链体,其引发细胞DNA修复反应。尿嘧啶DNA糖基化酶(UDG)催化从细胞中的DNA中去除U并启动碱基切除修复,将U∶G对回复突变为C∶G对作为最常见的结果。因此,此类细胞DNA修复反应可能是细胞中核碱基编辑效率降低的原因。尿嘧啶DNA糖基化酶抑制剂(UGI)在本领域中已知有效阻断人UDG活性。如Komor et al.,Nature(2016)中所述,将UGI域与胞苷脱氨酶-dCas9融合蛋白融合降低了UDG的活性并显著提高了编辑效率。
本文提供了合适的UGI蛋白和核苷酸序列,并且另外的合适的UGI序列是本领域技术人员已知的,并且包括例如Wang et al.,Uracil-DNA glycosylase inhibitor gene ofbacteriophage PBS2 encodes a binding protein specific for uracil-DNAglycosylase.J.Biol.Chem.264:1163-1171(1989);Lundquist et al.,Site-directedmutagenesis and characterization of uracil-DNA glycosylase inhibitorprotein.Role of specific carboxylic amino acids in complex formation withEscherichia coli uracil-DNA glycosylase.J.Biol.Chem.272:21408-21419(1997);Ravishankar et al.,X-ray analysis of a complex of Escherichia coli uracil DNAglycosylase(EcUDG)with a proteinaceous inhibitor.The structure elucidation ofa prokaryotic UDG.Nucleic Acids Res.26:4880-4887(1998);和Putnam et al.,Protein mimicry of DNA from crystal structures of the uracil-DNA glycosylaseinhibitor protein and its complex with Escherichia coli uracil-DNAglycosylase.J.Mol.Biol.287:331-346(1999)中发表的那些,每篇通过引用并入本文。在一些实施方案中,UGI包含以下氨基酸序列:
芽孢杆菌噬菌体PBS2(噬菌体PBS2)尿嘧啶-DNA糖基化酶抑制剂
在一些实施方案中,UGI蛋白包含野生型UGI或如SEQ ID NO:304中所示的UGI。在一些实施方案中,用于本公开的UGI蛋白包括UGI的片段和与UGI或UGI片段同源的蛋白质。例如,在一些实施方案中,UGI包含SEQ ID NO:304中所示的氨基酸序列的片段。在一些实施方案中,UGI包含与SEQ ID NO:304中所示的氨基酸序列同源的氨基酸序列,或与SEQ IDNO:304中所示的氨基酸序列的片段同源的氨基酸序列。在一些实施方案中,包含UGI或UGI的片段或者UGI或UGI片段的同源物的蛋白质称为“UGI变体”。UGI变体与UGI或其片段共享同源性。例如UGI变体与野生型UGI或如SEQ ID NO:304中所示的UGI至少70%相同、至少80%相同、至少90%相同、至少95%相同、至少96%相同、至少97%相同、至少98%相同、至少99%相同、至少99.5%相同或至少99.9%。在一些实施方案中,UGI变体包含UGI的片段,使得片段与野生型UGI或如SEQ ID NO:304中所示的UGI的相应的片段至少70%相同、至少80%相同、至少90%相同、至少95%相同、至少96%相同、至少97%相同、至少98%相同、至少99%相同、至少99.5%相同或至少99.9%。
应当理解,另外的蛋白质可以是尿嘧啶糖基化酶抑制剂。例如,其他能够抑制(例如空间阻断)尿嘧啶DNA糖基化酶碱基切除修复酶的蛋白质在本公开的范围内。在一些实施方案中,尿嘧啶糖基化酶抑制剂是结合DNA的蛋白质。在一些实施方案中,尿嘧啶糖基化酶抑制剂是结合单链DNA的蛋白质。例如,尿嘧啶糖基化酶抑制剂可以是塔斯曼尼亚欧文氏菌(Erwinia tasmaniensis)单链结合蛋白。在一些实施方案中,单链结合蛋白包含氨基酸序列(SEQ ID NO:305)。在一些实施方案中,尿嘧啶糖基化酶抑制剂是结合尿嘧啶的蛋白质。在一些实施方案中,尿嘧啶糖基化酶抑制剂是结合DNA中尿嘧啶的蛋白质。在一些实施方案中,尿嘧啶糖基化酶抑制剂是催化无活性的尿嘧啶DNA糖基化酶蛋白。在一些实施方案中,尿嘧啶糖基化酶抑制剂是不从DNA切除尿嘧啶的催化无活性的尿嘧啶DNA糖基化酶蛋白。例如,尿嘧啶糖基化酶抑制剂是UdgX。在一些实施方案中,UdgX包含氨基酸序列(SEQ ID NO:306)。作为另一个实例,尿嘧啶糖基化酶抑制剂是催化无活性的UDG。在一些实施方案中,催化无活性的UDG包含氨基酸序列(SEQ ID NO:307)。应当理解,其他尿嘧啶糖基化酶抑制剂对于本领域技术人员而言将是显而易见的,并且在本公开的范围内。在一些实施方案中,融合蛋白包含引导核苷酸序列-可编程DNA结合蛋白、胞苷脱氨酶域、Gam蛋白和UGI域。在一些实施方案中,本文提供的包含引导核苷酸序列-可编程DNA结合蛋白(例如Cas9域)、胞苷脱氨酶和Gam蛋白的任何融合蛋白可以进一步与UGI域直接地或经由接头融合。该公开还考虑了包含与胞苷脱氨酶融合的Cas9切口酶-核酸编辑域和Gam蛋白的融合蛋白,其进一步与UGI域融合。
塔斯曼尼亚欧文氏菌SSB(热稳定性单链DNA结合蛋白)
UdgX(与DNA中的尿嘧啶结合但不切除)
UDG(催化无活性的人UDG,与DNA中的尿嘧啶结合但不切除)
在一些实施方案中,UGI域与融合蛋白中dCas9域的C端融合。因此,融合蛋白将具有NH2-[胞嘧啶脱氨酶]-[引导核苷酸序列-可编程DNA结合蛋白域]-[UGI]-COOH的构造。在一些实施方案中,UGI域与胞嘧啶脱氨酶域的N端融合。因此,融合蛋白将具有NH2-[UGI]-[胞嘧啶脱氨酶]-[引导核苷酸序列-可编程DNA结合蛋白域]-COOH的构造。在一些实施方案中,UGI域融合在引导核苷酸序列-可编程DNA结合蛋白域和胞嘧啶脱氨酶域之间。因此,融合蛋白将具有NH2-[胞嘧啶脱氨酶]-[UGI]-[引导核苷酸序列-可编程DNA结合蛋白域]-COOH的构造。本文所述的接头序列也可以用于UGI域与胞嘧啶脱氨酶-dCas9融合蛋白的融合。
在一些实施方案中,融合蛋白包含结构:
[胞嘧啶脱氨酶]-[任选的接头序列]-[引导核苷酸序列-可编程DNA结合蛋白]-[任选的接头序列]-[UGI];
[胞嘧啶脱氨酶]-[任选的接头序列]-[UGI]-[任选的接头序列]-[引导核苷酸序列-可编程DNA结合蛋白];
[UGI]-[任选的接头序列]-[胞嘧啶脱氨酶]-[任选的接头序列]-[引导核苷酸序列-可编程DNA结合蛋白];
[UGI]-[任选的接头序列]-[引导核苷酸序列-可编程DNA结合蛋白]-[任选的接头序列]-[胞嘧啶脱氨酶];
[引导核苷酸序列-可编程DNA结合蛋白]-[任选的接头序列]-[胞嘧啶脱氨酶]-[任选的接头序列]-[UGI];或
[引导核苷酸序列-可编程DNA结合蛋白]-[任选的接头序列]-[UGI]-[任选的接头序列]-[胞嘧啶脱氨酶]。
在一些实施方案中,融合蛋白包含结构:
[胞嘧啶脱氨酶]-[任选的接头序列]-[Cas9切口酶]-[任选的接头序列]-[UGI];
[胞嘧啶脱氨酶]-[任选的接头序列]-[UGI]-[任选的接头序列]-[Cas9切口酶];
[UGI]-[任选的接头序列]-[胞嘧啶脱氨酶]-[任选的接头序列]-[Cas9切口酶];
[UGI]-[任选的接头序列]-[Cas9切口酶]-[任选的接头序列]-[胞嘧啶脱氨酶];
[Cas9切口酶]-[任选的接头序列]-[胞嘧啶脱氨酶]-[任选的接头序列]-[UGI];或
[Cas9切口酶]-[任选的接头序列]-[UGI]-[任选的接头序列]-[胞嘧啶脱氨酶]。
在一些实施方案中,本文提供的融合蛋白进一步包含核定位序列(NLS)。在一些实施方案中,NLS与融合蛋白的N端融合。在一些实施方案中,NLS与融合蛋白的C端融合。在一些实施方案中,NLS与UGI蛋白的N端融合。在一些实施方案中,NLS与UGI蛋白的C端融合。在一些实施方案中,NLS与引导核苷酸序列-可编程DNA结合蛋白域的N端融合。在一些实施方案中,NLS与引导核苷酸序列-可编程DNA结合蛋白域的C端融合。在一些实施方案中,NLS与胞嘧啶脱氨酶的N端融合。在一些实施方案中,NLS与脱氨酶的C端融合。在一些实施方案中,NLS经由一个或多个接头与融合蛋白融合。在一些实施方案中,NLS在没有接头的情况下与融合蛋白融合。非限制性、示例性NLS序列可以是PKKKRKV(SEQ ID NO:1988)或MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(SEQ ID NO:1989)。
本公开的一些方面提供与引导核苷酸序列(例如引导RNA或gRNA)缔合的本文所述的核碱基编辑器。gRNA可以作为两个或更多个RNA的复合物或者作为单个RNA分子存在。作为单个RNA分子存在的gRNA可以称为单引导RNA(sgRNA),尽管“gRNA”可互换使用以指作为单个分子或作为两个或更多个分子的复合物存在的引导RNA。通常,作为单一RNA种类存在的gRNA包含两个域:(1)与靶核酸共享同源性(例如,并指导Cas9复合物与靶物的结合)的域;和(2)结合Cas9蛋白的域。在一些实施方案中,域(2)对应已知为tracrRNA的序列,并且包含茎-环结构。例如,在一些实施方案中,域(2)与如Jinek et al.,Science 337:816-821(2012)中提供的tracrRNA相同或同源,其通过引用并入本文。gRNA的其他实例(例如包括域2的那些)可以在2013年9月6日提交的题为“Switchable Cas9 Nucleases And UsesThereof”的美国临时专利申请U.S.S.N.61/874,682和2013年9月6号提交的题为“DeliverySystem For Functional Nucleases”的美国临时专利申请U.S.S.N.61/874,746中找到,每篇以其整体在此通过引用并入。gRNA包含与靶位点互补的核苷酸序列,其介导核酸酶/RNA复合物与所述靶位点的结合,提供了核酸酶:RNA复合物的序列特异性。原则上,这些蛋白质能够被靶向到由引导RNA规定的任何序列。使用RNA可编程核酸酶如Cas9进行位点特异性切割(例如,以修饰基因组)的方法是本领域已知的(参见例如Cong,L.et al.Science 339,819-823(2013);Mali,P.et al.Science 339,823-826(2013);Hwang,W.Y.et al.Naturebiotechnology 31,227-229(2013);Jinek,M.et al.eLife 2,e00471(2013);Dicarlo,J.E.et al.Nucleic acids research(2013);Jiang,W.et al.Nature biotechnology 31,233-239(2013);每篇通过引用并入本文)。特别地,可以用于将本公开的融合蛋白靶向其靶序列以使靶C碱基脱氨基的引导核苷酸序列(例如sgRNA)的实例描述于Komor et al.,Nature,533,420-424(2016)中,其通过引用并入本文。
引导核苷酸序列(例如sgRNA)的特定结构取决于其靶序列和靶序列下游的PAM序列的相对距离。本领域技术人员将理解,没有给出引导核苷酸序列的统一结构,因为对于每个靶定以脱氨基的C,靶序列是不同的。
然而,本公开提供了如何设计引导核苷酸序列(例如sgRNA)的指导,使得本领域技术人员可以将此类教导用于感兴趣的靶序列。gRNA通常包含允许Cas9结合的tracrRNA框架和引导序列,其赋予本文公开的融合蛋白序列特异性。在一些实施方案中,引导RNA包含结构5’-[引导序列]-tracrRNA-3’。非限制性、示例性tracrRNA序列示于表17中。
表17 TracrRNA直向同源物和序列
gRNA的引导序列包含与靶序列互补的序列。引导序列通常约20个核苷酸长。例如,引导序列可以是15-25个核苷酸长。在一些实施方案中,引导序列是15、16、17、18、19、20、21、22、23、24或25个核苷酸长。在一些实施方案中,引导序列超过25个核苷酸长。此类合适的引导RNA序列通常包含与待编辑的靶核苷酸的上游或下游50个核苷酸内的核酸序列互补的引导序列。
在一些实施方案中,引导RNA约15-100个核苷酸长并且包含与靶序列互补的至少10个连续核苷酸的序列。在一些实施方案中,引导RNA是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸长。在一些实施方案中,引导RNA包含与靶序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的序列。
为了使用本文所述的方法编辑LDLR介导的胆固醇清除途径中的基因,将核碱基编辑器和/或引导核苷酸序列引入到编辑发生的细胞(例如,肝细胞)中。在一些实施方案中,将编码核碱基编辑器和/或引导核苷酸序列的核酸分子(例如表达载体)递送到细胞中,导致细胞中核碱基编辑器和/或引导核苷酸序列的共表达。编码核碱基编辑器和/或引导核苷酸序列的核酸分子可以使用本领域任何已知的方法递送到细胞中,例如转染(例如由阳离子脂质体介导的转染)、转导(例如经由病毒感染)和电穿孔。在一些实施方案中,分离的核碱基编辑器/gRNA复合物得以递送。将分离的蛋白质递送至细胞的方法是本领域技术人员熟悉的。例如,与gRNA复合的分离的核碱基编辑器与超荷电的、细胞穿透蛋白质或肽缔合,这促进其进入细胞(例如,如PCT申请公开WO2010129023和美国专利申请公开US20150071906中所述,通过引用并入本文)。在一些实施方案中,分离的核碱基编辑器与gRNA的复合物可以通过阳离子转染试剂递送,例如来自Thermofisher Scientific的Lipofectamine CRISPRMAX Cas9转染试剂。在一些实施方案中,核碱基编辑器和gRNA可以分开递送。本领域技术人员熟悉递送核酸分子或分离的蛋白质的方法。
包含Gam的融合蛋白
本公开的一些方面提供包含Gam蛋白的融合蛋白。本公开的一些方面提供进一步包含Gam蛋白的碱基编辑器。碱基编辑器在本领域中是已知的并且已在先前描述,例如于2015年6月18日公布的美国专利申请公开号:US-2015-0166980;2015年6月18日公布的US-2015-0166981;2015年6月18日公布的US-2015-0166984;2015年6月18日公布的US-2015-01669851;2016年10月20日公布的US-2016-0304846;2017年5月4日公布的US-2017-0121693-A1;以及2015年6月18日公布的PCT申请公开号:WO 2015/089406;和2017年4月27日公布的WO 2017/070632中;每篇的全部内容在此通过引用并入。基于本公开,技术人员将理解如何制备和使用进一步包含Gam蛋白的碱基编辑器。
在一些实施方案中,本公开提供包含引导核苷酸序列-可编程DNA结合蛋白和Gam蛋白的融合蛋白。在一些实施方案中,本公开提供包含胞苷脱氨酶域和Gam蛋白的融合蛋白。在一些实施方案中,本公开提供包含UGI域和Gam蛋白的融合蛋白。在一些实施方案中,本公开提供包含引导核苷酸序列-可编程DNA结合蛋白、胞苷脱氨酶域和Gam蛋白的融合蛋白。在一些实施方案中,本公开提供包含引导核苷酸序列-可编程DNA结合蛋白、胞苷脱氨酶域Gam蛋白和UGI域的融合蛋白。
在一些实施方案中,Gam蛋白是与DNA中双链断裂结合并在双链断裂处阻止或抑制DNA降解的蛋白质。在一些实施方案中,Gam蛋白由噬菌体Mu编码,其与DNA中的双链断裂结合。不希望受任何特定理论的束缚,Mu在细菌基因组之间转座(transpose)自身并使用Gam以保护转座过程中的双链断裂。Gam可以用于阻断与姐妹染色体的同源重组以修复双链断裂,有时导致细胞死亡。暴露于UV的细胞的存活对于细胞表达Gam和其中recB突变的细胞是相似的。这表明Gam阻断了DNA修复(Cox,2013)。因此,Gam蛋白可以促进Cas9介导的杀伤(Cui et al.,2016)。GamGFP用于标记双链断裂,尽管这在真核细胞中可能很难,因为Gam蛋白与相似的真核蛋白Ku竞争(Shee et al.,2013)。
Gam与参与非同源DNA末端接合的两种真核蛋白Ku70和Ku80有关(Cui et al.,2016)。Gam与Ku的两个亚基(Ku70和Ku80)具有序列同源性,并且可以具有与Ku的核心DNA结合区域相似的结构。Mu Gam的直向同源物存在于流感嗜血杆菌(Haemophilusinfluenzae)、伤寒沙门氏菌(Salmonella typhi)、脑膜炎奈瑟氏球菌和大肠杆菌的肠出血性O157:H7菌株的细菌基因组中(d’Adda di Fagagna et al.,2003)。Gam蛋白先前已得以描述,例如,在Cox,Proteins pinpoint double strand breaks.eLife.2013;2:e01561.;Cui et al.,Consequences of Cas9 cleavage in the chromosome of Escherichiacoli.Nucleic Acids Res.2016May 19;44(9):4243-51.doi:10.1093/nar/gkw223.Epub2016Apr 8.;d’Adda di Fagana et al.,The Gam protein of bacteriophage Mu is anorthologue of eukaryotic Ku.EMBO Rep.2003Jan;4(1):47-52.;和Shee et al.,Engineered proteins detect spontaneous DNA breakage in human and bacterialcells.Elife.2013Oct 29;2:e01222.doi:10.7554/eLife.01222中;每篇的内容通过引用并入本文。
在一些实施方案中,Gam蛋白是结合DNA中双链断裂并在双链断裂处阻止或抑制DNA降解的蛋白质。在一些实施方案中,Gam蛋白是来自任何生物体(例如细菌),例如本文提供的任何生物体的天然存在的Gam蛋白。在一些实施方案中,Gam蛋白是来自生物体的天然存在的Gam蛋白的变体。在一些实施方案中,Gam蛋白在自然界中不存在。在一些实施方案中,Gam蛋白与天然存在的Gam蛋白至少50%、至少55%、至少60%、至少65%、至少70%、至少75%至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,Gam蛋白与本文提供的任何Gam蛋白(例如SEQ IDNO:2030)至少50%、至少55%、至少60%、至少65%、至少70%、至少75%至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。以下提供示例性Gam蛋白。在一些实施方案中,Gam蛋白包含SEQ ID NO:2030-2058的任一个的氨基酸序列。在一些实施方案中,Gam蛋白是本文提供的任何Gam蛋白的经截短的形式。在一些实施方案中,经截短的Gam蛋白相对于全长Gam蛋白缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个N端氨基酸残基。在一些实施方案中,经截短的Gam蛋白相对于全长Gam蛋白缺少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20个C端氨基酸残基。在一些实施方案中,Gam蛋白不包含N端甲硫氨酸。
在一些实施方案中,Gam蛋白包含与本文提供的任何Gam蛋白至少60%、65%、70%、75%、80%、85%、90%、95、98%、99%或99.5%相同的氨基酸序列。在一些实施方案中,Gam蛋白包含与本文提供的任何Gam蛋白相比,具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变的氨基酸序列。在一些实施方案中,Gam蛋白包含与本文提供的任何Gam蛋白相比,具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的连续氨基酸残基的氨基酸序列。在一些实施方案中,Gam蛋白包含本文提供的任何Gam蛋白的氨基酸序列。在一些实施方案中,Gam蛋白由SEQ ID NO:2030-2058的任一个的氨基酸序列组成。
来自噬菌体Mu的Gam
>WP_001107930.1多物种:宿主-核酸酶抑制剂蛋白Gam[肠杆菌科(Enterobacteriaceae)]
>CAA27978.1未命名的蛋白质产物[埃希氏菌(Escherichia)病毒Mu]
>WP_001107932.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]
>WP_061335739.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]
>WP_001107937.1多物种:宿主-核酸酶抑制剂蛋白Gam[肠杆菌科]>EJL11163.1噬菌体Mu Gam样家族蛋白质[宋氏志贺氏菌(Shigella sonnei)Moseley株]>CSO81529.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>OCE38605.1宿主-核酸酶抑制剂蛋白Gam[宋氏志贺氏菌]>SJK50067.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJK19110.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SIY81859.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJJ34359.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJK07688.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJI95156.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SIY86865.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJJ67303.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJJ18596.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SIX52979.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJD05143.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJD37118.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJE51616.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]
>WP_001107930.1多物种:宿主-核酸酶抑制剂蛋白Gam[肠杆菌科]
>CAA27978.1未命名的蛋白质产物[埃希氏菌病毒Mu]
>WP_001107932.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]
>WP_061335739.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]
>WP_089552732.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]
>WP_042856719.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]>CDL02915.1推定宿主-核酸酶抑制剂蛋白质[大肠杆菌IS35]
>WP_001129704.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]>EDU62392.1噬菌体MuGam样蛋白质[大肠杆菌53638]
>WP_001107936.1多物种:宿主-核酸酶抑制剂蛋白Gam[肠杆菌科]>EGI94970.1宿主-核酸酶抑制剂蛋白Gam[鲍氏志贺氏菌(Shigella boydii)5216-82]>CSR34065.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>CSQ65903.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>CSQ94361.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJK23465.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJB59111.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJI55768.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJI56601.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJJ20109.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJJ54643.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJI29650.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SIZ53226.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJA65714.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJJ21793.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJD61405.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJJ14326.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SIZ57861.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJD58744.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJD84738.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJJ51125.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJD01353.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJE63176.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]
>WP_050939550.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]>KNF77791.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]
>WP_085334715.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]>OSC16757.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]
>WP_065226797.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]>ANO88858.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]>ANO89006.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]
>WP_032239699.1宿主-核酸酶抑制剂蛋白Gam[大肠杆菌]>KDU26235.1噬菌体MuGam样家族蛋白质[大肠杆菌3-373-03_S4_C2]>KDU49057.1噬菌体Mu Gam样家族蛋白质[大肠杆菌3-373-03_S4_C1]>KEL21581.1噬菌体Mu Gam样家族蛋白质[大肠杆菌3-373-03_S4_C3]
>WP_080172138.1宿主-核酸酶抑制剂蛋白Gam[肠沙门氏菌(Salmonellaenterica)]
>WP_077134654.1宿主-核酸酶抑制剂蛋白Gam[宋氏志贺氏菌]>SIZ51898.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]>SJK07212.1宿主-核酸酶抑制剂蛋白质[宋氏志贺氏菌]
>WP_000261565.1宿主-核酸酶抑制剂蛋白Gam[弗氏志贺氏菌(Shigellaflexneri)]>EGK20651.1宿主-核酸酶抑制剂蛋白Gam[弗氏志贺氏菌K-272]>EGK34753.1宿主-核酸酶抑制剂蛋白Gam[弗氏志贺氏菌K-227]
>ASG63807.1宿主-核酸酶抑制剂蛋白Gam[佐治亚克吕沃尔氏菌(Kluyverageorgiana)]
>WP_078000363.1宿主-核酸酶抑制剂蛋白Gam[迟钝爱德华氏菌(Edwardsiellatarda)]
>WP_047389411.1宿主-核酸酶抑制剂蛋白Gam[弗氏柠檬酸杆菌(Citrobacterfreundii)]>KGY86764.1宿主-核酸酶抑制剂蛋白Gam[弗氏柠檬酸杆菌]>OIZ37450.1宿主-核酸酶抑制剂蛋白Gam[弗氏柠檬酸杆菌]
>WP_058215121.1宿主-核酸酶抑制剂蛋白Gam[肠沙门氏菌]>KSU39322.1宿主-核酸酶抑制剂蛋白Gam[肠沙门氏菌肠亚种(subsp.enterica)]>OHJ24376.1宿主-核酸酶抑制剂蛋白Gam[肠沙门氏菌]>ASG15950.1宿主-核酸酶抑制剂蛋白Gam[肠沙门氏菌肠亚种血清型Macclesfield str.S-1643]
>WP_016533308.1噬菌体宿主-核酸酶抑制剂蛋白Gam[多杀巴斯德氏菌(Pasteurella multocida)]>EPE65165.1噬菌体宿主-核酸酶抑制剂蛋白Gam[多杀巴斯德氏菌P1933]>ESQ71800.1宿主-核酸酶抑制剂蛋白Gam[多杀巴斯德氏菌多杀亚种(subsp.multocida)P1062]>ODS44103.1宿主-核酸酶抑制剂蛋白Gam[多杀巴斯德氏菌]>OPC87246.1宿主-核酸酶抑制剂蛋白Gam[多杀巴斯德氏菌多杀亚种]>OPC98402.1宿主-核酸酶抑制剂蛋白Gam[多杀巴斯德氏菌多杀亚种]
>WP_005577487.1宿主-核酸酶抑制剂蛋白Gam[伴放线菌聚集菌(Aggregatibacter actinomycetemcomitans)]>EHK90561.1噬菌体宿主-核酸酶抑制剂蛋白Gam[伴放线菌聚集菌RhAA1]>KNE77613.1宿主-核酸酶抑制剂蛋白Gam[伴放线菌聚集菌RhAA1]
>WP_090412521.1宿主-核酸酶抑制剂蛋白Gam[嗜盐亚硝化单胞菌(Nitrosomonashalophila)]>SDX89267.1Mu样原噬菌体宿主-核酸酶抑制剂蛋白Gam[嗜盐亚硝化单胞菌]
>WP_077926574.1宿主-核酸酶抑制剂蛋白Gam[Wohlfahrtiimonas larvae]
组合物
本公开的方面涉及可以用于编辑编码PCSK9的多核苷酸的组合物。在一些实施方案中,编辑在体外实施。在一些实施方案中,编辑在培养的细胞中实施。在一些实施方案中,编辑在体内实施。在一些实施方案中,编辑在哺乳动物中实施。在一些实施方案中,哺乳动物是人。在一些实施方案中,哺乳动物可以是啮齿动物。在一些实施方案中,编辑离体实施。
在一些实施方案中,组合物包含:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和(ii)引导核苷酸序列,其将(i)的融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸。在一些实施方案中,(i)的融合蛋白进一步包含Gam蛋白。
在一些实施方案中,组合物包含:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;(ii)引导核苷酸序列,其将(i)的融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸;和(iii)引导核苷酸序列,其将(i)的融合蛋白靶向到编码载脂蛋白C3蛋白的多核苷酸。在一些实施方案中,(i)的融合蛋白进一步包含Gam蛋白。
在一些实施方案中,组合物包含:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;(ii)引导核苷酸序列,其将(i)的融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的核酸分子多核苷酸;(iii)引导核苷酸序列,其将(i)的融合蛋白靶向到编码载脂蛋白C3蛋白的多核苷酸;和(iv)引导核苷酸序列,其将(i)的融合蛋白靶向到编码低密度脂蛋白受体蛋白的核酸分子多核苷酸。在一些实施方案中,(i)的融合蛋白进一步包含Gam蛋白。
在一些实施方案中,组合物包含:(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;(ii)引导核苷酸序列,其将(i)的融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸;(iii)引导核苷酸序列,其将(i)的融合蛋白靶向到编码载脂蛋白C3蛋白的核酸分子多核苷酸;(iv)引导核苷酸序列,其将(i)的融合蛋白靶向到编码低密度脂蛋白受体蛋白的多核苷酸;和(v)引导核苷酸序列,其将(i)的融合蛋白靶向到编码LDL受体的诱导性降解物蛋白的多核苷酸。在一些实施方案中,(i)的融合蛋白进一步包含Gam蛋白。
本文所述的组合物中使用的用于编辑编码PCSK9的多核苷酸的引导核苷酸序列选自SEQ ID NO:336-1309。本文所述的组合物中使用的用于编辑编码APOC3的多核苷酸的引导核苷酸序列选自SEQ ID NO:1806-1906。本文所述的组合物中使用的用于编辑编码LDLR的多核苷酸的引导核苷酸序列选自SEQ ID NO:1792-1799。本文所述的组合物中使用的用于编辑编码IDOL的多核苷酸的引导核苷酸序列选自SEQ ID NO:1788-1791。在一些实施方案中,组合物包含编码本文所述的融合蛋白的核酸和本文所述的引导核苷酸序列。在一些实施方案中,本文所述的组合物进一步包含药学上可接受的载体。在一些实施方案中,核碱基编辑器(即融合蛋白)和gRNA以两种不同的组合物提供。
如本文所用,术语“药学上可接受的载体”意指药学上可接受的材料、组合物或媒介物,如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如,润滑剂、滑石粉、硬脂酸镁、钙或锌或硬脂酸)或溶剂包封材料,涉及将化合物从身体的一个部位(例如,递送部位)运送或运输到另一个部位(例如,器官、组织或身体的一部分)。药学上可接受的载体是“可接受的”,意思是与制剂的其他成分相容并且对受试者的组织无害(例如,生理学相容的、无菌的、生理学的pH等)。可以充当药学上可接受的载体的材料的一些实例包括:(1)糖,如乳糖、葡萄糖和蔗糖;(2)淀粉,如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素;(4)粉末黄蓍胶;(5)麦芽;(6)明胶;(7)润滑剂,如硬脂酸镁、十二烷基硫酸钠和滑石粉;(8)赋形剂,如可可脂和栓剂蜡;(9)油,如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和豆油;(10)二醇,如丙二醇;(11)多元醇,如甘油、山梨糖醇、甘露醇和聚乙二醇(PEG);(12)酯类,如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格氏液;(19)乙醇;(20)pH缓冲溶液;(21)聚酯,聚碳酸酯和/或聚酸酐;(22)增量剂(bulking agent),如多肽和氨基酸(23)血清成分,如血清白蛋白、HDL和LDL;(22)C2-C12醇,如乙醇;和(23)药物制剂中采用的其他无毒相容物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于制剂中。诸如“赋形剂”、“载体”、“药学上可接受的载体”等术语在本文中可互换使用。
在一些实施方案中,组合物中本公开的核碱基编辑器和引导核苷酸通过注射、通过导管的方法、通过栓剂的方法或通过植入物的方法施用,所述植入物是多孔的、无孔的或凝胶状的材料,包括膜(例如硅橡胶膜(sialastic membrane))或纤维。在一些实施方案中,注射针对肝脏。
在其他实施方案中,核碱基编辑器和引导核苷酸在控释系统中递送。在一个实施方案中,可以使用泵(参见例如,Langer,1990,Science 249:1527-1533;Sefton,1989,CRCCrit.Ref.Biomed.Eng.14:201;Buchwald et al.,1980,Surgery 88:507;Saudek et al.,1989,N.Engl.J.Med.321:574)。在另一个实施方案中,可以使用聚合物材料。(参见例如,Medical Applications of Controlled Release(Langer and Wise编.,CRC Press,BocaRaton,Fla.,1974);Controlled Drug Bioavailability,Drug Product Design andPerformance(Smolen and Ball编,Wiley,New York,1984);Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61。还参见Levy et al.,1985,Science 228:190;During et al.,1989,Ann.Neurol.25:351;Howard et al.,1989,J.Neurosurg.71:105.)其他控释系统讨论于例如Langer,同上中。
在典型的实施方案中,药物组合物根据常规规程配制为适合于对受试者(例如人)进行静脉内或皮下施用的药物组合物。典型地,用于通过注射施用的组合物是无菌等渗水性缓冲液中的溶液。必要时,药物还可以包括增溶剂和局部麻醉剂如利多卡因,以缓解注射部位的疼痛。通常,成分单独供应或以单位剂量形式混合在一起,例如,作为干燥的冻干粉末或无水浓缩物,在密封容器如表明活性剂的量的安瓿或小药囊中。当药物将通过输注施用时,可以用含有无菌药用级水或盐水的输液瓶分配。当药物组合物通过注射施用时,可以提供一安瓿的无菌注射用水或盐水,以便在施用前混合成分。
用于全身施用的药物组合物可以是液体,例如无菌盐水、乳酸林格氏液或汉克氏液。此外,药物组合物可以是固体形式,并在使用前立即重新溶解或悬浮。还考虑了冻干形式。
药物组合物可以包含在脂质颗粒或囊泡(例如脂质体或微晶)内,其也适用于肠胃外施用。颗粒可以是任何合适的结构的,例如单层或多层,只要其中含有组合物即可。化合物可以包埋在含有融合脂质二油酰磷脂酰乙醇胺(DOPE)、低水平(5-10mol%)的阳离子脂质的“稳定化的质粒-脂质颗粒”(SPLP)中,并通过聚乙二醇(PEG)涂层稳定化(ZhangY.P.et al.,Gene Ther.1999,6:1438-47)。对于此类颗粒和囊泡,特别优选带正电荷的脂质如N-[1-(2,3-二油酰氧基)丙基]-N,N,N-三甲基-甲基硫酸铵或“DOTAP”。此类脂质颗粒的制备是众所周知的。参见例如,美国专利号4,880,635;4,906,477;4,911,928;4,917,951;4,920,016;和4,921,757。
例如,本公开的药物组合物可以作为单位剂量施用或包装。当用于提及本公开的药物组合物时,术语“单位剂量”是指适合作为受试者的单一剂量的物理上离散的单位,每个单位含有预定量的活性物质,其经计算与所需稀释剂联合产生所期望的治疗效果;即载体或媒介物。
在一些实施方案中,本文所述的核碱基编辑器或引导核苷酸可以与治疗部分(例如抗炎剂)缀合。将此类治疗部分与多肽(包括例如Fc域)缀合的技术是众所周知的;参见例如,Amon et al.,“Monoclonal Antibodies For Immunotargeting Of Drugs In CancerTherapy”,于Monoclonal Antibodies And Cancer Therapy,Reisfeld et al.(编),1985,pp.243-56,Alan R.Liss,Inc.);Hellstrom et al.,“Antibodies For Drug Delivery”,in Controlled Drug Delivery(2nd Ed.),Robinson et al.(编),1987,pp.623-53,Marcel Dekker,Inc.);Thorpe,“Antibody Carriers Of Cytotoxic Agents In CancerTherapy:A Review”,in Monoclonal Antibodies′84:Biological And ClinicalApplications,Pinchera et al.(编),1985,pp.475-506);“Analysis,Results,AndFuture Prospective Of The Therapeutic Use Of Radiolabeled Antibody In CancerTherapy”,in Monoclonal Antibodies For Cancer Detection And Therapy,Baldwin etal.(编),1985,pp.303-16,Academic Press;和Thorpe et al.(1982)“The PreparationAnd Cytotoxic Properties Of Antibody-Toxin Conjugates,”Immunol.Rev.,62:119-158。
此外,可以将本公开的组合物组装成试剂盒。在一些实施方案中,试剂盒包含用于表达本文所述的核碱基编辑器的核酸载体。在一些实施方案中,试剂盒进一步包含适当的引导核苷酸序列(例如gRNA)或用于表达此类引导核苷酸序列的核酸载体,以将核碱基编辑器靶向所期望的靶序列。
本文所述的试剂盒可以包括一个或多个容器,所述容器容纳用于实施本文所述方法的组分和任选的使用说明书。本文所述的任何试剂盒可以进一步包含实施测定方法所需的组分。如果适用,试剂盒的每种组分可以以液体形式(例如,以溶液)或以固体形式(例如,干粉)提供。在某些情况下,一些组分可以是可重构的或以其他方式可加工的(例如,成为活性形式),例如,通过添加合适的溶剂或其他物质(例如水或某些有机溶剂),其可以或可以不随试剂盒提供。
在一些实施方案中,试剂盒可以任选地包括用于使用所提供组分的说明书和/或广告宣传。如本文所用,“说明书”可以定义说明和/或广告宣传的组分,并且通常涉及针对本公开的包装或与之相关的书面说明书。说明书还可以包括以任何方式提供的任何口头或电子说明书,使得用户将清楚地认识到说明书与该试剂盒相关,例如,视听(例如,录像带、DVD等),因特网和/或基于网络的通信等。书面说明书可以是以由管理药品或生物制品的制造、使用或销售的政府机构规定的形式,其也可以反映用于动物施用的制造、使用或销售的机构的批准。如本文所用,“宣传的”包括做生意的所有方法,其包括教育的方法、医院和其他临床指导、科学探究、药物发现或开发、学术研究、制药行业活动包括药品销售,以及任何广告或其他广告宣传活动包括与本公开相关的任何形式的书面、口头和电子通信。另外,如本文所述,取决于具体应用,试剂盒可以包括其他组分。
试剂盒可以在一个或多个容器中含有本文所述的任何一种或多种组分。这些组分可以无菌制备,包装在注射器中并冷藏运输。或者,其可以容纳在小瓶或其他容器中用于储存。第二容器可以具有无菌制备的其他组分。或者,试剂盒可以包括预混合的活性剂并在小瓶、管或其他容器中运输。
试剂盒可以具有多种形式,例如泡罩袋、收缩包装袋、真空可密封袋、可密封的热成型托盘或类似的袋或托盘形式,其中附件松散地包装在袋、一个或多个管、容器、盒子或袋子内。在添加附件后,可以对试剂盒进行灭菌,从而允许容器中的各个附件以其他方式拆开。可以使用任何适当的灭菌技术对试剂盒进行灭菌,例如辐射灭菌、加热灭菌或本领域已知的其他灭菌方法。试剂盒还可以包括其他组分,取决于具体应用,例如容器、细胞培养基、盐、缓冲液、试剂、注射器、针、织物例如纱布,用于施加或去除消毒剂、一次性手套、施用前对试剂的支持物等。
治疗剂
本文所述的组合物可以以治疗有效量施用于有此需要的受试者以治疗与高循环胆固醇水平相关的状况。可以使用本文所述的组合物和方法治疗的与高循环胆固醇水平相关的状况包括但不限于:高胆固醇血症、总胆固醇水平升高、低密度脂蛋白(LDL)水平升高、LDL-胆固醇水平升高、高密度脂蛋白水平降低、肝脏脂肪变性、冠心病、缺血、中风、外周血管疾病、血栓形成、2型糖尿病、高血压、动脉粥样硬化、肥胖、阿尔茨海默氏病、神经变性及其组合。组合物和试剂盒对降低受试者中循环胆固醇水平有效,从而治疗状况。
如本文所用,“治疗有效量”是指本公开的需要赋予受试者治疗效果(单独或与一种或多种其他治疗剂组合)的每种治疗剂的量。如本领域技术人员所认识到的,有效量变化取决于所治疗的具体状况,状况的严重程度,个体受试者参数包括年龄、身体状况、大小、性别和体重,治疗的持续时间,同步疗法的性质(如果有的话),特定的施用途径以及健康从业者的知识和专业技能内的相似因素。这些因素是本领域普通技术人员所熟知的,并且可以仅通过常规实验来解决。通常优选使用最大剂量的各个组分或其组合,即根据合理的医学判断的最高安全剂量。然而,本领域普通技术人员将理解,受试者可以出于医学原因、心理原因或实际上任何其他原因而坚持较低剂量或可耐受剂量。经验考虑,例如半衰期,通常将有助于确定剂量。例如,与人免疫系统相容的治疗剂(例如包含来自人源化抗体或完全人抗体的区域的多肽)可以用于延长多肽的半衰期并阻止多肽被宿主的免疫系统攻击。
可以在治疗的过程中确定和调整施用的频率,并且施用的频率通常但不是必需地基于疾病的治疗和/或抑制和/或改善和/或延迟。或者,多肽或多核苷酸的持续连续释放制剂可能是适当的。用于实现持续释放的各种制剂和装置是本领域已知的。在一些实施方案中,剂量是每天、每隔一天、每三天、每四天、每五天或每六天。在一些实施方案中,给药频率是每周、每2周、每4周、每5周、每6周、每7周、每8周、每9周或每10周一次;或者每月、每2月或每3月一次,或更长。该疗法的进展通过常规技术和测定法可以容易地监测。
给药方案(包括所用的多肽)可以随时间变化。在一些实施方案中,对于正常体重的成年受试者,可以施周范围为约0.01至1000mg/kg的剂量。在一些实施方案中,剂量为1至200mg之间。具体的剂量方案,即剂量、时间和重复,将取决于特定受试者和该受试者的病史,以及多肽或多核苷酸的性质(例如多肽或多核苷酸的半衰期,以及本领域熟知的其他考虑因素)。
为了本公开的目的,如本文所述的治疗剂的适当剂量将取决于所采用的特定试剂(或其组合物)、制剂和施用的途径、疾病的类型和严重程度、施用多肽或多核苷酸是用于预防还是治疗目的、先前的治疗、受试者的临床病史和对拮抗剂的反应,以及主治医师的判断。通常,临床医生将施用多肽直至达到实现所期望的结果的剂量。
一种或多种多肽或多核苷酸的施用可以是连续的或间歇的,这取决于例如受体的生理状况,施用的目的是治疗性的还是预防性的,以及熟练的从业者已知的其他因素。多肽的施用可以在预选的一段时间内基本上连续,或者可以是一系列的间隔的剂量,例如在疾病发展之前、期间或之后。如本文所用,术语“治疗”是指将多肽或多核苷酸或包括多肽或多核苷酸的组合物施加或施用于有此需要的受试者。
“有此需要的受试者”是指具有疾病、疾病的症状,或对疾病的倾向的个体,其目的是治疗、治愈、减轻、缓解、改变、补救、改善、改进或影响疾病、疾病的症状或对疾病的倾向。在一些实施方案中,受试者具有高胆固醇血症。在一些实施方案中,受试者是哺乳动物。在一些实施方案中,受试者是非人灵长类动物。在一些实施方案中,受试者是人。减轻疾病包括延迟疾病的发展或进展,或降低疾病严重性。减轻疾病并不一定需要有治愈结果。
如其中所用,“延迟”疾病的发展意指推迟、阻碍、减缓、延缓、稳定和/或延期疾病的进展。该延迟可以是不同的时间长度的,取决于疾病的历史和/或被治疗的个体。“延迟”或减轻疾病的发展或延迟疾病的发作的方法是当与不使用该方法相比,降低在给定时间范围中发展一种或多种疾病的症状的可能性和/或降低在给定时间范围中症状的程度。此类比较通常基于临床研究,使用足以给出统计学显著结果的多个受试者。
疾病的“发展”或“进展”意指疾病的初始表现和/或随后的进展。可以使用本领域熟知的标准临床技术检测和评估疾病的发展。然而,发展也指可以不可检测的进展。出于本公开的目的,发展或进展是指症状的生物学过程。“发展”包括发生、复发和发作。
如本文所用,疾病的“发作”或“发生”包括初始发作和/或复发。医疗领域普通技术人员已知的常规方法可以用于将分离的多肽或药物组合物施用于受试者,取决于待治疗的疾病的类型或疾病的部位。该组合物还可以经由其他常规途径施用,例如口服、肠胃外、通过吸入喷雾、局部、直肠、鼻腔、口腔、阴道或经由植入的储库(reservoir)施用。
如本文所用,术语“肠胃外”包括皮下、皮内、静脉内、肌肉内、关节内、动脉内、滑膜内、胸骨内、鞘内、病灶内和颅内注射或输注技术。另外,它可以经由可注射的贮库(depot)施用途径施用于受试者,例如使用1个月、3个月或6个月贮库可注射或可生物降解的材料和方法。
宿主细胞和生物体
本公开的其他方面提供了用于产生和/或分离核碱基编辑器的宿主细胞和生物体,例如用于体外编辑。宿主细胞经遗传工程化改造以表达本文所述的翻译系统的核碱基编辑器和组分。在一些实施方案中,宿主细胞包含编码翻译系统的核碱基编辑器和组分的载体(例如,转化、转导或转染),其可以是例如克隆载体或表达载体。载体可以是例如以质粒、细菌、病毒、裸多核苷酸或缀合的多核苷酸的形式。通过标准方法将载体引入到细胞和/或微生物中,所述标准方法包括电穿孔、通过病毒载体感染、小颗粒的高速弹道穿透,其中核酸在小珠子或颗粒的基质内或在表面上(Klein et al.,Nature 327,70-73(1987))。在一些实施方案中,宿主细胞是原核细胞。在一些实施方案中,宿主细胞是真核细胞。在一些实施方案中,宿主细胞是细菌细胞。在一些实施方案中,宿主细胞是酵母细胞。在一些实施方案中,宿主细胞是哺乳动物细胞。在一些实施方案中,宿主细胞是人细胞。在一些实施方案中,宿主细胞是培养的细胞。在一些实施方案中,宿主细胞在组织或生物体内。
经工程化的宿主细胞可以在适合于诸如筛选步骤、激活启动子或选择转化体等活性的常规营养培养基中培养。可以任选地将这些细胞培养成转基因生物体。
将靶核酸引入到细菌细胞中的若干众所周知的方法是可用的,其中任何一种都可以用于本公开内容。这些包括:受体细胞与含有DNA的细菌原生质体融合、电穿孔、射弹轰击(projectile bombardment)和用病毒载体感染(下面进一步讨论)等。细菌细胞可以用于扩增本公开的含有DNA构建体的质粒的数量。细菌生长至对数期,并且细菌内的质粒可以通过本领域已知的各种方法分离(参见例如Sambrook)。此外,许多试剂盒可商购用于从细菌纯化质粒(参见例如,来自Pharmacia Biotech的EasyPrepTM、FlexiPrepTM;来自Stratagene的StrataCleanTM;和来自Qiagen的QIAprepTM)。然后进一步操作分离和纯化的质粒以产生其他质粒,用于转染细胞或掺入到相关载体中以感染生物体。典型的载体含有转录和翻译终止子、转录和翻译起始序列以及可用于调节特定靶核酸表达的启动子。载体任选地包含含有至少一个独立终止子序列的通用表达盒,允许盒在真核生物或原核生物或两者中复制的序列(例如穿梭载体)和原核和真核系统两者的选择标志物。载体适合于在原核生物、真核生物或优选两者中复制和整合。参见Giliman&Smith,Gene 8:81(1979);Roberts,et al.,Nature,328:731(1987);和Schneider,B.,et al.,Protein Expr.Purifi 6435:10(1995))。
可用于克隆的噬菌体例如由ATCC提供,例如由ATCC出版的The ATCC Catalogueof Bacteria and Bacteriophage(1992)Gherna et al.(编辑)。另外的用于测序、克隆和分子生物学的其他方面的基本规程以及潜在的理论考虑也可以在Watson et al.(1992)Recombinant DNA Second Edition Scientific American Books,NY中找到。
其他有用的参考文献,例如用于细胞分离和培养(例如,用于随后的核酸分离)包括Freshney (1994)Culture of Animal Cells,a Manual of Basic Technique,thirdedition,Wiley-Liss,New York及其中引用的参考文献;Payne et al.(1992)Plant Celland Tissue Culture in Liquid Systems John Wiley&Sons,Inc.New York,NY;Gamborgand Phillips(编)(1995)Plant Cell.Tissue and Organ Culture;Fundamental MethodsSpringer Lab Manual,Springer-Verlag(Berlin Heidelberg New York)and Atlas andParks(编)The Handbook of Microbiological Media(1993)CRC Press,Boca Raton,FL.。此外,基本上任何核酸(和实际上任何标记的核酸,无论是标准的还是非标准的)都可以从各种商业来源定制或标准订购,例如The Midland Certified Reagent Company(mcrc@oligos.com)、The Great American Gene Company(www.genco.com)、ExpressGen Inc.(www.expressgen.com)、Operon Technologies Inc.(Alameda,CA)等等。
无需进一步详细阐述,相信本领域技术人员基于以上描述可以最充分地利用本公开。因此,以下具体实施方案应被解释为仅是说明性的,并且不以任何方式限制本公开的其余部分。出于本文引用的目的或主题,本文引用的所有出版物均通过引用并入。
实施例
为了可以更全面地理解本文所述的发明,提出以下实施例。提供本申请中描述的合成实施例以说明本文提供的化合物和方法,并且不以任何方式解释为限制其范围。
实施例1:引-导核苷酸序列-可编程DNA结合蛋白域、脱氨酶域和碱基编辑器
提供了合适的引导核苷酸序列-可编程DNA结合蛋白域的非限制性实例。本公开提供了Cas9变体,例如来自一种或多种生物体的Cas9蛋白,其可以包含一个或多个突变(例如,以生成dCas9或Cas9切口酶)。在一些实施方案中,可以突变Cas9蛋白的氨基酸残基中的一个或多个(下文用星号标识)。在一些实施方案中,对SEQ ID NO:1中提供的氨基酸序列的D10和/或H840残基,或SEQ ID NO:11-260中提供的任何氨基酸序列中相应的突变进行突变。在一些实施方案中,对SEQ ID NO:1中提供的氨基酸序列的D10残基,或SEQ ID NO:11-260中提供的任何氨基酸序列中相应的突变进行突变,突变为除了D外的任何氨基酸残基。在一些实施方案中,对SEQ ID NO:1中提供的氨基酸序列的D10残基,或SEQ ID NO:11-260中提供的任何氨基酸序列中相应的突变进行突变,突变为A。在一些实施方案中,SEQ IDNO:1中提供的氨基酸序列的H840残基,或SEQ ID NO:11-260中提供的任何氨基酸序列中相应的残基是H。在一些实施方案中,对SEQ ID NO:1中提供的氨基酸序列的H840残基,或SEQID NO:11-260中提供的任何氨基酸序列中相应的突变进行突变,突变为除了H外的任何氨基酸残基。在一些实施方案中,对SEQ ID NO:1中提供的氨基酸序列的H840残基,或SEQ IDNO:11-260中提供的任何氨基酸序列中相应的突变进行突变,突变为A。在一些实施方案中,SEQ ID NO:1中提供的氨基酸序列的D10残基,或SEQ ID NO:11-260中提供的任何氨基酸序列中相应的残基是D。
对来自各种物种的许多Cas9序列进行比对以确定是否可以在其他Cas9蛋白中鉴定SEQ ID NO:1或SEQ ID NO:11的D10和H840的相应的同源氨基酸残基,从而允许生成具有同源氨基酸残基的相应的突变的Cas9变体。以下列参数使用NCBI基于约束的多重比对工具(NCBI Constraint-based Multiple Alignment Tool)(COBALT(可在st-va.ncbi.nlm.nih.gov/tools/cobalt获得)进行比对。比对参数:空位罚分-11,-1;末端空位罚分-5,-1。CDD参数:使用RPS BLAST开启(on);Blast E值0.003;查找保守列和重新计算开启。查询聚类参数:使用查询聚类开启;字大小4;最大聚类距离0.8;字母常规。
以下提供了四个Cas9序列的示例性比对。比对中的Cas9序列是:序列1(S1):SEQID NO:11|WP_010922251|gi 499224711|II型CRISPR RNA引导的内切核酸酶Cas9[酿脓链球菌];序列2(S2):SEQ ID NO:12|WP_039695303|gi 746743737|II型CRISPR RNA引导的内切核酸酶Cas9[解没食子酸链球菌(Streptococcus gallolyticus)];序列3(S3):SEQ IDNO:13|WP_045635197|gi 782887988|II型CRISPR RNA引导的内切核酸酶Cas9[缓症链球菌(Streptococcus mitis)];序列4(S4):SEQ ID NO:14|5AXW_A|gi 924443546|金黄色葡萄球菌Cas9。针对四个序列的每一个鉴定HNH域(粗体且加下划线)和RuvC域(加框)。S1中的氨基酸残基10和840以及比对序列中的同源氨基酸在相应的氨基酸残基后用星号标识。
比对证明了可以通过使用本领域已知的比对程序和算法鉴定与参照序列或参照残基比对的氨基酸序列或残基来在Cas9序列变体间鉴定与参照Cas9氨基酸序列或氨基酸残基同源的氨基酸序列和氨基酸残基,所述Cas9序列变体包括但不限于来自不同物种的Cas9序列。本公开提供了Cas9变体,其中如本文所述,对SEQ ID NO:11-14(例如,分别为S1、S2、S3和S4)中的通过星号标识的氨基酸残基中的一个或多个进行突变。SEQ ID NO:1的Cas9中的残基D10和H840(其对应于SEQ ID NO:11-14中通过星号标识的残基)在本文中称为“同源的”或“相应的”残基。此类同源的残基可以通过序列比对来鉴定,例如,如上所述,并通过鉴定与参照序列或残基比对的序列或残基来鉴定。类似地,对应于本文SEQ ID NO:1中鉴定的突变,例如SEQ ID NO:1中的残基10和840的突变的Cas9序列中的突变在本文中称为“同源的”或“相应的”突变。例如,对于上述四个比对序列,对应于SEQ ID NO:1或S1(SEQID NO:11)中的D10A突变的突变是S2的D11A、S3的D10A和S4的D13A;SEQ ID NO:1或S1(SEQID NO:11)中H840A的相应的突变是S2的H850A、S3的H842A和S4的H560A。
提供了来自不同物种的总共250个Cas9序列(SEQ ID NO:11-260)。对应于SEQ IDNO:1的残基10和840的氨基酸残基可以以与上述相同的方式鉴定。可以根据本公开使用所有这些Cas9序列。
提供了合适的脱氨酶域的非限制性实例。
人AID
(下划线:核定位信号;双下划线:核输出信号)
小鼠AID
(下划线:核定位信号;双下划线:核输出信号)
狗AID
(下划线:核定位信号;双下划线:核输出信号)
牛AID
(下划线:核定位信号;双下划线:核输出信号)
小鼠APOBEC-3
(斜体:核酸编辑域)
大鼠APOBEC-3
(斜体:核酸编辑域)
恒河猴APOBEC-3G
(斜体:核酸编辑域;下划线:细胞质定位信号)
黑猩猩APOBEC-3G
(斜体:核酸编辑域;下划线:细胞质定位信号)
绿猴APOBEC-3G
(斜体:核酸编辑域;下划线:细胞质定位信号)
人APOBEC-3G
(斜体:核酸编辑域;下划线:细胞质定位信号)
人APOBEC-3F
(斜体:核酸编辑域)
人APOBEC-3B
(斜体:核酸编辑域)
人APOBEC-3C:
(斜体:核酸编辑域)
人APOBEC-3A:
(斜体:核酸编辑域)
人APOBEC-3H:
(斜体:核酸编辑域)
人APOBEC-3D
(斜体:核酸编辑域)
人APOBEC-1
小鼠APOBEC-1
大鼠APOBEC-l
海七鳃鳗(Petromyzon marinus)CDA1(pmCDA1)
人APOBEC3G D316R_D317R
人APOBEC3G A链
人APOBEC3G A链D120R_D121R
提供了融合蛋白/核碱基编辑器的非限制性实例。
His6-rAPOBEC1-XTEN-dCas9用于大肠杆菌表达(SEQ ID NO:293)
rAPOBEC1-XTEN-dCas9-NLS用于哺乳动物表达(SEQ ID NO:294)
hAPOBEC1-XTEN-dCas9-NLS用于哺乳动物表达(SEQ ID NO:295)
rAPOBEC1-XTEN-dCas9-UGI-NLS(SEQ ID NO:296)
rAPOBEC1-XTEN-Cas9切口酶-UGI-NLS(BE3,SEQ ID NO:297)
pmCDA1-XTEN-dCas9-UGI(细菌)(SEQ ID NO:298)
pmCDA1-XTEN-nCas9-UGI-NLS(哺乳动物构建体)(SEQ ID NO:299):
huAPOBEC3G-XTEN-dCas9-UGI(细菌)(SEQ ID NO:300)
huAPOBEC3G-XTEN-nCas9-UGI-NLS(哺乳动物构建体)(SEQ ID NO:301)
huAPOBEC3G(D316R_D317R)-XTEN-nCas9-UGI-NLS(哺乳动物构建体)(SEQ ID NO:302)
实施例2:用于修饰PCSK9和其他肝蛋白质以改善循环胆固醇和脂质水平的 CRISPR/Cas9基因组/碱基编辑方法
循环中约70%的胆固醇在低密度脂蛋白(LDL)内转运,所述低密度脂蛋白通过LDL受体(LDL-R)介导的胞吞作用在肝中被清除,伴随着内源性胆固醇生物合成途径下调的附加后果。PCSK9是一种分泌性、球状丝氨酸蛋白酶,能够将其N端原结构域蛋白水解自动加工成有力的内源性抑制剂,所述内源性抑制剂永久阻断其催化位点(图1A至1C)。用于阻断PCSK9功能的药剂列表可以在表12中找到。成熟的PCSK9通过分泌途径离开并且在网格蛋白包被的囊泡中起蛋白质结合衔接物作用以在LDL颗粒的胞吞作用期间桥接与LDL受体的pH依赖性相互作用,这阻止LDL受体再循环到细胞表面(图2)1。PCSK9的敲除小鼠模型由于LDLR在细胞表面上的呈递增强和肝细胞对LDL颗粒的摄取增加而显示出非常低的循环胆固醇水平2。人全基因组关联研究已经鉴定了高胆固醇血症患者中PCSK9的有害功能获得变体3,以及低胆固醇血症个体中有益的功能丧失和不稳定的PCKS9变体(图1A至1C、表1)3b,c,4。已知的人PCSK9变体的列表可以在表18中找到。
在过去十年中,制药业中对使用各种策略(包括抗体、小分子、肽配体、RNA干扰和反义寡核苷酸)消除PCSK9和LDLR之间的相互作用有重大的兴趣(图2)。最近,第一代CRISPR/Cas9工具已被用于在小鼠模型中体内消融PCSK9基因5。但是,由于大量细胞需要在体内进行修饰以调控胆固醇水平,因此存在关于低频率脱靶基因组不稳定性和可由基因组编辑处理引起的致癌修饰的紧迫担忧6。弥合向临床应用的缺口将需要安全且有效的策略来以最大化治疗效益的方式修饰PCSK9(表1)。本文公开的PCSK9修饰的精确靶向方法可优于先前提出的使用工程化核酸酶在PCSK9基因组位点中创建随机插入/缺失的策略6,所述工程化核酸酶包括CRISPR/Cas97,以及dCas9-Fok1融合物8、Cas9切口酶对9、TALEN、锌指核酸酶等10。此外,由于脱靶胞嘧啶脱氨基对基因组稳定性的影响相对较低12,依赖于诸如BE2或BE311的“碱基编辑器”的策略可具有更有利的安全概况,所述基因组稳定性包括癌基因激活或肿瘤抑制基因失活13
重要的是,PCSK9由肝细胞分泌到细胞外培养基中14,在该细胞外培养基中它作为旁分泌因子对邻近肝细胞的LDL受体以顺式起作用14。由于基因/蛋白质在体内递送到组织中的不完全外显率,相当大分数的PCSK9基因拷贝保持为未修饰/野生型15。因此,PCSK9功能丧失变体应当优先用于基因组/碱基编辑治疗,所述PCSK9功能丧失变体得以有效表达、自动激活和输出,从而以旁分泌机制衔接来自未修饰细胞的网格蛋白包被的小窝。
此种精心校准的PCSK9功能丧失策略可以通过与LDL-R结合区以及特别地EGF-A域(图1A至1C)直接接触的关键残基的工程化变体,如PCSK9残基R194、R237、F379、β-折叠S372至D374、C375-378二硫化物等(表3)以及可影响整体折叠的工程化的和天然存在的变体,如残基R46和R237以及A443(表3)来实现。这种治疗策略对携带中性PCSK9变体的高胆固醇血症患者有益,但对于PCSK9、LDLR、APOB等有害的功能获得突变(例如PCSK9-D374Y,图1A至1C)的携带者更是如此1b。此外,在体内施用多种引导RNA可以实现同时引入其他潜在协同的遗传修饰,例如APOC3的罕见心脏保护等位基因(A43T和R19X)16、IDOL/MYLIP功能丧失等位基因R266X17和提高基因表达的LDL-R非编码变体(表9)18
最后,通过用针对基因组位点中所有可能的PAM设计的引导RNA文库体外处理细胞,加上使用报告物/标记方法的FACS分选和DNA深度测序,可以鉴定PCSK9的新的心脏保护性变体,以找到编程碱基编辑反应的引导RNA,所述碱基编辑反应改变报告物基因表达或在细胞表面上显示升高的LDL-R。这些新的PCSK9变体,以及通过全基因组关联研究鉴定的其他心脏保护等位基因(并且对于LDL-R、IDOL、APOC3/C5等类似地)可以使用本文所述的引导RNA编程的碱基编辑反应的类型来概括(表2和3)。
重要的是,可以预测终止密码子的引入在靶向柔性环中的残基时在生成截短中最有效,或者其可以使用一种引导-RNA BE复合物(蓝色突出显示的引导RNA)串联持续性编辑。提前终止密码子串联引入到PCSK9中的实例包括:W10X-W11X、Q99X-Q101X、Q342X-Q344X、Q554X-Q555X。类似地,随后是终止密码子的结构性去稳定化的变体也可以是有效的,例如:P530S/L-Q531X、P581S/LR582X、P618S/L-Q619X(以红色突出显示的引导RNA)。在环/接头区域中发现的残基标记为+或++。
表18 来自LOVD数据库的人PCSK9的已知变体的列表
红色:使用引导RNA编程的基因组/碱基编辑反应得到的匹配/模拟的修饰。
表19用于阻断PCSK9功能的药剂的实例
参考文献
1.(a)Fisher,T.S.;Lo Surdo,P.;Pandit,S.;Mattu,M.;Santoro,J.C.;Wisniewski,D.;Cummings,R.T.;Calzetta,A.;Cubbon,R.M.;Fischer,P.A.;Tarachandani,A.;De Francesco,R.;Wright,S.D.;Sparrow,C.P.;Carfi,A.;Sitlani,A.,Effects of pH and low density lipoprotein(LDL)on PCSK9-dependent LDL receptorregulation.The Joumal of biological chemistry 2007,282(28),20502-12;(b)Cunningham,D.;Danley,D.E.;Geoghegan,K.F.;Griffor,M.C.;Hawkins,J.L.;Subashi,T.A.;Varghese,A.H.;Ammirati,M.J.;Culp,J.S.;Hoth,L.R.;Mansour,M.N.;McGrath,K.M.;Seddon,A.P.;Shenolikar,S.;Stutzman-Engwall,K.J.;Warren,L.C.;Xia,D.;Qiu,X.,Structural and biophysical studies of PCSK9and its mutants linked tofamilial hypercholesterolemia.Nature structural&molecular biology 2007,14(5),413-9.
2.Rashid,S.;Curtis,D.E.;Garuti,R.;Anderson,N.N.;Bashmakov,Y.;Ho,Y.K.;Hammer,R.E.;Moon,Y.A.;Horton,J.D.,Decreased plasma cholesterol andhypersensitivity to statins in mice lacking Pcsk9.Proceedings of the NationalAcademy of Sciences of the United States of America 2005,102(15),5374-9.
3.(a)Abifadel,M.;Varret,M.;Rabes,J.P.;Allard,D.;Ouguerram,K.;Devillers,M.;Cruaud,C.;Benjannet,S.;Wickham,L.;Erlich,D.;Derre,A.;Villeger,L.;Farnier,M.;Beucler,I.;Bruckert,E.;Chambaz,J.;Chanu,B.;Lecerf,J.M.;Luc,G.;Moulin,P.;Weissenbach,J.;Prat,A.;Krempf,M.;Junien,C.;Seidah,N.G.;Boileau,C.,Mutations in PCSK9cause autosomal dominant hypercholesterolemia.Naturegenetics2003,34(2),154-6;(b)Costet,P.;Krempf,M.;Cariou,B.,PCSK9and LDLcholesterol:unravelling the target to design the bullet.Trends in biochemicalsciences 2008,33(9),426-34;(c)Cohen,J.C.;Boerwinkle,E.;Mosley,T.H.,Jr.;Hobbs,H.H.,Sequence variations in PCSK9,low LDL,and protection against coronaryheart disease.The New Englandjournal of medicine 2006,354(12),1264-72.
4.(a)Benjannet,S.;Rhainds,D.;Hamelin,J.;Nassoury,N.;Seidah,N.G.,Theproprotein convertase(PC)PCSK9 is inactivated by furin and/or PC5/6A:functional consequences of natural mutations and post-translationalmodifications.The Journal of biological chemistry 2006,281(41),30561-72;(b)Cohen,J.;Pertsemlidis,A.;Kotowski,I.K.;Graham,R.;Garcia,C.K.;Hobbs,H.H.,LowLDL cholesterol in individuals of African descent resulting from frequentnonsense mutations in PCSK9.Nature genetics 2005,37(2),161-5.
5.(a)Ding,Q.;Strong,A.;Patel,K.M.;Ng,S.L.;Gosis,B.S.;Regan,S.N.;Cowan,C.A.;Rader,D.J.;Musunuru,K.,Permanent alteration of PCSK9 with in vivoCRISPR-Cas9 genome editing.Circulation research 2014,115(5),488-92;(b)Wang,X.;Raghavan,A.;Chen,T.;Qiao,L.;Zhang,Y.;Ding,Q.;Musunuru,K.,CRISPR-Cas9Targeting of PCSK9 in Human Hepatocytes In vivo-BriefReport.Arteriosclerosis,thrombosis,and vascular biology 2016,36(5),783-6.
6.Cox,D.B.;Platt,R.J.;Zhang,F.,Therapeutic genome editing:prospectsand challenges.Nature medicine 2015,21(2),121-31.
7.(a)Cong,L.;Ran,F.A.;Cox,D.;Lin,S.;Barretto,R.;Habib,N.;Hsu,P.D.;Wu,X.;Jiang,W.;Marraffini,L.A.;Zhang,F.,Multiplex genome engineering usingCRISPR/Cas systems.Science 2013,339(6121),819-23;(b)Jinek,M.;Chylinski,K.;Fonfara,I.;Hauer,M.;Doudna,J.A.;Charpentier,E.,A programmable dual-RNA-guidedDNA endonuclease in adaptive bacterial immunity.Science 2012,337(6096),816-21;(c)Mali,P.;Yang,L.;Esvelt,K.M.;Aach,J.;Guell,M.;DiCarlo,J.E.;Norville,J.E.;Church,G.M.,RNA-guided human genome engineering via Cas9.Science 2013,339(6121),823-6.
8.(a)Guilinger,J.P.;Thompson,D.B.;Liu,D.R.,Fusion of catalyticallyinactive Cas9 to FokI nuclease improves the specificity of genomemodification.Nature biotechnology 2014,32(6),577-82;(b)Tsai,S.Q.;Wyvekens,N.;Khayter,C.;Foden,J.A.;Thapar,V.;Reyon,D.;Goodwin,M.J.;Aryee,M.J.;Joung,J.K.,Dimeric CRISPR RNA-guided FokI nucleases for highly specific genomeediting.Nature biotechnology 2014,32(6),569-76.
9.Ran,F.A.;Hsu,P.D.;Lin,C.Y.;Gootenberg,J.S.;Konermann,S.;Trevino,A.E.;Scott,D.A.;Inoue,A.;Matoba,S.;Zhang,Y.;Zhang,F.,Double nicking byRNAguided CRISPR Cas9 for enhanced genome editing specificity.Cell 2013,154(6),1380-9.
10.(a)Cradick,T.J.;Fine,E.J.;Antico,C.J.;Bao,G.,CRISPR/Cas9 systemstargeting β-globin and CCR5 genes have substantial off-targetactivity.Nucleic acids research 2013;(b)Holt,N.;Wang,J.;Kim,K.;Friedman,G.;Wang,X.;Taupin,V.;Crooks,G.M.;Kohn,D.B.;Gregory,P.D.;Holmes,M.C.;Cannon,P.M.,Human hematopoietic stem/progenitor cells modified by zinc-finger nueleasestargeted to CCR5 control HIV-1 in vivo.Nature biotechnology 2010,28(8),839-47.
11.Komor,A.C.;Kim,Y.B.;Packer,M.S.;Zuris,J.A.;Liu,D.R.,Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 2016,advance online publication.
12.Koonin,E.V.;Novozhilov,A.S.,Origin and evolution of the geneticcode:the universal enigma.IUBMB life 2009,61(2),99-111.
13.(a)Thomas,M.A.;Weston,B.;Joseph,M.;Wu,W.;Nekrutenko,A.;Tonellato,P.J.,Evolutionary dynamics of oncogenes and tumor suppressor genes:higherintensities of purifying selection than other genes.Molecular biology andevolution 2003,20(6),964-8;(b)Iengar,P.,An analysis of substitution,deletionand insertion mutations in cancer genes.Nucleic acids research 2012,40(14),6401-13.
14.(a)Lagace,T.A.;Curtis,D.E.;Garuti,R.;McNutt,M.C.;Park,S.W.;Prather,H.B.;Anderson,N.N.;Ho,Y.K.;Hammer,R.E.;Horton,J.D.,SecretedPCSK9decreases the number of LDL receptors in hepatocytes and in livers ofparabiotic mice.The Journal of clinical investigation 2006,116(11),2995-3005;(b)Ferri,N.;Tibolla,G.;Pirillo,A.;Cipollone,F.;Mezzetti,A.;Pacia,S.;Corsini,A.;Catapano,A.L.,Proprotein convertase subtilisin kexin type 9(PCSK9)secretedby cultured smooth muscle cells reduces macrophages LDLRlevels.Atherosclerosis 2012,220(2),381-6.
15.(a)Zuris,J.A.;Thompson,D.B.;Shu,Y.;Guilinger,J.P.;Bessen,J.L.;Hu,J.H.;Maeder,M.L.;Joung,J.K.;Chen,Z.Y.;Liu,D.R.,Cationic lipid-mediateddelivery of proteins enables efficient protein-based genome editing in vitroand in vivo.Nature biotechnology 2015,33(1),73-80;(b)Yin,H.;Song,C.Q.;Dorkin,J.R.;Zhu,L.J.;Li,Y.;Wu,Q.;Park,A.;Yang,J.;Suresh,S.;Bizhanova,A.;Gupta,A.;Bolukbasi,M.F.;Walsh,S.;Bogorad,R.L.;Gao,G.;Weng,Z.;Dong,Y.;Koteliansky,V.;Wolfe,S.A.;Langer,R.;Xue,W.;Anderson,D.G.,Therapeutic genome editing bycombined viral and non-viral delivery of CRISPR system components invivo.Nature biotechnology 2016,34(3),328-33.
16.Jorgensen,A.B.;Frikke-Schmidt,R.;Nordestgaard,B.G.;Tybjaerg-Hansen,A.,Loss-of-function mutations in APOC3 and risk of ischemic vasculardisease.The New Englandjournal of medicine 2014,371(1),32-41.
17.Sorrentino,V.;Fouchier,S.W.;Motazacker,M.M.;Nelson,J.K.;Defesche,J.C.;Dallinga-Thie,G.M.;Kastelein,J.J.;Kees Hovingh,G.;Zelcer,N.,Identification of a loss-of-function inducible degrader of the low-densitylipoprotein receptor variant in individuals with low circulating low-densitylipoprotein.European heart journal 2013,34(17),1292-7.
18.(a)Scholtz,C.L.;Peeters,A.V.;Hoogendijk,C.F.;Thiart,R.;deVilliers,J.N.;Hillermann,R.;Liu,J.;Marais,A.D.;Kotze,M.J.,Mutation-59c-->t inrepeat 2 of the LDL receptor promoter:reduction in transcriptional activityand possible allelic interaction in a South African family with familialhypercholesterolaemia.Human molecular genetics 1999,8(11),2025-30;(b)Gretarsdottir,S.;Helgason,H.;Helgadottir,A.;Sigurdsson,A.;Thorleifsson,G.;Magnusdottir,A.;Oddsson,A.;Steinthorsdottir,V.;Rafnar,T.;de Graaf,J.;Daneshpour,M.S.;Hedayati,M.;Azizi,F.;Grarup,N.;Jorgensen,T.;Vestergaard,H.;Hansen,T.;Eyjolfsson,G.;Sigurdardottir,O.;Olafsson,I.;Kiemeney,L.A.;Pedersen,O.;Sulem,P.;Thorgeirsson,G.;Gudbjartsson,D.F.;Holm,H.;Thorsteinsdottir,U.;Stefansson,K.,A Splice Region Variant in LDLR Lowers Non-high DensityLipoprotein Cholesterol and Protects against Coronary Artery Disease.PLoSgenetics 2015,11(9),e1005379;(c)van Zyl,T.;Jerling,J.C.;Conradie,K.R.;Feskens,E.J.,Common and rare single nucleotide polymorphisms in the LDLR geneare present in a black South African population and associate with low-density lipoprotein cholesterol levels.Journal of human genetics 2014,59(2),88-94;(d)De Castro-Oros,I.;Perez-Lopez,J.;Mateo-Gallego,R.;Rebollar,S.;Ledesma,M.;Leon,M.;Cofan,M.;Casasnovas,J.A.;Ros,E.;Rodriguez-Rey,J.C.;Civeira,F.;Pocovi,M.,A genetic variant in the LDLR promoter is responsiblefor part of the LDL-cholesterol variability in primaryhypercholesterolemia.BMC medical genomics 2014,7,17.
19.Kwon,H.J.;Lagace,T.A.;McNutt,M.C.;Horton,J.D.;Deisenhofer,J.,Molecular basis for LDL receptor recognition by PCSK9.Proceedings of theNational Academy of Sciences of the United States of America 2008,105(6),1820-5.
20.Dewpura,T.;Raymond,A.;Hamelin,J.;Seidah,N.G.;Mbikay,M.;Chretien,M.;Mayne,J.,PCSK9is phosphorylated by a Golgi casein kiBase-like kiBase exvivo and circulates as a phosphoprotein in humans.The FEBS journal 2008,275(13),3480-93.
等同方案和范围
在权利要求书中,诸如“一种”、“一个”和“该/所述”的冠词可以意指一个/种或超出一个/种,除非相反地指出或者从上下文中以其他方式是明显的。若一个、超出一个或所有组成员在给定产物或过程中存在、采用或以其他方式相关,则认为在组中的一个或多个成员之间包括“或”的权利要求或说明书得到满足,除非相反地指出或者从上下文中以其他方式是明显的。本发明包括组的恰好一个成员在给定产物或过程中存在、采用或以其他方式相关的实施方案。本发明包括超出一个或所有组成员在给定产物或过程中存在、采用或以其他方式相关的实施方案。
此外,本发明涵盖所有变型、组合和置换,其中来自一个或多个列出的权利要求的一个或多个限制、元素、条款和描述性术语被引入到另一个权利要求中。例如,可以修改依赖于另一个权利要求的任何权利要求以包括在依赖于相同基本权利要求的任何其他权利要求中找到的一个或多个限制。在将元素呈现为列表(例如,以马库什群组格式)的情况下,还公开了元素的每个子群,并且可以从群组中移除任何元素。应当理解,通常,在本发明或本发明的方面称为包含特定元素和/或特征的情况下,本发明的某些实施方案或本发明的方面由此类元素和/或特征组成,或基本上由此类元素和/或特征组成。出于简化的目的,那些实施方案未在本文中同样具体阐述。
还应注意,术语“包含”和“含有”旨在是开放的并且允许包括另外的元素或步骤。在给出范围的情况下,端点包括在内。此外,除非相反地指出或从上下文和本领域普通技术人员的理解中以其他方式明显看出,否则表达为范围的值可以假定在本发明的不同实施方案中的所述范围内的任何特定值或亚范围,至该范围的下限的单位的十分之一,除非上下文另有明确规定。
本申请参阅各种公告的专利、公布的专利申请,期刊文章和其他出版物,它们都通过引用并入本文。若任何并入的参考文献与本说明书之间存在冲突,则以本说明书为准。另外,落入现有技术内的本发明的任何特定实施方案可以明确地从任何一个或多个权利要求中排除。因为此类实施方案认为是本领域普通技术人员已知的,所以即使本文未明确阐述排除,也可以排除它们。无论是否与现有技术的存在相关,本发明的任何特定实施方案可以出于任何原因排除在任何权利要求之外。
本领域技术人员将认识到或能够仅仅使用常规的实验确定本文所述的具体实施方案的许多等同方案。本文所述的本实施方案的范围不意图限于以上说明书,而是如所附权利要求书中所述。本领域普通技术人员将理解,在不脱离如所附权利要求书所限定的本发明的精神或范围的情况下,可以对本说明书进行各种改变和修改。

Claims (128)

1.编辑编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸的方法,所述方法包括使编码PCSK9的多核苷酸接触:
(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到所述编码PCSK9的多核苷酸中的靶胞嘧啶(C)碱基,
其中所述接触导致所述融合蛋白对所述靶C碱基的脱氨基,从而导致所述编码PCSK9的多核苷酸中胞嘧啶(C)至胸腺嘧啶(T)变化。
2.权利要求1的方法,其中所述引导核苷酸序列-可编程DNA结合蛋白是切口酶。
3.权利要求2的方法,其中所述切口酶是Cas9切口酶。
4.权利要求3的方法,其中所述Cas9切口酶包含对应于SEQ ID NO:1中D10A突变或H840A突变的突变。
5.权利要求4的方法,其中所述Cas9切口酶包含对应于SEQ ID NO:1中D10A突变的突变。
6.权利要求1的方法,其中所述引导核苷酸序列-可编程DNA结合蛋白域选自下组:核酸酶无活性的Cas9(dCas9)域、核酸酶无活性的Cpf1域、核酸酶无活性的Argonaute域,及其变体。
7.权利要求6的方法,其中所述引导核苷酸序列-可编程DNA结合蛋白域是核酸酶无活性的Cas9(dCas9)域。
8.权利要求7的方法,其中所述dCas9域的氨基酸序列包含对应于SEQ ID NO:1中D10A和/或H840A突变的突变。
9.权利要求7的方法,其中所述dCas9域的氨基酸序列包含对应于SEQ ID NO:1中D10A突变的突变,并且其中所述dCas9域包含对应于SEQ ID NO:1的氨基酸840的位置处的组氨酸。
10.权利要求1的方法,其中所述引导核苷酸序列-可编程DNA结合蛋白域包含核酸酶无活性的Cpf1(dCpf1)域。
11.权利要求10的方法,其中所述dCpf1域来自氨基酸球菌属(Acidaminococcus)或毛螺菌科(Lachnospiraceae)的物种。
12.权利要求1的方法,其中所述引导核苷酸序列-可编程DNA结合蛋白域包含核酸酶无活性的Argonaute(dAgo)域。
13.权利要求12的方法,其中所述dAgo域来自格氏嗜盐碱杆菌(Natronobacteriumgregoryi)(dNgAgo)。
14.权利要求1-13中任一项的方法,其中所述胞嘧啶脱氨酶域包含载脂蛋白B mRNA-编辑复合物(APOBEC)家族脱氨酶。
15.权利要求1-13中任一项的方法,其中所述胞嘧啶脱氨酶选自下组:APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、激活诱导的脱氨酶(AID)和pmCDA1。
16.权利要求1的方法,其中所述胞嘧啶脱氨酶包含SEQ ID NO:271-292和303的任一个的氨基酸序列。
17.权利要求1-16中任一项的方法,其中所述(i)的融合蛋白进一步包含Gam蛋白。
18.权利要求17的方法,其中所述Gam蛋白包含SEQ ID NO:2030-2058的任一个的氨基酸序列。
19.权利要求1-18中任一项的方法,其中所述(a)的融合蛋白进一步包含尿嘧啶糖基化酶抑制剂(UGI)域。
20.权利要求19的方法,其中所述UGI域包含SEQ ID NO:304的氨基酸序列。
21.权利要求19或20的方法,其中所述胞嘧啶脱氨酶域与所述引导核苷酸序列-可编程DNA结合蛋白域的N端融合。
22.权利要求21的方法,其中所述UGI域与所述引导核苷酸序列-可编程DNA结合蛋白域的C端融合。
23.权利要求1-22中任一项的方法,其中所述胞嘧啶脱氨酶和所述引导核苷酸序列-可编程DNA结合蛋白域经由任选的接头融合。
24.权利要求23的方法,其中所述UGI域经由任选的接头与所述dCas9域融合。
25.权利要求24的方法,其中所述融合蛋白包含结构NH2-[胞嘧啶脱氨酶域]-[任选的接头序列]-[引导核苷酸序列-可编程DNA结合蛋白域]-[任选的接头序列]-[UGI域]-COOH。
26.权利要求23-25中任一项的方法,其中所述接头包含(GGGS)n(SEQ ID NO:1998)、(GGGGS)n(SEQ ID NO:308)、(G)n、(EAAAK)n(SEQ ID NO:309)、(GGS)n、SGSETPGTSESATPES(SEQ ID NO:310)或(XP)n基序,或任何这些的组合,其中n独立地是1和30之间的整数,并且其中X是任何氨基酸。
27.权利要求26的方法,其中所述接头包含氨基酸序列SGSETPGTSESATPES(SEQ ID NO:310)。
28.权利要求26的方法,其中所述接头是(GGS)n,并且其中n是1、3或7。
29.权利要求1的方法,其中所述融合蛋白包含SEQ ID NO:10或293-302的任一个的氨基酸序列。
30.权利要求1-29中任一项的方法,其中所述编码PCSK9蛋白的多核苷酸包含编码链和互补链。
31.权利要求1-30中任一项的方法,其中所述编码PCSK9蛋白的多核苷酸包含编码区和非编码区。
32.权利要求1-31中任一项的方法,其中所述C至T变化发生在所述编码PCSK9的多核苷酸的编码序列中。
33.权利要求32的方法,其中所述C至T变化导致所述PCSK9蛋白中的突变。
34.权利要求33的方法,其中所述PCSK9蛋白中的所述突变是功能丧失突变。
35.权利要求34的方法,其中所述突变选自表3中列出的突变。
36.权利要求35的方法,其中所述引导核苷酸序列选自表3中列出的引导核苷酸序列。
37.权利要求34的方法,其中所述功能丧失突变在所述PCSK9编码序列中引入提前终止密码子,其导致截短的或非功能性的PCSK9蛋白。
38.权利要求37的方法,其中所述提前终止密码子是TAG(琥珀)、TGA(乳白)或TAA(赭石)。
39.权利要求38的方法,其中所述提前终止密码子经由所述编码链上的第一个C的脱氨基从CAG至TAG变化生成。
40.权利要求38的方法,其中所述提前终止密码子经由所述编码链上的第一个C的脱氨基从CGA至TGA变化生成。
41.权利要求38的方法,其中所述提前终止密码子经由所述编码链上的第一个C的脱氨基从CAA至TAA变化生成。
42.权利要求38的方法,其中所述提前终止密码子经由所述互补链上的第二个C的脱氨基从TGG至TAG变化生成。
43.权利要求38的方法,其中所述提前终止密码子经由所述互补链上的第三个C的脱氨基从TGG至TGA变化生成。
44.权利要求38的方法,其中所述提前终止密码子经由所述编码链上的C的脱氨基和所述互补链上的C的脱氨基从CGG至TAG或CGA至TAA变化生成。
45.权利要求37-44中任一项的方法,其中所述引导核苷酸序列选自表6中列出的引导核苷酸序列(SEQ ID NO:938-1123)。
46.权利要求37的方法,其中引入串联的提前终止密码子。
47.权利要求46的方法,其中所述突变选自下组:W10X-W11X、Q99X-Q101X、Q342X-Q344X和Q554X-Q555X,其中X是终止密码子。
48.权利要求37的方法,其中所述提前终止密码子在结构上去稳定化突变后引入。
49.权利要求48的方法,其中所述去稳定化突变选自下组:P530S/L、P581S/L和P618S/L。
50.权利要求48的方法,其中所述提前终止密码子选自下组:Q531X、R582X和Q619X,其中X是终止密码子。
51.权利要求50的方法,其中用于引入所述提前终止密码子的所述引导核苷酸序列选自SEQ ID NO:938-1123,并且其中用于引入所述结构上去稳定化突变的所述引导核苷酸序列选自SEQ ID NO:579-937。
52.权利要求34的方法,其中所述突变使PCSK9蛋白质折叠去稳定化。
53.权利要求52的方法,其中所述突变选自表4中列出的突变。
54.权利要求53的方法,其中所述引导核苷酸序列选自表4中列出的引导核苷酸序列(SEQ ID NO:579-937)。
55.权利要求1-31中任一项的方法,其中所述C至T变化发生在所述编码PCSK9的多核苷酸的非编码区中的剪接位点处。
56.权利要求55的方法,其中所述C至T变化发生在内含子-外显子接合处。
57.权利要求55的方法,其中所述C至T变化发生在剪接供体位点处。
58.权利要求55的方法,其中所述C至T变化发生在剪接受体位点处。
59.权利要求55的方法,其中所述C至T变化发生在与起始密码子(AUG)中G碱基配对的C碱基处。
60.权利要求55-59中任一项的方法,其中所述C至T变化阻止PCSK9mRNA成熟或消除PCSK9表达。
61.权利要求60的方法,其中所述引导核苷酸序列选自表8中列出的引导核苷酸序列(SEQ ID NO:1124-1309)。
62.权利要求1-61中任一项的方法,其中PAM序列位于变化的C的3’。
63.权利要求1-61中任一项的方法,其中PAM序列位于变化的C的5’。
64.权利要求62的方法,其中所述PAM序列选自下组:NGG、NGAN、NGNG、NGAG、NGCG、NNGRRT、NGGNG、NGRRN、NNNRRT、NNNGATT、NNAGAA和NAAAC,其中Y是嘧啶,R是嘌呤以及N是任何核碱基。
65.权利要求63的方法,其中所述PAM序列选自下组:NNT、NNNT和YNT,其中Y是嘧啶以及N是任何核碱基。
66.权利要求1-61中任一项的方法,其中没有PAM序列位于所述靶C碱基的3’。
67.权利要求1-61中任一项的方法,其中没有PAM序列位于所述靶C碱基的5’。
68.权利要求1-61中任一项的方法,其中没有PAM序列位于所述靶C碱基的3’或5’。
69.权利要求1-68中任一项的方法,其中将至少1、2、3、4、5、6、7、8、9或10个突变引入到所述编码PCSK9的多核苷酸中。
70.权利要求1的方法,其中所述引导核苷酸序列是RNA(gRNA)。
71.权利要求1的方法,其中所述引导核苷酸序列是ssDNA(gDNA)。
72.编辑编码载脂蛋白C3(APOC3)蛋白的多核苷酸的方法,所述方法包括使所述编码APOC3的多核苷酸接触:
(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到所述编码APOC3的多核苷酸中的靶胞嘧啶(C)碱基,
其中所述接触导致所述融合蛋白对所述靶C碱基脱氨基,从而导致所述编码APOC3的多核苷酸中胞嘧啶(C)至胸腺嘧啶(T)变化。
73.权利要求72的方法,其中所述引导核苷酸序列-可编程DNA结合蛋白是切口酶。
74.权利要求73的方法,其中所述切口酶是Cas9切口酶。
75.权利要求74的方法,其中所述Cas9切口酶包含对应于SEQ ID NO:1中D10A突变或H840A突变的突变。
76.权利要求75的方法,其中所述Cas9切口酶包含对应于SEQ ID NO:1中D10A突变的突变。
77.权利要求72的方法,其中所述引导核苷酸序列-可编程DNA结合蛋白域选自下组:核酸酶无活性的Cas9(dCas9)域、核酸酶无活性的Cpf1域、核酸酶无活性的Argonaute域,及其变体。
78.权利要求77的方法,其中所述引导核苷酸序列-可编程DNA结合蛋白域是核酸酶无活性的Cas9(dCas9)域。
79.权利要求78的方法,其中所述dCas9域的氨基酸序列包含对应于SEQ ID NO:1中D10A和/或H840A突变的突变。
80.权利要求78的方法,其中所述dCas9域的氨基酸序列包含对应于SEQ ID NO:1中D10A突变的突变,并且其中所述dCas9域包含对应于SEQ ID NO:1的氨基酸840的位置处的组氨酸。
81.权利要求72的方法,其中所述C至T变化导致所述APOC3蛋白中的突变。
82.权利要求81的方法,其中所述APOC3蛋白中的所述突变是功能丧失突变。
83.权利要求81或82的方法,其中所述突变选自表14中列出的突变。
84.权利要求72-83中任一项的方法,其中所述引导核苷酸序列选自表14中列出的引导核苷酸序列(SEQ ID NO:1805-1855)。
85.权利要求72-84中任一项的方法,其中所述C至T变化发生在所述编码APOC3的多核苷酸的剪接位点处。
86.权利要求85的方法,其中所述C至T变化发生在内含子-外显子接合处。
87.权利要求85的方法,其中所述C至T变化发生在剪接供体位点处。
88.权利要求85的方法,其中所述C至T变化发生在剪接受体位点处。
89.权利要求85的方法,其中所述C至T变化发生在与起始密码子(AUG)中G碱基配对的C碱基处。
90.权利要求85-89中任一项的方法,其中所述C至T变化阻止APOC3mRNA成熟或消除APOC3表达。
91.权利要求85-89中任一项的方法,其中所述引导核苷酸序列选自表15中列出的引导核苷酸序列(SEQ ID NO:1856-1906)。
92.编辑编码低密度脂蛋白受体(LDL-R)蛋白的多核苷酸的方法,所述方法包括使所述编码LDL-R的多核苷酸接触:
(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到所述编码LDL-R的多核苷酸中的靶胞嘧啶(C)碱基,
其中所述接触导致所述融合蛋白对所述靶C碱基脱氨基,从而导致所述编码LDLR的多核苷酸中胞嘧啶(C)至胸腺嘧啶(T)变化。
93.权利要求92的方法,其中所述引导核苷酸序列选自SEQ ID NO:1792-1799。
94.编辑编码LDL受体的诱导性降解物(IDOL)蛋白的多核苷酸的方法,所述方法包括使所述编码IDOL的多核苷酸接触:
(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到所述编码IDOL的多核苷酸中的靶C碱基,
其中所述接触导致所述融合蛋白对所述靶C碱基脱氨基,从而导致所述编码IDOL的多核苷酸中胞嘧啶(C)至胸腺嘧啶(T)变化。
95.权利要求94的方法,其中所述引导核苷酸序列选自SEQ ID NO:1788-1791。
96.权利要求1-95中任一项的方法,其中所述方法在体外实施。
97.权利要求96的方法,其中所述方法在培养的细胞中实施。
98.权利要求1-95中任一项的方法,其中所述方法在体内实施。
99.权利要求98的方法,其中所述方法在哺乳动物中实施。
100.权利要求99的方法,其中所述哺乳动物是啮齿动物。
101.权利要求100的方法,其中所述哺乳动物是人。
102.编辑编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸的方法,所述方法包括使所述编码PCSK9的多核苷酸接触融合蛋白,所述融合蛋白包含:(a)可编程DNA结合蛋白域;和(b)脱氨酶域,
其中所述接触导致所述融合蛋白对所述靶碱基脱氨基,从而导致所述编码PCSK9的多核苷酸中碱基变化。
103.权利要求102的方法,其中所述可编程DNA结合域包含锌指核酸酶(ZFN)域。
104.权利要求102的方法,其中所述可编程DNA结合域包含转录激活物样效应物(TALE)域。
105.权利要求102的方法,其中所述可编程DNA结合域是引导核苷酸序列-可编程DNA结合蛋白域。
106.权利要求105的方法,其中所述可编程DNA结合域选自下组:核酸酶无活性的Cas9域、核酸酶无活性的Cpf1域、核酸酶无活性的Argonaute域,及其变体。
107.权利要求105或106的方法,其中所述可编程DNA结合域与引导核苷酸序列缔合。
108.权利要求102-107中任一项的方法,其中所述脱氨酶是胞嘧啶脱氨酶。
109.权利要求94的方法,其中所述靶碱基是胞嘧啶(C)碱基并且所述靶C碱基的脱氨基导致C至胸腺嘧啶(T)变化。
110.组合物,其包含:
(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;和
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸。
111.组合物,其包含:
(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸;和
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码载脂蛋白C3蛋白的多核苷酸。
112.组合物,其包含:
(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸;
(iii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码载脂蛋白C3蛋白的多核苷酸;和
(iv)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码低密度脂蛋白受体蛋白的多核苷酸。
113.组合物,其包含:
(i)融合蛋白,其包含:(a)引导核苷酸序列-可编程DNA结合蛋白域;和(b)胞嘧啶脱氨酶域;
(ii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码前蛋白质转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)蛋白的多核苷酸;
(iii)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码载脂蛋白C3蛋白的多核苷酸;
(iv)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码低密度脂蛋白受体蛋白的多核苷酸;和
(v)引导核苷酸序列,其将(i)的所述融合蛋白靶向到编码LDL受体的诱导性降解物蛋白的多核苷酸。
114.权利要求110-113中任一项的组合物,其中所述引导核苷酸序列-可编程DNA结合蛋白是切口酶。
115.权利要求114的方法,其中所述切口酶是Cas9切口酶。
116.权利要求115的方法,其中所述Cas9切口酶包含对应于SEQ ID NO:1中D10A突变或H840A突变的突变。
117.权利要求116的方法,其中所述Cas9切口酶包含对应于SEQ ID NO:1中D10A突变的突变。
118.权利要求110-117中任一项的组合物,其中(ii)的所述引导核苷酸序列选自SEQID NO:336-1309。
119.权利要求111-117中任一项的组合物,其中(iii)的所述引导核苷酸序列选自SEQID NO:1806-1906。
120.权利要求112-117中任一项的组合物,其中(iv)的所述引导核苷酸序列选自SEQID NO:1792-1799。
121.权利要求113-117中任一项的组合物,其中(v)的所述引导核苷酸序列选自SEQ IDNO:1788-1791。
122.组合物,其包含编码权利要求110-121中任一项的融合蛋白的核酸和权利要求96-103中任一项的引导核苷酸序列。
123.权利要求110-122中任一项的组合物,其进一步包含药学上可接受的载体。
124.加强LDL受体介导的LDL胆固醇清除的方法,所述方法包括向有此需要的受试者施用治疗有效量的权利要求110-123中任一项的组合物。
125.降低受试者中循环胆固醇水平的方法,所述方法包括向有此需要的受试者施用治疗有效量的权利要求110-123中任一项的组合物。
126.治疗状况的方法,所述方法包括向有此需要的受试者施用治疗有效量的权利要求110-123中任一项的组合物。
127.权利要求126的方法,其中所述状况是高胆固醇血症、总胆固醇水平升高、低密度脂蛋白(LDL)水平升高、LDL-胆固醇水平升高、高密度脂蛋白水平降低、肝脏脂肪变性、冠心病、缺血、中风、外周血管疾病、血栓形成、2型糖尿病、高血压、动脉粥样硬化、肥胖、阿尔茨海默氏病、神经变性或其组合。
128.试剂盒,其包含权利要求110-123中任一项的组合物。
CN201780087049.7A 2016-12-23 2017-12-22 Pcsk9的基因编辑 Pending CN110352242A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662438869P 2016-12-23 2016-12-23
US62/438,869 2016-12-23
PCT/US2017/068105 WO2018119354A1 (en) 2016-12-23 2017-12-22 Gene editing of pcsk9

Publications (1)

Publication Number Publication Date
CN110352242A true CN110352242A (zh) 2019-10-18

Family

ID=61006360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780087049.7A Pending CN110352242A (zh) 2016-12-23 2017-12-22 Pcsk9的基因编辑

Country Status (10)

Country Link
US (1) US20180237787A1 (zh)
EP (1) EP3559223A1 (zh)
JP (1) JP7456605B2 (zh)
KR (2) KR102569848B1 (zh)
CN (1) CN110352242A (zh)
AU (1) AU2017382323A1 (zh)
CA (1) CA3048479A1 (zh)
GB (2) GB2605925B (zh)
IL (1) IL267500A (zh)
WO (1) WO2018119354A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108342387A (zh) * 2017-01-24 2018-07-31 谭旭 Pcsk9抑制剂类降血脂药的递送系统和生物制剂

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
IL258821B (en) 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
CN109804066A (zh) 2016-08-09 2019-05-24 哈佛大学的校长及成员们 可编程cas9-重组酶融合蛋白及其用途
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR102622411B1 (ko) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
JP2020505062A (ja) * 2017-01-17 2020-02-20 インスティテュート フォー ベーシック サイエンスInstitute For Basic Science Dna一本鎖切断による塩基編集非標的位置確認方法
JP7277052B2 (ja) * 2017-02-22 2023-05-18 クリスパー セラピューティクス アーゲー プロタンパク質転換酵素サブチリシン/ケキシン9型(pcsk9)関連障害の処置のための組成物および方法
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
GB2575930A (en) 2017-03-23 2020-01-29 Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN107164377A (zh) * 2017-06-12 2017-09-15 王小平 基于碱基编辑的基因敲除方法及其应用
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
WO2019079347A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
EP3592140A1 (en) 2018-03-19 2020-01-15 Regeneron Pharmaceuticals, Inc. Transcription modulation in animals using crispr/cas systems
WO2020010186A1 (en) * 2018-07-06 2020-01-09 Derek Klarin Pcsk9 variants
CN109182379A (zh) * 2018-08-21 2019-01-11 杭州观梓健康科技有限公司 一种具有同时降低甘油三酯和胆固醇作用的干细胞及其制备方法和用途
CN112867792A (zh) * 2018-08-23 2021-05-28 桑格摩生物治疗股份有限公司 工程化靶特异性碱基编辑器
CN109679989A (zh) * 2018-12-29 2019-04-26 北京市农林科学院 一种提高碱基编辑系统编辑效率的方法
WO2020191249A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
CA3137903A1 (en) * 2019-04-25 2020-10-29 The Board Of Trustees Of The Leland Stanford Junior University Engineered cas9 with broadened dna targeting range
WO2021016086A1 (en) * 2019-07-19 2021-01-28 Pairwise Plants Services, Inc. Optimized protein linkers and methods of use
WO2021046155A1 (en) 2019-09-03 2021-03-11 Voyager Therapeutics, Inc. Vectorized editing of nucleic acids to correct overt mutations
WO2021142342A1 (en) * 2020-01-10 2021-07-15 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
IL297193A (en) * 2020-04-09 2022-12-01 Verve Therapeutics Inc Basic editing of pcks9 and methods of using it to treat diseases
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
EP4185699A1 (en) * 2020-07-21 2023-05-31 Pairwise Plants Services, Inc. Optimized protein linkers and methods of use
CN112779267B (zh) * 2020-12-15 2022-10-21 上海市农业生物基因中心 水稻OsPPR406基因及其编码蛋白与应用
WO2022132996A1 (en) * 2020-12-17 2022-06-23 Monsanto Technology Llc Engineered ssdnase-free crispr endonucleases
WO2022204087A1 (en) * 2021-03-22 2022-09-29 Emendobio Inc. Compositions and methods for treating hypercholesterolemia
CN117396602A (zh) 2021-05-27 2024-01-12 阿斯利康(瑞典)有限公司 具有增强的稳定性的cas9效应蛋白
WO2023152371A1 (en) 2022-02-14 2023-08-17 Proqr Therapeutics Ii B.V. Guide oligonucleotides for nucleic acid editing in the treatment of hypercholesterolemia
WO2023212715A1 (en) 2022-04-28 2023-11-02 The Broad Institute, Inc. Aav vectors encoding base editors and uses thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140179770A1 (en) * 2012-12-12 2014-06-26 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
US20150166980A1 (en) * 2013-12-12 2015-06-18 President And Fellows Of Harvard College Fusions of cas9 domains and nucleic acid-editing domains
WO2015133554A1 (ja) * 2014-03-05 2015-09-11 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体
WO2016094845A2 (en) * 2014-12-12 2016-06-16 Woolf Tod M Compositions and methods for editing nucleic acids in cells utilizing oligonucleotides

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4880635B1 (en) 1984-08-08 1996-07-02 Liposome Company Dehydrated liposomes
US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
JPH0825869B2 (ja) 1987-02-09 1996-03-13 株式会社ビタミン研究所 抗腫瘍剤包埋リポソ−ム製剤
US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
WO2002102994A2 (en) 2001-03-21 2002-12-27 Human Genome Sciences, Inc. Human secreted proteins
EP1067182A3 (en) 1999-07-08 2001-11-21 Helix Research Institute Secretory protein or membrane protein
US20030119038A1 (en) 1999-09-09 2003-06-26 Bingham Brendan William NARC1, novel subtilase-like homologs
US7029895B2 (en) 1999-09-27 2006-04-18 Millennium Pharmaceuticals, Inc. 27411, a novel human PGP synthase
JP2003512840A (ja) 1999-10-22 2003-04-08 ミレニアム・ファーマシューティカルズ・インコーポレイテッド ラット脳に由来する核酸分子およびプログラム細胞死モデル
AU1448701A (en) 1999-11-09 2001-06-06 Human Genome Sciences, Inc. 15 human secreted proteins
EP1257572A2 (en) 2000-02-07 2002-11-20 Millennium Pharmaceuticals, Inc. Narc-1, subtilase-like homologs
EP1274720A4 (en) 2000-04-12 2004-08-18 Human Genome Sciences Inc ALBUMIN FUSED PROTEINS
AU2001269836A1 (en) 2000-06-16 2002-01-02 Incyte Genomics, Inc. Proteases
EP1309614A2 (en) 2000-08-11 2003-05-14 Eli Lilly And Company Novel secreted proteins and their uses
WO2002046383A2 (en) 2000-12-08 2002-06-13 Incyte Genomics, Inc. Protein modification and maintenance molecules
EP1440981A3 (en) 2003-01-21 2005-11-23 Research Association for Biotechnology Full-length human cdna
EP1471152A1 (en) 2003-04-25 2004-10-27 Institut National De La Sante Et De La Recherche Medicale (Inserm) Mutations in the human PCSK9 gene associated to hypercholesterolemia
US7572618B2 (en) * 2006-06-30 2009-08-11 Bristol-Myers Squibb Company Polynucleotides encoding novel PCSK9 variants
EP2424877A4 (en) 2009-04-28 2013-01-02 Harvard College SUPERCHARGED PROTEINS FOR CELL PENETRATION
WO2011091396A1 (en) 2010-01-25 2011-07-28 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of mylip/idol gene
US9526784B2 (en) * 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9322037B2 (en) * 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
IL258821B (en) 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
CN105462968B (zh) * 2015-12-07 2018-10-16 北京信生元生物医学科技有限公司 一种靶向apoCⅢ的CRISPR-Cas9系统及其应用
CN106244557B (zh) * 2016-08-29 2019-10-25 中国农业科学院北京畜牧兽医研究所 定点突变ApoE基因与LDLR基因的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140179770A1 (en) * 2012-12-12 2014-06-26 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
US20150166980A1 (en) * 2013-12-12 2015-06-18 President And Fellows Of Harvard College Fusions of cas9 domains and nucleic acid-editing domains
CN105934516A (zh) * 2013-12-12 2016-09-07 哈佛大学的校长及成员们 用于基因编辑的cas变体
WO2015133554A1 (ja) * 2014-03-05 2015-09-11 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体
WO2016094845A2 (en) * 2014-12-12 2016-06-16 Woolf Tod M Compositions and methods for editing nucleic acids in cells utilizing oligonucleotides

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
ALEXIS C. KOMOR ET AL: "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage", 《N AT U R E》, pages 420 - 436 *
KEIJI NISHIDA ET AL: "Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems", 《SCIENCE》 *
KEIJI NISHIDA ET AL: "Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems", 《SCIENCE》, 16 September 2016 (2016-09-16), pages 1248 - 1257 *
KOUICHI KITAMURA ET AL: "Uracil DNA Glycosylase Counteracts APOBEC3G-Induced Hypermutation of Hepatitis B Viral Genomes: Excision Repair of Covalently Closed Circular DNA", 《PLOS PATHOGENS》, pages 1 - 15 *
QIURONG DING ET AL: "Permanent Alteration of PCSK9 With In Vivo CRISPR-Cas9 Genome Editing", 《CIRCULATION RESEARCH》 *
QIURONG DING ET AL: "Permanent Alteration of PCSK9 With In Vivo CRISPR-Cas9 Genome Editing", 《CIRCULATION RESEARCH》, 15 August 2014 (2014-08-15), pages 488 - 452 *
XIAO WANG ET AL: "CRISPR-Cas9 Targeting of PCSK9 in Human Hepatocytes In Vivo—Brief Report", 《ARTERIOSCLER THROMB VASC BIOL》 *
XIAO WANG ET AL: "CRISPR-Cas9 Targeting of PCSK9 in Human Hepatocytes In Vivo—Brief Report", 《ARTERIOSCLER THROMB VASC BIOL》, 30 May 2016 (2016-05-30), pages 783 - 786 *
丁秋蓉等: "心血管疾病的基因治疗", 《上海大学学报(自然科学版)》, vol. 22, no. 3, pages 270 - 279 *
肖文虎等: "PCSK9结构与功能", 《中国生物化学与分子生物学报》 *
肖文虎等: "PCSK9结构与功能", 《中国生物化学与分子生物学报》, no. 03, 20 March 2009 (2009-03-20), pages 213 - 218 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108342387A (zh) * 2017-01-24 2018-07-31 谭旭 Pcsk9抑制剂类降血脂药的递送系统和生物制剂
CN108342387B (zh) * 2017-01-24 2021-09-24 谭旭 Pcsk9抑制剂类降血脂药的递送系统和生物制剂

Also Published As

Publication number Publication date
JP2020503027A (ja) 2020-01-30
KR102569848B1 (ko) 2023-08-25
KR20190096413A (ko) 2019-08-19
GB2605925B (en) 2023-02-22
GB202210167D0 (en) 2022-08-24
US20180237787A1 (en) 2018-08-23
GB2572918A (en) 2019-10-16
IL267500A (en) 2019-08-29
KR20230125856A (ko) 2023-08-29
AU2017382323A1 (en) 2019-07-11
GB2605925A (en) 2022-10-19
WO2018119354A1 (en) 2018-06-28
EP3559223A1 (en) 2019-10-30
CA3048479A1 (en) 2018-06-28
GB201910529D0 (en) 2019-09-04
GB2572918B (en) 2023-02-15
JP7456605B2 (ja) 2024-03-27

Similar Documents

Publication Publication Date Title
CN110352242A (zh) Pcsk9的基因编辑
US11820969B2 (en) Editing of CCR2 receptor gene to protect against HIV infection
US20240035006A1 (en) Crystal structure of crispr cpf1
Koonin et al. Origins and evolution of CRISPR-Cas systems
US20230287373A1 (en) Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
US20240093193A1 (en) Dead guides for crispr transcription factors
CN109152848B (zh) 抗-crispr化合物以及使用方法
WO2020236982A1 (en) Aav delivery of nucleobase editors
KR20210077732A (ko) Nme2cas9-데아미나아제 융합 단백질에 의한 프로그램 가능한 dna 염기 편집
CN109642231A (zh) Vi型crispr直向同源物和系统
JP2019526248A (ja) プログラム可能cas9−リコンビナーゼ融合タンパク質およびその使用
AU2015369725A1 (en) CRISPR having or associated with destabilization domains
WO2015089473A9 (en) Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
CA2932439A1 (en) Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
AU2017358122B2 (en) Artificially engineered SC function control system
WO2023081855A1 (en) Base editing enzymes
US20210093679A1 (en) Engineered gut microbes and uses thereof
WO2023081070A1 (en) Nme2Cas9 INLAID DOMAIN FUSION PROTEINS
WO2020059708A1 (ja) Casタンパク質の活性調節法
Sarma et al. It takes two to tango with CRISPR: a history and overview of augmenting the technology for genetic engineering
RU2771826C9 (ru) Новые ферменты crispr и системы

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination