CN114144519A - 单碱基置换蛋白以及包含其的组合物 - Google Patents

单碱基置换蛋白以及包含其的组合物 Download PDF

Info

Publication number
CN114144519A
CN114144519A CN202080053009.2A CN202080053009A CN114144519A CN 114144519 A CN114144519 A CN 114144519A CN 202080053009 A CN202080053009 A CN 202080053009A CN 114144519 A CN114144519 A CN 114144519A
Authority
CN
China
Prior art keywords
single base
base substitution
nucleic acid
protein
fusion protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080053009.2A
Other languages
English (en)
Inventor
裵承敏
金荣勋
李政埈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toolgen Inc
Original Assignee
Toolgen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toolgen Inc filed Critical Toolgen Inc
Publication of CN114144519A publication Critical patent/CN114144519A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/71Receptors; Cell surface antigens; Cell surface determinants for growth factors; for growth regulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2497Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/02Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
    • C12Y302/0202DNA-3-methyladenine glycosylase I (3.2.2.20), i.e. adenine DNA glycosylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/02Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
    • C12Y302/02027Uracil-DNA glycosylase (3.2.2.27)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Analytical Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Seasonings (AREA)
  • General Preparation And Processing Of Foods (AREA)

Abstract

本申请涉及单碱基置换蛋白;包含该蛋白的组合物;及其用途。

Description

单碱基置换蛋白以及包含其的组合物
技术领域
本申请涉及使用CRISPR酶、脱氨酶和DNA糖基化酶,利用用于单碱基置换的蛋白质将胞嘧啶(C)或腺嘌呤(A)置换为任意碱基的技术。
背景技术
CRISPR酶联脱氨酶已被用于通过编辑发生点突变的基因座位来治疗遗传性紊乱,或在人或真核细胞的基因中诱导靶向的单核苷酸多态性(SNP)。
目前报道的CRISPR酶联脱氨酶包括:
1)碱基编辑器(base editor,BE),包括(i)衍生自酿脓链球菌(S.pyogenes)的催化缺陷的Cas9(dCas9)或D10A Cas9切口酶(nCas9),以及(ii)rAPOBEC1,大鼠的胞苷脱氨酶;
2)靶标-AID,包括(i)dCas9或nCas9,以及(ii)PmCDA1(其为海七鳃鳗或人AID的激活诱导的胞苷脱氨酶(AID)直系同源物);
3)CRISPR-X,包括MS2RNA发夹连接的sgRNA和dCas9,以募集与MS2结合蛋白融合的过度活跃的AID变体;以及
4)与胞苷脱氨酶融合的锌指蛋白或转录激活因子样效应物(TALE)。
与传统DNA糖基化酶一起使用的CRISPR酶联脱氨酶可在核苷酸中仅用胸腺嘧啶(T)置换胞嘧啶(C),或仅用鸟嘌呤(G)置换腺嘌呤(A)。在一个实例中,其中融合了Cas9、胞苷脱氨酶和尿嘧啶DNA糖基化酶抑制剂(UGI)的材料用于将胞嘧啶(C)置换为胸腺嘧啶(T)。该材料用于使用诱导尿嘧啶(U)不被DNA糖基化酶去除的机制来将尿嘧啶(U)置换为胸腺嘧啶(T)。同样,最近有报道称,使用腺苷脱氨酶代替胞苷脱氨酶能够仅用鸟嘌呤(G)置换腺嘌呤(A)。
因此,本申请的发明人打算通过使用CRISPR酶、脱氨酶和DNA糖基化酶开发用于单碱基置换的蛋白质,从而用任意碱基置换胞嘧啶(C)或腺嘌呤(A)。该技术的开发可用于由突变引起的遗传疾病的鉴别,以及用于通过分析影响由SNP而来的疾病易感性或对药物具有耐药性的核酸序列进行的药物开发和治疗剂,并将在未来更有效地开发药物以及提高治疗效果。
发明内容
[技术问题]
传统的CRISPR酶联脱氨酶局限于胞嘧啶(C)或腺嘌呤(A)会被转化为特定的碱基(A或G)。由于这些限制,诸如由突变引起的遗传疾病的鉴别、由SNP而来的疾病易感性以及相关治疗剂的开发等的研究范围受到限制。
因此,迫切需要开发能够用任意碱基(A、T、C、G或U)而非特定碱基来置换胞嘧啶(C)或腺嘌呤(A)的手段。
本申请旨在提供用于单碱基置换的蛋白质或用于单碱基置换的复合物,或包含它们的用于单碱基置换的组合物,及其用途。
本申请旨在提供编码用于单碱基置换的蛋白质的核酸序列或包含所述核酸序列的载体。
本申请旨在提供用于单碱基置换的方法。
本申请旨在提供用于单碱基置换的蛋白质或用于单碱基置换的复合物或包含它们的用于单碱基置换的组合物的多种用途。
[技术方案]
本申请提供了用于单碱基置换的融合蛋白或编码该融合蛋白的核酸。
本申请提供了包含编码用于单碱基置换的融合蛋白的核酸的载体。
本申请提供了用于单碱基置换的复合物。
本申请提供了用于单碱基置换的组合物。
本申请提供了用于单碱基置换的方法。
本申请提供了使用本申请的用于单碱基置换的融合蛋白、用于单碱基置换的复合物、用于单碱基置换的组合物进行表位筛选、耐药基因或蛋白质筛选、药物敏化筛选或病毒抗性基因或蛋白质筛选的用途。
本申请提供了用于单碱基置换的融合蛋白或编码该融合蛋白的核酸,所述融合蛋白包含(a)CRISPR酶或其变体、(b)脱氨酶、和(c)DNA糖基化酶或其变体。其中,用于单碱基置换的融合蛋白诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的胞嘧啶或腺嘌呤的置换。
本申请提供了用于单碱基置换的融合蛋白或编码该融合蛋白的核酸,所述融合蛋白包含以下的任一组分:(i)N末端-[CRISPR酶]-[脱氨酶]-[DNA糖基化酶]-C末端;(ii)N末端-[CRISPR酶]-[DNA糖基化酶]-[脱氨酶]-C末端;(iii)N末端-[脱氨酶]-[CRISPR酶]-[DNA糖基化酶]-C末端;(iv)N末端-[脱氨酶]-[DNA糖基化酶]-[CRISPR酶]-C末端;(v)N末端-[DNA糖基化酶]-[CRISPR酶]-[脱氨酶]-C末端;以及(vi)N末端-[DNA糖基化酶]-[脱氨酶]-[CRISPR酶]-C末端。
本申请提供了用于单碱基置换的复合物,所述复合物包含(a)CRISPR酶或其变体;(b)脱氨酶;(c)DNA糖基化酶;和(d)两个或更多个结合结构域。其中,用于单碱基置换的融合蛋白诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的胞嘧啶或腺嘌呤的置换。
根据本申请,在用于单碱基置换的复合物中,CRISPR酶、脱氨酶和DNA糖基化酶中的每一个与一个或多个结合结构域连接。其中,所述CRISPR酶、所述脱氨酶和所述DNA糖基化酶通过结合结构域之间的相互作用形成所述复合物。
根据本申请,在用于单碱基置换的复合物中,选自于CRISPR酶、脱氨酶和DNA糖基化酶中的任一种与第一结合结构域和第二结合结构域连接。其中,第一结合结构域与另一组分的结合结构域为相互作用对,并且第二结合结构域与再一结合结构域的结合结构域为相互作用对。其中,所述复合物通过所述对形成。
根据本申请,用于单碱基置换的复合物包含(i)第一融合蛋白,所述第一融合蛋白包含选自于CRISPR酶、脱氨酶和DNA糖基化酶的两种组分以及第一结合结构域,以及(ii)第二融合蛋白,所述第二融合蛋白包含以上未被选择的另一组分以及第二结合结构域。其中,第一结合结构域和第二结合结构域为相互作用对,并且所述复合物通过所述对形成。
根据本申请,用于单碱基置换的复合物包含(i)第一融合蛋白,所述第一融合蛋白包含脱氨酶、DNA糖基化酶和第一结合结构域,以及(ii)第二融合蛋白,所述第二融合蛋白包含CRISPR酶和第二结合结构域。
其中,第一结合结构域为单链可变片段(scFv),并且第二融合蛋白进一步包含至少一个或多个结合结构域,其中所述进一步包含的结合结构域为GCN4肽。其中,第一融合蛋白中的两个或更多个可通过与GCN4肽中的任一个相互作用形成复合物。
本申请可提供用于单碱基置换的组合物,所述组合物包含(a)向导RNA或编码所述向导RNA的核酸,以及(b)i)如权利要求1所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,或ii)如权利要求13所述的用于单碱基置换的复合物。其中,所述向导RNA与靶核酸序列互补结合,其中,与所述向导RNA结合的靶核酸序列为15bp至25bp。其中,用于单碱基置换的融合蛋白或用于单碱基置换的复合物诱导任意碱基对包含靶核酸序列的靶区域中存在的一个或多个胞嘧啶或腺嘌呤的置换。
根据本申请,用于单碱基置换的组合物可包括一个或多个载体。
本申请可提供用于单碱基置换的方法,所述方法包括:使(i)和(ii)在体外(invitro)或离体(ex vivo)与包含靶核酸序列的靶区域接触,其中,(i)为向导RNA,(ii)为如权利要求1所述的用于单碱基置换的融合蛋白或如权利要求12所述的用于单碱基置换的复合物。其中,所述向导RNA与靶核酸序列互补结合,其中,与所述向导RNA结合的靶核酸序列为15bp至25bp,并且其中,用于单碱基置换的融合蛋白或用于单碱基置换的复合物诱导任意碱基对包含靶核酸序列的靶区域中存在的一个或多个胞嘧啶或腺嘌呤的置换。
其中,所述脱氨酶为胞苷脱氨酶,并且所述DNA糖基化酶为尿嘧啶-DNA糖基化酶或其变体。其中,用于单碱基置换的融合蛋白诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的C(胞嘧啶)的置换。
其中,所述胞苷脱氨酶可为APOBEC,激活诱导的胞苷脱氨酶(AID)或其变体。
其中,所述脱氨酶可为腺苷脱氨酶,并且所述DNA糖基化酶可为烷基腺嘌呤DNA糖基化酶或其变体。其中,用于单碱基置换的融合蛋白可诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的腺嘌呤的置换。
其中,所述腺苷脱氨酶可为TadA、Tad2p、ADA、ADA1、ADA2、ADAR2、ADAT2、ADAT3或它们的变体。
其中,所述结合结构域可为选自于FRB结构域、FKBP二聚化结构域、内含肽、ERT结构域、VPR结构域、GCN4肽、单链可变片段(scFv)中的任一种,或形成异二聚体的结构域中的任一种。
其中,在用于单碱基置换的复合物中,所述对可为选自于以下(i)至(vi)中的任一种:(i)FRB结构域和FKBP二聚化结构域;(ii)第一内含肽和第二内含肽;(iii)ERT结构域和VPR结构域;(iv)GCN4肽和单链可变片段(scFv);以及(v)用于形成异二聚体的第一结构域和第二结构域。
[有益效果]
本申请提供了用于单碱基置换的蛋白和/或编码所述蛋白的核酸。
本申请提供了用于单碱基置换的组合物,所述组合物包含用于单碱基置换的蛋白和/或编码所述蛋白的核酸。
本申请提供了用于单碱基置换的蛋白或包含所述蛋白的用于单碱基置换的组合物的各种用途。
附图说明
图1为说明使用用于单碱基置换的蛋白将靶核酸区域中的胞嘧啶(C)置换为N(A、T或G)的方法的图。
图2为说明使用用于单碱基置换的蛋白将靶核酸区域中的腺嘌呤(A)置换为N(C、T或G)的方法的图。
图3为说明用于单碱基置换的融合蛋白诱导任意碱基置换胞嘧啶的各种设计的图。
图4为说明用于单碱基置换的融合蛋白诱导任意碱基置换腺嘌呤的各种设计的图。
图5(a)为具有融合至羧基端的10个相同GCN4肽的nCas9;以及,图5(b)和图5(c)为复合物(scFv-Apobec-UNG和scfv-UNG-Apobec)的各种设计,其中单链可变片段(scFv)分别与Apobec和UNG融合。
图6(a)为说明复合物的设计的图,其中,5个相同的GCN4肽与nCas9的N末端和C末端各自融合,一个scFv与APOBEC融合,另一个scFv与UNG融合。图6(b)为说明复合物的设计的图表,其中,5个相同的GCN4肽与nCas9的C末端融合,一个scFv与APOBEC融合,另一个scFv与UNG融合。
图7(a)示出了BE3 WT和bpNLS BE3的设计;以及,图7(b)为示出了在HEK细胞中使用BE3 WT和bpNLS BE3进行的单碱基置换效率的图表。
图8为示出了在Hela细胞中使用BE3 WT、ncas-delta UGI、UNG-ncas和ncas-UNG进行的C至G、C至T或者C至A的置换率的图。ncas-delta UGI为从BE3 WT中移除尿嘧啶DNA-糖基化酶抑制剂(UGI)的蛋白。
图9示出了在靶区域中诱导碱基置换的核酸序列(SEQ ID No:1)。此外,图9还示出了在hela细胞中使用BE3 WT、bpNLS BE3、ncas-delta UGI、UNG-ncas和ncas-UNG进行的核酸序列(SEQ ID NO:1)中第15位胞嘧啶和第16位胞嘧啶的碱基置换率。
图10为确认在HEK细胞中靶向GX20 sgRNA的hEMX1靶核酸序列中的胞嘧啶置换的图表。
图11为示出了在HEK细胞中使用UNG-ncas和ncas-UNG进行的单碱基置换效率的一组图表。左图示出了GX20 sgRNA靶向的hEMX1靶核酸序列中的C至N置换率。右图示出了GX20sgRNA靶向的hEMX1靶核酸序列中13C、15C、16C和17C位置的C至G或C至A的置换率。
图12为确认Nureki nCas9是否在HEK细胞中的NG PAM处具有C至N碱基置换的一组图表。
图13为确认使用图5的用于单碱基置换的复合物是否发生C至N碱基置换的图表。
图14为鉴别使用图5的用于单碱基置换的复合物在PC9细胞中靶向hEMX1GX19sgRNA的核酸序列中发生置换的C的图表。
图15为示出了在PC9细胞中使用图5的用于单碱基置换的复合物在靶向hEMX1sgRNA的序列中的16C位置处的C至G、C至T或者C至A置换率的图表。
图16示出了编码使用nCas9的用于单碱基置换的蛋白的质粒的设计。用于单碱基置换的编码蛋白在图3(a)的1)中予以说明。
图17示出了使用Nureki nCas9的用于单碱基置换的CRISPR蛋白的质粒的设计。用于单碱基置换的编码蛋白在图3(c)的2)中予以说明。
图18示出了编码使用nCas9的用于单碱基置换的蛋白的质粒的设计。用于单碱基置换的编码蛋白在图3(a)的3)中予以说明。
图19示出了编码图4(a)中所示的用于单碱基置换的蛋白的质粒的设计。
图20示出了编码图4(b)中所示的用于单碱基置换的蛋白的质粒的设计。
图21为说明包含单链可变片段(scFv)的融合碱基置换结构域的结构的图。
图22至图24为示出在HEK细胞中使用用于单碱基置换的复合物的单碱基置换效率的图表,其中,图22示出了GX20 sgRNA靶向的hEMX1靶核酸序列(SEQ ID NO:1)中11C位置处的C至G、C至A或者C至G的置换率,图23示出了GX20 sgRNA靶向的hEMX1靶核酸序列(SEQ IDNO:1)中15C位置处的C至G、C至A或者C至G置换率,以及图24示出了GX20 sgRNA靶向的hEMX1靶核酸序列(SEQ ID NO:1)中16C位置处的C至G、C至A或者C至G置换率。
图25示出了sgRNA(SEQ ID NO:2-SEQ ID NO:20)中的三种(SEQ ID NO:2、SEQ IDNO:3和SEQ ID NO:19),其显示于发表在科学杂志《Nature》上标题为“Base Editing of A,T to G,C in Genomic DNA without DNA Cleavage”的文章的扩展数据图2中。
图26为示出了使用图25中选择的sgRNA1(SEQ ID NO:2)在HEK293T细胞中的A至N碱基置换率的一组图表。
图27为示出了使用图25中选择的sgRNA2(SEQ ID NO:3)在HEK293T细胞中的A至N碱基置换率的一组图表。
图28为示出了使用图25中选择的sgRNA3(SEQ ID NO:19)在HEK293T细胞中的A至N碱基置换率的一组图表。
图29为示出了使用分别能够与EGFR基因的一个区域互补结合的sgRNA1(SEQ IDNO:21)和sgRNA2(SEQ ID NO:22)在PC9细胞中的C至N碱基置换率的图表。
图30为示出了使用能够与EGFR基因的一个区域互补结合的sgRNA1(SEQ ID NO:21)和sgRNA2(SEQ ID NO:22)在PC9细胞中的C至A、C至T或者C至G碱基置换率的一组图表。
图31为分析在胞嘧啶的随机碱基置换后在补充有奥希替尼(osimertinib)的培养基中培养下存活的细胞的结果。
具体实施方式
除非另有定义,本说明书中使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管在本发明的实践或实验中可使用与本说明书中描述的方法和材料相似或等效的方法和材料,下文描述了合适的方法和材料。本说明书中提及的所有出版物、专利申请、专利和其它参考文献均通过引用的方式以其整体被并入。此外,所述材料、方法和实施例仅为说明性的而非限制。
本申请提供了用于单碱基置换的蛋白(单碱基置换蛋白),所述蛋白包含(a)CRISPR酶或其变体、(b)脱氨酶、以及(c)DNA糖基化酶或其变体。
本申请提供了用于单碱基置换的组合物,所述组合物包含用于单碱基置换的蛋白和(d)向导RNA。
此处,用于单碱基置换的蛋白可与向导RNA同时作用以诱导任意含氮碱基(nitrogenous base)对靶核酸序列中的一个或多个核苷酸中包含的胞嘧啶(C)或腺嘌呤(A)的置换。
根据本申请提供的用于单碱基置换的蛋白的(a)CRISPR酶和(d)向导RNA的组合可特异性地将所述用于单碱基置换的蛋白引导至包含靶核酸序列的靶区域。
此处,用于单碱基置换的蛋白的(b)脱氨酶和(c)DNA糖基化酶的组合可诱导另一碱基对靶区域中一个或多个核苷酸的碱基的置换。
含氮碱基
本文使用的“含氮碱基”是指嘌呤碱基或嘧啶碱基,其为核苷酸或核碱基的一种组成成分。
本文使用的含氮碱基可简称为碱基,并且所述碱基可指腺嘌呤(A)、胸腺嘧啶(T)、尿嘧啶(U)、羟基嘌呤(H)、鸟嘌呤(G)或胞嘧啶(C)。
本申请中碱基的缩写,例如A、T、C、G、U或H,在与碱基置换相关的上下文中使用时指含氮碱基。此外,当在与说明书中设定的SEQ ID NO、通用核酸、或核苷酸序列相关的上下文中使用时,它们是指本领域中通常使用的核酸或核苷酸。
在一个实例中,“用鸟嘌呤(G)置换腺嘌呤(A)”可意指将核酸序列上相同位置或相同类型的核苷酸中的含氮碱基从A置换为G。
在一个实例中,“用胸腺嘧啶(T)置换腺嘌呤(A)”可意指将核酸序列上相同位置或相同类型的核苷酸中的含氮碱基从A置换为T。
在一个实例中,“用胞嘧啶(C)置换腺嘌呤(A)”可意指将核酸序列上相同位置或相同类型的核苷酸中的含氮碱基从A置换为C。
在一个实例中,“用鸟嘌呤(G)置换胞嘧啶(C)”可意指核酸序列上相同位置或相同类型的核苷酸中的含氮碱基从C置换为G。
在一个实例中,“用胸腺嘧啶(T)置换胞嘧啶(C)”可意指核酸序列上相同位置或相同类型的核苷酸中的含氮碱基从C置换为T。
在一个实例中,“用腺嘌呤(A)置换胞嘧啶(C)”可意指核酸序列上相同位置或相同类型的核苷酸中的含氮碱基从C置换为A。
在一个实例中,“3'-ATGCAAA-5'”并非指含氮碱基,而是代表本领域通常使用的核酸序列或核苷酸序列。
碱基置换或碱基修饰
本文使用的“碱基置换”意指将靶基因中核苷酸的碱基置换为另一碱基。更具体而言,将靶区域中核苷酸的碱基用另一碱基来置换。
在一个实例中,碱基置换可意指将腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)、羟基嘌呤或尿嘧啶(U)变为另一碱基。
在一个示例性实施方式中,碱基置换可意指将腺嘌呤用胞嘧啶、胸腺嘧啶、尿嘧啶、羟基嘌呤或鸟嘌呤置换。
在一个示例性实施方式中,碱基置换可意指将胞嘧啶用腺嘌呤、胸腺嘧啶、尿嘧啶、羟基嘌呤或鸟嘌呤置换。
在一个示例性实施方式中,碱基置换可意指将鸟嘌呤用胞嘧啶、胸腺嘧啶、尿嘧啶、羟基嘌呤或腺嘌呤置换。
在一个示例性实施方式中,碱基置换可意指将胸腺嘧啶用腺嘌呤、胞嘧啶、尿嘧啶、羟基嘌呤或鸟嘌呤置换。
在一个示例性实施方式中,碱基置换可意指将尿嘧啶用胞嘧啶、胸腺嘧啶、腺嘌呤、羟基嘌呤或鸟嘌呤置换。
在一个示例性实施方式中,碱基置换可意指将羟基嘌呤用腺嘌呤、胸腺嘧啶、尿嘧啶或鸟嘌呤置换。
然而,本发明不限于此。
本文使用的“碱基置换”可为包含“碱基修饰”的概念。此处,修饰可意指通过碱基结构的修饰而变为另一碱基,并且碱基置换可意指碱基类型的改变。
在一个实例中,碱基修饰是改变腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)、羟基嘌呤或尿嘧啶(U)的化学结构。
在一个示例性实施方式中,碱基修饰可为通过腺嘌呤的脱氨基将腺嘌呤变为次黄嘌呤。
在一个示例性实施方式中,碱基修饰可为次黄嘌呤变为鸟嘌呤。
在一个示例性实施方式中,碱基修饰可为通过胞嘧啶的脱氨基将胞嘧啶变为尿嘧啶。
在一个示例性实施方式中,碱基修饰可为尿嘧啶变为胸腺嘧啶。
然而,本发明不限于此。
靶核酸序列——与向导RNA互补结合的核酸序列
靶核酸序列意指可以或能够与向导RNA互补结合的核苷酸序列,所述向导RNA为用于单碱基置换的组合物的组成成分。
在一个实例中,当细胞内双链DNA经受单碱基置换时,所述细胞内双链DNA由第一DNA链和第二DNA链组成。此处,所述双链DNA的第一DNA链和与第一DNA链互补的第二DNA链中的任一个都可包含靶核酸序列。包含靶核酸序列的第一DNA链或第二DNA链可与向导RNA结合。此处,与向导RNA结合的第一DNA链或第二DNA链中的核酸序列对应于靶核酸序列。
在一个实例中,当细胞内双链RNA经受单碱基置换时,所述细胞内双链RNA由第一RNA链和第二RNA链组成。所述双链RNA的第一RNA链和与第一RNA链互补的第二RNA链中的任一个都可包含靶核酸序列。包含靶核酸序列的第一RNA链或第二RNA链可与向导RNA结合。此处,与向导RNA结合的第一RNA链或第二RNA链的核酸序列对应于靶核酸序列。
在一个实例中,当细胞内双链DNA或RNA经受单碱基置换时,单链DNA或RNA可包含靶核酸序列。即,单链DNA或RNA可与向导RNA结合,并且此处,与向导RNA结合的核酸序列对应于靶核酸序列。
在一个实例中,所述靶核酸序列可为10bp、11bp、12bp、13bp、14bp、15bp、16bp、17bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、25bp、26bp、27bp、28bp、29bp或30bp或更多的核苷酸序列。
靶区域–包含碱基置换的核苷酸的区域
靶区域为包含通过用于单碱基置换的蛋白诱导碱基置换的核苷酸的区域。
靶区域为包含向导RNA结合的靶核酸序列的区域。此处,靶核酸序列可包含通过用于单碱基置换的蛋白诱导碱基置换的核苷酸。
靶区域包含与第一DNA链中的靶核酸序列互补结合的第二DNA链中的核酸序列,所述第一DNA链与向导RNA互补结合。此处,第二DNA链中的核酸序列可包含通过用于单碱基置换的蛋白诱导碱基置换的核苷酸。
在一个实例中,双链DNA或RNA中包含靶核酸序列的链可称为第一链,并且不包含靶核酸序列的链可称为第二链。此处,靶区域可包含第一链中与向导RNA互补结合的靶核酸序列以及与靶核酸序列互补结合的第二链中的核酸序列。
在一个实例中,双链DNA或RNA中包含靶核酸序列的链可称为第二链,并且不包含靶核酸序列的链可称为第一链。此处,靶区域可包含第二链中与向导RNA互补结合的靶核酸序列以及与靶核酸序列互补结合的第一链中的核酸序列。
用于单碱基置换的蛋白可诱导靶区域中一个或多个核苷酸的碱基置换。
在一个实例中,当向导RNA与包含在双链DNA的第一DNA链中的靶核酸序列互补结合时,用于单碱基置换的蛋白可置换(i)靶核酸序列中的一个或多个核苷酸碱基,或(ii)与双链DNA的第二链中的靶核酸序列互补结合的核酸序列中的一个或多个核苷酸碱基。
在一个实例中,当向导RNA与包含在双链RNA的第一RNA链中的靶核酸序列互补结合时,用于单碱基置换的蛋白可置换(i)靶核酸序列中的一个或多个核苷酸碱基,或(ii)与双链RNA的第二链中的靶核酸序列互补结合的核酸序列中的一个或多个核苷酸碱基。
在一个示例性实施方式中,靶核酸区域中的一个或多个核苷酸的胞嘧啶可用鸟嘌呤、胸腺嘧啶、尿嘧啶、次黄嘌呤或腺嘌呤置换。
在一个示例性实施方式中,靶核酸序列中的一个或多个核苷酸的腺嘌呤可用鸟嘌呤、胸腺嘧啶、尿嘧啶、次黄嘌呤或胞嘧啶置换。
本文使用的靶基因是指包含靶区域和靶核酸序列的基因。另外,本说明书中的靶基因是指其中通过用于单碱基置换的蛋白将靶区域中的一个或多个核苷酸的胞嘧啶置换为任意碱基的基因。
技术特征——用任意碱基置换
本申请所提供的用于单碱基置换的蛋白包含(i)脱氨酶和(ii)DNA糖基化酶作为必需组成成分。
用于单碱基置换的蛋白的第一组分(其为脱氨酶)以及用于单碱基置换的蛋白的第二组分(其为DNA糖基化酶)的组合可诱导任意碱基对核酸序列中的核苷酸的碱基的置换。
此处,由脱氨酶和DNA糖基化酶进行的碱基置换可由如下两个步骤引起:依次或同时进行(i)碱基脱氨基和/或(ii)通过DNA糖基化酶进行剪切或修复。
第一过程:碱基的脱氨基
脱氨基意指涉及氨基基团的剪切的生化反应。在一个实例中,在DNA的情况下,脱氨基可指碱基的氨基基团(其为核苷酸的一个组成成分)变为羟基或酮基。
在一个示例性实施方式中,脱氨酶可为胞苷脱氨酶。胞苷脱氨酶可通过胞嘧啶的脱氨基来提供尿嘧啶。胞苷脱氨酶可通过胞嘧啶的修饰来提供尿嘧啶。
Figure BDA0003482434050000141
在一个示例性实施方式中,用于单碱基置换的蛋白的脱氨酶可为腺苷脱氨酶。腺苷脱氨酶可通过腺嘌呤的脱氨基来提供次黄嘌呤。腺苷脱氨酶可通过腺嘌呤的修饰来提供羟基嘌呤(次黄嘌呤)。
Figure BDA0003482434050000142
在一个示例性实施方式中,脱氨酶可为鸟嘌呤脱氨酶。鸟嘌呤脱氨酶可通过鸟嘌呤的脱氨基来提供黄嘌呤。鸟嘌呤脱氨酶可通过鸟嘌呤的修饰来提供黄嘌呤。
Figure BDA0003482434050000151
第二过程:DNA糖基化
DNA糖基化酶是参与碱基切除修复(BER)的酶,并且BER是移除和替换DNA的受损碱基的机制。DNA糖基化酶通过水解DNA的碱基和脱氧核糖之间的N-糖苷键来催化该机制的第一步。DNA糖基化酶移除受损的含氮碱基,同时保持糖-磷酸骨架完整。结果,产生了AP位点,特别是无嘌呤位点或无嘧啶位点。之后,可通过AP核酸内切酶、末端加工酶、DNA聚合酶、flap核酸内切酶和/或DNA连接酶进行用任意碱基的置换。
在一个示例性实施方式中,DNA糖基化酶可为尿嘧啶DNA糖基化酶。尿嘧啶DNA糖基化酶水解DNA中尿嘧啶和脱氧核糖之间的N-糖苷键。尿嘧啶DNA糖基化酶水解包含尿嘧啶的核苷酸中的尿嘧啶和脱氧核糖之间的N-糖苷键。此处,可使用作用于包含胞嘧啶的核苷酸的胞苷脱氨酶通过脱氨基来提供含尿嘧啶的核苷酸。
在一个示例性实施方式中,DNA糖基化酶可为烷基腺嘌呤DNA糖基化酶。烷基腺嘌呤DNA糖基化酶水解DNA中羟基嘌呤(次黄嘌呤)和脱氧核糖之间的N-糖苷键。烷基腺嘌呤DNA糖基化酶水解包含羟基嘌呤的核苷酸中的羟基嘌呤和脱氧核糖之间的N-糖苷键。此处,可使用作用于包含腺嘌呤的核苷酸的腺苷脱氨酶通过脱氨基来提供包含羟基嘌呤的核苷酸。
第一过程和第二过程的结果
可使用本申请中提供的用于单碱基置换的蛋白将靶区域中的一个或多个腺嘌呤或胞嘧啶置换为任意碱基。
在一个实例中,用于单碱基置换的蛋白的脱氨酶可为腺苷脱氨酶,并且用于单碱基置换的蛋白的DNA糖基化酶可为烷基腺嘌呤-DNA糖基化酶或其变体。此处,用于单碱基置换的融合蛋白(单碱基置换融合蛋白)可诱导任意碱基(鸟嘌呤、胸腺嘧啶或胞嘧啶)对靶核酸序列中一个或多个核苷酸中的腺嘌呤的置换。
在一个示例性实施方式中,胞嘧啶对靶区域中一个或多个核苷酸中的腺嘌呤的置换可由包含如下的用于单碱基置换的蛋白来诱导:(a)CRISPR酶或其变体;(b)腺苷脱氨酶;以及(c)烷基腺嘌呤DNA糖基化酶。
Figure BDA0003482434050000161
在一个示例性实施方式中,胸腺嘧啶对靶区域中一个或多个核苷酸中的腺嘌呤的置换可由包含如下的用于单碱基置换的蛋白来诱导:(a)CRISPR酶或其变体;(b)腺苷脱氨酶;以及(c)烷基腺嘌呤DNA糖基化酶。
Figure BDA0003482434050000162
在一个示例性实施方式中,鸟嘌呤对靶区域中一个或多个核苷酸中的腺嘌呤的置换可由包含如下的用于单碱基置换的蛋白来诱导:(a)CRISPR酶或其变体;(b)腺苷脱氨酶;以及(c)烷基腺嘌呤DNA糖基化酶。
Figure BDA0003482434050000171
在一个实例中,用于单碱基置换的蛋白的脱氨酶可为胞苷脱氨酶,并且其DNA糖基化酶可为尿嘧啶DNA糖基化酶或其变体。此处,用于单碱基置换的融合蛋白可诱导任意碱基对靶核酸序列中一个或多个核苷酸的胞嘧啶的置换。
在一个示例性实施方式中,腺嘌呤对靶区域中一个或多个核苷酸中的胞嘧啶的置换可由包含如下的用于单碱基置换的蛋白来诱导:(a)CRISPR酶或其变体;(b)胞苷脱氨酶;以及(c)尿嘧啶DNA糖基化酶。
Figure BDA0003482434050000172
在一个示例性实施方式中,胸腺嘧啶对靶区域中一个或多个核苷酸中的胞嘧啶的置换可由包含如下的用于单碱基置换的蛋白来诱导:(a)CRISPR酶或其变体;(b)胞苷脱氨酶;以及(c)尿嘧啶DNA糖基化酶。
Figure BDA0003482434050000173
在一个示例性实施方式中,鸟嘌呤对靶区域中一个或多个核苷酸中的胞嘧啶的置换可由包含如下的用于单碱基置换的蛋白来诱导:(a)CRISPR酶或其变体;(b)胞苷脱氨酶;以及(c)尿嘧啶DNA糖基化酶。
Figure BDA0003482434050000181
以下,将详细地描述本发明。
说明书中公开的本发明的一个方面为用于单碱基置换的蛋白。
用于单碱基置换的蛋白为能够诱导或产生单碱基置换的蛋白、多肽或肽。
传统碱基编辑器的局限
传统碱基编辑器以脱氨酶、CRISPR酶和DNA糖基化酶抑制剂的融合、联结或连接的形式使用。作为代表性的实例,使用连接了来自大鼠的胞苷脱氨酶(例如rAPOBEC)、nCas9和尿嘧啶DNA糖基化酶的碱基编辑器,将胞嘧啶碱基置换为胸腺嘧啶。此外,使用腺苷脱氨酶代替胞苷脱氨酶将腺嘌呤(A)置换为鸟嘌呤(G)。
重要的是,传统的碱基编辑器可通过修正基因中的点突变位点来治疗由点突变引起的疾病(例如遗传性紊乱)。然而,传统的碱基编辑器具有局限性,即通过移除氨基基团(-NH2)或使用DNA糖基化酶抑制剂将氨基基团置换为酮基基团,将胞嘧啶(C)仅改变为特定碱基胸腺嘧啶(T),或者将腺嘌呤(A)仅改变为特定碱基鸟嘌呤(G)。
用于单碱基置换的蛋白的效用
使用传统的碱基编辑器具有限制性,即由被置换的碱基表达的氨基酸具有不同类型的可能性很低。大多数疾病或紊乱不是由点突变引起的,而是很可能是由肽、多肽或蛋白质水平(而不是核苷酸水平)的结构或功能异常引起的。毕竟,由于传统的碱基编辑器只能将腺嘌呤和胞嘧啶变成特定的碱基,因此改变肽、多肽或蛋白质结构的可能性显著降低。
使用本说明书中提供的用于单碱基置换的蛋白可克服现有技术的局限。本申请提供的用于单碱基置换的蛋白具有由以下组成的新型组合:(a)编辑器蛋白、(b)脱氨酶以及(c)DNA糖基化酶。也就是说,本申请提供的用于单碱基置换的蛋白具有将腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)或胞嘧啶(C)置换为任意碱基(A、T、C、G、U或H)的优点。
此外,具有新组成成分及其新组合的用于单碱基置换的蛋白具有同时置换靶核酸序列中存在的一个或多个碱基的优点。
因此,本申请提供的用于单碱基置换的蛋白可提供将各种碱基随机置换的“突变”。可由突变的基因表达具有各种结构的肽、多肽或蛋白质。
由于上述技术效果,本申请提供的用于单碱基置换的蛋白可用于表位筛选、耐药基因或蛋白质筛选、药物敏化筛选和/或病毒抗性基因或蛋白质筛选。
本申请提供的用于单碱基置换的蛋白通过与向导RNA共同使用,可诱导任意碱基对靶基因的靶区域中碱基的置换。
[用于单碱基置换的蛋白的第一组分-脱氨酶]
脱氨酶是参与移除氨基基团的酶,并包括将化合物的氨基基团变为羟基或酮基基团的酶。存在催化与胞嘧啶、腺嘌呤、鸟嘌呤、腺苷、胞苷、AMP和ADP等中的每一个结合的氨基基团的酶,并且这种酶通常包含在动物组织中。
本文使用的脱氨酶可称为碱基置换结构域。此处,碱基置换结构域是指参与用任意其它碱基置换靶基因中一个或多个核苷酸的碱基的肽、多肽、结构域或蛋白质。
本申请的脱氨酶可为胞苷脱氨酶。
此处,胞苷脱氨酶是指具有移除胞嘧啶、胞苷或脱氧胞苷的氨基(-NH2)基团活性的任意酶。本说明书中的胞苷脱氨酶作为包括胞嘧啶脱氨酶在内的概念使用。本说明书中的胞苷脱氨酶可与胞嘧啶脱氨酶互换使用。
胞苷脱氨酶可将胞嘧啶变为尿嘧啶。
胞苷脱氨酶可将胞苷变为尿苷。
胞苷脱氨酶可将脱氧胞苷变为脱氧尿苷。
胞苷脱氨酶是指具有将核苷酸中存在的碱基胞嘧啶(例如存在于双链DNA或RNA中的胞嘧啶)转化为尿嘧啶(C至U转化或C至U编辑)的活性的酶,并将位于具有靶位点序列(靶核酸序列)的PAM序列的链中的胞嘧啶转化为尿嘧啶。
在一个实例中,胞苷脱氨酶可来源于:原核生物,例如大肠杆菌(Escherichiacoli);或哺乳动物,例如灵长类动物(如人和猴),以及啮齿动物(例如大鼠和小鼠),但本发明不限于此。例如,胞苷脱氨酶可为APOBEC(“载脂蛋白B mRNA编辑酶,催化多肽样”)或选自属于激活诱导的胞苷脱氨酶(AID)家族的一种或多种。
胞苷脱氨酶可为APOBEC1、APOBEC2、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、AID或CDA,但本发明不限于此。
例如,胞苷脱氨酶可为人APOBEC1,例如NCBI登录号NM_005889、NM_001304566或NM_001644所代表的基因或mRNA表达的蛋白质或多肽。或者,胞苷脱氨酶可为人APOBEC1,例如NCBI登录号NP_001291495、NP_001635或NP_005880所代表的蛋白质或多肽。
例如,胞苷脱氨酶可为小鼠APOBEC1,例如NCBI登录号NM_001127863或NM_112436所代表的基因或mRNA表达的蛋白质或多肽。或者,胞苷脱氨酶可为小鼠APOBEC1,例如NCBI登录号NP_001127863或NP_112436所代表的蛋白质或多肽。
例如,胞苷脱氨酶可为人AID,例如NCBI登录号NM_020661或NM_001330343所代表的基因或mRNA表达的蛋白质或多肽。或者,胞苷脱氨酶可为人AID,例如NCBI登录号NP_001317272或NP_065712所代表的基因或mRNA表达的蛋白质或多肽。
以下列举了胞苷脱氨酶的实例:
APOBEC1:编码人APOBEC1(例如NCBI登录号NP_001291495、NP_001635、NP_005880)的基因,例如NCBI登录号NM_005889或NM_001304566所代表的APOBEC1基因;或编码小鼠APOBEC1(例如NCBI登录号NP_001127863、NP_112436)的基因,例如NCBI登录号NM_001127863或NM_112436所代表的APOBEC1基因。
APOBEC2:编码人APOBEC2(例如NCBI登录号NP_006780)的基因,例如NCBI登录号NM_006789所代表的APOBEC2基因;或编码小鼠APOBEC2(例如NCBI登录号NP_033824)的基因,例如NCBI登录号NM_009694所代表的APOBEC2基因。
APOBEC3B:编码人APOBEC3B(例如NCBI登录号NP_001257340或NP_004891)的基因,例如NCBI登录号NM_004900或NM_001270411所代表的APOBEC3B基因;或编码小鼠APOBEC3B(例如NCBI登录号NP_001153887、NP_001333970或NP_084531)的基因,例如NCBI登录号NM_001160415、NM_030255或NM_001347041所代表的APOBEC3B基因。
APOBE3C:编码人APOBEC3C(例如NCBI登录号NP_055323)的基因,例如NCBI登录号NM_014508所代表的APOBEC3C基因。
APOBEC3D:编码人APOBEC3D(例如NCBI登录号NP_689639或NP_0013570710)的基因,例如NCBI登录号NM_152426或NM_001363781所代表的APOBEC3D基因。
APOBEC3F:编码人APOBEC3F(例如NCBI登录号NP_001006667或NP_660341)的基因,例如NCBI登录号NM_001006666或NM_145298所代表的APOBEC3F基因。
APOBEC3G:编码人APOBEC3G(例如NCBI登录号NP_068594、NP_001336365、NP_001336366或NP_001336367)的基因,例如NCBI登录号NM_021822所代表的APOBEC3G基因。
APOBEC3H:编码人APOBEC3H(例如NCBI登录号NP_001159474、NP_001159475、NP_001159476或NP_861438)的基因,例如NCBI登录号NM_001166002,NM_001166003,NM_001166004或NM_181773所代表的APOBEC3H基因。
APOBEC4:编码人APOBEC4(例如NCBI登录号NP_982279)的基因,例如NCBI登录号NM_203454所代表的APOBEC4基因;或编码小鼠APOBEC4的基因,例如NCBI登录号NM_001081197所代表的APOBEC4基因。
胞苷脱氨酶可由激活诱导的胞苷脱氨酶(AID)基因表达。例如,AID基因可选自于由以下基因组成的组,但本发明不限于此:编码人AID基因(例如NP_001317272、NP_065712)的基因,例如NCBI登录号NM_020661或NM_001330343所代表的AID基因;或编码小鼠AID基因(例如NP_03377512)的基因,例如NCBI登录号NM_009645所代表的AID基因。
胞苷脱氨酶可由CDA基因编码。例如,CDA基因可选自于由以下基因组成的组,但本发明不限于此:编码人CDA(例如NCBI登录号NP_001776)的基因,例如NCBI登录号NM_001785所代表的CDA基因;或编码小鼠CDA(例如NCBI登录号NP_082452)的基因,例如NCBI登录号NM_028176所代表的CDA基因。
胞苷脱氨酶可为胞苷脱氨酶变体。
胞苷脱氨酶变体可为比野生型胞苷脱氨酶具有更高胞苷脱氨酶活性的酶。胞苷脱氨酶活性被理解为包括胞嘧啶或其类似物之一的脱氨基。
例如,胞苷脱氨酶变体可为其中胞苷脱氨酶中的一个或多个氨基酸序列被修饰的酶。
其中,对氨基酸序列的修饰可为选自于置换、删除和插入中的任一种。
本申请的脱氨酶可为腺苷脱氨酶。
腺苷脱氨酶是具有移除腺嘌呤、腺苷或脱氧腺苷的氨基(-NH2)基团或用酮基(=O)基团置换所述氨基基团的活性的任何酶。本说明书中的腺苷脱氨酶作为包括腺嘌呤脱氨酶在内的概念使用。本说明书中的腺苷脱氨酶作为包括腺嘌呤脱氨酶在内的概念使用。
腺苷脱氨酶可将腺嘌呤变为羟基嘌呤(次黄嘌呤)。
腺苷脱氨酶可将腺苷变成肌苷。
腺苷脱氨酶可将脱氧腺苷变成脱氧肌苷。
腺苷脱氨酶可来源于:原核生物,例如大肠杆菌;或哺乳动物,例如灵长类动物(例如人和猴),以及啮齿动物(例如大鼠和小鼠),但本发明不限于此。例如,腺苷脱氨酶可为tRNA特异性腺苷脱氨酶(TadA)或选自属于腺苷脱氨酶(ADA)家族的一种或多种。
腺苷脱氨酶可为TadA、Tad2p、ADA、ADA1、ADA2、ADAR2、ADAT2或ADAT3,但本发明不限于此。
例如,腺苷脱氨酶可为大肠杆菌TadA,例如NCBI登录号NC_000913.3所代表的基因或mRNA表达的蛋白质或多肽等。或者,腺苷脱氨酶可为大肠杆菌TadA,例如NCBI登录号NP_417054.2所代表的蛋白质或多肽等。
例如,腺苷脱氨酶可为人ADA,例如NCBI登录号NM_000022、NM_001322050或NM_001322051所代表的基因或mRNA表达的蛋白质或多肽等。或者,腺苷脱氨酶可为人ADA,例如NCBI登录号NP_000013、NP_001308979或NP_001308980所代表的蛋白质或多肽等。
例如,腺苷脱氨酶可为小鼠ADA,例如NCBI登录号NM_001272052或NM_007398所代表的基因或mRNA表达的蛋白质或多肽等。或者,腺苷脱氨酶可为小鼠ADA,例如NCBI登录号NP_001258981或NP_031424所代表的蛋白质或多肽等。
例如,腺苷脱氨酶可为人ADAR2,例如NCBI登录号NM_001033049、NM_001112、NM_001160230、NM_015833或NM_015834所代表的基因或mRNA表达的蛋白质或多肽等。或者,腺苷脱氨酶可为人ADAR2,例如NCBI登录号NP_001103、NP_001153702、NP_001333616、NP_001333617或NP_056648所代表的蛋白质或多肽等。
例如,腺苷脱氨酶可为小鼠ADAR2,例如由NCBI登录号NM_001024837、NM_001024838、NM_001024839、NM_001024840或NM_130895所代表的基因或mRNA表达的蛋白质或多肽等。或者,腺苷脱氨酶可为小鼠ADAR2,例如NCBI登录号NP_001020008、NP_570965或NP_001020009所代表的蛋白质或多肽等。
例如,腺苷脱氨酶可为人ADAT2,例如NCBI登录号NM_182503.3或NM_001286259.1所代表的基因或mRNA表达的蛋白质或多肽等。或者,腺苷脱氨酶可为人ADAT2,例如NCBI登录号NP_001273188.1或NP_872309.2所代表的蛋白质或多肽等。
腺苷脱氨酶可为adA变体、ADAR2变体和ADAT2变体中的任一种,但本发明不限于此。
例如,ADAR2变体可为选自于由以下基因组成的组中的一种或多种,但本发明不限于此。所述基因可为编码人ADAR2的基因,例如NCBI登录号NM_001282225、NM_001282226、NM_001282227、NM_001282228、NM_001282229、NM_017424或NM_177405所代表的CDA基因等。
腺苷脱氨酶可为腺苷脱氨酶变体。
腺苷脱氨酶变体可为比野生型腺苷脱氨酶具有更高腺苷脱氨酶活性的酶。
例如,腺苷脱氨酶变体可为其中腺苷脱氨酶中的一个或多个氨基酸序列被改变的酶。
腺苷脱氨酶可为腺苷脱氨酶变体。
腺苷脱氨酶变体可为比野生型腺苷脱氨酶具有更高腺苷脱氨酶活性的酶。其中,腺苷脱氨酶活性可包括移除腺嘌呤、腺苷、脱氧腺苷或其类似物的氨基(-NH2)基团或用酮基(=O)基团置换所述氨基(-NH2)基团,但本发明不限于此。
腺苷脱氨酶变体可为其中选自于构成野生型腺苷脱氨酶的氨基酸序列的一个或多个氨基酸序列被修饰的酶。
其中,所述氨基酸序列的修饰可为选自于一个或多个氨基酸的置换、删除和插入中的任一种。
腺苷脱氨酶变体可为TadA变体、Tad2p变体、ADA变体、ADA1变体、ADA2变体、ADAR2变体、ADAT2变体或ADAT3变体,但本发明不限于此。
例如,腺苷脱氨酶可为TadA变体。例如,TadA变体可为ABE0.1、ABE1.1、ABE1.2、ABE2.1、ABE2.9、ABE2.10、ABE3.1、ABE4.3、ABE5.1、ABE5.3、ABE6.3、ABE6.4、ABE7.4、ABE7.8、ABE7.9或ABE7.10,以及关于TadA变体的具体详情在题为“Base editing of A,Tto C,G in genomic DNA without DNA cleavage”(Nicole M.Gaudelli等,(2017)Nature,551,464-471)的文章中详细描述,因此可参考相应的文件。
腺苷脱氨酶可为融合的腺苷脱氨酶。
本申请中提供的脱氨酶可以融合形式提供,其中例如一个或多个功能结构域与胞苷脱氨酶或腺苷脱氨酶连接。
此处,可连接或融合脱氨酶和功能结构域从而使每个功能得以表达。
所述功能结构域可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA剪切活性或核酸结合活性的结构域,或为用于分离和纯化蛋白质(包括肽)的标签或报告基因,但本发明不限于此。
功能结构域可为用于分离和纯化蛋白质(包括肽)的标签或报告基因。
此处,标签可包括以下任一种:组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。此处,报告基因可包括以下自发荧光蛋白中的任一种:例如谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)。然而,本发明不限于此。
功能结构域可为核定位序列或信号(NLS)或者核输出序列或信号(NES)。
此处,可在CRISPR酶的氨基端或其附近、CRISPR酶的羧基端或其附近、或它们的组合处包含一个或多个NLS。所述NLS可为衍生自以下的NLS序列,但本发明不限于此:具有氨基酸序列PKKKRKV(SEQ ID NO:23)的SV40病毒大T抗原的NLS;来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:24)的核质蛋白双分型(nucleoplasmin bipartite)NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:25)或RQRRNELKRSP(SEQ ID NO:26)的c-mycNLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:27)的hRNPA1 M9NLS;来自importin-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:28);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:29)和PPKKARED (SEQ ID NO:30);人p53的序列POPKKKPL(SEQ ID NO:31);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ IDNO:32);流感病毒NS1的序列DRLRR(SEQ ID NO:33)和PKQKKRK(SEQ ID NO:34);传染性病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:35);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:36);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:37);以及人类固醇激素,糖皮质激素的受体的序列RKCLQAGMNLEARKTKK(SEQ ID NO:38)中的一个或多个。
功能结构域可为能够与另一结构域、肽、多肽或蛋白质形成复合物的结合结构域。
结合结构域可为FRB结构域和FKBP二聚化结构域之一;内含肽;ERT结构域和VPR结构域之一;GCN4肽和单链可变片段(scFv)之一;或形成异二聚体的结构域。
结合结构域可为scFv。其中,scFv可与GCN4肽配对,并且可与GCN4特异性地结合或连接。
在一个实例中,其中scFv功能结构域与腺苷脱氨酶连接的第一融合蛋白可与肽、多肽、蛋白质或包含GCN4肽的第二融合蛋白结合。
[用于单碱基置换的蛋白的第二组分——DNA糖基化酶]
DNA糖基化酶是参与碱基切除修复(BER)的酶,且BER是移除和替换DNA的受损碱基的机制。DNA糖基化酶通过水解DNA中碱基和脱氧核糖之间的N-糖苷键来催化该机制的第一步。DNA糖基化酶移除受损的含氮碱基,同时留下完整的糖-磷酸骨架。
本申请的糖基化酶可为尿嘧啶DNA糖基化酶。
尿嘧啶DNA糖基化酶是通过移除DNA中存在的尿嘧啶(U)来起防止DNA突变作用的酶,并且可为选自于通过破坏尿嘧啶的N-糖苷键来起启动碱基切除修复(BER)途径作用的所有酶中的一种或多种。
糖基化酶可为尿嘧啶DNA糖基化酶(UDG或UNG)。尿嘧啶DNA糖基化酶(UNG)可选自于由以下基因组成的组,但本发明不限于此:编码人UNG(例如NCBI登录号NP_003353和NP_550433)的基因,例如NCBI登录号NM_080911和NM_003362所代表的UNG基因;或编码小鼠UNG(例如NCBI登录号NP_001035781和NP_035807)的基因,例如NCBI登录号NM_001040691和NM_011677所代表的UNG基因;或编码大肠杆菌UNG(例如NCBI登录号ADX49788.1、ACT28166.1、EFN36865.1、BAA10923.1、ACA76764.1、ACX38762.1、EFU59768.A、EFU53885.A、EFJ57281.1、EFU47398.1、EFK71412.1、EFJ92376.1、EFJ79936.1、EFO59084.1、EFK47562.1、KXH01728.1、ESE25979.1、ESD99489.1、ESD73882.1和ESD69341.1)的基因。
DNA糖基化酶可为尿嘧啶DNA糖基化酶变体。尿嘧啶DNA糖基化酶变体可为比野生型尿嘧啶DNA糖基化酶具有更高DNA糖基化酶活性的酶。
例如,尿嘧啶DNA糖基化酶变体可为其中野生型尿嘧啶DNA糖基化酶的一个或多个氨基酸序列被修饰的酶。此处,所述氨基酸序列的修饰可为至少一个或多个氨基酸的置换、删除、插入或它们的组合。
糖基化酶可为融合的尿嘧啶DNA糖基化酶。
本申请的糖基化酶可为烷基腺嘌呤DNA糖基化酶(AAG)。
烷基腺嘌呤DNA糖基化酶是通过移除DNA中存在的烷基化或脱氨基的碱基来起防止DNA突变作用的酶,并且可为选自于通过催化烷基化或脱氨基的碱基的N-糖苷键的水解来起启动碱基切除修复(BER)途径作用的所有酶中的一种或多种。
DNA糖基化酶可为烷基腺嘌呤DNA糖基化酶(AAG)或其变体。
例如,烷基腺嘌呤DNA糖基化酶(AAG)可为人AAG,例如NCBI登录号NM_002434、NM_001015052或NM_001015054所代表的基因或mRNA表达的蛋白质或多肽等。或者,烷基腺嘌呤DNA糖基化酶(AAG)可为人AAG,例如NCBI登录号NP_001015052、NP_001015054或NP_002425所代表的蛋白质或多肽等。
例如,烷基腺嘌呤DNA糖基化酶(AAG)可为小鼠AAG,例如NCBI登录号NM_010822所代表的基因或mRNA表达的蛋白质或多肽等。或者,烷基腺嘌呤DNA糖基化酶(AAG)可为人AAG,例如NCBI登录号NP_034952所代表的蛋白质或多肽等。
DNA糖基化酶可为烷基腺嘌呤DNA糖基化酶变体。烷基腺嘌呤DNA糖基化酶变体可为比野生型烷基腺嘌呤DNA糖基化酶具有更高DNA糖基化酶活性的酶。
例如,烷基腺嘌呤DNA糖基化酶变体可为其中野生型烷基腺嘌呤DNA糖基化酶的一个或多个氨基酸序列被修饰的酶。其中,所述氨基酸序列的修饰可为至少一个氨基酸的置换、删除、插入或它们的组合。
所述糖基化酶可为融合的烷基腺嘌呤DNA糖基化酶。
本申请可提供融合的尿嘧啶DNA糖基化酶或融合的烷基腺嘌呤DNA糖基化酶,其中一个或多个功能结构域与尿嘧啶DNA糖基化酶或烷基腺嘌呤DNA糖基化酶连接。其中,尿嘧啶DNA糖基化酶或烷基腺嘌呤DNA糖基化酶可与每个功能结构域连接或融合,从而使得每个功能得以表达。
功能结构域可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA剪切活性或核酸结合活性的结构域,或为用于分离和纯化蛋白质(包括肽)的标签或报告基因,但本发明不限于此。
此处,功能结构域可为用于分离和纯化蛋白质(包括肽)的标签或报告基因。
此处,标签可包括以下任一种:组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。此处,报告基因可包括以下自发荧光蛋白中的任一种:例如谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)。然而,本发明不限于此。
功能结构域可为核定位序列或信号(NLS)或者核输出序列或信号(NES)。
此处,可在CRISPR酶的氨基端或其附近、CRISPR酶的羧基端或其附近、或它们的组合处包含一个或多个NLS。NLS可为衍生自以下的NLS序列,但本发明不限于此:具有氨基酸序列PKKKRKV(SEQ ID NO:23)的SV40病毒大T抗原的NLS;来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:24)的核质蛋白双分型NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:25)或RQRRNELKRSP(SEQ ID NO:26)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:27)的hRNPA1M9NLS;来自importin-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:28);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:29)和PPKKARED(SEQ ID NO:30);人p53的序列POPKKKPL(SEQ IDNO:31);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:32);流感病毒NS1的序列DRLRR(SEQ ID NO:33)和PKQKKRK(SEQ ID NO:34);传染性病毒δ抗原的序列RKLKKKIKKL(SEQ IDNO:35);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:36);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:37);以及人类固醇激素,糖皮质激素的受体的序列RKCLQAGMNLEARKTKK(SEQ ID NO:38)中的一个或多个。
功能结构域可为能够与另一结构域、肽、多肽或蛋白质形成复合物的结合结构域。
结合结构域可为FRB结构域和FKBP聚化结构域之一;内含肽;ERT结构域和VPR结构域之一;GCN4肽和单链可变片段(scFv)之一;或形成异二聚体的结构域。
结合结构域可为scFv。其中,scFv可与GCN4肽配对,并且可与GCN4特异性地结合或连接。
在一个实例中,其中scFv功能结构域与尿嘧啶DNA糖基化酶或烷基腺嘌呤DNA糖基化酶连接的第一融合蛋白可与肽、多肽、蛋白质或包含GCN4肽的第二融合蛋白结合。
[用于单碱基置换的蛋白的第三组分——CRISPR酶]
本申请提供的用于单碱基置换的蛋白包含CRISPR酶或包含所述CRISPR酶的CRISPR系统。本说明书中的CRISPR酶可称为CRISPR蛋白。
CRISPR系统是可通过靶向基因组DNA上原间隔序列临近基序(PAM)序列附近的靶核酸序列来引入人工突变的系统。具体而言,向导RNA和Cas蛋白彼此结合(或相互作用)以形成向导RNA-Cas蛋白复合物,并且可通过靶DNA序列的剪切在基因组DNA上诱导突变,插入缺失(indel)。
关于向导RNA、Cas蛋白和向导RNA-Cas蛋白复合物的更详细描述,可参考韩国专利公开号10-2017-0126636。
Cas蛋白在本说明书中用作除了野生型蛋白质外,还包括能够与向导RNA合作作为有活性的核酸内切酶或切口酶的所有变体在内的概念。有活性的核酸内切酶或切口酶可剪切靶核酸序列,并且可用于操作或修饰核酸序列。此外,无活性的变体可用于调控转录或分离所靶向的DNA。
本申请中的CRISPR蛋白可为由多种微生物衍生而来的Cas9或Cpf1,例如酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌属(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、空肠弯曲杆菌(Campylobacter jejuni)、达松维尔拟诺卡式菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿色产色链霉菌(Streptomycesviridochromogenes)、绿色产色链霉菌、粉红链孢囊菌(Streptosporangium roseum)、粉红链孢囊菌、酸热脂环酸芽孢杆菌(AlicyclobacHlus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、Bacillus selenitireducens、Exiguobacteriumsibiricum、德氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillussalivarius)、Microscilla marina、伯克氏菌目细菌(Burkholderiales bacterium)、Polaromonas naphthalenivorans、极地单胞菌属(Polaromonas sp.)、Crocosphaerawatsonii、蓝杆藻属(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻属(Synechococcus sp.)、阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)、Ammonifexdegensii、Caldicelulosiruptor bescii、Candidatus Desulforudis、肉毒梭状芽胞杆菌(Clostridium botulinum)、艰难梭状芽胞杆菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、Natranaerobius thermophilus、Pelotomaculumthermopropionicum、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillus ferrooxidans)、Allochromatium vinosum、海杆菌属(Marinobactersp.)、Nitrosococcus halophilus、Nitrosococcus watsonii、Pseudoalteromonashaloplanktis、Ktedonobacter racemifer、Methanohalobium evestigatum、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻属(Arthrospira sp.)、鞘丝藻属(Lyngbya sp.)、Microcoleus chthonoplastes、颤藻属(Oscillatoria sp.)、Petrotoga mobilis、非洲栖热腔菌(Thermosipho africanus)或Acaryochloris marina。
CRISPR酶可为具有完全活性的CRISPR酶。
在一个实施方式中,具有完全活性的CRISPR酶变体可为衍生自SpCas9酿脓链球菌的Cas9蛋白变体。下文列出了变体的实例:
变体可为其中的以下一个或多个氨基酸被置换的酶:
E108G,E217A,A262T,R324L,S409I,E480K,E543D,M694I,E1219V,E480K,E543D,E1219V,A262T,S409I,E480K,E543D,E1219V,A262T,S409I,E480K,E543D,M694I,E1219V,E108G,E217A,A262T,S409I,E480K,E543D,M694I,E1219V,A262T,R324L,S409I,E480K,E543D,M694I,E1219V,L111R,D1135V,G1218R,E1219F,A1322R,R1335V和T1337R。其中,CRISPR酶变体可识别不同的PAM序列,通过缩短能够被CRISPR酶识别的PAM序列的长度来扩展基因组中的靶核酸序列,以及提高核酸接近能力。
作为具体的实例,在SpCas9的情况下,当SpCas9突变(例如L111R、D1135V、G1218R、E1219F、A1322R、R1335V和T1337R)时,所述SpCas9变体可通过识别仅“NG”的PAM序列(初始识别的PAM序列是“NGG”)(N为A、T、C和G之一)来进行操作。
其中,SpCas9变体(L111R、D1135V、G1218R、E1219F、A1322R、R1335V和T1337R)可与“Nureki Cas9”(“CRISPR-Cas9nuclease with expanded targeting space”,Masu等,(2018)Science 361,1259-1262)互换使用。
CRISPR酶可为切口酶。
例如,当II型CRISPR酶为野生型SpCas9时,切口酶可为其中因野生型SpCas9的氨基酸序列中的组氨酸840突变为丙氨酸而使HNH结构域的核酸酶活性失活的SpCas9变体。此处,由于产生的切口酶(即SpCas9变体)具有由RuvC结构域产生的核酸酶活性,靶基因或核酸的非互补链(即不与gRNA互补结合的链)可被剪切。
在另一实例中,当II型CRISPR酶为野生型CjCas9时,切口酶可为其中因野生型CjCas9的氨基酸序列中的组氨酸559突变为丙氨酸而使HNH结构域的核酸酶活性失活的CjCas9变体。此处,由于产生的切口酶(即CjCas9变体)具有由RuvC结构域而来的核酸酶活性,靶基因或核酸的非互补链(即不与gRNA互补结合的链)可被剪切。
此外,切口酶可具有CRISPR酶的HNH结构域的核酸酶活性。即切口酶可不包含CRISPR酶的RuvC结构域的核酸酶活性,并因此,可操纵或修饰RuvC结构域。
在一个实例中,当CRISPR酶为II型CRISPR酶时,切口酶可为包含修饰的RuvC结构域的II型CRISPR酶。
例如,当II型CRISPR酶为野生型SpCas9时,切口酶可为其中因野生型SpCas9的氨基酸序列中的天冬氨酸10突变为丙氨酸而使RuvC结构域的核酸酶活性失活的SpCas9变体。此处,由于产生的切口酶(即SpCas9变体)具有由HNH结构域而来的核酸酶活性,靶基因或核酸的互补链(即与gRNA互补结合的链)可被剪切。
在又一实例中,当II型CRISPR酶为野生型CjCas9时,切口酶可为其中因野生型CjCas9的氨基酸序列中的天冬氨酸8突变为丙氨酸而使RuvC结构域的核酸酶活性失活的CjCas9变体。此处,由于产生的切口酶(即CjCas9变体)具有由HNH结构域而来的核酸酶活性,靶基因或核酸的互补链(即与gRNA互补结合的链)可被剪切。
在一个实施方式中,切口酶可为其中因Nureki Cas9的氨基酸序列中的天冬氨酸10突变为丙氨酸而使RuvC结构域的核酸酶活性失活的Nureki Cas9变体,所述酶为NurekiCas9切口酶(Nureki nCas9)。此处,由于产生的Nureki nCas9具有由HNH结构域而来的核酸酶活性,靶基因或核酸的互补链(即与gRNA互补结合的链)可被剪切。
在另一实施方式中,切口酶可为其中因Nureki Cas9的氨基酸序列中的组氨酸840突变为丙氨酸而使HNH结构域的核酸酶活性失活的Nureki Cas9变体,所述酶为NurekiCas9切口酶(Nureki nCas9)。此处,由于产生的Nureki nCas9具有由RuvC结构域而来的核酸酶活性,靶基因或核酸的非互补链(即不与gRNA互补结合的链)可被剪切。
CRISPR酶可为无活性CRISPR酶。
“无活性”是指野生型CRISPR酶的功能丧失的状态,即剪切双链DNA的第一链的第一功能和剪切双链DNA的第二链的第二功能二者均丧失。处于这种状态的CRISPR酶称为无活性CRISPR酶。
由于具有野生型CRISPR酶的核酸酶活性的结构域的突变,无活性CRISPR酶可具有核酸酶失活。
无活性CRISPR酶可具有由RuvC结构域和HNH结构域中的突变引起的核酸酶失活。即无活性CRISPR酶可不包含CRISPR酶的RuvC结构域和HNH结构域的核酸酶活性,并为此,可操纵或修饰RuvC结构域和HNH结构域。
在一个实例中,当CRISPR酶为II型CRISPR酶时,无活性CRISPR酶可为包含修饰的RuvC结构域和HNH结构域的II型CRISPR酶。
例如,当II型CRISPR酶为野生型SpCas9时,无活性CRISPR酶可为其中因野生型SpCas9的氨基酸序列中的天冬氨酸10和组氨酸840两者均突变为丙氨酸而使RuvC结构域和HNH结构域的核酸酶活性失活的SpCas9变体。此处,由于产生的无活性CRISPR酶(即SpCas9变体)具有RuvC结构域和HNH结构域的失活的核酸酶活性,它不能剪切靶基因或核酸的双链两者。
在另一实例中,当II型CRISPR酶为野生型CjCas9时,无活性CRISPR酶可为其中因野生型CjCas9的氨基酸序列中的天冬氨酸8和组氨酸559两者均突变为丙氨酸而使RuvC结构域和HNH结构域的核酸酶活性失活的CjCas9变体。此处,由于产生的无活性CRISPR酶(即CjCas9变体)具有RuvC结构域和HNH结构域的失活的核酸酶活性,它不能切割靶基因或核酸的双链两者。
此外,本申请可提供与功能结构域连接的CRISPR酶。此处,除了野生型CRISPR酶的原始功能之外,CRISPR酶变体可具有附加的功能。
功能结构域可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA剪切活性或核酸结合活性的结构域,或为用于分离和纯化蛋白质(包括肽)的标签或报告基因,但本发明不限于此。
功能结构域可为用于分离和纯化蛋白质(包括肽)的标签或报告基因。
此处,标签可包括以下任一种:组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。此处,报告基因可包括以下自发荧光蛋白中的任一种:例如谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)。然而,本发明不限于此。
功能结构域可为核定位序列或信号(NLS)或者核输出序列或信号(NES)。
此处,可在CRISPR酶的氨基端或其附近、CRISPR酶的羧基端或其附近、或它们的组合处包含一个或多个NLS。NLS可为来源于以下的NLS序列,但本发明不限于此:具有氨基酸序列PKKKRKV(SEQ ID NO:23)的SV40病毒大T抗原的NLS;来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:24)的核质蛋白双分型NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:25)或RQRRNELKRSP(SEQ ID NO:26)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:27)的hRNPA1 M9 NLS;来自importin-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:28);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:29)和PPKKARED(SEQ ID NO:30);人p53的序列POPKKKPL(SEQ IDNO:31);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:32);流感病毒NS1的序列DRLRR(SEQ ID NO:33)和PKQKKRK(SEQ ID NO:34);传染性病毒δ抗原的序列RKLKKKIKKL(SEQ IDNO:35);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:36);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:37);以及人类固醇激素,糖皮质激素的受体的序列RKCLQAGMNLEARKTKK(SEQ ID NO:38)中的一个或多个。
功能结构域可为能够与另一结构域、肽、多肽或蛋白质形成复合物的结合结构域。
结合结构域可为FRB结构域和FKBP二聚化结构域之一;内含肽;ERT结构域和VPR结构域之一;GCN4肽和单链可变片段(scFv)之一;或形成异二聚体的结构域。
结合结构域可为GCN4肽。此处,GCN4肽可与scFv配对,并且可与scFv特异性地结合或连接。
在一个实例中,其中GCN4肽功能结构域与CRISPR酶连接的第一融合蛋白可与肽、多肽、蛋白质或包含scFv的第二融合蛋白结合。
[用于单碱基置换的蛋白的第一方面——用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸]
本说明书中公开的用于单碱基置换的蛋白的一个方面为用于单碱基置换的融合蛋白。
在一个实例中,用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸可包含:
(a)CRISPR酶或其变体;
(b)脱氨酶;以及
(c)DNA糖基化酶或其变体。
此处,用于腺嘌呤置换的融合蛋白可诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的胞嘧啶或腺嘌呤的置换。
在一个示例性实施方式中,用于单碱基置换的融合蛋白可包含连接部分,所述连接部分插入到选自于(a)、(b)和(c)中的一个与选自于(a)、(b)和(c)中的另一个之间。
在一个示例性的实施方式中,用于单碱基置换的融合蛋白可具有以下的任一种组分:
(i)N末端-[CRISPR酶]-[脱氨酶]-[DNA糖基化酶]-C末端;
(ii)N末端-[CRISPR酶]-[DNA糖基化酶]-[脱氨酶]-C末端;
(iii)N末端-[脱氨酶]-[CRISPR酶]-[DNA糖基化酶]-C末端;
(iv)N末端-[脱氨酶]-[DNA糖基化酶]-[CRISPR酶]-C末端;
(v)N末端-[DNA糖基化酶]-[CRISPR酶]-[脱氨酶]-C末端;以及(vi)N末端-[DNA糖基化酶]-[脱氨酶]-[CRISPR酶]-C末端。
在一个示例性实施方式中,CRISPR酶或其变体可包含选自于由以下组成的组中的任一个或多个:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌(Streptococcus thermophilus)衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌(Neisseria meningitidis)衍生而来的Cas9蛋白以及Cpf1蛋白。
在一个示例性实施方式中,CRISPR酶变体的特征可在于RuvC结构域和HNH结构域中的任一个或多个失活。
在一个示例性实施方式中,CRISPR酶变体可为切口酶。
在一个实施方式中,可提供用于腺嘌呤置换的融合蛋白。
用于腺嘌呤置换的融合蛋白或编码所述融合蛋白的核酸可包含:
(a)CRISPR酶或其变体;
(b)腺苷脱氨酶;以及
(c)烷基腺嘌呤DNA糖基化酶或其变体。
其中,用于腺嘌呤置换的融合蛋白可诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的腺嘌呤的置换。
用于腺嘌呤碱基置换的蛋白可按照N末端-[CRISPR酶]-[腺苷脱氨酶]-[烷基腺嘌呤DNA糖基化酶]-C末端的顺序组成。
用于腺嘌呤碱基置换的蛋白可按照N末端-[烷基腺嘌呤DNA糖基化酶]-[CRISPR酶]-[腺苷脱氨酶]-C末端的顺序组成。
用于腺嘌呤碱基置换的蛋白可按照N末端-[烷基腺嘌呤DNA糖基化酶]-[腺苷脱氨酶]-[CRISPR酶]-C末端的顺序组成。
用于腺嘌呤碱基置换的蛋白可按照N末端-[腺苷脱氨酶]-[CRISPR酶]-[烷基腺嘌呤DNA糖基化酶]-C末端的顺序组成。
用于腺嘌呤碱基置换的蛋白可按照N末端-[CRISPR酶]-[烷基腺嘌呤DNA糖基化酶]-[腺苷脱氨酶]-C末端的顺序组成。
用于腺嘌呤碱基置换的蛋白可按照N末端-[腺苷脱氨酶]-[烷基腺嘌呤DNA糖基化酶]-[CRISPR酶]-C末端的顺序组成。
用于腺嘌呤碱基置换的蛋白可进一步包含连接结构域。
在一个实例中,所述连接结构域可为可操作地连接CRISPR酶与腺苷脱氨酶、腺苷脱氨酶与烷基腺嘌呤DNA糖基化酶、和/或CRISPR酶与烷基腺嘌呤DNA糖基化酶的结构域,并且可为连接CRISPR酶、腺苷脱氨酶和烷基腺嘌呤DNA糖基化酶以激活每个功能的结构域。
在一个实例中,所述连接结构域可为不影响CRISPR酶、腺苷脱氨酶和烷基腺嘌呤DNA糖基化酶的功能活性和/或结构的氨基酸、肽或多肽。
在一个实例中,用于腺嘌呤碱基置换的结构域可按照以下顺序组成:N末端-[CRISPR酶]-[连接结构域]-[腺苷脱氨酶]-[烷基腺嘌呤DNA糖基化酶]-C末端;N末端-[CRISPR酶]-[腺苷脱氨酶]-[连接结构域]-[烷基腺嘌呤DNA糖基化酶]-C末端;或N末端-[CRISPR酶]-[连接结构域]-[腺苷脱氨酶]-[连接结构域]-[烷基腺嘌呤DNA糖基化酶]-C末端。
在一个实例中,用于腺嘌呤碱基置换的蛋白可按照以下顺序组成:N末端-[烷基腺嘌呤DNA糖基化酶]-[连接结构域]-[CRISPR酶]-[腺苷脱氨酶]-C末端;N末端-[烷基腺嘌呤DNA糖基化酶]-[CRISPR酶]-[连接结构域]-[腺苷脱氨酶]-C末端;或N末端-[烷基腺嘌呤DNA糖基化酶]-[连接结构域]-[CRISPR酶]-[连接结构域]-[腺苷脱氨酶]-C末端。
在一个实例中,用于腺嘌呤碱基置换的蛋白可按照以下顺序组成:N末端-[烷基腺嘌呤DNA糖基化酶]-[连接结构域]-[腺苷脱氨酶]-[CRISPR酶]-C末端;N末端-[烷基腺嘌呤DNA糖基化酶]-[腺苷脱氨酶]-[连接结构域]-[CRISPR酶]-C末端;或N末端-[烷基腺嘌呤DNA糖基化酶]-[连接结构域]-[腺苷脱氨酶]-[连接结构域]-[CRISPR酶]-C末端。
在一个实例中,用于腺嘌呤碱基置换的蛋白可按照以下顺序组成:N末端-[腺苷脱氨酶]-[连接结构域]-[CRISPR酶]-[烷基腺嘌呤DNA糖基化酶]-C末端;N末端-[腺苷脱氨酶]-[CRISPR酶]-[连接结构域]-[烷基腺嘌呤DNA糖基化酶]-C末端;或N末端-[腺苷脱氨酶]-[连接结构域]-[CRISPR酶]-[连接结构域]-[烷基腺嘌呤DNA糖基化酶]-C末端。
在一个实例中,用于腺嘌呤碱基置换的蛋白可按照以下顺序组成:N末端-[CRISPR酶]-[连接结构域]-[烷基腺嘌呤DNA糖基化酶]-[腺苷脱氨酶]-C末端;N末端-[CRISPR酶]-[烷基腺嘌呤DNA糖基化酶]-[连接结构域]-[腺苷脱氨酶]-C末端;或N末端-[CRISPR酶]-[连接结构域]-[烷基腺嘌呤DNA糖基化酶]-[连接结构域]-[腺苷脱氨酶]-C末端。
在一个实例中,用于腺嘌呤碱基置换的蛋白可按照以下顺序组成:N末端-[腺苷脱氨酶]-[连接结构域]-[烷基腺嘌呤DNA糖基化酶]-[CRISPR酶]-C末端;N末端-[腺苷脱氨酶]-[烷基腺嘌呤DNA糖基化酶]-[连接结构域]-[CRISPR酶]-C末端;或N末端-[腺苷脱氨酶]-[连接结构域]-[烷基腺嘌呤DNA糖基化酶]-[连接结构域]-[CRISPR酶]-C末端。
在一个实施方式中,可提供用于胞嘧啶置换的融合蛋白。
用于胞嘧啶置换的融合蛋白或编码所述融合蛋白的核酸可包含:
(a)CRISPR酶或其变体;
(b)胞苷脱氨酶;以及
(c)尿嘧啶DNA糖基化酶或其变体。
其中,用于单碱基置换的融合蛋白可诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的胞嘧啶的置换。
用于胞嘧啶碱基置换的蛋白可按照N末端-[CRISPR酶]-[胞苷脱氨酶]-[尿嘧啶DNA糖基化酶]-C末端的顺序组成。
用于胞嘧啶碱基置换的蛋白可按照N末端-[尿嘧啶DNA糖基化酶]-[CRISPR酶]-[胞苷脱氨酶]-C末端的顺序组成。
用于胞嘧啶碱基置换的蛋白可按照N末端-[尿嘧啶DNA糖基化酶]-[胞苷脱氨酶]-[CRISPR酶]-C末端的顺序组成。
用于胞嘧啶碱基置换的蛋白可按照N末端-[胞苷脱氨酶]-[CRISPR酶]-[尿嘧啶DNA糖基化酶]-C末端的顺序组成。
用于胞嘧啶碱基置换的蛋白可按照N末端-[CRISPR酶]-[尿嘧啶DNA糖基化酶]-[胞苷脱氨酶]-C末端的顺序组成。
用于胞嘧啶碱基置换的蛋白可按照N末端-[胞苷脱氨酶]-[尿嘧啶DNA糖基化酶]-[CRISPR酶]-C末端的顺序组成。
用于胞嘧啶碱基置换的蛋白可进一步包含连接结构域。
在一个实例中,所述连接结构域可为可操作地连接CRISPR酶与胞苷脱氨酶、胞苷脱氨酶与尿嘧啶DNA糖基化酶、和/或CRISPR酶与尿嘧啶DNA糖基化酶的结构域,并且可为连接CRISPR酶、胞苷脱氨酶和尿嘧啶DNA糖基化酶以激活每个功能的结构域。
在一个实例中,所述连接结构域可为不影响CRISPR酶、胞苷脱氨酶和尿嘧啶DNA糖基化酶的功能活性和/或结构的氨基酸、肽或多肽。
在一个实例中,用于胞嘧啶碱基置换的结构域可按照以下顺序组成:N末端-[CRISPR酶]-[连接结构域]-[胞苷脱氨酶]-[尿嘧啶DNA糖基化酶]-C末端;N末端-[CRISPR酶]-[胞苷脱氨酶]-[连接结构域]-[尿嘧啶DNA糖基化酶]-C末端;或N末端-[CRISPR酶]-[连接结构域]-[胞苷脱氨酶]-[连接结构域]-[尿嘧啶DNA糖基化酶]-C末端。
在一个实例中,用于胞嘧啶碱基置换的蛋白可按照以下顺序组成:N末端-[尿嘧啶DNA糖基化酶]-[连接结构域]-[CRISPR酶]-[胞苷脱氨酶]-C末端;N末端-[尿嘧啶DNA糖基化酶]-[CRISPR酶]-[连接结构域]-[胞苷脱氨酶]-C末端;或N末端-[尿嘧啶DNA糖基化酶]-[连接结构域]-[CRISPR酶]-[连接结构域]-[胞苷脱氨酶]-C末端。
用于胞嘧啶碱基置换的蛋白可按照以下顺序组成:N末端-[尿嘧啶DNA糖基化酶]-[连接结构域]-[胞苷脱氨酶]-[CRISPR酶]-C末端;N末端-[尿嘧啶DNA糖基化酶]-[胞苷脱氨酶]-[连接结构域]-[CRISPR酶]-C末端;或N末端-[尿嘧啶DNA糖基化酶]-[连接结构域]-[胞苷脱氨酶]-[连接结构域]-[CRISPR酶]-C末端。
用于胞嘧啶碱基置换的蛋白可按照以下顺序组成:N末端-[胞苷脱氨酶]-[连接结构域]-[CRISPR酶]-[尿嘧啶DNA糖基化酶]-C末端;N末端-[胞苷脱氨酶]-[CRISPR酶]-[连接结构域]-[尿嘧啶DNA糖基化酶]-C末端;或N末端-[胞苷脱氨酶]-[连接结构域]-[CRISPR酶]-[连接结构域]-[尿嘧啶DNA糖基化酶]-C末端。
用于胞嘧啶碱基置换的蛋白可按照以下顺序组成:N末端-[CRISPR酶]-[连接结构域]-[尿嘧啶DNA糖基化酶]-[胞苷脱氨酶]-C末端;N末端-[CRISPR酶]-[尿嘧啶DNA糖基化酶]-[连接结构域]-[胞苷脱氨酶]-C末端;或N末端-[CRISPR酶]-[连接结构域]-[尿嘧啶DNA糖基化酶]-[连接结构域]-[胞苷脱氨酶]-C末端。
胞嘧啶碱基修饰蛋白可按照以下顺序组成:N末端-[胞苷脱氨酶]-[连接结构域]-[尿嘧啶DNA糖基化酶]-[CRISPR酶]-C末端;N末端-[胞苷脱氨酶]-[尿嘧啶DNA糖基化酶]-[连接结构域]-[CRISPR酶]-C末端;或N末端-[胞苷脱氨酶]-[连接结构域]-[尿嘧啶DNA糖基化酶]-[连接结构域]-[CRISPR酶]-C末端。
[用于单碱基置换的蛋白的第二方面——用于单碱基置换的复合物]
本说明书中公开的用于单碱基置换的蛋白的一个方面为用于单碱基置换的复合物(单碱基置换复合物)。
在一个实例中,用于单碱基置换的复合物可包含:
(a)CRISPR酶或其变体;
(b)脱氨酶;
(c)DNA糖基化酶;以及
(d)两个或更多个结合结构域。
其中,用于单碱基置换的融合蛋白可诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的胞嘧啶或腺嘌呤的置换。
在一个实例中,在用于单碱基置换的复合物中,CRISPR酶可与两个或更多个结合结构域连接。
此处,与CRISPR酶连接的两个或更多个结合结构域中的任一个可和与(b)脱氨酶连接的结合结构域配对,并且其中的另一个可和与(c)DNA糖基化酶连接的结合结构域配对。此处,由于所述对之间的结合,组分(a)CRISPR酶、(b)脱氨酶和(c)DNA糖基化酶形成复合物以提供用于单碱基置换的复合物。
在一个示例性实施方式中,与两个或更多个结合结构域连接的CRISPR酶可具有[结合结构域(功能结构域)]n-CRISPR酶(n可为2以上的整数)的构型。
例如,CRISPR酶可在图32(a)中示出。
此处,GCN4可为与CRISPR酶连接的结合结构域的实例,并且不同类型的结合结构域可与其连接。然而,本发明不限于此。
此处,CRISPR酶可与1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个结合结构域连接。
在另一实例中,CRISPR酶可在图32(b)中示出。
此处,GCN4可为与CRISPR酶连接的结合结构域的实例,并且不同类型的结合结构域可与其连接。然而,本发明不限于此。
此处,CRISPR酶可在C末端和N末端处与1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个结合结构域连接。
在一个示例性实施方式中,本申请提供的用于单碱基置换的复合物可通过以下方式提供:
图33的组成成分(a)、(b)和(c)中的结合结构域的特异性结合。
此处,(a)的结合结构域GCN4、(b)的结合结构域scFv和(c)的结合结构域scFv仅为示例并且本发明不限于此。APOBEC可由腺苷脱氨酶替换,并且UNG可由烷基腺嘌呤DNA糖基化酶替换。
其中,多个(b)和/或多个(c)可结合至一个(a)。
其中,“多个”意指2、3、4、5、6、7、8、9、10或更大的整数。
在一个示例性实施方式中,本申请提供的用于单碱基置换的复合物可通过以下方式提供:
图34的组成成分(a)、(b)和(c)中的结合结构域的特异性结合。
此处,(a)的结合结构域GCN4、(b)的结合结构域scFv和(c)的结合结构域scFv仅为示例并且本发明不限于此。APOBEC可由腺苷脱氨酶替换,并且UNG可由烷基腺嘌呤DNA糖基化酶替换。
此处,多个(b)和/或多个(c)可结合至一个(a)。
此处,“多个”意指2、3、4、5、6、7、8、9、10或更大的整数。
在一个实例中,在用于单碱基置换的复合物中,所述脱氨酶可与两个或更多个结合结构域连接。此处,与脱氨酶连接的两个或更多个结合结构域中的每一个和与(a)CRISPR酶连接的结合结构域以及与(c)DNA糖基化酶连接的结合结构域配对。此处,由于所述对之间的结合,组分(a)CRISPR酶、(b)脱氨酶和(c)DNA糖基化酶形成复合物,并且可提供用于单碱基置换的复合物。
在一个实例中,在用于单碱基置换的复合物中,所述DNA糖基化酶可与两个或更多个结合结构域连接。此处,与DNA糖基化酶连接的两个或更多个结合结构域中的每一个和与(a)CRISPR酶连接的结合结构域以及与(b)脱氨酶连接的结合结构域配对。此处,由于所述对之间的结合,组分(a)CRISPR酶、(b)脱氨酶和(c)DNA糖基化酶形成复合物以提供用于单碱基置换的复合物。
在一个实例中,在用于单碱基置换的复合物中,所述CRISPR酶可与两个或更多个结合结构域连接,并且可存在于其中连接了脱氨酶和DNA糖基化酶的融合蛋白中。此处,所述融合蛋白包含一个或多个结合结构域。在一个示例性实施方式中,与所述CRISPR酶连接的一个结合结构域和融合蛋白的结合结构域配对。此处,由于所述对之间的结合,组分(a)CRISPR酶、(b)脱氨酶和(c)DNA糖基化酶形成复合物以提供用于单碱基置换的复合物。
在一个示例性实施方式中,本申请提供的用于单碱基置换的复合物可通过图35中(a)的结合结构域和(b)的结合结构域的特异性结合而形成。
此处,(a)的结合结构域GCN4和(b)的结合结构域scFv仅为示例并且本发明不限于此。APOBEC可由腺苷脱氨酶或不同类型的胞苷脱氨酶替换,并且UNG可由烷基腺嘌呤DNA糖基化酶替换。
此处,多个(b)可结合至一个(a)。
此处,“多个”意指2、3、4、5、6、7、8、9、10或更大的整数。
在一个示例性实施方式中,本申请提供的用于单碱基置换的复合物可通过图36中(a)的结合结构域和(c)的结合结构域的特异性结合而形成。
此处,(a)的结合结构域GCN4和(b)的结合结构域scFv仅为示例并且本发明不限于此。APOBEC可由腺苷脱氨酶或不同类型的胞苷脱氨酶替换,并且UNG可由烷基腺嘌呤DNA糖基化酶替换。
此处,多个(b)可结合至一个(a)。
此处,“多个”意指2、3、4、5、6、7、8、9、10或更大的整数。
在一个示例性实施方式中,本申请提供的用于单碱基置换的复合物可通过图37中(a)的结合结构域和(b)的结合结构域的特异性结合而形成。
此处,(a)的结合结构域GCN4和(b)的结合结构域scFv仅为示例并且本发明不限于此。APOBEC可由腺苷脱氨酶或不同类型的胞苷脱氨酶替换,并且UNG可由烷基腺嘌呤DNA糖基化酶替换。
此处,多个(b)可结合至一个(a)。
此处,“多个”意指2、3、4、5、6、7、8、9、10或更大的整数。
在一个示例性实施方式中,本申请提供的用于单碱基置换的复合物可通过图38中(a)的结合结构域和(c)的结合结构域的特异性结合而形成。
此处,(a)的结合结构域GCN4和(b)的结合结构域scFv仅为示例并且本发明不限于此。APOBEC可由腺苷脱氨酶或不同类型的胞苷脱氨酶替换,并且UNG可由烷基腺嘌呤DNA糖基化酶替换。
此处,多个(b)可结合至一个(a)。
此处,”多个”意指2、3、4、5、6、7、8、9、10或更多的整数。
在一个实例中,用于单碱基置换的复合物可以以融合蛋白的形式存在,其中脱氨酶与两个或更多个结合结构域连接,并与CRISPR酶和DNA糖基化酶连接。此处,所述融合蛋白包含一个或多个结合结构域。在一个示例性实施方式中,与所述脱氨酶连接的一个结合结构域和融合蛋白的结合结构域配对。此处,由于所述对之间的结合,组分(a)CRISPR酶、(b)脱氨酶和(c)DNA糖基化酶形成复合物以提供用于单碱基置换的复合物。
在一个实例中,用于单碱基置换的复合物可以以融合蛋白的形式存在,其中DNA糖基化酶与两个或更多个结合结构域连接,并且脱氨酶和CRISPR酶连接。此处,所述融合蛋白包含一个或多个结合结构域。在一个示例性实施方式中,与所述DNA糖基化酶连接的一个结合结构域与融合蛋白的结合结构域配对。在此处,由于所述对之间的结合,组分(a)CRISPR酶、(b)脱氨酶和(c)DNA糖基化酶形成复合物以提供用于单碱基置换的复合物。
在一个实例中,用于单碱基置换的复合物可包含(i)第一融合蛋白,所述第一融合蛋白包含选自于CRISPR酶、脱氨酶和DNA糖基化酶中的两种组分和第一结合结构域,以及(ii)第二融合蛋白,所述第二融合蛋白包含未被选择的剩余组分和第二结合结构域。其中,第一结合结构域和第二结合结构域为相互作用对,并且此处,所述复合物通过所述对形成。其中,第二融合蛋白除第二结合结构域之外可进一步包含多个结合结构域。
在一个示例性实施方式中,用于单碱基置换的复合物可包含(i)包含脱氨酶、DNA糖基化酶和第一结合结构域的第一融合蛋白,以及(ii)包含CRISPR酶和第二结合结构域的第二融合蛋白。此处,第二融合蛋白除第二结合结构域之外可进一步包含多个结合结构域。此处,第一结合结构域可为单链可变片段(scFv),并且第二融合蛋白可为GCN4肽。此处,scFv可通过与GCN4肽的相互作用来提供用于单碱基置换的复合物。
在一个示例性实施方式中,用于单碱基置换的复合物可包含(i)包含脱氨酶、CRISPR酶和第一结合结构域的第一融合蛋白,以及(ii)包含DNA糖基化酶和第二结合结构域的第二融合蛋白。此处,第二融合蛋白除第二结合结构域之外可进一步包含多个结合结构域。此处,第一结合结构域可为单链可变片段(scFv),并且第二融合蛋白可为GCN4肽。此处,scFv可通过与GCN4肽的相互作用而提供用于单碱基置换的复合物。
在一个示例性实施方式中,用于单碱基置换的复合物可包含(i)包含CRISPR酶、DNA糖基化酶和第一结合结构域的第一融合蛋白,以及(ii)包含脱氨酶和第二结合结构域的第二融合蛋白。此处,第二融合蛋白除第二结合结构域之外可进一步包含多个结合结构域。此处,第一结合结构域可为单链可变片段(scFv),并且第二融合蛋白可为GCN4肽。此处,scFv可通过与GCN4肽的相互作用而提供用于单碱基置换的复合物。
在一个实例中,CRISPR酶、脱氨酶和DNA糖基化酶中的任一个与第一结合结构域和第二结合结构域连接,并且此处,第一结合结构域为与另一结合结构域相互作用的对。此处,第二结合结构域为与再一结合结构域相互作用的对,并且用于单碱基置换的复合物可通过所述对提供。
在一个实施方式中,所述CRISPR酶可与第一结合结构域和第二结合结构域连接。此处,第一结合结构域为与所述脱氨酶的结合结构域相互作用的对,并且第二结合结构域为与所述DNA糖基化酶的结合结构域相互作用的对。此处,用于单碱基置换的复合物可通过所述对提供。
在一个实施方式中,所述脱氨酶可与第一结合结构域和第二结合结构域连接。此处,第一结合结构域为与所述CRISPR酶的结合结构域相互作用的对,并且第二结合结构域为与所述DNA糖基化酶的结合结构域相互作用的对。此处,用于单碱基置换的复合物可通过所述对提供。
在一个实施方式中,所述DNA糖基化酶可与第一结合结构域和第二结合结构域连接。此处,第一结合结构域为与所述脱氨酶的结合结构域相互作用的对,并且第二结合结构域为与所述CRISPR酶的结合结构域相互作用的对。此处,用于单碱基置换的复合物可通过所述对提供。
此处,所述结合结构域可为FRB结构域和FKBP二聚化结构域之一;内含肽;ERT结构域和VPR结构域之一;GCN4肽和单链可变片段(scFv)之一;或形成异二聚体的结构域。
此处,所述对可为以下集中的任一个:
FRB结构域和FKBP二聚化结构域;
第一内含肽和第二内含肽;
ERT结构域和VPR结构域;
GCN4肽和单链可变片段(scFv);以及
形成异二聚体的第一结构域和第二结构域。
本申请可提供胞嘧啶置换复合物。
例如,所述脱氨酶可为胞苷脱氨酶,并且所述DNA糖基化酶可为尿嘧啶DNA糖基化酶或其变体。此处,用于单碱基置换的融合蛋白可为用于单碱基置换的复合物,所述复合物诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的胞嘧啶的置换。
在一个实例中,所述胞苷脱氨酶为APOBEC、激活诱导的胞苷脱氨酶(AID)或其变体。
在一个实例中,CRISPR酶、胞苷脱氨酶和尿嘧啶DNA糖基化酶中的任一个可与第一结合结构域和第二结合结构域连接。此处,第一结合结构域为与另一结合结构域相互作用的对,并且此处,第二结合结构域为与再一结合结构域相互作用的对。此处,用于单碱基置换的复合物可通过所述对提供。
在一个实施方式中,所述CRISPR酶可与第一结合结构域和第二结合结构域连接。此处,第一结合结构域为与所述脱氨酶的结合结构域相互作用的相互作用对,第二结合结构域为与所述DNA糖基化酶的结合结构域相互作用的相互作用对。此处,用于单碱基置换的复合物可通过所述对提供。
在一个实例中,用于单碱基置换的复合物可包含(i)包含第一结合结构域和选自于CRISPR酶、胞苷脱氨酶和尿嘧啶DNA糖基化酶中的两种组分的第一融合蛋白,以及(ii)包含未被选择的剩余组分和第二结合结构域的第二融合蛋白。此处,第一结合结构域和第二结合结构域为彼此相互作用的相互作用对,并且此处,所述复合物可通过所述对形成。此处,第二融合蛋白除第二结合结构域之外可进一步包含多个结合结构域。
此处,所述对可为以下集中的任一个:
FRB结构域和FKBP二聚化结构域;
第一内含肽和第二内含肽;
ERT结构域和VPR结构域;
GCN4肽和单链可变片段(scFv);以及
形成异二聚体的第一结构域和第二结构域。
本申请可提供腺嘌呤置换复合物。
在一个实例中,所述脱氨酶可为腺苷脱氨酶,并且所述DNA糖基化酶可为烷基腺嘌呤DNA糖基化酶或其变体。此处,用于单碱基置换的融合蛋白可为用于单碱基置换的复合物,所述复合物诱导任意碱基对靶核酸序列中一个或多个核苷酸中包含的腺嘌呤的置换。
在一个实例中,所述腺嘌呤脱氨酶可为TadA、Tad2p、ADA、ADA1、ADA2、ADAR2、ADAT2、ADAT3或其变体。
在一个实例中,CRISPR酶、腺苷脱氨酶和烷基腺嘌呤DNA糖基化酶中的任一个可与第一结合结构域和第二结合结构域连接。此处,第一结合结构域为与另一组分的结合结构域相互作用的相互作用对,第二结合结构域为与再一组分的结合结构域相互作用的相互作用对。此处,用于单碱基置换的复合物可通过所述对提供。
在一个实施方式中,所述CRISPR酶可与第一结合结构域和第二结合结构域连接。此处,第一结合结构域为与所述脱氨酶的结合结构域相互作用的相互作用对,并且第二结合结构域为与所述DNA糖基化酶的结合结构域相互作用的相互作用对。此处,用于单碱基置换的复合物可通过所述对提供。
在一个实例中,用于单碱基置换的复合物可包含(i)包含第一结合结构域和选自于CRISPR酶、腺苷脱氨酶和烷基腺嘌呤DNA糖基化酶中的两种组分的第一融合蛋白,以及(ii)包含第二结合结构域和未被选择的剩余组分的第二融合蛋白。此处,第一结合结构域和第二结合结构域为彼此相互作用的相互作用对,并且所述复合物通过所述对形成。此处,第二融合蛋白除第二结合结构域之外可进一步包含多个结合结构域。
此处,所述对可为以下集中的任一个:
FRB结构域和FKBP二聚化结构域;
第一内含肽和第二内含肽;
ERT结构域和VPR结构域;
GCN4肽和单链可变片段(scFv);以及
形成异二聚体的第一结构域和第二结构域。
本说明书中公开的本发明的一个方面为用于碱基置换的组合物及使用所述组合 物的方法。
用于单碱基置换的组合物可用于对基因中一个或多个核苷酸的碱基进行人工修饰。
术语“人工修饰的或人工工程化的”是指经过人工修饰的状态,而不是自然中发生的状态。例如,人工修饰的状态可为人工引起野生型基因突变的修饰。在下文中,非天然、人工修饰的多态性依赖型基因(polymorphism-dependent gene)可与术语人工多态性依赖型基因互换使用。
用于碱基修饰的组合物可进一步包含向导RNA或编码所述向导RNA的核酸。
在一个实例中,本发明提供了用于单碱基置换的组合物,所述组合物包含:
(a)向导RNA或编码所述向导RNA的核酸,以及(b)用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,或用于单碱基置换的复合物。其中,向导RNA可互补结合靶核酸序列,其中与向导RNA结合的靶核酸序列的长度为15bp-25bp,其中用于单碱基置换的融合蛋白或用于单碱基置换的复合物诱导用任意碱基对包含所述靶核酸序列的靶区域中存在的一个或多个胞嘧啶或腺嘌呤的置换。
[用于碱基置换的组合物的第一组分——向导RNA]
用于碱基置换的组合物可包含向导RNA或编码所述向导RNA的核酸。
向导RNA(gRNA)是指能够将gRNA-CRISPR酶复合体(即CRISPR复合体)特异性地引导至靶基因或核酸的RNA。此外,gRNA是指靶基因或核酸特异性RNA,并且可与CRISPR酶结合以将CRISPR酶指引至靶基因或核酸。
向导RNA可与靶基因或核酸的双链的任一条链的部分序列互补结合。所述部分序列可指靶核酸序列。
向导RNA可用于将向导RNA-CRISPR酶复合体诱导至具有靶基因或核酸的特定核苷酸序列的位置。
向导RNA是指能够将gRNA-CRISPR酶复合体(即CRISPR复合体)特异性引导至靶基因、靶区域或靶核酸序列的RNA。另外,gRNA是指靶基因或核酸特异性RNA,并且可与CRISPR酶结合以将CRISPR酶指引至靶基因、靶区域或靶核酸序列。
向导RNA可被称为单链向导RNA(单RNA分子;单gRNA;sgRNA);或双链向导RNA(包括多于一个,通常是两个的独立的RNA分子)。
向导RNA包含与靶序列互补结合的位点(下文中称为向导位点)和参与和Cas蛋白形成复合体的位点(下文中称为复合体形成位点)。
在一个实例中,向导RNA可与SpCas9蛋白相互作用,并且可为选自于SEQ IDNO.48-SEQ ID NO.81中的任一个。
在另一实例中,向导RNA可与CjCas9蛋白相互作用,并且可包含选自于SEQ IDNO.82-SEQ ID NO.92中的任一个。
[表1]
Figure BDA0003482434050000511
Figure BDA0003482434050000521
Figure BDA0003482434050000531
此处,复合体形成位点可根据Cas9蛋白来源的微生物的类型来确定。例如,在向导RNA与SpCas9蛋白相互作用的情况下,复合体形成位点可包含5′-GUUUUAGUCCCUGAAAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ.IDNO:45);在向导RNA与CjCas9蛋白相互作用的情况下,复合体形成位点可包含5′-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ ID NO:46)。
作为原间隔序列临近基序(PAM)序列,当使用spCas9蛋白时,考虑NGG(N为A、T、C或G),当使用CjCas9蛋白时,考虑NNNNRYAC(SEQ ID NO:47)(N各自独立地为A、T、C或G,R为A或G,Y为C或T)。
所述组合物可包含一个或多个向导RNA。
[用于碱基置换的组合物的第二组分——用于单碱基置换的蛋白]
用于碱基置换的组合物可包含用于单碱基置换的蛋白或编码所述蛋白的核酸。
用于单碱基置换的蛋白与上述所述相同。
[用于碱基置换的组合物的第三组分——载体]
用于碱基修饰的组合物可为载体的形式。
“载体”可将基因序列递送至细胞。通常,“载体结构”、“表达载体”和“基因转移载体”可指导期望的基因的表达,并且指能够将基因序列递送至靶细胞的任何核酸结构。因此,术语“载体”包括载体,以及克隆和表达媒介。
此处,所述载体可为病毒或非病毒载体(例如质粒)。
此处,所述载体可包含一个或多个调控/控制元件。
此处,调控/控制元件可包括启动子、增强子、内含子、聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。
所述启动子可为被RNA聚合酶II识别的启动子。
所述启动子可为被RNA聚合酶III识别的启动子。
所述启动子可为诱导型启动子。
所述启动子可为靶标特异性启动子。
所述启动子可为病毒或非病毒启动子。
作为启动子,可使用根据控制区域(即编码向导RNA或CRISPR酶的核酸序列)的合适的启动子。
例如,对向导RNA有用的启动子可为H1、EF-1a、tRNA或U6启动子。例如,用于CRISPR酶的启动子可为CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。
所述载体可为病毒载体或重组病毒载体。
所述病毒可为DNA病毒或RNA病毒。
此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。
此处,RNA病毒可为单链RNA(ssRNA)病毒。
所述病毒可为逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒或单纯疱疹病毒,但本发明不限于此。
通常,病毒可感染宿主(例如细胞)以将编码病毒遗传信息的核酸印入宿主,或将编码遗传信息的核酸插入宿主的基因组中。可使用具有上述特征的病毒将向导RNA和/或CRISPR酶引入靶标中。使用此类病毒引入的向导RNA和/或CRISPR酶可在受试者(例如细胞)中暂时表达。或者,使用此类病毒引入的向导RNA和/或CRISPR酶可在受试者(例如细胞)中持续表达很长一段时间(例如1周、2周、3周、1个月、2个月、3个月、6个月、9个月、1年、2年或永久)。
病毒包装能力可从至少2kb至50kb不等,取决于病毒类型。根据此种包装能力,可设计独立包含向导RNA或CRISPR酶的病毒载体或包含向导RNA和CRISPR酶两者的病毒载体。或者,可设计包含向导RNA、CRISPR酶和附加的组分的病毒载体。
例如,逆转录病毒载体对高达6kb至10kb的外来序列具有包装能力,并且由顺式作用长末端重复序列(LTR)组成。逆转录病毒载体将治疗性基因插入细胞,并提供所插入基因的永久表达。
在另一实例中,无论细胞分裂如何,腺相关病毒载体都具有非常高的各种细胞(肌肉、脑、肝、肺、视网膜、耳、心脏和血管细胞)引入效率且无致病性,并且由于大多数病毒基因组可被治疗性基因替换并且不诱导免疫反应,重复给予是可能的。此外,将AAV插入至靶细胞的染色体中,从而长时间稳定地表达治疗性蛋白。例如,AAV可用于在体外产生核酸和肽并在体内和离体将所述核酸或肽转导至细胞的靶核酸。然而,AAV体积小且包装能力不到4.5kb。
其中,用于碱基修饰的组合物可包含载体以及腺嘌呤碱基置换蛋白,所述载体包含编码向导RNA的核酸。
其中,用于碱基修饰的组合物可包含向导RNA以及载体,所述载体包含编码用于腺嘌呤碱基置换的蛋白的核酸。
其中,用于碱基修饰的组合物可包含:包含编码向导RNA的核酸的载体;以及包含编码用于腺嘌呤碱基置换的蛋白的核酸的载体。
其中,用于碱基修饰的组合物可包含载体,所述载体包含编码向导RNA的核酸以及编码腺嘌呤碱基置换蛋白的核酸。
在另一实例中,用于碱基修饰的组合物可包含
(a)CRISPR酶或编码所述CRISPR酶的核酸,所述CRISPR酶包含第一结合结构域;以及
(b)腺苷脱氨酶或编码所述腺苷脱氨酶的核酸,所述腺苷脱氨酶包含第二结合结构域。
其中,CRISPR酶可为野生型CRISPR酶或CRISPR酶变体。
其中,CRISPR酶变体可为切口酶。
腺苷脱氨酶可为TadA、Tad2p、ADA、ADA1、ADA2、ADAR2、ADAT2、ADAT3或它们的变体。
第一结合结构域可与第二结合结构域形成非共价键。
其中,第一结合结构域可为:FRB结构域和FKBP二聚化结构域之一;内含肽;ERT结构域和VPR结构域之一;GCN4肽和单链可变片段(scFv)之一;或形成异二聚体的结构域。
其中,第二结合结构域可为:FRB结构域和FKBP二聚化结构域之一;内含肽;ERT结构域和VPR结构域之一;GCN4肽和单链可变片段(scFv)之一;或形成异二聚体的结构域。
用于碱基修饰的组合物可进一步包含一个或多个向导RNA或编码所述向导RNA的核酸。
其中,用于碱基修饰的组合物可为核糖核蛋白(RNP)的形式(即复合物),其包含
向导RNA;-
具有第一结合结构域的CRISPR酶;以及-
具有第二结合结构域的腺苷脱氨酶。
其中,用于碱基修饰的组合物可包含
包含编码向导RNA的核酸的载体;
包含编码具有第一结合结构域的CRISPR酶的核酸的载体;以及
包含编码具有第二结合结构域的腺苷脱氨酶的核酸的载体。
其中,用于碱基修饰的组合物可包含
包含编码向导RNA的核酸的载体;以及
包含第一结合结构域的CRISPR酶和包含第二结合结构域的腺苷脱氨酶的复合物。
其中,用于碱基修饰的组合物可包含载体,所述载体包含编码向导RNA的核酸,编码具有第一结合结构域的CRISPR酶的核酸和编码具有第二结合结构域的腺苷脱氨酶的核酸。
其中,用于碱基修饰的组合物可包含:含有编码向导RNA的核酸和编码具有第一结合结构域的CRISPR酶的核酸的载体;以及含有编码具有第二结合结构域的腺苷脱氨酶的核酸的载体。
其中,用于碱基修饰的组合物可包含:含有编码具有第一结合结构域的CRISPR酶的核酸的载体;以及含有编码向导RNA的核酸和编码具有第二结合结构域的腺苷脱氨酶的核酸的载体。
其中,用于碱基修饰的组合物可包含:含有编码向导RNA的核酸的载体;具有第一结合结构域的CRISPR酶;以及含有编码具有第二结合结构域的腺苷脱氨酶的核酸的载体。
其中,用于碱基修饰的组合物可包含:含有编码向导RNA的核酸的载体;含有编码具有第一结合结构域的CRISPR酶的核酸的载体;以及具有第二结合结构域的腺苷脱氨酶。
其中,用于碱基修饰的组合物可包含:含有编码向导RNA的核酸和编码具有第一结合结构域的CRISPR酶的核酸的载体;以及具有第二结合结构域的腺苷脱氨酶。
其中,用于碱基修饰的组合物可包含:具有第一结合结构域的CRISPR酶;以及含有编码向导RNA的核酸和编码具有第二结合结构域的腺苷脱氨酶的核酸的载体。
[用于碱基置换的组合物的第四组分——向导RNA-用于单碱基置换的蛋白的复合物]
用于碱基修饰的组合物可为核酸-蛋白质复合物。其中,所述核酸-蛋白质复合物可为向导RNA-用于腺嘌呤碱基置换的蛋白的复合物。其中,所述核酸-蛋白质复合物可为向导RNA-用于胞嘧啶碱基置换的蛋白的复合物。
其中,向导RNA-用于腺嘌呤碱基置换的蛋白的复合物可由所述向导RNA与用于腺嘌呤碱基置换的蛋白之间的非共价键形成。
其中,向导RNA-用于胞嘧啶碱基置换的蛋白的复合物可由所述向导RNA与用于胞嘧啶碱基置换的蛋白之间的非共价键形成。
用于碱基修饰的组合物可为非载体型。
此处,所述非载体可为裸露DNA、DNA复合物或mRNA。
用于碱基修饰的组合物可为载体形式。
以上已经提供了对载体的描述。
在一个实例中,用于碱基修饰的组合物可包含具有CRISPR酶和腺苷脱氨酶的用于腺嘌呤碱基置换的蛋白,或编码所述蛋白的核酸。
其中,所述CRISPR酶可为野生型CRISPR酶或CRISPR酶变体。
其中,所述CRISPR酶变体可为切口酶。
所述腺苷脱氨酶可为TadA、Tad2p、ADA、ADA1、ADA2、ADAR2、ADAT2、ADAT3或其变体。
用于腺嘌呤碱基置换的蛋白可按照N末端-[CRISPR酶]-[腺苷脱氨酶]-C末端的顺序组成。
用于腺嘌呤碱基置换的蛋白可按照N末端-[腺苷脱氨酶]-[CRISPR酶]-C末端的顺序组成。
其中,用于腺嘌呤碱基置换的蛋白可进一步包含连接结构域。
用于碱基修饰的组合物可进一步包含一个或多个向导RNA或编码所述向导RNA的核酸。
其中,用于碱基修饰的组合物可为向导RNA-用于腺嘌呤碱基置换的蛋白的复合物(即核糖核蛋白(RNP))的形式。
本说明书中公开的本发明的一个方面为用于单碱基置换的蛋白或包含所述蛋白 的用于单碱基置换的组合物的用途。
可提供本申请中提供的用于单碱基置换的蛋白的以下用途。
用于碱基修饰的组合物可用于对靶基因中一个或多个核苷酸的碱基进行人工修饰。
(i)用于碱基修饰的组合物可用于通过对特定基因靶区域的一个或多个核苷酸的碱基进行人工修饰来获得关于突变从而不鉴别由所修饰的核酸序列表达的物质的部分(即具有抗体抗性的表位)的信息。
(ii)用于碱基修饰的组合物可用于通过对特定基因靶区域的一个或多个核苷酸的碱基进行人工修饰来获得关于由所修饰的核苷酸表达的物质对特定药物的敏感性是否降低或丧失的信息。即,用于碱基修饰的组合物可用于发现或确认影响特定药物的靶基因的区域或由所述靶基因编码的蛋白质(靶蛋白)的区域。
(iii)用于碱基修饰的组合物可用于通过对特定基因的靶区域的一个或多个核苷酸的碱基进行人工修饰来获得关于由修饰的核苷酸表达的物质对特定药物的敏感性是否增加的信息。即,用于碱基修饰的组合物可用于发现或确认影响对特定药物敏感性的增加的靶基因的区域或由所述靶基因编码的蛋白质(靶蛋白)的区域。
(iv)用于碱基修饰的组合物可用于通过对特定基因的靶区域的一个或多个核苷酸的碱基进行人工修饰来获得关于由修饰的核酸序列表达的物质是否具有病毒抗性的信息。即,用于碱基修饰的组合物可用于筛选病毒抗性基因或病毒抗性蛋白。
[第一用途——表位筛选]
在一个实施方式中,用于单碱基置换的蛋白或包含所述蛋白的用于碱基置换的组合物可用于表位筛选。
“表位”是指抗原的允许免疫系统(例如抗体、B细胞或T细胞)识别该抗原的特定部分,并且也称为抗原决定簇。蛋白质的表位根据与抗原结合位点(即抗体的识别表位的特定部分)的形状或作用方式,大致分为构象表位和线性表位。构象表位由抗原(即蛋白质)的不连续氨基酸序列组成。构象表位与抗体的抗原结合位点的三维结构发生反应。大多数表位为构象表位。相反,线性表位与抗体的抗原结合位点的一维结构反应,并且构成抗原的线性表位的氨基酸依次排列。
“表位筛选”意指发现或检测抗原的特定部分,所述特定部分允许免疫系统(例如抗体、B细胞或T细胞)识别该抗原,或意指用于发现或检测抗原的特定部分的方法、组合物或试剂盒,所述特定部分发生突变使得免疫系统(例如抗体、B细胞或T细胞)无法识别该抗原。其中,抗原的发生突变而使免疫系统(例如抗体、B细胞或T细胞)无法识别该抗原的特定部分可为具有抗体抗性的表位。
单碱基置换蛋白或包含所述蛋白的用于碱基置换的组合物可人工地产生单核苷酸多态性(SNP)以揭示参与机体变化的SNP的位置,例如特定因子的表达的产生、抑制、增加或减少,特定功能的产生或丧失,疾病的存在或不存在,或对外部药物或化合物(例如可用作表位的序列和与耐药性有关的单核苷酸多态性的位置)的反应性差异。
关于单碱基置换蛋白和用于碱基置换的组合物的描述已在上文中提供。
对于表位筛选,单碱基置换蛋白可用于诱导基因组中的人工SNP。
此处,人工SNP可引起点突变。
点突变是指由一个核苷酸的修饰引起的突变。点突变分为错义突变、无义突变和沉默突变。
错义突变是指突变的密码子由于一个或多个修饰的核苷酸而编码另一氨基酸的情况。无义突变是指其中一个或多个修饰的核苷酸突变的密码子成为终止密码子的情况。沉默突变是指一个或多个修饰的核苷酸突变的密码子编码的氨基酸与未突变的密码子编码的氨基酸相同的情况。
在一个实例中,通过用其它碱基C、T或G对一个碱基A的置换,密码子可变为编码不同氨基酸的密码子。换言之,可能发生错义突变。例如,当A被C置换时,亮氨酸可变成甘氨酸。
在另一实例中,通过其它碱基C、T或G对一个碱基A的置换,密码子可变为编码相同氨基酸的另一个密码子。换言之,可能发生沉默突变。例如,当A被C置换时,可产生编码相同脯氨酸的密码子。
在又一实例中,当A被C、T或G置换从而产生TAG、TGC或TAA时,可产生终止密码子(例如UAA、UAG和UGA)之一。换言之,可能发生无义突变。
单碱基置换蛋白可在基因中一个或多个核苷酸的碱基处诱导或产生人工置换,从而引起点突变。
用于碱基置换的组合物可在基因中一个或多个核苷酸的碱基处诱导或产生人工置换,从而引起点突变。
上面已经描述了单碱基的人工置换的诱导。
由单碱基置换蛋白或包含所述蛋白的用于碱基置换的组合物引起的点突变所编码的蛋白质可为其中至少一个或多个氨基酸发生改变的蛋白变体。
例如,在编码EGFR的基因中由单碱基置换蛋白或包含所述蛋白的用于碱基置换的组合物产生点突变时,由所产生的点突变编码的蛋白可为其中至少一个氨基酸与野生型EGFR不同的EGFR变体。
一个或多个修饰的氨基酸可变为具有相似特性的氨基酸。
疏水性氨基酸可变为不同的疏水性氨基酸。疏水性氨基酸可为甘氨酸、丙氨酸、缬氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、酪氨酸和色氨酸中的一种。
碱性氨基酸可变为其它碱性氨基酸。碱性氨基酸为精氨酸和组氨酸中的一种。
酸性氨基酸可变为其它酸性氨基酸。酸性氨基酸为谷氨酸和天冬氨酸中的一种。
极性氨基酸可变为其它极性氨基酸。极性氨基酸为丝氨酸、苏氨酸、天冬酰胺和谷氨酰胺中的一种。
一个或多个修饰的氨基酸可变为具有不同特性的氨基酸。
在一个实例中,疏水性氨基酸可变为极性氨基酸。
在另一实例中,疏水性氨基酸可变为酸性氨基酸。
在一个实例中,疏水性氨基酸可变为碱性氨基酸。
在另一实例中,极性氨基酸可变为疏水性氨基酸。
在一个实例中,酸性氨基酸可变为碱性氨基酸。
在另一实例中,碱性氨基酸可变为酸性氨基酸。
其中至少一个氨基酸发生改变的蛋白变体可具有修饰的三维结构。当氨基酸序列中的一个或多个氨基酸变为不同特性的氨基酸时,由于氨基酸序列之间的结合强度改变,可改变三维结构。当三维结构改变时,可修饰构象表位。可使用本申请提供的单碱基置换蛋白或包含所述蛋白的组合物来诱导所述修饰。
例如,当编码ATM的基因的点突变由用于单碱基置换的蛋白或包含所述蛋白的用于碱基修饰的组合物引起时,由所产生的点突变编码的ATM变体的三维结构可能部分改变,并因此可修饰构象表位。可使用本申请提供的单碱基置换蛋白或包含所述蛋白的组合物来诱导所述修饰。
具有人工SNP的基因可调整合成的蛋白质的量。
在一个实例中,具有人工SNP的基因的mRNA转录量可增加或减少。因此,可增加或减少蛋白合成量。
在另一实例中,当基因中的调控区域包含一个或多个人工多态性时,可增加或减少由含有单核苷酸多态性的基因合成的蛋白质的量。
基因中存在的人工SNP可调控蛋白质的活性。
在一个实例中,一个或多个人工SNP可促进和/或降低蛋白活性。
例如,当编码核膜受体的基因中包含人工SNP时,可激活或降低参与通过配体的识别和与配体结合进行的信号传导过程的所有因子或机制(磷酸化、乙酰化等)。
例如,当编码特定酶的基因中包含人工SNP时,可促进或降低酶的功能(例如乙酰化酶,即靶基因的乙酰化程度)。
基因中存在的人工SNP可改变蛋白功能。
在一个实例中,蛋白质的始功能可通过一个或多个人工SNP得到添加和/或被抑制。
例如,当编码核膜受体的基因中包含人工SNP时,可抑制识别和/或结合配体的能力。
或者,例如,当编码核膜受体的基因中包含人工SNP时,通过与配体结合进行的信号传导至下游因子的一些功能可被抑制。
在一个实施方式中,表位筛选方法可包括:
a)制备能够表达与存在于靶基因中的靶核酸序列互补结合的一个或多个向导RNA文库的一个或多个向导RNA的细胞,所述细胞具有靶核酸序列;
b)将单碱基置换蛋白或编码所述蛋白的核酸引入所述细胞;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)对分离的细胞中靶基因的核酸序列进行分析。
在一个实施方式中,所述表位筛选方法可包括:
a)制备能够表达与存在于靶基因中的靶核酸序列互补结合的一个或多个向导RNA文库的一个或多个向导RNA的细胞,所述细胞具有靶核酸序列;
b)将用于单碱基置换的蛋白或编码所述蛋白的核酸引入所述细胞;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由靶基因表达的蛋白质的结构或功能相关。
在一个实施方式中,所述表位筛选方法可包括:
a)将用于单碱基置换的蛋白或编码所述蛋白的核酸、以及一个或多个向导RNA文库的一个或多个向导RNA或编码所述向导RNA的核酸引入具有靶核酸序列的细胞中;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由靶基因表达的蛋白质的结构或功能相关。
在另一实施方式中,所述表位筛选方法可包括:
a)将用于碱基置换的组合物引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)对分离的细胞中靶基因的核酸序列进行分析。
在另一实施方式中,所述表位筛选方法可包括:
a)将用于碱基置换的组合物引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由靶基因表达的蛋白质的结构或功能相关。
向导RNA文库可为与靶序列的部分核酸序列互补结合的一个或多个向导RNA的组。尽管将编码相同向导RNA文库的核酸引入各个细胞,所述细胞可具有不同的向导RNA。作为将编码相同向导RNA文库的核酸引入各个细胞的结果,所述细胞可具有相同的向导RNA。
以上已描述了向导RNA的说明。
用于单碱基置换的蛋白可为用于腺嘌呤置换的蛋白或用于胞嘧啶置换的蛋白。
以上已描述了用于单碱基置换的蛋白、用于腺嘌呤置换的蛋白和用于胞嘧啶置换的蛋白的说明。
所述引入可通过选自于电穿孔、脂质体、质粒、病毒载体、纳米颗粒和蛋白易位结构域(PTD)融合蛋白中的一种或多种方法进行。
如上所述处理的抗体可为识别编码靶基因的蛋白(下文中称为靶蛋白)的抗体,并且可为能够与所述靶蛋白的表位反应的抗体。
所述活细胞可为不与如上处理的抗体反应的细胞。
分离的细胞可为靶基因中具有至少一个核苷酸修饰的细胞。
此处,一个或多个核苷酸的修饰可为靶基因中产生的一个或多个人工SNP。
此处,一个或多个人工SNP可诱导点突变。
在本申请中,可确认靶基因中存在的至少一个核苷酸(即一个或多个人工SNP)的修饰。因此,可获得靶标的信息。
此处,包含至少一个核苷酸的确认修饰(即一个或多个人工SNP)的核酸序列可为编码表位的核酸序列。
[第二用途——耐药基因或耐药蛋白的筛选]
在另一实施方式中,用于单碱基置换的蛋白或包含所述蛋白的用于碱基置换的组合物可用于耐药基因或耐药蛋白的筛选。
耐药性筛选可提供关于影响对特定药物敏感性降低或丧失的靶基因或编码所述靶基因的蛋白(以下称为靶蛋白)的一个区域的信息。该区域可使用本申请提供的单碱基置换蛋白或包含所述蛋白的组合物来发现或鉴定。
本申请提供了用于筛选耐药基因或耐药蛋白的方法。下文中,在筛选方法的一个实例中,将描述具体步骤。
sgRNA文库的制备
制备能够与靶基因的一个区域互补结合的向导RNA。在一个实施方式中,制备能够与靶基因中外显子的一个区域互补结合的向导RNA。此处,可制备1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、500个、1000个、2000个或3000个或更多个向导RNA。此处,多个制备的向导RNA可与靶基因中外显子的一个区域互补结合。
在一个实例中,向导RNA包含能够与对应于靶基因中外显子的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个或更多个区域的核苷酸序列互补结合的位点。
能够表达向导RNA的转化细胞的制备
制备如下细胞,所述细胞可以制备能够与靶基因中外显子的一个区域互补结合的向导RNA。可通过编码所制备的sgRNA文库的载体对细胞进行转染。此处,所述细胞可表达在所述sgRNA文库中编码的一个或多个向导RNA。
将单碱基置换蛋白引入转化细胞
将单碱基置换蛋白或编码所述蛋白的核酸引入能够表达sgRNA文库中编码的一个或多个向导RNA的转化细胞。单碱基置换蛋白可诱导任意碱基对靶区域中任一个或多个碱基的置换。
单碱基置换蛋白可诱导靶基因中至少一个SNP的产生。
单碱基置换蛋白可诱导靶区域中至少一个SNP的产生。
在一个实例中,当引入的单碱基置换蛋白为胞苷置换蛋白时,靶区域中至少一个胞嘧啶可被任意碱基置换。
在一个实例中,当引入的单碱基置换蛋白为腺嘌呤置换蛋白时,靶区域中至少一个腺嘌呤可被任意碱基置换。
转化细胞的制备
代替制备能够表达向导RNA的转化细胞并将用于单碱基置换的蛋白引入转化细胞的步骤,本申请的方法可通过以下步骤进行。
制备具有靶基因的细胞。
将单碱基置换蛋白和向导RNA引入细胞。此处,单碱基置换蛋白和向导RNA可分别以RNP复合物(核糖核蛋白复合物)的形式或编码它们的核酸的形式引入。
用药物或治疗剂处理转化细胞
使用用作药物或治疗剂的材料(例如抗生素、抗癌剂或抗体)处理转化细胞。此处,处理药物或治疗剂可与由靶基因表达的肽、多肽或蛋白质特异性结合或反应。或者,处理药物或治疗剂可降低或丧失由靶基因表达的肽、多肽或蛋白质的活性或功能。或者,处理药物或治疗剂可改善或增加由靶基因表达的肽、多肽或蛋白质的活性或功能。
转化细胞可被所述药物或治疗剂杀伤。
尽管进行了所述药物或治疗剂的处理,转化细胞可存活。
细胞选择
尽管进行了所述药物或治疗剂的处理,可分离、选择或获得活细胞。
在所述活细胞中,可使用至少一种向导RNA和用于单碱基置换的蛋白,将靶基因的靶区域中至少一个碱基置换为任意碱基。其中使用用于单碱基置换的蛋白将靶基因中的碱基置换为任意碱基的细胞可对处理药物或治疗剂具有耐受性。
此处,由存活细胞的靶基因所表达的肽、多肽或蛋白质可对所述药物或治疗剂具有耐受性。
信息的获得
可对所述活细胞的基因组或靶基因的核酸序列进行分析,以获得关于对处理药物或治疗剂具有耐受性的位点的信息。
可对所述活细胞的基因组或靶基因的核酸序列进行分析,以获得关于由所述靶基因表达的肽、多肽或蛋白质的结构或功能是否改变的信息。改变的结构或功能可在确定是否存在耐药性上发挥关键作用。
在一个实施方式中,筛选耐药基因或耐药蛋白的方法可包括:
a)制备具有靶基因的细胞;
b)向所述细胞中引入能够与靶核酸序列互补结合的一个或多个向导RNA文库的一个或多个向导RNA或编码所述向导RNA的核酸,以及单碱基置换蛋白或编码所述蛋白的核酸;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)对分离的细胞中靶基因的核酸序列进行分析。
在一个实施方式中,筛选耐药基因或耐药蛋白的方法可包括:
a)制备能够表达一个或多个向导RNA文库的一个或多个向导RNA的细胞,所述一个或多个向导RNA文库可与存在于靶基因中的靶核酸序列互补结合;
b)将单碱基置换蛋白或编码所述蛋白的核酸引入所述细胞;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)对分离的细胞中靶基因的核酸序列进行分析。
在一个实施方式中,筛选耐药基因或耐药蛋白的方法可包括:
a)制备能够表达一个或多个向导RNA文库的一个或多个向导RNA的细胞,所述一个或多个向导RNA文库可与存在于靶基因中的靶核酸序列互补结合;
b)将单碱基置换蛋白或编码所述蛋白的核酸引入所述细胞;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
在一个实施方式中,筛选耐药基因或耐药蛋白的方法可包括:
a)向细胞中引入单碱基置换蛋白或编码所述蛋白的核酸,以及向导RNA文库的任一个或多个向导RNA或编码所述向导RNA的核酸;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
在另一实施方式中,筛选耐药基因或耐药蛋白的方法可包括:
a)将用于碱基置换的组合物引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)对分离的细胞中靶基因的核酸序列进行分析。
在另一实施方式中,筛选耐药基因或耐药蛋白的方法可包括:
a)将用于碱基置换的组合物引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
向导RNA文库可为能够与靶序列的部分核酸序列互补结合的一个或多个向导RNA的组。尽管将编码相同向导RNA文库的核酸分别引入细胞,各个细胞可包含不同的向导RNA。作为将编码相同向导RNA文库的核酸引入各个细胞的结果,每个细胞可具有相同的向导RNA。
向导RNA的描述已在上文中提供。
单碱基置换蛋白可为用于腺嘌呤置换的蛋白或用于胞苷置换的蛋白。
单碱基置换蛋白、腺嘌呤置换蛋白和胞苷置换蛋白的描述已在上文中提供。
所述导入可通过选自于电击法、脂质体、质粒、病毒载体、纳米颗粒和蛋白质易位结构域(PTD)融合蛋白中的一种或多种方法进行。
如上所述的处理药物可为遏制或抑制由靶基因编码的蛋白(下文中称为靶蛋白)的活性或功能的材料。此处,所述材料可为生物材料(例如RNA、DNA、蛋白质、肽或抗体)或非生物材料(例如化合物)。
如上所述的处理药物可为促进或增加由靶基因编码的蛋白(下文中称为靶蛋白)的活性或功能的材料。此处,所述材料可为生物材料(例如RNA、DNA、蛋白质、肽或抗体)或非生物材料(例如化合物)。
所述活细胞可为具有靶蛋白活性的细胞,例如不会因如上所述的处理药物使得功能改变的耐药性。
分离的细胞可为靶基因中具有至少一个核苷酸的修饰的细胞。
此处,一个或多个核苷酸的修饰可为靶基因中产生的一个或多个人工SNP。
此处,一个或多个人工SNP可诱导点突变。
此处,可鉴别靶基因中存在的至少一个核苷酸的修饰,即一个或多个人工SNP。因此,可获得期望的信息。
此处,包含经鉴别的至少一个核苷酸的修饰(即一个或多个人工SNP)的核酸序列可为编码影响耐药性的蛋白质的一个区域的核酸序列。
如上所述的处理药物可为抗癌剂。然而,不限于抗癌剂,并且包含用于治疗所有已知疾病或紊乱的材料或治疗剂。
在一个实例中,所述药物可通过抑制表皮生长因子受体(EGFR)、经由阻断血管内皮生长因子(VEGF)以抑制向癌细胞的血管生成、或抑制间变性淋巴瘤激酶,来使用中断癌细胞的生长的机制。
在一个实施方式中,筛选耐药性突变的方法可包括:通过将用于单碱基置换的组合物引入包含靶基因的细胞来诱导所述靶基因上的人工SNP、用特定药物处理所述细胞、选择具有期望的SNP的活细胞、以及通过分析所选择的细胞获得关于期望的SNP的信息。其中,期望的SNP可与由所述靶基因表达的蛋白质的结构或功能相关。
在一个实施方式中,靶基因可为EGFR基因、VEGF基因或间变性淋巴瘤激酶基因。然而,本发明不限于此。
在一个实施方式中,如上所述的处理药物可为顺铂、卡铂、长春瑞滨、紫杉醇、多西他赛、吉西他滨、培美曲塞、易瑞沙、特罗凯、giotrif、泰瑞沙、Xalkori、zykadia、alectinib、Alunbrig(布加替尼)、阿瓦斯汀(贝伐珠单抗)、阿瓦斯汀(贝伐珠单抗)、keytruda(帕博利珠单抗)、Opdivo(纳武单抗)、Tecentriq(阿特珠单抗)、Imfinzi(durvalumab)或奥希替尼(osimertinib)。然而,本发明不限于此。
在一个实施方式中,筛选具有奥希替尼耐受性的EGFR突变基因的方法可按如下进行。
在一个实施方式中,筛选耐药突变体的方法可包括:通过将用于单碱基置换的组合物引入具有EGFR基因的细胞来诱导EGFR基因上的人工SNP、用药物处理所述细胞、选择具有期望的SNP的活细胞以及通过分析所选择的细胞来获得关于期望的SNP的信息。其中,期望的SNP可与EGFR的结构或功能相关。
此处,处理的药物可为奥希替尼。然而,本发明不限于此,并可为用于抑制或丧失EGFR功能的任意材料。
在一个实施方式中,筛选耐药突变体的方法可包括:通过将包含C797S sgRNA1和/或C797S sgRNA2的用于单碱基置换的组合物引入具有EGFR基因的细胞来诱导EGFR基因上的人工SNP,用药物处理所述细胞,选择具有期望的SNP的活细胞,以及通过分析所选择的细胞来获得关于期望的SNP的信息。其中,期望的SNP可与EGFR的结构或功能相关。
其中,处理药物可为奥希替尼。然而,本发明不限于此,并且处理药物可为用于抑制EGFR功能或使EGFR功能丧失的任意材料。
根据一个实施方式,鉴别具有奥希替尼耐受性的EGFR区域。确认在具有奥希替尼耐受性的EGFR区域中,通过所引入的用于单碱基置换的组合物或单碱基置换蛋白来诱导SNP。
即,使用本申请提供的单碱基置换蛋白,通过将细胞中EGFR基因中存在的胞嘧啶置换为任意碱基,可获得关于表现出对奥希替尼耐受性的各种位置的信息。
在一个实施方式中,本申请可提供获得EGFR耐受性SNP信息的方法,所述方法可包括:
a)向细胞中引入单碱基置换蛋白或编码所述蛋白的核酸,以及向导RNA文库的任一个或多个向导RNA或编码所述向导RNA的核酸;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由靶基因所表达的蛋白质的结构和功能相关。
[第三用途——药物敏化筛选]
在一个实施方式中,单碱基置换蛋白或包含所述蛋白的用于碱基修饰的组合物可用于药物敏化筛选。
“药物敏化”是指对特定药物超敏以及对特定药物的敏感性增加的状态。相反,“脱敏”是指对特定药物丧失敏感性的状态,以及对特定药物具有耐受性的状态。
药物敏化筛选是指发现或确认影响对特定药物的敏感性增加的靶基因或编码所述靶基因的蛋白(下文中称为靶蛋白)的一个区域的方法、组合物或试剂盒。
在一个实施方式中,所述药物敏化筛选方法可包括:
a)制备能表达一个或多个向导RNA文库的任一个或多个向导RNA的细胞,所述一个或多个向导RNA文库能够与存在于靶基因中的靶核酸互补结合;
b)将单碱基置换蛋白或编码所述蛋白的核酸引入所述细胞;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)对分离的细胞中靶基因的核酸序列进行分析。
在一个实施方式中,药物敏化筛选方法可包括:
a)制备能表达一个或多个向导RNA文库的任一个或多个向导RNA的细胞,所述一个或多个向导RNA文库能够与存在于靶基因中的靶核酸互补结合,其中,所述细胞包含靶核酸序列;
b)将单碱基置换蛋白或编码所述蛋白的核酸引入所述细胞;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
在一个实施方式中,药物敏化筛选方法可包括:
a)将用于单碱基置换的蛋白或编码所述蛋白的核酸、以及向导RNA文库的任一个或多个向导RNA或编码所述向导RNA的核酸引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
在另一实施方式中,药物敏化筛选方法可包括:
a)将用于碱基置换的组合物引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)对分离的细胞中靶基因的核酸序列进行分析。
在另一实施方式中,药物敏化筛选方法可包括:
a)将用于碱基置换的组合物引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
向导RNA文库可为能够与靶序列的部分核酸互补结合的一个或多个向导RNA的组。尽管将编码相同向导RNA文库的核酸引入各个细胞,所述细胞可包含不同的向导RNA。作为将编码相同向导RNA文库的核酸引入各个细胞的结果,各个细胞可具有相同的向导RNA。
向导RNA的说明已在上文中描述。
单碱基置换蛋白可为腺嘌呤置换蛋白或胞嘧啶置换蛋白。
单碱基置换蛋白、腺嘌呤置换蛋白和胞嘧啶置换蛋白的说明已在上文中描述。
所述引入可通过选自于电穿孔、脂质体、质粒、病毒载体、纳米颗粒和蛋白易位结构域(PTD)融合蛋白中的一种或多种方法进行。
如上所述的处理药物可为遏制或抑制靶基因编码的蛋白(下文中称为靶蛋白)的活性或功能的材料。此处,所述材料可为生物材料(例如RNA、DNA、蛋白质、肽或抗体)或非生物材料(例如化合物)。
如上所述的处理药物可为促进或增加靶基因的活性或功能的材料。此处,所述材料可为生物材料(例如RNA、DNA、蛋白质、肽或抗体)或非生物材料(例如化合物)。
分离的细胞可为由于c)中的处理药物而具有显著改变的靶蛋白的活性或功能(即增加的药物敏感性)的细胞。
此处,具有药物敏感性增加的细胞可为药物处理后的活细胞。
分离的细胞可为靶基因中具有至少一个核苷酸的修饰的细胞。
其中,一个或多个核苷酸的修饰可为靶基因中产生的一个或多个人工SNP。
其中,一个或多个人工SNP可诱导点突变。
可确认靶基因中存在的至少一个核苷酸的修饰(即一个或多个人工SNP)。因此,可获得期望的信息。
此处,包含经确认的至少一个核苷酸的修饰(即一个或多个人工SNP)的核酸序列可为编码影响药物敏感性增加的蛋白质的一个区域的核酸序列。
[第四用途——病毒抗性基因或蛋白质的筛选]
在另一实施方式中,单碱基置换蛋白或包含所述蛋白的用于碱基修饰的组合物可用于筛选病毒抗性基因或蛋白质。
在一个实施方式中,筛选病毒抗性基因或蛋白质的方法可包括:
a)制备能表达一个或多个向导RNA文库的任一个或多个向导RNA的细胞,所述一个或多个向导RNA文库能够与存在于靶基因中的靶核酸互补结合;
b)将用于单碱基置换的蛋白或编码所述蛋白的核酸引入所述细胞;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)对分离的细胞中靶基因的核酸序列进行分析。
在一个实施方式中,筛选病毒抗性基因或蛋白质的方法可包括:
a)制备能表达一个或多个向导RNA文库的任一个或多个向导RNA的细胞,所述一个或多个向导RNA文库能够与存在于靶基因中的靶核酸互补结合,其中,所述细胞包含所述靶核酸序列;
b)将用于单碱基置换的蛋白或编码所述蛋白的核酸引入所述细胞;
c)用药物或治疗剂处理b)的细胞;
d)分离活细胞;以及
e)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
在一个实施方式中,筛选病毒抗性基因或蛋白质的方法可包括:
a)将用于单碱基置换的蛋白或编码所述蛋白的核酸、以及向导RNA文库的任一个或多个向导RNA或编码所述向导RNA的核酸引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
在另一实施方式中,筛选病毒抗性基因或蛋白质的方法可包括:
a)将用于碱基置换的组合物引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)对分离的细胞中靶基因的核酸序列进行分析。
在另一实施方式中,筛选病毒抗性基因或蛋白质的方法可包括:
a)将用于碱基置换的组合物引入具有靶核酸序列的细胞;
b)用药物或治疗剂处理a)的细胞;
c)分离活细胞;以及
d)从分离的细胞中获得关于期望的SNP的信息。
此处,期望的SNP可与由所述靶基因所表达的蛋白质的结构或功能相关。
向导RNA文库可为与靶序列的部分核酸序列互补结合的一个或多个向导RNA的组。尽管将编码相同向导RNA文库的核酸导入各个细胞,所述细胞可具有不同的向导RNA。作为将编码相同向导RNA文库的核酸引入各个细胞的结果,所述细胞可具有相同的向导RNA。
向导RNA的说明已在上文中描述。
用于单碱基置换的蛋白可为用于腺嘌呤置换的蛋白或用于胞嘧啶置换的蛋白。
用于单碱基置换的蛋白、用于腺嘌呤置换的蛋白和用于胞嘧啶置换的蛋白的说明已在上文中描述。
所述引入可通过选自于电穿孔、脂质体、质粒、病毒载体、纳米颗粒和蛋白易位结构域(PTD)融合蛋白中的一种或多种方法进行。
如上所述的处理的病毒可通过与编码靶基因的蛋白(下文中称为靶蛋白)的相互作用而引入至所述细胞。
所述活细胞可为不与c)中处理的病毒相互作用的细胞,即具有病毒抗性。
分离的细胞可为靶基因中具有至少一个核苷酸的修饰的细胞。
分离的细胞可为靶基因中具有至少一个核苷酸的修饰的细胞。
其中,一个或多个核苷酸的修饰可为靶基因中产生的一个或多个人工SNP。
其中,一个或多个人工SNP可诱导点突变。
可确认靶基因中存在的至少一个核苷酸的修饰,即一个或多个人工SNP。因此,可获得期望的信息。
其中,包含经确认的至少一个核苷酸的修饰(即一个或多个人工SNP)的核酸序列可为编码对与病毒相互作用至关重要的蛋白质的一个区域的核酸序列。
本说明书中公开的本发明的一个方面为用于单碱基置换的方法。
用于碱基置换的组合物可在基因中的一个或多个核苷酸的碱基中诱导或产生人工修饰。
人工修饰或置换可由向导RNA-单碱基置换蛋白的复合物诱导或产生。
此处,向导RNA-单碱基置换蛋白的复合物可应用于以下的一个或多个步骤:i)靶向靶核酸序列,ii)剪切靶核酸序列,iii)靶核酸序列中一个或多个核苷酸的脱氨基,iv)经脱氨基的碱基的移除,以及v)经碱基移除的靶核酸序列的修复或恢复。此处,所述步骤可依次或同时进行,并且可改变所述步骤的顺序。
i)靶核酸序列的靶向
“靶核酸序列”为存在于靶基因或核酸中的核苷酸序列,且具体而言,为靶基因或核酸中靶区域的部分核苷酸序列。此处,“靶区域”为靶基因或核酸中可被向导RNA-用于碱基置换的蛋白的复合物修饰的位点。
下文中,“靶序列”可用作表示两种类型的核苷酸序列信息的术语。例如,在靶基因的情况下,靶核酸序列可指靶基因中DNA转录链的序列信息,或非转录链的核苷酸序列信息。
例如,靶核酸序列可指5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17),其为靶基因A的靶区域的部分核苷酸序列(转录链);以及5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18),其为与前述链互补的核苷酸序列(非转录链)。
靶核酸序列可为5至50个核苷酸的序列。
在一个实施方式中,靶核酸序列可为16nt序列、17nt序列、18nt序列、19nt序列、20nt序列、21nt序列、22nt序列、23nt序列、24nt序列或25nt序列。
靶核酸序列包含向导RNA结合序列或向导RNA非结合序列。
“向导RNA结合序列(向导核酸结合序列)”为与所述向导RNA的向导结构域中包含的向导序列具有部分或完全互补性的核苷酸序列,并且能够与所述向导RNA的向导结构域中包含的向导序列互补结合。靶核酸序列和向导RNA结合序列为能够根据靶基因或核酸(即经受基因操作或修饰的靶标)而改变的核苷酸序列,并且可根据靶基因或核酸以各种方式来设计。
“向导RNA非结合序列(向导核酸非结合序列)”与所述向导RNA的向导结构域中包含的向导序列部分或完全互补,并且可不与所述向导RNA的向导结构域中包含的向导序列互补结合。此外,向导RNA非结合序列为与向导RNA结合序列具有互补性的核苷酸序列,并且可与所述向导RNA结合序列具有互补性结合。
向导RNA结合序列可为靶核酸序列的部分核苷酸序列,并且可为具有靶核酸序列的两个不同序列的两个核苷酸序列之一,即能够彼此互补结合的两个核苷酸序列。其中,向导RNA非结合序列可为靶核酸序列中除向导RNA结合序列之外的核苷酸序列。
例如,当靶基因A的靶区域的部分核苷酸序列5′-ATCATTGGCAGACTAGTTCG-3′(SEQID NO:17)和与其互补的核苷酸序列5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18)用作靶核酸序列时,向导RNA结合序列可为所述两个靶核酸序列之一,例如,5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)或5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18)。此处,当向导RNA结合序列为5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)时,向导RNA非结合序列可为5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18),或当向导RNA结合序列为5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18)时,向导RNA非结合序列可为5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)。
向导RNA结合序列可为选自于靶核酸序列的一个核苷酸序列,即与转录链相同的核苷酸序列和与非转录链相同的核苷酸序列。此处,向导RNA非结合序列可为不包含选自于靶核酸序列的向导RNA结合序列的一个核苷酸序列的核苷酸序列,即与转录链相同的核苷酸序列和与非转录链相同的核苷酸序列。
向导RNA结合序列可具有与靶核酸序列相同的长度。
向导RNA非结合序列可具有与靶核酸序列或向导RNA结合序列相同的长度。
向导RNA结合序列可为5至50个核苷酸的序列。
在一个实施方式中,向导RNA结合序列可为16个核苷酸的序列、17nt序列、18nt序列、19nt序列、20nt序列、21nt序列、22nt序列、23nt序列、24nt序列或25nt序列。
向导RNA非结合序列可为5至50个核苷酸的序列。
在一个实施方式中,向导RNA非结合序列可为16个核苷酸的序列、17nt序列、18nt序列、19nt序列、20nt序列、21nt序列、22nt序列、23nt序列、24nt序列或25nt序列。
向导RNA结合序列可与所述向导RNA的向导结构域中包含的向导序列具有部分或完全互补性结合,并且向导RNA结合序列的长度可与向导序列的长度相同。
向导RNA结合序列可为与所述向导RNA的向导结构域中包含的向导序列互补的核苷酸序列,例如具有至少70%、75%、80%、85%、90%或95%互补性或完全互补性的核苷酸序列。
在一个实例中,向导RNA结合序列可具有或包含与所述向导RNA的向导结构域中包含的向导序列不互补的1-8个核苷酸的序列其。
向导RNA非结合序列可与所述向导RNA的向导结构域中包含的向导序列具有部分或完全的序列同源性,并且向导RNA非结合序列的长度可与向导序列的长度相同。
向导RNA非结合序列可为与所述向导RNA的向导结构域中包含的向导序列具有同源性的核苷酸序列,例如具有至少70%、75%、80%、85%、90%或95%的序列同源性或完全同一性的核苷酸序列。
在一个实例中,向导RNA非结合序列可具有或包含与向导RNA的向导结构域中包含的向导序列不同源的1-8个核苷酸的序列。
向导RNA非结合序列可与向导RNA结合序列互补结合,并具有与向导RNA结合序列相同的长度。
向导RNA非结合序列可为与向导RNA结合序列互补的核苷酸序列,例如具有至少90%或95%互补性或完全互补性的核苷酸序列。
在一个实例中,向导RNA非结合序列可具有或包含与向导RNA结合序列不互补的1-2个核苷酸的序列其。
此外,向导RNA结合序列可为位于能够被CRISPR酶识别的核苷酸序列附近的核苷酸序列。
在一个实例中,向导RNA结合序列可为位于临近能够被CRISPR酶识别的核苷酸序列的5'末端和/或3'末端的5-50个连续核苷酸的序列。
此外,向导RNA非结合序列可为位于能够被CRISPR酶识别的核苷酸序列附近的核苷酸序列。
在一个实例中,向导RNA非结合序列可为位于临近能够被CRISPR酶识别的核苷酸序列的5'末端和/或3'末端的5-50个连续核苷酸的序列。
“靶向”是指存在于靶基因或核酸中的靶核酸序列中与向导RNA结合序列的互补性结合。此处,互补结合可为100%完全互补性结合,或70%以上且低于100%的不完全互补性结合。因此,“靶向gRNA”是指gRNA与存在于靶基因或核酸中的靶核酸序列中的向导RNA结合序列互补结合。
向导RNA-用于单碱基置换的蛋白的复合物可靶向靶核酸序列。
ii)剪切靶核酸序列
向导RNA-单碱基置换蛋白的复合物可剪切靶核酸序列。
此处,当靶核酸序列为双链核酸时,所述剪切可为剪切双链两者。或者,所述剪切可为剪切双链之一。
此处,当靶核酸序列为单链核酸时,所述剪切可为单链的剪切。
或者,靶核酸序列剪切的剪切形式可根据构成向导RNA-单碱基置换蛋白的复合物的CRISPR酶的类型而改变。
例如,当构成向导RNA-单碱基置换蛋白的复合物的CRISPR酶为野生型CRISPR酶(例如SpCas9)时,靶核酸序列的剪切可为靶核酸序列的双链两者的剪切。
在另一实例中,当构成向导RNA-单碱基置换蛋白的复合物的CRISPR酶为切口酶(例如Nureki nCas9)时,靶核酸序列的剪切可为靶核酸序列的双链之一的剪切。
iii)靶核酸序列中一个或多个核苷酸的脱氨基
向导RNA-单碱基置换蛋白的复合物可使靶核酸序列中一个或多个核苷酸的碱基的氨基(-NH2)基团脱氨基。
此处,脱氨基可发生在胞嘧啶或腺嘌呤碱基处。
例如,当靶核酸序列中有5个具有腺嘌呤的核苷酸时(此处,5个核苷酸可连续或者也可不连续),向导RNA-单碱基置换蛋白的复合物可使5个具有腺嘌呤的核苷酸中所有腺嘌呤的氨基(-NH2)基团脱氨基。
在另一实例中,当靶核酸序列中有8个具有胞嘧啶的核苷酸时(此处,5个核苷酸可为连续或者也可不连续),向导RNA-单碱基置换蛋白的复合物可使8个具有胞嘧啶的核苷酸的3个中的胞嘧啶的氨基(-NH2)基团脱氨基。
脱氨基的碱基可根据构成向导RNA-单碱基置换蛋白的复合物的脱氨酶的类型而变化。
例如,当构成向导RNA-单碱基置换蛋白的复合物的脱氨酶为腺苷脱氨酶(例如TadA或TadA变体)时,脱氨基可发生在腺嘌呤处。此处,当将腺嘌呤的氨基(-NH2)基团脱氨基时,可形成酮(=O)基团。次黄嘌呤可通过腺嘌呤的脱氨基产生。
在另一实例中,当构成向导RNA-单碱基置换蛋白的复合物的脱氨酶为胞苷脱氨酶(例如APOBEC1或APOBEC1变体)时,脱氨基可发生在胞嘧啶处。此处,当将胞嘧啶的氨基(-NH2)基团脱氨基时,可形成酮(=O)基团。尿嘧啶可通过胞嘧啶的脱氨基产生。
iv)经脱氨基的碱基的移除
向导RNA-单碱基置换蛋白的复合物可移除步骤iii)中产生的经脱氨基的碱基。此处,经脱氨基的碱基的移除可移除步骤iii)中产生的经脱氨基的碱基的全部或一部分。
此处,经脱氨基的碱基可为经脱氨基的胞嘧啶或腺嘌呤。
此处,经脱氨基的碱基可为尿嘧啶或次黄嘌呤。
经脱氨基的碱基的移除可根据构成向导RNA-单碱基置换蛋白的复合物的DNA糖基化酶的类型而变化。
例如,当构成向导RNA-单碱基置换蛋白的复合物的DNA糖基化酶为烷基腺嘌呤DNA糖基化酶(AAG)或AAG变体时,将脱氧核糖或核糖与构成核苷酸的碱基(经脱氨基的腺嘌呤或次黄嘌呤)连接的N-糖苷键可被水解。此外,可形成AP位点(无嘌呤/无嘧啶位点)。AP位点可自发地或由于DNA(或RNA)损伤以无嘌呤或嘧啶碱基的形式位于DNA(或RNA)中。
在另一实例中,当构成向导RNA-单碱基置换蛋白的复合物的DNA糖基化酶为尿嘧啶DNA糖基化酶(UDG或UNG)或UDG变体时,将脱氧核糖或核糖与构成核苷酸的碱基(经脱氨基的胞嘧啶或尿嘧啶)连接的N-糖苷键可被水解。此外,可形成AP位点(无嘌呤/无嘧啶位点)。
v)经碱基移除的靶核酸序列的修复或恢复
经碱基移除的靶核酸序列的修复或恢复包括剪切后靶核酸序列的修复或恢复。
经碱基移除的靶核酸序列可为经剪切的靶核酸序列。
其中,经剪切的靶核酸序列可为其中的双链均被剪切的靶核酸序列。
其中,经剪切的靶核酸序列可为其中的双链之一被剪切的靶核酸序列。其中,经剪切的链可为经碱基移除的链。或者,经剪切的链可为其中的碱基未被移除的链。
经碱基移除的靶核酸序列的修复或恢复可为靶核酸序列中一个或多个经碱基移除的核苷酸的AP位点处由任意碱基(即腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶或尿嘧啶)修复或恢复。
例如,靶核酸序列中一个或多个脱氨基腺嘌呤移除的核苷酸的AP位点可被修复为鸟嘌呤。或者,靶核酸序列中的一个或多个脱氨基腺嘌呤移除的核苷酸的AP位点可被修复为胞嘧啶。靶核酸序列中一个或多个脱氨基腺嘌呤移除的核苷酸的AP位点可被修复为胸腺嘧啶。靶核酸序列中一个或多个脱氨基腺嘌呤移除的核苷酸的AP位点可被修复为尿嘧啶。靶核酸序列中一个或多个脱氨基腺嘌呤移除的核苷酸的AP位点可被修复为腺嘌呤。
在另一实例中,靶核酸序列中一个或多个脱氨基胞嘧啶移除的核苷酸的AP位点可被修复为腺嘌呤。或者,靶核酸序列中一个或多个脱氨基胞嘧啶移除的核苷酸的AP位点可被修复为鸟嘌呤。或者,靶核酸序列中一个或多个脱氨基胞嘧啶移除的核苷酸的AP位点可被修复为胸腺嘧啶。或者,靶核酸序列中一个或多个脱氨基胞嘧啶移除的核苷酸的AP位点可被修复为尿嘧啶。或者,靶核酸序列中一个或多个脱氨基胞嘧啶移除的核苷酸的AP位点可被修复为胞嘧啶。
人工修饰可发生在基因的外显子或内含子、剪接位点、调控区域(增强子或阻抑区)、5'末端或其临近区域、或3'末端或其临近区域。
例如,人工修饰可为外显子区域中的一个或多个碱基的置换。例如,在基因的外显子区域中,一个或多个A和/或C可被置换为不同的碱基(A、C、T、G或U)。
在另一实例中,人工修饰可为内含子区域中的一个或多个碱基的置换。例如,在基因的内含子区域中,一个或多个A和/或C可被置换为不同的碱基(A、C、T、G或U)。
例如,人工修饰可为剪接位点处的一个或多个碱基的置换。例如,在基因的剪接位点处,一个或多个A和/或C可被置换为不同的碱基(A、C、T、G或U)。
在另一实例中,人工修饰可为调控区域(增强子或阻抑区)中的一个或多个碱基的置换。例如,在调控区域(增强子或阻抑区)中,一个或多个A和/或C可被置换为不同的碱基(A、C、T、G或U)。
人工修饰可为编码蛋白质的基因的密码子序列的修饰。
“密码子”是指来自基因的编码氨基酸的遗传密码之一。当DNA转录成信使RNA(mRNA)时,此种mRNA的三个核苷酸形成每个密码子。密码子可编码一种类型的氨基酸或终止氨基酸合成的终止密码子。
人工修饰可为通过一个或多个单碱基修饰对编码蛋白质的密码子序列的修饰,并且经修饰的密码子序列可编码相同的氨基酸或不同的氨基酸。
例如,当一个或多个核酸序列从C变为T时,编码脯氨酸的CCC密码子可变为编码亮氨酸的CUU或CUC、编码丝氨酸的UCC或UCU、或编码苯丙氨酸的UUC或UUU。
例如,当一个或多个碱基从A变为C时,编码苏氨酸的ACC或ACA可变为编码脯氨酸的CCC或CCA。
例如,当一个或多个碱基从A变为G时,编码赖氨酸的AAA密码子可变为编码谷氨酸的GAA或GAG、编码甘氨酸的GGA或GGG、或编码精氨酸的AGA或AGG。
实施例
下文结合实施例将对本发明作进一步详细说明。
下文结合实施例将对本发明作进一步详细说明。实施例仅提供用于更具体地说明本发明,并且对于本领域普通技术人员来说将显而易见的是,本发明的范围不限于根据本发明的要旨的实施例。
实验方法
[实施例1]
实施例1-1:质粒构建
使用Gibson Assembly(NEBuilder HiFi DNA Assembly试剂盒,NEB)构建质粒。在通过PCR扩增图3(a)、图7(a)和图21的各片段后,将通过PCR扩增的DNA片段添加至GibsonAssembly Master混合液中,并于50℃下孵育60分钟。所有质粒都包含CMV启动子、p15A复制起点、和氨苄青霉素抗性基因的选择标记。一些质粒包含人密码子优化的WT-Cas9(P3s-Cas9HC;Addgene质粒#43945)或其变体。
实施例1-2:细胞培养和转染
(1)HEK293T细胞:单碱基置换CRISPR蛋白转染
将HEK293T细胞在补充有10%FBS和1%抗生素的Dulbecco改良Eagle培养基(DMEM,Welgene)中在5%CO2下于37℃孵育。转染前,将HEK293T细胞以每孔2×105个细胞的密度分配到6孔板中。随后,使用4μL LipofectamineTM 2000(Thermo Fisher Scientific,11668019),在200μL的Opti-MEM培养基中转染1μg BE3(WT、bpNLS、xCas-UNG、UNG-xCas、scFv-APO-UNG或scFv-UNG-APO)和1μg sgRNA表达质粒(hEMX1GX19或GX20)。
(2)Hela细胞:单碱基置换CRISPR蛋白转染
将Hela细胞在补充有10%FBS和1%抗生素的Dulbecco改良Eagle培养基(DMEM,Welgene)中在5%CO2下于37℃孵育。转染前,将Hela细胞以每孔2×105个细胞的密度分配到6孔板中。随后,使用4μL LipofectamineTM 2000(Thermo Fisher Scientific,11668019),在200μL的Opti-MEM培养基中转染1μg碱基置换质粒(BE3 WT、bpNLS BE3、ung-ncas、ncas-ung或ncas-delta UNG)和1μg sgRNA表达质粒。
(3)HEK293T细胞:单碱基置换CRISPR蛋白转染
将HEK293T细胞在补充有10%FBS和1%抗生素的Dulbecco改良Eagle培养基(DMEM,Welgene)中在5%CO2下于37℃孵育。转染前,将HEK293T细胞以每孔2×105个细胞的密度分配到6孔板中。随后,使用2μL LipofectamineTM 2000(Thermo Fisher Scientific,11668019),在200μL的Opti-MEM培养基中转染500ng碱基置换质粒(bpNLS-UNG-APOBEC-Nureki nCas9-bpNLS)、500ng sgRNA表达质粒(hEMX1GX19或GX20)。
实施例1-3:hEMX1 GX19 sgRNA、hEMX1 GX20 sgRNA的设计与合成
(1)sgRNA的设计与合成
使用CRISPR RGEN工具(http://www.rgenome.net;Park等,Bioinformatics 31:4014-4016,2015)设计了考虑hEMX基因的“NGG”PAM或“NG”PAM的向导RNA。除中靶(on-target)位点之外,认为所设计的向导RNA不具有1-碱基或2-碱基错配。
在用于产生sgRNA表达质粒的寡核苷酸(参见表1)退火和延伸后,将它们克隆至pRG2质粒的Bsa1位点。
[表2]
Figure BDA0003482434050000861
(2)深度测序
使用HiPi Plus DNA聚合酶(Elpis-Bio),通过PCR将中靶和脱靶(off-target)位点扩增至200bp至300bp的大小。使用MiSeq(Illumina)设备对通过上述方法获得的PCR产物进行测序,并使用由CRISPR RGEN工具(www.rgenome.net)提供的Cas分析器进行分析。CRISPR/Cas9剪切位点5bp内的置换被认为是由单碱基置换CRISPR蛋白诱导的突变。
实施例1-4:实验结果
使用根据本实施例的单碱基置换CRISPR蛋白,确认了用腺嘌呤(A)、胸腺嘧啶(T)或鸟嘌呤(G)置换胞嘧啶(C)的效果。
(1)bpNLS验证
确认了在HEK细胞中使用BE3 WT和bpNLS BE3 WT,bpNLS BE3 WT相比BE3 WT而言增加了C至T的置换率(参见图7B)。
(2)单碱基置换CRISPR蛋白的碱基置换效率的确认
1)Hela细胞中C至N(A、T、G)效率的确认
在Hela细胞中使用单碱基置换CRISPR蛋白确认了hEMX1 GX19 sgRNA靶标中C至N的置换率。
作为实验结果,确认了经UGI移除的ncas-delta UGI与BE3 WT在C至G或C至A置换率方面几乎没有差异。然而,确认了与BE3 WT相比,UNG融合的UNG-ncas和ncas-UNG的C至G或C至A的置换率增加(参见图8)。由该结果确认了,当在BE3 WT中将UGI置换为UNG时,C至G或C至A置换的概率增加。
此外,在hEMX1 GX19 sgRNA序列中,确认了15C或16C的置换率。作为实验结果,与BE3 WT或bpNLS BE3相比,确认了UNG-ncas或ncas-UNG在15C或16C具有增加的C至G或C至A置换的概率(参见图9)。
确认了在hEMX1 GX19 sgRNA序列中,相比16C,在15C更容易发生C至G或C至A的置换,并且在具有UNG-ncas结构的单碱基置换CRISPR蛋白中,C至G或C至A的置换概率是最高的(参见图9)。
2)HEK细胞中C至N(A、T、G)效率的确认
在HEK细胞中使用hEMX1 GX20 sgRNA靶标确认了单碱基置换CRISPR蛋白的C至N置换率。
作为实验结果,确认了在hEMX1 GX19 sgRNA序列中,13C、15C、16C和17C处发生了碱基置换(参见图10)。
此外,确认了在HEK细胞中,与UNG-ncas相比,ncas-UNG的C至N置换率增加(参见图11)。特别是,确认了在15C、16C和17C处,在UNG-ncas中比在ncas-UNG中更容易发生C至G或C至A碱基置换(参见图11)。
此外,作为确认使用单碱基置换CRISPR蛋白复合物(即具有单链可变片段(scFv)的融合碱基置换结构域(scFv-APO-UNG或scFv-UNG-APO))在hEMX1靶核酸序列中的单碱基置换效率的结果,确认了在11C更容易发生从C至A的碱基置换,并且在15C和16C更容易发生从C至G的碱基置换(参见图22至图24)。
(3)Nureki nCas9验证
为了扩大能够使用单碱基置换CRISPR蛋白产生随机差错的靶位点,使用具有NGPAM序列的Nureki nCas9进行了实验。
作为使用hEMX1 GX17 sgRNA和hEMX1GX20sgRNA进行实验的结果,确认了它们在HEK细胞中工作良好。特别是,确认了在NG PAM中发生了C至N的置换(参见图12)。
[实施例2]
实施例2-1:质粒构建
使用Gibson Assembly(NEBuilder HiFi DNA Assembly试剂盒,NEB)构建质粒。在使用PCR扩增图4的各片段后,将通过PCR扩增的DNA片段添加至Gibson Assembly Master混合液中,并于50℃下孵育60分钟。所有质粒都包含人密码子优化的WT-Cas9(P3s-Cas9HC;Addgene质粒#43945)、CMV启动子、p15A复制起点、和氨苄青霉素抗性基因的选择标记(参见图19和图20)。
实施例2-2:sgRNA的设计与合成
(1)sgRNA的设计
选择了科学期刊《Nature》中公开的题为“Base editing of A,T to C,G ingenomic DNA without DNA cleavage”的文章中扩展数据图2所示出的三个sgRNA(参见图25)。
(2)sgRNA的合成
两个互补的寡核苷酸退火至PCR扩增模板并延伸,用于sgRNA合成。
使用T7RNA聚合酶(New England Biolabs)进行模板DNA(不包括靶序列中3'末端的“NGG”)的体外转录,根据制造商的方案合成RNA,然后使用Turbo DNAse(Ambion)移除模板DNA。使用Expin Combo试剂盒(GeneAll)和异丙醇沉淀纯化转录的RNA。
在这个实施例中,将本文使用的化学合成的sgRNA用2'OMe和硫代磷酸酯进行修饰。
实施例2-3:细胞培养和转染
(1)HEK293T细胞:单碱基置换CRISPR蛋白转染
将HEK293T细胞在补充有10%FBS和1%抗生素的Dulbecco改良Eagle培养基(DMEM,Welgene)中在5%CO2下于37℃孵育。转染前,将HEK293T细胞以每孔5×104个细胞的密度分配到24孔板中。随后,使用12μL
Figure BDA0003482434050000891
HD转染试剂(目录号E231A,Promega),在200μL的Opti-MEM培养基中用3μg ABE(WT、N-AAG或C-AAG)转染各1μg的三种不同的sgRNA表达质粒。
(2)深度测序
使用HiPi Plus DNA聚合酶(Elpis-Bio),将中靶和脱靶位点PCR扩增至200bp至300bp的大小。使用MiSeq(Illumina)设备对通过上述方法获得的PCR产物进行测序,并使用由CRISPR RGEN工具(www.rgenome.net)提供的Cas分析器进行分析。CRISPR/Cas9剪切位点5bp内的置换被认为是由单碱基置换CRISPR蛋白诱导的突变。
实施例2-4:实验结果
腺嘌呤碱基编辑器(ABE)是指腺嘌呤修复遗传剪刀,且为用鸟嘌呤(G)置换腺嘌呤(A)的技术。烷基腺嘌呤DNA糖基化酶(AAG)为从DNA中移除肌苷碱基的酶(图2)。本发明人通过在ABE WT质粒的N-末端和C-末端各自插入AAG基因以诱导腺嘌呤(A)的随机突变,开发了腺嘌呤碱基置换蛋白。Cas9切口酶、腺苷脱氨酶和DNA糖基化酶按照各种顺序产生融合蛋白(图4)。
为了确认腺嘌呤(A)的随机突变,将三种sgRNA(sgRNA1、sgRNA2和sgRNA3)与具有编码碱基置换蛋白的核酸的质粒(即修饰的ABE质粒)一起转染至HEK 293T细胞。作为实验的结果,确认了与ABE WT相比,用修饰的ABE质粒(N-AAG和C-AAG)转染的HEK293T细胞中sgRNA 1的碱基序列中的腺嘌呤(A)14被随机置换为不同的碱基(胸腺嘧啶,T;胞嘧啶,C;或鸟嘌呤,G)。确认了sgRNA 1的碱基序列中的腺嘌呤(A)19和腺嘌呤(A)13被置换为不同的碱基(图27),并且仅在AAG插入N-末端的质粒中,sgRNA 1中的腺嘌呤16和腺嘌呤12被置换。(图28)。因此,确认了通过将AAG插入ABE诱导了不同碱基对腺嘌呤(A)的随机置换。此外,当不考虑Cas9切口酶、腺苷脱氨酶和DNA糖基化酶的顺序的情况下使用腺嘌呤置换蛋白时,确认诱导了不同碱基对腺嘌呤(A)的随机置换(参见图26至图28)。
[实施例3]
使用SunTag系统进行单碱基置换
实施例3-1:质粒构建
使用Gibson Assembly(NEBuilder HiFi DNA Assembly试剂盒,NEB)构建质粒。在通过PCR扩增图5(a)、图5(b)和图5(c)的各片段后,将通过PCR扩增的DNA片段添加至GibsonAssembly Master混合液中,并于50℃下孵育15-60分钟。所有质粒都包含人密码子优化的WT-Cas9(P3s-Cas9HC;Addgene质粒#43945)、CMV启动子、p15A复制起点、和氨苄青霉素抗性基因的选择标记。
实施例3-2:细胞培养和转染
将PC9细胞在补充有10%FBS和1%抗生素的Rosewell Park Memorial Institute1640(RPMI 1640,Welgene)中在5%CO2下于37℃孵育。转染前,将PC9细胞以每孔2×105个细胞的密度分配到24孔板中。随后,使用4μL LipofectamineTM 2000(Thermo FisherScientific,11668019),在200μL的Opti-MEM培养基中转染1500ng的每种碱基置换质粒(Apobec-nCas9-UGI和Apobec-Nureki nCas9-UNG)和500ng sgRNA表达质粒(hEMX1GX19);1000ng的SunTag质粒(GCN4-nCas9)和1000ng的每种ScFv质粒(ScFv-Apobec-UNG和ScFv-UNG-Apobec);或500g的sgRNA表达质粒(hEMX1 GX19)。
实施例3-3:深度测序
使用HiPi Plus DNA聚合酶(Elpis-Bio),通过PCR将中靶和脱靶位点扩增至200bp至300bp的大小。使用MiSeq(Illumina)设备对通过上述方法获得的PCR产物进行测序,并使用由CRISPR RGEN工具(www.rgenome.net)提供的Cas分析器进行分析。sgRNA序列区域10bp内的置换被认为是由单碱基置换CRISPR蛋白诱导的突变。
实施例3-4:实验结果
确认在PC9细胞中使用单碱基置换蛋白的C至N的置换率。
使用SunTag系统,通过仅用一个nCas9最大化UNG效应来增加随机突变的诱导。结果确认了ScFv-UNG-Apobec能够具有与WT相似的单碱基置换效率并诱导随机碱基置换(C至T或A或G)(参见图13)。
[实施例4]
使用单碱基置换CRISPR蛋白诱导EGFR C797S突变以及奥希替尼耐受性的确认
实施例4-1:PC9细胞:单碱基置换CRISPR蛋白的转导和药物培养
将PC9细胞在补充有10%FBS和1%抗生素的Rosewell Park Memorial Institute1640(RPMI 1640,Welgene)中在5%CO2下于37℃孵育。转染前,将PC9细胞以每孔3×106个细胞的密度分配到15cm2的皿中。随后,使用4μL LipofectamineTM 2000(Thermo FisherScientific,11668019),在3mL的Opti-MEM培养基中用15μg N-UNG转染各5μg的两种不同sgRNA表达质粒。转染后三天,用4μg/mL杀稻瘟菌素处理所述质粒7天。通过足够的抗生素培养获得稳定的细胞系后,将细胞用100nM奥希替尼(Selleckchem,S5078)处理20天,该药物为非小细胞肺癌的靶向治疗剂。使用能够产生已知具有奥希替尼耐受性的C797S突变体的sgRNA(C797S sgRNA 1(SEQ ID NO:21)和C797S sgRNA 2(SEQ ID NO:22)进行阳性对照实验。确认了使用筛选系统富集了C797S突变体。
实施例4-2:深度测序
使用HiPi Plus DNA聚合酶(Elpis-Bio),将中靶和脱靶位点PCR扩增至200bp至300bp的大小。使用MiSeq(Illumina)设备对通过上述方法获得的PCR产物进行测序,并使用由CRISPR RGEN工具(www.rgenome.net)提供的BE分析器进行分析。sgRNA序列位点10bp内的置换被认为是由单碱基置换CRISPR蛋白诱导的突变。
实施例4-3:实验结果
奥希替尼(第三代EGFR酪氨酸激酶抑制剂(TKI))被用作对第二代药物具有耐受性的EGFR T790M阳性非小细胞肺癌患者的治疗剂。通过N-UNG诱导靶sgRNA序列中胞嘧啶的随机碱基置换,筛选对特定药物具有耐受性的突变体。
通过使用对奥希替尼具有耐受性的已知突变体C797S作为阳性对照,确认了相应的工具有效。当发生C797S sgRNA 1中的C15至G的碱基置换或C797S sgRNA 2中的C13至G的碱基置换时,EGFR的氨基酸797半胱氨酸变为丝氨酸。作为实验的结果,虽然在仅用杀稻瘟菌素处理的组中只有10%的15C和13C通过C797S sgRNA 1和二价N-UNG置换为G,确认了在奥希替尼处理的组中C变为G的部分增加50%或80%(参见图30)。
[实施例5]
通过EGFR sgRNA文库的引入制备转化细胞及耐药突变体的筛选
实施例5-1:EGFR sgRNA文库的设计与合成
使用CRISPR RGEN工具(www.rgenome.net)设计了来自表皮生长因子受体(EGFR)基因的27个外显子的总共1803个sgRNA。在设计的1803个sgRNA寡核苷酸池的正向寡核苷酸序列的5'末端添加CACCG,在其反向寡核苷酸序列的5'末端添加AAAC以及在3'末端添加C后,委托Twist Bioscience进行合成。
实施例5-2:EGFR sgRNA文库质粒的制备
合成的EGFR sgRNA寡核苷酸池于95℃反应5分钟,并通过逐渐降温直至25℃来进行退火。随后,用T4连接酶连接用Bsa1限制性酶剪切的PiggyBac转座子骨架载体和EGFRsgRNA寡核苷酸池。通过电穿孔将连接反应溶液插入EnduraTM DUO电感受态细胞(Lucigen,目录号60242-2)。将如此转化的大肠杆菌细胞均匀地涂至添加有氨苄青霉素的LB培养基上,并于37℃孵育过夜。使用NuceloBond Xtra Midi EF(Macherey-Nagel,目录号740420.50)从大肠杆菌菌落中获得EGFR sgRNA文库质粒。
实施例5-3:细胞培养
将PC9细胞在补充有10%FBS和1%抗生素的Rosewell Park Memorial Institute1640(RPMI 1640,Welgene)中在5%CO2下于37℃孵育。
实施例5-4:使用PiggyBac转座子制备转化细胞
通过将基因传递系统(即PiggyBac转座子)应用于PC9细胞来制备能够表达EGFRsgRNA的细胞。转化前,将PC9细胞以每瓶4×106个细胞的密度分配到T175烧瓶中。随后,使用40μL LipofectamineTM 2000(Thermo Fisher Scientific,11668019),以1:5的比例在3mL的Opti-MEM培养基中转染PiggyBac转座子载体和转座酶表达载体。第二天,将所述细胞用2μg/mL嘌呤霉素处理并孵育7天。通过足够的抗生素继代培养获得稳定的细胞系。
实施例5-5:单碱基置换CRISPR蛋白的转染及耐药突变体的筛选
在使用LipofectamineTM 2000(Thermo Fisher Scientific,11668019)转染前约18至24小时,将4×106个转化的PC9细胞分配到T175烧瓶中。随后,转染20μg N-UNG。转染后三天,将细胞用4μg/mL杀稻瘟菌素作为抗生素进行处理,并孵育7天。当通过足够的抗生素培养获得稳定的细胞时,将4×106个细胞分配到T175烧瓶中。随后,将所述细胞与100nM非小细胞肺癌治疗剂奥希替尼(Selleckchem,S5078)孵育20天,从而获得耐受性突变型细胞。
实施例5-6:深度测序
使用HiPi Plus DNA聚合酶(Elpis-Bio),将中靶和脱靶位点PCR扩增至200bp至300bp的大小。使用MiSeq(Illumina)设备对通过上述方法获得的PCR产物进行测序,并委托对所得1803个EGFR sgRNA序列进行分析。
实施例5-7:实验结果
在表达EGFR sgRNA的PC9细胞中,用N-UNG对sgRNA中的胞嘧啶进行随机置换,然后将细胞在补充有奥希替尼的培养基中孵育,随后获得活细胞分析结果(参见图29和图30)。图31示出了通过在能够表达EGFR sgRNA的PC9细胞中用N-UNG对sgRNA中的胞嘧啶进行随机置换并在补充有奥希替尼的培养基中孵育所述细胞而来的活细胞分析结果。
<110> 株式会社图尔金
<120> 单碱基置换蛋白以及包含其的组合物
<130> OPP19-003-PCT
<150> US 62/851,372
<151> 2019-05-22
<150> US 62/898,094
<151> 2019-09-10
<160> 92
<170> KoPatentIn 3.0
<210> 1
<211> 20
<212> DNA
<213> 智人
<400> 1
aagaagaaga cgagcctgag 20
<210> 2
<211> 23
<212> DNA
<213> 智人
<400> 2
gaacacaaag catagactgc ggg 23
<210> 3
<211> 23
<212> DNA
<213> 智人
<400> 3
gagtatgagg catagactgc agg 23
<210> 4
<211> 23
<212> DNA
<213> 智人
<400> 4
gtcaagaaag cagagactgc cgg 23
<210> 5
<211> 23
<212> DNA
<213> 智人
<400> 5
gagcaaagac aatagactgt agg 23
<210> 6
<211> 23
<212> DNA
<213> 智人
<400> 6
gatgagataa tgatgagtca ggg 23
<210> 7
<211> 23
<212> DNA
<213> 智人
<400> 7
ggattgaccc aggccagggc tgg 23
<210> 8
<211> 23
<212> DNA
<213> 智人
<400> 8
gaatactaag catagactcc agg 23
<210> 9
<211> 23
<212> DNA
<213> 智人
<400> 9
gtaaacaaag catagactga ggg 23
<210> 10
<211> 23
<212> DNA
<213> 智人
<400> 10
gaagaccaag gatagactgc tgg 23
<210> 11
<211> 23
<212> DNA
<213> 智人
<400> 11
gaacataaag aatagaatga tgg 23
<210> 12
<211> 23
<212> DNA
<213> 智人
<400> 12
ggacaggcag catagactgt ggg 23
<210> 13
<211> 23
<212> DNA
<213> 智人
<400> 13
gtagaaaaag tatagactgc agg 23
<210> 14
<211> 23
<212> DNA
<213> 智人
<400> 14
gaagatagag aatagactgc tgg 23
<210> 15
<211> 23
<212> DNA
<213> 智人
<400> 15
ggctaaagac catagactgt ggg 23
<210> 16
<211> 23
<212> DNA
<213> 智人
<400> 16
gggaataaat catagaatcc tgg 23
<210> 17
<211> 14
<212> DNA
<213> 智人
<400> 17
kraatkkaga kkkk 14
<210> 18
<211> 23
<212> DNA
<213> 智人
<400> 18
gacaaagagg aagagagacg ggg 23
<210> 19
<211> 23
<212> DNA
<213> 智人
<400> 19
acacacacac ttagaatctg tgg 23
<210> 20
<211> 23
<212> DNA
<213> 智人
<400> 20
cacacacact tagaatctgt ggg 23
<210> 21
<211> 19
<212> DNA
<213> 智人
<400> 21
gtacgggaag ccgacggag 19
<210> 22
<211> 19
<212> DNA
<213> 智人
<400> 22
acgggaagcc gacggagga 19
<210> 23
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 来源于SV40病毒的NLS序列
<400> 23
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 24
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 来源于核质蛋白的NLS序列
<400> 24
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 25
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 来源于c-myc的双分型NLS序列
<400> 25
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 26
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 核质蛋白的双分型NLS
<400> 26
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 27
<211> 38
<212> PRT
<213> 人工序列
<220>
<223> hRNPA1 M9 NLS
<400> 27
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 28
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> importin alpha IBB结构域序列
<400> 28
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 29
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 肌瘤T蛋白序列
<400> 29
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 30
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 肌瘤T蛋白序列
<400> 30
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 31
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人的p53序列
<400> 31
Pro Pro Lys Lys Lys Pro Leu
1 5
<210> 32
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 小鼠的c-abl IV序列
<400> 32
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 33
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 流感病毒的NS1序列
<400> 33
Asp Arg Leu Arg Arg
1 5
<210> 34
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 流感病毒的NS1序列
<400> 34
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 35
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 肝炎病毒
<400> 35
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 36
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 小鼠Mx1蛋白的序列
<400> 36
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 37
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 人的ADP核糖
<400> 37
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 38
<211> 17
<212> PRT
<213> 智人
<400> 38
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> GX19
<400> 39
gagtccgagc agaagaagaa 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> GX20
<400> 40
tgcccctccc tccctggccc 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nureki sgRNA 1
<400> 41
gaggacaaag tacaaacggc 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nureki sgRNA 2
<400> 42
gggctcccat cacatcaacc 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nureki sgRNA 3
<400> 43
ggccccagtg gctgctctgg 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nureki sgRNA 4
<400> 44
gctttaccca gttctctggg 20
<210> 45
<211> 77
<212> RNA
<213> 人工序列
<220>
<223> 与spCas9蛋白形成复合体的序列
<400> 45
guuuuagucc cugaaaaggg acuaaaauaa agaguuugcg ggacucugcg ggguuacaau 60
ccccuaaaac cgcuuuu 77
<210> 46
<211> 76
<212> RNA
<213> 人工序列
<220>
<223> 与cjCas9蛋白形成复合体的序列
<400> 46
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 47
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> cjCas9蛋白的PAM
<400> 47
Asn Asn Asn Asn Arg Tyr Ala Cys
1 5
<210> 48
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 48
guaacacgag cagggguccu 20
<210> 49
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 49
ccccgccugu aacacgagca 20
<210> 50
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 50
accccgccug uaacacgagc 20
<210> 51
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 51
aggaccccug cucguguuac 20
<210> 52
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 52
accccugcuc guguuacagg 20
<210> 53
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 53
caccacgagu cuagacucug 20
<210> 54
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 54
ggacuucucu caauuuucua 20
<210> 55
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 55
ccuacgaacc acugaacaaa 20
<210> 56
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 56
ccauuuguuc agugguucgu 20
<210> 57
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 57
cauuuguuca gugguucgua 20
<210> 58
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 58
ggguugcguc agcaaacacu 20
<210> 59
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 59
uuugcugacg caacccccac 20
<210> 60
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 60
uccgcaguau ggaucggcag 20
<210> 61
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 61
aggaguuccg caguauggau 20
<210> 62
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 62
uccucugccg auccauacug 20
<210> 63
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 63
cgucccgcgc aggauccagu 20
<210> 64
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 64
ccgcgggauu cagcgccgac 20
<210> 65
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 65
uccgcgggau ucagcgccga 20
<210> 66
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 66
cccgucggcg cugaaucccg 20
<210> 67
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 67
guaaagagag gugcgccccg 20
<210> 68
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 68
ggggcgcacc ucucuuuacg 20
<210> 69
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 69
gaagcgaagu gcacacgguc 20
<210> 70
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 70
ggucuccaug cgacgugcag 20
<210> 71
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 71
aaugucaacg accgaccuug 20
<210> 72
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 72
aggaggcugu aggcauaaau 20
<210> 73
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 73
cggaaguguu gauaagauag 20
<210> 74
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 74
ccggaagugu ugauaagaua 20
<210> 75
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 75
gcgagggagu ucuucuucua 20
<210> 76
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 76
gaccuucguc ugcgaggcga 20
<210> 77
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 77
gauugagacc uucgucugcg 20
<210> 78
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 78
cucccucgcc ucgcagacga 20
<210> 79
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 79
gauugagauc uucugcgacg 20
<210> 80
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 80
gucgcagaag aucucaaucu 20
<210> 81
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 81
ucgcagaaga ucucaaucuc 20
<210> 82
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 82
ugucaacaag aaaaaccccg cc 22
<210> 83
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 83
aagcccuacg aaccacugaa ca 22
<210> 84
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 84
uuaccaauuu ucuuuugucu uu 22
<210> 85
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 85
acgucccgcg caggauccag uu 22
<210> 86
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 86
gugcacacgg uccggcagau ga 22
<210> 87
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 87
gugccuucuc aucugccgga cc 22
<210> 88
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 88
cgacgugcag aggugaagcg aa 22
<210> 89
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 89
ugcgacgugc agaggugaag cg 22
<210> 90
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 90
gaccgugugc acuucgcuuc ac 22
<210> 91
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 91
auguccaugc cccaaagcca cc 22
<210> 92
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sp20-viHBV-B
<400> 92
gaccaccaaa ugccccuauc uu 22

Claims (33)

1.一种用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,所述融合蛋白包含:
(a)CRISPR酶或其变体;
(b)脱氨酶;和
(c)DNA糖基化酶或其变体,
其中,所述用于单碱基置换的融合蛋白能够诱导任意碱基对胞嘧啶或腺嘌呤的置换,并且其中,所述胞嘧啶或所述腺嘌呤包含在靶核酸序列中的一个或多个核苷酸中。
2.如权利要求1所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述用于单碱基置换的融合蛋白具有选自于以下的任一组分:
(i)N末端-[CRISPR酶]-[脱氨酶]-[DNA糖基化酶]-C末端;
(ii)N末端-[CRISPR酶]-[DNA糖基化酶]-[脱氨酶]-C末端;
(iii)N末端-[脱氨酶]-[CRISPR酶]-[DNA糖基化酶]-C末端;
(iv)N末端-[脱氨酶]-[DNA糖基化酶]-[CRISPR酶]-C末端;
(v)N末端-[DNA糖基化酶]-[CRISPR酶]-[脱氨酶]-C末端;以及
(vi)N末端-[DNA糖基化酶]-[脱氨酶]-[CRISPR酶]-C末端。
3.如权利要求1所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述脱氨酶为胞苷脱氨酶,并且所述DNA糖基化酶为尿嘧啶-DNA糖基化酶或其变体,以及
其中,所述用于单碱基置换的融合蛋白能够诱导任意碱基对所述胞嘧啶的置换,并且其中,所述胞嘧啶包含在所述靶核酸序列中的一个或多个核苷酸中。
4.如权利要求3所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述胞苷脱氨酶为APOBEC、激活诱导的胞苷脱氨酶(AID)及它们的变体中的任一种。
5.如权利要求1所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述脱氨酶为腺苷脱氨酶,并且所述DNA糖基化酶为烷基腺嘌呤DNA糖基化酶或其变体,
其中,所述用于单碱基置换的融合蛋白能够诱导任意碱基对所述腺嘌呤的置换,其中,所述腺嘌呤包含在所述靶核酸序列中的一个或多个核苷酸中。
6.如权利要求5所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述腺苷脱氨酶为TadA、Tad2p、ADA、ADA1、ADA2、ADAR2、ADAT2、ADAT3及它们的变体中的任一种。
7.如权利要求1所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述用于单碱基置换的融合蛋白进一步包含一个或多个核定位序列(NLS)。
8.如权利要求1所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述CRISPR酶或其变体包含选自于由以下所组成的组中的一种或多种:衍生自酿脓链球菌的Cas9蛋白、衍生自空肠弯曲杆菌的Cas9蛋白、衍生自嗜热链球菌的Cas9蛋白、衍生自金黄色葡萄球菌的Cas9蛋白、衍生自脑膜炎奈瑟菌的Cas9蛋白和Cpf1蛋白。
9.如权利要求8所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述CRISPR酶的变体的特征在于RuvC结构域和HNH结构域中的任一种失活。
10.如权利要求9所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述CRISPR酶的变体为切口酶。
11.如权利要求1所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,
其中,所述用于单碱基置换的融合蛋白包含连接部分,所述连接部分插入选自于(a)、(b)和(c)中的一个与选自于(a)、(b)和(c)中的另一个之间。
12.一种载体,所述载体包含编码如权利要求1-11中任一项所述的用于单碱基置换的融合蛋白的核酸。
13.一种用于单碱基置换的复合物,所述用于单碱基置换的复合物包含:
(a)CRISPR酶或其变体;
(b)脱氨酶;
(c)DNA糖基化酶;和
(d)两个或更多个结合结构域,
其中,所述用于单碱基置换的融合蛋白能够诱导任意碱基对胞嘧啶或腺嘌呤的置换,并且其中,所述胞嘧啶或所述腺嘌呤包含在靶核酸序列中的一个或多个核苷酸中。
14.如权利要求13所述的用于单碱基置换的复合物,
其中,所述CRISPR酶、所述脱氨酶、所述DNA糖基化酶各自与一个或多个结合结构域连接,
其中,所述CRISPR酶、所述脱氨酶、所述DNA糖基化酶通过所述结合结构域之间的相互作用形成所述复合物。
15.如权利要求14所述的用于单碱基置换的复合物,
其中,所述CRISPR酶、所述脱氨酶、所述DNA糖基化酶中的任一种与第一结合结构域和第二结合结构域连接,
其中,所述第一结合结构域和另一组分的结合结构域为相互作用对,并且所述第二结合结构域和再一组分的结合结构域为相互作用对,
其中,所述复合物通过所述对形成。
16.如权利要求13所述的用于单碱基置换的复合物,
其中,所述脱氨酶为胞苷脱氨酶,并且
其中,所述DNA糖基化酶为尿嘧啶-DNA糖基化酶或其变体,
其中,所述用于单碱基置换的融合蛋白能够诱导任意碱基对所述胞嘧啶的置换,并且其中,所述胞嘧啶包含在靶核酸序列中的一个或多个核苷酸中。
17.如权利要求16所述的用于单碱基置换的复合物,
其中,所述胞苷脱氨酶为APOBEC、激活诱导的胞苷脱氨酶(AID)及它们的变体中的任一种。
18.如权利要求13所述的用于单碱基置换的复合物,
其中,所述脱氨酶为腺苷脱氨酶,并且
其中,所述DNA糖基化酶为烷基腺嘌呤DNA糖基化酶或其变体,
其中,所述用于单碱基置换的融合蛋白能够诱导任意碱基对所述腺嘌呤的置换,并且其中,所述腺嘌呤包含在靶核酸序列中的一个或多个核苷酸中。
19.如权利要求18所述的用于单碱基置换的复合物,
其中,所述腺苷脱氨酶为TadA、Tad2p、ADA、ADA1、ADA2、ADAR2、ADAT2、ADAT3及它们的变体中的任一种。
20.如权利要求13所述的用于单碱基置换的复合物,
其中,所述用于单碱基置换的复合物包含:
(i)第一融合蛋白,所述第一融合蛋白包含选自于所述CRISPR酶、所述脱氨酶和所述DNA糖基化酶的两种组分以及第一结合结构域,以及
(ii)第二融合蛋白,所说第二融合蛋白包含选自于所述CRISPR酶、所述脱氨酶和所述DNA糖基化酶的在(i)中未被选择的一种组分以及第二结合结构域,
其中,所述第一结合结构域和所述第二结合结构域为相互作用对,并且
其中,所述复合物通过所述对形成。
21.如权利要求20所述的用于单碱基置换的复合物,
其中,所述用于单碱基置换的复合物包含:
(i)所述第一融合蛋白,所述第一融合蛋白包含所述脱氨酶、所述DNA糖基化酶和所述第一结合结构域,以及
(ii)所述第二融合蛋白,所述第二融合蛋白包含所述CRISPR酶和所述第二结合结构域。
22.如权利要求14所述的用于单碱基置换的复合物,
其中,所述结合结构域为FRB结构域、FKBP二聚化结构域、内含肽、ERT结构域、VPR结构域、GCN4肽和单链可变片段(scFv)中的任一种,或形成异二聚体的结构域中的任一种。
23.如权利要求15或20所述的用于单碱基置换的复合物,
其中,所述对为选自于以下的任一种:
(i)FRB结构域和FKBP二聚化结构域;
(ii)第一内含肽和第二内含肽;
(iii)ERT结构域和VPR结构域;
(iv)GCN4肽和单链可变片段(scFv);以及
(v)形成异二聚体的第一结构域和第二结构域。
24.如权利要求23所述的用于单碱基置换的复合物,
其中,所述对为所述GCN4肽和所述单链可变片段(scFv)。
25.如权利要求21所述的用于单碱基置换的复合物,
其中,所述第一结合结构域为单链可变片段(scFv),
其中,所述第二融合蛋白进一步包含一个或多个结合结构域,其中,所述第二融合蛋白中进一步包含的所述结合结构域为GCN4肽,并且
其中,两个或更多个第一融合蛋白通过与所述GCN4肽中的任一个相互作用来形成所述复合物。
26.一种用于单碱基置换的组合物,所述用于单碱基置换的组合物包含:
(a)向导RNA或编码所述向导RNA的核酸,以及
(b)i)如权利要求1所述的用于单碱基置换的融合蛋白或编码所述融合蛋白的核酸,或ii)如权利要求13所述的用于单碱基置换的复合物,
其中,所述向导RNA与靶核酸序列互补结合,
其中,与所述向导RNA结合的所述靶核酸序列为15bp-25bp,
其中,所述用于单碱基置换的融合蛋白或所述用于单碱基置换的复合物能够诱导任意碱基对胞嘧啶或腺嘌呤的置换,其中,所述胞嘧啶或所述腺嘌呤包含在靶区域中的一个或多个核苷酸中。
27.如权利要求26所述的用于单碱基置换的组合物,
其中,所述用于单碱基置换的组合物包含一个或多个载体。
28.一种用于单碱基置换的方法,所述方法包括:
使(i)和(ii)在体外或离体与包含靶核酸序列的靶区域接触,
(i)向导RNA,
(ii)如权利要求1所述的用于单碱基置换的融合蛋白或如权利要求12所述的用于单碱基置换的复合物,
其中,所述向导RNA与靶核酸序列互补结合,
其中,与所述向导RNA结合的所述靶核酸序列为15bp-25bp,
其中,所述用于单碱基置换的融合蛋白或所述用于单碱基置换的复合物能够诱导任意碱基对胞嘧啶或腺嘌呤的置换,其中,所述胞嘧啶或所述腺嘌呤包含在靶区域中的一个或多个核苷酸中。
29.一种用于靶基因的SNP筛选的方法,所述方法包括:
通过将如权利要求26所述的用于单碱基置换的组合物引入包含所述靶基因的细胞中,在所述靶基因上人工诱导SNP;
选择包含期望的SNP的细胞;以及
通过分析所选择的细胞获得关于所述期望的SNP的信息,
其中,所述期望的SNP与由所述靶基因表达的蛋白的结构或功能相关。
30.如权利要求29所述的用于靶基因的SNP筛选的方法,
其中,所述用于单碱基置换的组合物通过选自于以下方法所组成的组中的一种或多种方法来引入:电穿孔、脂质体、质粒、病毒载体、纳米颗粒和蛋白易位结构域(PTD)融合蛋白方法。
31.一种用于筛选耐药突变的方法,所述方法包括:
通过将如权利要求26所述的用于单碱基置换的组合物引入包含靶基因的一个或多个细胞中,在所述靶基因上人工诱导SNP;
对所述细胞以特定药物进行处理;
对存活细胞进行选择;以及
通过分析所选择的细胞获得关于期望的SNP的信息,
其中,所述期望的SNP与由所述靶基因表达的蛋白的结构或功能相关。
32.一种用于获得关于奥希替尼耐受性SNP的信息的方法,所述方法包括:
a)将用于单碱基置换的蛋白或编码所述蛋白的核酸以及向导RNA文库中的任一个或多个向导RNA或编码所述向导RNA的核酸引入包含靶核酸序列的细胞;
b)用奥希替尼处理a)中的细胞;
c)对存活细胞进行分离;以及
d)从所述分离的细胞获得关于期望的SNP的信息,
其中,所述期望的SNP与包含所述靶核酸序列的EGFR基因所表达的EGFR的结构或功能相关。
33.如权利要求31所述的用于筛选靶基因的SNP的方法,
其中,所述用于单碱基置换的组合物通过选自于以下方法所组成的组中的一种或多种方法来引入:电穿孔、脂质体、质粒、病毒载体、纳米颗粒和蛋白易位结构域(PTD)融合蛋白方法。
CN202080053009.2A 2019-05-22 2020-05-22 单碱基置换蛋白以及包含其的组合物 Pending CN114144519A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962851372P 2019-05-22 2019-05-22
US62/851,372 2019-05-22
US201962898094P 2019-09-10 2019-09-10
US62/898,094 2019-09-10
PCT/KR2020/006731 WO2020235974A2 (ko) 2019-05-22 2020-05-22 단일염기 치환 단백질 및 이를 포함하는 조성물

Publications (1)

Publication Number Publication Date
CN114144519A true CN114144519A (zh) 2022-03-04

Family

ID=73458158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080053009.2A Pending CN114144519A (zh) 2019-05-22 2020-05-22 单碱基置换蛋白以及包含其的组合物

Country Status (7)

Country Link
US (1) US20220228133A1 (zh)
EP (1) EP3974525A4 (zh)
JP (1) JP2022533842A (zh)
KR (1) KR20200135225A (zh)
CN (1) CN114144519A (zh)
AU (1) AU2020278864A1 (zh)
WO (1) WO2020235974A2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115772523A (zh) * 2021-08-10 2023-03-10 珠海舒桐医疗科技有限公司 一种碱基编辑工具
CN115725650A (zh) * 2021-08-26 2023-03-03 华东师范大学 实现a到c和/或a到t碱基突变的碱基编辑系统及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018027078A1 (en) * 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
WO2018052247A1 (ko) * 2016-09-13 2018-03-22 주식회사 툴젠 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법
WO2018165629A1 (en) * 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
KR20190044157A (ko) * 2017-10-20 2019-04-30 경상대학교산학협력단 아데닌 또는 아데노신 탈아미노효소를 유효성분으로 포함하는 단일 염기 편집용 조성물 및 이의 용도

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA201700181A1 (ru) * 2014-10-14 2017-09-29 Галозим, Инк. Композиции аденозиндеаминазы-2 (ада-2), их варианты и способы использования
KR20170126636A (ko) 2016-05-10 2017-11-20 주식회사 코맥스 디지털 도어락 시스템 및 이의 동작방법
US20180258418A1 (en) * 2017-01-17 2018-09-13 Institute For Basic Science Method of identifying genome-wide off-target sites of base editors by detecting single strand breaks in genomic dna

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018027078A1 (en) * 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
WO2018052247A1 (ko) * 2016-09-13 2018-03-22 주식회사 툴젠 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법
WO2018165629A1 (en) * 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
KR20190044157A (ko) * 2017-10-20 2019-04-30 경상대학교산학협력단 아데닌 또는 아데노신 탈아미노효소를 유효성분으로 포함하는 단일 염기 편집용 조성물 및 이의 용도

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NICOLE M. GAUDELLI等: "Programmable base editing of A•T to G•C in genomic DNA without DNA cleavage", NATURE, vol. 551, no. 7681, 25 April 2018 (2018-04-25), pages 464, XP037336615, DOI: 10.1038/nature24644 *
WEN JIANG等: "BE-PLUS: a new base editing tool with broadened editing window and enhanced fidelity", CELL RESEARCH, vol. 28 *

Also Published As

Publication number Publication date
EP3974525A4 (en) 2023-07-05
AU2020278864A1 (en) 2021-12-23
WO2020235974A2 (ko) 2020-11-26
US20220228133A1 (en) 2022-07-21
KR20200135225A (ko) 2020-12-02
WO2020235974A3 (ko) 2021-04-22
WO2020235974A9 (ko) 2021-06-03
EP3974525A2 (en) 2022-03-30
JP2022533842A (ja) 2022-07-26

Similar Documents

Publication Publication Date Title
US20230407341A1 (en) Using Truncated Guide RNAs (tru-gRNAs) to Increase Specificity for RNA-Guided Genome Editing
US10633642B2 (en) Engineered CRISPR-Cas9 nucleases
US11060078B2 (en) Engineered CRISPR-Cas9 nucleases
EP3341477B1 (en) Engineered crispr-cas9 nucleases
JP6500293B2 (ja) Dnaメチル化編集用キットおよびdnaメチル化編集方法
CN109072235B (zh) 通过核递送crispr/cas9追踪并操纵细胞rna
US10519454B2 (en) Genome editing using Campylobacter jejuni CRISPR/CAS system-derived RGEN
US10557151B2 (en) Somatic human cell line mutations
CA3196116A1 (en) Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
CN107922949A (zh) 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法
KR20190005801A (ko) 표적 특이적 crispr 변이체
US20220372455A1 (en) Crispr type v-u1 system from mycobacterium mucogenicum and uses thereof
CN114144519A (zh) 单碱基置换蛋白以及包含其的组合物
US20210355475A1 (en) Optimized base editors enable efficient editing in cells, organoids and mice
KR20180128864A (ko) 매칭된 5&#39; 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
KR102667508B1 (ko) 프라임 에디팅 시스템을 이용한 게놈 편집의 과정에서 발생 가능한 오프 타겟을 예측하는 방법
KR20240090567A (ko) 조작된 crispr-cas9 뉴클레아제

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination