CN117062827A - Crispr相关转座子系统及其使用方法 - Google Patents

Crispr相关转座子系统及其使用方法 Download PDF

Info

Publication number
CN117062827A
CN117062827A CN202280024344.9A CN202280024344A CN117062827A CN 117062827 A CN117062827 A CN 117062827A CN 202280024344 A CN202280024344 A CN 202280024344A CN 117062827 A CN117062827 A CN 117062827A
Authority
CN
China
Prior art keywords
protein
nucleic acid
acid sequence
amino acid
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280024344.9A
Other languages
English (en)
Inventor
K·E·沃特斯
N·M·雅基莫
C·D·托格森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abbott Biotechnology
Original Assignee
Abbott Biotechnology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abbott Biotechnology filed Critical Abbott Biotechnology
Publication of CN117062827A publication Critical patent/CN117062827A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/21Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • General Preparation And Processing Of Foods (AREA)
  • Seeds, Soups, And Other Foods (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本披露涉及用于修饰靶核酸序列的系统、组合物和方法。

Description

CRISPR相关转座子系统及其使用方法
相关申请
本申请要求于2021年1月28日提交的美国临时申请号63/142,990的优先权。上述优先权申请的全部内容通过援引并入本文。
序列表
本申请含有已以ASCII格式以电子方式提交且特此通过援引以其全文并入的序列表。所述ASCII副本创建于2022年1月26日,命名为A112029_1020WO_(0010_7)_SL.txt,并且大小为16,715字节。
背景技术
成簇规律间隔短回文重复序列(CRISPR)和CRISPR相关(Cas)基因(统称为CRISPR-Cas或CRISPR/Cas系统)是古细菌和细菌中的适应性免疫系统,可保护特定物种免受外来遗传因素的侵害。
发明内容
本文描述了用于靶序列的序列特异性修饰的重组核酸组合物和重组核酸靶向系统,以及使用重组核酸靶向系统的方法。
在一个方面,本披露提供了一种重组核酸,该重组核酸包含可操作地连接到第一多核苷酸的第一启动子和可操作地连接到第二多核苷酸的第二启动子。第一多核苷酸包含编码至少一种成簇规律间隔短回文重复序列(CRISPR)相关转座酶蛋白或其功能片段的核酸序列,以及编码CRISPR相关(Cas)蛋白的核酸序列。第二多核苷酸包含编码能够与靶序列杂交的指导RNA(gRNA)的核酸序列。
在另一个方面,本披露提供了一种重组核酸,该重组核酸包含可操作地连接到第一多核苷酸的第一启动子和可操作地连接到第二多核苷酸的第二启动子,其中第一多核苷酸包含编码TniA蛋白或其功能片段的核酸序列、编码TniB蛋白或其功能片段的核酸序列和编码TniQ蛋白或其功能片段的核酸序列,以及编码CRISPR相关(Cas)蛋白的核酸序列,其中Cas蛋白包含SEQ ID NO:1中所示的氨基酸序列;其中第二多核苷酸包含编码指导RNA(gRNA)的核酸序列,其中gRNA能够与靶序列杂交。
在又一个方面,本披露提供了一种重组核酸,该重组核酸包含可操作地连接到第一多核苷酸的第一启动子和可操作地连接到第二多核苷酸的第二启动子,其中第一多核苷酸包含编码TniA蛋白或其功能片段的核酸序列、编码TniB蛋白或其功能片段的核酸序列和编码TniQ蛋白或其功能片段的核酸序列,以及编码CRISPR相关(Cas)蛋白的核酸序列,其中Cas蛋白包含与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列;其中第二多核苷酸包含编码指导RNA(gRNA)的核酸序列,其中gRNA能够与靶序列杂交。
在一个实施例中,重组核酸包含至少一种CRISPR相关转座酶蛋白或其功能片段,该至少一种CRISPR相关转座酶蛋白或其功能片段包含选自由TniA蛋白、TniB蛋白和TniQ蛋白组成的组的一种或多种蛋白。在另一个实施例中,至少一种CRISPR相关转座酶蛋白或其功能片段包含选自由TniA蛋白、TniB蛋白和TniQ蛋白组成的组的两种或更多种蛋白。在又一个实施例中,至少一种CRISPR相关转座酶蛋白或其功能片段包含TniA蛋白、TniB蛋白和TniQ蛋白。在上述某些实施例中,TniA蛋白包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列。在上述某些实施例中,TniA蛋白包含SEQ ID NO:2中所示的氨基酸序列。在上述某些实施例中,TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列。在上述某些实施例中,TniB蛋白包含SEQ ID NO:3中所示的氨基酸序列。在上述某些实施例中,TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。在上述某些实施例中,TniQ蛋白包含SEQ ID NO:4中所示的氨基酸序列。
在一些实施例中,重组核酸包含第一多核苷酸,该第一多核苷酸包含编码包含如SEQ ID NO:2中所示的氨基酸序列的TniA蛋白的核酸序列、编码包含如SEQ ID NO:3中所示的氨基酸序列的TniB蛋白的核酸序列和编码包含如SEQ ID NO:4中所示的氨基酸序列的TniQ蛋白的核酸序列。
在一些实施例中,重组核酸包含第一多核苷酸,该第一多核苷酸包含编码包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列的TniA蛋白的核酸序列、编码包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列的TniB蛋白的核酸序列和编码包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列的TniQ蛋白的核酸序列。
在一些实施例中,重组核酸包含编码作为V-K型Cas蛋白的Cas蛋白的核酸序列。在一些实施例中,V-K型Cas蛋白是包含与如SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列的Cas12k蛋白。在具体的实施例中,Cas12k蛋白包含如SEQ ID NO:1中所示的氨基酸序列。
在一个实施例中,重组核酸包含第一多核苷酸,该第一多核苷酸包含编码TniA蛋白或其功能片段的核酸序列、编码TniB蛋白或其功能片段的核酸序列和编码TniQ蛋白或其功能片段的核酸序列,以及编码包含如SEQ ID NO:1中所示的氨基酸序列的Cas蛋白(例如,Cas12k蛋白)的核酸序列。重组核酸进一步包含第二多核苷酸,该第二多核苷酸包含编码能够与靶序列杂交的gRNA的核酸序列。
在一些实施例中,重组核酸包含能够与Cas蛋白(例如,Cas12k蛋白)复合以形成Cas蛋白/gRNA核糖核蛋白(RNP)复合物的gRNA。在一些实施例中,gRNA包含CRISPR/Cas系统相关RNA(crRNA)序列。在某些实施例中,gRNA是进一步包含反式激活CRISPR/Cas系统RNA(tracrRNA)序列的单指导RNA。在一些实施例中,gRNA包含SEQ ID NO:5中所示的核苷酸序列。
在一个方面,本披露提供了一种载体,该载体包含本文的重组核酸。在另一个方面,本披露提供了一种细菌细胞,该细菌细胞包含本文所述的载体。
在一个方面,本披露提供了一种用于靶序列的序列特异性修饰的重组核酸靶向系统。该系统包含至少一种CRISPR相关转座酶蛋白或编码至少一种CRISPR相关转座酶蛋白的多核苷酸、Cas蛋白(例如,Cas12k蛋白)或编码Cas蛋白的多核苷酸;以及指导RNA(gRNA)或编码gRNA的多核苷酸。在一些实施例中,重组核酸靶向系统包含能够与Cas蛋白复合以形成Cas蛋白/gRNA RNP复合物的gRNA。
在一个实施例中,重组核酸靶向系统包含至少一种CRISPR相关转座酶蛋白或其功能片段,该至少一种CRISPR相关转座酶蛋白或其功能片段包含选自由TniA蛋白、TniB蛋白和TniQ蛋白组成的组的一种或多种蛋白。在另一个实施例中,至少一种CRISPR相关转座酶蛋白或其功能片段包含选自由TniA蛋白、TniB蛋白和TniQ蛋白组成的组的两种或更多种蛋白。在又一个实施例中,至少一种CRISPR相关转座酶蛋白或其功能片段包含TniA蛋白、TniB蛋白和TniQ蛋白。在上述某些实施例中,TniA蛋白包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列。在上述某些实施例中,TniA蛋白包含SEQ ID NO:2中所示的氨基酸序列。在上述某些实施例中,TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列。在上述某些实施例中,TniB蛋白包含SEQ ID NO:3中所示的氨基酸序列。在上述某些实施例中,TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。在上述某些实施例中,TniQ蛋白包含SEQ ID NO:4中所示的氨基酸序列。
在一些实施例中,重组核酸靶向系统包含第一多核苷酸,该第一多核苷酸包含编码包含与SEQ ID NO:2中所示的氨基酸至少95%相同的氨基酸序列的TniA蛋白的核酸序列、编码包含与SEQ ID NO:3中所示的氨基酸至少95%相同的氨基酸序列的TniB蛋白的核酸序列和编码包含与SEQ ID NO:4中所示的氨基酸至少95%相同的氨基酸序列的TniQ蛋白的核酸序列。在其他实施例中,重组核酸靶向系统包含第一多核苷酸,该第一多核苷酸包含编码包含如SEQ ID NO:2中所示的氨基酸序列的TniA蛋白的核酸序列、编码包含如SEQ IDNO:3中所示的氨基酸序列的TniB蛋白的核酸序列和编码包含如SEQ ID NO:4中所示的氨基酸序列的TniQ蛋白的核酸序列。
在一些实施例中,重组核酸靶向系统包含编码作为V-K型Cas蛋白的Cas蛋白的核酸序列。在一些实施例中,V-K型Cas蛋白是包含与如SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列的Cas12k蛋白。在具体的实施例中,Cas12k蛋白包含如SEQ ID NO:1中所示的氨基酸序列。
在一个实施例中,用于靶序列的序列特异性修饰的重组核酸靶向系统包含TniA蛋白、TniB蛋白和TniQ蛋白,或编码TniA蛋白、TniB蛋白和TniQ蛋白的多核苷酸;包含如SEQID NO:1中所示的氨基酸序列的Cas蛋白或编码包含如SEQ ID NO:1中所示的氨基酸序列的Cas蛋白的多核苷酸;以及gRNA或编码gRNA的多核苷酸,其中gRNA能够与Cas蛋白复合以形成gRNA-Cas蛋白复合物。
在一些实施例中,重组核酸靶向系统包含gRNA,该gRNA包含CRISPR/Cas系统相关RNA(crRNA)序列。在某些实施例中,gRNA是进一步包含反式激活CRISPR/Cas系统RNA(tracrRNA)序列的单指导RNA。在一些实施例中,gRNA包含SEQ ID NO:5中所示的核苷酸序列。
在一些实施例中,重组核酸靶向系统进一步包含靶多核苷酸。靶多核苷酸包含(i)能够与gRNA杂交的靶序列和(ii)原型间隔子相邻基序(PAM)序列。在某些实施例中,PAM包含核苷酸序列5'-GTN-3'、5'-NGTN-3'或5'-GGTN-3'。在某些实施例中,PAM包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTT-3'、5'-GTA-3'、5'-GTC-3'或5'-GTG-3'。在某些实施例中,PAM包含5'-GGTA-3'、5'-GGTC-3'或5'-GGTG-3'。在特定的实施例中,PAM包含如5'-GGTT-3'中所示的核苷酸序列。
在一些实施例中,重组核酸靶向系统进一步包含供体多核苷酸。供体多核苷酸包含用于插入靶多核苷酸中的有效负载序列。在一些实施例中,供体多核苷酸进一步包含编码转座子左端(TE-L)的核酸序列和编码转座子右端(TE-R)的核酸序列。在某些实施例中,TE-L包含与SEQ ID NO:6中所示的核酸序列至少95%相同的核酸序列。在某些实施例中,TE-L包含如SEQ ID NO:6中所示的核酸序列。在某些实施例中,TE-R包含与SEQ ID NO:7中所示的核酸序列至少95%相同的核酸序列。在某些实施例中,TE-R包含如SEQ ID NO:7中所示的核酸序列。
在一些实施例中,重组核酸靶向系统包含含有与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列的TniA蛋白以及供体多核苷酸,其中供体多核苷酸包含用于插入靶序列中的有效负载序列、与SEQ ID NO:6中所示的核酸序列至少95%相同的编码转座子左端(TE-L)的核酸序列,以及与SEQ ID NO:7中所示的核酸序列至少95%相同的编码转座子右端(TE-R)的核酸序列。在某些实施例中,重组核酸靶向系统进一步包含含有与SEQID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列的Cas蛋白(例如,Cas12k蛋白)或编码Cas蛋白的多核苷酸,其中Cas蛋白包含与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列;以及指导RNA(gRNA)或编码gRNA的多核苷酸,其中gRNA能够与Cas蛋白复合以形成gRNA-Cas蛋白复合物。在某些实施例中,重组核酸靶向系统进一步包含TniB蛋白和TniQ蛋白中的一种或多种。
在某些实施例中,重组核酸靶向系统包含作为纯化蛋白的Cas蛋白(例如,Cas12k蛋白)、TniA蛋白、TniB蛋白和TniQ蛋白中的至少一种。
在一个方面,本披露提供了一种细菌细胞,该细菌细胞包含本文所述的重组核酸靶向系统。
在一个方面,本披露提供了一种用于修饰细菌细胞中的靶多核苷酸的方法。该方法包括向细胞中引入第一、第二和第三重组核酸。第一重组核酸包含编码至少一种CRISPR相关转座酶蛋白或其功能片段的多核苷酸、编码Cas蛋白(例如,Cas12k蛋白)的多核苷酸;以及编码gRNA的多核苷酸。第二重组核酸包含靶多核苷酸,该靶多核苷酸含有能够与gRNA杂交的靶序列以及PAM序列。第三重组核酸包含供体多核苷酸,该供体多核苷酸包含用于插入靶多核苷酸中的有效负载序列。
在本文所述的方法的一些实施例中,gRNA能够与Cas蛋白质复合以形成Cas蛋白/gRNA RNP复合物。
在用于修饰细菌细胞中的靶多核苷酸的方法的一个实施例中,该方法包括向细胞中引入第一重组核酸,该第一重组核酸包含编码TniA蛋白或其功能片段的多核苷酸、编码TniB蛋白或其功能片段的多核苷酸和编码TniQ蛋白或其功能片段的多核苷酸;编码包含如SEQ ID NO:1中所示的氨基酸序列的Cas蛋白的多核苷酸;以及编码能够与Cas蛋白复合以形成gRNA-Cas蛋白复合物的gRNA的多核苷酸。在上述实施例中,该方法进一步包括向细胞中引入包含靶多核苷酸的第二重组核酸,该靶多核苷酸包含能够与gRNA杂交的靶序列以及PAM序列。该方法进一步包括向细胞中引入包含供体多核苷酸的第三重组核酸,该供体多核苷酸包含用于插入靶多核苷酸的有效负载序列。
在本文所述方法的一些实施例中,重组核酸靶向系统进一步包含供体多核苷酸。供体多核苷酸包含用于插入靶多核苷酸中的有效负载序列。在一些实施例中,供体多核苷酸进一步包含编码TE-L的核酸序列和编码TE-R的核酸序列。在某些实施例中,TE-L包含如SEQ ID NO:6中所示的核酸序列。在某些实施例中,TE-R包含如SEQ ID NO:7中所示的核酸序列。
在该方法的一个实施例中,重组核酸包含多核苷酸,该多核苷酸包含至少一种CRISPR相关转座酶蛋白或其功能片段。在一些实施例中,多核苷酸编码TniA蛋白或其功能片段、TniB蛋白或其功能片段或TniQ蛋白或其功能片段。在另一个实施例中,至少一种CRISPR相关转座酶蛋白或其功能片段包含选自由TniA蛋白、TniB蛋白和TniQ蛋白组成的组的两种或更多种蛋白。在又一个实施例中,至少一种CRISPR相关转座酶蛋白或其功能片段包含TniA蛋白、TniB蛋白和TniQ蛋白。在上述某些实施例中,TniA蛋白包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列。在上述某些实施例中,TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列。在上述某些实施例中,TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。在该方法的一些实施例中,TniA蛋白包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列,TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列,并且TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。在该方法的一些实施例中,TniA蛋白包含如SEQ ID NO:2中所示的氨基酸序列,TniB蛋白包含如SEQID NO:3中所示的氨基酸序列,并且TniQ蛋白包含如SEQ ID NO:4中所示的氨基酸序列。
在该方法的一些实施例中,PAM包含核苷酸序列5'-GTN-3'、5'-NGTN-3'或5'-GGTN-3'。在某些实施例中,PAM包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTT-3'、5'-GTA-3'、5'-GTC-3'或5'-GTG-3'。在某些实施例中,PAM包含5'-GGTA-3'、5'-GGTC-3'或5'-GGTG-3'。在特定的实施例中,PAM包含如5'-GGTT-3'中所示的核苷酸序列。
在该方法的一些实施例中,细菌细胞是大肠杆菌(Escherichia coli)。
附图说明
图1A描绘了具有TniA、TniB、TniQ、Cas12k、sgRNA支架和氨苄青霉素抗性蛋白(AmpR)的编码区的pEffector质粒A2的结构。图1B描绘了具有有效负载序列的编码区的pDonor质粒B2的结构,该有效负载序列包括卡那霉素抗性基因以及左(TE-L)和右(TE-R)转座子末端的序列。图1C描绘了具有原型间隔子相邻基序(PAM)序列并具有靶序列的编码区的pTarget质粒C2的结构。
图2示出了用于将pDonor质粒B2有效负载序列插入pTarget质粒C2中的pEffector质粒A2介导的CRISPR相关转座酶事件。x轴和y轴分别表示与pTarget质粒C2和pDonor质粒B2的比对位置,而竖直轴和水平轴中的直方图分别显示了与pDonor质粒B2或pTarget质粒C2比对的双端读段中的一个中的测序读段数量。
具体实施方式
本披露涉及用于靶序列的序列特异性修饰的重组核酸组合物和重组核酸靶向系统。本披露还提供了用于修饰细菌细胞中的靶多核苷酸的方法。本文所述的组合物和方法包含编码一种或多种成簇规律间隔短回文重复序列(CRISPR)相关转座酶蛋白或其功能片段、序列特异性核苷酸结合蛋白(例如,Cas蛋白)的一种或多种组分和指导分子(例如,指导RNA分子)的多核苷酸。本文所述的组合物和方法进一步包含含有能够与gRNA杂交的靶序列的靶多核苷酸和含有用于插入靶多核苷酸中的有效负载序列的供体多核苷酸。
I.定义
除非另有定义,否则本披露中所用的所有术语均具有如本领域普通技术人员通常理解的含义。为了更好地理解本披露的传授内容,将术语定义包括在内,以提供进一步的指导。
如本文所用,术语“约”或“大约”当指可测量的值诸如参数、量等时,意指涵盖指定值的和偏离指定值的+/-10%或更小、优选+/-5%或更小并且更优选+/-1%或更小的变化,只要此类变化适于在本披露中执行。
如本文所用,术语“供体多核苷酸”是包括能够使用如本文所述的CRISPR相关转座酶或方法插入靶核酸序列中的有效负载序列的多核苷酸分子。
如本文所用,术语“效应子复合物”是指具有执行酶活性或结合由指导RNA指定的核酸上的靶位点的至少一种蛋白质的复合物。
如本文所用,术语“编码”是指当置于适当调节序列的控制下时被转录(并任选地被翻译)的核酸序列(即,DNA)。
如本文所用,术语“杂交”是指其中一种或多种多核苷酸相互作用以形成经由多核苷酸的残基的碱基之间的氢键而稳定的复合物的反应。
如本文所用,术语“核酸靶向系统”是指参与基于CRISPR-Cas的系统(例如,CRISPR相关转座酶系统)的表达或以其他方式引导该系统的活性的转录物和其他元件,这些转录物和其他元件可包括编码CRISPR相关转座酶系统的核苷酸序列。
如本文所用的术语“可操作地连接”是指感兴趣的核酸序列(或多个核酸序列)以允许感兴趣的核苷酸序列(或多个核苷酸序列)表达的方式连接到调节元件。术语“调节元件”旨在包括启动子、核糖体结合位点(RBS)和其他表达控制元件。
如本文所用,术语“有效负载序列”是指能够被整合到靶序列中的感兴趣的核酸序列(例如,DNA序列或RNA序列)。有效负载序列可以是对细胞(例如,细菌细胞)内源或外源的序列。有效负载序列的非限制性实例包括DNA序列、编码蛋白质的RNA序列和非编码RNA序列(例如,微小RNA)。
如本文所用,“启动子”是指位于基因的转录起始位点(或蛋白质编码区)上游或5'端并参与RNA聚合酶和其他蛋白质(反式作用转录因子)的识别和结合以起始转录的DNA序列。
如本文所用,术语“原型间隔子相邻基序”或“PAM”是指与包含效应子复合物和RNA指导物的复合物所结合的靶序列相邻的DNA序列。在一些实施例中,PAM是酶活性所需的。
如本文所用,术语“指导RNA”或“gRNA”或“指导RNA序列”是指促进本文所述的多肽靶向靶核酸的任何RNA分子。例如,RNA指导物可以是识别靶核酸序列(例如,与其结合)的分子。指导RNA可被合成设计成与特定核酸序列互补。在一个方面,本文提供的指导RNA包含CRISPR RNA(crRNA)。在一个方面,本文提供的指导RNA包含与反式激活CRISPR RNA(tracrRNA)复合的CRISPR RNA(crRNA)。在另一个方面,本文提供的指导RNA包含单链指导RNA(sgRNA)。在一个方面,本文提供的单链指导RNA包含crRNA和tracrRNA两者。
如本文所用,术语“基本上相同”是指与参考序列具有一定程度同一性的序列,即多核苷酸序列或多肽序列。
如本文所用,术语“靶序列”、“靶核酸”、“靶核酸序列”和“靶位点”可互换地指通过CRISPR相关转座酶或通过如本文所述的方法修饰的核苷酸序列。在一些实施例中,靶序列在基因中。
如本文所用,术语“靶多核苷酸”是指包括能够使用如本文所述的CRISPR相关转座酶或方法将有效负载序列插入其中的靶序列的多核苷酸分子。
如本文所用,术语“反式激活crRNA”和“tracrRNA”是指与crRNA序列具有足够互补性以进行杂交并且参与指导RNA与靶核酸结合或是指导RNA与靶核酸结合所需的任何多核苷酸序列。
II.组合物和系统
本披露提供了用于靶序列的序列特异性修饰的重组核酸组合物和重组核酸靶向系统。在一个方面,本披露提供了一种重组核酸,该重组核酸包含可操作地连接到第一多核苷酸的第一启动子和可操作地连接到第二多核苷酸的第二启动子。在一些实施例中,第一多核苷酸包含编码至少一种成簇规律间隔短回文重复序列(CRISPR)相关转座酶蛋白或其功能片段的核酸序列,以及编码CRISPR相关(Cas)蛋白的核酸序列。在一些实施例中,第二多核苷酸包含编码能够与靶序列杂交的指导RNA(gRNA)的核酸序列。在另一个方面,本披露提供了一种用于靶序列的序列特异性修饰的重组核酸靶向系统。在一些实施例中,核酸靶向系统包含至少一种CRISPR相关转座酶蛋白,或编码至少一种CRISPR相关转座酶蛋白的多核苷酸;CRISPR相关(Cas)蛋白(例如,Cas12k蛋白),或编码Cas蛋白的多核苷酸;以及指导RNA(gRNA),或编码gRNA的多核苷酸。在另一个实施例中,本文提供的核酸靶向系统(或重组核酸)包含可操作地连接到编码至少一种、至少两种、至少三种、至少四种或至少五种(CRISPR)相关转座酶蛋白的至少一种、至少两种、至少三种、至少四种或至少五种多核苷酸的至少一种、至少两种、至少三种、至少四种或至少五种(或更多种)启动子。在一些实施例中,本文提供的核酸靶向系统(或重组核酸)编码至少一种、至少两种、至少三种、至少四种或至少五种(或更多种)指导RNA。在一些实施例中,核酸靶向系统进一步包含编码转座子左端(TE-L)的至少一种核酸序列和编码转座子右端(TE-R)的至少一种核酸序列。
在一些实施例中,核酸靶向系统进一步包含能够与gRNA中的至少一种和至少一种原型间隔子相邻基序(PAM)序列杂交的至少一种靶序列。
A.CRISPR相关转座酶
本文所述的重组核酸组合物和重组核酸靶向系统包含至少一种CRISPR相关转座酶蛋白或其功能片段。例如,在一些实施例中,本披露提供了一种重组核酸组合物,该重组核酸组合物包含编码至少一种CRISPR相关转座酶蛋白或其功能片段的第一多核苷酸。在其他实施例中,本披露提供了一种重组核酸靶向系统,该重组核酸靶向系统包含至少一种CRISPR相关转座酶蛋白,或编码至少一种CRISPR相关转座酶蛋白的多核苷酸。术语“转座酶”是指能够与转座子末端序列(即,转座子的远端处的核苷酸序列)形成功能复合物并催化含有转座子末端的序列插入或转座到单链或双链靶核酸序列(例如,DNA)中的酶。术语“CRISPR相关转座酶”是指与CRISPR基因座相关的转座酶和/或蛋白质。此外,如本文所用,术语“转座”或术语“转座反应”是指其中转座酶将供体多核苷酸序列(例如,供体多核苷酸的有效负载序列)插入靶多核苷酸中的靶位点中或附近的反应。在一些实施例中,供体多核苷酸的有效负载序列含有转座子末端序列(例如,转座子右端(TE-R)序列和转座子左端(TE-L)序列)或由转座酶识别的二级结构元件,其中在识别后,转座酶在靶多核苷酸中切割或引入交错断裂,供体多核苷酸序列的有效负载序列可插入这些交错断裂中。
示例性转座酶包括但不限于Tn转座酶(例如,Tn3、Tn5、Tn7、Tn10、Tn552、Tn903)、原核转座酶和与本文提供的转座酶相关和/或衍生自本文提供的转座酶的任何转座酶。在某些实施例中,与亲本转座酶相关和/或衍生自亲本转座酶的转座酶可包含与亲本转座酶的对应多肽或其功能片段具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或约99.5%或更高氨基酸序列同源性的多肽或其功能片段。在一些实施例中,本文所述的至少一种CRISPR相关转座酶蛋白包含完整的转座子系统(例如,Tn7转座子系统)。在一些实施例中,本文提供的至少一种(CRISPR)相关转座酶蛋白包含与选自SEQ ID NO:2-4的至少一个序列或其功能片段具有至少约50%序列同一性、至少约55%序列同一性、至少约60%序列同一性、至少约65%序列同一性、至少约70%序列同一性、至少约75%序列同一性、至少约80%序列同一性、至少约81%序列同一性、至少约82%序列同一性、至少约83%序列同一性、至少约84%序列同一性、至少约85%序列同一性、至少约86%序列同一性、至少约87%序列同一性、至少约88%序列同一性、至少约89%序列同一性、至少约90%序列同一性、至少约91%序列同一性、至少约92%序列同一性、至少约93%序列同一性、至少约94%同一性、至少约95%序列同一性、至少约96%序列同一性、至少约97%序列同一性、至少约98%序列同一性、至少约99%序列同一性(或更高)的氨基酸序列。在一些实施例中,本文提供的至少两种(CRISPR)相关转座酶蛋白包含与选自SEQ ID NO:2-4的至少一个序列或其功能片段具有至少约50%序列同一性、至少约55%序列同一性、至少约60%序列同一性、至少约65%序列同一性、至少约70%序列同一性、至少约75%序列同一性、至少约80%序列同一性、至少约81%序列同一性、至少约82%序列同一性、至少约83%序列同一性、至少约84%序列同一性、至少约85%序列同一性、至少约86%序列同一性、至少约87%序列同一性、至少约88%序列同一性、至少约89%序列同一性、至少约90%序列同一性、至少约91%序列同一性、至少约92%序列同一性、至少约93%序列同一性、至少约94%同一性、至少约95%序列同一性、至少约96%序列同一性、至少约97%序列同一性、至少约98%序列同一性、至少约99%序列同一性(或更高)的氨基酸序列。在一些实施例中,本文提供的至少三种(CRISPR)相关转座酶蛋白包含与选自SEQ ID NO:2-4的至少一个序列或其功能片段具有至少约50%序列同一性、至少约55%序列同一性、至少约60%序列同一性、至少约65%序列同一性、至少约70%序列同一性、至少约75%序列同一性、至少约80%序列同一性、至少约81%序列同一性、至少约82%序列同一性、至少约83%序列同一性、至少约84%序列同一性、至少约85%序列同一性、至少约86%序列同一性、至少约87%序列同一性、至少约88%序列同一性、至少约89%序列同一性、至少约90%序列同一性、至少约91%序列同一性、至少约92%序列同一性、至少约93%序列同一性、至少约94%同一性、至少约95%序列同一性、至少约96%序列同一性、至少约97%序列同一性、至少约98%序列同一性、至少约99%序列同一性(或更高)的氨基酸序列。在某些优选的实施例中,本文所述的组合物和系统包含选自TniA蛋白、TniB蛋白和TniQ蛋白或其功能片段的至少一种蛋白。在其他优选的实施例中,本文所述的组合物和系统包含选自TniA蛋白、TniB蛋白和TniQ蛋白或其功能片段的至少两种蛋白。在其他优选的实施例中,本文所述的组合物和系统包含TniA蛋白、TniB蛋白和TniQ蛋白或其功能片段。
在某些实施例中,本文所述的至少一种CRISPR相关转座酶蛋白可提供包括但不限于靶切割和多核苷酸插入的功能。在具体的实施例中,至少一种CRISPR相关转座酶蛋白不提供靶多核苷酸识别,但提供靶多核苷酸切割和供体多核苷酸插入靶序列中。在其他实施例中,本文提供的至少一种CRISPR相关转座酶蛋白与Cas蛋白/gRNA复合物形成复合物,该复合物将至少一种CRISPR相关转座酶蛋白引导到靶多核苷酸的靶序列,其中至少一种CRISPR相关转座酶蛋白在插入供体多核苷酸的靶多核苷酸中引入两个单链断裂。在某些实施例中,靶多核苷酸序列可以是单链或双链DNA。在一些实施例中,包含Cas蛋白/gRNA核糖核蛋白(RNP)复合物和至少一种CRISPR相关转座酶蛋白的复合物的形成导致供体多核苷酸插入靶多核苷酸的靶序列中或附近(例如,距其1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80个或更多个碱基对内)的一条或两条链中。在其他实施例中,包含Cas蛋白/gRNA RNP复合物和至少一种CRISPR相关转座酶蛋白的复合物的形成导致供体多核苷酸插入靶多核苷酸的靶序列中或附近(例如,1-10个碱基对、5-15个碱基对、10-20个碱基对、15-25个碱基对、20-30个碱基对、25-35个碱基对、30-40个碱基对、35-45个碱基对、45-60个碱基对、45-70个碱基对、45-80个碱基对或更多个碱基对内)的一条或两条链中。
本文所述的组合物和系统包含CRISPR-Cas系统和至少一种CRISPR相关转座酶蛋白。在一些实施例中,包含一种或多种转基因的重组核酸被整合在靶位点处。
B.Cas蛋白和指导RNA系统
本文所述的重组核酸组合物和重组核酸靶向系统包含CRISPR相关(Cas)蛋白(例如,Cas12k蛋白)或编码Cas蛋白的多核苷酸。在某些实施例中,Cas蛋白可充当重组核酸靶向系统的核苷酸结合组分。在某些实施例中,至少一种CRISPR相关转座酶蛋白与CRISPR相关(Cas)蛋白缔合或形成复合物。在优选的实施例中,CRISPR相关(Cas)蛋白将至少一种CRISPR相关转座酶蛋白引导到靶多核苷酸的靶序列,其中至少一种CRISPR相关转座酶蛋白促进供体多核苷酸的有效负载序列插入靶多核苷酸的靶序列中。
在某些其他实施例中,本文所述的重组核酸组合物和重组核酸靶向系统包含CRISPR相关(Cas)蛋白(例如,Cas12k蛋白)或编码Cas蛋白的多核苷酸和能够与靶多核苷酸的靶序列杂交的指导RNA(gRNA)。在优选的实施例中,gRNA能够与Cas蛋白质复合以形成gRNA-Cas蛋白复合物。在某些其他实施例中,Cas蛋白和gRNA包含CRISPR-Cas系统的基本单元。在其他实施例中,指导RNA包含一个或多个长度为大约60-80nt的小干扰CRISPR RNA(crRNA),它们中的每一个与反式激活CRISPR RNA(tracrRNA)缔合以将Cas蛋白(例如,Cas12k)引导到靶序列。所得CRISPR/Cas效应子复合物识别并结合靶序列(例如,DNA)中称为原型间隔子的同源双链DNA序列。在一些实施例中,切割的先决条件是靶序列下游存在保守的原型间隔子相邻基序(PAM)。在某些实施例中,PAM包含核苷酸序列5'-GTN-3'、5'-NGTN-3'或5'-GGTN-3'。在某些实施例中,PAM包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTT-3'、5'-GTA-3'、5'-GTC-3'或5'-GTG-3'。在某些实施例中,PAM包含5'-GGTA-3'、5'-GGTC-3'或5'-GGTG-3'。
本领域技术人员普遍认可的CRISPR-Cas系统有两类,称为1类和2类。1类和2类被认为包含多组分或单组分Cas蛋白。在本披露的一个方面,用于切割或结合靶多核苷酸的靶序列的优选系统是2类V型CRISPR-Cas系统的Cas蛋白(V型Cas蛋白)。在一些实施例中,V型Cas蛋白是V-K型Cas蛋白。在其他优选的实施例中,V-K型Cas蛋白是Cas12k蛋白。在一些实施例中,Cas12k蛋白包含如SEQ ID NO:1中所示的氨基酸序列。
在一些实施例中,本文所述的重组核酸包含编码CRISPR相关(Cas)蛋白的核酸序列,该CRISPR相关(Cas)蛋白包含与如SEQ ID NO:1中所示的氨基酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、具有至少约80%序列同一性、至少约81%序列同一性、至少约82%序列同一性、至少约83%序列同一性、至少约84%序列同一性、至少约85%序列同一性、至少约86%序列同一性、至少约87%序列同一性、至少约88%序列同一性、至少约89%序列同一性、至少约90%序列同一性、至少约91%序列同一性、至少约92%序列同一性、至少约93%序列同一性、至少约94%同一性、至少约95%序列同一性、至少约96%序列同一性、至少约97%序列同一性、至少约98%序列同一性、至少约99%序列同一性(或更高)的氨基酸序列。在某些其他实施例中,本文所述的重组核酸包含编码Cas蛋白的多核苷酸,其中Cas蛋白包含与如SEQ ID NO:1中所示的Cas12k蛋白的氨基酸序列具有约100%序列同一性的氨基酸序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数来人工确定两个序列(例如,核酸或氨基酸序列)之间的同一性百分比。两个核酸序列基本上相同的一个指示是两个核酸分子在严格条件下(例如,在中等至高度严格的范围内)彼此杂交。
在一些实施例中,本文所述的重组核酸靶向系统包含CRISPR相关(Cas)蛋白或编码Cas蛋白的多核苷酸,该Cas蛋白包含与SEQ ID NO:1中所示的氨基酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、具有至少约80%序列同一性、至少约81%序列同一性、至少约82%序列同一性、至少约83%序列同一性、至少约84%序列同一性、至少约85%序列同一性、至少约86%序列同一性、至少约87%序列同一性、至少约88%序列同一性、至少约89%序列同一性、至少约90%序列同一性、至少约91%序列同一性、至少约92%序列同一性、至少约93%序列同一性、至少约94%同一性、至少约95%序列同一性、至少约96%序列同一性、至少约97%序列同一性、至少约98%序列同一性、至少约99%序列同一性(或更高)的氨基酸序列。在某些其他实施例中,本文所述的重组核酸靶向系统包含CRISPR相关(Cas)蛋白或编码Cas蛋白的多核苷酸,该Cas蛋白包含与SEQ ID NO:1中所示的Cas12k蛋白的氨基酸序列具有约100%序列同一性的氨基酸序列。两个多肽基本上相同的一个指示是第一多肽与第二多肽免疫交叉反应。通常,因保守氨基酸取代而不同的多肽具有免疫交叉反应性。因此,多肽与第二多肽基本上相同,例如,其中两个肽仅因保守氨基酸取代或两个或更多个保守氨基酸取代而不同。
在一些实施例中,重组核酸靶向系统包含一种或多种纯化的蛋白组分。例如,系统可包括纯化的TniA蛋白、纯化的TniB蛋白、纯化的TniQ蛋白和纯化的Cas蛋白(例如,Cas12k蛋白)中的一种或多种。系统中的蛋白质可以通过本领域已知的方法进行纯化。在某些实施例中,蛋白组分可包括有助于表达、折叠、稳定性、分离、检测等的标签。在一些实施例中,标签位于蛋白质的C末端。在其他实施例中,标签位于蛋白质的N末端。在其他实施例中,标签位于蛋白质内的内部位置。本文所披露的蛋白质可以通过本领域已知的功能性蛋白质标签进行标记。例如,可以使用N末端His-SUMO标签。
在一些实施例中,使用一种或多种测定法来分析本文所述的Cas蛋白(例如,Cas12k蛋白)的生物化学。在一些实施例中,使用与指导RNA(例如,sgRNA)和靶多核苷酸(例如,DNA分子)一起孵育的纯化Cas蛋白体外分析本披露的Cas蛋白的生物化学特性,如实例1和2中所述。
在某些其他实施例中,本文所述的重组核酸和重组核酸靶向系统包含能够与Cas蛋白杂交以形成gRNA-Cas蛋白复合物的指导RNA(gRNA)。例如,在一些实施例中,本文提供的重组核酸和重组核酸靶向系统包含编码指导RNA的多核苷酸。在另一个实施例中,本文提供的重组核酸和重组核酸靶向系统包含编码一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种或十种或更多种指导RNA的一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种或十种或更多种多核苷酸。在一些实施例中,本文提供的编码指导RNA的多核苷酸可操作地连接到启动子。在某些其他实施例中,本文提供的编码指导RNA的多核苷酸可操作地连接到U6 snRNA启动子。在又一个实施例中,本文提供的编码指导RNA的多核苷酸可操作地连接到J23119启动子。在其他实施例中,编码本文提供的指导RNA的多核苷酸可操作地连接到如WO 20150131101中所述的U6 snRNA启动子,该文献通过援引并入本文。在另一个实施例中,本文提供的指导RNA是分离的RNA。在某些其他实施例中,本文提供的指导RNA在载体、质粒或细菌载体中编码。在优选的实施例中,gRNA包含CRISPR/Cas系统相关RNA(crRNA)序列和反式激活CRISPR/Cas系统RNA(tracrRNA)序列。在本文提供的某些其他实施例中,本文提供的指导RNA包含crRNA。在其他实施例中,本文提供的指导RNA包含tracrRNA。在又一个实施例中,本文提供的指导RNA包含单链指导RNA(sgRNA)。在具体的实施例中,本文提供的单链指导RNA包含crRNA和tracrRNA两者。在其他实施例中,本文提供的指导RNA包含反式激活CRISPR RNA(tracrRNA)序列,或来自CRISPR基因座的其他序列和转录物。在一些实施例中,本文提供的指导RNA不包含tracrRNA。
在一些实施例中,gRNA能够与Cas蛋白复合,并指导gRNA-Cas蛋白复合物与靶核酸序列进行序列特异性结合。在一些实施例中,gRNA能够与Cas蛋白质复合以形成gRNA-Cas蛋白复合物。在某些优选的实施例中,gRNA将如本文所述的Cas蛋白(例如,Cas12k蛋白)引导到靶多核苷酸的特定靶序列。本领域技术人员将理解,在一些实施例中,gRNA序列是位点特异性的。即,在一些实施例中,gRNA与一个或多个靶核酸序列(例如,特异性DNA或基因组DNA序列)特异性缔合,而不与非靶序列(例如,非特异性DNA或随机序列)特异性缔合。
在一些实施例中,如本文所述的组合物包含与本文所述的Cas蛋白(例如,Cas12k)缔合并将Cas蛋白引导到靶多核苷酸的靶序列(例如,DNA)的gRNA。gRNA可与靶序列缔合并改变Cas蛋白和/或至少一种CRISPR相关转座酶蛋白的功能性(例如,改变Cas12k的亲和力,例如改变至少约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或更多)。
本文所述的gRNA可靶向(例如,缔合、被引导到、接触或结合)靶序列的一个或多个核苷酸。在一些实施例中,本文所述的CRISPR相关转座酶的转座酶活性在形成Cas蛋白/gRNA RNP复合物时被激活。
在一些实施例中,gRNA包含间隔子序列。在一些实施例中,gRNA的间隔子序列通常可被设计成具有16-25个核苷酸(例如,16、17、18、19、20、21、22、23、24或25个核苷酸)的长度并且与特定核酸序列互补。在一些实施例中,gRNA的间隔子序列通常可被设计成具有至多约35个核苷酸(例如,26、27、28、29、30、31、32、33、34或35个核苷酸)的长度并且与特定核酸序列互补。在一些特定的实施例中,gRNA可被设计成与例如基因组基因座的特定DNA链互补。在一些实施例中,间隔子序列被设计成与例如特定基因组基因座的特定DNA链互补。
在某些实施方式中,gRNA包括或包含连接到序列或间隔子序列的同向重复序列。在一些实施例中,gRNA包括同向重复序列和间隔子序列或同向重复-间隔子-同向重复序列。在某些实施例中,gRNA包括截短的同向重复序列和间隔子序列,它是加工或成熟的crRNA的典型。在其他实施例中,Cas蛋白与gRNA形成复合物,并且gRNA引导复合物与同gRNA序列的至少一部分互补的位点特异性靶核酸缔合。
在一些实施例中,gRNA包含与靶序列具有至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%互补性的序列,例如RNA序列。在其他实施例中,gRNA包含与DNA序列至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%互补的序列。在另一个实施例中,gRNA包含与基因组序列至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%互补的序列。在其他实施例中,gRNA包含与SEQ ID NO:5中所示的序列互补的序列或与SEQ IDNO:5中所示的序列具有至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%互补性的序列。在一些实施例中,gRNA包含如SEQ ID NO:5中所示的序列。
在一些实施例中,本文所述的CRISPR-Cas系统包括一个或多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)gRNA序列。在一些实施例中,gRNA具有类似于例如国际公布号WO 2014/093622和WO 2015/070083的结构,这些文献中的每一篇的全部内容通过援引并入本文。
在一些实施例中,如本文所述的Cas蛋白和gRNA形成复合物(例如,核糖核蛋白(RNP))。在一些实施例中,复合物包括其他组分(例如,至少一种CRISPR相关转座酶蛋白)。在一些实施例中,复合物在结合与gRNA中的序列具有互补性的靶序列时被激活。在一些实施例中,靶多核苷酸是双链DNA(dsDNA)。在一些实施例中,靶多核苷酸是单链DNA(ssDNA)。在其他实施例中,序列特异性需要gRNA中的序列与靶序列完全匹配。在其他实施例中,序列特异性需要gRNA中的序列与靶序列部分(连续或非连续)匹配。在一些实施例中,复合物在结合靶序列时被激活。
在某些其他实施例中,本文所述的Cas蛋白(例如,Cas12k蛋白)在由gRNA与靶多核苷酸之间的互补性区域限定的序列处结合靶序列。在一些实施例中,由本文所述的Cas蛋白识别的原型间隔子相邻基序(PAM)序列直接位于靶多核苷酸的靶序列上游(例如,直接位于靶序列的5')。在一些实施例中,由本文所述的Cas蛋白识别的PAM序列直接位于靶多核苷酸的非互补链(例如,非靶链)的5'。在本文描述的某些实施例中,Cas蛋白靶向与PAM相邻的序列,其中PAM包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTN-3'、5'-NGTN-3'或5'-GGTN-3'。在某些实施例中,PAM包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTT-3'、5'-GTA-3'、5'-GTC-3'或5'-GTG-3'。在某些实施例中,PAM包含5'-GGTA-3'、5'-GGTC-3'或5'-GGTG-3'。如本文所用,“互补链”与RNA指导物杂交。如本文所用,“非互补链”不直接与RNA杂交。
在某些实施例中,靶序列插入靶多肽中发生在Cas结合位点。在其他实施例中,插入发生在核酸分子上Cas结合位点远端的位置。在一些实施例中,插入可以发生在Cas结合位点的3'侧上的位置,例如Cas结合位点的3'侧上的至少约1个碱基对(bp)、至少约5bp、至少约10bp、至少约15bp、至少约20bp、至少约35bp、至少约40bp、至少约45bp、至少约50bp、至少约55bp、至少约60bp、至少约65bp、至少约70bp、至少约75bp、至少约80bp、至少约85bp、至少约90bp、至少约95bp或至少约100bp。
在一些实施例中,Cas蛋白/gRNA的结合阻断一种或多种内源细胞分子或途径接近靶序列,从而修饰靶序列。例如,Cas蛋白/gRNA的结合可阻断内源转录或翻译机制,从而降低靶核酸的表达。可以进一步对编码本文所述的Cas蛋白的核酸分子进行密码子优化。可以对核酸进行密码子优化以用于特定宿主细胞,诸如细菌细胞。
在一些实施例中,本披露提供了一种重组核酸靶向系统,该重组核酸靶向系统包含CRISPR相关转座酶蛋白(例如,TniA、TniB和TniQ)、Cas12k和指导RNA(gRNA)中的至少一种。在其他实施例中,本披露提供了一种重组核酸靶向系统,该重组核酸靶向系统包含CRISPR相关转座酶蛋白(例如,TniA、TniB和TniQ)和Cas12k和指导RNA(gRNA)中的至少两种。在某些其他实施例中,本披露提供了一种重组核酸靶向系统,该重组核酸靶向系统包含TniA、TniB、TniQ、Cas12k和指导RNA(gRNA)。本披露还提供了用于靶序列的序列特异性修饰的重组核酸靶向系统。在一些实施例中,在细菌细胞中分析本披露的CRISPR相关转座酶系统的生物化学特性,如实例1中所述。
C.重组核酸组合物和重组核酸靶向系统
本文所述的重组核酸组合物和重组核酸靶向系统包含CRISPR相关(Cas)蛋白(例如,Cas12k蛋白)或编码Cas蛋白的多核苷酸,以及至少一种CRISPR相关转座酶蛋白,或编码至少一种CRISPR相关转座酶蛋白的多核苷酸。例如,在一些实施例中,本文所述的重组核酸组合物和重组核酸靶向系统包含Cas蛋白、TniA、TniB和TniQ。在某些实施例中,本文所述的重组核酸组合物和重组核酸靶向系统包含Cas蛋白、TniA、TniB和TniQ,其中Cas蛋白、TniA蛋白、TniB蛋白和TniQ蛋白的蛋白序列中的一者包含分别与SEQ ID NO:1、2、3和4中所示的Cas蛋白、TniA蛋白、TniB蛋白和TniQ蛋白的氨基酸序列至少95%相同的氨基酸序列。
在某些其他实施例中,本文所述的重组核酸靶向系统包含Cas蛋白(例如,Cas12k蛋白)、TniA、TniB和TniQ中的一种或多种,并且进一步包含至少一种编码转座子左端(TE-L)的核酸序列和编码转座子右端(TE-R)的核酸序列。在一些实施例中,本文所述的重组核酸靶向系统包含TniA以及TE-L和TE-R。在一些实施例中,优选的TE-L和TE-R由重组核酸靶向系统的TniA确定。例如,在一些实施例中,重组核酸靶向系统包含如SEQ ID NO:2中所述的TniA(即,包含与SEQ ID NO:2具有至少约80%序列同一性、至少约85%序列同一性、至少约90%序列同一性、至少约95%序列同一性、至少约99%序列同一性或约100%序列同一性的氨基酸序列的TniA)、TE-L(即,包含与SEQ ID NO:6具有至少约80%序列同一性、至少约85%序列同一性、至少约90%序列同一性、至少约95%序列同一性、至少约99%序列同一性或约100%序列同一性的核苷酸序列的TE-L)和TE-R(即,包含与SEQ ID NO:7具有至少约80%序列同一性、至少约85%序列同一性、至少约90%序列同一性、至少约95%序列同一性、至少约99%序列同一性或约100%序列同一性的核苷酸序列的TE-R)。在某些实施例中,本文所述的重组核酸靶向系统包含TniA和供体多核苷酸,其中供体多核苷酸包含用于插入靶序列中的有效负载序列、与SEQ ID NO:6中所示的核酸序列至少95%相同的TE-L核酸序列和与SEQ ID NO:7中所示的核酸序列至少95%相同的TE-R核酸序列。
D.靶多核苷酸
本文所述的重组核酸靶向系统可进一步包含靶多核苷酸,该靶多核苷酸包含能够与gRNA杂交的靶序列。靶多核苷酸可以是插入转座元件的靶位点的等效物。在本文所述的重组核酸靶向系统的某些实施例中,靶多核苷酸包含原型间隔子相邻基序(PAM)序列和能够与gRNA杂交的靶序列。如本文所述,“靶序列”是指gRNA序列与其具有(或被设计成具有)互补性的序列。gRNA中靶序列与其互补序列之间的杂交促进Cas/gRNA/靶序列复合物的形成。在其他实施例中,本文提供的靶多核苷酸可操作地连接到启动子。在其他实施例中,本文所述的靶多核苷酸至少包含PAM序列,该PAM序列具有包含5'-GGTT-3'的核苷酸序列。在某些实施例中,PAM包含核苷酸序列5'-GTN-3'、5'-NGTN-3'或5'-GGTN-3'。在某些实施例中,PAM包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTT-3'、5'-GTA-3'、5'-GTC-3'或5'-GTG-3'。在某些实施例中,PAM包含5'-GGTA-3'、5'-GGTC-3'或5'-GGTG-3'。在一些实施例中,PAM可以是5'PAM序列(即,位于原型间隔子的5'端上游)。靶多核苷酸序列可包含单链或双链DNA。在一些实施例中,包含CRISPR相关(Cas)蛋白、gRNA和CRISPR相关转座酶蛋白的复合物的形成导致供体多核苷酸插入靶多核苷酸的靶序列中或附近(例如,距其约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约20、约50、55、60、65、70、75、80个或更多个碱基对内)的一条或两条链中。在其他实施例中,包含Cas蛋白/gRNA RNP复合物和至少一种CRISPR相关转座酶蛋白的复合物的形成导致供体多核苷酸插入靶多核苷酸的靶序列中或附近(例如,1-10个碱基对、5-15个碱基对、10-20个碱基对、15-25个碱基对、20-30个碱基对、25-35个碱基对、30-40个碱基对、35-45个碱基对、45-60个碱基对、45-70个碱基对、45-80个碱基对或更多个碱基对内)的一条或两条链中。
E.供体多核苷酸
本文所述的重组核酸靶向系统可进一步包含供体多核苷酸,该供体多核苷酸包含用于插入靶多核苷酸中的有效负载序列。供体多核苷酸可以是能够被整合到靶序列中的转座元件的等效物。供体多核苷酸可以是包括有效负载序列的任何类型的多核苷酸,例如基因、基因片段、非编码多核苷酸、调节多核苷酸、合成多核苷酸以及它们的片段或组分。更具体地,如本文所述的术语“供体多核苷酸”是指包括能够使用如本文所述的CRISPR相关转座酶或方法插入靶核酸中的有效负载序列的多核苷酸分子。在一些实施例中,本文提供的有效负载序列可操作地连接到启动子。在一些实施例中,供体多核苷酸包含编码转座子左端(TE-L)的核酸序列和编码转座子右端(TE-R)的核酸序列。如本文所用的术语“转座子末端序列”是指与CRISPR相关转座酶蛋白形成功能性(如使用体外或体内转座反应所确定)复合物所必需的核苷酸序列。TE-R和TE-L序列通常作为反向重复序列(由CRISPR相关转座酶蛋白识别的特征)侧接供体多肽的有效负载序列,这促进有效负载序列插入靶多核苷酸的靶序列中。在一些实施例中,TE-L包含SEQ ID NO:6中所示的核酸,并且TE-R包含SEQ ID NO:7中所示的核酸。
在某些其他实施例中,经由共整合机制将供体多核苷酸的有效负载序列插入靶多核苷酸中。例如,供体多核苷酸和靶多核苷酸可以是有切口的和融合的。融合的供体多核苷酸和靶多核苷酸的复制品可通过聚合酶产生。在其他实施例中,经由切割和粘贴机制将供体多核苷酸插入靶多核苷酸中。例如,供体多核苷酸可包含在核酸分子中,并且可将其切除并插入核酸分子中的另一位置。
F.载体
本披露提供了一种或多种载体,这些载体包含本文所述的重组核酸和/或重组核酸靶向系统。在一些实施例中,本披露提供了用于表达本文所述的重组核酸或重组核酸靶向系统的一种或多种载体。本文提供的载体也用于修饰如本文所述的靶多核苷酸的方法中。在一个实施例中,本文提供的载体包括可操作地连接到第一多核苷酸的第一启动子,该第一多核苷酸编码至少一种CRISPR相关转座酶蛋白或其功能片段以及Cas蛋白(例如,Cas12k蛋白)。在上述实施例中,载体还包括可操作地连接到第二多核苷酸的第二启动子,该第二多核苷酸编码指导RNA(gRNA)。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个自由端、不包含自由端(例如,环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的其他多核苷酸变种。在一些实施例中,本文所述的载体是质粒。如本文所用的术语“质粒”是指环状双链DNA环,可以使用例如标准分子克隆技术将另外的DNA片段插入其中。在本文所述的某些实施例中,载体是能够指导与它们可操作地连接的基因表达的“表达载体”。典型的表达载体(包括本文所述的某些载体)包括可用于表达所需多核苷酸的转录和翻译终止子、起始序列和启动子。天然或合成多核苷酸的表达通常通过将编码天然或合成多核苷酸的多核苷酸可操作地连接到启动子并将构建体并入表达载体中来实现。在一个特定的实施例中,一种或多种感兴趣的基因(例如,编码TniA、TniB、TniQ、Cas12k的一种或多种多核苷酸)的表达通常通过将编码一种或多种感兴趣的基因的一种或多种多核苷酸(例如,编码TniA、TniB、TniQ、Cas12k的一种或多种多核苷酸)可操作地连接到启动子并将构建体并入表达载体(参见例如本文所述的pEffector质粒A2)中来实现。
在特定的实施例中,本文所述的组合物和系统的组分中的一种或多种在表达质粒上表达。在一个特定的实施例中,本披露提供了如图1A中所示的pEffector质粒A2。在另一个实施例中,pEffector质粒A2包含编码Cas12k蛋白、TniA蛋白、TniB蛋白和TniQ蛋白的氨基酸序列的多核苷酸。在又一个实施例中,pEffector质粒A2包含编码如表1中所示的Cas12k蛋白(SEQ ID NO:1)、TniA蛋白(SEQ ID NO:2)、TniB蛋白(SEQ ID NO:3)和TniQ蛋白(SEQ ID NO:4)的氨基酸序列和氨苄青霉素抗性蛋白(AmpR)的多核苷酸。
在其他实施例中,pEffector质粒进一步包含编码gRNA的多核苷酸。在一个实施例中,gRNA包含编码crRNA的多核苷酸。在另一个实施例中,gRNA包含编码tracrRNA的多核苷酸。在又一个实施例中,gRNA包含单指导RNA(sgRNA)序列,该sgRNA序列包含编码crRNA的多核苷酸、编码tracrRNA的多核苷酸和间隔子序列。在特定的实施例中,sgRNA序列包含如表1中所示的SEQ ID NO:5中所示的核苷酸序列。SEQ ID NO:5中的间隔子序列表示为N。
在其他实施例中,本披露提供了一种包含有效负载序列的pDonor质粒。在一个特定的实施例中,本披露提供了如图1B中所示的pDonor质粒B2,该质粒包含有效负载序列和卡那霉素抗性蛋白的编码区,并且进一步包含左(TE-L)和右(TE-R)转座子末端的序列。在特定的实施例中,TE-L包含如SEQ ID NO:6(表1)中所示的核酸序列。在特定的实施例中,TE-R包含如SEQ ID NO:7(表1)中所示的核酸序列。
在其他实施例中,本披露提供了一种包含靶序列的pTarget质粒。在一个特定的实施例中,本披露提供了如图1C所示的pTarget质粒C2,该质粒包含靶序列和原型间隔子相邻基序(PAM)序列。在另一个实施例中,PAM序列包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTN-3'、5'-NGTN-3'或5'-GGTN-3'。在某些实施例中,PAM包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTT-3'、5'-GTA-3'、5'-GTC-3'或5'-GTG-3'。在某些实施例中,PAM包含5'-GGTA-3'、5'-GGTC-3'或5'-GGTG-3'。
在一些实施例中,本披露提供了一种细胞,该细胞包含本文所述的重组核酸和/或重组核酸靶向系统。在一些实施例中,细胞是原核细胞。在某些实施例中,细胞是细菌细胞或衍生自细菌细胞的细胞。在其他实施例中,将用于表达本文所述的重组核酸和/或重组核酸靶向系统的一种或多种核酸、质粒和/或载体引入细菌细胞中。在另一个实施例中,将本文提供的核酸、质粒和/或载体转化到细菌细胞中。可以适当地选择通常适于在细菌细胞中表达的核酸、质粒和/或载体。用于引入本文所述的一种或多种核酸、质粒和/或载体的技术包括但不限于热休克和电穿孔,并且是本领域技术人员熟知的技术。在一些实施例中,细菌细胞是大肠杆菌细胞。在一些实施例中,大肠杆菌细胞是pir-116D菌株(例如,PIR1)。在一个实施例中,将pEffector质粒A2引入细菌细胞中。在另一个实施例中,将pDonor质粒B2引入细菌细胞中。在又一个实施例中,将pTarget质粒C2引入细菌细胞中。在优选的实施例中,将pEffector质粒A2、pDonor质粒B2和pTarget质粒C2引入同一细菌细胞中。在另一个实施例中,将pEffector质粒A2、pDonor质粒B2和pTarget质粒C2同时引入同一细菌细胞中。在另一个实施例中,将pEffector质粒A2、pDonor质粒B2和pTarget质粒C2依次引入同一细菌细胞中。
在一些实施例中,本文提供的核酸、质粒和/或载体进一步包含选择标记基因和/或报告基因以促进包含核酸、质粒和/或载体的细胞的鉴定和选择。选择标记和报告基因都可侧接有适当的转录控制序列以能够在细胞中表达。合适的选择标记的实例包括编码适当的抗生素抗性蛋白(例如,氨苄青霉素抗性蛋白、卡那霉素抗性蛋白等)的核酸序列。通过使用这种选择标记,可以通过在存在抗生素的条件下的细胞存活来证实包含本文所述的重组核酸和/或重组核酸靶向系统的核酸、质粒和/或载体的成功并入。合适的报告基因的实例包括编码荧光蛋白(例如,绿色荧光蛋白(GFP)等)的核酸序列。通过使用这种报告基因,可以通过观察荧光蛋白的表达来证实本文所述的核酸、质粒和/或载体的成功并入。
G.用于修饰靶多核苷酸的方法
本披露还提供了用于修饰细菌细胞中的靶多核苷酸的方法,这些方法包括向细菌细胞中引入以下项:第一重组核酸,该第一重组核酸包含至少一种CRISPR相关转座酶蛋白或编码至少一种CRISPR相关转座酶蛋白的多核苷酸、Cas蛋白(例如,Cas12k蛋白)或编码Cas蛋白的多核苷酸和指导RNA(gRNA)或编码gRNA的多核苷酸;包含靶多核苷酸的第二重组核酸;以及包含供体多核苷酸的第三重组核酸。
可通过转化包含编码本文所述的重组核酸的核酸序列的一种或多种递送多核苷酸(例如,质粒)将本文所述的重组核酸引入细菌细胞或细菌细胞群体中。编码本文所述的重组核酸的核酸序列可由它们可操作地连接到一个或多个调节序列(例如,启动子)的核酸序列表达,这些调节序列控制蛋白质和核酸在细菌细胞或细菌细胞群体中的表达。本文所述的重组核酸可在相同的递送多核苷酸上、单独的递送多核苷酸上或它们的组合上编码。在一些实施例中,递送多核苷酸可以是载体。在其他实施例中,递送多核苷酸是质粒。在其他实施例中,递送多核苷酸是质粒或是载体和质粒的组合。本文描述了示例性载体和质粒。
在某些实施例中,本披露提供了一种用于修饰细菌细胞中的靶多核苷酸的方法,该方法包括引入编码至少一种CRISPR相关转座酶蛋白的重组核酸,其中编码至少一种CRISPR相关转座酶蛋白的重组核酸可操作地连接到至少一种异源启动子(例如,T7启动子)。在一些实施例中,至少一种CRISPR相关转座酶蛋白通过在细菌细胞中表达编码可操作地连接到至少一种异源启动子(例如,T7启动子)的至少一种CRISPR相关转座酶蛋白的重组DNA分子来提供。在其他实施例中,至少一种CRISPR相关转座酶蛋白通过向细菌细胞中转化包含编码可操作地连接到至少一种异源启动子(例如,T7启动子)的至少一种CRISPR相关转座酶蛋白的DNA分子的质粒来提供。在某些其他实施例中,至少一种CRISPR相关转座酶蛋白通过向细菌细胞中引入包含编码至少一种CRISPR相关转座酶蛋白的RNA分子的组合物来提供。
在一些实施例中,本文提供的用于修饰细菌细胞中的靶多核苷酸的方法包括向细菌细胞中引入编码至少一种CRISPR相关转座酶蛋白的重组核酸,该CRISPR相关转座酶蛋白选自由TniA蛋白、TniB蛋白和TniQ蛋白组成的组。在其他实施例中,本文提供的方法包括向细菌细胞中引入编码至少两种CRISPR相关转座酶蛋白的多核苷酸,这些CRISPR相关转座酶蛋白选自由TniA蛋白、TniB蛋白和TniQ蛋白组成的组。在又一个实施例中,本文提供的方法包括向细菌细胞中引入编码三种CRISPR相关转座酶蛋白的多核苷酸,这些CRISPR相关转座酶蛋白选自由TniA蛋白、TniB蛋白和TniQ蛋白组成的组。在一些实施例中,本文提供的方法包括向细菌细胞中引入编码CRISPR相关转座酶蛋白的多核苷酸,该CRISPR相关转座酶蛋白包含与包含如SEQ ID NO:2中所示的氨基酸序列的TniA蛋白具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%或至少约99.5%或更高氨基酸序列同一性的氨基酸序列。在其他实施例中,本文提供的方法包括向细菌细胞中引入编码CRISPR相关转座酶蛋白的多核苷酸,该CRISPR相关转座酶蛋白包含与包含如SEQ ID NO:2中所示的氨基酸序列的TniA蛋白约100%相同的氨基酸序列。在某些其他实施例中,本文提供的方法包括向细菌细胞中引入编码CRISPR相关转座酶蛋白的多核苷酸,该CRISPR相关转座酶蛋白包含与包含如SEQ ID NO:3中所示的氨基酸序列的TniB蛋白具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或至少约99.5%或更高氨基酸序列同一性的氨基酸序列。在另一个实施例中,本文提供的方法包括向细菌细胞中引入编码CRISPR相关转座酶蛋白的多核苷酸,该CRISPR相关转座酶蛋白包含与包含如SEQ ID NO:3中所示的氨基酸序列的TniB蛋白具有约100%相同的氨基酸序列。在某些其他实施例中,本文提供的方法包括向细菌细胞中引入编码CRISPR相关转座酶蛋白的多核苷酸,该CRISPR相关转座酶蛋白包含与包含如SEQ ID NO:4中所示的氨基酸序列的TniQ蛋白具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或至少约99.5%或更高氨基酸序列同一性的氨基酸序列。在其他实施例中,本文提供的方法包括向细菌细胞中引入编码CRISPR相关转座酶蛋白的多核苷酸,该CRISPR相关转座酶蛋白包含与包含如SEQ ID NO:4中所示的氨基酸序列的TniQ蛋白约100%相同的氨基酸序列。
在某些实施例中,本披露提供了一种用于修饰细菌细胞中的靶多核苷酸的方法,该方法进一步包括向细菌细胞中引入编码至少一种CRISPR相关转座酶蛋白和Cas蛋白(例如,Cas12k)的重组核酸,其中编码至少一种CRISPR相关转座酶蛋白和Cas蛋白的重组核酸可操作地连接到至少一种异源启动子(例如,T7启动子)。在一些实施例中,至少一种CRISPR相关转座酶和Cas蛋白通过在细菌细胞中表达各自独立地可操作地连接到至少一种异源启动子的编码至少一种CRISPR相关转座酶的重组DNA分子和编码Cas蛋白的重组DNA分子来提供。在一些实施例中,本文提供的方法包括向细菌细胞中引入编码Cas蛋白的重组核酸,该Cas蛋白包含与如SEQ ID NO:1中所示的Cas12k蛋白的氨基酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%或更高序列同一性的氨基酸序列。在某些其他实施例中,本文提供的方法包括向细菌细胞中引入编码Cas蛋白的重组核酸,该Cas蛋白包含与包含如SEQ ID NO:1中所示的氨基酸序列的Cas12k蛋白的氨基酸序列具有约100%序列同一性的氨基酸序列。
在某些实施例中,本披露提供了一种用于修饰细菌细胞中的靶多核苷酸的方法,该方法包括向细菌细胞中引入编码至少一种CRISPR相关转座酶蛋白、Cas蛋白(例如,Cas12k)和指导RNA(gRNA)的重组核酸,其中编码至少一种CRISPR相关转座酶蛋白和Cas蛋白的重组核酸可操作地连接到异源启动子(例如,T7启动子),并且其中编码gRNA的重组核酸可操作地连接到不同的异源启动子(例如,J23119启动子)。在一些实施例中,本披露提供了一种用于向细菌细胞中引入在多于一种质粒上编码至少一种CRISPR相关转座酶蛋白、Cas蛋白(例如,Cas12k)和指导RNA(gRNA)的重组核酸的方法。在某些优选的实施例中,本披露提供了一种用于向细菌细胞中引入在单个质粒上包括编码至少一种CRISPR相关转座酶蛋白、Cas蛋白(例如,Cas12k)和指导RNA(gRNA)的重组核酸的方法。在特定的实施例中,至少一种CRISPR相关转座酶蛋白、Cas蛋白(例如,Cas12k)和指导RNA(gRNA)在如图1A中所示的单个质粒(pEffector质粒A2)上编码。在其他实施例中,将至少一种CRISPR相关转座酶蛋白、Cas蛋白(例如,Cas12k)和指导RNA(gRNA)作为预形成的核糖核蛋白(RNP)复合物引入细菌细胞中。在又一个实施例中,将Cas蛋白和指导RNA(gRNA)作为预形成的核糖核蛋白(RNP)复合物引入细菌细胞中,并且将至少一种CRISPR相关转座酶蛋白作为编码至少一种CRISPR相关转座酶蛋白的重组核酸引入细菌细胞中。
在一些实施例中,本文提供的方法包括向细菌细胞中引入编码gRNA序列的重组核酸,其中gRNA序列与靶多核苷酸的靶序列至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.5%或更多互补。在一些实施例中,gRNA包含与DNA序列至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.5%或更多互补的序列。在某些其他实施例中,gRNA包含与基因组序列至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.5%、至少约99.5%或更多或更多互补的序列。在一些实施例中,gRNA包含与SEQ ID NO:5中所示的序列互补的序列或与SEQ ID NO:5中所示的序列具有至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.5%或更多互补性的序列。在本文所述方法的一些实施例中,gRNA包含如SEQ ID NO:5中所示的序列。
在某些实施例中,该方法进一步包括向细菌细胞中引入包含靶多核苷酸的重组核酸,其中靶多核苷酸包含能够与gRNA杂交的靶序列,并且包含原型间隔子相邻基序(PAM)序列。在某些实施例中,靶序列可操作地连接到异源启动子(例如,cat启动子)。在其他实施例中,PAM序列是包含5'-GGTT-3'的核苷酸序列。在某些实施例中,PAM包含核苷酸序列5'-GTN-3'、5'-NGTN-3'或5'-GGTN-3'。在某些实施例中,PAM包含核苷酸序列5'-GGTT-3'。在某些实施例中,PAM包含核苷酸序列5'-GTT-3'、5'-GTA-3'、5'-GTC-3'或5'-GTG-3'。在某些实施例中,PAM包含5'-GGTA-3'、5'-GGTC-3'或5'-GGTG-3'。在另一个实施例中,本披露提供了一种用于修饰细菌细胞中的靶多核苷酸的方法,该方法包括使用单个质粒向细菌细胞中引入靶多肽。在特定的实施例中,单个质粒是如图1C中所示的pTarget质粒C2。
在某些实施例中,该方法进一步包括向细菌细胞中引入包含供体多核苷酸的重组核酸。在优选的实施例中,供体多核苷酸包含用于插入靶多核苷酸的靶序列中的有效负载序列。在另一个实施例中,有效负载序列可操作地连接到异源启动子。在一些实施例中,供体多核苷酸进一步包含编码转座子左端(TE-L)的核酸序列和编码转座子右端(TE-R)的核酸序列。在具体的实施例中,TE-L和TE-R序列与分别如SEQ ID NO:6和SEQ ID NO:7中所示的TE-L和TE-R的核酸序列至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或约99.5%或更多相同。在一些实施例中,TE-L具有如SEQ ID NO:6中所示的核酸,并且TE-R具有如SEQ ID NO:7中所示的核酸。在某些实施例中,本披露提供了一种用于修饰细菌细胞中的靶多核苷酸的方法,该方法包括使用单个质粒向细菌细胞中引入供体多肽。在特定的实施例中,单个质粒是如图1B中所示的pDonor质粒B2。
在一些实施例中,本文所述的方法包括通过向细菌细胞中引入以下项来修饰靶多核苷酸:第一重组核酸,该第一重组核酸包含(i)编码至少一种CRISPR相关转座酶蛋白的多核苷酸,(ii)编码CRISPR相关(Cas)蛋白的多核苷酸,以及(iii)编码指导RNA(gRNA)的多核苷酸;包含靶多核苷酸的第二重组核酸;以及包含如本文所述的供体多核苷酸的第三重组核酸。在一些实施例中,将第一重组核酸、第二重组核酸和第三重组核酸同时引入细菌细胞中。在某些其他实施例中,将第一重组核酸、第二重组核酸和第三重组核酸依次引入细菌细胞中。在又一个实施例中,本文所述的方法包括通过独立地向细菌细胞中引入上述第一重组核酸、第二重组核酸和第三重组核酸中的每一种来修饰靶多核苷酸。在某些其他实施例中,本文所述的方法包括通过向细菌细胞中引入如图1A中所示的pEffector质粒A2、如图1B中所示的pDonor质粒B2和如图1C中所示的pTarget质粒C2来修饰靶多核苷酸。在优选的实施例中,细菌细胞是大肠杆菌细胞。在其他实施例中,大肠杆菌细胞是来自pir-116D菌株(例如,PIR1)的细胞。在其他实施例中,将pEffector质粒A2、pDonor质粒B2和pTarget质粒C2同时引入同一细菌细胞中。在其他实施例中,将pEffector质粒A2、pDonor质粒B2和pTarget质粒C2依次引入同一细菌细胞中。本文披露的方法还提供了使用本领域技术人员已知的测序分析(例如,nextseq NGS测序)和/或生物信息学分析(例如,多序列比对)来鉴定引入靶多核苷酸的修饰和确定有效负载序列整合到靶多核苷酸中的%。
在一些实施例中,本文所述的方法包括以下方法:这些方法包括通过以下过程修饰靶多核苷酸:允许如本文所述的至少一种CRISPR相关转座酶蛋白、Cas蛋白(例如,Cas12k蛋白)和gRNA结合靶序列以促进供体多肽插入所述靶序列中,从而修饰靶序列。在另一个实施例中,本披露还提供了一种使用本文所述的重组核酸靶向系统来修复细菌细胞中的基因座的方法。在另一个实施例中,本披露提供了修饰细菌细胞中的靶多核苷酸(例如,DNA)的方法,其中该方法是体内方法、离体方法或体外方法。
本文引用的所有参考文献和出版物特此通过援引并入。
实例
提供以下实例以进一步说明本披露的某些实施例,但不旨在限制本披露的范围。应当理解,由于它们的示例性性质,可替代性地使用本领域技术人员已知的其他程序、方法或技术。
实例1-大肠杆菌中转座酶活性的测定
本实例描述了将CRISPR相关反式系统引入大肠杆菌中以测试转座酶活性。
将四种蛋白质Cas12k、TniA、TniB和TniQ中的每一种克隆到本文称为“pEffector质粒A2”的质粒中。pEffector质粒A2的示意图在图1A中示出,并且Cas12k、TniA、TniB和TniQ蛋白的氨基酸序列在表1中示出。pEffector质粒A2进一步包含含有靶向序列(例如,间隔子)的单指导RNA(sgRNA)序列。在SEQ ID NO:5的sgRNA序列中,间隔子序列表示为N。
表1.pEffector质粒A2的组分
/>
为了测试本文所述的重组核酸靶向系统的细菌活性,还克隆了包含测试有效负载和转座子末端的质粒(本文称为“pDonor质粒B2”)和包含指定靶序列的质粒(本文称为“pTarget质粒C2”)。pDonor质粒B2的示意图在图1B中示出,并且左端和右端的序列在表1中示出。pTarget质粒C2是含有与pEffector质粒A2中sgRNA的靶向序列匹配的特异性靶位点和上游GGTT序列的低拷贝细菌质粒(图1C)。将靶位点引入pTarget质粒C2中并合成为具有特异性靶序列的合成DNA序列,该特异性靶序列的任一侧侧接限制性酶位点,用于克隆到pTarget质粒C2中。
使用两个重叠的寡核苷酸对靶序列和sgRNA序列进行PCR扩增,并将其用作模板DNA。PCR扩增子被设计成使得感兴趣的序列任一侧侧接有两个独特的BsaI切割位点。对应位点存在于pEffector质粒A2和pTarget质粒C2中。然后在本文所述的位点处切割PCR扩增子和相关的pEffector质粒A2或pTarget质粒C2,并使用标准分子生物学克隆技术将其连接在一起。
通过热休克将连接的pEffector质粒A2和pTarget质粒C2转化到化学感受态细菌细胞系中,将其铺在含有羧苄青霉素(pEffector质粒A2的抗生素抗性标记)或氯霉素(pTarget质粒C2的抗生素抗性标记)的LB琼脂板上,并在37℃下孵育过夜。然后挑取单个菌落,使其在含有羧苄青霉素(pEffector)或氯霉素(pTarget)的2-5mL LB中生长约12-16小时,并使用可商购获得的试剂盒进行小量制备纯化。使用因美纳公司(Illumina)测序对纯化的质粒进行序列验证。
将pEffector质粒A2、pDonor质粒B2和pTarget质粒C2标准化至10ng/μL,然后将2μL(20ng)的每种质粒等量组合,然后在电感受态PIR1大肠杆菌(赛默飞世尔公司(ThermoFisher))中共转化。在37℃下振荡生长1小时后,将细胞铺在含有卡那霉素、羧苄青霉素和氯霉素的LB琼脂生物测定板上,并在37℃下孵育16小时。然后从板上收获细胞,并小量制备纯化质粒DNA。
将小量制备纯化的质粒DNA标准化至大约1ng/ul,并使用Nextera XT DNA文库制备试剂盒(因美纳公司)按照相关的标记和PCR方案进行制备用于测序。PCR后,组合样品,并使用QIAquick凝胶提取试剂盒(快而精公司(Qiagen))通过凝胶提取进行纯化,选择长度为350-500bp的片段。将纯化的DNA加载到NextSeq 550测序仪上,并使用2x 75双端方案和150Mid Kit(v2.5)进行测序。
对测读段数进行解复用以为每个样品创建单独的fastq文件。将每个双端读段的前50个核苷酸分别与pDonor质粒B2、pTarget质粒C2和pEffector质粒A2进行比对。其中两个双端读段分别与单独的pDonor质粒B2和pTarget质粒C2比对的情况代表可能的转座事件,并且对这些“反式读段”进行跟踪和分析。还对读段与pDonor质粒B2和pEffector质粒A2比对的情况进行跟踪并作为阴性对照进行分析。然后绘制两端的位置以确定转座是否以靶向方式在靶位点附近发生。预期对本文所述的重组核酸靶向系统特异的转座事件映射到转座酶末端并位于靶序列附近。
图2示出了针对pTarget中的有效负载插入事件而映射的反式读段。x轴和y轴分别与pTarget质粒C2和pDonor质粒B2的比对位置,其中每个点是其中一端与pDonor质粒B2比对而另一端与pTarget质粒C2比对的双端读段。沿竖直轴和水平轴的直方图分别显示了与pDonor质粒B2或pTarget质粒C2比对的双端读段中的一个中的读段数量。表示为“TE-L”或“TE-R”的阴影区域分别表示转座子左端和转座子右端,它们限定有效负载序列的外缘(序列位置1237-2821之间)。表示为“靶”的阴影区域表示pTarget质粒C2内靶向转座的序列。
如图2中所示,在y轴上的TE-L区域与x轴上的靶区域的左侧(上游)之间以及在y轴上的TE-R区域和靶区域的右侧发现两个点簇。这表明有效负载以限定的取向插入,使得最终产物为(按顺序):靶序列、转座子左端(TE-L),并以转座子右端(TE-R)结束。
为了确定系统的整合效率,对顺式读段(与相同质粒比对的双端读段)和反式读段(与单独的质粒比对的双端读段)两者进行过滤以仅包括在靶序列的400个核苷酸内与pTarget质粒C2比对的那些读段。然后对通过这些过滤器的反式读段的数量进行计数,并将其除以满足这些条件的读段的总数以提供整合百分比。这样做时,发现本文所述的重组核酸靶向系统的整合百分比为65.6%±2.5%。插入发生在靶序列的5'侧下游40-60bp。没有观察到pEffector(阴性对照)而不是pTarget中的插入事件。
因此,本实例表明,本文所述的重组核酸靶向系统通过将限定的有效负载序列以特定取向插入特定位置而在大肠杆菌中具有活性。
实例2-转座酶活性的体外分析
本实例描述了本文所述的重组核酸靶向系统的活性所需的最小组分的体外验证。
通过多片段吉布森组装(Gibson Assembly)设计并产生具有N末端His-SUMO标签的编码本文所述的重组核酸靶向系统中的每种蛋白质的质粒。将Cas12k、TniA、TniB和TniQ蛋白中的每一种直接置于T7启动子的下游,并提供高拷贝的复制起点和氨苄青霉素抗性盒用于选择。用于吉布森组装反应的片段通过实例1中所述的质粒的PCR而产生或作为合成DNA从整合DNA技术公司(Integrated DNA Technologies,IDT)订购。然后将组装的质粒转化到化学感受态大肠杆菌细胞中并铺在含有羧苄青霉素的LB琼脂上。使单个菌落生长,对其进行小量制备和序列验证,如实例1中所述。
将这些质粒转化到化学感受态大肠杆菌细胞中并使其在具有羧苄青霉素的LB琼脂板上生长过夜以产生新菌落。然后将一个或多个菌落接种到含有羧苄青霉素的LB中并使其在37℃下在振荡培养箱中生长过夜。然后将该起始培养物在1L极品肉汤(TerrificBroth)中稀释1000倍,并使其在振荡培养箱中生长,直到光密度达到0.4至1.0。通过添加IPTG(200nM至1uM最终浓度)来诱导感兴趣的蛋白的表达,并使细胞在18-20℃下继续振荡生长过夜。然后将细胞沉淀。
在4℃下将细胞沉淀重悬于包含50mM Tris-NaOH(pH7.4)、500mM NaCl、20mM咪唑、14.3mM 2-巯基乙醇、1mM DTT、5%甘油和1X稀释的cOmpleteTM蛋白酶抑制剂混合物(西格玛公司(Sigma))的缓冲液中。将细胞裂解并储存在冰上。通过两轮在4℃下以18,000rpm离心30分钟去除细胞碎片,然后收集上清液。然后通过快节奏液相色谱(FPLC)对纯化的裂解物进行纯化。通过聚丙烯酰胺凝胶电泳(PAGE)鉴定含有感兴趣的蛋白的级分并将其合并在一起。
将大约400U的SUMO蛋白酶1(生命传感器公司(LifeSensors)或卢西根公司(Lucigen))与合并的级分组合(用于N末端His-SUMO标签的切割),并在4℃下使用具有适当分子量截断值的Slide-A-LyzerTMG2透析盒(赛默飞世尔科技公司(Thermo Scientific))将样品在3L包含50mM Tris-NaOH(pH 7.4)、200mM NaCl、20mM咪唑、14.3mM 2-巯基乙醇、1mMDTT和5%甘油的缓冲液中透析过夜。然后通过FPLC纯化样品,并收集流通液。通过PAGE鉴定含有感兴趣的蛋白的级分并将其合并在一起。然后将合并的级分浓缩并通过尺寸排阻进行纯化,并组合含有感兴趣的蛋白质的级分。通过UV/可见光谱法测定蛋白质浓度。最终缓冲液包含50mM Tris-NaOH(pH 7.4)、200mM NaCl、14.3mM 2-巯基乙醇、1mM DTT和15%甘油。基于一级序列计算蛋白质消光系数。
使用高保真2X PCR主混合物(新英格兰生物公司(NEB))通过PCR扩增制备编码T7 RNA聚合酶启动子下游的sgRNA分子的DNA模板。使用HiScribeTMT7高产RNA合成试剂盒(NEB)按照NEB标准RNA合成方案进行T7转录。使转录反应在37℃下进行2-16小时。通过添加TURBO DNase缓冲液(1X最终浓度)和TURBO DNase(0.02-0.2U/ul最终浓度;赛默飞世尔科技公司)去除DNA模板。DNase反应在37℃下进行15-30分钟。使用RNA清洁和浓缩试剂盒25(兹莫研究公司(ZymoResearch))纯化RNA。利用NanoDropTM2000c(赛默飞世尔科技公司)或QubitTM3荧光计(赛默飞世尔科技公司)和Qubit RNA HS测定试剂盒(赛默飞世尔科技公司)通过UV/可见光谱法测定最终RNA产量。基于RNA一级序列估计消光系数。
将纯化的Cas12k、TniA、TniB和TniQ蛋白中的每一种在1X蛋白稀释缓冲液(25mMTris pH 8、500mM NaCl、1mM EDTA、1mM DTT、25%甘油)中稀释至2μM的浓度。使用最终浓度为50nM的Cas12k、TniA、TniB和TniQ蛋白中的每一种、20ng的pTarget、100ng的pDonor以及最终浓度为600nM的RNA在补充有15mM MgOAc2的反应缓冲液(例如,26mM HEPES pH 7.5、4.2mM Tris pH 8、50μg/mL BSA、2mM ATP、2.1mM DTT、0.05mM EDTA、0.2mM MgCl2、28mMNaCl、21mM KCl、1.35%甘油pH 7.5)中进行体外整合测定。总反应体积为20μL,并且将反应在37℃下孵育2小时。
孵育后,使用Agencourt AMPure XP珠纯化样品中的核酸,并在最终体积为12μL的水中洗脱。使用Quant iT Picogreen dsDNA测定试剂盒(赛默飞世尔公司)定量纯化样品中DNA的浓度。定量后,将样品中的DNA含量标准化成使得在所有样品中使用相同量的输入DNA用于随后的分析。
然后使用以下一组共两个引物通过PCR测试标准化样品的整合:一个对pTarget特异,一个对pDonor特异。通过琼脂糖凝胶电泳分析所得PCR产物。然后通过Sanger测序进一步分析用于转座的预期大小的PCR产物以证实转座。还使用实例1中所述的未锚定的Nextera方法来分析PCR模板材料,以测量整合水平。包括另外的对照反应以测试以下情况下的整合可编程性:i)不存在Cas12k,ii)不存在RNA组分,iii)pTarget缺乏正确靶位点,以及iv)非靶向RNA组分。
该体外整合反应也可以用于分析本文所述的重组核酸靶向系统对于活性的不同要求。一个这样的实验是测试RNA指导物的不同序列。进行其他实验以确定有效负载序列内转座酶末端的最小需求和有效负载大小对转座效率的影响。
序列表
<110> 阿伯生物技术公司(ARBOR BIOTECHNOLOGIES, INC.)
<120> CRISPR相关转座子系统及其使用方法
<130> A112029 1020WO (0010.7)
<140>
<141>
<150> 63/142,990
<151> 2021-01-28
<160> 7
<170> PatentIn 3.5版
<210> 1
<211> 639
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 1
Met Ser Gln Ile Thr Ile Gln Cys Cys Leu Ile Ala Ser Glu Ser Thr
1 5 10 15
Arg Gln Lys Leu Trp Lys Leu Met Ala His Leu Asn Thr Pro Leu Ile
20 25 30
Asn Glu Leu Leu Gln Gln Leu Ser Lys His Pro Asp Phe Glu Lys Trp
35 40 45
Arg Lys Asn Gly Lys Leu Pro Ser Thr Val Val Asn Gln Leu Cys Gln
50 55 60
Pro Leu Lys Thr Asp Pro Ser Phe Thr Gly Gln Pro Ser Arg Leu Tyr
65 70 75 80
Leu Ser Ala Ile His Val Val Asp Tyr Ile Tyr Lys Ser Trp Leu Ala
85 90 95
Ile Gln Lys Arg Leu Gln Gln Gln Leu Asp Gly Lys Ile Arg Trp Leu
100 105 110
Glu Met Leu Asn Ser Asp Ala Glu Leu Ile Glu Ile Ser Gly Cys Ser
115 120 125
Leu Glu Ala Ile Arg Thr Lys Ala Ala Glu Ile Leu Ala Ile Ala Thr
130 135 140
Pro Asp Ser Asp Val Ala Ala Pro Leu Thr Lys Thr Gly Lys Ala Lys
145 150 155 160
Lys Ser Lys Lys Ser Ser Ala Ser Asn Pro Asp Arg Ser Leu Ser His
165 170 175
Lys Leu Phe Asp Ala Tyr Gln Glu Thr Asp Asp Ile Leu Ser Arg Ser
180 185 190
Ala Ile Ser Tyr Leu Leu Arg Asn Gly Cys Lys Leu Asn Asp Lys Glu
195 200 205
Glu Asp Leu Glu Lys Phe Ala Lys Arg Arg Arg Lys Val Glu Ile Gln
210 215 220
Ile Gln Arg Leu Thr Asp Lys Leu Thr Ser Arg Ile Pro Lys Gly Arg
225 230 235 240
Asp Leu Thr Asn Ala Lys Trp Leu Glu Thr Leu Phe Thr Ala Thr Thr
245 250 255
Thr Val Pro Glu Asp Asn Val Glu Ala Lys Arg Trp Gln Asp Ile Leu
260 265 270
Leu Thr Arg Ser Ser Ser Val Pro Phe Pro Leu Ile Phe Glu Thr Asn
275 280 285
Glu Asp Leu Val Trp Ser Lys Asn Glu Lys Gly Arg Leu Cys Val His
290 295 300
Phe Asn Gly Leu Ser Asp Leu Thr Phe Glu Val Tyr Cys Asp Arg Arg
305 310 315 320
Gln Leu His Trp Phe Lys Arg Phe Leu Glu Asp Gln Gln Thr Lys Arg
325 330 335
Lys Ser Lys Asn Gln His Ser Ser Gly Leu Phe Thr Leu Arg Asn Gly
340 345 350
Arg Leu Ala Trp Gln Glu Gly Glu Gly Lys Gly Glu Pro Trp Gln Ile
355 360 365
Asn Arg Leu Thr Leu Tyr Cys Cys Val Asp Asn Arg Leu Trp Ser Ala
370 375 380
Glu Gly Thr Glu Gln Val Arg Gln Glu Lys Glu Glu Glu Ile Thr Lys
385 390 395 400
Phe Ile Thr Lys Met Asn Glu Lys Ser Asp Leu Ser Glu Thr Gln Gln
405 410 415
Ala Phe Ile Lys Arg Lys Glu Ser Thr Leu Thr Arg Ile Asn Asn Ser
420 425 430
Phe Glu Arg Pro Ser Gln Phe Leu Tyr Gln Gly Gln Ser His Ile Leu
435 440 445
Val Gly Val Ser Leu Gly Leu Glu Lys Pro Ala Thr Val Ala Val Val
450 455 460
Asp Ala Ile Ala Gly Lys Val Leu Ala Tyr Arg Ser Ile Lys Gln Leu
465 470 475 480
Leu Gly Asp Asn Tyr Glu Leu Leu Asn Arg Gln Arg Arg Gln Gln Gln
485 490 495
Tyr Leu Ser His Glu Arg His Lys Ala Gln Lys Ser Phe Ser Pro Asn
500 505 510
Gln Phe Gly Thr Ser Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu Ala
515 520 525
Lys Glu Ile Ile Ala Ile Ala Gln Thr His Lys Ala Gly Ser Ile Val
530 535 540
Leu Pro Lys Leu Gly Asp Met Arg Glu Ile Val Gln Ser Glu Ile Gln
545 550 555 560
Ala Ile Ala Glu Glu Lys Phe Pro Gly Tyr Val Glu Gly Gln Gln Lys
565 570 575
Tyr Ala Lys Gln Tyr Arg Val Asn Val His Gly Trp Ser His Ser Arg
580 585 590
Leu Ile Gln Ser Ile Gln Ser Lys Ala Ala Gln Ile Gly Ile Val Ile
595 600 605
Glu Glu Gly Lys Gln Pro Ile Arg Gly Ser Pro Gln Asp Lys Ala Lys
610 615 620
Glu Leu Ala Leu Ser Ala Tyr Asn Leu Arg Leu Ala Arg Arg Ser
625 630 635
<210> 2
<211> 584
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 2
Met Asn Ser Gln Gln Asn Pro Asp Leu Ala Val His Thr Ser Ala Ile
1 5 10 15
Pro Thr Glu Gly Leu Gln Glu Glu Ser Asp Lys Pro Leu Glu Arg Asn
20 25 30
Val Ile Val Thr Ala Leu Ser Glu Glu Ala Gln Leu Lys Leu Glu Val
35 40 45
Ile Gln Ser Leu Leu Glu Lys Ser Asp Arg Thr Thr Tyr Gly Gln Lys
50 55 60
Leu Lys Glu Ala Ala Glu Lys Leu Ser Val Ser Val Arg Thr Val Gln
65 70 75 80
Arg Leu Val Lys Lys Trp Glu Gln Asp Gly Val Val Gly Phe Thr Gln
85 90 95
Thr Gly Arg Ala Asp Lys Gly Arg His Arg Ile Gly Glu Phe Trp Glu
100 105 110
Asn Phe Ile Leu Lys Thr Tyr Arg Glu Gly Asn Lys Gly Ser Lys Arg
115 120 125
Met Thr Pro Lys Gln Val Ala Leu Arg Val Gln Ala Lys Ala Arg Glu
130 135 140
Leu Glu Asp Ser Lys Pro Pro Asn Tyr Arg Thr Val Leu Arg Val Leu
145 150 155 160
Ala Pro Val Leu Glu Lys Gln Glu Lys Ala Lys Ser Ile Arg Ser Pro
165 170 175
Gly Trp Arg Gly Thr Thr Leu Ser Val Lys Thr Arg Glu Gly Lys Asp
180 185 190
Leu Ser Val Asp Tyr Ser Asn His Val Trp Gln Cys Asp His Thr Arg
195 200 205
Val Asp Val Leu Leu Val Asp Gln His Gly Gln Leu Leu Ser Arg Pro
210 215 220
Trp Leu Thr Thr Val Ile Asp Thr Tyr Ser Arg Cys Ile Met Gly Ile
225 230 235 240
Asn Leu Gly Phe Asp Ala Pro Ser Ser Val Val Val Ala Leu Ala Leu
245 250 255
Arg His Ala Ile Leu Pro Lys Gln Tyr Gly Ser Glu Tyr Lys Leu His
260 265 270
Cys Glu Trp Gly Thr Tyr Gly Lys Pro Glu His Phe Tyr Thr Asp Gly
275 280 285
Gly Lys Asp Phe Arg Ser Asn His Leu Ser Gln Ile Gly Ala Gln Leu
290 295 300
Gly Phe Val Cys His Leu Arg Asp Arg Pro Ser Glu Gly Gly Val Val
305 310 315 320
Glu Arg Pro Phe Lys Thr Leu Asn Asp Gln Leu Phe Ser Thr Leu Pro
325 330 335
Gly Tyr Thr Gly Ser Asn Val Gln Glu Arg Pro Glu Asp Ala Glu Lys
340 345 350
Asp Ala Arg Leu Thr Leu Arg Glu Leu Glu Gln Leu Leu Val Arg Tyr
355 360 365
Leu Val Asp Arg Tyr Asn Gln Ser Ile Asp Ala Arg Met Gly Asp Gln
370 375 380
Thr Arg Phe Glu Arg Trp Glu Ala Gly Leu Pro Thr Val Pro Val Pro
385 390 395 400
Ile Pro Glu Arg Asp Leu Asp Ile Cys Leu Met Lys Gln Ser Arg Arg
405 410 415
Thr Val Gln Arg Gly Gly Cys Leu Gln Phe Gln Asn Leu Met Tyr Gln
420 425 430
Gly Glu Tyr Leu Ala Gly Tyr Ala Gly Glu Thr Val Asn Leu Arg Phe
435 440 445
Asp Pro Arg Asp Ile Thr Thr Ile Leu Val Tyr Arg Gln Glu Asn Asn
450 455 460
Gln Glu Val Phe Leu Thr Arg Ala His Ala Gln Gly Leu Glu Thr Glu
465 470 475 480
Gln Leu Ala Leu Asp Glu Ala Glu Ala Ala Ser Arg Arg Leu Arg Thr
485 490 495
Ala Gly Lys Thr Ile Ser Asn Gln Ser Leu Leu Gln Glu Val Val Asp
500 505 510
Arg Asp Ala Leu Val Ala Thr Lys Lys Ser Arg Lys Glu Arg Gln Lys
515 520 525
Leu Glu Gln Ala Val Leu Arg Ser Ala Gly Val Asp Glu Ser Lys Thr
530 535 540
Glu Ser Leu Ser Ser Gln Val Val Glu Pro Asp Glu Val Glu Ser Thr
545 550 555 560
Ala Glu Ile Asn Ser Gln Tyr Glu Asp Met Glu Val Trp Asp Tyr Glu
565 570 575
Gln Leu Arg Glu Glu Tyr Gly Phe
580
<210> 3
<211> 276
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 3
Met Thr Glu Ala Ser Ala Ile Ala Lys Gln Leu Gly Gly Val Lys Pro
1 5 10 15
Asp Asp Glu Trp Leu Gln Ala Glu Ile Ala Arg Leu Lys Gly Lys Ser
20 25 30
Ile Val Pro Leu Gln Gln Val Lys Thr Leu His Asp Trp Leu Asp Gly
35 40 45
Lys Arg Lys Ala Arg Gln Ser Cys Arg Val Val Gly Glu Ser Arg Thr
50 55 60
Gly Lys Thr Val Ala Cys Asp Ala Tyr Arg Tyr Arg His Lys Pro His
65 70 75 80
Gln Glu Val Gly Arg Pro Pro Ile Val Pro Val Val Tyr Ile Gln Pro
85 90 95
Pro Gln Lys Cys Gly Ser Lys Asp Leu Phe Lys Glu Met Ile Glu Tyr
100 105 110
Leu Lys Phe Arg Ala Thr Lys Gly Thr Val Ser Asp Phe Arg Gly Arg
115 120 125
Ala Met Glu Val Leu Lys Gly Cys Glu Val Glu Met Leu Ile Ile Asp
130 135 140
Glu Ala Asp Arg Leu Lys Pro Glu Thr Phe Ala Glu Val Arg Asp Ile
145 150 155 160
Tyr Asp Lys Leu Gly Ile Ala Val Val Leu Val Gly Thr Asp Arg Leu
165 170 175
Glu Ala Val Ile Lys Arg Asp Glu Gln Val Tyr Asn Arg Phe Arg Ala
180 185 190
Cys His Arg Phe Gly Lys Leu Ser Gly Lys Asp Phe Gln Asp Thr Val
195 200 205
Gln Ala Trp Glu Asp Arg Val Leu Lys Leu Pro Val Ser Ser Asn Leu
210 215 220
Thr Ser Lys Asp Met Leu Arg Ile Leu Thr Leu Ala Thr Glu Gly Tyr
225 230 235 240
Ile Gly Arg Leu Asp Glu Ile Leu Arg Glu Thr Ala Ile Arg Ser Leu
245 250 255
Ser Lys Gly Phe Lys Lys Ile Asp Lys Ala Val Leu Gln Glu Val Ala
260 265 270
Lys Glu Tyr Lys
275
<210> 4
<211> 167
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 4
Met Thr Ala Pro Asp Val Lys Pro Trp Leu Phe Ile Ile Glu Pro Tyr
1 5 10 15
Pro Gly Glu Ser Leu Ser His Phe Leu Gly Arg Phe Arg Arg Ala Asn
20 25 30
His Leu Ser Ala Ala Gly Leu Gly Asn Leu Ala Gly Ile Gly Ala Val
35 40 45
Val Ala Arg Trp Glu Arg Phe His Phe Asn Pro Arg Pro Ser Gln Gln
50 55 60
Glu Leu Glu Ala Ile Ala Ser Val Val Glu Val Asp Ala Asp Arg Leu
65 70 75 80
Ala Gln Met Leu Pro Pro Leu Gly Val Gly Met Gln His Glu Pro Ile
85 90 95
Arg Leu Cys Gly Ala Cys Tyr Ala Val Thr Pro Cys His Gln Ile Glu
100 105 110
Trp Gln Phe Lys Glu Met Gly Gly Cys Asn Arg His Asn Leu Arg Leu
115 120 125
Leu Ser Lys Cys Pro Lys Cys Glu Asp Arg Phe Lys Ile Pro Ala Leu
130 135 140
Trp Glu Tyr Gly Leu Cys Gly Arg Cys Arg Thr Pro Phe Ala Glu Met
145 150 155 160
Ala Glu Cys Gln Lys Arg Ile
165
<210> 5
<211> 254
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<221> 修饰的碱基
<222> (232)..(254)
<223> a、c、u、g、未知或其他
<400> 5
auaauaaaua gcgccgcagu ucaugcugcu ugcagccugu gaacuguguu aaaugagggu 60
uaguuugacu guagcaauac agucuugcuu ucugacccua guagcugcuc acccugaugc 120
ugcugucuuc ggacaggaua ggugcgcucc cagcaauaag ggcgcggaug uacugcugua 180
guggcuacug aaucaccccc gaucaagggg gaacccuaaa aggguugaaa gnnnnnnnnn 240
nnnnnnnnnn nnnn 254
<210> 6
<211> 238
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 6
tgtacagtga ctaattatat gtcgtcggtg acaaattgtt gtcattgagc cagactagtt 60
gtcgtcgtgg caaattaggt gtcgctcatt taatggtgac aaattaatgt cgctaagata 120
atacactctg taattatcat acagaacaat tcaaacaagc ggataaaagg acttgctttc 180
aacccacccc taaatttaat acttactgaa acccaaaact aatctcagtt tcaaatat 238
<210> 7
<211> 262
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 7
aatacataag ttttttataa atacatattg ttattctagg tgtagataaa gcgacagtca 60
atttgtcatt atgaaaatac acaaaagctt ttttctattt aaaaaagcga caactaattt 120
gtcactatta cggataacga catttatttt gtcaccatga agaagtgatc ctaattttgt 180
gaaaacgcta taagatatac tgtacaagca ttttagcaat gacattaatt tgtcacgacg 240
acaaataaaa agtcactgta ca 262

Claims (46)

1.一种重组核酸,所述重组核酸包含可操作地连接到第一多核苷酸的第一启动子和可操作地连接到第二多核苷酸的第二启动子,
其中所述第一多核苷酸包含:
编码TniA蛋白或其功能片段的核酸序列、编码TniB蛋白或其功能片段的核酸序列和编码TniQ蛋白或其功能片段的核酸序列,以及
编码CRISPR相关(Cas)蛋白的核酸序列,其中所述Cas蛋白包含与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列;
其中所述第二多核苷酸包含:
编码指导RNA(gRNA)的核酸序列,其中所述gRNA能够与靶序列杂交。
2.如权利要求1所述的重组核酸,其中所述TniA蛋白包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列。
3.如权利要求1所述的重组核酸,其中所述TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列。
4.如权利要求1所述的重组核酸,其中所述TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。
5.如权利要求1所述的重组核酸,其中所述TniA蛋白包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列,所述TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列,并且所述TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。
6.如权利要求1-5中任一项所述的重组核酸,其中所述gRNA能够与所述Cas蛋白复合以形成gRNA-Cas蛋白复合物。
7.如权利要求1-6中任一项所述的重组核酸,其中所述gRNA包含CRISPR/Cas系统相关RNA(crRNA)序列。
8.如权利要求1-7中任一项所述的重组核酸,其中所述gRNA是进一步包含反式激活CRISPR/Cas系统RNA(tracrRNA)序列的单指导RNA。
9.如权利要求1-8中任一项所述的重组核酸,其中所述gRNA包含如SEQ ID NO:5中所示的核苷酸序列。
10.一种载体,所述载体包含如权利要求1-9中任一项所述的重组核酸。
11.一种细菌细胞,所述细菌细胞包含如权利要求10所述的载体。
12.一种用于靶序列的序列特异性修饰的重组核酸靶向系统,所述系统包含:
TniA蛋白、TniB蛋白和TniQ蛋白,或编码所述TniA蛋白、所述TniB蛋白和所述TniQ蛋白的多核苷酸;
包含与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列的Cas蛋白或编码所述Cas蛋白的多核苷酸,其中所述Cas蛋白包含与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列;以及
指导RNA(gRNA)或编码所述gRNA的多核苷酸,
其中所述gRNA能够与所述Cas蛋白复合以形成gRNA-Cas蛋白复合物。
13.如权利要求12所述的重组核酸靶向系统,其中所述TniA蛋白包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列。
14.如权利要求12所述的重组核酸靶向系统,其中所述TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列。
15.如权利要求12所述的重组核酸靶向系统,其中所述TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。
16.如权利要求12所述的重组核酸靶向系统,其中所述TniA蛋白包含与SEQ ID NO:2中所示的氨基酸至少95%相同的氨基酸序列,所述TniB蛋白包含与SEQ ID NO:3中所示的氨基酸至少95%相同的氨基酸序列,并且所述TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸至少95%相同的氨基酸序列。
17.如权利要求12-16中任一项所述的重组核酸靶向系统,其中所述gRNA包含CRISPR/Cas系统相关RNA(crRNA)序列。
18.如权利要求12-17中任一项所述的重组核酸靶向系统,其中所述gRNA是进一步包含反式激活CRISPR/Cas系统RNA(tracrRNA)序列的单指导RNA(sgRNA)。
19.如权利要求12-18中任一项所述的重组核酸靶向系统,其中所述gRNA包含如SEQ IDNO:5中所示的核苷酸序列。
20.如权利要求12-19中任一项所述的重组核酸靶向系统,其进一步包含靶多核苷酸,其中所述靶多核苷酸包含(i)能够与所述gRNA杂交的靶序列和(ii)原型间隔子相邻基序(PAM)序列。
21.如权利要求20所述的重组核酸靶向系统,其中所述PAM序列包含选自由如5'-GTN-3'、5'-NGTN-3'、5'-GGTN-3'、5'-GGTA-3'、5'-GGTC-3'、5'-GGTG-3'、5'-GGTT-3'、5'-GTT-3'、5'-GTA-3'、5'-GTC-3'和5'-GTG-3'中所示的核苷酸序列组成的组的核苷酸序列。
22.如权利要求21所述的重组核酸靶向系统,其中所述PAM序列包含如5'-GGTT-3'中所示的核苷酸序列。
23.如权利要求12-22中任一项所述的重组核酸靶向系统,其进一步包含供体多核苷酸,其中所述供体多核苷酸包含用于插入所述靶多核苷酸中的有效负载序列。
24.如权利要求23所述的重组核酸靶向系统,其中所述供体多核苷酸进一步包含编码转座子左端(TE-L)的核酸序列和编码转座子右端(TE-R)的核酸序列。
25.如权利要求24所述的重组核酸靶向系统,其中所述TE-L包含与SEQ ID NO:6中所示的氨基酸至少95%相同的核酸序列。
26.如权利要求24或25所述的重组核酸靶向系统,其中所述TE-R包含与SEQ ID NO:7中所示的氨基酸至少95%相同的核酸序列。
27.一种用于靶序列的序列特异性修饰的重组核酸靶向系统,所述系统包含:
包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列的TniA蛋白;以及
供体多核苷酸,其中所述供体多核苷酸包含
用于插入所述靶序列中的有效负载序列
与SEQ ID NO:6中所示的核酸序列至少95%相同的编码转座子左端(TE-L)的核酸序列,以及
与SEQ ID NO:7中所示的核酸序列至少95%相同的编码转座子右端(TE-R)的核酸序列。
28.如权利要求27所述的重组核酸靶向系统,其进一步包含V-K型Cas蛋白(例如,Cas12k蛋白)。
29.如权利要求28所述的重组核酸靶向系统,其中所述Cas蛋白包含与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列或编码所述Cas蛋白的多核苷酸,其中所述Cas蛋白包含与SEQ ID NO:1中所示的氨基酸序列至少95%相同的氨基酸序列。
30.如权利要求27-29中任一项所述的重组核酸靶向系统,其进一步包含
指导RNA(gRNA)或编码所述gRNA的多核苷酸,其中所述gRNA能够与所述Cas蛋白复合以形成gRNA-Cas蛋白复合物。
31.如权利要求27-30中任一项所述的重组核酸靶向系统,其进一步包含TniB蛋白和TniQ蛋白中的一种或多种。
32.如权利要求31所述的重组核酸靶向系统,其中所述TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列或编码所述TniB蛋白的多核苷酸,其中所述TniB蛋白包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列。
33.如权利要求31所述的重组核酸靶向系统,其中所述TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列或编码所述TniQ蛋白的多核苷酸,其中所述TniQ蛋白包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。
34.如权利要求12-33中任一项所述的重组核酸靶向系统,其中所述Cas蛋白、所述TniA蛋白、所述TniB蛋白和所述TniQ蛋白中的至少一种是纯化蛋白。
35.一种细菌细胞,所述细菌细胞包含如权利要求12-34中任一项所述的重组核酸靶向系统。
36.一种用于修饰细菌细胞中的靶多核苷酸的方法,所述方法包括向所述细胞中引入:
(i)第一重组核酸,所述第一重组核酸包含:
编码TniA蛋白或其功能片段的多核苷酸、编码TniB蛋白或其功能片段的多核苷酸和编码TniQ蛋白或其功能片段的多核苷酸;
编码Cas蛋白的多核苷酸,其中所述Cas蛋白包含如SEQ ID NO:1中所示的氨基酸序列;以及
编码指导RNA(gRNA)的多核苷酸,其中所述gRNA能够与所述Cas蛋白复合以形成gRNA-Cas蛋白复合物;
(ii)包含靶多核苷酸的第二重组核酸,其中所述靶多核苷酸包含(a)能够与所述gRNA杂交的靶序列和(b)PAM序列;以及
(iii)包含供体多核苷酸的第三重组核酸,其中所述供体多核苷酸包含用于插入所述靶多核苷酸中的有效负载序列,
从而修饰所述靶多核苷酸。
37.如权利要求36所述的方法,其中所述供体多核苷酸进一步包含编码转座子左端(TE-L)的核酸序列和编码转座子右端(TE-R)的核酸序列。
38.如权利要求36或37中任一项所述的方法,其中所述TniA蛋白包含与如SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列。
39.如权利要求36或37中任一项所述的方法,其中所述TniB蛋白包含与如SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列。
40.如权利要求36或37中任一项所述的方法,其中所述TniQ蛋白包含与如SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。
41.如权利要求36或37中任一项所述的方法,其中所述TniA包含与SEQ ID NO:2中所示的氨基酸序列至少95%相同的氨基酸序列,所述TniB包含与SEQ ID NO:3中所示的氨基酸序列至少95%相同的氨基酸序列,并且所述TniQ包含与SEQ ID NO:4中所示的氨基酸序列至少95%相同的氨基酸序列。
42.如权利要求36-41中任一项所述的方法,其中所述PAM序列包含选自由如5'-GTN-3'、5'-NGTN-3'、5'-GGTN-3'、5'-GGTA-3'、5'-GGTC-3'、5'-GGTG-3'、5'-GGTT-3'、5'-GTT-3'、5'-GTA-3'、5'-GTC-3'和5'-GTG-3'中所示的核苷酸序列组成的组的核苷酸序列。
43.如权利要求42所述的方法,其中所述PAM序列包含如5'-GGTT-3'中所示的核苷酸序列。
44.如权利要求37-43中任一项所述的方法,其中所述TE-L具有如SEQ ID NO:6中所示的核酸序列。
45.如权利要求37-43中任一项所述的方法,其中所述TE-R具有如SEQ ID NO:7中所示的核酸序列。
46.如权利要求37-45中任一项所述的方法,其中所述细菌细胞是大肠杆菌。
CN202280024344.9A 2021-01-28 2022-01-28 Crispr相关转座子系统及其使用方法 Pending CN117062827A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163142990P 2021-01-28 2021-01-28
US63/142,990 2021-01-28
PCT/IB2022/050783 WO2022162623A1 (en) 2021-01-28 2022-01-28 Crispr-associated transposon systems and methods of using same

Publications (1)

Publication Number Publication Date
CN117062827A true CN117062827A (zh) 2023-11-14

Family

ID=82653976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280024344.9A Pending CN117062827A (zh) 2021-01-28 2022-01-28 Crispr相关转座子系统及其使用方法

Country Status (6)

Country Link
EP (1) EP4284815A1 (zh)
JP (1) JP2024509047A (zh)
CN (1) CN117062827A (zh)
AU (1) AU2022214512A1 (zh)
CA (1) CA3209639A1 (zh)
WO (1) WO2022162623A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998037205A1 (en) * 1997-02-20 1998-08-27 The John Hopkins University School Of Medicine Mutations in atp-dependent transposition proteins that reduce target-site specificity
AU2018360068A1 (en) * 2017-11-02 2020-05-14 Arbor Biotechnologies, Inc. Novel CRISPR-associated transposon systems and components
EP3898958A1 (en) * 2018-12-17 2021-10-27 The Broad Institute, Inc. Crispr-associated transposase systems and methods of use thereof
JP2022524037A (ja) * 2019-03-07 2022-04-27 ザ トラスティーズ オブ コロンビア ユニバーシティー イン ザ シティー オブ ニューヨーク Tn7様トランスポゾンを用いたRNA誘導DNA組込み
WO2020236972A2 (en) * 2019-05-20 2020-11-26 The Broad Institute, Inc. Non-class i multi-component nucleic acid targeting systems

Also Published As

Publication number Publication date
AU2022214512A1 (en) 2023-08-10
WO2022162623A1 (en) 2022-08-04
JP2024509047A (ja) 2024-02-29
CA3209639A1 (en) 2022-08-04
EP4284815A1 (en) 2023-12-06

Similar Documents

Publication Publication Date Title
US11459588B2 (en) Methods of use of CRISPR CPF1 hybrid DNA/RNA polynucleotides
KR102084186B1 (ko) Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법
CN107922931B (zh) 热稳定的Cas9核酸酶
EP2527438B1 (en) Methods and compositions for DNA fragmentation and tagging by transposases
KR20170020535A (ko) 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
JP2023517041A (ja) クラスiiのv型crispr系
CN113373130A (zh) Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
EP4159853A1 (en) Genome editing system and method
WO2019147073A1 (ko) 아데노신 디아미나아제를 이용한 염기 교정 확인 방법
CN115667283A (zh) Rna指导的千碱基规模基因组重组工程
JP7022699B2 (ja) トランスポザーゼ競合物制御系
CN117062827A (zh) Crispr相关转座子系统及其使用方法
CN117083380A (zh) Crispr相关转座子系统及其使用方法
US20230048564A1 (en) Crispr-associated transposon systems and methods of using same
KR20180128864A (ko) 매칭된 5&#39; 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
US20220333129A1 (en) A nucleic acid delivery vector comprising a circular single stranded polynucleotide
CN116615547A (zh) 用于对货物核苷酸序列转座的系统和方法
CN115397995A (zh) 来自细菌嗜肺巴斯德杆菌的cas9蛋白的用途
CN113614247A (zh) Dna切割剂

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination